-
2024.06.05
[빅데이터분석기사 실기] 기출 복원 문제 - 제3유형
빅데이터분석기사 실기 기출 복원 문제 - 제3유형들어가며빅데이터분석기사 실기 기출 제3유형 복원 문제를 정리해본다.제3유형에서는 2023년 6회 시험부터 검정(Test) 관련 문제가 출제된다.문제 해결 방법을 쭉 읽어 보는 용도로 정리해보았다. 문제2023년 6회문제 1감기약을 복용할 때 부작용에 대한 분류와 비율 데이터위약 효과가 있는지 253건의 데이터를 추출하여 검증감기 부작용에 대한 비율이 위약 효과 부작용 비율과 같은지를 카이제곱 검정하기 데이터부작용 유형코드비율두통10.05졸림20.1속쓰림30.05부작용 없음40.8합계 - 문제(1) 위약 샘플 데이터가 부작용 없음인 데이터를 0~1 사이의 확률로 출력 (반올림하여 소수점 셋째 자리로 출력)(2) 카이제곱 검정으로 검정 통계량 출력 (반올림하여..
-
2024.06.05
[빅데이터분석기사 실기] 기출 복원 문제 - 제2유형
빅데이터분석기사 실기 기출 복원 문제 - 제2유형들어가며빅데이터분석기사 실기 기출 제2유형 복원 문제를 정리해본다.2회 ~ 6회까지 분량이다.문제 해결 방법을 쭉 읽어 보는 용도로 정리해보았다. 문제2021년 2회기업에서 생성된 주문 데이터 (train.csv)정시 도착 가능 여부 예측 모델을 만들고, test.csv 파일에 대하여 정시 도착 여부를 예측한 확률을 기록한 CSV 생성하기import pandas as pdfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import confusion_matrixfrom sklearn.me..
-
2024.06.05
[빅데이터분석기사 실기] 기출 복원 문제 - 제1유형
빅데이터분석기사 실기 기출 복원 문제 - 제1유형들어가며빅데이터분석기사 실기 기출 제1유형 복원 문제를 정리해본다.2회 ~ 6회까지 분량이며, 2회부터 5회까지의 제1유형은 단답형 문제였으나 6회 시험부터 작업형 문제로 바뀌었고, 이에 맞게 문제의 내용이 수정되었다.문제 해결 방법을 쭉 읽어 보는 용도로 정리해보았다. 문제2021년 2회문제 1BostonHousing 데이터@crim@ 항목의 상위에서 10번째 값(즉, 상위 10개의 값 중에서 가장 적은 값)으로 상위 10개의 값을 변환하고, @age@가 @80@ 이상인 값에 대하여 `@crim@의 평균 구하기소수점 3째 자리에서 반올림해서 소수점 2째 자리로 출력하기import numpy as npimport pandas as pddf = pd.read..