20회 기출문제

실기 시험일자

2021.03.27

머신러닝 1

데이터셋
데이터 미리보기
rowyearmonthdayweektemp_2temp_1averageactualforecast_noaaforecast_accforecast_underfriend
0201611Fri454545.64543504429
1201612Sat444545.74441504461
2201613Sun454445.84143464756
3201614Mon444145.94044484653
4201615Tues414046.04446464641
데이터 설명
  • 문제 주제: 날씨 최고온도 예측
  • 종속변수: actual
  • temp_1: 전날 최고온도
  • temp_2: 전전날 최고온도
  • friend: 친구의 예측온도
1-1
  • 데이터 EDA를 수행하라.
  • 결측치를 확인하고 처리 방안에 대해 논의하라.
  • 데이터 분할 방법을 설명하라.
  • 최종 데이터셋이 적절함을 주장하라.
1-2
  • Random Forest를 학습하고 예측 결과를 해석하라.
  • 예측 결과를 검정하고 중요변수를 도출하라.
  • 변수 중요성을 분석하고 그래프로 출력하라.
1-3
  • SVM을 학습하고 예측 결과를 해석하라.
  • 예측 결과를 검정하고 해석하라.
  • 변수 중요성 분석 가능 여부와 한계를 설명하라.
1-4
  • Random Forest와 SVM 결과를 비교한 뒤 최종 모델을 선택하라.
  • 두 모델의 장단점을 분석하고 운영 관점에서 어떤 모델을 선택할지 설명하라.
  • 모델링 관련 추후 개선 방향을 제시하라.

머신러닝 2

데이터셋
데이터 미리보기
rowhouseCodedatepower consumption
0house_012050-01-14 21:00:0057.559877591292455
1house_262050-01-02 19:10:0059.726880077815515
2house_252050-01-13 07:20:006.558823207433487
3house_202050-01-26 04:55:0058.51458912444545
4house_092050-01-18 22:50:005.717008689346497
2-1
  • 각 가구의 15분 간격 전력량 합을 구하라.
  • 해당 데이터를 바탕으로 총 5개의 군집으로 군집화를 수행하라.
  • 군집 결과를 지정된 형태로 출력하라.
  • 군집화를 위한 데이터 구성 이유를 설명하라.
2-2
  • 2-1의 데이터를 바탕으로 각 군집의 요일별, 15분 간격별 전력사용량 합을 구하라.
  • 군집별 전력 사용 패턴을 히트맵으로 시각화하라.

머신러닝 3

데이터셋
데이터 미리보기
rowTIMESTAMPBIOGASBIOMASSGEOTHERMALHourSMALL HYDROSOLARSOLAR PVSOLAR THERMALWIND TOTAL
02012-11-26 00:00:00208.0354.0926.01.0208.0nan0.00.057.0
12012-11-26 01:00:00207.0354.0927.02.0207.0nan0.00.076.0
22012-11-26 02:00:00208.0353.0927.03.0208.0nan0.00.0100.0
32012-11-26 03:00:00208.0350.0927.04.0209.0nan0.00.0111.0
42012-11-26 04:00:00209.0352.0927.05.0209.0nan0.00.0131.0
데이터 설명
  • 문제 주제: 태양광 발전량 예측
  • 예측 변수: SOLAR PV
3-1
  • 데이터셋을 7:3으로 분할하라.
  • 데이터 전처리를 수행하고 예측 모델을 생성하라.
  • 모델 성능을 RMSE, R제곱, 정확도로 평가하라.
  • 정확도는 문제에서 제시한 식을 사용하고, 분모가 0인 경우는 0.5로 처리하라.
  • 최종 결과는 소수점 셋째 자리에서 반올림하라.
Next Step

문제를 확인했다면 바로 실기 워크스페이스로 넘어가세요

기출 문서를 읽은 뒤에는 동일한 ADP 실기 환경에서 바로 회차를 선택하고 코딩을 이어서 진행할 수 있습니다.