EDA
문제되는 터빈 : #25, #67, #121
데이터 처리
외부 온도 NULL값 처리
같은 TurbID 당 Day의 변화에 따른 distplot으로 분포도를 확인해서 값이 엄청 확 튀거나 하나의 값인 것을 None으로 처리를 해서 마지막에 fillna(method=’bfill’) 사용
선형 보간을 사용한다. / 동시간대 전날과 다음날의 평균 값.
후처리
예측 후에, patv 파일을 출력해보고 갑자기 모든 터빈들이 0으로 떨어지는 데이터들을 보간할 필요가 있음.
참고 자료
회의 내용
darts
GitHub - unit8co/darts: A python library for easy manipulation and forecasting of time series.
Time Series Framework