본문 바로가기
728x90
반응형

cross validation2

교차검증으로 최적의 시계열(time-series) 예측 모델 찾기 (ft. GridSearchCV) 교차검증 적용으로 최적의 시계열 모델 찾기 지난 포스팅에서 open power system data에 대한 전처리 과정과 데이터 visualization을 해보았다. 2021.04.15 - [Programming/Time series forecasting] - Time series 분석 I: importing and plotting data 이번 포스팅에서는 지난 포스팅에서 다듬은 최종 데이터로부터, cross-validation을 이용해 time series 예측의 최적화 모델을 찾는 방법을 살펴 보도록 하겠다. 이 과정은 참고 링크의 포스팅을 참고 하였다. 위 링크의 포스팅에서 최종적으로 다듬은 데이터는 다음과 같다. display(df) data_consumption = data.loc[:,['Co.. 2021. 5. 13.
시계열 모델의 교차검증 (cross-validation) 전략 (파이썬 코드 포함) 두 가지 time series 교차검증 (cross-validation) 방법 교차검증 cross validataion (CV) 은 데이터 모델링에 있어 모델의 정확도를 확인할 수 있는 효율적인 방법이다. 이것은 데이터를 훈련용과 테스트용을 순서 없이 나누는 과정을 포함한다. 하지만, 전후 데이터 사이의 상관관계가 존재하는 시계열 데이터(time series data)를 모델링할 때는 기존의 사용하는 CV를 적용할 수 없다. 이때는 시간순으로 나열된 데이터를 보존하면서 훈련용과 테스트용으로 데이터를 나눠야 한다. 다음의 두 가지 방법이 대표적으로 사용된다. Time series cross validation / blocked time cross validation Helper function: visua.. 2021. 5. 4.
728x90
반응형