728x90 반응형 분류 전체보기297 시계열 모델의 교차검증 (cross-validation) 전략 (파이썬 코드 포함) 두 가지 time series 교차검증 (cross-validation) 방법 교차검증 cross validataion (CV) 은 데이터 모델링에 있어 모델의 정확도를 확인할 수 있는 효율적인 방법이다. 이것은 데이터를 훈련용과 테스트용을 순서 없이 나누는 과정을 포함한다. 하지만, 전후 데이터 사이의 상관관계가 존재하는 시계열 데이터(time series data)를 모델링할 때는 기존의 사용하는 CV를 적용할 수 없다. 이때는 시간순으로 나열된 데이터를 보존하면서 훈련용과 테스트용으로 데이터를 나눠야 한다. 다음의 두 가지 방법이 대표적으로 사용된다. Time series cross validation / blocked time cross validation Helper function: visua.. 2021. 5. 4. Seaborn boxplot으로 five-number summary 이해하기 Seaborn boxplot with 'tips' dataset seaborn 라이브러리에서 제공하는 "tips" 데이타셋으로 five-number summary에 대해서 알아보자. 다음과 같이 데이터를 로딩한다. import seaborn as sns tips = sns.load_dataset("tips") tips 위의 표에서 보듯이 총 7개의 컬럼이 있다. 이중 'total_bill' 컬럼 데이터에 대한 boxplot을 그려 보자. 참고로 x축의 tick의 개수는 'set_major_locator' 매서드와 matplotlib의 ticker로 조절할 수 있다. import matplotlib.pyplot as plt import matplotlib.ticker as ticker ax = sns.bo.. 2021. 5. 3. [Python] Pandas sorting (오름/내림 정렬) 하기 우선 필요한 라이브러리를 import 한다. import pandas as pd import numpy as np [0, ... 9]의 배열로 pandas dataframe을 만들어 보자. 그리고 이것을 random shuffle을 이용해 섞어 본다. import random arr = np.arange(10) df = pd.DataFrame(data=arr, columns=['random_number']) print("before shuffle") display(df) random.shuffle(df.random_numbers) print("after shuffle") display(df) 섞기 전과 후의 모습이다 오름차순 정렬 (default: ascending=True) df.sort_values(.. 2021. 5. 1. [홍콩 카페] 헝홈(Hung Hom)의 Soufflé (수플레)카페 HeySoNut 홍콩의 침사추이 옆에 있는 헝홈(Hung Hom)이라는 동네에 가봤다. 홍험은 홍콩 폴리텍 대학이 위치해 있는 곳으로도 알려져 있으며, 가보니 침사추이 보다는 조금 덜 붐비는 동네라는 인상을 받았다. HeySoNut이라는 카페를 가봤다. 이 카페가 위치해 있는 골목에는 지중해식 식당 및 여러 카페와 음식점이 있어 쉬어가기 좋은 장소로 보였다. 수플레 (Soufflé)와 핸드드립 아이스 커피 그리고 나는 피콜로 라테를 주문했다. 가격이 저렴하진 않지만, 직원들도 친절하고 음식도 맛있어 한번 들러볼 만한 곳이다 2021. 5. 1. 이전 1 ··· 33 34 35 36 37 38 39 ··· 75 다음 728x90 반응형