Time series analysis is the endeavor of extracting meaningful summary and statistical information from points arranged in chronological order.
시계열 분석 관련 도서 : https://www.oreilly.com/library/view/practical-time-series/9781492041641/
시계열 데이터
백색 잡음(White noise process)
- 서로 독립이고 동일한 분포를 따르는(independently and identically distributed; i.i.d) 확률변수들의 계열로 구성된 확률과정
- 평균이 0이고 서로 다른 시간의 값 사이에 상관관계가 없는 과정
- 과거의 정보는 중요하지 않다.
확률 보행 과정(Random walk process)
- 직전 데이터에서 오르거나 내리거나 하는 데이터
- 시간에 따른 편차의 평균이 0이지만 분산은 시간에 비례하여 증가. 따라서, 앞뒤로 움직일 확률이 동일하다고 해도 시간이 흐름에 따라 평균에서 점차 벗어나는 경향을 보인다.
- 대표적인 예로 브라운 운동이 있다.
정상 확률 과정(stationary process)
- 뚜렷한 추세가 관측되지 않고 진폭(변동)이 시간의 흐름에 따라 일정
- stationarity : 시계열의 확률적인 성질들이 시간의 흐름에 따라 불변
- ARIMA가 이 데이터만을 다룸
- ARIMA(AutoRegressive Integrated Moving Average) : ARIMA 모형은 정상시계열 데이터에 적합한 모델로 Box-Jenkins Model을 통해 데이터 정상성 여부를 확인 후 사용
Fourier Transform
- Sin, Cos 함수를 이용하여 신호를 분리.
- 주파수, 음성 인식 등에 활용
Hidden Markov Model
- 은닉층이 마코프 모델을 따른다는 가정으로 예측
- 날씨, 음성인식 등에 활용
참고하면 좋을 사이트 : https://bioinformaticsandme.tistory.com/53
브라운 운동 (Brownian Motion)
- 1827년 식물학자 로버트 브라운이 꽃가루 입자 관찰에서 발견
- Quant, 블랙 숄즈 모형
Prophet -Facebook
https://facebook.github.io/prophet/
- 페이스북에서 비즈니스 분야에 적합하게 만든 시계열 예측 알고리즘
- 시계열 추세에 계절적 요소와 휴일 요소를 추가하여 비즈니스에 적합하게 구성
- 데이터에서 변동성 구간, 이상치 검출, 미래 예측, 예측 범위 등 다양하게 제공
- ARIMA처럼 통계학적 모델
Deep AR+ -Amazon Forecast
https://docs.aws.amazon.com/ko_kr/forecast/latest/dg/aws-forecast-recipe-deeparplus.html
- 아마존에서 인공신경망을 이용해 제시한 시계열 분석 라이브러리
시계열 분석 과목 커리큘럼
Kaggle에서 사용된 모델 관련 논문
Kaggle forecasting competitions: An overlooked learning opportunity
https://www.sciencedirect.com/science/article/abs/pii/S0169207020301114?via=ihub
Dacon 전력사용량 예측 AI 경진대회
https://www.dacon.io/competitions/official/235736/codeshare
- 1위 : XGBoost
- 2위 : TemporalFusionTransformer
- 인사이트 https://www.dacon.io/codeshare/2643