What is Time Series?
• Sequence Data / Time Series Data ?
- Sequence Data : 순서가 의미가 있으며 순서가 달라질 경우의 미가 손상되는데이터,
시간적인의미가 있다면 temporal data라고도 함
- Time Series (시계열 데이터) : 일정 시간 간격으로 기록된 데이터
- 과거패턴을 기반으로 미래를 예측하거나(Forecasting) 과거 특징적인 부분들을 분석
What is Time Series?
• 통계적 분석 방법론(딥러닝도 입전 기존 시계열 모델)
- 원본시계열 에서 Trend, Seasonality를 제거하고 남은 Residual 을 모델링
- Residual은 Stationarity 라는 특징을 기반으로 모델링(AR, MA, ARIMA, SARIMA 등)
- 예측은 반대로 Residual 을 토대로 만든 모델의 예측값에 Trend와 Seasonality를 더해 계산
Recurrent Neural Network?
- Sequence Data 여러 개를 input으로 받아 각 input마다 output을 내면서,
동시에 중간 계산 결과인 hidden state를 다음 hidden state 계산 때 합쳐서 계산하는 구조
- 위의 과정을 sequence size만큼 반복
Input sequence가 1에서 T까지 들어올때 각 input 마다 개별적인 W𝑖ℎ, 𝑏𝑖ℎ 을 통해 계산하고,
그 결과를 이전 ℎ𝑡−1을 Whℎ, 𝑏hℎ를 통해 계산한 결과와 합쳐서 tanh 통과→다음ℎt
RNN의단점
- 장기 의존성 문제(the problem of Long-Term Dependencies)
: input sequence가 길어지면 초기값의 정보량이 뒤쪽으로 충분히 전달 되지 않는 RNN의 문제점
- Gradient Vanishing, Exploding
• LSTM (Long Short-Term Memory)
- RNN의변형
- Cell State의 정의
- 기존의hidden state를 셀, 입력 게이트, 출력 게이트, 망각게이트로 세분화 하여 각 게이트마다
출력의 정도를 조절하여 사용
- 좀 더 복잡한 구조를 통해 RNN과 비교하여 긴 시퀀스의 입력을 처리하는데 탁월한 성능