250x250
vg-rlo
vg-rlo
vg-rlo
전체 방문자
오늘
어제
  • CATEGORY (114)
    • 일상과 기록 (12)
    • REVIEW (11)
    • DATA (20)
      • ML and DL (6)
      • NLP (2)
      • Growth hacking (2)
      • Note (10)
    • CODE (46)
      • Algorithm and Data Structur.. (2)
      • Coding Test (34)
      • DB (2)
      • Python (6)
      • Linux (2)
      • Github (0)
    • Portfolio (6)
      • Pratice and Tutorials (2)
      • Toy Projects (2)
      • Competitions (2)
      • Data Analysis (0)
    • ISSUE (17)
    • 🛠... (0)

블로그 메뉴

  • Github

인기 글

티스토리

hELLO · Designed By 정상우.
vg-rlo

vg-rlo

[시계열] Exponential Smoothing (지수 평활법)
DATA/Note

[시계열] Exponential Smoothing (지수 평활법)

2021. 5. 19. 21:40
해당 강의노트는 김성범 교수님의 Exponential Smoothing (지수 평활법) 강의를 기반으로 작성했음을 밝힙니다.

구간 평균법

  • $L_t = {D_t + D_(t-1) + ... + D_(t-N+1)}/N$
  • 과거 시점의 일정기간의 평균(단순 평균)으로 다음 시점을 예측

구간 평균법이 적절한 case

  • Trend나 Seasonality variables과 같은 일정 패턴없이 변하는 level을 가진 데이터

(질문) 일정 패턴없이 변하는 level이 cycle인지 아니면 random한건지? 어떤 case를 의미하는 것인지 궁금

구간 평균법의 한계

  • 과거 n개의 데이터에 동일한 가중치를 준다. 
  • 예시: 현재 시점 t를 기준으로 n=3까지의 과거 데이터를 고려한다고 가정해보자. 구간평균법은 t, t-1, t-2이 오래된 시점의 데이터인지 최신의 데이터인지 고려해주지 않고 일괄적으로 평균을 계산한다.  
  • 미래의 예측값이 모두 동일하다. (?)

구간 평균법에서 구간(N) 결정

  • N이 작은 값일 때, 최근 데이터의 경향을 반영
  • N이 큰 값일 때, 과거 데이터의 경향을 반영하여 편평하게 예측
  • 경험적으로 판단하는 값

 

지수 평활법(Exponential Smoothing)

  • 가중 평균 이용
  • 지수분포 모양에 근거한 가중치 결정
  • 최근 데이터의 경향에 보다 많은 가중치를 주고, 과거 데이터일수록 가중치가 줄어든다.

단순지수 평활법

  • $L_0 = {D_t + D_(t-1) + ... + D_(t-N+1)}/N$
  • $L_(t+1)$ 계산할 때 $(t=0, ... ,n)$
    $L_(t+1) = \alpha*D_(t+1) + (1-\alpha)L_t$
  • 모든 과거 데이터 포함하여 계산 => 구간 평균법과의 차이점:  N개의 과거 데이터만 고려
  • 최근 데이터에 보다 큰 가중치를 부여한다.

단순지수 평활법의 한계

  • 구간 평균법과 동일한 한계점을 가진다.
  • Trend나 계절적 변동 있는 데이터에 적합하지 않음.
  • 미래의 예측값이 모두 동일하다.
  • 구간 평균법 보다는 조금 더 정확할 수 있다. => 이유: 과거의 데이터에 동일한 가중치를 주기 보다, 지수적으로 가중치를 주는 방식으로 평균을 계산하기 때문

단순지수 평활법에서 $\alpha$ 결정

  • smooth data라면, 큰 $\alpha$값 사용 => 최근 데이터에 보다 큰 가중치 적용
  • nosiy data라면 $\alpha$값 사용 => 과거 데이터에 보다 큰 가중치 적용 
  • 보편적으로 $\alpha=0.2$나, $\alpha=0.3$ 사용 
  • R, python에는 최적의 $\alpha$값을 자동적으로 계산해주는 라이브러리 있음

이중지수 평활법

  • Trend가 존재하는 시계열 데이터 예측시 적합
  • 단순지수 평활법을 2번 적용 
  • 단순 회귀분석을 통해 $L_0$(기울기)와 $B_0$(Y절편) 결정
    • 종속변수(Y): 관측값 
    • 독립변수(X): 시간 인덱스 $(1,2, ..., t)$
  • Determine $L_(t+1)$ Smooth with $\alpha$
    $$L_(t+1) = \alpha*D_(t-1)+(1-\alpha)(L_t + B_t)$$
    • $\alpha*D_(t-1)$ : Newly observed time series value
    • $B_t$: Growth rate = "Trend"
  • Determine $B_(t+1)$ Smooth with $\beta$
    $$B_(t+1)=\beta(L_(t+1)-L_t)+(1-\beta)B_t$$
    • L_(t+1)-L_t : Difference between the levels in period t+1 and t
    • $B_t$ : Growth rate made in time period t
  • Forecast (renumber forecast time periods)
    • $F_(t+n)=L_t+nB_t$
      • n: 미래 t

이수지수 평활법

(질문) $Y=\beta_0 + \beta_1*x^t$ Y절편을 유도하는 식이 등비급수를 통해 유도되는데, 해당 블로그 설명에서 확인했을 때 시정수(타우)를 의미하는 것인지 궁금하다.

홀트-윈터(Holt-Winter)지수 평활법

  • 3중지수 평활법
  • 계절 변동 존재시 사용
    • Additive method(+-): 주로 덧셈/뺄셈은 선형적인 모델의 경우, seasonal variations가 일정(constant)할 경우 
    • Multiplicative method(*/): 주로 비선형적인, 좀 더 복잡한 패턴의 경우, seasonal variations가 증가할 경우

홀트-윈터(Holt-Winter)지수 평활법

Additive 홀트-윈터(Holt-Winter)지수 평활법

Additive 홀트-윈터(Holt-Winter)지수 평활법

Multiplicative 홀트-윈터(Holt-Winter)지수 평활법

Multiplicative 홀트-윈터(Holt-Winter)지수 평활법

 

시계열분석 정리집: https://support.minitab.com/ko-kr/minitab/18/help-and-how-to/modeling-statistics/time-series/how-to/double-exponential-smoothing/methods-and-formulas/methods-and-formulas/
통계 - 지수평활방법: https://developer-ellen.tistory.com/14
통계 - 이중지수평활법: https://datalabbit.tistory.com/76?category=1146956
    'DATA/Note' 카테고리의 다른 글
    • [확률및통계] 강의 정리
    • [시계열] Time Series Regression - Part 3
    • [시계열] Time Series Regression - Part 2
    • [시계열] Time Series Regression - Part 1
    vg-rlo
    vg-rlo
    🛠블로그 공사중.. Keep going! 🤔 (Profile - Dinotaeng®)

    티스토리툴바