본문 바로가기
  • 문과생의 백엔드 개발자 성장기
|Developer_Study/Python

210415_ 시계열 데이터란?

by 케리's 2021. 4. 15.

시계열 데이터의 개념

시계열(time series) 데이터는 관측치가 시간적 순서를 가진 데이터이다.

이 데이터는 변수 간의 상관성(correation)이 존재하는 데이터를 다루며, i.i.d, 연속(continous)하거나 불규칙적(irregular) 데이터는 다루지 않는다.
시계열 데이터는 과거의 데이터를 통해서 현재의 움직임 그리고 미래를 예측하는데 사용된다.

일반적인 label데이터는 input과 label간의 상관관계를 다루는 반면에 시간에 따라 어떻게 움직이는 과거의 자료를 가지고 예측하게 된다.

시계열 데이터의 분류

정상 시계열 (Stationary) : 이론적

어떤 시계열 자료의 변화 패턴이 평귱값을 중심으로 질정한 변동 폭을 갖는 시계열

시간의 추이와 관계없이 평균과 분산이 일정하다.

평균과 표준편차가 일정하다는 조건이 선행되어야 분석이 가능하다.

대표적인 예시로는 ARIMA모델이 있다.

 

비정상 시계열 (Non-stationary) : 대부분 시계열 자료

시간의 추이에 따라서 점진적으로 증가하는 추세

분산이 일정하지 않은 경우

차분이나 log함수를 씌워 정상시 계열로 변환 후 분석해야 한다.

 

시계열 데이터의 특성

추세 변동 

   인구 변동, 지각 변동, 기술 변화 등 상승과 하락의 영향 (장기 변동요인)

순환 변동

   2~10년의 주기에서 일정한 기간 없는 반복적 요소 (중, 장기 변동요인)

계절 변동

   일정한 기간 (월, 요일, 분기), 1년 단위 반복적 요소 (단기 변동요인)

불규칙 변동

  어떤 규칙 없이 예측 불가능한 변동요인 (설명할 수 없는 요인)

   실제 시계열 자료에서 추세, 순환 계절요인을 뺀 결과 (회귀분석 오차)

 

시계열 데이터의 알고리즘 (분석)

단일 변량

 

시간을 설명변수로 하나의 변수에 관심을 갖는 경우 활용한다.

 

 1) 평활법 (Smoothing Method)

  - 수학/통계적 방법의 분석이 아닌 시각화를 통한 직관적 방법의 데이터 분석 방법.

  - 단기예측, 1개 (1 변량)

  - 시계열 자료의 체계적인 자료의 흐름을 파악하기 위해서 과거 자료의 불규칙적인 변동을 제공하는 방법 

 

 2) 이동평균 (Moving Averange)

 - 시계열 자료를 대상으로 일정한 기간의 자료를 평균으로 계산하고,

   이동시킨 추세를 파악하여 추세를 예측하는 분석방법  

 

다변량

 

여러 시간에 따른 변수들을 활용한다.

다수의 측정치를 동시에 분석하는 모든 통계적 방법 종속 기법, 상호 의존적 기법,

명목 척도, 순위 척도, 등간 척도, 비율 척도, 정량적 자료, 비정량적 자료

변량 (변수들을 일종의 통계적 방법으로 가중치를 주어 변수들의 합의 형태로 나타낸 새로운 변수)

'|Developer_Study > Python' 카테고리의 다른 글

백준 _ for문  (0) 2021.05.20
백준 _ if문  (1) 2021.05.20
백준 _ 입출력과 사칙연산  (0) 2021.05.10
210501_프로그래머스 Lv1 수포자  (0) 2021.05.01
210429_클래스 4-2  (0) 2021.04.30

댓글