계량분석 A to Z
오늘날 우리는 ‘데이터의 시대’를 살아가고 있다. 데이터의 양도 폭발적으로 증가하고 있지만 유형 역시 예전에는 가히 상상할 수 없었을 정도로 다양해지고 있다. 또한 4차 산업혁명의 도래와 사물인터넷의 확대로 우리는 곧 ‘데이터의 시대’를 넘어 ‘슈퍼 데이터의 시대’를 마주하게 될 것이다. 단적인 예로, 예전에는 특정 시점(t)에서 횡단면적(Cross-sectional)으로 기록한 ‘스냅숏(Snapshot)’ 형태의 데이터만 존재했다면 오늘날에는 무수히 많은 연속적 시점(t, t+1, t+2...)에서 마치 일기를 써내려가듯이 대상을 순차적으로 따라가며 종단적(Longitudinal)으로 기록한 데이터 역시 쉽게 얻을 수 있다. 1
가령, 소비자 A가 특정 제품을 얼마나 사용하는지, 제품에 대한 만족도는 어떻게 달라지는지를 ‘매월’ 관찰해 데이터로 남긴다면 그 제품의 제조사는 데이터로부터 당연히 훨씬 풍부한 정보를 얻게 될 것이다.
이렇게 종단적으로 기록된 데이터는 미시적(Micro) 특성에 더해 시간의 흐름에 따라서 관찰된 자료라는 점에서 시계열 자료(Time series data)로서의 특성 역시 지니게 된다. 시계열 분석은 불확실한 미래에 대한 통계적 예측(Forecasting)을 위해서 사용되는 경우가 많은데 한국은행이 정책 수립을 위해 우리나라의 내년도 경제성장률을 예상하거나 항공사가 노선별 기종 배분을 위해 월별 탑승객 수를 미리 추정하는 것 등이 대표적인 사례다. 엄격한 시계열 분석은 여러 가정(Assumption)에 기반하고 있고 이러한 가정이 하나라도 위반된다면 분석 전체가 망가지게 되므로 계량분석 기법 중에서도 난도가 높은 편에 속한다. 2
하지만 제대로 수행된다면 기업의 의사결정 과정에 강력한 과학적 무기가 돼준다는 점에서 효용 역시 높다. (그래서인지 필자는 최근 유럽에서 시계열 분석 능력을 갖춘 데이터 애널리스트에 대한 기업들의 수요가 매우 높음을 새삼 느끼고 있다.) 필자는 이 글을 통해 기업 실무에서 누구나 간단하게 사용할 수 있으면서도 다양한 분야에서의 활용이 가능한 시계열 분석 기법 한 가지를 소개하고자 한다. 다음의 사례를 통해 논의를 시작해보자.
질문, 답변, 연관 아티클 확인까지 한번에! 경제·경영 관련 질문은 AskBiz에게 물어보세요. 오늘은 무엇을 도와드릴까요?
Click!
회원 가입만 해도, DBR 월정액 서비스 첫 달 무료!
15,000여 건의 DBR 콘텐츠를 무제한으로 이용하세요.