분석에 필요한 데이터, 잘 축적하고 있나요

248호 (2018년 5월 Issue 1)

기업의 정보 시스템이 널리 보급되기 전까지 기업 데이터는 분석하기에 다소 부족했던 게 사실이다. 그러나 최근 들어 데이터가 없는 기업은 찾기 어렵다. 데이터에 기반한 경영 의사결정이 일반화된 오늘날 기업들은 과연 분석에 필요한 데이터를 잘 구비하고 있을까?

통계를 배운 사람은 보통 Y로 표기하는 종속변수(결과변수)와 X라고 쓰는 원인, 즉 독립변수(설명변수)에 대해 알고 있다. 우리 회사에는 데이터가 충분히 많이 있다고 말하는 사람들의 대부분은 Y, 즉 결과변수가 있다는 뜻으로 말한다. 기업 정보 시스템에는 기업의 회계 결산을 위한 결과변수들이 존재한다. 그러나 데이터 분석에 기반한 경영 의사결정을 하기 위해서는 결과가 만들어진 원인인 X(설명변수)가 함께 있어야 한다. 필자의 경우 설명변수가 없어, 즉 원인이 되는 요소들에 대한 정보가 없어 아예 처음부터 과거 기록을 복기하고서야 비로소 자문을 시작한 경우도 있다.

그럼 X에는 어떤 것들이 포함될까? 우리가 언제 광고를 했고, 경쟁자와 우리가 어떤 프로모션을 했는지, 그때 우리의 가격은 얼마였는지, 경쟁상품의 가격은 얼마였는지 등이다. 이러한 설명변수가 SKU(상품판매/관리단위, stock keeping unit)별로 구비돼야 한다. 구체적 변수의 값이 없으면 가변수(dummy variable, 0과 1로만 구분하는)라도 사용해야 한다. 담당자가 바뀔 때 인수인계가 필요한 내용은 바로 이것이다. 이런 설명변수는 월별로, 때로는 주별로, 일별로 있어야 한다.

다시 필자의 자문 사례로 돌아가 보자. 10여 년 전 한 기업의 DB마케팅(database marketing) 시스템 문제를 살피고 조언을 하기 위해 방문했다. 실무자들은 거액을 들여 가입자 이탈 가능성을 예측하는 시스템을 만들었는데 실무에 전혀 사용할 수 없다고 설명했다. 문제는 결과변수와 사실상 같은 것을 동시에 설명변수로 사용한 데 있었다. 해당 변수를 빼자 모형의 결과는 엉망이 됐다. 빅데이터(big data)로 문제를 분석할 때 많은 사람이 이런 실수를 범한다. Y를 Y와 비슷한 변수로 설명하면 모형의 설명력은 매우 높아진다. 상관관계가 거의 1(100%)에 가까워질 수밖에 없기 때문이다.

런던에 본사를 둔 IWSR(International Wine & Spirit Research, www.theiwsr.com)은 전 세계 약 134개국을 매년 방문해 주류 가격과 소비량 등을 조사하고 보고서를 만들어 파는 일을 전문으로 한다. 이곳은 가족기업으로 종업원 수도 적다. 그러나 주류와 관련된 전 세계 기업들이 거의 대부분 이 보고서를 매년 구입해 경영에 참고한다. 해가 갈수록 이 데이터의 위력은 더 강해질 것이다. 데이터가 시계열(time-series)로 더해지기 때문이다. 고객의 데이터, 다른 기업의 데이터를 수집해 다시 다른 기업들에 판매하는 방식의 영업이다. 앞으로는 이 같은 정보 서비스 회사들이 지속적으로 늘어날 것이다.

이 기업의 사례가 우리에게 주는 교훈은 무엇일까? 구슬이 서 말이라도 꿰어야 보배다. 데이터도 마찬가지다. 무조건 최첨단의 기법과 최고가의 분석툴을 활용하는 게 핵심이 아니다. 엑셀과 같은 기존 오피스 프로그램이나 R과 같은 오픈소스 프로그램으로도 거의 모든 분석은 다 할 수 있다. 중요한 건 우리가 정말 제대로 된 데이터를 갖고 있고 이를 제대로 분류해 설명변수와 결과변수로 설정을 할 수 있는지 여부다. 최첨단 기법에 대해 연구하고 자문을 구하기 전에 정말 우리의 데이터가 분석하기에 충분한지 다시 점검해 볼 필요가 있다.

248_14_1

차경천 동아대 경영학과 교수(한국마케팅학회 부회장)


차경천 교수는 KAIST에서 경영공학 박사 학위를 받고, 현재 동아대 경영학과 교수로 재직 중이다. 한국마케팅학회 부회장을 맡고 있기도 하다. 수요 예측 전문 벤처기업을 3년간 운영한 바 있다. 국내외 다수의 학술저널에 논문을 게재했으며, 한국마케팅학회 최우수논문상과 우수논문상을 받았다. 현재 한국마케팅학회의 학술지 마케팅연구의 편집위원장을 맡고 있다. 저서로는 『예측의 힘』이 있다. 스포츠 기록, 전자제품 수요, 네트워크 사업 매출, 피자, 커피, 위스키, 외식업, 핸드폰, 보험, 핸드폰 통화량, 전자소자, 인터넷 쇼핑몰, 영화관 매출과 위치 선정, 위치 정보 분석, 관광실태 조사, 주유소 위치 선정, TV display size, 직무만족도 등과 관련한 다양한 예측 문제를 해결해 왔다.

동아비즈니스리뷰 290호 오프라인 매장의 반격 2020년 2월 Issue 1 목차보기