Top
검색버튼 메뉴버튼

바코드 속 숨은 정보 활용법

스캐너 데이터로 물가지수를 만들면?

정태훈 | 340호 (2022년 03월 Issue 1)
Article at a Glance

상품이 거래될 때 바코드를 통해 수집되는 스캐너 데이터에는 상품과 거래에 대한 많은 정보가 포함돼 있다. 유통사가 멤버십 제도 등을 통해 수집한 소비자 정보를 스캐너 데이터와 결합하면 간편하고 정확한 실시간 물가지수를 만들어 정부 정책과 기업 경영에 활용할 수 있다. 기업은 스캐너 데이터를 기반으로 연령별, 성별 물가지수 등 다양한 물가지수를 만들어 판매 전략을 세울 수 있다.



손 소독 티슈를 사기 위해 슈퍼에 들렀다. 상품에 어떤 성분이 들어 있나 살펴보기 위해 박스를 이리저리 살피다 한쪽 면 하단에 있는 검은 막대의 조합이 눈에 띄었다. 막대 밑에는 13자리 숫자가 적혀 있었다. 모두 알겠지만 이 막대 조합이 바로 바코드다. 그리고 바코드 아래 있는 숫자를 식별 코드라고 한다.

그렇다면 스캐너 데이터란 무엇인가? 바코드를 리더기로 읽어 들일 때 수집되는 데이터이다. 다른 말로는 POS(Point of Sales) 데이터라고도 한다. 여기에는 바코드가 내포한 상품의 정보, 즉 이 상품을 어떤 제조업체가 만들었는지, 어떤 종류의 상품인지, 무게 및 용량이 어떻게 되는지 등에 대한 정보가 담겨 있다. 그뿐만 아니라 거래 시점과 상황의 정보, 즉 거래 금액이 얼마인지, 구매한 점포의 위치 및 판매량, 거래가 이뤄진 시점에 대한 정보 등도 포함된다.

이처럼 상품과 거래에 대한 모든 정보가 취합된 스캐너 데이터는 활용 가치가 매우 높다. 더군다나 요즘 모든 유통사가 갖고 있는 포인트 카드와 결합되는 순간 소비자 정보와 매칭되며 소비자의 특성에 부합하는 맞춤형 마케팅 전략을 고안하는 일에도 활용할 수 있다. 즉, 특정 제품에 대한 수요를 분석한다든지, 신제품의 반향 정도를 분석한다든지, 가격 변경에 따른 시장점유율을 파악한다든지 등 자사의 상품 관리 및 마케팅, 고객관계관리(CRM) 등을 위해 활용할 수 있다.

특히 최근 국내외를 막론하고 인플레이션이 화두다. 지난 달 1월 미국의 소비자물가가 7.5% 오르며 40년 만에 최고치를 기록했고 한국 역시 라면, 햄버거 등 물가를 대표하는 상품들의 가격이 줄인상되고 있다. 인플레이션의 급물살 속에서 스캐너 데이터는 실시간으로 물가 변동을 확인할 수 있는 정보로 조명되고 있다. 스캐너 데이터 데이터가 원활히 공유된다면 데이터를 수집하는 유통사뿐 아니라 제조사, 심지어 이커머스 플랫폼 역시 시시각각 요동치는 물가를 경영 전략에 신속하게 반영할 수 있다.

167


스캐너 데이터로 만드는 물가지수

스캐너 데이터는 기업과 국가의 경제에 크게 기여할 수 있다. 스캐너 데이터가 수집되기 시작한 지 꽤 시간이 흘러서 이제는 엄청난 양의 정보를 제공하는 빅데이터가 됐다. 그리고 이 빅데이터는 정확한 경제지표를 만드는 데 사용된다. 대표적인 것이 소비자물가지수다. 기존에는 소비자물가지수 작성에 정부 기관만 참여했다. 우리나라의 경우 통계청에서 전적으로 소비자물가지수를 계산해 왔다. 하지만 스위스, 네덜란드, 노르웨이, 스웨덴 등 유럽의 여러 국가에서는 이미 스캐너 데이터를 이용해 소비자물가지수를 작성해 오고 있다.

스캐너 데이터로 물가지수를 만들면 어떤 장점이 있을까? 첫째, 데이터 수집에 필요한 비용이 절약된다. 상품의 가격을 조사할 조사원들을 교육해 40개 시도에 보낼 필요가 없어지기 때문이다. 둘째, 데이터 제공자의 부담이 경감된다. 데이터를 생산하는 유통업자 입장에서도 소비자물가 통계를 작성할 때 정부가 요구하는 정보를 전자 데이터 형태로 간편하게 제공할 수 있다.

셋째, 신속하게 물가지수를 제공할 수 있다. 시시각각으로 스캐너 데이터 정보가 수집되기 때문에 이를 집계해서 물가지수를 계산해 내는 시스템만 구축해 놓으면 매일 물가지수를 구할 수 있다. 실제로 나우캐스트(NOWCAST)라는 일본의 데이터 분석 서비스 기업은 NIKKEI CPINow라는 일별 물가지수를 생산하고 있다. 오늘의 물가지수가 이틀 후면 발표된다. 현재 통계청의 소비자물가지수가 한 달에 한 번 발표되는 것과 비교하면 속도감에서 차이가 있다.

넷째, 물가지수를 정확하게 제공할 수 있다. 현재는 소비자물가지수를 측정할 때 한 번 정해진 조사 품목이 5년간 고정된다. 신상품이 끊임없이 나오는 세상에서 실시간 데이터가 아닌 정보는 정확한 측정에 해가 될 수 있다. 소비자물가지수가 정확하지 않으면 어떤 일이 일어날까.

일본의 예를 들어보자. 일본은 1980년대 플라자합의1 이후 시작된 버블이 1991년 붕괴되며 경제가 나락으로 빠져들었다. 경제학 교과서에서만 배우던 유동성 함정2 을 실제로 겪게 됐고, 당시만 해도 아주 생소했던 양적 완화 정책을 실시하는 등 1990년 초반의 일본 경제는 그야말로 다이내믹했다. 그런데 와타나베 스토무(Tsutomu Watanabe) 도쿄대 경제학부 교수가 1990년대 초반 통화정책의 실패는 일본 은행의 잘못이 아니라 당시 소비자물가지수가 부정확했기 때문이라는 주장을 제기했다. 와타나베 교수는 스캐너 데이터를 이용해 물가지수를 측정했고 일본 총무성이 작성하는 소비자물가지수와 비교했다. 그랬더니 전년 동월 대비 물가상승률이 마이너스로 돌아선 시점이 총무성이 제공한 시점보다 3년이나 빨랐다. 필자가 데이터를 입수해 그려본 그래프는 [그림 1]과 같다.

168(1)


[그림 1]에 따르면 총무성의 소비자물가지수 증가율이 마이너스로 돌아선 시점은 1995년인 데 비해 스캐너 데이터를 이용한 물가지수 증가율이 마이너스로 돌아선 시점은 1992년이다. 만약 3년만 앞당겨 적극적인 통화정책을 시작했더라면 디플레이션이라는 터널로부터 진즉에 빠져나왔을 것이라는 것이 와타나베 교수의 주장이다.

168(2)

롯데멤버스의 롯데슈퍼 스캐너 데이터로 와타나베 교수의 물가지수 산정 방식과 유사하게 물가지수를 측정하고 생활물가지수와 비교해 봤다. [그림 2]는 필자가 스캐너 데이터로 작성한 물가지수의 전년 동월 대비 상승률과 통계청에서 발표하는 생활물가지수의 전년 동월 대비 상승률을 나타낸다.3 2017년에는 통계청의 생활물가지수 증가율이 더 큰 폭으로 상승한 반면 2018년에는 스캐너 데이터로 작성한 물가지수의 증가율이 더 큰 폭으로 상승한 것을 알 수 있다. 어떤 쪽이 맞다고 쉽게 이야기할 수는 없다. 중요한 것은 분명히 현실과 다른 움직임과 정보를 제공하고 있다는 점이다. 물가지수를 보고 정책을 펼치는 정부는 어떤 쪽이 정확하고 유용한지를 살펴봐야 한다는 의미다.

다섯째, 기존의 물가지수 작성 방식으로는 모르던 것을 알 수 있다. 예컨대 필자가 사용한 스캐너 데이터는 롯데의 멤버십 포인트인 ‘엘포인트(L.POINT)’ 정보와 결합돼 있기 때문에 연령대별로 체감하는 물가를 계산해 볼 수 있다. 이것은 통계청의 소비자물가지수만을 가지고는 불가능한 작업이다. 물론 별도로 설문 조사를 통한 분석도 가능하나 스캐너 데이터만큼 정확하게 측정할 수 없다.

169


[그림 3]은 마크 아기아르(Mark Aguiar) 프린스턴대 경제학과 교수와 에릭 허스트(Erik Hurst) 시카고대 경영대학원 교수가 연령대별로 체감하는 물가 수준을 20대를 기준으로 그린 그래프와 함께 이들의 방식을 일본에 적용한 아베 나오히토(Naohito Abe) 히토츠바시대 경제연구소 교수의 그래프와 우리나라 롯데슈퍼 오프라인 데이터에 적용한 필자의 그래프를 비교한 것이다. 우리나라의 경우 연령대가 높아질수록 더 싸게 상품을 구매하는 경향이 있다는 사실을 알 수 있다. 20대보다 50대가 0.8% 정도, 60대가 0.7% 정도 더 싸게 산다. 미국과는 상당히 유사한 반면 일본과는 다른 패턴을 보인다. 미국의 경우 연령대가 높을수록 싸게 사는데 20대보다 50대가 0.9∼2.7%, 60대가 2.7∼3.6% 더 싸게 산다. 반면 일본에서는 20대보다 50대가 1.0∼1.2%, 60대가 1.5% 정도 더 비싸게 산다. 아기아르 교수와 허스트 교수는 미국에서는 연령대가 높을수록 싼 상품을 사기 위해서 쇼핑을 자주 하기 때문이라고 주장한다. 반면 아베 교수는 일본에서도 연령대가 높을수록 쇼핑 빈도가 높아지는 것은 사실이지만 그것이 구매 가격에 미치는 영향은 제한적이라고 주장한다.

170


필자는 연령대별로 롯데슈퍼를 방문하는 횟수를 구해봤다. [그림 4]는 한 달 내 평균 방문일수를 나타내고 있는데 20대가 한 달에 2.5회 정도로 가장 적게 방문하고 40대가 3.3회 정도로 가장 많이 방문한다. 이는 연령대가 높아질수록 많이 방문하는 경향이 있다는 아기아르 교수와 허스트 교수의 주장과 대략적으로 일치한다.4 수치의 크기 자체를 차치하더라도 중요한 것은 연령대별로 체감하는 물가가 다르다는 점이다. 즉, 정부가 물가상승률을 조정하기 위해 실시하는 정책들이 모든 사람에게 동일한 의미로 와 닿지 않는다는 것이다.

기업을 위한 스캐너 데이터 활용 조언

우리나라는 데이터를 디지털화해서 입수하는 능력은 이미 세계적인 수준에 도달해 있다. 또한 빅데이터에 대한 정부의 요구도 지속적으로 이뤄지고 있어서 앞으로도 데이터를 생산하는 시장은 그야말로 블루오션이다. 그렇다면 기업들은 이러한 스캐너 데이터와 스캐너 데이터를 이용한 물가지수를 어떻게 이용해야 될까?

먼저 스캐너 데이터를 가치 있는 정보로 만들어 판매하려고 하는 기업 입장에서 생각해보자. 이들 기업이 우선적으로 해결해야 할 중요한 문제가 있다. 바로 바코드 공유가 안 된다는 사실이다. 서로 다른 기업들 간의 바코드 공유뿐만 아니라 동일한 기업에 속한 계열사 간의 바코드 공유도 어려운 실정이다. 많은 스캐너 데이터가 생산된다 하더라도 기업 내에서 바코드 공유가 어려운 상황이라면 데이터의 유용성이 대폭 줄어들 수밖에 없다.

바코드 공유가 잘되지 않는 이유는 무엇일까? 비식별화 조치 때문이다. 스캐너 데이터를 생산하는 기업들은 상품 정보 이외에 회원 가입을 통한 고객의 개인정보까지 갖고 있어서 이 둘을 연계해 놓는다. 이때 비식별화 조치를 하지 않으면 개인정보가 유출된다. 이러한 이유로 상품 고유의 바코드, 즉, 식별 코드가 계열사만의 독특한 코드로 변경이 된다. 이 과정에서 동일 상품인지, 아닌지 판별하기 어려워지는 것이다. 한 그룹 내 계열사 간 사정도 이러할진대 다른 그룹 간의 바코드 공유는 말할 것도 없다. 개인정보의 보호를 위한 비식별화 조치는 필요한 일이다. 하지만 데이터의 유용성을 높이기 위해서 식별화 조치를 어떤 방식으로 적용할지 심도 있는 논의가 필요하다. 이 문제를 해결하기 위해서는 스캐너 데이터를 총괄하는 컨트롤타워가 기업 내에 있어야 한다.

다음으로 스캐너 데이터를 생산하고 이용하는 기업 입장에서 생각해보자. 이들 기업은 실시간으로 스캐너 데이터 관련 정보를 관찰하면서 판매 전략을 세울 수 있다. 예를 들어, 2021년 8월 제품 가격을 모두 동결하기로 결정한 주식회사 오리온을 보자. 오리온은 2013년 이후로 제품 가격을 8년째 동결해왔다. 그럼에도 불구하고 2021년 상반기 영업이익률이 16.8%로 동종 다른 업체보다 더 높은 수준이다. 여러 이유 가운데 전문가들은 공통적으로 이 업체가 스캐너 데이터를 효율적으로 이용한 점을 꼽는다. 오리온은 실시간으로 들어오는 스캐너 데이터를 보고 가격을 변경할지, 아니면 수량을 조정할지를 결정해왔다. 이에 따라 그간 오리온은 가격 변경 전략보다는 수량 조정 전략을 펼쳤다. 잘 안 팔리거나 반품 비율이 높은 상품은 과감히 공급을 줄였다. 이 같은 판단은 다양한 유통사로부터 스캐너 데이터가 입수돼야 가능하다. 이 단계에서 스캐너 데이터로 작성된 물가지수도 이용할 수 있게 된다. 국가나 공공기관이 각 업체로부터 제공받은 스캐너 데이터를 이용해 물가지수를 만들어낸다는 것은 업종별 물가지수도 존재한다는 뜻이다. 스캐너 데이터를 통해 업종별 물가지수를 파악하면 기업이 해당 업종 내에 속한 포지션을 알 수 있다.5 이에 따라 가격 전략을 펼치는 것이 나은지, 수량 전략을 펼치는 것이 나은지 결정할 수 있다.

172


스캐너 데이터를 생산하고 이용하는 기업 입장에서는 업종별 물가지수만 이용할 수 있는 것이 아니다. 일반적으로 회원 가입을 통한 소비자의 특성도 함께 알 수 있기 때문에 연령대별, 성별, 지역별 물가지수도 계산할 수 있다. 노년층을 대상으로 하는 헬스케어 업체에서는 연령대별 물가지수가 중요할 수 있고, 뷰티 케어를 전문으로 하는 업체에서는 성별 물가지수가 중요할 수 있다. 그리고 지역에 따라 가격 전략을 취할지, 수량 전략을 취할지 선택이 달라질 수도 있다. 일본에서는 대중적으로 사용되는 멤버십 중 하나인 T포인트 카드의 제휴사를 통해 스캐너 데이터와 함께 회원들의 개별 특성이 함께 수집된다. 이에 따라 성별 및 연령대 등을 고려한 다양한 물가지수 분석이 이뤄지고 있다.

더군다나 디지털 판매 채널이 활성화되면서 온라인 가격 전략과 오프라인 가격 전략을 다르게 정하는 기업도 많다. 이때도 스캐너 데이터를 이용할 수 있다. 즉, 온라인 스캐너 데이터 물가지수와 오프라인 스캐너 데이터를 별도로 작성할 수 있다는 뜻이다. 필자도 알베르토 카발로(Alberto Cavallo) 하버드대 경영대학원 교수의 방법을 이용해 롯데슈퍼의 온라인 스캐너 데이터와 오프라인 스캐너 데이터를 가지고 각각의 물가지수를 측정했다. 그 결과 온라인 물가지수가 오프라인 물가지수보다 약간 더 낮게 나타났고 물가의 움직임, 즉 가격 변동의 주기는 온라인이 오프라인보다 더 짧았다. 온라인을 주력으로 이용하는 업체들이 가격 전략을 펼칠 때 온라인 물가지수를 기준으로 삼고, 이를 이용해 가격 설정 및 가격 변동 주기를 결정할 수 있다. 온라인과 오프라인을 동시에 운영하는 업체들은 두 물가지수를 모두 이용해야 할 것이다.

스캐너 데이터 자체와 이를 통해 알 수 있는 물가지수가 중요한 만큼 이것을 어떻게 투명하게 관리할 것인지에 기업과 학계의 논의도 필요하다. 또한 몇몇 기업만 참여하는 바람에 표집 편향(sampling bias)이 일어나선 안 된다.

데이터 입수에 오랜 시간이 걸리던 시대에는 현재를 직시할 수가 없었다. 현재를 정확하게 파악할 수 없으니 미래라도 예측(forecasting)하고 싶어 했다. 하지만 패러다임이 바뀌었다. 이제는 데이터를 실시간으로 보고 분석할 수 있는 시대가 됐다. 현재를 바라보는 나우캐스팅(nowcasting)6 이 중요해진 만큼 스캐너 데이터가 나우캐스팅의 한 축으로 큰 역할을 해내게 될 것이다.


정태훈 경북대 대학원 경제학과 교수 taehunjung@gmail.com
필자는 서울대 경제학과를 졸업하고, 일본 히토츠바시대에서 경제학 박사학위를 취득했다. 한국은행을 거쳐 경북대에서 근무하고 있으며, 최근에는 스캐너 데이터를 이용한 물가 분석, 아파트 실거래가를 이용한 분포 분석, 언론 기사를 이용한 경제 상황 분석 등 데이터에 기반한 연구를 수행하고 있다.
  • 정태훈 | 서울대 경제학과를 졸업하고, 일본 히토츠바시대에서 경제학 박사학위를 취득했다. 한국은행을 거쳐 경북대에서 근무하고 있으며, 최근에는 스캐너 데이터를 이용한 물가 분석, 아파트 실거래가를 이용한 분포 분석, 언론 기사를 이용한 경제 상황 분석 등 데이터에 기반한 연구를 수행하고 있다.

    이 필자의 다른 기사 보기
관련기사