SR4. 데이터의 비즈니스 가치를 높이려면

뛰어난 데이터도 활용 어려우면 쓸모없어
구독경제 시대 맞게 데이터 표준화 절실

305호 (2020년 9월 Issue 2)

Article at a Glance

데이터도 일회성 컨설팅이 아니라 정기적으로 구독하는 시대가 도래했다. 데이터의 비즈니스적 가치를 고려할 때는 대표성이나 활용 범위, 품질, 연결성, 지속적 제공 가능성 등 다양한 요소를 감안해야 한다. 아무리 구하기 힘든 고가의 데이터라도 활용이 제한적이고 찾는 이가 없다면 비즈니스적 가치는 결코 크다고 볼 수 없다. 데이터의 표준화를 통해 데이터 결합을 쉽게 시도할 수 있는 환경이 마련된다면 데이터의 비즈니스적 가치는 더욱 커질 것이다.



최근 데이터 3법이 통과되고 디지털 뉴딜 등 데이터를 활용해서 실질적 성과를 낼 수 있도록 지원하는 제도적, 정책적 환경이 조성되면서 데이터 산업에 대한 관심이 커지고 있다. 1990년대 말 금융권 신용평가 모형을 개발하면서 데이터 분석 업무를 시작한 필자는 현재까지 다양한 업종의 데이터를 다루고 활용하는 업무를 하고 있다. 이전까지 기업은 데이터를 주로 기업의 리스크나 성과 같은 주요 지표를 측정하고 관리하기 위해 필요한 내부 인프라 요소로만 여겨왔다. 그런데 최근에는 데이터 분석을 통해 신사업을 발굴하고, 데이터 직접 판매를 통한 수익화를 꾀하게 되면서 데이터를 기업의 중요한 자산 중 하나로 인식하고 그 가치를 높이려는 시도가 늘어나고 있다.

데이터 분석 및 활용 업무는 1990년대 말부터 2000년대 초 IMF와 카드 대란 사태를 겪으면서 금융권을 중심으로 본격적으로 시작됐다. 당시 개인 대출과 신용카드 같은 소매 상품에 대한 정확한 리스크 관리 필요성이 대두되면서 정밀한 평가 모형과 자동화된 모니터링 프로세스를 구축하기 시작했다. 금융권 데이터는 비교적 정형화된 형식을 갖추고 있고 장기간 정보가 보관돼 있어 원인과 결과에 대한 설명이 용이한, 상당히 깔끔한 형태다. 또 대부분 기관이 관리하는 항목 형태와 방식이 비슷하게 표준화돼 있어 활용하기가 쉽다. 하지만 최근에는 데이터의 활용 범위와 사업 범위가 빠르게 확대돼 금융권은 점차 마케팅과 비정형 신용평가 부문으로, 비금융권에서도 통신, 유통, 제조 등 다양한 분야에서 데이터 활용에 대한 새로운 시도가 빠르게 진행되고 있다.

본 글에서는 최근 빅데이터 컨설팅 트렌드를 중심으로 데이터가 비즈니스 의사결정에 어떻게 실질적인 역할을 하면서 가치를 높일 수 있을지를 살펴보고자 한다.

057

빅데이터도 구독경제 시대

기업들의 데이터 수요와 관련한 비즈니스 행태가 달라지고 있다. 과거 기업들은 특정 목적에 따라 구성된 다양한 외부 시장 데이터를 백화점식으로 납품해왔다. 데이터 사업도 고객별 맞춤 서비스라기보다는 최대한 다양한 분석 경험을 제공하고 고객이 직접 맞는 형태를 탐색할 수 있도록 도와주는 식이었다. 그래서 초기 빅데이터 사업은 시장 분석, 경쟁사와의 비교, 정책 수행 후 효과 분석 등 기존에 설문 조사나 리서치를 통해 수행하던 업무를 대량의 데이터를 통해 정확하고 신속하게 수행하는 형태가 많았다. 하지만 이런 데이터들은 그때그때의 궁금증을 해결하는 데는 도움이 될지 모르지만 한번 인사이트를 뽑아낸 다음에는 재활용할 이유가 사라지는 근본적인 한계가 있었다.

하지만 최근에는 데이터 분석 경험들이 쌓이면서 외부 빅데이터와 내부 데이터를 결합해 내·외부 통합적인 지표를 생성하고 그것을 전략적 목적으로 활용하려는 니즈가 커지고 있다. 시장을 거시적으로 한눈에 파악할 수 있는 각종 지수를 내부의 성과값과 연동하는 것이다. 일반적으로 기업의 빅데이터 분석 능력은 처음 분석을 준비하고 시작하는 도입 단계, 다양한 분석 결과를 실제 업무에 적용하는 확산 단계, 전사적인 성과 관리 및 최적화 전략과 연동하는 성숙 단계로 발전한다. 여기서 가장 중요한 것은 각 분석 프로세스와 전략의 기획·실행 과정이 잘 연계된 순환적 연결구조(Closed Loop)를 갖추는 것이다. 즉, 단계별 모든 활동은 수치화해 개인이나 조직의 성과 측정 과정과 연결돼야 한다. 그렇게 측정된 성과는 외부 지표와 비교해 상대평가하고 정확하게 포지셔닝하는 데 활용될 수 있다. 이처럼 기업의 내부 프로세스에 외부 데이터가 록인(Lock-in)되면 비로소 데이터에 대한 꾸준한 쓰임새가 마련되고 매달 또는 매 분기 데이터를 정기적으로 구매해 활용하는 데이터 구독(Subscription)도 가능해진다.

앞으로 일회성 프로젝트 기반에서 정기적 수수료 기반(Fee-biz 방식) 데이터 제공 비즈니스의 비중이 점차 커질 것으로 예상된다. 기업이 반복적인 데이터 탐색 과정을 통해 마침내 지속적인 데이터의 활용처를 발견하게 되면 정기적이고 안정적인 데이터 공급을 원하게 된다. 이렇게 데이터 구독경제가 정착되면 데이터 공급자 입장에서는 안정적인 수익 구조를 확보할 수 있을 뿐 아니라 고객과의 발전적인 관계를 보다 쉽게 구축할 수 있다는 장점이 있다. 즉, 지속적인 고객과의 네트워킹 과정은 새로운 니즈 발굴과 추가적인 서비스 개발로 연결될 수 있으며 이는 컨설팅 사업에서 데이터 사업으로 한 단계 도약하기 위해 필수적인 과정이라고 할 수 있다.

빅데이터의 시대, 데이터 산업 측면에서는 대량의 데이터를 발굴하고 최첨단의 빅데이터 기술을 발전시켜 복잡한 알고리즘을 개발하는 것도 중요하다. 하지만 일반 기업 입장에서는 분석과 적용, 예측 및 피드백의 과정을 통해 순환하는 데이터 중심의 의사결정 프로세스를 확립하고 이런 기업 문화를 내재화함으로써 핵심 비즈니스로 활용하는 능력을 키우는 것이 더 중요하다. 그래야 빅데이터 구독 서비스가 기업의 실질적인 의사결정에 효과를 발휘할 수 있을 것이다.

빅데이터 분석의 시작, 데이터 표준화 및 분류

단일 데이터를 분석하고 활용할 때는 상관없지만 어떤 목적을 위해 복수의 데이터를 함께 분석해야 한다면 서로 다른 데이터의 결합 기준, 즉 표준화와 관련된 이슈가 발생하기 마련이다. 일반적으로 원천 입수된 데이터는 바로 활용할 수 없는 경우가 많기 때문이다. 보통 전처리, 표준화 및 분류 작업, 지수화 등 여러 단계의 가공 과정을 거쳐야 비로소 데이터 분석이 가능한 형태가 되는데 이런 과정은 다양한 경험과 기술적인 노하우뿐만 아니라 데이터가 소속된 업종의 도메인 지식이 결합돼야 실제 적용했을 때 비즈니스적으로 어색하지 않은 분석 결과를 도출해 낼 수 있다. 이런 전처리·가공 과정이야말로 데이터에서 가치를 생성하는 첫 번째 단계라고 볼 수 있다.

059

현실의 데이터는 아주 복잡하다. 예를 들어, 매장 POS의 메뉴 데이터는 데이터 분석을 전혀 감안하지 않고 설계되다 보니 거의 자연어 수준으로 입력돼 있다. 데이터 과학자들이 이 데이터를 통해 어떤 목적의 분석 결과를 도출해 내기 위해서는 제일 먼저 수많은 메뉴를 표준화하고 대/중/소 카테고리로 분류하는 작업을 해야 한다. 그렇지 않으면 메뉴별 판매 금액을 집계하거나 여러 지역의 메뉴 판매 특성을 비교 분석할 때 낭패를 볼 것이다.

개인에 대한 데이터는 결합 키 1 에 대한 이슈가 적은 편이지만 사업자나 점포별 데이터는 결합 키를 포함한 주요 항목에 대한 정제, 표준화가 아직까지는 어려운 숙제다. 특히 주소(지역), 업종, 메뉴 등 세 가지 항목에 대한 공통적인 처리 방안을 마련하는 것이 데이터 결합에 있어 가장 필수적인 부분이라고 볼 수 있다.

서로 다른 데이터 원천에서 들어온 전국 각 지역 매장별 메뉴와 판매 가격 정보를 예로 들어보자. 정확한 데이터 분석을 위해 제일 먼저 필요한 과정은 서로 제각각 표현돼 있는 매장별 판매 정보를 ‘동일한 매장’의 ‘동일한 메뉴’로 인식할 수 있도록 정리해주는 일이다.

060

주소의 경우 여전히 신/구 주소 체계를 혼용해 사용하고 있을 뿐 아니라 지번 등의 상세 주소가 생략되거나 때로는 잘못 기입돼 있는 경우도 많다. 우선, 주소를 정제하고 불충분한 정보를 제대로 채워 넣는 작업을 거쳐 해당 주소는 특정 지역을 의미하는 코드로 변환된다. 이로써 주소를 누구에 대한 정보인지 알 수 없도록 비식별 처리함과 동시에 서로 동일한 지역에 속해 있음을 데이터적으로 인식할 수 있다. (그림 2의 ①)

또 매장명을 보고 해당 매장이 어느 업종에 해당하는지 판단해야 하는데 매장명과 함께 주소나 판매 메뉴 등 매장의 부가적인 정보를 활용해 정확한 업종을 매핑하는 것이 중요하다. 나이스지니데이타는 국내 최고의 상권 서비스 사업자로 업종 매핑 룰 세트2 를 확보하고 있으며 머신러닝으로 학습된 업종 분류 체계를 보유하고 있다. 이런 기준을 적용해 400여 가지 대/중/소분류 상세 업종코드로 분류를 할 수 있다. (그림2의 ②)

다음으로 난도가 가장 높은 과정이 메뉴의 정제 및 표준화다. 먼저, 정규식이나 불용어 제거, 토크나이징 같은 기술적인 전처리 과정3 과 머신러닝 학습 과정을 통해 메뉴를 정제한다. 이후 대/중/소 카테고리로 분류해 할당하고, 맛이나 재료, 용량(크기) 등의 다양한 속성값도 분리해 별도의 태그로 저장한다. (그림2의 ③)

위와 같은 과정을 거치고 나서야 비로소 “강남역 메인 상권에 위치한 커피 전문점의 최근 1년간 아메리카노 평균 가격과 총판매량은?”과 같은 질문에 대한 답을 정확하게 계산해 낼 수 있게 된다.

이렇게 여러 단계를 거쳐 처리된 데이터세트가 마련돼야 비즈니스 목적에 맞게 가공돼 문제를 해결하거나 전략을 지원하기 위한 솔루션으로 활용하는 빅데이터 컨설팅 업무가 가능해진다.

빅데이터를 활용한 컨설팅 서비스는 다양한 방식으로 제공될 수 있다. 금융, 공공 및 유통 등 다양한 원천으로부터 데이터를 입수해 상권 특성 정보, 상가 및 부동산 정보, 소비 고객의 특성 정보, 품목별 판매 정보, 음식점 메뉴 정보 등 다양한 가공 데이터로 재구성하고 있으며 이 수많은 가공 데이터는 목적별 맞춤 데이터 공급이나 웹서비스를 통한 솔루션 판매, 또는 특정 주제별 분석·컨설팅 및 시스템과 연계된 프로젝트 등에 다양한 형태로 제공하고 있다.

이제 다양한 업종에서 수행했던 수많은 컨설팅 중 몇 가지 사례를 통해 단순한 데이터가 ‘정보(Information)’로 변환돼 기업의 의사결정 단계에서 중요하게 사용되는 과정을 들여다보자.

사례1 빅데이터로 읽는 시장 트렌드

1) 자사 및 경쟁사 비교 통한 경쟁 전략 수립

주류 제조사 A사의 경우 매년 상당한 비용을 들여 소비 트렌드나 경쟁사 조사를 함으로써 주요 마케팅 전략에 대한 모니터링을 실시하고 있다. 이런 분석들은 대부분 리서치 회사를 통해 수행되는데 주로 설문이나 패널, 표본조사에 기반한 분석 기법이 많아 전체 시장에서의 소비 활동을 즉각적이면서 반복적으로 파악하기에는 시간과 비용적으로 어려운 점이 많다. 하지만 POS 유통 빅데이터와 상권 정보를 결합해 개발한 전국 단위 소비 활동 인덱스를 적용하면 정기적으로 매달 업데이트되는 새로운 시장 트렌드 빅데이터에 기반한 모니터링이 가능해진다.

일례로 나이스지니데이타는 보유하고 있는 음식점과 유통 점포의 POS 메뉴 정보로부터 주류나 음료의 판매 정보를 분리함으로써 주요 브랜드별 시장점유율 지표를 개발했다. 음식업종 140여 개 중에서 주류를 함께 판매하는 80여 개 외식업종을 분류하고, 이들 점포에서 판매되는 40가지 이상의 국산/수입 맥주와 20여 가지 소주/전통주를 브랜드별로 식별해 각각의 소비량을 계산하고 이를 지수화(Liquor Index)했다. 이를 통해 자사 및 경쟁사의 주요 제품별로 월별 판매량 추이를 지역, 업종별로 비교할 수 있을 뿐 아니라 전체 주류 판매량 대비 브랜드별 판매점유율, 전년 동월 대비 증가량이나 전월 대비 증가량 등 다양한 측면에서의 분석 지표를 비교할 수 있게 됐다. 또 고객집단별 상세 선호도의 변동을 구체적 숫자로 파악할 수 있게 되면서 영업 마케팅 및 조직 성과 관리 차원에서도 새로운 방식의 관리 기준을 마련했다.

061

2) 외부 요인으로 인한 소비 시장 변동 모니터링

어느 지역에 특정 정책의 도입으로 대형 상업시설이 입점하거나 코로나19와 같은 전국적 규모의 이벤트가 발생한 경우 이에 대한 적절한 대응 방안을 수립해야 한다. 먼저, 그런 변화가 지역에 미치는 영향을 정확히 분석해야 할 것이다. 특히 지자체나 공공기관의 경우 시장 동향을 항상 면밀히 관찰하고 지역경제의 변동이나 소비 활동상의 유의적인 변화를 즉각적으로 발견하는 모니터링 체계를 갖추는 것이 빅데이터 시대 과학 행정에 필수적인 요소다. 공공기관뿐 아니라 전국 단위의 지점이나 가맹점을 보유하고 있는 기업에도 매출에 영향을 미치는 내·외부 요인에 대한 상시적인 관찰이 필요하다. 기업의 위기관리 및 미래 예측에 필수적이기 때문이다.

실제 코로나19 확진자가 급증하기 시작했던 2월 중순 이후 시장에서의 소비 활동은 상당히 위축됐다. 편의점 등 소매유통점에서의 소비 건수는 전반적으로 감소해 음료나 과자, 간식류는 전년 대비 -20%가 넘는 판매 감소율을 보이기도 했다. 하지만 담배나 주류는 -5% 전후의 상대적으로 낮은 하락폭을 나타냈는데 이는 해당 제품들이 온라인 구매가 힘들고 주기적으로 소비되는 기호식품이라는 사실과 더불어 식당, 술집에서의 주류 소비가 가정으로 전환된 행동의 변화가 반영된 것으로 해석된다. 또 판매량은 줄어든 반면 객단가가 20% 이상 증가한 경우도 있는데 이는 불필요한 외출을 삼가고 한 번에 더 많은 상품을 구매하는 경향으로 이해된다.

다른 한편, 코로나19로 인한 언택트 문화 확산으로 배달 시장은 폭발적으로 성장했다. 올해 상반기 외식업체 POS 정보 기준으로 음식점 배달 매출 금액은 전년 동기 대비 26%나 증가했고 총매출 중 배달 음식이 차지하는 비중도 전년도 9%대에서 15% 수준까지 급증했다. 전체 음식점 가운데 배달 음식점 비율도 전년 74%에서 올해 94%로 20% 이상 늘었는데 전혀 배달을 하지 않다가 올해 초부터 배달 서비스를 시작한 음식점이 상당히 증가한 것을 알 수 있다. 특히 1월 이후 배달 점포로의 전환율이 가장 높은 업종은 냉면과 갈비/삼겹살 업종으로 코로나19로 인한 외식 매출 감소를 배달 서비스로 타개해보려는 노력을 엿볼 수 있다.

사례2 데이터 기반 마케팅 전략 효과 분석

마케팅부서에서는 신제품 출시나 기존 상품의 판매 촉진을 위해 다양한 이벤트와 프로모션을 꾸준히 실시하고 있다. 그런데 해당 이벤트의 효과를 측정할 때 상품의 판매량 증가 정도와 브랜드에 대한 소비자 인식 조사로는 한계가 있다. 하지만 여기에 소매 유통점 및 음식점의 영수증 정보와 카드 구매 고객 특성 정보를 결합하면 실제 판매 실적과 구매 고객에 대한 상세한 분석이 가능해진다. 이를 통해 프로모션으로 인한 고객의 구매행태 변화를 구체적 수치로 표현할 수 있으면 기존 방식과는 다른 스마트한 마케팅 전략 효과 분석의 기반을 구축할 수 있다.

예를 들어, 편의점을 통한 2+1 행사, 네 캔 만 원과 같은 맥주 판매 프로모션은 국내 맥주 시장, 특히 수입 맥주의 판매 신장에 지대한 공을 세웠다고 볼 수 있다. 이제는 거의 상시적인 판매 전략으로 정착한 이 프로모션으로 소비자들의 맥주 구매 방식과 소비패턴은 어떻게 바뀌었을까? 소비자들의 장바구니를 관찰하면 마케팅 기획담당자들은 프로모션의 효과와 이를 통한 추가적인 마케팅 전략의 방향을 고민해 볼 수 있다.

네 캔 만 원 행사로 맥주를 구매하는 고객들은 몇 가지 서로 다른 제품을 섞어서 구매할까? 우리 회사의 제품만 구매하는 충성 고객은 증가하고 있는가? 우리 제품은 메인 브랜드인가, 아니면 타사 맥주를 구매할 때 1개 정도 섞어 구매하는 서브 브랜드인가? 여러 종류의 맥주를 구매할 때 라거나 애일, 다크 등 다양한 스타일로 즐기는 고객 비중은 어느 정도일까? 등과 같은 궁금증에 답을 찾을 수 있다.

또 서로 다른 브랜드 간 함께 구매되는 비율을 나타내는 ‘단짝지수’도 마케팅 전략에 자주 사용되는 수치다. 예를 들어, H맥주-A맥주의 단짝지수가 1.8이고 H맥주-B맥주는 2.5라면 ‘H맥주는 B맥주와 같이 묶여 잘 팔리는 제품’임을 알 수 있는데 이런 방식으로 맥주 브랜드별로 서로 어울리는 음료나 안줏거리를 찾아낼 수 있다.

이런 분석 결과는 고객의 구매행태를 데이터로 분석해 도출해낸 정량적 수치로서 이를 통해 시장에서의 고객 반응을 빠르고 정확하게 확인할 수 있다. 기업은 이를 기반으로 제품별 컬래버레이션이나 이벤트 기획과 같은 마케팅 전략을 수립할 수 있다.

사례3 상권 빅데이터 활용한 매장 관리 전략 고도화

수많은 가맹점을 보유하고 있는 프랜차이즈 본사나 외식업체 브랜드를 관리하고 있는 유통사들에 효율적인 출점 및 매장 운영 전략은 매우 중요하다. 과거 기업들은 경험 많은 매장 관리 전문가의 축적된 노하우에 의존했다. 하지만 최근에는 카드 매출 정보와 소비 통계 정보 등 지역 데이터를 기반으로 이해할 수 있는 상권 빅데이터가 등장하면서 점차 내/외부데이터를 결합해 새로운 운영 기준을 만들고 활용 방안을 만드는 기업들이 많아지고 있다.

업종·지역별 매출, 소비, 업종별 성장성 전망 같은 상권과 관련된 외부 데이터를 매장별 매출 및 고객 정보 같은 내부 데이터와 결합해 융합 데이터세트를 구축한다. 이를 활용하면 기존 매장 및 출점 후보지의 예상 매출을 추정하고, 출점 유망 지역을 추천하고 최적화 시뮬레이션을 진행하는 등 기업 맞춤의 고도화된 상권 분석 서비스가 가능하다.

064

예컨대, 신규 매장 출점 전략을 짤 때는 전국의 상권 영역을 구분하고, 각 상권 단위로 전체 시장과 동종 업종, 그리고 자사 매장의 성장성을 차례대로 분석해 성장 가능성(Full Potential)을 도출한다. 그리고 성장 가능성이 높은 상권 내에서 출점 유망지역을 추출하고 기존 매장과의 카니발 효과가 작은 지점으로 신규 출점 지역을 선정한다.

특히 가맹사업거래 공정화에 관한 법률의 적용으로 예비 가맹점을 대상으로 예상 매출이 포함된 보고서를 제공하는 것이 의무화됨에 따라 프랜차이즈 본사 입장에서는 이런 전략을 활용해 객관성 있는 데이터를 제공함으로써 가맹점 유치율이 증가하는 효과를 기대할 수 있다.

또 다른 한편, 전체 매장별 향후 매출 예측 결과를 기반으로 이전이나 폐점 대상 매장을 선정하는 등 기존 매장을 재배치할 수도 있다. 선정된 매장을 기준으로 이전 유망 지역을 추천하거나 주변 지역 폐점 영향도를 분석하고 현실적인 계약 조건 등을 고려해 재배치 전략을 수립하는 데 활용한다.

구체적으로 전체 매장에 대해 향후 1년간 매출을 예측하는 모형을 개발하고, 모형의 예측 결과를 기반으로 관리 기준 코드를 설정해 운영한다. 예를 들면, ‘예측 매출이 -20% 이하인 경우 [폐점], -20%에서 -10% 사이인 경우 [이전/리뉴얼], -10%에서 5% 사이는 [MD최적화, 운영효율화] 그리고 5∼20%는 [유지]’와 같은 방식이다. 폐점에 따른 주변 매장의 영향 분석 결과와 영업권 중복에 따른 카니발 효과 분석이 추가되면 효과적인 매장의 재배치 전략이 도출될 수 있다.

연결과 확장성이 데이터 가치를 좌우한다

앞에서 기업의 내부 데이터와 외부 시장 데이터를 결합함으로써 경쟁 전략, 마케팅 전략, 매장 관리 전략의 의사결정에 활용하는 사례들을 예시로 살펴봤다. 빅데이터 사업자로서 데이터의 입수와 가공, 분석 및 활용까지 전반적인 업무를 직접 수행하고 있다 보니 최근 들어 과연 어떤 데이터가 가치가 높은지, 가격은 도대체 어떻게 매겨야 하는지에 대해 물어보는 사람이 많다.

사실 어떤 데이터가 좋은 데이터인지 판단하기는 매우 어렵다. 이를 위해서는 데이터의 대표성이나 활용 범위, 품질, 연결성, 지속적 제공 가능성 등 복합적 측면의 다양한 요소를 감안해야 할 것이다. 데이터의 희소성이나 전문성, 데이터화에 필요한 비용 등이 데이터의 ‘가격’을 결정한다면 데이터의 품질이나 다른 정보와의 연결·확장성, 활용 범위의 다양성과 같은 요소들에 의해 데이터의 ‘가치’를 평가할 수 있을 것이다.

사실 데이터는 그 자체로만 놓고 보았을 때 정확한 가치를 판단하기 어렵다. 하지만 데이터가 다양한 분야에 활용되기 시작하면 파생적으로 만들어내는 결과물들의 품질과 쓰임새가 어느 수준인지에 따라 점차 그 가치가 올라가게 된다. 아무리 구하기 힘든 고가의 데이터라도 활용이 제한적이고 찾는 이가 없다면 비즈니스적 가치는 결코 크다고 볼 수 없다. 결국, 다양한 용도로 쉽게, 그리고 반복적으로 꾸준히 사용되는 데이터가 상업적으로 좋은 데이터라고 판단할 수 있겠다.

최근 데이터 거래소나 빅데이터 플랫폼, 데이터댐 등 데이터 경제를 위한 정보 수집 기반이 계속 확대되고 있어 데이터 집중에 대한 다양한 시도가 이뤄질 것으로 예상된다. 하지만 아직 그 이후 단계인 가공과 활용에 대한 고민은 그리 크지 않은 것 같다. 쏟아져 나오는 다양한 데이터를 모아 놓고 나면 정작 활용에 있어 가장 큰 장벽은 알고리즘이나 시스템 성능이 아닌, 서로 제각각이고 통일되지 않은 정보 단위일 수 있다. 이런 파편화된 정보들을 공통의 기준으로 통합하고 표준화 과정을 통해 서로 다른 데이터의 결합을 쉽게 시도해 볼 수 있는 환경이 만들어진다면 산업별로 데이터가 다양하게 활용되고, 데이터의 비즈니스적 가치도 무한히 커지게 될 것이다.


유승연 나이스지니데이타 상무 yoosy@nice.co.kr
필자는 연세대에서 응용통계학 석사를 마치고 1997년 나이스평가정보(구 한국신용정보)에 입사, 금융기관 대상 개인신용평가(CSS) 모형 개발 컨설팅, CB스코어 개발과 운영 업무를 수행했다. 2015년 빅데이터 사업을 위해 분사한 나이스지니데이타에서 다양한 업종을 대상으로 빅데이터 서비스 및 신성장 사업을 기획하고 발굴하는 업무를 하고 있다. 나이스지니데이타는 신용평가회사인 나이스평가정보의 자회사로서 대용량 데이터 처리 및 DB 운영관리 능력, 높은 보안 기준 등을 기반으로 데이터 제공 사업과 비즈니스 활용 컨설팅을 동시에 수행하고 있다.
동아비즈니스리뷰 308호 ESG(환경·사회·지배구조) 2020년 11월 Issue 1 목차보기