Article at a Glance
디지타이징 비즈니스(digitizing business) 유형 중 예측과 개인 맞춤화 추천
1. 예측 : 이상탐지는 리스크 관리를 위한 예방 차원, 즉 고장이나 사고 등 나쁜 소식에 미리 대처하기 위한 것에 중점을 둠. 반면에 예측은 사고뿐만 아니라 다양한 가능성에 대해 개인 맞춤화 추천이나 최적화 등 선제적(proactive)이고 처방적(prescriptive)인 대응을 목표로 함. 부부가 이혼할 확률, 개인들의 대출 상환 확률 등을 예측할 수 있음.
2. 개인 맞춤화 추천 : 빅데이터 시대에 지속적으로 영역이 확대되고 있는 것이 개인화 추천 시스템. 특정 상품이나 서비스를 구매할 확률이 높은 고객을 예측해 그 고객에게 해당 상품이나 서비스를 추천하는 것. 넷플릭스나 아마존의 추천 시스템에서 발전하기 시작해 이제는 구체적인 여행 상품과 계획의 추천까지 가능한 수준으로 발전.
미래를 예측하기 위한 가장 신뢰할 만한 방법은 현재를 이해하려고 하는 것이다.
― 존 나이스비트(『메가트렌드』 저자)
디지타이징 비즈니스는 빅데이터 시대의 5대 핵심 기술(소셜미디어, 모바일, 사물인터넷, 클라우드, 빅데이터 분석)을 활용해 자신의 사업을 혁신하는 것이다. 디지타이징 비즈니스의 유형은 [그림 1]처럼 크게 7가지로 나뉜다. (DBR 229호 ‘배우 윌 스미스와 서울 심야버스, 빅데이터에서 인사이트를 끄집어내다’ 참고.) 지난 DBR 232호에서 유형 1의 사례(진단분석, 이상탐지)에 대해 다룬 데 이어 이번 글에서는 유형 2, 즉 예측과 이를 바탕으로 한 개인화 추천 사례를 다루려고 한다.
기업은 수많은 의사결정을 하고 규모가 커질수록 비효율적이 되며 자원을 낭비하는 경향이 있다. 하지만 미래를 엿볼 수 있는 예측을 통해 기업은 완전히 새로운 경쟁력을 갖게 된다. 선택권이 더 넓어지고 정확해지기 때문이다.
빅데이터 시대에 기업에서의 예측 분석 활용이 크게 증가한 이유는 3가지다. 첫째, 엄청나게 증가하는 데이터다. 둘째, 클라우드 등의 하드웨어와 오픈소스의 소프트웨어 솔루션의 개선으로 예측 분석이 용이해졌다. 셋째, 예측 분석의 중요성을 인식하고 예측 기술을 제대로 수용하고 활용하려는 기업문화가 확산되고 있다. 이제 예측 분석은 선택이 아니라 필수다. 예측 분석이 ‘비즈니스 방식을 업그레이드하는 수단’이자 ‘차별적인 경쟁력을 제공하는 도구’로서 비즈니스 판을 급격하게 바꾸고 있다.
예측의 첫걸음은 과거 데이터로부터의 학습이다. “어제는 역사고, 내일은 미스터리다”라는 말이 있지만 어제에서 교훈을 얻을 수 있다면 미래는 미스터리가 아니라 기회가 된다. 예측은 과거의 데이터를 바탕으로 무슨 일이 왜 일어났는지 알아볼 수 있도록 모델링과 검증을 하는 과정이다. 즉, 미래의 여러 가능성에 대한 확률을 계산하는 것이다. 모델을 통해 이벤트가 발생한 패턴을 추출해 검증한 다음, 그 모델을 그대로 새로운 데이터에 적용해 유사한 이벤트가 일어날지를 예측한다는 얘기다. 따라서 진단분석을 위해, 무슨 일이 왜 일어났는지를 우선 규명하기 (혹은 발견하기) 위해 모형화하는 것이 매우 중요하다.
지난 DBR 232호에서 설명한 이상탐지와 이번 글의 주제인 예측과의 차이점은 무엇일까? 기법 측면에서는 전혀 차이가 없다. 진단분석을 바탕으로 현재에 벌어지는 이상(異狀)을 조기탐지하거나 미래를 예측하는 것은 시점상의 구분일 뿐 기법상의 차이는 없다. 단지 이상탐지는 리스크 관리를 위한 예방 차원, 즉 고장이나 사고 등 나쁜 소식에 미리 대처하기 위한 것에 중점을 두는 반면 예측은 사고뿐 아니라 다양한 가능성에 대해 개인 맞춤화 추천이나 최적화 등 선제적(proactive)이고 처방적(prescriptive)인 대응을 목표로 한다.
구체적으로 예측 대상의 예를 들어보면 다음과 같다.
● 온라인 행동: 검색, SNS 글, 광고/프로모션 클릭, 좋아요/리트윗, 구매 결정● 소비: 가전, 패션, 외식, 배달, 여행 등 각종 서비스/상품 구매, 예약/주문, 예약/주문 취소● 건강: 의료 서비스 선호, 입/퇴원, 질병 감염, 치료 효과, 사망● 금융: 저축, 대출, 투자, 보험, 부당 청구, 계약 해지● 일 관련: 직업 선택, 취업, 고과, 이직, 사고 유발● 사적 영역: 우정, 사랑, 임신, 이혼, 부동산/주식 투자, 기부● 기타: 생각, 의도, 의견, 투표, 거짓말, 스팸 메일, 사고/범죄, 사기, 탈세예측 분석의 난이도는 데이터 획득, 가공, 분석 등의 단계가 각각 얼마나 어려운가에 달려 있다. 첫 단계, 즉 문제 해결을 위해 데이터를 측정하거나 수집하는 것이 쉽지 않은 문제들은 더욱 정교한 분석과정을 밟아야 한다. 이혼 예측의 예를 들어보자.
이혼을 점치는 수학자이혼이 언제나 행복으로 이어지는 것은 아니다. 결혼도 마찬가지다.― 모코코마 모코노아나(작가) 이혼에 관한 연구는 심리학, 가정학 등 다양한 영역에서 많이 축적돼 있기는 하지만 실제 데이터를 기반으로 이혼을 예측하려는 시도는 없었다. 그러던 중 심리학자인 고트만(John Gottman) 박사와 수학자인 머리(James Murray) 교수는 부부가 논쟁을 할 때 주고받는 말에 주목해봤다. 주고받는 말에 의해 마음의 상처가 조금씩 쌓이게 된다면 결국에는 파국을 맞을 것이라고 추측한 것이다. 그래서 대화나 논쟁에서 오가는 말 속에 포함된 긍정적인 표현과 부정적인 표현을 조사했다. 그중에서 애정, 기쁨, 유머, 의견 일치, 관심, 화, 거만, 슬픔, 울음, 호전성, 방어, 회피, 혐오, 모욕 등 14개 표현을 선정했다.
변수 측정 및 데이터 수집은 갓 결혼한 신혼부부 700쌍을 대상으로 했다. 부부를 방안에서 마주 앉게 한 뒤 돈, 성(性), 시댁 문제 등 평소 둘 사이에 언쟁을 유발하는 주제에 대해 15분 동안 대화를 하도록 했다. 두 연구자들은 녹음된 대화를 분석해 무엇을 말했느냐에 따라 남편과 아내에게 각각 다음과 같이 +4점에서 -4점 사이의 점수를 부여했다.
● 애정(affection), 기쁨(joy), 유머(humor), 의견일치(agreement): +4● 관심(interest): +2● 화(anger), 거만(domineering), 슬픔(sadness), 울음(whining): -1● 호전성(belligerence), 방어(defensiveness), 회피(stonewalling): -2● 혐오(disgust): -3● 모욕(contempt): -4분석에서의 핵심은 대화 중에 나타나는 긍정적 상호작용과 부정적 상호작용의 비율이었다. 부부 각각의 측정점수는 차이방정식(difference equation model)이라는 수학모델에 입력한 뒤 그 결과를 그래프로 나타냈다. 그래프에서 남자의 선(line)과 여자의 선은 그들이 어떻게 상호작용하고 있는가를 나타내며 두 선이 만나는 위치는 결혼의 실패 확률로 분석됐다. 긍정적 상호작용과 부정적 상호작용의 비율이 5대1 이하로 떨어지면 실패 확률이 높아졌다. 이런 분석을 통해 두 연구자는 700쌍의 신혼부부를 다음과 같은 5개 그룹으로 분류했다.
● 유효 부부(validating couple): 조용하고 친밀하며 서로를 배려해주고 경험을 공유하는 친구 같은 관계.● 회피 부부(avoiders): 충돌이나 마찰을 의도적으로 회피하는 부부로서 배우자에게 언제나 긍정적으로만 반응함.● 불안정 부부(volatile couple): 낭만적이고 열정적이지만 논쟁을 심하게 하는 부부. 안정과 불안정이 섞여 있으며 일반적으로 행복하지 않은 관계를 유지함.● 적대적 부부(hostile couple): 한 배우자는 논쟁거리에 대해 말하기 싫어하고 상대방도 이에 동의하는 관계. 부부 사이에 대화가 거의 없음.● 적대적·고립 부부(hostile-detached couple): 한 배우자는 화를 잘 내고 논쟁을 하고 싶어 하지만 상대방은 논쟁에 무관심.각 그룹의 특성을 바탕으로 연구자들은 유효 부부와 회피 부부는 이혼을 하지 않고, 적대적 부부와 적대적·고립 부부는 이혼을 하리라고 예측을 했으며, 불안정 부부는 행복하지 않은 생활을 하지만 이혼은 하지 않을 것으로 예측했다. 이러한 예측의 정확성을 확인하기 위해 연구자들은 실험 이후 12년에 걸쳐 1∼2년 간격을 두고 이들 부부에게 연락을 해서 이혼 여부를 확인했다. 최종적으로 12년 후에 확인한 결과, 700쌍의 신혼부부의 이혼 여부에 대한 예측은 놀랍게도 94%나 적중했다. 예측이 100% 완벽하지 않고 약간 오차가 난 것은 이혼은 하지 않은 상태로 불행한 결혼생활을 유지하리라고 예측했던 불안정 부부 중 일부가 실제로는 이혼을 해버렸기 때문이었다.
분석의 결과는 『결혼의 수학: 동적 비선형 모델(The Mathematics of Marriage: Dynamic Nonlinear Models)』이라는 제목으로 출간됐다.
1
이 책은 주로 다른 연구자들을 위한 것이었지만 고트만 박사는 이 연구 결과를 현실에서 적극적으로 활용하는 데 관심이 많았다. 이 연구는 이혼을 야기하는 부부 간 파괴적인 의사소통 패턴을 극복할 수 있는 방법을 제시하고 있기 때문이다. 이에 따라 고트만 박사는 고트만 관계연구소(The Gottman Relationship Institute)를 설립해 부부관계 개선을 위한 비디오와 훈련모임 및 소통을 증진하는 다양한 프로그램을 제공하고 있다. 고트만 관계연구소는 상담치료사들을 위한 워크숍과 상담지도 자료를 만들었다. 특히 이틀 동안 진행되는 부부 워크숍에서는 참가자의 75%가 파탄이 난 관계를 회복하고 있다고 한다.