Management Science 2.0

레코드 가게의 추억과 경영 과학

62호 (2010년 8월 Issue 1)

 
1990년대 초반까지만 해도 대학가마다 작은 레코드 가게 한두 군데쯤은 있었다. 가게 벽을 빼곡히 채운 레코드판과 장르별 인기곡 순위 차트는 레코드 가게의 익숙한 풍경이다. 이런 장면이 ‘머릿속 기억’이 아닌 ‘가슴속 작은 추억’으로 남아 있는 것은 이 가게가 단순한 소매 기능을 넘어선 공간이었기 때문이다.
당시 많은 대학가 레코드 가게는 음악을 즐기고 공유할 수 있는 작은 휴식 공간이었다. 굳이 뭔가 하지 않아도 단골 고객들은 레코드 가게 주인 아저씨와 음악에 대한 담소를 나눴다. 또 자신들이 사랑하는 음악을 함께 공유할 누군가가 있다는 사실에 즐거워했다. 당연히 레코드 가게 아저씨는 단골들의 취향을 잘 파악하고 있었다. 이들은 단골이 찾을 때면 취향에 맞는 음악을 틀어주며 고객 개개인에 맞는 ‘맞춤 문화 공간’을 즉석에서 창출해냈다. 나 자신도 몰랐던, 하지만 내가 좋아할 음악과 조우할 기대감과 설렘이라는 고객 가치를 제공했다.
 
데이터와 수학이 감성을 창조한다
고객이 원하는 것은 단지 값싸고 품질 좋은 상품이 아니다. 고객은 자신의 취향을 존중 받고 이를 바탕으로 한 상품을 추천 받고 싶어한다. 또 상품에 대한 감성을 다른 누군가와 함께 공유하며 즐기려는 욕구가 있다. 특히 책이나 음반 등의 문화 상품처럼 개인의 개성을 드러내는 상품일수록 이런 욕구는 더욱 강렬하다. 그래서 탄생한 것이 바로 감성 마케팅이다.
하지만 대형 유통점에서 혹은 온라인 쇼핑몰에서 감성에 대응하는 것에는 한계가 있다. 그러나 감성전달과 매출 증대를 동시에 실현할 수 있는 묘책은 감성과는 전혀 상반된 곳에서 제시됐다. 바로 ‘데이터와 수학’이다!
필자는 미국 최대 온라인 서점인 아마존닷컴의 프리미엄 회원이다. 이 서점을 자주 이용하는 이유는 단순히 저렴한 가격과 온라인 주문의 편리함 때문만은 아니다. 필자가 아마존닷컴의 충성 고객을 자처하는 가장 큰 이유는 아마존에서 회원들에게 제공하는 책 추천 목록 서비스 때문이다.
아마존닷컴 인터넷 페이지에는 책 추천 페이지가 있다. 책 추천은 회원 개개인의 취향에 맞춘 목록의 형태로 실시간 업데이트된다. 이 추천 목록을 보면 놀라움을 금할 수 없다. 이미 오프라인 서점에서 직접 읽고 구입하기로 찜해 놓거나 광고를 통해 관심을 가진 책들이 고스란히 추천 리스트에 올라온다. 아마존닷컴이 필자의 취향을 매우 구체적이고 정확하게 판별하고 있다는 증거다.
그렇다면 아마존닷컴은 어떻게 각 개인의 취향을 정확하게 파악해 맞춤형 추천 서비스를 제공할까? 그 비밀은 바로 소비자의 책 검색과 과거 구매 목록, 수많은 고객들의 상관관계 데이터를 분석한 수학 알고리즘에 있다.
아마존닷컴의 추천 서비스는 고객 데이터를 바탕으로 고객에게 맞춤 서비스 제공을 목적으로 하는 고객 관계 관리 (CRM) 방식이다. 그러나 기존 CRM과 다르다. 아마존닷컴은 개별 고객의 구매 패턴 분석에서 한걸음 더 나아가 고객들 상호 간의 다차원 분석을 통해 고객이 무엇을 원할지 미리 판별하는 ‘예측의 과학’을 적용한다. 이 개념을 좀더 알아보자.
 
 
예측의 과학
데이터를 분석해 고객 개개인의 가치를 실현한다는 CRM의 개념이 처음 소개 됐을 때는 고객이 직접 기입한 개인정보를 분석하는 데 그쳤다. 고객이 회원 가입 시 적어내는 주소, 직업, 출생일, 학력 등과 같은 개인 정보를 분석해 고객에게 지역•연령별로 차별화한 서비스를 제공했다. 이처럼 고객이 직접 제공한 개인 정보를 ‘1차 데이터’라 한다.
이후 데이터 처리기술의 발달과 정보 통신의 발달로 고객 구매 데이터를 보다 효율적으로 취합하고 저장할 수 있는 솔루션이 제공됐다. 이에 따라 고객 개개인의 구매행동을 저장해 이를 활용하는 보다 높은 차원의 고객 분석 방법이 나왔다. 고객이 어떤 상품을 구입하는지, 언제 구입하는지, 같이 구입하는 상품들 중에는 어떤 것이 있는지, 어떤 매장에서 구입하는지 등의 정보를 통해 소비 패턴을 보다 정확하게 분석할 수 있었다. 이와 같은 정보를 ‘2차 데이터’라고 한다.
1차 데이터는 고객이 이사를 거거나 직업을 바꾸는 등 신상에 변화가 있지 않는 한 변하지 않는 정적(static)인 데이터다. 반면, 2차 데이터는 고객이 물건을 구매할 때마다 새로운 데이터가 더해지는 동적(dynamic)인 특징을 띠고 있다. 2차 데이터 분석에 고도의 정보 처리 기술이 필요한 이유가 바로 여기에 있다.
대부분의 기업들이 이 1차와 2차 데이터의 분석을 통해 고객 개개인의 맞춤 서비스를 구현하고 있다. 그러나 여기서 한 단계 업그레이드된 분석이 있다. 1차, 2차 데이터에서 한걸음 더 나아가 고객이 원하는 물건이 무엇인지를 판별해 미리 상품을 제시하는 미래 지향적인 방식이다. 여기서 나오는 게 바로 ‘3차 데이터’다. 이 데이터는 고객들 간의 상관 관계를 나타낸 것으로 고객 개인의 데이터를 점으로 표시할 때 이 점과 점을 잇는 연결선에 해당한다. 이 연결선은 고객들 간의 상호 취향을 수치화한 정보다.
예를 들어 A와 B라는 고객이 있다. 1차 데이터와 2차 데이터는 고객 A와 B서로 각각의 정보를 담고 있다. 3차 데이터는 A와 B의 구매 취향이 얼마나 비슷한지를 수치화한 데이터다.
 
 
그렇다면 3차 데이터 분석이 왜 필요한 것일까? 만약 A와 B의 구매 패턴에 서로 유사성이 있다면 A가 구매한 물건을 B가 구매할 가능성도 높기 때문이다. 즉 소비자들 간의 상호 분석을 통해 개개인이 앞으로 어떤 물건을 구매할지 예측할 수 있게 된다.
 
3차 데이터로 기업 경쟁력을 높인다
아마존닷컴의 추천 알고리즘도 3차 데이터, 즉 수많은 고객들의 상호 연관성 분석을 통한 것이다. 아마존닷컴은 이런 분석을 통해 고객들의 트렌드를 판별하고 이를 바탕으로 고객이 구매할 가능성이 가장 높은 상품을 추천리스트에 담아 제시한다.
3차 데이터 분석은 수많은 고객 개개인의 상호 분석이 이뤄져야 하기 때문에 고도의 수학 기술과 컴퓨터 기술이 필요하다. 3차 데이터를 활용한 개념은 이미 1980년대 소개됐지만, 이 개념을 실제로 구현하는 기업은 여전히 소수에 불과하다. 또 세계적인 유통기업이 앞다퉈 수학자를 채용하는 이유도 바로 3차 데이터 분석을 통해 대형 체인점에서 상상만 했던 고객 감성의 마케팅을 구현하기 위해서다.
수학 알고리즘을 이용해 감성 마케팅을 구현하고 이를 기업의 경쟁력으로 승화시킨 또 다른 대표적인 기업으로는 넷플릭스가 있다. 이 회사는 미국 최대의 DVD대여 미디어 기업으로 창업한 지 불과 10여 년 만에 당시 최대의 DVD렌털 기업인 블록버스터의 아성을 무너뜨렸다. 넷플릭스의 성공 비결은 바로 넷플릭스 고유의 영화 추천 알고리즘이다. 넷플릭스는 고객의 영화 선별 패턴을 분석으로 영화 취향을 판별하고 이를 바탕으로 영화를 추천하는 서비스를 제공한다. 마치 개인 영화 추천 도우미를 두고 있는 듯한 체험을 고객 개개인에게 선사한다.
 
수학, 취향을 분석하다
고객 취향 분석과 추천 방식 중 그 효용성이 현장에서 검증돼 많은 기업들이 실제 사용하는 방식이 바로 협업적 필터링(Collaborative Filtering)이라는 알고리즘이다. 아마존닷컴과 넷플릭스도 이 를 이용한다. 이 협업적 필터링의 핵심 원리를 간단하게 알아보자.
만약 새로 개봉한 영화를 보려고 주위 사람들에게 의견을 구한다고 하자. 이미 최신 영화를 관람한 사람들로부터 영화 평을 듣지만, 우리는 무의식 중에 나와 취향이 비슷해 영화평을 신뢰할 사람과 그렇지 않은 사람의 평을 구별해서 듣는다. 하지만 취향이 비슷하다고 무조건 이 사람이 추천한 영화만 보는 것도 아니고 또 그 반대도 아니다. 단지 취향이 비슷한 사람의 의견에 좀 더 무게를 두고, 다른 이들의 정보를 포괄적으로 취합해 영화를 선택한다.
 
 
협업적 필터링도 이와 비슷한 단계를 거친다. 우선 수많은 회원들과 나 사이의 취향도를 분석해 이를 수치화한다. 그리고 구입한 상품에 대한 각 고객의 만족도에 더해 취향도 가중치를 고려한다. 내가 구매했을 때 만족도가 높을 상품을 추천하는 것이다.
 
 
영화 사이트에서 각 회원들이 대여해 본 영화의 평점을 바탕으로 취향도를 분석하는 문제를 생각해 보자. <표1>은 영화 ‘친구’와 ‘과속스캔들’을 이미 본 회원들이 각 영화를 1 에서 5(점수가 높을 수록 만족) 사이에 매긴 평점을 보여준다. 단순히 수치로만 보면 서로의 취향이 얼마나 비슷한지 판별하기 힘들다. 하지만 이 평점을 2차원 좌표에 표시했을 경우 <그래프1>과 같은 각각의 점으로 나타낼 수 있다. 영재와 유리의 좌표는 서로 가까이 위치해 있다. 반면 영재와 윤아는 상대적으로 거리를 두고 있다. 각 평점 좌표의 상대적 거리를 바탕으로 회원들의 취향도를 판별한다. 이 방식의 경우 좌표의 축은 상품이고 좌표의 점은 각각 회원의 점수표로 표시된다. 이처럼 좌표의 거리를 기준으로 취향도를 수치화하는 방식을 유클리드 거리 값 분석(Euclidean Distance Score Analysis)이라 한다. 이 분석에서 두 점의 거리를 d라 할 경우, 취향도는 의 함수로 계산한다. 비교하는 두 대상의 취향을 1과 0사이에서 수치화한 함수다(1에 가까울수록 취향이 비슷하다). 비교하는 두 명의 취향이 같아 두 점의 거리가 0일 경우 취향도는 1이 된다. 반대로 두 점의 거리가 멀리 떨어져 있을 경우 d의 값은 커지고 취향도는 0에 가까워진다.
 
 
유클리드 거리값 분석과 함께, 각 회원 간의 취향의 유사성을 판별하기 위한 또 다른 방법으로 <그래프2>와 <그래프3>에 소개된 패턴 분석을 사용할 수 있다. 이 경우 각 그래프에서 좌표는 회원이고 각 점은 각 회원이 매긴 각 영화의 평점이다. <그래프2>에서는 영재와 태연이 ‘친구’ ‘과속스캔들’ ‘타짜’ ‘해운대’ ‘국가대표’ ‘말아톤’에 매긴 평점을 좌표에 표시했다. <그래프3>에서는 영재와 수영이 같은 영화들에 매긴 평점을 표시했다.
두 그래프를 비교했을 때 영재와 태연의 좌표는 특정한 패턴 없이 퍼져있다. 반면 영재와 수영은 그래프에 표시된 직선을 따라 비슷한 패턴을 보이고 있다. 이 경우 영재는 태연보다는 수영과 취향이 비슷하다는 결론을 내릴 수 있다.
두 그래프에서 상호 상관도 표시 점이 일직선을 두고 퍼져 있는 정도를 수치화한 것을 피어슨스 계수(Pearson’s Coefficient) 측정법이라 한다. 좌표에서 점이 일직선을 이뤄 매우 밀접한 상관관계가 있을 경우 1, 그 반대로 전혀 상관 관계를 찾지 못할 경우 0으로 표시된다. 즉 두 비교 대상의 취향을 점으로 표시해 피어슨스 계수 측정법을 이용하는 방법으로 두 사람의 취향을 판별할 수 있다.
피어슨스 계수 측정법은 앞의 유클리드 거리값 분석과 비교해 계산이 다소 복잡하지만 큰 장점이 있다. 예를 들어 회원 A는 평점에 매우 인색해 아무리 좋은 영화라도 4점 이상 주지 않을 수 있다. 반면 회원 B는 웬만한 영화는 4점 이상을 준다고 하자. 이들의 상호 취향도를 유클리드 거리값 분석을 이용해 계산하면 A와 B는 언제나 취향이 다르다는 결과가 나온다. 하지만 피어슨스 계수 측정법은 A와 B의 절대적인 거리 값이 아니라 패턴을 분석하기 때문에 각 회원 간의 상대적인 평점 차이를 보완해 줄 수 있다.
협업적 필터링을 이용한 추천 알고리즘은 유클리드 거리분석법이나 피어슨스 계측 분석법들 중 한 가지를 이용하거나 혹은 이 둘을 혼합한 방식을 이용해 회원들 간의 상호 연관성을 수치화하는 것이다.
 
 
연관성 분석의 결과는 각 회원들 간의 취향을 수치화한 값이다. <표3>은 영재가 태연, 윤아, 유리, 써니, 수영 각각의 회원과 얼마나 취향이 비슷한지를 수치화한 결과다. 이 표에서 영재와 수영은 0.98로 영화 취향이 가장 비슷한 반면 태연과는 0.22로 다른 회원들과 비교해 볼 때 취향이 상대적으로 다르다.
그렇다면 영화 추천은 어떻게 할까? 영재를 제외한 다른 회원들이 모두 ‘시’ ‘하녀’ ‘방자전’을 이미 관람해 각각 평점을 부여했다고 가정해 보자. 영재에게 이 세 영화 중 하나를 추천하려면 어떤 영화를 추천해야 할까.
 
 
<표4>에서 ‘시’라 표기된 행은 영재를 제외한 각 회원이 영화 시에 대해 매긴 평점이다. 즉 태연은 3점을, 윤아는 1점을 부여했다. 회원이 부여한 각 평점에 앞서 계산한 취향도를 곱한 점수가 ‘시-W’라 표기된 행의 값이다. 즉 태연이 ‘시’에 부여한 평점이 3점에 영재와 태연의 취향도가 0.22이므로 3×0.22=0.66임을 알 수 있다. 이처럼 각 회원이 평점에 영재와 각 회원 간의 취향도의 가중치를 매기는 것이다. 또 각 평점과 가중치를 곱한 모든 값을 더한 값 7.87을 취향도의 합 3.07으로 나눈 값 2.56 (7.87/3.07=2.56)이 바로 영재가 영화 ‘시’를 봤을 경우 이 영화에 대해 매길 예상 평점이다. 마찬가지로 영화 ‘하녀’와 ‘방자전’을 같은 방식으로 계산하면 각각 3.74와 3.38이 나온다.
이는 영재가 비록 ‘시’ ‘하녀’ ‘방자전’을 보지 않았지만 이미 이 영화를 시청한 회원들이 매긴 평점과 영재와 각 회원 간의 취향도 분석을 바탕으로 영재가 내릴 평점을 예상할 수 있다. 영재가 이 영화를 시청했을 경우 ‘시’에 2.56, ‘하녀’에 3.74, 그리고 ‘방자전’에 3.38이란 평점을 내릴 것이라고 해석할 수 있다. 따라서 영재에게 추천될 영화는 예상 평점이 가장 높은 ‘하녀’가 된다.
이처럼 협업적 필터링은 각 회원들 간의 상호 취향도를 수치화한 뒤 회원들이 구매한 상품의 평점을 통해 상품마다 각 회원이 구매할 가능성을 산출해 추천 목록을 정한다.
앞의 예는 모든 고객들이 자신이 본 영화의 평점을 매긴다는 가정 아래 분석한 결과다. 하지만 모든 고객들이 상품을 구입한 후 상품의 평점을 매기는 수고를 감내하지 않는다. 그래서 아마존이나 넷플릭스는 구매 전 고객이 검색하는 검색어나 상품 클릭 회수 등 다양한 정보를 함께 취합해 고객의 상품에 대한 선호도나 브랜드 선호도를 감별한다.
기업 현장에서 협업적 필터링을 사용할 때는 고도의 다양한 수학적 알고리즘을 응용한다. 넷플릭스는 전체 회원 수가 1000만 명을 넘어섰다. 이는 넷플릭스가 협업적 필터링을 이용해 1000 만명 고객을 서로 비교하려면 엄청난 규모의 비교 연산이 필요하다는 뜻이다. 그것도 고객이 영화를 대여할 때마다 시시각각 연산을 실행해야 한다. 그래서 이 엄청난 연산을 신속히 처리하기 컴퓨터 공학에서 이용되는 다양한 인공지능 방식이 함께 활용된다.
수학과 과학을 이용한 감성 마케팅이 최첨단 산업인 이유가 바로 여기에 있다. 아마존 닷컴이 단순히 상품을 인터넷으로 판매하는 온라인 기업이 아닌, 전 세계 6개국에 걸쳐 소프트웨어와 인공지능 연구소를 둔 첨단 기업이라는 사실이 이를 뒷받침 해준다.
마케팅의 새로운 패러다임을 열다
고객의 취향을 통한 감성 마케팅은 상품 추천 서비스를 넘어 새로운 영역에서도 영토를 넓혀가고 있다. 전자책 시장이 좋은 예다. 책을 구매한 고객들의 구매 성향과 독자의 전자책의 밑줄 긋기 기능으로 서로 비슷한 취향과 같은 책을 읽고 같은 부분에 밑줄을 그은 이들을 네트워크로 연결해 감성을 공유하는 장을 창조하는 작업을 추진하고 있다. 마치 옛날 레코드가게가 고객들에게 삼삼오오 모여 서로의 음악에 대해 의견을 나눌 장을 제공한 것과 같은 원리다.
소비자는 단순히 상품을 구매해 기능을 사용하는 것뿐만 아니라 같은 물건을 공유한 다른 이들과 함께 감성을 공유하려는 욕구가 있다. 서로 비슷한 취향을 가진 이들에게 감성을 공유할 장()을 제공하는 이런 시도는 책, 음반, 문화 상품, 그리고 개인 기기 등으로 확장될 것이다. 이 감성 마케팅을 가능하게 한 핵심이 바로 데이터와 수학이다.
마케팅을 ‘감()’에 의존하던 시대는 지났다. 데이터가 없어서 수치를 분석하기 힘들었던 시절에는 ‘감’이나 경험에 의지할 수밖에 없었다. 하지만 우리가 상상도 할 수 없었던 많은 것을 데이터가 말해 주는 시대가 왔다. 마케팅에서 소비자의 감성을 파고드는 것은 필수다. 하지만 소비자의 감성을 파악해 기획하는 게 기획자도 덩달아 감성에 의존해 일해야 한다는 것을 의미하진 않는다.
훌륭한 소믈리에는 ‘주당’이 아니다. 이들 중에는 오히려 술을 못 마시는 사람이 많다. 그들은 와인의 특성을 섬세한 미각, 후각, 시각을 이용해 파악하고 머릿속에서 종합적으로 계산해 가치를 부여한다. 마찬가지로 소비자의 감성을 불러일으키는 마케팅을 하겠다고 마케터가 자신의 감성에만 의지하는 것은 잘못된 발상이다.
데이터와 수학 알고리즘을 이해하는 기업이 미래의 마케팅을 지배할 것이다.
 
편집자주 경영 현장에 수많은 수학자와 과학자들이 포진하고 있습니다. 이들은 전략, 기획, 운영, 마케팅 등 다양한 분야에서 첨단 수학•과학 이론을 접목시켜 기업 경쟁력 강화에 기여하고 있습니다. 경영 과학은 첨단 알고리즘과 데이터 분석 기술로 기업의 두뇌 역할을 하면서 경영학의 새로운 분야를 개척해나가고 있습니다. <경영학 콘서트>의 저자인 장영재 박사가 경영과학의 새로운 패러다임을 소개합니다.
 

참고
경영학 콘서트, 장영재, 비즈니스북스, 2010.
Amazon.com Recommendations: Item-to-Item Collaborative Filtering, Internet Computing, Greg Linden, Brent Smith, and Jeremy York, IEEE Computer Society, Vol.7, No, 1, 2003, pp. 76-80.
Offering Online Recommendations with Minimum Customer Input Through Conjoint-Based Decision Aids, Arnaud De Bruyn et al, Marketing Science, Vol. 27, No. 2008, pp. 443-460.
The Prediction Lover’s Handbook, Thomas H. Davenport and Jeanne G. Harris, MIT Sloan Business Review, 2009.
Programming Collective Intelligence, Toby Segaram, O’Reilly, 2007.
동아비즈니스리뷰 318호 Dynamic Workspaces 2021년 04월 Issue 1 목차보기