Top
검색버튼 메뉴버튼

Management Science 2.0

정보의 골드러시 시대: 해답은 네트워크 분석에 있다

장영재 | 64호 (2010년 9월 Issue 1)



편집자주
경영 현장에 수많은 수학자와 과학자들이 포진하고 있습니다. 이들은 전략, 기획, 운영, 마케팅 등 다양한 분야에서 첨단 수학·과학 이론을 접목시켜 기업 경쟁력 강화에 기여하고 있습니다. 경영 과학은 첨단 알고리즘과 데이터 분석 기술로 기업의 두뇌 역할을 하면서 경영학의 새로운 분야를 개척해나가고 있습니다. <경영학 콘서트>의 저자인 장영재 박사가 경영과학의 새로운 패러다임을 소개합니다.

공학자, 축구를 분석하다
2010년 6월 미국 노스웨스턴 대학의 화학-생물 공학과에서 복잡계를 연구하는 루이스 아마랄과 그의 동료 학자들이 흥미로운 연구 결과를 발표했다. 그런데 이 연구는 화학도 생물학도 공학에 관한 것도 아니었다. 바로 축구였다!1
 
아마랄 연구팀은 축구 경기에서 각 개인의 기량을 객관적으로 분석하는 알고리즘을 분석했다. 이들은 논문에서 데이터와 수학을 이용해 경기마다 각 선수의 기량을 평가하는 방식을 선보였다. 이 연구는 미국 포브스나 CNET등 미디어에 소개되는 등 세간의 주목을 받았다. 그 이유는 단순히 공학자들이 축구를 분석했기 때문만은 아니었다. 이들은 자체 개발한 알고리즘을 이용해 유로 2008(Euro Cup 2008) 경기에서 최고의 기량을 보인 ‘베스트 20’을 뽑았는데, 알고리즘이 뽑은 선수들은 전문가들이 뽑은 최고 선수 리스트와 큰 차이가 없었다.2
 
데이터와 수학알고리즘이 전문가들의 안목을 대신할 수 있다는 가능성을 보여준 셈이다. 다소 주관적인 안목과 경험에 의존하는 축구 전문가들의 평가 방식과 대조적으로 이 알고리즘은 선수의 기량을 객관적으로 설명할 데이터와 논리적 근거도 함께 제시한다. 이는 데이터와 수학 알고리즘이 축구 전문가들보다 더욱 설득력 있게 선수를 평가할 수 있다는 의미다.
 
네트워크 분석을 통한 축구 분석
개인기와 팀 플레이의 조화가 가장 요구되는 스포츠가 바로 축구다. 팀 플레이가 중요한 경기에서 각 개인의 팀 기여와 기량을 어떻게 측정할 수 있을까? 이 문제는 축구라는 스포츠가 그 형태를 갖추기 시작한 시점부터 축구 전문가들이 늘 고민해 오던 문제다.
 
축구에서 개인 기량을 객관적이고 논리적으로 판단하기 힘든 이유는 바로 ‘경기의 연속성’에 있다. 야구와 비교해 보자. 야구에서는 공격과 수비가 명확하게 구별돼 있다. 각 선수의 성적은 공격 기여도와 수비 기여도 등으로 명확하게 구별해 평가할 수 있다. 또 전체 경기의 흐름을 투수가 공을 던지는 것에서, 타자가 공을 치고, 주자가 뛰는 별개의 사건(discrete event)으로 나눌 수 있기 때문에 각 사건별로 선수 개인의 역량을 수치화할 수 있다. 이처럼 야구에서는 다양한 개인 기록을 데이터화하는 것이 가능하고 이를 분석해 작전이나 운영에 이용한다. 야구를 ‘통계의 스포츠’라 일컫는 것도 바로 이 때문이다.3
 
반면 축구는 90분간 끊임없이 공을 다투는 스포츠다. 공격과 수비가 예측할 수 없게 바뀐다. 공격수가 수비를, 수비수가 공격에 가담하는 예측 불가능한 변화의 연속이다. 분석의 기본은 데이터인데 끊임없는 연속적인 동작에서 선수의 능력을 포착해 수치화한 데이터를 포착하기란 쉽지 않다.
 
또 축구에서 각 개인의 기량을 측정하기 힘든 또 다른 이유는 바로 ‘득점의 제한성’에 있다. 한 경기당 수십 포인트가 나오는 농구의 경우 슛 성공률과 어시스트 포인트 등을 통해 개인 기량을 쉽게 평가할 수 있다. 그러나 1대0으로 승리한 축구 팀에 대해 슛을 넣은 선수만 팀에 기여했다고 말할 수 없다.
 
축구의 연속성과 득점의 제한성은 각 선수의 기량을 객관적으로 판단하는 데 걸림돌이 됐다. 결국 축구 선수에 대한 평가는 소수 전문가들이 축구 경기를 관람한 후 각자의 의견에 따라 선수의 평점을 매기는 방식에 의존할 수밖에 없었다. 하지만 평가자의 주관에 의지하는 전문가 평가방식은 일관성의 부재로 인해 종종 논란의 대상이 됐다.
 
아마랄 연구팀이 개발한 알고리즘은 이러한 축구 분석의 한계를 극복했다. 그렇다면 아마랄 연구팀은 어떤 방식으로 이 난제를 극복했을까? 바로 네트워크 분석을 통해 가능했다.
 

네트워크-연결고리의 복잡성을
명료하게 푸는 마법의 수학
아마랄과 연구팀은 각 경기당 선수들간의 패스 데이터와 슈팅 데이터를 바탕으로, 선수 간 패싱 성공률, 슈팅 성공률, 수비 역할, 전체 경기 흐름의 역할을 분석한 네트워크 그래프를 이용해 개인 역량을 산출했다.
 
<그림1>에서 각 점은 유로2008 독일-스페인 전 참가 선수를, 각 점에 표시된 숫자는 선수의 등 번호를 각각 의미한다. 각 점은 선수의 포지션별로 배치됐다. 그래프의 중앙의 사각형들은 골대로 향한 슈팅(맨 중간 사각형)과 골대를 벗어난 슈팅(위와 아래 사각형들)을 각각 표시한다. 점과 점을 잇는 선은 선수 간의 패스를 의미한다. 선이 굵을수록 패스 성공률이 높다. 선수의 기량은 각 선수를 표시한 점의 크기로 표현되는데 점의 크기가 클수록 기량이 우수한 선수다.
 
<그림1>에서 보면 대부분의 스페인 선수들은 독일 선수들을 압도한다. 또 패스라인이 다소 단순한 독일에 비해 스페인은 다양한 패스 전술을 구사했음을 한 눈에 파악할 수 있다(이 경기에서 스페인은 독일을 1-0으로 꺾어 승리했다).
 
이 분석에서 사용된 주 데이터는 선수 간 패스 횟수와 슈팅이다. 그렇다면 선수의 수비 기여도는? 이는 선수가 패스를 받은 수와 상대 선수에게 패스한 수를 통해 간접적으로 계산할 수 있다. 즉 어느 선수가 팀 동료 선수에게 패스한 횟수가 20번인데 반해 동료 선수로부터 공을 패스 받은 횟수는 12번이라면 나머지 8번은 상대편 선수로부터 공을 뺏은 것이다.
 
여기서 한 가지 빠진 게 있다. 실제 패스가 슈팅으로 연결돼 팀 승리에 얼마나 기여했느냐의 문제다. 패스들 중 수비 진영에서 시간을 끌려고 공을 돌리는 패스와 상대방 문전 앞에서 슈팅 기회를 잡으려고 상대 수비의 마크를 피해가며 숨가쁘게 전개되는 패스의 가치는 다르다. 또 수비와 공격의 중간에서 경기 흐름을 주도하는 패스의 가치도 고려돼야 한다. 실제 우리나라 대표팀의 박지성 선수의 가치를 단순히 패스 능력과 수비력만으로 판단할 수 없다. 미드필드에서 적시적소에 공을 공급해 전체적인 팀의 리듬을 현란하게 조절하는 것이 박지성의 능력이자 가치다.
 
아마랄은 이러한 경기 주도의 역할을 중앙성(Betweenness Centrality)을 이용해 수치화했다. 중앙성이란 소셜 네트워크의 특성을 분석하는 방식 중의 하나로 전체를 구성하는 개인의 영향력을 파악하는 데 사용된다.
 
 
중앙성의 예를 들어보자. <그림2-A>에서 남정은 윤아랑 친하게 지내고 싶어하지만 윤아를 직접 알지 못하기 때문에 영재를 통해 남정을 소개받아야 한다. 문세나 종서도 마찬가지로 태연이나, 윤아, 혹은 유리를 소개받기 위해서는 영재에게 의지할 수밖에 없다. 즉 이들 관계에서 영재의 영향력이 매우 크다고 할 수 있다. 반면 <그림2-B>에서는 영재뿐 아니라 유진, 이원도 이들 사이의 중개자 역할을 할 수 있다. 윤아가 남정을 소개받기 위해 영재뿐만 아닌 유진과 이원에게도 부탁할 수 있다. 이 경우 영재의 영향력은 <그림2-A>만 못하다.
 
축구 경기 분석으로 돌아가서 아마랄 연구팀은 중앙성 분석을 이용해 슛으로 연결된 공의 흐름에서 누가 가장 많은 영향력을 발휘했는지를 평가해 각 개인의 역량을 계산했다. 앞의 예처럼 골로 연결된 연결 패스들 중에서 얼마나 많이 가담했었는지를 판별해 각 선수의 기여도를 추론했다.
 
21세기 정보의 골드러시
트위터, 페이스북, 다양한 블로그들의 등장으로 소셜 미디어가 새로운 정보 매체로 주목받고 있다. 많은 기업들은 이 새로운 미디어 채널을 어떻게 기업의 경쟁력으로 승화시킬지 절치부심하고 있다. 한 가지 흥미로운 점이 있다. 우리나라에서 소셜미디어1세대로 꼽히는 싸이월드가 한창 유행했을 때나 네이버나 다음과 같은 포털이 블로그 서비스를 시작했을 때에도 소셜 미디어는 사회적으로 그다지 큰 주목을 받지 못했다. 단순히 개인 친목이나 사사로운 이야깃거리를 지인들과 나누는 매체 이상으로 여기지 않았다. 사회적 이슈나 흐름을 바꾸거나, 기존 미디어가 긴장할 만한 경쟁 상대거나 혹은 기업의 새로운 마케팅 채널로 고려할 대상과는 거리가 멀었다. 그런데 왜 하필이면 요즘 소셜 미디어에 대한 사회적인 관심이 폭증하게 된 것일까?
 
다양한 이유가 있겠지만 정보의 관점에서 바라보면 요즘 주목 받는 소셜 미디어의 공통점인 ‘오픈 정책’에서 해답을 찾을 수 있다. 트위터와 페이스북은 회원들의 정보, 대화 내용 등의 자료가 담긴 데이터베이스를 공개해 누구든지 이 정보를 이용해 새로운 서비스를 창조할 수 있는 플랫폼을 제공하고 있다. 이런 오픈 플랫폼은 타 기업에 상당한 매력이 아닐 수 없다. 수천 수백만의 회원을 지닌 소셜 미디어 서비스의 데이터베이스는 회원들 간 어떤 대화가 오가는지, 어떤 이슈가 주목받는지, 입소문이 어떤 경로로 전달되는지 등 전통적인 매체에서는 상상도 할 수 없는 값진 정보를 담고 있다. 시장의 트렌드나 소비자의 반응, 사회적 분위기를 고스란히 담고 있다. 더욱이 이 데이터를 모든 이들에게 공개하고 있으니 소셜 네트워크 서비스는 기업에 값진 광석이 묻힌 광산과 다를 게 없다.
 
기업뿐만 아니다. 전체 사회의 트렌드나 국민 여론, 그리고 사회적 이슈를 파악할 수 있다. 정부를 비롯한 정치단체가 이들 소셜미디어를 커뮤니케이션 채널로 적극 수용하는 이유다.
 
수억 명의 가입자를 가진 방대한 데이터베이스가 출현했고 이 데이터가 공개됐다는 사실은 과거에는 상상도 할 수 없었던 새로운 비즈니스 모델이 등장할 수 있고 새로운 마케팅 기법이 개발될 수 있다는 의미다. 이런 측면에서 기업, 국가, 그리고 전 사회가 떠들썩할 만하다.
 
이제 관건은 이 공개된 데이터의 광산에서 누가 먼저 가치 있는 데이터를 뽑아 내느냐다. 21세기 정보의 골드러시다.
 
앞의 아마랄 연구팀의 축구 분석이 가능했던 것도 바로 국제축구연맹(FIFA)이 2008년 국제 매치에서 모든 경기의 선수 간 패스 정보 데이터를 수집하고 공개했기 때문이다. ‘축구의 데이터 광산’이 공개됐고, 아마랄 연구팀은 골드러시의 선봉으로 달려가 네트워크이론을 이용해 축구의 역사와 함께한 개인 기여도 분석 방식을 제시했다. 그리고 이 골드러시에서 삽과 곡괭이는 다름 아닌 수학의 알고리즘과 논리적 분석이었다. 경영과학의 역할이 소셜 미디어라는 스포트라이트를 받으며 경영의 무대에서 재조명을 받고 있다.
 
네트워크 분석
소셜 미디어의 데이터 분석이 기존 경영과학에서 다루던 데이터 분석과 다른 점은 또 있다. 바로 수많은 사람 간의 복잡한 연결고리를 파악하는 연결망 분석이다. 점으로 표시된 개인이 다른 개인과 어떤 관계를 형성하고, 또 개인 간의 정보 전달과 확산이 어떤 경로를 통해 이뤄지는지를 파악하기 위해서는 연결 고리 분석이 필수다. 이처럼 점과 점의 연결을 통해 전체 구조의 특성을 이해하는 분야가 바로 네트워크 분석이다.
 
아마랄 연구팀의 축구 분석도 선수와 선수 간의 관계를 공의 패스 연결고리를 이은 네트워크를 이해함으로써 각 개인의 기량을 수치화할 수 있었다. 각 개인이나 하나의 사물에만 집중해서 풀지 못한 난제를 네트워크의 관계 분석을 통해 이론적 단서를 제공한 사례는 전화망 연결, 도로 교통망 분석, 단백질의 연결 고리 등 여러 분야에서 찾을 수 있다. 단백질 연결 고리를 연구하는 생물학자 아마랄이 축구를 분석한 것은 이들 사이에 공통분모가 존재했기 때문이다.
 
소셜 미디어와 네트워크 분석의 융합
소셜 미디어 서비스의 방대한 데이터가 열리면서 네트워크 분석을 이용해 단백질을 연구하는 생화학자, 교통망을 연구하던 경제학자들이 이젠 소셜 미디어 분석으로 시선을 돌리고 있다. 그리고 더 나아가 마케팅의 고객관계관리(CRM)가 추구하던 개인 고객 관리가 네트워크 분석과 결합해 한 단계 업그레이드된 CRM의 탄생을 예고하고 있다.
 
소비자 개개인의 선호도와 취향을 판별해 고객지향적 서비스를 지향하는 CRM입장에서 소셜 미디어의 데이터는 매우 군침이 도는 정보다. 기업이 자체 정보망으로 고객 데이터를 모으는 데는 한계가 있다. 또 기업에 쌓인 고객들의 데이터는 이미 자사 제품을 구매한 고객으로 한정돼 있다. 아무리 CRM과 고도의 데이터 분석을 자랑하는 월마트나 아마존닷컴이라 할지라도 자사에서 물건을 구매한 적이 없는 소비자의 취향을 판별할 수는 없다. 하지만 수많은 고객이 가입된 트위터나 페이스북에서 회원들의 대화나 친구들 간의 인맥 연결 고리를 통해 잠재고객을 찾아내 취향에 맞는 제품을 제시한다면 기존 CRM의 한계를 극복할 수 있는 새로운 플랫폼을 창조할 수 있다.
 
이러한 아이디어는 실제 미국 아마존닷컴(Amazon.com)과 페이스북이 올해 여름부터 연동 서비스를 시작하면서 좀더 구체화되고 있다. 2010년 7월 선보인 이 연동 서비스는 아직 베타 버전으로 현재까지는 아마존닷컴의 회원이 희망 리스트(Wish List)를 페이스북에 공개해 친구들에게 자신이 받고 싶은 선물을 공개하는 방식으로 첫 발걸음을 뗐다. 친구의 선물을 고를 때 고민할 필요 없이 페이스북에서 쉽게 친구가 원하는 상품을 선택해 구매 배송할 수 있다.
 
또 쇼핑하기 전 친구들에게 의견을 물어볼 수 있는 창구도 마련돼 있다. 실제로 싸이월드 같은 개인 블로그에 자신이 구매하고 싶은 상품의 사진을 올려놓고 일촌들에게 의견을 물어보는 포스팅을 자주 볼 수 있다. 아마존닷컴과 페이스북은 이런 ‘같이하는 쇼핑’ 심리를 시스템화한 것이다. 뉴욕타임스는 이를 ‘쇼핑 소셜(Shopping Social)’이라는 단어로 표현했다.4
 
CRM과 소셜 미디어 분석의 관점에서는 친구와 친구의 관계에서 상품이란 매개체를 통한 새로운 차원의 데이터분석의 장을 연 셈이다. 이는 마치 아마랄의 축구 분석에서 선수와 선수의 관계가 축구공으로 연결되는 것과 비슷한 의미로 해석할 수 있다.
   
소셜 미디어와 네트워크 분석의 결합은 새로운 분석 툴을 탄생시켰다. 바로 데이터 마이닝, 통계 분석, CRM이 네트워크 분석과 융합한 소셜 미디어 애널리틱스(Social Media Analytics)와 소셜 네트워크 애널리틱스(Social Network Analytics)란 분야다. 골드러시 때 실제 돈을 번 건 청바지 장수였다는 말처럼, 21세기 정보의 골드러시에도 수많은 정보기술(IT) 업체들이 나름의 분석 툴로 시장에 뛰어들고 있다. 대표적인 예로 2009년 세계적인 통계 소프트웨어 업체인 SPSS를 인수한 IBM이 자사의 시스템과 이 통계 기술을 결합한 소셜 미디어 솔루션을 올해 5월 선보였다.5
 

물주 알고리즘
소셜 미디어의 핵심은 바로 네트워크다. 이 네트워크 분석의 강력한 기능과 소셜 미디어의 공개데이터가 결합해 새로운 패러다임을 열고 있다. 소셜 미디어라는 새로운 소용돌이 모멘텀을 기업의 경쟁력으로 승화시킬 수 있는 방법은 네트워크에 대한 과학적 분석이란 사실을 잊지 말아야 한다.
 
요즘 수많은 기업들이 페이스북이나 트위터 계정을 운영하고 있지만, 아직 단순한 고객 의견 수렴 창구 역할에만 머물러 있다. 좀더 적극적이고 체계적인 데이터 수집과 분석을 고려해 볼 때다. 이 가치는 이미 아마랄의 축구 분석이 증명하고 있다. 마지막으로 네트워크 분석을 통해 축구 경기에서 박지성과 같은 키 플레이어를 찾은 알고리즘이 등장한 것처럼, 가족이나 친목 모임에서 물주나 스폰서를 찾는 알고리즘도 조만간 나오지 않을까 상상해 본다. 
  • 장영재 장영재 | - (현)카이스트 산업 및 시스템 공학과 교수
    - 마이크론 테크놀로지 기획실 프로젝트 매니저
    - 매사추세츠 공대 생산성연구소 연구원

    이 필자의 다른 기사 보기
관련기사