편집자주
경영 현장에 수많은 수학자와 과학자들이 포진하고 있습니다. 이들은 전략, 기획, 운영, 마케팅 등 다양한 분야에서 첨단 수학·과학 이론을 접목시켜 기업 경쟁력 강화에 기여하고 있습니다. 경영 과학은 첨단 알고리즘과 데이터 분석 기술로 기업의 두뇌 역할을 하면서 경영학의 새로운 분야를 개척해나가고 있습니다. <경영학 콘서트>의 저자인 장영재 박사가 경영과학의 새로운 패러다임을 소개합니다.
공학자, 축구를 분석하다
2010년 6월 미국 노스웨스턴 대학의 화학-생물 공학과에서 복잡계를 연구하는 루이스 아마랄과 그의 동료 학자들이 흥미로운 연구 결과를 발표했다. 그런데 이 연구는 화학도 생물학도 공학에 관한 것도 아니었다. 바로 축구였다!1
아마랄 연구팀은 축구 경기에서 각 개인의 기량을 객관적으로 분석하는 알고리즘을 분석했다. 이들은 논문에서 데이터와 수학을 이용해 경기마다 각 선수의 기량을 평가하는 방식을 선보였다. 이 연구는 미국 포브스나 CNET등 미디어에 소개되는 등 세간의 주목을 받았다. 그 이유는 단순히 공학자들이 축구를 분석했기 때문만은 아니었다. 이들은 자체 개발한 알고리즘을 이용해 유로 2008(Euro Cup 2008) 경기에서 최고의 기량을 보인 ‘베스트 20’을 뽑았는데, 알고리즘이 뽑은 선수들은 전문가들이 뽑은 최고 선수 리스트와 큰 차이가 없었다.2
데이터와 수학알고리즘이 전문가들의 안목을 대신할 수 있다는 가능성을 보여준 셈이다. 다소 주관적인 안목과 경험에 의존하는 축구 전문가들의 평가 방식과 대조적으로 이 알고리즘은 선수의 기량을 객관적으로 설명할 데이터와 논리적 근거도 함께 제시한다. 이는 데이터와 수학 알고리즘이 축구 전문가들보다 더욱 설득력 있게 선수를 평가할 수 있다는 의미다.
네트워크 분석을 통한 축구 분석
개인기와 팀 플레이의 조화가 가장 요구되는 스포츠가 바로 축구다. 팀 플레이가 중요한 경기에서 각 개인의 팀 기여와 기량을 어떻게 측정할 수 있을까? 이 문제는 축구라는 스포츠가 그 형태를 갖추기 시작한 시점부터 축구 전문가들이 늘 고민해 오던 문제다.
축구에서 개인 기량을 객관적이고 논리적으로 판단하기 힘든 이유는 바로 ‘경기의 연속성’에 있다. 야구와 비교해 보자. 야구에서는 공격과 수비가 명확하게 구별돼 있다. 각 선수의 성적은 공격 기여도와 수비 기여도 등으로 명확하게 구별해 평가할 수 있다. 또 전체 경기의 흐름을 투수가 공을 던지는 것에서, 타자가 공을 치고, 주자가 뛰는 별개의 사건(discrete event)으로 나눌 수 있기 때문에 각 사건별로 선수 개인의 역량을 수치화할 수 있다. 이처럼 야구에서는 다양한 개인 기록을 데이터화하는 것이 가능하고 이를 분석해 작전이나 운영에 이용한다. 야구를 ‘통계의 스포츠’라 일컫는 것도 바로 이 때문이다.3
반면 축구는 90분간 끊임없이 공을 다투는 스포츠다. 공격과 수비가 예측할 수 없게 바뀐다. 공격수가 수비를, 수비수가 공격에 가담하는 예측 불가능한 변화의 연속이다. 분석의 기본은 데이터인데 끊임없는 연속적인 동작에서 선수의 능력을 포착해 수치화한 데이터를 포착하기란 쉽지 않다.
또 축구에서 각 개인의 기량을 측정하기 힘든 또 다른 이유는 바로 ‘득점의 제한성’에 있다. 한 경기당 수십 포인트가 나오는 농구의 경우 슛 성공률과 어시스트 포인트 등을 통해 개인 기량을 쉽게 평가할 수 있다. 그러나 1대0으로 승리한 축구 팀에 대해 슛을 넣은 선수만 팀에 기여했다고 말할 수 없다.
축구의 연속성과 득점의 제한성은 각 선수의 기량을 객관적으로 판단하는 데 걸림돌이 됐다. 결국 축구 선수에 대한 평가는 소수 전문가들이 축구 경기를 관람한 후 각자의 의견에 따라 선수의 평점을 매기는 방식에 의존할 수밖에 없었다. 하지만 평가자의 주관에 의지하는 전문가 평가방식은 일관성의 부재로 인해 종종 논란의 대상이 됐다.
아마랄 연구팀이 개발한 알고리즘은 이러한 축구 분석의 한계를 극복했다. 그렇다면 아마랄 연구팀은 어떤 방식으로 이 난제를 극복했을까? 바로 네트워크 분석을 통해 가능했다.
네트워크-연결고리의 복잡성을
명료하게 푸는 마법의 수학
아마랄과 연구팀은 각 경기당 선수들간의 패스 데이터와 슈팅 데이터를 바탕으로, 선수 간 패싱 성공률, 슈팅 성공률, 수비 역할, 전체 경기 흐름의 역할을 분석한 네트워크 그래프를 이용해 개인 역량을 산출했다.
<그림1>에서 각 점은 유로2008 독일-스페인 전 참가 선수를, 각 점에 표시된 숫자는 선수의 등 번호를 각각 의미한다. 각 점은 선수의 포지션별로 배치됐다. 그래프의 중앙의 사각형들은 골대로 향한 슈팅(맨 중간 사각형)과 골대를 벗어난 슈팅(위와 아래 사각형들)을 각각 표시한다. 점과 점을 잇는 선은 선수 간의 패스를 의미한다. 선이 굵을수록 패스 성공률이 높다. 선수의 기량은 각 선수를 표시한 점의 크기로 표현되는데 점의 크기가 클수록 기량이 우수한 선수다.
<그림1>에서 보면 대부분의 스페인 선수들은 독일 선수들을 압도한다. 또 패스라인이 다소 단순한 독일에 비해 스페인은 다양한 패스 전술을 구사했음을 한 눈에 파악할 수 있다(이 경기에서 스페인은 독일을 1-0으로 꺾어 승리했다).
이 분석에서 사용된 주 데이터는 선수 간 패스 횟수와 슈팅이다. 그렇다면 선수의 수비 기여도는? 이는 선수가 패스를 받은 수와 상대 선수에게 패스한 수를 통해 간접적으로 계산할 수 있다. 즉 어느 선수가 팀 동료 선수에게 패스한 횟수가 20번인데 반해 동료 선수로부터 공을 패스 받은 횟수는 12번이라면 나머지 8번은 상대편 선수로부터 공을 뺏은 것이다.
여기서 한 가지 빠진 게 있다. 실제 패스가 슈팅으로 연결돼 팀 승리에 얼마나 기여했느냐의 문제다. 패스들 중 수비 진영에서 시간을 끌려고 공을 돌리는 패스와 상대방 문전 앞에서 슈팅 기회를 잡으려고 상대 수비의 마크를 피해가며 숨가쁘게 전개되는 패스의 가치는 다르다. 또 수비와 공격의 중간에서 경기 흐름을 주도하는 패스의 가치도 고려돼야 한다. 실제 우리나라 대표팀의 박지성 선수의 가치를 단순히 패스 능력과 수비력만으로 판단할 수 없다. 미드필드에서 적시적소에 공을 공급해 전체적인 팀의 리듬을 현란하게 조절하는 것이 박지성의 능력이자 가치다.
아마랄은 이러한 경기 주도의 역할을 중앙성(Betweenness Centrality)을 이용해 수치화했다. 중앙성이란 소셜 네트워크의 특성을 분석하는 방식 중의 하나로 전체를 구성하는 개인의 영향력을 파악하는 데 사용된다.