Management Science 2.0

통계와 과학이 그를 神이 되게했다

91호 (2011년 10월 Issue 2)


편집자주

경영 현장에 수많은 수학자와 과학자들이 포진해 있습니다. 이들은 전략, 기획, 운영, 마케팅 등 다양한 분야에서 첨단 수학·과학 이론을 접목시켜 기업 경쟁력 강화에 기여하고 있습니다. 경영 과학은 첨단 알고리듬과 데이터 분석 기술로 기업의 두뇌 역할을 하면서 경영학의 새로운 분야를 개척해나가고 있습니다. <경영학 콘서트>의 저자인 장영재 교수가 경영과학의 새로운 패러다임을 소개합니다.

 

“과연 김성근 감독은 야구의 신이었을까?”

지난 817, 국내 모든 스포츠뉴스는 SK와이번즈의 김성근 감독 계약해지라는 충격적인 소식을 헤드라인으로 전했다. 구단과 불화로 시즌 중 감독 계약해지라는 카드를 꺼내 든 자체도 놀라운 뉴스거리지만 2007년 취임 이후 SK를 한국 최고의 구단으로 만든 그에게 즉각 해지란 폭탄 카드를 꺼내 든 구단 운영진의 태도는 모든 야구인과 팬들에게 충격적인사태로 받아들여졌다. 김성근 감독은 취임 이후 2007, 2008년 한국시리즈 2연패, 2009년 한국시리즈 준우승에 이어 지난해 3번째 한국시리즈 우승 등 재임기간 4년 연속 팀을 한국시리즈에 올려놓았다. 더구나 2009년에는 정규시즌 19연승이란 아시아 신기록을 세웠다. 결과만으로는야구의 신이란 별명이 결코 과장이 아니다. 그러나 이해할 수 없는 선수 기용과 교체, 과다한 점수 지향적 작전으로 이기기만 하지 재미없는 야구를 구사한다는 비난도 함께 받아왔던 그다. 그는 과연 야구의 신이었을까, 아니면 승리에만 집착한 승부광이었을까? 그가 구사한 야구가 비난받을 만큼 승부 집착적인 야구였는가? 이 질문에 답하기 전 잠시 이야기를 스포츠 산업 최대의 시장인 미국으로 돌려보자.

 

MIT 슬론 스포츠 애널리틱스 콘퍼런스

매년 3월 미국 보스턴에서는 메이저리그 야구단의 구단주, ESPN 스타 해설가, 글로벌 스포츠 매니지먼트사의 사장단, PGA 운영위원 등 세계 스포츠계의 거물들과 MIT 공대의 공학자, MIT 슬론스쿨 및 하버드경영대학원 교수들이 한데 모이는 자리가 열린다. 전 세계적으로 스포츠계의 거물들과 이공계 학자, 그리고 경영학자들의 교집합을 찾을 수 있는 거의 유일한 회동인 이 모임은 ‘MIT 슬론 스포츠 애널리틱스(MIT Sloan Sports Analytics) 콘퍼런스. MIT 슬론스쿨과 하버드경영대학원 MBA 학생들이 의기투합해 시작한 이 콘퍼런스는 스포츠 산업의 과학적 운영에 대한 가치와 비전 공유를 목표로 하고 있다.1 2006년 시작된 이후 매년 그 규모가 커져 이제는 스포츠의 과학적 비즈니스 운영 부문 관련 세계 최대의 콘퍼런스로 자리매김하고 있다. 올해 3월 콘퍼런스에서는 NBA 휴스턴 로키츠의 운영 이사인 대릴 모리, 미국 풋볼 NFL 뉴욕 자이언츠의 스타 플레이어인 저스틴 턱, 그리고 <블링크>로 우리나라에도 잘 알려진 말콤 글래드웰 등 유명 인사들이 주연사로 참석했다.

 

이 콘퍼런스의 주제는 스포츠 산업과 과학적 운영이다. 데이터 분석과 이를 통한 과학적인 의사결정 및 운영에 대해 다루는 애널리틱스(Analytics)를 스포츠 산업에 적용해 효율적인 스포츠 운영과 비즈니스를 한다는 게 바로 스포츠 애널리틱스의 목적이다. 그런데 과연 스포츠와 애널리틱스의 접목이 가능한가? 글로벌 기업들이 기업 경쟁력 향상을 위해 유통이나 제조 부문에서 최근 몇 년 전부터 애널리틱스를 도입하고 있지만 아직도 많은 기업들에는 개념조차 생소하다. 더구나 이러한 과학적인 비즈니스 운영을 다름 아닌 과학과 거리가 가장 멀 것만 같은 스포츠에 응용한다니 도대체 가능이나 할까? 이러한 질문을 비웃기라도 하듯 스포츠 산업과 애널리틱스의 조합을 목표로 내건 콘퍼런스는 매년 놀라운 규모로 성장하고 있다.

 

머니볼

실제 애널리틱스가 가장 잘 활용되고 그 효용이 입증된 산업은 다름 아닌 스포츠 산업이다. 오히려 이러한 스포츠 산업에서 애널리틱스의 가치가 증명되면서 다른 산업 분야로 애널리틱스가 전파됐다고 해도 과언이 아니다. 애널리틱스의 기본 프레임은빅 데이터 (big data)’로 표현되는 대용량 데이터 분석과 이를 바탕으로 한 과학적 의사결정이다. 즉 방대한 데이터를 바탕으로 기존에 파악하지 못한 새로운 가치를 인지해 더 나은 의사결정을 내리는 게 바로 애널리틱스의 핵심이다. 애널리틱스의 스포츠 운영을 통한 대표적 성공사례가 바로 2000년에서 2003 4년 연속 포스트시즌 진출 쾌거를 이룬 미국 메이저리그 구단 오클랜드 애슬레틱스(Oakland Athletics).

 

1999년 메이저리그에서 가장 가난한 구단인 애슬레틱스의 단장으로 빌리 빈(Billy Bean)이 취임했다. 재정난으로 연봉이 높은 스타급 선수를 영입한다는 건 상상도 할 수 없었다. 빌리 빈이 할 수 있는 일은 메이저리그의 저평가된 선수를 영입해 승리팀으로 만드는 길뿐이었다. 100년이 넘는 메이저리그 역사상 타자의 능력은 타율과 홈런으로 대변됐다. 즉 우수한 타자는 곧 타율이 높고 홈런 수가 많은 선수를 의미했고 이는 다시 높은 연봉을 의미했다. 그러나 과연 이러한 개인 수치가 진정으로 팀의 승리에 기여를 할까? 혹시 타율이나 홈런 이외에 팀 승리에의 기여도를 측정할 수 있는 타자의 평가 항목이 있을까?

 

빌리 빈은 데이터 분석을 통해 답을 찾기 시작했고 놀라운 사실을 발견했다. 타율과 홈런보다는 끈질기게 투수를 물고 늘어지는 능력, 원하는 공이 오지 않으면 절대로 방망이를 휘두르지 않는 침착성, 포볼을 얻어 진루하는 출루율 등이 팀 성적에 더 큰 영향을 미친다는 사실을 파악했다. 빌리 빈은 이 새로운 발견을 바탕으로 저평가됐거나, 혹은 딴 팀으로 방출됐거나 2진에만 머무는 선수들로 팀을 구성했다. 처음 그가 이런 라인업을 구성했을 때 팬들과 미디어는 미친 실험이라면서 평가 절하했다. 특히 야구 인생에서 포수만하다 팔꿈치 수술로 더 이상 공을 많이 던질 수 없어 방출된 스캇 헤티스버그란 선수를 애슬레틱스로 영입해 1루수 자리로 배정하자 비난과 조롱은 극에 달했다. 그러나 빌리 빈은 헤티스버그의 뛰어난 선구안과 침착한 성격이 수천만 달러의 연봉을 받은 홈런 타자보다 더욱 가치가 있단 사실을 간파했다. 빌리 빈은 그에게 쏟아진 비난과 조롱을 메이저리그 최저 팀 연봉으로 4년 연속 포스트 시즌 진출이란 결과로 통쾌히 날려버렸다. 이 영화와 같은 성공 스토리는 이후 <머니볼2 >이란 책으로 발간돼 베스트셀러가 됐으며 미국 유수 경영대학원의 필독서로 자리매김하고 있다. 이 스토리는 영화로도 만들어져 최근 미국 극장에서 개봉됐다. 브래드 피트가 빌리 빈으로 분한 이 영화는 국내에서도 이달 말 개봉할 예정이다3 .

 

빌리 빈의 성공 이후 모든 메이저리그 구단은 데이터 분석과 이를 통한 팀의 과학적 구단 운영의 효용을 인정했고 앞다퉈 통계학자, 수학자, 컴퓨터 공학자를 팀 분석가로 영입했다. 실제 분석가들은 상당한 연봉을 받으며 팀의 전략 작전 운영에 중추적인 역할을 담당하고 있다. 메이저리그뿐 아닌 NBA 농구, NFL 풋볼 등 대부분 스포츠에 애널리틱스가 적용되기 시작한 것은 물론이다.4

 


그럼 왜 이토록 애널리틱스가 스포츠 산업에 잘 적용이 될까? 우선 스포츠는 한 시즌 동안 반복된 게임이 연속적으로 진행된다. 마치 카지노와 같다. 카지노에서 딜러의 승률은 51%, 고객의 승률은 49%라 한다. 비록 50%를 기준으로 1%의 승률 차이지만 이 작은 승률로도 카지노는 엄청난 수익을 올릴 수 있다. 바로 통계의대수의 법칙때문이다. 불확실한 상황에서 어떤 특정한 일이 일어날지를 예측하기란 불가능하다. 즉 주사위를 한 번 던질 때 어떤 수가 나올지를 예측하는 것은 어렵다. 그러나 이 주사위를 수백 번, 수천 번 던지면 특정 수가 나올 확률은 6분의1로 수렴한다. 이것이 바로 대수의 법칙이다. 카지노도 한 번의 특정 게임에서 승패를 예측하기란 불가능하다. 그러나 각 게임에서 돈을 잃기도 하고 벌기도 하지만 수많은 게임이 연속해서 반복되면 비록 작은 승률이라도 51%란 확실한 수치로 수렴된다. 확실히 1000번 중 510번에 가깝게는 이긴다는 의미다.5
스포츠에서도 선수 기용이나 운영에서 상대방에 비해 작은 승률이라도 상대팀보다 높이는 방식만 찾으면 반복적인 게임을 통해 전체 승률을 높일 수 있다.

 

애널리틱스가 스포스 산업에 효과적으로 적용할 수 있는 또 다른 이유는 바로데이터. 특히 야구의 경우 각각의 상황이 분절된 형태로 진행돼 데이터 기록에 용이하다. 또한 한 게임에서 엄청난 양의 데이터가 쏟아진다. 이는 데이터를 분석할 수 있는 기반이 마련돼 있다는 의미다. 더구나 모션 캡처(motion capture) 기술의 발달로 축구와 같이 끊임없이 연속적으로 이뤄지는 경기도 실시간으로 데이터를 수집할 수 있는 기술이 발달돼 스포츠 데이터 분석의 새로운 장을 열고 있다. 요즘 축구경기를 시청하면 어떤 선수가 몇 킬로미터를 뛰었는지 수치가 나오는 것도 바로 이러한 기술 덕택이다. 즉 다양한 기술을 통해 데이터 수집과 분석이 가능해졌고 이를 통해 과학적 의사결정, 즉 애널리틱스 활용 기반이 마련될 수 있게 됐다.6

 

스포츠를 분석하는 과학자들

엄청난 시장을 거느린 미국의 스포츠 산업 특성상 한 게임당 스포츠팀의 승패는 기업 매출에 지대한 영향을 미친다. 특히 스포츠 프랜차이즈 사업의 수익은 스포츠팀의 승패와 직결된다. 이러한 상업계의 요구로 과학적인 스포츠 분석, 즉 스포츠 애널리틱스의 규모는 더욱 커지고 있다. 경영학자, 경제학자, 공학자들이 스포츠분석을 하는 이유도 바로 이러한 스포츠 애널리틱스의 수요가 있기 때문이다. 경영공학에서 자주 사용되는 선형계획법의 세계적인 대가인 MIT의 드미트리스 벌치마스(Dimitris Bertsimas) 교수는 경영공학 부문에서 다양한 업적을 이뤘으며 스포츠 애널리틱스 영역에서도 의미 있는 성과를 낸 학자로 유명하다. 보스턴 레드삭스팀의 열혈 팬인 그는 수학적 모델을 바탕으로 2010년 레드삭스가 90승을 할 것이라고 시즌 전 공식 발표했다. 놀랍게도 그해 레드삭스는 89승으로 시즌을 마감했다.7 하버드대 통계학과의 칼 모리스(Carl Morris) 교수는 메이저리그 120년간의 데이터를 분석해 번트의 가치를 판별해냈다. 그는 흔히 번트가 점수를 낼 수 있는 유용한 방법이라 생각해 작전에 많이 남용되고 있지만 실제 번트로 점수를 낼 기대치는 번트 없이 점수를 낼 기대치보다 낮다는 사실을 밝혀했다. 이후 메이저리그에서 번트 시도 수가 급격히 줄기 시작했다.8

 

이러한 스포츠 산업의 새로운 과학화에 발 맞춰 구단의 스포츠 팬 서비스도 진화하고 있다. 구단들은 자체 분석한 자료를 팬들에게 공유하고 경기 후 왜 특정 선수가 기용됐는지, 혹은 이번 작전은 어떤 분석을 근거로 실행됐는지를 공개하기도 한다. 미국 전문 스포츠 방송사인 ESPN은 스포츠 경기마다 다양한 데이터와 분석을 경기 중계와 함께 보도하며 해설가 또한 이러한 데이터를 기반으로 해설을 진행한다. 해설가의 단순한 입담에만 의지한 스포츠 해설보다는 명확하고 일반인이 알지 못했던 새로운 사실을 데이터를 근거로 설명함으로써 스포츠를 새로운 시각에서 즐길 수 있는 묘미를 제공한다.

 

김성근 감독. 그는 과연 야구의 신인가?

이제 앞의 질문으로 돌아가보자. 그는 진정한 야구의 신일까? 아니면 단지 승부에만 집착해 재미없는 야구만 구사한 감독이었을까? 이 질문에 답하기 위해 그의 능력을 데이터를 통해 객관적으로 분석해 보기로 했다.

 

감독의 역할 중 가장 중요한 건 바로 선수 기용이다. 특히 선수 라인업 (타자를 1, 2, 3번 등으로 배정하는 것)을 구성하는 일은 팀에서 감독만이 할 수 있고 감독의 역량을 평가하는 가장 중요한 기준 중 하나다. 필자의 KAIST 시스템 디자인 및 경영(System Design and Management)’ 연구실에서 2010년 모든 구단의 매 경기별 선수의 타격과 주루 플레이 데이터를 모아 어떤 팀이 가장 효율적으로 선수를 라인업했는지를 판별하기로 했다.

 

일단 이 작업을 위한 첫 번째 작업으로 수학적 모델을 구성했다.9  구체적으로는 확률의마코프 체인(Markov Chain)’이라는 방식을 적용해 만든 이 모델은 타자의 타율과 주루 플레이를 바탕으로 팀별 게임당 예상 점수를 예측하는 것이다. <그림1>에서와 같이 이 모델을 각 타자별 타격 정보와 주루 플레이 정보, 실제 타선 라인업을 입력값으로 받아 분석을 통해 팀의 예상 점수를 산출해낸다.

[그림1] 모델의 입력값과 출력값


 
모델이 완성된 후 이 모델의 검증을 위해 실제 2010년 각 팀의 실제 점수와 모델이 예측한 점수 분포를 비교해보았다. <그림2>는 실제 2010년 시즌에서 각 팀의 경기별 평균 점수와 분석을 통한 예측 점수의 비교다. 예들 들어 SK의 경우 분석에서 예상한 점수는 5.218인 데 반해 실제 점수는 5.293이었다. 에러는 약 1.4%로 어느 정도 신뢰할 수 있는 모델이라 할 수 있다.

 

[그림2] 경기당 평균 점수와 분석을 통한 예측 점수 비교


모델이 검증된 이후 이 모델을 바탕으로 가능한 모든 타선 조합의 예상 점수를 산출해냈다. 그리고 가장 효율적인 라인업을 구성한 팀을 판별해냈다. 그 결과 국내 야구팀 중 효율적인 라인업을 구성한 팀은 다름 아닌 롯데와 SK였다. 롯데의 경우 거포타자들이 대거 포진한 라인업으로 타선 구성이 그리 어렵지 않았다. 반면 SK의 경우 김성근 감독은 선발 투수에 따라 매번 라인업을 바꾸는 스타일을 추구했다. 이러한 많은 변화에서 다른 팀에 비해 효율적인 라인업을 구사할 수 있었던 것은 김성근 감독이 추구한 데이터 야구의 결과라 할 수 있다.

 

그럼 김성근 감독이 재미없게 이기는 야구만 추구했다고 말할 수 있을까? 스포츠 경기의 재미는 관전하는 이의 스포츠에 대한 이해도와 밀접한 관계가 있다. 극단적인 예로 야구 규칙을 전혀 모르는 사람이 야구 경기를 관전한다면 단지 공을 던지고 방망이로 공을 치는 단순하고 지루한 놀이에 불과하다. 만일 SK의 경기에서 김성근 감독의 작전 이유에 대해 데이터를 바탕으로 한 분석적인 해설이 가미됐다면 좀 더 박진감 있는 김성근 야구를 관전할 수 있었을 것이다. 단지 입담에만 의지한 해설로 김성근 감독의 정교한 야구를 꿰뚫어보기 힘들었던 관객들에게 그의 경기는 승부에만 집착한 지루한 야구로 인식될 수밖에 없었다.

 

이제 야구 관객 600만 시대다. 야구뿐만 아닌 국내 다양한 스포츠 산업이 더 큰 도약을 기대하고 있다. 스포츠 마니아층도 소수에서 다수를 형성하고 있다. 이런 마니아들은 단순한 볼거리에서 한발 더 나아가 정교한 분석이 가미된 새로운 스포츠의 묘미를 요구하고 있다. 스포츠 기업들도 이러한 새로운 요구에 대응하기 위해서는 주먹구구식으로 운영할 게 아니라 스포츠 애널리틱스를 활용해 한층 업그레이드된 운영 방식을 도입할 필요가 있다. 스포츠 선진국인 미국에서 <머니볼>이 수년간 베스트셀러로 사랑받는 이유를 생각해 보자.

 

 

 

장영재 KAIST 산업 및 시스템 공학과 교수 yjang@kaist.ac.kr

필자는 미국 보스턴대 우주항공학과를 졸업한 뒤 미국 매사추세츠공대(MIT) 기계공학 석사 학위와 MIT 경영대학원(슬론스쿨)에서 경영과학 석사 학위를 받았다. 이어 MIT 기계공학과에서 불확실성을 고려한 생산 운영방식에 관한 논문으로 박사 학위를 취득했다. 이후 반도체 기업인 마이크론테크놀로지 본사 기획실의 프로젝트 매니저로 과학적 방식을 적용한 원가절감 및 전략적 의사결정을 지원했다. 현재는 카이스트 산업 및 시스템 공학과 교수로 재직 중이다. 저서로는 <경영학 콘서트>가 있다. 트위터 아이디는 @youngjaejang이다.

동아비즈니스리뷰 345호 Fake Data for AI 2022년 05월 Issue 2 목차보기