Issue Highlight 1 : 알파고가 우리에게 남긴 것

알파고는 이길 수 있을 때 대결을 신청했다 그러나, 그는 바둑이 뭔지도 모른다

199호 (2016년 4월 lssue 2)

 

Article at a Glance

 구글 딥마인드에서 인공지능 바둑 프로그램 알파고를 내세워 이세돌 9단에게 도전장을 냈을 땐 이미 많은 테스트를 거쳐승리를 확신한 이후였을 것이다. 1000개가 넘는 CPU와 인간이 대결하는 건 불합리하고 불공정하다는 얘기도 나왔지만, 이는 과학자들이 오랜 연구 끝에 찾아낸심층 인공신경망’, 즉 인간 뇌의 복잡한 뉴런 연결망을 흉내내는 기법으로 소프트웨어를 만들어낸 결과를 모르기 때문에 하는 얘기였다. 알파고의 메커니즘은 단순히 바둑만을 위한 것이 아니라 바둑을 통해 성능을 인정받은범용 프로그램이다. 이를인공지능의 지배가 다가왔다는 식으로 생각하며 겁먹을 필요는 없다. 인간은 어차피지능자체에 대해 잘 모른다. 자신이 잘 이해하지 못하고 있는 걸 개발할 수는 없는 노릇이다. 미래학자 케빈 켈리는앞으로 로봇과 얼마나 잘 협력하느냐에 따라 연봉이 달라질 것이라고 말했다. 우리 기업들도 인공지능과 로봇의 발전을 위한 장기투자에 나설 때다.

 

 

 

들어가며: 이세돌 9단이 질 수밖에 없는 이유

 

인공지능 바둑 프로그램인 알파고가 세계 최초로 프로 선수인 판후이 2단을 50으로 제압하고 세계 최강인 이세돌 9단에게 도전장을 내밀었을 때 필자는 경악했다. 기껏해야 아마 5∼6단 수준에 불과했던 인공지능 바둑 프로그램이 갑자기 프로 9단 수준으로 급성장했다는 것을 믿을 수 없었다. 게다가 알파고 측에서는 이세돌과의 대결에서도 정말 자신이 넘쳐 있었다. “알파고가 판후이 2단과 두었을 때보다도 더 늘기는 했을지라도 이번에 이세돌을 이기기는 힘들 것이라는 세간의 평가에 대해서 알파고를 개발한 구글 딥마인드의 하사비스 대표는 이렇게 대답했다. “(그렇게 말하는) 그들은 프로그래머가 아니다.(They are not programmers!)” 이 말은 곧 자신들은 프로그래머라는 말이다. 다시 말하면 프로그래머가 모든 것을 확인하고 검증한 다음에 프로그램을 돌리듯이 자신들은 이번 대결에서 승리한다는 것을 확인하고서 도전한다는 말이다. 알파고는 이세돌 9단과 대결하려고 (겨뤄보려고) 오는 것이 아니라 승리를 확인하기 위해서 서울로 오는 것임이 명백했다. 그들의 이런 믿기 어려운 확신이 도대체 어디서 나온 것인지 확인하기 위해서 그들이 네이처에 발표한 알파고에 관한 논문(그림 1), 제목을바둑 정복이라고 쓴 논문을 꼼꼼히 정독했다. 또한 그 논문에 참여한 스무 명 공저자들의 지난 10여 년의 연구도 추적했다. 그리고는 필자는 결론을 내렸다. 이번 대결에서 알파고가 완승할 것이고 만약 이세돌 9단이 1승이라도 한다면 그것은 그가 천재이기 때문이라고. 하지만 이렇게 공개적으로 예상한 전문가는 필자뿐이었다. 내 예상은 이세돌 9단은 알파고에게 이길 수 없으니까 한 번이라도 이기려면 5국 전체에 대한 전략을 짜서 단단히 준비하라고 하는 경고였지만 누구도 내 말을 진지하게 귀담아 듣지 않았다. 그렇다면 필자는 왜 알파고가 압승할 것이라고 결론을 내렸을까?

 

왜 바둑은 인공지능의 위대한 도전인가

 

이미 바둑을 제외한 모든 고전게임은 인공지능이 인간을 정복했다. 체스에서는 1997년에 IBM딥블루가 체스 세계챔피언 카스파로프를 꺾었고, 역시 이 회사의 슈퍼컴퓨터왓슨 2011년에 미국의 TV 퀴즈쇼제퍼디에서 인간 챔피언들을 제압했다. 그렇지만 전문가들은 바둑에서는 앞으로도 최소한 10년은 더 있어야 그런 도전이 가능할 (성공이 아니라) 것이라고 예상했다. 바둑이 인공지능에게 어려운 이유는 두 가지 특성 때문이다. 첫째, 바둑에서는 경우의 수가 너무 많다는 점이다. 한 게임에서 평균적으로 바둑판 위에 둘 수 있는 점은 250개이고, 게임이 평균 150수까지 진행된다고 할 때 총 경우의 수는 250150≒10360이 된다. 이 숫자는 우주 내에 존재하는 모든 원자의 개수(1080)보다 많고 체스(10123)와는 비교도 할 수 없을 정도로 엄청나게 복잡하다. 따라서 아무리 슈퍼컴퓨터를 수만 대 동원하더라도 모든 경우의 수를 따져서 승리를 보장하는 최적의 수를 찾는 것은 불가능하다. 둘째, 어떤 대국 상황에서 누가 이길 것인지를 예측하기가 매우 어렵다는 것이다. 체스나 장기의 경우에는 각각의 말들이 변하지 않는 내재적인 가치를 갖는다. 예를 들어 장기에서 차()가 갖는 가치는 시종일관 변하지 않는다. 따라서 어떤 상황에서 양 대국자가 갖고 있는 말들과 그 위치를 안다면 누가 이길 것인지를 예측할 수 있다. 하지만 바둑에서는 돌의 가치가 모두 동일할 뿐만 아니라 상황에 따라서 수시로 변한다.예를 들어 중요한요석1 사석2 작전’에 의해서 쓸모없는 말이 돼 버려지기도 하고 쓸모없는 말이 축머리3 가 돼 중요한 가치를 갖게 되기도 한다. 따라서 어떤 게임의 장면에서 누가 유리한지를 평가하는 것이 매우 어렵다.

 

컴퓨터가 활성화되기 시작한 1960년대 이후에 많은 연구자들이 컴퓨터 바둑 프로그램을 개발했지만 위에서 언급한 두 가지 이유 때문에 5급 정도의 낮은 아마추어 수준에 머물렀다. 그러다가 2008년경에 몬테카를로 트리탐색(Monte Carlo tree search)이라는 시뮬레이션 기법을 적용하면서 그 수준이 아마 5단까지 비약적으로 상승했다. 이 기법은 주어진 한 수를 평가하기 위해서 그로부터 비롯되는 모든 가능성을 탐색하는 것이 아니라 무작위로 선택한 샘플만을 검토하는데(rollout) 샘플 크기를 늘리고 시뮬레이션 횟수를 증가시키면 모든 가능성을 검토한 것과 같은 평가함수가 계산된다. 아마 5단 수준의 인공지능 바둑 프로그램은 한 착수당 200만 번의 시뮬레이션을 실행해 가장 승률이 높은 점을 선택해 착수한다. 이 기법은 빠르게 다음 착수 지점을 찾을 수는 있지만 그 정확성은 아직 프로 수준에 미치지 못하는 단점이 있다. 예를 들어 일본에서 개발된 인공지능 바둑 프로그램 젠(Zen) 2013년에 아마추어 9단에게 3점 접바둑으로 승리를 거뒀지만 프로 수준과는 상당한 격차가 있었다. 그렇다면 최초로 프로 바둑 선수인 판후이 2단을 제압한 알파고는 어떤 구조로 돼 있을까?

 

 

 

 

알파고의 구조

 

알파고가 프로 선수를 이길 수 있는 성능을 발휘하게 된 데는 딥러닝(심화학습)의 대표적인 기법인 심층 인공신경망(인간의 뇌의 복잡한 뉴런 연결망을 흉내내는 기법)을 이용했기 때문이다. 심층 인공신경망(Convolutional Neural Network)은 비교적 새로운 기계학습 이론이지만 각종 패턴인식 대회에서 탁월한 효과를 내고 있다. 사실 이 기법은 2012년 이후에 본격적으로 활용됐지만 전광석화처럼 빠르게 발전하며 성과를 내고 있다. 우선 알파고는 다음의 <그림 2><그림 3>과 같이 중요한 3개의 심층 인공신경망과 몬테카를로 시뮬레이션으로 이뤄져 있다.

 

 

우선 정책망은 두 단계의 심층 인공신경망으로 이뤄져 있는데(그림 2) 지도학습을 하는 첫 단계에서는 우선 유럽의 아마고수들이 인터넷 바둑(KGS Go Server)에서 뒀던 16만 대국의 기보에서 2940만 개의 바둑판 상황을 추출한 뒤 그런 장면에서 다음 수는 어느 위치에 착수할 것인지를 배운다. 실제로 아마고수들이 다음에 어느 위치에 착수했는지를 알고 있으니까 (그래서 지도 학습이라고 함) 그것으로부터 일관적인 패턴을 분석해서 흉내내고 익히는 것이다. 이미 이 단계에서 개발된 모델은 특정 바둑판 상황에서 그때까지의 흑백 착수 순서만을 입력해도 그 다음 수를 예측하는 데 있어서 55.7%의 정확도를 보였다. 이는 기존 다른 바둑 프로그램들의 예측치인 44.4%보다도 높은 것이다. 첫 단계에서부터 엄청난 양의 기보를 바탕으로 배워서 아마고수들의 착수를 잘 흉내낸다고 해서 대국에서 이기는 것이 보장된 것은 아니다. 그래서 알파고는 2단계에서 다음 착수 선정의 정확도를 (대국 승리와 직접적으로 연관지어) 더욱 높이기 위해서강화학습을 한다. 자기 자신과의 대국, 즉 현재의 모델과 그 이전 버전의 모델에서 임의로 추출한 모델과 수백만 번의 대국을 벌이게 하고 시행착오를 통해서 스스로 학습함으로써 모델을 점차 개선하는 것이다. 예를 들어 자신이 이긴 경기에 대해서는 해당 착수들이 승리에 기여했음을 고려해 해당 착수의 선택 확률을 높이는 것이다. 특히 이 부분에서 알파고는 지능의 중요한 요소인경험을 통해서 스스로 학습하는 능력을 구현하고 있다. 강화학습을 한 모델은 첫 단계의 모델과의 경기에서 80% 이상의 승률을 기록했다.

 

 

 

 

세 번째 단계에서는 다음 착수를 최종적으로 선택하기 위해 주어진 경기 상황에서 각각의 착수 후보 위치를 계산한다. 그리고 각각의 착수 이후에 나타나는 결과가 자신에게 얼마나 유리한지(승률이 얼마인지)를 두 가지 기법으로 평가한다. 하나는 심층 인공신경망을 이용한 평가망(value network)4 이고 다른 하나는 기존의 몬테카를로 시뮬레이션(rollout)을 이용하는 것이다. (그림 3) 평가망은 자신과의 3000만 대국에서 축적한 자료를 바탕으로 상황에 따라 필요한 장면을 추출해본다. 끝까지 두어 보지도 않은 상태에서 누가 이길 것인지를 학습한 모델로, 심층 인공신경망이 처리하는 방식이다. 평가망은 계산은 느리지만 상대적으로 정확하고, 몬테카를로 시뮬레이션은 빠르지만 상대적으로 정확도가 낮은 단점이 있다. 알파고는 이 두 기법의 장단점을 보완하기 위해 두 기법의 결과를 50%씩 반영해 최종 착수 위치를 결정한다. 알파고의 구조를 좀 더 쉽게 설명하기 위해 실제로 알파고와 판후이 2단이 뒀던 기보를 중심으로 각각의 단계가 어떻게 구현되는 살펴보자.

 

 

 

 

실제 대국의 한 장면5

 

이 대국은 속기 대국의 한 장면으로 흑을 잡은 알파고가 다음 수를 둘 차례다. <그림 4>는 정책망에서 알파고에게 다음 수를 추천한 결과다. 중앙 아래쪽의 한 점이 60%의 높은 확률로 추천되고 있고 그 오른쪽에는 35%의 확률로 다른 점이 추천되고 있다. 그림에서는 추천 확률이 0.2 이상인 9개의 점이 표시돼 있고 추천 확률이 0.1 이하인 14개의 위치는 생략돼 있다. <그림 5>는 이들 각각의 후보 지점에 착수를 했을 때 승률이 얼마인지를 각각 평가망과 시뮬레이션 기법으로 계산한 결과를 보여준다.

 

 

 

 

<그림 5>의 왼쪽 바둑판을 보면 평가망으로 계산한 각 후보 점들의 승률을 보여준다.6  23개의 후보 중에서 우하귀 화점(오른쪽 하단에 빨간 동그라미가 쳐진 돌)이 승률 53%로 가장 높은 것으로 나타났다. 반면에 각 후보 지점에 대한 시뮬레이션(rollout) 결과는 오른쪽 바둑판에 나타나 있는데(초당 약 120만 번의 시뮬레이션) 좌하귀의 2(바둑판 왼쪽 하단에 빨간 동그라미가 쳐진 돌)에 있는 후보가 승률 55%로 가장 높다.7 다음 수 후보의 승률 평가가 일치하는 경우에는 문제가 없지만 <그림 5>에서처럼 불일치하는 경우도 생긴다. 알파고는 두 기법의 결과를 50%씩 반영해 <그림 6>과 같이 우하귀 화점(바둑판 오른쪽 하단에 빨간 동그라미가 쳐진 돌)을 최적의 착수로 선정한다.

 

 

 

 

 

 

<그림 6>에서는 <그림 5>의 두 결과를 50%씩 합산한 상태에서 탐색 트리에서 가장 많이 방문한 지점을 다음 착수로 선택한다. 그렇게 하는 이유는 이 방법이 특별한 경우(outlier)에도 최적의 수를 추천하기 때문이다. 알파고는 자신의 최선의 수를 찾는 것에만 그치지 않고 상대방의 최선의 응수와 이어지는 상호 간의 최선의 응수를 미리 계산해 <그림 7>과 같이 지켜본다.

 

 

 

 

<그림 7>은 알파고가 우하귀의 O 표시에 흑을 놓은 이후에 전개되는 최선의 수들을 나타낸 것이다. 각각의 수들은 모두 위에서 설명한 절차에 따라서 계산한 결과다. 이 최적의 수순대로 흑백의 수가 이어진다면 흑이 이길 확률은 53%로 그대로 유지된다. 만약에 백이 응수를 달리하면 어떻게 될까? 실제로 판후이 2단은 우하귀에로 표시된 위치에 두지 않고 흰색의로 표시된 위치에 끼우는 수를 두었다. 이 수는 최선의 응대가 아니므로 알파고가 응징을 하게 되면 승률의 더 높아지게 된다. 실제로 판후이 2단은 이 수(□) 이후에 더욱 불리해졌는데 대국 후 검토에서 그는 다음 수를의 위치에 두었어야 했다고 후회했다.

 

 

알파고 업그레이드

 

알파고는 대단한 소프트웨어다. 알파고가 3주 동안 훈련한 약 3000만 건의 바둑판 상황은 유럽 아마고수들의 기보에서 추출한 것이다. 그중의 약 35%는 접바둑이었다. 그 아마고수들 모두는 중국에서 정식으로 프로에 입단한 후이 2단에게는 절대로 이길 수 없는 사람들이다. 하지만 그 데이터로부터 학습한 알파고는 판후이 2단에게 압승했다. 그게 작년 10월이다. 구글 딥마인드도 이세돌 9단에게 이기기 위해서는 알파고의 실력을 업그레이드시켜야만 한다는 것을 잘 알고 있었다. 하사비스는 대표는이세돌 선수와의 대결을 위해서 알파고를 업그레이드하기 위한 모든 준비를 다했다. 우리가 검증할 수 있는 모든 방법은 다 썼다고 자신 있게 말했다. 그렇다면 그들은 구체적으로 어떤 준비를 했을까? 아마도 세 가지 방향으로 준비를 했을 것이다. 첫째는 세계 최고 수준의 기보를 추가적으로 입력하지 않고 단지 자기 자신과의 수천만 번의 대국을 통해서 계속 학습함으로써 알파고의 정확도를 개선했을 것이다. 알파고는 쉬지도 않고, 자지도 않고, 지치지도 않고 학습할 수 있는 장점이 있다. 이 방법만으로는 이세돌 선수와 대결을 위한 준비가 충분하지는 않다고 필자는 생각한다. 그래서 두 번째는 알파고를 그야말로 세계 최고수로 만들기 위해서 아시아 최정상의 기보도 입력해서 학습했을 것이다. 모든 기계학습 알고리즘이 그러하듯이 알파고의 능력은 학습에 사용한 데이터(기보)의 양뿐만 아니라 질에도 좌우된다. 아시아 최정상의 기보를 바탕으로 학습한다면 그 수준이 훨씬 높아지는 것은 자명하다. 알파고는 덤 7집 반의 중국 룰에 맞춰져 있다. 그러니까 아시아 최정상 프로들이 인터넷에서 중국 룰로 대국한 기보를 바둑 포털 사이트에서 입수해서 입력했을 것이다. 알파고는 사람이면 1000년 이상 걸리는 100만 번의 대국을 몇 주 만에 지도 학습할 수 있으니까 지난 10월 이후에 지금까지 아시아 최고 수준의 기보를 바탕으로 수없이 지도 및 강화학습을 했을 것이다. 세 번째는 스파링이다. 이세돌 9단과 대결에 앞서서 최종적으로 이세돌 선수와 동등한 수준의 중국 기사들과 실전연습 대결을 가졌음이 틀림없다. 딥마인드가 이세돌 선수와의 대결에서자신 있다고 당당했던 확신은 바로 이 스파링에서도 압승했음을 입증한다. 알파고는 이 모든 준비를 끝내고 확신에 차서 이세돌에게 도전장을 내민 것이다. 겨뤄보려고 도전한 것이 아니라 그들이 이긴다는 것을 세계에 확인시키려고 서울에 온 것이다.

 

알파고를 만든 천재 과학자들

 

세렌디피티(serendipity)라는 말이 있다. 이 말은 우연으로부터 중대한 발견이나 발명이 이뤄지는 것을 의미한다. 알파고가 판후이 2단을 이긴 것은 정말로 대단한 일이다. 하지만 그런 대단한 승리가 우연히 이뤄진 것이 아니라 더 높은 상대인 이세돌 9단에 대해서도 반복 가능한 것인지를 확인하기 위해서는 <네이처> 논문의 저자들에 대해서 뒷조사, 즉 그들이 과연 지난 10여 년간 이 위대한 도전에 성공하기 위해서 어떤 노력과 연구를 했는지를 추적할 필요가 있었다. 우선 20명의 공저자 중에서 구글 딥마인드의 하사비스 대표에 대해서는 이미 매스컴에서 그의 천재성에 대해서 많이 다뤘기 때문에 언급을 생략하겠다. 하사비스 대표 외에도 알파고를 만드는 데 핵심적인 역할을 한 개발자들은 3명으로 압축된다. <그림 8>의 사진에 나타난 아자 황 박사는 이번 대결에서 알파고의 손 역할을 한 사람이다.

 

아자 황 박사는 박사 학위 논문도 몬테카를로 트리탐색에 대해서 썼을 뿐만 아니라 에리카(Erica)라는 최고 수준의 인공지능 바둑 프로그램을 개발한 사람이다. 그는 위대한 도전에 성공하기 위한 이론과 실무를 모두 갖춘 최고 적임자 중의 한 사람이다. 아자 황 박사의 최근 연구를 보면 2015 4월에 알파고의 정책망에 관한 논문을 발표했는데8 이미 작년 초에 알파고의 중요한 부분이 완성됐음을 알 수 있다. 이 논문의 공저자는 모두 4명인데9 이들 중에서 3명은 모두 딥마인드 소속이지만 한 연구자는 구글의 뇌 연구팀(brain research team) 소속인 수츠케버 박사다. 필자는 그가 알파고 탄생에 있어서 가장 핵심적인 역할을 했다고 생각한다.그는 29세의 나이에 MIT가 선정한 ‘35세 이하의 혁신가 35에 이미 뽑혔을 정도였는데 이미 석사 때부터 바둑에 대한위대한 도전에 중요한 첫발을 내딛는다. 그가 2008년에 쓴 논문은10 인공신경망을 이용해 아마고수들의 착수를 흉내는 것이었는데, 이는 인공신경망을 바둑에 적용한 최초의 논문이자 알파고의 정책망에 해당하는 것이다. 하지만 연구 결과는 그의 기대에는 미치지 못했다. 그 이유는 간단한 형태의 인공신경망을 사용했기 때문이었다. 수츠케버는 복잡한 형태의 인공신경망을 배우기 위해서 딥러닝의 대표격인 심층 인공신경망의 대가 제프리 힌튼 교수에게 가서 박사과정을 밟게 된다.

 

 

 

사실 인공신경망은 50년대부터 연구돼 왔지만 여러 기술적인 문제 때문에 암흑기를 거치고 있었다. 하지만 힌튼 교수는 어렵고 힘든 가운데서도 묵묵히 인공신경망 연구를 계속했고 2006년에는 드디어 기술적인 문제를 해결하는 방향을 제시한다.11 그리고 2012년에는 이미지 넷(ImageNet)에서 시행하는 시각인식 대회(ILSVRC)에서 힌튼 교수와 2명의 박사과정 학생으로 구성된(물론 수츠케버도 그 멤버 중의 하나다) 슈퍼비전팀은 심층인공신경망을 활용해 사진 판독의 오차율을 26%에서 16%로 무려 38%나 줄이는 획기적인 결과를 제시했다.12

 

이후에 심층 인공신경망은 각종 패턴 인식대회에서 발군의 성능으로 우승을 독차지하기 시작했다. 이들 3명은 심층인공신경망연구소(DNNResearch)라는 회사를 차리지만 이 회사는 곧바로 구글에 인수됐다. 이제 수츠케버 박사는 구글의 브레인 연구팀에서 본격적으로 위대한 도전을 하기 위한 준비상태가 됐다. 하지만 여전히 강화학습을 통해 스스로 실수로부터 배우는 기술은 부족한 상황이었다. 이 분야에서 세계 최고는 딥마인드라는 회사였다. 이 회사는 인공신경망과 강화학습을 이용해 인간처럼 실수를 통해 학습하는 비디오 게임 프로그램을 개발한 곳이다. 구글이 역시 딥마인드를 인수하려던 페이스북을 제치고 인수에 성공하게 된 것이 2014년 초였고 그때부터 수츠케버와 딥마인드는 위대한 도전에 박차를 가하게 된다.이 도전의 리더는 데이비드 실버 박사로 그는 지난 몇 년 동안 강화학습에 관한 논문만도 25여 편을 쓸 정도로 인공신경망과 강화학습의 대가다.(그림 10)

 

 

 

본격적으로 알파고를 개발한 지 1년 반 만에 지난 10월 판후이 2단과의 대결에서 압승을 한 알파고는 다시 6개월 만에 이세돌 9단도 이김으로써 위대한 도전을 성공적으로 마감하게 됐다. 알파고 개발에는 지난 10여 년에 걸쳐 이 위대한 도전을 성공하려는 많은 천재 과학자들의 노력이 최상의 조건에서 합쳐졌기 때문이라고 할 수 있다. 그래서 하사비스 대표는개발자들과 스태프들이 합심한 결과였다고 기뻐했지만 사실 이 성공의 배후에는 구글의 에릭 슈밋 회장이 있다. 슈밋 회장은 인공지능(기계학습)13 구글의 차세대 성장전략으로 정하고 인공지능의 신생 기업들을 쓸어 모으다시피 했다. 현재 기계학습 분야에 있어서 다양한 세계 최고 전문가의 50%가 구글 소속일 정도다. 그는 “앞으로 인공지능에서 무슨 혁신이 벌어진다면 그것은 모두 ‘구글이 이룬 것’이 될 것”라고 공언하기까지 했다. 바둑에 대한 위대한 도전도 슈밋 회장의 이런 성취욕에서 시작된 것이다. 그가 이번 대결의 전날 기자회견에 깜짝 등장한 것14 도 알파고 개발자들이 이 위대한 도전의 성공을 확신했고, 그 현장을 직접 눈으로 확인하기 위해서였을 것이다.그가 인사말에서결과가 어떻든 이 대결은 인류의 승리다(Whatever the result, the match is ‘a win for humanity’)”라고 했을 때 마치 (대결이 시작되기도 전에) 패자인 이세돌 9단과 우리를 위로하는 소리로 들릴 정도였다.

 

 

 

알파고 관련 이슈들, 그리고 오해

 

1)불공정한 대결?

일부에서는 이번 대결이 이세돌 선수에게는 애초부터 불공정한 것이었다는 주장이 있었다. 그 주된 근거는 1202대의 컴퓨터(CPU)와 싸우는 것은 마치 갑옷도 입지 않은 이세돌 선수에게 1202마리의 맹수가 달려든 격이라는 것이었다. 이런 주장은 문제의 핵심을 전혀 모르는 사람들의 어처구니없는 주장이다. 컴퓨터 1200대 정도만 필요한 도전이었다면 위대한 도전이 아니라 시시한 도전이었을 것이다. 사람들은 경우의 수가 암만 많더라도 직관을 이용해서 바둑에서 좋은 수를 찾아가지만 직관을 사용할 수 없는 컴퓨터는 계산을 통해서 좋은 수를 찾아가야 하는데 경우의 수가 너무 많고 평가함수 개발이 매우 어렵기 때문에 컴퓨터를 1000대가 아니라 100만 대를 갖고 온다고 해도 해결할 수 없는 문제다. 그래서 원래 문제 자체가동원할 수 있는 하드웨어를 다 동원해봐라! 그게 계산이 되나? 그래서 직관을 가진 사람을 이기기는 불가능하다!”였다. 이것은 하드웨어 문제가 아니라 소프트웨어의 문제다.페이스북도 자신들이 프로선수를 이기는 도전에 근접했다고 공언했지만 여전히 아마 6단 수준이다. 페이스북이 컴퓨터 1000대가 없어서 아직 성공하지 못하고 있겠는가?

 

2)비대칭 정보?

이세돌 선수가 세 번째 대국에서도 져서 스코어가 30이 되자 이 대국이 애초부터 이세돌 선수에게 불리한 대결이었다는 주장도 나왔다. 그런 주장은 우선시기부터가 잘못됐다. 그런 주장을 하려면 대결을 계약하기 전에 제기했어야지 대결 전엔이게 웬 떡이야하고 덥석 받아놓고서 막상 지게 되니까 그런 주장을 하는 것은 너무 궁색하다. 둘째, 그런 주장 자체도 틀린 것이다. 구글 딥마인드는 알파고가 이세돌 9단의 기보를 별도로 연구하지는 않겠다고 했다. 그 이유는 사실 하지 않겠다는 것이 아니라 할 수 없기 때문이다. 알파고가 사용하는 심층 인공신경망을 통한 학습은 엄청나게 많은 기보를 분석해서 승리를 보장하는 일관성 있는 패턴을 학습한다. 이세돌 9단이 많은 대국을 두기는 했지만 한국에서 둔 바둑들은 덤 6집 반 경기라 소용이 없다. 중국 룰로 진행된 국제대회나 중국 리그에서 이세돌 선수가 둔 경기를 다 모은다고 해도 기껏해야 1000대국도 되지 않을 것이고 이 정도는 빅데이터 시각으로 볼 때는 소용이 없을 정도로 적은 것이다. 따라서 알파고 측에서는 이세돌에 대한 정보가 하나도 없는 것이다. 반대로 이세돌 측에서는 <네이처>에 게재된 알파고에 대한 논문도 있고 판후이 2단과 두었던 5번의 기보도 있으니까 충분한 정보가 있었던 것이다. 문제는 알파고를 그다지 공부하려 하지도 않았고 근거도 없는 이세돌 선수의 일방적인 우세 분위기에 매몰됐던 것이다.

 

3)재대결 혹은 커제와의 대결?

당신이 구글의 회장이라면 이세돌 선수와 혹은 다른 선수와 또 대결을 하겠는가? 구글 측에서는 이 위대한 도전을 한 번에 성공했음을 이미 전 세계에 과시했다. 다른 선수와 다시 대결할 인센티브가 전혀 없다. 딥마인드는 우수한 인력을 더 이상 바둑에 배치하지 않고 다음의 목표인 스타크래프트 게임을 향해서 매진할 것이다. 하지만 구글이 거절하지 못할 제안을 한다면 가능할 수도 있다. 예를 들어 알파고와 한중일의 국가팀(나라별 5명의 대표선수)이 풀리그를 벌인다든지, 아니면 한중일 연합팀(각 나라 3명의 대표가 연합)이 알파고와 53선승제로 슈퍼매치를 벌인다든지 한다면 구글도 고려해볼 수는 있을 것이다.

 

4)선택적 지각의 문제!

심리학에는 선택적 지각(selective percep -tion)이란 개념이 있다. 이는 정보를 객관적으로 받아들이지 않고 자신이 듣고 싶은 것만 듣고, 보고 싶은 것만 선택적으로 받아들이는 것을 말한다. 이번 대결에서는 이런 선택적 지각이 집단적인 수준에서 나타났다. 알파고가 압승할 거니까 이세돌 선수가 1승이라도 하려면 철저하게 준비해야 한다는 필자의 경고는 대부분의 전문기사들이나 인공지능 연구자들에게는 바둑을 모르는 사람의 어설픈 예측으로 무시됐다. 이세돌 선수도 1패라도 한다면 이 대국에서 진 것으로 하겠다고 장담했고 사람들은 이번 대결에서 약 13억 원을 쉽게 챙기고 다음 도전에서 더 많은 돈을 챙기게 될 이세돌 선수를 행운아라고 부러워했다.실제 대국의 중계방송에서도 마찬가지 현상이 벌어졌다. 다음은 제2국 중계방송의 일부분이다.

 

이세돌이 유리한데요. 알파고의 수가 이해가 되지 않네요.

근데… 집을 막상 세어보니 알파고가 일리가 있네요?

 

(생략…)

 

그래도… 이세돌이 유리한데요. 알파고가 이해가 가지 않네요

이것은 명백한 실수, 오류입니다. 근데… 집을 막상 세어보니 알파고가 뒤지지 않고 있네요?

 

(생략…)

 

정말 이상합니다.… 이세돌이 졌어요. 그것도 갑자기 많이 차이가 나게….

 

실제 1, 2, 3대국의 중계방송에서는 계속 이세돌 선수가 유리하고 알파고는 실수를 연발하는 데도 마지막에는! 그런데 알파고가 이겼네요!”라는 어처구니없는 중계를 반복했다. 지피지기(知彼知己)의 교훈이 무시되는 싸움에서는 중계방송에서조차 낭패를 겪을 수밖에 없었다.

 

5)인공지능에 대한 우려

알파고가 인간의 고유한 영역이라는 바둑마저 침범하자 인간을 넘어서는 인공지능에 대한 우려의 목소리가 높아지고 있다. 하지만 결론적으로 말하자면 그런 걱정은 기우다. 현재의 인공지능은 아주 잘 정의된 작은 영역에서 문제를 푸는 약한 인공지능으로 이미 우리 주위에 깊이 침투해 있다. 이제 약한 인공지능은 우리의 삶을 윤택하게 하는 보조적인 도구로써 없어서는 안 될 중요한 역할을 하고 있는 것이다. 우리가 매일 하는 검색엔진에서부터 스팸메일 구분, ·오프라인에서의 책/영화/음악 등 각종 제품과 서비스의 추천 등이 바로 인공지능이 하는 일이다. 산업 전반에서도 복잡한 전자회로의 설계에서부터 시설의 배치, 운송 최적화, 예방 정비 등 운영의 효율과 생산성 증대 부문에서 뛰어난 성과를 올리고 있다. 미래학자 케빈 켈리는앞으로 로봇과 얼마나 잘 협력하느냐에 따라 연봉이 달라질 것이라고 말했다.이제 우리는 약한 인공지능이라는 도구를 유용하게, 그리고 현명하게 사용하려는 시각과 태도를 가져야 한다. 하지만 영화에서 많이 등장하는 인간 수준의 강한 인공지능이 탄생하려면 아직 넘어야 할 산이 많고 가야 할 길도 멀다. 필자는 영화에서 많이 등장하는 인간 수준의 인공지능이 현실적으로 실현될 가능성을 거의제로로 보고 있다. 모든 사람이 누구나 갖고 있는 지능이란 무엇일까? 지능의 실체는 너무 다양해서 제대로 정의하기 어렵다. 따라서 인공적으로 지능을 만들 수는 없다. 우리가 알지도, 파악하지도 못하는 것을 만들어낼 수는 없기 때문이다. 의학이나 과학 등이 매우 발달한 현재도 아직 우리가 인간 자체에 대해 알고 있는 것은 극히 제한적이다. 그렇기 때문에 인간이 지닌 섬세한 감정, 열정, 반사 신경 등 수많은 요소를 흉내내는 건 불가능하다. 영화는 픽션이니까 영화로 즐기면 되지 현실에서 일어날까봐 걱정할 필요는 없는 것이다. 알파고를 보라! 세계 최고수의 바둑을 두지만 자신은 바둑이 뭔지도 모른다. 아니, 자기 자신이란 것도 아예 없다. 바둑돌을 집어서 바둑판 위에 놓을 줄도 몰라서 아자 황이 대신 손 역할을 해서 돌을 집어서 놔주지 않았던가?

 

결어: 인공지능의 활용과 우리 기업의 대응

 

앞서도 잠시 언급했지만 인공지능의 비즈니스 활용법은 거의 무한에 가깝다. 수많은 비즈니스 기회를 제공하고 우리의 생활과 업무를 바꿀 것이다. 인공지능이바둑 하나에 매몰되는 게 아니라 이바둑 정복이라는 목적을 달성하기 위해 개발된 수많은 메커니즘이 곧바로 다른 영역에 활용될 수 있도록 확산될 것이기 때문이다. 이를범용(general purpose) 프로그램이라 한다. 인공지능에서 범용 프로그램이란 해당 문제뿐만 아니라 다른 문제를 해결하는 목적으로도 사용할 수 있는 프로그램을 말한다. 알파고는 범용을 지향하는 소프트웨어로써 바둑뿐만 아니라 다른 문제를 푸는 데도 쓸 수 있다. 사실 체스 챔피언을 꺾은 딥블루는 오직 체스만을 빠르게 두기 위해서 만들어진 컴퓨터였다. 딥블루로는 체스보다도 훨씬 쉬운 오목을 둘 수 없는 것이다. 마찬가지로 퀴즈쇼 제퍼디에서 우승한 왓슨 역시 음성을 인식한 뒤 엄청나게 빠른 정보처리능력을 바탕으로 질문과 답변의 형태에만 특화한 시스템이었다. 하지만 알파고는 사람처럼 경험을 통해서 학습해 문제를 효과적으로 해결하는 범용 프로그램이었고, 따라서 바둑을 두는 것 외에도 다른 문제를 해결하는 데 활용 가능하다. 사실 현실 세계의 많은 문제들은 바둑을 두는 것과 같은 특성을 가지고 있다. 너무 복잡하고 경우의 수가 너무 많아서 풀기가 불가능하게 여겨지는 문제들, 예를 들면, 기후 모델링, 복합성 질환 분석 등 다양한 문제를 푸는 데 알파고를 활용할 수가 있다.

 

구글, 페이스북, 마이크로소프, IBM 등의 글로벌 기업들이 인공지능에 적극적으로 투자하고 있는 이유는 명확하다. 빅데이터 시대의 화두는 기계학습을 통해 데이터 속에서 인사이트를 캐내는 것이라는 비전을 갖고 있기 때문이다. 한국 대기업들이 이 분야에 적극적으로 뛰어들지 않은 이유는 바로 이런 전략적 비전을 갖고 있지 않아서다. 더욱이 인공지능은 어떤 하나의 발견이나 기술로 해결할 수 있는 분야가 아니라 컴퓨터공학을 넘어 생명과학과 뇌 과학 등 여러 분야의 연구가 동시에 이뤄져야 한다. 따라서 인력 양성과 투자가 장기적인 관점에서 지속적으로 수행돼야 하지만 단기적인 ROI에 매몰돼 있는 우리 기업의 현실적인 상황에서는 ‘4차 산업혁명의 핵심 화두인 인공지능 분야에서 조연에 그치게 될 공산이 크다. 따라서 우리 기업들에게는 빅데이터와 기계학습이 새로운 전장(next frontier)이라는 명확한 인식과 분발이 요구된다.또한 인공지능의 발달에 필요한 생태계를 조성하려는 정부의 정책적인 노력과 지원도 시급하다.

 

김진호 서울과학종합대학원 빅데이터 MBA 주임교수 jhkim6@assist.ac.kr

 

김진호 교수는 서울대 경영대를 졸업하고 펜실베이니아대(Wharton School)에서 경영학 석사와 박사 학위를 받았다(통계학 부전공). 사회와 기업의 다양한 문제들을 계량분석적으로 접근하는 연구를 주로 했다. 저서로는등이 있으며, DBR ‘Power of Analysis’를 연재하고 있다. 최근 알파고와 이세돌 9단의 대국을 앞두고 많은 바둑 전문가들과 달리 알파고가 50으로 완승할 것이라고 예측해 주목을 끌었다. 또 실제 대국을 모 인터넷 방송을 통해 정확하게 중계하면서 화제의 중심에 섰다.

동아비즈니스리뷰 318호 Dynamic Workspaces 2021년 04월 Issue 1 목차보기