인공지능 컴퓨팅

똑똑한 인공지능 도시, 사람을 보호하라

128호 (2013년 5월 Issue 1)

 

 

인기 의학 드라마하우스(House M.D.)’는 성격 나쁜 괴짜 천재의사가 매회 다른 병을 가진 환자들을 치료하는 얘기다. 등장하는 환자들의 대부분은 상태가 심각해서 빨리 병명을 알아내고 적절히 치료하지 않으면 생명이 위험하다. 하우스 박사팀은 악화돼가는 환자의 상태를 관찰한다. 증상에는 어떤 패턴이 있기 마련이다. 이 패턴을 찾아내서 병명을 알아내고 환자의 죽음을 막아야 한다.

 

하우스 박사팀은 환자의 상태를 살피면서 팀 내 다양한 전공의 의사들이 가지고 있는 전문지식과 경험을 모은다. 이들이 가져오는 지식을 끊임없이 변화하는 환자의 증세와 연결해 하우스 박사 사무실에 있는 화이트보드에 써넣는다. 그리고 그 안에서 몇 가지 결정적인 단서를 찾아내 마침내 병명을 알아내고 환자를 치료한다.

 

드라마 속 얘기지만 실제로 종합병원에서 중환자를 치료하는 과정도 이와 같다. 의사의 경험과 판단이 환자의 생사를 가른다. 의사도 사람이니 실수를 한다. 또 모든 의사가 하우스 박사처럼 경험이 풍부하고 유능한 것도 아니다. 현대의학으로 충분히 치료할 수 있는 병인데도 병명을 파악하지 못해 못 고치는 경우가 있다. 만일 병의 진단을 의사가 아닌 컴퓨터가 한다면 어떨까? 인공지능 컴퓨팅 기술이 진보하면 이러한 하우스 박사팀의 역할을 대신할 수 있다. 인간의 기억력은 한계가 있다. 하지만 슈퍼컴퓨터는 매년 출간되는 수만 권의 의학 논문을 모두 저장할 수 있다. 환자의 증상과 의사들이 던지는 질문을 분석할 수만 있다면 수백 개의 알고리즘을 적용해 논리적으로 확률이 가장 높은 병의 원인과 치료법을 내놓는다. 물론 완벽하지는 않을 것이다. 가끔 어처구니없는 진단을 내기도 한다. 그럴 때는 의사의 역할이 필요하다. 인공지능 컴퓨터는 인간 의사들을 도울 수 있는 아주 강력한 분석도구가 된다.

 

‘빅데이터’라는 말처럼 데이터가 넘치는 시대다. 컴퓨팅 또한 새로운 패러다임으로 빠르게 전환되고 있다. 지금까지의 현대 비즈니스에서 컴퓨터의 역할은 빠른 계산 능력으로 업무를 단순 지원하거나, 아니면 매우 복잡하고 양이 많은 계산에 중점을 둬 왔다. 하지만 이제는 양상이 달라지고 있다. 계산만 빨리 하는 것이 아니라 인간의 언어를 이해해 필요한 정보를 수집하고 지속적인 학습을 통해 추론하고 가설을 세워 증명하는 인지능력을 갖춘 인지 컴퓨팅 시스템의 시대가 도래하고 있다. 가공되지 않은 자연언어 형태의 빅데이터를 엄청나게 빠른 속도로 분석해서 문제를 정확하게 해결할 수 있는 컴퓨터가 개발되고 있다.

 

인지 컴퓨팅 시스템의 기반이 되는 인공지능이 어디까지 도달했으며 기업들은 이를 어떻게 활용하는지, 앞으로 어떤 방향으로 갈 것인지, 그로 인해 예상되는 대비 방안은 무엇일지 살펴보자.

 

왓슨과 인간의 퀴즈 대결

체스나 장기 같은 게임에서는 컴퓨터가 사람을 심심치 않게 이기고 있다. 나올 수 있는 수가 매우 많기는 하지만 무한하지는 않기 때문에 연산능력이 빠른 컴퓨터라면 사람을 이기는 것이 불가능한 일이 아니다. 하지만 게임이 아니라 인간의 언어로 진행되는 퀴즈쇼라면 어떨까? 애플의 시리(Siri) 같은 프로그램도 아직 인간의 말을 완전히 이해하지는 못한다. 하물며 일부러 맞히기 어렵게 내는 퀴즈쇼에서는 컴퓨터가 인간을 이기기 힘들 것 같다.

 

이를 알아보기 위해 2011 2, IBM의 인공지능 슈퍼컴퓨터왓슨(Watson)’이 미국 최고의 인기 퀴즈쇼인 제퍼디(Jeopardy)에 출전했다. (그림1) 상대는 제퍼디쇼 역사상 가장 강력한 것으로 평가받는 우승자 2명이었다. 제퍼디는 역사, 문화, 예술, 팝 문화, 과학, 스포츠, 지질학, 세계사 등의 광범위한 주제를 다루는 유명한 TV 퀴즈쇼다. 에미상(Emmy Awards)을 총 28회 수상해 기네스북에 올라 있다. 하루 시청자 수만 무려 900만 명에 달하는 인기 프로그램이다.

 

 

 이 제퍼디 퀴즈쇼에서 왓슨은 예상을 뒤엎고 역대 최고 상금 우승자 브레드 러터와 74회 연속 우승의 최다 연승 기록(74연승) 보유자인 켄 제닝스를 상대로 승리했다. 그냥 승리가 아닌 압도적인 승리였다. 왓슨이 77147달러를 벌 동안 두 인간 경쟁자는 2만 달러를 조금 넘긴 수준이었다.

 

왓슨은 슈퍼컴퓨터답게 3초에 약 2억 장 분량의 자료를 읽고 이해할 수 있다. 정말 놀라운 것은 이처럼 방대한 데이터를 서로 연결시켜 분석하는 능력이다. 퀴즈쇼를 지켜본 사람들은 왓슨이 분야를 가리지 않고 퀴즈를 풀고 사람의 말을 정확히 알아 듣고 대답하는 것을 보고 놀라워했다. 인터넷에 연결돼 있지도 않았다. 왓슨은 자연어 처리 기술, 가설 생성 및 검증 기술, 그리고 학습 기술의 세 가지 기술을 이용해 퀴즈 질문들에 3초 이내로 대답했다.

 

왓슨의 승리는 컴퓨터의 역사상 중요한 순간이었다. 필자는 사이버센터에서 근무하고 있는 IT 전문가와 인공지능에 대해 논의할 기회가 있었다. 그는 컴퓨터가 퀴즈문제에 답을 내는 것이 기술적으로 어렵지는 않냐고 얘기했다. 평소에 사람들도 인터넷 검색엔진을 통해 비교적 정답에 가까운 답을 찾을 수 있으니 컴퓨터가 퀴즈를 푸는 것이 대단한 일은 아닐 수 있다는 생각이다. 하지만 생각보다 쉽지 않다.

 

구체적인 예로 생각해 보자. 탐험가의 이름을 물어보는 퀴즈가 있다. 통상의 퀴즈가 그렇듯이 복잡한 사고를 통해 답변을 유추하는 과정 없이는 쉽게 답을 떠올릴 수 없도록 만들어졌다.

 

1898 5월에 포르투갈에서 이 탐험가의 인도 도착 400주년 기념일을 축하했다. 이 탐험가는?

 

이 퀴즈 문장을 기존 인터넷 검색엔진으로 검색하면 무엇을 찾아올까? 사람들이 많이 찾는 인기 관련 정보부터 목록화해 보여줄 것이다. 이런 검색엔진 기술로 퀴즈의 답을 찾는다고 해보자. 만약 검색돼 나오는 정보 중 “5월에 간디는 포르투갈에서 기념일을 축하한 후 인도에 도착했다라는 문장이 있다면간디를 정답으로 제시할 가능성이 매우 높다. 이렇듯 기존 키워드 매칭 검색으로는 복잡한 질문에는 대응할 수 없다.

 

반면 왓슨은 가장 관련성이 높은 정보인 “1498 527일에 바스코 다 가마는 카파드 해안에 상륙했다에서 답변을 찾아바스코 다 가마라고 정확히 대답한다. 이런 답변 도출이 가능하기 위해서는 세 가지 기술이 필요하다. 첫째, 질문에서 1989 5월에 400주년을 맞는 사건이라면 1498 5월에 이뤄진 것이라는 시간적 관계를 파악할 수 있어야 한다. 둘째, 카파드 해변이 지리적으로 인도에 속해 있음을 파악할 수 있어야 한다. 셋째, 질문에 나온도착이라는 말과 검색해서 나온 정보에 들어 있는상륙이라는 말이 여기서는 동일한 의미를 가짐을 알아야 한다.

 

, 퀴즈를 풀기 위해 컴퓨터는 시간적ㆍ공간적ㆍ언어적 추론과 의역을 할 수 있어야 한다. (그림2)

 

 

 인간 언어를 이해하는 것이 어려운 이유

이미 많은 기업들이 컴퓨터를 이용해 인간의 의사소통을 분석하려 노력하고 있다. 대부분의 경우 이런 자연어(인간의 언어) 처리 시스템은 특정한 규칙의 범위 내에서 정밀도를 높이는 데 집중한다. 예를 들면 감성분석 기법은 블로그, 트위터, 페이스북, 싸이월드 등 소셜미디어 웹사이트 내에서 매우 구체적인 단어와 동의어의 집합을 저장해 놓고 해당 단어가 발견되면 이를 특정 브랜드에 대한 평판으로 바로 연계하는 것에만 집중한다. 즉 긍정, 부정, 중립 등과 같은 감정적인 표현의 데이터베이스를 얼마나 많이 구축해서 부합하는 단어를 잘 찾는가가 관건이다.

 

“오늘 아침 모닝 커피를 마시기 위해 ○○도넛에 들렀다, 정말 좋았던 것은…“이라는 문장을 어떤 소셜미디어에서 찾았다고 하자. 이때정말 좋았던 것은이라는 긍정적 의미의 단어를 추출하고 이를 XX도넛의 브랜드 평가로 정의한다면 이 문장은 긍정적 평가로 기록될 것이다. 그런데 인간이라면 이어지는 문장의 내용이 궁금해진다. “…정말 좋았던 것은 ○○커피 전문점이 곧 회사 근처에 생기니까 더 이상 아침마다 도넛을 먹고 싶은 유혹 때문에 고민하지 않아도 돼서 정말 다행이다라는 문장이 이어진다면 컴퓨터는 문맥 정보를 완전히 놓치게 된다. 이 정보는 사실 ○○커피 전문점이라는 경쟁 브랜드에 대한 긍정적 평가이고 XX도넛에 대해서는 부정적인 평가인데 컴퓨터는 사실에 정반대되는 결론을 내려버렸다.

 

초급단계(shallow)의 자연어처리(NLP) 시스템은 예로 본 바와 같이 매우 부정확한 결과를 얻을 가능성이 높다(물론 데이터가 충분히 많고 통계적 목적으로 사용할 경우 의미 있는 결과를 도출해낼 수는 있다). 이의 해결을 위해 고차원 수준의 정확도를 높이는 것을 고려해 설계된 다양한 문맥의 이해를 통해 질문을 재평가하는 시스템이 필요하며 이것을 심도 깊은(deep) 자연어처리 혹은 심도 있는 질문ㆍ응답 시스템이라고 부른다. 위에 소개한 왓슨이 바로 심도 깊은 자연어 처리 시스템이다. 문맥 분석은 질문을 분석할 때도, 해답을 찾기 위한 지식 데이터베이스 분석에도 활용된다.

 

왓슨이 제퍼디 퀴즈쇼 출전을 준비하는 동안 엔지니어들은 다음과 같은 질문을 시험 삼아 던져봤다.

 

 

 

 

Treasury Secy. Chase just submitted this to me for the third time - guess what pal, this time I’m accepting it.

(체이스 장관이 나에게 세 번째 제출했다 - , 친구, 이번엔 내가 어쩔 수 없이 받아들여야 하겠군)”

 

이 질문의 카테고리는링컨의 기록(Lincoln’s Blog)’이었다. 왓슨이 제일 먼저 알아차린 것은 “Secy”라는 단어였다. 이것은 Secretary의 약자로 비서를 칭한다. 여기까지는 쉽다. 다음이 문제다. 여기서 Secretary는 일정이나 업무를 보좌하는 비서의 의미로 해석하면 안 되고 ‘Treasury Secretary’, 즉 재무장관이라는 고유명사다. 왓슨은링컨 대통령이라는 문장은 없지만 제시된 카테고리가링컨의 기록이었고 재무장관이라는 직책과 관계가 있기 때문에 대통령 링컨을 말하는 것이라고 단서를 추정할 수 있다. 재무장관과 링컨 대통령 사이에 제출(submitted)하고 수락(accepting)하는 것은 과연 무엇일까? 답은사직서.

 

초등학교 5학년에게 위와 동일한 문제를 질문하자 학생의 답변이 걸작이었다. 어린 학생은 체이스 장관이 링컨에게 제출한 것은친구 요청이라고 답했다. 초등학교 5학년의 시대적, 경험적, 관심적 기준에서는 위의 문제가 링컨이란 사람의 블로그나 페이스북에서 이뤄진 세 번째의 친구요청, 더 이상 미안해서 더 이상 친구요청을 거절할 수 없는 상황, 사이버 삼고초려(三顧草廬)’로 받아들여졌다. (그림3)

 

 

 

이 대답은 두 가지 측면에서 매우 흥미롭다. 우선 소셜미디어가 다음 세대의 사회에 얼마나 깊숙이 자리잡았는지 알 수 있는 대목이다. 또 한 가지, 이러한 답변이 초급단계의 자연어 처리 시스템이 보이는 실수와 비슷하다는 점도 흥미롭다. 어른들, 그리고 심도 깊은 자연어 처리 시스템을 갖춘 컴퓨터는 인간처럼 블로그, 페이스북, 싸이월드 같은 소셜미디어는 19세기 후반에는 존재하지 않았다는 것을 이미 알고 있다. 인간이 선천적으로, 그리고 학습을 통해 어구들의 차이점을 인지하는 능력은 지난 40여 년 동안 인공지능 컴퓨터 연구자들의 주요 목표였다. 그리고 이제 초등학교 5학년 수준을 일부 넘어설 수 있는, 퀴즈쇼에서 우승할 수 있는 수준에 이르렀다.

 

컴퓨팅 패러다임의 전환

좀 더 깊이 들어가보자. 왓슨과 같은 고성능 인공지능 컴퓨터는 언어 속에 포함된 개별 단어들을 인지하기보다는 인간이 사용하는 언어적 특징을 이해하고 하나의 문장에 기반해 또 다른 문장을 추론하는 방식을 따른다. 질문이 처음 주어지면 질문의 핵심구문을 추출해내기 위해서 문법적으로 분석한다. 그런 다음 정답일 가능성이 있는 몇 가지 답들을 데이터베이스로부터 추출해내고 가설을 수립한다. 그리고 문법적으로 분석한 질문과 다양한 추론 알고리즘으로부터 추출해낸 답변들을 심도 깊게 비교 분석하게 된다.

 

이제부터가 어려운 부분이다. 각각 다른 종류의 비교를 수행해야 하는 추론 알고리즘이 수백 개가 있는데 이를 모두 검증해야 하기 때문이다. 그중 어떤 것들은 용어라든지 동의어의 매칭 분석이 필요하고 또 어떤 것들은 시간적, 공간적인 고려도 필요하며 어떤 것들은 문맥상에 존재하는 관련 정보를 다양한 각도로 조사한다.

 

수백 개에 이르는 각각의 추론 알고리즘에 대한 수백 개의 예상 답변들, 그리고 이들 각각에 대한 증거 자료, 증거 정황 등은 다시 수천 개에 이르고 이 수천 개의 증거와 수백 개의 예상답변, 그리고 질문의 조합으로 결국 수십만 개로 예상되는 각각의 경우에 점수를 할당한다.

 

수십만 개에 해당하는 조합들은 통계모델에 의해 추가적으로 가중치가 주어진다. 이는 두 개의 유사한 구절 사이에서 어떤 것이 더 정확한 추정이었는지에 대해 평가하는 통계모델이며, 최종 신뢰도의 척도로도 사용하게 된다. 결국 가장 높은 점수를 가진 단 하나의 예상 답변을 찾을 때까지 토너먼트 형태로 이러한 심도 깊은 분석을 통한 점수 부여(scoring), 가중치 부여(weighting), 통합(merging), 순위 매기기(ranking) 등을 반복해 최종적으로 가장 신뢰도가 높은 예상 답변을 결정하게 된다. 퀴즈쇼가 벌어지는 동안 컴퓨터의 머리 안에서도 자체 퀴즈쇼가 벌어지는 것이다. (그림4)

 

 

의료, 금융 분야 적용 가능성

퀴즈쇼에서 활약한 인공지능 컴퓨터를 현실 비즈니스에 적용시켜보면 어떨까? 우선 닥터 하우스가 일하는 곳 같은 종합병원을 상상해보자.

 

현재도 의사는 환자에게 의약품을 처방할 때 부작용이 무엇인지 알아보기 위해 데이터베이스를 찾아보기도 한다. 가령부프로피온의 사용을 금하는 신경질환은 무엇인가를 찾아본다면간질, 발작 장애, 거식증등의 답을 얻을 수 있다. 이는 오랜 시간 구축돼온 데이터에서 찾을 수 있는 결과다. 하지만 의사는 이런 식의 검색만으로는 병을 진단하고 처방을 내릴 수 없다.

 

예를 들어칠레의 인구는 얼마인가라는 질문에 컴퓨터는 쉽게 답을 찾을 수 있다. 그러나칠레와 가장 국경을 길게 맞대고 있는 나라는 어디인가라는 답변은 답하기가 어렵다. 이렇듯 우리 주변의 대부분의 지식은 데이터베이스에 맞게 정형화된 데이터로 축적된 것이 아니라 일상적으로 쓰는 언어, 비정형화된 자연어와 소리, 영상 등으로 축적돼 있다. 또 데이터의 양은 빠른 속도로 증가하며 최신 내용들이 계속 업데이트된다. 데이터 정형화, 데이터베이스화를 위해 많은 시간과 노력을 투자하고 계속 업데이트하는 것보다는 정형화되지 않은 자연언어로 된 정보를 분석할 수 있는 인공지능을 활용하면 비즈니스에 더 큰 도움을 받을 수 있다.1

 

왓슨의 성공 이후 이를 비즈니스에 적극적으로 활용하기 위한 수많은 시도가 있었다. 그중 세계적으로 유명한 암 센터인 메모리얼 슬로언 케터링(MSK) 암 센터는 2012 3월에 IBM과 파트너십을 맺었다. 미국의 경우에 암 초기 진단 시 오진율이 20∼44%에 달할 정도여서 인공지능 컴퓨터를 적용해 개선할 가능성이 높다고 판단한 것이다.

 

미국의 경우 암 치료에만 2010년에 2638억 달러를 지출했고 암 치료비 증가율은 전체 의료비 증가율의 세 배에 이른다. 이런 엄청난 지출에도 불구하고 암으로 인한 사망자는 계속 증가하고 있으며 치료에 성공하는 경우도 드물다. 의료정보는 5년마다 두 배씩 증가하고 있다. 또 종양학 분야의 발전 변화도 급속하게 진행되고 있어 의료진이 최신 정보를 보유하고 활용하려면 많은 노력이 필요하다. 실제로 의사가 내리는 판단의 20%만이 정보에 근거한다는 조사도 있다. MSK 암 센터는 종양학 전반에 걸쳐 치료율을 개선하기 위해 의학적 근거의 활용성을 높이는 방안을 찾아왔다. 이곳에서 인공지능 컴퓨터는 우선적으로 유방암과 폐암에 집중해 학습해 나가고 있다.

 

이 학습의 결과를 보여주는 동영상이 최근 공개됐다. 이 동영상에서 컴퓨터는 37세 여성의 4기 폐암 진단을 위해 종양전문 의사를 지원했다. 수십만 건의 책, 가이드라인, 의학 저널, 임상 문서를 조사해가며 이 환자의 전자의무기록상 정보를 평가하고 추론해 필요한 추가적인 진단테스트 및 추천 치료안을 제시했다.

 

인공지능 컴퓨터는 건강보험회사인 웰포인트(WellPoint)에도 취직했다. 맡은 업무는 국가의 건강보험 자료와 회사에 등록된 3420만 명에 달하는 환자 정보를 통합하고 이를 기초로 복잡한 의학적 치료법을 찾아내는 일이다. 질병 치료법을 제안하는 과정은 막대한 양의 자료를 분석하는 과정을 거친다. 여기에는 환자 차트와 의사나 병원이 갖고 있는 각종 질병 치료에 대한 기록, 보험회사가 가진 치료법과 시술 자료뿐만 아니라 컴퓨터 자체에 저장된 의료 논문까지 포함된다. 이런 자료는 계속 업데이트된다.

 

인공지능을 이용한 인지솔루션은 금융 분야에도 활용될 수 있다. 예를 들어 보자. 한 투자자가 A 제약사의 새로운 콜레스테롤 강화제 연구에 대한 기사를 읽었다. 그는 자신의 돈을 관리하는 금융전문가에게 A 제약사에 대한 투자 자문을 구한다. 금융전문가는 어떻게 행동할까? 그는 우선 CETP가 대체 무엇인지부터 알아내야 한다. 그런 다음에 잠재적 시장 가치를 파악한다. 이것이 끝나면 그는 CETP를 연구 중인 A 제약사와 그들의 잠재적 경쟁사들이 어디까지 연구를 진행했는지 조사해야 한다. CETP에 대한 연구 및 임상 실험이 어디까지 진행됐는지가 중요하다. 마지막으로 후보 회사 중 임상실험에서 가장 앞서서 상용화 가능성이 높고 다른 리스크가 적은 회사를 찾아낸다. 이러한 과정을 통해 금융전문가는 투자자가 문의한 A제약회사가 아닌 B제약회사를 근거에 기반해 추천할 수도 있다.

 

이러한 투자분석은 엄청난 시간과 노력, 경험이 필요하다. 금융전문가들이 많은 보수를 받는 이유이기도 하다. 만일 인공지능 컴퓨터가 도입된다면 위에 나온 정보들을 인지적으로 분석해 실시간으로 원하는 답변에 도달할 수 있다. 금융전문가의 할 일이 줄어든다. 금융산업의 구조 자체가 바뀔 수도 있다.

 

 

 

 

인공지능으로 똑똑해지는 도시

인공지능 컴퓨터는 스마트시티(smart city)2 에도 활용 가치가 높다. 스마트시티는 IT 기반 기술을 도시 규모로 도입해 청정한 환경에 지속 가능한 생태계를 유지하고 효율적으로 운영하는 현대 도시다. 스마트시티 IT 시스템이 다뤄야 할 영역과 데이터는 그 규모가 도시만큼 크다. 스마트시티의 대규모 시스템에서 생성되는 방대한 양의 데이터는 네트워크를 타고 다양한 소스에서 쏟아져 나온다. 이러한 방대한 데이터는 실시간 관측과 제어가 가능한 지능형 네트워크 시스템에서 대단위 모델링을 사용해 예측 분석돼 적절한 조치가 취해져야 한다. 그리고 스마트시티 시스템상의 통제 요소들이 자율적이면서도 필요할 때는 중앙집중적으로 기능해야 한다. 기후, 생태계, 에너지, 재해, 보안 등에 위협이 되는 상황에 대응할 때 특히 그렇다. 고성능 인공지능 컴퓨터는 이러한 대규모 데이터의 분석과 실시간 대응이 가능하다. 그리고 경험했던 사안을 지속적으로 학습해 변화된 상황에 맞춰 추론하고 분석한다.

 

결론: 언어를 이해하는 것은 단지 시작에 불과하다

컴퓨터 공학자들은 인간과 같이 생각하고 이를 전달할 수 있으며 나아가 인간이 할 수 있는 것보다 훨씬 더 많은 양의 정보를 엄청나게 빠른 속도로 분석해 문제를 정확하게 해결할 수 있는 시스템을 인지시스템이라고 정의한다. 이러한 시스템에는 언어를 이해하는 능력 이외에도 가설을 만들고 이를 테스트해보는 능력, 언어를 분해하고 거기서 추론을 만들어 낼 수 있는 능력, 유용한 정보(예를 들어 날짜, 장소, 가치 등)를 추출하고 평가할 수 있는 능력이 들어간다. 인지시스템은 질문에 답을 할 수 있도록 도울 뿐 아니라 한 번도 인지되지 못했던 통찰력들을 역으로 찾아내기도 하고 의사결정을 하는 데도 도움을 준다. 나아가 미래의 인지시스템은 언어를 인지하는 것뿐만 아니라 보고, 듣고, 느낄 수도 있어 기본적인 환경을 인식하고 모양을 인식하며 변화를 감지할 수도 있어 어떤 원인에 대해서 더 뛰어나게 정황을 포착하고 추론할 수 있는 능력을 가지게 될 것이다. 이를 통해 컴퓨터가 단순한 업무를 지원해서 인간의 효율성을 높여주기 위해 존재하는 시대를 뛰어넘어 인간이 하고자 하는 것을 더욱 더 현명하게 할 수 있도록 도움을 주는 새로운 시대가 열릴 것이다.3

 

그렇다면 인공지능 컴퓨터를 통해 우리는 무엇을 기대할 수 있을까.

 

지금 세계는 매일 2.5 퀀틸리언 바이트(25억 기가바이트)나 되는 엄청난 데이터를 쏟아내고 있다. 이들 데이터의 80%는 자연어 텍스트, e메일, 동영상, 비디오, 트윗 등 일반 컴퓨터가 분석할 수 없는, 구조화되지 않는 데이터다. 기업들은 이미 이 거대한 데이터 속에 풍부한 정보와 통찰력이 있다는 것을 알고 있다. 또 이 방대한 데이터를 활용해 문제를 해결하려 하지만 이 정보들을 구조화시키고 병렬하는 데도 엄청난 노력과 시간을 투자해야만 한다는 것 역시 안다. 정보량이 사람이나 기업이 감당할 수 있는 수준 이상이 되면 이를 해결하기 위한 비용은 기하급수적으로 늘어난다.

 

인공지능 컴퓨터는 다양한 산업에서 가지고 있는 데이터들을 엄청난 속도로 처리해 주요 의사결정자들을 도울 수 있을 것이다. 세계 최대 금융회사인 시티그룹은 인공지능 컴퓨터를 이용해 고객응대 업무를 도울 방법을 찾고 있다. 방대한 금융정보와 경제상황, 소비자들의 수요 등을 실시간으로 분석해 소비자들에게 알맞은 금융상담을 해주는 전략이다. 시티그룹 사례 같은 CRM 분야뿐 아니라 ERP, SCM 등 기업의 핵심 IT 시스템이 모두 획기적으로 변할 수 있다. 기업 간의 경쟁구조도 달라진다. 기존의 ERP, SCM, CRM과 같은 IT 시스템은 계산 패러다임에 기반해 구현됐다. 그래서 먹기 편하게 구조화된 데이터만 활용할 수 있으며 정적으로 프로그래밍된 알고리즘과 응용프로그램으로 돌아간다. 이러한 시스템을 운영하면 어떤 기업이든지 비슷비슷한 결과를 산출한다. 반면 인공지능 컴퓨터를 활용하게 되면 같은 시스템을 도입해 운영하더라도 그 기업의 비즈니스 경험, 즉 축적된 비즈니스 데이터에 따라 차별화된 상이한 결과를 얻을 수 있다. 이것은 같은 ERP, SCM 시스템을 쓰더라도 어떤 데이터를 얼마나 축적해서 소유하고 관리했느냐에 따라 비즈니스 성과가 확연히 달라지게 되는 것을 의미한다.

 

인공지능 컴퓨터 시대에는 기업 경쟁의 패러다임이 크게 바뀔 것이라 전제하고 그에 맞게 대비해야 한다. 먼 미래에 그 패러다임이 어떻게 변할지는 예측하기 힘들지만 우선 가까운 미래에 대비하기 위해 필자는 다음의 세 가지 대비책을 제안한다.

 

첫째, 양질의 데이터 확보다. 위에서 말했듯 인공지능 시대에는 보유한 데이터의 양과 질에 따라 성과가 천지 차이로 갈릴 수 있다. 그런데 지금과 같이 꼭 정형화된 데이터만을 수집할 필요는 없다. 물론 정확도가 높으면 좋지만 비정형 데이터도 빠른 분석이 가능해지기 때문이다. 병원인 경우는 임상정보, 금융기관은 모든 금융상담과 투자결과가 다 포함된다.

 

둘째, 장기간에 걸쳐 축적된 데이터에서 모래사장에서 바늘을 찾듯 숨겨진 통찰력을 찾을 수 있는 분석능력을 갖춰야 한다. 미국의 MSK 암센터는 이 단계에 특히 중점을 뒀다. 기존에 축적한 방대한 임상정보시스템의 데이터 및 진단결과 기록으로 심도 있고 다양한 분석을 통해 새로운 치료법을 찾고 있다.

 

셋째, 장기간 축적된 분석 정보에 기반한 통계 모델링을 통해 예측 분석을 하고 이에 기반해 비즈니스 결정을 내릴 수 있는 시스템을 갖춰야 한다. 미국의 세튼 헬스케어 패밀리(Seton Healthcare Family)는 퇴원 환자가 30일 이내에 상태 악화로 다시 입원하게 되는 재입원율을 줄이기 위한 시스템을 마련했다. 임상기록과 치료 결과를 통계 모델링해 재입원 가능성을 예측한다. 그리고 이를 병원 운영에 적극 반영한다.

 

이상의 세 가지는 단기적인 대비책이다. 인공지능 시스템이 실생활에 깊게 적용되기 시작하면 지금으로서는 상상하기 힘든 변화가 생길 것이다. 인공지능 컴퓨터를 스마트폰에서 개인비서로 사용하는내 손안의 왓슨이 현실화되는 시기도 그리 멀지 않다.

 

배영우 한국IBM 연구소 실장 ywpae@kr.ibm.com

필자는 고려대를 졸업하고 동 대학에서 MBA를 취득했다. 1991년 소프트웨어 엔지니어로 IBM에 입사해 시스템 소프트웨어, 음성인식 기술, 텔레매틱스, 헬스케어 솔루션 등을 연구했다. 한국IBM 연구소에서 기술선도솔루션 연구개발 팀장을 거쳐 현재 기술영업 혁신팀장으로 재직 중이다.

 

 

동아비즈니스리뷰 334호 세계관의 세계 2021년 12월 Issue 1 목차보기