똑똑한 인공지능 도시, 사람을 보호하라

인공지능 컴퓨팅

똑똑한 인공지능 도시, 사람을 보호하라

배영우 | 128호 (2013년 5월 Issue 1)

- 아티클
  
  스페셜 리포트 케이스 스터디
  경영전략/경영일반 인사/조직 마케팅/세일즈 리더십/자기계발 인문 AI/DT
  전체 기사 보기 호수별 Case Study HubENG audio DBR PDF 전체보기
- 구독
  
  월정액 서비스 연간 서비스 낱권 PDF 대량/법인
- 이벤트
  
  이벤트
- 고객센터
  
  공지사항 FAQ 1:1문의 이용권/상품권 인증
공유
스크랩

+ 새로운 폴더 생성
폴더명

메모입력

스크랩
아티클요약

인기 美 의학 드라마 ‘하우스(House M.D.)’는 성격 나쁜 괴짜 천재의사가 매회 다른 병을 가진 환자들을 치료하는 얘기다. 등장하는 환자들의 대부분은 상태가 심각해서 빨리 병명을 알아내고 적절히 치료하지 않으면 생명이 위험하다. 하우스 박사팀은 악화돼가는 환자의 상태를 관찰한다. 증상에는 어떤 패턴이 있기 마련이다. 이 패턴을 찾아내서 병명을 알아내고 환자의 죽음을 막아야 한다.

하우스 박사팀은 환자의 상태를 살피면서 팀 내 다양한 전공의 의사들이 가지고 있는 전문지식과 경험을 모은다. 이들이 가져오는 지식을 끊임없이 변화하는 환자의 증세와 연결해 하우스 박사 사무실에 있는 화이트보드에 써넣는다. 그리고 그 안에서 몇 가지 결정적인 단서를 찾아내 마침내 병명을 알아내고 환자를 치료한다.

드라마 속 얘기지만 실제로 종합병원에서 중환자를 치료하는 과정도 이와 같다. 의사의 경험과 판단이 환자의 생사를 가른다. 의사도 사람이니 실수를 한다. 또 모든 의사가 하우스 박사처럼 경험이 풍부하고 유능한 것도 아니다. 현대의학으로 충분히 치료할 수 있는 병인데도 병명을 파악하지 못해 못 고치는 경우가 있다. 만일 병의 진단을 의사가 아닌 컴퓨터가 한다면 어떨까? 인공지능 컴퓨팅 기술이 진보하면 이러한 하우스 박사팀의 역할을 대신할 수 있다. 인간의 기억력은 한계가 있다. 하지만 슈퍼컴퓨터는 매년 출간되는 수만 권의 의학 논문을 모두 저장할 수 있다. 환자의 증상과 의사들이 던지는 질문을 분석할 수만 있다면 수백 개의 알고리즘을 적용해 논리적으로 확률이 가장 높은 병의 원인과 치료법을 내놓는다. 물론 완벽하지는 않을 것이다. 가끔 어처구니없는 진단을 내기도 한다. 그럴 때는 의사의 역할이 필요하다. 인공지능 컴퓨터는 인간 의사들을 도울 수 있는 아주 강력한 분석도구가 된다.

‘빅데이터’라는 말처럼 데이터가 넘치는 시대다. 컴퓨팅 또한 새로운 패러다임으로 빠르게 전환되고 있다. 지금까지의 현대 비즈니스에서 컴퓨터의 역할은 빠른 계산 능력으로 업무를 단순 지원하거나, 아니면 매우 복잡하고 양이 많은 계산에 중점을 둬 왔다. 하지만 이제는 양상이 달라지고 있다. 계산만 빨리 하는 것이 아니라 인간의 언어를 이해해 필요한 정보를 수집하고 지속적인 학습을 통해 추론하고 가설을 세워 증명하는 인지능력을 갖춘 인지 컴퓨팅 시스템의 시대가 도래하고 있다. 가공되지 않은 자연언어 형태의 빅데이터를 엄청나게 빠른 속도로 분석해서 문제를 정확하게 해결할 수 있는 컴퓨터가 개발되고 있다.

인지 컴퓨팅 시스템의 기반이 되는 인공지능이 어디까지 도달했으며 기업들은 이를 어떻게 활용하는지, 앞으로 어떤 방향으로 갈 것인지, 그로 인해 예상되는 대비 방안은 무엇일지 살펴보자.

왓슨과 인간의 퀴즈 대결

체스나 장기 같은 게임에서는 컴퓨터가 사람을 심심치 않게 이기고 있다. 나올 수 있는 수가 매우 많기는 하지만 무한하지는 않기 때문에 연산능력이 빠른 컴퓨터라면 사람을 이기는 것이 불가능한 일이 아니다. 하지만 게임이 아니라 인간의 언어로 진행되는 퀴즈쇼라면 어떨까? 애플의 시리(Siri) 같은 프로그램도 아직 인간의 말을 완전히 이해하지는 못한다. 하물며 일부러 맞히기 어렵게 내는 퀴즈쇼에서는 컴퓨터가 인간을 이기기 힘들 것 같다.

이를 알아보기 위해 2011년 2월, IBM의 인공지능 슈퍼컴퓨터 ‘왓슨(Watson)’이 미국 최고의 인기 퀴즈쇼인 제퍼디(Jeopardy)에 출전했다. (그림1) 상대는 제퍼디쇼 역사상 가장 강력한 것으로 평가받는 우승자 2명이었다. 제퍼디는 역사, 문화, 예술, 팝 문화, 과학, 스포츠, 지질학, 세계사 등의 광범위한 주제를 다루는 유명한 TV 퀴즈쇼다. 에미상(Emmy Awards)을 총 28회 수상해 기네스북에 올라 있다. 하루 시청자 수만 무려 900만 명에 달하는 인기 프로그램이다.

이 제퍼디 퀴즈쇼에서 왓슨은 예상을 뒤엎고 역대 최고 상금 우승자 브레드 러터와 74회 연속 우승의 최다 연승 기록(74연승) 보유자인 켄 제닝스를 상대로 승리했다. 그냥 승리가 아닌 압도적인 승리였다. 왓슨이 7만7147달러를 벌 동안 두 인간 경쟁자는 2만 달러를 조금 넘긴 수준이었다.

왓슨은 슈퍼컴퓨터답게 3초에 약 2억 장 분량의 자료를 읽고 이해할 수 있다. 정말 놀라운 것은 이처럼 방대한 데이터를 서로 연결시켜 분석하는 능력이다. 퀴즈쇼를 지켜본 사람들은 왓슨이 분야를 가리지 않고 퀴즈를 풀고 사람의 말을 정확히 알아 듣고 대답하는 것을 보고 놀라워했다. 인터넷에 연결돼 있지도 않았다. 왓슨은 자연어 처리 기술, 가설 생성 및 검증 기술, 그리고 학습 기술의 세 가지 기술을 이용해 퀴즈 질문들에 3초 이내로 대답했다.

왓슨의 승리는 컴퓨터의 역사상 중요한 순간이었다. 필자는 사이버센터에서 근무하고 있는 IT 전문가와 인공지능에 대해 논의할 기회가 있었다. 그는 컴퓨터가 퀴즈문제에 답을 내는 것이 기술적으로 어렵지는 않냐고 얘기했다. 평소에 사람들도 인터넷 검색엔진을 통해 비교적 정답에 가까운 답을 찾을 수 있으니 컴퓨터가 퀴즈를 푸는 것이 대단한 일은 아닐 수 있다는 생각이다. 하지만 생각보다 쉽지 않다.

구체적인 예로 생각해 보자. 탐험가의 이름을 물어보는 퀴즈가 있다. 통상의 퀴즈가 그렇듯이 복잡한 사고를 통해 답변을 유추하는 과정 없이는 쉽게 답을 떠올릴 수 없도록 만들어졌다.

“1898년 5월에 포르투갈에서 이 탐험가의 인도 도착 400주년 기념일을 축하했다. 이 탐험가는?”

이 퀴즈 문장을 기존 인터넷 검색엔진으로 검색하면 무엇을 찾아올까? 사람들이 많이 찾는 인기 관련 정보부터 목록화해 보여줄 것이다. 이런 검색엔진 기술로 퀴즈의 답을 찾는다고 해보자. 만약 검색돼 나오는 정보 중 “5월에 간디는 포르투갈에서 기념일을 축하한 후 인도에 도착했다”라는 문장이 있다면 ’간디’를 정답으로 제시할 가능성이 매우 높다. 이렇듯 기존 키워드 매칭 검색으로는 복잡한 질문에는 대응할 수 없다.

반면 왓슨은 가장 관련성이 높은 정보인 “1498년 5월27일에 바스코 다 가마는 카파드 해안에 상륙했다”에서 답변을 찾아 ’바스코 다 가마’라고 정확히 대답한다. 이런 답변 도출이 가능하기 위해서는 세 가지 기술이 필요하다. 첫째, 질문에서 1989년 5월에 400주년을 맞는 사건이라면 1498년 5월에 이뤄진 것이라는 시간적 관계를 파악할 수 있어야 한다. 둘째, 카파드 해변이 지리적으로 인도에 속해 있음을 파악할 수 있어야 한다. 셋째, 질문에 나온 ‘도착’이라는 말과 검색해서 나온 정보에 들어 있는 ‘상륙’이라는 말이 여기서는 동일한 의미를 가짐을 알아야 한다.

즉, 퀴즈를 풀기 위해 컴퓨터는 시간적ㆍ공간적ㆍ언어적 추론과 의역을 할 수 있어야 한다. (그림2)

인간 언어를 이해하는 것이 어려운 이유

이미 많은 기업들이 컴퓨터를 이용해 인간의 의사소통을 분석하려 노력하고 있다. 대부분의 경우 이런 자연어(인간의 언어) 처리 시스템은 특정한 규칙의 범위 내에서 정밀도를 높이는 데 집중한다. 예를 들면 감성분석 기법은 블로그, 트위터, 페이스북, 싸이월드 등 소셜미디어 웹사이트 내에서 매우 구체적인 단어와 동의어의 집합을 저장해 놓고 해당 단어가 발견되면 이를 특정 브랜드에 대한 평판으로 바로 연계하는 것에만 집중한다. 즉 긍정, 부정, 중립 등과 같은 감정적인 표현의 데이터베이스를 얼마나 많이 구축해서 부합하는 단어를 잘 찾는가가 관건이다.

“오늘 아침 모닝 커피를 마시기 위해 ○○도넛에 들렀다, 정말 좋았던 것은…“이라는 문장을 어떤 소셜미디어에서 찾았다고 하자. 이때 ‘정말 좋았던 것은’이라는 긍정적 의미의 단어를 추출하고 이를 XX도넛의 브랜드 평가로 정의한다면 이 문장은 긍정적 평가로 기록될 것이다. 그런데 인간이라면 이어지는 문장의 내용이 궁금해진다. “…정말 좋았던 것은 ○○커피 전문점이 곧 회사 근처에 생기니까 더 이상 아침마다 도넛을 먹고 싶은 유혹 때문에 고민하지 않아도 돼서 정말 다행이다”라는 문장이 이어진다면 컴퓨터는 문맥 정보를 완전히 놓치게 된다. 이 정보는 사실 ○○커피 전문점이라는 경쟁 브랜드에 대한 긍정적 평가이고 XX도넛에 대해서는 부정적인 평가인데 컴퓨터는 사실에 정반대되는 결론을 내려버렸다.

초급단계(shallow)의 자연어처리(NLP) 시스템은 예로 본 바와 같이 매우 부정확한 결과를 얻을 가능성이 높다(물론 데이터가 충분히 많고 통계적 목적으로 사용할 경우 의미 있는 결과를 도출해낼 수는 있다). 이의 해결을 위해 고차원 수준의 정확도를 높이는 것을 고려해 설계된 다양한 문맥의 이해를 통해 질문을 재평가하는 시스템이 필요하며 이것을 심도 깊은(deep) 자연어처리 혹은 심도 있는 질문ㆍ응답 시스템이라고 부른다. 위에 소개한 왓슨이 바로 심도 깊은 자연어 처리 시스템이다. 문맥 분석은 질문을 분석할 때도, 해답을 찾기 위한 지식 데이터베이스 분석에도 활용된다.

왓슨이 제퍼디 퀴즈쇼 출전을 준비하는 동안 엔지니어들은 다음과 같은 질문을 시험 삼아 던져봤다.

15,000개의 아티클을 제대로 즐기는 방법
가입하면, 한 달 무료!

걱정마세요. 언제든 해지 가능합니다.

배영우

- (현) 한국IBM 연구소 실장
- 1991년 소프트웨어 엔지니어로 IBM입사
이 필자의 다른 기사 보기

이전 목록 다음

DBR의 교육솔루션

똑똑한 인공지능 도시, 사람을 보호하라

15,000개의 아티클을 제대로 즐기는 방법 가입하면, 한 달 무료!

15,000개의 아티클을 제대로 즐기는 방법
가입하면, 한 달 무료!