Data Science in Practice

위기 상황에서의 AI… “활약했다” vs. “역할 없었다”

298호 (2020년 6월 Issue 1)

Article at a Glance

코로나19라는 전 세계적 대재앙에 대응하는 과정에서 인공지능(AI)이 특별한 역할을 하지 못하면서 AI에 대한 회의론이 고개를 들고 있다. 뭐든지 척척 해결하는 만능 기술인 줄 알았더니 정작 수십만 명이 죽어 나가는 상황에서 별다른 힘을 쓰지 못한다는 것이 회의론의 골자다. 하지만 이런 비관론 속에서도 AI는 코로나19 해결에 나름의 역할을 하고 있다. 또한 AI가 지금 당장 해결책을 제시할 순 없지만 전 세계에서 코로나19와 관련된 연구가 계속되고 데이터가 쌓이고 있다는 점이 고무적이다. 어느 정도 패턴이 드러나면 이후 코로나19 확산 방지를 위한 예측에 AI가 큰 공헌을 할 가능성이 높다.

코로나19 사태를 겪으면서 인공지능(AI) 기술에 대해 비판적인 목소리가 나오고 있다. 뭐든지 척척 해결하는 만능 기술인 줄 알았는데 정작 수십만 명이 죽어 나가는 상황에서 별다른 힘을 쓰지 못한다는 지적이다. 실리콘밸리에서는 소프트웨어 거품 때문에 막상 사람 목숨 구할 ‘마스크 한 장’ 제대로 찍어낼 제조업만 사라졌다는 자조 섞인 목소리도 나왔다.1 CNBC는 딥마인드나 오픈AI, 페이스북AI와 마이크로소프트 같은 거대 AI 기업들이 이번 사태 내내 제대로 두각을 드러내지 못하고 있다는 점을 꼬집기도 했다. 2

111

나름대로 역할을 해내고 있는 AI

그렇다고 AI가 코로나19 해결에 아무런 도움이 되지 않은 것은 아니다. MIT테크놀로지리뷰에 따르면 AI 시스템 기업인 블루닷(BlueDot)을 비롯해 샌프란시스코의 메타바이오타(Metabiota) 등의 업체가 지난해 12월 중국 우한에서 시작된 코로나19의 대유행을 예측했다.3 뉴스와 공공 헬스케어 리포트에 대한 자연어 분석과 사람들의 해외 이동 데이터 연구를 함께 진행해 질병이 퍼져나갈 수 있음을 경고했다는 것이다. 이는 2013년에 구글이 독감을 분석한 사례와도 꽤 흡사한데, 그때보다도 데이터의 노이즈를 줄이고 정확도를 높이는 비지도 학습(Unsupervised Learning) 방법이 발달했기 때문에 정확도도 한결 높아졌다고 한다.

바이러스의 실체를 드러내는 연구에서도 딥러닝이 활용된 것으로 알려졌다. 한국의 김빛내리, 장혜식 교수 연구진이 세계 최초로 분석한 코로나19의 RNA, 즉 SARS-CoV-2 전사체 연구를 보면 다량의 데이터를 토대로 한 프로그래밍이 유효하게 쓰였다. 4 공개된 해당 프로그램 코드를 보면 텐서플로와 같은 딥러닝 프레임워크가 쓰인 것도 눈에 띈다. 5 이처럼 빅데이터와 딥러닝을 활용한 프로그래밍은 전보다 빠르게 질병의 원인과 의학적 대처를 할 수 있는 기회로 작동할 수 있다.

AI에 대한 비관론 속에서도 이처럼 AI는 코로나19 사태 해결을 위한 나름의 역할을 해내고 있다. 지난 5월4일 가트너는 ‘AI가 코로나바이러스로 인한 팬데믹 동안 정부와 보건의료 부문 CIO들의 의사결정을 도울 수 있는 다섯 가지 분야’를 소개하기도 했는데 내용은 다음과 같다. 6

111_2

구체적으로는 AI 기술 자체가 바이러스의 전파를 자동으로 추적하는 데 유리한 방법인 만큼 유행병 여부를 미리 알아차리는 데 탁월하다고 연구진은 말한다. 그뿐만 아니라 사회/경제적으로 임팩트가 큰 ‘사회적 격리’ 같은 결정을 내림에 있어서도 AI의 인간행동 분석 등이 주요한 역할을 해낸다고 설명한다.

또 환자 개개인에 대해 그 예후를 모델링하는 데도 AI가 기여할 수 있다. 조직, 나아가 국가적으로는 의료 자원을 관리하고 대처하는 데 있어 AI 분석이 용이하게 쓰일 수 있으며, 제약 분야 R&D에서도 AI를 활용해 수천 건의 보고서를 분석하고 데이터 간 연계를 통해 바이러스 대책을 세울 수 있을 것이라고 전망했다. 이 가운데 이번 사태에서 실제로 현장에서 쓰인 것이 얼마나 되는지는 아직 명확하게 밝혀진 바가 없다.

112_1

데이터가 있어야 AI도 일할 수 있다

여러 가능성에도 불구하고 이 모든 것은 사실 데이터가 있어야 가능한 일이다. 말인즉슨, 상황이 한 건이라도 발생하기 전, 완벽한 제로 상태에서부터 어떤 일이 벌어질지 파악할 수는 없다는 것이다. 이는 인간의 경우도 마찬가지다. 따라서 AI를 활용한 ‘선제적 조치’를 원한다면 두 가지를 생각해야 한다. 우선, 한 번 벌어졌던 상황에 대해서는 초기부터 완벽하게 대처할 수 있도록 AI를 훈련해 둬야 한다. 그리고 생각지도 못한 새로운 상황이 벌어진다면, 위에서 언급한 바와 같이 ‘ 조기 예측’을 목표로 해야 할 것이다.

혹시 여름을 지나 가을에 코로나19가 다시 한반도를 위협한다면 그때는 지금의 데이터 분석이 방역에 꽤 도움이 될 수 있다. 가장 대표적인 근거로 런던 콜레라 질병 지도 사례를 들 수 있다. (그림 2) 1849년 영국에서 콜레라 유행 시기에 의사 존 스노가 런던 브로드가의 콜레라 사망자 발생과 인근 우물의 정보를 지도에 찍어 분석했다. 그리고 이를 시각화해 분석한 내용을 토대로 콜레라가 오염된 물을 통해 옮는 수인성 질병이라는 사실을 밝혀냈다.7 이때의 지리정보(GIS)와 인구정보(Demographics)를 결합한 데이터 분석은 현재의 빅데이터 분석 교과서들에도 수록되고 있다. 데이터 수집, 정제, 분석의 일종의 ‘표준’을 보여주는 사례다.

112_2


코로나19의 대응 역시 여기서부터 출발해야 한다. 데이터를 모으고, 분석하는 작업이 절실하다. 이는 바이러스의 원인과 전파 예방을 막는 것에 크게 기여할 것이다. 요즘은 전 세계적으로 민간뿐 아니라 공적 영역에서도 코로나19 발생 관련 데이터를 꾸준히 공유하고 있다. 국내에서 처음으로 데이터를 공유한 이들은 한양대 연구진인데 질병관리본부의 데이터를 공학자들이 프로그래밍하기 좋게 정제해 깃허브(github)와 캐글(Kaggle)에 올렸다. (그림 3) 관련 데이터 공모전들도 슬슬 생겨나고 있다. 얼마 전에는 과학기술정보통신부에서 AI허브(aihub.or.kr)를 통해 포스트 코로나 AI 챌린지 공모전을 공고했는데, 전 세계 질병 관련 뉴스데이터와 KT의 가입자 로밍 통계 데이터를 참가자들에게 공유한다고 한다. 이를 토대로 해외 감염병의 국내 유입 위험도를 산출하는 모델링을 개발하게 한다고 한다.

113


만에 하나, 코로나19처럼 전무후무한 질병이 또다시 전 지구를 덮친다면 어떻게 해야 할까. 이때는 투명성과 속도가 아주 중요하다. 전 세계가 함께 투명하게 데이터를 공개하고 축적해서 분석 가능한 정도의 데이터를 빠르게 모으는 노력이 선행돼야 할 것이다. 진단 키트가 부족해 검사를 하지 못하는 나라에 대해서도 빠르게 검사 기기를 보급해야 한다. 인류 모두를 위한 AI일수록 어느 한 나라라도 그 상황이 누락돼선 안 되기 때문이다.

이 모든 것이 이뤄진다면 AI의 ‘빠른 조치’는 가능할까?

AI는 꽤 많은 일을 할 수 있다. 어느 정도 데이터가 쌓일 때까지 기다려야 하는 한계는 있지만 어느 정도 패턴이 생겨나면 이후 예측에 꽤 도움을 줄 수 있다. 다른 분야의 예측 기술들을 차용해 올 수도 있을 것이다. 영화나 드라마 시나리오의 다음 내용을 AI로 하여금 선제적으로 만들어내도록 하는 기술이나,8 어떤 스타일이든 음악 앞부분이 주어진다면 인간처럼 곡을 끝까지 완성해 내고야 마는 AI 음악 생성기라거나 9 또는 상대방의 포즈를 순간적으로 알아차리고 탁구공을 실시간으로 받아칠 수 있는 프로그램 10 같은 연구들이 전혀 다른 데이터 분석에도 새로운 아이디어를 불어넣어 줄 수 있다.

다만, 극도로 혼란스러운 시기에는 공공 이슈들에 대해 사회적 의견이 부딪는 순간들 또한 참 많다는 것을 우리는 경험했다. 이런 상황에서 AI는 꽤 냉정하고 객관적인 판단을 제시해 줄 수도 있을 것이다. 국가 예산을 굴리는 일을 짜거나, 특정 물품의 수요와 공급을 조정하거나, 인력을 배치하는 일들에서 말이다. 코로나19 정국에서 실제로 이러한 AI 분석, 또는 각종 통계분석 방법들이 현장에서 쓰였을지도 모른다. 어찌 됐든 그에 대한 해석과 논리적 반영과 정치적 판단은 최종적으로는 인간의 몫이다. 위기 상황에서의 AI 역할은 결국 사용하는 사람의 의지에 달려 있다.


필자소개 유재연 서울대 융합과학기술대학원 연구원 you.jae@snu.ac.kr
필자는 서울대 융합과학기술대학원에서 석사 학위를 받고 동 대학원에서 박사 과정에 재학 중이다. 인간과 컴퓨터 상호작용(HCI) 분야에서 데이터사이언스를 공부하고 있고 그중에서도 미디어 영상 데이터를 활용한 딥러닝 연구를 진행하고 있다. 진학 전까지 언론인으로 일했다.
동아비즈니스리뷰 306호 Gender at Work 2020년 10월 Issue 1 목차보기