AI Impact: 인공지능 기술로 가치 만들기

AI도 이젠 ‘잘 쓰기’ 넘어 ‘좋은 일’에 써야

342호 (2022년 04월 Issue 1)

Article at a Glance

AI 기술의 수준이 많이 높아졌다. 자연어 처리 기술의 발전으로 AI가 높은 수준의 번역을 제공하고, 자연스럽게 대화를 이끌어가는 챗봇도 개발됐다. 동영상이나 이미지를 분석해 문맥을 익히거나 익힌 문맥을 바탕으로 이미지를 생성하는 패턴 인식 기술 역시 범죄 예측, 사고 예방 등을 위해 사용되고 있다. 디지털 전환을 위해 AI를 활용하기 위해서는 AI가 사람을 방해하거나 부차적인 인건비가 들게 해선 안 된다. 기술이 발전한 만큼 사회적 임팩트를 창출하는 데도 AI가 적극 활용돼야 한다.



주로 만나는 투자 실무자들과 스타트업 대표들에게서 가장 많이 듣는 질문이 있다. ‘현재 AI 기술이 얼마나 올라왔느냐’는 것이다. 뉴스 매체들은 벌써 몇 년 전부터 AI가 인간을 대체할 거라고 보도해 왔지만 막상 실무에서 쓰려고 보면 부족한 감이 많다. 빅테크 기업이나 대학 연구팀이 내는 성능은 매년 현재까지의 최고 수준(SOTA)을 경신한다는데 막상 피부에 와 닿는 기술은 여전히 인간만 못 하다. 게다가 AI 의사결정 결과물을 보면 여전히 편견 등의 문제가 많다는 지적이다.

결론부터 말하면, 사실 AI 기술의 수준은 많이 높아졌다. 지난 2월2일에 구글의 딥마인드1 와 OpenAI2 에서 각각 발표한 내용에 따르면 어떤 주제에 대해 코드를 짜는 프로그래밍 실력은 AI나 사람이나 비슷한 수준에 이르렀고 수학올림피아드 문제도 AI가 척척 풀이해 내는 정도가 됐다. 이것이 가능해진 것은 기본적으로 문제를 이해하는 기술이 그만큼 올라왔기 때문이다. 적어도 사람이 하는 말, 즉 자연어 이해(NLU, Natural Language Understanding)에서 높은 성과를 보이고 있다. 전문가들은 빠르면 2∼3년 뒤엔 AI가 코드를 짜거나 보고서를 써낸 것을 사람이 검토만 하면 되는 수준에 이를 것이라고 전망하고 있다.

문맥도 잘 알아듣고, 분위기도 잘 캐치한다

AI 핵심 기술이라는 분류로 크게 나눠 보면 언어 관련 기술과 패턴 인식 기술 정도로 나눠 볼 수 있다. 전자의 경우 사람이 쓰는 말(자연어)을 중심으로 발화와 문자를 이해, 분석하고 또 생성하는 기술들을 포괄한다. 패턴 인식의 경우 이미지 분석과 여러 종류의 신호 처리가 들어간다. 물론 AI와 얽힌 모든 원천 기술을 아우르는 분류라고 하기는 힘들다는 점, AI 서비스 단계에서 이 둘을 겨울 무 자르듯 가를 수 없다는 점은 한계가 있다.

흔히 NLP(Natural Language Processing)라 불리는 자연어 처리는 크게 자연어 자체에 대해 이해하는 기술과 자연어를 생성하는 기술 정도로 구분할 수 있다. 자연어에 대해 묶어서 ‘처리’라는 표현을 하는 건 자연어를 문자 그대로 말로 익힌다기보다는 하나의 수학적인 표현으로 옮겨 이를 기계가 충분히 활용할 수 있도록 만드는 과정임을 이야기하는 것이다. 벡터 공간에 펼쳐진 문자들은 저마다의 수치적 표현으로 변환돼 기계에 학습된다.

기계는 그렇게 자신이 이해할 수 있는 방식으로 각 단어를 객체화하고 그 객체들의 관계를 통해 의미를 파악한다. 동시에 자주 등장한다거나, 특정 순서가 반복된다거나, 긍•부정의 의미나 감정이 인코딩돼 있다 거나 하는 등의 여러 패턴과 결합해 단어들이 수놓인 문장과 문장들이 이루는 텍스트를 이해한다. 기계는 방대한 양의 단어 사전과 사람들이 써 온 여러 문서를 데이터로 심어 학습을 해 왔고 사람은 중간의 단어를 가려 두고 앞뒤 단어만 던져 가린 것을 알아맞히도록 기계에 지속적으로 문제를 냈다. 다단한 방법을 다루는 알고리즘들이 나와 높은 수준의 번역을 가능하게 했고 꽤 자연스러운 대화가 되는 챗봇을 만들어 냈다. 그리고 이 기술은 현재 우리가 무심코 쓰는 많은 번역 사이트와 고객센터 응대에서 보이지 않게 활용되고 있다.

세상을 더 잘 이해하게 하기 위해서
기계에 그림을 그리게 하다

패턴 인식 분야, 특히 동영상이나 이미지 분석에서는 문맥을 익히는 기술이 각광받고 있다. 사물이나 사람 같은 오브젝트 간 네트워크를 바탕으로 그래프를 그려내고 그 안에서 벌어지는 관계를 학습시키는 알고리즘이 주요 대학과 연구소를 중심으로 여러 이름이 달린 채 발표된다. 그 바탕에는 오브젝트 자체를 알아보는 정확한 인식이 필요하고, 그것이 무엇인지를 판단하는 인지가 필요하다. 연구자들은 이 장면 다음에 어떤 장면이 발생할 것인지를 예측하기 위해 수많은 동영상에 대해 텍스트와 장면을 대응하는 방식으로 네트워크 그래프를 그려왔다. 영화 속 인물의 관계를 예측하거나3 벌어지지 않은 태스크에 대해 어떤 행동이 이어질지 알아내기도 한다.4 실생활로 넘어오면 자율주행차 연구에서 보행자가 길을 건널 것인지, 아닌지를 문맥적으로 판단하는 접근 방법도 지속적으로 늘고 있다. 범죄 예측이나 사고 예방 같은 분야에서 알음알음 쓰이고 있다.

115


그렇게 익힌 문맥은 역으로 이미지를 만드는 데서도 쓰인다. 기계가 이미지를 생성해내는 것은 단순히 가상 인물을 생성하거나, 오래된 사진의 화질을 개선하거나, 혹은 그리기 귀찮은 일러스트를 대신 만들게 하기 위한 것에만 그치지 않는다. 2차원으로 찍힌 단면의 사진을 우리가 의식적으로 인식하는 객체로 만들려는 시도는 공간에 대한 의식을 기계에 부여하기 위한 행위라고도 할 수 있다.5 우리는 머그컵의 앞면만 보고도 뒷부분도 마찬가지로 둥글 것을 알고, 컵이 원형으로 생겼다는 것 또한 안다. 꼭 뛰어내려 보지 않아도 다이빙 보드부터 수면까지 이르는 높이가 상당함을 우리는 알고, 본능적으로 두려움을 느낀다. 객체와 공간에 대한 이해가 있기 때문에 우리는 위험을 감지하고 어디까지 손을 짚을지, 어느 정도의 힘을 주어 사물을 들 것인지를 결정한다.

116

텍스트를 기반으로 일러스트를 만들어내는 DALL-E의 탄생은 그 이름만큼이나 초현실적인 느낌을 준다.6 문장에 대한 이해를 바탕으로 적절한 그림을 그려내는 것인데 이를 위해선 기본적으로 ‘어떤 것이 이치상 맞는 그림인지’에 대한 학습이 돼 있어야 한다. 아기 펭귄이 파란 모자와 빨간 장갑을 꼈다는 문장에 대해 그림을 그리려면 기존의 자연법칙과 달리 펭귄이 충분히 의인화될 수 있다는 점이 학습돼야 한다. 움직임이 없는 식물에 대해서도 마찬가지다. 머리와 다리를 정해 튀튀를 입히고 심지어 강아지까지 끌고 다닐 수 있다는 식의 상상력 또한 부여돼야 한다. (그림 3) 아직 그 활용처가 정해지지 않았을 뿐 기술은 그렇게 공간에 대한 인식과 상상력에 대한 패턴을 꽤 높은 수준까지 익혔다.

117


“인간 수준까지 몇 프로 남았다”는 말이
무의미한 이유

신기한 기술들임에 분명하지만 그래도 실험실에서 잘 정제된 데이터를 가지고 모델링을 한 뒤 높은 성능을 보이는 것이 무슨 의미냐는 말도 많다. 기본적으로 실무에서 쓰기엔 현실 데이터가 무척이나 엉망이고 잘해도 성능이 그에 못 미친다는 것이 그 이유다. 그러다 보니 몇 년 전까지만 해도 실제 현장 활용까지 몇 퍼센트 정도 남았는지 어렴풋하게라도 지표화하는 것이 중요했다. 이를테면 음성 인식 기술은 성인 어른 수준 대비 60% 정도에 불과하다는 식으로 말이다. 그래야 바로 가져다 쓸 수 있다는 것이다.

그런데 요즘은 분위기가 바뀌고 있다. 기반 기술들의 수준이 어느 정도 궤도에 올랐고 그렇기 때문에 분야별로 어떻게 잘 가져다 맞춤형으로 바꾸어 쓰느냐가 관건이 됐다. 촬영한 이미지로부터 문자를 파악해내는 OCR 기술의 경우 해상도만 적당히 확보되면 거의 대부분의 글자를 추출해 낸다. 숫자를 읽어 문제 푸는 방법을 알려주는 쪽으로 발전시키는 경우도 있고 화면 내 문자들을 읽어 마케팅 도구로 쓰는 케이스도 있다. 기획을 통해 각자의 목적에 맞게 기술 성능을 더욱 올리는 것이다. 음성 인식의 경우에도 사람의 목소리를 주변 음(노이즈)으로부터 파악해내는 기술이 수준급으로 올라왔다. 고객 상담 내용이 중요하면 텍스트 변환 시 주요 키워드나 문장으로 옮길 때 더 나은 자연어 처리 기술을 도입하면 되고, 고객과 직원의 상호 감정 전달이 중요하면 특정 감성을 인식하는 시스템을 얹으면 된다. 기술에 대한 이해와 이를 바탕으로 한 기획이 더욱 중요해진 것이다.

기술의 도입은 결국 인건비 대비 비용이 높지 않고 자체적으로 성능을 올릴 수 있는 기반이 마련돼 있을 때 빛을 발하게 된다. 디지털 전환(Digital Transformation)을 위해 업무 용도로 가져다 쓰는 툴로서의 AI는 디테일 면에서 특히 사람을 방해하면 안 된다. 협업 모델로 들여올 것인지, 아니면 인력 대체 용도로 들여올 것인지에 대해서도 고민해야 한다. 인력을 대체하기 위한 용도로 들여왔다면 그것이 또 다른 인건비를 발생시키는 용도가 돼선 안 된다. 가령 문제집을 자동으로 만들어 놓고 그것을 사람이 도로 꼼꼼하게 검수해야 한다면 차라리 애초부터 사람이 문제집을 만드는 것이 더 나았을 수도 있기 때문이다.

사회를 위한 AI 임팩트

AI 기술은 각 분야에서 기획력을 바탕으로 맞춤형으로 활용될 수 있는 궤도에 올랐다. 국내외 할 것 없이 산업계에서는 위에서 이야기한 내용보다도 훨씬 더 많은 측면에서 AI 기술을 활용하고 있고, 그것으로 매출을 올리는 실질적인 이득을 보고 있다. 그러나 세상을 살아가는 사람들의 삶에 대해 AI를 활용해 무언가를 바꿔나가는 일은 여전히 제자리에 머물러 있다. 세계적으로 AI 기술을 활용해 문제를 풀려는 AI 임팩트에 대한 요구가 많아지고 있다. 그리하여 더 나은 세상이 올 수 있도록 하는 것이다. 해외에서는 학계와 시민사회를 중심으로 다양한 시도가 이어지고 있지만 여전히 산발적이다. 사회를 위한 AI(AI for Society)라는 기치로 미국에선 여러 대학과 기업이 묶여 임팩트를 내려는 시도를 지속하고 있다. 우리나라에서도 곳곳에서 움직임이 나타나고 있다. 이제는 AI로 돈을 버는 것을 넘어서서 임팩트를 내는 일이 대세가 될 것이다. 잘 써먹는 것만큼 좋은 일에 쓰는 것에도 관심을 가질 때다.


유재연 옐로우독 AI펠로우 jane@yellowdog.kr
동아비즈니스리뷰 345호 Fake Data for AI 2022년 05월 Issue 2 목차보기