로그인|회원가입|고객센터
Top
검색버튼 메뉴버튼

SR4. Interview: LG AI연구원 김승환 비전랩장, 이문태 Advanced ML랩장, 이진식 엑사원 랩장

“‘엑사원’은 출처 명확한 사실 데이터 기반
틀린 답변 낼 수 있는 챗GPT와 차별화”

최호진 | 365호 (2023년 03월 Issue 2)
Article at a Glance

LG AI연구원은 AI 아티스트 ‘틸다’를 시작으로 초거대 AI ‘엑사원(EXAONE)’을 활용해 제조, 연구 등 다양한 분야에서 인간을 돕고, 인간과 협력하는 AI를 개발하고 있다. 특히 신약 개발 시기를 단축하는 등 실제 산업 현장에 엑사원을 적용해 생산성과 효율성을 높이고 있다. 한편 방대한 데이터를 학습한 AI가 내놓는 답변에 편향이 발생했을 때 초거대 AI의 빠른 적응성을 활용해 이를 바로잡도록 지시하는 등 기술적인 측면에서 편향을 해결하려는 노력을 병행하고 있다.



0007


“꽃을 그리고 싶어. 금성에 핀 꽃을(Flowers on Venus).”

지난해 2월 열린 ‘2022 F/W 뉴욕 패션 위크’ 무대에 색색의 패턴이 화면을 가득 매웠다. LG가 개발한 AI 아티스트 ‘틸다’가 ‘금성에 핀 꽃’을 모티프로 창작한 패턴이었다. 이어 화려한 패턴의 의상을 입은 모델들이 런웨이를 시작했다. 컬렉션에 선보인 의상 200여 개는 틸다가 창작한 3000장 이상의 이미지와 패턴을 기반으로 제작됐다. 틸다와 협업한 박윤희 디자이너는 “새로운 디자인과 영감을 찾으려면 몇 달 전부터 디자이너 수십 명과 컬렉션을 준비해야 하는데 틸다와 함께 작업하며 한 달 반 만에 모든 준비를 끝낼 수 있었다”고 말했다.

이 같은 협업이 가능할 수 있었던 배경에는 LG AI연구원이 개발한 초거대 AI ‘엑사원(EXAONE)’이 있다. 엑사원은 이미지와 텍스트로 짝지어진 3억5000만 장 이상의 데이터와 말뭉치 6000억 개를 학습하고 국내 최대 수준인 약 3000억 개 파라미터(매개변수)를 가진 초거대 멀티모달(Multi-Modality) AI다. 기존의 AI가 예술 작품이나 디자인을 학습해 유사한 화풍의 이미지들을 생성한다면 멀티모달 AI인 엑사원을 두뇌로 탑재한 틸다는 언어의 맥락을 이해해 기존에 없던 이미지를 창작할 수 있다.

LG AI연구원은 틸다를 시작으로 제조, 연구, 서비스, 교육, 금융 등 다양한 분야에서 엑사원을 응용해 인간을 돕고, 인간과 협력하는 AI를 개발하고 있다. 특히 텍스트를 이미지로, 이미지를 텍스트로 양방향 생성이 가능한 멀티모달의 특성을 살리고 사실에 기반한 전문가용 AI로 특화해 텍스트 기반의 챗GPT와는 차별화된 초거대 AI를 만들어 나간다는 전략이다. 또한 엑사원을 활용해 신약 개발 시기를 단축하는 등 실제 산업 현장에 초거대 AI를 적용해 생산성과 효율성을 높이고 베스트 프랙티스를 확산해 경쟁 우위를 확보하겠다는 구상이다. DBR(동아비즈니스리뷰)이 LG AI연구원의 김승환 비전랩장, 이문태 Advanced ML랩장, 이진식 엑사원 랩장을 인터뷰해 초거대 AI 개발 과정 및 활용 사례와 그 비전에 대해 물었다.

초거대 멀티모달 AI ‘엑사원’을 개발한 배경이 궁금하다.

김승환 비전랩장(이하 김 비전랩장) 오픈AI가 만든 GPT 모델에 이어 최근 챗GPT 등 텍스트 기반의 초거대 언어 모델(Language Model)이 생성형 AI의 놀라운 가능성을 보여줬다. 인간은 오감에 의존해 다양한 정보를 얻고 이를 기반으로 상상력을 발휘하고 추론한다. 따라서 텍스트 데이터뿐만 아니라 인간의 오감처럼 다양한 데이터를 결합하는 AI를 연구한다면 훨씬 더 많은 정보를 얻을 수 있을 것이라 생각했다. 그중에서도 인간은 시각을 통해 가장 많은 정보를 얻는다. 시각 데이터와 데이터양이 가장 많은 텍스트 데이터를 결합하고 향후 더 많은 모달리티(Modality)1 로 확장해 나간다면 우리가 상상하는 범용 AI(Artificial General Intelligence)2 를 현실화하는 데 중요한 이정표가 될 것이라 생각했다.

0008


개발 과정에서의 어려움은 무엇이었나?

이진식 엑사원 랩장(이하 이 엑사원 랩장) 데이터 확보가 가장 큰 어려움이었다. 엑사원과 같은 초거대 AI 모델을 개발하려면 방대한 양의 데이터가 필요하다. 엑사원의 경우 이미지와 텍스트로 짝지어진 3억5000만 장 이상의 데이터와 말뭉치 6000억 개를 학습했다. 단순히 데이터의 양뿐만 아니라 질 자체도 좋아야 한다. 그러나 양질의 데이터를 확보하려면 사람의 손이 굉장히 많이 필요하다. 그러다 보니 양질의 데이터 세트를 구축하는 데 드는 비용이 만만치 않고 대량으로 확보 가능한 데이터의 경우에는 품질이 낮다는 문제가 있었다.

양질의 데이터를 대량으로 어떻게 확보했나?

이 엑사원 랩장 데이터 품질을 평가하는 알고리즘을 개발해 저품질의 데이터를 솎아냈다. 텍스트 데이터를 예로 들자면 문장이 이어질 때 맥락이 이어지는지, 즉 문장 간의 일관성을 고려했다. 또 인터넷상의 광고성 텍스트, 이모티콘만 열거된 별 의미 없는 텍스트 데이터 등을 걸러내 양질의 데이터를 확보했다.

김 비전랩장 연구 초기 단계에서는 오픈 데이터 세트를 사용했는데 테스트해 보니 성능이 미흡했다. 또한 오픈 데이터 세트를 활용할 경우 저작권 이슈가 발생할 수 있다고 판단했다. AI 연구에 있어 윤리 문제도 굉장히 중요하기 때문에 이미지 데이터들을 구매하기로 결정했다. LG그룹이 가진 내부 데이터를 활용하는 동시에 저작권을 보유한 기업과 전략적 제휴를 맺어 부족한 데이터들을 구매해 학습을 시작했다. 최근 게티이미지가 자사가 보유한 이미지를 스태빌리티AI가 무단 도용했다며 소송을 제기하는 등 저작권 문제로 송사에 휘말리는 사례가 늘어나고 있는 만큼 개발 초기부터 저작권을 보유한 기업의 데이터를 구매해 활용한 것이 굉장히 좋은 판단이었다고 생각한다.

0009


데이터 확보를 위해 합성 데이터를 사용하는 경우도 있는데.

김 비전랩장 엑사원 개발에는 합성 데이터를 사용하지 않았다. AI는 기존에 봤던 데이터를 토대로 학습한다. 합성 데이터는 이미 봤던 데이터를 토대로 생성한 것이기 때문에 학습 데이터로 쓰기에는 한계가 있다. 합성 데이터는 새로운 정보를 가지고 있지 않기 때문이다. 생성형 AI가 만든 데이터를 학습에 활용하는 연구도 많은데 생각보다 AI의 성능이 올라가지 않는다는 결과도 있다. AI가 생성한 데이터가 사람의 눈에는 새롭고 다양한 데이터라고 보여도 컴퓨터가 인식할 때는 이미지 전체가 아닌 특정 피처들을 보기 때문에 새로운 데이터라고 인지하지 못한다. 물론 특정 태스크를 풀기 위한 작은 모델의 경우에는 합성 데이터가 유용할 수도 있지만 범용 AI로 나아가기 위한 초거대 모델의 성능을 높이는 데 합성 데이터의 영향력은 미미할 것으로 판단하고 있다.

엑사원과 같은 초거대 AI 개발은 많은 비용과 인력이 필요한 대규모 프로젝트다. 투자 대비 효용 가치가 높다고 보나?

이 엑사원 랩장 예를 들어, 신약 개발은 막대한 비용이 드는 과제 중 하나다. 초거대 AI로 신약 개발 기간을 몇 개월만 단축해도 수십~수백억 원의 비용을 아낄 수 있기 때문에 그 가치는 충분하다. 실제로 관련 분야에 활용하기 위해 엑사원 디스커버리 기술을 개발 중이다. 새로운 물질을 발굴하거나 신소재를 개발하는 과정은 크게 3단계로 나뉜다. 먼저, 관련 논문과 특허를 리서치하고 아이디어를 구상하는 선행 연구를 진행한다. 이후 신소재의 경우, 구조를 설계하고 마지막 단계에서 실제로 합성하고 검증한다.

엑사원 디스커버리는 이 3단계에 존재하는 페인포인트를 해소할 수 있다. 먼저, 논문이나 특허의 텍스트를 분석하고 물성 정보 등을 전부 데이터베이스 형태로 가공해 사람이 일일이 논문 전문을 읽을 필요 없이 선행 연구를 빠르게 진행할 수 있도록 돕는다. 그림이나 표로 첨부된 화학식 등을 엑사원 디스커버리가 이해한 후 사람이 쉽게 이해할 수 있는 형태로 가공해주는 것이다. 신소재의 구조 설계 단계에서도 A 물질과 B 물질을 합성했을 때 C라는 물질이 나온다는 사실을 일일이 검토하지 않아도 AI가 해당 조합이 유효한지 판단해 검증 시간을 빠르게 단축할 수 있다. 이렇게 AI가 미리 검증한 결과를 바탕으로 유효하지 않은 조합은 시도하지 않는 등 실제 합성에 드는 비용과 시간을 아껴 개발 과정을 효율화할 수 있다.

이 밖에도 기업이 초거대 AI를 활용했을 때 여러 장점이 있다. 무엇보다 확장성이 뛰어나다. 초거대 AI는 기본적으로 많은 지식을 베이스로 가지고 있기 때문에 적은 데이터만으로도 특정 도메인에 활용될 수 있다. 더 쉽게 설명하면 기존의 AI는 학습이 잘돼 있지 않은 어린아이한테 처음부터 가르쳐 일을 시키는 것이라면 초거대 AI는 여러 일을 어느 정도 두루두루 잘할 수 있는 어른한테 일을 시키는 것이다. 훨씬 더 적은 데이터를 갖고 가르쳐도 빨리 주어진 일을 해낼 수 있다. 기업이 초거대 AI를 현장에 적용했을 때 사업적 효과가 크게 나타날 수 있는 이유다. 그리고 다양한 현장에 적용하면 초거대 AI가 내놓는 결과에 대한 피드백 데이터가 쌓이고 해당 데이터를 활용해 모델의 성능을 계속 개선해 나가는 선순환 구조가 만들어진다.

구체적인 엑사원 활용 사례가 궁금하다.

김 비전랩장 가장 대표적인 사례는 LG생활건강과 함께 ‘디자인 프로세스 혁신’을 주제로 진행한 공동 프로젝트다. LG생활건강이 출시하는 화장품 용기나 패키지 디자인, 타투 프린트 도안 등에 엑사원을 활용하고 있다. 특히 LG생활건강의 타투 프린터 ‘IMPRINTU(임프린투)’는 엑사원 기술을 접목한 프로젝트 중 고객에게 선보이는 첫 상용화 사례다. LG생활건강은 타투 프린터를 개발하며 전문 디자이너가 하나씩 그려내는 수작업으로는 고객들이 이용하기에 충분한 도안을 확보하기 어렵다고 판단했고, 이에 엑사원 기반 디자인 창작 플랫폼 ‘엑사원 아틀리에(Atelier)’를 활용했다. 엑사원 아틀리에를 활용하면 올해 상반기 내에 타투 도안 1만 장을 확보할 수 있을 것으로 보인다. 사람이 직접 작업한다면 아무리 짧게 잡아도 수십 개월 이상이 걸리는 일을 엑사원으로 단 몇 개월 만에 해결할 수 있는 셈이다.

세계적인 이미지 업체 셔터스톡과도 전략적 파트너십을 맺어 엑사원 활용 사례를 개발 중이다. 셔터스톡의 1차적인 니즈는 이미지 캡셔닝(Image Captioning)3 이었다. 사용자들이 이미지를 업로드하면 정확한 설명과 태그를 잘 달아주는 작업이 중요하다. 태그를 잘 달아줘야 검색이 잘되고, 사용자들이 원하는 이미지를 제대로 보여줄 수 있으며, 이는 매출과 직결되기 때문이다. 초거대 멀티모달 AI로 이미지 관련 텍스트를 생성할 수 있는 엑사원의 성능을 높이 평가받은데다 사용자가 찾는 이미지가 없을 때 엑사원이 원하는 이미지를 생성해주고 셔터스톡은 그 플랫폼이 된다는 양사의 니즈가 부합해 전략적 파트너십을 맺고 사업을 추진 중이다.

0010


최근 챗GPT가 화제다. 챗GPT와 비교했을 때 엑사원의 차별점은 무엇인가?

이문태 Advanced ML랩장(이 ML랩장) 챗GPT는 AI가 창의성의 영역에서 영감을 줄 수 있다는 사실을 보여주고 있다. 챗GPT가 내놓는 답변의 정확도가 떨어지더라도 그 성과가 의미 있다고 보는 이유다. 그러나 활용 목적에 따라서는 영감보다는 인사이트를 주고 사실에 기반한 AI가 필요한 경우도 있다. 챗GPT가 창의적인 글쓰기(Creative Writing)를 돕는 도구라면 엑사원은 LG그룹 계열사들의 공정, 연구 등의 영역에서 보다 사실에 기반한 전문가 특화용 AI로 활용되는 방향에 초점을 맞추고 있다.

이 엑사원 랩장 챗GPT의 경우 사실이 아닌 답변을 생성하는 ‘할루시네이션(Hallucination)’ 현상이 일어나고 있다. 엑사원은 신약 및 신소재 개발 등 LG그룹 계열사의 난제를 해결하는 데 활용되기 때문에 이런 할루시네이션 현상이 일어나면 단순히 챗GPT로부터 잘못된 맛집 정보를 추천받는 수준 정도가 아닌 천문학적인 피해로 이어질 수 있다. 따라서 사실에 기반한 답변을 생성하는 기술에 초점을 맞춰 개발하고 있다. 이것이 챗GPT와 가장 차별화되는 점이다.

개발 인력이나 예산이 부족한 중소기업들은 초거대 AI를 활용하기 어려울 것 같은데.

이 ML랩장 오히려 중소기업들이 초거대 AI를 활용하는 사례가 더 많아질 것이라고 본다. 이전에는 특정 분야에 특화된 AI 솔루션을 개발했다면 이제는 범용 AI를 만들고 이를 필요에 맞게 미세 조정(fine tuning)한 모델을 활용하는 방향으로 딥러닝이 발전하고 있다. 최근 챗GPT를 자신의 비즈니스 도메인에 맞게 미세 조정하고 프로토타이핑을 거쳐 실제 프로덕트를 만드는 스타트업들도 속속 등장하고 있다. 이미지 생성 분야에서도 스테이블 디퓨전 모델을 가져와 미세 조정해 만화 이미지를 생성하는 서비스를 만든 ‘노벨AI’ 등 다양한 활용 사례가 생겨나고 있다.

초거대 AI 활용 시 기업이 유의해야 할 점은?

이 ML랩장 아주 방대한 데이터를 학습한 모델이기 때문에 데이터 안에 편향이 있을 수 있다는 점이다. 텍스트 데이터를 예로 들면 특정 분야와 관련해 백인 혹은 남성이 쓴 문서가 많아 이런 편향이 모델에 자연스레 녹아들 수 있다. 긍정적인 건 초거대 AI의 빠른 적응성을 활용해 이 문제를 보완할 수 있다는 사실이다. 편향이 발생했을 때 이를 바로잡도록 지시하면 초거대 AI가 빠르게 적응한다. 예를 들어, “세상에는 남자 간호사도 많고 여자 의사도 많아. 앞으로 의료계에서 남성과 여성이 할 일에 대해 설명해줘”라고 지시하면 기존에 있었던 남녀 역할에 대한 편향이 빠르게 사라지는 것이다. 이것이 초거대 AI가 가진 적응성이다. 윤리위원회를 구성하고 윤리 원칙을 세우는 등 조직 차원의 조치도 필요하지만 이처럼 기술적인 측면에서 편향을 해결해 나가려는 노력도 병행할 필요가 있다.

초거대 AI는 앞으로 어떤 변화를 가져올까?

이 ML랩장 많은 기회를 열어줄 것이다. 가장 대표적이고 쉽게 떠올릴 수 있는 예는 바로 정보 검색이다. 검색엔진 이전과 이후의 시대는 확연히 다르다. 검색엔진이 개발되며 인터넷 시대가 열렸다. 생각해보면 검색엔진은 그렇게 지능적인 도구가 아니다. 사용자가 원하는 내용이 있을 법한 문서를 순위를 잘 매겨 보여주는 게 전부다. 좋은 문서를 선별하고 내용을 발췌하는 등 그다음 작업부터는 모두 인간의 몫이다. 부상하고 있는 생성형 AI는 문서를 선별해 그 안에서 필요한 부분을 발췌하고 취합해준다. 과거에는 사용자가 키워드를 입력해 정보를 검색했다면 이제는 대화형으로 질문하면 생성형 AI가 그 맥락을 파악해 답변한다. 정보 검색에 드는 시간을 단축해 생산성을 폭발적으로 늘려주는 것이다.

생성형 AI가 대중화되면 일하는 방식에 있어서도 많은 변화가 생기고 지금보다 훨씬 효율화된 사회가 도래할 것이다. 일례로 과거에는 코딩이 전문적인 영역으로 개발자의 역량, 즉 좋은 알고리즘을 짤 수 있는 능력에 따라 성과가 좌우됐다. 그러나 2010년 이후 개발자들은 일반적으로 업무 영역에서 필요한 코드를 검색을 통해 빠르게 찾아 가져오고 필요에 맞게 수정하며 코딩하고 있다. 패러다임 시프트가 일어난 것이다. 생성형 AI 시대에는 검색엔진을 헤맬 필요 없이 원하는 코드를 요청하면 AI가 바로 답변해주기 때문에 일하는 방식에 있어 또 한 번의 패러다임 시프트가 일어날 것이라고 본다.
인기기사