로그인|회원가입|고객센터
Top
검색버튼 메뉴버튼

생성형 AI의 한계 보완 어떻게

토큰 검증 기법, AI 답변 정확도 높여
블록체인이 데이터 악용 방지 기능도

박보성 | 372호 (2023년 07월 Issue 1)
Article at a Glance

블록체인에 대한 관심이 생성형 AI로 넘어왔지만 그렇다고 이것이 기술의 승패를 의미하는 건 아니다. 블록체인과 생성형 AI는 상호 보완 관계에 있는 기술이다. 생성형 AI의 주요 한계점은 블록체인을 접목해 다음과 같이 보완할 수 있다.

1. NFT 커뮤니티 기반으로 생성형 AI 학습을 위한 데이터를 지속가능하게 확보할 수 있다.

2. 토큰 보상 기반의 정보 검증 방법을 도입해 생성형 AI의 답변 정확도를 높일 수 있다.

3. 블록체인으로 인간과 AI의 구분을 강화함으로써 디지털 세상에서 생성형 AI가 악용되는 것을 방지할 수 있다.



한때 업계의 주목을 받았던 NFT(Non-Fungible Token·대체불가토큰)라는 단어가 최근 잘 보이지 않는다. 2022년 초만 해도 마치 웹 3.0가 테크 업계의 판도를 바꿀 것처럼 관련 서비스가 우후죽순 쏟아져 나왔지만 최근에는 그 이름조차 듣기 어렵다. NFT, DeFi(탈중앙화 금융)와 같은 블록체인 서비스를 편리하게 사용하기 위해 필요한 모바일 블록체인 지갑 이용자 수는 2022년 초 2500만 명까지 늘었다가 최근 3분의 1 수준으로 급감한 상황이다. NFT 월 단위 구매자 수도 2022년 4월 약 110만 명에서 꾸준히 하락하다 2023년 초 잠깐 증가했지만 현재 약 38만 명 수준으로 다시 급락했다.1

20230626_125943


블록체인으로 향하던 관심은 지난해 말 챗GPT 공개 이후 생성형 AI로 넘어갔다. 현재 블록체인 업계의 분위기와는 다르게 생성형 AI 애플리케이션 수와 관련 매출은 급증하고 있는 상황이다. 앱 사용 관련 지표를 추적하는 조사 기관 앱토피아(Apptopia)에 따르면 2023년 1분기 AI 챗봇 애플리케이션 158개가 앱스토어에 등록됐다. 이는 전년 대비 1480% 늘어난 수치다. AI 챗봇 애플리케이션 다운로드 수는 전년 대비 1506% 늘었고 인앱 결제(in-app purchase)2 매출은 4184% 증가했다.

신기술의 시장 성장 사이클 안에서 보면 어쩌면 당연한 일이다. 대중의 관심이 챗GPT를 비롯한 생성형 AI로 넘어오면서 신규 아이디어와 아이디어 기반의 새로운 애플리케이션, 관련 서비스를 제공하는 기업이 등장했고 그 결과, 해당 업계의 시장 규모가 증가하는 것은 자연스러운 과정이다. 2020~2021년 블록체인 업계도 똑같은 사이클 안에서 시장 규모를 성장시킨 바 있다.

이처럼 테크 업계 전반의 관심은 블록체인에서 생성형 AI로 넘어왔지만 그렇다고 이것이 기술의 승패를 의미하는 건 아니다. 생성형 AI라는 기술이 홀로 테크 트렌드를 선도할 수 있을까? 블록체인은 중요하지 않은 기술로 전락한 걸까? 아직 여기에 확답을 하기엔 이르다.


생성형 AI의 한계 보완하는 블록체인 서비스

생성형 AI가 블록체인보다 대중에게 더 빠른 속도로 다가갔지만 완전한 대중화를 위해서는 여전히 개선해야 할 한계점이 남아 있다. ▲개인정보 보호 문제가 없는 대화 데이터를 지속적으로 확보해 AI 챗봇을 고도화하는 것 ▲생성형 AI가 만들어내는 답변의 정확도를 높이는 것 ▲디지털 콘텐츠 생산 주체를 명확히 하는 것 등이 완성도 높은 생성형 AI 서비스를 만들기 위해 반드시 해결해야 할 과제다. 그리고 놀랍게도 블록체인이 생성형 AI에 남겨진 과제들의 해결책이 될 수 있다. 생성형 AI는 블록체인 트렌드를 대체한 것이 아니다. 둘은 상호 보완 관계에 있는 기술이다. 블록체인은 생성형 AI 시장을 더욱 성숙하게 만들어주고, 생성형 AI 역시 블록체인 기술의 돌파구를 마련해줄 수 있다. AI와 블록체인을 잘 접목한 서비스 사례를 통해 생성형 AI의 한계점을 블록체인이 어떻게 보완해줄 수 있는지 알아보고자 한다.

GettyImages-1280474964_[변환됨]


한계 1. 지속가능한 대화 데이터 확보의 어려움

마이크로소프트의 전폭적인 지지를 받고 있는 오픈AI와 같은 스타트업이 아닌 이상 신생 기업이 새로운 대규모 언어 모델(LLM, Large Language Model)을 구축하는 것은 불가능에 가깝다. 그럼에도 사용자 입맛에 맞는 AI 버티컬 서비스3 에 대한 니즈는 항상 존재한다. 또한 GPT-4와 같은 모델에 의존해 서비스를 운영하는 것은 비용상 한계가 있기 때문에 자체 대규모 언어 모델을 구축하려는 시도가 계속되고 있다. 이런 시도는 특히 AI 챗봇 영역에서 활발하다.

AI 스타트업들이 자체 모델을 구축하기 위해서는 끊임없는 대화 데이터 확보가 필수적이다. 하지만 사용자들에게 모델을 구축할 규모의 대화 데이터를 요구하기란 쉽지 않은 일이다. 오픈AI의 언어 모델들이 부적절한 데이터를 학습했다는 공격에서 자유롭지 않은 것처럼 개인정보, 저작권 등의 문제가 없는 데이터를 지속적으로 확보하는 것은 더욱 어렵다. 그러나 NFT 기반 디지털 소유권 증명과 블록체인 기반 보상 시스템을 잘 설계해 이 한계를 극복한 사례가 있다. 바로 2020년 설립해 꾸준히 블록체인과 AI가 결합된 비즈니스를 이어오고 있는 스타트업 ‘알레시아 AI(Alethea AI)’다.

20230626_130001


알레시아 AI는 NFT 기반 엔터테인먼트 요소와 토큰 기반 보상 시스템을 통해 지속적으로 데이터를 확보하며 자체 언어 모델을 고도화하고 있다. 알레시아 AI는 지능이 있는 똑똑한 NFT인 ‘iNFT(intelligent NFT)’ 개념을 처음으로 내놓았다. iNFT는 본인이 소유한 이미지 NFT를 대화 데이터로 잘 학습시켜 대화 가능한 캐릭터로 만드는 개념이다. iNFT를 만들기 위해 사용자들은 우선 캐릭터의 지능을 학습시키기 위한 별도의 NFT를 구입해야 한다. 구입한 ‘지능 NFT’를 본인이 소유한 NFT에 연결해 지속적으로 대화 데이터를 학습시키면 NFT의 지능이 점점 높아진다. NFT를 똑똑하게 학습시키는 과정에서 자체 생태계에서 활용 가능한 ‘ALI’ 토큰을 지급받아 수익 창출 또한 가능하다. 최근에는 블록체인 애플리케이션에서도 사용자가 생성한 지능형 캐릭터 NFT를 사용할 수 있게 되면서 수익 창출의 창구가 확장됐다.

알레시아 AI는 데이터 수집에 있어 사용자 경험을 180도 바꿔 놓았다. 사용자는 자신이 입력한 데이터로 중앙화된 특정 AI 플랫폼 발전에 기여한다기보다 내가 소유한 NFT 캐릭터를 성장시킨다고 느낄 수 있다. 회사가 직접 데이터를 모으는 것이 아닌 사용자가 데이터를 직접 가져오게 만드는 것이다. 사용자는 본인이 소유한 NFT 캐릭터를 더 똑똑하게 만드는 과정에서 흥미를 느끼고 회사 입장에서는 이를 통해 새로운 대화 데이터를 얻을 수 있다.

알레시아 AI는 첫 캐릭터 NFT를 만드는 데 1년이 걸렸지만 데이터의 지속적인 확보와 모델 고도화로 현재 모델은 2분 안에 AI 캐릭터를 만들 수 있는 수준에 이르렀다. 최근에는 지금까지 쌓은 데이터를 기반으로 신규 서비스인 ‘캐릭터 GPT(Character GPT)’를 공개했다. 텍스트 프롬프트를 입력해 새로운 NFT 캐릭터를 생성하는 서비스(Text-to-Character)다.

NFT, 토큰 생태계 기반으로 데이터 확보 문제를 해결한 알레시아 AI의 방식은 최근 타 서비스에서도 찾아볼 수 있다. 이레버런트랩스(Irreverent Labs)라는 AI 기반 블록체인 게임 업체도 NFT 기반 게임 캐릭터를 판매해 사용자가 학습시키는 방식으로 AI 모델을 고도화했다. 이처럼 캐릭터 육성, 게임과 같은 엔터테인먼트 요소를 결합하면 언어 모델을 개발하는 회사가 개인정보 문제로부터 자유로운 데이터를 확보하는 데 도움이 된다.

20230626_130014


한계 2. 답변 정보의 부정확성

생성형 AI가 안정적인 대중 서비스로 자리 잡기 위한 큰 걸림돌 중 하나는 생성 답변의 부정확성이다. 잘 알려져 있는 생성형 AI의 치명적인 단점인 ‘환각 현상(Hallucination)’은 정확한 답변이 필요한 검색 서비스와 같은 영역에서 서비스 신뢰도를 급격히 떨어뜨릴 수 있다. 검색 서비스는 생성형 AI가 크게 혁신할 수 있는 영역 중 하나이기 때문에 답변의 신뢰도를 높일 수 있는 방법에 대한 고민은 반드시 필요하다.

이 문제와 관련해서는 블록체인 기반의 검증, 보상 시스템으로 정보 정확도 문제를 해결하고 있는 ‘골든(Golden)’이라는 서비스에서 힌트를 얻으면 좋을 듯하다. 골든은 안데르센호로위츠와 같은 유수 실리콘밸리 투자자들로부터 6000만 달러 이상의 투자를 받은 기업으로 지식의 최소 단위 정보를 AI로 연결해 탈중앙화된 지식 그래프를 만드는 ‘골든 프로토콜’이라는 프로젝트를 진행하고 있다. 100억 개 지식에 대한 공개 그래프를 만드는 것을 목표로 한다. 예를 들어 일론 머스크가 설립한 스페이스X(SpaceX)라는 지식에 설립 연도(founded), 관련 산업(industry), 대표(CEO), 제품(product)과 같은 최소 단위의 정보들이 연결돼 하나의 그래프를 이루는 것이다. (그림 4)

20230626_130028


이 서비스는 정보의 정확도를 높이기 위해 블록체인 기반 사실 검증 과정을 거친다. 다수의 사람이 ‘스페이스X의 대표는 일론 머스크다’와 같이 지식의 최소 단위에 정보를 연결해 제안하면 검증인들4 이 제출된 정보의 사실 여부를 검증한다. 이 정보의 사실 여부가 확인되면 이를 제출한 사람에게는 토큰 기반의 보상이 주어진다. 부정확한 정보를 제안하면 이후 제안에 대한 신뢰도가 떨어지며 토큰을 잃을 수 있기 때문에 사람들은 더 주의해서 정보를 입력하게 된다.5

이런 토큰 보상 기반의 정보 검증 방법은 골든의 지식 그래프 생성 서비스뿐만 아니라 생성형 AI의 답변을 고도화하는 데도 활용될 수 있다. 생성형 AI가 부정확한 답변을 생성하는 할루시네이션 문제를 개선하기 위해 활용되는 대표적인 방법은 사용자의 피드백을 반영해 모델을 고도화하는 인간 피드백 기반 강화학습(RLHF, Reinforcement Learning from Human Feedback)이다. 쉽게 말하면 더 많은 사용자가 양질의 피드백을 줄수록 생성형 AI가 똑똑해지는 것이다. 이때 토큰 보상 콘셉트를 적용해 생성형 AI에 피드백을 주는 사용자에게 토큰을 지급한다면 좀 더 활발한 피드백을 유도해 생성형 AI를 빠르게 고도화할 수 있다.

20230626_130036



한계 3. 콘텐츠 생산 주체의 불확실성

장기적인 관점에서 생성형 AI가 안전한 대중화를 이루기 위해서는 기존 디지털 세상의 질서를 해치지 않고 자리 잡는 것이 중요하다. 1년 전까지만 해도 생성형 AI가 만들어낸 콘텐츠는 인간이 만들어낸 콘텐츠와 확실히 구분됐다. 쉽게 말해, AI가 만들어낸 콘텐츠가 어떤 건지 인간이 육안으로 골라낼 수 있었다. 하지만 최근 GPT-3.5에 이어 GPT-4가 등장하면서 지능 측면에서 AI가 인간을 바짝 쫓아왔다. 주관식, 객관식이 모두 포함된 복잡한 시험에서 AI가 높은 점수를 기록한 것이다. GPT-4는 미국 모의 변호사 시험에서 상위 10%, 미국 대학 입학 자격시험(SAT) 읽기와 수학 과목에서 각각 상위 7%, 9%의 성적을 냈다.

인간과 AI가 생성한 콘텐츠의 구분이 흐려지면 디지털 세상에는 엄청난 혼돈이 일어날 수 있다. AI가 가짜 뉴스, 검증되지 않은 콘텐츠를 생산해 콘텐츠 생태계를 파괴할 수 있기 때문이다. 이에 디지털 세상에서 사람임을 증명하는 것은 매우 중요한 과제가 됐다. 월드코인(Worldcoin)은 익명의 디지털 환경에서의 인간 인증 프로젝트를 진행하고 있다. 인간임을 증명하기 위한 최적의 방법은 생체 정보를 인식해 계정을 발급해주는 것이라며 홍채 인식을 통해 이더리움 기반의 월드 아이디(World ID)를 발급하는 방식을 선보였다. 월드코인은 이를 ‘개인 증명(PoP, Proof-of-Personhood)’이라고 명명했다. 일각에서는 이 방식이 기존의 인증 방식인 온라인 계정, 본인 인증(KYC, Know Your Customer) 등을 대체할 수 있다는 주장도 나오고 있다.

이처럼 생체 정보를 바탕으로 개인을 증명하는 월드 아이디는 디지털 세상에서 생성형 AI가 허위 정보, 유해한 콘텐츠를 퍼뜨려 커뮤니티를 파괴하는 것을 예방하는 데 도움이 된다. 일례로 현재 AI 봇에 의한 스팸, 해킹 등을 방지하기 위해 구글이 개발한 ‘리캡차(reCAPTCHA)’를 활용하는 웹사이트가 많다. 사용자가 로봇이 아님을 인증하기 위해 제시된 여러 이미지 중 도로 표지판 등 특정 종류의 물체 이미지를 선택하는 식이다. 그러나 홍채를 인식해 아이디를 발급받는 월드 아이디는 인간임을 증명하는 더 확실한 방법이다. 따라서 리캡차 같은 기존의 방식보다 더 정확하게 인간과 AI를 구별해 디지털 세상에서 허위 정보, 유해한 콘텐츠를 퍼뜨리는 악성 생성형 AI가 확산되는 것을 예방할 수 있다.

20230626_130044


생성형 AI와 블록체인의 기술 시너지가 만들 미래

생성형 AI라는 단일 기술이 세상을 바꿀 수 있을까? 앞서 언급한 것처럼 생성형 AI는 지속가능한 대화 데이터 확보 문제, 답변 정보의 부정확성 등의 한계에 부딪혀 발전 속도가 더뎌질 수 있다. 그러나 그 한계들을 블록체인으로 해결하는 다양한 시도가 나오고 있다는 점은 고무적이다. 두 기술이 서로의 단점을 보완해 함께 성장하며 시너지를 낼 미래를 기대해볼 만하다. 마지막으로 살펴본 사례인 월드코인은 챗GPT를 만든 오픈AI의 CEO 샘 올트먼이 설립한 회사다. 현재 생성형 AI 시대의 핵심에 있는 인물마저 AI 시대의 한계를 탈중앙화된 블록체인이 개선해줄 수 있다고 여겨온 것으로 해석할 수 있다. 블록체인은 생성형 AI 기술의 완성도를 높여줄 수 있고 이와 함께 블록체인 기술도 대중화를 이루며 더욱 성장할 것이다. 특정 기술이 세상을 지배한다는 목소리가 커지는 지금, 다양한 기술이 융합되고 시너지를 내며 함께 만들어갈 미래에 눈을 돌려보는 건 어떨까.



참고문헌

1 “2023 State of Crypto Report: Introducing the State of Crypto Index”, a16z, April 2023, https://a16zcrypto.com/content/article/state-of-crypto-report-2023/
2 “Humanness in the age of AI”, Worldcoin, March 2023, https://worldcoin.org/blog/engineering/humanness-in-the-age-of-ai#official-id-verification-(kyc)
  • 박보성 | 카카오 전략기획실 매니저

    필자는 CURG, D3LAB DAO 학회 소속으로 블록체인 및 메타버스 관련 해커톤, 강의, 콘텐츠 제작, 학회 활동을 통해 진정한 웹 3.0의 의미를 알리고 있다. 메타버스 해커톤 과학기술부 장관상, ‘Chainlink 해커톤’ DAO 부문 대상, 위믹스해커톤 대상 등 다양한 수상 경력을 보유하고 패스트캠퍼스, 멋쟁이사자처럼, 한국표준협회, 콜로소 등에서 신기술 트렌드 관련 강의를 진행했다. 다양한 콘텐츠를 통해 새로운 기술 트렌드와 신선한 시각을 널리 알리고 있다.
    bs97@naver.com
    이 필자의 다른 기사 보기
인기기사