로그인|회원가입|고객센터
Top
검색버튼 메뉴버튼

AI 아트 인사이트

‘비디오 생성형 AI’가 2024년 흔든다

김민지 | 384호 (2024년 1월 Issue 1)
Article at a Glance

2023년 말을 뜨겁게 달군 올트먼의 오픈AI 해임 사태는 AI 개발을 둘러싼 가치관 충돌이 낳은 해프닝이었다. 이는 AI 개발의 속도를 조절하자는 ‘효과적 이타주의’와 인위적으로 기술 진보를 억제해서는 안된다는 ‘효과적 가속주의’의 입장 차를 단적으로 드러냈다. 이 사태가 올트먼의 복귀로 일단락됐다는 것은 2024년에도 AI 개발 및 사업화 경쟁이 더 치열해질 것임을 예고한다. 2023년이 달리2, 미드저니, 스테이블 디퓨전 등과 같은 ‘이미지’ 생성형 AI의 해였다면 2024년은 ‘비디오’ 생성형 AI 서비스가 확산되는 해가 될 전망이다. 이렇게 AI가 생성한 비디오 콘텐츠는 진짜와 가짜 사이의 경계를 더 흐리게 만들 수 있다. 당장 내년 미국 대선과 맞물려 AI가 정교하게 조작한 ‘딥페이크’ 영상이 더 큰 사회적 혼란을 야기할 가능성도 크다. 2024년에도 AI의 명암은 더 극명하게 엇갈릴 것이다.



2023년 테크 업계에서 잊지 못할 해프닝은 단연 ‘챗GPT의 아버지’라 불리는 샘 올트먼 오픈AI 최고경영자(CEO) 축출 및 복귀 사건일 것이다. 반전에 반전을 거듭해 전개되는 실리콘밸리 뉴스를 파악하려 밤낮 X를 확인하는 과정은 당황스럽기까지 했다. 사건은 올트먼의 오픈AI 복귀라는 해피엔딩으로 일단락됐으나 본 해임 사건의 배경을 헤아리는 것은 향후 AI 업계의 방향성을 가늠하는 시점에서 중요할 수 있다.


효과적 이타주의 vs. 효과적 가속주의

올트먼의 오픈AI 해임의 원인으로 다양한 추측이 제기되고 있으나 AI 개발을 둘러싼 가치관 충돌이 주요 원인이라는 의견이 많다. 이때 이해해야 할 용어는 바로 ‘효과적 이타주의(EA·Effective Altruism, 이하 EA)’와 ‘효과적 가속주의(Effective Accelerationism, 이하 e/acc)’라는 일종의 기술 철학이자 사회운동과 관련한 용어다. 올트먼은 챗GPT 출시 이후 GPT 스토어, AI 칩 개발, 추가 투자 유치 등 AI 개발과 성장에 집중하는 행보를 보였다. 그러나 비영리단체로 시작한 오픈AI의 또 다른 공동창업자 및 이사진은 EA를 추구하며 갈등을 빚은 올트먼을 축출했다. 요약하면 오픈AI의 이사진은 EA를 지지했지만 올트먼은 e/acc를 추구하는 입장이었다.

그렇다면 전 세계에 챗GPT 열풍을 일으킨 스타 CEO 올트먼의 해임 결정을 촉발한 EA란 무엇인가. EA는 이타적이라는 단어에서 유추할 수 있듯 타인을 도울 수 있는 최선의 방법을 찾고 실천하는 것을 목표로 하고, 근거와 추론에 기반한 합리적 이타주의를 추구한다. 이러한 EA를 AI 시스템에 적용해 보면 AI 개발의 가속화로 미래에 대한 통제력을 상실했을 경우의 위험성을 인지하고 인류에 안전한 AI 개발을 위해 속도를 조절하자는 입장이라고 볼 수 있다.

20231226_140435


반면 e/acc는 가속이라는 단어에서 보이듯 기술개발을 빠르게 촉진해 혁신과 사회 변화를 추구하는 입장이다. 대표적으로 실리콘밸리 액셀러레이터인 와이콤비네이터의 CEO 게리 탄과 디지털 혁신가 겸 벤처캐피털리스트인 마크 안드레센 등 비즈니스 리더들이 e/acc의 지지자다. 이들은 기술의 필연적 진보를 가속화하는 기술 자본 기계(techno-capital machine)에 저항하거나 속도를 늦출 방법이 없다고 본다. 따라서 e/acc 지지자들은 급진적인 기술 낙관론자들로 기술 진보를 억제하려는 모든 시도를 전면적으로 거부하고 범용인공지능(AGI, Artificial General Intelligence)의 개발을 지지한다. e/acc 지지자들은 기술 발전 속도를 늦춘다 한들 과연 인류에 안전하고 선의로 찬 미래가 도래할까에 대해 의심한다. 오히려 빠르게 기술을 발전시켜 어떠한 문제가 발생하는지 발견하고 이에 대응할 실제적인 방안을 찾는 쪽을 추구한다.

최근 이더리움 창시자 비탈리크 부테린은 트위터에서 벌어진 e/acc 관련 논쟁에 참여하며 자신의 의견을 피력했다. 그는 e/acc의 기술 낙관론에 기본적으로 동의하나 AI는 인간의 자유에 중대한 위협을 가할 수 있는 기술이라 말했다. 특히 500명의 직원으로 1억 명 이상의 고객들에게 서비스를 제공하는 오픈AI가 보여주듯이 AI 기술이 극도의 중앙화로 인한 권력 집중과 감시 사회를 야기할 수 있다는 구체적인 두려움을 표현했다.1 이러한 두려움의 이면에는 탈중앙화와 권력 분산의 가치를 기술에 담고자 한 블록체인이 데이터 및 권력 중앙화에 따른 위험을 내포한 AI 기술을 보완할 수 있을 거라는 부테린의 신념이 엿보인다.

이처럼 오픈AI 사태는 실리콘밸리를 중심으로 AI 기술 개발과 속도 조절에 관한 일련의 의견이 서로 다른 철학을 바탕으로 충돌하는 상황에서 벌어진 해프닝이었다. 이는 향후 AI 개발 촉진과 사업화를 위한 업계의 치열한 경쟁이 내년에도 이어질 것을 예고하는 징후이기도 하다. 그뿐만 아니라 2024년, AI 기술이 일상을 파고들면서 그 열풍이 이어질 것이란 전망도 속속 나오고 있다. 다가올 세계 최대 전자제품 박람회인 CES 2024(Consumer Electronics Show)의 핵심 주제도 AI다. 주최사인 CTA(Consumer Technology Association)의 게리 샤피로 회장 겸 CEO는 올해에 이어 내년에도 다양한 AI 영역 중 생성형 AI의 가능성에 주목할 필요가 있다고 봤다. 지난 10월 미국에서 개최된 가트너 IT심포지엄(Gartner IT Symposium)에서도 리 맥멀런 가트너 수석 부사장은 “2024년은 모든 것이 변하는 해가 될 것이며 생성형 AI가 모든 영역에 침투할 것”이라 힘주어 말했다.2 또한 “2027년에는 AI의 생산성 가치가 각국 국력의 1차적인 지표로 인식될 것(By 2027, the productivity value of AI will be recognized as a primary indicator of national power)”이라며 국가 전략의 일부로서 AI의 중요성을 강조했다.3

그렇다면 여전히 중요하게 다뤄질 AI 기술은 새해에 어떠한 트렌드를 보이며 발전해 갈 것인가? 기술 트렌드 변화에 민감한 디지털 미디어 아티스트 사이에서는 일찌감치 2024년은 ‘비디오’ 생성형 AI가 화두가 될 것이란 이야기가 나오고 있다.


이미지에서 비디오로: 2024년 생성형 AI 전망

2023년이 달리2, 미드저니, 스테이블 디퓨전 등과 같은 ‘이미지’ 생성형 AI의 해였다면 2024년은 ‘비디오’ 생성형 AI 서비스가 확산되는 해가 될 것이다. 시장조사 업체 ‘마켓앤드마켓(MarketsandMarkets)’의 보고서에 따르면 글로벌 ‘텍스트-이미지 변환 AI 시장 규모(Text to Video AI Market)’는 2027년까지 37.1%로 고속 성장할 것으로 예상된다.4 2022년에 1200억 원 규모였는데 4년 내로 1조 원에 이른다는 전망이다. 비디오 생성형 AI의 대표적인 서비스로는 메타의 메이크어비디오(Make-A-Video)와 에뮤 비디오(Emu Video), 구글의 페나키(Phenaki)와 이매젠 비디오(Imagen Video)가 있다. 이렇게 빅테크의 서비스 외에도 스타트업인 스태빌리티 AI, 런웨이 리프레이즈, 피카랩스, 카이버, 레이아픽스 등이 출시한 서비스도 많다.

구글과 엔비디아, 세일즈포스 등으로부터 1억4100만 달러(약 1860억 원) 규모의 투자를 유치한 런웨이5 는 동영상 생성형 AI 스타트업의 선두 주자다. 기업가치 약 15억 달러(약 1조9700억 원), 누적 투자금 2억3700만 달러(약 3100억 원)에 달하는 런웨이는 2018년 미국 뉴욕대 인터랙티브 텔레커뮤니케이션 프로그램 졸업생들이 공동 창업했다. 홈페이지에 ‘인공지능을 통한 창의력 향상’이라는 문구가 강조돼 있듯 런웨이가 진출하려는 영역에는 예술 및 콘텐츠 미디어 산업이 자리 잡고 있다. 런웨이는 엔터테인먼트 사업부인 런웨이 스튜디오를 설립한 데 이어 AI가 영화 제작에 참여한 결과물인 ‘AI 필름 페스티벌’도 개최하고 있다. 일전에 크리스토발 발렌주엘라 런웨이 대표는 AI를 통해 콘텐츠 제작에 걸리는 시간과 비용을 절감할 뿐 아니라 생성형 AI 콘텐츠를 새로운 유형의 콘텐츠로 자리 잡게 하겠다는 포부를 내비친 바 있다. 이처럼 AI 아트에 심리적 저항과 불쾌감을 표현했던 예술계에서도 물감이나 카메라가 등장했을 때와 마찬가지로 AI를 새로운 영상 창작의 도구로 인식하고 실험적인 작업을 시도하려 하고 있다. 즉, AI를 새로운 장르 형성의 도구로 바라보는 것이다.

런웨이의 대표 제품은 젠-1(Gen-1), 젠-2 (Gen-2), AI 매직 툴(AI Magic Tools), 그린 스크린(Green Screen), 인페인팅(Inpainting)이다. 2022년 9월 런웨이가 내놓은 AI 매직 툴은 명령어 텍스트나 이미지를 입력하면 관련 동영상을 제작하고 편집할 수 있는 도구다. 구체적으로 자동 자막 생성, 영상 배경 교체, 이미지 삭제 등이 가능해 동영상 편집의 효율성을 높일 수 있다. 2023년 2월 런웨이가 출시한 AI 모델 ‘젠-1’은 텍스트로 스타일을 지정하면 기존 영상을 새로운 영상으로 변환해준다. 이어 런웨이는 같은 해 3월 젠-2를 출시했고 5월에는 구글로부터 1억 달러 규모 투자를 유치하면서 해상도와 속도를 개선하는 등 프로그램을 고도화했다. 비디오 생성형 AI로 영화 및 방송 제작이 유행처럼 번지고 있는 상황에서 런웨이의 지속적인 업데이트는 미디어, 아트, 엔터테인먼트 등 업계 관계자들의 호응을 얻고 있다.

20231226_140447


그런가 하면 스태빌리티6 는 런웨이 모델보다 뛰어난 품질의 영상을 생성했다는 연구 결과를 오픈소스 AI 커뮤니티 ‘허깅페이스’에 공개하며 비디오 생성형 AI 시장에 도전장을 내밀었다. 스태빌리티 AI는 이미지 생성형 AI ‘스테이블 디퓨전’을 기반으로 이미지를 입력하면 2~3초 분량의 짧은 동영상을 만들 수 있는 비디오 생성형 AI ‘스테이블 비디오 디퓨전(SVD, Stable Video Diffusion)’을 지난 11월 공개했다.7 SVD는 초당 3~30프레임 사이의 속도로 각각 14프레임과 25프레임을 생성할 수 있는 두 가지 ‘이미지-비디오 생성 모델’로 출시됐다. 하지만 현재는 상업용 애플리케이션이 아니라 연구 목적으로만 서비스가 제공되고 있다. 예술 작품 생성 및 디자인 작업, 교육, 창작 등에 사용하며 생성형 모델의 활용 가능성과 한계 및 보완 사항을 연구하려는 목적이 커 보인다. 이렇듯 연구 목적의 SVD를 사용해 본 아티스트나 사용자들의 경험담을 들어보면 몇 초 만에 무료로 고품질 영상을 얻을 수 있어 놀랍다는 반응이 주를 이룬다. 이렇게 사용자 반응을 확인한 스태빌리티AI가 향후 SVD 품질을 고도화해 광고, 교육, 엔터테인먼트, 미디어 등의 분야에 손쉽게 활용할 수 있는 상업용 비디오 생성형 AI를 출시할 것이란 점은 쉽게 예상할 수 있다.


진짜와 가짜의 경계가 흐려진 시대

비디오 생성형 AI 서비스의 확산은 콘텐츠 및 창작물 제작의 비용과 시간을 대폭 줄이는 등 새로운 산업적 기회를 만들어나갈 것이다. 그러나 기술의 진보에는 명과 암이 공존한다. AI로 만든 비디오 콘텐츠는 진짜와 가짜 사이의 경계가 흐려지는 세태를 더 짙게 만들 것이다. 당장 내년에 당면한 미국 대선과 맞물려 AI가 정교하게 조작한 ‘딥페이크(deepfake)’ 사진과 영상이 가짜 뉴스를 증폭하고 여론을 조작할 수 있다는 우려도 제기되고 있다. 내가 지금 보고 있는 사진과 영상이 과연 진짜인지 끊임없이 의심해봐야 하는 미래가 오고 있다는 뜻이다. 이런 상황을 뒤집어 보면 생성형 AI로 만든 가짜 콘텐츠를 감별해 안정성을 꾀하는 방향으로 AI 기술이 진보해 나갈 것을 유추할 수 있다.

20231226_140456


그렇다면 AI 생성 콘텐츠의 진위를 구별하고 입증하고자 하는 시도에는 어떤 것들이 있을까. 우선 MIT 인공지능연구소(CSAIL)가 지난 7월 무료 배포한 ‘포토가드(PhotoGuard)’ 기술이 있다. 이 기술은 AI로 특정인의 사진을 도용 및 합성하는 것을 방지해 딥페이크 사진 제작을 차단한다.8 사진에 포토가드 기술을 적용하면 이미지의 핵심 단위인 픽셀을 왜곡시키게 된다. 인간의 눈으로는 이런 픽셀 왜곡을 감지하기 어려우나 AI로는 감지할 수 있다. 그 결과 AI는 해당 사진의 원본을 제대로 인식하지 못하고 왜곡된 버전으로 인식하기 때문에 사진을 무단으로 편집하거나 변형할 수 없게 된다. 이는 뉴스 파급력이 큰 유명인이나 공인의 얼굴이 가짜 뉴스나 음란물에 도용되는 사례를 차단해 이미지의 진위(authenticity)를 보호할 수 있다. 다만 MIT 연구팀이 인정했듯 이 기술은 악의를 지닌 공격자가 보호된 이미지를 리버스 엔지니어링(reverse engineering, 이미 만들어진 시스템을 역으로 추적해 처음의 문서나 설계 기법 등의 자료를 얻어 내는 일)할 수 있기 때문에 불완전하다는 약점이 있다.

한편 포토샵, 일러스트레이터, 프리미어프로 등의 프로그램으로 유명한 미국의 디자인 소프트웨어 업체 어도비는 콘텐츠 위조와 변조, 가짜 뉴스 제작과 전파를 막고자 2019년 ‘CAI(Content Authenticity Initiative, 콘텐츠 진위 이니셔티브)’를 결성했다. CAI는 뉴욕타임스, AFP, 게티이미지를 비롯한 미디어 및 기술 회사, NGO, 학계 등 전 세계 375개사가 모인 커뮤니티로 디지털 콘텐츠 진위와 출처(provenance)를 입증하기 위한 개방형 산업 표준 채택을 촉진하는 것을 목표로 한다.9 이어 2021년에는 디지털 가짜 뉴스 퇴치를 목적으로 BBC와 마이크로소프트가 주도해 설립한 ‘프로젝트 오리진’과 CAI가 협력해 ‘C2PA(Coalition for Content Provenance and Authenticity, 콘텐츠 출처 및 진위를 위한 연합)’를 설립하기도 했다.10 C2PA는 디지털 콘텐츠의 출처와 진위 및 생성형 AI 사용 여부를 표시하는 개방형 기술 표준을 마련했다. 이런 표준을 AI 아트에 적용할 경우 누가 어떤 이미지를 가지고, 어떤 편집 도구를 사용해 작품을 만들었는지에 관한 작품 출처와 정보를 투명하게 확인할 수 있다. 구체적으로 어도비는 어도비 파이어플라이(Adobe Firefly)라는 AI 아트 생성 도구를 출시했는데 이때 콘텐츠 자격증명 기능을 사용하면 C2PA 표준에 따라 서명하고 이미지의 메타데이터에 출처를 공개할 수 있다. 사용자가 콘텐츠 자격증명 기능을 활성화하면 설정에 따라 창작자, 제작 도구, 최종 이미지 제작을 위해 수행한 편집 작업, 이미지 제작에 사용된 다른 콘텐츠, 콘텐츠 자격증명을 발급한 서명자 등 정보를 창작물에 기입할 수 있다. 이와 유사하게 카메라 제조업체인 라이카와 니콘도 AI를 사용하지 않고 실제로 촬영한 ‘진짜’ 사진임을 인증하기 위해 카메라에 C2PA 표준을 구현하고 있다.

20231226_140505


주목할 만한 점은 마이크로소프트(MS)가 C2PA의 설립 멤버라는 것이다. MS는 ‘빙 이미지 크리에이터’와 ‘마이크로소프트 디자이너’ 등 생성형 AI 도구로 만든 이미지를 C2PA 표준에 따라 암호화해 서명하고, 이미지의 메타데이터에 출처를 명확하게 공개하기로 했다. 이 같은 방침은 이미지에 국한되지 않고 비디오 생성형 AI에도 적용될 예정이다. 2024년 비디오 생성형 AI 서비스 확산으로 인해 가짜 콘텐츠가 야기할 사회적 혼란과 피로에 대비하기 위한 MS의 방책으로도 해석된다.


진정성 위기의 시대,
도도히 나아가는 AI 기술

미국에서 가장 오래된 사전 출판사인 메리엄 웹스터 사전은 올해의 단어로 ‘진짜(authentic)’를 골랐다. 이 단어는 가짜(false)와 모방(imitation)과 대조되는 관점의 진짜와 실제를 지칭한다. 또한 원본성 및 진정성의 가치를 의미하기도 한다. 이처럼 AI의 발전은 모든 것의 진위에 대한 의심을 낳고 있다. 메리엄 웹스터가 단어 조회 수와 검색량 증가 등을 토대로 올해의 단어를 ‘진짜’로 선정했다는 사실은 무엇이 진짜인지 쉽게 믿을 수 없는 탈진실 시대의 위기를 반영한다. 이와 동시에 진짜를 발견해 믿고자 하는 욕구가 사람들에게 잠재돼 있다는 것도 보여준다.

이런 진정성 위기에도 불구하고 챗GPT가 촉발한 AI 기술 대중화의 흐름은 내년에도 고고히 이어질 것이고, 사회 각 영역에 파고든 생성형 AI 서비스를 마주하게 될 것이다. 특히 이미지를 넘어 비디오 생성형 AI 서비스가 늘어날 것이며 AI 생성물의 진위를 감별하고자 하는 기술적 시도도 내년 주요 선거를 앞둔 국제사회의 정치적 필요에 의해 가속화될 것이다. 오픈AI 사태는 AI 개발 속도가 조절되기보다 더 탄력을 받고 업계 발걸음이 더 바빠질 것임을 예고했다. 이런 현실을 담담히 인정하되 탈진실의 시대에 진실을 추구하는 마음으로 AI 기술이 사회 유익과 선의 가치를 증폭시키는 방향으로 나아갈 수 있도록 새해에도 각자의 자리에서 관심의 끈을 이어 나가야 한다.
  • 김민지 | Art&Tech 칼럼니스트

    필자는 서울대에서 미학을 전공하고 KAIST 문술미래전략대학원에서 과학저널리즘 석사 학위를 받았다. 15년간 예술 관련 강의 및 진행 활동을 해왔으며 미래 교육 및 문화예술 콘텐츠 스타트업에서 근무했고, 경제방송에서 ‘김민지의 Art & Tech’ 앵커로 활동한 바 있다. 저서로는 『NFT Art 그 무엇으로도 대체 불가능한 예술(2022, 아트북프레스)』이 있다.
    artandtechminji@gmail.com
    이 필자의 다른 기사 보기
인기기사