로그인|회원가입|고객센터
Top
검색버튼 메뉴버튼

SR1. Interview: ‘씨앤에이아이(CN.AI)’ 이원섭 CEO, 김보형 CTO

더 싸게, 더 많이, 더 빨리
‘With AI’ 시대 앞당길 ‘가짜’의 힘

김윤진 | 345호 (2022년 05월 Issue 2)
Article at a Glance

데이터가 넘쳐나는 시대에 기업들은 역설적으로 데이터 부족에 시달리고 있다. 데이터가 있다 한들 AI가 학습할 수 있도록 데이터에 표시를 하는 라벨링이 인간의 수작업으로 이뤄지기 때문에 가공하는 데만 많은 시간과 비용이 든다. 이런 데이터 수급의 불안정은 AI의 정확도를 개선하고 상용화하는 데 있어 가장 큰 병목으로 작용한다. 그런데 인공적으로 합성 데이터를 생성하면 데이터 한 개당 약 6달러인 라벨링 비용을 6센트까지 낮출 수 있다. 또한 환자 개인의 동의를 일일이 받느라 구하기 힘든 의료 데이터를 합성 데이터로 생성하면 8개월 걸릴 작업을 이틀 만에 끝낼 수도 있다. 합성 데이터가 AI 개발 및 운영상의 한계에 봉착한 기업들의 페인포인트를 해소하고 ‘With AI’ 시대를 앞당겨 줄 대안으로 부상하고 있는 이유다.


‘데이터에 굶주리고 있다(Data Hungry).’

2022년 MIT테크놀로지리뷰가 선정한 ‘10대 혁신 기술’에는 ‘인공지능을 위한 합성 데이터(Synthetic Data for AI)’가 등재됐다. AI가 학계와 산업계의 주요 테마로 거론돼 온 것은 하루 이틀 일이 아니다. 하지만 올해 특별히 주목할 점은 AI 응용을 위한 핵심 기술로 ‘합성 데이터’가 꼽혔다는 점이다. 이런 흐름은 AI가 진화할수록 AI 훈련에 필요한 데이터양이 천문학적으로 불어나고 있는 현상과 관련이 깊다. 똑똑한 자식을 키우기 위해 교육비가 늘어나는 것과 비슷한 이치다. 이처럼 데이터의 양이 AI의 학습 속도를 따라가지 못하게 되면서 데이터에 굶주린 빅테크들이 돌파구를 찾기 시작했고, 이들이 눈을 돌린 곳이 바로 합성 데이터다. 다르게 말하면 진짜를 모방한 ‘가짜 데이터’로 진짜 데이터를 대체해보려는 시도가 본격화됐다는 의미다.

가입하면 무료

인기기사