[DBR] 더 싸게, 더 많이, 더 빨리, ‘With AI’ 시대 앞당길 ‘가짜’의 힘

SR1. Interview: ‘씨앤에이아이(CN.AI)’ 이원섭 CEO, 김보형 CTO

더 싸게, 더 많이, 더 빨리
‘With AI’ 시대 앞당길 ‘가짜’의 힘

김윤진 | 345호 (2022년 05월 Issue 2)

로그인을 해주세요
로그인 회원가입

사이드메뉴 닫기
전체서비스 MY서비스
에디터가 강력추천하는

Special Report

Case Study

Graphic DBR

아티클
경영전략 마케팅/세일즈 인사/조직 재무회계 경영일반 리더십 자기계발 글로벌 리포트 스타트업 IT 의료 금융 유통 건설/제조 서비스 호수별 연재물별 필진별 그래픽 DBR PDF 전체보기

PREMIUM

구독

이벤트
이벤트 당첨자공지

고객센터
공지사항 FAQ 1:1문의 제휴&광고문의 이용권/상품권 인증 구독인증

DBR SNS
Facebook 카카오톡 블로그
결제내역

구독정보관리

PDF보관함

장바구니

스크랩

공유함

개인정보관리

1:1문의
- 아티클
  
  전체 기사 보기 스페셜 리포트 케이스 스터디
  직무별| 경영일반 경영전략 인사/조직 리더십 마케팅/세일즈 재무회계 자기계발 글로벌리포트
  업종별| 스타트업 IT 의료 금융 유통 건설/제조 서비스
  호수별 연재물별 필진별 그래픽DBR PDF 전체보기
- 비즈런
  
  전체강좌 패키지 비즈니스 마케팅 리더십
- 서비스신청
  
  월정액 서비스 연간 서비스 낱권 오디오북 eBook PDF 법인/단체
- 이벤트
  
  이벤트 북세통 당첨자공지
- 고객센터
  
  공지사항 FAQ 1:1문의 제휴&광고문 이용권/상품권인증 비즈런 수강권인증 구독인증
- DBR SNS
  
  Facebook 카카오톡 블로그
공유
스크랩

+ 새로운 폴더 생성
폴더명

메모입력

스크랩

Article at a Glance

데이터가 넘쳐나는 시대에 기업들은 역설적으로 데이터 부족에 시달리고 있다. 데이터가 있다 한들 AI가 학습할 수 있도록 데이터에 표시를 하는 라벨링이 인간의 수작업으로 이뤄지기 때문에 가공하는 데만 많은 시간과 비용이 든다. 이런 데이터 수급의 불안정은 AI의 정확도를 개선하고 상용화하는 데 있어 가장 큰 병목으로 작용한다. 그런데 인공적으로 합성 데이터를 생성하면 데이터 한 개당 약 6달러인 라벨링 비용을 6센트까지 낮출 수 있다. 또한 환자 개인의 동의를 일일이 받느라 구하기 힘든 의료 데이터를 합성 데이터로 생성하면 8개월 걸릴 작업을 이틀 만에 끝낼 수도 있다. 합성 데이터가 AI 개발 및 운영상의 한계에 봉착한 기업들의 페인포인트를 해소하고 ‘With AI’ 시대를 앞당겨 줄 대안으로 부상하고 있는 이유다.

‘데이터에 굶주리고 있다(Data Hungry).’

2022년 MIT테크놀로지리뷰가 선정한 ‘10대 혁신 기술’에는 ‘인공지능을 위한 합성 데이터(Synthetic Data for AI)’가 등재됐다. AI가 학계와 산업계의 주요 테마로 거론돼 온 것은 하루 이틀 일이 아니다. 하지만 올해 특별히 주목할 점은 AI 응용을 위한 핵심 기술로 ‘합성 데이터’가 꼽혔다는 점이다. 이런 흐름은 AI가 진화할수록 AI 훈련에 필요한 데이터양이 천문학적으로 불어나고 있는 현상과 관련이 깊다. 똑똑한 자식을 키우기 위해 교육비가 늘어나는 것과 비슷한 이치다. 이처럼 데이터의 양이 AI의 학습 속도를 따라가지 못하게 되면서 데이터에 굶주린 빅테크들이 돌파구를 찾기 시작했고, 이들이 눈을 돌린 곳이 바로 합성 데이터다. 다르게 말하면 진짜를 모방한 ‘가짜 데이터’로 진짜 데이터를 대체해보려는 시도가 본격화됐다는 의미다.

김윤진 | 동아일보 기자
truth311@donga.com
이 필자의 다른 기사 보기

이전 목록 다음

DBR의 교육솔루션

더 싸게, 더 많이, 더 빨리 ‘With AI’ 시대 앞당길 ‘가짜’의 힘

더 싸게, 더 많이, 더 빨리
‘With AI’ 시대 앞당길 ‘가짜’의 힘