2015년 설립한 테스트웍스는 자폐성 장애인, 지적장애인 등 발달장애인들을 고용해 인공지능(AI) 학습용 데이터 가공 업무를 수행하는 사회적기업이다. 지난해 약 49억 원의 매출액을 올렸고, 현재 약 50곳의 고객사를 대상으로 AI 데이터를 가공해 납품하고 있다. 사업 초창기엔 제대로 된 준비도 없이 ‘취약계층 일자리 창출’이란 소셜 미션과 진정성만 앞세우다 형편없는 품질로 고객사로부터 계약 중도 해지 통보를 받는 등 위기를 맞기도 했다. 하지만 1) 품질관리 시스템을 체계화하고 2) 고객사와의 커뮤니케이션 방식을 정립하며 단기간 내 품질을 높여 위기를 극복했다. 이후 1) 자폐성 장애인 채용 프로세스 체계화 2) 자폐성 장애인 업무 적응을 위한 관리지원 시스템 정비 3) 비장애인 직원 대상 자폐성 장애인과의 소통 교육 실시 등을 통해 장애인이 어떠한 편견이나 차별 없이 일할 수 있는 ‘포용적 고용(inclusive employment)’의 모범을 제시하고 있다는 평을 받고 있다. 영화 ‘아이언맨’ 시리즈에 나오는 캐릭터 ‘자비스’는 우리가 원하는 인공지능(AI)의 전형적 모델로 통한다. 하지만 자비스처럼 제아무리 뛰어난 AI도 처음부터 똑똑할 순 없다. 기계를 스스로 생각하는 인간처럼 만들기 위해선 학습 데이터가 필요하다. 이 과정에서 필연적으로 수반되는 게 데이터 전처리 과정이다. 맨 처음부터 기계 스스로 생각할 수는 없기 때문에 일일이 사람 손으로 가공한 데이터를 입력해 줘야 한다.
가령, 자율주행기술 구현을 위한 영상인식 AI가 사람과 자동차를 구분할 수 있게 만들려면 AI에 시각 데이터를 계속 보여주면서 어떤 게 사람이고, 어떤 게 자동차인지 분간할 수 있게 해줘야 한다. 당연히 사진이나 영상을 있는 그대로 보여줘서 될 일은 아니다. 이미지 속 객체(object)마다 주변에 사각형 상자로 경계(bounding box, 바운딩 박스)를 만들거나 객체 형상 그대로 테두리를 치는 식(polygon segmentation, 다각형 분할)으로 영역을 설정한 후, 해당 객체가 무엇인지 일일이 설명을 달아주는 가공 과정(data labelling, 데이터 라벨링)이 필요하다.(그림 1)
AI 산업의 성장과 함께 머신러닝 학습을 위한 데이터 수요가 늘면서 AI 개발을 위한 데이터 가공 서비스에 대한 관심도 높아지고 있다. 2015년 6월 설립한 테스트웍스(Testworks)는 최근 이 분야에서 두각을 나타내고 있는 회사 중 하나다. 국내 자율주행 스타트업의 대표주자로 딥러닝 기반의 영상 인식 기술을 보유한 스트라드비젼11DBR 282호 ‘DBR Case Study: 스트라드비젼의 자율주행 기술 전략’ 참고
닫기이 테스트웍스의 핵심 고객사다. 테스트웍스는 작년 스트라드비젼 한 회사에만 약 460만 건(사람, 자동차 등 데이터 이미지 안에 포함된 객체 기준)22이미지 기준 가공 실적은 약 81만 건.
닫기의 AI 학습용 데이터를 가공해 납품했다. 2019년 이 회사가 가공한 AI 학습용 데이터 건수는 약 1800만 건. 회사 설립 이래 지금까지 누적 가공한 데이터 건수는 약 3300만 건(2020년 2월 말 기준)에 달한다.
이방실smile@donga.com
- (현) 동아일보 미래전략연구소 기자 (MBA/공학박사)
- 전 올리버와이만 컨설턴트 (어소시에이트)
- 전 한국경제신문 기자