Revisiting Big Data

데이터 만능주의 ‘분석의 함정’

299호 (2020년 6월 Issue 2)

Article at a Glance

데이터 분석을 활용해 비즈니스 기회를 확대하려는 기업들의 움직임이 분주하다. 하지만 데이터 분석의 본질과 목표를 제대로 이해하지 못하면 이 노력은 수포로 돌아갈 수밖에 없다. 새로운 모형을 설계하기 전에는 다음과 같은 상황을 다시 한번 점검해야 한다.

1. 가설이 현장의 비즈니스 상황과 이해관계자들의 상황을 제대로 반영하고 있는지 살펴봐야 한다.
2. 데이터 분석 정확도보다 더 중요한 것은 데이터 분석을 통해 비즈니스 기회를 잡는 것이다. 주객이 전도되지 않고 비즈니스의 본질을 꿰뚫을 수 있는 가설과 목표를 세워야 한다.
3. 지속적으로 가설을 의심하고 수정해 실제 비즈니스 목표에 다가갈 수 있는 유연함을 발휘해야 한다.


113


2020년 3월31일, 데이터 3법 시행령 개정안이 입법 예고됐다. 본격적인 데이터 전쟁의 서막이 올랐다는 얘기다. 국내에도 9•11 테러범을 알아낸 것으로 유명한 Acxiom 같은 데이터 브로커 기업이 등장하지 말라는 법이 없다. 기존 기업들은 지금보다 더 치열하게 데이터를 활용해 새로운 비즈니스 기회를 찾고 고객의 고민을 해결하기 위해 경쟁하게 될 것이다. 이를 위해 데이터 친화적 조직으로 기업의 체질을 바꾸고, 관리자의 역량을 갖추기 위한 작업이 더욱 빠르게 진행될 것이다. 요즘 들어 부쩍 더 많은 기업이 컨설팅사에 데이터 분석 활용 역량 확보에 관한 자문을 요청하는 것을 보면 전쟁은 이미 시작됐다.

이미 여러 번 많은 전문가가 강조한 이야기이지만 데이터 중심의 시장에서는 기업이 완벽한 답을 찾기보다는 얼마나 빠르게 가설을 세우고, 실행으로 옮기며, 실패하고 검증할 수 있는 역량을 갖추고 있느냐가 최종 승패를 결정하게 될 것이다. 즉 조직이, 분석가가, 그리고 관리자가 데이터 리터러시를 갖고 있느냐가 다가오는 데이터 전쟁에서의 핵심 무기가 될 것이다.

다만 데이터 리터러시를 확보한 데이터 친화적인 조직일지라도 모든 분석에 성공할 수는 없다. 역설적이게도 데이터 친화적인 환경을 갖춘 조직일수록 빠져들기 쉬운 데이터 분석의 함정을 경계해야 한다. 데이터로 성공한 경험이 있고 데이터를 많이 확보하고 있는 기업일수록 더욱 이러한 데이터 중심의 성공 방정식에 집착하기 쉽다.

지금부터 사례를 통해 분석 조직이 걸려들기 쉬운 데이터 분석의 함정과 이러한 함정에서 벗어나기 위한 방법에 대해 이야기해보자.

데이터 분석으로 문제를 해결해야 한다는 착각

데이터 분석 조직이 가장 쉽게 빠지는 함정은 데이터 분석 관점에서 문제를 해결하려는 집착이다. 데이터를 활용해서 풀어야 하는 문제로 비즈니스 이슈를 재정의하는 순간, 데이터 분석의 틀에 갇히게 되고, 분석의 결과가 원래의 비즈니스 이슈를 해결하는 데 도움이 되지 못한다는 사실을 뒤늦게 깨닫게 된다.

보험 시장에서 실제 분석 사례를 통해 데이터 분석의 함정에 빠지는 순간을 이해해보자. 보험 시장은 데이터 분석을 통한 혁신에 대한 니즈가 매우 높다. 대리인 문제로 인한 데이터의 신뢰성 문제, 보험 상품의 긴 구매 주기로 인한 고객 이해 어려움, 고객과 보험사 간의 정보 비대칭성으로 인한 구매 의사결정의 비합리성 등 독특한 데이터 특성을 갖고 있음에도 산업이 포화 상태에 이르렀기 때문이다.

보험 시장에서의 데이터 분석을 이야기하기 전에 먼저 보험 시장의 특징을 이해할 필요가 있다. 보험 상품은 금융 상품 중에서도 특히나 정보의 비대칭성이 극대화돼 있다. 특히 보험 상품은 고객이 가치를 판단하기 어려운 구조(일부 상품은 죽어야 보험료를 받게 되는데 누가 그 가치를 경험해 봤을까?)이기 때문에, 고객은 상품을 이해하고 혜택을 합리적으로 판단해 구매 의사를 결정하기 쉽지 않다. 이처럼 정보에 대한 비대칭성이 높아지면 고객의 의사결정은 전문가나 지인과 같은 신뢰할 수 있는 사람의 의견을 반영해 의사결정을 하게 된다. 내가 믿을 만한 사람이(또는 믿을 만한 사람이 추천한 사람이) 나에게 추천하는 상품은 믿을 만하다는 다소 비합리적 구매 결정 과정을 통해 구매 의사결정이 이뤄진다. 결국 보험 판매는 설계사의 인맥(설계사를 신뢰하는 고객)과 영업력의 산물이라는 의미다. 다시 말해, 설계사의 역량이 비즈니스 성과의 핵심이다.


114


이처럼 설계사가 비즈니스 성과에 미치는 영향이 크다면 보험사가 풀어야 하는 문제는 자명하다.

첫째, 역량 있는 설계사를 리크루팅한다.
둘째, 코칭을 통해 설계사의 역량을 키운다.
셋째, 설계사의 이탈을 막는다.

세상의 모든 보험사는 이 3가지 문제로 골머리를 앓는다. 몇 해 전부터 많은 보험사가 갈수록 악화되는 설계사의 이탈(해촉률 51%, 설계사 위촉 후 1년 내 51%가 퇴사함)을 막기 위해 잠재력이 높은 설계사를 영업하기 위한 방안을 고민했다. 설계사 이탈의 근본적인 원인이 실적 부진으로 인한 수수료 수입의 감소이기 때문에 영입 단계부터 성과를 잘 낼 수 있는 잠재력이 높은 설계사를 영입하는 것이 장기적으로 설계사의 이탈률을 낮출 수 있는 방법이라고 판단했다.

설계사 영입 문제를 해결하기 위해 먼저 설계사 리크루팅 과정을 살펴봤다. 보험사가 설계사 모집 공고를 내면 잠재력이 높은 후보자가 자발적으로 찾아오는 일은 거의 없었다. 보험사가 적극적으로 설계사 후보를 탐문하고 제안해야 했다. 예를 들면, 설계사 본인의 계약고객(지인) 중에서 보험설계사에 관심이 있는 사람을 찾거나 추천을 받는 것이다. 그래서 데이터 분석을 통해 “보험사의 고객이 설계사로서의 잠재력이 얼마나 높은가를 추정하는 모형을 만드는 것”으로 문제를 재정의했다.

분석 모형의 접근은 간단했다. 설계사 중 성과가 좋았던 설계사와 성과가 좋지 않았던 설계사를 구분하고, 학력, 거주지역, 나이, 가족 관계, 설계사 관심 동기, 과거 직업, 과거 직업 근속 기간 등 설계사의 현재 및 과거 정보가 설계사의 영업 성과에 미친 영향을 추정하는 모형을 만드는 것이다.

예를 들면, 다음과 같은 가설들을 세워 볼 수 있다.

- 과거 직장생활을 오래 했던 사람일수록 지인 관계가 많을 것이며, 초기 설계사 정착 및 성과에 미치는 영향이 클 것이다.

그러고 이러한 개별 가설을 검증하기 위한 다양한 데이터를 확보하고, 이러한 데이터가 1년 뒤 설계사의 정착 여부와 성과(영업실적)에 어떻게 영향을 미치는지를 추정하는 예측 모형을 개발하는 것이다. 실제로 설계사의 영업 성과와 장기 정착은 설계사 인맥의 규모와 품질, 설계사의 재무적 안정성, 절박함, 사회적 성향 등과 같이 사전에 파악하기 어렵거나 정량적으로 판단하기 힘든 요인이 너무 많기 때문에 모형의 정확도는 생각보다 높지 않았다. 그럼에도 불구하고 보험설계사들의 고객 중 설계사로 성공 가능성이 높은 사람을 추천해주는 새로운 모형을 만들어낼 수 있었다.

그런데 파일럿 단계에서 새로운 이슈가 발생했다. 잠재 후보 발굴 모형에서 리크루팅을 추천받은 보험설계사들이 적극적으로 움직이지 않았다. 무엇이 문제였을까? 설계사들을 탐문하고, 리크루팅 담당자, 지점장을 인터뷰하며 문제의 원인을 파악하는 과정에서 예상치 못했던 답변을 들을 수 있었다.

A의 답변

잠재력이 높은 후보 고객은 저의 영업 관점에서도 중요한 고객입니다. 기본적으로 그 사람(추천 후보)이 갖고 있는 인맥도 좋고, 보험에 대한 이해도도 높기 때문에 오히려 이 사람을 나의 핵심 고객으로 관리해서 새로운 영업 기회를 발굴하는 데 활용해야지, 이분이 설계사가 되면 오히려 제 입장에서는 경쟁자가 생기는 것과 같습니다. 제 입장에서 득이 되는 게 없네요.

B의 답변

사실 저도 추천해주신 후보를 몇 번 만난 적이 있습니다. 지금 식당 일을 하시는데 보험설계사에 관심도 있으시더라고요. 다만 개인적으로 후보를 추천하고 리크루팅을 하는 과정이 생각보다 손이 많이 갑니다. 초반에 신규 설계사가 경험이 없기 때문에 데리고 다니며 영업 경험도 시켜줘야 하고, 출근 관리도 해야 하고, 상황에 따라선 옷도 사 입히고, 밥도 사주는 경우도 많고요. 그 시간에 차라리 제 영업을 하나 더 뛰는 게 수당을 더 받을 수 있어요. 마음고생도 덜하고.

A, B의 답변을 한마디로 요약하자면, 현장에서는 우수한 잠재력을 갖고 있는 후보가 누구인지 몰라서 리크루팅을 못한 게 아니다. 본질적으로 시장의 중복으로 인한 비즈니스 기회의 손실, 리크루팅 과정상의 노력과 투자에 대한 보상 부재와 같은 데이터 분석이 아닌 정책과 보상, 프로세스 등의 측면에서 발생하는 문제가 진짜 문제였다. 데이터 분석이 비즈니스에 적용돼 성공하기까지는 이처럼 많은 부분이 고려돼야만 한다.

혹시 여기까지 글을 읽으며 느꼈는지 모르겠지만 우리는 이 문제를 해결하는 과정에서 너무도 자연스럽게 함정에 빠졌다. 비즈니스 요구사항은 ‘역량 있는 설계사를 뽑아야 한다’였고, 이를 위한 문제 정의를 ‘역량 있는 설계사 후보를 추정하기 위한 모형 개발이 필요하다’로 선언한 순간 미묘하게 문제가 틀어져 버린 것이다. “데이터로 이 문제를 어떻게 해결할 것인가?”로 프레이밍을 하는 순간 문제가 달라졌다. 데이터 분석가가 후보 잠재력 추정 모형의 정확도를 높이는 다양한 가설을 만드는 데만 집중한다면 데이터 외의 고려해야 하는 부분들이 간과될 가능성이 있다.

이와 같은 데이터 분석에 집착한 프레이밍 문제로 인한 데이터 분석의 실패는 현장에서 빈번하게 발생한다. 데이터 분석 조직은 스스로를 끝없이 의심할 필요가 있다. 지금 풀고 있는 문제가 진짜 문제인가? 데이터 분석으로 풀어야 하는 문제인가? 혹시 데이터로 풀기 위한 문제로 관점이 바뀐 것은 아닌가? 분석 외 고려해야 할 점을 놓치고 있지 않은가? 만약 그렇다면 지금 풀고 있는 문제는 분석을 위한 분석으로 끝나버릴지도 모른다.

정확도 높은 분석에 대한 집착

오늘날 진행되는 많은 데이터 분석 과제는 예측 모형을 개발하는 경우가 많다. 이때 예측 모형의 결과가 비즈니스에 활용되기 위해서 ‘예측의 정확도’가 핵심 판단 기준이 된다. 딥러닝 알고리즘의 발달로 정확도에 대한 현장의 요구 수준이 점점 높아지고 있는데 문제는 데이터와 분석에 집중할 때 빠지기 쉬운 또 다른 함정이 ‘예측 정확도에 대한 집착’이라는 점이다.

다시 보험사 사례로 돌아가 보자. 앞서 이야기한 것처럼 보험 상품은 고객이 스스로의 가치 판단에 의해 구매 의사결정하기 쉽지 않다. 그 결과 긴급 자금의 필요나 현금 흐름의 유동성 이슈 등이 발생하면 “내가 굳이 계속 이 보험을 유지해야 할까?”에 대한 고민이 생기고 고객은 더 큰 손해를 보기 전에 해지하는 경향이 강하다.

일부 보험사는 고객의 이탈률을 낮추기 위해 보험 계약의 해지 위험성을 사전에 탐지하는 데이터 분석 프로젝트를 수행했다. 다양한 가설을 세우고 분석을 진행했으나 좀처럼 예측 정확도가 개선되지 않다가 ‘연체 발생 정보’를 변수로 활용하는 순간 계약 해지의 예측 정확도가 드라마틱하게 증가하는 것을 발견했다. 이제는 영업팀에서 분석의 결과를 어떻게 활용할 것인가를 고민하기만 하면 될 것이라 판단했다. 하지만 현장에 적용하는 데는 새로운 어려움이 발생했다.

위의 사례에는 논리적 모순이 있었다. 이는 크게 2가지 문제를 발생시키면서 프로젝트는 조용히 마무리되고 말았다. 핵심은 ‘예측의 정확도를 높이기 위해 연체 발생 정보를 이탈 예측 모형에 활용해도 되는가?’였다. 왜 ‘연체 정보’를 활용하는 것이 문제가 되는 걸까?

첫 번째 문제는 “연체는 이탈의 선행 지표이며, 이탈에 준하는 수준의 위험이다. 즉, 이탈 예측 모형에 연체 정보를 활용하는 것은 ‘이탈로 이탈을 예측’하는 것과 같은 것이 아닌가?”라는 질문이었다. “설령 연체 정보를 활용해 이탈을 정교하게 예측할 수 있다 하더라도 이미 연체가 발생하는 순간 이탈을 방어하기 위해 우리(보험사)가 해줄 수 있는 게 없지 않은가? 보험료를 대신 납부해 줄 것인가?”가 두 번째 문제였다.

표현이 이상하긴 하지만 이탈 예측의 본질은 ‘이탈 방어’지 ‘이탈 예측’이 아니다. 고객의 이탈을 ‘99%’의 정확도로 예측하고 ‘예측이 정말 정확한데? 진짜로 고객이 계약을 해지하네. 예측 잘했네”라고 칭찬받는 걸 목표로 분석 모형을 개발하는 것이 아니라 정확도가 70%라도 이탈을 방어할 수 있는 기회를 잡는 것이 분석의 목적이다. 결국 예측의 정확도를 일정 부분 포기하더라도 “얼마나 빨리 이탈을 예측해야 이탈을 방어할 수 있는가?” “이탈을 방어할 수 있는 유형을 분류할 수 있는가?”와 같이 데이터 분석 과제를 다양한 관점으로 세분화해 검토해야 한다는 말이다.

다음의 사례를 한번 더 살펴보자.

B2B 영업을 하는 C사는 영업 기회 발굴을 위해 데이터 분석 프로젝트를 진행했다. 영업사원들의 영업활동 정보와 업계 뉴스 정보를 통해 향후 1개월 내 신규 계약 기회를 발굴해서 영업 역량을 집중하는 것을 목표로 분석을 진행했다. 거래처들의 규모가 크지 않아 뉴스나 소셜데이터로는 영업 기회를 발굴하기 어려웠고, 과거 거래 패턴에 대한 분석만으로 신규 계약 기회를 예측하는 데는 한계가 있었다. 데이터 분석팀은 다양한 변수를 분석하는 과정에서 ‘영업사원의 최근 1개월 내 거래처 접촉 횟수’가 신규 계약 기회 예측 정확도를 크게 증가시킨다는 것을 발견했다.

앞의 보험사 사례와 유사한 관점에서 눈치챘겠지만 ‘최근 1개월 내 거래처 접촉 건수’는 과연 예측에 활용해도 되는 데이터일까? 정확도 개선에는 분명 도움이 되는 변수였지만 의구심이 생겼다. “영업사원은 영업 기회가 탐지돼 지속적으로 방문하고 있었던 것은 아닌가? 방문을 많이 해서 신규 계약이 생기는 것이 아니라 신규 계약 기회를 탐지한 영업사원이 방문을 많이 했다고 해석해야 하는 게 아닐까?”

이처럼 데이터 분석이 ‘정확도’에 집착하면 주객이 전도되는 상황이 발생할 수 있다. 데이터 분석 조직 관점에서는 정확도를 개선할 수 있는 데이터 중 하나일 뿐일지 모르나 역으로 정확도에 대한 집착이 인과관계를 왜곡하고 데이터 분석에 들인 노력을 한순간에 물거품으로 만들 수도 있다는 사실을 경계해야 한다.

이러한 함정에 빠지지 않기 위한 방법은 단 한 가지다. 끊임없이, 그리고 의식적으로 ‘무엇이 문제인가?’ ‘지금 풀고 있는 문제가 진짜 문제인가?’ ‘데이터로 해결해야 하는 문제가 맞는가?’와 같이 비즈니스의 본질을 파고들며 ‘문제를 의심하는 것’ 외엔 해결 방법이 없다. 결국 문제 정의가 문제라는 말이다.

117


제대로 된 문제정의란 무엇일까?

‘머니볼’은 메이저리그 최하위 팀인 오클랜드 애슬래틱스가 데이터를 야구에 도입하면서 겪는 전통과의 충돌 등 수많은 시행착오를 통해 리그 최정상이 되기까지의 드라마틱한 성공 스토리를 다룬 이야기다. 극 중 데이터 분석가인 피터 브랜드가 이렇게 말한다.

“모두 야구를 잘못 이해하고 있어요. 중요한 건 선수가 아니라 승리를 사는 것입니다.”

이 한마디는 데이터 분석과 문제 정의의 본질을 관통하고 있다.

야구의 본질은 개인이 홈런을 많이 치고, 투수가 160㎞ 공을 던지는 것이 아니다. 홈런을 단 1개도 치지 못하더라도, 투수가 공을 130㎞밖에 던지지 못하더라도 ‘팀이 승리한다’가 가능하기만 하면 된다. 물론 우리는 강속구 투수에 환호하고 홈런 타자에 열광하지만 야구의 궁극적인 목표는 상대보다 더 많은 점수를 내는 것이다. 점수를 내는 방법이 홈런이든, 안타든, 번트든, 도루든 중요하지 않다.

비즈니스 현장에서의 데이터 분석도 마찬가지다. 앞서 이야기한 보험사의 계약 해지 문제 역시 이탈 예측의 정확도가 낮더라도 계약 해지를 막아낼 수만 있으면 된다. 어쩌면 예측 모형이 필요치 않을 수도 있다. 이탈을 예측해야 이탈을 막을 수 있다는 것은 지극히 데이터 분석 관점의 편견일지도 모르다. 실제로 설계사가 고객을 직접 대면하고 교류하는 활동을 주기적으로 하도록 관리 체계를 개선하는 것만으로 계약 해지가 감소한 사례도 있다. F 보험사의 경우 보험설계사의 수당 지급 조건을 13차(1년) 계약 유지에서 18차(1년6개월)로 변경하는 것만으로도 고객의 계약이탈률이 급격히 개선된 사례도 있다.

널리 알려진 드라마앤컴퍼니의 ‘리멤버’는 비즈니스 본질을 파고든 데이터 분석 vs. 문제 정의의 좋은 사례라 할 수 있다. 2014년 OCR(Optical Chracter Recognition, 광학 문자 인식) 기능으로 무장한 명함 관리 서비스 앱들이 우후죽순 등장하던 시기에 리멤버는 사람(500여 명의 타이피스트)이 입력하는 명함 앱으로 시장을 압도했다. 이게 무슨 혁신일까 싶지만, 고객은 단 한 번도 ‘OCR’ 기능을 요구한 적이 없다. 다만 자동으로, 편하게, 정확하게, 고객을 대신해서 명함을 관리할 수 있는 서비스가 필요했을 뿐이다. 오히려 OCR 기반의 명함 관리 앱들의 부정확한 인식률은 고객의 핵심 니즈인 ‘편하게와 정확하게’를 전혀 만족시키지 못하는 상황이었고, 리멤버는 이를 훌륭하게 해결해냈다. 데이터 분석의 함정에 빠지지 않고 문제의 본질에 집착한 결과물이다.

그렇다면 이처럼 중요한 문제 정의를 잘하기 위해서는 데이터 분석 조직은 어떠한 역량을 갖춰야 할까?

118


문제 정의의 핵심은 유연성이다

실제 현장에서 ‘문제 정의의 실패’는 데이터 분석 프로젝트가 성과를 내지 못할 때 내부에서 가장 먼저 나오는 비판이다.

“이걸 왜 분석한 거지?
우리가 풀려고 하는 Business Problem이 대체 뭐야!
Why가 없잖아!!!”

데이터 분석 프로젝트 결과에 대해 한 임원이 했던 지적이다. 너무 원론에 가까운 이야기라 반론을 제기하기도 어렵다. 사실 많은 데이터 전문가의 견해에서도 빠지지 않고 등장하는 것이 ‘문제 정의’에 관한 지적이다. 뚜렷한 비즈니스 목적과 방향이 없고, 프로젝트가 시작될 때 명확한 문제정의를 하지 않았기 때문에 프로젝트가 실패했다고 이야기한다. 실제로 2017년 캐글(Kaggle)에서 데이터 전문가들을 대상으로 한 설문에서조차 ‘분석을 통해 해결할 문제가 명확하지 않다’는 점이 ‘데이터 부족’ ’조직의 데이터 분석 역량 부족’ 등에 이어 4번째로 지적됐다.

비즈니스 이슈를 발굴하는 조직과 데이터를 분석하는 조직이 완전히 분리돼 있다면 맞는 평가이겠으나 이상적인 데이터 친화적 조직, 즉 비즈니스 기획과 데이터 분석가가 한 팀으로서 유기적으로 운영되는 조직 관점에서는 조금 다른 관점에서 생각해 볼 필요가 있다고 생각한다.

조금 이상하게 들리겠지만 사전에 잘 정의된 문제로 시작하는 데이터 분석 프로젝트는 거의 없다. 적어도 필자의 경험에서는 명확하게 문제가 도출된 프로젝트는 거의 없었다. 사실 처음부터 명확한 문제 정의가 돼 있었다면 이미 해답 또한 알고 있는 문제였을 것이다. 그랬다면 몇 개월씩 뭔가 분석하고 검토할 것도 없었을 것이다. 아마 컨설팅 회사를 부르지도 않았을 것이다. 보통은 문제를 파악해가는 과정을 반복하면서 가설적 문제 정의와 해결책을 수립하고, 검증하고, 수정한다. 업무 프로세스처럼 순차적으로 단계별로 진행되지 않고 적절한 해답을 발견할 때까지 여러 번 앞뒤를 오가며 반복해서 수행하게 된다.

이제 우리는 시작부터 데이터로 풀어야 할 문제가 명확해야 한다는 강박에서 벗어나 조금 다른 관점에서 생각해 볼 필요가 있다. 데이터 분석의 과정 자체가 문제를 정의하는 과정이라고 봐야 한다. 프로젝트가 단순히 주어진 문제를 데이터 분석을 통해 해결하는 과정이 아니라 문제를 의심하고 재정의할 수 있어야 한다. 분석 프로젝트가 진행되는 과정에서 수없이 많은 가설의 수립과 검증, 수정을 반복하게 되고, 그 결과 진짜 비즈니스 문제와 진짜 비즈니스 문제의 해결책에 가까워지게 되는 것이다. 아이러니하게도 문제를 풀기 시작해야 무엇이 문제인지 알 수 있다는 의미다.

결국 데이터 분석 조직이 갖춰야 하는 핵심 역량은 ‘주어진 문제가 잘못 정의됐을 수도 있다’는 합리적 의심에서 출발해 이를 검증하기 위한 가설을 세우고, 문제를 수정할 수 있는 ‘유연성’이 될 것이다. 전통적인 데이터 분석 조직처럼 비즈니스 조직의 분석 요청에 수동적으로 대응하기만 해서는 데이터 분석의 함정에서 빠져나올 수 없다.


정성문 PwC컨설팅 Emerging Technology Lab 이사 sungmoon.cheong@pwc.com
필자는 KAIST 전기 및 전자공학과를 졸업하고 동 대학원에서 머신러닝 분야를 연구, 석사 학위를 받았다. 한국전자통신연구원(ETRI)에서 데이터 분석 및 신기술 개발 연구를 진행했다. 금융사 및 글로벌 컨설팅사에서 10여 년간 근무하며 CRM, 고객행동분석 등 데이터 기반 비즈니스 전략 및 데이터 분석 업무를 수행하고 현재는 PwC컨설팅의 Emerging Technology Lab의 이사로 재직 중이다.
동아비즈니스리뷰 305호 New Era of Data Business 2020년 9월 Issue 2 목차보기