Top
검색버튼 메뉴버튼

MIT Sloan Management Review

데이터 과학 프로젝트의 5가지 실수

닝 수(Ning Su),마유르 조시(Mayur P. Joshi) | 341호 (2022년 03월 Issue 2)
Article at a Glance

인도의 민간 은행 3곳을 대상으로 분석한 연구는 데이터 과학 활동을 하는 기업들이 쉽게 저지르는 다음의 5가지 실수를 보여준다.

1. 모기를 보고 칼을 빼는 것처럼 기술에 압도돼 비즈니스 맥락을 잘못 짚음
2. 데이터 분석 과정에서 편향의 출처를 인식하지 못해 편향이 모델에 스며듦
3. 솔루션은 맞지만 비즈니스 우선순위나 시스템과 부합하지 않아 적기를 놓침
4. 툴에는 문제없지만 사용자 경험을 분석하지 않아 시장 반응이 예상과 다름
5. 험난한 마지막 단계를 넘지 못함



편집자주

이 글은 MIT 슬론 매니지먼트 리뷰(SMR) 2021년 봄 호에 실린 ‘Why So Many Data Science Projects Fail to Deliver’을 번역한 것입니다. 이 글에 의견이 있는 분은 http://sloanreview.mit.edu/x/62317에 접속해 남겨 주시기 바랍니다.

점점 더 많은 기업이 데이터 과학을 회사의 핵심 기능이자 역량으로 받아들이고 있다. 하지만 이 중 다수가 빅데이터, 인공지능, 머신러닝에 대규모 투자를 하고도 비즈니스 가치를 지속적으로 창출하지 못하고 있다.1 게다가 데이터 과학을 통해 성공적으로 가치를 확보하는 조직과 그렇지 못해 고군분투하는 조직 간 격차가 더욱 벌어지고 있다는 근거들도 있다.2

필자들은 기업이 수익성 높은 데이터 과학 프로젝트를 실행할 때 저지르는 실수를 더 잘 이해하고, 그런 실수를 피하는 방법을 발견하기 위해 심층 연구를 수행했다. 인도의 10대 민간은행 중 데이터 분석 조직이 잘 갖춰진 3개 은행에서 벌인 데이터 과학 활동이 연구의 대상이 됐다. 연구 결과 기업이 쉽게 저지르는 5가지 실수를 확인할 수 있었다. 지금부터 사례들을 통해 그 내용을 설명하고 이 실수들에 대처하는 해법을 제시하려고 한다.

113


실수 1 모기를 보고 칼을 빼는 경우. 데이터 과학자 히렌은 필자들이 연구한 은행 중 한 곳에서 최근 고용한 인력으로 기업들이 서로 탐내는 분석의 귀재다.3 그는 특히 데이터 클러스터를 식별하고 분류하는 데 유용한 KNN(K-Nearest Neighbors, K-최근접 이웃) 알고리즘 전문가였다. 히렌은 면접에서 “연구를 하면서 다양한 시뮬레이션 데이터세트에 KNN 알고리즘을 적용했습니다. 이를 실제 데이터에도 빨리 적용해 보고 싶습니다”라고 말했다.

몇 달 후 히렌의 바람은 실현됐다. 그는 KNN 알고리즘으로 은행의 기업용 당좌예금 포트폴리오 안에서 수익성이 특히 높은 산업 부문을 확인하는 임무를 맡았다. 그리고 분석을 통해 총 33개 산업 중 2개 산업 부문을 집중 공략해야 한다는 결론을 기업당좌예금팀에 제시했다.

하지만 기업당좌예금팀 직원들은 이런 결론에 시큰둥한 반응을 보였다. 그들은 이미 간단한 계산으로 산업 부문별 수익성을 확인하고 있었고, 히렌이 제안한 두 부문의 중요성도 알고 있었다. 당좌예금팀 입장에서는 그런 작업에 굳이 KNN 알고리즘을 사용하는 것은 공기총으로도 충분한데 미사일을 사용하는 것과 같았다.

이 사례는 물론이고 필자들이 연구한 세 은행에서 모두 과학적 솔루션에 너무 심취한 나머지 비즈니스 가치를 얻지 못한 경우들이 다수 확인됐다. 이런 실패는 여러 형태로 나타날 수 있다. 히렌이 해결하려던 문제에는 KNN 알고리즘 같은 정교한 해법이 필요하지 않았다. 또 다른 사례에서는 한 분야에서 성공적이었던 데이터 과학 솔루션이 다른 분야에서 적절하거나 효과적이지 않았다. 이런 실수는 분석 기법을 기술적으로 잘못 실행해서가 아니라 잘못 적용했기 때문에 발생한다.

히렌은 회사의 비즈니스를 더 깊숙이 이해하게 된 뒤 기업당좌예금팀에 새로운 제안을 했다. 이번에도 KNN 알고리즘을 활용하자고 했지만 산업 수준이 아니라 고객 수준에서 살펴보겠다는 점이 달랐다. 이 접근법은 비즈니스 상황에 훨씬 더 적합했고 당좌예금팀이 미처 살피지 못한 고객 세그먼트를 공략함으로써 새로운 통찰력을 제공했다. 똑같은 알고리즘이었지만 더 적절한 맥락에서 사용하자 비즈니스 가치를 실현할 수 있는 잠재력이 훨씬 커졌다.

분석 솔루션을 비즈니스와 상황에 더 민감한 방식으로 개발하고, 그것을 적용했을 때 가장 큰 효과를 발휘할 수 있도록 하는 것은 로켓 과학처럼 어려운 일이 아니다. 하지만 본 연구에서 접한 기업체의 많은 관리자는 데이터 과학을 로켓 과학처럼 부담스럽게 대하고 있었다. 이렇게 대하다 보면 자칫 분석 기술의 하이테크 이미지에 압도돼 비즈니스의 맥락을 놓칠 수 있다. 관리자들의 이런 경향은 해당 솔루션이 다른 분야에서 잘 작동하는 경우 혹은 ‘AI’와 ‘기계학습’처럼 흥미로운 기술이 솔루션에 적용된 경우에 더욱 강해졌다. 분석 방법에 치중하는 데이터 과학자들 또한 종합적인 관점을 갖지 못하거나 제시하지 못할 때가 많았다.

연구 대상이 된 은행들의 고위 관리자들은 주로 교육을 통해 이 문제를 해결하려 했다. 한 은행의 경우 신입 데이터 과학자들에게 제품 관계 관리자(PRM)들과 함께 도메인 전문가가 가르치는 교육 과정을 이수하도록 했다. 또 직급별 비즈니스 관리자 전원을 대상으로 데이터 과학 부서장이 가르치는 데이터 과학 교육 과정을 이수하게 했다. 교육 커리큘럼에 걸쳐 기본 분석 개념과 함께 특정 솔루션 기법에 대해 던질 질문, 그 기법을 사용해야 하는 경우와 사용하면 안 되는 경우를 중점적으로 다뤘다. 모두 데이터 과학을 비즈니스 맥락에 맞게 활용하기 위해 설계된 교육이었다. 그리고 이들 교육은 데이터 과학자, 비즈니스 관리자, 도메인 전문가들이 서로의 지식을 더 잘 공유하고 서로의 직무를 더 잘 이해하는 것을 목표로 삼았다.

특정 솔루션을 너무 급하게 채택하는 실수를 방지하기 위해 프로세스 중심의 해법들도 제시됐다. 미국에 본사를 둔 대형 항공우주회사 하나는 소위 7가지 방법(Seven Ways)이라는 접근법을 활용했다. 이 회사의 팀들은 적어도 7가지 후보 솔루션을 확인하고 비교한 뒤 그중 최선의 솔루션을 최종 선택하는 접근을 택했다.

실수 2 편향의 출처를 인식하지 못하는 경우. 데이터 과학자 프라나브는 통계 모델링 분야의 전문가다. 그는 중소기업의 담보대출 신청을 승인하는 언더라이터(underwriters)들에게 조언을 제공하는 알고리즘을 개발하고 있었다. 프리나브는 지난 10년간 처리된 모든 대출 신청 건에 대한 신용 승인 메모(CAM, credit approval memos) 정보들을 바탕으로 기업들의 대출 신청 당시 재무 건전성과 현재의 재무 건전성을 비교했다. 몇 달 만에 아주 정확한 소프트웨어 툴을 성공적으로 개발했고, 언더라이팅팀 역시 해당 툴을 사용하기 시작했다.

하지만 6개월 후 확인해 보니 중소기업들의 대출 연체율이 그 툴이 사용되기 전보다 사용 후 오히려 더 높아졌다. 당황한 고위 관리자들은 경험 많은 언더라이터 한 명을 지정해 프라나브와 함께 잘못의 근원을 파악하게 했다.

언더라이터는 프라나브가 입력 데이터로 CAM 정보들을 쓴 것을 알게 된 뒤 문제의 원인을 깨닫게 됐다. CAM은 숙련된 관계 관리자(RM)들이 이미 사전 심사를 마쳐 대출이 승인될 가능성이 매우 높은 대출 건들을 위해서만 사용되던 정보였다. 언더라이터는 이런 사실을 이미 알고 있었지만 프라나브는 몰랐다. 그 결과 사전 심사 단계에서 탈락된 대출 신청 데이터는 모델 개발 과정에 포함되지 않았고, 결과적으로 엄청난 편향적 상황이 초래된 것이다. 이런 편향으로 인해 프라나브는 ‘부도수표’라는 의사결정상의 중요한 파라미터를 놓치고 말았다. RM들이 사전 검사를 실시해 통과된 대출 신청 기업에서는 부도수표가 발생하는 경우가 아주 드물었기 때문이다.

다행히 이런 문제는 기술적으로 쉽게 바로잡을 수 있었다. 프라나브가 사전 심사에서 거부된 대출 신청들의 데이터를 추가하자 분석 모델에서 부도수표 파라미터가 중요한 요소가 됐고 편향이 수정됐다. 이후 소프트웨어 툴은 의도했던 방향으로 작동하기 시작했다.

기업이 데이터 과학을 통해 비즈니스 가치를 달성하는 데 있어 더 큰 관건은 편향의 원인을 확인하는 일이다. 나아가 이런 편향이 애초에 모델에 스며들지 않도록 원천 봉쇄하는 것도 중요하다. 이 작업이 까다로운 이유는 분석 모델이라는 블랙박스가 결과를 어떻게 만들어 내는지를 일반 직원은 물론이고 분석 전문가조차 쉽게 파악하지 못하기 때문이다. 게다가 이런 ‘블랙박스’를 이해하는 분석 전문가들도 자신이 사용하는 미가공 데이터에 내재된 편향을 인식하지 못할 때가 많다.

본 연구에 포함된 은행들은 부지불식간에 발생하는 이런 편향을 피하기 위해 데이터 과학자들로 하여금 분석 모델에 이용되는 데이터 소스를 더 잘 이해하도록 했다. 가령 어떤 데이터 과학자는 한 달 내내 은행 지점에서 RM을 그림자처럼 따라다니면서 모델이 정확한 결과를 산출하는 데 필요한 데이터가 무엇인지 파악했다.

또 다른 은행에서는 데이터 과학자와 비즈니스 담당자들로 구성된 프로젝트팀이 잠재적 예측 변수와 관련 데이터 소스를 파악하고 각 소스에서 잠재적으로 발생할 수 있는 편향들을 철저히 검토하도록 편향 방지 프로세스를 가동했다. 이런 프로세스의 목적은 담당자가 세운 가정에 의도적으로 의문을 제기해 보고 데이터의 문제 요소들을 제거하는 것이다. 그래야 데이터가 생성되거나 수집되는 과정에서 발생할 수 있는 문제를 미연에 방지할 수 있기 때문이다.4

실수 3 솔루션은 맞지만 시기가 잘못된 경우. 기계학습에 특화된 데이터 과학자 카르틱은 예금계좌 고객들이 이탈할 원인을 분석하기 위해 한 달여간 정교한 모델을 개발했다. 이후 모델의 정확성을 높이기 위해 정밀 조정 작업에 3개월을 더 투자했다. 그가 개발한 최종 모델은 예금계좌 제품팀의 감탄을 자아냈지만 안타깝게도 부서의 연간 예산이 이미 바닥난 상태라 실행되지는 못했다.

이듬해 카르틱은 같은 실수를 반복하지 않으려고 예산 사이클이 시작되기 전에 모델을 제품팀에 제시했다. 하지만 이번에는 고위 경영진의 의사결정에 따라 팀의 업무가 계좌 유지에서 신규 계좌 취득 쪽으로 바뀌고 말았다. 팀은 또다시 카르틱의 모델을 실행할 수 없게 됐다. 그는 프로젝트를 시작한 지 3년 되던 해에 마침내 프로젝트를 승인받았다. 하지만 이미 모델이 구식이 돼 그다지 축하할 상황은 아니었다. 카르틱은 실망감이 역력한 얼굴로 이렇게 말했다. “이제는 제품팀이 모델을 실행하고 싶어 하지만 그 사이 모델이 한물가서 다시 만들어야 할 것 같습니다!”

이 사례에서 은행이 가치를 실현할 수 없었던 까닭은 데이터 과학과 비즈니스의 우선순위 및 프로세스가 잘 부합하지 않았기 때문이다. 이런 상황을 피하려면 데이터 과학과 비즈니스 전략 및 시스템이 더 잘 연계돼야 한다.

고위 임원들은 데이터 과학 활동과 데이터 과학자들을 물리적, 구조적, 프로세스적으로 비즈니스와 더 긴밀히 통합함으로써 데이터 과학 활동이 조직의 전략 및 시스템과 더 잘 연동되게 만들 수 있다. 예를 들어 한 은행은 프로젝트를 중심으로 데이터 과학자들을 비즈니스팀에 합류시켰다. 데이터 과학자들은 매일 비즈니스팀과 협력하면서 그들의 우선순위와 업무 데드라인을 자연스레 습득하게 됐다. 그 결과 데이터 과학자들이 겉으로 표출되지 않는 비즈니스 니즈까지 먼저 예측하는 경우도 생겼다. 또한 데이터 과학팀과 비즈니스 담당 팀을 같은 공간에 배치하는 것은 물론이고 프로젝트 활동들을 비즈니스팀의 사무실에서 실행하게 했다. 데이터 과학자들이 의무적으로 비즈니스팀 회의에 참석하고 관련 활동을 함께 수행하는 프로세스도 찾아볼 수 있게 됐다.

일반적인 상황이라면 데이터 과학자들은 비즈니스 리더들이 가장 중요시하는 문제에 집중해야 한다.5 그러나 주의할 것이 있다. 현재의 비즈니스 우선순위에 부합하든 아니든, 가끔 데이터 과학을 활용하다 보면 고위 임원들이 주목해야 할 중요한 통찰력이 예기치 않게 도출되기도 한다는 것이다.6 따라서 약간의 기교를 발휘해야 한다. 비즈니스의 현재 우선순위나 시스템에는 부합하지 않더라도 회사에 상당한 가치를 제공할 만한 통찰력이 나왔다면 데이터 과학자는 이를 경영진에게 꼭 전달해야 한다.

이런 탐색을 촉진하기 위해 어떤 은행의 경영진은 별도의 데이터 과학자들을 프로젝트팀에 배치하기도 했다. 이때 데이터 과학자들은 비즈니스팀과 같은 공간에서 일하지 않았다. 그 대신 팀의 우선순위에 연연하지 말라는 지시를 받았다. 이어 그들에게는 프로젝트와 관련된 대안 솔루션을 개발하는 임무가 떨어졌다. 이 대안 솔루션이 실행 가능하다고 판단이 서면 데이터 과학 부서장이 그 내용을 고위 경영진에게 보고했다. 이런 이중 접근 방식을 활용하면 데이터 과학자와 비즈니스 담당자들의 지식 사이에 상호의존성이 있다는 것을 깨닫게 될 수 있다. 즉, 데이터 과학으로 오늘날의 비즈니스 니즈를 해결할 뿐만 아니라 현재의 비즈니스 관행을 혁신하거나 탈바꿈할 기회도 탐색할 수 있는 시나리오가 마련되는 것이다.7 데이터 과학으로 가능한 많은 비즈니스 가치를 실현하려면 이 두 역할 모두 중요하다.

실수 4 툴은 맞지만 사용자가 잘못된 경우. 소피아는 비즈니스 분석가로서 은행 고객에게 정확히 맞춤화된 신제품과 서비스를 제공할 수 있는 추천 엔진을 팀원들과 함께 개발하고 있었다. 이 추천 엔진은 마케팅팀의 도움 덕분에 은행의 모바일 월렛 앱과 인터넷뱅킹 사이트, e메일에 적용됐다. 하지만 기대했던 새로운 사업 기회는 발생할 기미를 보이지 않았다. 상품을 추천해도 가입하는 고객 비중이 기대보다 훨씬 낮았다.

이유를 파악하기 위해 은행의 텔레마케터들은 추천된 신제품에 가입하지 않은 고객들을 대상으로 설문 조사를 실시했다. 수수께끼는 빠르게 풀렸다. 많은 고객이 앱이나 웹사이트, e메일이 추천하는 상품의 신뢰성을 의심했다.

소피아는 그보다 더 구체적인 답을 원했기에 여러 은행 지점을 직접 방문했다. 그 결과 고객들이 RM의 조언을 엄청나게 신뢰한다는 사실을 알게 됐다. 그녀는 몇 가지 비공식적인 실험을 통해 추천 엔진이 제안한 상품을 은행 지점에서 RM이 직접 소개하면 고객들이 이 상품을 수용할 가능성이 훨씬 높아질 것이라는 확신을 얻었다. 문제의 원인은 추천 모델이 아니라 추천을 하는 방식이라는 사실을 알게 된 것이다. 이후 소피아는 지점 임원들을 만나 추천 엔진을 RM이 제품을 판매할 때 활용할 수 있는 보조 도구로서 재출시하자고 제안했다. 이렇게 수정된 프로젝트는 큰 성과를 거뒀다.

소피아가 겪은 어려움은 분석 툴에서 나온 결과물을 전달하는 방법이 그만큼 중요하다는 사실을 보여준다. 고객과 비즈니스를 위한 가치를 완전히 끌어올리려면 데이터 과학 설계 프로세스에 사용자 경험에 대한 분석 결과를 함께 넣어야 한다. 적어도 데이터 과학 프로젝트의 수명 주기 안에 사용자 테스트를 명시적으로 포함해야 한다. 이보다 더 좋은 방법은 데이터 과학 활동을 인간 중심 설계 프레임 안에 녹여 넣는 것이다. 이런 설계 프레임에는 사용자 테스트 외에도 데이터 과학 프로세스의 프런트 엔드(front end, 사용자 인터페이스(UI)처럼 사용자와 시스템이 직접적으로 접속되는 입력 부분-역주)에 관한 사용자 조사도 의무적으로 포함시켜야 한다.

본 연구에서는 디자인싱킹(design thinking)이나 인간 중심 설계 방식에 데이터 과학 활동을 포함한 사례를 보지 못했다. 하지만 다른 직원을 그림자처럼 따라 하는 셰도잉 방법을 일종의 사용자 경험 분석법으로 활용하는 경우는 찾아볼 수 있었다. 데이터 과학자들은 데이터 소스를 파악하기 위해 다른 직원을 따라 하는 과정에서 사용자나 채널에 대한 지식을 자연스레 습득했다. 이를 통해 어떤 솔루션을 개발해야 할지도 터득할 수 있었다. 즉, 데이터 과학 프로젝트에서 셰도잉을 활용하면 데이터를 생성하는 프로세스와 솔루션 사용자 및 솔루션 전달 채널에 대해 더 잘 파악할 수 있다.

117


실수 5 험난한 마지막 단계(last mile). 연구 대상이 된 은행 중 한 곳은 빠져나간 고객들을 되찾기 위해 ‘윈백(win-back)’ 프로그램을 운영하고 있었다. 하지만 몇 달 동안 진전이 없었다. 프로그램을 다시 정상 궤도에 올려놓기 위해 데이터 과학자들과 제품 관리자들이 한자리에 모여서 회의를 해봤지만 이 역시 지지부진하기는 마찬가지였다.

데이터 과학자인 다라와 바이럴은 어떤 이탈 고객들이 그들의 은행으로 돌아올 가능성이 가장 높은지 식별하는 데 중점을 뒀다. 하지만 제품 관리자인 아니시와 잘파는 곧 집행될 캠페인의 세부 사항을 논의하고 싶은 눈치였고, 데이터 과학자들이 책임지고 이 캠페인을 즉시 실행해야 한다고 몰아붙였다. 회의가 특별한 소득 없이 중단되자 바이럴은 다라에게 좌절감을 토로했다. “데이터 과학자와 분석가가 모든 일을 도맡아 해야 한다면 은행에 제품 관리자가 왜 필요한 겁니까? 우리 임무는 분석 솔루션을 개발하는 겁니다. 실행은 그들 몫이고요.”

하지만 그다음 회의가 열릴 때 바이럴도 생각을 바꾼 듯 보였다. 그는 제품 관리자들이 왜 프로그램 실행을 데이터 과학자들한테 계속 떠넘기려고 하는지 파악하기로 결심하고 행동에 나섰다. 그는 이 과정에서 이전에 정보 시스템 부서가 집중적으로 공략할 이탈 고객 명단을 은행의 제품 관리자들에게 제공했지만 여러 차례 실패한 경험이 있었다는 사실을 알게 됐다. 알고 보니 당시에는 시스템 부서가 제공한 명단에 있던 고객들의 연락처 정보가 부실해서 그 명단을 제대로 활용하기가 굉장히 어려웠다. 그 때문에 제품 관리자들은 타깃 고객에 대한 명단을 받아 봤자 다시 실패만 맛보게 될 것이라는 회의감에 빠져 있었던 것이다.

제품 관리자 관점에서 문제를 파악한 바이럴과 다라는 은행의 텔레마케터, e메일 관리팀, 지점 직원, 자산관리팀을 위한 프런트 엔드 소프트웨어 애플리케이션 개발을 프로젝트 계획에 추가했다. 그리고 이를 통해 비즈니스 담당자들에게 고객과 상호작용을 하면서 얻은 정보를 제공했다. 이어 데이터 과학팀이 제공하는 명단을 그들이 더 잘 활용할 수 있도록 툴도 개발했다. 마침내 프로젝트는 효과를 내기 시작했다.

이 사례에서는 바이럴과 다라의 남다른 공감 능력과 주도력이 빛을 발했다. 그들은 주어진 고유 역할에서 한발 더 나아가 프로젝트 리더처럼 행동했다. 하지만 기업이 데이터 과학자에게 이런 태도를 당연한 듯 기대해서는 안 된다. 데이터 과학자의 귀하고 값비싼 자원은 무엇보다 기술적 전문성이기 때문이다.

대신 기업은 솔루션을 실행하는 과정에 데이터 과학자를 참여시켜야 한다. 연구 대상이 된 은행 중 한 곳은 데이터 과학자들이 개발한 솔루션이 이후 창출할 비즈니스 가치를 추정치로 계산해 성과 평가에 추가했고, 이 방법으로 데이터 과학자들의 참여도를 높였다. 솔루션의 비즈니스 가치를 가시화하면 데이터 과학자들에게 개발된 솔루션이 성공적으로 이행될 수 있다는 확신을 줄 수 있고, 그들의 의욕을 높일 수 있기 때문이다. 물론 은행 임원들은 이런 상황에서 데이터 과학자들이 해야 할 기본적인 업무에서 완전히 벗어난 일을 할 위험도 있다는 것을 알고 있었다. 그럼에도 불구하고 그들은 데이터 과학 자원의 유용성은 결국 가치 창출로 정당화된다고 믿었고, 이런 가치 중심의 활동이 데이터 과학자들의 핵심 업무에 지나치게 지장을 초래한다면 프로젝트마다 상황에 맞게 해결하면 된다고 여겼다.

필자들이 본 연구를 하면서 목격한 실수는 항상 데이터 과학 업무와 일반 비즈니스 업무가 만나는 접점, 즉 인터페이스에서 발생했다. 이를 감안하면 기업의 리더들은 조직 안에서 데이터 과학의 역할을 더 광의의 개념으로 수용하고 이를 촉진해야 한다. 이를 위해서는 문제를 진단하거나 프로세스를 관리하고 솔루션을 구현하는 직원과 데이터 과학자 간 더 수준 높은 협력이 필요하다. 이런 철저한 업무 연계는 교육, 셰도잉, 부서 배치, 공식 인센티브 등 다양한 방식으로 구현될 수 있다. 그렇게 되면 솔루션의 오류가 적어지고, 프로젝트 주기가 단축되며, 궁극적으로는 비즈니스 가치가 증대될 것이다.

마유르 P. 조시•닝 수•로버트 D. 오스틴•아난드 K. 순다람
마유르 조시(Mayur P. Joshi)는 맨체스터대, 얼라이언스 맨체스터 경영대학원의 핀테크 분야 조교수다.
닝 수(Ning Su)는 웨스턴대 아이비경영대학원의 일반 경영, 전략, 정보 시스템 분야의 부교수다.
로버트 오스틴(Robert D. Austin)은 아이비 경영대학원의 정보시스템 교수다.
아난드 순다람(Anand K. Sundaram)은 IDFC 퍼스트 뱅크(IDFC First Bank)의 리테일 분석 부서장이다.

번역|김성아 dazzlingkim@gmail.com


DBR mini box

연구 내용

● 이 기사는 총자산이 2억 달러 이상인 인도의 대형 민간은행 세 곳에서 있었던 데이터 과학 활동에 대한 심층 연구를 바탕으로 작성됐다.

● 연구는 현장 관찰과 임원, 관리자, 데이터 과학자 57명과 진행한 반구조적 인터뷰, 아카이브 기록 탐색 방식으로 진행했다.

● 이런 정성 데이터를 바탕으로 수행한 귀납적 분석 프로세스를 통해 5가지 장애물과 이를 극복하는 해법을 도출했다.

관련기사