Top
검색버튼 메뉴버튼

Indepth Communication

박경수 | 145호 (2014년 1월 Issue 2)
  

 

편집자주

DBR은 독자 여러분들의 의견과 반응을 체계적으로 수렴해 콘텐츠의 품질을 높이기 위해 다양한 분야의 비즈니스 현장에서 왕성하게 활동 중인 열독자를 중심으로독자패널을 운영하고 있습니다 ‘Indepth Communication’은 독자패널들로부터 DBR 최근 호 리뷰를 들어본 후 추가로 궁금한 점에 대해 해당 필자의 피드백을 받아 게재하는 코너입니다.

 

박경수 DBR 6기 독자패널(KT경제경영연구소)

DBR 143호의 “30억 통화 분석한 심야버스 도입 서울의 빅데이터 활용, 시카고의 모범되다는 뉴욕시 및 시카고시의 빅데이터를 활용한 범죄예방 사례와 함께 서울시의 심야버스 노선 사례를 제시하고 있다. 빅데이터는 다양한 데이터의 유형을 분석해 기존에는 생각하지 못했던 인사이트를 도출할 수 있게 해준다. 말 그대로 빅데이터는 데이터일 뿐이다. 빅데이터 내 다양한 변수들을 어떤 식으로 엮어서 필요한 결과를 뽑아낼지가 중요하다. 그렇다면 빅데이터의 효율적 분석을 위해서는 가설을 설정하고 이에 맞는 검증이 필요하다. 빅데이터의 분석 시 다양한 변수들 간의 인과관계를 파악해 분석가가 어떻게 인사이트를 도출할 수 있을지 궁금하다. 누구나 빅데이터를 이야기하고 있지만 빅데이터에서 어떻게 인사이트를 도출해서 실질적인 결과를 내는지에 대한 프로세스를 구체적으로 이야기하는 사람은 없는 것 같다.

 

김수현 DBR 6기 독자패널 (넥슨네트웍스)

DBR 143호의 “30 억 통화 분석한 심야버스 도입 서울의 빅데이터 활용, 시카고의 모범되다를 보면서 GIS를 활용한 다양한 사례들을 통해 빅데이터의 실질적인 활용에 대해 잘 알 수 있었다. 실제로 데이터를 가공하는 일들을 하다 보면 새로운 인사이트를 얻는 경우도 있지만 그렇지 않은 경우도 있는 것 같다. 빅데이터를 활용해 데이터를 가공할 때 최대한 많은 인사이트들을 얻어내기 위해 신경 써야 하는 부분에 대한 팁을 좀 알려주시면 감사하겠다.

 

송규봉 GIS United 대표

두 분의 질문에 공통적인 부분이 있어 함께 답해보도록 하겠다.

분석(分析·analysis)이라는 단어의 한자와 영어의 어원에는쪼개다라는 뜻이 똑같이 담겨 있다. 잘게 쪼개 자세히 살피는 작업의 정반대편에는 합성과 종합이 있다. 데이터 분석의 성과는 어떻게 쪼개고 종합하는가에 달려 있다. 그러나 시간, 장소, 주제를 초월해 모두에게 적용되는 분석의 원리를 만날 수 있을지 막막한 경우가 많다. 따라서 사안별로 분석의 목적을 분명히 할 때 좀 더 나은 결과를 기대할 수 있을 것이다. 우리가 분석을 할 때는 분석 그 자체가 목적이 아닐 때가 많다. 분석하려는 이유는 크게 두 가지일텐데 질문에 답하거나 문제를 해결하려는 경우다. 질문에 답하려면 많은 사람들이 지지할 수 있는 보편적인 지식을 잡아내야 할 것이다. 만약 문제를 해결하기 위한 것이라면 구체적 실행방안을 제시할 수 있어야 할 것이다. 답하거나 해결책을 내놓는 것은 결국 분석의 초점에 따라 달라진다는 얘기다.

 

이번 기회에빅데이터에 대한 신화와 오해에 대해서도 짚어보고자 한다. 데이터의 규모가 거대하거나, 형태가 비정형이거나, 구축 속도가 급속하다는 특징보다 더 중요한 것이 있다. 데이터는 규모가 아니라 주요 자원의 매장량과 활용도가 더 중요하지 않을까 하는 것이다. 다시 말해, 꼭 새로운 데이터만 중요한 것이 아니라 이미 조직 내외부에 쌓여 있고 당장 이용 가능한 기존 데이터부터 활용도를 따져 보면 좋겠다는 말이다. 데이터 속에 보석이 숨겨져 있는지, 석탄이 매장된 것인지를 봐야 하는데 시추, 분류, 추출, 변환 등의 작업을 제대로 경험한 사람일수록 지속적인 성과가 나올 것이다. 결국은 분석자의 안목, 경험, 역량, 자세가 가장 중요하다고 생각한다.

 

시카고의 경우 시장의 목표는 분명했다. 범죄를 전염병처럼 심각하게 생각하고 범죄율을 획기적으로 떨어뜨리기 위해 범죄가 가장 많이 발생하는 핵심지역을 선정하고 그곳의 패턴을 파악하기 위해 기존 데이터부터 활용했다. 시카고 전역에 걸쳐 새로운 데이터를 대대적으로 신규 구축한 것이 아니라 창고에 먼지를 뒤집어쓰고 있는 데이터를 우선 꺼내 직접 사용하는 것부터 시작했다. 범죄발생 핵심지역부터 장악하면 전체 범죄율을 신속하게 떨어뜨릴 수 있다는 가설은 실제 현실로 확인됐다.

 

인문학자 조동일 교수는 통찰을 두 가지로 구분한다. 통찰(通察·whole insight)은 넓게 보려는 것이고 통찰(洞察·deep Insight)은 깊게 보려는 것이라고 알려준다. 모든 분석에 적용되는 통찰의 방법을 찾기는 쉽지 않을 것이다. 부족하지만 그간 분석을 하면서 배웠던 몇 가지 경험을 보태보려 한다. 첫째, 훌륭한 질문이 훌륭한 분석의 첫걸음이라는 점이다. 이화여대 경영학과 송상영 교수가 데이터 분석에서 항상 강조하는 조언이다. 훌륭한 질문을 던질 수 있도록 스스로 안목과 역량을 키우는 것이 먼저다. 필자 역시 비법이나 지름길이 따로 없음을 받아들이기까지 오랜 시간이 걸렸다.

 

둘째, 데이터를 최대한 장악해야 한다는 점이다. 일본 스시명인 오노 지로는 스시에 대해 열 권의 책을 남겼다. 권수가 중요한 것이 아니다. 그가 스시에 대해 얼마나 넓고 깊게 알고자 했던가 짐작해보게 된다. 미슐랭가이드 별점 2개를 얻은 미국 이동민 셰프의 경우, 요리도구가 자기 몸처럼 느껴질 정도로 붙들고 씨름했노라 말한 적이 있다. 요리사가 식재료, 조리도구, 요리과정을 제대로 장악할 때 최상의 요리가 나오지 않을까 상상해본다. 분석가도 결국 데이터, 분석도구, 분석과정에 대한 이해력과 장악력이 가장 중요하다고 본다.

 

셋째는 분석을 함께하는 좋은 파트너들과의 협업이다. 혼자라면 놓치기 쉬운 대목들을 채워주는 훌륭한 동료들과의 공동작업은 분석의 가치를 높이는 가장 중요한 과정이라고 생각한다. 마치 최고의 병원들이 협진을 통해 진단하고 처방하는 것처럼.

관련기사