Power of Analysis
Article at a Glance
아무리 좋은 데이터를 훌륭하게 분석했다 하더라도 ‘전달’이 제대로 되지 않으면 소용이 없다.‘데이터는 스스로 말한다’고 하는 건 오만이다. 경영진이 보고를 지루해 하거나 이해할 수 없다면 그들이 분석결과에 입각해 의사결정을 하거나 행동을 취할 가능성은 거의 없다. 그래서 우리는 데이터를 그림으로 만든 ‘그래프’를 그린다. 그러나 그래프는 만드는 사람의 의도 혹은 실수에 따라 엄청난 왜곡을 만들어낼 수 있다. 따라서 그래프를 만드는 사람들은 ‘미적인 기술’에만 치중하지 말고 데이터의 본질도 제대로 전달할 수 있도록 노력해야 한다. 그래프를 보는 사람들 역시 그림이 실제의 수치를 제대로 반영하는지 점검해볼 필요가 있다. |
시각화의 함정
지금 우리는 모바일, 사물인터넷 센서, 소셜미디어가 데이터의 폭증을 주도하는 빅데이터 시대를 살아가고 있다. 어느 산업(금융, 마케팅, IT, 생산)에 있든지, 혹은 어떤 조직(대기업, 비영리조직, 소규모 스타트업)에서 일하든지 우리의 세계는 데이터로 넘쳐나고 있다. 이제 빅데이터는 거의 모든 산업과 경영의 기능을 변화시키고 있으며 이런 변화에 적응하지 못하면 살아남을 수 없기 때문에 많은 기업과 공공기관들이 빅데이터의 효율적 활용을 위해 고심하고 있다.
빅데이터를 활용한 분석의 첫 단계는 구체적으로 어떤 문제를 해결하기 위해 빅데이터 분석을 할 것인지를 명확히 하는 것이다. 그런 다음에 관련된 데이터를 수집·창출해 분류·저장하고 문제해결에 적합한 기법을 사용해 분석한 뒤 그 결과에서 인사이트를 추출해 의사결정자 혹은 경영층에 전달하는 것이다. 이런 과정은 마치 고리로 연결된 체인과 같아서 모든 고리가 제대로 연결돼야만 효과를 발휘한다. 하지만 이전의 모든 과정을 완벽하게 수행했더라도 마지막 단계인 ‘전달’이 잘되지 않으면 분석이 효과를 낼 수 없다. 많은 분석가들은 전통적으로 분석 기법 자체에만 너무 초점을 맞췄고 분석결과를 어떻게 효과적으로 전달할 것인가는 심각하게 고려하지 않았다. 심지어는 분석 결과는 ‘스스로 말한다’라고 믿고 이 단계에 대해서 신경을 쓰지 않는 경우도 많았다.1
하지만 현명한 분석가는 분석결과를 흥미롭고 이해할 수 있는 형태로 제시함으로써 의사결정자(예를 들어 분석 프로젝트를 하도록 지시한 경영자)의 더 많은 주의를 끌고 영감을 줄 수 있다. 즉 전달을 받는 경영자로 하여금 분석결과에 따라 의사결정을 하고 행동을 취하도록 하기 위해서 전달 단계를 중요시하고 많은 시간과 노력을 투입한다. 사실 아무리 훌륭한 분석을 했더라도 그것을 제대로 전달하지 못해 분석결과를 듣는 경영진이 지루해 하거나 이해할 수 없다면 그들이 분석결과에 입각해서 의사결정을 하거나 행동을 취할 가능성은 거의 없다. 예를 들어 분석결과를 표의 형태로 제시하는 것은 분석 결과가 주의를 끌지 못하게 하는 아주 나쁜 방법이다. 거의 모든 경우에 다양한 차트나 그래프를 활용해야 효과적으로 분석내용을 제시할 수 있다. 색이나 움직임 등으로 전달을 생기 있게 할 수 있다면 효과는 더 좋아진다. 다시 말해서 숫자가 나타내는 정보를 시각화해 쉽게 이해할 수 있도록 해서 전달하면 그 효과는 확실하게 달라지는 것이다. 그렇기 때문에 최근에는 빅데이터 분석결과의 효과적인 전달을 위해서 다양한 시각화 솔루션과 툴을 사용하는 사람이 늘고 있다.
많은 숫자나 분석 결과들을 요약해서 잘 설명할 수 있는 가장 효과적인 방법이 그래프 등을 사용해 시각적으로 나타내는 것임은 두말할 필요가 없다. 그래프는 가로축, 세로축, 점, 선, 숫자, 글자, 심볼 등을 복합적으로 사용해 양적인 수치를 시각적으로 요약한 것이다. 따라서 그래프를 대하는 사람의 입장에서는 익숙하지도 않은 많은 숫자들을 머리를 써서 생각할 필요도 없이 단지 보는 것만으로도 숫자들 속에 포함된 사실을 파악할 수 있다. 하지만 문제는 그래프를 이용해 정보를 전달할 때 가장 많은 왜곡이 일어난다는 점이다. 왜 그럴까? 많은 숫자(데이터)를 그래프로 그릴 때에는 가능한 한 간단하게 데이터가 갖고 있는 정보를 생기 있는 그림으로 전달해야 한다. 이때 중요한 것은 데이터를 단순화(simplicity)하면서도 데이터가 갖고 있는 사실(fact)을 충실하게(loyalty) 전달해야 한다는 것이다. 하지만 이 두 가지 원칙은 자칫하면 서로 상충하기 쉽다. 그래서 그래프를 그리는 것이 언뜻 보기에 매우 쉬운듯하지만 상당한 기술(art)이 필요하다는 얘기다.실제로 통계 그래프에서 속임수가 가장 많다는 사실은 데이터의 단순화 과정에서 사실에 대한 정확성을 유지하기가 어렵다는 것을 말해준다. 다시 말하면 그래프의 미숙한 사용으로 데이터를 너무 단순화하면 그래프를 부정직하게 그리지는 않았더라도 실제와는 전혀 다른 인상을 주는 그래프가 될 수 있다. 더욱이 그래프를 그리는 사람이 논조를 흐리거나 사실을 의도적으로 왜곡해 그리게 되면 그래프는 사실에서 크게 동떨어지게 된다. 그러므로 그래프가 제시될 때 그것을 비판적으로 볼 수 있는 안목을 길러서 혹시 있을지 모르는, 의도적인 혹은 비의도적인 ‘왜곡’의 함정에 빠지지 않는 능력을 키우는 것이 매우 중요하다. 이번 글에서는 먼저 그래프를 그릴 때 일어나는 잘못을 가상의 예로 설명한다. 이어서 사실 그대로를 전달하는 데 실패한 실제 그래프의 사례를 분석한 뒤, 끝으로 올바르게 그래프를 보고 그리는 방법에 대해서 설명한다.2
우선 숫자를 그래프로
그래프 중에서 가장 흔한 것은 선을 이용한 선 그래프다. 선 그래프는 그리기가 쉬울 뿐만 아니라 많은 숫자 속에 숨어 있는 경향을 잘 나타내기 때문에 데이터의 분석이나 예측에 가장 많이 쓰인다. 그러나 데이터의 왜곡이 가장 많이 일어나는 그래프도 선 그래프다. 먼저 가상 사례로 설명을 시작해보자. 고등학교 3학년에 올라가는 나과외 학생은 지난 2년 동안 조집게 과외선생으로부터 영어 과목 과외를 받았다. 조 선생은 그동안 매월 치른 나군의 학력고사의 영어성적을 갖고 나군의 부모님과 함께 3학년에 대비한 영어공부 계획을 논의하기로 돼 있다. 조 선생은 우선 그래프용지에 그동안의 시험성적을 그래프로 나타내봤다. 우선 가로축에는 24번의 시험순서를 표시하고 세로축에는 10점 단위로 점수를 표시했다. 다음에 나군의 월별 영어성적을 표시한 뒤 선을 그어 연결했더니 <그림 1>이 됐다.
<그림 1>은 지난 2년 동안에 영어성적이 매달 어떻게 변화했는가를 잘 나타내고 있다. 가끔씩 성적이 오르내리기는 했지만 지난 2년간 영어성적이 전체적으로는 75점에서 85점으로 10점 정도 상승하고 있다. 또한 그래프의 제일 아래쪽에 0점이 표시돼 있어 점수 간 상호비교도 쉽고 한 번만 봐도 성적변화를 전체적으로 쉽게 이해할 수 있으므로 무난한 그래프라고 할 수 있다. 성적 증가 10점도 그대로 10점 증가처럼 보이고 그 상승경향이 크기는 하지만 유별나게 큰 것도 아니라는 것을 보여주고 있다. 그러나…
질문, 답변, 연관 아티클 확인까지 한번에! 경제·경영 관련 질문은 AskBiz에게 물어보세요. 오늘은 무엇을 도와드릴까요?
Click!
회원 가입만 해도, DBR 월정액 서비스 첫 달 무료!
15,000여 건의 DBR 콘텐츠를 무제한으로 이용하세요.