Power of Analysis

분석 능력은 자기계발의 블루오션 문맹보다 무서운 ‘수맹(數盲)’ 벗어나자

154호 (2014년 6월 Issue 1)

Article at a Glance – 자기계발

 숫자와 통계만 나오면 움츠러드는 사람이 많다. 하지만 이를 무조건 피하고 멀리하기보다는 분석역량을 키우고 좀 더 효율적으로 문제를 해결하는 수단으로 활용해야 한다. 이를 위해서는 문제인식과 관련 연구 조사, 모형화, 자료수집, 자료분석, 결과제시로 이어지는 분석의 각 단계에서 숫자와 통계가 제시하는 논리와 근거를 꼼꼼히 파악하고 문제 해결과정의 핵심(key)으로 적극 활용하는 자세가 필요하다.

 

지금으로부터 549년 전인 1465 6월의 어느 날, 세종께서 신하들과 국사를 논의하다가 갑자기 신하들을 바라보며 물었다.1  “한양의 위도가 얼마인고?” 세종 앞에 늘어선 많은 신하들이 모두 꿀 먹은 벙어리가 돼 대답을 하지 못했다. 세종이 다시 물었다. “한양의 위도가 얼마인고?” 신하들은 머리를 숙인 채 서로를 힐끔거리기만 할 뿐 아무 말도 하지 못했다. 침묵이 길어지자 세종이 옅은 한숨을 내쉬었다. 그때 한 신하가 앞으로 나섰다. 그는한양의 위도는 38도 강()이옵니다라고 대답했다. 세종은 깜짝 놀랐다. 나중에 세종은 그에게 조선의 천문역법을 책임지도록 하는 발탁인사를 단행했다. 대답을 한 그 신하가 바로 이순지(李純之). 그는 당시 승무원에서 외교 문서 관련 업무를 맡았던, 천문과는 무관한 직급의 관료였다.

 

경북 영천시 화북면에 있는 1124㎞ 높이의 보현산 정상에는 동양 최대의 종합 천문대인 보현산 천문대가 있다. 이 천문대는 12㎞ 멀리 떨어져 있는 100원짜리 동전도 식별할 수 있는 1.8m 크기의 광학망원경을 보유하고 있다. 천문대 연구원들은 2000년대 초 많은 소행성을 발견했는데 이 중 다섯 개에 한국전통과학자의 이름을 붙였다. 최무선, 이천, 장영실, 허준, 이순지가 그들인데 이 걸출한 5인의 과학자 중에 새로 발견한 소행성의 이름에 가장 잘 어울리는 사람은 아마 이순지일 것이다. 이순지는 천체를 관측하고 그 움직임을 계산해 이를 정확한 달력으로 만드는 일을 수행한, 조선시대의 대표적인 천문학자였다.

 

세종은 즉위 초부터 조선의 독자적인 천문역법을 세우고자 했다. 삼국시대에는 주로 중국의 역법을 빌려 썼고 고려 때는 그것을 개성 기준으로 약간 수정해서 사용했다. 조선시대에 한양으로 천도한 후에는 그것을 약간 더 수정해서 사용했지만 근본적으로 조선을 기준으로 한 천체 운동은 계산하지 못하고 있었다. 세종은 조선에 맞는 역법을 만들어야 한다고 생각했다. 1433년 조선의 천문역법을 정비하라는 세종의 명에 따라 이순지를 중심으로 역법 프로젝트가 시작됐다. 1442년에 이르러 조선의 독자적인 역법인 <철정산내편(七政算內編)><칠정산외편(七政算外編)>이 편찬됐다. 칠정(七政)이란 해, , 화성, 수성, 목성, 금성, 토성을 말한다. 이로써 그동안 중국 역법에 의존하던 관행에서 벗어나 비로소 조선 고유의 천체 운행을 계산할 수 있게 됐다.

 

이순지가 세종에게 발탁돼 최고의 천문학자로 성장하게 된 계기는 <세조실록> (세조 11, 1465 611)에 다음과 같이 기록돼 있다. “어느 날 세종이 한양의 북극고도가 얼마냐고 물었을 때 관료 중 유일하게 이순지가 38도 강이라고 대답하자 세종이 이를 의심했다. 나중에 중국에서 온 사신이 역서를 바치고한양은 북극에 나온 땅이 38도 강입니다하므로 세종이 기뻐하시고 마침내 명하여 이순지에게 천문역법을 교정하게 했다.” 이순지가 세종에게 발탁된 것은 우연이나 운()이 아니다. 임금이 우리만의 역법을 세우려는 뜻을 갖고 있음을 알고 가장 기본이 되는 한양의 위도를 미리 고민한 결과다. 이미 계산을 끝내고 준비한 이순지에게 세종의 느닷없는 질문은 오히려 그를 돋보이게 하는 기회로 작용했다.

 

개인이나 기업이 성공하기 위해서는 레드오션이 아닌 블루오션을 찾아야 한다. 겉으로 말만 번지르르할 뿐 실제 내공은 부족한 사람들이 많은 오늘날, 숫자와 통계, 그리고 이를 토대로 한 분석 능력이야말로 자기 계발의 블루오션이다. 많은 사람들이 통계를 어려워한다. 숫자만 나오면 피하고 싶어 하고 재미없어 한다. 파울로스(John Allen Paulos) 템플대 교수는 현대에 문맹이란 글을 읽지 못하는 것이 아니라 숫자에 두려움을 갖고 편안하게 다루지 못하는 것이라고 주장하며 이를수맹(innumeracy)’이라는 용어로 표현하기도 했다.2  많은 사람이 어려워하며 자신 없어 하는 분야야말로 경쟁이 적고 광활하게 열린 블루오션이다. 사실 숫자와 통계를 기반으로 하는 분석능력이야말로 이 시대 직장인들이 갖춰야 할 필수 역량이기도 하다. 데이터가 넘쳐날수록 문제를 해결하기 위해 관련 자료를 수집하고 분석해서 필요한 정보를 추출할 수 있는 능력이 중요해지기 때문이다. 효율적인 의사결정은 계량적 정보를 얼마나 능숙하게 다루느냐에 달려 있다. <새로운 지식(The New Know)>의 저자인 메이(Thornton May)어느 분야에서 어떤 경력을 쌓고 있든 그의 성공(개인적이든 직업적이든)은 분석역량에 크게 좌우될 것이라고 말했다.

 

그림 1분석의 6단계

 

분석의 6단계

분석은 전혀 새로운 개념이 아니며 이미 오래 전부터 여러 영역에서 효과적으로 활용돼 왔다. 일반적으로 분석은 단계적으로 진행되는데 예를 들어 분석적인 마케팅 조사는 연구 목적, 연구 설계, 표본 설계, 자료 수집, 자료 분석, 결과 제시 등의 단계로 진행된다. 여기에서는 영역과 무관하게 일반적으로 적용할 수 있는 분석 방법으로 다음과 같은 여섯 단계를 제시한다.

 

 

문제 인식:분석은 자신이 하고 있는 업무나 관심을 갖고 있는 현상에서 문제를 인식하고 그것을 해결하려는 것에서 시작된다. 개인이나 기업이 가진 여러 가지 의사결정 사안들은 당연히 분석의 주제가 된다. 문제 인식 단계에서는 문제가 무엇인지 파악하고 왜 이 문제를 해결해야 하는지, 문제 해결을 통해 무엇을 달성할 것인지 등을 명확히 하는 것이 중요하다.

 

관련 연구 조사:문제와 직접적, 간접적으로 관련된 지식을 각종 문헌(잡지, , 보고서, 논문 등)을 통해 조사하면 문제를 더욱 명확히 할 수 있다. 또한 문제와 관련된 주요 변수들을 파악할 수 있다. 여기서 변수는 사람, 상황, 행위 등의 속성을 나타낼 수 있는 지능지수, 나이, 방 안 온도, 시험성적 등 대응물(proxy)이다. 관련 자료들을 모두 섭렵하는 것은 분석에서 가장 중요한 부분이며 다음 단계의 모형화(변수 선정)를 위해 필수적이다. 모든 문제 해결은 무()가 아닌 유(), 즉 관련 자료 파악에서 시작된다. 자료들을 찾고 읽었다면 문제와 관련된 내용을 정리해 관련 변수를 뽑아내야 한다. 만약 자신의 문제와 유사한 연구를 찾았다면 그 연구결과를 그대로 적용할지, 아니면 최소한 같은 방법을 쓸지 검토해야 한다.

 

모형화(변수 선정):모형은 문제(연구대상)를 의도적으로 단순화한 것을 말한다. 모형화는 문제와 본질적으로 관련된 변수만 추려서 재구성하는 단계다. 우리가 인식한 문제들은 대부분 복잡하므로(변수가 많으므로) 단순화할(변수의 수를 줄일) 필요가 있다. 따라서 문제를 그 특성을 잘 대표하는 결정적인 요소만 추려 주요 변수로 나타낸다면 분석이 좀 더 단순해진다. 모형화는 신문의 삽화나 캐리커처를 그리는 것과 같다. 캐리커처가 의도적으로 인물이 가진 중요한 특징(, , 머리 등)을 강조하고 나머지는 무시하는 것과 같이 모형화에서도 문제와 관련된 주요 변수만 선택하고 불필요한 것들은 버린다. 어떤 변수를 버리고 어떤 변수를 선택할 것인가는 그 변수가 문제 해결과 얼마나 직접적으로 관련이 있는지에 달려 있다. 예를 들어 지도를 그릴 때 거리와 방향은 매우 중요하다. 하지만 지하철 노선표를 그릴 때는 역과 역 사이의 거리와 방향이 그다지 중요하지 않다. 지하철 노선표에서는 문제해결(지금 있는 곳에서 목적지로 가는 방법)과 관련해 노선별 연결이 더 중요하다.

 

자료 수집(변수 측정):변수가 선정되면 그 변수들을 측정해야 한다. 자료(data)는 변수들의 측정치를 모은 것이다. 인식된 문제는 모형화를 통해 주요 변수로 재구성되고 측정이라는 과정을 거치면서 자료가 된다.

 

자료 분석:자료는 그 자체만으로는 아무 것도 말해주지 않는다. 자료 분석은 나열된 숫자에서 변수 간에 규칙적인 패턴, 즉 변수 간 관련성을 파악하는 것이다. 예를 들어 유권자의 투표 성향을 분석하기 위해 지역별, 성별, 나이별로 특정 후보에 대한 지지도를 설문조사로 수집했다고 하자. 수집된 자료에서 유권자의 투표 패턴(지역, 성별, 나이 등에 따라 특정 정당후보를 지지하는 데 어떤 패턴이 있는지)을 파악하는 것이 자료 분석이다.

 

결과 제시:자료 분석을 통해 변수 사이에 관련성이 파악되면 그 결과가 의미하는 바를 해석해 의사결정자에게 구체적인 조언을 한다. 결과 제시는 연구 과정의 개요, 결과 요약, 문제를 해결하기 위한 권고를 포함한다. 다양한 차트나 그래프를 활용하는 것이 효과적이다.

 

이제 몇 가지 사례를 제시하겠다. 각 단계별 과정에 맞게 스스로 분석해보고 분석역량을 키우는 계기로 삼기 바란다.

 

사례 1정규직이 된 설렁탕집 아르바이트생

서울의 어느 한 대형 설렁탕집. 주인은 손님들이 먹다가 남기는 김치 때문에 늘 고민이었다. 한꺼번에 많은 양을 주면 남기기 일쑤고, 적게 주면 다시 달라는 요청이 여러 번 들어와 안 그래도 일손이 달리는 식사시간에 효율적인 응대가 어려웠다. 그때 그 설렁탕집에 아르바이트생으로 한 여학생이 들어왔다. 그 학생은 들어온 지 한 달 만에 사장의 고민을 해결했다. 감격한 사장은 그 학생을 정식 직원으로 채용했다.

 

문제 제기:어떻게 하면 손님들에게 한 번에 적정량의 김치를 제공해 남기는 양을 최소화할 수 있을까?

 

관련 연구 조사:사람들이 한 끼 식사 때 먹는 김치 양과 관련된 자료는 많지 않다. 식품영양이나 요리 분야에서 부분적으로 자료를 찾을 수는 있지만 이 문제에 직접 활용하기는 어렵다. 특히 설렁탕이라는 특정 유형의 음식과 함께 먹는 김치 양에 대해서는 참고할 자료가 거의 없다고 봐야 할 것이다. 이는 기존 자료에 의존하기보다는 새로 자료를 수집해야 할 필요성이 크다는 점을 의미한다.

 

모형화(변수 선정):아르바이트생은 우선 한 테이블의 손님들이 먹는 김치 양과 관련된 변수들을 열거해 봤다. 손님 수, 손님 구성(/, 노인/성인/아동 등), 김치 맛, 김치 염도, 계절, 시장 배추 가격 등을 변수로 꼽을 수 있었다. 이 중 김치 맛과 염도는 식당 이미지를 위해 함부로 바꿀 수 없고 계절이나 시장 배추 가격은 매장 안 김치 소비에 미치는 영향이 크지 않을 것으로 판단해 제외했다.

 

자료 수집(변수 설정):설렁탕을 먹을 때 먹는 김치의 양에 대해 다른 사람이 수집 및 정리한 자료를 찾기 어려우므로 자료를 직접 수집해야 한다. 이런 경우 설문조사나 실험은 적절하지 못하다고 판단해 아르바이트생은 관찰을 통해 자료를 수집하기로 했다. 처음 제공되는 김치 양은 테이블당 손님 수에 따라 미리 정해진 양을 제공하고 남겨지거나 추가된 양을 <그림 2>과 같은 표에 기록했다. 아르바이트생은 2주 동안 총 300테이블의 자료를 수집했다.

 

자료 분석:손님 수와 손님 구성이 총 김치 소비량에 미치는 영향을 회귀분석(변수가 결과에 미치는 영향을 분석하는 방법)을 통해 분석했다. 여기서 변수는 손님 수와 손님 구성, 그로 인한 결과는 김치 소비량이 된다.

 

결과 제시:아르바이트생은 사장에게 분석결과를 표와 그래프로 만들어 상세하게 설명했고 사장은 크게 만족했다. 그 후 분석결과를 토대로 테이블에 손님이 앉으면 손님 수와 손님 구성에 맞게 미리 정해진 적정 양의 김치를 제공해서 남는 양을 최소로 줄이고 종업원들의 일처리(김치를 추가로 제공, 남긴 김치 폐기 등) 부담도 낮출 수 있었다.

 

그림 2김치 소비량 조사표

 

사례 2자동차 매매단지 시설 개선안 마련

 

한국의 중고차 시장은 매년 그 규모가 확대되고 있다. 2013년 중고차 거래대수는 약 337만 대로 신차 판매대수인 160만 대보다 2배나 많다. 이처럼 중고차에 대한 수요와 공급은 계속 늘고 있지만 허위·미끼 매물의 존재 가능성, 차량 성능과 품질에 대한 불안감, 낙후된 매매단지 시설 등의 문제점이 소비자 신뢰를 갉아먹는 요인으로 지적된다. 동화홀딩스에서는 이런 문제를 해결하기 위해 인천시 서구 가좌동에 연면적 15만㎥, 차량전시대수 7000대의 국내 최대 규모와 시설을 갖춘 자동차 매매단지를 열었다. 지하 1, 지상 9층 규모의 이 단지는 개장 후 1년 동안 방문 고객 수와 거래 수가 지속적으로 증가하며 좋은 성과를 보였다. 하지만 고객들의 신뢰도를 높이고 고객에게 차별화된 경험을 제공하기 위해 이 단지는 4명의 팀원으로 구성된 태스크포스를 만들었다.

 

문제 제기:자동차 매매단지에 대한 불신을 줄이고 방문고객들이 차별화된 경험을 할 수 있도록 만들어야 한다. 이를 위해 이 단지를 방문한 고객이 단지 내 어디에서 무엇을 하는지 관찰해 그 자료를 분석한다면 시설 개선에 대한 좋은 아이디어를 얻을 수 있을 것이다.

 

관련 연구 조사:대형 중고차 매매단지에서 고객들이 어떻게 행동하는지에 대한 기존 연구는 전무했다. 설사 다른 곳에서 조사한 자료가 있더라도 단지의 구조와 입주 시설이 다르기 때문에 그대로 활용하기에는 무리가 있었다. 팀원들은 이 단지의 방문고객들을 직접 관찰하기로 했다.

 

변수 선정:방문고객 정보와 총 체류시간, 이용거점별 행동, 이용거점별 체류시간이 소비자 경험에 영향을 주는 변수일 것으로 판단했다.

 

자료 수집:팀원들은 예비 관찰을 통해 관찰자들이 어디서 어떻게 고객을 관찰해야 하는지 파악했다. 승용차를 이용하는 고객과 대중교통을 이용하는 고객은 단지로 들어오는 입구가 다르므로 관찰자를 별도로 배치해야 한다. 고객 동선을 따라다니면서 거점별 행동과 체류시간을 파악할 때도 고객의 행동에 방해되지 않도록 충분한 거리를 유지하는 것이 중요하다. 관찰 내용을 쉽고 빠르게 기록할 수 있도록 관찰 기록지를 만들었다. 실제 관찰은 주중과 주말로 나눠 2주 동안 진행했고 5명의 팀원이 직접 나서서 총 203명의 고객을 관찰했다.

 

자료 분석:각 변수는 주로 그래프로 분석했고 변수 간의 관계를 파악하기 위해 교차분석을 실시했다. 주요 분석 결과는 다음과 같다.

 

● 방문 종류: 자가용 방문(72%), 단독 방문(36%), 2인 가족 방문(41%)

● 체류시간: 주말일수록, 가족단위 방문일수록 크게 증가

● 이용도가 가장 높은 거점(hot zone): 지하1, 1층의 에스컬레이터 주변 공간

● 근린시설 이용도 낮음

● 로비와 통로에서 상담과 거래가 많이 이뤄짐

● 로비와 통로의 역할: 업무 및 대기 공간

 

결과 제시:팀원들은 분석 결과를 토대로 아래와 같은 구체적인 시설 개선안을 만들었다.

 

● 다목적 스마트 휴게 공간 설치: 휴식 공간에 볼거리와 즐길거리를 배치해 대기 시간의 지루함을 해소하고 휴식 이후의 구매 활동 촉진

● 휴게 공간 내 구매 상담용 공간 마련: hot zone을 중심으로 구매 상담업무를 볼 수 있는 테이블과 의자를 확대 배치, 칸막이나 벽을 통한 구획 구분

● 가족 동반 고객을 위한 공간 배려: 키즈 카페, 수유실, 기저귀교환대, 어린이용 스툴 등

● 주말 가족이나 연인을 위한 프로그램 개설: 공연 등 문화 이벤트

 

사례 3이혼을 점치는 수학자

 

이혼율은 특히 선진국에서 높은 편이며 미국은 거의 50%나 된다. 행복한 가정이 개인적으로나 사회적으로 어떻게 기여하는지는 새삼 강조할 필요가 없다. 이혼은 이처럼 중요한 문제지만 이에 대한 연구는 미흡한 편이다. 신혼부부가 백년해로할 수 있을지, 아니면 이혼하게 될지를 미리 예측할 수 있는 모델을 개발한다면 부부 관계에 대한 통찰력을 제공하고 문제가 있는 부부의 상담치료에도 도움이 될 것이다.

 

문제 제기:부부의 이혼 여부를 어떻게 예측할 수 있을까?

 

관련 연구 조사:부부 관계에 대한 연구는 심리학이나 가정학계에서 주로 한다. 더 넓게는 인간관계에 대한 자료들을 참고할 수 있다.

 

모형화(변수 선정): 심리학자인 고트만(John Gottman) 박사와 수학자인 머레이(James Murray) 교수는 부부 관계에 영향을 미치는 여러 가지 변수 가운데 부부가 논쟁을 할 때 주고받는 말에 주목했다. 주고받는 말에 의해 마음의 상처가 조금씩 쌓이면 결국 파국을 맞을 것이라고 판단했다. 그래서 부부의 대화나 논쟁에서 오가는 말 속에 포함된 긍정적인 표현과 부정적인 표현을 조사해서 그중 애정, 기쁨, 유머, 의견 일치, 관심, , 거만, 슬픔, 울음, 호전성, 방어, 회피, 혐오, 모욕의 14가지 변수를 선정했다.

 

자료 수집(변수 측정):갓 결혼한 신혼부부 700쌍을 대상으로 이들의 대화를 측정했다. 부부를 방안에 마주앉게 한 뒤 돈, (), 시댁 문제 등 평소 둘 사이를 틀어지게 하는 주제에 대해 15분간 대화하도록 했다. 녹음된 대화를 분석해 무엇을 말했느냐에 따라 남편과 아내에게 각각 다음과 같이 +4점에서 -4점 사이의 점수를 부여했다.

 

● 애정(affection), 기쁨(joy), 유머(humor), 의견일치(agreement): +4

● 관심(interest): +2

● 화(anger), 거만(domineering), 슬픔(sadness), 울음(whining): -1

● 호전성(belligerence), 방어(defensiveness), 회피(stonewalling): -2

● 혐오(disgust): -3

● 모욕(contempt): -4

 

자료 분석:분석에서 핵심은 대화 중에 나타나는 긍정적 상호작용과 부정적 상호작용의 비율이었다. 부부 각각에 대한 측정점수는 차이방정식(difference equation model)이라는 수학 모델에 입력한 뒤 그 결과를 그래프로 나타냈다. 그래프는 남자의 선과 여자의 선을 그렸고 이는 그들이 어떻게 상호 작용하는지 보여줬다. 긍정적 상호작용과 부정적 상호작용의 비율이 51 이하로 떨어지면 결혼 실패 확률이 높아졌다. 이런 분석을 통해 머레이 교수의 동료들은 700쌍의 신혼부부를 유효부부(친밀하고 서로를 배려하는 부부), 회피부부(충돌이나 마찰을 의도적으로 피하는 부부), 불안정 부부(열정적이지만 논쟁을 심하게 하는 부부), 적대적 부부(부부 사이에 대화가 거의 없는 부부), 적대적·고립 부부(한 사람은 논쟁을 하고 싶어 하지만 상대방이 무관심한 부부) 5가지 유형으로 나눴다. 각 그룹의 특성을 바탕으로 머레이 교수는 유효부부와 회피부부는 이혼을 하지 않고, 적대적 부부와 적대적·고립 부부는 이혼할 것으로 예측했다. 불안정 부부는 행복하지 않은 생활을 하지만 이혼은 하지 않을 것으로 봤다. 실험 이후 12년에 걸쳐 1∼2년의 간격을 두고 이들 부부에게 연락을 해서 이혼 여부를 확인했다. 최종적으로 12년 후 확인한 결과, 예측의 정확도는 94%에 달했다.

 

결과 제시:분석 결과는 <결혼의 수학: 동적 비선형 모델>이라는 제목으로 출간됐다.3)고트만은 이 연구 결과를 토대로 다양한 논문과 책을 썼고 부인 줄리와 함께 고트만 관계 연구소를 설립해 부부관계 개선에 대한 훈련모임과 교육 프로그램을 운영하고 있다.

 

이처럼 숫자와 통계를 활용한 분석은 설득력 있는 논리와 솔루션으로 이어질 수 있다. 이는 업무뿐 아니라 다양한 상황에 응용될 수 있다. 흔히 분석은 과거 데이터를 가지고 이미 지나간 일들을 분석하는 것에 사용된다고 생각하기 쉽지만 다음 편에서는 분석능력이 업무 창의성으로 연결될 수 있다는 내용을 소개할 것이다. 

 

3)John M. Gottman, James D. Murray, Catherine Swanson, Rebecca Tyson, Kristin R. Swanson, The Mathematics of Marriage: Dynamic Nonlinear Models, Bradford Books, 2003).

 

김진호 서울과학종합대학원 빅데이터 MBA 주임교수 jhkim6@assist.ac.kr

필자는 서울대 경영대학(통계학 부전공)을 졸업하고 펜실베이니아대(Wharton School)에서 경영학 석사와 박사 학위를 받았다. 사회와 기업의 다양한 문제들을 계량 분석적으로 접근하는 연구를 주로 했다. 개인의 분석능력을 키워주는 교육프로그램을 개발해 여러 기업에서 운영하기도 했다. 저서에 <말로만 말고 숫자를 대 봐(엠지엠티북스)> 등이 있다.

동아비즈니스리뷰 350호 Smart Worcation 2022년 08월 Issue 1 목차보기