로그인|회원가입|고객센터
Top
검색버튼 메뉴버튼

Management by Map

‘개봉영화’ 쳤는데 ‘개봉동 영화아파트’ 뜬다면? 빅데이터, 내 절실함 풀어줘야 의미 있다

송규봉 | 165호 (2014년 11월 Issue 2)

Article at a Glance – 전략, 마케팅

빅데이터란 무엇인가? 이제 질문을 바꿔야 한다. 나의 절실한 문제를 해결하는 데 도움이 되는 데이터는 무엇인가? 그 데이터는 어디에 가면 찾을 수 있는가? 어떤 절차를 거쳐야 확보할 수 있는가? 어떻게 활용할 수 있는가? 성과를 만들어내기 위해 누구의 도움을 요청해야 하는가? 빅데이터에 관한 질문의 출발을 데이터가 아니라 자기 자신, 소속기관, 현실 업무, 미래개척의 관점에서 시작해야 한다.  

 

부산에 출점을 앞두고 있던 한 대형 유통업체는 기존 소비자 설문조사 팀, CRM 팀 이외에 다양한 빅데이터 분석 전문가들과 함께 이 질문을 던졌다. ‘우리는 무엇을 파는 곳이다라고 먼저 규정하고 소비자에게 강요하지 않았다. 어떤 데이터가 필요한지, 어디에 가면 구할 수 있는지, 어떻게 활용할 수 있는지에 대한 답을 내·외부 전문가들의 도움으로 제대로 찾아냈다. 데이터 분석을 통해우리는 무엇을, 어떻게, 누구에게 팔아야 하는 점포인지부터 다시 규정했고 제대로 된 전략을 짤 수 있었다.

  

편집자주

DBR은 지리정보시스템(GIS)을 활용해 경영 효율성을 높이거나 혁신에 성공한 사례를 소개하는 ‘Management by Map’ 코너를 연재합니다. 지도 위의 거리든, 매장 내의 진열대든, 선수들이 뛰는 그라운드든 공간을 시각화하면 보이지 않던 새로운 정보가 보입니다. 지도를 통해 경쟁력을 강화하기 위한 새로운 지혜와 통찰을 얻으시길 바랍니다.

 

빅데이터와 의회도서관

“빅데이터를 더 쉽게 설명해주세요. 잘 와 닿지 않습니다.” 사내 세미나에 참석한 어느 기업 임원의 요청이었다. 빅데이터를 어떻게 실감나도록 설명할 수 있을까? 세계에서 가장 장서 수가 많은 도서관을 검색해봤다. 보통 국내 대학교의 장서 수는 100∼200만 권 사이다. 세계에서 가장 많은 소장자료를 보유한 곳은 미의회도서관으로 총 15800만 종이 있다.

 

미의회도서관 공식 블로그는 스스로 데이터 크기에 대해 언급하고 있다.1 텍스트, 사진, 동영상, 오디오 등 모든 자료의 크기는 약 10테라바이트(이하, TB)로 추정하고 있다. 2014 8월 말 기준 1TB 외장하드 가격은 10만 원 내외면 구입할 수 있다. 100만 원이면 미의회도서관 모든 데이터를 저장할 수 있다. 외장하드는 스마트폰 크기와 비슷하다. 인터넷 쇼핑몰에는 5TB 외장하드까지 등장했다.

 

5TB에는 무엇을, 얼마나 저장할 수 있을까? 고화질 사진 약 100만 장, MP3 음원 약 130만 곡, HD 화질 영화 약 3500편을 저장할 수 있는 분량이다. 국립중앙도서관의 소장자료는 총 970만 종이다. 미의회도서관과 비교하면 1TB에 모두 담을 수 있는 분량이다. 물론 추정치다. 최근 저장용량이 1TB를 넘는 노트북이 속속 출시되고 있다. 노트북에 국립중앙도서관 데이터 전체와 외장하드 2개에 미의회도서관 소장자료 전체를 담아 활용할 수 있는 시대에 살고 있다.

 

국립중앙도서관이 보유한 책은 모두 950만 권이다. 2013년 대한민국 성인 연평균 독서량은 9.2권이다. 평균 독서량을 적용하면 한국의 성인 한 사람이 국립중앙도서관의 책을 다 읽는 데 100만 년이 걸린다. 만약 매일 1권씩 읽는다면 26027년이 필요하다. 성실함으로 어찌 해볼 수 없는 분량이다. 시스코는 전 세계 모바일 데이터 사용량이 2013년보다 11배 증가해 2018년에는 연평균 190엑사바이트에 달할 것이라고 전망했다. 테라바이트의 1024배가 페타바이트다. 페타바이트의 1024배가 엑사바이트다. 그러니 엑사바이트는 테라바이트의 100만 배 이상의 크기다. 빅데이터는 성실함으로 어찌해볼 수 없는 방대한 데이터다.

 

한국 기업의 현주소

데이터스토리지 전문기업 퀀텀(Quantum)이 발표한 설문조사에 따르면, 한국 기업 중에서 자사 데이터를 90% 수준으로 이용하는 경우는 24%였다. 정말이라면 좋겠다. 2013년 기업 차원에서 관리하는 전체 데이터 규모는 약 32% 1∼20TB로 가장 많았고, 20% 51∼500TB였다. 퀀텀에 의하면 한국의 데이터 소비 규모가 세계 평균보다 5%가량 높다. 데이터 유형별 비중을 묻는 질문에는 목적에 따라 분석이 가능한 형태의 데이터베이스(DB) 및 구조화된 데이터가 36%로 가장 높았고, 문서파일이 22%, e메일과 이미지가 각각 13%로 그 뒤를 이었다. 이는 전 세계 평균 데이터 유형과 비교해볼 때 정형화된 데이터가 10%가량 많은 것으로 나타났다.2 (그림 1)

 

 

 

미국 의회도서관 자료실(좌측구글 데이터센터 서버실(우측)i

 

가입하면 무료

  • 송규봉

    송규봉mapinsite@gisutd.com

    - (주)GIS United 대표
    - 연세대 생활환경대학원 겸임교수
    - 와튼경영대학원, 하버드대 GIS연구원

    이 필자의 다른 기사 보기
인기기사

질문, 답변, 연관 아티클 확인까지 한번에! 경제·경영 관련 질문은 AskBiz에게 물어보세요. 오늘은 무엇을 도와드릴까요?

Click!