극도로 복잡한 한국어 소셜 버즈 분석 필요 없는 데이터 잘 버리는 게 핵심

SR4. 소셜 분석 방법론

극도로 복잡한 한국어 소셜 버즈 분석
필요 없는 데이터 잘 버리는 게 핵심

윤용찬 | 261호 (2018년 11월 Issue 2)

- 아티클
  
  스페셜 리포트 케이스 스터디
  경영전략/경영일반 인사/조직 마케팅/세일즈 리더십/자기계발 인문 AI/DT
  전체 기사 보기 호수별 Case Study HubENG audio DBR PDF 전체보기
- 구독
  
  월정액 서비스 연간 서비스 낱권 PDF 대량/법인
- 이벤트
  
  이벤트
- 고객센터
  
  공지사항 FAQ 1:1문의 이용권/상품권 인증
공유
스크랩

+ 새로운 폴더 생성
폴더명

메모입력

스크랩
아티클요약

Article at a Glance
소셜 버즈 분석은 소셜 모니터링, 소셜 트렌드, 타깃 마이닝으로 크게 나눌 수 있는데 그 유용성과 정확한 분석력으로 최근 급격히 각광받고 있으나 복잡한 한국어의 구조와 어려운 텍스트 분석 난이도로 인해 여전히 해결해야 할 과제가 많은 분석 기법이다. 소셜 분석 정확도를 높이기 위해서는 정확한 수집 대상을 선정해야 하며 필요 없는 데이터를 효과적으로 버리는 작업도 필수적이다. 특히 한국어 소셜 버즈가 가진 특징과 한계를 정확히 파악하고 극복하려는 노력도 절실하다.

들어가며: 소셜 분석, ‘한국어 소셜 버즈’ 분석
많은 기업이 소셜 버즈 분석 1 을 비즈니스에 적용하고 있다. 분석 결과를 활용해 새로운 상품과 서비스를 기획, 개발하고, 신제품에 대한 소비자 반응을 모니터링하며, 타깃 소비자들의 숨겨진 니즈를 발굴하고 있다.

소셜 버즈 분석은 소셜 마이닝, 오피니언 마이닝, 소셜 트렌드 분석 등 다양한 이름으로 불리고 있으나 그 본질은 크게 다르지 않다. 분석 목적을 기준으로 크게 세 가지로 나눠본다면, 첫 번째는 특정 제품과 서비스에 대한 사람들의 반응, 요구사항을 확인하는 것이고(소셜 모니터링), 두 번째는 특정 주제에 대한 사람들의 생각을 파악하는 것이며(소셜 트렌드), 세 번째는 특정 집단의 생각과 의견을 파악하는 것이다(타깃 마이닝). 최근에는 ‘소셜 버즈’만을 분석하는 것이 아니라 여러 가지 데이터를 결합, 연계해 분석함으로써 다양한 관점의 분석 결과를 도출하고 있다. 예를 들면, 소셜 버즈 분석 결과와 카드사의 매출 데이터를 연계함으로써 특정 제품에 대한 타깃 고객을 도출해 ‘타깃 마케팅’을 진행하거나 인구통계 데이터와 결합해 특정 지역에 대한 유통전략을 새롭게 추진한다. 타깃 고객에 대한 서베이 결과 및 검색량 데이터와 결합해 새로운 브랜드 컨셉과 광고 전략을 도출하기도 한다.

이렇게 다양한 시도와 함께 성공 사례가 만들어지고 활용 범위가 넓어지고 있지만 ‘소셜 버즈 분석’은 아직도 발전 가능성이 크다고 볼 수 있다. 이는 ‘소셜 버즈 분석’의 기술적 기반이 ‘자연어 처리와 텍스트 분석’에 있으며, 한국어 텍스트 분석의 난도는 다른 어떤 언어보다도 높은 관계로 아직 극복하지 못한 부분이 많기 때문이다.

한국어 텍스트 분석이 어려운 이유는 한국어의 특성상 문법적으로 완벽하지 않은 문장도 그 의미를 충분히 파악할 수 있기 때문이다. 가령 “2일연짱야근중. 야근오나전 ㅠㅠ”라는 문장이 있다고 가정할 때 독자들 중 이 문장을 이해하지 못하는 사람은 많지 않을 것이다. 띄어쓰기를 제대로 하지 않아도, 오탈자가 있어도, 어순이 틀려도 의미 파악이 가능하다. 게다가 동형이의어가 많고, 맥락에 따라 의미가 똑같은 단어도 긍·부정은 전혀 다르게 해석되기 때문에 텍스트만 보고 의미와 의도를 정확하게 파악하기 어렵다. “동생에게 사과를 받았다”는 문장만으로는 실제로 받은 것이 무엇인지 알 수 없으며, ‘수상한 그녀’(영화 제목)로 ‘수상(受賞)한 그녀’(배우 심은경)가 있다.

SNS가 활성화할수록 이 난도는 훨씬 높아진다. 매일매일 다양한 유형의 신조어가 생겨나고, 어떤 단어는 원래 뜻과 전혀 다르게 사용되고, 심지어 자기들만의 새로운 문법을 만들어 사용하기도 한다. 따라서 소셜 버즈 분석에 앞서 한국어의, 아니, 정확히는 ‘한국어 소셜 버즈’의 특징을 정확히 이해해야 한다. 연기자 ‘김혜자’ 씨의 이름에 ‘가성비가 좋다’는 의미가 추가되고, ‘여포’는 더 이상 삼국지 속 등장인물만이 아니라 ‘절대강자’를 의미하는 신조어임을 모른다면 결코 제대로 된 분석을 할 수 없다.

15,000개의 아티클을 제대로 즐기는 방법
가입하면, 한 달 무료!

걱정마세요. 언제든 해지 가능합니다.

윤용찬

데이터마케팅코리아 교육사업본부장
이 필자의 다른 기사 보기

이전 목록 다음

듣는 DBR 브리핑

극도로 복잡한 한국어 소셜 버즈 분석 필요 없는 데이터 잘 버리는 게 핵심

15,000개의 아티클을 제대로 즐기는 방법 가입하면, 한 달 무료!

극도로 복잡한 한국어 소셜 버즈 분석
필요 없는 데이터 잘 버리는 게 핵심

15,000개의 아티클을 제대로 즐기는 방법
가입하면, 한 달 무료!