로그인|회원가입|고객센터
Top
검색버튼 메뉴버튼

SR4. 소셜 분석 방법론

극도로 복잡한 한국어 소셜 버즈 분석
필요 없는 데이터 잘 버리는 게 핵심

윤용찬 | 261호 (2018년 11월 Issue 2)
Article at a Glance
소셜 버즈 분석은 소셜 모니터링, 소셜 트렌드, 타깃 마이닝으로 크게 나눌 수 있는데 그 유용성과 정확한 분석력으로 최근 급격히 각광받고 있으나 복잡한 한국어의 구조와 어려운 텍스트 분석 난이도로 인해 여전히 해결해야 할 과제가 많은 분석 기법이다. 소셜 분석 정확도를 높이기 위해서는 정확한 수집 대상을 선정해야 하며 필요 없는 데이터를 효과적으로 버리는 작업도 필수적이다. 특히 한국어 소셜 버즈가 가진 특징과 한계를 정확히 파악하고 극복하려는 노력도 절실하다.


들어가며: 소셜 분석, ‘한국어 소셜 버즈’ 분석
많은 기업이 소셜 버즈 분석 1 을 비즈니스에 적용하고 있다. 분석 결과를 활용해 새로운 상품과 서비스를 기획, 개발하고, 신제품에 대한 소비자 반응을 모니터링하며, 타깃 소비자들의 숨겨진 니즈를 발굴하고 있다.

소셜 버즈 분석은 소셜 마이닝, 오피니언 마이닝, 소셜 트렌드 분석 등 다양한 이름으로 불리고 있으나 그 본질은 크게 다르지 않다. 분석 목적을 기준으로 크게 세 가지로 나눠본다면, 첫 번째는 특정 제품과 서비스에 대한 사람들의 반응, 요구사항을 확인하는 것이고(소셜 모니터링), 두 번째는 특정 주제에 대한 사람들의 생각을 파악하는 것이며(소셜 트렌드), 세 번째는 특정 집단의 생각과 의견을 파악하는 것이다(타깃 마이닝). 최근에는 ‘소셜 버즈’만을 분석하는 것이 아니라 여러 가지 데이터를 결합, 연계해 분석함으로써 다양한 관점의 분석 결과를 도출하고 있다. 예를 들면, 소셜 버즈 분석 결과와 카드사의 매출 데이터를 연계함으로써 특정 제품에 대한 타깃 고객을 도출해 ‘타깃 마케팅’을 진행하거나 인구통계 데이터와 결합해 특정 지역에 대한 유통전략을 새롭게 추진한다. 타깃 고객에 대한 서베이 결과 및 검색량 데이터와 결합해 새로운 브랜드 컨셉과 광고 전략을 도출하기도 한다.

이렇게 다양한 시도와 함께 성공 사례가 만들어지고 활용 범위가 넓어지고 있지만 ‘소셜 버즈 분석’은 아직도 발전 가능성이 크다고 볼 수 있다. 이는 ‘소셜 버즈 분석’의 기술적 기반이 ‘자연어 처리와 텍스트 분석’에 있으며, 한국어 텍스트 분석의 난도는 다른 어떤 언어보다도 높은 관계로 아직 극복하지 못한 부분이 많기 때문이다.

65-1


한국어 텍스트 분석이 어려운 이유는 한국어의 특성상 문법적으로 완벽하지 않은 문장도 그 의미를 충분히 파악할 수 있기 때문이다. 가령 “2일연짱야근중. 야근오나전 ㅠㅠ”라는 문장이 있다고 가정할 때 독자들 중 이 문장을 이해하지 못하는 사람은 많지 않을 것이다. 띄어쓰기를 제대로 하지 않아도, 오탈자가 있어도, 어순이 틀려도 의미 파악이 가능하다. 게다가 동형이의어가 많고, 맥락에 따라 의미가 똑같은 단어도 긍·부정은 전혀 다르게 해석되기 때문에 텍스트만 보고 의미와 의도를 정확하게 파악하기 어렵다. “동생에게 사과를 받았다”는 문장만으로는 실제로 받은 것이 무엇인지 알 수 없으며, ‘수상한 그녀’(영화 제목)로 ‘수상(受賞)한 그녀’(배우 심은경)가 있다.

SNS가 활성화할수록 이 난도는 훨씬 높아진다. 매일매일 다양한 유형의 신조어가 생겨나고, 어떤 단어는 원래 뜻과 전혀 다르게 사용되고, 심지어 자기들만의 새로운 문법을 만들어 사용하기도 한다. 따라서 소셜 버즈 분석에 앞서 한국어의, 아니, 정확히는 ‘한국어 소셜 버즈’의 특징을 정확히 이해해야 한다. 연기자 ‘김혜자’ 씨의 이름에 ‘가성비가 좋다’는 의미가 추가되고, ‘여포’는 더 이상 삼국지 속 등장인물만이 아니라 ‘절대강자’를 의미하는 신조어임을 모른다면 결코 제대로 된 분석을 할 수 없다.

가입하면 무료

인기기사
DBR AI

아티클 AI요약 보기

30초 컷!
원문을 AI 요약본으로 먼저 빠르게 핵심을 파악해보세요. 정보 서칭 시간이 단축됩니다!

Click!