METATREND Report

소닉 인터페이스 :소리는 가장 강한 도구다

98호 (2012년 2월 Issue 1)

PDF 다운로드 횟수 10회중 1회차 차감됩니다.
다운을 진행하시겠습니까?
아티클 다운로드(PDF)
4,000원

 

 

편집자주

메가트렌드에 비해 마이크로트렌드는 미세한 변화를 통해 파악되기 때문에 쉽게 인식하기 어렵습니다. 하지만 마이크로트렌드는 기업에 블루오션을 열어줄 수 있습니다. 상품을 통해 마이크로트렌드를 파악하고 분석하는 메타트렌드연구소의 최신 연구 결과를 신사업 아이디어 개발에 활용하시기 바랍니다.

 

인간의 오감 중 소리는 오랫동안 사람들 사이의 관계를 만들고 상호작용을 이끌어 내기 위한 중요한 인터페이스로 사용돼 왔다. 하지만 소리와 음성은 정량적으로 해석할 수 없는 아날로그적인 요소가 강해 디지털 시대의 스포트라이트에서 살짝 비켜 지나갔다. 기술이 발전하면서 소리는 이전에는 상상하지 못했던 새로운 인터페이스로 주목받고 있다. 스마트 모바일 시대에 음성 인식 인터페이스는 간단한 대화만으로 다양한 일을 수행할 수 있는 단축키와도 같다. 또 각종 전자 기기들 간 접촉이 빈번하게 일어나는 상황에서 특정한 소리는 마치 지문과 같은 식별의 수단으로 활용될 수도 있다. 사람들의 무의식 속에 자리잡는 소리의 기억은 인상적인 사용자 경험을 만들 때 꼭 필요한 요소이기도 하다. 우리가 소닉 인터페이스(Sonic Interface)에 주목해야 하는 이유다.

 

가장 인간적인 입출력 방식

사람이라면 누구나 자연스럽게 쓸 수 있는 목소리를 통해 인공지능, 알고리즘을 활용하고 복잡한 과제를 처리한다. 언어는 인간적인 감성을 갖고 있는 매체이므로 사람과 기기 간의 교류를 유연하게 만들어준다. 언어로 포장된 인공지능은 고유한 성격을 갖고 대화 속에서 컨텍스트를 감지하고 응답한다. 더 이상 기기가 아닌 인간적인 그 무엇처럼 느껴진다.

 

애플 아이폰 4S의 시리(Siri)는 소닉 인터페이스를 실제 사람들의 생활 속으로 끌어들여온 첫 사례인 동시에 사람에게 더욱 인간적으로 자연스럽게 접근하는 인공지능의 모습을 보여주는 좋은 예다. 시리는 키워드 기반의 목소리 입력(Voice Input)과 달리 사람의 자연스러운 대화 속에서 스스로 키워드를 찾고 사람이 의도하는 바를 예측하는 인간적인 측면에 주목한다. 이러한 감성적 반응은 소닉 인터페이스의 편의성과는 별개로 사람들의 감성에 호소하는 인터페이스가 된다. 또 소리를 통한 인공지능과의 인터랙션은 사람들이 감정 이입을 원하는 주변의 다른 사물들로 영향력을 넓혀 나간다.

 

plamoni라는 아이디의 네티즌이 개발, 공개한 시리 프록시(github.com/plamoni/SiriProxy)가 대표적인 예다. 시리 프록시는 인터넷 연결을 통해 다른 가전제품이나 전자기기를 시리로 조종하는 기술이다. 시리 프록시가 등장한 후 이를 응용한 시리 해킹 사례가 속속 등장하고 있다. fiquett이라는 사람은 자신의 자동차 스마트키와 시리를 연결해차에 시동을 걸어줘라는 대화로 실제 시동을 거는 모습을 보여줬다. 사람들은 소닉 인터페이스를 통해 주변 사물과의 연결에서도 감성적인 충족감을 얻으려고 한다.

 

 

Siri-“Start my car”
지름길 인터페이스

소닉 인터페이스는 기존 인터페이스의 불편을 해결하고 여러 개의 과정을 단축시킨다. 특히 모바일 환경의 정착은 소리의 편리함을 더욱 부각시켰다. 예를 들어 길거리를 걷거나, 자동차를 운전하거나, 양손으로 요리하는 동안 모바일 단말기에 소리로 입력을 할 수 있다. 사용자의 양손을 자유롭게 하기 위해 기기가 가진 터치 스크린이나 버튼 등의 인터페이스를 생략하고 즉시 명령을 전달한다. 즉 소닉 인터페이스는 여러 단계의 물리적 인터페이스를 건너뛰고 빠르게 명령을 수행하는 일종의 지름길과도 같다.

 

기존 인터페이스의 기능을 늘리고 더 세밀하게 작동 시키기 위해 소리를 추가하는 경우도 있다. 크리스해리슨(chrisharrison.net)의 탭센스 기술은 터치스크린의 단순한 입력 구조에 소리를 추가해 복합적인 입력을 구현한다. 스마트 디바이스에 흔히 사용되는 터치스크린은 전기가 통하는 물체(손가락을 포함한 인체 모두)의 접촉만을 인지하지만 탭센스는 스크린에 인체 부위가 닿을 때 나는 소리의 미세한 차이를 구별해서 더욱 많은 종류의 입력이 가능하다. 손가락 끝, 손톱, 손가락 마디 등으로 입력 변수가 많아짐에 따라 사용자가 쓸 수 있는 기능의 수가 대폭 증가한다.

 

Acoustic Ruler
물리적 도구를 소닉 인터페이스로 대체한 사례로는 플로리안 스튜던트(iqtainment.wordpress.com)의 어쿠스틱 룰러를 들 수 있다. 이 기술은 음파가 스피커에서 발사돼 마이크에 도착하는 시간 차를 이용해 기기 간의 거리를 측정한다. 물리적인 자를 사용하지 않고 스마트폰, 태블릿 등에 달린 마이크와 스피커만으로 길이를 잴 수 있다. 서랍에서 커다란 자를 찾아서 그것을 들어 길이를 잴 곳에 갖다 대는 여러 개의 과정이 음파를 한번 발생시키는 것으로 단축된다. 중간에 방해물이 없으면 최대 25m까지 거리를 측정할 수 있어 어지간한 휴대용 줄자보다도 훨씬 효율적이다.

 

사람의 자연스러운 활동이 곧 사용자 인터페이스가 되는 NUI(Natural User Interface)를 구현함에 있어서 모션 컨트롤과 소닉 인터페이스의 조합은 사용자에게 학습을 요구하지 않으며 기술적으로도 빠른 시일 내에 대중화될 수 있는 방법이다. 마이크로소프트는 키넥트의 모션 컨트롤과 음성 인식 기능을 함께 사용해 거실 속의 생활을 바꿔놓으려 한다. 이들이 공개한거실의 미래영상에서는 리모컨 없이 손 동작으로 TV 속 콘텐츠를 브라우징하며 음성으로 키워드를 입력해서 방송 프로그램과 연계된 다양한 정보를 찾는 모습이 나온다. 더 나아가 뉴애드라는 기능은 음성으로 검색하는 광고 콘텐츠 모델의 가능성을 보여준다. 방송을 보다가 엑스박스라는 키워드와 함께(More)”라고 말하면 실제 진행되고 있는 이벤트에 참가하는 방법이나 상점의 위치 정보 등이 추가로 나온다. 사람의 몸 동작과 음성을 함께 사용함으로써 기존 키보드, 마우스, 리모컨 등에서 나타나는 복잡함을 한번에 건너뛸 뿐만 아니라 추가 정보의 검색 과정까지 단순화시켰다.

 

사물 사이의 교류를 위한 만능 인터페이스

수많은 모바일 단말기가 쏟아져 나온 만큼 고정식 기기들과의 접촉도 크게 증가하는 시대다. NFC(Near Field Communication) 기술이 기기 간 교류의 매개로 부상하고 있지만 NFC가 모든 기기들의 통신 규격을 통합시키기는 어렵다. NFC를 포함해 바코드나 QR코드 등도 여전히 사용되고 있으며 접촉식 혹은 비접촉식 카드 리더 등 다수의 규격이 함께 발전하고 있다. 이 와중에 소리는 마이크, 스피커만 있으면 어느 기기나 인터페이스로 쓸 수 있다는 장점을 내세워 구형 모바일 단말기나 결제 시스템까지 포용하는 통합 프로토콜이 될 수 있다. 게다가 소리는 방대한 패턴을 갖고 있어 강력한 보안성을 갖추거나 콘텐츠를 세밀하게 구분하는 등의 다양한 용도로 사용될 수 있다.

 

  
IntoNow & Soundprint, Yahoo!
야후! TV와 태블릿을 연동시키는 어플리케이션인 인투나우를 공개했다. 인투나우는 TV에서 흘러나오는 소리를 아이폰 마이크를 통해 입력을 받아 현재 상영 중인 프로그램을 인식하는 사운드 프린트 기술이다. 방송의 소리를 알고리즘으로 빠르게 분석해 상영 중인 프로그램을 인식하는 기술인데 생방송이든 저장된 비디오든 상관없이 프로그램을 정확히 읽어내고 관련 정보를 제공한다. 인투나우의 개발진은 이것을 일종의 지문 식별에 비유한다. 내러티(www.naratte.com)는 스마트폰이나 일반 휴대전화의 스피커와 마이크만으로 근거리 통신을 할 수 있는 주시(Zoosh) 기술을 선보였다. 사람의 귀에 들리지 않는 초음파를 활용하는 것으로 소리를 통해 카드 결제를 하거나 음성 메시지로 할인 쿠폰을 받는 등의 동작이 가능하다. 또한 결제 같은활동이 일어난 다음에는 즉각 분간할 수 없는 소리 신호로 변경되기 때문에 보안에도 유리하다. 기존의 POS(Point-of-sale) 시스템을 수시로 교체하는 데 드는 비용은 30달러 정도에 불과하며 하드웨어가 아닌 소프트웨어 업데이트만으로 진행된다.

 

무의식 수준의 사용자 경험을 만드는 인터페이스

소리는 여러 가지 사용자 경험들 중에서도 직접적인 자극에 해당하며 사람의 뇌리에 흔적을 남긴다. 소리가 현실 세계에 변화를 주는 모습은 마법처럼 신기하고 재미있다. 기능적인 요소 외에도 감각적으로 전달되는 뜻밖의 재미를 제공한다. 소리는 무의식 수준의 경험을 창조한다. 인상적으로 디자인된 소리는 사람들에게 새로운 형태의 경험이며 다양한 멀티미디어 기기들을 통해 빠르게 전파되는 입소문(Viral) 매체이기도 하다.

 

반려견 사료 브랜드인 베네풀(www.beneful.com)은 유럽 지역의 TV 광고에 독특한 효과를 넣었다. 광고 중간에 개만 들을 수 있는 고음의 신호를 몇 차례 넣은 것이다. 이 소리는 개 피리와 거의 동일한 주파수이므로 자연스럽게 반려견이 TV 광고에 주목하게 된다. 이는 소닉 인터페이스가 가진 무의식적 자극의 간단한 활용에 속한다. 소리는 사람이든 동물이든 이성적 생각보다 앞서 반응하도록 만드는 자극제다. 제품에 대해 별다른 생각을 하지 않은 상태에서도 짧은 소리 신호 한 번으로 상상력이 발동된다. 또한 사료 광고를 보는 반려견의 주인에게 베네풀은 동물과 최대한 교감하고 싶어하는 브랜드라는 인식을 준다.

 

브레노코스타가 기획한 BGH 퀵 셰프의 뮤직 케이스는 전자레인지에서 들려오는 비프음을 음악으로 바꾼다. 이들은 1000대로 한정 생산된 BGH 전자레인지에 스피커를 삽입하고 USB 디스크로 사용자가 직접 음악을 넣을 수 있도록 했다. ‘삑삑거리며 사용자에게 음식을 찾아갈 것만 강요하는 소리를 즐거운 음악으로 바꿔서 제품에 개성을 부여했다. 사람의 무의식 단계에서 스트레스를 주는 소리를 듣기 좋은 소리로 바꾸는 사운드 경험의 설계에 주목할 필요가 있다.


Jambox, Jawbone
소리의 무의식적인 이미지 전달 기능은 기업의 브랜딩 및 개인의 아이덴티티 표현에도 유용하다. 이미 유명 브랜드들은 브랜드 사운드를 보유하고 있으며 이 소리를 TV, 라디오 광고 및 실제 제품에서 나오는 소리 등으로 다양하게 활용하고 있다. 같은 제품이라도 색다른 소닉 인터페이스를 가진 쪽이 사람들에게 특별한 인상을 주며 고유한 개성을 드러낸다. 조본(www.jawbone.com)은 사용자들이 직접 웹사이트에서 무선 스피커 잼박스를 비롯한 블루투스 제품 모두에 목소리 앱을 설치할 수 있게 했다. 이 제품들은 디스플레이가 없기 때문에 버튼을 누를 때마다 사람의 목소리로 상태를 설명해주는데 앱을 설치할 때마다 독특한 목소리가 추가된다. 힘있고 거친 남성의 목소리부터 섹시한 여성의 목소리까지 잼박스에 특화된 다수의 소리가 제품의 이미지를 새롭게 바꿔준다.

 

Ritornell for Musicbox, Richard Eigner
리처드 아이그너(richard.ritornell.at)는 오르골에 넣는 악보 형태의 명함을 만들었다. 여러 겹으로 접히는 명함에는 사람 이름의 알파벳이 하나씩 새겨져 있다. 이것을 펼친 후 오르골에 넣고 돌리면 일정한 음악이 나오다가 알파벳 부분에서만 혼합된 화음이 들린다. 각 사람의 이름마다 모두 다른 소리가 나온다는 뜻이다. 소리로 표현된 이 아이덴티티는 글자, 그림들보다도 무의식적으로 강하게 인식된다. 한번 기억되면 잘 잊혀지지 않는, 머릿속에서 자꾸 맴도는 기억으로 자신을 표현한다.

 

 

 

유인오 메타트렌드미디어그룹 대표이사 willbe@metatrendmedia.com

신동윤 메타트렌드미디어그룹 수석연구원 dyshin@metatrendmedia.com

 

메타트렌드연구소(METATREND Institute·www.themetatrend.com)는 상품 중심의 최신 마이크로 트렌드를 분석해 전 세계 주요 미디어, 글로벌 기업, 오피니언 리더들에게 제공하고 있다. 기업과 소비자가 더 나은 미래를 창조하는 데 도움을 준다는 목표로 운영되는 글로벌 트렌드 연구소다.

동아비즈니스리뷰 273호 언더그라운드 정보와 기업 전략 2019년 5월 Issue 2 목차보기