[IT열쇳말] 인공지능(AI) 스피커

음악 감상이나 라디오 청취에 활용되던 스피커가 음성인식 기술과 만나 진화하고 있다.  스마트폰에서 쉽게 만나볼 수 있는 음성인식 기술과 클라우드, 인공지능(AI) 기술을 활용해 단순하게 소리를 전달하는 도구에서 생각하고 관리하는 AI 스피커로 변신중이다. 이미 아마존, 구글, 애플 등 글로벌 IT 기업이 이 시장에 뛰어들었다. 국내에서는 SK텔레콤, KT, 네이버, 삼성전자 등도 이 시장에 관심을 보이고 있다.

▲AI 스피커를 활용하면 음성으로 간편하게 노래를 재생하거나, 통신망에 연결된 가전기기를 제어할 수 있다. (출처: 아마존)

스피커는 왜 AI를 품었을까

사용자조작화면(UI)이 새롭게 만들어질 때 거대한 플랫폼이 동시에 만들어진다. UI는 사용자가 기계와 쉽게 대화를 나눌 수 있게 도와주는 중개 역할을 하기 때문이다. PC 시대에는 마우스와 그래픽 중심의 UI 플랫폼이 만들어졌다. 스마트폰이 등장하면서 화면을 클릭할 수 있는 터치 기반 UI 플랫폼이 등장했다. 그리고 이제 기업은 차세대 UI 플랫폼으로 텍스트 기반 입력이 아닌 ‘음성’에 주목하고 있다.

음성 기반 플랫폼이 만들어지면 스마트홈으로 가는 사물인터넷(IoT) 시장을 손쉽게 선점할 수 있다. 스마트홈은 집 안 각종 가전제품, 수도, 전기사용량 등을 통신에 연결해 모니터링하고 제어할 수 있는 집을 말한다. 이 핵심엔 현재 스피커가 자리잡았다.

음성 기반 플랫폼을 이용하면 손을 이용하지 않고도 편리하게 기기를 관리하거나 제어할 수 있다. AI 스피커가 등장하는 이유다.

AI 스피커는 인공지능 알고리즘을 이용해 사용자와 음성으로 의사소통을 한다. AI 스피커를 이용하면 음성인식을 통해 집안의 기기를 목소리만으로 간편하게 제어하는 식으로 손쉽게 스마트홈 환경을 구축할 수 있다.

또한 터치 기반과 달리 음성 기반 조작은 쉽게 배우고 사용할 수 있다. 우리가 스마트폰에서 ‘시리’나 ‘S보이스’ 등을 이용해 기기를 제어하는 게 낯설지 않듯, 음성인식 기반 UI 플랫폼은 우리 생활 가까이에 숨어 있다. 억지로 배우지 않아도 자연스럽게 배울 수 있는 UI인 셈이다.

AI 스피커 대중화에 앞장선 아마존 ‘에코’

AI 시장에 가장 먼저 뛰어든 건 아마존이다. 아마존은 2년 전 스마트홈 스피커 ‘에코’(Echo)를 출시한 이후 ‘에코닷’Echo Dot), ‘아마존탭’(Amazon Tap) 등을 선보이며 AI 스피커 시장을 이끌고 있다.

아마존 에코는 음성비서 기능인 ‘알렉사’(Alexa)를 내장한 원통형 스피커다. 원통에는 마이크 7개가 내장돼 있으며, 소음 제거 기능이 들어가 있다. 이용자는 명령어를 통해 아마존 프라임 뮤직이나 스포티파이 같은 스트리밍 음악 서비스를 즐길 수 있다. 에코는 날씨나 그날 뉴스를 알려주기도 하고, 간단한 질문에도 음성으로 답을 해준다.

▲아마존 에코 (출처: 아마존)

에코닷은 지난 3월 아마존이 선보인 아마존 에코 후속 제품이다. 아마존은 에코닷 외에도 아마존탭이라는 휴대용 버전 아마존 에코도 함께 선보였다.

▲에코닷 (출처: 아마존)

에코닷은 아마존 에코보다 작다. 와이파이 같은 무선 통신이나 블루투스, 오디오 케이블을 이용해 외부 스피커와 연결해서 사용한다. 주위에 소음이 있어도 6-7m 거리에서도 명령을 내릴 수 있다. 명령에 반응하면 본체 위쪽에 위치한 링이 빛난다.

https://youtu.be/24Hz9qjTDfw

아마존탭은 아마존 에코의 휴대용 버전이다. 생김새는 아마존 에코와 비슷하지만, 제품 색상은 훨씬 다양하며 크기가 작다. 사용법은 아마존 에코와는 조금 다르다. 아마존 에코가 항상 켜져 있는 상태라면, 아마존탭은 탭을 해야 음성을 인식하고 처리한다.

아마존 에코, 에코닷, 탭 등 AI 스피커의 핵심은 음성인식 기술인 알렉사다. 알렉사는 ‘스킬킷’이라는 API를 통해 다른 앱에서 호출 또는 응용해 쓸 수 있다. 인터넷과 연결된 스피커만 있다면 냉장고, 화장실 거울, 전자렌지 등에서도 AI 스피커를 이용해 제어할 수 있다.

▲아마존탭 (출처: 아마존)

아마존이 제공하는 알렉사 스킬 스토어를 보자. 지난 3월 기준으로 300여개의 알렉사 스킬킷이 제작되면서 앱스토어와 유사한 생태계를 만들고 있다. 야릇한 목소리로 알렉사의 음성을 변조하는 스킬에서부터 음식 조리법을 읽어주는 스킬, 메일 중 일정 관련 메시지를 뽑아내서 읽어주는 스킬 등 스킬의 알렉사의 기능을 다채롭게 만들고 있다.

한국어 전용 AI 스피커, SK텔레콤 ‘누구’

‘누구’(Nugu)는 전용기기에 대화하듯 말을 걸면 음성인식 기술과 인공지능 엔진을 통해 고객이 원하는 바를 파악해 수행하는 서비스다. 지난 8월 SK텔레콤이 개발한 일종의 AI 비서다.

예를 들어 누구에게 ‘오늘 날씨를 알려줄래?’, ‘노래를 불러줄래?’ 등과 같은 질문을 던지면, 누구는 이를 이해해 날씨 정보를 사용자에게 음성으로 알려주거나 노래를 불러준다.

▲SK텔레콤이 선보인 AI 스피커 ‘누구’

누구 역시 아마존 에코처럼 클라우드를 통해 사용자 대화를 이해하고 파악한다. SK텔레콤은 누구 음성인식 기술에 딥 러닝을 더해, 쌓이는 데이터가 늘어날수록 이를 바탕으로 학습할 수 있게 개발했다. 사용자 자주 이용할수록 누구가 이해할 수 있는 단어와 문장도 함께 늘어나면서 인식도가 높아진다.

누구는 고객과의 대화 맥락을 이해하는 인공지능 플랫폼과 음성 입출력이 가능한 전용 스마트 기기로 이뤄져 있다. 누구를 사용하려면 전용 스마트 기기와 와이파이가 있어야 한다. 그다음 스마트폰에 누구 앱을 내려받아 연결해 사용하면 된다. 누구는 팅커벨, 크리스털, 아리아, 레베카란 이름 중 하나를 선택해 이름을 부르면 이용할 수 있다.

SK텔레콤이 이날 선보인 ‘가정용 누구’는 멜론과 같은 음악 스트리밍 서비스를 재생하고, 조명이나 제습기 같은 가전 기기 제어할 수 있으며, 스마트폰과 연동해 ‘휴대폰 찾기’를 하거나 알람이나 일정관리 등의 비서 역할 등도 수행할 수 있다.

이 외에도 집 밖에서 누구를 이용해 집 안 조명을 켜거나 에어컨 등을 이용해 실내 온도를 원격으로 제어할 수 있다. 누구의 음성인식 범위는 2-3m 정도로 실내에서 이용하는 데 최적화돼 있다.

구글판 AI 스피커 ‘구글홈’

구글은 지난 10월 열린 신제품 공개 행사 ‘메이드 바이 구글’에서 ‘구글홈’을 정식으로 발표했다.

구글홈은 스피커 모양의 거치형 AI 개인비서 기기로, 다른 AI 스피커와 마찬가지로 음성 인식 기반이다. ‘오케이, 구글’(OK, Google)로 인공지능 비서를 깨운 다음 자연스러운 구어체로 말을 걸면, 사용자 대화 내용을 이해하고 그에 따른 정보를 음성으로 알려준다. 기기 상단에 터치 센서를 탑재해 터치로 볼륨 및 재생을 제어할 수 있다. 음소거 버튼도 갖췄다.

▲구글홈 (출처: 구글)

검색 제왕 구글답게 만약 구글 데이터베이스를 활용해 사용자 답변을 이해하고 대답한다. 적절한 답변이 없을 땐, 위키피디아 같은 신뢰할 수 있는 소스에서 검색한 내용을 답한다. 다른 기기와도 연결헤서 사용할 수 있으며, 크롬캐스트와 연동해 음성인식으로 TV에서 동영상을 틀고 크롬캐스트 오디오를 통해 음악도 재생할 수 있다.

그 외에도 각종 스마트홈 기기와도 연동해 전등을 켜거나 전원을 차단하고 에어컨 온도 조절도 가능하다.

https://youtu.be/r0iLfAV0pIg

삼성전자·KT도 AI 스피커 준비중

삼성전자 역시 AI 스피커를 준비하고 있는 것으로 알려졌다. 삼성전자는 마이크로소프트 음성비서 ‘코타나’ 기반 AI 기술과 세계적인 음향 기기 제조사 하만카돈의 기술을 결합해 2017년 AI 스피커를 선보일 계획이다.

KT는 지난 7월 한국전자통신연구원(ETRI)의 음성인식 기술과 KT CS 콜센터 데이터베이스, KT뮤직의 음원 서비스 지니를 결합한 스피커 형태의 AI 홈비서 ‘기가 지니’(GiGA genie, 가칭)를 연내 출시할 예정이라고 밝힌 바 있다. 그러나 이 계획은 조금 미뤄져 2017년 초로 연기됐다.

기가 지니는 사용자가 기기와 대화를 주고받으며 정보를 확인하거나 집안의 각종 전자기기를 제어할 수 있는 스피커 형태의 홈비서 시스템이다. 인터넷TV(IPTV)와 연동해 음성만으로 TV를 조작할 수 있는 게 특징이다.

출시 시점에서는 700만곡 이상의 음원 서비스가 가능한 KT 뮤직 지니를 음성명령으로 실행하는 서비스와 가정용 IoT 기기 제어 서비스가 주된 기능이 될 것으로 보인다. 출시 이후에는 택시, 배달 등 각종 콜서비스와 전자상거래 등이 가능한 플랫폼으로 서비스가 확대될 것으로 보인다.

이 글은 ‘네이버캐스트→테크놀로지월드→용어로 보는 IT’에도 게재됐습니다. ☞‘네이버캐스트’ 보기