엑스퍼넷-롤링 블로터공식블로그

음성인식과 내비게이션은 '찰떡궁합?'

  도안구 2007. 07. 18 디지털라이프, 테크놀로지 |

마우스와 키보드, 그리고 리모콘.

사람들에게 가장 익숙한 장비 제어의 인터페이스들이다. 수많은 IT 기기들이 쏟아지고 있는 상황에서 마우스와 키보드, 리모콘은 그 아성을 새로운 인터페이스 장비나 장치에 자리를 물려주지 않고 있다. 최근에는 터치스크린 방식으로 직접 키패드를 누루지 않고 손으로 조작하는 인터페이스가 두각을 나타내고는 있지만 아직까지 범용적으로 확산되지는 않고 있다.


음성인식이 주목 받고 있는 이유는 바로 인터페이스의 혁명을 몰고 올 것으로 기대하기 때문이다. 물론 음성 인식도 마우스와 키보드, TV 리모콘 등을 대체할 수 있다고 보지는 않는다. 음성 인식이 사용될 수 있는 곳에서는 기존에 나온 인터페이서를 대체만 해도 충분하다고 볼 수 있다.

국내에서는 휴대폰 제조업체들이 음성인식엔진을 휴대폰에 탑재해 번호를 걸 때 활용을 해보긴 했지만 실패했었다. 음성인식 소프트웨어의 성능도 문제였고, 이 엔진을 탑재할만큼의 대용량 CPU들이 탑재되지 않은 휴대폰 자체의 문제도 있었다. 또 워낙 단축키들이 많아 굳이 음성을 이용하지 않고도 전화 걸기가 쉬웠던 것도 음성인식 시장이 광범위하게 확산되지 못한 이유였었다.

그렇다면 음성인식에 대한 관심을 그만 접어야 할까? 그렇지 않다. 음성인식 관련 분야는 점차 확대되고 있다.

음성인식 소프트웨어가 차량용 네비게이션 확산과 함께 다시금 비상을 꿈꾸고 있다. KT는 지난해 열렸던 인텔개발자 회의에서 차량용 ‘카PC’에 관련 기술을 접목시키고 있고, 한국전자통신연구원(ETRI)에서도 관련 연구가 진행중이다. KT는 서울 우면동에 위치한 미래기술연구소에서 모바일 디바이스에 관련 기술을 이식하기 위해 구슬땀을 흘리고 있고, ETRI도 마찬가지다. 두 곳은 공동 연구도 함께 병행하면서 동시에 독자적인 연구도 진행하고 있다.

KT는 "유사어와 변형어 등 350개 정도의 단어를 조사해 이를 음성 엔진이 인식하도록 했다. 향후 음성 인식 기술이 유비쿼터스 환경에서 광범위하게 사용되기 때문에 현장 환경에 적용해 문제점을 개선하고 꾸준히 업그레이드하는 것이 중요하다"고 밝힌 바 있다.

이런 가운데 ETRI에서 음성인식 내비게이션 소프트웨어를 개발하는데 성공하고 국내 50여개 네이게이션 장비에 이를 탑재해 테스트를 진행하려고 한다.

이윤근 ETRI 음성언어처리연구팀장은 블로터닷넷과 전화 통화에서 "최대 45만 단어를 인식할 수 있도록 관련 소프트웨어를 개발하는데 성공했습니다. 이 정도의 성능을 내는 소프트웨어는 해외에서도 아직 없는 것으로 알고 있습니다"라고 의미를 부여하고 "올해 말이나 내년 초에는 상용화 할 수 있도록 노력을 할 계획입니다. 물론 이런 기술을 관련 업체가 수용했을 때 확산이 빠를 것은 자명한 사실입니다"라고 업체들의 협조를 구했다.

이 팀장은 "그동안 음성인식이 텔레매틱스나 내비게이션 분야에 적용되기는 했지만 단어 인수가 너무 적었습니다. 국내 행선지만 해도 수십만 개인데 이를 모두 수용하기가 힘들었는데 이번엔 그런 문제들을 해결했습니다"라고 덧붙였다.

SK텔레콤이나 KTF 등은 전국 어느에서나 인터넷이 가능한 무선 데이터 서비스인 HSDPA 접속 서비스를 선보였고, 9월부터는 업데이트 속도를 개선한 HSUPA 기술도 적용할 방침이다. KT는 와이브로 서비스를 출시하면서 더 많은 대역폭을 제공하고 있다. (물론 KT 서비스는 서울과 수도권 일부 대학에 국한돼 있어서 내비게인션에 바로 음성 인식을 적용하기에는 한계가 있다.)

내비게이션 업체들은 단순한 위치 확인과 지도 검색이 가능한 내비게이션에 DMB 방송 시청 기능도 제공하고 있다. 앞으로 더 많은 서비스와 방송 콘텐츠가 제공되면 일일히 손을 쓰는 데는 한계가 있을 수밖에 없다. 음성인식 소프트웨어가 내비게이션 활용을 극대화하는 킬러 애플리케이션이 될 것으로 예측하는 이유도 바로 이 때문이다.

음성인식이 우리의 생활 속으로 한 발 다가서고 있다. 이번에는 예전처럼 찬밥 신세를 면치 못할지, 아니면 연구자들의 말대로 일상 생활에 많은 변화를 주는 ‘엔진’으로 자리를 잡을 지 기대된다.

다음은 ETRI에서 보낸 보도자료 전문

“ETRI, 음성인식 내비게이션 SW개발”
 - 음성통해 행선지 입력, 편의,안전,경제성 
 - 세계최고 수준 음성인식 기술개발 성공

간단한 음성 명령만으로도 정확히 작동하는 내비게이션 소프트웨어(SW)가 국내연구진에 의해 개발되어 일일이 내비게이션의 키 패드를 눌러 사용하던 불편함이 사라지게 될 전망이다.
   
ETRI(한국전자통신연구원, 원장 최문기)는 17일, 내비게이션 단말기에 행선지를 음성으로 입력할 수 있는 음성인식 기술개발에 성공, 연내 텔레매틱스 단말기에 내장형 음성인식 시스템을 탑재, 시범운용후 본격적인 기술이전에 나서 내년 상반기면 시장에 선뵌다는 계획이다. 
  
이번 개발에 성공한 음성인식 SW는 PDA 또는 내비게이션 단말기 등에 탑재되어 최대 45만 단어까지 음성인식이 가능하며, 내비게이션의 행선지 입력을 음성인식으로 처리하는 기술은 세계 최초로 개발된 첨단 기술이라고 말했다.
 
본 기술은 CPU와 메모리의 제약이 있는 단말기 형태의 하드웨어에 탑재되어 수 십만개의 어휘를 고속으로 음성인식 하기 위해, 기존의 음성인식 기술과는 달리, 사람의 음성인식 과정과 유사한 방법을 적용, 기존기술 대비 효율성이 크다는 평가를 받고있다. 
 
또한 음성인식SW 개발을 위해 실제 차량의 주행환경에서 발생한 다량의 음성데이터를 수집, 음성인식률을 크게 높인것이 특징인데 이로써 내비게이션 사용자 인터페이스에 획기적인 변화를 가져올 것으로 ETRI는 예상했다. 
 
특히 최근 내비게이션 단말기, 휴대폰, 지상파DMB, 와이브로(WiBro) 등 차량내 정보단말기기 사용이 급증하는 가운데, 이번 ETRI에 의해 개발된 음성인식시스템 적용으로 보다 편리하게 행선지를 입력할 수 있을 뿐 아니라 기기조작으로 인한 사고도 예방할 수 있어 향후, 차량 내 단말기에 음성인터페이스 기능을 의무적으로 탑재하는데 탄력을 받을 수 있을 것으로 보인다.
 
아울러, 음성인식 시스템은 내비게이션 작동은 물론, DMB 프로그램의 조회, 채널변경 등의 단말기 제어, 단말기내 주소로의 전화 걸기 등 다양한 편의성이 제공될 수 있게 되어 상용화 수준에까지 도달한 것으로 ETRI는 설명했다. 
 
기존 내비게이션 단말기는 행선지 설정을 위해서는 초성 자음을 터치 스크린을 통해 입력해야 했고, 일부 음성인식이 적용된 경우도 전화통화를 이용한 방식이어서 사용자가 비용을 직접 지불해야 하는 등 불편함이 많았으나, ETRI가 개발한 음성인식시스템은 이런 근본적인 문제를 해결, 편리한 서비스 제공이 가능케 되었다는 점에서 큰 의미를 갖는다.
 
ETRI 임베디드SW연구단 박상규 음성/언어정보연구센터장은 “이번 음성인식 SW의 개발성공으로 내비게이션을 사용하는 운전자들에게 편의성, 안전성, 경제성을 가져다 줄 뿐만아니라 신체적으로 내비게이션 작동이 어려웠던 사용자들에게도 큰 도움이 되어 복지 정보통신을 앞당길수 있게되어 기쁘다”고 말했다.
 
향후, 텔레매틱스 시장전망으로는 관련 서비스 및 기기 생산전망 등을 합한 생산량 기준으로 볼 때 국내시장이 2005년 4천 6백억원에서 2010년 2조 1천억원으로 증대될 것이라고 ETRI는 밝혔다. 
 
한편, ETRI는 본 기술개발과 관련 국제특허 출원 및 국제논문을 발표했으며 국내외 정보통신 전시회에 참가, 큰 호응을 얻은바 있다. ETRI는 금년말 내비게이션 업체와 함께 음성인식 단말기 50여대를 공동제작, 시범서비스 할 계획이다.
 
ETRI가 이번에 개발한 기술은 정보통신부 “신성장동력산업용 대용량/대어휘 분산/내장처리 음성인터페이스 기술 개발”의 일환으로 지난해부터 연구개발에 착수한 중간연구 결과물이라고 말했다.

트랙백 : http://bloter.net/archives/476/trackback

댓글쓰기