하이퍼커넥트, ‘인터스피치 2019’서 음성인식 AI 성과 발표

모바일 음성인식 AI 키워드 검출 속도 385배 향상

가 +
가 -

글로벌 영상 메신저 ‘아자르’를 개발 운영 중인 하이퍼커넥트가 9월 오스트리아 그라츠에서 열리는 ‘인터스피치 2019’에 참가해 음성인식 분야 인공지능(AI) 연구 성과를 발표한다고 8월13일 밝혔다. 하이퍼커넥트는 모바일 기기에서 음성인식으로 키워드 검출 속도를 개선한 내용을 발표할 예정이다.

인터스피치는 음성언어처리 분야에서 세계 최고 권위를 인정받고 있는 국제 학회다. 올해 20회째로 매년 2천명 규모의 전세계 연구진이 참여해 음성인식과 음성합성, 음성통신 관련 연구 성과를 공유한다. 9월15일부터 19일까지 열리는 이번 행사에는 구글, 페이스북, 아마존, 엔비디아, 알리바바 등 글로벌 기업과 대학이 발표자로 나선다.

하이퍼커넥트는 ‘인터스피치 2019’에서 ‘모바일 기기에 실시간 키워드 검출을 위한 템퍼럴 컨볼루션(Temporal Convolution for Real-time Keyword Spotting on Mobile Devices)’ 논문을 발표한다.

하이퍼커넥트는 이번 연구를 통해 모바일 기기에서 음성인식으로 특정 키워드를 검출하는데 ‘템퍼럴 컨볼루션(Temporal convolution)’을 적용, 기존 최고 성능 모델 대비 음성인식 AI의 키워드 검출 속도를 385배 높이는 동시에 정확도는 0.3% 높이는 성과를 달성했다고 밝혔다. 키워드 검출은 사용자의 말 중 특정 키워드를 인식하는 기술로, ‘오케이 구글’, ‘헤이 시리’ 등 음성 명령을 실행하는데 사용된다.

하이퍼커넥트는 지난 2016년 머신러닝 기반의 실시간 음성 번역 기능을 아자르 앱에 도입한 것을 시작으로, 자체 머신러닝 연구 조직을 갖추고 모바일 딥러닝 분야 연구에 투자해왔다. 특히 서버와의 통신 없이 스마트폰 기기 내에서 가볍고 빠르게 구동 가능한 온디바이스 AI를 만드는 데 집중해왔다. 하이퍼커넥트는 기존 이미지·영상 처리 분야에서 쌓아온 기술력을 바탕으로 음성, 텍스트 등으로 AI 연구 분야를 확장해 나갈 계획이다.

용현택 하이퍼커넥트 CTO는 “음성인식 분야로 AI 연구 도메인을 확장한 후 단기간에 가시적 연구 성과를 달성하고 이를 세계 최고 권위 학회에서 글로벌 IT기업들과 나란히 공유하게 되어 기쁘다”라며 “앞으로 영상, 음성, 텍스트 등 다양한 분야에서 최첨단 온디바이스 AI 모델을 연구하고 개선하여 전 세계 사용자들에게 더 많은 가치를 제공할 수 있도록 노력하겠다”라고 밝혔다.

네티즌의견(총 0개)