▲ △네이버의 인공지능(AI) 스피커 프렌즈 미니(사진=네이버)
▲ △네이버의 인공지능(AI) 스피커 프렌즈 미니(사진=네이버)

네이버가 초대규모(hyperscale) 인공지능(AI) ‘하이퍼클로바’의 딥러닝 기술을 음성인식 엔진에 접목했다고 8일 밝혔다. 추후 이같이 업그레이드된 엔진을 클로바노트·클로바케어콜 등 음성인식 AI 기반의 각종 서비스에 탑재해 편리한 사용자 경험을 제공할 예정이다.

네이버에 따르면 전통적으로 딥러닝은 데이터와 데이터를 설명하는 레이블(label)을 쌍으로 학습시키는 ‘지도학습(supervised learning)’ 방식으로 이뤄져왔다. 예를 들면 고양이 이미지와 ‘고양이’라는 설명을 같이 학습시키는 식이다. 음성인식을 개발할 때도 음성과 음성 속 텍스트를 같이 학습시켜야 한다.

이 같은 ‘데이터 레이블링’은 사람의 수작업이 필요해 학습데이터 구축에 시간·비용이 소요된다. 반면, ‘자기지도학습(self-supervised learning)’은 레이블 없이 자체 데이터 만으로 학습할 수 있는 딥러닝 기법으로 학습의 효율성을 높여준다. 네이버 ‘하이퍼클로바’의 핵심 기술이기도 하다.

네이버는 자기지도학습 기법을 AI 음성인식 엔진 ‘네스트(NEST·Neural End-to-end Speech Transcriber)’에 적용해 기존 대비 음성인식 정확도를 약 30% 높였다고 밝혔다. 새로운 학습기법 적용으로 음원 데이터 속 텍스트를 확인하는 전사(transcription) 작업을 최소화해 모델의 학습시간·비용이 단축됐다는 설명이다.

앞서 네이버가 지난해 4월 처음 공개한 네스트 엔진은 단문 위주의 음성 명령보다 복잡한 장문의 음성 표현을 인식하는데 최적화된 기술이다.

네스트 엔진은 가장 우선적으로 ‘클로바노트’에 탑재됐다. 네이버는 이를 시작으로 AI가 전화로 코로나19 능동감시자를 확인하는 클로바 케어콜, 뉴스 자동 자막 서비스 등 음성인식 AI 기반의 서비스에 엔진 적용을 확대해 나갈 예정이다.

한익상 네이버 책임리더는 “네이버는 음성기술에 하이퍼클로바의 기술을 접목시켜 다양한 음성 AI 서비스의 성능을 더욱 고도화해 나갈 것”이라고 말했다.

저작권자 © 블로터 무단전재 및 재배포 금지