트렌드

네이버, 클로바에 ‘유인나’ 목소리 제공…자체 음성합성기술 활용

2018.11.30

배우 유인나 씨 목소리가 네이버 스마트 스피커에 들어간다. 녹음한 음원이 아니다. 음성합성 기술을 활용해 일부 음성 데이터를 가지고 유인나 씨 목소리를 재현했다.

네이버는 11월29일부터 인공지능(AI) 플랫폼 클로바가 탑재된 스마트 스피커와 클로바 앱에 배우 유인나 씨 목소리를 적용했다고 밝혔다. 유인나 씨 목소리는 네이버가 자체 연구·개발한 음성합성 기술인 ‘HDTS(Hybrid Dnn Text-to-Speech)’ 기술을 활용해 구현됐다.

HDTS는 딥러닝(DNN)과 파형 접합 합성(UTS)을 결합한 하이브리드 음성합성 기술이다. 네이버에 따르면 4시간 분량의 음성 데이터로도 특정인의 목소리 특성을 살릴 수 있다. 배우 유인나 씨 목소리도 일부 음성 데이터만 가지고 실제 음성과 비슷한 억양과 톤을 구현했다. 실제로 네이버 ‘프렌즈 스피커’에 적용해본 결과, 유인나 씨 특유의 나긋나긋한 라디오 톤 목소리가 재생됐다.

네이버는 지난 7월 기자간담회에서 HDTS 기술에 대해 발표했다. 이날 김재민 네이버 서치앤클로바 음성합성 리더는 기존 UTS(Unit-selection Text-to-Speech; 합성단위 선택방식) 방식의 음성합성 기술은 40시간 이상의 음성 DB가 있어야 서비스 가능한 수준의 음성을 만들어낼 수 있었지만, 네이버가 독자 기술로 이 문제를 풀었다고 설명했다. 이 기술은 추후에도 장시간 녹음이 필요한 애니메이션이나 연예인 녹음 등에 다양하게 활용될 수 있다.

배우 유인나 씨 목소리는 클로바 앱에서 설정할 수 있다. 스마트 스피커에선 “유인나 목소리로 바꿔줘”라고 음성 명령을 내리면 바로 적용된다.

‘유인나의 연애상담’ 스킬도 새롭게 추가됐다. 라디오 DJ로 인기를 끈 배우 유인나 씨의 강점을 살린 콘텐츠다. 클로바 스마트 스피커 혹은 클로바앱에서 “유인나 연애상담 시작해줘”라고 명령하면 연애상담 챗봇이 시작되며, 유인나 씨의 목소리로 소개팅, 썸, 이별 등에 관한 다양한 연애 상담을 경험할 수 있다.

김재민 리더는 “클로바가 연구개발한 HDTS 기술은 최소 40시간 이상의 녹음 시간이 필요한 UTS 기술보다 한층 고도화된 기술로써, 글로벌 IT기업들이 실제 서비스에 활용하고 있는 음성합성기술 대비 우수성을 갖췄다”라며, “기존 기술 대비 필요한 데이터나 시간 등이 줄어든 만큼, 향후 보다 넓은 범위의 환경에서 해당 기술이 활용될 기회가 늘어날 것으로 기대한다”라고 밝혔다.

spirittiger@bloter.net

사랑과 정의의 이름으로 기술을 바라봅니다. 디바이스와 게임, 인공지능, 가상현실 등을 다룹니다.