디지털라이프

디지털 기기, 게임, IT 정책

arrow_downward최신기사

ai

네이버, 클로바에 '유인나' 목소리 제공...자체 음성합성기술 활용

배우 유인나 씨 목소리가 네이버 스마트 스피커에 들어간다. 녹음한 음원이 아니다. 음성합성 기술을 활용해 일부 음성 데이터를 가지고 유인나 씨 목소리를 재현했다. 네이버는 11월29일부터 인공지능(AI) 플랫폼 클로바가 탑재된 스마트 스피커와 클로바 앱에 배우 유인나 씨 목소리를 적용했다고 밝혔다. 유인나 씨 목소리는 네이버가 자체 연구·개발한 음성합성 기술인 'HDTS(Hybrid Dnn Text-to-Speech)' 기술을 활용해 구현됐다. HDTS는 딥러닝(DNN)과 파형 접합 합성(UTS)을 결합한 하이브리드 음성합성 기술이다. 네이버에 따르면 4시간 분량의 음성 데이터로도 특정인의 목소리 특성을 살릴 수 있다. 배우 유인나 씨 목소리도 일부 음성 데이터만 가지고 실제 음성과 비슷한 억양과 톤을 구현했다. 실제로 네이버 '프렌즈 스피커'에 적용해본 결과, 유인나 씨 특유의 나긋나긋한 라디오 톤 목소리가...

ai

네이버의 음성 기술 수준, 어디까지 왔나

인공지능(AI) 스피커는 말을 한다. 사람이 말로 대화를 하려면 상대방의 말을 인식하고, 말의 내용을 이해하고, 상대방이 알아들을 수 있도록 말해야 한다. AI 스피커도 마찬가지다. 사용자 목소리를 인식하고(음성인식), 무슨 말을 하는지 알아듣고(자연어처리), 사람처럼 자연스럽게 말해야(음성합성) 한다. 대화의 내용을 구체화하기 위해선 사용자 목소리만 듣고도 누군지 식별(화자인식)할 수 있어야 한다. AI 플랫폼이 음성 기반 인터페이스를 사용하면서 음성 기술이 서비스 경쟁력에 중요한 요소로 떠오르고 있다. 기술 플랫폼을 지향하는 네이버의 음성 기술 수준은 어느 정도 수준일까? 네이버는 자사의 음성 기술에 대한 자부심을 갖고 있다. 특히 음성합성 분야에 있어서 글로벌 수준에 있다고 자부한다. 기계가 내는 목소리가 자연스러울 뿐만 아니라 음성합성에 필요한 데이터양과 시간을 획기적으로 줄였기 때문이다. 지난...

ai

AI 음성합성 스타트업 네오사피엔스, 프리 시리즈A 투자 유치

인공지능(AI) 기반 음성합성 기술을 개발하는 스타트업 '네오사피엔스'가 프리 시리즈A 투자를 유치했다. 누적 투자금은 총 12억원이다. 네오사피엔스는 10월16일 패스트인베스트먼트에서 시드 투자와 우리기술투자에서 프리 시리즈A를 마쳐 총 누적 투자금 12억원을 유치했다고 밝혔다. 네오사피엔스는 사람처럼 자연스럽게 말할 수 있는 음성합성 기술을 개발해 누구나 쉽게 음성 서비스를 쓸 수 있도록 하는 플랫폼을 제공할 예정이다. 네오사피엔스는 퀄컴과 카이스트 출신의 음성 분야 AI 전문가팀이 2017년 11월에 설립한 AI 스타트업이다. 네오사피엔스는 사람의 목소리를 추출해 임의의 텍스트에 합성하는 기술 '아이스픽AI(Icepeak.AI)'를 통해 억양 및 섬세한 특징을 반영한 음성 기술을 확보했다. 네오사피엔스 측에 따르면 성대모사 수준의 음성 기술이다. 네오사피엔스는 올해 4월 특정인의 목소리를 다른 국가의 언어로까지 재구현할 수 있는 이중...

ai

네이버, "클로바 보이스 경쟁력 구글보다 높다"

인공지능(AI) 스피커와의 대화에는 전제가 있다. 음성인식, 음성합성, 자연어처리(NLP) 기술이 필요하다는 점이다. 사용자의 목소리를 제대로 인식할 수 있어야 하며(음성인식), 사람처럼 자연스럽게 말해야 하고(음성합성), 무슨 말을 하는지 알아들어야(자연어처리) 대화를 할 수 있다. 'AI 플랫폼'이 음성 기반 사용자 인터페이스를 사용하면서 음성 기술의 중요성이 대두되고 있다. 구글은 사람처럼 자연스럽게 말하는 '듀플렉스' 기술을 시연해 화제를 모았다. 국내 음성 기반 기술은 어느 정도 수준일까. 네이버는 자사의 음성 합성 기술 '클로바 보이스'의 경쟁력이 한국어, 영어, 일본어, 중국어 등에 있어서 구글보다 우위에 있다고 밝혔다. 네이버는 7월3일 서울 강남구 'D2 스타트업 팩토리'에서 테크포럼을 열고 자사의 AI 스마트 스피커에 적용된 음성인식·음성합성·자연어처리 기술에 대해 발표했다. 이날 발표에 나선 김재민 네이버 클로바...

네이버

네이버, 오디오 콘텐츠 실험에 300억원 투자한다

네이버가 '아미카', '엔보이스' 등 네이버의 음성 관련 기술에 활용된 원천 기술을 기반으로 새로운 포맷의 사운드 콘텐츠 개발에 나선다고 12월9일 밝혔다. 네이버는 “텍스트, 동영상, 이미지와 융합해 새로운 경험을 제공할 수 있는 오디오 콘텐츠의 확장성과 다른 포맷의 콘텐츠와 비교해 상대적으로 사용 환경의 제약이 적은 오디오 콘텐츠의 차별화된 가능성에 주목하고 있다”라고 배경을 밝혔다. 최근에는 사물인터넷, 인공지능 등의 기술 활용이 실생활에 적용되는 단계로 들어오면서, 오디오 콘텐츠의 가능성에 주목하는 추세다. 네이버는 네이버가 발전시키고 있는 음성 관련 원천 기술들을 사용해 새로운 오디오 콘텐츠를 만드는 제작자들에게 매년 100억원씩 3년간 총 300억원을 투자할 계획이다. 투자 대상은 지식·교양·실용 콘텐츠 분야다. 네이버는 “해당 분야에 집중적으로 투자를 결정한 것은 이 분야가...