플랫폼

저작권과 열린 문화, CCL, 인터넷과 웹서비스

arrow_downward최신기사

ai

네이버의 음성 기술 수준, 어디까지 왔나

인공지능(AI) 스피커는 말을 한다. 사람이 말로 대화를 하려면 상대방의 말을 인식하고, 말의 내용을 이해하고, 상대방이 알아들을 수 있도록 말해야 한다. AI 스피커도 마찬가지다. 사용자 목소리를 인식하고(음성인식), 무슨 말을 하는지 알아듣고(자연어처리), 사람처럼 자연스럽게 말해야(음성합성) 한다. 대화의 내용을 구체화하기 위해선 사용자 목소리만 듣고도 누군지 식별(화자인식)할 수 있어야 한다. AI 플랫폼이 음성 기반 인터페이스를 사용하면서 음성 기술이 서비스 경쟁력에 중요한 요소로 떠오르고 있다. 기술 플랫폼을 지향하는 네이버의 음성 기술 수준은 어느 정도 수준일까? 네이버는 자사의 음성 기술에 대한 자부심을 갖고 있다. 특히 음성합성 분야에 있어서 글로벌 수준에 있다고 자부한다. 기계가 내는 목소리가 자연스러울 뿐만 아니라 음성합성에 필요한 데이터양과 시간을 획기적으로 줄였기 때문이다. 지난...