비즈니스

기업 비즈니스, 보안, 네트워크, 기업용 소프트웨어

arrow_downward최신기사

ai

TTS에서 음성인식까지…AWS의 인공지능 서비스들

아마존웹서비스(AWS)가 7월25일 서울 여의도 콘래드 서울에서 'AWS 기술 세션'을 열었다. 세션에서는 김일호 AWS 솔루션즈 아키텍트가 자리해 아마존의 AI 서비스에 관해 설명했다. 자연스러운 음성 데이터 재현을 위한 '아마존 폴리' 아마존 폴리는 딥러닝 기술을 통해 텍스트를 음성으로 변환하는 서비스이다. 글자를 최대한 사람이 말하는 것과 가깝게 전환해 서비스에 적용할 수 있도록 하는 바탕을 만들어준다. AI 등장 이전에도 웹이나 모바일에 텍스트를 음성으로 변환해주는 기능은 존재했다. 하지만 부자연스럽기 그지없어 장난삼아 문장을 넣어 돌려보고 실소하기 일쑤였다. 폴리는 AI 기술을 활용해 '덜 우스꽝스러워' 보이는 것에 나아가 완벽해지기 위해 다양한 학습을 한다. 폴리의 '텍스트 투 스피치(텍스트를 말로 옮기는) 기반 기술'은 언어가 주는 다양한 어려움을 극복해 구현한다. 대표적으로 세션...