TTS에서 음성인식까지…AWS의 인공지능 서비스들

가 +
가 -

아마존웹서비스(AWS)가 7월25일 서울 여의도 콘래드 서울에서 ‘AWS 기술 세션’을 열었다. 세션에서는 김일호 AWS 솔루션즈 아키텍트가 자리해 아마존의 AI 서비스에 관해 설명했다.

김일호 아마존웹서비스(AWS) 솔루션즈 아키텍트

김일호 아마존웹서비스(AWS) 솔루션즈 아키텍트

자연스러운 음성 데이터 재현을 위한 ‘아마존 폴리

아마존 폴리는 딥러닝 기술을 통해 텍스트를 음성으로 변환하는 서비스이다. 글자를 최대한 사람이 말하는 것과 가깝게 전환해 서비스에 적용할 수 있도록 하는 바탕을 만들어준다.

AI 등장 이전에도 웹이나 모바일에 텍스트를 음성으로 변환해주는 기능은 존재했다. 하지만 부자연스럽기 그지없어 장난삼아 문장을 넣어 돌려보고 실소하기 일쑤였다. 폴리는 AI 기술을 활용해 ‘덜 우스꽝스러워’ 보이는 것에 나아가 완벽해지기 위해 다양한 학습을 한다.

아마존 폴리가 텍스트를 음성으로 변환하는 과정

아마존 폴리가 텍스트를 음성으로 변환하는 과정

폴리의 ‘텍스트 투 스피치(텍스트를 말로 옮기는) 기반 기술’은 언어가 주는 다양한 어려움을 극복해 구현한다. 대표적으로 세션 데모에서는 모양은 같으나 발음이 다른 동형이의어 구분, 약식 단어를 각 상황에 맞게 학습해 구현되는 것을 보였다.

영어 ‘live’라는 단어는 동[lɪv] 사와 형용사[laɪv]로 쓰일 때 그 발음이 다르다. 폴리는 같은 문장에서 이를 구분해 문장을 구현했다. 이어, 약자 ‘ST’의 경우 ‘Street(거리)’인지 ‘Saint(성)’인지 기존 텍스트 언어 구현에서는 알기 힘들었다. 폴리는 이를 구분하게 학습시켜 전체 문맥에 맞는 단어로 풀어 읽는다. ‘렉시콘스’라는 기능은 실제 발음이나 의도하는 발음을 지정해서 읽힐 수 있게 했다. 사람 이름이나 상호 같이 일반적인 발음 기호와는 다르게 읽혀야 할 때 유용하게 쓰일 것으로 보인다.

AWS는 폴리가 신문이나 책 읽기 기능이 탑재된 앱이나 이러닝 플랫폼 시장 등에 도움이 될 수 있을 것으로 예상된다. 아쉬운 건, 아직 한국어 지원이 되지 않는다는 점이다. 영어, 유럽어부터 아태지역의 인도 영어, 일본어까지 총 24개 언어를 지원하지만, 한국어는 지원 목록에 없었다. 한국어가 언제부터 지원될 것이라는 정확한 이야기는 없었다. 한국 시장에서 한국어로 완벽하게 쓰이려면 시간이 걸릴 것으로 보인다.

이미지 분석 담당, ‘아마존 레코그니션

아마존 레코그니션은 딥러닝을 기반으로 해 이미지 인식 서비스를 제공하도록 도와준다. 자세한 서비스 분야로는 ▲객체 및 장면 탐지 ▲안면 분석 ▲안면 비교 ▲안면 인식이 있었다.

객체 및 장면 탐지는 아마존 레코그니션에 사진을 넣으면 사진에 어떤 객체들이 있는지 분석해 파악해준다. 거실 장면을 넣으면 거실에 있는 ‘꽃’, ‘커피 탁자’, ‘의자’ 등이 태깅이 된다.

AWS 레코그니션 객체 및 장면 탐지 예시

아마존 레코그니션 객체 및 장면 탐지 예시 (사진=AWS자료 갈무리)

안면 분석은 사진 속 사람의 나이, 성별, 감정 등을 파악해 그 정도를 비율(%)로 나타내준다. 안면 비교는 이미지 2개를 바탕으로 특정 인물이 동일인인지 아닌지를 파악할 수 있다. 유사도 점수를 사용하여 거의 실시간을 사용자를 기준 사진과 대조할 수 있다고 한다. 안면인식 역시 앞의 기능과 같이 사전 속 사람 얼굴을 알아보는 기능이다.

아마존 레코그니션 안면 분석 예시 (사진=AWS자료 갈무리)

아마존 레코그니션 안면 비교 예시 (사진=AWS자료 갈무리)

아마존 레코그니션 안면 인식 예시 (사진=AWS자료 갈무리)

김일호 솔루션즈 아키텍트는 “안면 정보 인식 기술은 리테일 비즈니스나 광고 분야에서 개인화된 마케팅 도구로 사용할 수 있다”라며 “나아가 아마존 레코그니션을 이용해 사물인터넷(IoT)이나 공공장소 등에서 인증이나 보안을 위해 사용할 수도 있다”라고 덧붙였다.

현재 마이크로소프트나 구글에서도 머신러닝 기술을 클라우드 상에서 결합·사용할 수 있도록 많은 서비스를 내놓고 있다. 이번 세션에서 AWS가 선보인 AI 서비스도 타사와 같거나 비슷한 기능이 많았다. AWS의 AI 서비스는 이들과 어떤 점에서 차별화될까.

이에 대해 김일호 솔루션즈 아키텍트는 “아마존은 고객의 관점에서 고객에게 필요한 것을 제공하려는 것에 초점을 맞춘다”라며 “인공지능 서비스 역시 고객 입장에 눈높이를 맞추는 아마존의 기본 마음가짐 아래 개발·발전하고 서비스가 나오는 것”이라고 전했다.

네티즌의견(총 0개)