구글, 음성인식 기술 API 공개

이지현
입력 2016.03.25 11:55
수정 2016.03.25 11:56
댓글 0

이 기사를 공유합니다

구글이 3월23일 음성인식 기술인 '클라우드 스피치 API'를 공개했다. 현재는 프리뷰 단계로 별도로 가입한 사용자만 이용할 수 있다. 신청은 누구나 무료로 할 수 있다.

클라우드스피치 API는 오디오를 텍스트로 바꿔주는 기술이다. 딥러닝 뉴럴 네트워크 알고리즘을 이용했으며, 구글 내부 제품에서 실제로 활용하고 있는 기술이다. 클라우드 스피치 API는 전세계 80개 언어를 지원하며, 부적절한 콘텐츠를 따로 걸러낼 수 있는 필터 기능도 제공한다. 실시간으로 언어를 인식하고 해석할 수 있으며, 기존에 녹음된 파일을 읽을 수도 있다. 클라우드 스피치 API에서 지원하는 오디오파일 형식은 FLAC, AMR, PCMU , 리니어-16이다. 주변 소음도 걸러내는 기능도 지원한다.

구글은 클라우드 스피치 API 데모 영상을 통해 라즈베리파이로 만든 로봇이 음성을 읽고 해석하는 과정을 보여주기도 했다.

https://youtu.be/wzp9dfVpeeg

☞클라우드스피치API 데모영상 링크

클라우드스피치 API

이지현 j.lee.reporter@gmail.com

다른기사 보기

구글, 음성인식 기술 API 공개

'2024 블로터 지배구조포럼' 개최…시장이 바라보는 ‘좋은 승계, 나쁜 승계’

블로터 2024년 상반기 경력기자 공개 채용

블로터 2023년 하반기 경력기자 공개 채용

블로터 총괄부사장에 박정용 전 머니S 대표

블로터 신임 대표에 박종면 전 머니투데이 대표...종합경제매체로 새출발

[인사] NH투자증권

[인사] 동양생명

[부고] 장진모(교보생명 전무)씨 장인상

[부고]박진국(아이티센그룹 부회장)씨 부친상

[부고] 김민규(신세계그룹 경영전략실 경영지원총괄 부사장)씨 빙부상

[인사] 공정거래위원회

[부고]김성민(HMM 홍보팀 매니저)씨 부친상

강기석(삼진제약 향남공장 이사)씨 모친상

[부고] 임현규(KT 경영지원부문장)씨 모친상

[인사] NH투자증권