MS ‘애저’, 동영상 자동 분류·분석 기능 추가

가 +
가 -

마이크로소프트(MS)가 기계학습 개발에 한창이다. 이번엔 오디오·비디오 인식 기술을 클라우드 서비스 ‘애저’에서 바로 이용할 수 있도록 지원한다. 음성 및 영상 인식 기능은 기계학습을 기반으로 만들어진 기술이다. 텍스트를 검색하듯 영상과 음성 파일에서 원하는 데이터를 검색하거나 접근하도록 돕는다. 이 기술은 수년 전부터 개발됐지만, 이번에 처음으로 클라우드 서비스에 추가됐다.

MS리서치는 공식 블로그를 통해 “내부에서 개발 중이었던 오디오·비디오 인덱싱 기술을 9월10일부터 MS 애저에서 바로 이용할 수 있다”라고 발표했다. 이 기술은 MS 애저 중 미디어 서비스에서만 이용할 수 있다. 서비스 이름은 ‘마이크로소프트 애저 미디어 서비스 인덱서(Microsoft Azure Media Services Indexer)’다.

MS 애저 미디어 서비스는 동영상 서비스를 위한 클라우드 기술이다. 주요 고객은 방송사나 스트리밍 서비스 업체로, <NBC 스포츠>나 미국 방송사 <CW> 등이다. MS 애저 미디어 서비스는 여러 모바일 플랫폼에 맞춰 알아서 동영상을 인코딩해 전송하며, 사용자가 늘어나거나 줄어들 때마다 컴퓨팅 자원을 자동으로 조절해준다. 예를 들어 스포츠 중계라면 기존 방송보다 더 많은 시청자가 몰리기 마련인데, 이때 클라우드 기술은 빠른 시간에 컴퓨팅 자원을 늘려 양질의 영상을 사용자가 볼 수 있도록 지원한다.

Azure_video_indexing_thum

▲출처 : MS 애저 공식 홈페이지

MS 애저 미디어 서비스는 많은 비디오 및 오디오 파일을 활용하고 있다. 이번에 발표한 인덱싱 기술은 단순히 영상 데이터를 전송하는 데 그치지 않고 클라우드에 올라온 영상 데이터를 분석할 수 있게 돕는다. 오디오나 비디오 파일은 텍스트처럼 검색하기 쉬운 구조가 아닌데, MS는 새로 개발한 인덱싱 기술로 원하는 데이터를 쉽게 접근할 수 있게 만들었다.

예를 들어, MS 애저 미디어 인덱서는 메타데이터를 비디오에서 뽑아와 해당 비디오가 정치적 내용을 담고 있는지, 오락성 콘텐츠를 담고 있는지 주제별로 분류해준다. 베루스 칫사즈 MS리서치 IP 전략부 디렉터는 “단순히 주제를 분류하는 것뿐만 아니라 인덱싱 기술로 비디오에 대한 대략적인 소개를 자동으로 만들어낼 수 있다”라며 “소셜미디어, 방송국, 기업 데이터 영상 등에 다양하게 활용될 수 있다”라고 설명했다.

MS 애저 미디어 서비스 인덱서는 MS리서치가 7년 전부터 개발한 ‘마이크로소프트 오디오 비디오 인덱싱 서비스(Microsoft Audio Video Indexing Service, MAVIS)’를 활용한 기술이다. 미국 에너지부, 미항공우주국(NASA), 영국국립도서관 등이 데이터 분석할 때 이 기술을 활용했다. 베루스 칫사즈 디렉터는 “MAVIS의 성공으로 2년 전부터 인덱싱 기술을 애저에 넣는 것을 고려했다”라고 설명했다.

mavis_3

▲출처 : MS 리서치 공식홈페이지

MS는 최근 기계학습 연구에 박차를 가하고 있다. 6월16일에는 ‘애저 머신러닝’이라는 서비스를 출시했다. 애저 머신러닝은 소프트웨어를 따로 설치하지 않고 클라우드 기반에서 오픈소스 R나 MS 데이터 분석도구를 함께 사용할 수 있는 기능이다. 클라우드에 많은 데이터가 쌓이는 점을 활용해 이를 분석할 수 있는 방법을 다양하게 제공하는 셈이다.

<기가옴>은 9월10일 보도에 “MS 애저 미디어 서비스 인덱서는 스카이프 실시간 통역 기술을 함께 활용할 수 있을 것”이라고 평가했다. 현재 MS 애저 미디어 서비스 인덱서 기술은 영어 데이터만 지원하고 있는데, 스카이프에서 얻은 번역 데이터를 MS 애저 미디어 서비스 인덱서 기술에 이용할 수 있을 것으로 봤다. 스카이프 실시간 번역 기술 역시 기계학습 기반으로 개발됐다. <기가옴>은 “최근 많은 비디오 파일을 생겨나는 만큼 이러한 비디오 분석 기술은 계속 주목받을 것”이라고 덧붙였다.

네티즌의견(총 1개)