"똑똑한 동영상 검색의 해답을 드립니다"

발행일 2008-11-09 17:59:12
"지금 웹브라우저를 열고 네이버 비디오구글 비디오에 접속해 '오바마'를 검색해보세요. 어떤가요? 비슷한 비디오들이 검색결과 화면에 마구잡이로 뿌려져 어떤 게 내가 찾는 동영상인지 정확히 구분하기 어렵습니다. 이처럼 중복된 동영상은 최대한 줄이고, 이용자가 원하는 동영상을 빠르고 정확하게 찾아 상위에 보여주는 게 엔써미 검색의 핵심 경쟁력이죠."

김길연(33) 엔써즈 사장을 만났을 땐 마침 제44대 미국 대통령선거 결과가 막 발표되고 있었다. 실시간 검색어는 '오바마'와 '미국 대통령선거'로 도배됐다. 정말 '오바마'를 검색해볼까. 엔써미는 얼핏 보기에도 확연히 달랐다. 검색 결과에 뜨는 동영상이 제각각이고 가지런하다. 어떤 비법이 숨어 있는 걸까.

같은 동영상 묶어 중복 검색 피하는 '클러스터링' 방식

엔써미는 동영상 검색 서비스다. 전세계 50여곳에 흩어진 동영상들을 한데 모아 검색할 수 있는 서비스다. 아직은 비공개 시범서비스 단계로, 초대장을 받아야 이용할 수 있다. 11월초 현재 5100만여개 동영상이 등록돼 있으며, 매일 50만건씩 새 동영상이 올라오고 있다.

김길연



"엔써미의 핵심 경쟁력은 클러스터링 기술입니다. 말하자면 같은 동영상을 한데 '묶는' 기술인데요. 데이터베이스를 분석해 10초 이상 겹치는 동영상을 하나의 리스트로 묶어 보여주는 방식이죠. 또 엔써미는 사람들이 많이 공유하는 동영상을 검색결과에 먼저 보여줍니다. 그래서 검색 결과에서 똑같은 동영상이 중복돼 나타나지 않고 원하는 동영상이 상단에 뜨게 되는 것이죠."

풀어 설명하자면 이렇다. 대개 동영상 서비스들은 동영상 제목이나 설명 등 동영상 등록자가 직접 기입한 텍스트를 기준으로 검색한다. 그러다보니 제목과 실제 동영상 내용이 달라도 이를 구분해낼 수 없고, 애니메이션같은 유사 동영상 컨텐트도 판별하지 못한다. 더구나 외국어로 등록된 서비스들은 검색 블랙홀에 가깝다. 똑같은 동영상이 여러 개 등록돼 있어도 검색 결과에서 그대로 노출되므로 이용자 입장에선 만족도가 떨어진다.

김길연 사장이 '똑똑한' 동영상 검색 서비스를 구상하게 된 까닭도 여기에 있다. "우선은 중복된 동영상이라도 걸러내는 서비스를 만들어보고 싶었습니다. 예전 회사에서 음성인식과 신호처리 기술을 개발한 덕분에, 자연스레 이를 검색에 접목하려는 생각을 하게 된 거죠."

엔써미는 동영상 검색 결과 화면에서 같은 동영상을 한데 묶어 보여준다. 겹치는 동영상 개수와 겹치는 길이를 표시해주고, 동영상 제목이나 설명같은 부가정보도 한데 모아 제공한다. 이용자는 겉으론 달라 보이지만 사실상 똑같은 동영상을 손쉽게 구분할 수 있어, 원하는 동영상을 찾기 쉽다. 검색 결과는 정확도, 최신, 공유도, 재생시간 순으로 정렬해 볼 수 있다.

여기엔 어떤 기술이 숨어 있을까. 엔써미는 소리와 영상을 동시에 분석한다. 먼저 동영상의 소리를 분석해, 소리가 같으면 똑같은 동영상으로 묶는다. 단순 분석으로는 오류율이 26% 정도에 이르는데, 여러 분석기술을 반복 적용해 실제 오류율을 3% 수준까지 줄였다. 비슷한 방법으로 동영상도 프레임을 분석해 같은 이미지를 같은 동영상으로 묶는데, 이 또한 오류율이 0.3% 수준으로 거의 완벽에 가깝다. 여기에 이용자들이 직접 올린 부가정보를 함께 분석해 검색 결과에 반영하므로 정확도는 더욱 높아진다.

같은 동영상끼리 묶는 '클러스터링' 기술에도 비밀은 숨어 있다. "똑같은 동영상을 빠르고 정확히 찾아내는 게 핵심 기술입니다. 하루 50만개씩 등록되는 동영상을 기존 5천만개 DB와 매칭해 똑같은 동영상을 찾아주는 게 쉬운 일이 아니죠. 지금은 우리가 구축한 분산시스템으로 이같은 작업을 대략 1시간 안에 완료하는 수준인데, 내부적으로는 30분 안에 처리 가능한 수준까지 개발을 마친 상태입니다."

그러니 아무리 DB가 방대해도 같은 동영상은 하나로 묶어 보여주니 검색 결과가 매끄럽고 정확도도 높다. 묶음 동영상 가운데 한두 개가 삭제되더라도 실제 영상을 감상하는 데는 아무 문제가 없다. 엔써미는 언어 장벽도 뛰어넘었다. 텍스트 대신 음성과 영상을 직접 분석하는 덕분이다. 또한 많은 사람들이 공유하는 동영상일 수록 의미 있는 동영상으로 판단해 검색 결과에서 먼저 노출된다.

포털사이트 동영상 서비스도, 전문 동영상 사이트도 모두 검색 기능은 기본으로 제공하는 세상이다. 엔써미같은 전문 검색 서비스가 따로 필요할까. 김길연 사장의 대답은 당연히 '그렇소'이다.

"동영상은 국경이 없는 서비스입니다. 한국에서 방영된 드라마가 거의 실시간으로 중국 동영상 서비스에 뜨고 있는 세상이에요. 텍스트 대신 영상과 음성을 분석하는 엔써미 기술을 활용하면 전세계에 흩어진 동영상을 한데 모아 제공하는 글로벌 서비스도 어렵지 않습니다. 해외 진출에 고심하는 포털 검색사업과 비교하면 훨씬 경쟁력이 있는 셈이죠."

저작권자와 수익 공유하는 모델 내년께 선보일 것

하지만 궁금했다. 저렇게 외부 동영상을 막 가져다 보여줘도 문제가 없는 것일까. "일단 주요 동영상 서비스에서 퍼가기가 허용된 동영상만 엔써미에 직접 노출하고 있습니다. 펌질이 금지돼 있거나 민감한 동영상은 해당 서비스로 이동해 보도록 아웃링크를 걸고 있어요. 국내외 동영상 서비스들도 이같은 방식에 대해 대체로 동의하는 반응입니다."

동영상 저작권 보호는 김길연 사장이 요즘들어 특히 고민하는 문제이기도 하다. 이를테면 외부 동영상 서비스에 등록된 방송 저작물이나 불법 음란물을 어떻게 걸러내고 다듬어 엔써미에서 보여줄 것이냐의 문제다. 실제로 같은 동영상을 묶어 하나의 목록으로 보여주는 엔써미 검색을 교묘히 활용하면 여러 시즌으로 나뉜 '미드'나 방송 시리즈물을 순서대로 정렬해 시청하는 '꼼수'도 부릴 수 있는 법.

"저작권이 걸린 동영상을 무조건 삭제하는 게 능사는 아니겠죠. 그 대신 저작권자와 수익을 나누는 프로그램을 준비하고 있어요. 자신의 저작물이 어떤 사이트에서 얼마나 노출됐는 지 파악할 수 있는 시스템도 이미 갖췄고요. 이같은 컨텐트 전송 플랫폼(CDP)이 완성 단계인데요. 올해 말까지 주요 포털이나 저작권자들과 협의해 합법적인 수익공유 모델을 선보일 생각입니다."

검색 품질을 보다 정교하게 다듬는 작업도 박차를 가할 생각이다. "엔써미에 하룻동안 수집되는 동영상 숫자를 지금으 2배인 100만개 수준까지 늘릴 계획입니다. 그만큼 많은 동영상을 지금보다 빠르고 정확하게 클러스터링하도록 기술을 계속 개선해야겠죠. 공개 시범서비스도검색 품질이 더욱 정교해지고 저작권 보호장치가 어느 정도 갖춰진 시점에서 선보일 생각입니다. 올해 말께면 국내 서비스는 공개할 수 있을 전망입니다."

내년에는 해외로 검색폭을 더욱 확장할 생각이란다. "일본어와 중국어 등 나라별로 검색 완성도를 높이는 데 주력하고 있어요. 해외 검색이란 게 단순히 검색 품질만 높이는 게 아니라 실시간성도 중요하고 나라마다 변수가 달라서 쉽지 않은 일이더라고요. 그래도 목표가 글로벌 동영상 검색이니, 앞을 보고 달려가야죠." 돌아오는 봄이면 엔써미 검색창에도 만국기가 걸릴 모양이다.

엔써미
▲엔써미는 검색 결과에서 겹치는 동영상을 '클러스터링' 방식으로 묶어 보여주므로 원하는 동영상을 찾기 쉽다. 각 영상별 겹치는 시간과 부가정보도 제공한다.


함께 보면 좋은 뉴스

댓글

(0)
※ 댓글 작성시 상대방에 대한 배려와 책임을 담아 깨끗한 댓글 환경에 동참에 주세요. 0 / 300
뉴스레터
최신 IT 소식을 가장 빠르게 받아보세요.
(광고성 정보가 포함될 수 있습니다.)