“영화 불법 유통, 인공지능으로 원천봉쇄한다”

AI가 배우의 얼굴을 학습해 불법 콘텐츠를 식별한다.

가 +
가 -

“사람은 영화나 드라마를 볼 때 이미지의 색깔 분포, 밝기의 분포가 아닌 내용, 등장인물, 옷을 통해 콘텐츠를 인식한다. 이를 도입해보자는 게 인공지능(AI)에 기반한 지능형 마이크로 식별 기술이다.”

인공지능(AI)이 영상 콘텐츠에 등장하는 배우를 보고 영화나 드라마를 알아맞힌다. 이를 통해 저작물의 불법 유통을 사전에 쉽게 차단할 수 있다. 기존처럼 이미지 색깔이나 밝기 분포 등 신호학에 기반한 데이터베이스(DB)를 구축하지 않아도 콘텐츠를 식별할 수 있기 때문이다. 영상뿐만 아니라 음성도 식별한다. 이 기술을 활용해 TV 프로그램에서 빈번하게 불거지는 음악 저작권료 분배 문제를 해결할 수 있다. 저작권을 단순히 보호하는 일 외에도 AI를 통해 저작물 관리를 쉽게 해 저작권의 선순환 구조를 만들 수 있다. AI와 저작권 기술의 만남이 그려내는 콘텐츠의 미래다.

문화체육관광부와 한국저작권위원회가 개최한 ‘인공지능과 차세대 저작권기술 연구 발표회’ (출처=한국저작권위원회)

문화체육관광부와 한국저작권위원회는 지난 6월8일 ‘인공지능과 차세대 저작권 기술’을 주제로 저작권 기술 연구 발표회를 열었다. 이번 발표회는 최신 영화가 유튜브, 웹하드 등 온라인을 통해 불법 유통되는 문제를 개선하고 현재 연구·개발되고 있는 AI 기반 저작물 식별 및 정산 기술을 소개하기 위해 마련됐다. 이날 발표에 나선 유원영 한국전자통신연구원(ETRI) 그룹장은 “영상인식이나 음성인식 부분에서 인공지능이 인간을 넘는 인식 정확도를 보여주는데, 기존 저작권 보호 기술은 음성, 영상, 이미지 쪽에 연결되기 때문에 DRM, 워터마킹, 펑거프린팅 등에 있어서 향후에는 인공지능을 써서 예측하거나 연관된 걸 찾아낼 수 있다”라며 “기존 신호학에 기반한 저작권 기술의 한계를 인공지능이 해결할 수 있을 것으로 보인다”라고 말했다.

 

AI와 저작권 기술이 만난 이유

저작권 기술은 저작권을 효과적으로 보호하고 저작물의 원활한 유통을 돕기 위한 기술 및 서비스를 말한다. 하지만 암호화 기반 DRM 방식의 초기 저작권 기술은 효과적이지 못했다. 콘텐츠 사용에 제약을 줘 오히려 콘텐츠 구매자보다 불법 사용자가 자유롭게 콘텐츠를 이용할 수 있는 불합리한 상황이 벌어졌다. 이후 신호에 기반한 워터마킹, 핑거프린팅 기술이 등장했지만 원본 콘텐츠가 확보되지 않으면 무용지물이라는 점이 한계로 꼽혔다. 영상의 밝기나 색상 분포 등 신호를 바탕으로 한 DB 매칭 작업을 통해 콘텐츠를 식별하기 때문에 원본을 확보하기 어려운 최신 영화 불법 유통을 막기 어렵다. 원본 전달 과정 자체가 불법 콘텐츠 유통 경로가 될 수 있기 때문이다.

기존 모니터링 시스템과 AI기반 모니터링 시스템 비교 (출처=한국저작권위원회)

‘지능형 마이크로 식별’ 기술은 AI를 활용해 원본 없이 저작물을 인식하고 식별할 수 있다. 지능형 마이크로 식별 기술을 연구하는 박지현 ETRI 연구원은 AI의 영상·음성인식 기술을 바탕으로 사람처럼 등장 배우를 보고 영화를 판별해 원본 DB 없이 콘텐츠를 식별하는 게 가능하다고 설명했다. 배우의 얼굴을 딥러닝 방식으로 학습해 해당 배우의 출현 빈도 분석을 통해 콘텐츠를 식별하는 방식이다. 예를 들어 박보검, 류준열, 혜리 등의 얼굴을 학습해 드라마 ‘응답하라1988’을 알아맞힌다. 박지현 연구원은 짧은 독립영화는 인식이 안 됐지만 상업영화는 100% 인식할 수 있었다고 밝혔다.

AI가 배우 얼굴을 학습하고 영상에서 배우의 얼굴을 검출한다. (출처=한국저작권위원회)

인식률을 높이기 위해 배우 정면 얼굴을 기준으로 특징점을 뽑아낸다. 측면의 얼굴도 특징점에 기반해 정면으로 돌려 인식한다. 이후 얼굴을 5개 영역으로 나눠 각각의 얼굴인식 결과 값을 종합해 배우를 식별한다. 이런 과정을 거쳐 영화마다 분장이 달라지는 배우를 동일인으로 인식할 수 있게 된다. 또 배우의 얼굴분장과 의상 정보를 분석해 영화별로 다른 배우의 모습을 구분해서 인식한다. 실제 배우뿐만 아니라 애니메이션이나 SF 영화에 등장하는 CG 캐릭터를 인식하는 것도 가능하다.

 

소모적 저작권 분쟁 막는 AI

ETRI는 영상뿐만 아니라 음성 식별 기술도 연구 중이다. 사람이 듣고 싶은 소리에 집중해 다른 소리를 걸러내듯, 여러 소리가 중첩된 방송 콘텐츠에서 배경음악만 분리해서 식별하는 기술이다. 해마다 불거지는 저작권료 분배 문제를 해결하기 위한 목적이다. 박지현 연구원은 “전체 오디오에서 음악이 나오는 구간을 찾고, 잡음을 제거하고, 음악이 아닌 대사가 겹쳐져 있다면 대사를 걷어내고 음악만 남긴 뒤 음악만 가지고 특징을 뽑아서 인식하겠다는 게 기술 개발의 프로세스”라고 설명했다.

AI 기반 저작권 기술을 통해 저작권료 미분배 문제를 해결할 수 있다. (출처=한국저작권위원회)

기존에도 사람의 음성을 구별하는 기술은 상당한 수준으로 개발돼 있다. 여러 사람의 목소리 중 한 사람의 목소리만 분류하거나 노래에서 보컬만 빼내는 식이다. ETRI가 연구 중인 기술은 음성이 아닌 음악을 타깃으로 한다. 음성은 제한된 주파수 폭을 갖지만, 음악은 더 폭넓은 주파수 영역에 있다. 음악을 분리해내는 게 더 난이도가 높은 기술인 셈이다.

현재의 방송 배경음악 모니터링 시스템은 사람에 의존하는 방식으로 이뤄진다. 방송 콘텐츠 중 일부를 골라 사람이 듣고 특정 배경음악이 몇 회 나왔는지 직접 세는 식이다. 오디오 추출 기술을 활용하긴 하지만 검출력이 떨어져 결국 사람의 전수 검사가 필수적이다. 하지만 사람이 모든 콘텐츠를 모니터링하는 데는 한계가 있다. 저작료 분배 문제가 발생하는 근본적인 원인이다. 한국저작권위원회와 ETRI는 AI 기술 도입으로 저작료 정산 문제를 해결할 수 있을 것으로 기대한다.

콘텐츠를 제작할 때 마주하는 저작권 문제를 쉽게 해결할 수 있는 AI 기반 저작권 기술도 개발되고 있다. 숙명여대 김철연 교수는 인공지능 기반 이미지 객체 분류·식별·정산 기술을 발표했다. 김철연 교수는 AI를 활용해 교육저작물을 만들 때 사용되는 이미지들의 저작권을 DB로 구축해 저작권 정산을 쉽게 하는 기술을 개발 중이다.

기존에 교과서나 학습지 등 교육 저작물을 만들 때는 저작권료 공탁제도가 활용됐다. 저작권 문제를 사전에 다 해결할 수 없기 때문에 일정 금액을 공탁하고 대행 기관에서 저작권자를 찾아 공탁금을 배분해주는 방식이다. 하지만 모든 이미지의 저작권자를 일일이 찾기 힘들기 때문에 미분배 보상금 문제가 발생한다. 김철연 교수는 “인공지능을 활용해서 미분배 요소를 떨어뜨려 저작권을 떳떳하게 사용하고 저작권자도 수익을 받는 선순환 구조를 만드는 것이 이 과제의 목표”라고 말했다.

네티즌의견(총 3개)