빅데이터 기반으로 AI가 선정한 영화 흥행은
1위 예상 '맘마미아2'가 오히려 꼴찌 기록해
흥행 여부에 관계없이 시도 자체에 큰 '의의'

▲  /픽사베이 제공
▲ /픽사베이 제공

빅데이터를 기반으로 인공지능(AI)이 고른 영화가 3편 있습니다. AI는 이들 영화를 재개봉하면 많은 이들이 몰릴 것이라고 예상했죠. 실제 결과는 어땠을까요. 결론부터 말하자면 틀렸습니다.

◇과거 영화 재개봉 열풍…그러나 고르기 어렵다
코로나19의 여파로 신작 개봉이 계속 연기됐던 상반기에 극장가는 그야말로 썰렁했습니다. 영화진흥위원회(이하 영진위)에 따르면 올해 상반기 전체 극장 관객 수는 3241만명으로 전년 대비 70.3% 줄었습니다. 코로나19라는 된서리를 맞은 탓이죠.

관객을 불러들일 신작이 없는 상태에서 극장가는 궁여지책으로 과거 인기 영화를 재개봉하며 활로를 찾았습니다. 흘러간 명화를 다시 영화관에서 보고 싶어하던 팬들에게는 더없이 좋은 기회였죠. 영진위 자료에 따르면 올해 상반기에 재개봉한 영화는 모두 168편이며 총 142만명이 관람했습니다. 신작 상영이 줄줄이 연기되면서 지난 4월에는 재개봉 영화 관객 비중이 전체의 25%에 달하기도 했습니다.

하지만 극장가 관계자들은 많고 많은 영화 중 어떤 작품을 골라 재개봉을 해야할지 고민이 깊었습니다. 그냥 예전 흥행작을 고르면 되지 않냐고요? 그렇게 단순하지 않습니다. 인기 영화는 무척 많지만 다시 극장에 걸었을 때 과연 당시처럼 똑같이 환영 받을 수 있을지 장담하기 어렵거든요.

너무 좋은 성적을 거둔 작품은 이미 영화관에서 본 관객이 많으니 오히려 유도 효과가 떨어집니다. 예를 들어 국내 관객 1300만명을 돌파한 ‘어벤져스: 엔드게임’의 경우 4월 29일 재개봉 이후 1주일 간 6668명을 동원하는데 그쳤습니다. 고(故) 장국영 주연의 ‘패왕별희 디 오리지널’의 재개봉 성적보다 낮았죠.

반면 평점은 높지만 인지도가 낮은 작품은 영화 마니아가 아니라면 일반 관객이 찾기가 쉽지 않습니다. 그렇다고 소수의 마니아만 바라보고 고를 수도 없죠. 쉽지 않은 작업인 만큼 편성 전문가들은 코로나19로 쌓인 스트레스를 풀만한 요소, 대중성, 인지도, 기존 관객 수, 온라인 투표를 통한 조사 등을 고려해 재개봉 작품을 선정해왔습니다.

◇빅데이터와 인공지능(AI)의 판단은?
어려운 시기를 맞아 CJ CGV는 독특한 시도를 합니다. 사람이 아닌 ‘빅데이터와 머신러닝’을 통해 지난 7월 재개봉 영화를 선정한 것이죠. 명확한 데이터에 근거해 객관성을 높이고 관객의 요구에 부응하려는 시도였습니다.

▲  /CJ CGV제공
▲ /CJ CGV제공

CGV는 재개봉이 활발했던 올해 2~5월 자료를 활용해 영화 선정 알고리즘을 자체 개발했습니다. 재개봉작 선정을 위해서 최초 개봉 시 관람객 특성, 재개봉 관람객 수, 장르나 감독 등의 특징, 관람객 반응, 케이블 영화채널 편성 현황 등 100여가지 변수를 투입했습니다. 이렇게 얻은 자료을 바탕으로 파이썬(Python)과 마이크로소프트 애저(Azure)에서 제공하는 머신러닝 알고리즘을 활용해 예측 결과를 얻었습니다.

CGV 관계자는 “신규 영화와 달리 재개봉 작품은 흥행 가능성에 대한 고민이 많다”며 “일부 고객의 요구사항을 파악해 선정하던 것에서 벗어나 과거 재개봉 사례에 대한 빅데이터 분석을 통해 보다 과학적으로 콘텐츠를 선정하려고 했다”고 밝혔습니다.

◇AI의 선택, 관계자들은 '의아했다'
이러한 빅데이터 분석과 머신러닝 기법을 통해 CGV는 재개봉 대상에 대한 흥행 스코어를 산출했고, 편성 전담부서와 협의해서 상영 가능한 영화 50개를 선정했습니다. 이 중에서 7월초에 재개봉이 가능한 영화를 장르별로 3편을 추려 지난달 9일부터 15일까지 기획전을 열었습니다.

그렇다면 빅데이터를 기반으로 AI가 흥행할 것으로 예측한 영화는 어떤 것이었을까요. 최종 선정작은 뮤지컬 영화 '맘마미아2', 공포 영화 '겟 아웃', 액션 영화 '월요일이 사라졌다' 였습니다. 그 중에서도 추천 영화 1위는 ‘맘마미아2’였죠.

‘겟 아웃’은 흑인 남자가 백인 여자친구 집에 초대 받으면서 벌어지는 이야기를 다룬 작품으로 신선하고 충격적이라는 평을 들으면서 2017년 국내 개봉 당시 관객 214만명을 동원한 흥행작입니다. 2018년 개봉한 ‘월요일이 사라졌다’는 관객 수 90만명을 기록했지만 성적에 비해 평가가 무척 높은 작품이죠. 반면 '맘마미아2'는 관람객 1200만명을 동원한 ‘신과함께-인과 연’과 같은 시기에 개봉되면서 상대적으로 덜 조명받은 비운의 작품입니다.

후보작 선정 결과를 본 CGV 관계자들은 처음에 무척 의아했다고 합니다. ‘겟 아웃’이나 ‘월요일이 사라졌다’가 나온 것은 이해할 수 있지만 '맘마미아2'를 재개봉할 것인지에 대해서는 의견이 엇갈렸다네요. 하지만 ‘넘어진 김에 쉬어간다’는 속담이 있죠. 관계자들은 코로나19로 관객 수가 크게 줄어든 상황이라 흥행에 대한 큰 부담없이 재개봉에 들어갔습니다.

◇하지만 결과는 ‘AI가 틀렸다’
그렇다면 3개 작품의 성적은 어땠을까요. CGV가 추출한 빅데이터를 기반으로 AI가 추천한 영화 1위는 맘마미아2였지만, 실제 관객 수는 달랐습니다. 1위가 겟 아웃(1700여명), 2위가 월요일이 사라졌다(1400여명), 3위가 맘마미아2(1100여명)로 나타났죠. 전반적으로 당초 기대치보다는 낮았습니다. 또한 AI가 1위를 할 것으로 예상한 맘마미아2는 오히려 꼴찌를 차지했고요.

은근히 흥행을 기대했던 관계자들에게는 아쉬운 일이었습니다. 올해 상반기 재개봉 영화 중 흥행 1위는 ‘위대한 쇼맨’(28만3000명), 2위는 ‘라라랜드’(13만6000명)였습니다. 모두 맘마미아2와 같은 뮤지컬 영화죠. 이처럼 국내에서 뮤지컬 영화에 대한 선호도가 크고, 코로나19로 우울한 분위기를 신나는 음악으로 날릴 수 있어 성공 가능성이 있다고 봤지만 예상은 빗나갔습니다.

CGV 측은 신규 영화 개봉이 어려웠던 시기의 데이터를 기반으로 학습한 모델을 ‘살아있다’, ‘반도’ 등 기대작들이 개봉한 시기에 적용한 것이 원인이라고 보기도 합니다. 당초 설정했던 환경 및 조건과는 차이가 있었기 때문에 그 효과를 제대로 평가할 수 없었다는 것이죠.

◇빅데이터·AI 흥행 예측 실험, 시도 자체에 의미 커
이에 대해 이춘길 CJ CGV 데이터전략팀장은 “기존에 재개봉 영화는 편성 전문가의 식견 및 노하우를 바탕으로 선정했지만, 객관성을 갖춘 인공지능이 재개봉작을 선정하도록 처음 시도했고 관객이 보고 싶어할 만한 영화를 제공할 수 있는 기반을 마련했다는 점에서 의의가 있다”며 “향후 지속적인 개선을 통해 환경까지 고려한 모델 등 말 그대로 고객의 숨은 요구까지 반영하는 예측 모델로 진화시키고 싶다”고 말했습니다.

▲  /픽사베이 제공
▲ /픽사베이 제공

이미 유튜브나 넷플릭스 등은 개인의 요구를 꿰뚫어 보는 추천 알고리즘을 도입해 디지털 혁신을 이루고 있죠. 소비자에 맞춰 알맞은 콘텐츠를 추천하는 초개인화 기술은 빅데이터와 AI가 결합해 만들고 있습니다.

하지만 단체 관객을 수용하는 영화관은 TV나 휴대폰과 같은 개인화 기기와 전혀 다릅니다. 표를 구매하는 순간 선택이 끝나고 중간에 바꿔볼 수도, 환불할 수도 없죠. 따라서 영화 관객은 넷플릭스 관람객보다 훨씬 신중하고 까다롭습니다.

따라서 극장 입장에서는 관객이 어떤 작품을 원할지 파악하는 것이 중요합니다. 감으로 적절한 작품을 선정하고 좌석 배분을 해서 성공하기란 쉽지 않죠. 그런 만큼 빅데이터와 AI를 결합해 최적의 결과값을 얻으려는 이번 예측 실험은 충분히 의의가 있습니다. 성적만 보고 실패라고 하기 어려운 이유죠. 이러한 노력을 기반으로 향후 관련 기술이 더 발전하기를 기대해 봅니다.

저작권자 © 블로터 무단전재 및 재배포 금지