“머신러닝이 만족도 80% 넷플릭스 추천 시스템 만든다”

가 +
가 -

콘텐츠 추천 서비스, 개인 맞춤형 서비스를 얘기할 때 빠지지 않고 등장하는 서비스가 있다. 100명이 넘는 사람이 모여 수집한 데이터를 바탕으로 새로운 알고리즘 서비스를 만들어 내는 곳, 세계에서 가장 정교한 추천 알고리즘을 가지고 있다고 자부하는 곳, 가장 많은 사용자 시청 정보를 가지고 맞춤형 서비스를 개발한다고 외치는 곳. 바로 세계적인 인터넷 기반 TV 서비스 기업 넷플릭스다.

“우리 꿈은 사람들이 아주 쉽게 자기가 좋아할 만한 영상을 볼 수 있는 환경을 만들어주는 것입니다. 넷플릭스에 들어와서 순간적으로 ‘이거 내가 좋아하는 거네?’하면서 기분 좋게 시청할 수 있는 환경을 만들고자 합니다.”

넷플릭스 개인화 알고리즘을 책임지고 있는 카를로스 고메즈 유리베 넷플릭스 제품 혁신 담당 부사장이 밝힌 넷플릭스 추천 서비스의 목표다. 그는 넷플릭스 시청자 중 80%가 추천 시스템에 만족하고 자신이 좋아하는 콘텐츠를 볼 수 있게 되는 게 꿈이라며, 좋은 추천 시스템을 만들기 위해 노력하는 중이라고 밝혔다.

“굉장히 다양한 변수가 있지만, 추천 알고리즘 개발하는 데 있어 인기와 개인화를 빼놓을 수 없습니다. 추천 서비스 기본은 ‘인기를 끄는 콘텐츠가 무엇인지’, ‘어떤 콘텐츠를 사람이 많이 보는지’, ‘어떤 기기를 바탕으로 어느 시간에 콘텐츠를 시청하고 있는지’, ‘어떤 분위기에서 콘텐츠를 소비하고 있는지’ 등을 정보를 파악해 적절히 조화를 이루면 좋은 알고리즘을 만들 수 있고 추천 서비스도 선보일 수 있다고 생각합니다.”

카를로스 고메즈 유리베 넷플릭스 제품 혁신 담당 부사장

카를로스 고메즈 유리베 넷플릭스 제품 혁신 담당 부사장

넷플릭스 추천 알고리즘엔 다양한 변수가 들어간다. 인기와 개인화 못지않게 다양성도 중요 변수다. 사용자가 주로 시청하는 콘텐츠 영역에만 머무르지 않고, 해당 사용자가 시청할 수 있는, 시청하면 좋아할 콘텐츠를 계속해서 발굴해 보여준다. 언제, 어떤 타이밍에 추천 서비스를 선보일지도 고민한다. 너무 빠르게 추천하다 보면 가입자가 혼란스러워지고, 너무 느리게 추천하면 볼 게 없다고 생각할 가능성이 있기 때문이다. 그 외에 사용 언어도 신경 쓰고 국가별 문화도 신경 쓴다.

“사용자 시청 정보, 플레이 데이터를 바탕으로 가능한 모든 경우를 분석합니다. 단순히 넷플릭스 계정 하나만 분석하는 게 아니라 넷플릭스 계정에서 나뉘는 각 프로필 정보도 파악해서 분석하지요. PC와 모바일, 태블릿 등 다양한 기기에서 어떻게 콘텐츠를 소비하는지도 살펴봅니다.”

넷플릭스는 190개국, 전세계 8100만명이 가입한 글로벌 서비스다. 지난 1월 새로운 국가 130여곳에 새로 진출하면서 전세계 어느 곳에서나 원활한 서비스를 제공하기 위해 개인화 추천 서비스를 무기로 들고 나왔다. 1년에 걸친 노력과 연구 끝에 넷플릭스는 전세계 가입자가 이용할 수 있는 개인화 추천 시스템을 개발했다. 가입자가 원하는 콘텐츠를 빠르고 간편하게 찾을 수 있게 돕는다.

이제 막 넷플릭스 서비스를 이용할 수 있는 나라에서도 추천 서비스는 문제없이 돌아간다. 나라가 아닌 전세계 사용자 그룹을 나눠서 가입자 개개인 거주 국가와 상관없이 콘텐츠를 추천한다. 당장은 부족하게 보일지 모르지만, 시간이 흐르고 콘텐츠가 쌓이면 넷플릭스 서비스는 힘을 발휘한다.

“한국 역시 이제 막 진입한 시장입니다. 지금 한국 사용자가 얘기하는 콘텐츠 부족과 같은 불만을 멕시코에서도 경험했습니다. 1년 뒤면 훨씬 더 나은 서비스 환경을 제공해 드릴 수 있다고 자신합니다.”

참고로 이 모든 서비스는 알고리즘, 컴퓨팅 시스템으로 운영된다. 넷플릭스 추천 서비스에 사람은 없다. 시스템이 자리한다. 물론 처음부터 넷플릭스가 알고리즘을 바탕으로 개인 맞춤형 추천 서비스를 만든 건 아니다. 알고리즘을 이용하는 방식보다 태그 입력 같은 콘텐츠 색인 목록을 바탕으로 추천 서비스를 제공하는 게 더 낫다는 내부 의견도 있었다. 그러나 이런 의견 다툼은 6년 전 진행한 실험에서 끝났다.

“제가 6년 전 넷플릭스에 합류할 때 일입니다. 통계와 머신러닝을 이용한 알고리즘을 통해 추천하는 게 얼마나 적합한가에 대한 얘기가 있었습니다. 이때 실제 추천할 때 태그를 이용해 하는 게 낫지 않겠냐고 믿는 사람이 많았습니다. 그래서 직접 실험을 해봤습니다.”

블로터아카데미

넷플릭스는 사용자를 서로 다른 그룹으로 나눠 실험을 진행했다. 첫 번째 그룹에는 태그를 기반으로 추천 서비스를 만들어 제공했다. 두 번째 그룹에게는 영화 전문가에게 특정 영화를 보고 어떤 영화와 유사할지, 이 영화를 좋아하는 사람은 어떤 영화를 좋아할지 등 자문해 얻은 정보를 바탕으로 추천 서비스를 만들었다. 세 번째 그룹에는 태그 정보를 무시하고 통계와 머신러닝 기반으로 추천 서비스를 운영했다.

결과는 통계와 머신러닝 기반 추천 서비스를 경험한 사용자 집단에서 압도적으로 높은 만족도가 나왔다. 넷플릭스 구독을 해지한 사용자도 가장 적었다. 넷플릭스가 추천 알고리즘 개발 논문을 선보이며 공을 들이는 이유다.

“A/B 테스트 대조 실험을 진행했습니다. 두세 달 동안 실제 서비스 환경에서 몇십만명에 이르는 사용자를 대상으로 실험을 진행했지요. 이 기간에 시청 시간이 어떻게 달라지는지, 추천된 영화를 얼마나 많이 시청하는지, 사용자가 해당 기간 동안 얼마나 탈퇴하는지 등을 살폈습니다. 그 결과 맨 마지막 사용자군 반응이 가장 좋게 나타나더군요.”

그 뒤로 넷플릭스는 고민하지 않았다. 실제 서비스 운영 결과에서 얻은 경험을 바탕으로 어떻게 하면 더 좋은 추천 서비스를 만들 수 있을지 알고리즘을 개선하는 데 집중했다. 좋은 서비스를 바탕으로 차근차근 회원 수를 늘려나갔다.

“넷플릭스는 계속 성장하고 있습니다. 알고리즘 추천 서비스를 개선하고 나면, 이를 통해 얻은 정보를 바탕으로 콘텐츠를 보강할 계획입니다. 그럼 더 많은 콘텐츠를 바탕으로 사용자에게 더 나은 추천 서비스를 제공할 수 있게 되겠지요.”

네티즌의견(총 1개)