네이버, 사람 없이 이미지 뉴스 만든다

가 +
가 -

네이버가 사람의 개입 없이 이미지형 뉴스를 자동 제작하는 기술을 개발했다. 네이버는 이 기술의 구현 과정을 담은 논문 ‘News2Images: Automatically Summarizing News Articles into Image-Based Contents via Deep Learning’을 오는 16일 오스트리아에서 개최되는 ACM ‘레코멘데이션 시스템’ 콘퍼런스에서 발표할 예정이다.

네이버가 개발해 논문으로 공개한 ‘News2Image’(뉴스투이미지) 시스템은 일반 텍스트형 뉴스를 이미지 뉴스로 자동 전환하는 알고리즘이다. 피키캐스트와 같은 정보 큐레이팅 서비스는 에디터가 직접 이미지를 검색하거나 GIF 이미지를 제작해 스토리를 만들어내지만, 네이버는 사람의 개입 없이 딥러닝 기술만으로 이를 구현할 수 있는 시스템을 개발한 것이다.

 

최근 해외 유력 IT 기업들은 뉴스를 요약해주는 서비스를 잇달아 내놓은 바 있다. 예를 들어 야후는 뉴스 요약 스타트업 섬리를 인수해 ‘야후 다이제스트’를 내놓았고 MS는 뉴스를 요약해 읽어주는 ‘뉴스캐스트’라는 앱을 현재 개발 중이다. 네이버는 여기서 한발 더 나아가 뉴스를 요약한 뒤 이를 이미지 스토리로 자동 변환하는 서비스를 제작할 수 있는 기술을 확보했다.

네이버랩스의 하정우 연구원은 이날 공개한 논문에서 “피키캐스트와 같은 이미지 중심의 간편 블로그가 모바일앱이나 웹이 인기를 얻으면 운영되고 있다”면서 “이와 같은 이미지 중심 콘텐츠는 짧은 시간 안에 핵심 메시지를 전달할 수 있을 뿐 아니라 텍스트 콘텐츠에 비해 사용자들의 관심도 모을 수 있다”고 개발 취지를 설명했다.

더 읽어보세요!

‘News2Image’는 텍스트 뉴스에서 핵심 문장을 추출해 요약하는 단계, 추출된 문장과 관련이 있는 이미지를 회수하는 단계, 이를 기반으로 이미지 스토리를 제작하는 단계로 구성돼있다. 이 과정에 CNN(Convolutional Neural Networks)이라는 딥러닝 알고리즘을 활용했다.

네이버랩스는 이 시스템을 완성하기 위해 100명의 유명 인사 기사 22만건에 포함된 이미지를 CNN 모델로 학습시켰다. 그리고 6967개의 기사를 검증 데이터로 실험했다. 이 같은 절차를 거쳐 모두 2만224개의 이미지 기사를 자동으로 제작했는데 대부분이 관련 기사 이미지로 채워졌다고 이 논문을 밝히고 있다. 다만 다의어가 많이 포함돼있는 기사나 단어수가 과도하게 많은 문장을 포함하고 있는 기사의 경우 이미지 뉴스 자동 생성에 일부 한계가 존재했다고 설명했다.

하정우 연구원 등은 논문 결론에서 “TF/IDF 방식과 비교했을 때 딥러닝을 활용하면 분류 정확도는 24%, 코사인 유사도는 0.23 개선된 결과를 얻을 수 있었다”고 밝혔다. 하 연구원은 개인 맞춤형 정보와 결합할 경우 사용자들이 선호하는 뉴스를 이미지 뉴스 형태로 제공할 수도 있다“고 덧붙였다. 이 논문은 하정우 연구원 외에 강동엽, 표현아, 김정희 연구원 등이 공동 저자로 참여했다.