▲ (사진=네이버 뉴스 화면 갈무리)
▲ (사진=네이버 뉴스 화면 갈무리)

‘네이버 뉴스’ 알고리즘에 인간 편집자가 인위적으로 개입할 수 있는 가능성이 발견되지 않았다는 검토 결과가 나왔다. 특정 언론사를 이념·성향에 따라 우대하는 정치적 편향도 드러나지 않은 것으로 나타났다.

26일 네이버는 이 같은 내용이 담긴 ‘제2차 네이버 뉴스 알고리즘 검토위원회(검토위)’ 결과 보고서를 공개했다. 보고서에 따르면 검토위는 △뉴스 검색(랭킹 알고리즘) 서비스 △AiRS 뉴스 추천 서비스 △뉴스 클러스터링 △코드 개발 △서비스 배포 과정을 검토했다.

보고서에서 검토위는 네이버 알고리즘에 대한 인위적인 개입이 사실상 불가능하다고 밝혔다. “학습데이터의 구성이 중간에 인위적으로 수정되거나 알고리즘을 구성하는 자질이 특정기간 동안 임의로 수정되기 어렵다는 점을 확인했다”는 설명이다. 특히 검토위는 “알고리즘의 자질을 변경하고 보완하는 일은 단기간 수행되기 어렵고, 수정에 대한 이력이 기록으로 남아 인위적인 개입이 가능하지 않은 환경”이라고 덧붙였다. 

‘학습데이터’는 언론사에서 제공하는 뉴스 기사 데이터와 뉴스 서비스 이용자들이 남기는 로그데이터 등을 말한다. ‘자질(feature)’은 기사 제목·본문·키워드(단독 등)·최신성·기자 정보·이용자의 기사 추천 등 다양한 고려 요소를 말한다. 네이버는 이를 통해 뉴스 품질을 측정해 기사를 검색 상위에 제공하거나 추천해주고 있다.

검토위는 검색·추천 알고리즘에서 정치적 편향성도 확인할 수 없었다고 밝혔다. “특정 언론사의 이념이나 성향을 우대하는 것이 아니라 송고된 기사 수, 송고 시점, 기사의 최신성 등 뉴스 생산과 관련된 활동이 다양한 자질 목록과 각각에 대한 가중치로 작동하는 계수 계산과정에 더 관련이 높다고 판단됐다”는 것이다. 

다만 이 같은 알고리즘은 결과적으로 인력과 자원이 풍부한 대형 언론사에게 유리하게 작용한다는 지적도 이어졌다. 검색·추천 알고리즘은 충분한 데이터가 수집∙분석되지 않으면 예측 정확도가 떨어지는 ‘콜드 스타트(cold start)’ 문제가 발생하게 되는데, 뉴스는 매일 업데이트되는 새로운 데이터로부터 출발해야 한다. 이 때문에 실시간 온라인 이슈에 대응할 수 있는 인력을 갖추고 기사를 쏟아낼 수 있는 대형 언론사들이 뉴스 노출에 있어 유리할 수밖에 없다.

검토위는 네이버 뉴스 알고리즘의 질적 발전을 위해 학습데이터와 자질이 시대의 변화를 잘 반영하고 있는지 지속적으로 검토할 것을 권고했다. 더불어 뉴스의 자질을 숫자로 집약하는 과정에서 단순화가 발생할 수 있으므로 평가자의 다양성 확보에 대한 필요성을 강조했다.

또 일반 추천 결과에 언론사의 ‘기획·심층 기사’가 자주 노출 될 수 있는 방법을 고민해줄 것을 제언했다. 단순 기사에 비해 상대적으로 클릭 수나 인기도 측면에서 불리한 데다, 많은 이용자들이 해당 기사 노출 영역의 존재 자체를 모르는 경우가 많기 때문이다. 이에 네이버 측은 “심층기사로 편집되면 고품질 기사로 판단해 추천을 적용하는 영역에서 우대하는 개선안을 계획하고 있다”고 밝혔다.

한편 이번에 공개된 보고서는 12명의 위원으로 구성된 2차 검토위가 지난해 8월부터 올해 1월까지 6개월 간 검토작업을 진행한 결과다. 앞서 네이버는 뉴스 알고리즘 편향 논란에 따라 지난 2018년 1차 검토위를 발족, 네이버 뉴스 알고리즘을 검토하도록 한 바 있다. 당시 검토위는 “네이버 뉴스 검색·추천 알고리즘에 문제가 없다”고 밝혔지만 ‘소스코드’는 직접 보지 못했다는 점이 한계로 지적됐다.

이후 지난 2020년 9월 윤영찬 더불어민주당 의원의 이른바 ‘카카오 들어와’ 발언 논란으로 알고리즘에 대한 문제제기가 잇따르자 네이버는 2차 검토위를 구성하고 재검증에 나섰다. 2차 검토위에선 검토가 필요한 부분의 소스코드도 네이버로부터 전달 받아 확인했다. 검토위 보고서 전문은 네이버 다이어리 블로그(https://blog.naver.com/naver_diary/222631701600)를 통해 확인할 수 있다.

저작권자 © 블로터 무단전재 및 재배포 금지