“당신의 정치 성향, 크롬 웹브라우저로 알아보세요”

가 +
가 -

구글이 언론의 디지털 혁신을 돕기 위해 진행하는 프로그램인 ‘구글 뉴스랩 펠로우십’의 ‘오라잇’팀이 필터버블 문제 해결에 도움이 될 수 있는 ‘뉴스피드 분석기’를 제작했다. 크롬 확장기능인 이 ‘뉴스피드 분석기’는 분석 시점에서 사용자의 페이스북 뉴스피드 200개를 긁어와 그중 뉴스는 얼마나 많은지, 어떤 언론사의 기사를 많이 보는지 알려준다.
projectO (3)

필터버블이란?

‘필터버블’은 인터넷 정보제공자가 이용자 맞춤형 정보를 제공해 필터링 된 정보만 이용자에게 도달하는 현상을 지칭한다. 미국의 시민단체 무브온의 이사장인 엘리 프레이저가 쓴 ‘생각 조종자들’(원제 : The Filter Bubble)에 등장하는 단어다.

“저는 진보적 정치 성향을 가지고 있습니다. 놀랄만한 일인가요. 하지만 저는 늘 보수적 성향의 사람들을 만나려고 노력했습니다. 저는 그들이 생각하는 바를 경청하기 좋아합니다. 저는 그들이 연관된 것을 확인하기 좋아합니다. 저는 이것저것 배우는 것을 좋아합니다. 그래서 어느 날 보수주의자들이 제 페이스북 피드에서 사라졌다는 것을 알았을 때 깜짝 놀랐습니다. 페이스북이 제가 어떤 링크를 클릭하는지 살펴보고 있었고, 그것은 실제로 제가 보수적 성향의 친구들보다 진보적 성향을 가진 친구들의 링크를 더 많이 클릭했다는 것을 나타내는 것이었죠. 그리고 제 의견을 묻지도 않고 페이스북은 그것을 편집해 버렸습니다. 그들은 사라졌죠.” – 엘리 프레이저의 TED 강연 ‘온라인 ‘필터버블’을 주의하세요’ 중

projectO (2)

프로젝트 O 화면 갈무리

필터버블에 취약한 페이스북

가짜뉴스가 이슈가 되면서 필터버블에 대한 논의도 활성화되고 있다. 물론 한국은 여전히 네이버나 다음 등 포털의 영향력이 강하지만, 페이스북으로 대표되는 소셜미디어의 영향력도 부쩍 올라간 상태다.

페이스북을 하다 보면 친구가 늘어나고 받아보는 페이지가 늘어난다. 하지만 정보를 보는 화면은 6인치가 안 되는 모바일 화면에 한정돼 있다. 한정된 공간에 들어가야 할 정보가 무한정 늘어날 수는 없다. 페이스북은 ‘사용자가 좋아할 만한’ 콘텐츠를 생각해서 뉴스피드에 노출해준다. 뉴스 콘텐츠도 여기에 섞이면서 갈수록 ‘입맛에 맞는’ 뉴스만 올라오게 된다. 필터버블에 갇히게 된다. 오라잇 팀은 개인이 얼마나 필터버블에 갇혀 있는지 보여주겠다는 취지로 뉴스피드 분석기를 개발했다.

projectO (1)

중앙일보 ‘오라잇’ 팀의 한소영, 신동민, 박솔, 박상현 씨와 멘토 김동관 씨(왼쪽부터)

제작 과정

뉴스피드 분석기는 폴리테코라는 사이트를 참조했다. 우선 ‘앵커’라고 불리는 100여명의 사용자를 확보해 데이터를 수집하고, 이걸 기반으로 머신러닝을 시도해 각각의 뉴스 매체들을 사람들이 어떻게 받아보는지 보여주려고 했다.

하지만 기획을 진행하다보니 몇 가지 어려운 점이 발생했다. 앵커를 모으는 일부터 쉽지 않았다. 지인 위주로 모이다 보니 편향이 생겼다. 좀 더 폭넓게 반영하기 위해서 전국 국립대 커뮤니티를 대상으로 홍보했다. 오라잇 팀의 박솔 씨는 “정확히 (인적구성이 어떤지) 확인을 해보진 않았지만, 뿌린 이후에 몇 십명 정도의 앵커가 쌓였기 때문에 영향이 있었다고 본다”라고 말했다.

‘뉴스 매체’를 정의하기도 어려웠다. 오라잇 팀은 수집한 앵커 데이터를 바탕으로 모든 페이지와 사람을 뽑아냈다. 그게 1만개였다. 페이스북에는 ‘미디어/뉴스’라는 카테고리가 있지만, 데이터 수집에서 그 정보를 가져올 수는 없었다. 많이 등장하는 정도를 기준으로 자르기도 어려웠다. 일일이 확인하는 방식으로 분류작업을 거쳤다. 외국언론까지 포함해 살폈다. 이 과정에서 큐레이션 매체나 지나친 연예오락 매체를 제거하고 421개 언론사를 추렸다.

‘크롬 확장기능’이라는 형식도 극복해야 할 지점이었다. 분석에 필요한 정도의 정보를 수집하기 위해서는 어쩔 수 없이 크롬 확장기능을 사용해야 했다. 오라잇 팀에서 개발을 담당한 신동민 씨는 “페이스북 앱을 사용하는 방법도 생각했지만 충분한 정보를 받을 수 없었다”라고 개발상의 어려움을 설명했다. 오라잇 팀의 뉴스피드 분석기가 의미 있으려면 사용자를 ‘PC 환경-크롬 브라우저-크롬 확장기능 설치’까지 하게 만들어야 했다. 이 과정에서 사용자가 최소한의 노력으로 콘텐츠를 볼 수 있도록 UX·UI를 디자인해야 하는 어려움이 있었다.

진보-보수 구분도 난점이었다. 필터버블은 보통 기존에 가진 정치적 신념을 강화하는 쪽으로 작용해서 문제가 된다. 그러나 이걸 실제로 확인하기 위해서는 언론사의 이념적 위치를 파악해야 하는데, 이걸 오라잇 팀이 자의적으로 하기 어려웠다. 참조할만한 논문 자료도 마땅치 않았다. 오라잇 팀의 멘토인 김동관 씨는 “(진보-보수를) 평가하는 기준을 만드는 것도 무리라고 판단해서 보수-진보의 가치 판단을 내리지 않았다”라고 말했다.

projectO (1)

쌓인 데이터 분석해 의미 있는 결과 찾는다

뉴스피드 분석기를 써 본 사람은 대략 700여명, 분석 대상이 된 포스트는 12만개다. 모바일 사용자보다 PC로 콘텐츠를 소비한 사용자가 많았고, 사용자의 평균 이용 페이지 수는 2페이지 이상이었다. 이는 오라잇팀이 콘텐츠의 의미와 퀄리티를 바탕으로 사용자를 불편한 PC 콘텐츠로 끌어오는 데 성공했기 때문이기도 하다.

진보-보수의 구분은 없었기 때문에 당장 본인이 얼마나 편향됐는지 직접적으로는 알 수 없다. 다만 개인이 가지고 있는 언론사 인식에 바탕한 대략적인 판단은 가능하다. ‘내가 이런 언론사의 기사를 많이 보는구나’ 정도는 알 수 있다. 오라잇 팀의 박상현 씨는 “개인적으로는 필터버블을 확인했다”라며 “언론사 입사 준비를 하면서 다양한 언론사를 받아봤는데, 분석기 순위에 뜬 언론사는 <한겨레>, <경향신문>이 많이 나왔다”라고 말했다. 분석 시점마다 등장하는 매체가 조금씩 달라지는데, 여러 번 돌려볼수록 좀 더 정확한 결과를 얻을 수 있다. 순위에 자주 등장하는 매체는 어디인지, 등장하지 않는 매체는 어디인지 살피면 자신을 둘러싼 필터버블의 존재를 확인할 수 있다.

데이터가 충분히 쌓이면 언론사도 묶어낼 수 있다. 예컨대 A, B, C, D, E, F라는 사람이 있을 때 A와D, F가 보는 뉴스가 비슷하다면 이 세 명의 뉴스피드를 분석한 결과로 자주 나타나는 언론사를 하나의 그룹으로 묶는 식이다. 이 경우에도 ‘진보’나 ‘보수’라고 정의하기는 어려울 수 있지만 묶이는 매체를 보면서 좀 더 뚜렷한 필터의 모습을 보는 것도 가능할 수 있다. 김동관 씨는 “가지고 있는 데이터로 여러 분석을 해 보고 의미 있는 결과가 나오면 공개할 것”이라고 밝혔다.