알고리즘 저널리즘의 명암, 자동화와 불평등

가 +
가 -

‘알고리즘 저널리즘’이라는 말은 다소 생소하다. 아직 명확한 개념이나 정의가 확립된 말은 아니다. 알고리즘 저널리즘은 크게 뉴스의 소비처가 온라인으로 옮겨오면서 저널리즘이 IT와 밀접하게 연결되는 현상을 지칭한다.

지난 11월11일 미디어카페 후에서 한국언론진흥재단 후원으로 저널리즘학연구소가 주최한 ‘알고리즘의 부상과 저널리즘 생태계의 변형’세미나가 열렸다. 이날 세미나에서는 알고리즘 저널리즘의 이슈와 쟁점을 짚어보고, 알고리즘의 사회적 책무와 저널리즘 생태계의 복원 방안을 논의하는 시간을 가졌다.

1부는 3개의 발제와 개별 발제에 이어지는 토론으로 구성됐다. 우선 ‘디지털 정보중개자의 알고리즘, 현황과 쟁점’에서는 구글, 페이스북, 네이버, 카카오 등 뉴스 중개자가 주도권을 잡은 현실을 이야기했다. 두 번째 세션에서는 ‘뉴스콘텐츠 생성 알고리즘 리뷰’를 통해 기사 작성을 돕는 알고리즘의 사례를 보고, 마지막 세션에서는 ‘알고리즘의 현실 뉴스룸의 생산과정에 미치는 영향’을 살폈다. 전반적으로는 포털을 ‘저널리즘 훼손’을 가져온 주범이라고 비판하면서 사회적인 통제가 있어야 한다고 강조하는 목소리가 많았다. 세션별 토론자의 주요 발언을 정리했다.

algorithm (2)

디지털 정보중개자, 알고리즘

발제자로 나선 저널리즘학연구소의 진민정 박사는 지금 알고리즘이 저널리즘에서 중요해진 이유로 ‘엄청난 양의 정보’를 꼽았다. 인간이 엄청나게 많은 양의 정보를 만들어내고 있는데, 이 정보는 보기 좋은 형태로 제공돼야 한다. 이 과정에서 알고리즘이 개입한다. 예컨대 하루 생산되는 수만개의 기사가 있다면, 이 중 선별된 몇 개의 기사가 내 눈에 들어오게 된다. 뉴스가 읽히는데 가장 중요한 요소가 ‘알고리즘’이 된 셈인데, 중개자들이 이 알고리즘을 투명하게 공개하지 않기 때문에 논란이 된다. 진민정 박사는 “평가 기준은 명시돼 있지만 작동 방식은 불투명하다”라며 “뉴스 순위 알고리즘의 형평성 논란이 있다”라고 말했다. 또한 “알고리즘의 접근성, 투명성 문제에 대한 논의가 필요하다”고 덧붙였다.

강국진(서울신문) : 구글과 페이스북이 논란이라고 하지만, 한국 포털의 전반적인 행태를 봤을 때 부럽다. 실급검(실시간급상승검색어) 조작 논쟁 등등을 보면 구글이나 페이스북 정도라도 (국내 포털이) 하면 지금보다 낫지 않을까 하는 생각이 든다. 소비자 운동 같은 주체적 뉴스 소비에 대한 고민이 필요하다.

구본권(한겨레) : 알고리즘을 블랙박스 속 기술이라고 한다. 결론에 이르는 과정을 알려주지 않는다. 미디어의 이용주체가 사람뿐이었던 상황에서 비인간이 들어왔는데 통제는커녕 이해도 못 하고 있는 상황이다. 알고리즘의 편향성 이전에 알고리즘에 대한 접근성을 어떻게 확보할 것인지. 어떤 방식으로 만들어지는지에 대한 공개가 우선돼야 한다. 알고리즘이 편향됐는지, 아니면 현명하고 이로운 것인지에 대한 판단이나 논의는 그다음에 가능하다.

민노씨(슬로우뉴스) : 알고리즘은 저널리즘의 이상보다는 중개자의 장기적인 이익과 안정적인 수익모델의 확보를 우선적으로 고려한다. 여기에 대한 비판적 접근이 필요한데, 지금 언론사의 태도를 보면 굉장히 회의적이다. 예컨대 페이스북을 말해보자. 페이스북에서 같은 정보와 가치를 담고 있는 텍스트와 동영상이 있을 때, 동영상이 알고리즘을 통해 소비되도록 유도된다. 알고리즘의 정보 중개자의 이익과 직접적인 연계를 맺고 있는데, 소비자는 물론 정보 생산자도 비판적으로 인식하기 보다는 생존하기 위해서 동영상을 무비판적으로 수용한다. 이런 상황에서 공론화를 시킬 수 있을까? 그렇지 않다고 생각한다.

최낙진(제주대) : 분배의 방식으로 통제를 해야 한다. 생산해 내는 우리에 대한 보상을 경제적으로 해야 한다. 또한 저널리즘을 교육하는 측면에서도, 알고리즘에 대해 현업과 학계가 같이 논의해야 한다.

정혜승(카카오, 정혜승 카카오 이사는 2부 토론자이지만 주로 1부에서 이어지는 질문들에 답변했다) : 뉴스 생산 알고리즘에는 기대가 많다면 뉴스 편집에는 불안감이 훨씬 크다. 이 차이는 무엇인가? 어젠다 세팅의 주도권을 넘겨준 것에 대한 불안감인가에 대해서는 논의가 더 필요할 것 같다.

다음의 경우 하루 3만건의 뉴스가 들어온다. 사람이 편집하기에는 한계를 넘어섰다. 특히 모바일 시대에는 예전 PC시대와 뉴스 소비 양태가 다르다. 모바일에서는 개인 관심사에 맞춰서 뉴스를 제공해야 한다. 그래야 뉴스 소비량도 늘어난다.

알고리즘이 저널리즘에 기여하는 부분이 있다. 국제뉴스는 그렇게 인기 있는 카테고리가 아니다. 신문이나 방송에서도 비중이 작다. 모바일 화면도 한계가 있었지만, 루빅스의 적용으로 비중이 적었던 카테고리의 뉴스도 끌어올릴 수 있었다. 다양성 측면에서도 좋다.

알고리즘이 아무도 이해 못 하고, 통제도 어려운 그런 것은 아니다. 기본적으로 데이터를 기반으로 이용자에게 좀 더 많은 가치를 줄 수 있는 방향을 고려해 수정하고 업데이트한다. 보다 나은 방향으로 진화하는 데 개입할 수 있다. ‘실급검 조작’ 같은 오해가 생긴 점은 분명 우리의 책임도 있겠지만, 검색 조작이 그렇게 쉬운 일도 아니다.

검색 중립성이라는 용어가 나온 지 몇 년 됐다. 그런데 검색이 어떻게 중립적일 수 있나? 검색은 이용자가 찾고자 하는 정보의 최적값을 주는 행위다. 그게 알고리즘이다. 그냥 던져주는 게 아니라 최적도에 순서를 매겨서 준다. 이런 개념에 어떻게 중립이 있을 수 있나 하는 생각도 든다.

저희가 어쨌든 보수와 진보를 아우르는 뉴스를 유통하는 플랫폼이지만, 논란이 있다면 해결은 투명성 확보로 해야 하지 않나 생각한다. 카카오에서는 루빅스가 어떤 팩터로 어떻게 구성됐고, 어떻게 작동하는지에 대한 공개를 준비하고 있다.

구글·페이스북과 달리 한국의 포털은 매체사에 대가를 지급하고 뉴스 콘텐츠를 받아왔다. 사회적 책무도 끊임없이 고민하고 있다. 경제적인 보상에서는 오히려 우리가 선진적이지 않나 생각한다.

저널리즘이 포털 때문에 망가졌다는 말이 있지만, 저널리즘에 대한 책임은 생산-유통을 담당하는 우리가 모두 논의해야 할 문제다. 좀 더 근원적인 성찰이 필요하지 않나 생각한다.

algorithm (1)

뉴스콘텐츠 생성 알고리즘 리뷰

두번째 발제에서는 프로야구 뉴스로봇, 증시 시황기사를 알고리즘으로 작성하는 사례와, 뉴스 콘텐츠 생성 알고리즘의 종류 및 속성을 살펴봤다. 흔히 이야기하는 ‘로봇 저널리즘’이다.

서보윤(중앙대) : <SBS>에서 스포츠 기자를 오래 한 지인에게 보여줬다. 그 기자는 스트레이트는 사람이 쓴 것보다 훨씬 좋다고 평가하면서도 로봇이 하지 못하는 영역이 있다고 말했다. 예컨대 야구에서 벤치클리어링이 났을 때, 단순히 데이터로 볼 수 없는 배경이나 감각 등은 로봇이 캐치할 수 없다는 것이다. 각자의 역할에 대한 고민이 필요하다. 또한 어뷰징 가속화에 대한 우려가 있는데, 기사 품질 평가에 대한 고민도 있어야 한다.

이성규(메디아티) : 데이터 분석을 베이스로 하는 대부분의 분석이나 알고리즘은 기본적으로 상관관계를 발견하지 인과관계를 발견하기는 어렵다. 야구 기사를 쓴다고 했을 때, ‘오승환의 포심 패스트볼 회전율이 방어율을 낮추는 데 어떤 인과가 있는지?’ 같은 기사는 로봇이 쓰기 어렵다. 기자가 찾아야 하는 문제다. 두 번째 필요한 고민은 ‘데이터가 발견할 수 없는 맥락의 구성을 누가 할 것인가?’의 문제다. ‘왜?’는 기자가 고민해야 한다. 기자와의 협업을 어떻게 가져갈 것인가의 문제가 있다.

알고리즘 기사 작성에서 단조로움의 문제도 해결해야 한다. 규칙 기반 기사 생성은 자칫 지루한 기사를 양산할 수 있다. 기사의 톤앤매너 조절도 이슈다. 기자와 데스크의 역할이 중요하다. 전반적으로는 알고리즘이 기자를 대체한다기보다는, 이것을 어떻게 활용해서 저널리즘의 품질을 높일 수 있을지 고민해야 한다.

이정환(미디어오늘) : 지금은 알고리즘이 작성하는 기사에 ‘와, 멋지다’ 감탄하는 단계가 아닐까 싶다. <파이낸셜뉴스>에서 알고리즘이 작성한 기사를 보고 굉장히 실망했다. 템플릿에 기반해 팩트를 끼워넣는 건 굉장히 초보적인 단계인데, 다들 엄청난 거라고 생각하는 듯 싶다. 애초에 이런 기사는 기사 가치도 높지 않고, 사람도 안 읽는다. ‘알파고 때문에 기자 일자리 없어진다’ 이건 아직 설레발이 아닐까 싶다. 아직은 그냥 잡일을 대체하는 수준이다.

데이터를 긁어서 어떤 특이점을 짚어준다거나, 잘 보지 않지만 필요한 사실을 알려준다든지, 다양한 아이디어가 필요하다. 지금은 알고리즘에 대한 환상을 접어야 할 필요가 있다. 최순실 게이트는 결국 발품 팔고 쓰레기통 뒤지는 옛날 방식을 알고리즘이 넘을 수 없다는 걸 보여준다. 권력에 대한 비판을 알고리즘이 대체할 수는 없다. 알고리즘도 거들 뿐이다. 결국 저널리즘이다. 유연한 개발자, 상상력이 풍부한 기자, 오픈된 공공정보 시스템이 저널리즘을 풍성하게 하지 않을까 생각한다.

김동한(서울대, 발제자) : 데이터가 발견할 수 없는 맥락은 당연히 있다. 토론자분이 지적하셨던 단조로움의 문제를 극복하기 위해 머신러닝을 활용해 기사를 작성하는 것도 고려하고 있다. 기자와 알고리즘은 보완관계다. 기자에게 필요한 게 무엇인지 논의하면서 진행하면 더 좋은 결과를 이끌어나갈 수 있을 거로 생각한다.

algorithm (3)

알고리즘이 현실 뉴스룸의 생산과정에 미치는 영향

“신문에서 대학 평가를 하면 대학도 거기에 맞춰서 순위를 높이려고 노력하겠죠. 알고리즘에 제기하는 문제도 비슷한 게 아닐까 생각합니다.” – 이봉현 <한겨레> 편집국 부국장

이봉현 부국장은 알고리즘이 편집국에 미칠 변화를 이야기했다. 우선 알고리즘 기사 작성은 아직 제한적 기능만을 수행하는 보조적 역할에 그친다고 평했다. 이봉현 부국장의 발제 역시 플랫폼에 어떻게 편집국이 대응할 것인지에 초점을 맞췄다.

<한겨레>의 경우 디지털 뉴스 유입 비율이 네이버 30%, 페이스북 30%, 카카오 10%, 구글 10%, 직접 유입이 20% 이하다. 이처럼 대부분의 기사가 유통 플랫폼에서 소비된다. 이봉현 부국장은 조회수에 목 매게 되는 현실을 비판적으로 언급했다.

언론은 유통 플랫폼에서 주목을 받아야 하는 기사를 써야 하는 압박 느껴. CMS (콘텐츠 관리 시스템)등을 통해 자기 기사의 페이지뷰를 거의 실시간으로 파악할 수 있고, 전체 기사 중 조회수, 공유횟수 기준으로 일간, 주간, 월간, 역대 순위가 나오며 이에 대해 기존의 특종상, 기획상 이외에 페이지뷰상, 소셜공감상을 시상을 하는 언론사가 다수. 비록 의미 있고 공을 많이 들인 기사를 써도 “좋아요”나 공유횟수가 한 자릿수에 머물면 무의미하다는 분석도. – 알고리즘의 부상과 저널리즘 생태계의 변형 발제자료

알고리즘을 알 수 없어 겪게 되는 고충도 털어놓았다. 분명히 자사 기사가 훨씬 좋은 수준인데도 타사 기사가 상단에 걸려있을 경우가 많다고 이야기했다. 이봉현 부국장은 “이런 들쭉날쭉한 상황에 대해 포털은 알고리즘으로 하는 일이어서 어쩔 수 없다는 태도다”라며 “기사의 선정, 배치 등에서 편집인력에 의한 ‘마사지’가 의심되고 실제 포털, 구글, 페북 모두 어느 정도 사람이 보정을 하는 것은 확실하다”라고 말했다. 이봉현 부국장은 알고리즘이 저널리즘 현장에 끼치는 역기능으로 ① 의제설정 왜곡 및 언론 생태계 황폐화 ② 민주적 책임성의 유실 ③ 언론의 플랫폼 종속과 여론 독과점을 들었다.

김성해(대구대) : 알고리즘이 작성하는 기사가 많아질 것이다. 하지만 알고리즘 저널리즘의 근본적인 한계는 있다. ‘왜?’에서 치명적인 약점이 있다. 인간밖에 못 하는, 인간의 역할은 분명하게 있다. 우리가 알고리즘에 어떻게 접근할 것인지가 문제다. 이해와 통제를 넘어서 저널리즘 복원에 알고리즘을 어떻게 이용할 것인지 생각해야 한다.

문소영(서울신문) : 이봉현 부국장님의 말에 100% 동의한다. 저희 온라인 쪽에서는 알고리즘이 어떻게 작동하는지 알기 위해 부단히 노력한다. 알고리즘을 알려주진 않겠지만, 최소한의 가이드라인이 있으면 어떨까 싶다.

포털 이후의 시대에 민주적인 시민을 길러내는 저널리즘, 그런 뉴스가 소비되고 있는지에 대해 회의감이 든다. 사건사고, 연예, 스포츠만 쭉 올라가고 유권자들이 필요한 정보는 잘 소비되지 않고 있다. 뉴스가 많이 소비됐다고 해서 좋아할 만한 상황은 아닌 거다.

언론은 현실을 재현해서 보여준다. 중요하다고 생각하는 문제에 좀 더 포커스를 둔다. 이 기능이 포털로 넘어가면서 알고리즘으로 재현되는데, 포털이 중간이 있다 보니 언론이 보여주고 싶어하는 현실을 보여줄 수 없는 게 큰 문제가 된다고 생각한다.

우리가 저널리즘과 동떨어진 기사를 양산할 수밖에 없는 현실이 개선될 필요가 있다. 절대 지금의 디지털 방식으로는 인건비를 해결할 수 없다. 포털이나 디지털 쪽에서 일하는 분들이 ‘좋은 콘텐츠 만들면 살 수 있다’고 이야기하는데, 다 죽은 다음에 그 시대가 오지 않을까 우려한다. 알고리즘에 대해서 사회적인 합의가 필요하다. 일정 수준으로는 공개도 해야한다.

박진우(건국대) : 언론, 플랫폼 사업자가 같이 교육을 고민했으면 한다. 학교에서는 ‘언론인 하고 싶은 애들이 많은데, 뭘 교육해야 하나’ 고민이 많다. 다들 사회적인 논의가 필요하다고 말씀을 하시는데, 말만 할 때가 아니다. 지금 언론사는 이 기술을 가지고 무엇을 어떻게 할 것인지에 대해 아무런 비전이 없다. 기술을 어떻게 사용해야 하는지 정말로 배워야 할 시점이 왔다. 언론사도 자각해야 한다.

이영태(뉴스핌) : 알고리즘에는 가치가 없다고 말하지만, 플랫폼 사업자의 가치가 반영되고 있다. 일종의 ‘문고리 권력’ 문제가 아닌가? 유통사업자가 어떤 생각을 가지고 있는지에 따라 알고리즘이 운영되고 있다.

언론사 스스로 좋은 기사를 쓰는 데도 신경을 써야겠지만, 언론사 스스로가 문고리 권력을 장악하는 방법도 생각해야 한다. 좋은 뉴스 공급 플랫폼을 같이 고민하면 어떨까 생각해본다.

언제까지 포털만 탓할까

이날 토론 주제는 ‘알고리즘 저널리즘의 이슈와 쟁점’이었으나, 전반적으로 포털에 뭇매를 때리는 모습이었다. ‘모두가 함께 해결해야 할 문제’라고 입은 모았지만, 포털이 뉴스 유통을 담당하면서 지금 저널리즘의 문제가 생겼다는 식이었다. ‘문제는 포털 탓’이라는 주장이 주를 이뤘다.

앞으로의 변화를 논의하자고 모인 자리에서 수년 전부터 나왔던 이야기의 지난한 반복이 이어진 것은 다소 아쉽다. 사회의 통제만을 바라는 태도도 다소 아쉽다. 사회적 논의도 중요하지만, 빠르게 변하는 시대의 변화에 적절하게 대응하기 위해서는 포털에만 천착하지 말고 문제 해결을 위한 다각적인 접근이 필요한 시점이다.

네티즌의견(총 1개)