“저널리스트여, 구글 데이터와 도구를 활용하시라”

가 +
가 -

‘제2회 넥스트 저널리즘 스쿨’ 참가자인 김혜인, 연다혜, 이민경 씨가 지난 5월, 2박3일 일정으로 미국 마운틴뷰 구글 캠퍼스를 방문하고 돌아왔습니다. 김혜인 씨가 사이먼 로저스 구글 뉴스랩 데이터 에디터를 인터뷰했습니다. 제2회 넥스트 저널리즘 스쿨은 <블로터>와 <한겨레21>, 구글코리아가 공동 주최하는 젊은 저널리스트 교육 과정입니다._편집자

지난 5월16일, 꼬박 16시간의 비행 끝에 구글 본사가 위치한 마운틴뷰에 도착했다. 선글라스를 끼지 않으면 눈을 뜨기 힘들 정도로 맑은 샌프란시스코의 햇볕 아래, 새하얀 마시멜로우를 들고 있는 안드로이드 모형과 마주했다. 그 뒤론 흡사 하나의 ‘구글 마을’을 이룬 듯 190개가 넘는 건물들이 자리하고 있었다. 알록달록 구글 자전거를 타고 돌아다니고 야외에서 노트북 자판을 두드리는 직원들의 모습은 복장만큼이나 자유로워 보였다.

google_njs_01

본사 건물에 출입하기 전까지, 관광객과 본사 직원간의 구분은 모호했다. 나이부터 인종까지 다양한 이들이 자연스레 함께 있었기 때문이다. “Excuse me, sir.” 일행을 놓쳐 때마침 문을 열고 들어가는 다른 직원 뒤를 따라가다 저지당했다. 가슴에 붙인 출입증은 담당자가 동행하지 않으면 무용지물이었다. 담당자가 오자 다시 친절한 웃음으로 문을 열어주던 본사 직원들의 뒤에는 익숙한 구글 로고가 박혀있었다. 오픈돼 있지만 그 안에 그어진 경계. 이곳은 미국 구글 본사였다.

“네게 소개해 줄, 준비된 도구가 아주 많아”

첫 인터뷰어인 뉴스랩의 사이먼 로저스 데이터 에디터는 새로운 도구들을 소개해주었다. 흰 바탕의 구글 검색창은 예상보다 많은 일을 했다. 검색창은 심플했지만 입력된 질문들은 많은 양의 데이터를 만들어냈다. 사이먼 로저스는 30억건이 넘는 검색이 발생하고 있다고 말했다. 검색창에 올라온 질문들은 데이터가 돼 시각화 자료로 탈바꿈했다. 어떤 질문이든 상관없었다. 가벼운 질문부터 무거운 질문까지 구글은 이를 데이터화해서 분석했다. 한 번은 ‘할로윈 데이에 어떤 옷을 입을까요?’라는 검색어를 순위 매겨 데이터화한 자료를 공개했다. 할로윈 데이에 특별한 옷을 입고 싶어하는 이들에게 이는 가볍지만 도움을 주는 자료였다.

사이먼 로저스 구글 뉴스랩 데이터 에디터.

사이먼 로저스 구글 뉴스랩 데이터 에디터.

그는 동성결혼에 대한 검색을 예로 들어 검색이 데이터로 읽히는 과정을 설명했다. 2004년 검색창에 올라온 동성결혼에 관한 질문들은 대부분 반대적인 성향을 띠었다. 검색된 질문의 말투에 따라 다른 색으로 표시했다. 중립적인 질문은 노란색으로, 반대적인 질문은 분홍색, 고무적인 질문은 녹색으로 시각화했다. 꾸준히 검색을 데이터화한 결과, 2015년 동성결혼에 대한 판도는 바뀌어 있었다.

“구글 데이터는 긴밀하다. 파리 테러 사건 당시 몇 시간 안에 얼마나 많은 이들이 ‘Paris is attacked’란 단어로 구글을 통해 뉴스를 검색하는지 알 수 있었다”라고 사이먼 로저스는 말했다. 그는 전통적인 뉴스매체와 달리 전 세계 사람들이 구글을 통해 검색을 하고 뉴스를 본다고 설명했다. 전 세계 가장 많은 이용자를 보유한 구글이기에 가능한 신속한 데이터 속도와 양, 그리고 활용 능력이었다.

블로터아카데미

하나의 검색은 결과적으로 또 다른 검색으로 이어졌다. 미국 대선 후보 관련 검색어들을 경제 데이터와 접목시켜 데이터화했을 때 흥미로운 결과가 나왔다. 공화당 상원의원 테드 크루즈의 경우 ‘총기’, ‘쉐비 트럭’, ‘오일’과 관련된 도식화가 나오는 반면, 도널드 트럼프의 연관 검색어는 ‘아이들의 활동’, ‘미니밴’, ‘게임’등이었다. 이는 미국의 많은 보통의 부모세대들이 트럼프에 관심을 보였다는 뜻으로 해석됐다. “구글은 예측하지 않는다, 다만 서치를 통해 강력한 신호등을 보여준다”라는 사이먼 로저스의 말이 이해가 됐다.

‘위대한 데이터’라는 수식어를 붙여가며 구글 데이터에 관한 설명을 마친 그는, 저널리스트들에게 유용한 도구를 알려줬다. 전 세계 사람들이 가장 많이 검색한 데이터를 확인해 볼 수 있는 ‘이어 인 서치'(Year in search)는 한국어로도 제공되고 있다고 했다. 또한 ‘구글 트렌드‘ 사이트에 들어가면 전문가가 아니더라도 데이터를 내려받아 활용할 수 있다고 귀띔했다. 실제로 인터뷰 도중 구글 트렌드에 들어가 ‘데이터 스토어’에 가보니 많은 사람들이 어떤 데이터를 내려받았는지 손쉽게 볼 수 있었다.

“구글은 중요한 데이터를 많이 가지고 있습니다. 때문에 여러분과 같은 언론인을 통해 데이터가 어떤 의미를 갖는지 의미 부여할 수 있는 중요한 도구라고 생각합니다.”

google_njs_03

그렇다면 저널리즘과 연관성은?

사이먼 로저스가 제시한 구글 데이터의 활용범위는 무궁무진했다. 데이터의 업데이트 속도는 독보적이었고 사용자들의 신뢰도는 높았다. 그는 뉴햄프셔 경선 투표 결과를 보여주며 구글 검색과 실질적 투표 결과 사이에 편차가 거의 없었다고 말했다. 지난 총선, 한국에선 많은 통계 예측 결과가 빗나가 신뢰도를 잃었다. 구글 데이터는 이런 점들을 보안해줄 수 있는 대안책을 보여주는 듯했다.

하지만 저널리즘과의 연관성에 있어선 의문이 들었다. 구글은 왜 유독 뉴스에 관심을 가지고 적극적으로 협업을 하자고 하는 것일까. 구글 뉴스랩에 오기 전 영국 <가디언>을 거친 사이먼 로저스에게 물었다. 당신은 왜 언론인의 길에서 구글을 택했는지.

“저는 지금도 구글에서 일하는 언론인이라 생각합니다. 경이로운 데이터를 가지고 일할 수 있는 기회를 구글에서 받았기에 구글의 손을 잡은 것입니다.” 도구를 제공해주는 구글, 이를 활용하는 것은 저널리스트들의 책임. 결국 저널리스트들의 고민이자 역할이라는 뜻이었다.

google_njs_04

구글에서 제공하는 건 도구와 가능성이었다. 저널리스트가 고민해야 하는 ‘의제 설정’에 관해 어떻게 생각하냐는 질문에 사이먼 로저스는 “구글에 나오는 서치를 보면 사람들은 연예인과 스포츠에 관한 관심만큼 파리 테러, 이민자, 지진등에 관한 문제에도 관심을 갖는다”라고 대답했다. 구글은 데이터 분석한 결과에 기반을 둬야만 대답할 수 있다는 얘기다.

한국 저널리스트들에게 보다 도움이 될 거란 생각에 보다 본질적인 질문을 마지막으로 던졌다. “최대 검색엔진 구글이 아닌 작은 언론사들은 도구가 갖춰져 있지 않은데 어떻게 하면 데이터를 좋게 활용할 수 있을까요?” 그의 대답은 “구글에서 제공되는 무료 도구를 활용하라”였다.