뉴욕타임즈, CCL 채택…”기사 맘대로 퍼가라”

가 +
가 -

new_york_times_logo

<뉴욕타임즈>가 큰 사고를 쳤다. 핵심 자산인 알짜 기사들을 온라인으로 공개하겠단다. 돈은 한 푼도 안 받는다. 누구든 가져다가 상업 용도로 써도 좋다. 조건은 하나다. 출처가 ‘뉴욕타임즈’임을 밝히기만 하면 된다. 150년동안 권위를 유지해 온 전통 신문사임을 감안하면 고개가 갸웃거려진다.

사연은 이렇다. 대개 신문사가 웹에 기사를 올릴 때를 떠올려보자. 특정 주제에 관한 기사를 올리면서 연관 기사들이 모여 있는 자사 기사 페이지를 링크로 걸곤 한다. ‘관련기사’란 이름으로 한두 개 링크할 때도 있지만, 해당 키워드가 모인 페이지 전체를 걸어두기도 한다.

예컨대 <블로터닷넷>에서 ‘윈도우7’ 기사를 올리면서 MS 관련기사를 모아둔 링크(http://www.bloter.net/archives/tag/MS)를 한꺼번에 걸어줄 수 있다. 독자는 ‘윈도우7’에 관한 기사를 읽은 뒤, MS 기사 모둠 페이지 링크를 눌러 관심 있는 기사를 더 읽으면 된다. 이렇게 특정 주제 아래 관련기사를 모아두는 일은 신문사 입장에선 중요한 자산이자 공이 드는 작업이다. 쓸 만한 기사 데이터가 오랜 기간동안 쌓일 수록 기사 모둠 페이지 가치도 더 커진다.

<뉴욕타임즈>는 이런 기사 모둠 페이지를 ‘토픽‘이란 이름으로 제공하고 있다. 2009년 11월 현재 <뉴욕타임즈> 토픽에는 3만여개 키워드가 등록돼 있다.

<뉴욕타임즈>는 10월29일(현지시각) 이 토픽 페이지를 공개했다. ‘링크드 오픈 데이터‘(Linked Open Data)란 프로젝트다.

주목할 것은, 이들 링크가 단순히 <뉴욕타임즈> 웹사이트 울타리 안에 갇혀 있지 않다는 게다. 지금껏 <뉴욕타임즈>가 올린 기사에 포함되지 않은 다양한 외부 정보들을 자유롭게 연동해 쓸 수 있다는 게 이번 프로젝트의 핵심 가치다. 이를 위해 지난 몇 달동안 프리베이스DB피디아 등 정보수집 사이트와 <뉴욕타임즈> 인물 정보를 일일이 수작업으로 엮었다.

<뉴욕타임즈>는 첫 단계로 5천여개 인물 정보를 우선 공개했다. 데이터는 친숙한 웹페이지 방식인 ‘HTML‘과, 시맨틱 웹에 적합한 ‘RDF‘ 두 가지 형태로 제공된다. 기사 검색 API뉴욕타임즈 개발자 네트워크를 통해 공개했다.

공개된 데이터에는 ‘저작자표시‘(BY)의 CCL 조건을 붙였다. 요컨대 출처만 밝히면 이들 데이터를 가져다 어떤 용도로든 조건 없이 사용할 수 있다는 얘기다.

<뉴욕타임즈>는 링크로 촘촘히 얽힌 거대한 정보 덩어리를 조건없이 웹으로 풀었다. 정보를 가둬놓는 대신 더 넓은 바다에 풀어줌으로써 이용 가치를 높였다. 손해볼 짓 같지만 그렇지 않다. <뉴욕타임즈>는 자사 기사들을 웹에 널린 더 많은 정보들에 촘촘히 엮고 얽었다. 망망대해 웹에서 정보를 찾아 돌아다니는 누리꾼들이 이들 링크를 타고 <뉴욕타임즈>를 두드릴 기회도 더 넓어졌다.

[youtube ZYmNuIlBlB0]

네티즌의견(총 0개)