트위터 어노테이션과 시맨틱 웹

가 +
가 -

최근 런던의 한 행사에서 트위터(twitter.com)의 한 엔지니어가 트위터가 준비 중인 새 기능인 어노테이션(annotation)에 대한 소개를 했다. 어노테이션의 기본 컨셉은 트위터의 각 트윗 속에 어떤 특정한 사물이나 사람, 혹은 장소 등에 관한 정보를 첨가할 수 있게 한다는 것이다. 이를 위해 현재 140자 제한을 두고 있는 트윗 하나의 크기도 512byte, 그리고 점진적으로 2KB까지 키우겠다는 것이다. 아, 물론 그렇다고 해서 140자 제한이 풀린다는 말은 전혀 아니다. 우리가 입력창에 집어넣거나 육안으로 확인할 수 있는 트윗의 글자수 제한은 변함이 없을 것이다. 다만, ‘보이지 않는 부분’에 추가가 된다는 말일 뿐.

물론 지금도 하나의 트윗 속에는 URL이나 해시태그, 멘션, 또는 위치정보 등 많은 부가적인 정보들이 따라붙기 때문에 트윗 속에 소위 ‘시맨틱(semantic)’한 데이터들을 첨부하겠다는 어노테이션이란 발상이 썩 그렇게 색다르게 다가오지 않을 수도 있겠다. 이런 기능이라면 우리나라의 미투데이(me2day) 같은 서비스에서는 이미 오래 전부터 제공해 오고 있는 기능 아니냐고. 맞다.

문 제는 그 속에 들어가는 데이터가 무엇이냐 하는 것이다. 그 속에 들어가는 데이터들이 그저 단순한 정보들이 아니라 시맨틱 웹의 표준을 따르는 데이터들이라면? 그리고 그 데이터들이 (웹 페이지 상에서는) RDFa 같은 형식으로 엮여서 함께 표시된다면?

그 러면 이제 소통의 중심에 서 있던 사람들의 독립된 재잘거림(트윗)은 어느 특정 리소스에 묶인 속성값 하나로 전락하는 신세가 된다. 물론 육안으로는 전혀 차이를 느낄 수 없다. 그렇지만 적어도 검색엔진이나 기계(machine)의 입장에서는 그렇단 말이다. 보이지 않는 것이 중심에 서는 세상. 바로 시맨틱 웹 세상이다.

올 봄 국내의 어느 실시간 웹 컨퍼런스에서 발표자 한 분이 실시간 검색에 대해 얘기하면서 “실시간 검색의 가치는 대화 자체가 아니라 그 대상이다“라고 했던 말을 기억한다. 이미 누군가는 벌써 트위터의 스트리밍(streamming)과 어노테이션을 결합하여 실시간 시맨틱 웹의 아이디어를 내놓기도 하였다.

아직 ‘그 속‘에 어떤 데이터가 들어가게 될지는 아무도 모른다. 어쩌면 트위터 저 자신도 모를 것이다. 그리고 512byte라는 메시지 크기 속에 얼마나 많은 데이터가 담길지도 아직은 의문이다. 그렇지만 적어도 시맨틱 데이터들이 그 자리를 차지하고 ‘sameAs’ 같은 필드들이 떡하니 한 자리 잡을 것 같다는 생각은 지울 수 없다. 내가 트위터 어노테이션을 기대하는 이유이기도 하다.

▲사진 : http://www.flickr.com/photos/13194817@N00/4142887433. CC BY.