“트위터 분석의 핵심은 키워드와 영향력”

가 +
가 -

트위터는 여론을 품은 광산이다. 모두에게 공개된 트위터 웹(twitter.com)에 오늘 점심 메뉴부터 쓸만한 앱, 드라마, 대학 등록금, 취업걱정, 물가, 선거 예측 등 종합일간지보다 더 다양한 이야기를 나눈다. 화제가 다양한 만큼 작성되는 글도 많다. 트위터 이용자가 하루에 올리는 트윗은 전 세계 1억7천만개, 국내는 300만개 정도다. 국내 이용자 트윗만 해도 한 달에 9천만개다. 트윗은 트위터에 올리는 글을 말한다.

다음소프트트렌드시크라는 서비스를 만들어 트윗을 쪼개고 캐내어 분석한다. 트렌드시크를 통해 다음소프트는 요즘 트위터 이용자들은 어떤 이야기를 많이 나누고 좋아하고 싫어하는 것들은 무엇인지 알아낸다. 블로그 글도 분석자료에 포함되지만, 10%에 불과하다.

다음소프트가 트렌드시크 서비스를 시작한 건 기업 고객을 위해서다. 이용직 다음소프트 이사는 사회 전반에 대한 데이터를 보기엔 트위터가 좋다고 말한다.

“온라인의 중요성이 커지고 사회관계망 서비스(SNS)도 커지기 때문에 당연히 주목해야 합니다. 100명 중 20~30명만 쓴다고 해도 봐야죠. 특히, 트위터는 정보가 가장 빨리 확산되는 곳입니다. 실시간으로 작성되는 트윗을 살펴보면 지금 사람들이 가장 이야기를 많이 나누고 관심을 두는 게 무엇인지가 바로 보입니다.”

트렌드시크의 트위터 분석은 키워드를 뽑아내는 데서 시작한다. ‘임재범’, ‘녹화’, ‘노래’, ‘부른다’, ‘아티스트’, ‘저지’라는 단어로 무엇을 알아낼 수 있는지 살펴보자. 일단 ‘임재범’이란 단어에서 어떤 사람에 대한 이야기라는 것을 알 수 있다. 그리고 ‘녹화’라는 단어로 방송과 관련된 인물, ‘노래-부른다-아티스트’라는 세 단어와 연결하면 가수라는 걸 알 수 있다. 저지라는 키워드에서는 그에게 어떠한 문제가 있다는 추측이 가능하다. 자, 이제 자료로 활용한 트윗 원문을 보자.

이러한 키워드 분석을 위해 다음소프트는 자연어처리 전문가와 언어전문가, 엔지니어, 홍보전문가 등 직원 130명을 두고 있다. 데이터 수집과 분석, 분산처리, 서버관리도 자체 기술을 사용한다.

트위터 키워드 분석 과정을 거치면 특정 주제에 대한 사람들의 생각도 알아낼 수 있다. 휴대폰 제조회사에서 신제품의 카메라 기능을 소비자들이 만족하는지 알고 싶다고 치자. 문제는, 사람들이 ‘나는 A휴대폰 카메라 기능이 좋다’라는 식으로 글을 쓰지 않는다는 데 있다. 대체로 ‘사진 찍어보니 좋더라’ 처럼 ‘카메라’라는 단어를 직접 언급하지 않은 글이 더 많다. 이 문장이 포함된 글에 휴대폰이란 키워드가 있다면 휴대폰의 카메라 기능에 대해 만족한다는 것을 알 수 있다. 이런 내용의 트윗이 많다면 휴대폰 제조회사는 카메라 기능을 강점으로 내세워 마케팅할 수 있게 된다.

트렌드시크에서 ‘소셜커머스’에 대한 사람들의 심리는 어떤지 검색해 나온 화면이다. 각 형용사에 대한 색깔을 통해 부정적으로 생각하는 사람이 많은지, 긍정적으로 생각하는 사람이 많은지도 가늠할 수 있다.

트위터를 통해서 사람들의 생각을 알 수도 있지만, 영향력있는 사람이 누군지 알아내는 일도 어렵잖다. 트렌드시크는 국내 트위터 이용자의 순위를 팔로어 수와 RT 수를 조합해 매긴다. 트위터에서 영향력은 팔로어가 얼마나 많으냐로도 평가할 수 있지만, 그 사람이 쓴 글이 얼마나 많은 사람이 보느냐로 어림잡기도 한다. 트렌드시크의 ‘트위터랭킹’에서 부동의 1위는 이외수 작가다. 팔로어도 많지만, 이외수 작가의 글은 리트윗이 많이 된다. 팔로잉하지 않는 사람에게도 자신의 글을 보일 만큼의 영향력은 신문과 방송에 비교하면 이해하기 쉽다. 직접 뉴스를 보거나 기사를 읽지 않아도 그 내용을 많은 사람이 안다면 그 매체는 충분히 영향력이 있다. 트위터에서의 영향력도 이와 비슷하다.

키워드와 영향력을 분석하면 특정 주제에서 영향력이 있는 사람을 찾아낼 수도 있다. 트렌드시크는 키워드에 따라 이용자 순위를 공개하는 ‘소셜랭킹’을 서비스하고 있다. 막걸리를 좋아하고 자세히 알고 싶다고 치자. 멋진 안주가 있는 막걸리바, 지역 특산물로 만든 막걸리 등 궁금한 게 많지만, 주위 친구들은 잘 알지 못한다. 이럴 때 ‘소셜랭킹’을 이용해 막걸리에 대해 이야기를 많이 하고 영향력이 큰 인물을 찾으면 원하는 답을 얻을 수 있다.

트렌드시크에서 특정 키워드에 대한 영향력있는 블로거와 트위터 이용자를 확인할 수도 있다.

“지식iN은 글을 올리면 누가 답변을 써줄 지 모릅니다. 트위터에서는 내가 원하는 사람에게 물어볼 수 있습니다. 내가 궁금한 키워드에 대해서 가장 잘 아는 사람에게 묻는다면 더 좋겠지요.” 이용직 이사는 소셜랭킹을 일반 이용자에게도 공개할 예정이라며 네트워크 분석을 다음소프트가 앞으로 나아가야 할 방향이라고 꼽았다. “우리는 사람들간의 네트워크를 뽑아내고 싶습니다. 내 주위에 어떤 글과 키워드, 관심사가 있는지 본인도 모르기도 합니다. 이걸 분석하면 간단하게는 트위터 이용자에게 관심사가 비슷한 사람을 추천할 수도 있습니다.” 현재로선 소셜랭킹이 네트워크 분석의 기초 단계다.

다음소프트가 트렌드시크 웹사이트를 일반에도 공개한 건 기업 고객에게 맛보기 서비스를 보여주고 싶어서다. 트위터와 블로그를 바탕으로 어떤 의미있는 분석이 나오는지, 어떻게 활용할 지 알려주는 용도였는데, 생각보다 이용자 반응이 좋다. 트래픽과 방문자수 등을 공개하진 않았지만, 이용직 이사는 “앞으로 트렌드시크를 B2C로 확대해 6월에 개편할 예정”이라고 말했다.