[톡!소셜분석] 다음소프트 “데이터에서 의미 찾기”

가 +
가 -

총선과 대선을 앞두고 민심을 읽는 도구로 사회관계망 서비스(SNS)가 적극 활용되고 있다. 트위터 페이스북, 미트데이 같은 SNS를 분석하면 사회 동향을 좀 더 자연스럽게 파악할 수 있기 때문이다. 검색 솔루션 업체부터 이동통신 업체에 이르기까지 다양한 업체들이 소셜분석 솔루션을 출시하고 있다. 여기에 빅데이터 분석도 가세하면서 국내 시장은 소셜분석 춘추전국시대를 방불케 한다. 업계 관계자들은 소셜분석과 빅데이터 분석에 대해 어떻게 바라볼까. 블로터닷넷이 잇따라 만나 들어볼 생각이다.

빅데이터를 정의할 때 빠지지 않는 설명이 있다. 3V로 대두되는 크기(Volume), 속도(Velocity), 다양성(Variety)이다. SNS에서 발생하는 소셜 데이터도 이 3가지 요소를 갖고 있다는 점에서 빅데이터로 분류된다. 그 덕에 얼마나 많은 소셜 데이터를 빨리 분석하는지의 여부가 소셜분석 경쟁력으로 자리잡았다. 얼마나 오랫동안 데이터를 수집했는지, 얼마나 많은 데이터를 한 번에 분석하는지, 분석 결과를 얼마나 빠른 시간 내에 내놓는지가 기준이다.

이런 기준에 대해 다음소프트는 조용히 반기를 들었다. 송길영 다음소프트 부사장은 “광산을 얘기할 때, 광산의 크기와 규모에 대해 물어보지 않는다”라며 “매장량이 중요하다”라고 강조했다. 그는 “어느 순간부터 주객이 전도돼 데이터를 처리하는 방법에만 시장이 흘러가고 있는데, 이는 바람직하지 않다”라고 지적했다.

소셜 분석에 있어 데이터 양, 크기, 속도도 중요하지만 가장 중요한것은 소셜 데이터로부터 무엇을 얻을 것인지가 생각하는 게 우선이라는 것이다. 데이터를 분석하는 기술도 중요하지만 그 못지않게 어떤 데이터가 숨겨져 있는지 찾아내고, 그 의미를 찾아내는 게 소셜분석의 핵심 가치다. 그 덕에 다음소프트는 경쟁 소셜분석 업체들과는 다르게 검색 기술과 동시에 데이터 해석 능력을 중요하게 여겨 별도의 데이터 분석팀을 조직해 운영하고 있다. 송길영 부사장 중심으로 한 이 조직은 소셜 데이터에서 어떤 데이터가 가치 있는지를 분석하고 연구하는 일을 담당한다.

“다음소프트에서 엄마 역할을 담당하고 있다고 할까요. 아빠 역할로 불리는 윤준태 부사장이 개발한 분석 알고리즘과 검색 기술을 바탕으로 정밀하게 소셜데이터를 뽑아내면 제가 이를 잘 가공해서 고객이 보기 좋은 데이터 형태로 만드는 식이죠.”

송길영 부사장과 윤준태 부사장 모두 다음소프트 창립때부터 함께했다. 송길영 부사장이 마케팅쪽을, 윤준태 부사장은 기술쪽을 맡았다.

그래서일까, 소셜분석에 사용되는 검색 기술에 대해서 윤준태 부사장은 전문적인 지식을 자랑했다. 데이터 처리에 대한 고민도 상당했다. 빅데이터로 표현되는 소셜 데이터 처리를 위해 하둡으로 데이터 처리 시스템을 구축했고, 최근에는 몽고DB를 활용해 시스템 전면 개편에 나서고 있는 중이다. 보다 많은 데이터를 효과적으로 처리하기 위한 방법을 몸소 찾아서 사내 시스템에 도입해보고 있는 것이다.

그렇다고 윤준태 부사장이 검색 기술 개발을 소흘히 한 것도 아니다. 웹사이트에서 그의 이름을 검색하면, 그가 발표한 검색엔진 기술 논문이 등장한다. 윤준태 부사장은 지금도 검색기술 관련 논문을 발표하면서 연구자로도 활발하게 활동중이다. 소셜분석에 사용되는 분석 기술과 과거 분석 기술 간 차이에 대해 윤준태 부사장은 “의미분석, 텍스트마이닝 같은 기술은 검색엔진 업체라면 다 갖고 있을뿐더러, 소셜분석업체라면 다 알고 있는 기술로 기술적인 측면에서만 살펴보면 특이한 점은 없다”라고 설명했다.

과거에도 게시판이나 댓글을 분석할 때도 위와 같은 기술을 사용해 분석했다는 것이다. 다만 소셜분석 시대가 되어 다른 점이 있다면, 이 기술들이 좀 더 정확성을 갖추고 발전했을 뿐이란다. 이 말은 소셜분석 경쟁력이 단순히 검색 기술에만 달려 있는 게 아니라는 식으로도 이해될 수 있다. 이에 대해 윤준태 부사장은 “지금과 다른 점이 있다면, 그 데이터 속에서 어떻게 의미를 만들어내고 가치를 부여하는지 여부가 업체별 경쟁력의 핵심”이라며 “하루 트윗이 얼마나 나왔고, 영향력 있는 사람이 누군지 찾아내고 하는 일은 소셜분석에서 크게 중요한 부문이 아니며, SNS에 올라온 메시지에 진의를 찾아내는 게 훨씬 더 중요하다고 생각한다”라고 말했다. 모니터링보다는 해석이, 사람 간 관계를 파악하는 것보다는 SNS 문맥의 의미를 따지는 게 더 중요하다고 본 것이다.

이런 생각은 다음소프트의 소셜분석 솔루션인 ‘소셜메트릭스‘에 녹아들어 있다. 경쟁 업체들처럼 소셜 모니터링이나 사회관계망 분석보다는 단어 의미를 파악하는 문맥 중심의 소셜분석 기능을 선보이는 게 특징이다. 단순히 데이터를 뽑아내서 열거하기보다는, 텍스트 마이닝 작업을 통해 각 데이터가 어디서 시작됐는지, 왜 나왔는지를 추적해서 사용자에게 보여주는 식이다.

예를 들어 소셜상에서 아이폰에 대해 어떤 이야기가 나오고 있는지, 그 아이폰과 함께 자주 얘기 나오는 화제는 무엇인지, 아이폰과 관련돼 시간에 따라 어떤 주제가 나오는지를 보여주는데 집중했다. 아이폰을 둘러싼 트윗 메시지 수와 리트윗 수보다는 ‘아이폰’이라는 단어 그 자체의 화제 흐름도를 사용자에게 보여줬다.

다음소프트는 관계망 분석보다는 문맥 중심으로 소셜메트릭스를 발전시켜 나갈 계획이다. 이유는 간단하다. 관계망 분석은 시간과 돈이 많이 들어가는 것에 비해 기업이 원하는 가치를 파악하기 어렵지만, 문맥 분석은 보다 쉽게 기업이 원하고자 하는 분석 결과를 제공해 줄 수 있다는 점에서다.

“SNS에서 트윗 메시지 전파력이 높은 사람을 찾아내서 그 사람에게 집중한 특정 브랜드 마케팅 전략을 펼친다는 것은 상당히 어려운 일입니다. 브랜드 이미지를 확산시키기 위해서는 좋을 수 있지만, 이런 식으로 일방적으로 전달된 메시지에 사용자가 반응하기는 어려울 것이라고 생각합니다. 그래서 당연히 문맥을 중심으로 한 소셜 분석 서비스를 계속해서 선보일 계획입니다.”

송길영 부사장은 언어처리 분야에서 쌓아왔던 지식을 바탕으로 분석 서비스를 내놓겠다는 심산이다. 현재 다음소프트내 박사급 연구인력만 해도 10여명 이상이다.

윤준태 부사장은 “다음소프트는 크롤링, 데이터 수집과 정제, 언어처리, 텍스트 마이닝, 저장 구조 같은 기술을 다 갖고 있다”라며 “앞으로는 이런 처리쪽 기술 외에 고객에게 전달하는 ‘시각화’ 쪽 부문이 중요해질 것으로 판단해, 여기에 역량을 집중하고 있다”라고 설명했다.

다음소프트는 하둡을 중심으로 빅데이터 어플라이언스를 선보이는 업체들이나 외국계 분석 솔루션 업체들을 크게 신경쓰지 않는 눈치다. 이에 대해 윤준태 부사장은 “한글 중심의 언어처리에 기술력을 쌓고 있기 때문에 단기간에 외국계 회사들이 분석시장을 점령할 것으로 생각되지 않는다”라고 밝혔다. 분석이라는 것은 한 언어에 대한 체계적인 연구가 있어야 이뤄지는 일이기 때문이다.

하둡 얘기가 나오자 갑자기 다음소프트가 빅데이터 분석 업체로 불리는 것에 대해 억울하다는 송길영 부사장의 하소연이 이어졌다. 한 방송프로그램에 출연하면서 다음소프트를 수식하는 어구 중 하나로 빅데이터가 등장했는데, 자신들은 빅데이터 분석 업체로 남고 싶지 않다는 얘기였다. “빅데이터는 정말 한때입니다. 마케팅 용어라고 봐도 무방하지요. 저희는 소셜분석 업체로 남고 싶습니다. 동영상과 이미지 같은 비정형 데이터를 처리하는 영역은 저희 전문분야가 아닙니다.”

소셜데이터가 빅데이터일 순 있지만, 빅데이터와 소셜데이터가 갖고 있는 공통점은 ‘대용량’이라는 점 외에 없다고 윤준태 부사장은 덧붙였다. 세상에는 빅데이터라고 볼 수 있는 수많은 데이터가 있는데, 그 중 교집합을 이루고 있는 소셜데이터를 빅데이터로 볼 필요는 없다는 지적도 함께였다. “물론 사람들의 메시지에 관심이 있기는 합니다. 하지만 이게 빅데이터를 대표하는 건 아니지요. 앞으로 사람들 메시지 간 상호 연관관계를 찾아내는 정보 파악에 더 집중하고 싶습니다.”