[톡!소셜분석] 사이람 "복잡성을 분석하라"

발행일 2012-05-02 11:22:28
총선과 대선을 앞두고 민심을 읽는 도구로 사회관계망 서비스(SNS)가 적극 활용되고 있다. 트위터, 페이스북, 미투데이 같은 SNS를 분석하면 사회 동향을 좀 더 자연스럽게 파악할 수 있기 때문이다. 검색 솔루션 업체부터 이동통신 업체에 이르기까지 다양한 업체들이 소셜분석 솔루션을 출시하고 있다. 여기에 빅데이터 분석도 가세하면서 국내 시장은 소셜분석 춘추전국시대를 방불케 한다. 업계 관계자들은 소셜분석과 빅데이터 분석에 대해 어떻게 바라볼까. 블로터닷넷이 잇따라 만나 들어볼 생각이다.

"여전히 대부분의 기업들은 어떻게 소셜분석 솔루션을 활용해야 하는지 모르고 있습니다. 빅데이터가 뜨자 각종 소셜분석 업체들이 등장했습니다. 소셜분석 솔루션도 늘어났지요. 하지만 소셜분석 솔루션을 접한 기업들은 하나같이 '그래서 뭐 어쩌라고'라는 말을 반복합니다. 제대로 SNS 데이터를 파악하고 활용하기 위해선 각 데이터들을 이해하는 작업이 중요합니다."



송슬기 사이람 응용컨설팅팀 주임 컨설턴트의 말은 간단하다. 데이터에 대한 정확한 이해가 있어야 호기심도 생기고, 이를 바탕으로 데이터를 마케팅에 적용할 수 있는데, 대부분의 기업들이 무조건 솔루션에 의존하려다보니 현재 비슷한 문제에 부딪히고 있다는 지적이다. 빅데이터와 소셜분석 솔루션 시장이 유행하듯이 떴지만, 이를 제대로 활용하는 기업은 드물다는 얘기다. 제조업체들이 빅데이터 분석 사례로 해외 기업을 언급한 적은 많아도, 국내 기업이 빅데이터와 소셜분석을 통해 득을 봤다고 발표한 사례는 찾기 힘들다.

트위터, 페이스북, 미투데이 같은 SNS 서비스만 '소셜'을 의미하는 건 아니다. 사람이 있는 곳이라면 관계가 있기 마련이다. 이런 소셜 네트워크 학문은 1960년부터 등장했다. 사이람은 10년 넘게 '소셜 네트워크'라는 사람과 사람, 기업과 기업 간 관계를 파악하고 분석했다. 그래서인지 SNS 데이터, 소셜 데이터, 빅데이터를 구분하는 기준이 비교적 명확하다. "저희는 소셜분석이라는 말을 쉽게 사용하지 않습니다. 소셜이 포함한 범위를 '사회'로 보기 때문입니다. 사람이 있고, 사회가 존재하기에 여기서 발생하는 데이터를 분석하는 것, 이를 소셜 네트워크 분석이라고 생각합니다."

사이람은 다른 소셜분석 업체들과는 다르게 '소셜'을 정의하고 있다. 관계를 나타낼 수 있는 모든 수단을 '소셜'로 표현했다. 자사 솔루션도 당연히 SNS 분석에만 초점을 맞춘 게 아니라 '관계'를 파악할 수 있는 기술에 집중돼 있다. 단순히 트윗 메시지를 분석해서 통계화 하고, 트윗 메시지에 담긴 단어를 분석하는 게 아니라 그 메시지가 나온 상황, 그 메시지를 작성한 사람을 바탕으로 분석한다.

"기업 내부에서 발생하는 인사 관리 기록도, 증권 거래 기록도 모든 소셜 네트워크 분석이라고 할 수 있습니다. 결국 소셜 네트워크 데이터 분석은 두 개체간 관계를 분석하는 작업을 말합니다. 아마존이 고객 구입 이력을 조회해서 또 다른 상품을 추천하는 맞춤 서비스도 소셜 네트워크 데이터를 분석했기 때문입니다. 고객의 구매 내역과 그 제품을 구매한 사람들의 공통점, 이 모든 관계를 분석했기 때문에 가능한 일이라고 봅니다." 사이람은 SNS만으로 소셜분석 전체를 바라보기에는 소셜분석 범위가 훨씬 크다고 바라봤다.

빅데이터에 대한 생각도 뚜렷하다. 송슬기 주임 컨설턴트는 단순히 크기와 양으로 빅데이터를 대표하기에는 무리가 있다고 지적했다. 크기, 속도, 다양성이 빅데이터를 설명하는 것은 맞지만 이 외 복잡성(Complex)라는 요소가 포함돼야 진정한 빅데이터라고 볼 수 있다고 한다. 제조업체들이 빅데이터의 시대가 왔다며 더 많은 데이터를 보관하고 저장할 수 있는 장비를 구입해야 한다고 기업들을 설득하는 점을 꼬집은 셈이다.

"빅데이터가 단순히 데이터 보관과 관리를 얘기하는 건 아닙니다. 빅데이터를 양으로 봤다면, 지금 장비로도 충분히 SNS에서 발생하는 데이터를 분석할 수 있습니다." 사이람은 SNS분석을 위해 트위터가 국내에 상륙했을 때부터 한글 트윗을 수집했다. 사이람이 하루에 수집하고 처리하는 한글 트윗이 평균 300만 건이다. "한달에 약 1억건에 데이터를 처리하는데도 기존 데이터베이스 관리 솔루션(DBMS)로도 충분합니다. 빅데이터를 얘기할 때 저장 개념이 지금은 필요하지 않습니다. 앞으로 데이터가 더 많아질 가능성을 고려해야 하긴 하지만, 빅데이터가 말하고자 하는 것은 크기와 양이 아니라고 생각합니다."

사이람이 빅데이터를 정의할 때 중요하다고 생각한 요소는 바로 복잡성(Complex)이다. 3V로 대표되는 크기, 속도, 다양성 못지 않게 각 데이터들 간 관계와 이 관계에서 발생하는 복잡도가 중요하다는 것이다. 사이트 방문자 수가 과거와 비교하지 못할 정도로 엄청나게 늘었다고 해서 빅데이터라고 볼 수 없다. 늘어난 방문자 수가 사이트 내 체류 시간, 사이트에 접근한 위치와 결합해 '특정 이용자는 언제, 어디서 주로 우리 사이트에 접속해 일을 한다'라는 결론을 만들어 데이터의 복잡도가 커져야 빅데이터라고 볼 수 있단 얘기다. 양 못지 않게 밀도가 중요하다고 강조한 셈이다.

이런 생각을 바탕으로 현재 사이람은 SNS 분석 솔루션 '소피언'을 준비중이다. 기업들이 더 이상 소셜분석 자료를 보고 '그래서, 어쩌라고'라는 말이 나오지 않게 준비를 기울였다. "데이터를 찾아내는 것 못지않게 발생한 데이터가 '왜' 나왔는지를 기업 마케팅 담당자들에게 알려주는 게 중요합니다. '왜'를 파악하면 데이터가 발생한 상황을 파악해서 이야기를 만들어낼 수 있습니다. 이런 솔루션들이 많이 나오면 국내 시장에서도 빅데이터든 아니든 재미난 분석 시장이 열리지 않을까 싶습니다."

함께 보면 좋은 뉴스

댓글

(0)
※ 댓글 작성시 상대방에 대한 배려와 책임을 담아 깨끗한 댓글 환경에 동참에 주세요. 0 / 300
뉴스레터
최신 IT 소식을 가장 빠르게 받아보세요.
(광고성 정보가 포함될 수 있습니다.)