[블로터포럼] SNS 여론 꿰뚫는 ‘소셜분석’ 세계

각 기업의 마케팅 도구로 트위터, 페이스북, 미투데이 같은 사회관계망 서비스(SNS)를 적극 활용하기 시작했다. 신문이나 TV 등을 통한 전통적인 마케팅과 비교해 효과를 빨리 볼 수 있다는 점, 비교적 적은 비용을 투입해 큰 효과를 누릴 수 있다는 점에서 기업들은 SNS 마케팅을 선호했다.

이런 SNS 마케팅 붐이 일자 각광받는 시장이 생겨났다. SNS 분석이다. 기업들은 SNS를 통한 마케팅이 실제로 효과를 보고 있는지 궁금해했고, 이를 객관적인 수치로 살펴보길 원했다. 설문조사, 전화조사 같은 기존 방식을 통해서도 확인이 가능했지만 이는 설문 대상도 한정적일 뿐더러 시간과 비용이 많이 소모된다. 이에 반해 SNS 분석은 조사에 걸리는 시간과 비용 대비 설문 대상이 광범위하다.

기업의 이런 수요에 맞춰 SNS를 분석하겠다고 나선 업체들이 있다. 국내에서는 코난테크놀로지, 다음소프트, 와이즈넛, 오픈SNS 등이 뛰어들었다. SNS 속 키워드 모니터링부터 선호도 조사까지 다양한 소셜분석 솔루션들이 등장했다.

문제는 이 다음부터 시작된다. SNS를 이용해 키워드를 모니터링하고, 단어의 호불호를 따져서 선호도를 조사하는 건 이전에도 있었다. 굳이 SNS가 아니더라도 뉴스나 까페, 블로그, 댓글 등을 통해서도 이를 분석하는 시장이 있었다. 설문조사를 통해서도 선호도 조사가 가능했다.

이렇게 보면 기업들이 새삼 소셜분석에 열광할 이유는 없어 보인다. 그저 조사 대상이 SNS가 됐을 뿐이다. 그럼에도 불구하고 소셜분석에 대한 관심은 뜨겁다. 새로운 소셜분석 솔루션이 계속해서 등장하고 있으며, 이 시장에 뛰어드는 업체들도 늘어나고 있다.

이유가 있다. 기존 분석과는 다른 분석을 소셜분석이 내놓을 거라는 기대감 때문이다. 다이아몬드도 가공하기 전까지는 돌덩어리에 그치지 않는다. 소셜분석도 아직은 어떤 어떤 분석을 해야 할 지 모르기 때문에 기존 분석 시장과 다를 바 없어보이지만, 향후 달라질 수 있다는 것이다.

블로터닷넷도 지난 9월 창간5주년을 기념해 ‘트위터분석’을 선보이면서 같은 경험을 한 적 있다. 소셜분석을 하겠다고 나섰지만, 정작 소셜분석이 무엇인지, 어떻게 해야 하는지, 어디까지 분석 가능한지 미처 파악하지 못했다. 그러다보니 욕심껏 분석 결과를 내놓지 못하는 한계에 부딪히기도 했다.

지금 기업들도 다를 바 없어보인다. 이번 블로터포럼에서는 소셜분석 서비스 관계자들을 초대해 소셜분석이 무엇인지, 소셜분석으로는 무엇을 할 수 있는지, 소셜분석의 가치는 무엇인지 등을 들어봤다.

  • 일시 : 2011년 10월6일(목) 오후 4시~6시
  • 장소 : SAS 회의실
  • 참가자 : 강정수 뮤즈얼라이브 전략담당 겸 연세대학교 커뮤니케이션 연구소 전문 연구원, 구방본 SAS 부장, 김태현 유저스토리랩 부사장, 이전행 그루터 미디어랩 이사, 도안구 블로터닷넷 미디어 랩장, 이지영 블로터닷넷 기자

도안구 : 블로터닷넷도 창간특집으로 ‘소셜분석’을 해봤다. 처음 하다보니 분석 진행과정에서 어려움이 많았다. 소셜분석으로 무엇을 분석해야 할 지, 질문은 무엇으로 정해야 할 지 많이 고민했다. 그래서 이번 포럼을 준비했는데, 우선 모이신 분들께 묻고 싶다. 소셜분석이란 정말 무엇인가.

구방본 : 통상 말하는 분석과는 조금 다르게 얘기한다면, 인터넷을 통해 우리가 사는 모든 세상을 다 들여다 볼 수 있는게 바로 소셜분석이라고 생각한다.

강정수 : 전통적으로 웹분석과 시장 조사가 있었는데 이게 결합돼 소셜분석이 나왔다고 생각한다.

소셜분석은 소비자가 어떤걸 좋아하고 무엇을 선호하는지 추적하고 분석해서 행위를 구조화하는게 가능하다. 이 구조화된 행위에 의미를 부여하고 선호도를 조사하는게 바로 소셜분석의 핵심이 아닐까 생각한다.

과거에는 웹상에서 분석을 하려면 페이지뷰가 얼마나 나오고, 그 페이지에 얼마나 오래 있었는지 등을 조사했다. 이런 수치야말로 객관적으로 조사가 가능했기 때문이다. 그러나 페이스북과 유투브 등의 확대로 소비자들의 사소한 행위는 점차 분석 가능한 데이터 영역에 들어오기 시작했다고 본다. 데이터 영역에 들어왔기 때문에 이를 바탕으로 구조화해서 해석하는게 가능해졌다. 소셜분석은 이게 더 발전된 형태다.

이전행 : 앞에서 말씀하신 분들과 비슷하면서도 약간 달리 생각해봤다. 소셜분석은 소셜네트워크가 문화적 플랫폼으로 자리잡으면서 등장했다고 생각한다. 서로 소통하는 커뮤니케이션들이 분석 가능한 형태로 등장하기 시작하면서, 소셜분석이 나왔다. 아직 한국은 문화적 플랫폼 수준까진 오진 않았지만, 이미 해외는 문화적 플랫폼으로 SNS가 활용되고 있다.

김태현 : 소셜이란 부분이 예전에는 검색이라는 영역에 들어오기 힘들었다. 140자 단문을 활용하는 트위터와 다르게 까페나 블로그 등 예전에는 글을 쓰려면 상당히 긴 글을 써야 했다. 그리고 이들 까페나 블로그 등이 항상 공개돼 있는 것은 아니다보니 더욱 분석하기 힘들었다.

이제는 트위터가 등장하면서 누구나 볼 수 있는 짧은 글을 웹에 올리는게 가능해졌고, 이게 검색이 되기 시작하면서 소셜분석의 토대가 된 게 아닌가 싶다. 소셜분석을 토대로 이젠 사람들 관계에 영향을 미치는지 여부 등을 분석할 수 있게 됐다.

도안구 : 소셜분석이 대략 무엇을 의미하는지 알겠다. 그렇다면 왜 기업들이 관심있어 하는지, 소셜분석 중 어떤 것에 대해 관심있어 하는지를 알고 싶다. SAS는 원래 데이터마이닝 등 분석 관련한 솔루션을 많이 갖고 있고, 유저스토리랩은 트윗믹스 등을 통해 트위터 분석을 서비스하는 걸로 안다. 기업들이 무엇을 분석해 달라고 하는가.

구방본 : 소셜분석에 대해 기업들이 최근 관심을 많이 기울이고 있는 것은 사실이다. 소셜분석 결과를 기업 목적에 활용하려다보니 더욱 궁금해하는 것 같다. 게다가 기업은 이윤추구를 고려해야 하니, 어떻게 하면 마케팅 비용은 줄이면서 매출은 늘릴 수 있는지를 많이 고민한다. 그래서 계속해서 피드백을 받고 싶어하는데, SNS가 대안으로 등장했다. 많은 소비자들이 인터넷에서 자신의 감정을 표출하기 시작했다. 예전에는 이 표출된 감정을 분석할 방법이 많이 없었는데 자연어 처리 기술이 발달하면서 빅데이터를 활용해 분석하다보니 기업들이 소셜분석에 적극적인 것 같다.

예를들어 모바일 분야의 경우 제품 주기가 굉장히 짧다고 한다. 제품의 히트 여부가 3개월 안에 결정난다고 한다. 그래서 고객불만 등을 단기간에 처리하면 반응이 좋아져서 제품이 성공한다고 한다. 소셜분석을 활용하면 시중의 이런 반응에 대해서 적극적으로 파악할 수 있게 되기 때문에 기업들이 적극적으로 소셜분석을 활용하려는게 아닐까 싶다.

도안구 : 트윗믹스도 서비스를 시작한 지 1년이 넘었다. 직접 서비스 하는 입장에서 반응의 변화를 지켜봤을 텐데, 어떤가?

김태현 : 어려운 질문이다. 우리가 봤을 때 하루에 한국어 트윗이 300만건, 링크가 걸린 트윗은 25만건이 등장한다. 하루에 트위터상에서 굉장히 많은 이야기가 쏟아지는 것이다.

우리는 트윗믹스를 통해 기존 검색을 넘어서고 싶었다. 실시간 검색을 통해 보면 알 듯이 가십성이 많다. 트위터에서는 단순 검색과 다르게 좀 더 적극적인 행위를 보인다. 이를 분석하면 실제로 사람들이 어떤 내용에 대해서 관심을 가지고 있는지가 드러난다.

검색만으로는 무엇이 많은 사람들 화제에 오르고 있는지 알 수 있지만, 왜 오르고 있는지, 누가 그 화제에 관심이 많은지는 파악이 힘들다. 트위터를 통해서 조금 더 분석하면 실제로 사람들이 어떤 내용에 관심을 가지고 있고, 왜 그 이야기에 신경을 쓰고 있는지를 알 수 있다.

특히 트윗에 링크를 걸어 리트윗한 경우 굉장히 적극적으로 관심을 표현하는 경우라고 생각한다. 이런 행동에는 의미가 충분히 있기 때문이다. 트윗믹스는 이런 생각에서 출발해서 지금까지 약 1년반 동안 하루에 실시간 인기있는 트윗을 내보내고 있다. 어떤 뉴스가 트위터에서 인기가 많은지 링크가 포함된 트윗을 통해 분석한다. 이 과정에서 기술적으로 힘들었던 부분도 있다. 워낙 많은 짧은 링크들 포함된 트윗이 많고 돌아다녀서, 이걸 다 풀어 원문 링크가 뭔지 알아내고 다시 통계를 내는 작업이 힘들었다. 사실 트윗믹스에선 이걸 다 잡아내는 게 핵심이다. 이것만 잘 진행해도 사람들이 웹상에서 관심있어 하는건 다 알아낼 수 있다고 생각한다.

도안구 : 소셜분석하면 빠질 수 없는게 바로 빅데이터다. 빅데이터 얘기가 많이 나오고 있는데 그루터는 소셜분석과 연관해서 빅데이터 흐름을 어떻게 보는가.

이전행 : 빅데이터를 소셜 분석쪽으로 포커스를 맞추면, 한국은 아직 빅데이터 수준이 아니라고 생각한다. 이 점에 대해서는 오해가 없길 바라는데, 아직은 소셜분석 대상이 빅데이터 수준이 아니라는 것이다.

예를들면 현재 소셜분석은 ‘○○ 노래가 정말 좋아’라는 트윗에 대해 필터링을 거친 뒤 문장을 분석한다. 이는 빅데이터 쪽에서는 더 확장돼서 분석할 수 있다. ‘○○ 노래가 정말 좋아’라는 트윗이 어느 지역에서 나왔는지, 어디서 전송했는지 등을 포괄적으로 파악해서 상황을 해석해 분석하는 것이다.

이렇게 되면 소셜분석 의미에 그치지 않고 복합적으로 상황과 연계돼 해석할 수 있게 된다. 블로터도 소셜분석을 진행할 때 좀 어떤걸 뽑아내서 분석할 지 좀 더 상상력을 발휘할 수 있었다. 트위터와 페이스북, 트위터와 미투데이 등 서로 결합해서 정보를 만들어낼 수록 소셜분석은 더 많은걸 분석하고 상상할 수 있게 된다.

시스템쪽으로는 현지 이런 분석이 가능한데, 실질적으로 데이터를 분석해서 결과를 내놓는 입장에서는 이런 분석이 아직은 등장하지 않은 것 같다.

강정수 : 사실 소셜분석은 사회를 분석하는 것이다. 그래서 많은 학자들이 참여해서 의미있는 결과물들을 만들어내야 한다고 생각한다. 현재 우리 소셜분석 시장은 분석하는 역량과 노하우가 한정돼 있다.

소셜분석을 통해 선호도를 파악하는 과정에서 한국식 의미의 시멘틱을 연구하는 교수는 얼마 없다. 심지어 논문은 다 영어이며, 분석 대상도 영어의 시멘틱 구조로 분석한다. 한글 문맥에 대한 사회학적 연구가 없다. 앞서 말한것처럼 좀 더 다양한 데이터를 통해 분석하면 세련된 소셜분석 결과가 나올 수 있는데, 아직 그러지 못한데는 이런 환경적인 요인들이 많다. 다음소프트 등 많은 업체가 소셜분석 시장에 들어오면서 이런 문제들을 보강하려고 하지만, 아직은 어려워하는 것 같다.

도안구 : 방금 나온 것처럼, 소셜분석하면서 빠지지 않는 얘기가 호불호 조사다. 한글로 호불호 조사가 어느 수준까지 되고 있는가. 단어가 아니라 문장으로 파악해야 하다보니 어려움이 많다고도 들었다.

구방본 : 앞뒤 문맥을 읽어 선호도를 조사하는 시멘틱 연구에 대해 계속해서 개발이 진행되고 있다. 그동안 기업에서는 이슈를 빨리 파악하는게 중요했기 때문에 키워드 기반으로 분석을 원했다. 이제는 회사 제품에 대한 고객 반응이 어떤지 기업들은 알고 싶어한다. 어떤 시점에 기업에 대한 호감이 증가했는지, 어떤 사건이 터졌을 때 그 기업에 대한 부정적인 감정이 등장했는지 등을 파악하길 원한다.

이 과정에서 중립적인 의미를 파악하는 것도 중요해졌다. “잘한다, 잘해”의 경우 정말 잘해서 잘한다고 말하는 호감일 수도 있지만 비꼬는 말일 수도 있기 때문이다. 이래서 등장한 게 앞뒤 문맥을 파악하는 시멘틱 연구다. 중립적 의미를 문맥 구조에서 잡아내야 한다.

SAS의 경우 자연어를 처리하는 규칙을 살펴보면, 형태소를 먼저 분석한 뒤 파악하는 것으로 알고 있다. 그 다음 주부, 부사부, 술어부를 통해 그 문장 전체에 대한 의미를 파악한다. 예전에는 단순하게 주부, 부사부, 술어부를 나눈뒤 이 구조 안에서 긍정적인 단어와 부정적인 단어가 각각 몇 개 등장했는지 등을 통해 분석했다. 그러다보니 정확도에서 문제가 생겼다. 지금은 한글 사전 등을 통해 비교적 과거보다는 정확하게 의미를 처리한다.

이지영 : 소셜분석에 있어 호불호 말고 기업들이 요구하는 것은 무엇인가. 실제로 서비스를 하다보면 기업이 소셜분석을 통해서 가장 하고 싶어하는게 무엇인지 알거 같은데. 또 소셜분석을 통해서 할 수 있는 분석에는 무엇이 있는지도 궁금하다.

김태현 : 우리가 지금 서비스하고 있는 건 모니터링이다. 아무래도 기업이 마케팅 메시지를 퍼뜨리면서 이에 대한 효과를 측정하는 것보다는, 기업에 반하는 불리한 이슈가 터졌을 때를 사전에 감지하는 것을 더 선호한다.

그래서 특정 키워드를 등록해 놓고 파악한다. 실질적으로 부정적인 단어가 언급되고 이를 빨리 파악하는게 기업에게 있어서 중요하기 때문에, 아무래도 이런 요구가 많이 나오는게 아닐까 싶다.

강정수 : 개인정보 침해 문제만 없다면 더 많은 분석이 가능하다. 실제로 많은 소셜분석 업체들이 부딪히는 문제가 사생활 침해 여부다. 지금 소셜분석을 통해서 정치적인 인물에 대한 선호도 조사뿐만 아니라 지지도까지도 파악할 수 있다. 하지만 이 과정에서 개인정보 침해 문제가 항상 고개를 든다.

그러다보니 패턴으로 분석하는 경우가 등장했다. 최근 우리는 뮤지선에 대한 지지도와 선호도를 표현할 수 있는 패턴 분석을 개발하고 있다.

김태현 : 트위터나 페이스북처럼 누구나 얘기할 수 있는 서비스가 등장하기 시작하면서 분석할 수 있는 범위는 놀랄만큼 커지고 있다. 소셜분석을 할 경우 사람의 관심사와 콘텐츠, 관련 카테고리 등이 나온다. 이는 필요성에 따라 대상 범위를 바꿀 수도 있다. 사람으로 따지면, 소셜분석을 통해 그 사람의 성향, 위치, 취향, 연령 같은 것을 파악할 수 있다.

이 과정에서 기업들이 조심할 게 있는데, 조사 분석 대상이 모두 같은 의미를 가지는 것은 아리나는 것이다. 즉 트위터 상에 특정 기업에 대한 부정적인 의견이 올라온다고 해서 그게 모두 의미를 가지는 것은 아니다. 1천명이 트윗으로 한 기업에 대해 불만을 토로한다고 해도 이 중 실질적인 영향을 미치거나 RT된 경우는 2회 밖에 불과하다면 의미가 없다. 트위터에 올라간다고 해서 모든 트윗이 영향력을 가지지는 않기 때문이다.

구방본 : 그래서 SAS의 경우 누가 중요한 영향력을 SNS에서 가지고 있는지 등을 파악해서 가중치를 매긴 다음 분석한다.

강정수 : 사실 소셜분석을 통하면 뭘 파도 나온다. 이외수가 트윗했을 때 내가 트윗했을 때보다 더 영향력이 강하다. 그러나 이런 건 이건 소셜분석 이전에도 있었다.

현재 기업이 요구하는 소셜분석은 약간 언어적인 측면엥서 데이터 마이닝을 요구하는게 강하다. 그러나 실제 SNS는 점점 더 발전하면서 오프라인에어 맺었던 친구관계가 온라인에게까지 이어지는 등 관계형 메시지 성향이 더 강하다. 앞으로는 관계형 분석을 통해 이 의미를 파악하는게 중요해지지 않을까 싶다.

구방본 : SNS에서 어떤 글을 남기는데 그 글의 관계까지 얽히면 통합적인 분석이 가능해지기는 하다.

이전행 : 사실 SNS를 이용하면 다 분석 가능하다. 빅데이터는 이 데이터를 다룰 수 있다는 개념이기 때문에 바짝 붙어서 나온 콘텐츠를 볼 수 있다는 의미가 될 것이다. 상상력에 좌우되고 시나리오와 사회적 법적 환경에 제한될 뿐, 결국 원하는 만큼 분석이 가능하다.

이지영 : 결국 분석에서 중요한 것은 무엇인가. 뭐든지 다 분석 가능하다면, 분석을 어떻게 접근해야 하는가.

구방본 : 목적이 있어야 한다. 무엇을 분석하려고 하는지 알아야 한다.

김태현 : 트윗믹스는 링크가 달린 트윗을 대상으로 하다보니 이 부분은 비교적 명확하다. 우리는 업체가 요구하는 주제에 따라 분석을 해준다. 다만 블로터의 경우 일반적으로 분석해달라고 포괄적으로 질문을 던지면 불분명하다. 소셜분석은 주제와 질문이 구체적일 때 효과를 발휘한다.

강정수 : 오프라인에만 국한됐던 정보가 온라인으로 드러나고 사물에 대한 행위 패턴들이 점점 더 중요해지면서 분석 세계는 점점 더 무궁무진하게 펼쳐질 것으로 보인다.

도안구 : 이쯤 되니 궁금한게 생겼다. 싸이월드도 SNS인데, 그때는 왜 이런 분석 붐이 일지 않았는가.

구방본 : 재미있는 지적이다. 사실 개인적으로는 트위터가 등장해서 소셜분석이 나온 것 같다고 생각한다.

강정수 : 페이스북, 트위터, 싸이월드 확산의 구조가 완전히 다르다. 분석 시장에선 API 공개 여부가 분석을 가른다. 싸이월드의 경우 일촌에 묶여 서비스가 철저하게 폐쇄적으로 전달됐다. 사용자간 강한 연결은 좋았지만, 사용자 나이가 들면서 확대되는 관계망을 일촌으로 추가적으로 끌어들이지 못했다. 이 점에서 싸이월드는 분석하기 어려운 점이 있었다.

블로터닷넷 엔터프라이즈, 클라우드, 기업용 SW를 담당합니다. 하루가 다르게 변화하는 IT 세상에 조금이라도 더 빨리 적응하기 위해 노력중. 마음과 몸이 자라는 기자가 되겠습니다. izziene@bloter.net, @izziene

  • 구글플러스
  • 블로터닷넷 아카데미, 북스, 컨퍼런스 그리고 블로터TV

    아카데미 | Academy

    북스 | Books

    컨퍼런스 | Conference

    블로터 | TV