다음, "웹검색 찍고 UCC 검색으로"
대한민국 국민 10명 중 8명은 다음의 회원이다. 이들 가운데 5명은 하루에 한 번 이상 들어와 e메일을 읽거나 카페를 방문한다. 흔적 없이 들어왔다 나가는 것이 아니라, 매일 로그인하는 알짜 고객들이다. 정확도 높은 이용자 정보와 이를 기반으로 한 맞춤서비스는 다른 포털사이트가 따라올 수 없는 다음만의 강점이다.
다음커뮤니케이션이 이같은 고급 이용자들의 맞춤정보를 무기로 새로운 도전에 나섰다. 고지는 다름아닌 '검색'이다. 1년여 동안 쉬쉬하며 실력을 갈고 기술을 닦아온 다음이 최근 새로운 경쟁을 알리는 첫 총성을 울렸다. 그동안 개발해온 자체 검색엔진이 모습을 드러낸 것이다. 지난 5월4일 선보인 다음 웹검색은 다음 검색의 새로운 출발을 알리는 신호탄이다. 국내 검색시장의 70% 이상을 독식하고 있는 네이버에 정면 도전장을 내민 것이다.
자체 검색엔진 개발…"표준 따르고 검색 효율성 높다"
"그동안 '다음에 검색이 있느냐'는 얘기도 많이 들었습니다. 그럼에도 내부 검색을 교정하고 업그레이드하면서 2위 자리는 유지해오고 있었다고 평가하는데요. 양질의 UCC를 풍부히 확보하고 있었지만 내부 검색엔진이 없다보니 정확도나 만족도가 떨어진 게 사실이에요. 그래서 1년여 전부터 검색엔진 전담반(TFT)을 구성하고 개발을 추진해온 끝에 이번에 시범서비스를 선보이게 된 것입니다."
정대중 검색포털본부 검색마케팅전략팀장은 "다음에 있어 올해는 검색의 해"라고 강조했다. 그만큼 검색서비스에 들이는 노력과 기대가 크다는 뜻이다. 그 배경에는 '자체 검색엔진 개발'이라는 만만찮은 도전의 첫 발을 무사히 뗐다는 데 대한 자신감과 자부심이 깃들어 있다.
그동안 다음은 다음소프트의 검색엔진을 이용해 다음 내 블로그나 카페검색 등을 제공해왔다. 뉴스검색 또한 미디어다음이 보유한 뉴스 데이터베이스(DB)를 대상으로 검색 결과를 제공했다. 그렇지만 검색의 바탕인 웹검색은 자체 서비스를 할 엄두를 내지 못하고, 4년 전인 2003년 3월부터 구글의 웹검색 결과를 그대로 가져다 뿌려주는 데 그쳤다. 그래서 이번 검색엔진 개발과 웹서치 서비스 시작으로 그동안 구긴 자존심을 회복하겠다는 기세다. 웹검색의 구글 더부살이도 머잖아 청산할 전망이다.
하지만 자체 검색서비스란 게 어디 말처럼 쉬운가. 이미 몇몇 실패사례가 험난한 도전을 입증하고 있다. 가깝게는 SK커뮤니케이션즈가 '서치플러스'란 자체 검색엔진을 내놓았다가 쓴맛을 본 경험이 있다. 다음의 검색엔진 개발을 반신반의하는 이유도 이런 학습효과 때문일게다.
다음 웹서치는 다음오에이(Daumoa·Daum operating agent)라는 웹검색로봇을 이용해 독자적으로 웹문서를 크롤링한다. 웹문서 운영자의 허용권한인 'Robots.txt' 규약에 맞춰 정보를 모으는데, 정보수집 과정을 빠르고 효율적으로 개선한 것이 특징이다. "기존 검색서비스가 '웹문서 수집→스팸 필터링→데이터 가공→검색엔진 로딩'의 여러 단계를 거쳤다면 다음오에이는 웹문서 수집 과정에서 바로 검색엔진으로 로딩되도록 스팸 필터링과 랭킹 가공 등이 동시에 이뤄지는 것이 특징"이라고 다음측은 설명한다. 그래서 같은 검색어를 입력해도 빠르고 정확한 검색결과를 제공한다는 것이다.
"무엇보다 자체 검색엔진을 가지게 된 점이 의미가 있겠죠. 다음 웹서치의 특징은 무엇보다 검색엔진 효율성이 뛰어나다는 점입니다. 분산기술이나 파이썬같은 새 기술이 접목되다보니 확장성이 뛰어나 대용량 검색에서 큰 힘을 발휘합니다. 말하자면, 예전에는 검색 문서수를 10배 늘리면 서버나 인력도 10배 늘려야 했는데 다음 웹서치는 그걸 10분의 1로 줄인 셈이죠. 또 엔진 자체가 표준을 준수하고 유니코드 인코딩을 지원해서 외국어 검색이 잘 되는 것도 특징입니다."
대용량 처리기술+로그인 회원DB=맞춤 UCC 검색
그렇지만 다음 웹서치가 갖는 보다 중요한 의미는 따로 있다. 다음 웹서치가 앞으로 등장할 다음의 핵심 검색서비스로 가는 징검다리이기 때문이다.
정대중 팀장은 다음 검색이 나아가는 방향을 '맞춤 UCC 검색'으로 요악했다. 말하자면 다음 내에 산재한 블로그, 카페, 동영상 UCC를 대상으로 이용자가 원하는 정보를 콕 집어 보여주겠다는 얘기다. 물론 여기에는 미디어다음 블로그기자단이 생산한 뉴스콘텐츠도 포함된다.
"이제는 눈높이가 높아졌다고 말씀드리겠어요. 우리가 더 잘 할 수 있는 대목을 찾은 것입니다. 그동안 진행해온 내부 UCC 검색의 노하우를 이번에 개발한 검색엔진과 결합해 시너지를 낼 수 있는 요인을 찾은 것이죠. 과거에는 블로그나 카페글을 검색하면서도 내부 검색엔진이 없다보니 정확도가 떨어졌거든요. 이번 검색엔진 개발로 이런 문제들이 개선될 걸로 봅니다. 또 크롤러가 웹문서들을 직접 가져오니 콘텐츠 확보 측면에서도 고무적인 일입니다."
이를 위해서는 이용자 성향분석이 필수적이다. 그런 면에서 다음은 3800만 회원과 2200만 일일 로그인 회원이라는 강력한 무기를 갖고 있다. "다음에서 로그인해 검색하는 이용자가 2위 업체보다 20% 더 많습니다. 이는 이용자가 로그인했을 때 어떤 키워드를 많이 보는지, 어느 서비스를 주로 이용하는지를 분석할 수 있게 해줍니다. 다음 내에 쌓여있는 UCC가 30억건에 이르는데요. 로그인 특성을 십분 활용해 데이터베이스를 구축하면 맞춤 개인화 검색이 가능한 것입니다. 이것이 다음이 UCC에 적합한 플랫폼이라고 말하는 이유입니다."
다음은 지난해 12월 카페검색 서비스를 업그레이드한 데 이어 올해 3월에는 블로그 검색 서비스를 강화하며 문호를 외부 블로그에도 개방했다. 그리고 이번 자체 검색엔진 개발로 다음은 검색사의 새로운 출발을 알렸다. 웹검색 시범서비스가 그 첫 발걸음이라면, 맞춤 UCC 검색은 본격적인 검색 경쟁을 알리는 선전포고가 될 전망이다. 다음의 'UCC 검색'은 오는 6월께 첫 모습을 선보일 예정이다.
인터뷰/ 정대중 다음커뮤니케이션 검색포털본부 검색마케팅전략팀장 "검색 노하우 축적, 점진적 변화 기대" Q. 그동안의 개발 일정은. Q. 검색엔진 개발이 쉬운 일은 아니다. Q. 다음 검색의 차이점은. Q. 웹검색 정식서비스는 언제 시작하나. Q. 지난해 카페검색을 개편했다. 반응은. Q. 카페 정보 오픈에 대한 반발도 있었다. Q. 다음 카페가 버릴 수도 유지하기도 부담스러운 존재라는 얘기도 있었다. Q. 미디어다음 뉴스 개편과는 어떻게 연결되나. Q. 블로그 검색 개편의 반응은. Q. 랭킹방식은 구글 페이지랭크와 무엇이 다른가. Q. 향후 일정은. |