대한민국 국민 10명 중 8명은 다음의 회원이다. 이들 가운데 5명은 하루에 한 번 이상 들어와 e메일을 읽거나 카페를 방문한다. 흔적 없이 들어왔다 나가는 것이 아니라, 매일 로그인하는 알짜 고객들이다. 정확도 높은 이용자 정보와 이를 기반으로 한 맞춤서비스는 다른 포털사이트가 따라올 수 없는 다음만의 강점이다.


다음커뮤니케이션이 이같은 고급 이용자들의 맞춤정보를 무기로 새로운 도전에 나섰다. 고지는 다름아닌 '검색'이다. 1년여 동안 쉬쉬하며 실력을 갈고 기술을 닦아온 다음이 최근 새로운 경쟁을 알리는 첫 총성을 울렸다. 그동안 개발해온 자체 검색엔진이 모습을 드러낸 것이다. 지난 5월4일 선보인 다음 웹검색은 다음 검색의 새로운 출발을 알리는 신호탄이다. 국내 검색시장의 70% 이상을 독식하고 있는 네이버에 정면 도전장을 내민 것이다. 

다음 웹검색
▲ 다음 웹검색

 

자체 검색엔진 개발…"표준 따르고 검색 효율성 높다"


"그동안 '다음에 검색이 있느냐'는 얘기도 많이 들었습니다. 그럼에도 내부 검색을 교정하고 업그레이드하면서 2위 자리는 유지해오고 있었다고 평가하는데요. 양질의 UCC를 풍부히 확보하고 있었지만 내부 검색엔진이 없다보니 정확도나 만족도가 떨어진 게 사실이에요. 그래서 1년여 전부터 검색엔진 전담반(TFT)을 구성하고 개발을 추진해온 끝에 이번에 시범서비스를 선보이게 된 것입니다."


정대중 검색포털본부 검색마케팅전략팀장은 "다음에 있어 올해는 검색의 해"라고 강조했다. 그만큼 검색서비스에 들이는 노력과 기대가 크다는 뜻이다. 그 배경에는 '자체 검색엔진 개발'이라는 만만찮은 도전의 첫 발을 무사히 뗐다는 데 대한 자신감과 자부심이 깃들어 있다.


그동안 다음은 다음소프트의 검색엔진을 이용해 다음 내 블로그나 카페검색 등을 제공해왔다. 뉴스검색 또한 미디어다음이 보유한 뉴스 데이터베이스(DB)를 대상으로 검색 결과를 제공했다. 그렇지만 검색의 바탕인 웹검색은 자체 서비스를 할 엄두를 내지 못하고, 4년 전인 2003년 3월부터 구글의 웹검색 결과를 그대로 가져다 뿌려주는 데 그쳤다. 그래서 이번 검색엔진 개발과 웹서치 서비스 시작으로 그동안 구긴 자존심을 회복하겠다는 기세다. 웹검색의 구글 더부살이도 머잖아 청산할 전망이다.


하지만 자체 검색서비스란 게 어디 말처럼 쉬운가. 이미 몇몇 실패사례가 험난한 도전을 입증하고 있다. 가깝게는 SK커뮤니케이션즈가 '서치플러스'란 자체 검색엔진을 내놓았다가 쓴맛을 본 경험이 있다. 다음의 검색엔진 개발을 반신반의하는 이유도 이런 학습효과 때문일게다.


다음 웹서치는 다음오에이(Daumoa·Daum operating agent)라는 웹검색로봇을 이용해 독자적으로 웹문서를 크롤링한다. 웹문서 운영자의 허용권한인 'Robots.txt' 규약에 맞춰 정보를 모으는데, 정보수집 과정을 빠르고 효율적으로 개선한 것이 특징이다. "기존 검색서비스가 '웹문서 수집→스팸 필터링→데이터 가공→검색엔진 로딩'의 여러 단계를 거쳤다면 다음오에이는 웹문서 수집 과정에서 바로 검색엔진으로 로딩되도록 스팸 필터링과 랭킹 가공 등이 동시에 이뤄지는 것이 특징"이라고 다음측은 설명한다. 그래서 같은 검색어를 입력해도 빠르고 정확한 검색결과를 제공한다는 것이다.


"무엇보다 자체 검색엔진을 가지게 된 점이 의미가 있겠죠. 다음 웹서치의 특징은 무엇보다 검색엔진 효율성이 뛰어나다는 점입니다. 분산기술이나 파이썬같은 새 기술이 접목되다보니 확장성이 뛰어나 대용량 검색에서 큰 힘을 발휘합니다. 말하자면, 예전에는 검색 문서수를 10배 늘리면 서버나 인력도 10배 늘려야 했는데 다음 웹서치는 그걸 10분의 1로 줄인 셈이죠. 또 엔진 자체가 표준을 준수하고 유니코드 인코딩을 지원해서 외국어 검색이 잘 되는 것도 특징입니다."


대용량 처리기술+로그인 회원DB=맞춤 UCC 검색


그렇지만 다음 웹서치가 갖는 보다 중요한 의미는 따로 있다. 다음 웹서치가 앞으로 등장할 다음의 핵심 검색서비스로 가는 징검다리이기 때문이다.


정대중 다음 검색전략마케팅팀장
▲ 정대중 다음 검색전략마케팅팀장
"이번 변화를 웹검색 개념으로만 이해할 것은 아니라고 봅니다. 웹검색은 엔진에 의해 구현한 대상 가운데 하나일 뿐입니다. 다음의 자산은 무엇보다 커뮤니티입니다. 회원들이 생산한 엄청난 양의 UCC들이 쌓여 있습니다. 이들을 과거보다 효율적이면서도 검색 품질을 높이는 방향으로 구조화하는 게 다음 검색의 방향입니다."


정대중 팀장은 다음 검색이 나아가는 방향을 '맞춤 UCC 검색'으로 요악했다. 말하자면 다음 내에 산재한 블로그, 카페, 동영상 UCC를 대상으로 이용자가 원하는 정보를 콕 집어 보여주겠다는 얘기다. 물론 여기에는 미디어다음 블로그기자단이 생산한 뉴스콘텐츠도 포함된다.


"이제는 눈높이가 높아졌다고 말씀드리겠어요. 우리가 더 잘 할 수 있는 대목을 찾은 것입니다. 그동안 진행해온 내부 UCC 검색의 노하우를 이번에 개발한 검색엔진과 결합해 시너지를 낼 수 있는 요인을 찾은 것이죠. 과거에는 블로그나 카페글을 검색하면서도 내부 검색엔진이 없다보니 정확도가 떨어졌거든요. 이번 검색엔진 개발로 이런 문제들이 개선될 걸로 봅니다. 또 크롤러가 웹문서들을 직접 가져오니 콘텐츠 확보 측면에서도 고무적인 일입니다."


이를 위해서는 이용자 성향분석이 필수적이다. 그런 면에서 다음은 3800만 회원과 2200만 일일 로그인 회원이라는 강력한 무기를 갖고 있다. "다음에서 로그인해 검색하는 이용자가 2위 업체보다 20% 더 많습니다. 이는 이용자가 로그인했을 때 어떤 키워드를 많이 보는지, 어느 서비스를 주로 이용하는지를 분석할 수 있게 해줍니다. 다음 내에 쌓여있는 UCC가 30억건에 이르는데요. 로그인 특성을 십분 활용해 데이터베이스를 구축하면 맞춤 개인화 검색이 가능한 것입니다. 이것이 다음이 UCC에 적합한 플랫폼이라고 말하는 이유입니다."


다음은 지난해 12월 카페검색 서비스를 업그레이드한 데 이어 올해 3월에는 블로그 검색 서비스를 강화하며 문호를 외부 블로그에도 개방했다. 그리고 이번 자체 검색엔진 개발로 다음은 검색사의 새로운 출발을 알렸다. 웹검색 시범서비스가 그 첫 발걸음이라면, 맞춤 UCC 검색은 본격적인 검색 경쟁을 알리는 선전포고가 될 전망이다. 다음의 'UCC 검색'은 오는 6월께 첫 모습을 선보일 예정이다. 










인터뷰/ 정대중 다음커뮤니케이션 검색포털본부 검색마케팅전략팀장


"검색 노하우 축적, 점진적 변화 기대"


Q. 그동안의 개발 일정은.

지난해 전담반을 꾸리고 1년 정도 내부에서 준비했다. 그동안은 다음소프트란 자회사와 함께 서비스를 제공했는데, 지난해부터 내부 경쟁력을 키우자고 해서 개발에 착수했다. 웹검색이란 게 검색에선 고도화된 부분이고 난이도도 높다. 결과물이 1년 정도만에 나왔다. 계속 검색서비스를 개발하는 기반을 마련했다는 점에서 의의를 느낀다. 검색의 핵심이 엔진인데 지금까지는 반쪽이었다. 지금까지는 구글에 의존했지만 앞으로는 달라질 거다.


Q. 검색엔진 개발이 쉬운 일은 아니다. 

자체 엔진을 개발해야겠다고 마음먹은 건, 눈높이가 좀 높아졌다는 시점이라고 판단했기 때문이다. 우리가 더 잘 할 수 있는 부분이 있다고 판단했다. 패러다임이 많이 바뀌었다. 과거에는 카페가 폐쇄적이었는데 지금은 정보를 공유하고 개방하는 방향으로 바뀌었다. 우리도 커뮤니티 경험이 검색에서 강점을 살릴 수 있겠다 생각이 든 거다. 우리 엔진은 웹검색을 위주로 했던 개발업체와는 다른 색깔을 가진다. 데이터마이닝에 우리가 강하다. 로그인 기반 유저 많기 때문이다. 우리는 노하우가 있으니, 핵심인 엔진만 가지면 할 수 있는 게 많겠다 싶었다.


Q. 다음 검색의 차이점은.

UCC 검색의 영역은 좀 다르다. 카페나 동영상 검색이 1년 전만 해도 약했다. 지금은 카페, 블로그, 동영상, 외부 게시판 검색의 역할이 커지고 있다. 검색에 들어오는 키워드 패턴도 보면 UCC 검색영역이 많다. 네이버 지식검색과는 다른 색깔의 UCC 검색으로 방향을 잡아가려 생각하고 있다. 다음이란 플랫폼이 UCC에 맞는 플랫폼이다.


Q. 웹검색 정식서비스는 언제 시작하나.

당분간은 시범서비스로 간다. 구글과의 계약시 조건 때문에 정확한 시점은 말씀드릴 수 없다. 6월 개편은 웹문서 외에 나머지 검색서비스의 개편이다.


Q. 지난해 카페검색을 개편했다. 반응은.

개편의 효과가 높아지고 있다. 카페 데이터베이스가 접근성 면에서 12% 정도 올라갔다. 다음에 670만개의 카페가 있는데 상위 카페의 경우 회원수만 300만명이다. 처음 카페검색을 선보일 때는 회원이 아니면 로그인해서 봐야 했는데 그건 접근성이 떨어진다. 지금은 카페 회원들의 동의 절차를 거쳐 상위 카페부터 DB를 오픈하는 정책을 가져가고 있다. 이번 검색엔진을 오픈하면 카페의 핵심 정보 위주로 검색을 구성할 수 있다.


Q. 카페 정보 오픈에 대한 반발도 있었다.

카페 주인장과 회원들의 동의절차를 밟는 과정에서 초기에 오해가 있었다. 지금은 DB를 열어주는 일이 회원이 늘어나고 카페 활동이 활발해진다는 인식을 가지는 추세라, 최근에는 오히려 열어달라는 요청이 늘어나고 있다.


Q. 다음 카페가 버릴 수도 유지하기도 부담스러운 존재라는 얘기도 있었다.

지금 카페가 670만개다. 서버나 시설투자에 매년 130억~150억 정도 쓰는데 해마다 10%씩 늘어나고 있다. 카페가 다음 서버에 부담을 준다는 건 오해다. 기술도 계속 업데이트되고 있다. 자원을 효율적으로 쓰는 기술이 등장하고 있다. 그게 부담되면 100GB 자료실도 오픈 못한다. 카페가 다음 핵심 경쟁력이란 건 사실이다. 카페와 UCC는 계속 결합해야 한다.


Q. 미디어다음 뉴스 개편과는 어떻게 연결되나.

결국 누가 먼저냐의 차이인 것 같다. 미디어팀과 공동작업하고 있다. 언론사 대상으로도 얘기하고 있다. 우리는 네이버 아웃링크보다 한 단계 더 나아간 정책도 고려중이다. '서치 얼라이언스'란 모델이 있는데 관심 있는 언론사도 많다. 개방하고 협력하는 건 항상 열려 있다.


Q. 블로그 검색 개편의 반응은.

올해 초 개편하면서 블로거들을 일대일로 접촉했다. 블로그 검색 개편된 걸 말씀드리고 리뷰도 부탁했다. 반응이 꽤 좋았다. 실제 지표를 봐도 한두 달 사이에 트래픽이 상당히 증가했다. 검색부분이 더 반응이 좋은 것 같다. 현재 검색은 키워드 검색이다. 블로그는 좀 다르다. 자기의 표현이나 개성을 부각하는 게 중요한 요소다. 우리는 태그검색도 지원하고 특정 블로그 내의 포스팅도 검색에서 보이도록 기능화돼 있다.


Q. 랭킹방식은 구글 페이지랭크와 무엇이 다른가. 

우리는 크롤러 수집주기가 빠르다. 국내검색에 강하다는 것도 있을 테고, 게시판 검색은 로직이 좀 다르다. 구글은 그런 부분을 검색 못한다. UCC 요소들, 집단지성 요소도 있다. 다음은 로그인하는 게 굉장히 자연스럽다. 로그인하지 않고 검색을 이용하던 사람도 5분 뒤에 e메일 확인하려 로그인하면 그 정보도 수집 가능하다. 이용자 정보관리에 대한 마인드가 고도화돼 있다. 그게 네이버와 좀 다르다.


Q. 향후 일정은.

시범서비스에서 계속 개선해서 최적화되면 곧 정식서비스를 내놓는다. 우리는 급할 수록 돌아가자는 정책이다. 3~4년 차근차근 준비한 노하우가 우리에겐 큰 힘이다. 올해 의미하는 바가 크다. 차츰 다른 변화를 가져올 것이라는 게 우리의 여유다.




저작권자 © 블로터 무단전재 및 재배포 금지