소사이어티

사람들

arrow_downward최신기사

개방성

구글 직원 1400여명, '중국형 검색엔진' 프로젝트에 항의

"구글 직원은 우리가 무엇을 구축하고 있는지 알아야만 한다." 구글이 구축하고 있는 중국 검열 맞춤형 검색엔진 '잠자리(Dragonfly)' 프로젝트에 내부 직원들이 윤리적인 우려를 나타내며 프로젝트 투명성을 보장할 것을 촉구했다. <디인터셉트>는 8월17일(현지시간) 구글 내부에서 중국형 검열 검색엔진을 출시하려는 계획에 항의하는 움직임이 일고 있으며 이들은 회사 경영진에게 답변을 요구하고 있다고 전했다. 지난 2006년 구글은 중국형으로 '필터링'된 검색엔진을 내놓으며 중국에 진출했다 2010년 중국 시장에서 철수한 바 있다. 이달 초 구글이 중국 시장에 재진입하기 위해 중국 반체제 인사, 민주주의, 인권 등 중국 정부에 민감한 키워드를 검열해 보여주는 중국형 검색엔진을 또 다시 구축하고 있으며 중국 정부의 승인을 기다리고 있다는 보도가 나오면서 전세계적으로 논란이 일었다. 해당 보도가 나오기...

SEO

[IT열쇳말] 검색엔진 최적화(SEO)

쉽게 콘텐츠를 만들 수 있는 장이 많아지면서 단순히 콘텐츠를 소비하는 주체에서 능동적으로 콘텐츠를 만드는 사람들이 늘고 있다. 글도 있고, 인포그래픽, 카드뉴스, 동영상 등 여러가지 콘텐츠가 인터넷의 바다에 돌아다닌다. 콘텐츠를 만드는 이유는 자기 만족도 있을 수 있지만, 기업이나 단체에서는 홍보 차원에서 콘텐츠를 만드는 일이 대부분일 것이다. 그런데 열심히 공들여 만들어 놓은 정보가 생각보다 읽히지 않는다면, 찾는 사람이 없다면 홍보하는 입장에서는 김빠지는 일이다. 이럴 때 한번 짚고 넘어가야 하는 것이 ‘검색엔진 최적화(SEO)’이다. 사람들이 잘 방문하지 않는다면, SEO부터 기본적으로 사람들이 자료나 제품을 검색할 때 가장 먼저 하는 행동이 뭘까. 바로 구글, 네이버 등의 검색엔진에서 검색하는 일이다. 따라서 블로그든 개인 홈페이지든 콘텐츠 제작자가 올리는...

IoT

[IT열쇳말] 쇼단

쇼단은 세계 최초의 사물인터넷(IoT) 검색엔진이다. 쇼단은 웹사이트를 검색 결과로 보여주는 일반 검색엔진과 달리, 인터넷에 연결된 기기의 다양한 정보를 제공한다. 웹캠, 라우터, 서버, 산업제어시스템, 스마트TV, 스마트 냉장고 등 인터넷에 연결된 모든 기기가 검색 대상이다. 세계 최초 IoT 검색엔진 만약 웹사이트를 찾고 싶다면 구글, 빙, 네이버 등 일반 검색엔진을 이용하면 된다. 그런데 만약 찾고 싶은 게 아파치(Apache)같이 특정 소프트웨어로 돌아가는 컴퓨터라면? 마이크로소프트 인터넷정보서비스 (IIS·Internet Information Service) 버전 중 가장 인기 있는 버전의 정보라면? 혹은 얼마나 많은 익명의 파일 전송 프로토콜(FTP·File Transfer Protocol)이 존재하는지 궁금하다면? 일반 검색엔진은 이런 질문에 대한 답을 제공하지 않는다. 이때 필요한 게 쇼단이다. 쇼단은 2009년 만들어졌다. 창립자는 스위스 출신...

검색등록

"네이버 검색 등록, 제대로 하셨나요?"

최근 네이버에 자신의 홈페이지를 검색해보신 적이 있나요? 혹은 회사 홈페이지를 검색해보셨나요? 만약 없다면 한 번쯤 확인해보는 것이 좋습니다. 웹사이트가 전혀 검색되지 않거나 잘못된 설명 문구가 들어가 있을 수 있습니다. 2016년 7월 11일 이후 네이버는 검색 등록한 사이트 정보를 변경했습니다. 네이버 마이비즈니스(구 검색등록)를 통해 등록했던 정보 대신 검색 로봇이 웹에서 수집한 정보를 반영하는 것으로 바뀌었습니다. 이러한 변화를 2015년 11월에 사전에 안내했지만 많은 사용자가 검색등록 변경에 대비하지 못해 불편을 호소하고 있습니다. 그런데 더 심각한 문제는 원치 않는 사이트명과 설명 문구가 노출되고 있지만, 이를 원하는 문구로 바꾸는 방법을 모르거나 네이버 정책이 원래 그런 것으로 오해하는 것입니다. 네이버 검색 등록 변화 2015년 11월 네이버는...

TF-IDF

[블로터10th] 언론사가 알아야 할 알고리즘③ TF-IDF

포털 검색은 현대인의 일상이다. 매일 아침 ’핫‘ 이슈를 실시간 급상승 검색어를 통해 확인한다. 어떤 인물이 혹은 어떤 이슈가 대한민국의 관심을 주도하고 있는지 검색을 통해 발견하고 확인한다. 무심코 검색어를 클릭하거나 키워드를 입력하면 수많은 검색 결과가 일목요연하게 정리돼 나타난다. 관련 콘텐츠가 어림잡아 수만, 수십만 건이 될 텐데도, 검색 결과는 알토란 같은 정보만 뽑아서 보여준다. ’필터링’의 힘이다. 우리가 매일매일 포털 모바일앱에서 만나는 검색 결과물들은 알고리즘의 계산 결과다. ‘지하철 파업’이 이슈라고 한다면 검색엔진은 지하철 파업과 관련된 문서 가운데 현재 가장 관련성이 높은 것들만 골라서 차려준다. 누가 봐도 고개를 끄덕일 정도의 정확성과 적절한 공간 배열에 깜짝 놀랄 때도 있다. 'TF-IDF'라는 알고리즘은 검색 키워드에 가장 부합하는...

B2B

[B2B스타트업] 모두를 위한 기업용 검색엔진, 패스트캣

검색엔진 기술을 개발하는 기업은 어떤 곳이 있을까? 보통 포털 업체가 떠오르지만 ‘기업용 검색엔진’ 제공하는 기업들도 꽤 있다. 그 중 패스트캣은 2010년부터 기업용 검색엔진 시장에 뛰어든 기업이다. 창업 당시 웹스퀘어드란 회사로 출발했다가 올해부터 사명을 패스트캣으로 바꿨다. 2010년만해도 검색엔진 기술은 국내 많은 기업들이 진출한 레드오션 시장이었다. 송상욱 패스트캣 대표는 검색엔진에 대한 남다른 관심 때문에 자신만의 기업을 설립하고 치열하게 경쟁하고 있다. 최근엔 클라우드 분야까지 진출해 입지를 넓히고 있다. 내부 DB까지 찾아주는 기업용 검색엔진 검색엔진은 두 가지 분야로 나눌 수 있다. 웹 검색엔진과 기업용 검색엔진이다. 웹 검색엔진은 보통 포털에서 사용하는 기술이다. 웹페이지 본문, 웹주소, 제목, 키워드, 메타데이터를 찾고 우선순위로 매겨 결과값을 보여준다. 사용자는 결과값이...

검색엔진

오픈소스 코드 검색하려면 '소스그래프'

오픈소스 코드를 검색하고 싶을 때는 보통 구글, 스택오버플로우, 깃허브 등을 이용한다. 여기에 소스그래프를 추가로 활용해보자. 소스그래프는 웹에 있는 오픈소스 코드를 전문적으로 찾아주는 검색엔진이다. 사용자는 패키지, 함수, 레포지트리별로 세분화해 원하는 정보를 찾을 수 있다. 검색 자체는 무료로 이용할 수 있다. 소스그래프는 코드를 웹에 쉽게 삽입할 수 있는 임베디드 기능도 지원한다. 아래는 소스그래프의 활용 사례다. 클래스 이름이나 함수 이름을 검색 키워드로 입력할 수 있다. 전체 코드에서 특정 기능만 수행하는 소스코드를 볼 수 있다. 특정 언어로 된 소스코드와 관련 문서를 동시에 볼 수 있다. 소스그래프는 자바, 고, 파이썬, 자바스크립트(베타), 루비(베타), 하스켈(베타)로 된 소스코드를 검색할 수 있다. 임베디드로 원하는 소스코드를 웹에 삽입할 수 있다....

ELK

엘라스틱서치, 데이터 분석으로 서비스 확장

오픈소스 검색엔진 ‘엘라스틱서치’를 만든 엘라스틱서치가 사명을 바꾸고 서비스를 확장한다. 앞으로 회사 이름은 ‘서치’를 없애고 ‘엘라스틱’으로 바뀌며, 데이터 분석 기술이나 SaaS(Software as a Service) 판매에도 집중할 예정이다. 엘라스틱은 2012년에 루씬 기반의 실시간 오픈소스 검색엔진을 출시하고 이후 꾸준히 성장해 왔다. 엘라스틱서치는 출시된 이후 2천만건 넘게 다운로드됐다. 위키미디어, 모질라, 포스퀘어, 깃허브, 사운드클라우드 등이 엘라스틱서치를 사용했다. 엘라스틱은 3월10일 공식 블로그를 통해 “앞으로 데이터뿐 만 아니라 데이터를 추출하고, 분석하고, 상관관계를 알아내는 기술에도 집중할 것”이라며 “‘ELK 스택’에 대한 지원을 강화할 것”이라고 설명했다. ELK란 엘라스틱이 제공하는 핵심 제품인 엘라스틱서치(Elasticsearch), 로그스태시(Logstash), 키바나(Kibana) 머릿글자를 조합한 것이다. 3가지 제품을 조합해 데이터 수집부터 분석, 시각화를 통합적으로 작업할 수 있다는 점을 강조한...

Brandon Hamric

데이터 분석으로 불법 e성매매 ‘꼼짝 마’

기술은 좋은 일에만 쓰이지 않는다. 불법 활동도 기술 덕에 진화하고 있다. 성매매 산업이 대표적이다. 현재 해외에선 상당수의 성매매가 온라인에서 이뤄지고 있다. 포주들은 성매매 광고를 웹 배너에 노출시키는 식으로 사업을 운영하고 있다. 특히 불법 성매매 사이트는 검색엔진에 잘 노출되지 않고, 웹서버는 해외에 퍼져 있다. 사업 주체가 누구인지 찾아내기 점점 힘들어지고 있다. 미국에 있는 한 변호사와 프로그래머는 불법 성매매 연루자를 찾기 위해 검색 소프트웨어 ‘레스큐 포렌식’을 만들었다. 레스큐 포렌식은 “미국에서 매년 어린 아이 10만명이 인신 매매범에게 학대를 당하고 있다”라고 설명한다. 인신매매범은 대부분은 가난한 집안의 어린아이나 가출 청소년을 노리고 납치한다. 납치된 아이들은 대부분 강제로 성매매 현장으로 보내진다. 레스큐 포렌식은 이러한 상황을 막고자 인신매매범을...

AEDE

‘구글세’ 걷으려던 스페인 언론, 백기투항

'재주는 곰이 부리고 돈은 왕서방이 번다.' 포털 사이트에 기사를 공급하며 근근이 먹고 사는 언론사가 입에 달고 사는 말이다. 피땀 흘려 기사를 쓰는 것은 언론사지만, 기사 콘텐츠로 돈을 버는 쪽은 언론사가 아니라 뉴스를 유통하는 포털이라는 비판이다. 이 때문에 언론사는 종종 포털에 ‘제값을 달라’고 시위를 벌였다. 보통은 어느 정도 선에서 타협점을 찾았지만 너무 앞서 나간 바람에 제 목줄을 움켜쥔 경우도 생겼다. 스페인 신문발행인협회(AEDE)다. 스페인 언론사, "검색 결과에 기사 보여주려면 돈 내" 지난 10월 스페인 의회는 일명 ‘구글세’ 법안을 통과시켰다. 검색 엔진이나 콘텐츠 큐레이션 웹사이트가 기사 제목과 링크를 노출할 때마다 언론사에 저작권 사용료를 지불하라는 법이었다. 짧은 기사 요약문(snippet)만 보여줘도 마찬가지로 돈을 내라고 규정했다. 이를...