콘텐츠

arrow_downward최신기사

k-means

[블로터10th]언론사가 알아야 할 알고리즘① k-means 클러스터링

“클러스터링은 네이버 뉴스가 지속적으로 진행해온 '검색품질 강화'의 일환이다. 각각의 이슈가 묶음 형식으로 보여지게 되면 다양한 이슈를 한 번에 확인할 수 있게 되고, 그 결과 묻혀 있었던 '양질의 기사'가 검색 결과에서 좀 더 쉽게 노출될 수 있는 등 이용자 만족도가 높아질 것으로 기대한다.” 2014년 12월 네이버가 뉴스 검색 결과에 클러스터링 방식을 적용했다며 내놓은 설명 문구다. 이 때를 기점으로 국내 언론사들은 클러스터링을 친숙한 단어로 간주하게 됐다. 수학과 코드, 논리가 뒤범벅된 알고리즘을 언론사들이 보통명사처럼 다루게 된 데는 그것이 언론사 수익에 차지하는 영향력이 상당해졌기 때문이다. 네이버가 뉴스 검색에 적용한 클러스터링은 군집화 알고리즘을 지칭한다. 여기서 유의해야 할 사항이 있다. 우리말로 군집화로 번역되는 ‘Clustering’과 분류로 표기되는 ‘Classification’은...

규제

[블로터10th] 댓글로 보는 블로터…“규제, 액티브X, 삼성-애플”

인터넷 뉴스가 다른 뉴스와 가장 차별되는 지점은 상호작용입니다. 방송이나 신문은 일방향적인 전달로 뉴스를 전하지만, 인터넷 뉴스는 '좋아요', 댓글 등으로 기사에 대한 수용자의 반응을 즉각 나타낼 수 있습니다. 기사에 대한 만족도 혹은 사안에 대한 의견표명, 기사 내용에 대한 보충 등을 할 수 있죠. <블로터> 10주년을 맞아 블로터 홈페이지에 달린 댓글을 분석해봤습니다. 저희는 시지온에서 만든 ‘라이브리’라는 소셜 로그인 댓글 솔루션을 부착해서 사용하는데요. 이 데이터를 통해 어떤 댓글들이 있었는지, 어떤 특징이 엿보이는지 살펴봤습니다. 데이터는 2011년 5월부터 2016년 9월1일까지 달린 댓글 7만201건입니다. 굳이 따지자면 10년까진 안 됩니다만… 양해를 부탁드립니다. ^^ 가장 많이 사용하는 SNS는? 가장 많이 사용하는 로그인 수단은 트위터였습니다. 2만5390건의 댓글이 트위터 아이디로...