‘뉴욕타임스’, 머신러닝 기반 자동 태그 시스템 개발

가 +
가 -

<뉴욕타임스>의 기사 관리가 더 체계적으로 변할 예정이다.

지난 7월30일 니먼랩은 <뉴욕타임스>의 연구개발팀이 기사를 실시간으로 스캔해서 태그를 추천해 주는 편집기 도구를 개발했다고 보도했다.

더 읽어보세요!

<뉴욕타임스> 연구개발팀이 이번에 개발한 자동 태그 시스템은 기사 작성이 시작되는 순간부터 텍스트를 분석해 추천한다. 기자가 글을 작성하면 네트워크를 통해서 추천된 태그가 편집기에 표시된다. 맞춤법이 틀린 대목도 표시해 준다. 자동 태그 시스템은 기계가 스스로 학습하는 머신러닝 기법을 이용한다.

아무리 좋은 기사도 찾기 어렵고, 어떤 내용을 담고 있는지 알 수 없다면 효용이 떨어진다. 기사에서 태그가 중요한 이유다. 태그는 기사의 메타데이터로 작용한다. 메타데이터란 데이터베이스 시스템에서 데이터를 관리하는 데 필요한 속성에 관한 데이터를 말한다. 잘 정리된 태그는 관련된 기사를 한데 엮어 볼 수 있게 해 준다. 웹사이트에서 원하는 자료를 검색할 때도 도움을 준다.

<뉴욕타임스> 연구개발팀은 홈페이지를 통해서 “머신러닝 기술이 기사 작성 과정과 상호작용하는 게 목표”라고 밝혔다. 또한 로이드 <뉴욕타임스> 연구개발팀 크리에이티브 디렉터는 니먼랩과의 인터뷰에서 “자동화나 컴퓨터를 이용하는 접근법이 저널리스트에게 얼마나 큰 도움이 될 수 있을지를 생각한다”고 말했다.