페이스북 “유해 게시물 솎아내기, ‘실수’ 줄이는 게 목표죠”

가 +
가 -

“실수가 적을수록 좋지만, 쉽진 않죠. 유해 콘텐츠를 판단하는 게 어렵고 미묘할 때도 있어요. 특히 페이스북처럼 덩치가 큰 플랫폼에서는 복잡한 사안에 대한 결정을 내릴 때 실수가 일어나기 십상입니다.”

크리스 팔로우(Chris Palow) 페이스북 커뮤니티 무결성팀 엔지니어는 17일 페이스북이 아시아태평양(APAC) 기자들을 대상으로 연 ‘인공지능(AI)을 통한 페북 커뮤니티 규정 집행 미디어 세션’에서 이같이 말했다.

페이스북은 매일 전세계 18억2000명이 사용하는 사회관계망서비스(SNS)다. 크기와 영향력에 비례해, 논란도 끊이지 않는다. 혐오발언 등을 비롯해 각종 유해 콘텐츠를 적극적으로 걸러내는 데 소홀하다는 게 주된 비판의 논지다. 이에 대해 페이스북은 모니터링 인력의 검토와 더불어 AI 고도화 등을 통해 커뮤니티 규정을 위반한 콘텐츠에 대응하고 있다고 밝혀왔다. 이날 간담회도 유해 콘텐츠 분류・처리 등을 위해 페이스북이 하고 있는 기술적 노력을 설명하는 자리로 마련됐다.

페이스북에서 커뮤니티 규정을 위반한 콘텐츠·이용자를 관리하기 위한 기술을 개발하고 있는 ‘커뮤니티 무결성(integrity)’ 팀의 크리스 팔로우 엔지니어와 라이언 반스 프로덕트 매니저가 직접 참석해 발표를 진행했다.

팔로우 엔지니어는 “아직 AI는 미묘한 맥락을 알아채기 어렵다. 사람의 ‘눈치’를 따라오기는 힘들다. 때문에 실수를 줄이고, 시정하고, 실수를 통해 배우는 과정에 집중하고 있다”며 “기술 고도화를 위해 노력하고 있으며 지금은 커뮤니티 규정 위반이 아니더라도 (이용자들의) 피드백을 더 많이 수집하면서 새로운 커뮤니티 규정을 만드는 식으로 이를 보완해 나가고 있다”고 말했다.

유해 콘텐츠, AI가 ‘우선순위’도 판단한다 

팔로우 엔지니어에 따르면 초창기 페이스북은 이용자 신고가 들어왔을 때만 모니터링 인력들이 콘텐츠 유해 여부를 검토하는 등 수동적으로 대응했다. 반스 매니저는 “이용자 신고에 의존도가 높았는데, 일단 페이스북에서 유해한 콘텐츠를 ‘보고’ 신고하는 건 (플랫폼 경험상) 부적절하다 생각했다”고 말했다.

이후 페이스북은 머신러닝 시스템을 도입, 이용자 신고 없이도 AI가 유해 콘텐츠를 가려내거나 리뷰 인력에게 전달하게끔 조치했다. 그 결과 올해 2분기 기준 스팸 콘텐츠나 가짜 계정, 아동 나체 사진 및 아동 성 착취 이미지, 테러리즘 위험 게시물 등은 99% 이상 사전감지하는 데 성공했다.

특히 최근에는 신고 콘텐츠를 처리하는 우선순위에도 AI를 활용할 수 있도록 기술을 고도화해 능동적 대응을 강화했다. 기존에는 AI가 알아서 게시물을 필터링하거나 게시물에 유해 수준 우선순위를 부여하는 역할까지 하지는 못했다. 이용자 신고에 의존했던 데다가 콘텐츠를 순서별로 검토하는 등 우선순위를 지정하지 않아 유해도가 높은 콘텐츠도 삭제되는 등 조치가 이루어지기까지 응답시간이 오래 소요됐다.

이와 달리 현재는 △확산 속도 △심각성(자살·자해·아동착취 등 실제 피해사례와 관련도에 따라 분류) △위반 정도(정책 위반 콘텐츠와 유사한 신호를 포함한 콘텐츠) 등 다양한 요소에 기반해 우선순위를 정하고 있다. 예를 들어 자살이나 아동학대 등의 콘텐츠가 있으면 스팸 게시물보다는 조치 여부를 우선 판단한다는 의미다. 이처럼 콘텐츠 처리에 있어 우선순위가 명확해지면서 유해 콘텐츠를 검토하는 데 보다 빠른 응답률을 기록할 수 있게 됐다.

이들은 페이스북의 기술적 개선에 대해서도 강조했다. AI가 콘텐츠 이면의 맥락을 이해하도록 하기 위해 이미지와 게시글, 댓글 등의 정보를 모두 종합해 판단하도록 학습(WPIE)시키고 있다는 설명이다. 팔로우 엔지니어는 “각기 다른 맥락을 동원해 이를 융합함으로써 게시물이 커뮤니티 규정을 위반하고 있는지 여부를 따지게 하려 한다”며 “교차언어모델도구를 개발해 다양한 언어의 맥락을 이해할 수 있도록 머신러닝을 시키고 있다. 이 같은 기술 고도화를 위해 다양한 파트너와도 협력 중”이라고 말했다.

팔로우 엔지니어와 반스 매니저는 “페이스북의 콘텐츠 집행은 완벽하지 않다. 어느 영역에 속하는지 확실하지 않은 그레이 존도 있고, 결정을 내릴 때 (인력의 개입이 필요한) 보고된 콘텐츠의 우선순위를 정하는 일 또한 불분명한 경우 또한 존재한다”며 “(이처럼) AI가 아직 완벽하지는 않다. 놓치고 누락하는 부분이 있어 검토 인력의 개입이 필요하다. 50개 이상의 언어를 구사하는 1만5000명의 리뷰 인력이 주요 국가별로 배치돼 있다”고 강조했다.