트렌드

‘이루다’ 잠정중단…스캐터랩 “이름 못 걸러 죄송, 알고리즘 개선할 것”

2021.01.12

혐오・차별 발언과 개인정보 유출 등으로 논란을 일으킨 인공지능(AI) 챗봇 ‘이루다’가 출시 20일 만에 서비스를 일시 중단한다. 12일 이루다 개발사인 스캐터랩은 “오후 6시까지 서비스를 잠정 중단하고 현재 제기되고 있는 문제점들과 기존 계획 중이던 개선사항이 완비될 때까지 서비스 운영을 중단하겠다”고 밝혔다. 추후 알고리즘 업데이트를 통해 이를 개선하겠다는 입장이다.

| 김종윤 대표 “다시 서비스를 재개하는 시점에는 더욱 이롭고 더욱 사랑받을 수 있는 인공지능(AI) 이루다로 돌아오겠다”

“내 카카오톡 대화가 챗봇으로…”

앞서 스캐터랩은 지난달 23일 페이스북 메신저를 기반으로 챗봇 이루다를 출시했다. 이용자 75만명을 확보, 일일활성사용자수(DAU) 20만명을 기록하는 등 1020세대 사이에서 급속도로 인기를 끌었다.

그러나 각종 혐오・차별 발언 등이 도마에 올랐고, 이후 스캐터랩이 당사 유료 서비스인 ‘연애의 과학’ 사용자들로부터 수집한 100억건의 카카오톡 대화를 이루다 학습에 활용한 것이 뒤늦게 알려지면서 파문이 일었다. 사용자들의 카카오톡 대화를 충분한 설명 없이 별도 챗봇 개발에 이용했다는 지적이 불거진 것이다. 사용자들은 당초 ‘신규 서비스 개발’에 활용된다는 데는 동의했지만 이루다 챗봇에 쓰일 거라고는 예상하지 못했다며 당혹해하고 있다. 특히 이름, 집 주소, 계좌번호 등 개인정보가 불특정 다수에게 노출됐다는 의혹이 나오면서 논란에 불이 붙었다. 사용자들과 대화한 연애 상대 등 제3자까지 개인정보 침해를 입었다는 지적도 나오고 있다. 이에 일부 사용자들은 오픈채팅방을 만들어 자료를 확보하는 등 집단소송을 준비 중이다.

이날 스캐터랩은 연애의 과학 사용자들로부터 사전 동의를 받았으며 개인정보취급방침 범위 내에서 이를 활용했다고 주장했다. 스캐터랩은 “이루다의 경우 핑퐁 데이터베이스를 통해 프리트레이닝 단계를 거쳤고, 이 단계는 연애의 과학 텍스트 데이터 기반 학습이 진행된 것이 맞다”며 “그러나 이때 사용되는 데이터는 발화자의 이름 등 개인정보가 삭제된 상태로 성별과 나이만 인식 가능하다”고 말했다. AI는 프리트레이닝 단계에서 맥락과 답변의 상관관계만 학습한다는 설명이다.

이어 “이루다는 회원 정보와 연계돼 있지 않은 별도 데이터베이스(DB)에 수록된 1억개 문장으로 이용자에게 응답하고 있다. 이 문장들을 조합해 개인을 특정하는 것은 불가능하다”며 “사용자의 사전 동의가 이루어진 개인정보취급방침의 범위 내에서 활용했으나 AI 학습에 데이터가 활용되기 원치 않으시는 분들은 DB 삭제와 함께 앞으로 이루다의 DB에 활용되지 않도록 추가 조치를 진행할 예정”이라고 전했다.

개인정보 유출 의혹에 대해선 “기존에는 숫자와 영문, 실명 등이 포함된 메시지를 알고리즘을 통해 삭제했지만 1억건의 개별 문장을 사람이 일일이 검수하기는 어렵기 때문에 알고리즘을 통한 기계적인 필터링을 거쳤다”며 “이 과정에서 되도록 많은 변수를 주려고 노력했으나, 문맥에 따라 인물의 이름이 남아 있다거나 하는 부분들이 발생했다”고 밝혔다. 이 회사는 “해당 사항에 대해 더욱 세심히 주의를 기울이지 못하고, 인물 이름이 등장하게 된 점 사과드린다. 문장 내의 이름 정보가 다른 정보가 결합돼 이용되지 않음을 말씀 드린다”고 덧붙였다.

수집된 사용자들의 대화를 사내 대화방을 통해 직원끼리 돌려봤다는 의혹에 대해서는 자체 진상조사위원회를 꾸려 대응 중이다. 스캐터랩은 “진상을 신속히 조사하고, 만에 하나 의혹이 사실로 드러나는 경우에는 관련자들에게 엄중히 책임을 묻고 조속히 필요한 조치를 하도록 하겠다”며 “조사 결과는 투명하게 공개하도록 하겠다”라고 말했다.

혐오・차별 발언을 하게 된 것은 초기 단계이기 때문이라고도 해명했다. 스캐터랩은 “이루다 서비스 출시 전부터 이에 대비해 혐오·비하 단어를 제거했지만, 시나리오를 벗어난 질문에 ‘자체 AI 알고리즘’을 기반으로 답변하다가 벌어진 사고”라며 “출시 이후 사전에 대비한 것보다 넓고 다양하고 심각한 사용자 발화가 등장했다. 대처가 부족했다”고 말했다.

스캐터랩은 향후 △실명 필터링 알고리즘 강화 △한글 주소 비노출 △대화 데이터 변형 △민감정보 노출 방지 등으로 기존 알고리즘을 고도화하겠다며, 서비스 재개 의사를 밝히기도 했다. 김종윤 스캐터랩 대표는 “사람만큼 대화를 잘하는 친구 같은 AI를 만들겠다는 꿈을 멈추고 싶지는 않다. 이번에 이슈가 된 부분을 성찰의 기회로 삼아 기술적으로, 그리고 사회적으로 가치있는 스타트업으로 거듭나고 싶다. 응원해달라”고 말했다.

한편 이날 스캐터랩에 이용자 데이터 폐기 및 서비스 전면 종료를 촉구하는 청와대 국민청원도 등장했다. 청원인은 ‘스캐터랩은 수집한 이용자 데이터를 모두 폐기해야 하며 나아가 이루다 서비스도 종료돼야 한다’며 청원글을 게시했으나 스캐터랩은 데이터 파기 의사는 없는 것으로 보인다. 개인정보보호위원회는 한국인터넷진흥원(KISA)과 함께 스캐터랩의 개인정보보호법 위반 여부 등을 조사할 예정이다.