▲ (왼쪽부터) 이민철 연구원, 신명철 팀장. (사진=카카오엔터프라이즈)
▲ (왼쪽부터) 이민철 연구원, 신명철 팀장. (사진=카카오엔터프라이즈)

최근 카카오톡 챗봇(채팅로봇) 서비스를 통해 AI(인공지능) 상담원에게 질문을 하고 답을 받는 일이 많아졌다. 기존엔 인간 상담원이 이용자 질문에 대한 답을 정보검색시스템(KMS)을 활용해 최대한 빠르게 찾아 대응해왔는데, 이를 챗봇이 대체하고 있는 것이다.

이에 AI 기반 챗봇이 스스로 정확한 답을 빠르게 파악해 안내할 수 있도록 하는 기술들이 연구되고 있다. 그리고 여기서 중요한 것이 ‘자연어처리(NLP)’ 기술이다. NLP는 기계가 사람의 언어 즉 자연어를 이해하고 분석해주는 기술이다. NLP가 중요한 이유는 챗봇의 핵심이 대화의 의도와 맥락을 이해하고 적절히 대응하는 것이기 때문이다.

특히 카카오 관련 서비스에 들어가는 NLP 기술은 카카오엔터프라이즈 ‘AI 어시스턴트팀’에서 진행하고 있다. 음성비서인 ‘헤이카카오’도 이용자의 음성을 텍스트로 변환해 NLP를 진행해야 하는데, 카카오엔터프라이즈 AI 어시스턴트팀을 통한다. 지난달 21일 AI 어시스턴트팀의 신명철 팀장(이사)과 이민철 연구원을 만나 관련 연구 현황을 들었다.

카카오엔터프라이즈 AI 어시스턴트팀은 기업에 필요한 NLP 모델을 개발하고 연구하는 조직이다. 이를 위해선 ‘오픈 도메인 QA(질의응답)’ 시스템이 중요하다. 오픈 도메인 QA는 방대한 정보를 포함하고 있는 대량의 문서로부터 주어진 질문에 대한 답을 찾는 문제를 말한다.

즉 각 기업이 원하는 목적을 가진 챗봇 등 AI 비서를 카카오엔터프라이즈에서 만들어주려면 △그에 해당하는 방대한 문서에서 검색을 통해 이용자 질문에 적합한 답을 찾아내는 시스템을 구축하고 △단순 키워드가 아닌 이용자의 질문을 자연어 그대로 이해할 수 있는 NLP 기술이 필요한 것이다.

이 연구원은 “쉽게 말해 어떤 질문이 들어올지 모르는 상황에서 ‘공룡 티라노사우루스는 언제 살았어?’라는 질문이 들어오면 관련 정보에 대한 검색을 쫙 하고 정답을 추출해 이용자에게 답변을 해주는 그런 완성된 시스템을 오픈 도메인 QA라고 한다”고 설명했다.

이와 관련한 AI 어시스턴트팀의 최근 성과는 자체 개발한 NLP AI 모델이 한국어 기계독해 데이터셋 ‘코쿼드(KorQuAD) 2.0’ 성능 평가에서 1위를 차지한 것이다. 코쿼드는 LG CNS가 만든 자연어이해(NLU) 학습용 한국어 표준데이터다. AI 챗봇 등을 개발하려면 이러한 학습 데이터가 필요하다. 비유하자면 수학능력시험을 보기 전 모의고사 문제를 LG CNS에서 제공한 건데, 이 학습 데이터를 가지고 AI 어시스턴트팀이 언어 모델을 만들어 제출해 성능 평가 1위에 오른 것이다.

▲ 코쿼드 2.0에서 1위와 6위에 각각 오른 카카오엔터프라이즈 AI 어시스턴트팀. (사진=코쿼드 2.0 홈페이지)
▲ 코쿼드 2.0에서 1위와 6위에 각각 오른 카카오엔터프라이즈 AI 어시스턴트팀. (사진=코쿼드 2.0 홈페이지)

신 팀장은 “코쿼드 1.0은 언제·어디서·누가 등 답변하기 쉬운 형태의 질문 유형이었는데, 2.0의 경우 문서의 길이가 엄청 길고 답변도 표 안에 있거나 특정 셀에서 뽑아낸다든가 하는 등 난도가 더 높은 형태였다”면서 “그에 맞는 모델을 만들어 제출하면 LG CNS 측에서 질문과 답을 알아서 시험해 평가를 하는 것”이라고 말했다.

해당 모델인 ‘리틀버드-라지(LittleBird-large)’의 정확도는 90.22점을 기록했고, 처리 속도 역시 기존 1위 모델 대비 약 1.7배 빠른 수치를 기록했다.

AI 어시스턴트팀의 또 다른 모델인 ‘리틀버드-베이스(LittleBird-base)’는 6위에 올랐는데, 이는 모델 사이즈 자체는 작지만 유사 성능 타사 모델 대비 약 3.4배 빠른 속도와 높은 정확도(88.57점)를 기록했다는 점에서 의미있다. 즉 실제 AI 서비스를 할 때 언어 모델은 크면 클수록 정확하지만 느려지는 한계가 있다. 그런데 작은 크기로 높은 성능을 낼 수 있다는 가능성을 보여준 것이다. 작은 모델에서의 정확도와 속도 개선은 불필요한 연산을 쳐내고 핵심만을 담아 효율성을 높임으로써 가능하다. 

이러한 연구 결과는 지속적으로 모델을 고도화해 검색·챗봇뿐 아니라 AI 컨택센터인 ‘카카오 i 커넥트 센터’ 등에 적용된다. 모델을 고도화할수록 기대할 수 있는 건 인간과 같이 이해하고 알아듣는 AI다. 예컨대 키워드가 정확하게 입력되지 않더라도, 사람이 질문을 뒤죽박죽으로 하더라도, 의미나 맥락 등을 파악해 알맞은 답을 AI가 해주는 것이다. 

이 외에도 지난해엔 글로벌 AI NLU 경진대회 ‘MS MARCO’의 ‘Passage Ranking’ 분야에서 1위를 차지한 바 있다. 신 팀장은 “오픈 도메인 QA 가운데 검색을 잘하는 능력을 평가하는 대회였다”면서 “330만개의 문서가 있고 그 가운데서 질문이 주어지면 1000개를 검색해, (관련도가 높은)답이 포함돼 있는 걸 상위 순위에 올릴수록 점수가 높아지는 것이었다”고 설명했다.

▲ 챗봇이 이용자의 질문 의도를 이해하고 적합한 답을 찾는 과정. (사진=카카오엔터프라이즈 홈페이지에서 발췌해 가공)
▲ 챗봇이 이용자의 질문 의도를 이해하고 적합한 답을 찾는 과정. (사진=카카오엔터프라이즈 홈페이지에서 발췌해 가공)

이러한 대회에 참여해 좋은 성과를 내는 건 어떤 의미가 있을까. 신 팀장은 “현업에서 모델을 개선하기에 적합한 대회들에 참여하는 것이고, 좋은 성과를 내면 서비스도 좋은 방향으로 개선할 수 있다”면서 “대외적으로 효과도 있겠지만, 그보다 궁극적으로 기술 발전의 로드맵 가운데 그런 데이터를 활용하는 게 필요하기 때문에 참여하는 것”이라고 말했다.

이어 “오픈 도메인 QA 영역에 많은 대회가 있는데, 문제를 해결하기 위해 공략해야 할 부분이 다 다르다”면서 “하나하나 공략하고 나면 오픈 도메인 QA라는 거대한 영역을 조금씩 정복할 수 있지 않을까 생각한다”고 덧붙였다.

이 연구원은 “사실 기계가 자연어처리로 이해를 하고 분석하고 추론한다는 게 사람이 하는 것과는 질적으로 다르다고 생각한다”면서 “대회에서 1위를 한 건 그냥 시험을 잘 본 거고, 더 발전시켜서 실제로 사람이 일을 할 때 더 도움이 되는 서비스가 되게 하려면 앞으로 갈 길이 멀다”고 전했다.

저작권자 © 블로터 무단전재 및 재배포 금지