인터뷰

“사람의 말을 기계언어로, 기계언어를 사람에게”

2018.03.29

이 글은 ‘넥스트 저널리즘 스쿨’ 4기 우승자 곽효원(khw33033@gmail.com) 님이 작성했습니다.

막상 현실에 부딪히면 생경한 것이 있다. 미국 마운틴뷰 구글 캠퍼스가 그랬다. 구글 캠퍼스에서 마주치는 모든 사람이 전 세계에서 손꼽히는 엘리트라는 게 놀라웠다. 구글 캠퍼스에서 만난 최현정 총괄 연구원(언어학자)도 성공가도만 달려온 엘리트라고 예상했다. 그는 구글 어시스턴트 언어팀을 이끌고 있다.

‘넥스트 저널리즘 스쿨 2017’ 우승자 프로그램을 통해 곽효원, 김병훈 씨는 지난 3월12-16일 미국 마운틴뷰 구글 캠퍼스를 탐방했다. 넥스트 저널리즘 스쿨은 <블로터>와 <한겨레21>, 구글코리아가 공동 주최하는 디지털 저널리스트 교육 과정이다.

“저는 3년 동안 애 키우던 암울한 청년이었어요.”

예상과 달리 최현정 총괄 연구원은 유학에 실패하기도 했고 경력단절 기간도 있었다. 최현정 연구원은 인공지능을 기반으로 한 음성인식 서비스 ‘구글 어시스턴트’의 자연어 처리를 맡고 있다. 음성인식은 최근 가장 주목받는 분야로 최현정 연구원 역시 2년 전 구글 본사로 자리를 옮기며 어느 때보다 바쁜 시간을 보내고 있다. 하지만 최현정 연구원이 처음부터 자연어 처리에 관심이 있었던 건 아니었다.

최현정 연구원은 국내 대학에서 언론학부를 졸업했다. 최현정 연구원은 “광고·홍보 공부를 하고 싶어서 프랑스로 유학 갔는데 불어가 너무 어렵고 광고·홍보 공부도 저랑 안 맞았다”고 말했다. 결국 최현정 연구원은 유학을 접고 한국으로 돌아왔다.

프랑스 유학 생활이 실패한 것만은 아니었다. 프랑스 사람들의 높은 자국어 자부심을 보며 깊은 감동을 받았다. 자연스레 한국어 교육에 대한 관심으로 이어졌다. 하지만 그즈음 최현정 연구원은 임신을 하게 된다. 최현정 연구원은 “애 가졌을 때 ‘나는 이제 끝났구나, 유학 가려고 일찍 결혼한 건데 이제 어떡하지’라고 생각했다”고 회고했다. 3년 동안 아이를 키우며 최현정 연구원은 무엇을 할지 계속 고민했다. 그리고 다시 학교에 갔다.

“사람의 말이 소리로, 소리가 숫자로”

고려대학교 국문과에서 석사과정을 시작한 최현정 연구원은 우연히 신지영 교수를 만난다. “언어학을 아무것도 모르니 지도교수님으로 아무나 찾아갔어요. 그때 만난 지도교수님이 신지영 교수님이었습니다. 음성학을 한 분이었죠.”

우연히 시작한 음성학은 최현정 연구원에게 새로운 세상을 가져왔다. 최현정 연구원은 “사람의 말이 소리로 변환되고 숫자로 계산되는 게 너무 새로웠다”라며 “모유수유하면서 매일 밤새 공부했다. 박사과정 때는 가족이 애 엄마가 저렇게 힘들게 공부한다고 한소리 하기도 했다”고 말했다. 실험음성학을 하며 통계와 코딩까지 배운 최현정 연구원에게는 또 한 번의 기회가 찾아왔다.

보이스 서치(음성검색)를 런칭할 당시 구글은 단기 음성학 연구자를 찾고 있었다. 이때부터 구글과의 인연이 시작됐다. 최현정 연구원은 보이스 서치 프로젝트를 도와주며 구글코리아에 합류했다. 최현정 연구원은 당시를 떠올리며 “그동안 공부만 했던 게 제품화가 가능하구나, 세상에 영향력을 줄 수 있구나라는 걸 알았다”고 말했다.

구글 어시스턴트 시연 장면

“야민정음도 이해하는 기계”

전산언어학은 IT 업계에서 새로운 분야이자 가장 주목받는 분야다. 사람의 언어를 연구하고 기계 언어를 이해하는 학문이기 때문이다. 최현정 연구원은 구글 자연어처리팀(NLP)의 첫 멤버가 됐다. 자연어 처리는 사람과 기계의 대화를 가능하게 하는 것을 말한다. 전산언어학자의 역할도 사람이 하는 말을 기계가 알아듣는 말로 바꿔서 이해할 수 있게 하는 것이다. 기계와 소통하는 것이 목표다.

자연어처리는 앞서 말했듯 사람의 말을 기계언어로 처리하는 것이다. 최근 구글이 시도하는 것은 머신러닝이다. 머신러닝 이전에 언어학자와 엔지니어는 하나씩 규칙을 만들었다. 한국어로 예시를 들면 ‘은/는’이 언제 나오고 받침이 어떻게 사용되는지 규칙을 만드는 것이다. 최현정 연구원은 “사람의 언어가 규칙으로 설명되지 않는 게 너무 많다. 한계가 분명해서 머신러닝이 발달했다”라며 “빅데이터를 주고 알고리즘을 제공해서 자연스럽게 배우게 하는 것”이라고 설명했다.

여기서 한 단계 더 나아간 것이 딥러닝이다. 사람이 학습을 할 때 범주화를 하는 것처럼 기계에게 범주화시키는 것이 딥러닝이다. 범주화란 서로 다르게 생긴 고양이를 모두 고양이라고 인식하는 것을 말한다. 딥러닝을 사용하면 인터넷용어인 ‘야민정음’까지 기계가 이해할 수 있다. 최현정 연구원은 “사용자가 언어로 쓰기 시작하면 기계는 다 배울 수 있다”고 말했다.

인간 대화에서 발생하는 ‘맥락’의 요소를 기계에게 접목시키는 일은 어려운 과정이다.

인공지능 음성비서, 구글 어시스턴트

최현정 연구원은 현재 구글 어시스턴트 팀으로 옮겨 연구를 제품에 적용하고 있다. 구글 번역팀과 함께 있었던 자연어처리팀이 구글 어시스턴트로 이동한 것이다. 구글 어시스턴트는 인공지능을 기반으로 한 음성 비서다. 영화 ‘아이언맨’에 나오는 자비스나 프라이데이가 예시다. 구글 어시스턴트는 크게 3가지로 사용될 수 있다. 최현정 연구원은 “첫째는 무언가를 시킬 때(action), 둘째는 정보가 궁금할 때(answer), 마지막은 대화(general conversation)”라며 “많은 사람들이 바라는 것 없이 기계와 대화하고 싶어 한다. 사람처럼 대화하는 게 목표”라고 말했다.

구글 어시스턴트는 자연어처리를 사용하는 서비스다. 기존의 음성인식 서비스인 애플 ‘시리’나 삼성 ‘빅스비’와의 차이점에 대해 최현정 연구원은 “(구글의) 음성인식 정확성이 세계적으로 높은 수준”이라며 “한국어는 많은 데이터를 통해 사투리까지 구축했다”라고 말했다. 무엇보다 구글 어시스턴트의 강점은 구글이 가진 방대한 데이터와 기술에 있다. 최현정 언어학자는 “음성인식 스피커, TV, 메신저, 챗봇까지 연동이 가능하다”라며 “구글에서 어시스턴트를 공격적으로 확장하고 있고, 올해에는 더 많은 계획이 있다”고 말했다.

최현정 연구원은 “시스템이 다양한 기기에 들어가면 이용자의 생활을 편리하게 한다”며 자신의 업무에 대한 자부심을 나타냈다. 한때 유학에 실패하고 육아에 전념하던 청년은 지금 세상을 바꾸고 있다.

bloter@bloter.net

블로터는 블로거(BLOGGER)와 리포터(REPORTER)가 결합된 말입니다. 블로거의 전문적 분석능력과 리포터의 현장취재력이 결합된 소셜시대의 새로운 저널리스트를 꿈꿉니다. # Twitter : @bloter_news # Facebook : facebook.com/bloter.net