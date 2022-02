‘풀리퀘’는 깃허브에서 타인의 코드에 리뷰를 요청하는 기능인 ‘풀 리퀘스트’의 줄임말입니다. 풀리퀘를 통해 코드는 더 발전하는데요. 알아두면 쓸모 있는 IT업계의 크고 작은 사건들을 격주로 ‘풀리퀘’ 드립니다.

△AI가 댕댕이·띵작마저 번역해주는 시대다.

△8개 번역기가 저마다의 답을 내놨다.

웹드라마 <좋좋소> 시즌 1 3회에서 이미나 주임은 신입사원에게 영어를 잘 하는 사람으로 소개된다. 그러자마자 걸려온 해외 거래처와의 전화에서 이 주임은 “이 선적은 이틀 안에 완료될 것입니다”를 영어로 말하기 위해 바로 구글 번역기를 써서 “This shipment will be completed within two days” 라고 답한다.[1] 해외 숙박시설에 대한 ‘솔직 후기’를 한국어로 남겨도 숙박시설 운영자가 인공지능(AI) 번역기로 바로 읽어보고 삭제하는 시대다. 그렇다 보니 이젠 AI 번역기가 번역을 할 수 없도록 받침을 바꾸고 발음을 꼬아주는 ‘한국어 번역 방해기’[2]까지 등장했다. 이처럼 최첨단 AI 번역 기술은 이미 우리의 일상 속에 깊숙이 들어와 있다.실제로 “'풀리퀘'는 깃허브에서 코드를 함께 개선해가는 과정인 '풀 리퀘스트'의 줄임말입니다”처럼 영어와 어순이 다른 문장도 “'Pull Request' is an abbreviation for 'Pull Request', which is the process of improving code together on GitHub”(구글)로 그럴싸하게 번역해낸다. 심지어 일부 AI 번역기는 한글로 적었을 때 모양이 비슷한 다른 글자를 사용하는 신조어인 ‘댕댕이’, ‘띵작’을 ‘puppy’, ‘masterpiece’처럼 원래 뜻으로 번역하기까지 한다.컴퓨터를 이용해 사람의 언어를 번역하는 기술, ‘기계번역’(Machine Translation)분야에 AI 기술이 활용되기 시작한 것은 비교적 최근의 일이다. 1990년대 후반까지는 ‘규칙 기반 번역’(RMT, Rule-based Machine Translation) 기술, 즉 각 언어의 문법을 체계적으로 연구해 사람이 직접 규칙성을 찾아 번역 프로그램을 작성하려는 시도가 주를 이뤘다. 2000년대 초중반 ‘통계 기반 번역’(SMT, Statistical Machine Translation) 기술이 등장하면서 판도가 바뀌었다. 실제 사람이 번역한 수천만, 수십억개의 문장에 대한 통계 분석을 토대로 번역하는 프로그램이 좋은 성능을 내자 자연스럽게 기계번역 분야에서 ‘빅 데이터’의 중요성이 부각된 것이다. 이에 힘입어 2010년대 후반부터 딥러닝(Deep Learning)으로 대표되는 ‘인공신경망 기반 번역’(NMT, Neural Machine Translation) 방식으로 넘어가면서, 빅 데이터로부터 각 언어에 어울리는 표현을 배워 구사하는 AI 번역 기술이 등장하기에 이르렀다.[3]그러면 2022년 현재 AI가 잘 번역하지 못하는 문장은 무엇이 있을까? 이를테면 친구와 함께 중국집에 배달음식을 주문하는 장면을 상상해 보자. "뭐 시킬까? 난 간짜장 곱빼기." "그럼 난 짬뽕?" 두 사람의 대화는 단 세 문장으로, 문장부호와 띄어쓰기까지 30글자다.이 대화를 영어로 번역하면 어떤 결과가 나올까? 아래는 임의로 고른 8개 유명 인터넷 번역기의 결과다.

바이두(Baidu), 시스트란(Systran), 플리토(Flitto)는 문장부호나 띄어쓰기를 임의로 바꿔버렸다. 플리토는 ‘간짜장’을 쿨하게 생략했고, 파파고(Papago)는 ‘간짜장’을 ‘짜장면’으로 옮겼다. 카카오 아이(Kakao i)와 마이크로소프트 빙(Bing)은 아예 ‘dick’이나 ‘ganja- clasp’, ‘hookup’ 등 정체불명의 단어로 둔갑시켰다. 구글, 카카오 아이, 빙, 왓슨, 시스트란은 모두 ‘메뉴 선정’을 ‘자기 소개’로 번역했다. 마지막으로 구글은 ‘곱빼기’의 ‘빼기’를 ‘lose weight’, 즉 ‘살을 빼는 것’으로 해석했다. 그럭저럭 영문법에 맞는 것처럼 보이는 번역 결과가 나오긴 했지만, 의미가 완전히 달라져버렸다.



각각의 번역기가 이렇게 번역한 이유를 분석하는 건 쉬운 일이 아니다. 특히 NMT 방식으로 넘어간 뒤로는 원인을 분석하거나 오류를 개선하기가 더욱 어려워졌다. 예를 들어, SMT가 주로 쓰이던 시기에는 특정 사람의 이름이 엉뚱하게 번역되는 문제가 자주 보고되곤 했다. 대표적으로 미국 대통령의 이름을 이라크 대통령의 이름으로 바꿔버리는 사례가 있었다. 통계적으로 두 사람의 이름이 같은 문장에서 자주 등장하는 바람에 벌어진 일이다. 그래도 SMT에서는 ‘어떤 단어’ 혹은 짧은 단어 몇 개로 구성된 ‘구절’이 어떻게 번역되는지를 기준으로 삼고 있어 오류의 원인을 추적하고 개선하기가 상대적으로 수월했다.



하지만 NMT에서는 단순히 데이터의 양만 문제가 되는 것이 아니라 단어가 나열된 순서, 앞뒤 맥락 등이 복합적으로 고려되기 때문에 문제의 원인을 찾기가 더욱 어려워진다. 특히 번역에선 의역을 하는 경우가 많고, 오역의 원인이 단순히 특정 단어 때문이 아닌 사례도 쉽게 찾아볼 수 있다. 자연스러운 번역을 위해 단어 한두 개나 구절을 통째로 생략하기도 하고, 원문에 없던 추임새를 집어넣기도 한다. 같은 표현이나 같은 구조의 문장이라고 해도, AI의 학습에서는 완전히 다르게 받아들여질 수 있다.



심지어 최근의 연구에서는 대소문자나 특수문자의 사소한 차이를 ‘다른 것’으로 취급할 때 번역 품질이 더 높았다고 한다. 이렇다보니 일부 AI 번역기는 대소문자만 바뀌거나 특수문자만 바뀌어도 번역 결과가 크게 달라지는 모습을 보인다. 예시로 든 문장에서 짬뽕과 간짜장 곱빼기의 순서를 바꾸거나, 따옴표를 " 에서 “, ”(아스키 코드 8220, 0221)로 바꾸기만 해도 번역 결과가 크게 달라지는 모습을 볼 수 있다. 심지어 독일어에서 한국어로 번역할 때, 원문에 누구의 이메일 주소가 적혀 있든 적든 이를 특정 인물의 이메일 주소로 오역하는 버그가 꽤 오랫동안 고쳐지지 않은 사례도 있다. [12]

△" 혹은 “, ”...어떤 따옴표를 넣느냐에 따라 번역기의 답이 달라지기도 한다.

이런 문제들은 AI가 공부할 학습 데이터가 더 늘어난다면 해결될 수 있을까? 그것만으로는 극복하기 어려운 문제도 있다. 성별과 관련된 문제가 대표적이다. 한국어는 상대적으로 대상의 성별이 드러나지 않는 문장구조를 가진 글을 쓰기 쉽지만, 영어를 비롯해 그렇지 않은 언어들도 많다. “쟤는 교수야. 쟤는 간호사야”를 적절하게 번역하는 AI를 찾기 어려운 이유이다. 표현방식 자체가 해당 언어에서 잘 쓰이지 않다 보니, AI는 자신이 학습해 온 해당 언어의 ‘자연스러운’ 문장을 구사하기 위해 원문에는 없었던 ‘성별’에 대한 정보를 끼워 맞추게 된다. 이 과정에서 어떤 단어는 ‘여성’으로 옮긴다거나, 성별에 대한 정보가 없을 때는 무조건 ‘남성’으로 옮기는 등의 모습을 볼 수 있다.

△대상의 성별이 드러나지 않은 문장이지만, 영어로 옮기자 고정화된 성별로 번역되었다.

여기까지 AI 번역기가 저지르는 다양한 실수와 근본적인 한계를 살펴보았다. 무척 편리하고 어느새 생활 깊숙이 들어와 있는 AI지만 언제든 틀릴 수 있음을 알아야 한다. 불과 2년 전까지만 해도 우리말 ‘사흘’과 ‘나흘’이 모두 ‘Four days’로 번역되던 사건이 화제가 되기도 하지 않았나. [15] 다행스러운 점은 이런 한계점들을 인지하고 개선해 나가기 위한 전문가들의 지적과 연구 또한 활발히 이뤄지고 있다는 것이다. [16] [17] 단순히 딥러닝은 블랙박스여서 원인을 알 수 없다는 식의 설명에 머무르지 않고, 어떻게든 ‘설명가능AI’(eXplainable AI) 기술을 현실화하고자 하는 노력도 이어지고 있다. 그러니, 그리 멀지 않은 시간 안에 오늘 살펴본 것보다 훨씬 만족스러운 번역을 술술 내놓는 AI를 기대할 수 있을지도 모르겠다.

▲기고|변규홍 스켈터랩스 개발자