네이버클라우드 '기업용 파파고', 문서·웹 페이지 그대로 번역한다

발행일 2021-08-02 13:05:11
네이버의 파파고 문서 번역 API 예시. (사진=네이버)

네이버의 기업용 인공지능(AI) 번역 서비스 '파파고 번역'을 활용하면 텍스트를 따로 추출하지 않아도 문서나 웹 형식의 페이지에서 그대로 번역할 수 있게 된다.

네이버 자회사 네이버클라우드는 2일 문서 번역 API(응용 프로그램 인터페이스)와 웹 번역 API를 출시했다.

기존에 문서나 웹페이지를 번역하려면 텍스트를 직접 추려 번역하고 번역된 문장을 사이트나 서식에 적용해야 했다. 하지만 이번에 새로 출시된 기능을 활용하면 변환 작업없이 번역 기능을 사용할 수 있다.

문서 번역 API는 폰트 크기·색상·정렬 등 서식이나 표는 그대로 유지한 채 번역한 결과를 출력해준다. 가령 영어로 된 웹 페이지를 한글로 번역하기를 원할 경우 해당 페이지에서 바로 한글로 번역된 결과를 보여주는 식이다. 파파고 문서 번역 API는 마이크로소프트 오피스 형식(docx, pptx, xlsx)을 비롯해 국내에서 활용도가 높은 아래한글(HPW 5.0 버전 이상) 문서 번역까지 지원한다. 최대 100메가바이트(MB)까지 파일을 업로드할 수 있도록 서비스한다.

웹 번역 API는 웹페이지 내 소스 언어로 작성된 HTML 문서를 파파고만의 태그 복원 기술을 반영해 원하는 언어로 번역해준다. HTML 소스 내에 태그와 문장을 분리한 후 발췌된 문장 내용만 번역하고, 완성된 번역결과를 다시 HTML 태그와 조합해 완성된 형태의 HTML로 보여준다. 예를 들면 영어 문장이 포함된 HTML 소스 문서에서 영어 문장만 한글로 번역해 나타내는 방식이다. 문서와 웹 번역 API는 한국어·영어·일본어·중국어 간체자 등을 지원한다. 기업들은 필요에 따라 API를 사용하고 월 사용료를 지불하면 된다.

또 네이버클라우드는 현재 개인용 파파고 서비스에서 제공하고 있는 이미지 번역 기능도 기업용으로 선보이기 위해 준비 중이다. 기존에는 이미지 번역이 필요할 경우 광학 문자 인식(OCR) API와 번역 API를 결합해 활용해야 했다. 이 경우 단순히 문자를 검출해 번역하는 방식으로 문장 구조가 다소 불완전해 사용자가 선택하는 텍스트 영역에 따라 번역 품질이 일정하지 않았다. 파파고 이미지 번역은 인식된 문자들의 디자인과 문장 구조를 분석해 번역에 적합한 문장을 찾는 자체 딥러닝(기계심화학습) 모델 'HTS'를 개발해 이미지 번역 품질을 높였다. 이미지 번역 기능의 출시 시점은 미정이다.

파파고 번역은 네이버가 자체적으로 개발한 인공 신경망 기반 기계 번역 기술인 NMT를 이용한 기업용 번역 서비스다. 높임말 번역과 치환 번역 등이 가능한 단문 번역 API는 16개 언어쌍을, 언어 감지 API는 12개 언어를 지원한다. 파파고 번역의 AI는 대규모의 데이터를 매일 자동으로 학습하며 한국어 언어 처리 능력을 고도화하고 있다. 네이버는 최근 AI 번역 성능 강화를 위해 160억원을 투자했다.

댓글

(0)
※ 댓글 작성시 상대방에 대한 배려와 책임을 담아 깨끗한 댓글 환경에 동참에 주세요. 0 / 300

요일별 Edition