[현장+]머니브레인의 'AI 휴먼' 탄생 과정 살펴보니

발행일 2021-04-13 14:13:14

"생각보다 스튜디오가 아담하네요" 12일 찾아간 인공지능(AI) 스타트업 머니브레인의 2층 촬영장을 본 기자의 첫 소감이었다. 'AI 휴먼(인공지능 영상합성 기술로 재현한 사람)'이 만들어지는 곳인 만큼 왠지 화려한 장비와 넓은 공간, 많은 스탭이 함께할 거라 상상했지만 직접적인 참여 인원은 모델 한 명과 엔지니어 두세 명, 중간에서 소통을 담당하는 인력 정도가 전부였다.
AI 휴먼 제작 과정의 큰 틀은 비슷하다. 우선 AI가 학습할 수 있는 재료 데이터를 확보하는 차원에서 먼저 모델 촬영을 진행한다. 촬영 중 어떤 데이터에 중점을 둘 것인지는 프로젝트 성격에 따라 다르다. 만약 AI 아나운서라면 명확한 의사전달이 중요한 만큼 양질의 음성과 발화 데이터를 다수 확보하는 것이 중요하다.

머니브레인의 AI 휴먼 촬영 스튜디오 (사진=이건한 기자)

머니브레인 사업개발팀 관계자는 "하루에 약 1만 문장을 녹화하기도 한다"고 말했다. 최근 AI로 목소리를 재현하는 기술은 수백 문장, 수십분 정도의 학습 데이터만 있어도 일정 수준의 결과물을 얻을 수 있는 반면, AI 휴먼은 영상과 표정, 목소리와 입 모양까지 정교하게 맞추기 위해 훨씬 많은 학습 데이터를 필요로 한다. 또 모델이 촬영 시작부터 끝까지 한결같은 컨디션을 유지하는 것도 아니다. 이 때문에 1회 촬영 시 휴식 시간을 포함해 약 8시간 이상이 필요하다는 설명이다. 

이날 촬영은 음성보단 얼굴 및 표정 데이터를 얻는 것에 초점이 맞춰져 있었다. 이에 따라 모델은 다양한 견본 영상과 대본이 주어질 때마다 이를 수차례 이상 반복 촬영하는 과정을 거쳐야 했다. 엔지니어 팀에선 '표정을 더 역동적으로 해달라'는 주문을 계속 보냈는데, 아마 말보다 표정 짓는 일이 더 피곤하지 않았을까? 사진 속 모델의 '열연'은 기사에 첨부된 영상에서 볼 수 있다.

음성 확보가 중요한 날은 잡음을 막기 위해 에어컨 가동이 제한된다. 이 경우 주변 조명의 열기가 더해져 모델이 고생하는 날도 있다고 한다 (사진=이건한 기자)

사실 기사 첫 문장에 '스튜디오가 아담하다'고 했는데 이는 숲이 아닌 나무를 본 평가였다. 촬영 직전 관계자가 들려준 이야기에 따르면 촬영은 AI 휴먼 제작 과정에서 극히 일부에 불과하다. 수 시간 분량의 촬영 데이터가 확보되면 다음은 별도의 데이터 팀이 2주 이상 검수에 착수한다. 1차 검수를 마친 데이터는 개발팀에서 다시 가공한 뒤 이를 재검수 절차가 반복되며, 최종 완성까지는 2개월여가 소요될 만큼 긴 시간이 필요하다. 


대신 인고의 과정을 거쳐 만들어진 AI 휴먼은 언뜻 봐선 알아보기 힘들 만큼 정교한 품질을 보인다. 또 한 번 제작된 AI 휴먼은 이후 영속성을 갖고 언제 어디든 유연하게 활용할 수 있다는 것이 가장 큰 장점이다.
촬영한 자료에서 다양한 음성, 표정, 제스처 등의 데이터를 확보하고 검수·가공하는 과정이 반복해서 이어진다 (자료=머니브레인)

가령 AI 아나운서는 뉴스 투입 전 대본을 준비하고 연습하는 일, 메이크업을 하고 촬영팀과 리허설을 하는 과정 등 많은 준비가 필요하지만 AI 아나운서는 그렇지 않다. 오직 '대본'만 있다면 모든 준비 절차를 생략하고 24시간 언제든 뉴스에 투입될 수 있어 속보에도 신속히 활용할 수 있다. 또 장기적으론 인건비도 절감되니 일석이조다. AI 변호사, AI 선생님, AI 상담원 등도 마찬가지다.

실제 LG헬로비전은 지난 3월 아나운서 출신 방송인 이지애 씨를 본 따 만든 'AI 아나운서 이지애'를 자사 케이블 TV에서 송출하는 △지역뉴스 코너 △날씨와 생활 △우리동네 함께가게 등에 투입했다. MBN도 앞서 김주하 앵커를 AI로 구현해 일부 뉴스에 활용하고 있으며 두 프로젝트 모두 머니브레인이 참여한 프로젝트다. 이날 머니브레인 사무실에서 AI 김현욱 아나운서가 금융 상품을 안내하는 키오스크도 잠시 구경해볼 수 있었다. AI 휴먼의 전체적인 완성도 면에선 아직 일부 부자연스러운 부분들도 느껴졌지만 앞으로의 성장성은 충분해 보였다.

장세영 머니브레인 대표는 "앞으로 우리 생활권 곳곳에서 AI 휴먼 기술이 자연스럽게 확대 적용될 것으로 기대하고 있다"며 "현재 수준에 만족하지 않고 목소리 톤과 강약, 발음, 제스처 등이 더욱 정교하게 구현될 수 있도록 기술 개발에 박차를 가할 계획"이라고 말했다.

▲ [퓨처클립]나와 똑닮은 AI, 이렇게 만들어집니다!

댓글

(1)
※ 댓글 작성시 상대방에 대한 배려와 책임을 담아 깨끗한 댓글 환경에 동참에 주세요. 0 / 300
최신순 과거순 공감순
  • 2021-04-13 14:24:13
    자기 밥그릇 뺏기는건데 저걸 해준다고?ㅋㅋㅋㅋ미래 후배들 일자리를 지들이 뺏고있는걸 모르네 ㅋㅋㅋㅋㅋ

요일별 Edition