엔비디아, 반려동물 표정 구현하는 AI 기술 공개

'눈표범', '이집트 고양이'의 표정을 내 반려동물에게 적용할 수 있다.

가 +
가 -

엔비디아 연구진이 서울 코엑스에서 열린 국제컴퓨터비전 학회(International Conference on Computer Vision, 이하 ICCV)에서 동물의 사진을 보고 표정이나 포즈를 다른 동물에 똑같이 구현하는 ‘GANimal’ 앱 관련 논문을 발표했다.

‘GANimal’은 생성적 적대 신경망(Generative Adversarial Networks, 이하 GAN)이라는 새로운 인공지능(AI) 기술을 기반으로 개발됐다. GAN은 두개의 네트워크로 구성된 심층 뉴럴 네트워크 구조로 한 네트워크가 다른 네트워크와 서로 대립해 경쟁하는 방식으로 학습을 진행하는 기술이다.

GAN 기반의 반려동물 표정 구현 AI

새롭게 개발된 GANimal 앱은 개나 고양이의 사진을 업로드하면 다른 동물의 표정이나 포즈를 반려동물의 사진에 적용한다. 아프리카 사냥개나 이집트 고양이, 시추, 눈표범, 느림보곰 등 수십 종의 동물이 지원된다고 한다.

엔비디아는 “이 기술의 잠재력은 무궁무진하다. 영화를 촬영할 때 묘기를 부리는 개의 모습을 찍고 그 움직임을 AI로 매핑해 다루기 위험한 호랑이에 적용할 수 있다”라고 설명했다.

GANimal에는 ‘푸닛(FUNIT, Few-shot, UNsupervised Image-to-image Translation)’이라고 부르는 알고리즘이 사용됐다.

리우 밍유(Ming-Yu Liu) 푸닛 기술 개발팀 수석 연구원은 “대부분의 GAN 기반 이미지 변환 네트워크는 오로지 한 개의 작업을 처리하나 우리는 단일 네트워크가 다양한 변환작업을 처리할 수 있게 학습시킨다”라며 “네트워크는 다양한 이미지 변환 작업을 처리하면서, 기존의 동물 모습을 일반화해 전에 볼 수 없었던 새로운 동물의 이미지로 변환한다”라고 말했다.

이미지 변환을 위해서는 대상 동물의 이미지 여러 장을 네트워크 모델에 학습시켜야 한다. 연구진은 GAN 프로세스의 훈련 기능을 통해 사진 한 장으로 이미지를 변환할 수 있다고 밝혔다. 리우 수석연구원은 “새로운 문제들을 해결해 나가는 것이 기술과 사회를 발전시키는 길”이라고 말했다.

엔비디아 푸닛팀은 엔비디아 200여명의 연구진 중 7명의 연구원으로 구성돼 있다. 올해 초 사람들이 그린 낙서를 마치 사진과 같은 사실적인 예술작품으로 변환하는 ‘고갱(GauGAN)’이라는 AI 기술을 공개해 주목 받은 바 있다. 이 팀은 앞으로 푸닛 툴에 더 많은 이미지를 더 높은 해상도로 포함할 예정이다. 현재 고해상도 꽃, 음식 이미지로 테스트를 진행 중이다.

네티즌의견(총 0개)