구글이 내 손안의 인공지능(AI) 시대를 천명했다. 모바일 기기 안에서 작동하는 ‘온디바이스(on-device)’ 방식의 AI는 대세로 자리 잡고 있다. 구글은 여기에 더해 데이터 이동 없이 사용자 기기 내에서 AI 학습이 이뤄지는 새로운 머신러닝 방법 '연합학습(Federated Learning)'을 제시했다. 이 방식을 적용할 경우 원본 데이터(raw data) 수집 없이 AI 모델을 개선할 수 있어 프라이버시 문제를 해소하는 데 도움이 될 것으로 보인다.

구글코리아는 8월22일 서울 중구 한국프레스센터에서 '구글 AI 라운드테이블' 행사를 열고 AI 정책과 머신러닝의 공정성을 주제로 발표했다. 이날 행사에는 구글에서 모바일 기기의 머신 인텔리전스 담당 팀을 총괄하고 있는 블레이즈 아게라 이 아카스 구글 디스팅귀시드 사이언티스트가 참여해 연합학습 기술을 소개했다.

▲  | 구글 모바일 기기 머신 인텔리전스 담당 팀을 총괄하고 있는 블레이즈 아게라 이 아카스 구글 디스팅귀시드 사이언티스트
▲ | 구글 모바일 기기 머신 인텔리전스 담당 팀을 총괄하고 있는 블레이즈 아게라 이 아카스 구글 디스팅귀시드 사이언티스트

온디바이스 방식의 AI 학습


흔히 AI라고 부르는 기술은 대개 머신러닝을 지칭한다. 인간이 직접 규칙을 제공하지 않고 컴퓨터가 스스로 데이터를 학습하고 규칙을 일반화해 예측하도록 하는 기술이다. 머신러닝은 일반적으로 학습 데이터를 중앙의 데이터 센터로 모아야 한다. 이렇게 모인 데이터를 바탕으로 클라우드 상에서 AI 모델을 학습시켜 개선된 결과를 보여준다. 하지만 데이터를 중앙으로 수집하는 과정을 거치기 때문에 프라이버시 논란을 근본적으로 피해갈 수 없다.

▲  | 각 사용자의 스마트폰에서 사용자 이용행태를 기반으로 학습 모델을 개인화하고(A), 수많은 사용자 업데이트 정보를 취합해(B), 모델을 개선한 내용을 업데이트(C)하는 과정이 반복된다. (사진=구글)
▲ | 각 사용자의 스마트폰에서 사용자 이용행태를 기반으로 학습 모델을 개인화하고(A), 수많은 사용자 업데이트 정보를 취합해(B), 모델을 개선한 내용을 업데이트(C)하는 과정이 반복된다. (사진=구글)

연합학습은 학습 데이터를 기기에 저장하고 모델 훈련을 기기에서 수행하도록 한 새로운 머신러닝 방법론이다. 기기 안에서 사용자가 입력한 내용을 기반으로 머신러닝 모델을 개선해나가는데 이때 작은 용량으로 요약된 변동사항 정보만 암호화된 통신을 통해 클라우드로 전송하는 식이다. 즉 데이터 센터 등 중앙으로 원본 데이터를 직접 보내지 않고 AI 모델의 변동사항만 개별 사용자로부터 취합해 모델을 개선하고 다시 개별 기기의 AI 모델을 업데이트하는 방식이다.

블레이즈 아게라 이 아카스 총괄은 "실제 데이터가 클라우드로 가지 않고 신경망 모델에서 변경된 가중치 값 데이터가 간다"라며 "구글이든 해커든 정부 기관이든 해당 데이터를 탈취하거나 학습 데이터를 재조합해서 사용할 수 없다. 신경망 스킬을 습득하는 것이지 학습데이터의 콘텐츠를 기억하는 게 아니기 때문"이라고 설명했다. 그는 연합학습을 의사들이 학회를 열고 환자 개인의 정보를 공유하지 않는 방식으로 수술 효과를 토론하는 모습에 비유했다.

구글은 모든 학습 데이터는 각 사용자 기기에 남아있으며 개별 업데이트 정보는 클라우드에 저장되지 않는다고 밝혔다. AI 모델 업데이트는 사용자 경험에 부정적인 영향을 미치지 않도록 스마트폰이 와이파이에 연결돼 있고, 전원이 꼽힌 채로 대기 상태에 있을 때 진행된다.

기존 온디바이스 AI와의 차이


기존의 온디바이스 AI 논의는 이미 만들어진 AI 모델을 클라우드가 아닌 모바일 기기의 컴퓨팅 파워로 돌리는 것에 초점이 맞춰져 있었다. 머신러닝 알고리즘 연산에 최적화된 AI 전용 칩셋 NPU(신경망처리장치)를 스마트폰에 탑재해 영상·음성인식 등 AI 기반 기능에 활용하는 식이다. 예를 들어 사진을 찍을 때 사람·사물·풍경을 인식하고 밝기 등 주변 환경을 파악해 최적화된 설정으로 촬영을 돕는다.

또 모바일에 최적화된 AI 애플리케이션을 구현하는 작업이 병행되고 있다. 하지만 결국 데이터가 중앙에 가지 않고는 AI 모델 개선이 어렵다는 점이 한계점으로 꼽혔다. 구글이 발표한 연합학습은 '추론'이 아닌 '학습'에 초점을 맞춘 온디바이스 AI로, 이 같은 한계점을 해결하고 프라이버시를 보호하기 위해 고안됐다. 연합학습 자체는 NPU가 아닌 기존 ARM 기반 프로세서에서도 작동한다.

▲  | 연합학습이 적용된 구글 키보드 서비스 '지보드'
▲ | 연합학습이 적용된 구글 키보드 서비스 '지보드'

구글은 지난 2016년부터 연합학습 연구를 진행하고 2017년부터 자사의 키보드 서비스 '지보드'에 연합학습을 적용해 테스트해왔다. 지보드는 연합학습을 기반으로 단어를 추천하고 검색어를 제안해준다. 현재 구글은 연합학습 기술을 텐서플로 페더레이티드(TensorFlow Federated)로 오픈소스화해 모든 개발자가 활용할 수 있도록 했다. 올가을 출시될 구글의 스마트폰 '픽셀4'에도 연합학습을 비롯한 온디바이스 AI 기능들이 내재될 예정이다.

블레이즈 아게라 이 아카스 총괄은 "아직 다른 회사는 신경망을 분산해서 학습시키는 모델을 개발한 기업은 없는 것 같다"라며 "연합학습은 구글이 개발한 기술이지만 널리 퍼지길 바라며, 현재 AI 연구 분야의 하부영역으로 자리 잡고 있고 스타트업들도 연합학습 기술을 활용한 비즈니스 모델을 개발 중인 상황"이라고 밝혔다.

저작권자 © 블로터 무단전재 및 재배포 금지