구글, 고차원 데이터 시각화 도구 오픈소스로 공개

가 +
가 -

구글이 텐서플로우를 활용한 데이터 시각화 도구를 오픈소스 프로젝트로 지난주 공개했다. ‘임베딩 프로젝터’라는 기술이다.

구글은 공식 블로그에서 “최근 머신러닝이 이미지 인식, 번역, 의료 진단 등 다양한 부분에서 성장하고 있다”라며 “머신러닝 연구원들에게는 점점 데이터를 어떻게 탐색하고 모델 안에서 통합할지가 중요해졌다”라고 말했다. 또한 “차원이 백 단위나 천 단위로 커지면서 데이터 탐색이 힘들어지는 걸림돌이 존재했다”라며 “이에 맞는 특별한 도구가 필요하다고 보았다”라며 임베딩 프로젝터를 개발한 이유를 밝혔다.

임베딩 프로젝터는 웹기반 도구로, 인터랙티브한 데이터를 분석하고 시각화할 수 있도록 도와준다. 텐서플로우를 일부 활용했으며, 사용자는 별다른 설치 없이 웹사이트에서 바로 임베딩 프로젝터를 이용할 수 있다. 고차원의 데이터를 2D, 3D 모드로 바꿔 표현할 수 있으며, 확대와 축소 및 회전화면서 살펴볼 수도 있다.

Embedding_projector_02
▲임베딩 프로젝터 예시(출처 : 구글 블로그)
Embedding_projector_03
▲임베딩 프로젝터 예시(출처 : 구글 블로그)
Embedding_projector_00
▲임베딩 프로젝터 예시(출처 : 임베딩 프로젝터 논문)

임베딩 프로젝터 웹사이트에서는 이미 예제 데이터를 제공하기 때문에 사용자는 쉽게 작동 원리를 살펴보거나 텐서플로우에 대해서도 공부할 수 있다. 구글은 “이 도구가 머신러닝 커뮤니티에 도움이 되고, 기술을 정제하는데 잘 활용됐으면 좋겠다”라고 설명했다. 임베딩 프로젝터에 대한 자세한 정보는 논문에서 살펴볼 수 있다.

네티즌의견(총 0개)