구글, 스파크·하둡 관리 클라우드 서비스 공개

가 +
가 -

구글이 하둡스파크를 관리해주는 서비스 ‘클라우드 데이터프록’을 9월23일 공개했다.

클라우드 데이터프록은 매니지드 스파크 및 하둡 서비스다. 오픈소스 데이터 도구를 쉽게 이용할 수 있게 구성됐다. 사용자는 복잡한 초기 구축 과정 없이 배치 프로세싱, 쿼리 작업, 스트리밍 작업, 머신러닝 기술 등을 활용할 수 있다.

Cloud_Dataproc_01

▲클라우드 데이터프록 서비스 소개(사진:구글 블로그)

더 읽어보세요!

구글은 9월23일 공식 블로그를 통해 “클라우드 데이터프록의 자동화 기능으로 쉽게 클러스터를 생성하고 관리할 수 있다”라며 “필요없을 때 클러스터를 꺼놓으면서 비용을 절감할 수 있다”라고 설명했다. 클라우드 데이터프록 가격은 가상 CPU 한 대를 시간당 이용하는 기준으로 1센트다.

구글은 클라우드 데이터프록의 장점으로 빠른 속도를 강조했다. 구글은 “보통 스파크나 하둡 클러스터를 구축형 인프라 혹은 IaaS(Infrastruture as a Servie) 위에서 생성하면 5분에서 30분 정도의 시간이 걸린다”라며 “사용자는 클라우드 데이터프록으로 동일한 작업을 90초 안에 끝낼 수 있다”라고 설명했다. 또한 “관리에 드는 비용과 시간을 줄이면서 핵심적인 일과 데이터에 집중할 수 있을 것”이라고 덧붙였다.

클라우드 데이터프록은 ‘클라우드 빅테이블‘, 빅쿼리‘, ‘클라우드 스토리지‘, ‘클라우드 모니터링‘ 등 기존 구글 클라우드 서비스와 통합해 이용할 수 있다. 또한 사용자는 기존 스파크와 하둡 환경에서 사용되던 도구 및 라이브러리를 클라우드 데이터프록 내에서 바로 활용할 수 있다. 기존 데이터 프로젝트나 ETL 파이프라인을 다시 개발하지 않고 클라우드 데이터프록에 옮기는 것도 가능하다. 클라우드 데이터프록은 당분간 베타버전 상태로 제공된다.

Cloud_Dataproc_02

▲클라우드 데이터프록은 기존 스파크와 하둡 환경에서 사용되던 도구 및 라이브러리를 이용할 수 있다.(사진:클라우드 데이터프록 홈페이지)

네티즌의견(총 2개)