“빅데이터도 이젠 서비스 시대”

가 +
가 -

서비스로 빅데이터 시장에 뛰어든 업체가 등장했다. ‘빅데이터 플랫폼 구축 못지않게 빅데이터를 잘 운영할 수 있게 도와주는 도구도 중요하다’는 게 이들의 주장이다. 하둡 사용자 인터페이스(UI)인 ‘플라밍고 하둡 매니저‘를 개발한 클라우다인과 어니컴 얘기다.

김병곤 클라우다인 대표는 “데이터웨어하우스(DW)와 비즈니스 인텔리전스(BI) 솔루션으로 데이터를 다루는 사람들에게 하루 아침에 빅데이터를 다루라면서 하둡을 건네주면, 누구나 당황할 것”이라며 “하둡을 몰라도 하둡 기술로 빅데이터를 다룰 수 있게 도와주는 도구와 서비스가 빅데이터 시장에 필요하다”고 설명했다.

빅데이터에 대한 기업의 관심은 그 어느때보다 높다. 빅데이터 분석을 통한 고객 맞춤형 서비스를 제공하겠다는 기업이 늘어나고 있고, 빅데이터 처리를 위해 하둡을 활용한 데이터 처리 플랫폼을 만들었다는 기업도 등장했다.

그러나 일부일 뿐이다. 여전히 대다수의 기업 마케팅 담당자들을 빅데이터를 통해 무엇을 할 수 있는지 의문을 품고 있고, 개발자는 어떻게 해야 빅데이터를 원활하게 처리하고 관리할 수 있을지를 고민하고 있다. 빅데이터를 다루는 데 필수라는 하둡에 대해서 잘 모르는 이들도 태반이다. 빅데이터 시장에 대한 기대는 높지만, 막상 빅데이터를 어떻게 다루고 관리해야하는지 모르는 기업도 많다. 클라우다인과 어니컴은 이 간극을 노렸다.

이성준 어니컴 전략기획팀 부장은 “플라밍고 하둡 매니저를 통해 빅데이터 전문 서비스 기업이 되는 게 목표”라며 “빅데이터를 어떻게 분석하는지를 알려주는 컨설팅이 아닌, 빅데이터 그 자체를 어떻게 하면 잘 다루고 관리할 수 있는지 도와주는 서비스를 기업들에게 제공하고 싶다”고 말했다.

플라밍고 하둡 매니저는 빅데이터 처리와 분석을 위한 웹 관리 도구로 누구나 빅데이터 기술을 활용해 데이터를 가공 수 있는 개발·운영 환경을 제공한다. 플라밍고 맵리듀스, 플라밍고 알고리즘, 플라밍고 리소스 모니터링, 플라밍고 하둡 매니저로 구성돼 있다.

지금까지 빅데이터 프로젝트를 맡은 기업은 스크립트를 짜고 터미널 환경에서 손수 코딩하는 식으로 데이터를 처리했다. 플라밍고 하둡 매니저는 다르다. 분산파일과 맵리듀스만 있는 반제품 형태인 하둡에 사용자 인터페이스(UI)를 덧붙였다고 할까. 아이콘만 누르면 데이터 조인, 소팅, 묶기 등이 이뤄진다. 기존 DW 솔루션에서 데이터를 처리하는 환경과 크게 다르지 않다.

게다가 플라밍고는 오픈소스 프로젝트로 GPLv3와 아파치 라이선스2.0만 지키면 누구나 웹에서 무료로 내려받아 사용할 수 있다. 하둡에 대해 잘 모르는 사용자도 플라밍고 하둡 매니저만 있으면 빅데이터 처리와 분석에 필요한 맵리듀스와, 피그, 하이브, 마하우트 등 아파치 하둡 스택을 마우스 클릭으로 실행할 수 있다.

클라우다인과 어니컴은 플라밍고 하둡 매니저를 계속 오픈소스로 가져나갈 방침으로 현재로서는 상용화할 생각이 없다고 밝혔다. 대신 플라밍고 하둡 매니저에서 사용할 수 처리 모듈 판매와 빅데이터 처리 서비스로 수익을 얻는다는 계획이다. 아마존웹서비스(AWS)나 유클라우드 같은 클라우드 컴퓨팅 서비스와 연계해 소프트웨어 클라우드 서비스(SaaS) 형태로 제공할 계획도 있다. AWS 사용 고객이 맵리듀스 서비스에 플라밍고 하둡 매니저를 선택해 빅데이터를 관리할 수 있게끔 말이다. 현재 AWS에 있는 맵리듀스 웹서비스는 결과값을 올려 데이터를 관리하다보니 데이터를 설계하고나 테스트하기에는 적합치 않다.

김준홍 빅데이터사업부 부장은 “하둡 솔루션 운영 지원이나 유지보수를 주로 제공하는 업체들과 달리 플라밍고 하둡 매니저 사용법과 이를 응용한 서비스를 고객들에게 제공할 생각”이라며 “우리만의 빅데이터 서비스를 제공한다는 게 자사 하둡 솔루션이 없는 SI업체들과의 차별화된 점”이라고 말했다.

두 회사는 우선 플라밍고 하둡 매니저로 공공 데이터 시장부터 공략할 계획이다. IBM, 오라클, 테라데이타 같은 외국계 기업들이 장악하고 있는 제조업과 금융 분야에 뛰어들어 경쟁하기보다는 공공데이터 쪽에 집중하는게 더 낫다는 판단에서다.

김준홍 부장은 “기업이 보유하고 있는 데이터 못지 않게 정부기관이 갖고 있는 의료, 지도 데이터도 중요하다”며 “방대한 공공기관 데이터를 손쉽게 다루는 방법부터 고객들에게 전파할 계획”이라고 말했다. 김병곤 대표 역시 “올해 들어 상용 솔루션이 아닌 오픈소스 솔루션을 도입해 데이터를 분석하려는 공공기관이 부쩍 늘었다”며 “기업 시장보다는 공공기관 시장이 먼저 열릴 것으로 보인다”라고 덧붙였다.

플라밍고 하둡 매니저는 현재 버전 0.2까지 나왔다. 영어, 일본어 등 다국어를 추가로 지원해 내년 하반기에 1.0이 출시될 예정이다.

네티즌의견(총 1개)