국내 하둡 3인방이 준비하는 ‘플랫폼’은

가 +
가 -

바다 건너 미국에서는 연일 하둡 기반의 새로운 솔루션 업체가 등장하고 있다는 소식이 들려온다. 호튼웍스, 맵R, 클라우데라 같은 기존 하둡 강자들 외에 위비데이터나 클리어스토리 같은 신생 기업이 얼굴을 내밀었다. 위비데이터는 데뷔와 동시에 에릭 슈미츠 구글 최고경영자로부터 500만달러를 투자받았다. 클리어스토리도 투자 규모는 알려지지 않았지만 구글 벤처스로부터 투자 지원을 약속받았다. 이처럼 미국 벤처투자자들은 하둡 기반의 플랫폼 업체들에게 막대한 자금 지원을 약속하며 러브콜을 보내는 상태다.

미국만큼은 아니지만 국내 하둡 플랫폼 시장도 뜨겁게 달아오를 전망이다. 국내에서 하둡깨나 다뤄봤다는 그루터, 넥스알, 클라우다인이 준비한 하둡 기반의 플랫폼이 오는 상반기에 잇따라 출시될 예정이다.

이 중 그루터가 가장 먼저 하둡 기반의 플랫폼을 선보인다. 권영길 그루터 대표는 “수집, 실시간 분석, 저장, 배치에 이르는 데이터 처리 과정을 관리하는 소프트웨어 스택 솔루션인 ‘BAAS(Bigdata Analytic Application System)’를 오는 4월 정식으로 출시하겠다”라고 발표했다. 국내 일부 기업이 도입해서 사용하고 있는 BAAS를 더 많은 기업들이 사용할 수 있게 공개하는 셈이다.

BAAS는 그루터가 개발한 빅데이터 처리 플랫폼으로 하둡 맵리듀스와 하둡 분산파일저장시스템(HDFS), 하이브(HIVE), HBASE를 활용해 페타바이트(PB) 이상의 원본 데이터와 수백억건 이상의 실시간 트랜잭션 데이터를 저장할 수 있다. 오픈소스를 활용한 솔루션은 관리와 모니터링이 어렵다는 단점을 자체 개발한 ‘클루몬’이라는 솔루션을 통해 극복한 게 특징이다.

권영길 대표는 “BAAS는 기업이 블로그나 트위터 같은 데이터를 심도 있게 분석하고 싶다고 말할 경우 즉시 분석할 수 있는 온디맨드 분석 서비스를 지원한다”라며 “이는 분석 플랫폼 외에 그루터 자체적으로 갖고 있는 데이터가 있기 때문에 가능한 일”이라고 말했다.

그루터만 하둡 기반의 플랫폼을 준비하고 있는 것은 아니다. 넥스알도 ‘엔답'(NDAP)라는 이름의 하둡 플랫폼을 준비하고 있다. 넥스알은 오는 상반기에 이 플랫폼을 공개할 계획이라고 밝혔다.

한재선 넥스알 대표는 “하둡 플랫폼이라고 해서 하둡만 들어간 것이 아니다”라며 “엔답은 일반적인 분석처리, 데이터마이닝, 고급분석까지 빅데이터 처리에 필요한 모든 과정을 하나의 패키지 형태로 제공한다”라고 설명했다.

오픈소스 기반의 빅데이터 플랫폼이 있다고 해서 모든 기업이 해당 플랫폼을 활용해 데이터를 분석할 수 있는 것은 아니다. 해당 플랫폼을 가지고 데이터를 어떻게 분석하고, 활용하는지를 알아야 분석이 가능하다.

엔답은 이 방법을 알려주는 솔루션이다. 한재선 대표는 “단순히 솔루션을 던져주고 ‘알아서 분석하세요’가 아닌 기업이 갖고 있는 데이터로 ‘무엇을 할 수 있는지’를 보여주겠다”라고 말했다. 빅데이터 분석을 위한 알고리즘을 어떻게 짜고 구성하는지 조언해주겠다는 얘기다.

그루터와 넥스알이 데이터를 처리 과정을 핵심으로 한 하둡 플랫폼을 선보였다면 클라우다인은 하둡을 몰라도 하둡으로 분석할 수 있는 환경을 만드는 데 집중했다. ‘플라밍고’라는 하둡 관련 사용자 인터페이스(UI)를 올 상반기에 출시할 예정이다.

김병곤 클라우다인 대표는 “실제로 데이터를 다루는 협업 사용자는 DW나 비즈니스 인텔리전스(BI) 도구를 활용하는데, 이 사용자들은 하둡 설계가 익숙하지 않다”라며 “하둡을 몰라도 하둡으로 데이터를 처리할 수 있는 환경을 만들 수 있게 도우려 한다”라고 말했다.

‘플라밍고’는 사용자가 드래그앤드롭으로 손쉽게 분석 알고리즘을 만들면 분석 알고리즘에 맞게 데이터를 하둡으로 처리할 수 있게 도와준다. 실시간 분석 처리 능력도 갖췄다. 일정 기간 데이터를 쌓아놓고 처리하는 배치 형식뿐만 아니라 설계한 알고리즘에 맞게 실시간으로 데이터를 수집해서 분석한 뒤 그 결과값도 제공한다. 즉 현업 사용자들이 UI에서 데이터 프로세싱하는 플로우를 그려내고 이를 저장한 뒤 실행만 하면, 뒤에서 하둡 관련 오픈소스 제품들이 자동으로 이를 처리해서 사용자에게 보여준다는 것이다.

김병곤 대표는 “하둡 생태계를 자세히 살펴보면 대부분이 동물 이름으로 된 걸 볼 수 있다”라며 “플라밍고는 홍학을 뜻하면서도 화려한 자태를 뽐내기 때문에 UI 플랫폼으로는 적합하다고 생각해서 이름지었다”라고 설명했다.

네티즌의견(총 2개)