[빅데이터1년] ②오라클 “하둡만 빅데이터인가”

가 +
가 -

‘빅데이터’. 국내외 대다수의 기업이 2013년에도 주목하겠다고 꼽은 단어다. 근데, 걱정이 앞선다. 이미 너무 많은 매체가 지난 한 해 빅데이터를 주목했다. 빅데이터 시장성, 가능성, 사례 등을 얘기했다. 갑자기 쏟아진 빅데이터에 사람들은 ‘귀에 딱지가 않겠다’라는 반응을 보였다. 그럼에도 불구하고 빅데이터는 여전히 뜨거운 감자다. 많은 기업이 빅데이터를 주목하고 나섰으며, 빅데이터의 가치를 얘기하려고 한다. 그래서 1년전 ‘빅데이터’와 지금의 ‘빅데이터’는 뭐가 다른지 살펴봤다.

지난 2011년 오라클은 샌프라신코에서 열린 ‘오픈월드’에서 ‘빅데이터 어플라이언스’ 솔루션을 선보였다. 이 솔루션은 아파치 하둡 오픈소스 배포판, 오라클 NoSQL 데이터베이스, 하둡용 오라클 데이터 인테그레이션 애플리케이션 어댑터, 하둡용 오라클 로더, 오픈소스 통계 프로그램 ‘R’등으로 구성됐다. 오라클은 이를 통해 웹로그, 동영상, 소셜미디어, 텍스트 등 대용량 비정형 데이터를 하둡과 NoSQL 지원을 통해 해결하겠다고 밝혔다.

오라클은 상용 데이터베이스관리시스템(DBMS) 강자다. 엑사데이터라는 훌륭한 어플라이언스 제품군도 갖고 있다. 그동안 기업들은 정형화된 데이터를 중심으로 분석과 관리할 때 오라클 DB와 솔루션을 사용해 왔다. 그런데 왜 갑자기 오라클은 오픈소스 하둡을 지원하고 나선 것일까.

빅데이터 시대에 접어들면서 기업은 끝도 없이 늘어나는 데이터를 유닉스 기반에서 라이선스 비용을 내면서 처리하는 데 비용 부담을 느끼기 시작했다. 해결책을 찾아보던 기업은 하둡 등 오픈소스 솔루션과 저렴한 x86 서버 인프라를 주목했다. 이는 곧 오라클에게 위기로 작용했다. 여전히 많은 고객들이 중요한 데이터는 유닉스 기반의 오라클 솔루션으로 보관하고 처리했지만, 상대적으로 덜 중요한 가벼운 데이터에 한해서는 x86서버 인프라의 오픈소스 활용을 고려하기 시작했다.

그래서 오라클은 정형화된 데이터와 비정형화된 데이터를 모두 감당할 수 있는 ‘빅데이터 어플라이언스’를 출시했다. 엑사데이터와의 연동도 잊지 않았다. 오라클은 기존 데이터베이스 시장에서 검증된 오라클 시스템의 신뢰성, 유연성과 성능에 기반해 빅데이터 시장에 다가가겠다고 밝혔다. 정형화된 데이터와 비정화된 데이터를 모두 오라클에서 처리할 수 있게 돕겠다면서 말이다.

전략은 통했다. 지금까지는 말이다. 국내 금융권과 증권사, 통신사는 엑사데이터로 1.8페타바이트(PB)에 이를 대용량 데이터를 처리하고 있으며, 여기서 더 나아가 빅데이터 어플라이언스와 연계해 비정형 데이터를 처리하는 법도 고민 중이다.

oracle

“국내 기업에서 여전히 많이 활용하고 있는 데이터는 아직까진 정형화된 데이터 입니다. 빅데이터 등장 후 비정형 데이터에 관심이 몰리긴 했지만, 여전히 기업은 정형화된 데이터에 관심이 많습니다. 빅데이터 시대에 지금 기업은 이 데이터를 얼마나 빨리 처리하는지에 대해 관심을 가지고 있다”라고 설명했다.

나정옥 오라클 엑사데이터 상무는 비정형 데이터라고 해서 꼭 비정형 상태로 분석하는 게 아니라고 내다보았다. 그렇기에 오라클은 급하게 하둡과 같은 NoSQL을 내세워 고객에게 다가가기보다는 검증된 자사 서비스로 빅데이터 시장에 접근하고 있다고 말했다.

현재 오라클은 오라클은 CRM 시스템의 고객정보, 트랜잭션 내 데이터, 웹스토어 거래, 총계정원장 데이터, CDR, 웹로그, 스마트 미터기, 제조센서, 장비 로그 데이터, 트레이딩 시스템 데이터 등 기존 엔터프라이즈 데이터와 시스템 생성/센서 데이터를 빅데이터를 바라보고 있다. 물론 트위터나 페이스북과 같은 소셜 미디어 플랫폼에서 발생하는 소셜 데이터도 빠지지 않는다.

하지만 실제로 기업이 빅데이터 분석 결과를 활용하기까지는 시간이 걸리는만큼, 오라클은 앞서 언급한 데이터를 처리하는 걸 중심으로 빅데이터 시장에 접근했다. 엑사데이터를 매년 새로이 출시하면서 동시에 빅데이터 어플라이언스와의 연계를 강화하고 NoSQL DB2.0을 발표하는 배경이다. 오라클은 오라클 엑사데이터와 함께 오라클 빅데이터 어플라이언스를 사용해 정형, 비정형 엔터프라이즈 데이터를 수집하고 구성, 분석할 수 있다고 설명했다.

“기업이 지금 활용하고 있는 데이터는 엑사데이터와 빅데이터 어플라이언스에서 충분히 다룰 수 있습니다. 오히려 개발자 중심의 NoSQL 데이터베이스 환경을 SQL 환경으로 가져와 쉽게 데이터를 호출해 정렬하고 분석할 수 있게 도와주지요.”

현재 오라클이 빅데이터 시장에서 내세우는 건 압축기술이다. NoSQL 지원도, 하둡 지원도 아니다. 이유는 하나다. 비용절감 효과 때문이다. 압축이 잘 되면 될 수록 기업은 제품을 덜 구입해도 된다. 공간을 덜 차지하기 때문에 장소 대여료도 줄어들 수 있다. 기업은 자사의 중요한 데이터를 데이터 크기에 상관없이 DB에 보관한다. 빅데이터 환경에선 비정형 데이터 못지 않게 정형 데이터도 급증했다. 오라클은 급증한 정형 데이터를 가급적 적은 스토리지와 DB 공간에 담는 게 비용절감을 걱정하는 고객에게 더욱 도움이 될 것이라고 내다봤다.

“빅데이터는 하둡만 의미하는 게 아닙니다. 대용량 데이터 처리를 위해선 분산처리 기술 못지 않게 압축 기술도 발전해야 합니다. 압축이 높을수록 기업은 데이터를 많이 다루면서도 비용을 아낄 수 있으니까 말이지요. 압축도 제대로 하지 않고 무조건 대용량 데이터를 담을 순 없습니다.”

나정옥 상무의 설명에 일부 기업은 이게 바로 엑사데이터와 빅데이터 어플라이언스를 팔려는 상술이 아니냐고 바라볼지 모르겠다. 압축 기술을 언급하면서도 오라클은 은근히 자사 엑사데이터와 빅데이터 어플라이언스만으로 빅데이터를 처리할 수 있다고 강조하고 있다. 데이터를 처리하는 데 필요한 소프트웨어, 하드웨어, 네트워크를 모두 오라클 어플라이언스가 제공하기에, 기업은 오라클 제품만 구입하면 된다면서 말이다.

“오라클이 단순하게 어플라이언스를 판매하려고 나선 건 아닙니다. 데이터를 제대로 다루는 법도 고객에게 함께 안내하고 있습니다. ‘엑사이트(ECXITE)’라는 프로그램으로 말이지요.”

나정옥 상무는 자사 데이터를 제대로 관리하려면 장비 도입 문제 이전에 어떻게 데이터를 활용한 건지에 대한 이해가 선행되야 한다고 강조했다. 그렇기에 오라클은 엑사이트라는 컨설턴트 조직을 통해 기업의 데이터 아키텍처를 진단하고 방향성을 제시한다고 설명했다. 물론 엑사이트는 무료다.

“장비만 팔고 그만이면, 아무도 오라클을 찾지 않겠지요. 이건 서로 좋은 일이 아닙니다. 올바르게 쓸 수 있는 방법을 제시하고 이를 제대로 활용할 수 있게 만드는 법, 이게 바로 올해 오라클이 할 일입니다.”

네티즌의견(총 2개)