주간 스토리지 소식[11/9~11/13]

가 +
가 -

OCZ, 샌드포스에서 SSD 컨트롤러 받는다

ocz-ssd SSD 제조업체인 OCZ(OCZ Technology Group Inc.)가 자사의 SSD 컨트롤러로 샌드포스(SandForce)의 제품을 들여오기로 했답니다. OCZ는 국내에서도 PC 부문에서 상당히 인지도가 높은 회사로, PC 시장 뿐만 아니라 기업용 시장에서도 SSD 공급을 위해 SLC 타입의 플래시 메모리 디스크를 출시하고 있습니다. OCZ는 향후 SLC 타입은 기업용으로, MLC 타입은 일반 소비자 용도로 출시할 것이라고 합니다. SLC 타입과 MLC 타입은 이미 몇 차례 소개해 드린 바와 같이, SLC 타입의 제품이 MLC 타입의 제품보다 성능, 제품 수명 면에서 월등합니다. 인터페이스는 크게 두 부분으로 나뉘어 지는데요, 3Gbps SATA와 6Gbps SAS 등이며 용량은 50GB~400GB에 이르기까지 다양합니다.

SandForce 샌드포스는 대체 어떤 회사일까 궁금합니다. 홈페이지를 보니 SSD 컨트롤러, 프로세서 등을 제조하는 업체이고 이 방면에서는 인지도가 높은 회사더군요. 2006년 12월에 설립된 회사로서 현재 20개가 넘는 특허를 가지고 있고 미국(CA) 사라토가(Saratoga)라는 곳에 있네요. ESG의 평가에 따르면(물론 이러한 평가가 절대적인 것은 아니지만), ‘SSD계에 숨어 있는 최고’라는군요. 샌드포스의 컨트롤러 SF-1500 이라는 모델은 현재 최대 16개의 플래시 메모리 디바이스를 부착할 수 있고 SAS와 SATA 인터페이스 지원, AES 암호화, 30,000IOPS, 5년 품질 보증 등을 자랑하고 있습니다. 플래시 제조와 컨트롤러 제조, 그것을 가져와서 완성품의 SSD 제조 및 판매 등 이 시장도 분업화 경향을 보이고 있군요.

그런데, OCZ는 이러한 새로운 SSD 제품을 2010년 국제 CES에서 선보일 것이라고 하는데요, 참 일찍도 팡파르를 울린다는 생각이 드는군요.

스펙트라로직 테이프 라이브러리 180PB까지 확장

기업들의 데이터가 계속 증가함에 따라 1차 스토리지와 2차 스토리지의 용량도 커지고 있습니다. 특히 2차 스토리지라고 할 수 있는 아카이브나 백업 저장장치의 경우 그 용량이 1차 스토리지에 비해 더 많이 필요해지는데, 통상 백업 저장장치는 1차 스토리지와 비교해 적게는 2~3배에서 많게는 4~5배 정도가 필요하니, 중복 제거 기술이 매우 절실한 것이 현실입니다.

한편 용량이 커진다는 것은, 제조업체의 입장에서는 사업적인 기회가 될 수도 있겠지만, 많은 데이터를 관리해야 한다는 것은 그 만큼 기술의 진전(관리 기능, 발열 문제, 액세스 속도 등)을 이뤄야 함을 의미합니다. 그런 의미에서 볼 때 스펙트라로직의 이번 용량 확장성을 보면서 참으로 많은 생각이 듭니다. 일단, 하나의 라이브러리에서 확장할 수 있는 수준이라는 것이 있기 때문에 LTO 기술을 기존 LTO-4가 아닌, LTO-5를 사용하였을 것으로 보입니다. 스펙트타로직에서는 이렇게 용량을 확장할 수 있는 제품이 아직 출시되지는 않고, 개발을 했다고 하는 소식을 전하고 있는데요, 현재 LTO 로드맵 상에서 볼 때 내년(2010년) 4월까지는 기다려야 LTO-5를 기대할 수 있을 것일텐데 말이죠. 하지만 제품은 12월에 나온다고 합니다.

스펙트라로직에 따르면, 이번에 개발한 제품이 경쟁사의 어느 제품보다 면적당 수용용량이 더 크다고 합니다. IBM TS3500은 제곱 피트(feet) 당 42TB, Sun의 SL8500은 50TB인데 반해, 스펙트라로직의 제품은 72 제곱 피트라고 하는군요. 정확히는 할 수 없겠지만 1미터(m)가 3.2 피트(feet)이니까, 가로 X 세로 0.3㎡ 정도가 되는가요? 물론 이러한 비교는 IBM과 Sun 제품 모두 LTO-5로 했을 때 이야기입니다. 이러한 대용량 라이브러리의 슬롯은 라이브러리당 3만개, 라이브러리를 연결할 경우 12만개에까지 슬롯을 만들 수 있고, 전력 소비량은 873와트(watt)로, TB 당 소비 전력을 따져 보면 대략 0.35와트 정도 되기 때문에 여느 제품보다 상당히 저전력으로 설계되었음을 알 수 있습니다. 대개의 테이프 라이브러리 소비 전력은 1,200~1,800와트 정도 되는데, 전력 면에서 볼 때 합격점이라고 할 수 있겠군요. 장착할 수 있는 드라이브는 최대 12개라고 하는데, 용량이 커서 이런 생각이 드는 건지 모르겠습니다만, 생각보다 적은 것 같다는 생각이 드는군요.

가격의 경우 시작가가 21만8,500달러부터 시작하고, 최소 사양은 LTO-4 두 개의 FC 타입의 드라이브, 2개 로봇 암, 암호화, 관리 소프트웨어 등을 포함합니다. 향후 LTO-5와 SAS, iSCSI 인터페이스를 지원한다고 하니 기대해 볼 만합니다. 제조사 측에서는 다음 주에 열릴 2009년도 슈퍼컴퓨팅 컨퍼런스에서 공개할 것이라고 하네요. 궁금해 집니다.

SNIA, 데이터 보호에 관한 구매 가이드 발간

snia_logo_n_s SNIA라는 단체가 있습니다. 스토리지 업체들이 결성한 산업 협의체(SNIA: Storage Networking Industry Association)인데요, 여기 홈페이지를 보면 의외로 좋은 자료들이 많습니다. 비교적 객관적인 시각으로 업체들의 제품과 각종 스토리지 컨셉과 이론 등을 확인해 볼 수 있습니다. 통상 제조업체의 입장에서 작성된 자료를 보다 보면 용어의 자의적 해석, 왜곡된 개념과 이론 등으로 기업이나 기관의 소비자 입장에서 잘못 인지되고 있는 경우를 볼 수 있는데, SNIA의 자료는 그런 면에서 비교적 자료의 객관성을 유지하고 있습니다.

이 단체에서 2009년도 가을판이 나왔습니다. 지난달(10월) 기준으로 작성이 완료되어 지금은 일반에 공개되었습니다. CDP(Continuous Data Protection)을 비롯해, 중복제거(Deduplication), VTL(Virtual Tape Library) 등에 관한 개념과 제조업체의 제품 설명, 제품들간의 비교 등을 자세히 수록해 놓았습니다. 「Data protection initiative – Members buyer’s guide 6th Edition」이라는 이름으로 출시된 이 자료에서 몇 가지만 보도록 하겠습니다.

CDP의 정의: SNIA에서는 CDP를 “독립적으로 떨어져 보관되어 있는 프라이머리 데이터의 변동을 계속해서 캡쳐하고 추적하여, 과거의 어느 시점으로든 복구할 수 있는 방법론”으로 정의하고 있습니다. 그래서 CDP는 기본적으로 3가지 속성을 가지게 되는데요, 첫째 데이터의 변경을 지속적으로 보관하고 추적해야 한다는 것이고 둘째, 모든 변경된 데이터는 1차 데이터 보관소(primary storage)와는 독립적으로 분리된 스토리지에 보관해야 한다는 것입니다. 마지막으로 세번째, (사실 이 부분은 논란의 소지가 있을 수 있는데요) RPO 즉 목표로 하는 복구 시점을 자의적으로 할 수 있어야 하며 실제 복구를 위해서 사전에 정의될 필요는 없을 것을 전제로 하고 있습니다. 여느 CDP의 정의보다 확실한 정의라고 생각됩니다. 특히 CDP의 마지막 요건이라고 한 RPO의 시점 선택이 특정한 시점에서의 사본이 아니라는 것을 명쾌히 하고 있습니다. 그러한 면에서 스냅샷과는 분명히 선을 긋게 되는 셈이죠. SNIA는 CDP 제품의 비교를 EMC RecoveryPoint CDP와 팔콘스토어(FalconStor) CDP 두 개의 제품을 하고 있으며 상세한 내용은 해당 자료를 참조하여 주세요.

중복제거(Deduplication)의 비교: 스토리지 비즈니스에서 중복 제거만큼 말 많은 것은 SSD를 제외하면 없을 것입니다. SNIA에서는 중복 제거 제품들을 비교하는 의미 있는 항목들을 제시하였습니다. 제품들의 고유 설계에 따라 다양하기 때문에 이것이 저것보다 더 낫다 혹은 못하다는 것은 좀 의미가 없을 것입니다. 결국 선택은 소비자가 해야 할 것이지만 다만 차이점에 대해서는 분명히 알아야겠죠. SNIA가 제시한 항목들로는 중복성 판단 방법(Granularity), 언제 중복 제거를 하는가, 어디서 중복 제거를 하는가, 관리 인터페이스, 중복 제거와 복제(Replication), 연결성(connectivity), 압축(compression), 애플리케이션 지원성, 기타 등으로 나누고 있습니다.

  • 중복성 판단 방법(Granularity): 적당한 단어를 찾지 못해 엉성한 번역을 해 보았는데요, 중복 여부를 어떻게 판별하는가 하는 것입니다. 이를 테면 싱글 인스턴스만 저장하는 저장소(SIS; Single Instance Storage)를 두는 방식은 파일(file)에 대해서 중복되었는지 여부를 판단하는 방식으로 채택할 것입니다. 하지만 고정형 길이(fixed length)의 분절(chunking) 또는 가변형 길이(Variable length)의 분절은 블록 데이터(block data)의 길이를 특정 길이만큼 잘라서 중복성 여부를 판단하게 될 것입니다. 고정형 길이와 가변형 길이에 대해서는 어느 것이 더 좋은가에 대한 논란은 있습니다. EMC 아바마(Avamar), 넷워커(NtWorker), 데이터 도메인(Data Domain), 히다찌 프로텍티어(ProtecTIER), NEC 하이드라스토어(HYDRAstor), 퀀텀(Quantum) 등은 가변형 길이 방식을 채택하고 있고, 나머지 중복 제거 제품(엑사Exar, 팔콘스토어, 넷앱NetApp)들은 고정형 길이를 채택하고 있습니다. 효율성(중복제거비율) 면에서 볼 때 가변형 길이가 나은 방식일 수 있으나 처리 성능 면에서 볼 때는 고정형 길이가 나을 수 있습니다. 고정형 길이와 가변형 길이가 갖는 차이는 거의 없습니다. 중복성 판단 방법의 마지막으로 차분 추출 방식도 있는데요, 차분(differencing) 데이터를 뽑아 내 저장하는 방식으로 HP, 세파톤(Sepaton )만이 이 방식을 채택하고 있습니다.
  • 중복제거가 어디서 일어나는가: 중복 제거를 말하는 방식에서 가장 많은 분류 방식이 바로 이것이 아닌가 싶을 정도인데요, 인라인(inline), 포스트 프로세싱(post-processing), 정책 기반(policy-based) 방식으로 나뉘어 집니다. 인라인 방식의 제품들은 데이터도메인, 아바마, HP Dynamic Deduplication, 퀀텀 DXi3500, 히다찌 프로텍티어 등이 여기에 속하며, 포스트 프로세싱 방식은 팔콘스토어, HP Accelerated Deduplication, 넷앱의 제품들, 세파톤 델타스토어(DeltaStor), 썬의 Virtual Tape Library plus with ECO 등이 여기에 해당 됩니다. 마지막 정책 기반이라고 하는 것은 특정 시간에 중복 제거를 한다는 것으로 퀀텀의 DXi2500-D, DXi7500 Express, DXi7500 Enterprise 등이 여기에 해당되는 것입니다.
  • 어디서 중복 제거를 하는가: 중요한 것 같기도 하고 중요하지 않은 것 같기도 하고 포인트를 어디에 두는가에 따라 가장 많은 논란을 불러 일으키는 요소가 바로 이것입니다. 중복 제거를 소스 차원에서 할 수도 있고, 타깃 즉 저장장치 차원에서 할 수도 있습니다. 중요한 것은 리소스의 중요도를 어디에 두는가 하는 것입니다. 백업 소스 차원에서 중복 제거를 하게 되면, 호스트의 리소스를 사용하여 중복 제거 처리를 하게 됩니다. 따라서 운영 애플리케이션의 시스템 사용율이 높다면 이 방식은 피해야 할 것입니다. 반대로 현재 시스템의 사용율이 낮다면 소스 차원에서의 중복 제거도 의미가 있습니다. 소스 차원의 중복 제거는 백업 네트워크를 줄일 수 있다는 데 주안점을 두는 것입니다. 즉 백업되는 양을 줄이게 되면 네트워크에 흘러가는 데이터의 양이 줄게 되고 그렇게 되면 백업 윈도우(backup window) 즉 백업 시간이 줄어들게 되는 장점이 있게 됩니다. 하지만 앞서의 지적과 같이 호스트의 리소스를 사용하여 중복 제거를 하게 되고, 백업 소프트웨어와 같은 에이전트(agent) 소프트웨어를 호스트에 설치하여야 하는 부담을 안게 된다는 면에서 백업 타깃에서의 중복 제거가 쉽게 사용자들이 선택하는 방법이기도 합니다. 기존의 백업 프로세스를 그대로 두고 백업 소프트웨어 역시 그대로 사용하면서 중복 제거는 백업 장치에서 실시하기 때문에 백업 환경에 대한 변경이 매우 적다는 점이 장점입니다. 하지만 백업 네트워크에는 데이터의 양이 중복 제거 도입 전과 동일한 양의 데이터가 다니기 때문에 네트워크의 효율성 면에서는 단점이 있습니다. 절대적인 비교가 안되는 상황에서 두 개의 아키텍처를 비교한다는 것은 무리가 있습니다. 다만 주안점을 어디에 둘 것인가가 중요한 관건이 되겠습니다.
  • 복제와 압축: 복제(replication)는 중복 제거의 성장 가능성을 가장 크게 해 준 기능일 것입니다. 중복 제거를 하는 목적 중 하나는 디스크 스토리지의 양을 줄이고자 하는 것도 있겠지만 원격지의 복제의 실현 가능성을 높이고자 하는 것입니다. SNIA의 이번 제품들 간의 비교에 있어 가장 취약한 부분이 여기인데요, 복제 기술의 지원성을 유무(有無)정도로만 판별하고 그 이상을 못하고 있습니다. 중요한 것은 좀 더 깊은 수준으로 들어가서 복제의 실제 구현 가능성을 짚어봤으면 좋았을 것인데요, 이 부분에 있어 상당히 취약한 분석 리포트를 제시하고 있습니다. SNIA의 자료에 따르면 단 하나의 제품을 제외하고는 모든 제품이 복제를 지원하는 것으로 나와 있지만 중복 제거의 기술에서 지원이 된다는 것인지, 아니면 스토리지 어레이의 복제 기술을 사용한다는 것인지에 대한 분명한 설명이 아예 없습니다. 이것이 어떻게 보면 SNIA의 태생적 한계 때문일 것인데요, 전체적으로 좋기는 하지만 이런 부분에서 아쉽네요. 압축 역시 그러한 면을 보이고 있어서 요즘 흔한 말로 좀 씁쓸하네요.

SNIA에 대해서 사실 불만 어린 이야기들도 많습니다. 그도 그럴 것이 SNIA는 업체들의 연합체입니다. 회원사들끼리 출자해서 자신의 이익과 공영(共榮)을 도모하는 기관입니다. 공영(公營) 기관이 아닙니다. 그래서 신생 스토리지 업체의 등장을 막는 역할도 하고 기술 혁신을 가로막는 역할을 하기도 합니다. 그래서 SNIA를 Stopping Network Innovation Altogether, 다시 말해 ‘다 같이 모여 기술혁신을 중단하자’는 곳이라는 비아냥도 듣습니다. 일면 맞는 이야기입니다. 좋은 이야기는 하는데 좋지 않은 이야기는 절대 하지 않습니다. 그런 의미에서 볼 때 자본에 독립적인 기관이나 단체가 기술에 대한 분명한 평가를 할 수 있으면 좋겠다는 생각을 해 봅니다. 자본주의 사회에서 그런 기관이 있을 수 있겠는가 하는 근본적인 물음에 어쩔 수 없으려니 하지만 이런 자료를 보고, 깊게 파 헤치다 보면 아쉬움이 많이 남아 이렇게 몇 자 적어 봅니다.