[주간스토리지] 인포그래픽: 데이터 아카이빙

가 +
가 -

데이터 아카이빙에 관한 흥미로운 인포그래픽

최근에 인포그래픽이 커뮤니케이션의 중요한 수단으로 사용되면서 유용하면서도 직관적인 인포그래픽이 많이 나오고 있습니다. 물론 어떤 것은 정신사나워서 보다가 피로감을 느끼는 것도 있지만 대개의 경우 상당히 많은 정보를 그림으로 잘 표현해 주고 있습니다.

리마지에서 내놓은 인포그래픽을 보니 데이터 아카이빙에 관한 필요성을 언급하고 있는데요, 지난 9월 100여명이 넘은 중역들을 대상으로 온라인 설문을 했다고 합니다. 표본집단에 관한 설명이 많지 않아 이러한 결과를 일반화하기에는 많은 무리가 있을 것 같지만 관심의 비중 정도는 충분히 확인할 수 있을 것 같습니다. 다만 리마지의 제품이나 기술이 CD/DVD, 블루레이 등의 옵티컬 미디어 기술, 서베일런스, 디지털 포렌직, 의료 및 방송 영상 아카이빙 등에 초점이 맞춰져 있으므로 티어1에 해당되는 스토리지 기술보다는 아카이빙에 포커스를 두었다는 것을 염두에 두고 자료를 보면 좋을 것 같습니다. 그럼 그 내용을 하나씩 살펴 보기로 하겠습니다.

데이터 아카이빙 기간에 대한 설문에서 10~20년 사이가 35.5%로 가장 높고 그 다음이 20~50년이 33.1%로 높았습니다. 5~10년으로 응답한 경우도 28.2% 정도 되는데요, 기업 데이터를 이렇게 유지하고 싶은 이유는 중요한 지적 자산의 손실을 막고자 하는 이유가 81.5%로 가장 많은 선택을 받았고 그 다음으로는 규제 준수(73.4%), 벌금과 법적 조치(52.4%), 느린 파일 복구(51.6%) 등으로 상당한 이유는 자산 보호와 규제(compliance)와 관계된 사항이었습니다. (아래 그림 참조)

(출처: 리마지 블로그, 2012, 원문 인포그래픽 링크)

‘자신의 의료 기록을 어떻게 받고 싶은가’란 항목에서는 ‘디스크 형태로 받고 싶다’는 응답이 48.4%로 가장 높았고 그 뒤를 ‘종이문서로 받고 싶다’는 응답이 21.0%, ‘온라인 상에서 확인할 수 있도록 하라’는 응답이 13.7%, ‘이메일로 받고 싶다’는 응답이 6.5%였습니다. 생각보다 종이문서로 받고자 하는 응답이 높네요. 디스크 형태로 받고 싶은 이유에 대해서 온라인 형태의 접근 보다는 디스크가 안전하다고 생각한 응답자가 45.2%로 가장 높아 인터넷 해킹에 대한 우려를 반영한 것이 아닌가 하는 생각이 듭니다. 그 뒤를 본인이 그 데이터를 보관할 수 있다는 것이 40.3%로 높았는데요. 디스크 형태로 받아서 직접 저장하여 보관하고 싶은 마음이 강한가 봅니다. (아래 그림 참조)

(출처: 리마지 블로그, 2012, 원문 인포그래픽 링크)

설문지를 직접 확인할 수 없었지만 리마지의 솔루션이 CD, DVD, 블루레이 등으로 아카이브를 하고 MD5 같은 해싱 처리를 하기 때문에 다소 의도가 있는 문항을 넣지 않았을까 하는 생각을 해 봅니다. 그래서 의료 기록이나 디지털 사진 등에 대해서 평생 보관을 하고 싶다는 응답이 각각 62.9%, 89.5%로 나왔는데요. 신기한 것은 의료기록이 디지털 사진보다 낮다는 점입니다. 어떤 의도에서 이러한 결과가 나왔는지 모르겠지만 단순히 이 결과만 놓고 본다면 사람들은 추억을 더 소중하게 생각한다는 뜻일까요. 아니면 의료 기록은 어차피 기관에서 보관될 테니 개인 차원에서 보면 디지털 사진이 더 중요하다고 하는 합리적인 판단을 하는 것일까요.

업종 별로 데이터 저장 어떻게 할까

앞서 리마지의 설문에서도 비록 작은 부분이었지만 온라인 상으로 의료 데이터를 보는 것에 관한 우려가 있었는데, 그렇다면 과연 업종별로 데이터 저장 방법이나 위치에 관한 생각, 차이가 있을까요. 있다면 얼마나 있을까요. 막연한 생각입니다만, 있을 것 같은데요. 백업 및 DR 소프트웨어 개발사인 패러곤소프트웨어그룹(PSG)이 이런 조사를 했네요. PSG에 따르면 지난 8월 29일부터 9월 7일까지 377명의 IT 전문가들을 대상으로 데이터 저장에 관한 방법을 업종별로 조사·정리했는데, 대표성을 담보하기는 어렵지만 어느 정도의 인사이트를 제공한다는 측면에서 흥미로운 내용이 있어 소개합니다.

설문 결과 대개의 경우 로컬 서버 스토리지에 중요한 데이터를 가장 많이 저장한다고 하였는데요. 절반이 넘는 52.6%가 이렇게 저장한다고 하였습니다. 그 뒤를 NAS가 차지하였는데요. 51.2%가 여기에 응답을 하였습니다. 그밖에 테이프는 38.8% 정도를 차지하였고 가장 흥미로웠던 클라우드의 경우 약 30% 정도라는 것입니다.

중요한 데이터를 순서대로 보면 로컬 서버 스토리지, NAS, 테이프, 클라우드 순서로 저장한다는 것은 일반적으로 스토리지 아키텍트들에게 있어 사실상 거의 보이지 않는 법칙이라고도 할 수 있는데요. 흥미로운 것은 생각보다 테이프가 많은 비중을 차지했다는 점이고 이것을 어떻게 보아야 할지에 대해서는 판단이 필요해 보이지만 설문조사 차원의 결과에서 의미를 두고 해석할 필요가 굳이 있겠는가 하는 생각이 드네요.

그렇다면 업종별로 중요한 데이터 배치가 어떠한 비중으로 위치될까요? PSG의 텍스트 결과(아래 그림 왼쪽)를 보다 시각적으로 재정리(아래 그림 오른쪽 그래프)했습니다.

업종별로 업무의 특성과 중요도 수준에 따라 상당히 분포가 다르다는 것을 확인할 수 있습니다. 무엇보다도 클라우드의 경우 그러한 현상은 극명하게 다르게 나타나고 있는데요. 헬스케어는 제도적으로 클라우드를 사용하기 어려웠고 우주·항공분야의 경우 데이터의 크기와 양, 애플리케이션 등에 있어 클라우드와 적합하지 않을 것입니다. 소매, 유통, 통신과 금융 등은 클라우드의 적용이 많은데요. 클라우드로의 더 많은 전환이 이뤄질 경우 비중이 더 많이 달라질 것입니다. 다만 동작하는 플랫폼이 퍼블릭 클라우드냐 아니면 프라이빗 클라우드냐 하는 것에 대한 차이가 될 것입니다. 외부와의 인터페이스가 많은 시스템을 많이 가지고 있는 유통이나 도·소매 업종의 경우 클라우드로 상당히 전환하기 쉬울 텐데, 다만 보안 수준과 하이브리드 형태의 클라우드가 보편적이지 않을까 하는 생각을 해 봅니다.

PSG의 이러한 설문 조사를 전적으로 신뢰하기보다는 대략 이 정도의 수준으로만 이해하는 것이 바람직해 보입니다. 일단 스토리지 차원에서의 분류가 MECE(Mutually Exclusive and Collectively Exhaustive)하지 않습니다. 게다가 데이터와 스토리지 등에 관한 체계적인 이해를 전제로 하지 않고 있으며 클라우드에 관해서도 퍼블릭과 프라이빗 등을 구분하지 않아 데이터의 위치가 로컬인가 아닌가 하는 전제가 성립되지 않습니다. 상당히 엉성한 설문조사에 대한 결과이기 때문에 결과를 의지하기 보다는 의식적인 재해석이 필요해 보입니다. 다만 클라우드에 관한 영감은 얻을 수 있을 것 같군요.

네티즌의견(총 0개)