[특별기획] (3) 에너지 효율성이 중요한 이유

2006-09-10     도안구

패트릭 P. 겔싱어 인텔 수석 부사장은 “구글의 전용 하드웨어 개발과 관련해서도 협력을 아끼지 않고 있다”고 밝혔다. 범용 서버가 아닌 구글에 최적화된 서버를 개발하기 위해 인텔은 물론 서버 업체들도 접촉을 있다고도 전했다. 


눈을 돌려 국내 상황을 살펴보자. 지난 7월 NHN은 국산 DBMS 업체인 큐브리드와 자체 DB 플랫폼을 공동으로 개발한다고 밝혔다. 두 회사는 보다 효율적인 기업 데이터베이스 관리와 차세대 인터넷 서비스 개발을 위한 인프라를 구축하기 위해 NHN 서비스에 최적화된 고성능 DBMS을 개발한다는 것.


구글이나 NHN을 비롯해 많은 업체들은 자사에 최적화된 비용 효율적인 시스템과 애플리케이션 개발에 눈을 돌리고 있다. 한정된 IT 예산을 기반으로 자사의 서비스가 최적의 안정성과 운영이 필요하기 때문에 범용 제품이 아닌 자사에 맞는 맞춤형 ‘하드웨어와 솔루션’을 도입하려는 것.


차이가 있다면 구글엔 하드웨어 칩을 설계했던 인력들이 풍부하고, NHN은 그렇지 않다는 것. 이는 해외 포털들과 국내 포털들이 동일한 고민을 하고는 있지만 국내 포털들이 해법 마련에는 구글과 같은 유연성을 가지기는 태생적으로 힘들다는 말이다. 물론 포털들이 국내 서버 업체들과의 협력을 어떤 수준까지 끌어올리느냐, 아니면 해외 엔지니어들을 스카웃할 정도로 글로벌한 포털로 성장하느냐에 따라 해법 마련도 달라질 수 있다.


많은 포털들은 x86 서버에 리눅스 운영체제와 MySQL 같은 오픈 소스 소프트웨어를 많이 사용하고 있다. 검색을 위해 도입한 서버들은 클러스터 소프트웨어로 엮어 사용하고 있을 정도로 국내 최고의 오픈 소스 소프트웨어 개발자들이 포털에 포진해 있다. 패키지 소프트웨어 개발 회사와 차이점이 있다면 이들은 서비스 최적화된 소프트웨어에 대한 전문가 집단이라는 점이다.


그렇다면 전력 문제와 이런 하드웨어와 솔루션엔 어떤 상관 관계가 있을까? 이런 상황에서 구글의 루이즈 안드레 바로소(Luiz André Barroso)라는 직원이 개인적으로 ACM Queue에 기고한 글은 동일한 고민을 하고 있는 담당자들에게 유용할 것으로 보인다. 



루이즈 안드레 바로소는 ‘성능과 비용’이라는 주제의 글에서 “극단적인 상황에 다다르면 하드웨어를 24시간 켜놓는 것이 하드웨어 자체보다도 더 많은 비용을 요구할 수도 있는 상황”이라고 전하고 “이상하게 들릴지 모르지만 어쩌면 나중에는 전력회사에서 장기 전력 사용 계약을 맺는 기업에 하드웨어를 무료로 제공하는 시대가 올지도 모른다”고 전력 문제의 심각성을 깨달아야 한다고 전하고 있다.  


그는 대규모 인터넷 서비스 인프라스트럭처의 비용 트렌드와 컴퓨팅 플랫폼의 제반 비용 효율성을 향상시키기 위한 칩 멀티프로세서(Chip Multiprocessor, 이하 CMP) 기반 시스템을 활용하는데 있어 고려사항과 기회들을 살펴보고 있다. 


그에 따르면 구글은 컴퓨팅 인프라스트럭처를 개발하는데 있어서 주된 관심은 단순한 성능 이상의 것이라고 한다. 범용 아키텍처가 아닌 특정한 아키텍처의 강점은 ‘필요로 하는 컴퓨팅 성능을 비용효율적으로 지원할 수 있는가’ 하는 질문에 얼마나 부응하는가에 따라 평가된다. 대부분의 구글 서비스에 필수적인 고도의 컴퓨팅 요구 사양들로 인해 점차 컴퓨팅 비용에 대해 점점 관심을 갖게 됐고 이제는 비용 대비 성능을 최적화하기 위한 하드웨어와 소프트웨어를 찾기 위해 촉각을 곤두세우고 있다는 설명이다.


시스템 비용에 대한 이해

시스템 커뮤니티는 성능을 측정, 모델링, 예측, 및 최적화하는 툴의 보고를 개발해 냈다. 그러나 커뮤니티의 비용 요인에 대한 올바른 인식과 이해는 여전히 미개발 단계에 머물러 있는 상황이다. 비용에 대한 숙지와 이해 없이는 어떤 기술이나 제품의 진정한 효용도 실은 검증됐다고 할 수 없다.


그는 대규모 컴퓨팅 클러스터의 총 소유비용(TCO, Total Cost of Ownership)을 하드웨어 비용, 데이터 센터에 대한 최초의 투자이면서 끊임없이 비용을 요구하는 전력, 데이터센터 운영 비용 및 소프트웨어 인프라스트럭처에 대한 비용, 이렇게 4가지 부문으로 세부적으로 구분하고 있다. 


시스템 구축에 있어 총 소유비용의 주요 요소로 소프트웨어가 지적되는 경우가 종종 있다. TPC-C 벤치마크에 사용되는 시스템의 비용에 대한 조사에서 드러난 바에 의하면 운영체제(OS)와 데이터베이스 엔진의 CPU당 비용은 적게는 4,000달러에서 많게는 2만 달러까지 차이가 난다고 그는 전한다.


그는 "기타 시스템 소프트웨어, 애플리케이션, 관리 소프트웨어에 대한 라이선스 비용까지 감안한다면 이는 다른 전체 비용요소보다 훨씬 더 큰 비중을 차지하고 있음을 알 수 있다"고 말한다.  특히 시스템이 미드레인지 또는 로우엔드 서버를 채택했다면 상대적으로 저렴한 기계를 다수 활용한 것이 되어 CPU당 또는 서버당 라이선스 비용 정책으로 인해 소프트웨어 비용이 더욱 늘어나게 된다는 것. 


이를 위해 구글이 선택한 방법은 무엇일까? 루이즈 안드레 바로소는 "구글은 자체 소프트웨어 인프라스트럭처를 내부적으로 개발하고 오픈소스 커뮤니티와 협업을 통해 소프트웨어 비용을 대폭 절감시킬 수 있었다"며 "물론 소프트웨어 개발 비용은 여전히 부담해야 하지만 대규모 CPU 도입을 통해 상당 부분 상각됐다. 그 결과 구글은 소프트웨어 이 외의 비용 요소를 절감시키고자 집중적인 노력을 기울이게 됐다"고 밝혔다.  





그림 1은 구글의 3 세대가 계승돼 오면서 서버 플랫폼 성능과 서버당 성능, 그리고 전력당 성능의 트렌드를 보여준다. 



루이즈 안드레 바로소는 구글의 하드웨어 솔루션은 로우엔드 서버를 포함하고 있다고 전한다.



구글의 이러한 시스템은 대용량 PC레벨의 요소를 기반으로 하고 있으며, 따라서 각 세대별로 대략 비슷한 수준의 비용 대비 성능 향상을 보이고 있다.


이는 서버당 성능 비용 곡선이 상향하고 있는 결과를 가져왔다. 구글의 결함허용(fault-tolerant) 소프트웨어 설계 방법론은 상대적으로 덜 안정적인 빌딩 블록을 기반으로 높은 가용성을 달성하도록 했다.


루이즈 안드레 바로소는 구글이 이런한 노력에도 불구하고 전력 와트(watt)당 성능은 시간이 가도 여전히 비슷한 수준에 머무르고 있다고 전한다. 심지어 전력 효율성을 향상시키려는 노력에도 별다른 개선이 없는 것이 사실이다. 그는 "다시 말해서 성능 개선은 전력 소모 현황에서 본다면 상대적인 인플레이션을 맞고 있는 셈"이라고 말했다. 이러한 트렌드는 전력 관련 비용이 TCO에서 차지하는 비용이 점차 늘어나고 있는 현실로 드러나고 있다고 한다.


이러한 트렌드는 컴퓨팅 비용이 어떻게 구성되어 운영되는가를 고려할때 시사점이 매우 크다고 루이즈 안드레 바로소는 전한다. 간접적인 전력 비용을 배제하고 순수하게 에너지에만 중점을 두어 진행된 분석은 충격적이다. 일반적인 로우엔드 X86 기반 서버의 가격은 대략 3,000 달러 정도다. 이 제품은 피크타임에는 300와트 이상의 전력을 사용하지만 평균잡아 200 와트 정도의 전력을 소모한다.


루이즈 안드레 바로소는 "전력 공급의 비효율성과 오버헤드는 이 에너지 예산을 금새 두 배로 올려 놓는다"고 주장한다. 그는 또 "기본 에너지 비용을 시간당 9센트로 가정하고 서버가 대략 4년 정도 수명을 한다고 하면 시스템의 에너지 비용은 이미 하드웨어 비용보다 40% 높아짐을 알 수 있다"고 이 문제의 심각성을 주장하고 있다.  




그에 따르면 상황은 더욱 악화되고 있다. 와트당 성능이 향후 수년간 동일 수준으로 유지된다면 전력 비용은 오히려 하드웨어 비용을 엄청난 마진으로 가볍게 넘어설 것이라는 것. 



그림 2(왼쪽)
는 이러한 가정을 근거로 성능과 전력 증가에 대한 연간 비용을 4가지 수준으로 설명하고 있다. 



가장 급진적인 케이스로 연간 50% 증가한다고 가정한 경우 전력 비용은 얼마 가지 않아 서버 비용을 우습게 만들 것이다.


그나마 이는 향후 수년간 에너지 가격이 증가하지 않는다는 가정을 했을 경우라는 것. 루이즈 안드레 바로소는 극단적인 상황에 다다르면 하드웨어에 전력을 켜놓는 것이 하드웨어 자체보다도 더 많은 비용을 요구할 수도 있는 노릇이다. 이상하게 들릴지 모르지만 어쩌면 나중에는 전력회사에서 장기 전력 사용 계약을 맺는 기업에 하드웨어를 무료로 제공하는 시대가 올지도 모른다고 경고한다. 


컴퓨팅 전력 소모의 통제가 어렵다는 가정은 전체 컴퓨팅 비용 효율성 문제에 있어 심각한 위협으로 다가오고 있다. CPU가 시스템 전원 예산에서 차지하는 비중은 미미할지 모르나 이 비중이 로우엔드 서버 플랫폼에서 50-60%로 뛰어오를 수 있다는 사실을 명심해야 한다고 끝을 맺고 있다.