트렌드

ARM “2년 뒤 스마트폰 3배 이상 빨라진다”

2012.11.21

ARM은 벌써 20년이 훌쩍 넘은기업이지만 요즘처럼 입에 많이 오르내리는 적도 없는 듯하다. 자동차 센서부터 스마트폰, TV, 심지어 윈도우 PC에까지 들어가는 게 ARM 기반 프로세서다 보니 그 근본이 되는 아키텍처에도 큰 관심이 쏠리게 된다. ARM은 최근 새 아키텍처를 발표하고 스마트폰의 성능과 전력 효율을 끌어올리는 것은 물론이고 RISC 기반의 서버 시장에도 눈독을 들이고 있다. 새 아키텍처의 특징을 잘 들여다 보면 2년 뒤 스마트폰을 내다볼 수 있다.

ARM의 새 아키텍처는 성능과 전력에 대한 고민을 함께 풀어내고 있다. 먼저 ARM v8 아키텍처부터 살펴보자. ARM v8 아키텍처에는 코어텍스 A53과 A57이 있다. A53은 저전력에, A57은 고성능에 초점이 맞춰져 있다. A53 아키텍처는 A9와 비슷한 성능을 내지만 전력 소비는 4분의 1밖에 안 된다. 적은 전력으로 작동하는 ARM의 특성을 잘 살린 제품이다. 이와 달리 A57은 A9와 같은 전력으로 3배 이상의 성능을 낸다. 64비트로 최적화되면 그 이상의 성능 향상도 기대할 수 있다. 같은 전력으로 더 많은 일을 할 수 있게 되는 셈이다. ARM은 이 프로세서들을 적절히 섞어 스마트폰 뿐 아니라 태블릿, 저전력 서버에까지 영역을 넓혀 나가려는 전략을 세웠다.

그 중심에 빅리틀 전략이 있다. ARM은 이 두 개 프로세서를 잘 섞은 제품을 기대하고 있다. MP3 재생처럼 적은 힘으로도 돌릴 수 있는 일들은 A53으로 처리하고, 게임처럼 고성능 프로세스가 필요한 일에는 A57을 돌린다. ARM의 설계로는 A53으로 돌리던 일이라도 급작스레 요구 성능이 늘어나면 A57로 스레드를 넘길 수 있다. 황광선 ARM 과장은 향후 로드맵에 애초에 컴퓨터 자원을 얼마나 이용할지 예측해서 프로세서를 고르는 기술도 더해질 계획이라고 덧붙였다.


▲두 가지 프로세서를 묶어 쓰는 빅리틀 전략은 프로세서의 다양한 설계를 가능케 한다.

이 프로세서들은 하나의 칩 다이 안에 여러 조합으로 앉혀진다. A57 2개에 A53 4개를 더하고 말리 그래픽 코어를 붙이는 슈퍼폰용 프로세서를 구상하거나, 각각 4개의 코어를 묶어 8개 코어를 지닌 PC·태블릿용 프로세서가 나올 수도 있다. 전력 소비는 줄어들고 컴퓨팅 성능은 높아지는 것이다. 애플이 맥에도 ARM 기반의 프로세서 도입을 고민한다는 이야기도 마냥 터무니없는 상상은 아니다. 비슷한 작동 속도에 코어 크기가 작아지고 컴퓨팅 성능이 늘어나니 역시 가장 반길 시장은 스마트폰쪽이다. 새 프로세서들은 현재 주력 제품인 A9에 비해 4분의 1크기로 작아진다니, 단순히 생각해도 4배 더 많은 코어를 담을 수 있다. 쿼드코어 정도가 아니라 A57과 A53이 각각 4개씩 들어가는 옥타코어 프로세서를 떠올리는 것도 어렵지 않다. 최대 16코어까지 하나의 칩에 넣을 수 있다니, 괴물 스마트폰이 나올지도 모르는 일이다.

저전력 서버에 대한 설계도 있다. A57을 4코어씩 묶은 세트를 4개 합치면 하나의 칩에 16개 코어가 들어간다. 여기에 GPU를 이용한 컴퓨팅을 할 수 있는 말리 T600 시리즈를 품는다. 각 개별 코어의 성능은 미약할지 몰라도 이를 16개씩 묶고 GPGPU 기술을 더하면 그 성능을 무시할 수 없다. 더욱이 이런 칩 하나의 부피가 크지 않기 때문에 이를 여러 개 묶어 병렬 컴퓨팅을 할 수 있다. 실제 이렇게 만드는 서버가 어느 정도까지 성능을 낼 수 있을지는 아직 알 수 없지만, 단순한 연산을 수없이 잘게 쪼개 처리하는 슈퍼컴퓨팅, HPC 영역에서는 충분히 관심을 가질 만하다. EU가 코어텍스 A15를 기반으로 한 삼성의 엑시노스5 프로세서로 슈퍼컴퓨터를 설계한다는 것을 보면 ARM 프로세서의 성격을 그저 저전력에만 맞출 게 아니다.


▲빅리틀은 슬슬 풀리기 시작하는 코어텍스 A15과 A7프로세서로도 구성할 수 있다. 성능과 전력을 모두 만족할 만하다.

ARM의 그래픽 프로세서 말리 이야기도 더 해보자. 이 GPU는 3D 게임을 가속하는 데에만 쓰는 것은 아니다. 물론 스마트폰에 주로 쓰는 말리 T400 시리즈는 오픈GL2.0 명령어를 처리하는 그래픽 코어다. 하지만 상위 기종인 말리 T600 GPU는 그래픽 코어를 병렬 컴퓨팅 자원으로 이용하는 GPGPU에 최적화돼 있다. 오픈CL 뿐 아니라 구글의 렌더스크립트컴퓨트, 마이크로소프트의 다이렉트컴퓨트까지 처리할 수 있어 리눅스, 윈도우, 안드로이드 환경에 맞춰 병렬 컴퓨팅을 할 수 있다.

이를 앞에서 이야기한 것처럼 성능을 끌어올린 A57 프로세서와 더하면 CPU와 GPU 컴퓨팅이 더해지는 헤테로 지니어스 컴퓨팅 환경이 갖춰진다. 정확한 수치는 이를 직접 심은 프로세서 완제품이 나와봐야 알 수 있지만, ARM은 8개 말리 GPU를 묶으면 수백GFlops(기가플롭스) 정도가 될 것이라는 정도로만 설명한다. 1GFlops는 1초에 10억번 연산처리를 할 수 있는 수치다. 직접적으로 비교할 수는 없지만 AMD의 2세대 APU 트리니티가 700GFlops 성능을 낸다는 점이 참고가 될 수 있겠다.

ARM의 영역은 이 프로세서들이 나오면서 더 넓어질 것이다. ARM의 새 디자인들은 안드로이드와 윈도우 등 운영체제를 넘나들며 인텔의 저전력 프로세서 아톰을 더 강하게 몰아붙일 것이다. ARM v8 아키텍처로 디자인된 프로세서들은 2014년부터 공급된다.

allove@bloter.net

프리랜서 IT 컬럼니스트, 기술과 사람이 더 가까워질 수 있는 이야기를 담고 싶습니다. e메일 work.hs.choi@gmail.com