초당 연산속도 700PF(페타플롭스, 70경). 엔비디아가 지난해 공개한 슈퍼컴퓨터 ‘DGX 슈퍼POD’의 2세대 모델의 연산속도다.

DGX 슈퍼POD 2세대는 △140개의 DGX A100 시스템 △1120개의 엔비디아 A100 GPU △170개의 멜라녹스 퀀텀 200G 인피니밴드 스위치 △15km 광케이블 △4PB 스토리지로 구성됐다. 속도만 따지면 전 세계 슈퍼컴퓨터 중에서 20번째다. 약 1년 전에 공개된 1세대 슈퍼POD의 연산속도 9.6PF와 비교해 성능면에서 큰 개선이 이뤄졌다.

▲  엔비디아가 공개한 DGX 슈퍼POD 2세대 모델. 연산속도와 확장성이 크게 개선됐다 /사진=엔비디아
▲ 엔비디아가 공개한 DGX 슈퍼POD 2세대 모델. 연산속도와 확장성이 크게 개선됐다 /사진=엔비디아

엔비디아는 DGX 슈퍼POD를 확장 가능한 20개의 DGX A100 시스템 그룹으로 모듈화 했다. 각각은 멜라녹스 HDR 인피니밴드를 사용하는 2티어 팻트리(Fat-Tree) 스위치 네트워크 토폴로지로 지원되며, 초과가입(Oversubscription) 없는 양방향(bisection) 대역폭을 제공한다.

DGX A100에는 시스템 당 최대 9개의 인터페이스를 갖는 200Gbps HDR 인피니밴드를 갖춘 멜라녹스 ConnectX-6 VPI 네트워크 어댑터가 제공된다.

또한, 스위칭 티어를 추가하면 드래곤플라이+(DragonFly+)나 팻트리 토폴로지를 사용해 수천대의 시스템으로 확장할 수 있으며, 엔비디아 DGX 슈퍼POD와 DGX A100을 통해 사용량 기반 지불방식(pay-as-you-grow) 모델로 손쉽게 확장할 수 있다.

엔비디아는 이를 통해 기업은 운영에 미치는 영향을 최소화하는 AI 네트워크 패브릭을 적용할 수 있으며, 시스템 모듈 추가 비용은 줄이면서 인프라 확장에 유연하게 대처할 수 있다고 설명했다.

저작권자 © 블로터 무단전재 및 재배포 금지