엔비디아는 AI 혁신을 주도할 DGX 클라우드 렙톤을 출시했다. 이 플랫폼은 글로벌 클라우드 제공업체와 결합하여 개발자들에게 수만 개의 GPU를 제공, AI 개발을 가속화한다. DGX 클라우드 렙톤은 통합된 AI 서비스로 생산성과 유연성을 높이고, 실시간 상태 진단으로 안정적인 성능을 보장한다.
AI 컴퓨팅 기술 분야의 선두주자인 엔비디아(www.nvidia.co.kr, CEO 젠슨 황)가 엔비디아 DGX 클라우드 렙톤(NVIDIA DGX Cloud Lepton)을 발표했다. DGX 클라우드 렙톤은 컴퓨팅 마켓플레이스가 포함된 AI 플랫폼으로, 글로벌 클라우드 제공업체 네트워크에서 제공되는 수만 개의 GPU를 통해 에이전틱•물리적 AI 애플리케이션을 구축하는 전 세계 개발자들을 연결한다.

AI 수요를 충족하기 위해 엔비디아 클라우드 파트너(Cloud Partner, NCP)는 DGX 클라우드 렙톤 마켓플레이스에서 엔비디아 블랙웰(Blackwell)과 기타 엔비디아 아키텍처 GPU를 제공할 예정이다. NCP에는 코어위브(CoreWeave), 크루소(Crusoe), 퍼머스(Firmus), 폭스콘(Foxconn), GMI 클라우드(GMI Cloud), 람다(Lambda), 네비우스(Nebius), 엔스케일(Nscale), 소프트뱅크(Softbank Corp), 요타 데이터 서비스(Yotta Data Services)가 포함된다.
개발자는 온디맨드와 장기 컴퓨팅을 위해 특정 지역의 GPU 컴퓨팅 용량을 활용해 전략적인 소버린 AI(Sovereign AI) 운영 요구 사항을 지원할 수 있다. 선도적인 클라우드 서비스 제공업체와 GPU 마켓플레이스도 DGX 클라우드 렙톤 마켓플레이스에 참여할 것으로 예상된다.
엔비디아 창립자 겸 CEO인 젠슨 황은 “엔비디아 DGX 클라우드 렙톤은 글로벌 GPU 클라우드 제공업체 네트워크와 AI 개발자를 연결한다. 엔비디아는 NCP와 함께 행성 규모의 AI 팩토리를 구축하고 있다”고 말했다.
DGX 클라우드 렙톤은 엔비디아 컴퓨팅 에코시스템 전반에서 클라우드 AI 서비스와 GPU 용량에 대한 액세스를 통합함으로써 안정적인 고성능 GPU 리소스를 확보할 수 있도록 지원한다. 이 플랫폼은 엔비디아 소프트웨어 스택과 통합돼 AI 애플리케이션의 개발과 배포를 가속화하고 간소화한다. 통합 가능한 엔비디아 소프트웨어 스택에는 엔비디아 NIM™과 네모(NeMo™) 마이크로서비스, 엔비디아 블루프린트(Blueprints)와 엔비디아 클라우드 펑션(Cloud Functions) 등이 포함된다.
DGX 클라우드 렙톤은 클라우드 제공업체에 실시간 GPU 상태 진단을 제공하고 근본 원인 분석을 자동화하는 관리 소프트웨어를 제공함으로써 수작업을 배제하고 가동 중단 시간을 줄여준다.
DGX 클라우드 렙톤의 주요 이점은 다음과 같다.
생산성과 유연성 향상: 개발, 훈련, 추론 전반에 걸쳐 통합된 환경을 제공해 생산성 향상을 지원한다. 개발자는 마켓플레이스를 통해 참여 클라우드 제공업체로부터 GPU 용량을 직접 구매하거나 자체 컴퓨팅 클러스터를 가져올 수 있어 유연성과 제어력이 향상된다.
원활한 배포: 추론, 테스트, 훈련 워크로드를 위한 통합 서비스를 사용함으로써 최소한의 운영 비용으로 멀티 클라우드와 하이브리드 환경 전반에 걸쳐 AI 애플리케이션을 배포할 수 있다.
민첩성과 독자성: 개발자가 특정 지역의 GPU 리소스에 빠르게 액세스해 데이터 주권 규정을 준수하고, 민감한 워크로드에 대한 저지연 요구 사항을 충족할 수 있도록 지원한다.
예측 가능한 성능: 참여 클라우드 제공업체에 엔터프라이즈급 성능, 안정성, 보안을 제공해 일관된 사용자 경험을 보장한다.
AI 클라우드 성능의 새로운 기준
엔비디아는 엔비디아 엑셈플러 클라우드(Exemplar Clouds)도 발표했다. 이는 엔비디아의 전문성, 레퍼런스 하드웨어와 소프트웨어, 운영 툴을 사용해 NCP가 보안, 사용성, 성능, 탄력성을 강화할 수 있도록 지원한다.
엔비디아 엑셈플러 클라우드는 AI 플랫폼에서 워크로드 성능을 최적화하고 비용과 성능 간 관계를 정량화하기 위한 포괄적인 도구와 레시피 모음인 엔비디아 DGX 클라우드 벤치마킹(DGX™ Cloud Benchmarking)을 활용한다.
요타 데이터 서비스는 아시아 태평양 지역 최초로 엔비디아 엑셈플러 클라우드 이니셔티브에 참여한 NCP이다.
※출처: Bodnara