엔비디아, AI 서비스 위해 오라클 클라우드 채택

OCI 슈퍼클러스터에서 엔비디아 AI 파운데이션 및 DGX 클라우드 구동

 

[더테크 뉴스] 오라클이 24일 새로운 오라클 클라우드 인프라스트럭처(OCI) 슈퍼클러스터(Supercluster) 상에서 엔비디아의 전략적인 AI 애플리케이션 구동을 위해 엔비디아와의 협력을 확대한다고 밝혔다. 

 

엔비디아는 AI 슈퍼컴퓨팅 서비스 ‘엔비디아 DGX 클라우드(NVIDIA DGX Cloud)’의 대규모 제공을 위한 최초의 하이퍼스케일 클라우드 기업으로 오라클의 OCI를 선택했다. 또한 DGX 클라우드를 통해 이용 가능한 새로운 생성형 AI 클라우드 서비스인 ‘엔비디아 AI 파운데이션(NVIDIA AI Foundations)’를 OCI 상에서 구동할 예정이다.

 

엔비디아 DGX 클라우드 및 엔비디아 AI 파운데이션 서비스는 엄격한 DGX 클라우드 표준 준수를 보장할 수 있도록 엔비디아 인증을 받은 OCI만의 고유한 슈퍼클러스터를 활용한다.

 

OCI 슈퍼클러스터에는 엔비디아 네트워킹에 기반하는 레이턴시가 극히 낮은 RoCE 클러스터 ‘OCI 컴퓨트 베어 메탈(OCI Compute Bare Metal)’ 및 HPC 스토리지가 포함돼 있다. OCI 슈퍼클러스터는 대규모 병렬 애플리케이션을 효율적으로 처리할 수 있는 수천 개의 OCI 컴퓨트 베어 메탈 인스턴스를 지원하도록 엔비디아가 구축 및 검증 작업을 완료했다.  

 

엔비디아 AI 파운데이션 모델 제작 서비스는 언어, 이미지, 비디오, 3D, 나아가 생물학 분야에서도 활용 가능하다. 기업들은 언어 서비스 ‘엔비디아 네모(NVIDIA NeMo)’ 및 이미지, 비디오, 3D 서비스 ‘엔비디아 피카소(NVIDIA Picasso)’를 활용해 지능형 채팅 및 고객 지원, 전문 콘텐츠 제작, 디지털 시뮬레이션 등을 위한 독점적이고, 도메인 특화된, 생성형 AI 애플리케이션을 구축할 수 있다.

 

‘엔비디아 바이오네모(NVIDIA BioNeMo)’ 클라우드 서비스는 생성형 AI 애플리케이션을 신속하게 커스터마이징 및 구축할 수 있는 도구 모음을 제공한다.

 

엔비디아 AI 파운데이션 및 GPT-3 등의 모델 제품군을 활용해 구축된 커스텀 모델을 OCI에서 구동할 경우, 마이크로초 단위에 불과한 레이턴시로 통신 회선의 데이터 전송 속도와 거의 동일한 성능을 얻을 수 있다 RDMA에 의존하는 워크로드와 관련된 차단 문제를 해결하는 등 다양한 이점이 기대된다. 

 

오라클 클레이 마고요크 OCI 총괄 부사장은 “OCI는 모든 산업 분야의 수천 개 고객사들을 대상으로 대규모 AI 슈퍼컴퓨터를 제공하는 최초의 플랫폼이다. 이는 갈수록 많은 기업들이 고유한 AI 활용 사례를 위해 컴퓨팅 리소스를 요구하고 있는 현 시점에 매우 중요한 기능이다”라며 “이러한 수요를 지원하기 위해 오라클은 엔비디아와의 협력 체계를 지속적으로 확장해 나갈 것이다”라고 말했다.

 

엔비디아 마누비르 다스 엔터프라이즈 컴퓨팅 부사장은 “AI 중심 혁신이 제공하는 무한한 기회는 모든 기업의 트랜스포메이션을 돕고 있다”며 “엔비디아와 OCI의 파트너십에 힘입어 모든 기업이 엔비디아의 가속 컴퓨팅 플랫폼이 제공하는 탁월한 슈퍼컴퓨팅 성능을 누릴 수 있게 됐다”라고 말했다.
 



배너