인텔 가속기, FP8로 GPT-3서 두 배 성능 보여

[더테크=전수연 기자] 인텔이 ML커먼스가 인텔® 가우디®2(Intel® Gaudi®2) 가속기 및 인텔® 어드밴스드 매트릭스 익스텐션(Intel® AMX)이 탑재된 4세대 인텔® 제온® 스케일러블 프로세서(4th Gen Intel® Xeon® Scalable processors)의 AI 모델 학습에 대한 업계 표준 MLPerf 트레이닝(MLPerf Training) v3.1 벤치마크 측정 결과를 발표했다고 10일 밝혔다.

(관련기사: 인텔, 오픈소스 AI 레퍼런스 키트 공개)

인텔 가우디2는 v3.1 학습 GPT-3 벤치마크에서 FP8 데이터 유형을 적용해 두 배 높은 성능을 보였다. 인텔은 해당 벤치마크 제출을 통해 경쟁력 있는 AI 솔루션으로 AI를 제공할 계획이다.

산드라 리베라 인텔 데이터센터 총괄은 “인텔은 AI 포트폴리오를 지속 혁신하고 연이은 MLPerf 성능 결과를 통해 ML 커먼스 AI 벤치마크의 기준을 높이고 있다”며 “인텔의 다양한 AI 하드웨어와 소프트웨어 구성은 사용자에게 AI 워크로드에 맞는 포괄 솔루션과 선택지를 제공한다”고 말했다.

최신 ML커먼스의 MLPref 결과는 지난 6월 발표된 트레이닝 결과보다 강력한 인텔의 AI 성능을 기반으로 한다. 인텔 제온 프로세서는 MLPref 결과를 제출하는 유일한 CPU다.

인텔 가우디2는 다양한 하드웨어 구성을 통해 사용자의 컴퓨팅 요구사항을 해결할 수 있다. 또 가속기는 ESM2와 E4M3 형식에서 자연 스케일링 옵션을 지원한다.

이와 함께 가우디2는 BF16을 사용해 20.2분 만에 64개의 가속기로 스테이블 디퓨전(Stable Diffusion) 멀티모달 모델에 대한 학습을 시연했다. 향후 MLPerf 트레이닝 벤치마크에서는 FP8 데이터 유형에 대한 스테이블 디퓨전 성능이 제출될 예정이다.

아울러 인텔은 소프트웨어 업데이트와 최적화를 통해 향후 MLPref 벤치마크에서 AI 성능 결과가 더욱 향상될 것으로 예상하고 있다.

CATEGORY