IBM, AI 전용 가속기 ‘스파이어 엑셀러레이터’ 출시… 생성형·에이전트 AI 성능 강화

 

 

[더테크 이승수 기자]  IBM이 메인프레임과 서버 환경에서 생성형 및 에이전트 기반 인공지능(AI) 업무를 지원하는 전용 하드웨어를 개발했다. 

 

IBM은 자사의 메인프레임 시스템 ‘IBM z17’ 및 ‘IBM 리눅스원 5(IBM LinuxONE 5)’에 적용 가능한 AI 가속기 ‘스파이어 엑셀러레이터(Spyre Accelerator)’를 정식 출시했다고 밝혔다. 이번 신제품은 AI 추론 성능을 강화하면서도 핵심 업무의 보안성과 복원력을 유지하도록 설계됐다. 12월 초에는 파워11(Power11) 서버용 제품도 제공될 예정이다.

 

기업 IT 환경이 기존의 논리 중심 처리에서 에이전트 기반 AI 추론 중심으로 빠르게 이동하면서, 실시간 반응성과 저지연 추론은 필수 요소로 자리 잡고 있다. IBM은 이러한 변화를 지원하기 위해 고성능 AI 추론을 처리하면서도 데이터와 거래 시스템의 보안, 안정성을 보장하는 전용 하드웨어를 개발했다. 스파이어 엑셀러레이터는 기업이 핵심 데이터를 온프레미스 환경에서 안전하게 처리할 수 있도록 설계됐으며, 운영 효율성과 에너지 절감 효과도 함께 제공한다.

 

이번 제품은 IBM 리서치 AI 하드웨어 센터의 기술 혁신과 IBM 인프라 사업부의 개발 역량이 결합된 결과물이다. 시제품 단계부터 IBM 요크타운 하이츠 연구소의 클러스터 실험과 올버니대학교 산하 ‘신흥 인공지능 시스템 센터’와의 협력을 통해 완성도를 높였다.

 

스파이어 엑셀러레이터는 32개의 AI 가속 코어와 256억 개의 트랜지스터를 탑재한 5나노미터(㎚) 공정 기반의 상용 SoC( 형태로 완성됐다. 각 제품은 75와트 PCIe 카드 형태로 제공되며, IBM Z 및 리눅스원 시스템에는 최대 48개, IBM 파워 시스템에는 최대 16개까지 클러스터 구성이 가능하다.

 

배리 베이커 IBM 인프라 사업부 최고운영책임자(COO)는 “스파이어 엑셀러레이터를 통해 IBM 시스템은 생성형 및 에이전트 기반 AI를 포함한 다중 모델 AI를 지원할 수 있게 됐다”며 “기업 고객이 핵심 업무를 AI 기반으로 확장하면서도 보안성과 복원력, 효율성을 모두 확보할 수 있을 것”이라고 말했다.

 

무케시 카레 IBM 반도체 및 하이브리드 클라우드 부문 부사장은 “IBM은 2019년 AI 리서치 하드웨어 센터를 설립해 AI 연산 수요 증가에 대비해 왔다”며 “이번 스파이어 칩 상용화는 그 결실로, IBM 고객에게 향상된 성능과 생산성을 제공하게 될 것”이라고 밝혔다.

 

스파이어 엑셀러레이터는 IBM의 텔럼 II(Telum II) 프로세서와 함께 사용돼 보안성, 저지연성, 높은 거래 처리 성능을 제공한다. 이를 통해 사기 탐지, 유통 자동화, 예측 기반 운영 등 다양한 AI 모델 기반 업무에 적용할 수 있다.

 

IBM 파워 기반 서버에서는 AI 서비스 카탈로그를 통해 맞춤형 AI 워크플로우를 손쉽게 구성할 수 있으며, 온칩 가속기(MMA)와 결합된 파워용 스파이어 엑셀러레이터는 생성형 AI를 위한 데이터 변환 속도를 향상시킨다. 이 시스템은 128개 토큰 길이의 프롬프트 입력과 시간당 800만 건 이상의 문서 처리를 지원하며, IBM의 소프트웨어 스택, 보안성, 확장성, 에너지 효율성과 결합돼 기업의 생성형 AI 도입을 효과적으로 지원한다.

 



배너