엔비디아보다 2.1배 빠른 AI 반도체…KAIST ‘오토GNN’ 기술 개발

 

[더테크 이지영 기자]  엔비디아 GPU 대비 추론 속도를 두 배 이상 높이면서 전력 소비까지 낮춘 인공지능(AI) 반도체 기술이 국내에서 개발됐다. 대규모 데이터를 처리하는 지능형 서비스의 성능과 에너지 효율을 동시에 개선할 수 있는 기반이 마련됐다는 평가다.

 

KAIST는 정명수 전기및전자공학부 교수 연구팀이 그래프 신경망(GNN) 기반 AI 추론을 가속하는 반도체 기술 ‘오토GNN(AutoGNN)’을 세계 최초로 개발했다고 5일 밝혔다. 해당 연구는 최근 컴퓨터 아키텍처 분야 국제학술대회 HPCA 2026에서 발표됐다.

 

그래프 신경망은 추천 시스템, 금융 사기 탐지, 보안 분석 등 사람과 객체 간 복잡한 관계를 분석하는 핵심 AI 기술이다. 그러나 실제 서비스에서는 AI 추론 이전 단계인 ‘그래프 전처리’가 전체 계산 시간의 70~90%를 차지하며 병목 구간으로 지적돼 왔다. 기존 GPU는 불규칙한 연결 구조를 처리하는 데 한계를 보여 서비스 지연을 유발하는 문제가 있었다.

 

연구팀은 이 병목을 해결하기 위해 입력 데이터 구조에 맞춰 반도체 내부 회로를 실시간으로 재구성하는 ‘적응형 AI 가속기’ 구조를 설계했다. 데이터 연결 방식에 따라 칩이 스스로 최적 구조를 선택하도록 해 그래프 전처리 효율을 크게 개선한 것이 핵심이다.

 

성능 평가 결과 오토GNN은 엔비디아 고성능 GPU RTX 3090 대비 추천 추론 속도가 2.1배 빠르고, CPU 대비 최대 9배 높은 성능을 기록했다. 동시에 에너지 소비는 3.3배 줄였다. 속도와 전력 효율을 동시에 개선한 점이 가장 큰 특징이다.

 

이번 기술은 유튜브·이커머스 추천 시스템, 금융 사기 탐지, 사이버 보안 등 실시간 분석이 필요한 AI 서비스에 즉시 적용 가능하다. 특히 데이터 구조가 복잡하고 불규칙한 대규모 서비스 환경에서 효과가 클 것으로 기대된다.

 

정명수 교수는 “불규칙 데이터 구조를 효율적으로 처리하는 유연한 하드웨어 시스템을 구현했다”며 “추천 시스템뿐 아니라 금융·보안 등 다양한 AI 분야에서 활용될 것”이라고 밝혔다.

 

AI 서비스 확산으로 데이터 처리량과 전력 소비가 동시에 증가하는 상황에서, 적응형 AI 반도체 기술은 차세대 AI 인프라 경쟁력의 핵심 축으로 부상할 전망이다.

 



배너