카이스트, 시각적 상상력 체계화한 AI 개발

딥러닝의 체계적 시각 개념 일반화 문제에 도전, 새로운 모델 개발
시각 정보 일반화로 적은 데이터로 더 높은 성능 내는 AI 개발 가능

 

[더테크=조재호 기자] ‘노란 포도’나 ‘보라색 바나나’처럼 본 적 없는 시각 개념을 이해하고 상상하는 인공지능(AI) 능력 구현이 가능해졌다.

 

카이스트는 안성진 전산학부 교수 연구팀이 구글 딥마인드와 미국 럿거스 대학교와의 국제 공동 연구를 통해 시각적 지식을 체계적으로 조합해 새로운 개념을 이해하는 AI 모델과 프로그램을 수행하는 벤치마크를 개발했다고 30일 밝혔다.

 

안 교수가 이끄는 국제 공동 연구팀은 시각 정보에 대한 체계적 일반화를 연구할 수 있는 벤치마크를 개발했다. 시각 정보는 언어와 달리 명확한 단어나 토큰 구조가 없어 이 구조를 학습하고 체계적 일반화를 달성하는 것이 큰 도전이다.

 

체계적 일반화 혹은 조합적 일반화는 시각을 인식하는 능력이다. 예를 들어 사람은 보라색 포도나 노란 바나나 같은 개념을 학습하고 이를 나눈 뒤 재조합해 노란 포도나 보라색 바나나와 같은 이미지나 개념을 상상하는 능력을 말한다.

 

체계적 일반화 문제는 1988년 미국의 인지과학자 제리 포더(Jerry Fodor)와 제논 필리쉰(Zenon Pylyshyn)이 인공신경망이 해결할 수 없는 분야라는 주장과 함께 35년 동안 인공지능 딥러닝 분야에서 큰 도전 과제로 남아있었다. 이 문제는 언어와 시각 정보에서 발생하는데 지금까지는 언어의 체계적 일반화에만 초점이 맞춰져 시각 정보에 관한 연구는 상대적으로 부족했다.

 

 

안성진 교수는 “시각 정보의 체계적 일반화가 범용 인공지능(AGI)을 달성하기 위한 필수적인 능력이며 연구를 통해 인공지능의 추론능력과 상상능력 관련 분야의 발전을 가속할 것으로 기대한다”고 말했다.

 

아울러 딥마인드 책임 연구원으로 이번 연구에 참여한 찰라 걸셔(Caglar Gulcehre) 스위스 로잔연방공과대학교(EPFL) 교수는 “체계적 일반화가 가능해지면 지금보다 훨씬 적은 데이터로 더 높은 성능을 낼 수 있게 될 것”이라고 전했다.

 

이번 연구는 12월 미국 뉴올리언스에서 열리는 제 37회 신경정보처리학회(NeurIPS)에서 발표될 예정이다.