카이스트, 생성형 AI로 신약 개발 가능성 열어

단백질-분자 상호작용 패턴 기반의 3차원 생성형 AI 개념도. [지료=카이스트]

[더테크=조재호 기자] 카이스트가 단백질-분자 상호작용 패턴에서 착안한 생성형 인공지능(AI)을 개발했다. 기존 모델의 데이터 의존성 문제를 극복한 모델로 약물 분자뿐 아니라 생체 분자를 다루는 바이오 분야의 활용이 기대된다.

카이스트는 18일 김우연 화학과 교수 연구팀이 단백질-분자 사이의 상호작용을 고려해 활성 데이터 없이도 타겟 단백질에 적합한 약물 설계 생성형 AI를 개발했다고 밝혔다.

신규 약물을 발굴하기 위해서는 질병의 원인이 되는 타겟 단백질에 특이적으로 결합하는 분자를 찾는 것이 중요하다. 기존의 약물 설계 생성형 AI는 이미 알려진 활성 데이터를 학습에 활용해 기존 약물과 유사한 약물을 설계하려는 경향을 보였다.

이는 신규성이 중요한 신약 개발 분야에서 약점으로 지적됐다. 또한 사업성이 높은 계열 내 최초 타겟 단백질에 대해서는 실험 데이터가 적은 편으로 기존 방식의 생성형 AI를 활용하는 것이 불가능했다.

연구팀은 이런 데이터 의존성 문제를 극복하기 위해 단백질 구조 정보만으로 분자를 설계하는 기술 개발에 주목했다. 타겟 단백질의 약물 결합 부위에 대한 3차원 구조 정보를 주형처럼 활용해 해당 결합 부위에 꼭 맞는 분자를 주조하듯 설계하는 것이다. 마치 자물쇠에서 열쇠를 설계하는 방식이다.

아울러 기존 단백질 구조 기반 3차원 생성형 AI 모델들의 낮은 일반화 성능을 개선하기 위해 연구팀은 신규 단백질에 대해서도 안정적으로 결합할 수 있는 분자를 설계할 수 있도록 단백질-분자 간 상호작용 패턴이 핵심 역할을 하는 것에 착안한 기술을 개발했다.

그 결과 기존 10만~1,000만 개의 가상 데이터를 활용하는 것에서 단백질-분자 상호작용 패턴을 사전 지식의 형태로 학습에 활용함으로써 수천 개의 실제 실험 구조만을 학습해도 월등히 높은 성능을 발휘하는 AI를 개발했다.

연구진은 생성형 AI를 통해 돌연변이가 일어난 아미노산에 특이적인 상호작용을 유도해 분자를 설계했는데 생성된 분자의 23%가 이론상으로 100배 이상의 선택성을 가지는 것으로 예측됐다. 이와 같은 상호작용 패턴에 기반한 생성형 AI는 인산화효소 저해제 등과 같이 약물 설계에 있어 선택성이 중요한 상황에서 더욱 효과적으로 활용될 수 있음을 확인했다.

이번 연구 논문에 제 1저자로 참여한 정원호 카이스트 화학과 박사과정은 “사전 지식을 인공지능 모델에 사용하는 전략은 상대적으로 데이터가 적은 과학 분야에서 적극적으로 사용되어 왔다”며 “이번 연구에서 사용한 분자 간 상호작용 정보는 약물 분자뿐 아니라 다양한 생체 분자를 다루는 바이오 분야의 문제에도 유용하게 적용될 수 있을 것”이라고 말했다.

이번 연구는 국제 학술지 ‘네이처 커뮤니케이션즈(Nature Communications)’ 2024년 3월 15호에 게재됐다.

CATEGORY