국내 연구진이 적은 학습 데이터만으로도 새로운 약물 후보물질을 발굴할 수 있는 생성형 AI 모델을 개발했다.
펙셀즈 제공
펙셀즈 제공
카이스트 화학과 연구팀은 단백질-분자 사이의 상호작용을 활용해 타켓 단백질에 적합한 약물 설계 특화 생성형 AI를 개발했다고 18일 밝혔다. 이 연구 결과는 기초 과학 및 공학 분야 국제 학술지 ‘네이처 커뮤니케이션즈’에 실렸다.
신규 약물을 개발하기 위해서는 우선 질병 원인이 되는 타겟 단백질과 결합하는 분자를 찾는 것이 중요하다. 기존에도 생성형 AI로 신규 약물을 발굴하기 위한 시도가 있었지만, 기존 알려진 데이터로 학습이 필요하다. 문제는 새로운 약물이기 때문에 관련한 실험 데이터가 매우 적거나 전혀 없다는 점이다.
이에 연구팀은 AI의 데이터 의존성 문제를 극복하기 위해 단백질 정보만으로 분자를 설계하는 기술 개발에 초점을 맞췄다. 연구자들이 설계한 분자가 단백질과 안정적으로 결합하기 위해서는 단백질-분자 간 상호작용 패턴이 핵심 역할을 한다. 연구팀은 생성형 AI가 이런 상호작용 패턴을 학습하고, 분자 설계에 직접 활용할 수 있도록 모델을 설계하고 재현하도록 했다.
기존 단백질 구조 기반 생성형 AI 모델은 부족한 학습 데이터를 보완하기 위해 10만~1000만 개의 가상 데이터를 활용해야 했다. 그러나 이번에 개발한 신약 개발 특화 생성형 AI 모델은 수천 개의 실제 실험 데이터만으로도 우수한 성능을 발휘한다는 장점이 있다.
연구팀은 비소세포폐암의 주요 원인으로 알려진 돌연변이 상피 성장인자 수용체에 대한 약물 개발을 실험한 결과 이론상으로 100배 이상 선택성을 가진 약물 분자를 설계하는 데 성공했다.
연구를 이끈 김우연 교수는 “이번에 개발한 생성형 AI 모델은 약물 분자뿐만 아니라 다양한 생체 분자를 다루는 바이오 분야에서 유용하게 쓰일 것으로 기대한다”고 말했다.