신약 후보물질 탐색. 기간 비용 줄여줄 수 있는 인공지능(AI) 모델 개발

신약 후보물질 탐색. 기간 비용 줄여줄 수 있는 인공지능(AI) 모델 개발

GIST, 단백질 3차원 구조 정보 없이 신약 개발이 가능한 인공지능 기술 개발

GIST(광주과학기술원) 전기전자컴퓨터공학부 남호정 교수 연구팀은 단백질 서열 기반으로 약물과 표적 단백질의 결합지역 및 상호작용을 예측(Highlights on Target Sequence, HoTS) 하는 인공지능 기술을 개발했다고 21일 밝혔다.

이번 연구로 천문학적 시간과 비용을 필요로 하는 신약개발 산업에서 인공지능을 이용하여 신약 후보물질 탐색 시간을 단축함으로써 결과적으로 신약개발에 소요되는 기간과 비용을 획기적으로 줄일 수 있을 것으로 예상된다.  

신약개발의 초기 단계인 후보 물질 발굴단계는 표적 단백질에 활성을 보이는 화합물을 찾아내는 단계로써, 수만⋅수십만 개의 화합물로부터 표적 단백질에 활성을 보이는 화합물을 찾아야 하는 힘겨운 과정이다. 

이러한 상황을 해결하기 위하여 다양한 약물-표적 단백질 상호작용 예측 인공지능 모델들이 개발됐지만, 좋은 예측 성능에도 불구하고 예측 결과에 대한 설명력이 부족하였기 때문에 실제 신약 개발에서 적극적인 도입이 꺼려져 왔다.  

그러나, 이번에 연구팀이 개발한 모델인 HoTS는 약물-표적 단백질이 결합하는 부분을 사전학습한 후 예측하게 함으로써, 높은 예측 정확도와 함께 약물-표적 단백질 상호작용 예측의 근거도 함께 제시하여 신약개발 연구자들에게 보다 신뢰할 수 있는 유효화합물 예측 결과를 제시해 줄 수 있게 되었다. 
 

▲ HoTS 모델 개요. HoTS 모델의 학습 데이터셋, 모델 구조, 평가 및 분석 방법을 종합적으로 보여주고 있다. (이미지 출처=GIST)


본 연구는 대규모의 단백질 3차원 구조 데이터베이스로부터 화합물과의 결합지역을 추출하여 CNN(Convolutional Neural Network)과 트랜스포머(Transformer) 기반의 딥러닝 모델로 단백질 서열상의 결합지역을 예측할 수 있도록 학습되었다. 

결합지역을 학습한 후, 해당 학습을 기반으로 하여 더 많은 트랜스포머 계층을 통해 약물-표적 단백질 상호작용을 예측할 수 있으며, 그 결과딥러닝 모델이 결합지역과 함께 약물-표적 상호작용을 예측할 수 있게 되었다. 
 

▲ HoTS의 결합지역 예측과 트랜스포머의 Attention 분포. HoTS의 트랜스포머가 단백질의 결합지역을 중점적으로 고려하고 있음을 보여준다.(이미지 출처=GIST)


결과적으로 HoTS 모델은 다른 딥러닝 모델들보다 더 높은 예측력을 보여주었으며, 결합지역 예측도 단백질 서열 정보만을 사용함에도 불구하고 3차원 구조 기반의 타 예측 모델과 비슷한 수준의 성능을 확인하였다. 

남호정 교수는 “본 연구성과는 신약 개발 단계 중 유효화합물 발굴의 효율성을 크게 높여주는 기술이며, 무엇보다 3차원 구조 정보가 없는 신규 표적 단백질에 대한 신약 개발의 가능성을 열어줬다는데 의의가 있다”면서 “향후 해당 모델을 통해 약 개발 단계에서의 빠르고 효율적인 유효화합물 발굴이 가능할 수 있을 것으로 기대된다”고 말했다. 

지스트 남호정 교수팀이 수행한 이번 연구는 ‘설명가능 인공지능 기반 약물 후보의 독성 및 부작용 예측 시스템 개발’(한국연구재단 중견연구자지원사업), ‘지스트-전남대학교병원 공동연구과제’, ‘GRI(GIST 연구원) 생명노화연구소’ 사업의 지원을 받아 수행되었으며, ‘Journal of Cheminformatics’에 2월 8일자 온라인 게재되었다.   

글. 이지은 기자 smile20222@brainworld.com | 사진 및 자료출처 = GIST(광주과학기술원) 

ⓒ 브레인미디어 무단전재 및 재배포 금지

인기 뉴스

설명글
인기기사는 최근 7일간 조회수, 댓글수, 호응이 높은 기사입니다.