9일 스웨덴 왕립과학원 노벨위원회에 따르면 ‘알파폴드(AlphaFold)’를 개발한 데미스 하사비스 구글 딥마인드 CEO(최고경영자)와 존 점퍼 연구원, 단백질 구조 예측 AI ‘로제타폴드’를 개발한 데이비드 베이커 미국 워싱턴대 교수가 노벨화학상을 차지했다.
단백질 구조 예측이 신약개발에 왜 중요할까
어쩌면 이번 수상은 이미 예견됐는지 모른다. 2016년 ‘알파고’로 세계 바둑을 재패한 구글 딥마인드는 인공지능(AI)을 통해 그간 난제로 여겨졌던 단백질 구조와 신약 개발의 비밀을 하나하나 풀어나갔다. 단백질 구조 예측에 그치지 않고 생체 분자와 단백질간 상호작용까지 예측하는 수준으로 진화했다. 실제 알파폴드는 폐질환 신약후보물질을 46일 만에 발굴하기도 했다. 수년은 걸릴 작업은 두 달 남짓으로 줄인 것이다.
코로나19 백신도 이런 방식으로 탄생했다. 코로나19 바이러스 표면에는 ORF8 등 20여 종의 단백질이 있고 이것을 몸에 주입해서 항체를 만드는 방식이다.
국제학술지 ‘네이처’에 따르면 구글의 알파폴드3는 단백질-단백질 상호작용뿐만 아니라, 단백질-리간드 및 단백질-DNA 상호작용까지 예측할 수 있어 생물학적 이해와 약물 개발에 큰 혁신을 가져올 것으로 기대된다. 단백질 구조 분석을 통해 타겟을 정확하게 발견할 수 있고 후보물질 스크리닝 과정에서 약물과 단백질을 효과적으로 결합할 수 있는 후보물질을 빠르게 찾을 수 있게 된 것이다.
신약개발 담당자들은 지금까지 X선이나 극저온 전자현미경 등 장비를 활용해 10만여 종의 단백질 구조를 해독했다. 하지만 이제 아미노산 염기서열만 입력하면 AI가 가능한 단백질 구조를 빠르게 예측하는 것이 가능해졌다. 수개월 걸리던 작업을 순식간에 해낼 수 있게 된 것이다.
딥마인드, AI 사업 영역 어디까지?
|
특히 알파미스센스는 DNA가 정상적인 형태를 유지할지 예측하는 방식으로 질병 발생 가능성을 평가한다. 이 플랫폼은 알파폴드를 발전시킨 형태로 학습됐는데 단백질의 화학적 구성을 바탕으로 향후 단백질의 3D 구조를 예측하는 방식을 도입했다. 인간과 가까운 영장류의 DNA데이터를 바탕으로 어떤 미스센스 돌연변이가 빈번하게 발생하는지 학습했다.
청쥔 딥마인드 연구원은 “알파미스센스의 해독법은 인간의 언어와 비슷하다”며 “영어 문장에서 어떤 단어가 다른 단어로 대체됐을 때, 영어에 능숙한 사람이 대체된 단어가 문장의 의미를 어떻게 바꿀지 여부를 알 수 있는 것과 비슷하다”고 설명했다.