https://arxiv.org/abs/2409.08022
새로운 AI 시스템이 목표 분자에 성공적으로 결합하는 단백질을 설계하다. 약물 설계, 질병 이해 등에서의 발전 가능성을 보이다.
모든 생물학적 과정은 세포 성장부터 면역 반응에 이르기까지 단백질이라고 불리는 분자 간의 상호작용에 달려 있다. 열쇠가 자물쇠에 맞는 것처럼, 하나의 단백질이 다른 단백질에 결합하여 중요한 세포 과정을 조절한다. AlphaFold와 같은 단백질 구조 예측 도구는 단백질이 서로 상호작용하여 기능을 수행하는 방식을 이해하는 데 엄청난 통찰력을 제공했지만, 이러한 도구는 새로운 단백질을 만들어 그 상호작용을 직접적으로 조작하지는 못한다.
그러나 과학자들은 목표 분자에 성공적으로 결합하는 새로운 단백질을 만들어낼 수 있다. 이러한 결합 단백질은 연구자들이 약물 개발, 세포 및 조직 이미지화, 질병 이해와 진단, 심지어 해충에 대한 작물 저항성 연구에 이르기까지 광범위한 연구에서 진전을 가속화할 수 있도록 돕는다. 최근의 머신러닝 기반 단백질 설계 접근법이 큰 진전을 이루었음에도, 이 과정은 여전히 노동집약적이며 광범위한 실험적 테스트가 필요하다.
오늘 우리는 생물학 및 건강 연구의 빌딩 블록으로 사용할 수 있는 새로운 고강도 단백질 결합체를 설계하는 첫 번째 AI 시스템인 AlphaProteo를 소개한다. 이 기술은 생물학적 과정을 이해하고 새로운 약물을 발견하며, 바이오 센서를 개발하는 것을 가속화할 잠재력을 가지고 있다.
AlphaProteo는 암 및 당뇨병 합병증과 관련이 있는 VEGF-A를 포함한 다양한 목표 단백질에 대한 새로운 단백질 결합체를 생성할 수 있다. AI 도구가 VEGF-A에 대한 성공적인 단백질 결합체를 설계한 것은 이번이 처음이다.
AlphaProteo는 우리가 테스트한 7개의 목표 단백질에 대해 기존의 최고 방법들보다 3배에서 300배 더 나은 결합 친화도와 높은 실험적 성공률을 달성한다.
단백질이 서로 결합하는 복잡한 방식 배우기
목표 단백질에 강하게 결합할 수 있는 단백질 결합체를 설계하는 것은 어렵다. 전통적인 방법은 시간이 많이 소요되며, 여러 차례의 광범위한 실험실 작업을 요구한다. 결합체가 생성된 후에도, 결합 친화도를 최적화하기 위해 추가적인 실험 단계들을 거쳐야 하며, 이를 통해 결합력이 충분히 강해져야 실제로 유용하게 사용할 수 있다.
AlphaProteo는 Protein Data Bank (PDB)의 방대한 단백질 데이터와 AlphaFold로부터 얻은 1억 개 이상의 예측 구조를 학습하여, 분자들이 서로 결합하는 수많은 방식을 배웠다. 목표 분자의 구조와 그 분자에서 선호하는 결합 위치 집합을 입력으로 받아, AlphaProteo는 그 위치에서 목표 분자에 결합할 수 있는 후보 단백질을 생성한다.
https://deepmind.google/api/blob/website/media/GDM-ProteinDesignBlog-02-Binder-Final.mp4
영상 일시정지 예측된 단백질 결합체 구조가 목표 단백질과 상호작용하는 삽화. 파란색으로 표시된 것은 AlphaProteo가 생성한 예측된 단백질 결합체 구조이며, 목표 단백질과 결합하도록 설계되었다. 노란색으로 표시된 것은 목표 단백질로, 이는 구체적으로 SARS-CoV-2 스파이크 수용체 결합 도메인을 의미한다.
중요한 단백질 결합 목표에 대한 성공 사례 시연
AlphaProteo를 테스트하기 위해 우리는 다양한 목표 단백질에 대한 결합체를 설계했다. 여기에는 감염과 관련된 두 가지 바이러스 단백질(BHRF1과 SARS-CoV-2 스파이크 단백질 수용체 결합 도메인, SC2RBD)과 암, 염증 및 자가면역질환과 관련된 다섯 가지 단백질(IL-7Rɑ, PD-L1, TrkA, IL-17A, VEGF-A)이 포함된다.
우리 시스템은 매우 경쟁력 있는 결합 성공률과 업계 최고 수준의 결합 강도를 자랑한다. 일곱 개의 목표에 대해 AlphaProteo는 실험적으로 테스트했을 때 목표 단백질에 강하게 결합하는 후보 단백질을 컴퓨터 시뮬레이션을 통해 생성했다.
일곱 개의 목표 단백질에 대해 AlphaProteo가 성공적인 결합체를 생성한 예측 구조의 일러스트들이 그리드 형태로 나열되어 있다. 파란색으로 표시된 것은 실험실에서 테스트된 결합체의 예시이며, 노란색은 목표 단백질을, 어두운 노란색은 의도된 결합 위치를 나타낸다.
특정 목표 단백질 중 하나인 바이러스 단백질 BHRF1의 경우, Google DeepMind 실험실에서 테스트했을 때 후보 분자의 88%가 성공적으로 결합했다. 테스트된 목표들에 기반하여, AlphaProteo의 결합체는 기존의 최고 설계 방법들보다 평균적으로 10배 더 강하게 결합한다.
또 다른 목표인 TrkA의 경우, 우리의 결합체는 기존의 여러 차례 실험 최적화를 거친 TrkA 결합체보다도 더 강력하다.
AlphaProteo의 출력물이 일곱 개의 목표 단백질 각각에 대해 다른 설계 방법들과 비교하여 실험적 시험관 내 성공률을 나타내는 파란색과 회색 막대 그래프. 더 높은 성공률은 성공적인 결합체를 찾기 위해 테스트해야 할 설계 수가 적다는 것을 의미한다.
AlphaProteo의 설계물이 실험적 최적화 없이 일곱 개의 목표 단백질 각각에 대해 다른 설계 방법들과 비교하여 가장 좋은 친화도를 나타내는 파란색과 회색 막대 그래프. 더 낮은 친화도는 결합체 단백질이 목표 단백질에 더 강하게 결합한다는 것을 의미한다. 수직 축의 로그 스케일을 참고하기 바란다.
결과 검증
컴퓨터 시뮬레이션 상의 검증과 AlphaProteo의 실험실 테스트를 넘어, 우리는 프랜시스 크릭 연구소의 피터 체레파노프, 케이티 벤틀리, 데이비드 LV 바우어 연구 그룹과 협력하여 우리의 단백질 결합체를 검증했다. 다양한 실험을 통해 이들은 AlphaProteo가 예측한 일부 더 강력한 SC2RBD 및 VEGF-A 결합체를 심층 분석했다. 연구 그룹들은 이러한 결합체의 결합 상호작용이 AlphaProteo가 예측한 것과 실제로 유사하다는 것을 확인했다. 또한, 이 결합체들이 유용한 생물학적 기능을 가지고 있다는 사실도 확인되었다. 예를 들어, 일부 SC2RBD 결합체는 SARS-CoV-2와 그 변이 일부가 세포를 감염시키지 못하도록 막는 것으로 나타났다.
AlphaProteo의 성능은 단백질 결합체와 관련된 초기 실험에 필요한 시간을 크게 단축할 수 있음을 시사한다. 그러나 우리의 AI 시스템에는 한계가 있다는 점도 알고 있다. 예를 들어 자가면역 질환인 류마티스 관절염과 관련된 단백질인 TNFɑ에 대해 결합체를 설계하는 데는 성공하지 못했다. 우리는 AlphaProteo에 강력한 도전을 주기 위해 TNFɑ를 선택했으며, 컴퓨터 분석 결과 이 목표에 대한 결합체를 설계하는 것은 매우 어려울 것이라는 점이 나타났다. 우리는 이러한 어려운 목표를 궁극적으로 해결할 수 있도록 AlphaProteo의 역량을 지속적으로 개선하고 확장할 것이다.
강한 결합력을 얻는 것은 보통 실용적인 응용에 사용할 수 있는 단백질을 설계하는 첫 번째 단계일 뿐이며, 연구 개발 과정에서 극복해야 할 더 많은 생물공학적 장애물이 존재한다.
책임 있는 단백질 설계를 향해
단백질 설계는 빠르게 발전하는 기술로, 질병을 유발하는 요인을 이해하는 것부터 바이러스 발병에 대한 진단 테스트 개발 가속화, 더 지속 가능한 제조 공정 지원, 심지어 환경 오염 물질 정화에 이르기까지 과학의 진전을 이루는 데 많은 잠재력을 가지고 있다.
생물 보안의 잠재적 위험을 고려하기 위해, 우리는 책임과 안전에 대한 오랜 접근 방식을 바탕으로 외부 전문가들과 협력하여 이 작업을 단계적으로 공유하는 접근 방식을 도출하고 있으며, NTI(핵 위협 이니셔티브)의 새로운 AI Bio Forum을 포함한 공동체 노력에 기여하여 최선의 관행을 개발하고 있다.
앞으로 우리는 AlphaProteo를 생물학의 중요한 문제들에 활용하고 그 한계를 이해하기 위해 과학계와 협력할 것이다. 또한 우리는 이소모픽 랩스에서 약물 설계 응용을 탐구해왔으며, 미래에 대해 매우 기대하고 있다.
동시에, AlphaProteo의 알고리즘의 성공률과 친화도를 지속적으로 개선하고, 해결할 수 있는 설계 문제의 범위를 확장하며, 머신러닝, 구조 생물학, 생화학 및 기타 여러 분야의 연구자들과 협력하여 공동체를 위한 책임 있고 더 포괄적인 단백질 설계 제공 방안을 개발하고 있다.
'인공지능' 카테고리의 다른 글
DeepSeek-V2.5 (1) | 2024.11.23 |
---|---|
De novo design of high-affinity protein binders with AlphaProteo (3) | 2024.11.22 |
VASA-1: Lifelike Audio-Driven Talking FacesGenerated in Real Time (3) | 2024.11.21 |
EMO: Emote Portrait Alive -- Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions (4) | 2024.11.21 |
Framer: Interactive Frame Interpolation (2) | 2024.11.21 |