150세 가능한가?
genomics🟢 입문Nature

AlphaFold — AI로 단백질 3D 구조 예측 문제 해결

DeepMind의 AlphaFold2가 아미노산 서열만으로 단백질 3D 구조를 원자 수준 정확도로 예측하는 데 성공해, 50년간 미해결 난제를 AI로 돌파했습니다.

2026-03-31·6 min read
저널Nature
발표일2026-03-31

왜 중요한가?

우리 몸속에는 수만 종류의 단백질(protein)이 있습니다. 단백질은 단순히 근육을 만드는 물질이 아니라, 소화를 돕고, 면역을 담당하고, 세포 신호를 전달하는 등 생명 유지에 없어서는 안 될 분자 기계입니다. 이 단백질들이 어떤 **3차원 구조(3D structure)**를 갖느냐에 따라 그 기능이 완전히 달라지기 때문에, 구조를 아는 것은 곧 기능을 이해하는 열쇠입니다.

문제는 단백질의 구조를 실험으로 밝혀내는 것이 엄청나게 어렵고 오래 걸린다는 점입니다. X선 결정학(X-ray crystallography)이나 냉동전자현미경(cryo-EM) 같은 실험 방법으로 단백질 하나의 구조를 규명하는 데 짧게는 몇 달, 길게는 몇 년이 걸립니다. 지금까지 구조가 밝혀진 단백질은 약 10만 종에 불과한데, 자연계에 존재하는 단백질 서열(sequence)은 수십억 개에 달합니다. 이 엄청난 간극을 메우기 위해 컴퓨터로 구조를 예측하는 연구가 50년 넘게 이어져 왔지만, 기존 방법들은 정확도가 크게 부족했습니다.

연구 방법

DeepMind의 연구팀은 AlphaFold라는 딥러닝(deep learning, 인공신경망 기반 기계학습) 모델을 완전히 새롭게 설계했습니다. 핵심 아이디어는 단백질의 아미노산 서열(amino acid sequence)만 입력으로 받아, 물리학적·생물학적 지식을 알고리즘 안에 녹여 넣는 것이었습니다. 특히 다중 서열 정렬(MSA, Multiple Sequence Alignment) — 즉, 진화적으로 유사한 단백질들의 서열을 한꺼번에 비교 분석하는 기법 — 을 활용해 어떤 아미노산끼리 서로 가까이 위치하는지에 대한 패턴을 학습했습니다. 이렇게 훈련된 모델을 단백질 구조 예측의 올림픽이라 불리는 **CASP14(제14회 단백질 구조 예측 국제 대회)**에 출전시켜 성능을 검증했습니다.

핵심 발견

AlphaFold는 CASP14에서 경쟁자들을 압도적으로 제치고, 실험으로 측정한 구조와 맞먹는 **원자 수준의 정확도(atomic accuracy)**로 단백질 구조를 예측하는 데 성공했습니다. 이는 50년 묵은 난제가 사실상 해결되었음을 알리는 역사적인 순간으로 평가받고 있습니다.

  • 전례 없는 정확도: 대다수의 테스트 단백질에서 실험 구조와 구별하기 어려울 정도의 높은 정확도를 달성했습니다.
  • 상동 구조 없이도 예측 가능: 비슷한 구조가 알려진 단백질이 전혀 없는 경우에도 정확한 예측이 가능했습니다. 기존 방법들이 가장 취약했던 바로 그 상황에서 빛을 발했습니다.
  • 기존 방법 대비 압도적 우위: CASP14에 참가한 다른 모든 방법들과 비교했을 때 정확도 점수에서 큰 격차로 1위를 차지했습니다.
  • 물리·생물학 지식의 통합: 단순히 데이터를 외우는 것이 아니라, 단백질 구조에 관한 물리적·생물학적 원리를 딥러닝 모델 설계에 직접 반영하여 일반화 성능을 높였습니다.
  • 빠른 예측 속도: 실험에 비해 수개월~수년이 걸리던 구조 규명을 단 몇 시간 안에 처리할 수 있습니다.

우리 삶에 미치는 영향

AlphaFold는 신약 개발의 속도를 획기적으로 높일 수 있습니다. 새로운 바이러스나 세균이 출현했을 때 관련 단백질의 구조를 빠르게 예측해 치료제 후보 물질을 훨씬 빠르게 찾아낼 수 있기 때문입니다. 또한 희귀 유전 질환처럼 오랫동안 구조가 밝혀지지 않아 치료법을 찾지 못했던 수많은 질병 연구에도 새로운 돌파구가 열릴 것으로 기대됩니다. 나아가 환경 오염을 분해하는 효소(enzyme) 개발이나 친환경 소재 설계 등 의학을 넘어선 다양한 분야에서도 인류의 삶을 바꿀 잠재력을 지니고 있습니다.

📄 원문: John Jumper, Richard Evans, Alexander Pritzel et al., "Highly accurate protein structure prediction with AlphaFold", Nature, 2021-7-15. DOI: 10.1038/s41586-021-03819-2

AlphaFold: 단백질 구조 예측의 게임 체인저

왜 이렇게 중요한 거예요?

우리 몸 안에는 정말 엄청나게 많은 단백질들이 떠다니고 있어요. 근육을 만드는 것도 단백질이지만, 음식을 소화시키고, 병균으로부터 우리를 지키고, 세포들끼리 신호를 주고받는 것도 모두 단백질이 하는 일이에요. 말하자면 우리 몸의 작은 기계들이라고 생각하면 돼요.

여기서 핵심인데, 이 단백질이 어떤 3D 모양을 갖느냐에 따라 기능이 완전히 달라진다는 거예요. 모양을 알면 어떤 기능을 하는지도 알 수 있다는 뜻이죠.

문제는 단백질의 모양을 직접 실험으로 파악하는 게 정말 어렵다는 거예요. 특수한 기계로 촬영하고 분석하고... 하다 보면 한 개의 단백질 구조를 파악하는 데 몇 달에서 몇 년이 걸려요. 지금까지 구조를 알아낸 단백질은 약 10만 개 정도인데, 자연계에 실제로 있는 단백질은 수십억 개가 넘는다고 해요. 말도 안 되는 차이죠?

그래서 과학자들은 50년 넘게 "컴퓨터로 이 구조를 예측할 수 없을까?"라고 고민해왔는데, 지금까지는 정확도가 별로였어요.

어떻게 문제를 풀었을까?

DeepMind 팀이 AlphaFold라는 인공지능 모델을 만들었어요. 쉽게 말해서, AI한테 단백질의 아미노산 순서(단백질의 레시피 같은 거)만 알려주면, 그것으로부터 실제 3D 모양을 맞춰내는 거죠.

특별한 점은 AI가 "진화적으로 비슷한 단백질들은 어떤 패턴을 보이나?"라고 여러 개를 한 번에 비교 분석하면서 배웠다는 거예요. 마치 여러 사진을 비교해서 패턴을 찾아내는 거랑 비슷해요.

그리고 이 모델의 실력을 테스트하기 위해 단백질 구조 예측의 올림픽이라고 불리는 국제 대회(CASP14)에 참가했어요.

결과가 정말 놀라워요

AlphaFold가 압도적으로 1등을 했어요. 그것도 단순히 이기는 수준이 아니라, 실제 실험으로 측정한 구조와 거의 구별 불가능할 정도로 정확하게 맞춰냈어요. 이건 정말 역사적인 순간이라고 평가받고 있어요.

구체적으로 뭐가 대단했냐면:

  • 정확도가 미친 수준: 대부분의 단백질을 원자 단위로 정확하게 예측해냈어요
  • 아무것도 없는 상태에서도 가능: 비슷한 구조가 이미 알려진 단백질이 없어도 정확하게 예측할 수 있었어요. 기존 방법은 이 부분에서 가장 약했는데, AlphaFold는 여기서 빛을 발했어요
  • 다른 경쟁자들을 완전히 압도: 다른 모든 방법들과 비교했을 때 점수 차이가 정말 컸어요
  • 물리 법칙과 생물학을 AI에 녹였다: 단순히 데이터를 외우는 게 아니라, 단백질 구조의 실제 원리를 AI 설계에 포함시켜서 더 영리하게 만들었어요
  • 엄청 빨라요: 실험에 수개월~수년이 걸리던 걸 몇 시간이면 끝나요

우리 생활에 뭐가 바뀔까요?

먼저 새로운 약을 만드는 속도가 정말 빨라질 거예요. 새로운 바이러스가 나왔을 때 그 단백질 구조를 빠르게 예측하면, 치료제를 찾는 시간을 엄청 줄일 수 있거든요.

그리고 지금까지 구조를 몰라서 치료법을 못 찾던 희귀 병들도 연구가 활발해질 거예요. 환경 오염을 분해하는 효소를 만들거나, 친환경 재료를 설계하는 것도 가능해질 것 같아요.

결국 의학부터 환경, 재료 과학까지 정말 광범위하게 우리 생활을 바꿀 수 있는 거죠.

공유하기X (트위터)페이스북

📚 관련 논문