이 연구는 어쩌면 과학의 역사에서, 혹은 인류의 역사에서 중요한 이정표가 될 수도 있겠습니다. 흔히 강한 인공지능(AGI)이 구현되거나 특이점(singularity)에 도달하면 벌어질 일 중의 하나로 손꼽히는 것이 바로, 인공지능이 스스로 연구를 진행해서 새로운 과학적인 발견을 하게 된다는 것입니다.
만약 인공지능이 완전히 자율적으로 연구를 진행하여 새로운 과학적인 발견을 할 수 있다면, 인류의 역사가 새로운 페이지로 넘어가는 변화를 겪게 될 것입니다. 인공지능이 스스로 과학적인 진전을 이뤄낼 수 있다면, 이것 자체가 또 다른 새로운 과학적인 진전을 만들어낼 수 있는 토대가 됩니다. 이것을 소위 재귀적 자기 개선(recursive self-improvement)이라고 하는데요. 이런 과정이 반복되면 인류의 과학적 수준은 전례 없는 속도로, 혹은 걷잡을 수 없을 정도로 빠르게 발전할 수 있습니다. 로봇을 만드는 로봇을 만들거나, 3D프린터를 찍어내는 3D프린터를 만드는데 성공하는 것을 상상해보면 됩니다. 최근에 샘 알트만은 본인의 블로그 글인 The Gentle Singularity 에서, 인류가 이미 이런 단계에 서서히 접어들고 있음을 이야기한 바 있습니다. (아직 읽어보지 못하신 분이 계시다면, 꼭 읽어보시기를 권합니다.)
스스로 연구해서 과학적 발견을 하는 인공지능
이번에 소개해드릴 스탠퍼드 대학의 연구자들이 최근 네이쳐에 발표한 논문에는 이렇게 ‘스스로 연구해서 새로운 과학적인 발견을 하는’ 인공지능의 초기 성과를 보여주고 있습니다. 최근 복잡한 의학적 과업을 해결하기 위해서 마치 여러 분야의 ‘인간’ 전문가들이 협업을 하듯이, 각각 전문적인 역할을 부여 받은 여러 인공지능 에이전트가 서로 토론하고, 협업하는 소위 ‘멀티 에이전트‘ 인공지능 모델이 많은 주목을 받고 있는데요. (최근에 제가 소개해드린 마이크로소프트의 MAI-DxO가 대표적인 예시입니다. 환자의 질병을 진단하기 위해서 가설을 생성하는 에이전트, 진단 검사를 선택하는 에이전트, 평향을 제거하고 논리적 문제를 지적하는 에이전트 등이 서로 협업하는 모델로 구성되어, 의사보다 무려 4배가 높은 진단 정확도를 보였습니다.)
이 연구에서는 다양한 분야의 전문 연구자의 역할을 하는 여러 에이전트로 구성된 ‘가상 연구실(Virtual Lab)’을 만들었습니다. 일종의 ‘인공지능 연구팀’이라고 볼 수 있겠습니다. 이 ‘가상 연구실’은 면역학자(Immunologist), 머신러닝 전문가 (Machine Learning Specialist), 전산 생물학자(Computational Biologist)의 역할을 하는 개별 분야 전문가 에이전트 뿐만 아니라, 전체 연구를 아우르는 연구 책임자(Principal Investigator) 에이전트, 그리고 비판적인 사고를 하고 오류를 검증해주는 과학적 비판자(Scientific Critic) 에이전트로 구성되었습니다.
이런 여러 에이전트들이 (마치 인간 연구자들이 하는 것처럼) 모두 함께 모여서 팀 미팅을 하거나, 혹은 연구 책임자 에이전트와 1:1 미팅을 하면서 연구 주제를 분석해서 세부적인 연구 계획을 수립하고, 실제 연구를 수행합니다. 광범위한 질문에 대해서 결론을 도출하기 위해서는 모든 에이전트가 참여하는 팀 미팅을 진행하며, 이 미팅에서는 모든 에이전트가 차례대로 의견을 제시하게 됩니다. 혹은 특정 에이전트에게 더 구체적인 작업을 부여하고 해당 작업을 수행하게 하기 위해서는 1:1 미팅을 진행합니다. 더 좋은 답변을 얻기 위해서 이러한 미팅을 여러 라운드에 걸쳐서 연속적으로 시행하거나, 혹은 똑같은 미팅을 여러번 병렬적으로 수행해서 각 미팅에서 나온 답을 취합하는 방식도 활용하고 있습니다.

압도적으로 빠른 연구 수행 속도
인공지능이 이러한 과정을 모두 수행한다는 것에서 짐작할 수 있듯이, 전체 연구 과정은 매우 빠르게 이뤄집니다. 이 연구에서 ‘가상 연구실’의 실제 연구 사례로 ‘코로나 바이러스 변이를 공격할 수 있는 새로운 나노바디 신약 후보물질의 발굴에 성공’했다는 것을 보여주고 있습니다. 이를 위해서 크게 보면 ‘가상 연구실’에서는 아래와 같은 단계의 연구가 진행되었는데요.
- 팀 선정 (Team Selection): 어떤 역할의 에이전트로 구성할 것인지를 결정
- 연구책임자, 과학적 비판자, 면역학자, 기계학습 전문가, 전산생물학자 에이전트로 구성
- 프로젝트 세부 사항 결정 (Project Specification)
- 결정 사항1: 항체/나노바디 등 어떤 물질을 기반으로 신약 후보 물질을 만들지 결정
- 결정 사항2: De Novo로 완전히 새로 만들지, 기존의 항체/나노바디를 수정할지 결정
- 결정 사항3: 수정한다면, 구체적으로 어떤 항체/나노바디를 기반으로 할지를 결정
- 도구 선정 (Tools Selection): 선택한 나노바디를 수정하기 위해서, 어떠한 시뮬레이션 툴을 사용할지를 선택
- 결과적으로 ESM, AlphaFold-Multimer, Rosetta를 선택함
- 도구 구현(Tools Implementation): 각각의 툴을 활용하여 실제로 나노바디를 설계할 수 있는 파이썬 코드를 작성
- 워크플로우 설계 (Workflow Design)
- 각 나노바디 후보들에게 몇개의 돌연변이를 부여할지
- 각 툴에서 나온 점수들에 어떻게 가중치를 부여하여 총점을 계산할지
- 총점 기준으로 상위 몇개의 후보들을 다음 단계로 진행시킬지 등
이러한 과정에서 ‘가상 연구실’의 각 미팅은 약 5-10분 정도밖에 소요되지 않았고, 전체 미팅을 모두 완료하기 위해서 단 1-2시간 밖에 걸리지 않았다고 합니다. 현실적으로는 각 단계에 대한 프롬프트를 조정하고, 에이전트가 작성한 코드를 검토하고 디버깅하는 시간까지 고려하면, ‘가상 연구실’은 나노바디 워크플로우 설계를 단 며칠만에 완료했다고 합니다. 논문에서는 인간 연구자가 동일한 파이프라인을 설계하고 구축하기 위해서는 몇 주가 걸렸을 것이라고 예상하고 있습니다.
극히 제한적이었던 인간 연구자의 역할
이 연구에서 특히 흥미롭고도, 중요한 부분은 전체 과정에서 인간의 역할은 극히 제한적이었다는 것입니다. 인간 연구자의 역할은 큰 주제를 던져주고, 연구의 큰 흐름 정도를 제시하는 것에 그쳤습니다. 나머지 대부분의 과정은 인공지능 에이전트끼리 토론하고 의논해서 결정이 되었습니다. 제가 놀랐던 점은, 이 연구에서는 심지어 어떤 역할의 에이전트로 팀을 구성할지 그 자체를 인공지능이 결정한다는 것입니다. ‘가상 연구실’을 구성하는 기본 요소는 ‘연구 책임자’와 ‘과학적 비판자’ 에이전트 두 가지 밖에 없습니다. 이 연구에 참여한 면역학자 에이전트, 머신러닝 전문가 에이전트 및 전산생물학자 에이전트는 모두 ‘연구 책임자’ 에이전트가 필요하다고 결정한 것입니다. 인간 연구자로부터 받은 연구 주제를 분석하여 ‘연구 책임자’ 에이전트가 그렇게 스스로 판단한 것이지요. 놀랍지 않을 수 없습니다.
인간 연구자의 역할이 극히 제한적인 수준에 그쳤다는 점은 이 가상 연구실에서 각각의 에이전트와 인간 연구자가 대화에 참여한 비율을 보면 여실히 드러납니다. 인간 연구자들은 전반적인 아젠다를 던져주거나, 높은 수준 (high level)의 가이드를 제공하는 정도에 그쳤는데요. 이번 연구 워크플로우의 전 단계에 걸쳐서, 인간 연구자는 1,596 단어만 작성하여, ‘가상 연구실’이 작성한 총 단어의 1.3%에 불과하였습니다. 반면, 에이전트들은 122,462단어를 작성하여, 총 단어의 98.7%를 작성했습니다.
더 나아가, 시뮬레이션 툴인 ESM, AlphaFold-Multimer, 및 Rosetta 스크립트는 모두 에이전트들이 처음부터 작성했으며, 일부 보완적인 데이터 처리 및 작업 스케줄링 스크립트 정도만 연구팀 컴퓨팅 인프라의 특정 조건을 처리하기 위해 인간 연구자가 작성했습니다.

실험적으로 검증된 후보 물질이 나오기까지의 과정
사실 이 연구는 스스로 연구를 진행하는 ‘가상 연구실’을 만들었다는 것 자체가 중요하고, 이 ‘가상 연구실’이 어떤 코로나 변이 억제 후보 물질을 만들어냈는지는 하나의 예시에 불과하다고 생각합니다. 하지만 이 ‘가상 연구실’이 구체적으로 어떤 식으로 연구를 진행했고, 그 결과 도출된 후보 물질을 어떻게 검증했는지를 알아보기 위해서 그 과정을 간략하게만 소개해보겠습니다. 다시 강조합니다만, 중요한 것은 (인간 연구자는 연구 주제를 던져주고, 큰 방향만 제시했을 뿐) 아래에 언급되는 세부적인 연구 방법론들 대부분이 인공지능 에이전트들에 의해서 결정되었다는 것입니다.
먼저 팀 선정 파트에서는 인간 연구자에 의해서 주어진 연구 아젠다, 즉 ‘SARS-CoV-2 KP.3 변이체의 스파이크 단백질에 대한 항체/나노바디 설계’를 위해서, 연구 책임자 에이전트에게 세 명의 과학자 에이전트 팀을 선택하도록 했습니다. 그 결과 면역학자, 머신러닝 전문가, 전산 생물학자의 에이전트를 생성하기로 결정되었습니다.
프로젝트 세부 사항 결정 파트에서는 전체 에이전트 팀이 항체와 나노바디 중 무엇을 선택할지, 기존 항체/나노바디를 수정할지, 아니면 새로운 항체/나노바디를 de novo로 설계할지 등을 선택하게 하였습니다. 그 결과 기존의 나노바디를 수정하기로 하였고, 특히 SARS-CoV-2에 대해 강력한 중화 능력을 입증했으며, 구조 데이터가 있어 수정에도 용이한 Ty1, H11-D4, Nb21, VHH-72 의 네 가지 나노바디를 선택하였습니다. 이러한 결정에 따라, ‘가상 연구실’에서는 KP.3 스파이크 단백질의 수용체 결합 도메인(RBD)에결합하는 나노바디 개발에 집중하게 되었습니다.
도구 선정 파트에서는 나노바디를 수정하기 위한 시뮬레이션 도구 세트를 선택하였습니다. 결과적으로 ESM, AlphaFold-Multimer, Rosetta를 계산 나노바디 설계 워크플로우의 구성 요소로 사용하기로 결정했습니다.
- ESM은 메타AI에서 개발한 ‘단백질 언어 모델(protein language model)’로 단일 돌연변이에 의해서 단백질 서열에 변화가 생길 경우, 기존 서열보다 더 안정적이고, 진화적으로 가능한 서열인지를 평가하는 모델입니다.
- AlphaFold-Multimer는 딥마인드가 개발한 단백질 복합체(protein complex) 구조 예측 모델입니다. 이 연구에서는 설계된 나노바디와 RBD의 복합체 구조를 예측하고, 결합의 안정성을 평가하기 위해서 활용되었습니다.
- Rosetta는 단백질 구조 시뮬레이션 툴로, 이 연구에서는 나노바디와 RBD 복합체의 결합 자유 에너지를 계산하여, 결합 친화도, 즉 얼마나 강하게 결합하는지를 예측하기 위해서 활용되었습니다.
도구 구현 파트에서는 이 세 가지 시뮬레이션 툴을 실제로 어떻게 활용할지에 대해서, 각 에이전트가 파이썬 스크립트와 XML 파일을 직접 작성하고, ‘과학적 비판자’ 에이전트의 피드백을 받아 오류를 수정하면서 코드를 개선했습니다.
이후 ‘가상 연구실’은 나노바디를 수정하기 위한 세부적인 워크플로우를 설계했습니다. 네 가지 기존 나노바디 후보 각각에 대해서 모든 가능한 단일 돌연변이를 ESM에 의해 평가하여, 상위 20개의 돌연변이를 선택하기로 했습니다. 이를 AlphaFold-Multimer와 Rosetta로 평가한 이후, 세 가지 툴에서 나온 점수를 활용해 상위 5개의 후보를 선택합니다. 이것이 한 라운드이고, 한 라운드에서 나온 후보는 그 다음 라운드의 시작 서열로 사용됩니다. 이를 총 4라운드를 진행합니다.
그 결과 나온, 가장 좋은 돌연변이 나노바디 92개 (즉, 4개의 각 시작 나노마디마다 23개)를 선택하여, SARS-CoV-2 KP.3 스파이크 RBD에 결합할 수 있는지 실험적으로 확인하였습니다. 이를 위해, KP.3 RBD 단백질, 밀접하게 관련된 모체 변이체(JN.1 RBD), 밀접하게 관련된 변이체(KP.2.3 RBD), 초기 오미크론 변이체(BA.2 RBD)에 결합하는지를 확인하였습니다.
이 92개의 후보 나노바디 중에서, 두 개가 유망한 결합을 보였습니다. 첫 번째는 Nb21에서 파생된 I77V-L59E-Q87A-R37Q(즉, I77V, L59E, Q87A, R37Q 돌연변이를 가진 Nb21)로, JN.1 RBD에 결합력을 보였습니다. 두 번째는 Ty1 돌연변이 나노바디(V32F-G59D-N54S-F32S)로, 우한 RBD에 대한 결합을 개선했을 뿐만 아니라 JN.1 RBD에 대한 중간 정도의 결합도를 얻었습니다. 이것이 이 논문에서 보여주는 최종 결과입니다.
물론 나노바디가 JN.1 RBD에 단순히 결합한다고 해서, 이것이 백신으로의 효과가 있을 것인지를 장담할 수는 없습니다. 백신의 가능성이 있는지를 보기 위해서는 이 나노바디의 중화능력, 면역 유도 능력 등을 추가로 확인해야 합니다. 하지만, 결합한다는 것 자체는 1차적인 선별에서 중요한 단서가 될 수 있는 부분입니다.

인공지능이 스스로 과학 연구를 수행하는 미래
이번 연구의 가장 중요한 점 중의 하나는 이러한 ‘가상 연구실’ 모델이 연구 주제나 과학 분야에 구애받지 않는다는 것입니다. 심지어 과학 분야가 아니라 다른 분야에서의 연구나, 문제 해결에도 활용될 수 있습니다.
이는 향후 과학적인 연구가 진행되는 방식에 큰 영향을 미칠 것임이 분명합니다. 연구자들은 지금까지 그래왔듯이, 다른 인간 연구자와의 협업도 진행하겠지만, 이제는 여러 세부 분야의 전문가 역할을 하는 에이전트와도 함께 연구하는 방식이 빠르게 늘어나지 않을까 합니다. 즉, 인공지능을 공동연구자로 적극적으로 받아들이게 되는 것이지요.
흔히 멀티 에이전트 모델에서 인간이 개입하는 것을 ‘휴먼 인 더 룹 (human-in-the-loop)’이라고 이야기 하는데, 오히려 향후 연구에서는 ‘AI 인 더 룹 (AI-in-the-loop)’의 형태로 나아갈 것이라고 해야 하지 않을까 합니다. 이는 특히 다학제간 협력이 필수적인 연구를 진행하기 위해서 강력한 프레임워크가 될 것이며, 과학자들의 생산성과 연구 성과를 크게 높일 수 있는 계기가 될 것입니다.
조금 더 멀리 나아가자면, 인간의 개입이 (이번 연구보다도) 더 최소화되거나, 아예 없어지는 경우도 이제는 시도해볼 수 있는 준비가 된 것 같습니다. 이번 연구에서는 아젠다를 인간이 던져주고, 또한 팀 선정 – 프로젝트 명세 – 도구 선정 – 도구 구현 – 워크 플로우 설계라는 전체 연구 구조에 대한 가이드라인도 ‘가상 연구실’에 제공했습니다. 하지만 이 마저도 에이전트에게 맡기는 것으로 이제는 충분히 구현해볼 수 있을 것 같습니다. 그 결과가 어떻게 나올지는 지켜봐야겠습니다만, 아마 세계 어딘가에서는 이미 이런 식의 연구가 진행되고 있을 것입니다.
샘 알트만은 The Gentle Singularity에서 인공지능이 스스로 과학 연구를 수행하거나, 과학 발전을 가속화하는 능력에 대해서 여러번 언급하고 있습니다. 아직은 인공지능 시스템이 완전히 자율적으로 자신의 코드를 업데이트하는 단계에는 이르지 못했으나, AI가 스스로 연구 역량을확장해나가는 초기 단계라는 점을 강조했습니다. 특히, 샘 알트만은 2026년에는 새로운 통찰력을 찾아낼 수 있는 인공지능 시스템이 등장할 가능성이 높다고 언급했었는데요. 이 논문에서 그러한 가능성을 보여주고 있다고 할 수 있습니다.
마지막으로 한 가지를 더 언급하고 이번 글을 마무리할까합니다. 이 논문에는 언급되고 있지 않습니다만, 이 연구의 교신 저자인 James Zou 교수님의 Stanford’s RAISE Health Symposium 2025 발표에는 놀라운 언급이 등장합니다. 실제로 이 ‘가상 연구실’이 새로운 과학적인 인사이트를 스스로 발견한다는 것입니다. James Zou 교수님의 연구팀에서 과거에 출판한 논문과 해당 데이터셋을 ‘가상 연구실’에 제공했더니 며칠만에 이를 분석해서 인간 연구자들이 이전에 생각하지 못했던 새로운 과학적인 통찰력을 제시했다고 합니다. 그리고 그러한 분석 결과와 검증된 가설을 그림까지 담긴 상세한 보고서를 통해 제공했다는 것입니다.

연구자들은 이런 데이터셋을 분석하고 논문을 쓰는데 수년의 시간을 보냅니다. 세계 최고 수준의 스탠퍼드 대학의 연구자들이 수년동안 발견하지 못했던 과학적 발견을 며칠만에 이 ‘가상 연구실’이 해내고 있다는 것이지요. 이러한 인공지능 에이전트들은 이미 과학 연구에서 변화를 만들어내고 있으며, 향후 의학 연구를 포함한 과학 연구를 크게 가속화시킬 것입니다.
이것이 제가 서두에 이 연구가 어쩌면 과학의 역사에서, 혹은 인류의 역사에서 중요한 이정표가 될 수도 있다고 언급했던 이유입니다. 우리는 인류의 역사에서 정말로 흥미진진하고도 흥분되고, 또 한편으로는 두려움도 느껴지는 시기를 지나고 있는 것 같습니다.
최윤섭의 디지털 헬스케어에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.






좋은 글 감사합니다
[…] 3배로 높아졌습니다. 의학은 빠르게 발전하는 분야이기 때문에 (최근 들어 AI를 연구에 활용하기 시작하면서 더욱 속도가 빨라졌지요), 매일 쏟아지는 논문과 […]