영상의학 분야에서의 에이전틱 AI

이번 Radiology에 영상의학 분야에서의 Agentic AI 에 대한 아티클이 실렸습니다. 최근 크게 주목 받고 있는 Agentic AI 중에서도 특히 영상의학 분야에 특화되어 있는 Agentic AI에 대한 내용을 심도 있게 다루고 있는 아티클입니다. 일반적인 Agentic AI에 대한 개념과 대비해서, 의료, 특히 영상의학 분야에서 Agentic AI가 어떠한 의미와 특수성을 가지는지, 어떤 방향으로 나아가고 있으며, 향후 어떤 과제가 남아 있는지를 다루고 있습니다.

길이가 긴 아티클은 아니지만, 영상의학 분야의 Agentic AI가 가져야 할 주요 내용들이 잘 정리되어 있어서, 저도 따로 아래와 같이 정리해보았습니다.

AI Agent와 Agentic AI의 개념에 대한 구분:
– AI Agent: 목표 달성을 위해 반복적인 루프 속에서 도구 호출을 통해 환경을 인식ㅋ하고, 추론하고, 계획하고, 행동하는 프로그램. 주로 LLM에 의해서 구동됨.
– Agentic AI: 제한된 인간의 감독 하에 복잡한 다단계 작업을 해결하기 위해 하나 이상의 에이전트를 조율하는 더 넓은 시스템 프레임워크

영상의학에서 에이전틱 AI는 좁은 범위의 정적인 애플리케이션(예: 이미지 분류기 또는 병변 탐지기)을 넘어 반성적 추론, 동적 도구 조정 및 실시간 적응을 통합하는 방향으로 나아가고 있음.

에이전틱 AI를 선택적인 에이전트 간 통신, 동적 조정 및 영구 메모리를 갖추고, 에이전트(들)를 목표가 세분화된 파이프라인으로 조율하는 시스템 패러다임으로 규정. 아래와 같이 일관되게 나타나는 공통점이 있음:
(a) 추론과 계획을 위한 파운데이션 모델, 주로 LLM 또는 멀티모달 LLM(MLLM)
(b) 데이터베이스 쿼리나 API 호출과 같은 도구를 사용할 수 있는 능력
(c) 에이전트가 관찰하고, 반성하고, 추론을 조정할 수 있게 하는 반복 루프
(d) 정의된 인간의 감독

영상의학 분야에서의 Agentic AI의 가능성:
– 전자건강기록(EHR)에서 흡연 및 악성 종양 병력, 생검 결과 등의 정보를 검색하고, 현재 및 이전 영상 소견을 분석하며, 판독문 초안을 작성하고, 필수 청구 항목의 문서화를 검증하며, 근거 기반의 후속 조치 권장 사항을 발행하고, 긴급 결과의 소통 우선순위를 정하며, 필요한 후속 조치를 지시할 수 있음.
– 파운데이션 모델을 EHR 통합, 이미지 분석, 구조화된 판독문 작성 및 상황별 메모리를 위한 도구들과 결합함으로써, 에이전틱 AI는 가상의 협력자로서 기능하며 판독, 소통 및 행정 워크플로우를 간소화할 수도 있음.

급속한 발전에도 불구하고, 임상 영상의학 분야에는 널리 배포된 자율적이고 비감독형의 end-to-end 에이전틱 시스템은, 아직 없음.

영상의학 판독문 생성을 위한 몇몇 연구 단계의 다중 에이전트 프로토타입이 가능성을 보여주고 있지만, 아직 초기 단계:
– RadCouncil: 유사 사례 검색, 소견 초안 작성 및 반복적인 검토를 위해 에이전트들을 조율하며, 내부 평가에서 단일 모델 기준선보다 더 나은 정확도, 문체적 정렬 및 명확성
– CBM-RAG: 개념 병목 모델(concept bottleneck models)을 다중 에이전트 검색 증강 생성(RAG) 파이프라인과 결합하는데, 여기서 에이전트들은 임상적 특징을 매핑하고, 외부 지식을 쿼리하며, 근거 기반 판독문을 작성하여 해석 가능성을 높이고 hallucination 현상 줄임.

의학 외의 분야에서는 에이전틱 AI 애플리케이션이 지속적으로 발전하여 비교의 기준점을 제공하고 있으나, 영상의학의 신뢰 기준은 훨씬 더 높음. 다만, 고무적이게도 여러 구성 요소들이 형태를 갖춰가고 있음.

Anthropic의 모델 컨텍스트 프로토콜(MCP) 및 Google의 Agent2Agent 프로토콜(A2A)과 같은 프로토콜은 아직 초기 단계이지만, 에이전트가 이미지 인코더, 가이드라인 검색 시스템 또는 EHR 쿼리와 같은 검증된 도구를 호출하고 복잡한 워크플로우 전반에 걸쳐 다른 에이전트와 조정할 수 있게 함으로써 상호 운용성을 향상시킬 잠재력을 가지고 있음.

현재 영상의학 워크플로우에서 매끄럽지 않은 부분은 작업을 자동화할 수 있는 기회를 의미함:
(a) 긴급한 검사의 우선순위를 정하거나 세부 전문 분야 대기열로 라우팅하는 작업 목록 분류(triage)
(b) 관련 이전 검사 기록을 검색하고 가이드라인 준수 여부를 확인
(c) 검토 및 편집을 위한 판독문 초안 생성

비전 모델을 “눈”(탐지기 및 분할기)으로, 의료 및 영상의학 특화 언어 모델을 “뇌”(추론, 계획 및 설명 처리)로 포함하고, 외부 시스템과 상호작용하는 도구 어댑터를 통해 조율되는 적절한 AI 모델 및 아키텍처가 선택되어야 함:
– 결정론이 필요한 곳에는 규칙 기반 방법을 사용하고,
– 유연성이 도움이 되는 곳에는 학습된 정책(learned policies)을 사용해야
– 트립와이어(신뢰도 및 적용 범위 한계), 임상적으로 중대한 결과가 따르는 작업에 대한 승인 게이트, 검증 체크포인트, 그리고 적절한 경우 실행 샌드박스를 구현하여 안전장치를 확장해야 함.

다중 에이전트 시스템은 오류 증폭 및 조정 실패의 소지가 있으므로 복잡성을 최소화해야 하며, 반복적인 반성(iterative reflection), 고정된 검증 체크포인트, 강력한 오류 및/또는 충돌 처리 등의 보호 장치를 추가해야 합니다.

에이전트는 기존 임상 환경(예: PACS, RIS, EHR)에 원활하게 통합되어야 하며, 워크플로우의 혼란을 최소화하기 위해 공통 표준(예: HL7, FHIR, FHIRcast, DICOM, DICOMweb)을 사용해야함.

실시간 성능 역시 매우 중요. 임상적으로 유용하려면 영상 획득 직후에 분류 알림 및 판독문 초안이 나타나야 함.

기술적 장벽으로는 방대한 양의 고품질 데이터와 상당한 컴퓨팅 성능에 대한 필요성이 포함
– 복잡한 영상 작업을 처리하도록 AI 에이전트를 훈련시키려면 희귀 질환과 다양한 환자 집단을 포함하는 광범위한 데이터셋이 필요
– 훈련을 넘어, 매일 수백에서 수천 건의 연구(검사)에서 정교한 에이전트를 실행하려면 강력한 인프라가 요구
– 대규모 환경에서 신뢰성을 보장하는 것은 여전히 가장 중요: 영상의학과 의사가 판독하는 케이스의 양은 다운타임이나 지연을 거의 허용하지 않기 때문

임상적 장벽으로는 신뢰 문제, 기술 저하(deskilling)의 위험, 그리고 워크플로우 통합이 포함
– 사용자 교육과 함께, AI의 확신 또는 불확실성을 전달하고, 아첨(sycophancy)을 방지하며, 알림 피로, 무시 편향(dismissal bias) 및 번아웃을 피하기 위해 알림 부담을 낮게 유지하는 구현이 필요

책임 소재: AI 에이전트가 오류를 범할 때 (악성 종양을 놓치거나 결함이 있는 권장 사항을 제공할 때) 책임 소재는 여전히 불확실하지만 기본적으로 영상의학과 의사에게 귀속되며, 이는 기관들이 AI에게 광범위한 자율성을 부여하는 것을 조심스럽게 한다.

의료기기 규제 장벽
– 현재 미국과 유럽 연합의 규제 프레임워크는 의도된 용도, 범위 및 자율성 정도에 따라 AI 애플리케이션을 의료 기기로 분류
– 좁은 범위의 낮은 자율성을 가진 도구는 기존 승인 경로를 통과할 수 있지만, 광범위하고 매우 자율적인 에이전틱 시스템은 상당한 규제 장애물에 직면
– 추가적인 규제 발전 없이는 현재 프레임워크 하에서의 승인 가능성은 여전히 불확실

향후 몇 년 안에, 지능형 에이전트가 일상적이고 반복적이며 데이터 집약적인 작업을 자동화하여 영상의학과 의사를 지원하는 AI 증강 워크플로우가 예상됨. 예를 들어,
– 에이전틱 AI는 관련 과거 검사 기록을 자동으로 수집하고, 현재와 과거 이미지를 비교하여 변화를 확인하며, 영상의학과 의사가 검토를 시작하기 전에 판독문 초안을 생성
– 영상의학과 의사는 AI와 나란히 작업하면서 검증, 미묘한 판독, 그리고 환자 소통에 집중할 수 있을 것
– 가까운 미래에는 이러한 영상의학과 의사와 AI의 협업이 표준이 될 가능성이 높음

결정적으로, 이러한 비전은 AI가 고립되어 작동하는 것이 아니라 인간과 AI의 협업을 의미
– 의료계에서 지금까지의 근거는 임상적 의사 결정에 있어 감독 없는 자율성보다는 감독 하의 지원을 지지함.
– 따라서 단기적인 시스템은 임상적으로 중대한 결과를 초래하는 모든 조치에 대해 HITL 승인을 의무화하는 워크플로우 증강에 중점을 두어야 함.
– 인간의 주체성(human agency)을 AI 개발의 핵심 설계 원칙으로 포함시키는 것은 인간의 잠재력을 축소하기보다는 오히려 증폭시키는 기술로 이어질 수 있음.

글쓴이

최윤섭

디지털 기술과 생명과학, 의학의 융합을 통해 사회적 가치를 창출하고 의료를 혁신하는 것을 화두로 삼고 있는 디지털 헬스케어 전문가, 미래의료학자, 작가, 벤처투자자입니다. 포항공과대학교(POSTECH)에서 컴퓨터공학과 생명과학을 복수전공하였으며, 전산생물학으로 이학박사 학위를 취득하였습니다. Stanford University 방문연구원, 서울대학교병원 연구조교수를 역임하였습니다. 현재 디지털 헬스케어 스타트업 전문 투자사 디지털 헬스케어 파트너스(DHP)의 대표 파트너이며, 연세대학교 의과대학 예방의학교실 외래조교수이기도 합니다. 『디지털 헬스케어: 의료의 미래』, 『의료 인공지능』, 『헬스케어 이노베이션』 등을 집필하였으며, Science의 제1저자를 비롯해서, 주요 국제 학술 저널에 다수의 논문을 개제하였습니다. npj Digital Medicine Editorial Board 멤버이자, 대한의료인공지능학회 설립 발기인 및 기획이사로 활동했습니다. 식약처 및 심평원의 자문위원이기도 합니다.


최윤섭의 디지털 헬스케어에서 더 알아보기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

Subscribe
Notify of
guest

0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
위로 스크롤
0
Would love your thoughts, please comment.x
()
x