Friday 29th March 2024,
최윤섭의 디지털 헬스케어

IBM Watson은 수가를 받을 수 있을까?

한국은 현재 IBM 왓슨 포 온콜로지 (Watson for Oncology, 이하 WFO)를 전세계에서 가장 활발하게 도입한 나라 중 하나다. 지금까지 총 8개 병원이 WFO를 도입한 것으로 보인다. 이는 미국과 중국을 제외하면 세계적으로 가장 많은 숫자인 것 같다.

중국은 2016년 가을에 항저우 코그니티브 케어(Hangzhou Cognitive Care)를 통해서 50개 이상의 병원에 도입되었으며, 미국은 다수의 병원에 서비스를 제공하는 2차 소견 전문 기업 베스트닥터(Best Doctor)가 WFO 및 Watson Genomics 등을 채택함으로써 실질적으로 중국보다 더 많은 수의 병원에서 접근 가능한 것으로 알고 있다.

한국에서는 WFO의 도입은 소위 빅5 병원으로의 환자 쏠림에 대비하기 위한 지방 병원들의 고육지책의 일환으로 보는 것이 일반적이었다. 대다수의 암 환자가 수도권으로 몰리는 현실에서 지방 병원들이 환자를 붙잡기 위한 노력의 일환이라는 것이다. 한국에서 WFO를 도입한 병원이 모두 지방 거점 병원이라는 것만 보더라도 알 수 있다.

[1.5hr v4] How AI would innovate the medicine of future 170317 copy.001

 

인공지능 헬스케어 컨소시엄

2017년 10월 31일 어제 WFO를 도입한 가천대 길병원, 부산대병원, 대구 가톨릭대병원, 대구 계명대 동산병원, 대전 건양대병원, 광주 조선대병원 등 6개 병원은 ‘인공지능 헬스케어 컨소시엄’을 구성한다고 밝혔다. 이 컨소시엄에서는 ‘인공지능이 수도권으로 암 환자가 쏠리는 현상을 해결할 수 있을 것’ 이라고 언급하기도 했다.

필자가 여러 칼럼이나 블로그, 강의에서 언급했다시피, WFO의 정확성이나 의학적 효용은 아직까지 완전히 증명되어 있지 않다. 이 증명을 위해서는 보다 철저한 임상시험이 필요하기도 하다. 단순히 의사와의 일치도를 확인하는 연구로는 의학적 효용을 판단하기가 어렵기 때문이다. 필자가 만나서 인터뷰했던 Watson Health의 최고의료책임자(Chief Health Office) Kyu Rhee 박사님도 내부적으로 정확성, 환자 만족도, 의료진 만족도, 비용 절감 등을 기준(endpoint)으로 임상 연구를 진행하고 있다고 이야기한 바 있다.

WFO는 분명히 실체가 있는 기술이다. 하지만 의료에서는 그 기술의 수준과 별개로 의학적 측면에서의 정확성과 효용성을 증명해야 하는 숙제가 있다. 또한, 최근에는 WFO가 실제 기술 수준과 대비해서 홍보가 과장되어 있다는 지적이 많다. 필자도 코멘트 했던 최근 STAT 뉴스의 장문의 기사는 이러한 비판을 잘 반영하고 있다.

필자가 이번 컨소시엄에서 기대하는 바는 두 가지다. 이러한 WFO의 효용성 증명에 대한 임상연구를 진행하기를 기대한다는 것이다. 이는 아마도 IBM의 후원을 받지 못할 가능성이 높다. IBM의 입장에서는 이러한 연구의 결과, WFO의 의학적 효용이 생각보다 높지 않을 리스크가 없지 않으므로, 이를 공개적으로 진행하는 것을 별로 달가워하지 않을 것이다.

또한, 국내에서만이라도 WFO를 사용하는 가이드라인 등 ‘기준’을 만들기를 바란다. WFO는 미국의 진료 환경을 만들어진 시스템이며, 현재 WFO를 도입한 병원은 저마다의 원칙 하에 이를 운용 중이다. 이렇게 운용 원칙이 달라지면, 환자에게 미치는 영향도 달라질 수 있다. 예를 들어, 어떤 경우, 어던 환자에게 WFO를 적용하고, 여기에서 나온 결과를 어떤 방식으로 활용할 것인지 등에 대한 기준을 만드는 것이 필요할 것이다.

 

왓슨은 수가를 받을 수 있을까

그런데 이번 컨소시엄의 기자 간담회를 보면 매우 흥미로운 부분이 있다. 바로 WFO를 급여화, 즉 국민건강보험으로부터 수가를 받겠다는 것이다. 기자 간담회에서 이 부분이 실제로 얼마나 강조되었는지는 모르겠지만 필자는 조금 의아한 느낌이 든다. 아래와 같은 이유들 때문이다.

무엇보다 왓슨 포 온콜로지는 의료기기가 아니다. 의료기기가 아니면 수가를 받을 수 없다. 매우 간단한 논리다.  필자도 포함되어 있는 식약처 인공지능 소프트웨어 협의체에서는 작년 말 이러한 내용이 포함된 가이드라인의 초안을 내어놓았다 (빅데이터 및 인공지능(AI) 기술이 적용된 의료기기의 허가·심사 가이드라인(안)). 비의료기기의 예시에는 “전자의무기록, 의료영상, 생체신호를 이용하여 문헌을 검색하고 문헌의 내용(진단법, 치료법 등)을 요약하여 제시하는 소프트웨어”라는 것이 포함되어 있다. 이것이 결국 왓슨 포 온콜로지를 의미한다. 최종 버전이 나오기까지는 여러 이유로 다소 지연되고 있지만, 이 부분에 변화가 생길 가능성은 별로 없어 보인다.

Screen Shot 2017-03-05 at 2.00.22 PM

해당 기기의 의료기기 해당 여부는 사용 목적(intended use)과 위해도(risk)에 의해서 결정된다. 사용 목적은 사용자인 병원이 아니라 제조사인 IBM이 결정한다. 위해도는 식약처나 FDA에서 판단할 것이다. 필자가 Kyu Rhee 박사님께 ‘WFO를 의료기기로 분류되어야 한다고 생각하느냐’ 고 물었을 때, ‘IBM은 각국의 규제 기관의 결정을 존중한다’는 것이었다. IBM의 입장에서는 한국 식약처의 결정을 굳이 뒤집기 위해서 노력할 이유가 없다.

또한, 만약 의료기기가 되기로 결정한다면, (의료기기 등급에 따라서 달라지겠지만) 이 경우 IBM이 주체가 되어서 본격적으로 공개적인 임상시험을 해야 할 수도 있다. WFO의 동등성을 입증할 기기도 없으므로 비교임상을 하기도 어렵고, 왓슨의 절대적인 퍼포먼스를 측정할 수밖에 없다. 앞서 언급했듯이, 이는 결코 (적어도 내부적으로 이에 대한 검증이 여전히 진행 중인 현재로서는) IBM이 원하는 바는 아닐 것으로 생각한다.

 

미국의 경우

한국뿐만 아니라 미국에서도 WFO 는 의료기기가 아닌 것으로 결정되었다. 오바마 정부가 임기 말에 의욕적으로 추진하여 통과시킨 21세기 치유법(21st Century Cures Act)에는 이러한 내용이 언급되어 있다. 2016년 12월에 발표된 이 법안에는 왓슨 포 온콜로지를 특정하지는 않았으나, 이러한 유형의 시스템은 의료기기의 범위에 포함되지 않는 것으로 보고 있다. 아래와 같은 소프트웨어는 의료기기에서 제외한다고 명시하고 있다. (SEC. 3060. “CLARIFYING MEDICAL SOFTWARE REGULATION.”)

  • 환자의 의료 정보 또는 임상 연구 결과나 가이드라인 등의 의료 정보를 표시, 분석, 출력하는 소프트웨어
  • 질병 예방, 진단, 치료에 관해 의료 전문가에게 권고 사항을 지원하거나 제공하는 소프트웨어로
  • 의료전문가가 그러한 권고의 근거를 독립적으로 검토할 수 있도록 제작된 소프트웨어.

뿐만 아니라 미국에서도 WFO가 수가를 받지는 않는다고 알고 있다. 의료기기의 경우 국가별로 일관적인 정책을 만드는 것이 매우 중요하다. EU의 경우에는 의료기기로 분류된 것으로 알려졌지만, 이는 규제 담당자들 사이에서도 예외적인 결정으로 간주되는 것으로 보인다.

그리고 기사에서 언급된 WFO가 지속적으로 업데이트가 된다는 부분도 가이드라인에는 이제 반영되어 있다. 소위 버전 관리인데, WFO와 같은 adaptive system은 새로운 논문 등의 출판에 따라서 정기/비정기적으로 버전이 달라지기 때문이다. 식약처 협의체에서는 이 부분을 알고리즘과 이 알고리즘이 근거로하는 DB를 따로 구분해서 관리하는 식으로 풀었다. 딥러닝이 적용된 영상 판독 의료기기의 경우에는 다른 문제지만, WFO가 비의료기기라는 결정에 이 부분이 영향을 미치지는 않을 것 같다.

 

유방암 판독은 수가를 받는다?

기자 간담회에서 나왔던 또 다른 이야기 중에 미국에서 유방암에 대한 인공지능이 수가를 받는다는 것은 구체적으로 어떤 의미인지는 잘 모르겠다.

혹시 유방촬영술(mammography)의 자동진단보조(CAD)의 수가를 의미하는 것일까? 유방촬영술 CAD는 엑스레이 영상을 판독하는 것이므로 CDSS(Clinical Decision Support System)인 WFO에 비교해서 이야기할 수 있는 것은 아니다. 비교하려면 여타 CDSS가 수가를 받고 있는지를 근거로 해서 주장해야 할 것이다.

미국에서 유방촬영술 CAD는 1998년 FDA 승인을 받고 2002년부터 CMS(Centers for Medicare and Medicaid Services)의 수가를 받기 시작했다. 이 보험 혜택을 받기 전까지 유방촬영술 CAD의 사용 비중은 5%도 안될 만큼 거의 미미했는데, 2008년에는 74%, 2012년에는 83% 까지 폭발적으로 증가했다.

cad 1-

2002년 보험 적용 이후로 유방촬영술 CAD의 사용은
폭발적으로 증가했다 (출처: JAMA Intern Med)

하지만 2015년 JAMA에 출판된 연구에 따르면, 2003-2009년에 시행된 유방촬영술 CAD 30만 건 이상의 결과를  후향적으로 분석한 결과 유방촬영술 CDA이 암의 검출이나, 판독 정확도나 민감도 측면에서 유의미하지 않거나 오히려 악영향을 준다는 것이 밝혀졌다. 즉, 이 결과에 따르면 보험 수가를 주는 것이 필요하다는 주장은 설득력을 잃는다.

물론 이 2002년에 승인 받은 이 CAD는 아주 오래된 기술이다. 현재 루닛 등에서 개발하고 있는 딥러닝 기반의 시스템으로 바뀐다면 정확도는 극적으로 상승할 것은 자명하다. 이 때는 정확도 자체가 달라지므로 이를 기반으로 한 의학적 효용을 다시 평가해볼 필요가 있을 것이다. 다만 이번 컨소시엄의 주장에 근거로 쓰이기에 적절한 것은 아니라는 점을 지적하고 싶다.

Screen Shot 2017-11-01 at 10.28.09 AMCAD의 사용이 민감도, 검출력 등에서 유의미하지 않거나,
오히려 악영향을 미친다. (출처: JAMA Intern Med)

 

 

왓슨의 비용 효과성을 증명할 수 있을까

또 다른 문제는 WFO의 비용 효과성을 증명하기 위한 문제이다. 만에 하나 WFO가 의료기기로 분류된다고 해도 비용 효과성을 증명하기는 쉽지 않을 것으로 보인다. 심평원 NECA 등에서 어떤 의료기기에 수가 반영이 필요한지 여부와, 수가를 얼마로 책정할 것인지를 결정하기 위해서 중요한 기준이 비용 대비 효과이다.

무엇보다도 ‘비용’ 대비 효과를 측정하려면, ‘비용’을 공개해야 한다. 하지만 현재 IBM과 병원의 계약을 보면 이 비용 부분은 공개하지 않는다는 것이 조건이다. 비용을 공개하지 못하면 비용 효과성 측정도 불가능하다. 물론 의료계에서 공공연하게 떠도는 이야기가 있기는 하지만, 공식적으로는 공개된 바도, 확인된 바도 없다.

또한, 비용 대비 ‘효과’를 무엇을 기준으로 측정할 것인지도 숙제다. 이는 앞서 이야기한 임상 연구의 필요성과 다시 맞물리는 이야기인데, WFO의 정확성과는 별개로 ‘효과’를 증명하기 위한 기준을 정하기가 마땅하지가 않다. 의사군 vs 의사+WFO군을 비교 임상하여 5년 생존율을 의학적 효용으로 정의하고, (WFO의 건당 비용을 공개하여) WFO의 건당 비용 대비 개별 환자의 생존 기간 연장 효과를 평가해야 할까? 어떠한 기준을 적용해야 할지 필자도 잘 모르겠고, 실제로 이를 진행한다고 하더라도 WFO의 비용 효과성이 우수하게 나올지도 미지수다.

사실 딥러닝 등을 이용한 영상판독 보조 의료기기 같은 경우에는 장기적으로 보면, 의사의 판독 효율성이 증가해서 의사 한 명당 판독할 수 있는 영상의 숫자가 늘어난다는 논리를 적용할 수도 있다. 하지만 WFO의 경우, 진료에 필요한 종양내과 의사의 숫자에도 별반 차이가 없을 것이므로, 병원에서 의사를 고용하는 인건비를 절감할 수 있기 때문에 비용 대비 효과가 있을 수도 있다는 논리를 적용하기도 어렵다.

 

IBM은 이런 움직임을 어떻게 생각할까

마지막으로 (수가가 가능한지의 여부와는 별개의 문제일 수도 있으나) IBM은 병원들의 이런 움직임을 어떻게 생각할지에 대해서도 고려해볼 필요가 있다. 개인적으로는 IBM이 병원들의 이런 움직임을 별로 달갑지 않게 생각할 가능성이 높다고 본다.

앞서 언급했듯이 세계적으로 WFO의 현재 기술 수준 대비 지나친 홍보에 대한 비판의 목소리가 높아지고 있다. 이 때문인지는 최근 국내외 행사에 참석해보면 IBM이 Watson의 홍보와 마케팅을 상당히 자제하고 있다는 느낌을 받는다. 우연인지는 모르겠지만, 특히 STAT 뉴스의 보도 이후로 그러한 느낌이다.

필자가 이번에 Health 2.0, DigiMed17, Rock Health Summit의 세 개 학회에 참석하면서, 의아하게 생각했던 것은 IBM의 발표자 및 왓슨에 대한 언급이 현저히 줄어들었다는 것이다. DigiMed17에는 IBM 연자가 참석했지만 WFO 이야기는 하지 않았고 (스마트 홈 등에 대한 이야기를 함), Rock Health Summit에서는 원래 예정되어 있던 Kyu Rhee 박사님의 패널 토의 참석이 취소되고 다른 토론자로 대체되었다.

IBM은 글로벌에서 매우 엄격한 홍보 가이드라인을 받고, 전 세계적으로 일관된 마케팅 전략을 쓴다. IBM이 WFO에 대한 지나친 홍보를 자제하기로 결정했다면, 현재는 몸을 사리면서 WFO에 대한 내실을 다지려고 할 것 같다. 만약 이러하다면, IBM의 입장에서는 이번 컨소시엄의 구성에 따라서 (한국에서만) 여러 목소리가 나오는 것을 별로 환영하지는 않을 것으로 본다.

 

About The Author

디지털 헬스케어를 통해 의료를 혁신하고 세상을 더 건강하게 만들고자 하는 벤처투자자, 미래의료학자, 에반젤리스트입니다. 포항공대에서 컴퓨터공학과 생명과학을 복수 전공하였고, 동대학원에서 전산생물학으로 이학박사를 취득했습니다. 스탠퍼드 대학, 서울대학교병원 등에서 연구하였습니다. 현재 디지털 헬스케어 스타트업 전문 투자사, 디지털 헬스케어 파트너스 (DHP)를 2016년에 공동창업하였고, 대표를 맡고 있습니다. 지금까지 40여 개의 디지털 헬스케어 스타트업에 투자하였습니다. 네이처의 디지털 헬스케어 분야 자매지 『npj 디지털 메디슨』의 편집위원이자, 식약처, 심평원의 전문가 협의체 자문위원입니다. 『디지털 헬스케어: 의료의 미래』 『의료 인공지능』 『헬스케어 이노베이션』 등을 집필하였습니다.

Leave A Response