Tuesday 26th September 2017,
최윤섭의 Healthcare Innovation

데이터 중심 의학과 ‘머니볼’

Yoon Sup Choi December 25, 2015 Big Data, Digital Healthcare Comments
money_ball_pitt

혹시 ‘머니볼’ 이라는 책을 들어보신 적 있으신가요?

이 책은 경제학분야 저널리스트인 마이클 루이스가 미국 메이저리그의 야구단, 오클랜드 애슬레틱스(Oakland Athletics)의 실화를 다룬 ‘야구 책’ 입니다. 책은 2003년에 출판되어 세계적인 베스트셀러가 되었고, 2011년에는 브래드 피트 주연의 동명의 영화로 만들어진 바가 있는데요. 저는 이틀 전에 구매해서 이제야 읽었습니다. 사실 책의 유명세를 감안하면 늦어도 너무 늦게 읽은 것 같습니다.

늦었지만 ‘머니볼’ 을 읽을 결심을 했던 계기는 다름 아닌 에릭 토폴 박사님의 스크립스 중개과학연구소 (Scripps Translational Science Institute, STSI) 에서 머니볼의 주역 중 한 사람인 폴 디포디스타 (Paul DePodesta) 를 생물정보학 분야의 교수로 임용했다는 소식을 들었기 때문입니다.

저는 지난 10월 초 스크립스 중개과학연구소의 Transforming Medicine 학회에 다녀온 후기를 블로그에 몇번에 걸쳐 올려드린 바 있었는데요.

이 학회에 폴 디포디스타 역시 연자로 초대받아 발표를 했었지만, 당시에는 누구인지도 잘 몰랐고 큰 인상을 받지는 못했던 것이 사실입니다. (슬라이드 없이 스탠딩 코미디언처럼 서서, 주로 야구계 이야기를 했던 것으로 기억합니다) 그런데 이 분이 STSI 에 교수가 될 정도라니 어떤 사람인지 궁금하기도 했고, 에릭 토폴 박사님의 복안이 무엇일지 궁금했기 때문에 바로 이 책을 주문하여 읽기 시작했습니다.

DePodesta-Topol-e1450728586681
에릭 토폴 박사님과 폴 디포디스타 (출처: Scripps Health)

데이터 분석으로 야구의 역사를 바꾸다

머니볼은 잘 알려져있다시피, 야구 이야기입니다. 단순한 야구 이야기가 아니라, 데이터와 통계를 바탕으로 한 야구 구단의 경영 이야기입니다. 2000년대 초반 가난한 메이져리그 야구단 오클랜드 어슬레틱스가 데이터와 통계를 기반한 전략을 통해, 천문학적인 돈을 투자하는 뉴욕 양키스 같은 부자 구단들을 어떻게 이겨나갈 수 있었는지를 분석한 책입니다.

이 책의 핵심은 기존 야구계에 만연했던 잘못된 통념과 편견을 데이터와 통계에 기반한 논리적인 분석을 통해 깨뜨리고, 더 나아가 선수의 역량 중 실제로 승리에 기여하는 것이 무엇인지에 대한 인사이트를 얻었다는 것이었지요. 이를 통해 (실제로는 큰 가치가 있지만) 기존 통념이나 겉모습으로 인해서 저평가되거나 무시당했던 선수를 발굴하고 저렴한 가격에 영입함으로써, 수퍼스타 없이도 가난한 구단 오클랜드 어슬레틱스가 승리해나갈 수 있었다는 이야기입니다. (정규 리그에서 20연승이라는 대기록을 세우기도 하지요)

사실 머니볼의 주인공은 특정 인물이라기보다는 ‘데이터와 통계에 기반한 분석’ 이라는 일종의 철학이라고 봐야할 것 같습니다. 이러한 철학을 중심으로 많은 인물들이 등장하는데, 그 중에서 가장 핵심 인물을 꼽자면 역시 오클랜드 어슬레틱스의 단장인 빌리 빈 (Billy Beane) 입니다. 야구단의 감독보다 더 큰 권한을 쥐고 흔드는 단장으로 등장합니다. (영화에서는 브래드 피트가 연기했습니다)

그런데 이 야구단에서 실제로 데이터를 분석한 인물은 당시 하버드 경제학과를 졸업한지 몇년 되지 않았던 신출내기 폴 디포디스타 (Paul DePodesta)였습니다. 당시 야구계의 스카우터들은 5-tool player (타격 정확도, 장타력, 수비, 송구, 주루의 공수 5박자를 모두 겸비한 플레이어), 체격, 타율 등의 기존의 통념에 의지해서 선수들을 평가하고 영입했습니다. 이 스카우터들은 대부분 메이져리그, 마이너리그 등 선수 출신으로 자신이 오랜 시간 쌓아온 경험과 통찰력을 통해서 선수를 평가했지요.

이에 반해 폴 디포디스타는 선수 출신은 커녕, 야구 문외한의 젊은 경제학도였던 것입니다. 하지만 선수로서의 경험이 일천한 대신, 폴 디포디스타는 데이터 분석을 통해 당시 야구계에서는 무시되던 출루율, 장타율 등이 승리에 가장 영향을 크게 미친다는 분석을 이끌어 내었습니다. 빌리 빈 단장은 많은 반대에도 불구하고 이를 효과적으로 야구단 운영에 적용했던 것이지요. (베스트셀러가 된 머니볼 때문에 너무 많은 주목을 받게 된 폴은 영화에서는 실명을 쓰는 것을 거부했습니다. 그래서 영화에서는 피터 브랜드 (Peter Brand) 라는 이름으로 등장합니다. 하버드 대신 예일대를 졸업한 것으로 각색되기도 했구요.)

f0213613_50dd996e31f8f
영화 머니볼(2011)에서 ‘피터 브랜드’ 역으로 묘사된 폴 디포디스타

 

야구의 데이터 사이언스, 세이버메트릭스

사실 ‘기록의 스포츠’ 라고 불리는 야구만큼 경기의 모든 부분이 정량적인 데이터로 기록되는 종목도 없습니다. 선수들이 경기하는 일거수 일투족이 숫자와 기록으로 남게되고, 이를 통해 통계적인 분석이 가능해집니다. 야구에서는 이러한 통계학적 데이터 분석 분야를 세이버메트릭스 (sabermetrics) 라고 불려왔습니다. 다양한 수리적, 통계적 방법론을 동원해 야구를 분석하는 분야로, 일종의 ‘데이터 사이언스’ 라고 할 수 있겠죠.

특히, 이러한 세이버메트리션들은 야구를 더 객관적으로 이해하고 본질적으로 접근하기 위해서, 기존에는 측정하지 않던 새로운 종류의 데이터를 만들어서 측정하기도 하고 (예를 들어, 타구의 각도나 공이 낙하한 위치 등을 수치화하기 위한 지표 개발 등), 기존의 수치를 조합하여 새로운 유의미한 수치를 만들어내기도 합니다. (쉬운 예시로, OPS (출루율+장타율), WHIP (이닝당 안타와 볼넷 허용률) 등등)

폴 디포디스타 역시 이러한 초기 세이버메트리션 중의 한 명이라고 할 수 있습니다. 당시에는 새롭고 참신했던 이러한 데이터 분석은 오클랜드 어슬레틱스의 성공과 베스트셀러 머니볼의 주목 덕분에 이제는 대부분의 구단이 사용하는 방법론이 되었습니다. 이후 이 전략을 적극적으로 받아들인 보스턴 레드삭스는 ‘밤비노의 저주’를 깨고 2004년 86년만에 월드시리즈에서 우승하기도 합니다.

 

데이터와 디지털 의학 구루의 만남

의학은 이제 ‘근거 중심 의학 (evidence-based medicine)’ 에서 ‘데이터 중심 의학 (data-driven medicine)’ 으로 바뀌어간다고 할만큼, 데이터가 중요해지고 있습니다. 웨어러블, 사물인터넷, 모바일 의료기기, 스마트폰 등의 발달로 기존에는 측정 불가능했던 데이터가 더 다양하게, 더 자주, 더 많이 쏟아져 나오고 있습니다. 불연속적으로 측정되었던 데이터는 이제 연속적으로, 눈으로 관찰했던 데이터가 이제는 정량적으로 측정되기도 합니다.

더 나아가, 유전체 분석 기술의 발달에 따라 향후 인간의 유전체 데이터의 증가 속도는 지구상 어떤 데이터보다 더 빠를 것으로 예상되고 있습니다. 지난 2015년 7월 PloS Biology 에 발표된 연구 결과에 따르면, 2025년에 이르면 지구상에서 가장 큰 규모의 데이터는 천문학, 유투브, 트위터 데이터를 제치고 바로 유전체 데이터가 될 것이라고도 합니다. 이 유전체 데이터는 사람의 출생 전부터 사망 이후까지 생에 전주기에 걸쳐서 활용될 것입니다.

petabyte
기하급수적으로 증가할 유전체 데이터 (출처: Nature)

미래의 디지털 의료는 이러한 데이터를 어떻게 측정하고, 통합하고, 분석할 것인가에 달려 있다고 해도 과언이 아닐 것입니다. 이번에 ‘디지털 의학의 구루’인 에릭 토폴 박사가 ‘데이터 구루’ 인 폴 디포디스타를 깜짝 등용한 것은 이러한 흐름을 잘 반영한다고 볼 수도 있겠습니다.

이번 임용에 대해서 스크립스가 내어놓은 보도자료에 따르면, 아래와 같은 분야의 연구에 폴 디포디스타가 공헌할 수 있을 것으로 예상하고 있습니다.

  • 분자 부검 연구: 사인을 알 수 없는 급성 사망의 경우 DNA 를 분석하여 사망 원인을 밝히는 연구
  • GIRAFFE 연구: 가장 흔한 부정맥인 심방세동과 관련한 유전 변이를 밝혀내는 연구
  • IDIOM 연구: DNA 분석을 통한 특발성 질환 (idiopathic disease)의 발병 원인과 치료에 관한 연구

야구의 문외한이었던 폴 디포디스타는 데이터 분석에 기반한 새로운 시각을 통해서 야구의 역사를 바꿔놓았습니다. 그러한 방법론은 처음에 야구계에서도 격렬한 반대와 조롱에 시달렸지만 이제는 너무나 일반화된 방법이 되어버렸습니다. 이제 이 ‘데이터 구루’는 의학이라는 또 다른 새로운 분야에 도전하게 되었는데요. 의학과 생물학에도 문외한인 폴 디포디스타가 이제는 디지털 의학의 혁신에 영향을 미칠 수 있을지 주목해봐야겠습니다.

About The Author

IT와 헬스케어의 컨버젼스를 통해 사회적 가치를 창출하는 것을 화두로 삼고 있는 융합 생명과학자, 미래의료학자, 작가입니다. 포항공대에서 컴퓨터공학과 생명과학을 복수 전공하였고, 동대학원에서 전산생물학으로 이학박사를 취득했습니다. Stanford University 방문연구원, 서울대학교 의과대학 암연구소 연구조교수, KT종합기술원 컨버전스연구소 팀장, 서울대병원 의생명연구소 연구조교수 등을 역임하였습니다. 현재 최윤섭 디지털 헬스케어 연구소의 소장이며, 국내 유일의 헬스케어 전문 스타트업 엑셀러레이터 디지털 헬스케어 파트너스 (DHP)의 대표 파트너를 맡고 있습니다. 성균관대학교 삼성융합의과학원 디지털헬스학과 초빙교수이자, VUNO, Zikto, Promisope, Souling, 트랜스링크 캐피털, HB 인베스트먼트, 녹십자 홀딩스의 자문이며, 매일경제신문의 필진입니다.

error: Content is protected !!