Thursday 28th March 2024,
최윤섭의 디지털 헬스케어

코로나 바이러스와 디지털 헬스케어 (2) 빅데이터 기반의 실시간 감염 트렌드 파악

지난 포스팅에 이어서, 신종 코로나 바이러스의 창궐에 대응하여, 디지털 헬스케어 분야의 기술이나 서비스 중에 무엇을 활용할 수 있을지에 대해서 더 이야기 해보려고 한다. 첫 번째 글에서는 코로나19 검사의 필요성 여부를 선별해주는 문진 솔루션 (앱, 웹페이지, 챗봇, 인공지능 스피커), 그리고 원격진료와 원격 환자 모니터링에 대해서 다루었다. 이번에는 웨어러블, IoT 센서 등으로 측정한 헬스케어 빅데이터를 기반으로 감염 추이를 인구 수준에서 지역별, 실시간으로 파악하거나, 감염의 조기 진단을 시도하는 사례들을 소개하려 한다.

미국 질병관리본부(CDC)는 인플루엔자 등의 감염 질환에 대해서는 지속적인 모니터링을 통해서 매주 트렌드를 발표하고 있다. 하지만 이는 감염의 전파 추이를 실시간으로 파악하지는 못한다. 병원의 데이터를 취합하는 등 오프라인에 기반한 방법을 활용하므로 일반적으로 실제 발병에 비해서 1-3주 정도의 시간 지연이 있고, 심지어 몇달 이후에 이 데이터를 다시 수정하는 일이 빈번하다고 한다.[1, 2] 하지만 디지털 헬스케어 기술로 측정, 통합, 분석한 빅데이터를 통해서는 COVID-19와 같은 감염 질환의 전파 추이를 파악하는데 더 용이한 측면이 있다.

 

스마트 체온계: 인구 수준의 발열 양상 추적

코로나19의 대표적인 증상은 발열이다. 그렇다면 수많은 사람들의 발열 데이터를 동시다발적으로, 실시간으로, 지역별로 얻을 수 있다면, 코로나 바이러스의 감염이 언제, 어디에서 발생하고 있는지의 트렌드를 파악할 수 있을 것이다. 바로 Kinsa의 커넥티드 체온계가 이런 역할을 하고 있다.


커넥티드 체온계, Kinsa

Kinsa는 스마트폰에 연동되는 IoT 체온계를 만드는 미국의 스타트업이다. 측정한 체온 데이터는 스마트폰을 통해서 공유할 수 있게 되어 있다. 이러한 발열 데이터를 미국 전역에서 지역별로 수집하여 (ZIP 코드 별로) 특정 지역에 갑자기 발열이 시작되고 있는지 등을 실시간으로 모니터링 할 수 있다. 수집한 데이터는 US Health Weather Map by Kinsa 라는 웹사이트에 공개하고 있다.

킨사는 지금까지 100만 개 이상의 체온계를 판매 및 제공했으며, 각 가정의 실사용자로 따지면 200만 명 이상이 될 것으로 추정하고 있다. 지금까지 Kinsa는 이러한 실시간 발열 데이터를 이용한 예측 모델을 만들어서, 계절 독감을 CDC 보다 먼저 예측하는 등의 성과를 보여 왔다.

이러한 모델이 최근 COVID-19 상황에서 위력을 발휘하고 있다. 90% 이상의 코로나 바이러스 환자가 발열 증상을 보이게 되므로, 지역별로 실시간 모니터링을 할 수 있는 것이다. 기존 CDC의 시스템은 주마다 분석 리포트를 내는 것에 비해, 이러한 분석은 실시간이다. NYT 기사에 따르면 Google Trend나 감기약 판매 수량을 통해서 모니터링하는 것보다 더 정확하다고 한다.

실제로 미국의 South Florida 지역에 발열 수준이 갑자기 증가한 것을 COVID-19의 전파가 파악되기 이전에 Kinsa의 데이터가 먼저 포착하였다. 현재 South Florida는 미국에서 코로나 바이러스 감염이 가장 심각한 곳 중의 하나이다. NYT 기사가 나온 3월 18일 시점으로 플로리다, 미시간, 아리조나, 동부 텍사스 등 (아직 COVID-19 환자가 많이 나오지 않은) 지역에 발열이 있다는 것을 보여주고 있다고 한다.


Kinsa 체온 데이터에 기반한 미국 전역의 발열 상황 (2020년 4월 9일 기준)

 NYT에서 집계한, (4월 11일 현재 기준) 미국에서 실제로 확진자가 빠르게 증가하는 지역 분포
위의 Kinsa로 만든 지역별 발열 상황과 비교해보자. (출처: NYT)

킨사의 데이터는 체온 데이터만 수집하기 때문에 이에 따른 한계도 분명히 있다. 계절 독감 등 발열을 일으키는 다른 질병과 COVID-19를 구분하기는 쉽지 않기 때문이다. 하지만 적어도 현 상황에서 갑작스런 인구 수준의 발열 현상은 코로나 바이러스의 감염 추이를 추적하는데 도움이 될 것이다.

Kinsa는 2014년 실리콘밸리의 유명 벤처캐피털인 Kleiner Perkins 등으로부터 약 $10M 규모의 시리즈A 투자를 받는 등 주목을 받고 있다. 이때 역시 스마트 체온계를 바탕으로 빅데이터를 얻을 수 있다는 점이 높게 평가되었다. 사실 한국에서는 Kinsa보다 앞서 엠트리케어, 열나요(모바일닥터) 등의 스타트업이 이러한 스마트 체온계나, 체온 기반의 실시간 발열 지도 등의 시스템을 구축한 바 있다.

하지만 엠트리케어와 모바일닥터는 지금까지도 한국의 모든 VC 들의 외면을 받았다. 엠트리케어는 자금난 끝에 결국 2019년 사업을 중단하고 말았다. 비접촉 체온계를 만드는 엠트리케어가 사업을 중단하지 않았더라면, 이번 코로나 발생 초기 체온계 부족 사태에 큰 역할을 할 수 있었을 것이다. 열나요 역시 고객들의 절대적인 지지를 받고 있음에도 아직 기관 투자를 한 번도 유치하지 못한 채 자금난을 겪고 있다. 비단 투자자들의 안목만을 문제 삼을 수는 없겠으나, 이런 사례들을 볼 때마다 안타까운 마음을 금할 수 없다.

 

반지 웨어러블: 코로나19의 조기 발견 연구

체온을 비롯한 웨어러블로 측정한 데이터를 바탕으로 COVID-19의 발병을 조기에 파악하려는 시도도 있다. UCSF의 연구자들은 최근 반지 형태의 웨어러블 OURA를 이용한 연구를 시작한다고 밝혔다. [1, 2, 3]

OURA는 반지 형태의 웨어러블 디바이스로 반지 안쪽에 달린 센서들을 통해 체온, 심박수, 호흡수, 활동량, 수면 등을 지속적으로 측정한다. 이는 모두 코로나19와 직간접적으로 관계되는 데이터이다. 특히, 앞서 소개한 Kinsa의 스마트 체온계는 한 순간의 체온을 얻는데 그치지만, 이런 웨어러블은 착용하고 있는 동안 24시간 지속적으로 측정한다는 점에서 차이가 있다. UCSF 연구자들은 웨어러블을 통해 체온, 심박수, 호흡 등의 변화를 지속적으로 측정한 데이터를 축적하여 COVID-19의 발병 데이터와 함께 분석한다면, 코로나19의 발병을 조기에 파악할 수 있는 일종의 바이오마커(생체표지자)를 찾을 가능성도 있다고 기대하고 있다.

실제로 최근에는 Petri Hollmén 이라는 OURA 반지의 미국인 사용자가 이 웨어러블로 코로나 진단에 도움을 받은 것이 알려지기도 했다. 그는 다른 아무 자각 증상이 없음에도 OURA 를 통해 체온이 평소보다 1도 상승한 것을 발견했고, 자가격리를 하다가 결국 COVID-19에 확진을 받았다. (이러한 사연을 본인의 페이스북에 공개하면서 알려졌다)

UCSF의 연구자들은 OURA의 도움을 받아, TemPredict 라는 프로젝트를 시작했다. 데이터의 수집을 위해 OURA는 전세계 15만 명의 사용자들에게 이 프로젝트에 대한 참여를 요청했다. (사실 필자도 그 중의 한 명이다) 이 연구에 참여하게 되면, 웨어러블로 측정한 데이터를 공유함과 동시에 코로나19와 관련되는 증상에 대한 설문조사에도 응해야 한다. 이를 통해 코로나의 발병, 진행 및 회복에 이르기까지의 패턴을 파악할 수도 있다. 연구진은 이 프로젝트에 수 천 명의 참가자를 모을 수 있을 것으로 기대하고 있다.

또한 UCSF 병원과 샌프란시스코 제너럴 병원의 의료진 2,000명이 이 OURA 스마트 반지를 착용함으로써 데이터를 지속적으로 모니터링한다. 미국은 COVID-19에 대한 의료 시스템의 대처가 미비하여, 일선 의료진들이 감염에 상당히 취약한 것으로 알려졌다. 만약 이런 반지로 발열 등의 증상을 지속적으로 측정할 수 있다면 감염에서 의료진을 보호하는데 도움을 줄 수 있을 가능성이 있다.

사실 이 반지를 착용해보면, 크기가 약간 커서 이물감이 느껴지기도 하고 (그나마 두번째 버전의 제품에서는 크기가 많이 줄어들었다. 필자가 구매한 초창기 버전은 크기가 꽤 크다), 반지를 착용하면 손을 소독하는데 방해가 되기도 한다. 샌프란시스코의 의료진이 이 반지 웨어러블을 착용하는 것은 근무 중이 아니라, 밤에 잠을 잘 때 착용하게 된다고 한다.

웨스트버지니아 의대에서도 OURA를 활용한 유사한 연구가 진행되고 있다. 이 프로젝트에서도 OURA의 스폰서를 받아서 연구를 진행 중이고, 기존 사용자의 데이터를 수집해서 연구할 뿐만 아니라 1,000명의 의료진들에게 나눠주었다. 한 기사에 따르면 이 연구는 이미 상당한 진전이 있는 것으로 보인다. 이 연구의 책임자인 Dr. Ali Rezai에 따르면 90%의 확률로 COVID-19의 발병을 24시간 전에 예측할 수 있다고 하고, 더 많은 데이터가 쌓이면 그것보다 하루나 이틀 더 일찍 예측하는 것도 가능할 것으로 보고 있다.

 

핏빗: 감염병의 지역별 실시간 모니터링

최근 에릭 토폴 박사의 스크립스 중개과학연구소 (Scripps Research Translational Institute)도 핏빗, 애플워치 등의 웨어러블 데이터를 인구 수준으로 축적하여 COVID-19의 발병 트렌드를 지역별로 모니터링하고, 더 나아가서는 예측까지 하겠다는 연구를 발표했다. 이름하여 DETECT 스터디로, 일종의 COVID-19 버전의 ‘구글맵’을 만들겠다는 것. 최근에 참가자들을 모집하기 시작했고, 향후 2년 동안 지속할 예정이다.

이러한 시도는 에릭 토폴 박사와 스타인허블 박사 연구팀에서 지난 1월 Lancet Digital Health에 출판한 연구에 기반하고 있다. 이 논문에서는 손목에 착용하는 활동량 측정계 핏빗의 데이터를 기반으로 (코로나19와 같은) 호흡기 감염 질환인 인플루엔자 감염을 인구 수준에서, 실시간으로, 그리고 지역별로 파악할 수 있다는 것을 보여줬다. (이렇게 웨어러블 기반으로, 감염 질환을, 인구 수준에서, 실시간으로 파악하는 연구는 최초라고 한다)

앞서 언급한대로 CDC는 인플루엔자 등의 감염 질환에 대해서는 지속적인 모니터링을 통해서 매주 트랜드를 발표하지만, 보통 실제 발병에 비해서 1-3주 정도의 지연이 있고, 심지어 몇달 이후에 이 데이터를 다시 수정하는 일이 빈번하다. 이러한 단점을 보완하기 위해서 과거에도, 구글의 검색어 트랜드를 이용한 Google Flu Trend, 트위터의 데이터 등을 이용한 연구들이 있었다. 하지만 이런 검색어나 SNS 데이터를 활용하는 경우, 이런 데이터가 실제 발병과 직접적으로 관계된 것인지, 아니면 미디어 등에서 노출되기 때문에 검색어나 트위터의 빈도가 덩달아 올라가는지를 파악하기가 어려웠다.

최근 Lancet Digital Health 논문에서는 핏빗의 RHR (Resting Heart Rate, 휴식기 심박수)과 수면 데이터를 활용한다. 감염 질환에 걸리면 RHR이 평소보다 약간 높아지고, 또한 (몸이 좋지 않으면) 수면 시간이 평소보다 늘어난다는 것에 착안한 것이다. 이 연구에서는 2년 동안, 핏빗을 사용하는 20만 명의 65m 개 이상의 데이터를 수집했다. 여기에서 지속적으로 사용하는 등의 몇가지 기준을 충족시키는, 미국 5개 주에 거주하는 47,249명의 13m 개 이상의 데이터를 분석했다.

그 결과 핏빗으로 얻은 RHR과 수면 데이터에 기반한 모델이, 실제로 CDC에서 인플루엔자를 모니터링했던 트랜드와 높은 상관관계를 보여주는 것을 증명했다. 인플루엔자가 유행하던 시기에는 핏빗의 데이터에서 이상을 보이는 사람들의 비율이 늘었고, 5개 주에서 모두 실제 인플루엔자 바이러스의 발병을 정확하게 포착해낼 수 있었다. 더 나아가, 이런 모델링이 CDC의 예측력을 5개 주에서 모두 더 높일 수 있음을 증명했다. (이 부분은 수식이 좀 복잡해서 제가 제대로 이해했는지 모르겠습니다만.. 혹시 논문을 보신 분들 있으면 추가 코멘트 부탁드립니다.)

핏빗의 심박수 및 수면 데이터에 기반하여 CDC의 인플루엔자 감염 추이를
5개 주에서 정확히 포착 (출처: Lancet Digital Health)

다만 핏빗에 기반한 데이터가 이상 징후를 나타내는 시점은, 인플루엔자 발병 시점에 선행하기보다는 발병 시점이나, 1주일 이후 정도를 잘 반영하는 것으로 드러났다. 즉, 인플루엔자의 발병을 예측하는 것보다, 실시간으로 발병 상태를 지역별로 모니터링하기 위해서 활용될 수 있다는 것을 보여주고 있다. (논문에서는 이를 빗대어 forecasting이 아닌 ‘nowcasting’ 으로 지칭하고 있다.)

하지만 이는 COVID-19 에서는 더 활용성이 높을 수 있다. 논문의 디스커션에서는 인플루엔자의 잠복기가 1-4일 정도이므로, 발병 전에 핏빗으로 예측할 수 있는 기간이 너무 짧은 반면, 잠복기가 보통 3-8일로 더 긴 다른 호흡기 질환이 경우에는 이런 센서로 발병 트렌드를 예측할 수도 있다고 언급하고 있다. COVID-19의 경우에는 잠복기가 최대 14일에 이르는 것으로 알려져 있으므로, 이런 웨어러블로 측정한 데이터가 발병하기 전에 기준치를 넘게될 가능성이 있다고 생각한다.

특히, 이번 연구에서는 RHR과 수면의 두 가지 데이터만 활용하였고, 체온이나 활동량 같은 데이터를 사용하지는 않았다. 감염 질환에 대해서는 이런 데이터가 추가되면 모델링의 결과가 더 정확할 수도 있을 것이다.

 

리얼 월드 데이터: 감염에 의한 인구 수준의 행동 변화 파악

미국의 디지털 헬스케어 스타트업 Evidation Health는 최근 미국의 COVID-19 상황에 대한 흥미로운 데이터를 공개했다. 이 회사는 일상 생활 속에서 나오는 ‘환자 유래의 의료 데이터 (Patients Generated Health Data)’를 대규모로 수집하여, 이를 임상 연구에 (주로 제약사 등 B2B 로) 제공하는 역할을 한다.

즉, 소위 ‘리얼 월드 데이터 (Real-World Data)’를 필요로 하는 회사에게 수집해주는 역할을 하는 것. 이러한 RWD 수집에는 스마트폰 앱, 웨어러블, 설문조사 데이터 등등을 가리지 않는다. 이 Evidation Health의 플랫폼에는 미국인 3.5m 명이 자발적으로 참여하고 있으며, 이러한 데이터를 애플, 존슨앤존슨, 일라이릴리 등의 회사에서 사간다고 한다.

이렇게 미국 전역에서 지역별로 인구 수준에서 수집된 데이터는 COVID-19 상황의 여러 트렌드를 파악하기 위해서 유용하다. 지난 3월에는 Evidation Health는 미국 50개 모든 주의 159,000명 이상의 미국인에게 앱, 웨어러블 (핏빗, 애플워치, 가민), 서베이 등을 통하여 실제로 미국인들이 주별, 시기별로 신체적인 활동량, 수면, 불안감 등이 어떻게 변화하는지에 대해서 파악하였고, 이 데이터를 공개했다.

Evidation Health 가 미국 전역에서 축적한 RWD 중 일부.
COVID-19 상황에서 미국 주별로 활동량이 얼마나 줄어들었는지를 보여준다 (출처)

이러한 조사 결과 중에서 눈에 띄는 몇가지 데이터만 소개하자면 아래와 같다.

  • 미국 전체의 신체적 활동량의 수준은 3월 24일 기준으로 (3월 1일에 비해서) 39% 하락. 그 중에서도 뉴욕이 50% 하락을 기록하여 가장 큰 폭으로 감소.
  • 미국 전체의 수면 시간은 (3월 13일 트럼프 대통령이 국가 재난 사태를 선포한 이후에) 20% 증가. 주별로 본다면, 하와이와 알래스카 빼면, 모든 주에서 10% 이상 증가함.
  • 원격 진료에 대한 수요 증가. 1차 병원, 응급실, 응급처치실(urgent care) 등에 비해서, 원격진료를 먼저 하겠다는 비율이 19%에서 30% 로 증가. (3월12일~18일 기간과 3월19일~25일 기간의 조사 결과 비교)
  • 가족이 코로나 바이러스에 걸릴까봐 걱정, 혹은 매우 걱정된다는 비율은 35%에서 51%로 증가 (위와 같은 기간)
  • 불안감을 느끼는 사람은 29%에서 49%로 증가. (위와 같은 기간)

이러한 결과를 보면 인구 수준의 RWD의 축적이 어떠한 위력을 가지는지를 잘 알 수 있다. 고백하건대 필자는 개인적으로 그동안 Evidation Health가 하는 일에 대해서 다소 회의적인 시각을 가지고 있었지만, 이런 판데믹 상황에서 RWD의 지역별, 시간별 축적은 큰 의미를 가질 것으로 생각한다. 현실에서 사람들의 행동이나 심리적인 상태를 지역에 따라, 정량적으로 측정하고, 그것도 시간대별로 어떻게 변화하는지를 적시에 파악하기란 이러한 방법이 아니면 어렵기 때문이다. 이러한 데이터는 방역 등에 대한 지역별 정책 수립에도 활용할 수 있을 것이다.

 

구글은 알고 있다. 사회적 거리두기가 잘 진행되는지

최근 구글은 COVID-19 Community Mobility Reports 라는 데이터를 공개하기 시작했다.[1, 2] 이 데이터는 국가별로, 혹은 세부 지역별로, 지역 사회에서 이동량이 어디에서, 어떻게 변화하는지 정량적으로 보여준다. 기존에 구글맵을 보면 특정 레스토랑이 사람들로 붐비는 시간 및 요일 등에 대한 결과가 제공된다. 스마트폰의 GPS를 활용하여 이러한 데이터를 수집하는 것으로 알려져 있다.

이렇게 특정 시간대에 사람들이 특정 장소에 얼마나 모이는지를 파악할 수 있다면, 코로나19 판데믹과 같은 상황에 대처하기 위한 여러 주요한 인사이트를 얻을 수 있다. 예를 들어서, 공공 장소에 사람들이 얼마나 많이 모이는지, 대중 교통은 얼마나 사용하는지, 집에 머무는 시간은 얼마나 되는지 등을 파악할 수 있는 것이다.

구글은 지난 4월 초부터 전세계 131개의 국가 및 지역에 대해서 이러한 COVID-19 Community Mobility Reports 를 제공하기 시작했다. 여기에는 아래와 같은 6가지 큰 범주의 장소에서 보내는 시간이 어떻게 변화하고 있는지에 대한 변화를 알려준다. 익명화된 데이터들이 취합된(aggregated, anonymized data) 결과만 보여주고 있으며, 개별 사용자에 대한 데이터는 제공하지 않는다. 또한 시간에 따른 상대적인 변화량만 보여줄 뿐, 절대적인 수치는 보여주지 않는다. 여기에 기준치(baseline)은 1월 3일~2월 6일의 5주 동안의 중간값으로 정의하였다.

  • Retail & Recreation: 식당, 카페, 쇼핑센터, 테마파크, 박물관, 도서관, 극장 등과 같은 장소의 이동량
  • Grocery & Pharmacy: 식료품점, 수퍼마켓, 시장, 약국 등의 장소에 대한 이동량
  • Parks: 국립공원, 해변가, 공원, 광장 등의 장소에 대한 이동량
  • Transit Stations: 지하철, 버스, 기차역과 같은 대중 교통의 이동량
  • Workplace: 직장에서의 이동량
  • Residential: 거주지에서의 이동량

이러한 빅데이터를 보면 특정 지역에서 사회적 거리두기가 잘 유지되고 있는지, 혹은 특정 시간 대에 특정 노선의 대중 교통이 부족하여 밀집도가 높아지는지 등에 대해서 파악할 수 있다. 이런 경우, 사람들이 한 곳에 너무 많이 모이지 않도록 특정 노선을 추가 편성한다던가 등의 조치를 취할 수 있을 것이라고 구글은 밝히고 있다.

4월 5일에 발표된 한국에 대한 보고서에 따르면, 기준치(baseline)에 비해서 각 장소에 대한 변화량은 아래와 같다. 식당이나 카페, 대중교통, 직장에서 머무는 시간은 1월 대비 10% 이상 줄어든 상태이며, 야외 공원에서 보내는 시간은 46% 정도 증가하였음을 알 수 있다. 또한 식당, 카페, 약국, 공원 등에 방문하는 양이 2월 말부터 조금씩 증가하고 있는 추세인 것도 볼 수  있다.

4월 5일 발표된 한국의 Community Mobility Report (출처)

(3편에 계속)

 

About The Author

디지털 헬스케어를 통해 의료를 혁신하고 세상을 더 건강하게 만들고자 하는 벤처투자자, 미래의료학자, 에반젤리스트입니다. 포항공대에서 컴퓨터공학과 생명과학을 복수 전공하였고, 동대학원에서 전산생물학으로 이학박사를 취득했습니다. 스탠퍼드 대학, 서울대학교병원 등에서 연구하였습니다. 현재 디지털 헬스케어 스타트업 전문 투자사, 디지털 헬스케어 파트너스 (DHP)를 2016년에 공동창업하였고, 대표를 맡고 있습니다. 지금까지 40여 개의 디지털 헬스케어 스타트업에 투자하였습니다. 네이처의 디지털 헬스케어 분야 자매지 『npj 디지털 메디슨』의 편집위원이자, 식약처, 심평원의 전문가 협의체 자문위원입니다. 『디지털 헬스케어: 의료의 미래』 『의료 인공지능』 『헬스케어 이노베이션』 등을 집필하였습니다.

5 Comments

Leave A Response

Click here to cancel reply.