디지털 표현형 (2) 인스타그램은 당신이 우울한지 알고 있다

Yoon Sup Choi January 28, 2019 AI, Big Data, Digital Healthcare No Comments

SNS의 디지털 표현형

스마트폰뿐만 아니라, 트위터, 페이스북, 인스타그램과 같은 소셜 네트워크 서비스에 남는 우리의 디지털 표현형을 통해서 우리의 건강 상태 및 질병을 파악할 수 있다. 앞서 언급한, ‘디지털 표현형’이라는 제목의 네이처 바이오테크놀러지 논문에는 트위터를 통한 불면증 및 조현병의 증상 파악의 가능성에 대해서 언급되어 있다.[ref]

관련 포스팅: 디지털 표현형 (1) 스마트폰은 당신이 우울한지 알고 있다

불면증의 경우, 병원 밖의 환자가 일상생활을 하면서 얼마나 잠을 잘 자는지, 증상이 개선 혹은 악화되고 있는지에 대해서 파악하기란 쉽지 않다. 하지만 트위터에 반영되는 디지털 표현형을 분석하면 불면증 환자의 상태에 대해서 더 많은 정보를 얻을 수 있다. 예를 들어, 트위터에 남기는 단어나 해시태그에 불면증이나 수면제와 관련된 표현이 있거나, 이러한 표현을 사용하는 빈도, 트윗을 남기는 시간 등을 파악해볼 수 있는 것이다.

환자들의 불면증과 관계된 트윗의 빈도 [ref]

첫 번째 그림은 7명의 트위터 사용자의 트윗을 분석하여, 불면증과 관련된 트윗이 얼마나 포스팅되었는지 빈도를 2년 동안 추적 관찰한 것이다. 예를 들어, ‘잠을 잘 수 없다’, ’나 혼자 깨어 있다’ 거나, #teamnosleep이라는 불면증 관련 해시태그를 포스팅한 것을 모니터링했다. 이렇게 트위터에 사용하는 표현의 빈도 변화를 보면, 특정 환자의 증상이 어떻게 변화하는지를 짐작할 수 있다.

불면증과 관련된 트윗이 올라온 시간대 [ref]

두 번째 그림은 1,315,236건의 트윗을 2년 동안 분석하여, ‘불면증’, ‘멜라토닌’, ‘앰비엔 (수면 유도제 상표명)’ 등의 표현이 하루 24시간 중에 언제 포스팅되었는지를 분석한 것이다. 이러한 표현이 늦은 밤과 이른 새벽에 업로드된다면, 그 사용자의 불면증 증상을 의심해볼 수 있을 것이다.

또한 이 논문에는 트위터 데이터가 양극성 장애(조울증)의 증상 중 하나인 하이퍼그라피아(hypergraphia)를 파악하는 데 도움이 된다는 언급도 있다. 하이퍼그라피아는 글을 엄청나게 쓰는 증상을 의미한다. 양극성 장애는 기분이 지나치게 들뜨는 조증과, 기분이 우울해지는 울증을 반복하여 조울증이라고 부르기도 하는데, 조증의 시기에 발생하는 증상 중의 하나가 바로 이 하이퍼그라피아다.

이 증상을 직접 경험하고 책으로 쓰기도 했던, 하버드 의과대학 교수 앨리스 플래허티는 하이퍼그라피아 증상이 있었던 당시 “컴퓨터 자판이나 빈 종이를 보면 마약 중독자가 마약을 보고 얻는 것과 같은 쾌감을 느꼈을 정도”라고 고백하기도 했다.[ref] 이러한 증상은 직접적으로 글을 쓰는 것으로 나타나기 때문에, 트위터에 사용자가 글을 남기는 빈도와 길이 등의 패턴으로 파악할 수 있을 것이다.

트위터를 통한 정신 질환 파악

실제로 이러한 트위터의 디지털 표현형에 기반하여 산후 우울증과 양극성 장애 등을 파악하고, 심지어는 발병하기 전에 예측하려는 시도들도 있다. 마이크로소프트의 연구진은 트위터 데이터를 기반으로 산후우울증의 위험이 있는 산모를 사전에 선별할 가능성이 있다는 연구를 2013년 발표했다.[ref] 임신 중에 올린 트위터의 데이터로 감정상태를 분석하여, 이러한 패턴이 출산 이후에 급격히 바뀔 사용자들을 분류하려고 한 것이다.

이 연구에서는 376명의 산모의 출산 전 3개월, 출산 후 3개월의 트위터 데이터를 분석하였다. 특히 트위터에 나타나는 포스팅 패턴이나, 사용하는 언어의 스타일, 감정 표현 등 우울증 증상과 관련이 높을 수도 있는 부분을 분석했다. 구체적으로는 크게 아래와 같이 네 가지 항목으로 트윗을 분석했다.

활용정도 (Engagment)
- 하루에 글을 몇개나 썼는지
- 하루에 개별 답장(멘션)을 몇 개나 썼는지
- 하루에 리트윗을 몇 개나 해서 정보를 공유했는지
- 하루에 url 을 몇 개나 공유했는지
- 하루에 질문하는 글을 몇 개나 올렸는지
네트워크 (Ego-network)
- 몇 명이 이 사용자를 팔로우하는지
- 이 사용자가 몇 명을 팔로우하는지
감정 상태 (Emotion)
- 어떤 감정이 담긴 단어 표현을 쓰는지 (긍정적 감정, 부정적 감정)
- 그 감정이 얼마나 강렬한지 등
언어 스타일 (Linguistic Style)
- 언어를 어떤 형식으로 사용하는지
- 조동사, 접속사, 형용사, 전치사, 대명사 등의 활용 방식 등

이러한 특성을 분석한 결과 해당 산모가 출산 이후에, 트위터에 나타나는 디지털 표현형이 급격히 변화할지를 70% 이상의 정확도로 예측할 수 있었으며, 출산 직후 1~2주의 데이터를 더 고려한다면 정확도가 80% 이상으로 상승한다. 이 연구는 산후우울증의 진단까지는 다루지 않았지만, 트위터에 나타나는 디지털 표현형만으로 출산 전후의 감정변화를 파악할 가능성에 대해서 보여줬다고 할 수 있다. 이 연구진은 이어서 2014년 페이스북의 데이터를 기반으로 산후우울증 예측 가능성을 보는 연구 결과를 공개하기도 했다. [ref]

또 다른 연구에서는 트윗에 반영되는 양극성 장애(조울증) 증상을 파악하기도 했다.[1, 2] 앞서 언급했듯이, 양극성 장애 환자는 조증과 울증을 반복하기 때문에 기분의 변화가 심하고, 그에 따라 의사소통하는 패턴도 달라지며, 수면 장애를 겪기도 한다. 특히 이 환자들의 30%가 자살로 생을 마감한다는 통계도 있어서, 이러한 극단적인 상황을 막기 위해서는 조기 발견 및 치료가 중요하다.

연구진은 환자의 트위터 내용이나 트윗 패턴 (밤늦게 트윗하는 빈도, 개별 답장의 빈도, 트윗하는 빈도의 일간 격차) 및 기분, 사회적인 관계 등을 분석했다. 또한 음운론에 기반한 새로운 기준도 만들어서, 트위터에 올린 단어들이 실제로 발음되면 얼마나 강한 억양을 나타내는지도 계산했다.

이를 바탕으로 양극성 장애 진단을 받은 환자 406명의 트윗과 대조군의 트윗을 구분해보았다. 양극성 장애를 진단받기 1년 전의 트윗부터 모아서 기계학습으로 대조군과 얼마나 잘 구분할 수 있는지를 본 것이다. 특히 진단 받은 시점부터 2개월 전까지, 3개월, 6개월, 9개월, 12개월 전까지의 데이터를 각각 분석해보았다.

그 결과 90% 이상의 정확도로 양극성 장애 진단을 받기 이전에 환자(위험군)을 구분해낼 수 있었다. 음운론 피쳐와 사회적 상호관계를 파악하는 기준은 각각 단독으로 진단 2개월 이전에 이미 90% 이상의 정확도를 보였다. 특히 몇몇 기준을 조합하면 진단 12개월 전의 데이터까지 보더라도 97%의 정확도(precision)로 위험군을 분류할 수 있었다. 연구진은 양극성 장애 환자의 증상이 트윗에 무의식중에 반영되기 때문에, 이러한 디지털 표현형을 인공지능으로 분석하면 증상을 이른 시기에 파악할 수 있다고 해석했다.

인스타그램은 당신이 우울한지 알고 있다

그렇다면 인스타그램은 어떨까? 한국에서는 트위터보다 인스타그램이 특히 여성과 20, 30대 사용자를 바탕으로 더 많은 인기를 끌고 있다. 140자 분량의 글이나 링크를 주로 공유하는 트위터와는 달리 인스타그램은 사진과 동영상을 공유하는 SNS이다. 이 인스타그램에 올라오는 사진에도 사용자의 건강 상태가 반영되어 있을까.

하버드 대학과 버몬트 대학의 연구진은 2017년 인스타그램의 사진과 사진을 올리는 패턴으로부터 사용자가 우울증을 겪고 있는지를 정확하게 알아낼 수 있다는 연구 결과를 발표했다.[ref] 이 연구에서는 166명의 사용자가 올린 43,950장의 사진을 기계학습으로 분석해서 우울증 여부를 가려내었다. 그 결과 인스타그램을 바탕으로 평균적인 의사(일반의)의 판단보다 더 높은 정확도로 우울증 환자를 구분할 수 있었다. 특히 우울증을 진단받기 전에 올린 사진만을 보고, 향후 우울증이 발병할 가능성을 예측하기도 했다.

이 연구는 크게 두 가지 가설을 검증하고자 했다.

가설1: 우울증 환자의 인스타그램 사진은 정상인이 올린 사진과 차이가 있을 것이다.
가설2: 우울증 환자가 ‘우울증을 진단받기 전에’ 올렸던 사진도, 정상인이 올린 사진과 차이가 있을 것이다.

이를 위해서 연구진은 인스타그램에 올라온 사진 및 관련 데이터를 분석해보았다. 특히 가설1에 따라서 우울증 환자의 (발병 전후 기간을 모두 포함한) 인스타그램과 정상인의 인스타그램을 비교하였을 뿐만 아니라(All-data model), 가설2에 따라서 우울증으로 진단받기 전의 데이터만을 가지고도 정상인과 차이가 나는지(Pre-diagnosis model)를 살펴보았다. 만약 가설2가 옳은 것으로 나타난다면, 인스타그램 데이터만 가지고도 사용자가 추후 우울증에 걸릴 가능성이 있는지를 예측할 수 있는 것이다.

누가 더 우울한 사용자일까?

그러한 분석 결과, 실제로 정상인과 우울증 환자의 인스타그램에는 여러 측면에서 차이가 있었다. 대표적으로 사진의 색감에서 차이를 보였다. 색상(Hue), 채도(Saturation), 명도(Brightness)를 기준으로 했을 때, 우울증 환자의 사진은 정상인의 사진보다 더 푸른색을 띠고, 어두우며, 회색에 가까웠다. 또한 우울증 환자들은 정상인보다 얼굴이 드러나는 사진을 올리는 경향이 강했으나, 사진에 드러나는 얼굴의 평균적인 수는 정상인보다 더 적었다.

그뿐만 아니라, 인스타그램의 ‘필터’ 사용에 대해서도 우울증 환자와 정상인 사이의 차이가 드러났다. 인스타그램에 사진이나 영상을 올릴 때는 사진의 색감을 수정할 수 있는 다양한 필터를 활용할 수 있다. 그런데 우울증 환자는 정상인 대비 필터를 아예 사용하지 않는 경향이 강했다. 하지만 우울증 환자들이 필터를 활용하는 경우에는 정상인 대비 잉크웰(Inkwell) 필터의 사용이 두드러졌다. 잉크웰은 사진을 흑백으로 만들어주는 필터다. 반면, 건강한 사용자는 색감을 더 밝게 만들어주는 발렌시아(Valencia) 필터의 사용이 상대적으로 더 많았다. 이렇게 인스타그램에 드러나는 우울증 환자의 디지털 표현형은, 우울증 환자들이 더 어둡고, 푸르며, 단색을 선호한다는 기존의 연구와도 일치하는 결과라고 할 수 있다.

연구진은 앞서 설명한 두 가지 가설에 따라서, 우울증 환자(발병 전후의 인스타그램 데이터를 모두 포함)와 정상인과 구분하는 모델과, 우울증 발병 전의 데이터만을 기반으로 정상인을 구분하는 기계학습 모델 두 가지를 만들었다. 그리고 이 두 가지 모델을 일반의(general practitioner)의 실력과 비교함으로써 정확성을 평가해보았다. [Mitchell et al.] 그 결과, 첫 번째 ‘전체 데이터’ 기반의 모델은 의사보다 조금 더 나은 정확도로 우울증 환자와 정상인을 구분한다. 두 번째 ‘발병 전 데이터’ 기반의 모델은 의사와 거의 대등한 정확도를 보이는데, 이미 진단 전의 데이터만 가지고도 의사와 비슷한 수준의 정확도를 보인다는 점이 유의미하다고 볼 수 있다.

(footnote: 좀 더 구체적으로는 All-Data 모델의 경우 일반의보다 재현율(recall)과 정밀도(precision)은 더 높았으며, 특이도(specificity)와 음성예측도(negative predictive value)는 더 낮았다. 결과적으로 F1 수치는 All-Data가 더 높았다. 반면 Pre-diagnosis 모델의 경우 특이도와 정밀도가 일반의보다 더 높았으며, 재현율과 음성예측도는 더 낮았다. F1 수치는 일반의와 거의 비슷한 수준이었다)

디지털 표현형, 의료 데이터의 확장

이번에는 디지털 헬스케어에서 측정할 수 있는 데이터의 사례로 ‘디지털 표현형’을 살펴보았다. 아직 일반 대중에게는 물론, 디지털 헬스케어 분야에서도 이 개념이 소개된지는 몇년 지나지 않았다. 하지만 디지털 기술의 발전으로 인해서, 환자의 건강을 파악하기 위해 새롭게 얻을 수 있는 데이터로 이 디지털 표현형을 빼놓을 수는 없을 것이다. 특히 스마트폰을 사용하고, SNS에 글이나 사진을 올리는 것은 원래 일상생활에서 해오던 것이기 때문에, 병원에 국한되지 않은 실제 환경에서, 환자의 상태를 보다 객관적이고, 높은 빈도로, 정량적으로 파악하기 위해서 도움이 될 수 있다.

이러한 디지털 표현형은 어쩌면 의료 데이터의 범주가 확장된다고도 볼 수 있다. 디지털 헬스케어의 새로운 기술을 살펴보면, 기존에는 의료 데이터로 분류되지 않던 완전히 새로운 종류의 데이터가 환자의 건강 상태나 질병을 파악하기 위해서 활용됨을 알 수 있다. 이번 챕터에서는 스마트폰의 통화 빈도나, 타이핑 속도, 스크롤을 내리는 속도, 혹은 SNS에 어떤 색감의 사진을 올리고, 트윗을 얼마나 자주 올리는지와 같은, 전통적인 의미에서는 ‘비 의료적인’ 데이터를 바탕으로 ‘의료적인’ 판단을 내리게 된다.

그렇다면 이러한 스마트폰과 SNS 데이터는 이제 의료 데이터로 간주해야 하는가? 이 데이터는 다른 기존의 의료 데이터처럼 법적으로 보호받아야 하는가? 혹은 이러한 데이터를 만들어내는 스마트폰과 SNS는 의료기기나 의료 서비스가 되어야 하는가? 우리는 디지털 표현형과 연관지어 이와 같은 흥미로운 질문을 던져볼 수 있다. 아직 우리는 이러한 질문이 있는지조차 모르고 있지만, 향후 의료 데이터의 범주가 확장되고, 디지털 표현형이 제도권 의료 속으로 편입된다면 이러한 새로운 질문에도 답해야 할 것이다.

더 나아가 어쩌면 디지털 표현형은 단순히 환자의 상태를 더 효과적으로 모니터링하기 위한 수단에 그치는 것이 아니라, 더 깊은 의학적인 의미를 가질 수도 있다. 질병에 대한 이해, 정의, 분류는 시대나 기술의 발전에 따라서 달라지기도 한다. 자폐 스펙트럼 장애(autism spectrum disorder)처럼 예전에는 하나의 질병으로 간주되던 것들이 이제는 수없이 다양한 세부적인 질병의 총합으로 이루어진 스펙트럼으로 간주되기도 하고, 당뇨병이나 천식과 같은 만성질환도 통계적 분석이나, 인공지능으로 더 세부적인 유형으로 나누려는 연구가 진행되고 있기도 하다.[1, 2]

그렇다면 이런 디지털 표현형의 개념을 기반으로, 질병의 발현이나 증상, 더 나아가서는 질병 그 자체를 새롭게 정의할 수도 있지 않을까? 예를 들어, 우울증에 걸린 환자들은 매우 다양한 증상과 양태를 보인다. 어떤 우울증 환자는 항상 잠을 자고 싶어하고, 또 다른 우울증 환자는 반대로 불면증으로 잠에 들지 못하기도 한다. 이는 우울증이 하나의 질병이 아니라 어쩌면 세부적으로는 여러 타입으로 구분될 수도 있다는 의미이다.

만약 스마트폰에 반영되는 디지털 표현형으로 이러한 세부적인 구분에 대한 힌트를 얻거나, 아예 그러한 디지털 표현형 자체가 새로운 질병의 세부 구분 기준이 되지 않으리라는 법도 없다. 실제로 마인드스트롱의 주요 연구 목표 중의 하나는 스마트폰 사용 패턴을 바탕으로 주요우울장애(major depressive disorder)를 세부적인 유형으로 구분하는 것이다.[ref] 이는 디지털 표현형을 적용할 수 있는 다른 질병에도 해당될 수 있다고 본다.

About The Author

Yoon Sup Choi

디지털 헬스케어를 통해 의료를 혁신하고 세상을 더 건강하게 만들고자 하는 벤처투자자, 미래의료학자, 에반젤리스트입니다. 포항공대에서 컴퓨터공학과 생명과학을 복수 전공하였고, 동대학원에서 전산생물학으로 이학박사를 취득했습니다. 스탠퍼드 대학, 서울대학교병원 등에서 연구하였습니다. 현재 디지털 헬스케어 스타트업 전문 투자사, 디지털 헬스케어 파트너스 (DHP)를 2016년에 공동창업하였고, 대표를 맡고 있습니다. 지금까지 40여 개의 디지털 헬스케어 스타트업에 투자하였습니다. 네이처의 디지털 헬스케어 분야 자매지 『npj 디지털 메디슨』의 편집위원이자, 식약처, 심평원의 전문가 협의체 자문위원입니다. 『디지털 헬스케어: 의료의 미래』『의료 인공지능』『헬스케어 이노베이션』 등을 집필하였습니다.