data is the new oil
data is the new oil

디지털 헬스케어: 데이터의 해석과 활용

데이터가 새로운 석유 (Data is new oil)가 될 것이라고 합니다.

처음에는 많은 데이터를 모으게 되었으니 이것으로 뭘 해도 하지 않겠느냐는

막연한 수준의 예측에 불과했지만

딥러닝을 비롯한 분석 기술의 발달과 과거 축적할 수 없던 데이터를 모을 수 있게되면서

이제 데이터의 중요성을 부인하는 사람은 없어 보입니다.

이렇게 많은 데이터를 모으는 과정을 선도하는 곳 중 하나가

다양한 센서로 무장한 디지털 헬스케어와 사물 인터넷입니다.

이들 영역에서 센서로 얻을 수 있는 데이터의 종류와 특징에 대해서 살펴보려고 합니다.

사물인터넷 비지니스 모델 혁명이라는 책에서 이 글의 모티브와

몇몇 사례를 빌렸음을 밝힙니다.

(디지털 헬스케어에 관심있는 분들도 한번쯤 읽어볼만한 책입니다.)

 

수집한 데이터를 해석하는 수준에 따라서 크게 3단계로 분류할 수 있을 것 같습니다.

1차 해석은 데이터 자체와 그 패턴에 의미를 부여하는 것입니다.

가장 일반적인 경우가 아닐까 합니다.

핏빗으로 측정한 걸음걸이 수를 보고 하루에 얼마나 움직였는 지를 알 수 있고

얼마나 지속적인지, 주말에도 기본 이상의 운동을 하는 지를 파악할 수 있습니다.

Noom에 기록한 식단 기록을 보면 끼니마다 어느 정도 칼로리를 섭취했는 지를 알 수 있고

불금에만 폭식을 하지 않는지, 주말에는 아침을 거르지 않는 지 등을 파악할 수 있습니다.

 

최근들어 많이 수집되는 1차 해석 데이터 대부분은 기존 의료계에서 의미있다고 보는 것들입니다.

센서 기술과 해석 능력이 발달하면서 기존 의료계가 중요시 하지 않았던

데이터를 수집해서 의미를 부여하려는 경우가 늘어나고 있습니다.

 

대표적인 사례가 (제 책에서도 소개했던) 에어소니아(Airsonea) 천명음 측정기입니다.

AirSonea (회사 홈페이지)

AirSonea (회사 홈페이지)

천식은 알레르기로 인해서 기관지가 좁아져서 숨쉬기 힘들어지는 병인데

이때, 천명음(wheezing)이라고 하는 소리가 납니다.

천식이 악화되었을 때 폐활량계를 이용하면 천식이 심해진 정도를 측정할 수 있습니다.

환자들은 평소에 손쉽게 사용할 수 있는 간이 폐활량계 제품을 갖고 다니면서

매일 일정한 시간마다, 또 숨이 찰 때 사용해서 폐활량을 측정하게 됩니다.

의사는 측정치를 보고 천식이 나빠졌는 지를 판단하고 필요하면 약물을 조절합니다.

문제는 폐활량계를 제대로 부는 것이 쉽지 않다는 것입니다.

특히 천식 환자가 대부분 소아 혹은 노인이기 때문에 폐활량을 제대로 측정하는 것이 힘듭니다.

 

에어소니아는 천식 증상이 있을 때 발생하는 천명음이 심한 정도를 측정해주는 장비입니다.

이는 의료 현장에서 사용할만한 의학적으로 공인된 데이터는 아닙니다.

하지만 폐활량계를 제대로 사용하는 것이 힘든 사람에서  대안이 될 수 있을 것으로 보인다.

서로 다른 사람의 검사치를 비교하는 것은 무리가 있을 수 있지만

적어도 같은 사람에서 지속적으로 사용해서 그 변화를 찾아내기에는 충분히 유용할 것입니다.

즉, 에어소니아는 ‘천명음’이라는 기존 의료에서 측정 대상으로 생각하지 않았지만

의미있는 데이터를 수집했다고 할 수 있습니다.

 

또 다른 사례로 목소리를 분석하는 경우 있습니다.

IBM의 인공지능 왓슨이 정신병 발생 위험을 예측하기 위해 연구하고 있고

오디오프로파일링(AudioProfiling) 회사는 주의력 결핍 과다 행동 장애(ADHD)를 진단하기 위한

알고리즘을 개발하고 있습니다.

이 분야의 선두주자는 목소리 분석을 통해 파킨슨병을 진단하는 알고리즘을 개발하는

Parkinson’s Voice Initiative인데

2015년 제약회사 로슈가 임상 시험에서 사용하기 위한 용도로 개발한

파킨슨병 증상 추적 앱에 그 기술이 적용되었다고 합니다.

 

이렇게 여러 회사들이 노력하고 있기는 하지만 목소리만으로 질병을 진단하는 것은 쉽지 않습니다.

천식과 호흡음의 변화(천명음의 발생)와의 관계가 그런 것처럼

성대 질환과 같이 목소리와의 관계가 긴밀한 질병은 가능성이 높겠지만

정신 질환이나 신경 질환의 경우 목소리가 가장 중요한 증상이 아니기 때문입니다.

또, 진단한다고 해도 목소리에까지 영향을 미칠 경우

이미 질병이 상당 부분 진행한 경우가 많을 가능성이 높아 큰 의미가 없을 가능성이 있습니다.

 

새로운 생체 측정 대상을 찾기 위한 또 다른 노력으로 생리혈을 대상으로 하려는 경우도 있습니다.

국내 스타트업이 만드는 스마트 생리컵 룬컵이 대표적입니다.

생리컵은 월경시 생리혈을 모아주는 제품인데

룬컵에는 센서가 부착되어 생리혈의 양과 색깔 그리고 컵의 기울기를 측정할 수 있습니다.

아직 생리혈 색깔에 대한 연구가 잘 이루어져 있지 않기 때문에

당장 건강 관리에 활용하기는 힘들겠지만 더 많은 데이터가 모이면

건강에 도움이 될만한 의미를 찾아낼 수 있을 것으로 보입니다.

 

목소리나 생리혈와 같은 측정치는 아직 의학적인 효용이 입증되지 않았기 때문에

측정치와 그 결과치 (예를들어 대상 질병 유무 혹은 심각한 정도)의

상관 관계에 대한 연구가 필요합니다.

따라서 아직은 데이터만으로 의미가 있는 1차 해석 영역에 속하지 않는다고 볼 수도 있습니다.

 

2차 해석은 얻은 데이터의 의미를 확대해서 재해석하는 것을 의미합니다.

관련해서 ‘사물인터넷 비지니스 모델 혁명’ 책에서 다룬 사례가 재미있습니다.

자동차 와이퍼에 센서를 달았다고 생각해 보겠습니다.

이런 경우 센서를 다는 목적은 보통 부품이 제대로 작동하는 지,

교체가 필요하지 않은 지를 확인하기 위한 경우가 많습니다.

따라서 와이퍼 센서를 통해서 와이퍼 마모 정도를 추적하여

교체 시점을 알리거나 하는 용도로 사용할 수 있을 것입니다.

 

한걸음 더 나아가 와이퍼를 왜 사용하는지를 생각해 보면 비가 내리기 때문일 것입니다.

따라서 특정 지역에 위치한 자동차의 와이퍼 센서가 움직이면

해당 지역에서 비가 오기 시작했다고 생각할 수 있습니다.

와이퍼 센서가 강우 여부를 알려주는 센서가 될 수 있는 것입니다.

 

책에 나오는 또다른 사례는 일본 도쿄의 지하철 2호선이라고 할 수 있는 야마노텐선에 대한 것입니다.

야마노텐선의 지하철 객차에는 무게 센서가 장착되어 있다고 합니다.

그 목적은 지하철을 정지시킬 때에 브레이크 제어를 최적화하기 위해서입니다.

그런데 객차 무게 증가분에 승객의 평균 체중을 나누면

탑승한 사람의 숫자를 추정할 수 있을 것입니다.

야마노텐선에서는 이를 활용해서 객차별 혼잡도를 추정하여 그 결과를 앱으로 표시해준다고 합니다.

어린이나 노인이 많이 타는 경우에 다소 정확도가 떨어질 수도 있겠지만

전반적인 추세를 보기에는 나쁘지 않을 것 같습니다.

 

위의 두가지 사례를 놓고 생각해 보면 센서를 통해서 어떤 데이터를 얻느냐 하는 1차 해석도 중요하지만

이를 가공하여 어떤 의미를 이끌어 낼 수 있을 지 하는 2차 해석의 여지가 없는 지를 생각해 볼 필요가 있습니다.

 

디지털 헬스케어에서 2차 해석은 어떻게 작용할 수 있을까요?

크게 세가지 유형으로 분류할 수 있습니다.

첫번째는 센싱된 데이터와 관련된 문맥, 즉 컨텍스트를 파악하는 것입니다.

자동차 와이퍼는 사용되면 비가 오고 사용되지 않으면 비가 오지 않는다고

추정할 수 있어 컨택스트가 분명합니다.

 

핏빗과 같은 활동량 측정계를 활용하면 사용자가 움직이는 패턴을 알 수 있습니다.

이를 시간대 별로 놓고 보면 몇시에 어떤 맥락의 행동을 하는 지 짐작할 수 있을 것입니다.

Activity tracking

위의 그림은 저의 하루 활동량 시계열 자료입니다.

7시경에 출근해서 점심시간 전에 걸어다니면서 일을 하고

점심 식사는 밖에 나가서 한 후 오후 내내 앉아서 일하다가 6시경 퇴근했다고 이야기할 수 있을 것입니다.

다양한 센서가 수집한 정보를 더하는 경우

사용자가 어떻게 살고 있는 지에 대한 자세한 맥락을 읽어내는 것이 가능할 것입니다.

만약 제가 병원 밖에서 점심 식사를 하기로 하고 병원 밖으로 나가고 있다는 사실을 알 수 있다면

주위 식당에서 할인 쿠폰을 보낸다던 지 하여 제 발걸음을 이끌 수도 있을 것입니다.

식당에 설치한 비콘을 통해서 식당 인근에 있을 때 유도하는 방법도 있겠지만

활동량 측정계 데이터는 병원 건물을 나설 때 쯤  그 사실을 알고 대응할 수 있게 해줄 것이기 때문에

보다 먼저 고객을 이끌 수 있을 것입니다.

 

컨텍스트 파악과 관련하여 흥미로운 또 다른 사례는

지진이 발생했을 때 인근 지역에서 활동량 측정계 조본 사용자들에게 나타난 데이터입니다.

2014년 8월 새벽 샌프란시스코 인근에 진도 6.0 규모의 지진이 발생하였습니다.

조본에서는 사용자들의 당일 수면 데이터를  정리하여 공개하였습니다.

지진 발생 직전 샌프란시스코 인근 주민 90%가 수면중이었고

새벽 3시 20분에 지진 발생 당시 상당 수 주민이 잠에서 깨었습니다.

진앙에서의 거리에 따라 3개 지역으로 나누어 보면

가장 가까운 지역 주민은 거의 80%가 잠에서 깨었고 거의 절반이 다시 잠들지 못했습니다.

가장 먼 지역 주민은 20% 정도가  잠에서 깨었습니다.

지진계를 통해서 지진의 정확한 위치와 발생 시간, 세기를 알 수 있기 때문에

지진 발생 여부를 알기 위해서 활동량 측정계의 수면 데이터를 사용할 필요는 없습니다.

하지만 특정 지역 주민이 갑자기 잠에서 깨어났다는 사실을 실시간으로 알 수 있다면

무엇인가 큰 일이 벌어졌다는 것을 짐작할 수 있고

그 지역에 경찰을 보내거나 CCTV 감시를 강화하여

어떤 문제가 생겼는 지 조사에 나서는 계기가 될 수 있을 지도 모르겠습니다.

 

2차 해석의 두번째 유형은 다양한 사람에 대한 데이터를 종합하여 새로운 가치를 만들어 내는 것입니다.

개인을 대상으로 한 유전자 분석 서비스를 대상으로 하는 23andMe가 대표적입니다.

개인별 유전자 분석 결과 보고서는 그 사람의 가계에 대한 정보나

어떤 질병이 발생할 가능성이 높은 지 등을 알려줄 수 있습니다.

이를 대량으로 모으면 인구 중에 어떤 질병에 걸릴 가능성이 높은 사람이 많은 지,

약물을 분해하는 특성 유형 중 어떤 것을 가진 사람이 많은 지에 대한 데이터를 모을 수 있는데

이는 제약회사가 신약을 개발할 때 매우 소중한 정보가 될 수 있습니다.

실제 23andMe는 개인들로 부터 받는 검사료보다는

제약회사에 데이터를 판매 수수료를 통해서 더 많은 수익을 거두고 있으며

자체적으로 신약 개발에 나설 것이라는 보도가 나오고 있습니다.

 

데이터를 모음으로써 새로운 가치를 낼 수 있는 또 다른 경우로 식단 관리 앱을 생각해 볼 수 있습니다.

체중을 관리하거나 당뇨병과 같은 대사성 질병을 관리할 때에 식단을 관리하는 것이 필요합니다.

과거에는 식단 수첩에 기록하곤 했는데 모바일 시대가 열리면서 (제가 자문을 하는) Noom이나

Endomondo 같은 앱 서비스들을 활용해서 보다 수월하게 기록하고 관리할 수 있습니다.

이런 앱들은 보통 가입자들이 먹는 칼로리와 영양분을 분석하여 그 결과를 제공해 줍니다.

여기서 많은 사용자들이 기록한 식단이라는 점에 주목한다면

최근 유행하는 음식이나 재료를 실시간으로 파악할 수 있는 데이터 베이스가 될 수도 있을 것 같습니다.

사용자가 다이어트를 위해 노력하는 사람이기 때문에 일반적인 사용자를 대변하기에 한계가 있을 수 있지만

사용자가 직접 먹은 것을 기록했다는 점에서 상당한 가치가 있을 수 있습니다.

예를 들어  다이어트를 원하는 사람의 의지를 꺾는 디저트가 무엇인지를 알아서

이를 저칼로리로 만드는 등 제품 기획 과정에 반영할 수도 있을 것입니다.

 

2차 해석의 세번째 유형은 데이터의 다른 의미를 찾는 것입니다.

대표적인 경우가 생체 신호를 활용한 신원 확인, 즉 생체 인식입니다.

현재 사용 중인 대표적인 생체 인식 대상으로는 지문과 홍채가 있습니다.

이미 출입문 통제에서 널리 사용되고 있는데 지문은 스마트폰 사용자 확인에 많이 사용되고 있습니다.

최근 갤럭시 노트 7가 홍채 인식 기능을 탑재하면서

스마트폰 사용 시는 물론 금융 결제 시 본인 확인 용도로 사용할 계획을 밝히기도 했습니다.

 

이외에도 다양한 생체 신호를 활용하려는 시도가 이루어지고 있습니다.

목소리나 서명 인식을 활용하는 기술이 개발되고 있으며

디지털 헬스케어와 관련하여 주목할만한 것으로 걸음걸이를 통해 신원을 확인하려는 시도도 있습니다.

국내의 대표적인 활동량 측정계 회사인 직토의 경우

걸음걸이와 자세를 분석하여 바르게 걸을 수 있도록 도와주는 제품을 내놓은 바 있는데

개인별 걸음걸이 특성을 사용하여 개인을 식별할 수 있는 가능성을 제시하기도 했습니다.

즉, 건강을 향상시키기 위한 목적으로 측정한 걸음걸이 데이터를

개인 신원 확인이라는 목적으로도 사용할 수 있는 것입니다.

 

마지막으로 3차 해석은 데이터를 종합하거나 상관 관계를 파악하여

새로운 의미를 찾아내는 것을 의미합니다.

디지털 헬스케어와 관련하여 가장 각광 받는 분야입니다.

모바일을 중심으로 한 새로운 기술을 통해서

기존에 측정하기 힘들던 데이터를 얻을 수  있게 되었기 때문입니다.

 

특히 기존 의료에서 어떤 생체 신호를 측정한다는 것은 대부분

어떤 일이 발생해서 증상으로 나타난 다음에야 병원에서 실시할 수 있는 일이었는데

디지털 헬스케어를 통해서 일이 발생하기 전의 데이터를 수집할 수 있게 되었다는 점에서

의료의 패러다임 자체를 바꿀 수 있게 되었습니다.

 

3차 해석을 통해서 크게 두가지가 가능해질 수 있는데

다양한 데이터를 활용한 정밀한 맞춤형 진단

질병이 발생하기 전 데이터 확보를 통한 질별 발생 예측이 그 것입니다.

이에 대해서는 예전 포스팅 ‘의료 빅데이터가 가져올 변화와 회사들의 접근 전략’에서

다루었습니다.

 

그때 다루었던 사례를 보면 맞춤형 진단의 대표적인 예

Ginger.io회사가  전화나 문자 사용 패턴 및 활동량과 같은 스마트폰 사용 패턴을 분석하여

 우울증 등 정신과 질환의 상태를 추적할 수 있도록 하는 것과

이스라엘 연구자들이

혈당 반응 예측을 통한 개인별 맞춤 영양 관리 (Personalized Nutrition by Prediction of Glycemic Responses) 라는 제목의 논문에서

개인의 다양한 데이터를 수집해서 맞춤형 영양 관리를 통해서 혈당을 관리할 수 있는

알고리즘을 만들어 냈고 이것이 유효함을 입증한 경우가 있습니다.

 

 질병 예측의 대표적인 예

미국의 메이요 클리닉이 설립한 데이터 분석 회사인 Ambient Clinical Analytics에서 만든

임상 의사 결정 지원 시스템(Clinical Decision Support)인

패혈성 쇼크 감지기 ‘Sepsis Detection And Response Tool’와

인공호흡기 관련 폐손상 감지기 ‘Ventilator–Induced Lung Iinjury Sniffer’가 있습니다.

환자 의무기록, 생체 신호 측정치, 혈액 검사 결과 등 데이터를 분석해

생명에 치명적인 영향을 줄 수 있는 패혈성 쇼크와 인공호흡기 관련 폐손상 가능성을

예측해줌으로써 의료진이 미리 대처할 수 있게 해줍니다.

 

위의 제 포스팅에서 쓰지 않은 사례를 몇가지만 더 생각해 보겠습니다.

 

좀 더 생각을 확장시켜보면 맞춤형 진단과 관련해서 ‘진단’이 반드시 질병에 대한 것을 의미할 필요는 없습니다.

예를 들어, Ginger.io 회사의 알고리즘을 발전시키면

사용자의 행동 특성을 파악할 수 있을 것입니다.

만약 쇼핑앱이 이런 데이터에 접근할 수 있다면

사용자의 심리를 이용하는 방법으로 물건을 판매할 수 있을 지도 모릅니다.

또, 그때그때의 기분을 파악하여 효율적으로 쇼핑을 유도하는 것도 가능할 것 같습니다.

이를 건강 관리와 연결시키면 사용자 맞춤으로 건강 관련 행동 변화를 유도할 수 있을 것 같습니다.

예를 들어, 목표 달성을 못하면 잠을 못자는 유형이라는 것을 발견하면

10,000 걸음 목표를 달성한 경우에도 데이터를 조작하여 9,500 걸음만 걸었다고

사기(!)를 쳐서 더 많이 걷도록 유도할 수 있을 지도 모릅니다.

 

질병 예측과 관련해서 ‘사물인터넷 비지니스 모델 혁명’ 책에서 흥미로운 사례를 보았습니다.

일본의 후지쯔는 소에 활동량 측정계를 착용시키고 그 활동을 추적하여

소의 발정기와 최적의 인공 수정 시기를 찾아내는 알고리즘을 만들었다고 합니다.

소의 발정기가 시작되면 일반적으로 소가 미친듯이 돌아다니는 것으로 알려져 있는데

활동량 측정계를 통하여 소의 활동 양상을 정확하게 측정함으로써

발정기의 시작을 찾아낼 수 있게 되었습니다.

여기에 더해서 활동량이 증가하고 16시간 후에 수정이 가장 잘 이루어진다는 사실을 발견하여

최적의 시기에 인공 수정을 할 수 있게 되었다고 합니다.

 

현재까지 디지털 헬스케어 영역에서 주로 관심을 가졌던 것은

1차 해석에서 기존 의료계에서 의미있다고 생각하는 데이터를 그대로 수집하거나

3차 해석에서 데이터를 종합하여 맞춤형 진단에 활용하는 경우입니다.

지금까지 살펴본 것처럼 기존에 관심을 두지 않았던 데이터를 수집하거나

이미 수집하고 있는 데이터를 새롭게 활용할 수 있다는 점에 염두를 두고

데이터에서 더 많은 가치를 만들어내기 위해서 노력하는 것이 필요합니다.

Comments

comments

2 comments

Leave a Reply

Your email address will not be published.