가톨릭대학교 서울성모병원 감염내과 이동건(감염관리실장, 공동 교신저자), 조성연 교수(공동 제1저자), 혈액내과 김동욱(가톨릭혈액병원장, 공동 교신저자), 박성수 교수(공동 제1저자) 연구팀이 국내에서 코로나19로 진단받은 환자 5,594명의 빅데이터를 활용해 코로나19 사망 위험요인을 분석하고 예측모델을 개발했다.
연구팀은 정부에서 공개한 질병관리청 의료 빅데이터를 활용해 2020년 1월부터 4월까지 코로나19로 확진된 5,594명에 대한 사망 위험 예측모델을 개발하기 위해 2 대1 비율의 개발 코호트(3,729명)와 검증 코호트(1,865명)로 나누어 연구를 수행했다.
연구 결과 코로나19 진단시점에서 사망에 영향을 미치는 요인으로 고령, 치매 동반, 만성신질환 동반, 호흡곤란 또는 의식 저하가 있는 경우, 절대림프구 수 1000개 미만을 확인했다.
연구팀은 예측 모델을 손쉽게 활용할 수 있도록 웹사이트를 구축했다. 논문의 내용과는 별도로, 일반환자를 대상으로 비록 경증이라도 산소치료가 필요한 질병 상태로 이행하는지 여부를 예측하는 모델 또한 제공하고 있다.
서울성모병원 혈액병원은 빅데이터를 기반으로 AI(인공지능)를 활용한 혈액질환 관련 의료모델을 개발한 바 있다. 이런 개발 경험을 바탕으로, 연구팀은 그간 축적한 연구 경험과 질병관리청 제공 공공데이터를 활용해 코로나19 대유행을 극복할 수 있는 시스템을 개발한 것에 큰 의의가 있다고 밝혔다.
이번 연구는 서울성모병원 생명존중기금과 가톨릭의대 재미동문회 지원으로 진행되었으며, 연구 결과는 국제학술지 ‘Journal of Medical Internet Research’ 에 게재됐다.
한편 연구팀은 코로나19의 데이터를 사용자가 웹베이스에서 축적하고, 이를 자동으로 분석해 사망 예측모델을 자동으로 고도화하는 데이터 축적 및 인공지능 모델을 개발해 특허로 출원했다. 이는 사용자가 원하는 예측 모델을 통해 필요한 정보를 얻고, 사용자에 의해 투입된 정보는 데이터로 축적된 뒤 머신러닝 알고리즘을 이용해 모델이 연속적으로 고도화되는 데이터 처리 기술이다. 이런 데이터 처리 기술은 개인이 투입한 데이터의 가치를 높이고, 공공의 이익을 증대하는 기술로 활용할 수 있다.