KR20140141534A

KR20140141534A - 패혈증 고위험군 예측 방법 및 시스템

Info

Publication number: KR20140141534A
Application number: KR20140067012A
Authority: KR
Inventors: 이선미
Original assignee: 가톨릭대학교 산학협력단
Priority date: 2013-05-31
Filing date: 2014-06-02
Publication date: 2014-12-10
Also published as: KR101595784B1

Abstract

본 발명은 EMR(Electronic Medical Record) 서비스 서버로부터 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청하는 과정과, 상기 요청된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정하는 과정과, 상기 EMR 서비스 서버로부터 상기 변수와 매칭되는 임상 데이터를 추출하고, 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택하는 과정과, 선택된 상기 변수에 기초하여 예측모형 형식에 따라 훈련(Training) 및 검증(Validation) 데이터를 도출하고, 상기 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가하는 과정과 패혈증 고위험군 유무를 표시하는 과정을 포함함을 특징으로 한다.

Description

패혈증 고위험군 예측 방법 및 시스템{METHOD AND SYSTEM FOR PREDICTING SEPSIS RISK}

본 발명은 전자의무기록 시스템과의 연동을 통해 데이터 마이닝 기법으로 패혈증(Sepsis) 관련 위험을 예측하기 위한 패혈증 고위험군 예측 방법 및 시스템에 관한 것이다.

패혈증은 뚜렷한 위험증상을 나타내지 않아 조기 진단하여 치료하기 어려우며, 30% 이상의 높은 사망률을 보이는 치명적인 질환이다. 미국에서는 패혈증이 전체 사망원인 중 10위를 차지하고, 감염질환으로 동반되는 경우에는 사망원인 중 3위를 차지하고 있다. 패혈증의 발생률을 낮추기 위해 패혈증 발생 위험을 주기적으로 사정하여 조기 발견할 수 있는 예방시스템이 필요하다.

그러나 현재까지 패혈증의 위험요인이나 예방을 위한 가이드라인은 이미 많이 개발되어 있지만 고위험 사정도구는 개발되지 않은 실정이다. 그러므로 패혈증의 발생률을 낮출 수 있도록 의료인의 업무를 지원해 줄 수 있는 고위험군 예측을 위한 자동화된 컴퓨터 시스템 개발이 필요하다.

따라서 본 발명은 상기와 같은 문제점을 해결하기 위하여 창안된 것으로서 의료인들이 추가적으로 데이터를 수집하거나 가공 또는 입력할 필요 없이 현재 임상에서 기록되고 있는 전자의무기록 데이터만으로 패혈증 고위험군을 예측할 수 있는 시스템을 구축하는 기술을 제공하고자 한다.

본 발명의 일 견지에 따르면, EMR(Electronic Medical Record) 서비스 서버로부터 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청하는 과정과, 상기 요청된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정하는 과정과, 상기 EMR 서비스 서버로부터 상기 변수와 매칭되는 임상 데이터를 추출하고, 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택하는 과정과, 선택된 상기 변수에 기초하여 패혈증 발생 위험 대상에서 고위험군과 저위험군을 구분하기 위해 기설정된 평가 기준을 이용하여 예측모형이 가장 적합한 것으로 예측시스템을 구축하고자 한다.

본 발명의 다른 견지에 따르면, 제어부로부터 출력된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정하는 변수 선정부와, EMR(Electronic Medical Record) 서비스 서버와 연동되어 상기 EMR 서비스 서버로부터 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청하고, 상기 변수 선정부로부터 선정된 변수와 매칭되는 임상 데이터를 추출하는 제어부와, 상기 제어부로부터 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택하는 변수 선택부와, 상기 제어부의 제어 하에 변수 선택부로부터 선택된 상기 변수에 기초하여 예측모형 형식에 따라 훈련(Training) 및 검증(Validation) 데이터를 도출하고, 상기 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가하는 예측력 평가부를 포함함을 특징으로 한다.

본 발명의 또 다른 견지에 따르면, 패혈증 고위험군 예측을 수행하는 화면 표시 방법에 있어서, 환자별 임상적 판단을 지원하기 위한 임상 데이터 서비스 모드가 실행되면, 각종 진료 서식 생성을 위한 정보 제공 입력 페이지를 표시하는 과정과, 상기 임상 데이터 서비스 모드로 전환되어 복수의 분할된 영역을 갖는 정보 제공 입력 페이지에서 상기 분할된 소정 영역에 패혈증 고위험 유무를 표시하는 과정과, 상기 고위험 유무가 표시된 영역에 사용자 인터럽트가 발생되는 경우 해당 패혈증 발생에 관한 상세정보 페이지로 링크되어 상기 정보 제공 입력 페이지로부터 전환되거나 상기 정보 제공 입력 페이지 내에 상기 상세정보 페이지를 표시하는 과정을 포함함을 특징으로 한다.

본 발명은 패혈증 고위험군을 예측할 수 있어 패혈증 관련 위험 판단에 소요되는 인적/물적 자원을 절약하고, 사용자 간의 변이를 줄임으로써 위험 예측의 일관성 및 정확성을 높일 뿐만 아니라 위험 발생 예측을 보다 적극적으로 판단하여 환자의 패혈증 관련 발생 빈도를 최소화함으로써 의료 서비스의 질적 향상에 기여하는 효과가 있다.

도 1은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 관한 전체 흐름도.
도 2는 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 있어서 변수 선택에 대한 상세 흐름도.
도 3은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 있어서 변수 선택 결과에 대한 테이블.
도 4는 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법이 적용된 ROC 곡선.
도 5는 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 있어서 예측값 산출 공식에 대한 테이블.
도 6은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 있어서 훈련용 및 검증용 데이터에 관한 ROC 곡선.
도 7은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 있어서 Calibration 곡선.
도 8은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 시스템에 관한 구성도.
도 9는 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측을 수행하는 화면 표시 방법에 관한 전체 흐름도.
도 10은 본 발명의 또 다른 실시 예에 따른 패혈증 고위험군 예측모형 화면 디스플레이 방법이 적용된 화면 예시도.
도 11은 본 발명의 일 실시 예에 따른 패혈증 관련 위험군 레벨 분류 기준 테이블.
도 12는 본 발명의 일 실시 예에 따른 패혈증 관련 예측 방법에 있어서 변수 선택 결과에 대한 도 3의 테이블에서 변수별 값, 설명이 추가된 테이블.

이하 본 발명에 따른 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 하기 설명에서는 구체적인 구성 소자 등과 같은 특정 사항들이 나타나고 있는데 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐 이러한 특정 사항들이 본 발명의 범위 내에서 소정의 변형이나 혹은 변경이 이루어질 수 있음은 이 기술 분야에서 통상의 지식을 가진 자에게는 자명하다 할 것이다.

본 발명은 전자의무기록 시스템과의 연동을 통해 패혈증 관련 위험을 예측하기 위한 것으로, 보다 상세하게는 데이터 마이닝(Data mining) 및 로지스틱 회귀분석(Logistic regression)을 통해 EMR 서비스 서버의 임상 데이터 기반 패혈증 관련 발생 위험이 높은 고위험군 예측모델을 개발하고자 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정하고, 상기 변수와 매칭되는 임상 데이터를 추출하여 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택하고 이에 기초하여 예측모형에 대한 예측력을 평가함으로써 패혈증 관련 위험 판단에 소요되는 인적/물적 자원을 절약하고, 사용자 간의 변이를 줄임으로써 위험 예측의 일관성 및 정확성을 높일 뿐만 아니라 위험 발생 예측을 보다 적극적으로 판단하여 환자의 패혈증 관련 발생 빈도를 최소화함으로써 의료 서비스의 질적 향상에 기여하는 기술을 제공하고자 한다.

이하, 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 관해 도 1을 참조하여 자세히 살펴보기로 한다.

도 1은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 관한 전체 흐름도이다.

도 1을 참조하면, 먼저 110 과정에서 EMR(Electronic Medical Record) 서비스 서버로부터 환자별 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청한다.

본 발명에서는 패혈증 발생의 위험 예측을 수행하기 위하여 환자의 임상 데이터를 활용할 수 있다.

이를 위하여, 상기 EMR 서비스 서버는 환자별 임상 데이터를 저장/통합관리하는 수단을 의미할 수 있다.

112 과정에서는 상기 요청된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정한다.

이때, 상기 패혈증 발생의 위험 요인이 되는 변수는, 데이터 마이닝(Data mining) 및 로지스틱 회귀분석(Logistic regression)을 포함하는 방법을 통해 패혈증 고위험군 예측모형이 수행된다.

상기 데이터 마이닝은 전문적 지식과 고급분석 기법을 이용하여 대용량 데이터(Large volume of data)내에 존재하는 숨겨진(Hidden) 관계(Association), 규칙(Rule), 패턴(Pattern) 등을 찾아내어 모형화(Modeling)함으로써 유용한 정보(Valuable information)를 추출하여 지식(Knowledge)을 형성하도록 도와주는 일련의 반복과정이다.

상기 로지스틱 회귀모형은 목표변수가 더미(Dummy) 값인 0과 1 두 개의 값을 가지는 이항형 반응에 대한 통계적 모형 중 하나이다. 로지스틱 회귀모형의 목적은 흔히 추정된 로짓모형을 이용하여 자료를 분류하기 위한 것이기 때문에 일반적인 판별분석과 비교하여 로지스틱 판별분석(Logistic discrimination)이라고도 불린다.

로지스틱 회귀분석의 장점 중 하나는 선형회귀분석의 회귀계수와 같이 설명변수에 미치는 영향력을 측정할 수 있다는 것이다. 선형회귀분석에서는 각 설명변수의 회귀계수

가 영향력을 측정하는 도구임에 비해 로지스틱 회귀분석에서는 오즈비(Odds ratio)로 계량화할 수 있다. 즉, 다른 모든 설명변수가 일정한 상태에서

가 1단위 증가하는데 따른 오즈비는 다음과 같이 계산된다.

여기서 오즈비가 1보다 작다(

가 음의 값)면 설명변수

가 감소방향으로 영향을 미침을 의미하고 반대로 오즈비가 1보다 크다(

가 양의 값)면 증가방향으로 영향을 미침을 의미한다.

또한, α= Y축에서 절편(Intercept)을 의미한다.

더욱 상세하게는, y=αχ + β 일 때, α는 이른바 절편으로 χ값의 변화되는 수에 따라, y값이 변화하는 정도를 나타내는 수를 의미하는 것으로, 급격하게 변화하느냐, 혹은 완만하게 변화하느냐를 나타내는 척도의 값이다.

그리고 상기 변수 선정은 의학문헌 검색 시스템인 MEDLINE 데이터베이스에서 패혈증 관련 논문을 검색하여 1차적으로 타이틀(Title) 및 요약(Abstract) 리뷰 후 2차적으로 풀 텍스트(Full text) 리뷰하여 위험요인을 추출한 결과를 근거로 EMR 시스템에서 4600개 항목을 추출하였다.

이러한 과정을 통해 추출된 개념들을 이용하여 패혈증 발생의 위험 요인이 되는 변수와 각 변수의 범주(분류 수준, Value)를 규명할 수 있다.

이어, 상기 변수에 대응되는 임상 데이터를 확인하는 동작으로 114 과정에서는 상기 EMR 서비스 서버로부터 상기 변수와 매칭되는 임상 데이터를 추출한다.

여기서, 상기 변수와 임상 데이터를 매칭하는 작업에 대한 접근은 구조화된 EMR 시스템의 임상 데이터 항목을 검토한다. 예를 들어, 간호사의 임상관찰 기록은 '중환자실 간호기록지'와 같은 구조화된 입력 화면과 '간호일지'와 같은 비구조화된 입력 화면을 통해 중복적으로 이루어지고 있으므로, 임상 데이터의 활용성이 유연하다고 판단되는 구조화된 EMR 시스템 화면의 데이터 항목을 우선적으로 고려한다.

또한, 상기 변수와 매칭되는 임상 데이터를 추출하는 과정이 필요하다.

이를 위하여, 패혈증 대상 환자를 선정하고 각 대상 환자의 임상 데이터를 추출한다. 상기 대상 환자는 활력 징후, 환자 상태 등 임상 관찰 내용을 참조하여 선정할 수 있으며, 패혈증 위험 발생 여부에 따라 발생군과 비발생군으로 분류할 수 있다.

계속해서, 116 과정에서는 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택한다.

이러한 116 과정의 동작을 거쳐 선택된 변수는 도 3에 도시된 테이블과 같이 정리할 수 있다.

도 3에 도시된 바와 같이, 상기 선택된 패혈증 발생 변수로는 나이, 병원재원기간, 맥박 최대값, 호흡 최대값, 이완기 혈압 최소값, 체온 최대값, 응급실 경유 유무를 포함한다.

더불어, 도 12의 테이블에서는 선택된 패혈증 발생 변수별 값, 설명 1 및 설명 2를 추가하였다.

또한, 상기 패혈증 발생 변수를 선택하는 상세과정을 도 2를 참고하여 설명하면, EMR 시스템에서 추출된 데이터를 대상으로 잠재적 위험 요인 변수는, 210 과정에서 IV(Information Value) 산출을 통해 기설정된 기준에 대응하는 독립변수를 선정한다.

상기 IV는 각 독립변수가 가지는 설명력을 측정하는 지표 중 하나이다. 상기 IV가 0.1 이상인 변수만을 선택하였다.

212 과정에서는 선정된 독립변수에 대하여 단변량검정(T-test, Chi-square test)의 기설정된 유의수준 0.05에서 유의한 변수를 선택하고, 214 과정에서는 다중 로지스틱 회귀분석(Multiple logistic regression)에 의한 변수선정(Forward/Backward/Stepwise selection)에 있어서 적어도 한번 이상 선정된 변수를 선정한다.

216 과정에서는 문헌 고찰 혹은 임상 실무자의 임상적 판단을 통해 지지 되는 변수를 선정한다.

다시 도 1의 설명으로 돌아가서, 118 과정에서는 선택된 상기 변수에 기초하여 예측모형 형식에 따라 훈련(Training) 및 검증(Validation) 데이터를 도출한다.

더욱 상세하게는 본 발명에서는 최적의 예측모형을 구축하기 위해 다수의 예측모형을 구축하고, 그 중 최고의 예측모형을 선택해야 하므로 이를 위해 2가지 방법으로 평가가 수행되었다.

우선, 과적합의 문제를 해결하기 위해 데이터를 훈련용 데이터와 검증용으로 구분하고, 다수의 예측모형 중 일정한 기준을 세우고 그 기준을 가장 잘 충족하는 예측모형을 선택하였다.

이때, 본 발명에서 사용한 데이터는 총 2020건으로 이 중 70%(1414건)를 훈련용 데이터로 사용하였으며 30%(606건)를 검증용 데이터로 사용하였다.

분할 방법은 랜덤 할당하여 사용하였다.

이후, 120 과정에서는 상기 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가한다.

상기 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가하는 과정은, 예측모형의 적합성을 검증하기 위해 부트스트래핑(Bootstrapping)을 통해 산출된 슈렁큰 회귀 계수(Shrunken regression coefficients)를 적용하여, 패혈증 발생 위험 대상에서 고위험군과 저위험군을 구분하기 위해 ROC(Receiver Operating Characteristic) 곡선과 AUC 분석을 통해 판별(Discrimination)능력을 평가하는 단계와, 예측 값과 실제 관측 값이 일치하는 정도(Calibration)를 평가하는 제2 단계를 통해 수행된다.

상기 판별능력은 예측모델이 예를 들면, 패혈증 환자를 비패혈증 환자로부터 얼마나 잘 분리해 내는가를 평가하는 것이고 Calibration 능력은 예측치(Predictive probability)가 실제 결과(Real outcome)에 얼마나 근접했는가를 평가하는 방법이다.

상기 판별 능력은 Receiver Operating Characteristic(ROC) 곡선과 AUC 분석을 통해서 측정하고 임계점(Best cut-off point)을 (1-민감도)²과 (1-특이도)²의 합이 최소화되고 ROC 곡선에서 (0, 1)에 가장 가까운 지점, 혹은 Youden index가 최대인 지점에서 정확도(Accuracy), 민감도(Sensitivity), 특이도(Specificity), 양성예측치(PPV: Positive Predictive Value), 음성예측치(NPV: Negative Predictive Value)를 구하여 타당도를 평가한다.

민감도= a/(a+b)

특이도= d/(c+d)

Youden index=민감도+특이도-1

PPV=a/(a+c)

NPV=d/(b+d)

ACU=(a+d)/(a+b+c+d)

상기 ROC(Receiver Operating Characteristics) 곡선은 도 4에서와 같이 각 분류점마다 횡축(X축)에 1-특이도, 종축(Y축)에 민감도를 표시하고 이 점들을 모두 이어 표시한 그래프를 말한다. ROC 곡선은 45도 기울기로부터 멀리 떨어질수록 예측력이 우수하다고 할수 있다. 서로 다른 모형을 비교하기 위해서는 ROC 곡선의 면적을 구하고 이를 비교함으로써 얼마나 45도 기울기 선에서 떨어져 있는지를 알 수 있다.

상술한 바와 같은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 대하여 도 5 내지 도 7을 참고하여 패혈증 고위험군 예측모형 선택 결과를 예시한다.

우선, 도 5에 도시된 바와 같이, 패혈증 고위험군 예측값 산출 공식을 보인 것이다.

이와 같은 예측값 산출 공식을 기반으로 하기의 패혈증 고위험군 예측모형의 AUC 결과는 하기에서와 같다.

패혈증 고위험군 예측모형의 AUC 결과

이와 같이, 검증결과, 훈련용 데이터와 검증용 데이터의 AUC(예측력)는 각각 0.95, 0.96으로 예측력이 우수한 것으로 나타났다.

도 6은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에서 있어서 훈련용(상단) 및 검증용(하단) 데이터에 관한 ROC 곡선이고, 도 7은 Calibration 곡선이다.

이상에서는, 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 관해 살펴보았다.

이하, 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 시스템에 대해 도 8을 참조하여 자세히 살펴보기로 한다.

도 8은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 시스템에 관한 구성도이다.

도 8을 참조하면, 본 발명이 적용된 시스템(800)은 변수 선정부(810), 예측력 평가부(812), 제어부(814), 변수 선택부(816), 예측모형 생성부(817) 및 EMR 서비스 서버(818)을 포함한다.

상기 변수 선정부(810)은 제어부(814)로부터 출력된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정한다.

여기서, 상기 변수 선정부(810)는, 데이터 마이닝(Data mining) 및 로지스틱회귀분석(Logistic regression)을 포함하는 방법을 통해 패혈증 고위험군 예측모형을 수행하는 것으로, 상기 로지스틱회귀 분석은 하기와 같은 오즈비(Odds ratio)로 계량화된다.

상기 제어부(814)는 EMR(Electronic Medical Record) 서비스 서버(818)와 연동되어 상기 EMR 서비스 서버(818)로부터 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청하고, 상기 변수 선정부(810)로부터 선정된 변수와 매칭되는 임상 데이터를 추출한다.

상기 변수 선택부(816)는 제어부(814)로부터 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택한다.

이때, 상기 변수 선택부(816)는, 패혈증 발생 변수 선택 시, IV(Information Value) 산출을 통해 기설정된 기준에 대응하는 독립변수를 선정하고, 선정된 독립변수에 대하여 단변량검정의 기설정된 유의수준에서 유의한 변수를 선택하고, 다중 로지스틱 회귀분석(Multiple logistic regression)에 의한 변수선정에 있어서 적어도 한번 이상 선정된 변수를 선정하고, 문헌 고찰 혹은 임상 실무자의 임상적 판단을 통해 지지되는 변수를 선정하여 수행된다.

상기 예측력 평가부(812)는 제어부(814)의 제어 하에 변수 선택부(816)로부터 선택된 상기 변수에 기초하여 예측모형 형식에 따라 훈련(Training) 및 검증(Validation) 데이터를 도출하고, 상기 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가한다.

이때, 상기 예측력 평가부(812)는, 예측모형의 적합성을 검증하기 위해 부트스트래핑(Bootstrapping)을 통해 산출된 슈렁큰 회귀 계수(Shrunken regression coefficients)를 적용하여, 패혈증 발생 위험 대상에서 고위험군과 저위험군을 구분하기 위해 ROC(Receiver Operating Characteristic) 곡선과 AUC 분석을 통해 판별(Discrimination)능력을 평가하는 단계와 예측 값과 실제 관측 값이 일치하는 정도(Calibration)를 평가하는 상기 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가한다.

상기 예측모형 생성부(817)는 예측력 평가부(812)로부터 출력된 예측력 평가를 기반으로 패혈증 발생의 예측모형을 생성한다.

이하, 본 발명의 또 다른 실시 예에 따른 패혈증 고위험군 예측을 수행하는 화면 디스플레이 방법에 도 9를 참조하여 자세히 살펴보기로 한다.

도 9는 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측을 수행하는 화면 디스플레이 방법에 관한 전체 흐름도이다.

도 9를 참조하면, 먼저 90 과정에서 환자별 임상적 판단을 지원하기 위한 임상 데이터 서비스 모드를 실행하여 92 과정에서 각종 진료 서식 생성을 위한 정보 제공 입력 페이지를 표시한다.

94 과정에서는 임상 데이터 서비스 모드로 전환되어 복수의 분할된 영역을 갖는 정보 제공 입력 페이지에서 상기 분할된 소정 영역에 패혈증 고위험 유무를 표시한다.

96 과정에서는 상기 고위험 유무가 표시된 영역에 사용자 인터럽트가 발생되는 경우 98 과정으로 이동하여 해당 패혈증에 관한 상세정보 페이지로 링크되어 상기 정보 제공 입력 페이지로부터 전환되거나 상기 정보 제공 입력 페이지 내에 상기 상세정보 페이지를 표시한다.

예를 들어, 도 10을 참조하면, 도 10은 본 발명의 또 다른 실시 예에 따른 패혈증 고위험군 예측모형 화면 디스플레이 방법이 적용된 화면 예시도로서, 도 10에 도시된 바와 같이, 정보 제공 입력 페이지(20)에서 위험군(혹은 패혈증 위험군) 표시 아이콘(21)의 색이 기설정된 색으로 표시되는 경우 이를 클릭하면 패혈증 고위험 유무를 확인 가능한 페이지를 표시한다.

즉, 상기 위험군(혹은 패혈증 위험군) 표시 아이콘(21) 클릭을 통해 환자별 패혈증 위험군 예측 판단을 지원하기 위한 패혈증 위험군 알람 서비스 모드가 실행되면, 상기 모드에 따라 해당 환자의 패혈증 위험군 레벨을 EMR 서비스 서버를 통해 기설정된 입원 기간별 패혈증 확진 여부를 확인하여 가이드한다.

이때, 상기 위험군 레벨은 도 11에 도시된 테이블과 같이, 고위험군, 중위험군, 저위험군으로 분류되고, 각 위험군 레벨은 테이블에 각각 기재된 바와 같다.

여기서, 상기 고위험군에 해당하는 예측값은 상술한 예측모형에 대한 예측력을 평가하는 동작에서 출력되는 예측 값을 의미하는 것으로, 이 외 EMR 서비스 서버를 통해 EMR 서비스 서버에 기저장된 해당 환자의 이번 입원에서 패혈증으로 확진된 환자 혹은 이전 입원에서 패혈증으로 확진된 환자에 해당하는 경우 패혈증 고위험군 환자로 분류된다.

상기와 같이 본 발명에 따른 패혈증 고위험군 예측 방법 및 시스템에 관한 동작이 이루어질 수 있으며, 한편 상기한 본 발명의 설명에서는 구체적인 실시 예에 관해 설명하였으나 여러 가지 변형이 본 발명의 범위를 벗어나지 않고 실시될 수 있다. 따라서 본 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 청구범위와 청구범위의 균등한 것에 의하여 정하여져야 할 것이다.

810: 변수 선정부 812: 예측력 평가부
814: 제어부 816: 변수 선택부
817: 예측모형 생성부 818: EMR 서비스 서버

Claims

패혈증 고위험군을 예측 방법에 있어서,
EMR(Electronic Medical Record) 서비스 서버로부터 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청하는 과정과,
상기 요청된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정하는 과정과,
상기 EMR 서비스 서버로부터 상기 변수와 매칭되는 임상 데이터를 추출하고, 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택하는 과정과,
선택된 상기 변수에 기초하여 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형 형식에 따라 훈련(Training) 및 검증(Validation) 데이터를 도출하고, 상기 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가하는 과정을 포함함을 특징으로 하는 패혈증 고위험군 예측 방법.
제1항에 있어서,
상기 패혈증 발생의 위험 요인이 되는 변수는, 데이터 마이닝(Data mining) 및 로지스틱회귀 분석(Logistic regression)을 포함하는 방법을 통해 패혈증 고위험군 예측이 수행됨을 특징으로 하는 패혈증 고위험군 예측 방법.
제2항에 있어서,
상기 로지스틱회귀 분석은 하기와 같은 오즈비(Odds ratio)로 계량화됨을 특징으로 하는 패혈증 고위험군 예측 방법.
제1항에 있어서,
상기 패혈증 발생 변수를 선택하는 과정은,
IV(Information Value) 산출을 통해 상기 IV가 0.1 이상에 대응하는 독립변수를 선정하는 단계와,
선정된 독립변수에 대하여 단변량검정의 기설정된 0.05 유의수준에서 유의한 변수를 선택하는 단계와,
다중 로지스틱 회귀분석(Multiple logistic regression)에 의한 변수선정에 있어서 적어도 한번 이상 선정된 변수를 선정하는 단계와,
문헌 고찰 혹은 임상 실무자의 임상적 판단을 통해 지지되는 변수를 선정하는 단계를 포함함을 특징으로 하는 패혈증 고위험군 예측 방법.
제1항에 있어서,
상기 예측모형에 대한 예측력을 평가하는 과정은,
예측모형의 적합성을 검증하기 위해 부트스트래핑(Bootstrapping)을 통해 산출된 슈렁큰 회귀 계수(Shrunken regression coefficients)를 적용하여, 패혈증 발생 위험 대상에서 고위험군과 저위험군을 구분하기 위해 ROC(Receiver Operating Characteristic) 곡선과 AUC 분석을 통해 판별(Discrimination) 능력을 평가하는 단계와,
예측 값과 실제 관측 값이 일치하는 정도(Calibration)를 평가하는 제2 단계를 통해 수행됨을 특징으로 하는 패혈증 고위험군 예측 방법.
제1항에 있어서,
상기 선택된 패혈증 발생 변수는,
나이, 병원재원기간, 맥박 최대값, 호흡 최대값, 이완기 혈압 최소값, 체온 최대값, 응급실 경유 유무를 포함함을 특징으로 하는 패혈증 고위험군 예측 방법.
제어부로부터 출력된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정하는 변수 선정부와,
EMR(Electronic Medical Record) 서비스 서버와 연동되어 상기 EMR 서비스 서버로부터 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청하고, 상기 변수 선정부로부터 선정된 변수와 매칭되는 임상 데이터를 추출하는 제어부와,
상기 제어부로부터 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택하는 변수 선택부와,
상기 제어부의 제어 하에 변수 선택부로부터 선택된 상기 변수에 기초하여 예측모형 형식에 따라 훈련(Training) 및 검증(Validation) 데이터를 도출하고, 상기 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가하는 예측력 평가부를 포함함을 특징으로 하는 패혈증 고위험군 예측 시스템.
제7항에 있어서, 상기 변수 선정부는,
데이터 마이닝(Data mining) 및 로지스틱 회귀분석(Logistic regression)을 포함하는 방법을 통해 패혈증 고위험군 예측을 수행함을 특징으로 하는 패혈증 고위험군 예측모형 시스템.
제8항에 있어서,
상기 로지스틱회귀 분석은 하기와 같은 오즈비(Odds ratio)로 계량화됨을 특징으로 하는 패혈증 고위험군 예측 시스템.
제7항에 있어서, 상기 변수 선택부는,
상기 패혈증 발생 변수 선택 시,
IV(Information Value) 산출을 통해 기설정된 기준에 대응하는 독립변수를 선정하고, 선정된 독립변수에 대하여 단변량검정의 기설정된 유의수준에서 유의한 변수를 선택하고, 다중 로지스틱 회귀분석(Multiple logistic regression)에 의한 변수선정에 있어서 적어도 한번 이상 선정된 변수를 선정하고, 문헌 고찰 혹은 임상 실무자의 임상적 판단을 통해 지지되는 변수를 선정하여 수행됨을 특징으로 하는 패혈증 고위험군 예측 시스템.
제7항에 있어서, 상기 예측력 평가부는,
예측모형의 적합성을 검증하기 위해 부트스트래핑(Bootstrapping)을 통해 산출된 슈렁큰 회귀 계수(Shrunken regression coefficients)를 적용하여,
패혈증 발생 위험 대상에서 고위험군과 저위험군을 구분하기 위해 ROC(Receiver Operating Characteristic)곡선과 AUC 분석을 통해 판별(Discrimination)능력을 평가하고,
예측 값과 실제 관측 값이 일치하는 정도(Calibration)를 평가하여 상기 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가함을 특징으로 하는 패혈증 고위험군 예측 시스템.
패혈증 고위험군 예측을 수행하는 화면 표시 방법에 있어서,
환자별 임상적 판단을 지원하기 위한 임상 데이터 서비스 모드가 실행되면, 각종 진료 서식 생성을 위한 정보 제공 입력 페이지를 표시하는 과정과,
상기 임상 데이터 서비스 모드로 전환되어 복수의 분할된 영역을 갖는 정보 제공 입력 페이지에서 상기 분할된 소정 영역에 패혈증 고위험 유무를 표시하는 과정과,
상기 고위험 유무가 표시된 영역에 사용자 인터럽트가 발생되는 경우 해당 패혈증 발생에 관한 상세정보 페이지로 링크되어 상기 정보 제공 입력 페이지로부터 전환되거나 상기 정보 제공 입력 페이지 내에 상기 상세정보 페이지를 표시하는 과정을 포함함을 특징으로 하는 패혈증 고위험군 예측을 수행하는 화면 표시 방법.
제7항에 있어서,
상기 예측력 평가부로부터 출력된 예측력 평가를 기반으로 최적의 예측모형을 생성하는 예측모형 생성부를 더 포함함을 특징으로 하는 패혈증 고위험군 예측 표시 방법.