KR20140141534A - 패혈증 고위험군 예측 방법 및 시스템 - Google Patents

패혈증 고위험군 예측 방법 및 시스템 Download PDF

Info

Publication number
KR20140141534A
KR20140141534A KR20140067012A KR20140067012A KR20140141534A KR 20140141534 A KR20140141534 A KR 20140141534A KR 20140067012 A KR20140067012 A KR 20140067012A KR 20140067012 A KR20140067012 A KR 20140067012A KR 20140141534 A KR20140141534 A KR 20140141534A
Authority
KR
South Korea
Prior art keywords
sepsis
variable
risk
data
selecting
Prior art date
Application number
KR20140067012A
Other languages
English (en)
Other versions
KR101595784B1 (ko
Inventor
이선미
Original Assignee
가톨릭대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가톨릭대학교 산학협력단 filed Critical 가톨릭대학교 산학협력단
Publication of KR20140141534A publication Critical patent/KR20140141534A/ko
Application granted granted Critical
Publication of KR101595784B1 publication Critical patent/KR101595784B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Public Health (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Pathology (AREA)
  • Algebra (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Child & Adolescent Psychology (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)

Abstract

본 발명은 EMR(Electronic Medical Record) 서비스 서버로부터 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청하는 과정과, 상기 요청된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정하는 과정과, 상기 EMR 서비스 서버로부터 상기 변수와 매칭되는 임상 데이터를 추출하고, 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택하는 과정과, 선택된 상기 변수에 기초하여 예측모형 형식에 따라 훈련(Training) 및 검증(Validation) 데이터를 도출하고, 상기 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가하는 과정과 패혈증 고위험군 유무를 표시하는 과정을 포함함을 특징으로 한다.

Description

패혈증 고위험군 예측 방법 및 시스템{METHOD AND SYSTEM FOR PREDICTING SEPSIS RISK}
본 발명은 전자의무기록 시스템과의 연동을 통해 데이터 마이닝 기법으로 패혈증(Sepsis) 관련 위험을 예측하기 위한 패혈증 고위험군 예측 방법 및 시스템에 관한 것이다.
패혈증은 뚜렷한 위험증상을 나타내지 않아 조기 진단하여 치료하기 어려우며, 30% 이상의 높은 사망률을 보이는 치명적인 질환이다. 미국에서는 패혈증이 전체 사망원인 중 10위를 차지하고, 감염질환으로 동반되는 경우에는 사망원인 중 3위를 차지하고 있다. 패혈증의 발생률을 낮추기 위해 패혈증 발생 위험을 주기적으로 사정하여 조기 발견할 수 있는 예방시스템이 필요하다.
그러나 현재까지 패혈증의 위험요인이나 예방을 위한 가이드라인은 이미 많이 개발되어 있지만 고위험 사정도구는 개발되지 않은 실정이다. 그러므로 패혈증의 발생률을 낮출 수 있도록 의료인의 업무를 지원해 줄 수 있는 고위험군 예측을 위한 자동화된 컴퓨터 시스템 개발이 필요하다.
따라서 본 발명은 상기와 같은 문제점을 해결하기 위하여 창안된 것으로서 의료인들이 추가적으로 데이터를 수집하거나 가공 또는 입력할 필요 없이 현재 임상에서 기록되고 있는 전자의무기록 데이터만으로 패혈증 고위험군을 예측할 수 있는 시스템을 구축하는 기술을 제공하고자 한다.
본 발명의 일 견지에 따르면, EMR(Electronic Medical Record) 서비스 서버로부터 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청하는 과정과, 상기 요청된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정하는 과정과, 상기 EMR 서비스 서버로부터 상기 변수와 매칭되는 임상 데이터를 추출하고, 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택하는 과정과, 선택된 상기 변수에 기초하여 패혈증 발생 위험 대상에서 고위험군과 저위험군을 구분하기 위해 기설정된 평가 기준을 이용하여 예측모형이 가장 적합한 것으로 예측시스템을 구축하고자 한다.
본 발명의 다른 견지에 따르면, 제어부로부터 출력된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정하는 변수 선정부와, EMR(Electronic Medical Record) 서비스 서버와 연동되어 상기 EMR 서비스 서버로부터 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청하고, 상기 변수 선정부로부터 선정된 변수와 매칭되는 임상 데이터를 추출하는 제어부와, 상기 제어부로부터 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택하는 변수 선택부와, 상기 제어부의 제어 하에 변수 선택부로부터 선택된 상기 변수에 기초하여 예측모형 형식에 따라 훈련(Training) 및 검증(Validation) 데이터를 도출하고, 상기 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가하는 예측력 평가부를 포함함을 특징으로 한다.
본 발명의 또 다른 견지에 따르면, 패혈증 고위험군 예측을 수행하는 화면 표시 방법에 있어서, 환자별 임상적 판단을 지원하기 위한 임상 데이터 서비스 모드가 실행되면, 각종 진료 서식 생성을 위한 정보 제공 입력 페이지를 표시하는 과정과, 상기 임상 데이터 서비스 모드로 전환되어 복수의 분할된 영역을 갖는 정보 제공 입력 페이지에서 상기 분할된 소정 영역에 패혈증 고위험 유무를 표시하는 과정과, 상기 고위험 유무가 표시된 영역에 사용자 인터럽트가 발생되는 경우 해당 패혈증 발생에 관한 상세정보 페이지로 링크되어 상기 정보 제공 입력 페이지로부터 전환되거나 상기 정보 제공 입력 페이지 내에 상기 상세정보 페이지를 표시하는 과정을 포함함을 특징으로 한다.
본 발명은 패혈증 고위험군을 예측할 수 있어 패혈증 관련 위험 판단에 소요되는 인적/물적 자원을 절약하고, 사용자 간의 변이를 줄임으로써 위험 예측의 일관성 및 정확성을 높일 뿐만 아니라 위험 발생 예측을 보다 적극적으로 판단하여 환자의 패혈증 관련 발생 빈도를 최소화함으로써 의료 서비스의 질적 향상에 기여하는 효과가 있다.
도 1은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 관한 전체 흐름도.
도 2는 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 있어서 변수 선택에 대한 상세 흐름도.
도 3은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 있어서 변수 선택 결과에 대한 테이블.
도 4는 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법이 적용된 ROC 곡선.
도 5는 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 있어서 예측값 산출 공식에 대한 테이블.
도 6은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 있어서 훈련용 및 검증용 데이터에 관한 ROC 곡선.
도 7은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 있어서 Calibration 곡선.
도 8은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 시스템에 관한 구성도.
도 9는 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측을 수행하는 화면 표시 방법에 관한 전체 흐름도.
도 10은 본 발명의 또 다른 실시 예에 따른 패혈증 고위험군 예측모형 화면 디스플레이 방법이 적용된 화면 예시도.
도 11은 본 발명의 일 실시 예에 따른 패혈증 관련 위험군 레벨 분류 기준 테이블.
도 12는 본 발명의 일 실시 예에 따른 패혈증 관련 예측 방법에 있어서 변수 선택 결과에 대한 도 3의 테이블에서 변수별 값, 설명이 추가된 테이블.
이하 본 발명에 따른 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 하기 설명에서는 구체적인 구성 소자 등과 같은 특정 사항들이 나타나고 있는데 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐 이러한 특정 사항들이 본 발명의 범위 내에서 소정의 변형이나 혹은 변경이 이루어질 수 있음은 이 기술 분야에서 통상의 지식을 가진 자에게는 자명하다 할 것이다.
본 발명은 전자의무기록 시스템과의 연동을 통해 패혈증 관련 위험을 예측하기 위한 것으로, 보다 상세하게는 데이터 마이닝(Data mining) 및 로지스틱 회귀분석(Logistic regression)을 통해 EMR 서비스 서버의 임상 데이터 기반 패혈증 관련 발생 위험이 높은 고위험군 예측모델을 개발하고자 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정하고, 상기 변수와 매칭되는 임상 데이터를 추출하여 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택하고 이에 기초하여 예측모형에 대한 예측력을 평가함으로써 패혈증 관련 위험 판단에 소요되는 인적/물적 자원을 절약하고, 사용자 간의 변이를 줄임으로써 위험 예측의 일관성 및 정확성을 높일 뿐만 아니라 위험 발생 예측을 보다 적극적으로 판단하여 환자의 패혈증 관련 발생 빈도를 최소화함으로써 의료 서비스의 질적 향상에 기여하는 기술을 제공하고자 한다.
이하, 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 관해 도 1을 참조하여 자세히 살펴보기로 한다.
도 1은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 관한 전체 흐름도이다.
도 1을 참조하면, 먼저 110 과정에서 EMR(Electronic Medical Record) 서비스 서버로부터 환자별 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청한다.
본 발명에서는 패혈증 발생의 위험 예측을 수행하기 위하여 환자의 임상 데이터를 활용할 수 있다.
이를 위하여, 상기 EMR 서비스 서버는 환자별 임상 데이터를 저장/통합관리하는 수단을 의미할 수 있다.
112 과정에서는 상기 요청된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정한다.
이때, 상기 패혈증 발생의 위험 요인이 되는 변수는, 데이터 마이닝(Data mining) 및 로지스틱 회귀분석(Logistic regression)을 포함하는 방법을 통해 패혈증 고위험군 예측모형이 수행된다.
상기 데이터 마이닝은 전문적 지식과 고급분석 기법을 이용하여 대용량 데이터(Large volume of data)내에 존재하는 숨겨진(Hidden) 관계(Association), 규칙(Rule), 패턴(Pattern) 등을 찾아내어 모형화(Modeling)함으로써 유용한 정보(Valuable information)를 추출하여 지식(Knowledge)을 형성하도록 도와주는 일련의 반복과정이다.
상기 로지스틱 회귀모형은 목표변수가 더미(Dummy) 값인 0과 1 두 개의 값을 가지는 이항형 반응에 대한 통계적 모형 중 하나이다. 로지스틱 회귀모형의 목적은 흔히 추정된 로짓모형을 이용하여 자료를 분류하기 위한 것이기 때문에 일반적인 판별분석과 비교하여 로지스틱 판별분석(Logistic discrimination)이라고도 불린다.
로지스틱 회귀분석의 장점 중 하나는 선형회귀분석의 회귀계수와 같이 설명변수에 미치는 영향력을 측정할 수 있다는 것이다. 선형회귀분석에서는 각 설명변수의 회귀계수
Figure pat00001
가 영향력을 측정하는 도구임에 비해 로지스틱 회귀분석에서는 오즈비(Odds ratio)로 계량화할 수 있다. 즉, 다른 모든 설명변수가 일정한 상태에서
Figure pat00002
가 1단위 증가하는데 따른 오즈비는 다음과 같이 계산된다.
Figure pat00003
여기서 오즈비가 1보다 작다(
Figure pat00004
가 음의 값)면 설명변수
Figure pat00005
가 감소방향으로 영향을 미침을 의미하고 반대로 오즈비가 1보다 크다(
Figure pat00006
가 양의 값)면 증가방향으로 영향을 미침을 의미한다.
또한, α= Y축에서 절편(Intercept)을 의미한다.
더욱 상세하게는, y=αχ + β 일 때, α는 이른바 절편으로 χ값의 변화되는 수에 따라, y값이 변화하는 정도를 나타내는 수를 의미하는 것으로, 급격하게 변화하느냐, 혹은 완만하게 변화하느냐를 나타내는 척도의 값이다.
그리고 상기 변수 선정은 의학문헌 검색 시스템인 MEDLINE 데이터베이스에서 패혈증 관련 논문을 검색하여 1차적으로 타이틀(Title) 및 요약(Abstract) 리뷰 후 2차적으로 풀 텍스트(Full text) 리뷰하여 위험요인을 추출한 결과를 근거로 EMR 시스템에서 4600개 항목을 추출하였다.
이러한 과정을 통해 추출된 개념들을 이용하여 패혈증 발생의 위험 요인이 되는 변수와 각 변수의 범주(분류 수준, Value)를 규명할 수 있다.
이어, 상기 변수에 대응되는 임상 데이터를 확인하는 동작으로 114 과정에서는 상기 EMR 서비스 서버로부터 상기 변수와 매칭되는 임상 데이터를 추출한다.
여기서, 상기 변수와 임상 데이터를 매칭하는 작업에 대한 접근은 구조화된 EMR 시스템의 임상 데이터 항목을 검토한다. 예를 들어, 간호사의 임상관찰 기록은 '중환자실 간호기록지'와 같은 구조화된 입력 화면과 '간호일지'와 같은 비구조화된 입력 화면을 통해 중복적으로 이루어지고 있으므로, 임상 데이터의 활용성이 유연하다고 판단되는 구조화된 EMR 시스템 화면의 데이터 항목을 우선적으로 고려한다.
또한, 상기 변수와 매칭되는 임상 데이터를 추출하는 과정이 필요하다.
이를 위하여, 패혈증 대상 환자를 선정하고 각 대상 환자의 임상 데이터를 추출한다. 상기 대상 환자는 활력 징후, 환자 상태 등 임상 관찰 내용을 참조하여 선정할 수 있으며, 패혈증 위험 발생 여부에 따라 발생군과 비발생군으로 분류할 수 있다.
계속해서, 116 과정에서는 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택한다.
이러한 116 과정의 동작을 거쳐 선택된 변수는 도 3에 도시된 테이블과 같이 정리할 수 있다.
도 3에 도시된 바와 같이, 상기 선택된 패혈증 발생 변수로는 나이, 병원재원기간, 맥박 최대값, 호흡 최대값, 이완기 혈압 최소값, 체온 최대값, 응급실 경유 유무를 포함한다.
더불어, 도 12의 테이블에서는 선택된 패혈증 발생 변수별 값, 설명 1 및 설명 2를 추가하였다.
또한, 상기 패혈증 발생 변수를 선택하는 상세과정을 도 2를 참고하여 설명하면, EMR 시스템에서 추출된 데이터를 대상으로 잠재적 위험 요인 변수는, 210 과정에서 IV(Information Value) 산출을 통해 기설정된 기준에 대응하는 독립변수를 선정한다.
상기 IV는 각 독립변수가 가지는 설명력을 측정하는 지표 중 하나이다. 상기 IV가 0.1 이상인 변수만을 선택하였다.
212 과정에서는 선정된 독립변수에 대하여 단변량검정(T-test, Chi-square test)의 기설정된 유의수준 0.05에서 유의한 변수를 선택하고, 214 과정에서는 다중 로지스틱 회귀분석(Multiple logistic regression)에 의한 변수선정(Forward/Backward/Stepwise selection)에 있어서 적어도 한번 이상 선정된 변수를 선정한다.
216 과정에서는 문헌 고찰 혹은 임상 실무자의 임상적 판단을 통해 지지 되는 변수를 선정한다.
다시 도 1의 설명으로 돌아가서, 118 과정에서는 선택된 상기 변수에 기초하여 예측모형 형식에 따라 훈련(Training) 및 검증(Validation) 데이터를 도출한다.
더욱 상세하게는 본 발명에서는 최적의 예측모형을 구축하기 위해 다수의 예측모형을 구축하고, 그 중 최고의 예측모형을 선택해야 하므로 이를 위해 2가지 방법으로 평가가 수행되었다.
우선, 과적합의 문제를 해결하기 위해 데이터를 훈련용 데이터와 검증용으로 구분하고, 다수의 예측모형 중 일정한 기준을 세우고 그 기준을 가장 잘 충족하는 예측모형을 선택하였다.
이때, 본 발명에서 사용한 데이터는 총 2020건으로 이 중 70%(1414건)를 훈련용 데이터로 사용하였으며 30%(606건)를 검증용 데이터로 사용하였다.
분할 방법은 랜덤 할당하여 사용하였다.
이후, 120 과정에서는 상기 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가한다.
상기 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가하는 과정은, 예측모형의 적합성을 검증하기 위해 부트스트래핑(Bootstrapping)을 통해 산출된 슈렁큰 회귀 계수(Shrunken regression coefficients)를 적용하여, 패혈증 발생 위험 대상에서 고위험군과 저위험군을 구분하기 위해 ROC(Receiver Operating Characteristic) 곡선과 AUC 분석을 통해 판별(Discrimination)능력을 평가하는 단계와, 예측 값과 실제 관측 값이 일치하는 정도(Calibration)를 평가하는 제2 단계를 통해 수행된다.
상기 판별능력은 예측모델이 예를 들면, 패혈증 환자를 비패혈증 환자로부터 얼마나 잘 분리해 내는가를 평가하는 것이고 Calibration 능력은 예측치(Predictive probability)가 실제 결과(Real outcome)에 얼마나 근접했는가를 평가하는 방법이다.
상기 판별 능력은 Receiver Operating Characteristic(ROC) 곡선과 AUC 분석을 통해서 측정하고 임계점(Best cut-off point)을 (1-민감도)2과 (1-특이도)2의 합이 최소화되고 ROC 곡선에서 (0, 1)에 가장 가까운 지점, 혹은 Youden index가 최대인 지점에서 정확도(Accuracy), 민감도(Sensitivity), 특이도(Specificity), 양성예측치(PPV: Positive Predictive Value), 음성예측치(NPV: Negative Predictive Value)를 구하여 타당도를 평가한다.
Figure pat00007
민감도= a/(a+b)
특이도= d/(c+d)
Youden index=민감도+특이도-1
PPV=a/(a+c)
NPV=d/(b+d)
ACU=(a+d)/(a+b+c+d)
상기 ROC(Receiver Operating Characteristics) 곡선은 도 4에서와 같이 각 분류점마다 횡축(X축)에 1-특이도, 종축(Y축)에 민감도를 표시하고 이 점들을 모두 이어 표시한 그래프를 말한다. ROC 곡선은 45도 기울기로부터 멀리 떨어질수록 예측력이 우수하다고 할수 있다. 서로 다른 모형을 비교하기 위해서는 ROC 곡선의 면적을 구하고 이를 비교함으로써 얼마나 45도 기울기 선에서 떨어져 있는지를 알 수 있다.
상술한 바와 같은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 대하여 도 5 내지 도 7을 참고하여 패혈증 고위험군 예측모형 선택 결과를 예시한다.
우선, 도 5에 도시된 바와 같이, 패혈증 고위험군 예측값 산출 공식을 보인 것이다.
이와 같은 예측값 산출 공식을 기반으로 하기의 패혈증 고위험군 예측모형의 AUC 결과는 하기에서와 같다.
패혈증 고위험군 예측모형의 AUC 결과
Figure pat00008
이와 같이, 검증결과, 훈련용 데이터와 검증용 데이터의 AUC(예측력)는 각각 0.95, 0.96으로 예측력이 우수한 것으로 나타났다.
도 6은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에서 있어서 훈련용(상단) 및 검증용(하단) 데이터에 관한 ROC 곡선이고, 도 7은 Calibration 곡선이다.
이상에서는, 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 방법에 관해 살펴보았다.
이하, 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 시스템에 대해 도 8을 참조하여 자세히 살펴보기로 한다.
도 8은 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측 시스템에 관한 구성도이다.
도 8을 참조하면, 본 발명이 적용된 시스템(800)은 변수 선정부(810), 예측력 평가부(812), 제어부(814), 변수 선택부(816), 예측모형 생성부(817) 및 EMR 서비스 서버(818)을 포함한다.
상기 변수 선정부(810)은 제어부(814)로부터 출력된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정한다.
여기서, 상기 변수 선정부(810)는, 데이터 마이닝(Data mining) 및 로지스틱회귀분석(Logistic regression)을 포함하는 방법을 통해 패혈증 고위험군 예측모형을 수행하는 것으로, 상기 로지스틱회귀 분석은 하기와 같은 오즈비(Odds ratio)로 계량화된다.
Figure pat00009
상기 제어부(814)는 EMR(Electronic Medical Record) 서비스 서버(818)와 연동되어 상기 EMR 서비스 서버(818)로부터 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청하고, 상기 변수 선정부(810)로부터 선정된 변수와 매칭되는 임상 데이터를 추출한다.
상기 변수 선택부(816)는 제어부(814)로부터 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택한다.
이때, 상기 변수 선택부(816)는, 패혈증 발생 변수 선택 시, IV(Information Value) 산출을 통해 기설정된 기준에 대응하는 독립변수를 선정하고, 선정된 독립변수에 대하여 단변량검정의 기설정된 유의수준에서 유의한 변수를 선택하고, 다중 로지스틱 회귀분석(Multiple logistic regression)에 의한 변수선정에 있어서 적어도 한번 이상 선정된 변수를 선정하고, 문헌 고찰 혹은 임상 실무자의 임상적 판단을 통해 지지되는 변수를 선정하여 수행된다.
상기 예측력 평가부(812)는 제어부(814)의 제어 하에 변수 선택부(816)로부터 선택된 상기 변수에 기초하여 예측모형 형식에 따라 훈련(Training) 및 검증(Validation) 데이터를 도출하고, 상기 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가한다.
이때, 상기 예측력 평가부(812)는, 예측모형의 적합성을 검증하기 위해 부트스트래핑(Bootstrapping)을 통해 산출된 슈렁큰 회귀 계수(Shrunken regression coefficients)를 적용하여, 패혈증 발생 위험 대상에서 고위험군과 저위험군을 구분하기 위해 ROC(Receiver Operating Characteristic) 곡선과 AUC 분석을 통해 판별(Discrimination)능력을 평가하는 단계와 예측 값과 실제 관측 값이 일치하는 정도(Calibration)를 평가하는 상기 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가한다.
상기 예측모형 생성부(817)는 예측력 평가부(812)로부터 출력된 예측력 평가를 기반으로 패혈증 발생의 예측모형을 생성한다.
이하, 본 발명의 또 다른 실시 예에 따른 패혈증 고위험군 예측을 수행하는 화면 디스플레이 방법에 도 9를 참조하여 자세히 살펴보기로 한다.
도 9는 본 발명의 일 실시 예에 따른 패혈증 고위험군 예측을 수행하는 화면 디스플레이 방법에 관한 전체 흐름도이다.
도 9를 참조하면, 먼저 90 과정에서 환자별 임상적 판단을 지원하기 위한 임상 데이터 서비스 모드를 실행하여 92 과정에서 각종 진료 서식 생성을 위한 정보 제공 입력 페이지를 표시한다.
94 과정에서는 임상 데이터 서비스 모드로 전환되어 복수의 분할된 영역을 갖는 정보 제공 입력 페이지에서 상기 분할된 소정 영역에 패혈증 고위험 유무를 표시한다.
96 과정에서는 상기 고위험 유무가 표시된 영역에 사용자 인터럽트가 발생되는 경우 98 과정으로 이동하여 해당 패혈증에 관한 상세정보 페이지로 링크되어 상기 정보 제공 입력 페이지로부터 전환되거나 상기 정보 제공 입력 페이지 내에 상기 상세정보 페이지를 표시한다.
예를 들어, 도 10을 참조하면, 도 10은 본 발명의 또 다른 실시 예에 따른 패혈증 고위험군 예측모형 화면 디스플레이 방법이 적용된 화면 예시도로서, 도 10에 도시된 바와 같이, 정보 제공 입력 페이지(20)에서 위험군(혹은 패혈증 위험군) 표시 아이콘(21)의 색이 기설정된 색으로 표시되는 경우 이를 클릭하면 패혈증 고위험 유무를 확인 가능한 페이지를 표시한다.
즉, 상기 위험군(혹은 패혈증 위험군) 표시 아이콘(21) 클릭을 통해 환자별 패혈증 위험군 예측 판단을 지원하기 위한 패혈증 위험군 알람 서비스 모드가 실행되면, 상기 모드에 따라 해당 환자의 패혈증 위험군 레벨을 EMR 서비스 서버를 통해 기설정된 입원 기간별 패혈증 확진 여부를 확인하여 가이드한다.
이때, 상기 위험군 레벨은 도 11에 도시된 테이블과 같이, 고위험군, 중위험군, 저위험군으로 분류되고, 각 위험군 레벨은 테이블에 각각 기재된 바와 같다.
여기서, 상기 고위험군에 해당하는 예측값은 상술한 예측모형에 대한 예측력을 평가하는 동작에서 출력되는 예측 값을 의미하는 것으로, 이 외 EMR 서비스 서버를 통해 EMR 서비스 서버에 기저장된 해당 환자의 이번 입원에서 패혈증으로 확진된 환자 혹은 이전 입원에서 패혈증으로 확진된 환자에 해당하는 경우 패혈증 고위험군 환자로 분류된다.
상기와 같이 본 발명에 따른 패혈증 고위험군 예측 방법 및 시스템에 관한 동작이 이루어질 수 있으며, 한편 상기한 본 발명의 설명에서는 구체적인 실시 예에 관해 설명하였으나 여러 가지 변형이 본 발명의 범위를 벗어나지 않고 실시될 수 있다. 따라서 본 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 청구범위와 청구범위의 균등한 것에 의하여 정하여져야 할 것이다.
810: 변수 선정부 812: 예측력 평가부
814: 제어부 816: 변수 선택부
817: 예측모형 생성부 818: EMR 서비스 서버

Claims (13)

  1. 패혈증 고위험군을 예측 방법에 있어서,
    EMR(Electronic Medical Record) 서비스 서버로부터 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청하는 과정과,
    상기 요청된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정하는 과정과,
    상기 EMR 서비스 서버로부터 상기 변수와 매칭되는 임상 데이터를 추출하고, 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택하는 과정과,
    선택된 상기 변수에 기초하여 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형 형식에 따라 훈련(Training) 및 검증(Validation) 데이터를 도출하고, 상기 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가하는 과정을 포함함을 특징으로 하는 패혈증 고위험군 예측 방법.
  2. 제1항에 있어서,
    상기 패혈증 발생의 위험 요인이 되는 변수는, 데이터 마이닝(Data mining) 및 로지스틱회귀 분석(Logistic regression)을 포함하는 방법을 통해 패혈증 고위험군 예측이 수행됨을 특징으로 하는 패혈증 고위험군 예측 방법.
  3. 제2항에 있어서,
    상기 로지스틱회귀 분석은 하기와 같은 오즈비(Odds ratio)로 계량화됨을 특징으로 하는 패혈증 고위험군 예측 방법.
    Figure pat00010
  4. 제1항에 있어서,
    상기 패혈증 발생 변수를 선택하는 과정은,
    IV(Information Value) 산출을 통해 상기 IV가 0.1 이상에 대응하는 독립변수를 선정하는 단계와,
    선정된 독립변수에 대하여 단변량검정의 기설정된 0.05 유의수준에서 유의한 변수를 선택하는 단계와,
    다중 로지스틱 회귀분석(Multiple logistic regression)에 의한 변수선정에 있어서 적어도 한번 이상 선정된 변수를 선정하는 단계와,
    문헌 고찰 혹은 임상 실무자의 임상적 판단을 통해 지지되는 변수를 선정하는 단계를 포함함을 특징으로 하는 패혈증 고위험군 예측 방법.
  5. 제1항에 있어서,
    상기 예측모형에 대한 예측력을 평가하는 과정은,
    예측모형의 적합성을 검증하기 위해 부트스트래핑(Bootstrapping)을 통해 산출된 슈렁큰 회귀 계수(Shrunken regression coefficients)를 적용하여, 패혈증 발생 위험 대상에서 고위험군과 저위험군을 구분하기 위해 ROC(Receiver Operating Characteristic) 곡선과 AUC 분석을 통해 판별(Discrimination) 능력을 평가하는 단계와,
    예측 값과 실제 관측 값이 일치하는 정도(Calibration)를 평가하는 제2 단계를 통해 수행됨을 특징으로 하는 패혈증 고위험군 예측 방법.
  6. 제1항에 있어서,
    상기 선택된 패혈증 발생 변수는,
    나이, 병원재원기간, 맥박 최대값, 호흡 최대값, 이완기 혈압 최소값, 체온 최대값, 응급실 경유 유무를 포함함을 특징으로 하는 패혈증 고위험군 예측 방법.
  7. 제어부로부터 출력된 임상 데이터 중 패혈증 관련 활용 가능한 데이터를 선별하기 위한 패혈증 발생의 위험 요인이 되는 변수를 선정하는 변수 선정부와,
    EMR(Electronic Medical Record) 서비스 서버와 연동되어 상기 EMR 서비스 서버로부터 임상적 판단을 지원하기 위한 임상 데이터 서비스를 요청하고, 상기 변수 선정부로부터 선정된 변수와 매칭되는 임상 데이터를 추출하는 제어부와,
    상기 제어부로부터 추출된 상기 임상 데이터 기반 각 변수의 범주별 패혈증 발생 변수를 선택하는 변수 선택부와,
    상기 제어부의 제어 하에 변수 선택부로부터 선택된 상기 변수에 기초하여 예측모형 형식에 따라 훈련(Training) 및 검증(Validation) 데이터를 도출하고, 상기 도출된 데이터에 대하여 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가하는 예측력 평가부를 포함함을 특징으로 하는 패혈증 고위험군 예측 시스템.
  8. 제7항에 있어서, 상기 변수 선정부는,
    데이터 마이닝(Data mining) 및 로지스틱 회귀분석(Logistic regression)을 포함하는 방법을 통해 패혈증 고위험군 예측을 수행함을 특징으로 하는 패혈증 고위험군 예측모형 시스템.
  9. 제8항에 있어서,
    상기 로지스틱회귀 분석은 하기와 같은 오즈비(Odds ratio)로 계량화됨을 특징으로 하는 패혈증 고위험군 예측 시스템.
    Figure pat00011
  10. 제7항에 있어서, 상기 변수 선택부는,
    상기 패혈증 발생 변수 선택 시,
    IV(Information Value) 산출을 통해 기설정된 기준에 대응하는 독립변수를 선정하고, 선정된 독립변수에 대하여 단변량검정의 기설정된 유의수준에서 유의한 변수를 선택하고, 다중 로지스틱 회귀분석(Multiple logistic regression)에 의한 변수선정에 있어서 적어도 한번 이상 선정된 변수를 선정하고, 문헌 고찰 혹은 임상 실무자의 임상적 판단을 통해 지지되는 변수를 선정하여 수행됨을 특징으로 하는 패혈증 고위험군 예측 시스템.
  11. 제7항에 있어서, 상기 예측력 평가부는,
    예측모형의 적합성을 검증하기 위해 부트스트래핑(Bootstrapping)을 통해 산출된 슈렁큰 회귀 계수(Shrunken regression coefficients)를 적용하여,
    패혈증 발생 위험 대상에서 고위험군과 저위험군을 구분하기 위해 ROC(Receiver Operating Characteristic)곡선과 AUC 분석을 통해 판별(Discrimination)능력을 평가하고,
    예측 값과 실제 관측 값이 일치하는 정도(Calibration)를 평가하여 상기 기설정된 평가 기준을 이용하여 예측모형에 대한 예측력을 평가함을 특징으로 하는 패혈증 고위험군 예측 시스템.
  12. 패혈증 고위험군 예측을 수행하는 화면 표시 방법에 있어서,
    환자별 임상적 판단을 지원하기 위한 임상 데이터 서비스 모드가 실행되면, 각종 진료 서식 생성을 위한 정보 제공 입력 페이지를 표시하는 과정과,
    상기 임상 데이터 서비스 모드로 전환되어 복수의 분할된 영역을 갖는 정보 제공 입력 페이지에서 상기 분할된 소정 영역에 패혈증 고위험 유무를 표시하는 과정과,
    상기 고위험 유무가 표시된 영역에 사용자 인터럽트가 발생되는 경우 해당 패혈증 발생에 관한 상세정보 페이지로 링크되어 상기 정보 제공 입력 페이지로부터 전환되거나 상기 정보 제공 입력 페이지 내에 상기 상세정보 페이지를 표시하는 과정을 포함함을 특징으로 하는 패혈증 고위험군 예측을 수행하는 화면 표시 방법.
  13. 제7항에 있어서,
    상기 예측력 평가부로부터 출력된 예측력 평가를 기반으로 최적의 예측모형을 생성하는 예측모형 생성부를 더 포함함을 특징으로 하는 패혈증 고위험군 예측 표시 방법.
KR1020140067012A 2013-05-31 2014-06-02 패혈증 고위험군 예측 방법 및 시스템 KR101595784B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20130062322 2013-05-31
KR1020130062322 2013-05-31

Publications (2)

Publication Number Publication Date
KR20140141534A true KR20140141534A (ko) 2014-12-10
KR101595784B1 KR101595784B1 (ko) 2016-02-26

Family

ID=52458963

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140067012A KR101595784B1 (ko) 2013-05-31 2014-06-02 패혈증 고위험군 예측 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101595784B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101886374B1 (ko) * 2017-08-16 2018-08-07 재단법인 아산사회복지재단 딥러닝 기반의 패혈증 조기 감지방법 및 프로그램
CN112447289A (zh) * 2019-08-30 2021-03-05 希尔-罗姆服务公司 败血症监测系统
CN113113143A (zh) * 2021-04-12 2021-07-13 重庆大学 一种考虑延迟强化核磁影像的心肌梗死危险程度评估系统
KR200495575Y1 (ko) 2021-09-13 2022-06-29 윤수희 굴절이 자유로운 분사헤드를 구비한 샤워기

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008522604A (ja) * 2004-12-09 2008-07-03 イギリス国 敗血症の早期検出
JP2009539416A (ja) * 2005-07-18 2009-11-19 インテグラリス エルティーディー. 潜在的に生命を脅かす病気の発症を予想するための装置、方法並びにコンピュータ可読コード
KR20140044773A (ko) 2011-01-11 2014-04-15 미쓰비시 가가쿠 메디엔스 가부시키가이샤 패혈증 예후의 예측 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008522604A (ja) * 2004-12-09 2008-07-03 イギリス国 敗血症の早期検出
JP2009539416A (ja) * 2005-07-18 2009-11-19 インテグラリス エルティーディー. 潜在的に生命を脅かす病気の発症を予想するための装置、方法並びにコンピュータ可読コード
KR20140044773A (ko) 2011-01-11 2014-04-15 미쓰비시 가가쿠 메디엔스 가부시키가이샤 패혈증 예후의 예측 방법

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101886374B1 (ko) * 2017-08-16 2018-08-07 재단법인 아산사회복지재단 딥러닝 기반의 패혈증 조기 감지방법 및 프로그램
WO2019035639A1 (ko) * 2017-08-16 2019-02-21 재단법인 아산사회복지재단 딥러닝 기반의 패혈증 조기 감지방법 및 프로그램
CN112447289A (zh) * 2019-08-30 2021-03-05 希尔-罗姆服务公司 败血症监测系统
CN113113143A (zh) * 2021-04-12 2021-07-13 重庆大学 一种考虑延迟强化核磁影像的心肌梗死危险程度评估系统
CN113113143B (zh) * 2021-04-12 2024-03-01 重庆大学 一种考虑延迟强化核磁影像的心肌梗死危险程度评估系统
KR200495575Y1 (ko) 2021-09-13 2022-06-29 윤수희 굴절이 자유로운 분사헤드를 구비한 샤워기

Also Published As

Publication number Publication date
KR101595784B1 (ko) 2016-02-26

Similar Documents

Publication Publication Date Title
dos Santos et al. Data mining and machine learning techniques applied to public health problems: A bibliometric analysis from 2009 to 2018
Liu et al. Comparison of early warning scoring systems for hospitalized patients with and without infection at risk for in-hospital mortality and transfer to the intensive care unit
US20190108912A1 (en) Methods for predicting or detecting disease
JP6127160B2 (ja) 個人化ヘルスケアシステム及び方法
CN106068509B (zh) 一种用于创建患者发现的纵视图的系统和方法
KR101611838B1 (ko) 환자안전 관련 고위험군 예측 방법 및 시스템
Myers et al. Predicting intracranial pressure and brain tissue oxygen crises in patients with severe traumatic brain injury
Kramer et al. Comparison of the mortality probability admission model III, national quality forum, and acute physiology and chronic health evaluation IV hospital mortality models: implications for national benchmarking
US20180342328A1 (en) Medical data pattern discovery
US10372786B2 (en) State inference in a heterogeneous system
JP2008532104A (ja) 複数の医療関連アウトカムの予測を行い、インターベンション計画の評価を行い、更に同時にバイオマーカー因果性検証を行うことのできる、予測モデルを生成して適用する方法、そのシステム、及びそのコンピュータ・プログラム製品
US20140136225A1 (en) Discharge readiness index
CN109155152B (zh) 临床报告检索和/或比较
US20210035688A1 (en) Medical information processing apparatus, medical information processing method, and electronic medical record system
KR101595784B1 (ko) 패혈증 고위험군 예측 방법 및 시스템
CN109427420A (zh) 诊断有效性工具
JP2017504846A (ja) ヒト臨床遺伝学のための病原性スコアリングシステム
US20180032674A1 (en) Diagnostic system, diagnostic method, and storage medium
Farrow et al. Interpretation and reporting of predictive or diagnostic machine-learning research in Trauma & Orthopaedics
WO2016006042A1 (ja) データ分析装置、データ分析装置の制御方法、およびデータ分析装置の制御プログラム
Mandal Machine learning algorithms for the creation of clinical healthcare enterprise systems
Valko et al. Feature importance analysis for patient management decisions
Silan et al. Quantifying frailty in older people at an Italian local health unit: a proposal based on partially ordered sets
JP2012194741A (ja) 行列形データの欠損値予測装置、欠損値予測計算方法および欠損値予測プログラム
JP2019003408A (ja) ハイパーパラメータの評価方法、計算機及びプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
FPAY Annual fee payment

Payment date: 20190213

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20200204

Year of fee payment: 5