KR102643686B1 - 증상 재구성을 통한 환자의 질병 진단 시스템 - Google Patents

증상 재구성을 통한 환자의 질병 진단 시스템 Download PDF

Info

Publication number
KR102643686B1
KR102643686B1 KR1020230139926A KR20230139926A KR102643686B1 KR 102643686 B1 KR102643686 B1 KR 102643686B1 KR 1020230139926 A KR1020230139926 A KR 1020230139926A KR 20230139926 A KR20230139926 A KR 20230139926A KR 102643686 B1 KR102643686 B1 KR 102643686B1
Authority
KR
South Korea
Prior art keywords
symptom
disease
reconstruction
similarity
patient
Prior art date
Application number
KR1020230139926A
Other languages
English (en)
Inventor
이정설
Original Assignee
주식회사 쓰리빌리언
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 쓰리빌리언 filed Critical 주식회사 쓰리빌리언
Priority to KR1020230139926A priority Critical patent/KR102643686B1/ko
Application granted granted Critical
Publication of KR102643686B1 publication Critical patent/KR102643686B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

본 발명은 질병의 알려진 증상 집합을 수집하는 질병-증상 수집부; 상기 질병의 증상 집합을 기 설정된 동일 집단으로 분류하여 증상 재구성 집합을 생성하는 증상 재구성부; 및 환자의 증상과 모든 질병에 대한 증상 재구성 집합을 비교하여 증상 유사도를 측정하는 증상 유사도 측정부를 포함하는 증상 재구성을 통한 환자의 질병 진단 시스템을 제공한다.

Description

증상 재구성을 통한 환자의 질병 진단 시스템{SYSTEM FOR DIAGNOSING PATIENT'S DISEASE THROUGH SYMPTOM RECONSTRUCTION}
본 발명은 환자의 증상과 알려진 질병과의 증상 유사도를 이용해서 환자의 질병을 진단하는 환자의 질병 진단 시스템에 관한 것으로, 보다 상세하게는 증상 재구성을 통해서 환자의 질병을 진단하는 환자의 질병 진단 시스템에 관한 것이다.
환자의 증상과 알려진 질병과의 증상 유사도는 환자의 질병을 진단하는 가장 중요한 정보이다. 이미 진단을 받은 환자가 아닌, 아직 진단을 받지 못한 환자의 경우 알려진 모든 질병에 대하여 해당 질병의 알려진 증상과 환자의 증상이 얼마나 유사한지에 대한 증상 유사도를 측정 후 증상 유사도가 높은 질병부터 확인하는 것이 일반적인 절차이다.
질병 유사도를 측정하기 위해서는 환자의 증상과 질병의 증상 간 유사도를 측정하게 되는데, 질병의 증상은 동일 질병을 겪는 환자 간에 차이가 있을 수 있다.
또한, 유전병인 경우 동일한 유전적 결함을 갖고 있는 한 가족 구성원 내에서는 구성원 간의 증상은 유사할 수 있다. 그러나 독립적인 다른 가족이 같은 유전병이라 하더라도 두 가족 간의 증상은 다를 수 있다. 또한, 질병의 증상 정보를 구성함에 있어 근거가 되는 문헌 보고에 사용된 집단에 따라 증상이 상이할 수 있다. 이는 OMIM(Online Mendelian Inheritance in Man)에 등록된 질병 중 300여개 이상의 질병에서 명시적으로 동일 질병의 개체 간 임상적 차이가 있음을 언급하는 것에서도 알 수 있다.
도 1은 OMIM의 질병 ID 620158에 대한 증상 정보를 나타내는 도면이다.
도 1을 참조하면, 증상 정보는 해당 증상이 모두 한 개인에서 나타난 것인지, 아니면 한 가족 구성원에서 나타난 것인지에 대한 구분이 없다. 일례로 해당 질병의 OMIM 정보를 살펴보면 열거된 증상 중 연하곤란(dysphagia, 음식물 삼키기 장애)은 해당 질병의 환자 중 47 세 남성에게서만 보고된 증상이다. 또한 기억 장애(Memory impairment)는 해당 질병으로 진단받은 환자 중 58세 여성에게서는 보고되지 않은 증상이다. 반면 해당 질병으로 진단받은 6세 여야에서는 해당 질병으로 진단받은 환자에게서는 보고되지 않은 증상인 보행 장애, 언어 능력 소실, 간질이 보고되었다.
살펴본 바와 같이, 동일 질병이라 하더라도 개체 간 발현되는 증상이 차이가 있을 수 있다.
종래 기술에 따른 환자의 증상과 질병에 포함되어 있는 증상 간의 유사도를 측정하는 방법은 잘못된 증상 유사도를 도출하여 환자의 질병에 대한 오진을 유발하는 문제가 있다.
한국공개특허 제10-2022-0138327호 (공개일자, 2022.10.12)
삭제
본 발명이 이루고자 하는 기술적 과제는 환자의 증상과 질병에 포함되어 있는 증상 간의 증상 유사도 측정의 정확도를 향상시킬 수 있는 환자의 질병 진단 시스템을 제공하고자 한다.
이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 증상 재구성을 통한 환자의 질병 진단 시스템은 질병의 알려진 증상 집합을 수집하는 질병-증상 수집부; 상기 질병의 증상 집합을 기 설정된 동일 집단으로 분류하여 증상 재구성 집합을 생성하는 증상 재구성부; 및 환자의 증상과 모든 질병에 대한 증상 재구성 집합을 비교하여 증상 유사도를 측정하는 증상 유사도 측정부를 포함한다.
상기 증상 재구성부는 하기 식 1을 만족하도록 상기 증상 재구성 집합을 생성할 수 있다.
[식 1]
Figure 112023114556450-pat00001
여기서, S는 해당 질병에 대한 모든 알려진 증상의 집합이고,
Figure 112023114556450-pat00002
는 S를 재구성한 증상 재구성 집합임
상기 증상 재구성 집합(
Figure 112023114556450-pat00003
)에 속해 있는 모든 증상은 해당 질병으로 진단된 단일 집단(G) 내에서 모두 속해야 하고, 모든 증상 재구성 집합(
Figure 112023114556450-pat00004
)은 3개 이상의 증상으로 구성될 수 있다.
상기 증상 재구성 집합()에 포함되어 있는 3개 이상의 증상들은 HPO의 계층 관계에서 서로 상하 관계가 아닐 수 있다.
상기 동일 집단의 기준은 개인, 일란성 쌍둥이, 형제자매(sibling), 단일 가계, 문헌에 보고된 단일 집단, 유전적 구성이 유사한 인종 집단 중 어느 하나일 수 있다.
상기 증상 재구성 집합에 대한 상기 증상 유사도를 이용해서 환자의 질병을 판별하는 질병 판별부를 더 포함할 수 있다.
상기 질병 판별부는 질병에 대한 증상 재구성 집합 중에서 상기 증상 유사도가 가장 높은 것을 상기 질병에 대한 대표 증상 유사도로 선별하고, 각각의 질병에 대한 대표 증상 유사도에 따라 랭킹을 부여할 수 있다.
상기 질병 판별부는 상기 증상 유사도가 가장 높은 최대 증상 유사도를 선별하고, 상기 최대 증상 유사도를 가진 상기 증상 재구성 집합이 속한 질병을 환자의 질병으로 판별할 수 있다.
위에서 언급된 본 발명의 기술적 과제 외에도, 본 발명의 다른 특징 및 이점들이 이하에서 기술되거나, 그러한 기술 및 설명으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
이상과 같은 본 발명에 따르면 다음과 같은 효과가 있다.
본 발명은 질병의 증상 집합을 동일 집단으로 분류하여 증상 재구성 집합을 생성한 후, 증상 재구성 집합과 환자의 증상 간에 증상 유사도를 측정함으로써 질병의 증상 정보와 환자의 증상 간에 증상 유사도를 측정하는 종래 기술보다 증상 유사도의 정확성을 향상시킬 수 있다.
이 밖에도, 본 발명의 실시 예들을 통해 본 발명의 또 다른 특징 및 이점들이 새롭게 파악될 수도 있을 것이다.
도 1은 OMIM의 질병 ID 620158에 대한 증상 정보를 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른 증상 재구성을 통한 환자의 질병 진단 시스템의 개략적인 구성도이다.
도 3은 본 발명의 일 실시예에 따른 증상 재구성을 통한 환자의 질병 진단 시스템이 수행하는 것을 설명하기 위한 개략적인 예시도이다.
도 4는 본 발명에 따른 질병 판별부가 질병을 판별하는 것을 수행하는 것을 설명하기 위한 예시도이다.
도 5는 본 발명에 따른 질병 판별부가 질병을 판별하는 것을 수행하는 것을 설명하기 위한 다른 예시도이다.
도 6은 본 발명에 따른 증상 유사도 측정에 따라 최대 유사도가 나온 집단 형태의 비율을 나타낸 도면이다.
본 명세서에서 각 도면의 구성요소들에 참조번호를 부가함에 있어서 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 번호를 가지도록 하고 있음에 유의하여야 한다.
한편, 본 명세서에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 정의하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 한다.
"포함하다" 또는 "가지다" 등의 용어는 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, 첨부되는 도면을 참고하여 상기 문제점을 해결하기 위해 고안된 본 발명의 바람직한 실시예들에 대해 상세히 설명한다.
도 2는 본 발명의 일 실시예에 따른 증상 재구성을 통한 환자의 질병 진단 시스템의 개략적인 구성도이고, 도 3은 본 발명의 일 실시예에 따른 증상 재구성을 통한 환자의 질병 진단 시스템이 수행하는 것을 설명하기 위한 개략적인 예시도이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 증상 재구성을 통한 환자의 질병 진단 시스템(1000)은 질병-증상 수집부(100), 증상 재구성부(200), 증상 유사도 측정부(300), 및 질병 판별부(400)를 포함한다.
질병-증상 수집부(100)는 질병의 알려진 증상 집합을 수집할 수 있다.
질병-증상 수집부(100)는 OMIM(Online Mendelian Inheritance in Man), DO(Disease Ontology), HPO(Human Phenotype Ontology) 등 질병에 대한 알려진 증상을 정리하여 저장한 데이터베이스(2000)로부터 질병에 대한 증상 집합을 수집할 수 있다.
OMIM은 인간의 유전질환 및 유전자에 대해서 지속적으로 업데이트되는 데이터베이스이다. OMIM에는 특정 질병에 연결된 유전자, 질병의 임상적 특성, 관련된 연구 참조 등의 정보가 포함되어 있다.
DO는 인간의 질병에 대한 계층적이고 표준화된 온톨로지(정보의 분류 및 구조화)를 제공한다. DO를 사용하면 복잡한 질병 분류 체계와 연관된 정보를 정리하고, 다른 데이터베이스와 통합할 수 있다.
HPO는 인간의 현상학적 비정상에 대한 표준화된 온톨로지를 제공한다. 이는 유전적 질환의 임상적 특성을 설명하기 위한 표준 언어를 제공하여, 유전적 질환의 진단과 연구에 사용될 수 있다. HPO는 질병에 대한 특정 증상이나 현상을 구조화하고, 서로 관련된 증상 간의 관계를 나타내는 계층적 구조를 사용한다.
증상 재구성부(200)는 질병의 증상 집합을 기 설정된 동일 집단으로 분류하여 증상 재구성 집합을 생성할 수 있다.
증상 재구성부(200)는 하기 식 1을 만족하도록 증상 재구성 집합을 생성하는데, 여기서 S는 해당 질병에 대한 모든 알려진 증상의 집합이고, 는 S를 재구성한 증상 재구성 집합이다.
[식 1]
Figure 112023114556450-pat00007
이때, 증상 재구성 집합()에 속해 있는 모든 증상은 해당 질병으로 진단된 단일 집단(G) 내에서 모두 속해야 하고, 모든 증상 재구성 집합()은 3개 이상의 증상으로 구성될 수 있다. 여기서, 증상 재구성 집합()에 포함되어 있는 3개 이상의 증상들은 HPO의 계층 관계에서 서로 상하 관계가 아닐 수 있다.
증상 재구성부(200)는 질병의 증상 정보를 구성함에 있어 해당 질병의 알려진 증상들에 대하여 동일 집단 내에서 동시에 관측된 증상들의 집합으로 재구성할 수 있다.
실제 예를 살펴보면 하기 표 1과 같다. 이때, '동일 집단'의 기준으로는 개인, 일란성 쌍둥이, 형제자매 (sibling), 단일 가계, 문헌에 보고된 단일 집단, 유전적 구성이 유사한 인종 집단 등이 될 수 있다. 본 발명에서는 일 실시예로 '동일 집단'중 개인, 가계, 문헌에 보고된 단일 집단, 만을 예시로 들고 있으나, 이 세 개의 '동일 집단' 기준에만 국한되지는 않는다.
질병 인식자 집단형태 집단인식자 증상1 증상2 증상3 증상4 증상5
620481 ALL   HP:0001876 HP:0005528 HP:0000132 HP:0001915 HP:0001873
620481 FAMILY 1 HP:0001876 HP:0005528 HP:0000132 HP:0001915 HP:0001873
620481 FAMILY 2 HP:0005528 HP:0002719 HP:0001876 HP:0001875 HP:0001873
620481 FAMILY 3 HP:0004859 HP:0001875 HP:0000978 HP:0001873  
620481 GROUP 1 HP:0001876 HP:0005528 HP:0001873 HP:0005548  
620481 INDIVIDUAL 1 HP:0001876 HP:0000132 HP:0005528    
620481 INDIVIDUAL 2 HP:0004859 HP:0001875 HP:0000978 HP:0001873  
620482 ALL   HP:0001300 HP:0001249 HP:0100660 HP:0001263 HP:0100543
620482 GROUP 1 HP:0001300 HP:0001249 HP:0100660 HP:0001263 HP:0100543
620483 ALL   HP:0001249 HP:0000639 HP:0000992 HP:0001510 HP:0010562
620483 GROUP 1 HP:0001249 HP:0000639 HP:0000992 HP:0001510  
620483 INDIVIDUAL 1 HP:0010562 HP:0100699      
620483 INDIVIDUAL 2 HP:0008066 HP:0001271 HP:0007906 HP:0000545 HP:0000794
620483 INDIVIDUAL 3 HP:0001249 HP:0012412 HP:0001250    
620483 INDIVIDUAL 4 HP:0004209 HP:0001056 HP:0100699 HP:0008066 HP:0001156
620483 INDIVIDUAL 5 HP:0000953 HP:0011096 HP:0010049 HP:0001056 HP:0008066
620483 INDIVIDUAL 6 HP:0000953 HP:0030084 HP:0001056 HP:0100699 HP:0008066
620483 INDIVIDUAL 7 HP:0001056 HP:0008066 HP:0001156 HP:0000987 HP:0001030
620483 INDIVIDUAL 8 HP:0008066 HP:0009381 HP:0000998    
620483 INDIVIDUAL 9 HP:0200055 HP:0000953 HP:0001156 HP:0001056 HP:0100699
620483 INDIVIDUAL 10 HP:0008066 HP:0000989 HP:0000988    
620486 ALL   HP:0000132 HP:0040185 HP:0000132 HP:0000978 HP:0040184
620486 FAMILY 1 HP:0000132 HP:0040185 HP:0000225 HP:0001892  
620486 GROUP 1 HP:0000132 HP:0040185      
620486 GROUP 2 HP:0000132 HP:0000978 HP:0040184 HP:0001892 HP:0000421
620486 INDIVIDUAL 1 HP:0000132 HP:0040185 HP:0000225 HP:0001892  
620489 ALL   HP:0002714 HP:0000505 HP:0001999 HP:0000729 HP:0000278
620489 GROUP 1 HP:0002714 HP:0000505 HP:0001999 HP:0000729 HP:0000278
620494 ALL   HP:0001156 HP:0000505 HP:0008050 HP:0001999 HP:0000368
620494 GROUP 1 HP:0001156 HP:0000505 HP:0008050 HP:0001999 HP:0000368
620501 ALL   HP:0000028 HP:0005528 HP:0002308 HP:0000026 HP:0001875
620501 FAMILY 1 HP:0000028 HP:0005528 HP:0002308 HP:0000026 HP:0001875
증상은 HPO 로 표시되었으며 질병인식자는 OMIM의 ID이다. 동일 집단의 형태는 개인(INDIVIDUAL), 가계(FAMILY), 집단(GROUP)이 사용되었으며 모두 집단인식자를 갖는다. 추후 해당 데이터베이스에 또 다른 개인/가계/집단 정보가 추가될 수 있으므로 동일 집단 형태가 한 개만 있다 하더라도 항상 집단인식자를 갖는다(620481의 GROUP과 같은 예). 또한, 이 모든 증상을 통합하여 기존 방식과 같이 증상을 구성한 'ALL'이 존재함을 볼 수 있다.
증상 유사도 측정부(300)는 환자의 증상과 모든 질병에 대한 증상 재구성 집합을 비교하여 증상 유사도를 측정할 수 있다.
증상 유사도 측정부(300)는 환자의 증상과 질병에 대한 증상 재구성 집합을 이용하여 공지된 다양한 방법을 이용할 수 있다.
질병 ID 및 상기 질병 ID에 해당하는 증상 ID의 집합 정보를 이용하여 증상 유사도가 계산되는 종래 기술과 달리 본 발명에 따른 증상 유사도 측정부(300)는 질병 ID 및 재구성된 증상 재구성 집단의 ID(증상 재구성 집합)가 함께 지정되어 증상 유사도가 계산될 수 있다.
즉, 본 발명에 따른 증상 유사도 측정부(300)는 <질병ID, 동일집단형태, 집단ID, {증상ID}> 로 정보를 구성할 수 있다.
하기 표 2는 종래 기술에 질병-증상 정보이고, 하기 표 3은 본 발명에 따른 질병-증상 정보의 실시예이다.
질병 인식자 증상
620486 HP:0001892, HP:0000978, HP:0000421, HP:0040184, HP:0000132, HP:0040185, HP:0000225
질병 인식자 동일 집단 형태 집단 인식자 증상
620486 GROUP 1 HP:0001892, HP:0000978, HP:0000421, HP:0040184, HP:0000132
620486 FAMILY 1 HP:0040185, HP:0001892, HP:0000225, HP:0000132
620486 INDIVIDUAL 1 HP:0040185, HP:0001892, HP:0000225, HP:0000132
620486 ALL 1 HP:0000132, HP:0000132, HP:0000225, HP:0000421, HP:0000978, HP:0001892, HP:0040184, HP:0040185
증상 유사도 측정부(300)는 동일 집단이 구분되어 구성된 질병-증상 정보를 이용하여 환자와 해당 질병의 모든 동일 집단 형태와의 증상 유사도를 측정할 수 있다. 이 중 가장 높은 증상 유사도를 환자와 해당 질병의 증상 유사도로 사용할 수 있다.
질병 판별부(400)는 질병의 증상 재구성 집합과 환자의 증상 간에 증상 유사도를 이용해서 환자의 질병을 판별할 수 있다.
도 4는 본 발명에 따른 질병 판별부가 질병을 판별하는 것을 수행하는 것을 설명하기 위한 예시도이다.
도 4를 참조하면, 본 발명의 일 실시예에 따른 질병 판별부(400)는 질병에 대한 증상 재구성 집합 중에서 증상 유사도가 가장 높은 것을 질병에 대한 대표 증상 유사도로 선별하고, 각각의 질병에 대한 대표 증상 유사도에 따라 랭킹을 부여하여 환자의 질병을 판단할 수 있다.
도 5는 본 발명에 따른 질병 판별부가 질병을 판별하는 것을 수행하는 것을 설명하기 위한 다른 예시도이다.
도 5를 참조하면, 본 발명의 다른 실시예에 따른 질병 판별부(400)는 증상 유사도가 가장 높은 최대 증상 유사도를 선별하고, 상기 최대 증상 유사도를 가진 증상 재구성 집합이 속한 질병을 환자의 질병으로 판별할 수 있다.
본 발명의 효과를 확인하기 위해서 총 309개의 질병에 대하여 진단받은 1633명의 환자들에 대하여 해당 환자가 진단받은 증상을 본 발명에 따라 재구성한 후 증상 유사도를 확인하였다. 증상 유사도는 문헌 Clinical Diagnostics in Human Genetics with Semantic Similarity Searches in Ontologies에 나온 방법을 따르되 논문에서는 각 증상 노드의 Mutual Information 이용하였으나 본 발명에서는 증상 node의 depth(최상위 노드에서의 최단 거리)를 이용하였다.
그 결과 종래 기술에 따른 방법, 즉 동일 집단 형태에 따른 구분 없이 증상 정보를 이용할 경우 유사도가 가장 높은 경우는 전체의 34%에 불과했다.
도 6은 본 발명에 따른 증상 유사도 측정에 따라 최대 유사도가 나온 집단 형태의 비율을 나타낸 도면이다.
도 6을 참조하면, 본 발명에 따라 환자가 진단받은 질병에 대하여 해당 질병의 증상을 개인/가족/집단으로 구분하여 증상 유사도를 측정할 경우 집단에서 가장 높은 증상 유사도가 측정된 경우는 전체의 43%로 가장 높았다.
종래 기술에 따른 방법론은 34%, 개인은 15%, 그리고 나머지는 가족은 8% 이었다.
집단에 대한 증상과 환자의 증상이 가장 유사했던 경우에 대하여 점수차이는 종래 기술에 따른 방법일 경우 평균 4.61점이 나왔으나, 본 발명에 따른 집단의 증상으로 구분하여 유사도를 계산할 경우 5.18점이 나왔으며, 평균 0.57점 차이로 이는 단측검정 paired t-test p-value < 0.001 로 매우 유의미한 차이임을 알 수 있다.
개인별 증상을 구분하여 계산했을 때가 환자의 증상과 가장 유사했던 경우에 대하여 종래 기술에 따른 방법을 사용할 경우 평균 증상 유사도는 4.62점이 나온 반면에, 본 발명에 따른 방법을 따를 경우 5.06점이 나왔으며, 평균 0.44점 차이로 이는 단측검정 paired t-test p-value < 0.001로 매우 유의미한 차이임을 알 수 있다.
가계별 증상을 구분하여 계산했을 때가 환자의 증상과 가장 유사했던 경우에 대하여 종래 기술에 따른 방법을 이용할 경우 평균 증상 유사도는 3.90이 나온 반면에, 본 발명에 따른 방법을 따를 경우 4.28점이 나오며, 평균 0.38점 차이가 나며 이는 단측검정 paired t-test p-value < 0.001 로 매우 유의미한 차이임을 알 수 있다.
종래 기술에 따른 방법과 본 발명에 따른 방법을 사용할 때 점수 차이가 가장 크게 나타난 경우를 살펴보면 표 4와 같다.
환자ID 진단 질병 전체 증상 정보 이용 집단 증상 정보 이용 동일 집단 형태 점수 차이
id1 615779 3.74 6.43 가계 2.69
id2 619243 2.47 5.00 개인 2.53
id3 167800 4.80 7.00 개인 2.20
id4 167800 4.10 6.30 개인 2.20
id5 167800 4.80 7.00 개인 2.20
종래 기술에 따른 방법인, 집단의 구분 없이 질병의 전체 증상을 이용한 유사도를 계산할 때와 본 발명에 따른 방법을 이용하여 집단 별 증상을 구분하여 환자와의 증상 유사도를 계산할 때를 비교해 보면, 주로 개인 또는 가계별 증상을 따로 구분하여 계산할 때 특히 큰 점수 차이가 나는 것을 알 수 있다.
즉, 동일 질병을 갖고 있다 하더라도 개인, 가계, 집단 별로 증상이 다를 수 있으며, 생물학적으로 좀 더 균일한 집단인 개인 또는 가계에서 나타나는 증상들이 집단으로 구분된 증상보다 환자의 증상과 유사한 경향이 보이는 것을 알 수 있다.
이를 통하여 본 발명에 따른 증상 재구성을 통한 환자의 질병 진단 시스템을 적용할 경우 진단받은 환자의 증상과 해당 환자가 진단받은 질병의 증상 유사도가 더 높게 측정되는 것을 확인할 수 있다.
이상의 본 발명의 목적들, 다른 목적들, 특징들 및 이점들은 첨부된 도면과 관련된 이상의 바람직한 실시예들을 통해서 쉽게 이해될 것이다. 그러나 본 발명은 여기서 설명되는 실시예들에 한정되지 않고 다른 형태로 구체화될 수도 있다. 오히려, 여기서 소개되는 실시예들은 개시된 내용이 철저하고 완전해질 수 있도록 그리고 통상의 기술자에게 본 발명의 사상이 충분히 전달될 수 있도록 하기 위해 제공되는 것이다. 본 명세서에서, 어떤 구성요소가 다른 구성요소 상에 있다고 언급되는 경우에 그것은 다른 구성요소 상에 직접 형성될 수 있거나 또는 그들 사이에 제3의 구성요소가 게재될 수도 있다는 것을 의미한다.
또한, 어떤 엘리먼트 (또는 구성요소)가 다른 엘리먼트(또는 구성요소) 상(ON)에서 동작 또는 실행된다고 언급될 때, 그 엘리먼트(또는 구성요소)는 다른 엘리먼트(또는 구성요소)가 동작 또는 실행되는 환경에서 동작 또는 실행되거나 또는 다른 엘리먼트(또는 구성요소)와 직접 또는 간접적으로 상호 작용을 통해서 동작 또는 실행되는 것으로 이해되어야 할 것이다.
어떤 엘리먼트, 구성요소, 장치, 또는 시스템이 프로그램 또는 소프트웨어로 이루어진 구성요소를 포함한다고 언급되는 경우, 명시적인 언급이 없더라도, 그 엘리먼트, 구성요소, 장치, 또는 시스템은 그 프로그램 또는 소프트웨어가 실행 또는 동작하는데 필요한 하드웨어(예를 들면, 메모리, CPU 등)나 다른 프로그램 또는 소프트웨어(예를 들면 운영체제나 하드웨어를 구동하는데 필요한 드라이버 등)를 포함하는 것으로 이해되어야 할 것이다.
또한 어떤 엘리먼트(또는 구성요소)가 구현됨에 있어서 특별한 언급이 없다면, 그 엘리먼트(또는 구성요소)는 소프트웨어, 하드웨어, 또는 소프트웨어 및 하드웨어 어떤 형태로도 구현될 수 있는 것으로 이해되어야 할 것이다.
100: 질병-증상 수집부
200: 증상 재구성부
300: 증상 유사도 측정부
400: 질병 판별부
1000: 증상 재구성을 통한 환자의 질병 진단 시스템

Claims (8)

  1. 질병의 알려진 증상 집합을 수집하는 질병-증상 수집부;
    상기 질병의 증상 집합을 기 설정된 동일 집단으로 분류하여 증상 재구성 집합을 생성하는 증상 재구성부; 및
    환자의 증상과 모든 질병에 대한 증상 재구성 집합을 비교하여 증상 유사도를 측정하는 증상 유사도 측정부를 포함하고,
    상기 증상 재구성부는 하기 식 1을 만족하도록 상기 증상 재구성 집합을 생성하고, 상기 동일 집단의 기준은 개인, 일란성 쌍둥이, 형제자매(sibling), 단일 가계, 문헌에 보고된 단일 집단, 유전적 구성이 유사한 인종 집단 중 어느 하나인 것을 특징으로 하는 증상 재구성을 통한 환자의 질병 진단 시스템.
    [식 1]

    여기서, S는 해당 질병에 대한 모든 알려진 증상의 집합이고, 는 S를 재구성한 증상 재구성 집합이고, 상기 증상 재구성 집합()에 속해 있는 모든 증상은 해당 질병으로 진단된 단일 집단(G) 내에서 모두 속해야 하고, 모든 증상 재구성 집합()은 3개 이상의 증상으로 구성됨
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 증상 재구성 집합()에 포함되어 있는 3개 이상의 증상들은 HPO의 계층 관계에서 서로 상하 관계가 아닌 것을 특징으로 하는 증상 재구성을 통한 환자의 질병 진단 시스템.
  5. 삭제
  6. 제1항에 있어서,
    상기 증상 재구성 집합에 대한 상기 증상 유사도를 이용해서 환자의 질병을 판별하는 질병 판별부를 더 포함하는 증상 재구성을 통한 환자의 질병 진단 시스템.
  7. 제6항에 있어서,
    상기 질병 판별부는 질병에 대한 증상 재구성 집합 중에서 상기 증상 유사도가 가장 높은 것을 상기 질병에 대한 대표 증상 유사도로 선별하고, 각각의 질병에 대한 대표 증상 유사도에 따라 랭킹을 부여하는 것을 특징으로 하는 증상 재구성을 통한 환자의 질병 진단 시스템.
  8. 제6항에 있어서,
    상기 질병 판별부는 상기 증상 유사도가 가장 높은 최대 증상 유사도를 선별하고, 상기 최대 증상 유사도를 가진 상기 증상 재구성 집합이 속한 질병을 환자의 질병으로 판별하는 것을 특징으로 하는 증상 재구성을 통한 환자의 질병 진단 시스템.








KR1020230139926A 2023-10-18 2023-10-18 증상 재구성을 통한 환자의 질병 진단 시스템 KR102643686B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230139926A KR102643686B1 (ko) 2023-10-18 2023-10-18 증상 재구성을 통한 환자의 질병 진단 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230139926A KR102643686B1 (ko) 2023-10-18 2023-10-18 증상 재구성을 통한 환자의 질병 진단 시스템

Publications (1)

Publication Number Publication Date
KR102643686B1 true KR102643686B1 (ko) 2024-03-05

Family

ID=90298088

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230139926A KR102643686B1 (ko) 2023-10-18 2023-10-18 증상 재구성을 통한 환자의 질병 진단 시스템

Country Status (1)

Country Link
KR (1) KR102643686B1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140103611A (ko) * 2013-02-18 2014-08-27 (주)지노첵 질병 관련 유전체 분석 서비스 시스템 및 그 방법
KR20170011389A (ko) * 2015-07-22 2017-02-02 주식회사 케이티 질병 위험도 예측 방법 및 이를 수행하는 장치
US20180357507A1 (en) * 2017-06-08 2018-12-13 Fdna Inc. Systems, methods, and computer-readable media for patient image analysis to identify new diseases
KR20190000168A (ko) * 2017-06-22 2019-01-02 한국과학기술원 질병 연관 세포기능에 연결된 마커 기반으로 멀티마커 패널을 선정하는 시스템 및 방법
KR20200059430A (ko) * 2018-11-21 2020-05-29 주식회사 쓰리빌리언 질병 증상 추천 시스템 및 방법
KR20220138327A (ko) 2021-04-05 2022-10-12 (주)케어테크 질병 증상 및 치료 정보 예측 서비스 제공 장치, 방법 및 프로그램

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140103611A (ko) * 2013-02-18 2014-08-27 (주)지노첵 질병 관련 유전체 분석 서비스 시스템 및 그 방법
KR20170011389A (ko) * 2015-07-22 2017-02-02 주식회사 케이티 질병 위험도 예측 방법 및 이를 수행하는 장치
US20180357507A1 (en) * 2017-06-08 2018-12-13 Fdna Inc. Systems, methods, and computer-readable media for patient image analysis to identify new diseases
KR20190000168A (ko) * 2017-06-22 2019-01-02 한국과학기술원 질병 연관 세포기능에 연결된 마커 기반으로 멀티마커 패널을 선정하는 시스템 및 방법
KR20200059430A (ko) * 2018-11-21 2020-05-29 주식회사 쓰리빌리언 질병 증상 추천 시스템 및 방법
KR20220138327A (ko) 2021-04-05 2022-10-12 (주)케어테크 질병 증상 및 치료 정보 예측 서비스 제공 장치, 방법 및 프로그램

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Kwang Baek Kim, Oriental Medicine-based Health Pre-Diagnosis System using Fuzzy Decision Tree, JKIICE Vol.25, No. 11: 1519~1524, Nov. 2021. *

Similar Documents

Publication Publication Date Title
Pilkonis et al. Scales for personality disorders developed from the Inventory of Interpersonal Problems
Kusiak et al. Autonomous decision-making: A data mining approach
Hornbrook Hospital case mix: its definition, measurement and use: Part I. The conceptual framework
Brousseau et al. Practical application and clinical impact of the WHO histopathological criteria on bone marrow biopsy for the diagnosis of essential thrombocythemia versus prefibrotic primary myelofibrosis
Lenzenweger et al. Refining the borderline personality disorder phenotype through finite mixture modeling: Implications for classification
Solomon et al. Analysis of component findings in 79 patients diagnosed with VACTERL association
Bloch et al. Data analysis with Shapley values for automatic subject selection in Alzheimer’s disease data sets using interpretable machine learning
Ho et al. Septic shock prediction for patients with missing data
Fetter Casemix classification systems
CN111933281B (zh) 一种疾病分型的确定系统、方法、装置及存储介质
Ratnaike et al. MitoPhen database: a human phenotype ontology-based approach to identify mitochondrial DNA diseases
CN107169259A (zh) 基于协同过滤和建议的个性化医学决定支持系统
CN116052770A (zh) 基于多基因突变的vte风险评估模型、构建方法及应用
Baskin et al. Predictors of psychological adjustment in mothers of children with cancer
Monsen et al. Discovering client and intervention patterns in home visiting data
US20110093448A1 (en) System method and computer program product for pedigree analysis
Winkel Patterns and clusters—multivariate approach for interpreting clinical chemistry results
KR102643686B1 (ko) 증상 재구성을 통한 환자의 질병 진단 시스템
JP3563394B2 (ja) 画面表示システム
CN113782197B (zh) 基于可解释性机器学习算法的新冠肺炎患者转归预测方法
JP2024027086A (ja) 自己監督グラフクラスタリングに基づく慢性腎症亜型マイニングシステム
CN108753991A (zh) 一种针对人群高原适应相关遗传变异的高效筛查系统及方法
Quantin et al. Classification and regression trees on aggregate data modeling: an application in acute myocardial infarction
Cao et al. A bibliometric analysis of publications on burn sepsis using VOSviewer
Percesepe et al. The effect of family size on estimates of the frequency of hereditary non-polyposis colorectal cancer

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant