KR102503609B1 - 머신 러닝을 이용한 가상 환자 정보 생성 시스템 및 방법 - Google Patents

머신 러닝을 이용한 가상 환자 정보 생성 시스템 및 방법 Download PDF

Info

Publication number
KR102503609B1
KR102503609B1 KR1020220013903A KR20220013903A KR102503609B1 KR 102503609 B1 KR102503609 B1 KR 102503609B1 KR 1020220013903 A KR1020220013903 A KR 1020220013903A KR 20220013903 A KR20220013903 A KR 20220013903A KR 102503609 B1 KR102503609 B1 KR 102503609B1
Authority
KR
South Korea
Prior art keywords
information
group
virtual patient
data
machine learning
Prior art date
Application number
KR1020220013903A
Other languages
English (en)
Other versions
KR20220111212A (ko
Inventor
김수연
Original Assignee
주식회사 코스모스메딕
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 코스모스메딕 filed Critical 주식회사 코스모스메딕
Publication of KR20220111212A publication Critical patent/KR20220111212A/ko
Application granted granted Critical
Publication of KR102503609B1 publication Critical patent/KR102503609B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

본 발명은 머신 러닝을 이용한 가상 환자 정보 생성 시스템 및 방법에 관한 것이다.
본 발명에 따른 머신 러닝을 이용한 가상 환자 정보 생성 시스템은, 공개되어 있고, 사용 가능한 질병 관련 정보 또는 환자의 생체 정보를 수집하는 정보 수집부; 상기 수집된 정보를 바탕으로 머신 러닝 AI 모델을 이용하여 각각의 질병에 대해 각각 대응하는 그룹을 형성하고, 형성된 각 그룹에 속하는 환자의 정보(데이터)를 생성하는 정보 생성부; 생성된 각 그룹의 환자의 정보(데이터)를 바탕으로 머신 러닝 AI 모델을 이용하여 복합 질환을 앓고 있는 새로운 가상 환자군을 각각 생성하는 가상 환자군 생성부; 생성된 각각의 가상 환자군에 대하여 상기 머신 러닝 AI 모델을 이용하여 각각의 가상 환자군에 속하는 가상 환자의 정보를 생성하는 가상 환자 정보 생성부; 및 정보 수집부, 정보 생성부, 가상 환자군 생성부, 가상 환자 정보 생성부의 상태 체크 및 동작을 제어하고, 머신 러닝 AI 모델에 의한 각각의 질병에 대응하는 각 그룹의 형성, 새로운 가상 환자군 생성 및 가상 환자의 정보 생성을 위한 제어 명령을 송출하는 제어부를 포함한다.

Description

머신 러닝을 이용한 가상 환자 정보 생성 시스템 및 방법{Virtual patient information generating system and method using machine learning}
본 발명은 머신 러닝을 이용한 가상 환자 정보 생성 시스템 및 방법에 관한 것으로서, 더 상세하게는 머신 러닝 AI(Artificial Intelligence) 모델을 이용하여 환자의 생체 정보와 의료 영상(이미지)을 결합하여 실제 환자와 비슷한 수준의 가상의 환자의 정보를 생성하여 제공할 수 있는 머신 러닝을 이용한 가상 환자 정보 생성 시스템 및 방법에 관한 것이다.
환자에 대한 정보를 생성하려는 시도는 의료 영상 분야에서 먼저 시행되었고 지금도 시행되고 있다. 그러나 환자에 대한 진료는 영상 데이터(정보)만으로 수행되는 것이 아니라 환자의 생체 정보(데이터)도 분명히 필요하다. 하지만 이와 같은 환자의 생체 정보(데이터) 생성은 아직까지 만족할 만한 성과를 거두지 못하고 있다.
현재까지 공개되어 있는 머신 러닝과 딥 러닝 기법들을 사용하면 생체 정보와 의료 이미지를 결합하여 가상 환자의 데이터를 만들 수 있다. 그 기법들은 빠른속도로 발전하고 있기 때문에, 가상 환자에 대한 데이터의 품질은 더욱 향상될 수 있고 정교하게 만들 수 있다. 이러한 가상 환자의 데이터를 적용할 수 있는 분야는 광범위하다.
4차 산업의 핵심인 스마트 의료시장에서 환자의 정보는 매우 민감한 사안이다. 데이터 3법이 시행되었지만 환자들의 정보를 환자의 동의없이 사용하는 것은 엄연히 불법이다. 하지만, 세계적으로 다양한 의료 인공지능과 관련하여 많은 회사들이 연구개발에 박차를 가하고 있는 상황에서 그와 같은 규제는 결국 대한민국 의료 인공지능의 개발에 역효과를 미치게 되고, 궁극적으로 의료 인공지능의 경쟁력을 약화시키게 되는 결과를 초래하게 될 것이다.
통상 의학 논문을 보면, 환자군의 특성(character)에 대한 언급이 있고, 그 중에서 두 개의 비교 환자군 간의 유의미한 차이를 나타내는 지표를 체크하여 보여주기도 한다. 이와 관련하여 때로는 동일한 질병을 가진 환자에게, 같은 약을 썼을 때 해당 환자의 특성에 따라 그 약의 효과는 달라질 수 있다. 예를 들면, 간단한 전신근육통에 소염제를 처방하였으나, 소염제 알레르기가 있는 환자는 그 약을 먹으면 두드러기가 나타나고, 심하면 사망에 이를 수가 있다.
이와 같이 환자의 특성을 이해(파악)하는 것은 매우 중요하지만, 응급환자나 희귀질환 등을 가진 환자의 정보는 충분히 구하기가 쉽지 않다. 특히 응급실 및 응급 상황의 특성상 검증되지 않은 새로운 약이나 시술 등을 적용한다는 것은 윤리적인 측면에서 문제가 있고, 이는 의학 발전의 중대한 걸림돌이 되고 있다.
따라서 충분한 '가상의 환자'의 정보를 생성하여 이에 대해 연구가 이루어진다면, 특히 인공지능 프로그램 개발에 있어서 사용할 수 있는 데이터셋(dataset)을 만들 수 있다면, 이는 응급 환자들에게 많은 도움이 될 것이다.
한편, 한국 공개특허공보 제10-2021-0051141호(특허문헌 1)에는 "환자의 증강 현실 기반의 의료 정보를 제공하는 방법, 장치 및 컴퓨터 프로그램"이 개시되어 있는 바, 이에 따른 증강 현실 기반의 의료 정보를 제공하는 방법은, 환자의 의료 영상에 기초하여 생성된 환자의 피부에 대한 정보를 포함하는 3D 모델링 데이터를 획득하는 단계; 상기 환자의 상태, 상기 환자의 실시간 자세, 환부 및 시술 종류 중 적어도 하나에 기초하여 상기 3D 모델링 데이터로부터 적어도 일부의 기준 피부에 대한 정보를 샘플링하는 단계; 상기 환자가 위치하는 공간의 정보를 포함하는 실시간 공간 영상을 획득하는 단계; 상기 기준 피부에 대한 정보에 기초하여 상기 3D 모델링 데이터와 상기 실시간 공간 영상을 정합하는 단계; 상기 환자의 피부에 대한 정보에 기초하여, 상기 실시간 공간 영상에서 상기 환자의 신체 상에 의료 정보가 출력되도록 하는 증강 현실 기반의 의료 영상을 생성하는 단계; 및 상기 증강 현실 기반의 의료 영상을 출력하는 단계를 포함하는 것을 특징으로 한다.
이상과 같은 특허문헌 1의 경우, 환자의 의료 영상에 기초하여 생성된 환자의 피부에 대한 정보를 포함하는 3D 모델링 데이터를 활용함으로써, 비마커 기반의 좌표계 정합을 통해 좌표계 정합의 정확도를 높일 수 있는 효과가 있기는 하나, 이는 환자의 상태, 환자의 실시간 자세, 환부 및 시술 종류 등 실제 환자를 기반으로 하고, 또한 궁극적으로 시술을 위한 환자의 피부에 대한 정보와 시술시의 정합도를 높이고자 하는 것으로, 일반적인 다양한 응급 환자들에 대해 적재적소에 필요한 다양한 환자의 정보를 제공할 수 없는 문제점을 내포하고 있다.
한국 공개특허공보 제10-2021-0051141호(2021.05.10.)
본 발명은 이상과 같은 사항을 감안하여 창출된 것으로서, 머신 러닝 AI(Artificial Intelligence) 모델을 이용하여 환자의 생체 정보와 의료 영상(이미지) 등을 결합하여 실제 환자와 비슷한 수준의 가상의 환자의 정보를 생성하여 제공함으로써, 일반 환자는 물론 응급 환자들의 진료 및 치료에 많은 도움을 줄 수 있는 머신 러닝을 이용한 가상 환자 정보 생성 시스템 및 방법을 제공함에 그 목적이 있다.
상기의 목적을 달성하기 위하여 본 발명에 따른 머신 러닝을 이용한 가상 환자 정보 생성 시스템은,
공개되어 있고, 사용 가능한 질병 관련 정보 또는 환자의 생체 정보를 수집하는 정보 수집부와;
상기 정보 수집부에 의해 수집된 정보를 바탕으로 머신 러닝 AI(Artificial Intelligence) 모델을 이용하여 각각의 질병에 대해 각각 대응하는 그룹을 형성하고, 형성된 각 그룹에 속하는 환자의 정보(데이터)를 생성하는 정보 생성부와;
상기 정보 생성부에 의해 생성된 각 그룹의 환자의 정보(데이터)를 바탕으로 상기 머신 러닝 AI 모델을 이용하여 복합 질환을 앓고 있는 새로운 가상 환자군을 각각 생성하는 가상 환자군 생성부와;
상기 가상 환자군 생성부에 의해 생성된 각각의 가상 환자군에 대하여 상기 머신 러닝 AI 모델을 이용하여 각각의 가상 환자군에 속하는 가상 환자의 정보를 생성하는 가상 환자 정보 생성부; 및
상기 정보 수집부, 정보 생성부, 가상 환자군 생성부, 가상 환자 정보 생성부의 상태 체크 및 동작을 제어하고, 상기 머신 러닝 AI 모델에 의한 각각의 질병에 대응하는 각 그룹의 형성, 새로운 가상 환자군 생성 및 가상 환자의 정보 생성을 위한 제어 명령을 송출하는 제어부를 포함하는 점에 그 특징이 있다.
여기서, 바람직하게는 상기 가상 환자 정보 생성부에 의해 생성된 가상 환자의 정보(데이터)에 대해 SPSS, R Studio를 포함하는 통계 프로그램을 통해 신뢰도를 검증하고 필요시 수정하는 데이터 검증/수정부를 더 포함할 수 있다.
또한, 상기 정보 수집부에 의해 수집되는 상기 공개되어 있고, 사용 가능한 질병 관련 정보 또는 환자의 생체 정보는 의학서적이나 의학논문에 기재되어 있는 정보 또는 데이터, 공개되고 법적으로 사용 가능한 환자의 생체정보 데이터, 공개되고 법적으로 사용 가능한 환자의 의료 영상(이미지) 데이터 중 적어도 어느 하나를 포함할 수 있다.
또한, 상기 정보 생성부가 상기 각 그룹에 속하는 환자의 정보(데이터)를 생성함에 있어서, 상기 각 그룹에 속하는 환자 집단이 표준 정규분포를 따르는 것으로 가정하고, 평균을 정한 후 상위 및 하위 각 5%를 제외한 나머지 90%의 정규분포 환자에 대한 정보를 생성할 수 있다.
또한, 상기 정보 생성부가 상기 수집된 정보를 바탕으로 머신 러닝 AI 모델을 이용하여 각각의 질병에 대해 각각 대응하는 그룹을 형성함에 있어서, 상기 수집된 정보가 상호 간에 상관관계가 있는지의 여부를 체크하여, 상관관계가 있는 정보들은 그 상관성을 분석하여 같은 그룹으로 묶고, 상관관계가 없는 정보들은 그들끼리 임의로 섞어서 해당 질병(질환)의 가상 환자군을 생성할 수 있다.
또한, 상기 정보 생성부가 상기 환자의 정보(데이터)를 생성함에 있어서, 문자, 숫자로 구성된 환자 정보는 통계 프로그램 R studio를 포함한 머신 러닝 툴(machine learning tool)을 이용하여 표준 정규분포 데이터를 생성할 수 있다.
또한, 상기 가상 환자군 생성부가 상기 각 그룹의 환자의 정보(데이터)를 바탕으로 머신 러닝 AI 모델을 이용하여 복합 질환을 앓고 있는 새로운 가상 환자군을 각각 생성함에 있어서, 앙상블(Ensemble) 기법을 포함한 머신 러닝 기법을 이용하여 각 질환별 환자의 정보(데이터)를 조합해서 새로운 가상 환자군을 생성할 수 있다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른 머신 러닝을 이용한 가상 환자 정보 생성 방법은,
a) 정보 수집부에 의해 공개되어 있고, 사용 가능한 질병 관련 정보 또는 환자의 생체 정보를 수집하는 단계와;
b) 정보 생성부가 상기 수집된 정보를 바탕으로 머신 러닝 AI 모델을 이용하여 각각의 질병에 대해 각각 대응하는 그룹을 형성하고, 형성된 각 그룹에 속하는 환자의 정보(데이터)를 생성하는 단계와;
c) 가상 환자군 생성부가 상기 단계 b)에서 생성된 각 그룹의 환자의 정보(데이터)를 바탕으로 머신 러닝 AI 모델을 이용하여 복합 질환을 앓고 있는 새로운 가상 환자군을 각각 생성하는 단계; 및
d) 가상 환자 정보 생성부가 상기 생성된 각각의 가상 환자군에 대하여 머신 러닝 AI 모델을 이용하여 각각의 가상 환자군에 속하는 가상 환자의 정보를 생성하는 단계를 포함하는 머신 러닝을 이용한 가상 환자 정보 생성 방법.
여기서, 바람직하게는 상기 단계 d) 이후에 데이터 검증/수정부가 SPSS, R Studio를 포함하는 통계 프로그램을 통해 데이터의 신뢰도를 검증하고 필요시 수정하는 단계를 더 포함할 수 있다.
또한, 상기 단계 a)에서 상기 공개되어 있고, 사용 가능한 질병 관련 정보 또는 환자의 생체 정보는 의학서적이나 의학논문에 기재되어 있는 정보 또는 데이터, 공개되고 법적으로 사용 가능한 환자의 생체정보 데이터, 공개되고 법적으로 사용 가능한 환자의 의료 영상(이미지) 데이터 중 적어도 어느 하나를 포함할 수 있다.
또한, 상기 단계 b)에서 상기 각 그룹에 속하는 환자의 정보(데이터)를 생성함에 있어서, 상기 각 그룹에 속하는 환자 집단이 표준 정규분포를 따르는 것으로 가정하고, 평균을 정한 후 상위 및 하위 각 5%를 제외한 나머지 90%의 정규분포 환자에 대한 정보를 생성할 수 있다.
또한, 상기 단계 b)에서 상기 수집된 정보를 바탕으로 머신 러닝 AI 모델을 이용하여 각각의 질병에 대해 각각 대응하는 그룹을 형성함에 있어서, 상기 수집된 정보가 상호 간에 상관관계가 있는지의 여부를 체크하여, 상관관계가 있는 정보들은 그 상관성을 분석하여 같은 그룹으로 묶고, 상관관계가 없는 정보들은 그들끼리 임의로 섞어서 해당 질병(질환)의 가상 환자군을 생성할 수 있다.
또한, 상기 단계 b)에서 상기 환자의 정보(데이터)를 생성함에 있어서, 문자, 숫자로 구성된 환자 정보는 통계 프로그램 R studio를 포함한 머신 러닝 툴(machine learning tool)을 이용하여 표준 정규분포 데이터를 생성할 수 있다.
또한, 상기 단계 c)에서 상기 각 그룹의 환자의 정보(데이터)를 바탕으로 머신 러닝 AI 모델을 이용하여 복합 질환을 앓고 있는 새로운 가상 환자군을 각각 생성함에 있어서, 앙상블(Ensemble) 기법을 포함한 머신 러닝 기법을 이용하여 각 질환별 환자의 정보(데이터)를 조합해서 새로운 가상 환자군을 생성할 수 있다.
이와 같은 본 발명에 의하면, 머신 러닝 AI 모델을 이용하여 환자의 생체 정보와 의료 영상(이미지) 등을 결합하여 실제 환자와 비슷한 수준의 가상의 환자의 정보를 생성하여 제공함으로써, 의료 현장에서 일반 환자는 물론 응급 환자들의 진료 및 치료에 많은 도움을 줄 수 있는 장점이 있다.
도 1은 본 발명의 실시예에 따른 머신 러닝을 이용한 가상 환자 정보 생성 시스템의 구성을 개략적으로 나타낸 도면이다.
도 2는 본 발명의 실시예에 따른 머신 러닝을 이용한 가상 환자 정보 생성 방법의 실행 과정을 나타낸 흐름도이다.
도 3은 모든 데이터가 라벨을 가지고 있을 경우, 그를 바탕으로 군집화를 다시 진행하고 이상치는 제거하는 개념을 도식적으로 나타낸 도면이다.
도 4a 및 도 4b는 본 발명에 도입되는 생성된 가상 환자들의 데이터를 의사들에 의해 평가하는 평가 툴(tool)을 나타낸 도면이다.
본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정되어 해석되지 말아야 하며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 한다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 또한, 명세서에 기재된 "…부", "…기", "모듈", "장치" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
이하 첨부된 도면을 참조하여 본 발명의 실시예를 상세히 설명한다.
도 1은 본 발명의 실시예에 따른 머신 러닝을 이용한 가상 환자 정보 생성 시스템의 구성을 개략적으로 나타낸 도면이다.
도 1을 참조하면, 본 발명에 따른 머신 러닝을 이용한 가상 환자 정보 생성 시스템(100)은 정보 수집부(110), 정보 생성부(120), 가상 환자군 생성부(130), 가상 환자 정보 생성부(140), 제어부(150)를 포함하여 구성된다.
정보 수집부(110)는 공개되어 있고, 사용 가능한 질병 관련 정보 또는 환자의 생체 정보를 수집한다. 여기서, 이와 같은 정보 수집부(110)에 의해 수집되는 상기 공개되어 있고, 사용 가능한 질병 관련 정보 또는 환자의 생체 정보는 의학서적이나 의학논문에 기재되어 있는 정보 또는 데이터, 공개되고 법적으로 사용 가능한 환자의 생체정보 데이터, 공개되고 법적으로 사용 가능한 환자의 의료 영상(이미지) 데이터(예를 들면, X-ray, CT, MRI, 초음파 등) 중 적어도 어느 하나를 포함할 수 있다. 여기서, 수집되는 정보의 일 예로서, 예를 들어, Type Ⅱ 당뇨(제2형 당뇨병)가 진단된 환자의 경우에 대해 설명해 보기로 한다.
- Type Ⅱ 당뇨(제2형 당뇨병)가 진단된 환자의 체질량 지수(Body Mass Index; BMI) 평균은 30이다. 이와 같은 체질량 지수(BMI)의 범위로서 25∼40이 있다.
- Type Ⅱ 당뇨(제2형 당뇨병)가 진단된 환자의 복부 비만율은 60%이다.
- Type Ⅱ 당뇨(제2형 당뇨병)가 진단된 환자의 성인기준 남성 대 여성의 비율이 6:4 정도이다.
- Type Ⅱ 당뇨(제2형 당뇨병)가 진단된 환자의 최초 평균 진단 나이는 남성은 45세, 여성은 50세이다.
정보 생성부(120)는 상기 정보 수집부(110)에 의해 수집된 정보를 바탕으로 머신 러닝 AI(Artificial Intelligence) 모델(150m)을 이용하여 각각의 질병에 대해 각각 대응하는 그룹을 형성하고, 형성된 각 그룹에 속하는 환자의 정보(데이터)를 생성한다. 이와 같은 정보 생성부(120)가 상기 각 그룹에 속하는 환자의 정보(데이터)를 생성함에 있어서, 상기 각 그룹에 속하는 환자 집단이 표준 정규분포를 따르는 것으로 가정하고, 평균을 정한 후 상위 및 하위 각 5%를 제외한 나머지 90%의 정규분포 환자에 대한 정보를 생성할 수 있다. 여기서, 상위 및 하위 각 5%의 정보 제거와 관련하여 조금 더 설명을 부가하면, 모든 데이터셋(dataset)에서 상위, 하위 각 5%의 정보를 제거한다는 의미는 아니다. 왜냐하면, 때로는 상, 하위 5%의 환자가 가지고 있는 정보가 오히려 90%의 정규분포 환자가 가진 정보보다 유의미할 수 있기 때문이다. 따라서, 본 발명에서는 가상환자 정보 생성의 토대가 되는 기본 데이터셋을 철저히 분석하여 표본의 위치에 따라 소수 표본을 노이즈 표본, 불안정 표본, 경계 표본, 그리고 정규성을 따르는 표본으로 분류하여 각각의 샘플 특성에 따라 오버샘플링(oversampling)하는 방식을 도입한다. 여기서, 오버샘플링은 데이터가 불균형한 분포를 가지는 경우, 모델의 학습이 제대로 이루어지지 않을 확률이 높기 때문에 낮은 비율 클래스의 데이터 수를 증가함으로써 데이터 불균형을 해소하는 것을 말한다.
또한, 상기 정보 생성부(120)가 상기 수집된 정보를 바탕으로 머신 러닝 AI 모델(150m)을 이용하여 각각의 질병에 대해 각각 대응하는 그룹을 형성함에 있어서, 상기 수집된 정보가 상호 간에 상관관계가 있는지의 여부를 체크하여, 상관관계가 있는 정보들은 그 상관성을 분석하여 같은 그룹으로 묶고, 상관관계가 없는 정보들은 그들끼리(즉, 상관관계가 없는 정보들끼리) 임의로 섞어서 해당 질병(질환)의 가상 환자군을 생성할 수 있다. 이때, 생성한 가상 환자 정보의 양은 정보 수집부(110)에서 획득할 수 있는 정보의 양과 질에 따라 달라질 수 있다. 이상과 관련하여 일 예를 들어 부연 설명해 보면, 예를 들면, ○○대학교 부속병원에서 진료 또는 치료를 받는 1000명의 환자군으로서 남자는 620명, 여자는 380명이며, 그 평균 나이는 남성 46세, 여성 52세이다. 남성 및 여성 모두 복부비만율은 50% 이상이었으며, 체질량 지수는 28∼38로 측정되었고, 그 평균은 32였다.
또한, 상기 정보 생성부(120)가 상기 환자의 정보(데이터)를 생성함에 있어서, 문자, 숫자로 구성된 환자 정보는 통계 프로그램 R studio를 포함한 머신 러닝 툴(machine learning tool)을 이용하여 표준 정규분포 데이터를 생성할 수 있다.
가상 환자군 생성부(130)는 상기 정보 생성부(120)에 의해 생성된 각 그룹의 환자의 정보(데이터)를 바탕으로 상기 머신 러닝 AI 모델(150m)을 이용하여 복합 질환을 앓고 있는 새로운 가상 환자군을 각각 생성한다. 여기서, 이와 같은 가상 환자군 생성부(130)가 상기 각 그룹의 환자의 정보(데이터)를 바탕으로 머신 러닝 AI 모델(150m)을 이용하여 복합 질환을 앓고 있는 새로운 가상 환자군을 각각 생성함에 있어서, 앙상블(Ensemble) 기법을 포함한 머신 러닝 기법을 이용하여 각 질환별 환자의 정보(데이터)를 조합해서 새로운 가상 환자군을 생성할 수 있다. 여기서, 앙상블(Ensemble) 기법이란 여러 개의 모델을 조합하여 결과를 예측하는 기법으로서, 정확도가 높은 모델 하나를 사용하는 것보다 정확도가 낮은 모델을 여러 개 조합하여 사용하는 방식이 오히려 좋은 성능을 가질 수 있다라는 가정하에 만들어진 기법을 말한다.
가상 환자 정보 생성부(140)는 상기 가상 환자군 생성부(130)에 의해 생성된 각각의 가상 환자군에 대하여 상기 머신 러닝 AI 모델(150m)을 이용하여 각각의 가상 환자군에 속하는 가상 환자의 정보를 생성한다. 이때, 생성된 가상 환자의 정보에 대한 신뢰성을 확인하기 위해 각종 통계적 기법을 이용하여 가상 환자의 정보를 검증할 수 있다. 여기서, 이상과 같은 가상 환자 정보 생성부(140) 및 상기 가상 환자군 생성부(130)와 관련하여 설명을 조금 더 부가해 보기로 한다. 예를 들어, 고혈압 환자군, 당뇨 환자군, 고지혈증 환자군이 있을 때, 이들을 조합하여 다양한 환자군 및 그 정보를 생성할 수 있다. 즉, 고혈압, 당뇨, 고지혈증을 모두 앓고 있는 환자군 및 그 정보, "고혈압 + 당뇨", "고혈압 + 고지혈증", "당뇨 + 고지혈증"을 앓고 있는 환자군의 정보, 고혈압, 당뇨, 고지혈증 중 하나씩만 앓고 있는 환자군 및 그 정보를 생성할 수 있다.
제어부(150)는 상기 정보 수집부(110), 정보 생성부(120), 가상 환자군 생성부(130), 가상 환자 정보 생성부(140)의 상태 체크 및 동작을 제어하고, 상기 머신 러닝 AI 모델(150m)에 의한 각각의 질병에 대응하는 각 그룹의 형성, 새로운 가상 환자군 생성 및 가상 환자의 정보 생성을 위한 제어 명령을 송출한다. 이와 같은 제어부(150)는 마이크로프로세서나 마이크로컨트롤러 등으로 구성될 수 있다.
이상과 같은 구성을 가지는 본 발명에 따른 머신 러닝을 이용한 가상 환자 정보 생성 시스템(100)은 바람직하게는 상기 가상 환자 정보 생성부(140)에 의해 생성된 가상 환자의 정보(데이터)에 대해 SPSS, R Studio를 포함하는 통계 프로그램을 통해 신뢰도를 검증하고 필요시 수정하는 데이터 검증/수정부(160)를 더 포함할 수 있다.
또한, 이상과 같은 구성을 가지는 본 발명에 따른 머신 러닝을 이용한 가상 환자 정보 생성 시스템(100)은 하나의 컴퓨터 시스템(예를 들면, 데스크탑 컴퓨터)으로 구성될 수도 있다.
그러면, 이하에서는 이상과 같은 구성을 가지는 본 발명에 따른 머신 러닝을 이용한 가상 환자 정보 생성 시스템을 기반으로 한 가상 환자 정보 생성 방법에 대해 설명해 보기로 한다.
도 2는 본 발명의 실시예에 따른 머신 러닝을 이용한 가상 환자 정보 생성 방법의 실행 과정을 나타낸 흐름도이다.
도 2를 참조하면, 본 발명에 따른 머신 러닝을 이용한 가상 환자 정보 생성 방법은, 전술한 바와 같은 정보 수집부(110), 정보 생성부(120), 가상 환자군 생성부(130), 가상 환자 정보 생성부(140) 및 제어부(150)를 포함하는 머신 러닝을 이용한 가상 환자 정보 생성 시스템(100)에 기반한 가상 환자 정보 생성 방법으로서, 먼저 상기 정보 수집부(110)에 의해 공개되어 있고, 사용 가능한 질병 관련 정보 또는 환자의 생체 정보를 수집한다(단계 S201). 여기서, 상기 공개되어 있고, 사용 가능한 질병 관련 정보 또는 환자의 생체 정보는 의학서적이나 의학논문에 기재되어 있는 정보 또는 데이터, 공개되고 법적으로 사용 가능한 환자의 생체정보 데이터, 공개되고 법적으로 사용 가능한 환자의 의료 영상(이미지) 데이터(예를 들면, X-ray, CT, MRI, 초음파 등)중 적어도 어느 하나를 포함할 수 있다.
이렇게 하여 정보 수집부(110)에 의해 정보가 수집되면, 정보 생성부(120)는 상기 수집된 정보를 바탕으로 머신 러닝 AI 모델(150m)을 이용하여 각각의 질병에 대해 각각 대응하는 그룹을 형성하고, 형성된 각 그룹에 속하는 환자의 정보(데이터)를 생성한다(단계 S202). 여기서, 상기 각 그룹에 속하는 환자의 정보(데이터)를 생성함에 있어서, 상기 각 그룹에 속하는 환자 집단이 표준 정규분포를 따르는 것으로 가정하고, 평균을 정한 후 상위 및 하위 각 5%를 제외한 나머지 90%의 정규분포 환자에 대한 정보를 생성할 수 있다. 여기서, 상위 및 하위 각 5%의 정보 제거와 관련하여 조금 더 설명을 부가하면, 전술한 바와 같이 모든 데이터셋(dataset)에서 상위, 하위 각 5%의 정보를 제거한다는 의미는 아니다. 왜냐하면, 때로는 상, 하위 5%의 환자가 보유하고 있는 정보가 오히려 90%의 정규분포 환자가 보유한 정보보다 더 유의미할 수 있기 때문이다. 따라서, 본 발명에서는 가상환자 정보 생성의 토대가 되는 기본 데이터셋을 철저히 분석하여 표본의 위치에 따라 소수 표본을 노이즈 표본, 불안정 표본, 경계 표본, 그리고 정규성을 따르는 표본으로 분류하여 각각의 샘플 특성에 따라 오버샘플링(oversampling)하는 방식을 도입한다. 여기서, 오버샘플링은 데이터가 불균형한 분포를 가지는 경우, 모델의 학습이 제대로 이루어지지 않을 확률이 높기 때문에 낮은 비율 클래스의 데이터 수를 증가함으로써 데이터 불균형을 해소하는 것을 말한다.
또한, 상기 정보 생성부(120)가 상기 수집된 정보를 바탕으로 머신 러닝 AI 모델(150m)을 이용하여 각각의 질병에 대해 각각 대응하는 그룹을 형성함에 있어서, 상기 수집된 정보가 상호 간에 상관관계가 있는지의 여부를 체크하여, 상관관계가 있는 정보들은 그 상관성을 분석하여 같은 그룹으로 묶고, 상관관계가 없는 정보들은 그들끼리 임의로 섞어서 해당 질병(질환)의 가상 환자군을 생성할 수 있다.
또한, 상기 정보 생성부(120)가 상기 환자의 정보(데이터)를 생성함에 있어서, 문자, 숫자로 구성된 환자 정보는 통계 프로그램 R studio를 포함한 머신 러닝 툴(machine learning tool)을 이용하여 표준 정규분포 데이터를 생성할 수 있다.
이상과 같이, 상기 정보 생성부(120)에 의해 각 그룹에 속하는 환자의 정보(데이터)가 생성되면, 가상 환자군 생성부(130)는 그 생성된 각 그룹의 환자의 정보(데이터)를 바탕으로 머신 러닝 AI 모델(150m)을 이용하여 복합 질환을 앓고 있는 새로운 가상 환자군을 각각 생성한다(단계 S203). 여기서, 상기 각 그룹의 환자의 정보(데이터)를 바탕으로 머신 러닝 AI 모델(150m))을 이용하여 복합 질환을 앓고 있는 새로운 가상 환자군을 각각 생성함에 있어서, 앙상블(Ensemble) 기법을 포함한 머신 러닝 기법을 이용하여 각 질환별 환자의 정보(데이터)를 조합해서 새로운 가상 환자군을 생성할 수 있다.
이후, 가상 환자 정보 생성부(140)는 상기 생성된 각각의 가상 환자군에 대하여 머신 러닝 AI 모델(150m)을 이용하여 각각의 가상 환자군에 속하는 가상 환자의 정보를 생성한다(단계 S204).
여기서, 이상과 같은 본 발명에 따른 머신 러닝을 이용한 가상 환자 정보 생성 방법은, 바람직하게는 상기 단계 S204 이후에 데이터 검증/수정부(160)가 SPSS, R Studio를 포함하는 통계 프로그램을 통해 데이터의 신뢰도를 검증하고 필요시 수정하는 단계를 더 포함할 수 있다.
여기서, 또한 상기 가상 환자군 생성부(130)에 의한 가상 환자군 생성 및 가상 환자 정보 생생부(140)에 의한 가상 환자 정보 생성과 관련하여 조금 더 설명을 부가해 보기로 한다.
가상 환자군을 생성함에 있어서, 1차적으로 판단해야 할 사항은 가지고 있는 질병(질환) 또는 환자 생체정보 관련 실제 데이터가 모집단의 특성을 잘 반영하고 있는지에 대한 사항이다. 실제로 가지고 있는 데이터가 모집단의 특성을 잘 반영한 샘플이라고 본다면, 이를 토대로 새로운 데이터(정보)를 생성하여 기존의 가지고 있는 데이터와 합쳐서 사용할 경우 데이터가 부족한 문제도 어느 정도 해결이 가능하고, 가상 환자군 및 가상 환자의 정보 생성에 대한 연구에도 도움이 될 수 있다.
따라서, 아무것도 없는 상태에서 데이터를 생성해내는 것이 아니라 기존의 데이터를 기반으로 새로운 데이터를 생성해내어 데이터 변수(data variable)가 겹치는 케이스에서 사용해야 한다. 예를 들어, 위에서 언급한 당뇨병의 경우, 당뇨병 환자의 실제 데이터에 포함되어 있는 체질량 지수, 복부 비만율, 혈당 등의 데이터가 있지만, 당뇨병 과제(task)를 위해 수집된 데이터가 아니라 비만이나 심장질환을 조사하기 위해 수집된 데이터에서도 당뇨병 환자가 있다면 이를 추출해서 겹치는 변수들을 조합하여 데이터를 생성해낼 수 있다.
더불어 최근 인공지능 분야에서도 유사한 문제에 대한 조사가 많이 이루어지고 있다.
지도 학습(supervised learning)은 가지고 있는 데이터에 대한 라벨이 이미 정해진 상태에서 학습을 진행하는 것을 말한다. 즉, 각각의 데이터가 어떤 데이터인지 그 해답을 알고 있는 상태에서 학습을 진행한다.
비지도학습(unsupervised learning)은 위의 지도 학습과는 달리 사용하는 데이터에 특징(label)이 부여되어 있지 않다. 본 발명에서는 이러한 경우에 기존 데이터를 기반으로 비지도학습 데이터들이 어떻게 구성되어 있는지를 분석한다. 이와 같은 비지도학습 방법에도 본 발명의 방법 및 의료 데이터를 적용해 볼 수 있다.
이를 순차적으로 정리해 보면 다음과 같다.
1) 당뇨병 환자들에 대해서 수집 가능한 데이터를 최대한 수집한다.
2) 수집된 데이터에 어떠한 변수들이 있는지, 그리고 각 데이터가 당뇨병과 어느 정도의 상관관계를 가지는지 파악한다.
3) 당뇨병과 높은 상관관계를 가지는 변수들 순으로 정리 후, 이를 포함하고 있는 다른 오픈 데이터(open data)를 찾아본다.
4) 만약 당뇨병 환자들예게서 중요하게 여겨지는 변수가 "나이, 성별, 체질량지수, 복부비만율, 혈당, 혈압" 이라고 할 경우, 그러면 오픈 데이터 중에서 당뇨병을 판단하기 위해 수집된 데이터가 아니더라도 "나이, 성별, 체질량지수, 복부비만율, 혈당, 혈압"을 포함하고 있는 데이터를 찾아서 모두 수집한다.
5) 기존 당뇨병 데이터를 군집화하여 n개의 군집으로 나눈다. 만약 당뇨병인지, 아닌지를 판단하겠다고 하면 2개의 군집으로 나눈다.
6) 새롭게 수집된 데이터와 기존 당뇨병 데이터를 중복되는 변수들을 기준으로 하여 합친다.
7) 군집화 기법(clustering methods)을 통해 새롭게 추가된 데이터들도 함께 n개의 군집으로 나눈다.
8) 새롭게 추가된 데이터들이 어떤 군집에 속했는지 확인하고 라벨링 (labeling) 작업을 해준다.
9) 모든 데이터가 라벨(label)을 가지고 있을 경우, 이를 통해 도 3에 도시된 바와 같이, 군집화를 다시 진행하고 이상치는 제거한다.
한편, 위에서 언급한 “단계 S204 이후에 데이터 검증/수정부(160)가 SPSS, R Studio를 포함하는 통계 프로그램을 통해 데이터의 신뢰도를 검증하고 필요시 수정하는 단계를 더 포함할 수 있다.”라는 내용과 관련하여 조금 더 설명을 부가해 보기로 한다.
도 4a 및 도 4b는 본 발명에 도입되는 생성된 가상 환자들의 데이터를 의사들에 의해 평가하는 평가 툴(tool)을 나타낸 도면이다.
도 4a를 참조하면, 이는 본 발명에 따른 머신 러닝을 이용한 가상 환자 정보 생성 시스템 및 방법에 의해 생성된 가상 환자들의 데이터를 의사들(최소 3명의 의사)에 의해 평가하는 평가 툴(tool)로서, 먼저 (a)와 같이 임의의 가상 환자(본 예시에서는 '홍길동')에 대해 기본 증상(예컨대, 의식상태, 혈압, 맥박, 호흡상태, 체온, 통증강도 등)을 입력 받고, (b) 및 (c)와 같이 신체의 다양한 부분(예컨대, 호흡기계, 순환기계, 근골격계, 비뇨기계…, 등)과 특정 부위(예를 들면, 눈, 코, 귀 등) 또는 특정 사항(예를 들면, 정신건강, 물질오용 등)의 해당되는 증상이나 사항을 선택하도록 한다.
이후, 도 4b의 (d)와 같이 해당되는 증상을 모두 선택하도록 하고, (d)에서의 선택 결과에 따라 (e)와 같이 질문에 따른 답을 선택하도록 한다. 그리고 최종적으로 (f)와 해당 가상 환자에 대한 문진결과를 출력한다. 여기서, 이상과 같은 평가 툴은 하나의 소프트웨어 프로그램(일종의 application)으로서 본 발명을 활용하는 의료진의 개인 단말기(일반적인 PC나 스마트폰 등)에 제공될 수 있다.
이상과 같은 평가 툴(tool)에 의해 획득된 데이터에 대해 최소 3명의 의사들이 해당 데이터가 데이터로서 적합한지를 직접 검토하고, 과반수 이상이 적합하지 않다고 판단한 환자 데이터는 추출 및 제거하게 된다. 그리고 이와 같은 일련의 과정은 연구자(혹은 의료진)가 원하는 양의 데이터를 확보할 때까지 다수회 반복 수행한다. 이와 같이 기존 데이터와 생성된 가상 환자 정보(데이터)를 결합하여 본 발명에서의 머신 러닝을 이용한 가상 환자 정보의 원본 데이터로 활용할 수 있게 된다. 또한, 이와 같이 해서 생성된 가상 환자 정보는 일반 환자는 물론, 특히 응급 환자들에 대한 진료 및 치료에 유용하게 활용될 수 있다.
이상의 설명과 같이, 본 발명에 따른 머신 러닝을 이용한 가상 환자 정보 생성 시스템 및 방법은 머신 러닝 AI 모델을 이용하여 환자의 생체 정보와 의료 영상(이미지) 등을 결합하여 실제 환자와 비슷한 수준의 가상의 환자의 정보를 생성하여 제공함으로써, 의료 현장에서 일반 환자는 물론 응급 환자들의 진료 및 치료에 많은 도움을 줄 수 있는 장점이 있다.
이상, 바람직한 실시 예를 통하여 본 발명에 관하여 상세히 설명하였으나, 본 발명은 이에 한정되는 것은 아니며, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 다양하게 변경, 응용될 수 있음은 당해 기술분야의 통상의 기술자에게 자명하다. 따라서, 본 발명의 진정한 보호 범위는 다음의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술적 사상은 본 발명의 권리 범위에 포함되는 것으로 해석되어야 할 것이다.
100: (본 발명)머신 러닝을 이용한 가상 환자 정보 생성 시스템
110: 정보 수집부 120: 정보 생성부
130: 가상 환자군 생성부 140: 가상 환자 정보 생성부
150: 제어부 150m: 머신 러닝 AI 모델
160: 데이터 검증/수정부

Claims (14)

  1. 공개되어 있고, 사용 가능한 질병 관련 정보 또는 환자의 생체 정보를 수집하는 정보 수집부와;
    상기 정보 수집부에 의해 수집된 정보를 바탕으로 머신 러닝 AI(Artificial Intelligence) 모델을 이용하여 각각의 질병에 대해 각각 대응하는 그룹을 형성하고, 형성된 각 그룹에 속하는 환자의 정보(데이터)를 생성하는 정보 생성부와;
    상기 정보 생성부에 의해 생성된 각 그룹의 환자의 정보(데이터)를 바탕으로 상기 머신 러닝 AI 모델을 이용하여 복합 질환을 앓고 있는 새로운 가상 환자군을 각각 생성하는 가상 환자군 생성부와;
    상기 가상 환자군 생성부에 의해 생성된 각각의 가상 환자군에 대하여 상기 머신 러닝 AI 모델을 이용하여 각각의 가상 환자군에 속하는 가상 환자의 정보를 생성하는 가상 환자 정보 생성부; 및
    상기 정보 수집부, 정보 생성부, 가상 환자군 생성부, 가상 환자 정보 생성부의 상태 체크 및 동작을 제어하고, 상기 머신 러닝 AI 모델에 의한 각각의 질병에 대응하는 각 그룹의 형성, 새로운 가상 환자군 생성 및 가상 환자의 정보 생성을 위한 제어 명령을 송출하는 제어부를 포함하고,
    상기 정보 생성부가 상기 각 그룹에 속하는 환자의 정보(데이터)를 생성함에 있어서, 가상환자 정보 생성의 토대가 되는 기본 데이터셋을 분석하여 표본의 위치에 따라 소수 표본을 노이즈 표본, 불안정 표본, 경계 표본, 그리고 정규성을 따르는 표본으로 분류하여 각각의 샘플 특성에 따라 오버샘플링(oversampling)하는 방식으로 각 그룹에 속하는 환자의 정보(데이터)를 생성하며,
    상기 가상 환자군 생성부가 상기 각 그룹의 환자의 정보(데이터)를 바탕으로 머신 러닝 AI 모델을 이용하여 복합 질환을 앓고 있는 새로운 가상 환자군을 각각 생성함에 있어서, 머신 러닝 기법을 이용하여 각 질환별 환자의 정보(데이터)를 조합해서 새로운 가상 환자군을 생성하는 머신 러닝을 이용한 가상 환자 정보 생성 시스템.
  2. 제1항에 있어서,
    상기 가상 환자 정보 생성부에 의해 생성된 가상 환자의 정보(데이터)에 대해 SPSS, R Studio를 포함하는 통계 프로그램을 통해 신뢰도를 검증하고 필요시 수정하는 데이터 검증/수정부를 더 포함하는 머신 러닝을 이용한 가상 환자 정보 생성 시스템.
  3. 제1항에 있어서,
    상기 정보 수집부에 의해 수집되는 상기 공개되어 있고, 사용 가능한 질병 관련 정보 또는 환자의 생체 정보는 의학서적이나 의학논문에 기재되어 있는 정보 또는 데이터, 공개되고 법적으로 사용 가능한 환자의 생체정보 데이터, 공개되고 법적으로 사용 가능한 환자의 의료 영상(이미지) 데이터 중 적어도 어느 하나를 포함하는 머신 러닝을 이용한 가상 환자 정보 생성 시스템.
  4. 삭제
  5. 제1항에 있어서,
    상기 정보 생성부가 상기 수집된 정보를 바탕으로 머신 러닝 AI 모델을 이용하여 각각의 질병에 대해 각각 대응하는 그룹을 형성함에 있어서, 상기 수집된 정보가 상호 간에 상관관계가 있는지의 여부를 체크하여, 상관관계가 있는 정보들은 그 상관성을 분석하여 같은 그룹으로 묶고, 상관관계가 없는 정보들은 그들끼리 임의로 섞어서 해당 질병(질환)의 가상 환자군을 생성하는 머신 러닝을 이용한 가상 환자 정보 생성 시스템.
  6. 제1항에 있어서,
    상기 정보 생성부가 상기 환자의 정보(데이터)를 생성함에 있어서, 문자, 숫자로 구성된 환자 정보는 통계 프로그램 R studio를 포함한 머신 러닝 툴(machine learning tool)을 이용하여 표준 정규분포 데이터를 생성하는 머신 러닝을 이용한 가상 환자 정보 생성 시스템.
  7. 삭제
  8. a) 정보 수집부에 의해 공개되어 있고, 사용 가능한 질병 관련 정보 또는 환자의 생체 정보를 수집하는 단계와;
    b) 정보 생성부가 상기 수집된 정보를 바탕으로 머신 러닝 AI 모델을 이용하여 각각의 질병에 대해 각각 대응하는 그룹을 형성하고, 형성된 각 그룹에 속하는 환자의 정보(데이터)를 생성하는 단계와;
    c) 가상 환자군 생성부가 상기 단계 b)에서 생성된 각 그룹의 환자의 정보(데이터)를 바탕으로 머신 러닝 AI 모델을 이용하여 복합 질환을 앓고 있는 새로운 가상 환자군을 각각 생성하는 단계; 및
    d) 가상 환자 정보 생성부가 상기 생성된 각각의 가상 환자군에 대하여 머신 러닝 AI 모델을 이용하여 각각의 가상 환자군에 속하는 가상 환자의 정보를 생성하는 단계를 포함하고,
    상기 단계 b)에서 상기 정보 생성부가 상기 각 그룹에 속하는 환자의 정보(데이터)를 생성함에 있어서, 가상환자 정보 생성의 토대가 되는 기본 데이터셋을 분석하여 표본의 위치에 따라 소수 표본을 노이즈 표본, 불안정 표본, 경계 표본, 그리고 정규성을 따르는 표본으로 분류하여 각각의 샘플 특성에 따라 오버샘플링(oversampling)하는 방식으로 각 그룹에 속하는 환자의 정보(데이터)를 생성하며,
    상기 단계 c)에서 상기 각 그룹의 환자의 정보(데이터)를 바탕으로 머신 러닝 AI 모델을 이용하여 복합 질환을 앓고 있는 새로운 가상 환자군을 각각 생성함에 있어서, 머신 러닝 기법을 이용하여 각 질환별 환자의 정보(데이터)를 조합해서 새로운 가상 환자군을 생성하는 머신 러닝을 이용한 가상 환자 정보 생성 방법.
  9. 제8항에 있어서,
    상기 단계 d) 이후에 데이터 검증/수정부가 SPSS, R Studio를 포함하는 통계 프로그램을 통해 데이터의 신뢰도를 검증하고 필요시 수정하는 단계를 더 포함하는 머신 러닝을 이용한 가상 환자 정보 생성 방법.
  10. 제8항에 있어서,
    상기 단계 a)에서 상기 공개되어 있고, 사용 가능한 질병 관련 정보 또는 환자의 생체 정보는 의학서적이나 의학논문에 기재되어 있는 정보 또는 데이터, 공개되고 법적으로 사용 가능한 환자의 생체정보 데이터, 공개되고 법적으로 사용 가능한 환자의 의료 영상(이미지) 데이터 중 적어도 어느 하나를 포함하는 머신 러닝을 이용한 가상 환자 정보 생성 방법.
  11. 삭제
  12. 제8항에 있어서,
    상기 단계 b)에서 상기 수집된 정보를 바탕으로 머신 러닝 AI 모델을 이용하여 각각의 질병에 대해 각각 대응하는 그룹을 형성함에 있어서, 상기 수집된 정보가 상호 간에 상관관계가 있는지의 여부를 체크하여, 상관관계가 있는 정보들은 그 상관성을 분석하여 같은 그룹으로 묶고, 상관관계가 없는 정보들은 그들끼리 임의로 섞어서 해당 질병(질환)의 가상 환자군을 생성하는 머신 러닝을 이용한 가상 환자 정보 생성 방법.
  13. 제8항에 있어서,
    상기 단계 b)에서 상기 환자의 정보(데이터)를 생성함에 있어서, 문자, 숫자로 구성된 환자 정보는 통계 프로그램 R studio를 포함한 머신 러닝 툴(machine learning tool)을 이용하여 표준 정규분포 데이터를 생성하는 머신 러닝을 이용한 가상 환자 정보 생성 방법.
  14. 삭제
KR1020220013903A 2021-02-01 2022-02-03 머신 러닝을 이용한 가상 환자 정보 생성 시스템 및 방법 KR102503609B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020210013842 2021-02-01
KR20210013842 2021-02-01

Publications (2)

Publication Number Publication Date
KR20220111212A KR20220111212A (ko) 2022-08-09
KR102503609B1 true KR102503609B1 (ko) 2023-02-24

Family

ID=82844500

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220013903A KR102503609B1 (ko) 2021-02-01 2022-02-03 머신 러닝을 이용한 가상 환자 정보 생성 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102503609B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102550465B1 (ko) 2023-02-28 2023-07-03 주식회사 인포인 인공지능 기반의 가상 환자 관리 시스템

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102100698B1 (ko) * 2019-05-29 2020-05-18 (주)제이엘케이 앙상블 학습 알고리즘을 이용한 인공지능 기반 진단 보조 시스템

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102237449B1 (ko) * 2018-05-18 2021-04-07 주식회사 송아리아이티 환자 진단 학습 방법, 서버 및 프로그램
KR20210051141A (ko) 2019-10-30 2021-05-10 주식회사 스키아 환자의 증강 현실 기반의 의료 정보를 제공하는 방법, 장치 및 컴퓨터 프로그램

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102100698B1 (ko) * 2019-05-29 2020-05-18 (주)제이엘케이 앙상블 학습 알고리즘을 이용한 인공지능 기반 진단 보조 시스템

Also Published As

Publication number Publication date
KR20220111212A (ko) 2022-08-09

Similar Documents

Publication Publication Date Title
JP6907831B2 (ja) コンテキストベースの患者類似性の方法及び装置
US8548823B2 (en) Automatically determining ideal treatment plans for complex neuropsychiatric conditions
US9483613B2 (en) Determination of neuropsychiatric therapy mechanisms of action
KR20170061222A (ko) 건강데이터 패턴의 일반화를 통한 건강수치 예측 방법 및 그 장치
US7996242B2 (en) Automatically developing neuropsychiatric treatment plans based on neuroimage data
CN102110192A (zh) 基于诊断要素数据关联的疾病辅助判断方法
CN109074869A (zh) 医疗诊断支持装置、信息处理方法、医疗诊断支持系统以及程序
KR102332740B1 (ko) 딥러닝을 이용하여 환자의 증상을 진단하는 방법, 장치 및 시스템
KR20190132290A (ko) 환자 진단 학습 방법, 서버 및 프로그램
KR20200027091A (ko) 환자의 주증상과 진단 관계에 대하여 인공신경망 기법을 이용하여 유사성 정도를 추론하여 진단 사례를 추천하는 시스템
EP1922679A2 (en) Dynamic healthcare modeling
CN109615012A (zh) 基于机器学习的就诊数据异常识别方法、设备及存储介质
KR20220007275A (ko) 음성활동 평가를 이용한 기분삽화(우울삽화, 조증삽화) 조기 진단을 위한 정보 제공 방법
CN110874409A (zh) 病情分级预测系统、方法、电子设备及可读存储介质
KR20200131020A (ko) 의료기계 학습 시스템
Aubinet et al. Residual implicit and explicit language abilities in patients with disorders of consciousness: a systematic review
KR102503609B1 (ko) 머신 러닝을 이용한 가상 환자 정보 생성 시스템 및 방법
Houlton How artificial intelligence is transforming healthcare
Woźniacka et al. Artificial intelligence in medicine and dermatology
Windriyani et al. Expert system for detecting mental disorder with Forward Chaining method
WO2021072084A1 (en) Systems and methods for cognitive diagnostics for neurological disorders: parkinson's disease and comorbid depression
CN116705302A (zh) 一种用于早期判断心脏术后急性肾损伤风险的XGBoost机器学习模型构建方法
Kalina et al. System for selecting relevant information for decision support
KR20210142921A (ko) 안면 표정 인식을 이용한 기분장애 진단을 위한 정보 제공 방법
KR102587222B1 (ko) Copd 환자를 위한 인공지능 기반의 약제 처방 시스템

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant