KR102024375B1 - 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법 - Google Patents

만성신장 질환의 질병 위험도를 예측하는 장치 및 방법 Download PDF

Info

Publication number
KR102024375B1
KR102024375B1 KR1020170183818A KR20170183818A KR102024375B1 KR 102024375 B1 KR102024375 B1 KR 102024375B1 KR 1020170183818 A KR1020170183818 A KR 1020170183818A KR 20170183818 A KR20170183818 A KR 20170183818A KR 102024375 B1 KR102024375 B1 KR 102024375B1
Authority
KR
South Korea
Prior art keywords
disease
chronic kidney
risk
kidney disease
genetic information
Prior art date
Application number
KR1020170183818A
Other languages
English (en)
Other versions
KR20180079209A (ko
Inventor
박수경
김종효
태주호
안충현
이주연
Original Assignee
서울대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교 산학협력단 filed Critical 서울대학교 산학협력단
Publication of KR20180079209A publication Critical patent/KR20180079209A/ko
Application granted granted Critical
Publication of KR102024375B1 publication Critical patent/KR102024375B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)

Abstract

본원은 만성신장 질환의 질병 위험도를 예측하는 장치에 관한 것으로서, 만성신장 질환의 질병 위험도를 예측하는 장치는 상기 만성신장 질환의 질환자의 유전자 정보 및 상기 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 유전자 정보와 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 유전자 정보 기계학습 모델을 생성하는 유전자 정보 기계학습 모델 생성부, 상기 유전자 정보 기계학습 모델을 이용하여 상기 유전자 정보로부터 핵심 유전자 정보를 선택하는 핵심 유전자 정보 선택부, 상기 만성신장 질환의 질환자의 생활상태 변수 및 건강상태 변수를 포함하는 복수의 상태 변수, 상기 핵심 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 복수의 상태 변수 및 핵심 유전자 정보 중 적어도 하나 이상과 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 질병 위험도 기계학습 모델을 생성하는 질병 위험도 기계학습 모델 생성부, 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 입력받는 정보 입력부 및 상기 질병 위험도 기계학습 모델에 상기 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 상기 대상자의 대상자 질병 위험도를 예측하는 질병 위험도 예측부를 포함할 수 있다.

Description

만성신장 질환의 질병 위험도를 예측하는 장치 및 방법 { APPARATUS AND METHOD FOR PREDICTING DISEASE RISK OF CHRONIC KIDNEY DISEASE }
본원은 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법에 관한 것이다.
건강위험예측 도구 구현 및 그에 따른 고위험군에 대한 중재가 활발히 이루어지고 있는 질환 중 대표적인 것은 유방암이고, 서양에서 구현된 유방암 발생위험도 평가모델에 따르면 크게 세 가지로 나눌 수 있다.
그 중 하나는 일반인구에서 기저위험도 (baseline risk)와 위험요인의 조합(joint risk)으로 절대 발생 가능성을 예측하는 모델이고, 다른 하나는 위험인자의 상대적인 위험 크기에 따라 발생 가능성을 예측하는 방법일 수 있으며, 세 번째는 유전성 유방암 발생 예측에 특화하여 사용되는 모델로 가족력을 기반으로 BRCA 유전자 돌연변이 보유 가능성 또는 BRCA 유전자 돌연변이 보유 가능성에 기반 하여 유방암 발생 가능성을 예측할 수 있다.
현재 국내에서는 대한가정의학회에서 한국형 건강위험예측도구를 개발하였으며 이를 적용하여 국민건강보험공단에서 건강검진을 받은 국민들을 대상으로 공단 홈페이지 <건강iN>에 개인별 맞춤형 건강관리 프로그램 서비스를 제공되고 있다.
하지만, 국민건강보험공단에서 제공하는 건강위험예측도구는 사망률에 대해 그 타당도가 입증된 바 있으나, 개별 사망 원인에 대한 분석이 부족하고, 이 도구의 목적이 교정 가능한 건강위험요인을 발견하여 실천하도록 하는 것이 주된 목적이므로 개인의 현재 건강 상태를 측정하기에는 부적절하다는 한계가 있다.
이에 따라, 개인의 생활습관 및 건강 상태를 기반으로 하여 향후의 질병 발생 확률을 예측하는 방법이 요구된다.
본원의 배경이 되는 기술은 한국공개특허공보 제10-2004-0012368(공개일: 2004.02.11)호에 개시되어 있다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 개인의 생활 습관, 건강 상태 및 유전정보를 이용하여 만성신장질환 발생위험을 예측하는 알고리즘을 구축하는 것이다. 구축된 알고리즘을 바탕으로 이러한 만성신장질환 위험 혹은 사망과 같은 최종 건강상태를 예측하는 데 활용할 수 있는 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법을 제공하고자 한다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 만성신장질환의 합병증으로 볼 수 잇는 만성신장질환, 심혈관질환 발생과 질병이 나쁜 건강상태(악화)로 인해 최종적으로 발생할 수 있는 사망을 최종건강상태로 예측할 수 있는 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법을 제공하고자 한다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 유전 정보 빅데이터를 사전 분석하고 유전 지표를 선정하는 방식을 기존 통계학적 확률 모형과 다중퍼셉트론 방식의 인공신경망 (ANN) 방식 두 개를 이용하여 핵심 유전자를 선정한다. 인공신경망 방식에서 부가 유전자를 선정하고, 최종건강상태인 만성신장질환, 심혈관질환 발생 위험과 사망 위험은 세 가지 방법에 의하여 예측할 수 있는 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법을 제공하고자 한다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 본원은 질병관리본부의 한국인 유전체 역학조사 사업의 일환인 안산-안성 코호트 의 유전체 자료원과 추적 자료원을 기반으로 인공신경망 기반 예측 모형과 통계적 확률모형을 기반으로 한 질병 위험 예측 모형을 구축하고, 구축된 모형을 이용해 만성신장질환 발생 위험 확률을 예측해 일차예방을 위한 생활습관변화 안내 경로를 표시 할 수 있는 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법을 제공하고자 한다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로, 인공신경망 기반의 질병 발생 예측 모형 및 통계학적 확률기반의 질병 발생 예측 모형을 구축하고, 각 질병 발생 위험에 대한 대상자의 확률값을 연산하고, 시각화 알고리즘을 통해 대상자 맞춤형 예방관리서비스 모형을 구축할 수 있는 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법을 제공하고자 한다.
다만, 본원의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들도 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상기한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본원의 일 실시예에 따르면, 만성신장 질환의 질병 위험도를 예측하는 장치는, 상기 만성신장 질환의 질환자의 유전자 정보 및 상기 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 유전자 정보와 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 유전자 정보 기계학습 모델을 생성하는 유전자 정보 기계학습 모델 생성부, 상기 유전자 정보 기계학습 모델을 이용하여 상기 유전자 정보로부터 핵심 유전자 정보를 선택하는 핵심 유전자 정보 선택부, 상기 만성신장 질환의 질환자의 생활상태 변수 및 건강상태 변수를 포함하는 복수의 상태 변수, 상기 핵심 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 복수의 상태 변수 및 핵심 유전자 정보 중 적어도 하나 이상과 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 질병 위험도 기계학습 모델을 생성하는 질병 위험도 기계학습 모델 생성부, 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 입력받는 정보 입력부 및 상기 질병 위험도 기계학습 모델에 상기 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 상기 대상자의 대상자 질병 위험도를 예측하는 질병 위험도 예측부를 포함할 수 있다.
본원의 일 실시예에 따르면, 만성신장 질환 질병 위험도 예측 장치는 기 만성신장 질환의 질환자의 유전자 정보 및 상기 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 유전자 정보 각각의 존재 유무 또는 값에 따라 상기 만성신장 질환의 질병 위험도를 확률적으로 나타내는 유전자 정보 통계확률 모델을 생성하는 유전자 정보 통계확률 모델 생성부를 더 포함하되, 상기 핵심 유전자 정보 선택부는 상기 유전자 정보 통계확률 모델 및 상기 유전자 정보 기계학습 모델을 이용하여 상기 유전자 정보로부터 핵심 유전자 정보를 선택할 수 있다.
본원의 일 실시예에 따르면, 만성신장 질환 질병 위험도 예측 장치는 상기 만성신장 질환의 질환자의 상기 복수의 상태 변수, 상기 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 복수의 상태 변수 및 유전자 정보 중 적어도 하나 이상의 존재 유무 또는 값에 따라 상기 만성신장 질환의 질병 위험도를 확률적으로 나타내는 통계확률 모델을 생성하는 통계확률 모델 생성부를 더 포함하되, 상기 기계학습 모델 및 상기 통계확률 모델에 상기 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 상기 대상자의 대상자 질병 위험도를 예측하는 질병 위험도 예측부를 포함할 수 있다.
본원의 일 실시예에 따르면, 상기 통계확률 모델 생성부는, 상기 만성신장 질환의 질환자의 상기 복수의 상태 변수, 상기 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하고, 상기 복수의 상태 변수 중 상기 만성신장 질환과 연관된 적어도 하나 이상의 상태 변수를 선택하고, 상기 적어도 하나 이상의 상태 변수의 존재 여부 또는 값에 대한 상기 만성신장 질환의 질병 위험도를 확률적으로 나타내는 기본 통계확률 모델을 생성하는 기본 통계확률 모델 생성부 및 상기 만성신장 질환과 연관된 유전자 정보의 존재 여부에 따라 상기 만성신장 질환의 질병 위험도에 가중치를 적용함으로써, 기본 통계확률 모델로부터 상기 통계확률 모델을 생성하는 가중치 통계확률 모델 생성부를 포함할 수 있다.
본원의 일 실시예에 따르면, 상기 유전자 정보 기계학습 모델은 상기 복수의 상태 변수 중 제 1 상태 변수를 입력층으로 하고 상기 복수의 상태 변수 중 제 2 상태 변수를 은닉층으로 할 때, 상기 입력층과 은닉층 사이의 관계의 정도를 학습하는 제 1 학습을 하고, 상기 은닉층 및 상기 유전자 정보를 입력층으로 하고 상기 질병 위험도를 출력층으로 할 때, 상기 은닉층과 출력층 사이의 관계의 정도를 학습하는 제 2 학습을 함으로써, 상기 복수의 상태 변수 및 유전자 정보 중 적어도 하나 이상과 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습할 수 있다.
본원의 일 실시예에 따르면, 상기 유전자 정보 기계학습 모델은 상기 복수의 상태 변수의 이전 시점 상태 변수를 입력층으로 하고 상기 복수의 상태 변수의 현재 시점 상태 변수를 은닉층으로 할 때, 상기 입력층과 은닉층 사이의 관계의 정도를 학습하는 제 1 학습을 하고, 상기 은닉층 및 상기 유전자 정보를 입력층으로 하고 상기 질병 위험도를 출력층으로 할 때, 상기 은닉층과 출력층 사이의 관계의 정도를 학습하는 제 2 학습을 함으로써, 상기 복수의 상태 변수 및 유전자 정보 중 적어도 하나 이상과 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습할 수 있다.
본원의 일 실시예에 따르면, 상기 유전자 정보 기계학습 모델은 상기 복수의 상태 변수 중 제 1 상태 변수 및 이전 시점 은닉층을 입력층으로 하고 상기 복수의 상태 변수 중 제 2 상태 변수 또는 현재 시점 상태 변수를 은닉층으로 할 때, 상기 입력층과 은닉층 사이의 관계의 정도를 학습하는 제 1 학습을 하고,상기 은닉층 및 상기 유전자 정보를 입력층으로 하고 상기 질병 위험도를 출력층으로 할 때, 상기 은닉층과 출력층 사이의 관계의 정도를 학습하는 제 2 학습을 함으로써, 상기 복수의 상태 변수 및 유전자 정보 중 적어도 하나 이상과 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 것이되, 상기 제 1 학습은 [수학식 1]을 기반으로, 상기 입력층과 은닉층 사이의 관계의 정도를 학습하는 것이되,
Figure 112017131046759-pat00001
이때, 상기
Figure 112017131046759-pat00002
는 t 시점에서의 은닉층이고, 상기
Figure 112017131046759-pat00003
은 이전 시점 은닉층이고,
Figure 112017131046759-pat00004
는 제 1 상태 변수이고, 상기
Figure 112017131046759-pat00005
는 입력층과 은닉층 사이의 제 1 유형의 관계의 정도를 나타내는 제 1 가중치이고, 상기
Figure 112017131046759-pat00006
는 입력층과 은닉층 사이의 제 2 유형의 관계의 정도를 나타내는 제 2 가중치일 수 있다.
본원의 일 실시예에 따르면, 상기 제 2학습은 [수학식 1] 및 [수학식2]를 기반으로 상기 은닉층과 출력층 사이의 관계의 정도를 학습하는 것이되,
Figure 112017131046759-pat00007
이때, 상기 y는 출력층이고, 상기
Figure 112017131046759-pat00008
는 은닉층과 출력층 사이의 관계의 정도를 나타내는 제 3 가중치이고,
Figure 112017131046759-pat00009
는 은닉층이고, 상기
Figure 112017131046759-pat00010
는 입력층 중 유전자 정보와 출력층 사이의 관계의 정도를 나타내는 제4 가중치이고, z는 입력층 중 유전자 정보일 수 있다.
본원의 일 실시예에 따르면, 상기 유전자 정보 기계학습 모델 생성부는, [수학식 3]을 기반으로 상기 복수의 상태 변수 및 유전자 정보 중 적어도 하나 이상과 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 기계학습 모델을 생성 시 발생하는 오차에 가중치를 갱신하는 것이되,
Figure 112017131046759-pat00011
상기 E는 상기 기계학습 모델 생성부의 오차의 검출값이고, 상기 t는 상기 만성신장 질환의 발생 여부이고, 상기 y는 기계학습 모델을 통해 예측된 질병 위험도이고,
Figure 112017131046759-pat00012
는 오차에 따른 과적합(overfitting)을 방지하기 위한 L2 정규식일 수 있다.
본원의 일 실시예에 따르면, 상기 질병 위험도 예측부는, 상기 대상자의 질병 위험도 예측 결과를 기 설정된 분류 항목에 기반하여 시각화하는 것일 수 있다.
본원의 일 실시예에 따르면, 상기 질병 위험도 예측부는, 상기 대상자의 질병 위험도 예측 결과와 연계된 질병 예방 관리 정보를 제공할 수 있다.
본원의 일 실시예에 따르면, 만성신장 질환의 질병 위험도를 예측하는 방법은, 상기 만성신장 질환의 질환자의 유전자 정보 및 상기 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 유전자 정보와 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 유전자 정보 기계학습 모델을 생성하는 단계,상기 유전자 정보 기계학습 모델을 이용하여 상기 유전자 정보로부터 핵심 유전자 정보를 선택하는 단계,상기 만성신장 질환의 질환자의 생활상태 변수 및 건강상태 변수를 포함하는 복수의 상태 변수, 상기 핵심 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 복수의 상태 변수 및 핵심 유전자 정보 중 적어도 하나 이상과 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 질병 위험도 기계학습 모델을 생성하는 단계,대상자의 대상자 상태 변수 및 대상자 유전자 정보를 입력받는 단계 및상기 질병 위험도 기계학습 모델에 상기 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 상기 대상자의 대상자 질병 위험도를 예측하는 단계를 포함할 수 있다.
상술한 과제 해결 수단은 단지 예시적인 것으로서, 본원을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 추가적인 실시예가 존재할 수 있다.
전술한 본원의 과제 해결 수단에 의하면, 질병관리본부의 한국인 유전체 역학조사 사업의 일환인 안산-안성 코호트 의 유전체 자료원과 추적 자료원을 기반으로 인공신경망 기반 예측 모형과 통계적 확률모형을 기반으로 한 질병 위험 예측 모형을 구축하고, 구축된 모형을 이용해 만성신장질환 발생 위험 확률을 예측해 일차예방을 위한 생활습관변화 안내 경로를 표시할 수 있다.
전술한 본원의 과제 해결 수단에 의하면, 개인의 생활 습관, 건강 상태 및 유전정보를 이용하여 만성신장질환 발생위험을 예측하는 알고리즘을 구축하는 것이다. 구축된 알고리즘을 바탕으로 이러한 만성신장질환 위험 혹은 사망과 같은 최종 건강상태를 예측하는 데 활용할 수 있다.
전술한 본원의 과제 해결 수단에 의하면, 만성신장질환의 합병증으로 볼 수 잇는 만성신장질환, 심혈관질환 발생과 질병이 나쁜 건강상태(악화)로 인해 최종적으로 발생할 수 있는 사망을 최종건강상태로 예측할 수 있는 만성신장 질환의 질병 위험도를 예측할 수 있다.
전술한 본원의 과제 해결 수단에 의하면, 유전 정보 빅데이터를 사전 분석하고 유전 지표를 선정하는 방식을 기존 통계학적 확률 모형과 다중퍼셉트론 방식의 인공신경망 (ANN) 방식 두 개를 이용하여 핵심 유전자를 선정한다. 인공신경망 방식에서 부가 유전자를 선정하고, 최종건강상태인 만성신장질환, 심혈관질환 발생 위험과 사망 위험은 세 가지 방법에 의하여 예측할 수 있다.
전술한 본원의 과제 해결 수단에 의하면, 고혈압과 당뇨병, 대사증후군을 가진 대상자는 이후 다른 대사 이상 질환을 동반할 위험이 높기 때문에 조기 진단을 통해 치료 가능성을 높이며, 더 나아가 사망위험을 높이는 대사 이상 질환으로 인한 합병증 및 심혈관질환, 만성심장질환 발생 및 사망 위험을 감소시킬 수 있어 개인의 삶의 질의 향상을 이룰 수 있다.
전술한 본원의 과제 해결 수단에 의하면, 지역사회 일반 인구집단의 건강관리 현장 적용에 활용하거나, 임상시험에서 고위험군 선정 등에 활용할 수 있고, 위험예측모델의 웹(WEB) 및 앱(APP)을 활용한 제품에 활용할 수 있다.
도 1은 본원의 일 실시예에 따른 만성신장 질환의 질병을 예측하는 장치의 개략적인 시스템이다.
도 2는 본원의 일 실시예에 따른 만성신장 질환의 질병을 예측하는 장치의 개략적인 구성도이다.
도3은 본원의 일 실시예에 따른 질병 위험도 기계학습 모델 생성부 및 유전자 정보 통계확률 모델 생성부에 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 대상자의 만성질환 질병 위험도를 예측하는 과정을 개략적으로 도시한 도면이다.
도 4는 본원의 일 실시예에 따른 유전자 정보 통계 확률 모델 생성부의 질병유병 위험 발생위험 확률 예측과 사망위험을 통한 위험도를 평가하는 실시예를 설명하기 위한 예시도이다.
도 5는 본원의 일 실시예에 따른 만성신장 질환 위험도 예측 과정의 일 실시예를 설명하기 위한 도면이다.
도 6은 본원의 일 실시예에 따른 만성신잘 질환 질병 위험도 예측 장치의 일 실시예를 설명하기 위한 도면이다.
도7은 본원의 일 실시예에 따른 유전자 정보 통계 확률 모델 생성부의 일 실시예를 설명하기 위한 도면이다.
도8은 본원의 일 실시예에 따른 복수의 만성신장질환의 클러스터링을 나타낸 도면이다.
도9는 본원의 일 실시예에 따른 만성신장질환의 질병위험에 대한 안내지도를 시각화한 도면이다.
도 10a 및 도10j은 본원의 일 실시예에 따른 핵심 유전자를 선택하고, 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 대상자의 만성질환 질병 위험도를 예측하는 일 실시예를 설명하기 위한 도면이다.
도 11a내지 도11f는 본원의 일 실시예에 따른 만성신장 질환 발생위험 예측 모형의 예측 검증과정의 실시예를 설명하기 위한 도면이다.
도12는본원의 일 실시예에 따른 만성신장 질환 질병 위험도 예측 방법의 개략적인 흐름도이다.
본원 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다.
본원 명세서 전체에서, 어떤 부재가 다른 부재 "상에", "상부에", "상단에", "하에", "하부에", "하단에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.
본원 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함" 한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
본원은 복수의 상태 변수(생활 습관, 건강 상태) 및 유전정보를 이용하여 만성신장질환 발생위험을 예측하는 알고리즘을 구축하고, 구축된 알고리즘을 바탕으로 만성신장질환 위험 혹은 사망과 같은 최종 건강상태를 예측하는데 활용할 수 있는 만성신장 질환의 질병 위험도를 예측하는 장치에 관한 것이다.
본원의 일 실시예에 따르면, 도 1은 본원의 일 실시예에 따른 만성신장 질환의 질병 위험도를 예측하는 장치(100)의 개략적인 시스템도이다. 도 1을 참조하면, 만성신장 질환의 질병 위험도를 예측하는 장치(100)는 질병 예측 서버(200)와 네트워크로 연동될 수 있으나, 이에 한정되는 것은 아니다. 예시적으로, 질병 예측 서버(200)는 질병관리본부의 한국인 유전체역학조사사업의 일부인 안산-안성 코호트의 유전체 자료원과 1차부터 7차까지의 추적된 추적 자료를 포함할 수 있다. 질병 예측 서버(200)는 만성신장 질환의 질병을 예측하는 장치(100)로 질병관리본부의 한국인 유전체 역학조사 사업의 일환인 안산-안성 코호트의 유전체 자료원과 추적 자료원의 정보를 네트워크를 통해 제공할 수 있다.
본원의 일 실시예에 따르면, 만성신장 질환의 질병을 예측하는 장치(100)는 적어도 하나의 인터페이스 장치를 구비하는 디바이스로서, 예를 들면, 스마트폰(Smartphone), 스마트패드(Smart Pad), 태블릿 PC, 웨어러블 디바이스 등과 PCS(Personal Communication System), GSM(Global System for Mobile communication), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말기 같은 모든 종류의 무선 통신 장치 및 데스크탑 컴퓨터, 스마트 TV와 같은 고정용 단말기일 수도 있다. 예시적으로 디바이스에는 사용자에게 질병 위험도를 예측 정보를 제공하기 위한 만성신장 질환의 질병 예측 어플리케이션(application)이 설치 및 구동될 수 있으나, 이에 한정되는 것은 아니다.
이하 설명되는 만성신장 질환의 질병을 예측하는 방법은 만성신장 질환의 질병을 예측하는 장치(100)에서 수행될 수 있다. 다른 일예로, 만성신장 질환의 질병을 예측하는 방법의 각 단계는 질병 예측 서버(200)에서 수행될 수 있다. 또 다른 일예로, 만성신장 질환의 질병을 예측하는 방법의 각 단계 중 일부 단계는 만성신장 질환의 질병을 예측하는 장치(100)에서 수행되고, 나머지 단계는 질병 예측 서버(200)에서 수행될 수 있다. 예를 들어, 만성신장 질환의 질병을 예측하는 장치(100)는 만성신장 질환의 질병을 예측하는 방법의 일부 단계로서 사용자 입력을 수신하고, 수신된 사용자 입력을 서버로 전송하며, 사용자 입력에 응답하여 서버로부터 전성된 정보를 화면에 표시하는 기능만을 수행할 수 있으며, 이 밖에 만성신장 질환의 질병을 예측하는 방법의 나머지 단계는 질병 예측 서버(200)에서 수행될 수 있다. 이하에서는 설명의 편의를 위하여 만성신장 질환의 질병을 예측하는 장치(100)에서 만성신장 질환의 질병을 예측하는 방법이 수행되는 예에 대하여 설명하기로 한다.
본원의 일 실시예에 따르면, 만성신장 질환의 질병을 예측하는 장치(100)는 만성신장질환 발생위험을 예측하는 알고리즘에서 예측된 위험도를 가시화하고, 가시화된 질병 발생 확률 예측 과정과 중간건강결과를 중재하며, 최종건강상태가 호전됨을 이미지화하여 보여주는 도구를 제공함으로써, 질병위험예방관리 서비스 모형을 생성할 수 있다.
본원의 일 실시예에 따르면, 만성신장 질환의 질병을 예측하는 장치(100)는 인공지능 알고리즘을 기반으로 유전 정보 빅데이터를 사전 분석하고 유전 지표를 선정하는 방식을 기존 통계학적 확률 모형과 다중퍼셉트론 방식의 인공신경망 (ANN) 방식 두 개를 이용하여 핵심 유전자를 선정할 수 있다. 또한, 만성신장 질환의 질병을 예측하는 장치(100)는 인공신경망 방식에서 부가 유전자를 선정할 수 있다.
또한, 만성신장 질환의 질병을 예측하는 장치(100)는 최종건강상태인 만성신장질환, 심혈관질환 발생 위험과 사망 위험을 세가지 방법에 의하여 예측할 수 있다. 첫 번째 방법은 머신러닝 방법 중 하나인 다중퍼셉트론 방식의 인공신경망 (ANN) 방식이며, 두 번째 방법은 머신러닝 방법인 랜덤 포레스트와 부스팅 방식, 세 번째 방법은 기존의 통계확률모형으로 환경요인, 생활습관, 질병력과 임상검사자료를 이용하여, 사전에 건강요인을 군별로 선정하고 모형을 만든 다음 이 모형에서 각 질병이나 사망과 인과적 측면에서 볼 때 역인과성 관계이거나 (질병 발생 이후 변화되는 인자인 경우) 혹은 우연이나 노이즈, 바이어스로 인해 포함되어졌을 가능성이 있을만한 요인들은 제외하고, 이후 의학적으로 중요한 요인이나 모형에서 빠진 요인 변수를 추가하여 최종 모형을 형성한 다음, 최종 모형을 이용하여 시간의존적 콕스회귀모형에서 최종 건강상태 위험을 예측할 수 있다.
또한, 본원의 일 실시예에 따르면, 만성신장 질환의 질병을 예측하는 장치(100)는 인공신경망 방식을 적용하여 변수들의 차원을 줄이고 우선순위를 정하여 건강요인들을 입력으로할 수 있다. 이때, 입력 순서는 질병의 자연사 개념을 고려하여 출생 시점부터 결정되어 있는 요인부터 이후 노출될 수 있는 요인들로 이후, 질병 발생, 악화, 사망의 순서로 순차적으로 포함되도록 할 수 있다.
도2는 본원의 일 실시예에 따른 만성신장 질환의 질병을 예측하는 장치(100)의 개략적인 구성도이다. 도2를 참조하면, 만성신장 질환의 질병을 예측하는 장치(100)는 정보 입력부(110), 유전자 정보 기계학습 모델 생성부(120), 핵심 유전자 정보 선택부(130), 질병 위험도 기계학습 모델 생성부(140), 유전자 정보 통계확률 모델 생성부(150), 통계확률 모델 생성부(160) 및 질병 위험도 예측부(170)를 포함할 수 있으나, 이에 한정되는 것은 아니다.
정보 입력부(110)는 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 입력받을 수 있다. 정보 입력부(110)는 대상자의 대상자 상태 변수를 획득하기 위해, 복수의 생활상태 변수 및 건강상태 변수를 사용자 단말로 제공할 수 있다. 예를 들어, 사용자 단말에는 복수의 생활상태 변수 및 건강상태 변수에 해당하는 목록들이 출력되고, 사용자는 본인의 생활상태 변수 및 건강상태 변수에 해당하는 정보들을 입력할 수 있다.
본원의 일 실시예에 따르면, 상태 변수는 연령, 성별, 가구 수입 등의 인구학적 특성과, 가족력, 과거력 등의 역학 정보, 음주력, 흡연력, 신체 활동, 영양 섭취 등의 생활 습관, 신장, 체중, 혈액 검사 결과와 같은 신체 계측 치 및 임상 정보를 보함하는 대상자의 생활상태 변수 및 건강상태 변수일 수 있다. 유전자 정보는 단일염기 다형성 형태로 수집된 유전 정보일 수 있다.
정보 입력부(110)는 질병 예방 서버(200)로부터 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 입력받을 수 있다. 질병 예방 서버(200)는 질병관리본부의 한국인 유전체역학조사사업의 일부인 안산-안성 코호트의 유전체 자료원과 1차부터 7차까지의 추적된 추적 자료를 대상자의 대상자 상태 변수 및 대상자 유전자 정보로 제공할 수 있으나, 이에 한정되는 것은 아니다.
유전자 정보 기계학습 모델 생성부(120)는 만성신장 질환의 질환자의 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하여, 유전자 정보와 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 유전자 정보 기계학습 모델을 생성할 수 있다.
핵심 유전자 정보 선택부(130)는 유전자 정보 기계학습 모델을 이용하여 상기 유전자 정보로부터 핵심 유전자 정보를 선택할 수 있다. 또한, 핵심 유전자 정보 선택부(130)는 유전자 정보 통계확률 모델 및 유전자 정보 기계학습 모델을 이용하여 유전자 정보로부터 핵심 유전자 정보를 선택할 수 있다. 예시적으로 핵심 유전자 정보 선택부(130)는 질병 발생 및 사망 위험 예측에 대한 값을, 빅데이터 요인 정보를 입력하여 머신러닝을 이용하여 훈련된 예측 값과 최소한으로 사전에 의학적 인과적 요인으로 구성된 통계확률 예측 값 각각 2개를 산출할 수 있다.
본원의 일 실시예에 따르면, 핵심 유전자 정보 선택부(130)는 개인의 자료 상태 (미싱 정도, 오분류 정도, 질 상태 등)과 양에 따라 최적의 예측력을 가진 모형에 의해 위험 예측이 되도록 할 수 있다. 예시적으로, 개인의 정보량이 빅데이터 수준일 경우 예측력이 더 좋은 머신러닝 방법을 사용하여 예측값이 산출되도록 하고 개인의 정보가 한정되어 최소한의 의학적 정보로만 구성되어 있다면 통계적 모형에서 예측값을 산출하도록 구성할 수 있다.
본원의 일 실시예에 따르면, 핵심 유전자 정보 선택부(130)는 질병과 관련된 유전자 지표를 1) 추정사구체여과율과 연관된 유전자 지표, 2) 알부민뇨 (Urine albumin)와 연관된 유전자 지표, 3) 단백뇨 (Urine total protein)과 연관된 유전자 지표를 각각 선정하여 이를 핵심 유전자1로 선별할 수 있다. 또한, 핵심 유전자 정보 선택부(130)는 다층 퍼셉트론 구조의 인공신경망 (ANN) 모형을 이용하여 유의한 확률값의 기준을 1x10-8부터 1x10-6 사이에 두어 유전자 지표를 선정하고, 이 때 선정된 유전자 지표를 핵심 유전자2로 선별할 수 있다.
핵심 유전자 정보 선택부(130)는 유의한 확률값의 기준을 1x10-5부터 1x10-3 사이에 두어 10-1씩 높여가면서 조절하여 선정되는 SNP지표 수, 정밀도, 정확도, 설명력 등이 가장 갑자기 많이 차이가 나는 확률값을 기준으로 하여 핵심 유전자 지표와 부가 유전자 지표를 선정하여 최소 기준 확률값을 결정할 수 있다.
질병 위험도 기계학습 모델 생성부(140)는 만성신장 질환의 질환자의 생활상태 변수 및 건강상태 변수를 포함하는 복수의 상태 변수, 핵심 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하여, 복수의 상태 변수 및 핵심 유전자 정보 중 적어도 하나 이상과 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 질병 위험도 기계학습 모델을 생성할 수 있다.
질병 위험도 기계학습 모델 생성부(140)는 복수의 상태 변수 및 유전자 정보 중 적어도 하나 이상과 만성신장 질환의 질병 위험도 사이의 관계의 정보를 학습하는 기계학습 모델을 생성할 수 있다. 예시적으로, 기계학습 모델은 순환신경망 (Recurrent Neural Network, RNN) 과 다층퍼셉트론신경망 (Multi-layer perceptron neural network, MLP)을 이용해 기계학습 모델을 생성할 수 있다.
본원의 일 실시예에 따르면, 질병 위험도 기계학습 모델 생성부(140)는 만성신장 질환의 각 질병과 관련된 유전자를 다층 퍼셉트론 신경망을 연결해 순환신경망에 연결하여 입력할 수 있다. 또한, 질병 위험도 기계학습 모델 생성부(140)는 반복 측정된 복수의 상태 변수를 통해 각 역학적 변수의 시간에 따른 상관관계뿐만 아니라 변수간의 상관관계까지 분석이 가능하도록 이를 순환 신경망에 순차적으로 입력하여 분석할 수 있다.
질병 위험도 기계학습 모델 생성부(140)는 대상자의 대상자 상태 변수 및 대상자 유전자의 정보를 반복측정하고 반복 측정된 정보를 입력할 수 있다. 질병 위험도 기계학습 모델 생성부(140)는 대상자의 대상자 상태 변수 및 대상자 유전자의 정보를 기반으로 생활습관 및 신체계측치, 임상치 등의 반복 측정된 값들에 대해 생활습관에 변화가 있는지를 확인할 수 있다. 질병 위험도 기계학습 모델 생성부(140)는 반복 측정된 값들 중 유사한 양상을 보이는 집단끼리 구분 하여 각각에 대한 클러스터를 생성하고, 성별, 질병별로 비슷한 생활습관 변화 양상을 보이는 집단을 구분할 수 있다. 질병 위험도 기계학습 모델 생성부(140)는 대상자의 대상자 유전자 정보를 기반으로, 만성신장 질환의 각 질병별로 생활습관의 변화와 관련된 유의한 유전자를 선별할 수 있다. 유의한 유전자는 만성신장 질환의 각 질병과 연계된 유전자일 수 있다.
본원의 일 실시예에 따르면, 질병 위험도 기계학습 모델 생성부(140)는 반복측정된 대상자의 대상자 상태 변수를 인경신공망 중 순환신경망에 순차적으로 입력하고, 만성신장 질환의 각 질병별로 생활습관의 변화와 관련된 유의한 유전자는 다층퍼셉트론을 통해 순환신경망에 연결될 수 있다.
질병 위험도 기계학습 모델 생성부(140)는 생활상태 변수 및 건강상태 변수를 포함하는 복수의 상태 변수와 같은 시계열 데이터를 입력할 수 있는 인공 신경망 중 순환신경망을 적용하여 기계학습 모델을 생성할 수 있다. 질병 위험도 기계학습 모델 생성부(140)는 단일 시점에서 수집한 유전 정보를 통합 입력하기 위해 기존 순환신경망 마지막 층에 다층 퍼셉트론 신경망을 추가적으로 연결할 수 있다. 질병 위험도 기계학습 모델 생성부(140)는 마지막의 출력 층에 만성신장 질환 발생 유/무를 설정할 수 있다.
예시적으로, 인공 신경망은 입력층(input layer), 은닉층(hidden layer) 및 출력층(output layer)의 3가지의 층으로 구분될 수 있다. 각 층들은 노드들로 구성되어 있으며, 입력층은 시스템 외부로부터 입력자료를 받아들여 시스템으로 입력 자료를 전송할 수 있다. 은닉층은 시스템 안쪽에 자리잡고 있으며 입력 값을 넘겨받아 입력자료를 처리한 뒤 결과를 산출할 수 있다. 출력층은 입력 값과 현재 시스템 상태에 기준하여 시스템 출력 값을 산출할 수 있다. 입력층은 예측값(출력변수)을 도출하기 위한 예측변수(입력변수)의 값들을 입력할 수 있다. 입력층에 n개의 입력 값들이 있다면 입력층은 n개의 노드를 가지게 되며, 본원에서의 입력층에 입력되는 값은 생활상태 변수 및 건강상태를 포함하는 복수의 상태 변수와 유전자 정보일 수 있다. 은닉층은 복수의 입력 노드로부터 입력 값을 받아 가중합을 계산하고, 이 값을 전이함수에 적용하여 출력층에 전달할 수 있다. 예시적으로 기계학습 모델의 입력층은 복수의 상태 정보, 유전자 정보, 이전 시점의 은닉층이 될 수 있고, 은닉층은 복수의 상태 정보, 복수의 상태 정보를 그룹핑한 정보일 수 있고, 출력층은 질병 위험도를 나타내는 것일 수 있다.
본원의 일 실시예에 따르면 기계학습 모델은 복수의 상태 변수 중 제 1 상태 변수를 입력층으로 하고 복수의 상태 변수 중 제 2 상태 변수를 은닉층으로 할 때, 입력층과 은닉층 사이의 관계의 정보를 학습하는 제 1 학습을 수행할 수 있다. 또한, 기계학습 모델은 복수의 상태 변수의 이전 시점 상태 변수를 입력층으로 하고 복수의 상태 변수의 현재 시점 상태 변수를 은닉층으로 할 때, 입력층과 은닉층 사이의 관계의 정보를 학습하는 제 1 학습을 수행할 수 있다.
기계학습 모델은 [수학식1]을 기반으로, 입력층과 은닉층 사이의 관계의 정도를 학습할 수 있다. 관계의 정도는 입력층에 입력 받은 정보들의 가중합을 계산한 값을 의미할 수 있으나, 이에 한정되는 것은 아니다.
[수학식1]
Figure 112017131046759-pat00013
이때,
Figure 112017131046759-pat00014
는 t 시점에서의 은닉층이고,
Figure 112017131046759-pat00015
은 t시점의 이전 시점 은닉층이고,
Figure 112017131046759-pat00016
는 제 1 상태 변수이고,
Figure 112017131046759-pat00017
는 입력층과 은닉층 사이의 제 1 유형의 관계의 정도를 나타내는 제 1 가중치이고,
Figure 112017131046759-pat00018
는 입력층과 은닉층 사이의 제 2 유형의 관계의 정도를 나타내는 제 2 가중치이다. 예시적으로, [수학식 1]에서
Figure 112017131046759-pat00019
는 t시점의 복수의 상태 변수 중 제 1 상태 변수이고,
Figure 112017131046759-pat00020
는 t시점의 은닉층을 나타내고
Figure 112017131046759-pat00021
는 복수의 상태 변수(입력 변수)와 은닉층간의 가중치이고,
Figure 112017131046759-pat00022
는 은닉층들간의 가중치일 수 있으나, 이에 한정되는 것은 아니다. 일예로, 제 1 유형의 관계의 정도는 시간에 따른 복수의 상태 변수들관의 상관관계(가중치)일 수 있고, 제 2 유형의 관계의 정도는 복수의 상태 변수간의 상관관계(가중치)일 수 있으나, 이에 한정되진 않는다.
기계학습 모델은 [수학식 1]에 표현된 순환신경망에 반복 측정된 복수의 상태 변수 (예를 들어, 개개인의 생활 습관 및 건강 상태 변수)를 입력하여 시간에 따른 상관관계뿐만 아니라 생활 습관 및 건강 상태 변수간의 상관관계까지 분석할 수 있다.
본원의 일 실시예에 따르면, 기계학습 모델은 은닉층 및 유전자 정보를 입력층으로 하고 질병 위험도를 출력층으로 할 때, 은닉층과 출력층 사이의 관계의 정보를 학습하는 제 2 학습을 수행할 수 있다. 또한, 기계학습 모델은 은닉층 및 유전자 정보를 입력층으로 하고 질병 위험도를 출력층으로 할 때, 은닉층과 출력층 사이의 관계의 정보를 학습하는 제 2 학습을 수행할 수 있다.
기계학습 모델은 [수학식 2]를 기반으로 은닉층과 출력층 사이의 관계의 정도를 학습할 수 있다. 제 2학습은 [수학식 1] 및 [수학식2]를 기반으로 은닉층과 출력층 사이의 관계의 정도를 학습할 수 있다. 기계학습 모델은 [수학식1] 및[수학식2]를 기반으로 입력층, 은닉층 및 출력층 사이의 관계의 정보를 학습하고 출력층의 결과로 질병 위험도의 예측 결과를 학습할 수 있다.
[수학식 2]
Figure 112017131046759-pat00023
이때, y는 출력층이고,
Figure 112017131046759-pat00024
는 은닉층과 출력층 사이의 관계의 정도를 나타내는 제 3 가중치이고,
Figure 112017131046759-pat00025
는 은닉층이고,
Figure 112017131046759-pat00026
는 입력층 중 유전자 정보와 출력층 사이의 관계의 정도를 나타내는 제4 가중치이고, z는 입력층 중 유전자 정보일 수 있다. 일예로, 제 3 가중치는 질병 위험을 예측하기 위해 복수의 상태 변수와 출력층 사이의 관계를 나타낸 관계의 정도이고, 제 4가중치는 특정 유전자에 가중치를 부여하기 위한 유전자 정보와 출력층 사이의 관계의 정도일 수 있다.
본원의 일 실시예에 따르면, 유전 정보는 단일 시점으로 수집되었으므로 순환신경망에 통합시키기 위해 [수학식 2]와 같이 순환신경망 마지막 층에 다층 퍼셉트론 신경망을 연결하여 입력할 수 있다. 예시적으로, 유전 정보는 단일염기 다형성 형태로 수집되었으며, 각 만성신장 질병 각각에 대해 기존에 알려진 유전정보를 대립유전자에 따른 위험 지수(Risk fator)로 변환하여 입력할 수 있다. 기계학습 모델은 제 2 학습을 통해, 은닉층과 출력층 사이의 관계의 정도, 즉 은닉층과 출력층 사이의 가중치를 학습할 수 있다.
본원의 일 실시예에 따르면, 질병 위험도 기계학습 모델 생성부(140)는 [수학식 3]을 기반으로 복수의 상태 변수 및 유전자 정보 중 적어도 하나 이상과 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 기계학습 모델 생성 시 발생하는 오차에 가중치를 갱신할 수 있다.
[수학식 3]
Figure 112017131046759-pat00027
E는 질병 위험도 기계학습 모델 생성부(140)의 오차의 검출값이고, t는 만성신장 질환의 발생 여부이고, y는 기계학습 모델을 통해 예측된 질병 위험도이고,
Figure 112017131046759-pat00028
는 오차에 따른 과적합(overfitting)을 방지하기 위한 L2 정규식이다.
[수학식 3]은 질병 위험도 기계학습 모델 생성부(140)의 오차식이며 산출된 오차를 역전파 알고리즘을 통해 인공신경망의 가중치를 학습할 수 있다. 학습 과정 중 발생하는 노이즈(noise)에 따른 과적합을 방지하기 위해 L2 정화규 식을 추가하였으며, t는 각 실제 만성신장 질환에 대한 발생 유 또는 무를 나타내는 것일 수 있으나, 이에 한정되는 것은 아니다.
본원의 일 실시예에 따르면, 질병 위험도 기계학습 모델 생성부(140)는 구축된 기계학습 모델(예를 들어, 인공신경망)의 타당도 검증을 위해 만성신장 질환의 질환자(전체 대상자)를 3그룹으로 구분하여 교차검증을 시행할 수 있다. 질병 위험도 기계학습 모델 생성부(140)는 검증 후 문헌 조사를 통해 만성신장 질병 발생과 연관된 생활상태 변수 및 건강상태 변수를 포함하는 복수의 상태 변수에 가중치를 조정하여 견고한 기계학습 모델을 생성할 수 있다.
예시적으로, 질병 위험도 기계학습 모델 생성부(140)는 다층 퍼셉트론 구조의 인공신경망 (ANN) 모형을 이용하여 기계학습 모델을 생성할 수 있다, 질병 위험도 기계학습 모델 생성부(140)는 인공신경망에 입력되는 변수를 질병의 자연사 개념에 따르는데, 출생 시점부터 결정되어 있는 생식세포 유전자와 이후 반복적인 환경 노출, 환경노출에 의해 결정되는 후생유전자, 반복적 환경 노출과 유전자와의 상호작용, 이후 생체 내에서의 변화를 통해 관찰되는 임상검사 지표들의 변화, 이후 질병에 대한 진단으로 인한 만성신장질환의 발생과 악화, 사망 등을 고려하여 순차적으로 입력되도록 하여 차원을 줄이는 방법을 적용하여 기계학습 모델을 생성할 수 있다. 질병 위험도 기계학습 모델 생성부(140)는 인공신경망에 입력되는 변수를 생식세포와 관련된 유전정보부터 입력하되, 위에서 언급한 원칙에 따라 핵심 유전 정보를 먼저 포함하여 차원을 줄여 첫 번째 층을 만들고, 부가 유전 정보를 추가로 포함하여 차원을 줄여 두 번째 층을 만들며, 다음 생활습관 요인 등의 환경 요인들을 포함하여 차원을 줄여 세 번째 층을 만들고, 다음 임상검사 지표들을 포함하여 네 번째 층을 생성할 수 있다. 질병 위험도 기계학습 모델 생성부(140)는 이후 은닉층을 거쳐 반복적 훈련을 통해 만성신장질환의 발생을 예측할 수 있다.
본원의 일 실시예에 따르면, 질병 위험도 기계학습 모델 생성부(140)는 모든 입력 요인(복수의 상태 변수)들을 포함하여 질병 발생 및 사망 위험을 예측하는 머신러닝 모형으로, 여러 개의 결정 트리들을 임의적으로 훈련하여 학습하는 방식인 랜덤 포레스트 (Random forest)와 잘못 분류된 변수에 집중하여 새로운 분류규칙을 반복해서 만드는 방법인 부스팅(Boosting)을 이용하는 방식으로, 이 방식들은 학습을 반복함으로써 예측모형의 정확도를 향상시키는 방법을 적용하여 기계학습 모델을 생성할 수 있다.
본원의 일 실시예에 따르면, 유전자 정보 통계 확률 모델 생성부(150)는 만성신장 질환의 질환자의 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하여, 유전자 정보 각각의 존재 유무 또는 값에 따라 만성신장 질환의 질병 위험도를 확률적으로 나타내는 유전자 정보 통계확률 모델을 생성할 수 있다. 예시적으로, 유전자 정보 통계 확률 모델 생성부(150)는 통계적 확률 모형을 이용하여 변수를 선정한 다음 다중 일반인구집단의 평균적인 건강요인 노출을 제외한 시간변이 콕스회귀모형을 이용한 방식을 통해 질병 발생 및 사망 위험을 예측 모델을 생성할 수 있다.
유전자 정보 통계 확률 모델 생성부(150)는 질병 발생 혹은 사망에 관련된 요인 변수들은 사전에 선정 과정을 거쳐 최종 모형에 포함하도록 할 수 있다. 변수 선정은 콕스비례위험 모형에서 전진선택법, 후진선택법, 단계 삽입법 등의 3가지 과정에서 2번 이상 동일한 변수가 선정될 때 우선적으로 요인 변수로 선정하여 모형을 만든 다음 이 모형에서 각 질병이나 사망과 인과적 측면에서 볼 때 역인과성 관계이거나 (질병 발생 이후 변화되는 인자인 경우) 혹은 우연이나 노이즈, 바이어스로 인해 포함되어졌을 가능성이 있을만한 요인들은 제외하고, 이후 의학적으로 중요한 요인이나 모형에서 빠진 요인 변수를 추가하여 최종 유전자 정보 통계 확률 모델을 생성할 수 있다. 유전자 정보 통계 확률 모델 생성부(150)는 최종 모형을 이용하여 이후 우선 선정된 변수들의 다변량모형에서 공선성 문제가 없으면서 가장 적합한 모형을 선정하여 최적의 요인 변수를 선정한 다음, 이후 의학적으로 중요한 요인 변수이나 통계모형에서 빠진 변수를 추가하여 최종 유전자 정보 통계 확률 모델을 생성할 수 있다.
예시적으로 유전자 정보 통계 확률 모델 생성부(150)는 개인의 연령을 통계적 선정에서 유의하던 유의하지 않던 간에 모형에 포함하였으며, 이 방식에 의해 의학적 인과성 모형을 설정하였다. 모형 구축과 검증을 위해 대상자를 7대 3 비율로 구축데이터 (training set)과 검증 데이터 (test set)으로 구분하였으며, 이후 선정된 변수를 이용해 구축데이터 내에서 통계적 모형 기반인 경쟁적 확률 위험 모형을 이용하여 대상자의 향후 질병 발생 위험을 예측하였고, 이를 검증 데이터를 이용한 내부검증 (internal validation)과 5겹 교차검증 (cross-validation)을 통해 질병 발생 예측을 실시하였다. 최종 선정된 모형에서 변수 별 질병 발생 위험에 미치는 영향 (beta=b)을 기반으로 각 대상자별 관측된 (observed) 질병발생 위험 (R)과 기저위험을 나타내는 각 변수 조합 별 기대되는 (expected) 질병의 위험도 (R0) 를 예측하여 아래와 같은 공식을 이용하여 최종적으로 각 대상자 고유의 위험점수 (risk score)를 연산하였다.
본원의 일 실시예에 따르면, 유전자 정보 통계 확률 모델 생성부(150)는 최소한의 중요한 의학적 요인들로 구성된 시간변이 콕스회귀모형과 최대한의 많은 요인들로 구성되고 스스로 학습에 의해 예측능력을 증강하게 되는 머신러닝 기법을 동시에 포함하여 최소한 2개 의 모형에서 질병 확률 값이 산출되도록 유전자 정보 통계 확률 모델을 생성할 수 있다.
본원의 일 실시예에 따르면, 통계확률 모델 생성부(160)는 기본 통계확률 모델 생성부(161) 및 가중치 통계확률 모델 생성부(162)를 포함할 수 있다.
통계확률 모델 생성부(160)는 만성신장 질환의 질환자의 복수의 상태 변수, 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하여, 복수의 상태 변수 및 유전자 정보 중 적어도 하나 이상의 존재 유무 또는 값에 따라 만성신장 질환의 질병 위험도를 확률적으로 나타내는 통계확률 모델을 생성할 수 있다. 예시적으로, 통계확률 모델 생성부(160)는 대상자가 현재 4그룹으로 구분된 위험군(낮음-보통수준-높음-매우높음) 중 어느 곳에 속하는 지 확인 할 수 있다. 또한 통계확률 모델 생성부(160)는 변수(복수의 상태 변수) 별 질병 발생 위험도에 미치는 영향도 (b)를 기반으로 각 대상자별 관측된 (observed) 질병발생 위험 (R)과 기저위험을 나타내는 각 변수 조합 별 기대되는 (expected) 질병의 위험도 (R0) 를 예측하고 이를 이용하여 최종적으로 각 대상자 고유의 risk score를 연산할 수 있다.
본원의 일 실시예에 따르면, 기본 통계확률 모델 생성부(161)는 만성신장 질환의 질환자의 복수의 상태 변수, 유전자 정보 및 만성신장 질환의 질병 위험도를 입력하고, 복수의 상태 변수 중 만성신장 질환과 연관된 적어도 하나 이상의 변수를 선택하고, 적어도 하나 이상의 상태 변수의 존재 여부 또는 값에 대한 만성신장 질환의 질병 위험도를 확률적으로 나타내는 기본 통계확률 모델을 생성할 수 있다.
예시적으로, 기본 통계확률 모델 생성부(161)는 개인(대상자, 질환자)이 인식할 수 있는 복수의 상태 변수(예를 들어, 생활 습관, 신체 계측치, 질병력과 같은 요인의 반복측정된 정보)를 입력할 수 있다. 또한, 기본 통계확률 모델 생성부(161)는 질병 예측 서버(200)로부터 제공받은 질병관리본부의 한국인 유전체역학조사사업의 일부인 안산-안성 코호트의 1차부터 7차까지의 추적된 추적 자료를 기반으로 만성신장 질환의 질병 위험도를 확률적으로 나타내는 통계확률 모델을 생성할 수 있다. 또한, 통계확률 모델 생성부(160)는 기저 조사 당시 개인의 생활 습관 및 건강 상태 정보에 대한 입력을 기반으로 만성신장 질환의 질병 위험도를 확률적으로 나타내는 통계확률 모델을 생성할 수 있다. 또한, 기본 통계확률 모델 생성부(161)는 개인이 인식하지 못하는 영양소 섭취 및 임상수치와 같은 요인에 대한 반복 측정된 값에 대한 만성신장 질환의 질병 위험도를 확률적으로 나타내는 통계확률 모델을 기반으로 주요 변수에 대한 선정이 이루어질 수 있다.
기본 통계확률 모델 생성부(161)는 개인이 인식할 수 있는 복수의 상태 변수 중 통계적 확률 기반의 모형을 이용해 주요 변수에 대한 선정을 1차적으로 수행하고, 개인이 인식하지 못하는 영양소 섭취 및 임상수치와 같은 요인을 통계적 확률 기반의 모형을 이용해 주요 변수에 대한 선정을 2차적으로 수행하고, 1차 및 2차 주요 변수 선정에 기반하여 만성신장 질환의 질병 위험도를 확률적으로 나타내는 기본 통계확률 모델에 대한 주요 변수를 선정할 수 있다. 예시적으로, 앞서 설명된 통계확률 모델은 통계확률 모형의 방법 중 하나인 콕스비례위험모형을 이용하여 전진선택법, 후진선택법 및 단계 삽입법의 3가지의 변수 선정 과정을 통해 2번 이상 선정된 변수에 대해 1차 변수(주요 변수)를 선정할 수 있다.
또한, 기본 통계확률 모델 생성부(161)는 의학적 임상적 기반으로 만성신장 질환의 각 지병과 관련된 변수를 추가 선정할 수 있다. 유전정보에 기반한 유전체 선정은 먼저 입력된 유전 정보를 기반으로 각 만성신장 질환의 질병별 유의한 유전체를 선정하고, 통계적으로 유의하지는 않았으나 기존에 질병과 연관성이 있다고 보고된 유전자에 대해 추가 선정이 이뤄져 최종적으로 유전체가 선별될 수 있다. 또한, 기본 통계확률 모델 선정부(161)는 전문가의 의학적 판단 하에, 임상적으로 유의한 변수에 대한 추가적인 입력을 통해 최종적으로 만성신장 질환의 각 질병예측에 포함된 변수를 선정할 수 있다.
또한, 기본 통계확률 모델 생성부(161)는 모형 구축과 검증을 위해 대상자를 7대 3 비율로 구축데이터 (training set)과 검증 데이터 (test set)으로 구분할 수 있다. 기본 통계확률 모델 생성부(161)는 선정된 변수를 이용하여 구축데이터 내에서 통계적 모델 기반인 경쟁적 확률 위험 위험 모형을 이용한 대상자의 현재 만성신장 질환 위험을 예측하는 기본 통계확률 모델을 생성할 수 있다. 기본 통계확률 모델 생성부(161)는 검증 데이터에서 검증하는 내부검증 (internal validation)과 5겹 교차검증 (cross-validation)을 통해 각 변수 별(복수의 상태 변수 각각) 질병 발생에 미치는 영향도(b)에 대한 최적의 값을 추출하고, 이를 이용한 최종 질병 발생 기본 통계확률 모델을 생성할 수 있다.
가중치 통계확률 모델 생성부(162)는 만성신장 질환과 연관된 유전자 정보의 존재 여부에 따라 만성신장 질환의 질병 위험도에 가중치를 적용함으로써, 기본 통계확률 모델로부터 통계확률 모델을 생성할 수 있다.
질병 위험도 예측부(170)는 질병 위험도 기계학습 모델에 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 대상자의 대상자 질병 위험도를 예측할 수 있다. 또한, 질병 위험도 예측부(170)는 질병 위험도 기계학습 모델 및 유전자 정보 통계확률 모델에 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 대상자의 대상자 질병 위험도를 예측할 수 있다.
본원의 일 실시예에 따르면 질병 위험도 예측부(170)는 기계학습 모델 및 통계확률 모델에 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 대상자의 대상자 질병 위험도를 예측할 수 있다. 또한, 질병 위험도 예측부(170)는 대상자의 질병 위험도 예측 결과를 기 설정된 분류 항목에 기반하여 시각화할 수 있다. 예를 들어, 질병 위험도 예측부(170)는 딥러닝 기반의 시각화 알고리즘을 구축하여 기계학습 모델 생성부(120)의 기계학습 모델 및 통계확률 모델 생성부(130)의 통계확률 모델을 기반으로 각 대상자별 시각화된 결과를 제공할 수 있다. 질병 위험도 예측부(170)는 부정적 요인의 변화양상을 바탕으로 개인의 질병 위험 경로의 변화를 예측하여 시각화하여 제공할 수 있다. 또한, 질병 위험도 예측부(170)는 긍정적 요인의 변화양상을 바탕으로 개인의 질병 위험 확률이 감소될 수 있는 안전 경로를 시각화하여 제공할 수 있다. 또한, 질병 위험도 예측부(170)는 부정적 요인 및 긍정적 요인의 변화 양상을 통합적으로 고려하여, 각 대상자별 생활 습관의 변화양상을 바탕으로 만성신장질환 및 최종 건강상태인 심혈관계 질환, 만성심장질환 및 사망에 대한 위험회피 경로 안내를 통해 개인 맞춤형 예방 관리 서비스 모형을 제공할 수 있다.
예시적으로, 질병 위험도 예측부(170)는 추후 반복 측정된 대상자(개인)의 복수의 상태 정보(생활 습관 및 건강 상태 정보)를 기계학습 모델 생성부(120) 및 통계확률 모델 생성부(130)에 재입력하여 각 역학적 변수의 시간에 따른 변화를 파악하고 변화 속도를 예측 모형에 적용하여 계산하여, 대상자의 중간건강관리에 따른 건강상태 수정결과와 그에 따른 재 예측된 질병 발생 위험도를 제공할 수 있다.
본원의 일 실시예에 따르면 질병 위험도 예측부(170)는 [수학식 4]
Figure 112017131046759-pat00029
에 표현된 콕스 비례위험 모형을 통하여 각각의 생활 습관 및 건강 상태 변수와 만성신장질환 발생 사이의 상관관계를 평가하며, 각 질병 발생과 유의한 상관성을 갖는 변수들을 모두 모형에 ‘포하였다’하여 다변량 콕스 비례위험 모형을 유전자 정보 기계학습 모델 생성부(140)에 적용 복수의 상태변수 만성신장질환 발생 사이의 상관관계를 평가할 수 있따. 예시적으로, 유전자 정보 기계학습 모델 생성부 (120)는다변량 콕스 비례위험 모형에서 각 질병의 발생과 유의한 상관관계를 보이는 변수들을 선정하고, 마지막으로 임상적인 유의성을 기준으로 변수를 선정하여 최종적으로 콕스 비례위험 모형을 구축할 수 있다.
도3은 본원의 일 실시예에 따른 질병 위험도 기계학습 모델 생성부 및 유전자 정보 통계확률 모델 생성부에 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 대상자의 만성질환 질병 위험도를 예측하는 과정을 개략적으로 도시한 도면이다. 예시적으로 도 3을 참조하면, 유전자 정보 통계확률 모델 생성부(150)는 대상자의 환경요인(생활습관 등)의 기저 및 반복 측정된 복수의 상태 변수 정보를 입력으로 할 수 있다. 유전자 정보 통계확률 모델 생성부(150)는 만성신장 질환과 연계된 환경 요인을 유전자 정보 통계확률 모델에 기반하여 선정할 수 있다. 유전자 정보 통계확률 모델 생성부(150)는 임상검사 및 신체측정 등의 기저 및 반복측정 정보를 입력으로 할 수 있다. 유전자 정보 통계확률 모델 생성부(150)는 유전자 정보 통계확률 모델에 기반하여 검사지표를 선정할 수 있다. 유전자 정보 통계확률 모델 생성부(150)는 제 1 유전자 정보 통계확률 모델에 기반하여 문제가 있는 유전자 요인 변수를 제외할 수 있다. 유전자 정보 통계확률 모델 생성부(150)는 제 2 유전자 정보 통계확률 모델에 기반하여 생물학적 타당성 및 인과성 평가 과정을 거쳐 유전자 정보를 추가할 수 있다. 또한, 유전자 정보 통계확률 모델 생성부(150)는 만성신장 질환과 연계된 의학적 주 요인이나 유전자 정보 통계확률 모델에서 제외된 유전자 정보를 입력받을 수 있다. 유전자 정보 통계확률 모델 생성부(150)는 제 1 유전자 정보 통계확률 모델 및 제 2 유전자 정보 통계확률 모델, 의학적 주 요인이나 모형에서 빠진 요인을 추가로 하여 만성신장 질환과 연계된 유전자의 최종 환경 요인을 선정할 수 있다.
본원의 일 실시예에 따르면, 유전자 정보 기계학습 모델 생성부(120)는 질병 서버(200)에 저장된 유전 정보 빅데이터를 유전자 정보 통계 확률 모델에 적용하여 유전 지표를 선정할 수 있다. 유전자 정보 통계 확률 모델에서 선정된 유전자 정보를 핵심 유전자 1로 구분할 수 있다. 유전자 정보 기계학습 모델 생성부(120)는 질병 서버(200)에 저장된 유전 정보 빅데이터를 질병 위험도 기계학습 모델에 적용하여 유전 지표를 선정할 수 있다. 유전자 기계 학습 모델에서 선정된 유전자 정보를 핵심 유전자 2로 구분할 수 있다. 핵심 유전자 정보 선택부(130)는 핵심 유전자 1 및 핵심 유전자 2에 기반하여 최종 핵심 유전자 지표를 선정할 수 있다. 유전자 정보 기계학습 모델 생성부(120)는 제 2 유전 정보 기계학습 모델에 기반하여 부가 유전자 지표를 선정할 수 있다. 질병 위험도 예측부(170)는 유전자 기계학습 모델 및 유전자 정보 통계확률 모델에서 선정된 유전자에 기반하여 질병 위험을 예측할 수 있다. 예를 들어, 유전자 정보 통계 확률 모델 생성부(150)는 선정된 환경요인 및 선정된 검사 지표를 제공하고, 유전자 정보 기계학습 모델 생성부(120)는 핵심 유전자 지표 및 부가 유전자 지표를 제공하 수 있다. 질병 위험도 예측부(170)는 질병 서버(200)로부터 기존 연구에서 보고된 주요 유전자를 추가적으로 입력받을 수 있다. 질병 위험도 예측부(170)는 현재 유병자를 제외하고 질병 없는 정상인과 대상자의 대상자 유전자 정보에 기반하여 만성신장 질환 질병을 예측할 수 있다.
예시적으로, 질병 위험도 예측부(170)는 질병 발생 위험 예측을 통계확률 모델 생성부(160)의 질병 위험 통계 확률 모델에서 생성된 통계적 위험 예측값 및 질병 위험도 기계학습 모델 생성부(140)의 질병 위험 기계학습 모델에서 생성된 기계학습 위험 예측값에 기반하여 질병 발생 위험을 예측할 수 있다. 이때, 질병 위험도 예측부(170)는 개인의 요인 입력 정보의 수, 입력 정보의 질, 무응답 상태, 측정 시점 등에 기반하여 통계모형모델에서 예측값 또는 기계학습 모델에서의 예측값 중 최적의 모델을 선정하여 발생위험 예측값을 제공할 수 있다.
질병 위험도 예측부(170)는 선정된 위험 예측값을 최고위험군, 고위험군, 중간정도 위험군, 저위험군 중 적어도 하나를 선정하여 대상자의 질병 위험도를 예측할 수 있다. 또한, 질병 위험도 예측부(170)는 부정적 요인의 시계열 변동 경로, 긍정적 요인의 시계열 변동 경로에 기반하여 개인맞춤형 위험 경로를 제공할 수 있다.
도 4는 본원의 일 실시예에 따른 유전자 정보 통계 확률 모델 생성부(150)의 질병유병 위험 발생위험 확률 예측과 사망위험을 통한 위험도를 평가하는 실시예를 설명하기 위한 예시도이다.
예시적으로, 도4를 참조하면, 유전자 정보 통계 확률 모델 생성부(150)는 입력1로 개인이 인식하고 있는 요인들을 입력받을 수 있다. 일예로, 개인이 인식하고 있는 요인은 생활습관, 신체 계측치, 질병력과 같은 요인일 수 있다. 유전자 정보 통계 확률 모델 생성부(150)는 입력2로 개인이 인식하지 못하고 있는 요인들을 입력 받을 수 있다. 개인이 인식하지 못하고 있는 요인들은 영양소 섭취 및 임상수치와 같은 요인일 수 있다.
유전자 정보 통계 확률 모델 생성부(150)는 입력1 및 입력2를 기반으로 특정 질환과 연계된 주요 상태 변수를 선정하고, 대상자의 현재 질병가능 확률을 예측할 수 있다. 본원에서는 만성신장 질환의 질병의 유병확률을 예측할 수 있다. 유전자 정보 통계 확률 모델 생성부(150)는 확률 평가 결과를 매우 높음, 높음, 보통, 낮음과 같은 위험도 중 하나를 선정하여 확률 평가 결과를 제공할 수 있다. 질병 위험도 예측부(170)는 확률 평가 결과에 기반하여 각 위험도에 해당하는 대상자(개인)의 맞춤형 위험 조치 정보를 제공할 수 있다. 대상자(개인)의 맞춤형 위험 조치 정보는 고확률 대상에 대한 병원 내원, 건강 검진 등의 정보 및 현재 질병가능확률을 감소할 수 있는 방안일 수 있다.
유전자 정보 통계 확률 모델 생성부(150)는 중간건강상태 제공 이후 일정 시간이 지난 후 향후 만성이상 질환의 질병발생 위험 평가를 제공할 수 있다. 통계확률 모델 생성부(130)는 위험 평가 결과를 최고 위험군, 고 위험군, 중간정도 위험군, 저위험군으로 구분하여 대상자의 위험 평가 결과를 제공할 수 있다. 질병 위험도 예측부(140)는 위험 평가 결과에 기반하여 개인 맞춤형 위험 조치 정보를 제공할 수 있다.
또한, 유전자 정보 통계 확률 모델 생성부(150)는 향후 질병발생 위험 및 사망위험의 위험 평가 결과를 제공할 수 있다. 예를 들어, 최종결과는 만성신장 질환 질병 발생 이후 발생할 수 잇는 만성신장질환, 심혈관질환 사망의 위험 평가 결과일 수 있다. 유전자 정보 통계 확률 모델 생성부(150)는 최종 결과에 대한 위험 평가를 최고 위험군, 고 위험군, 중간정도 위험군, 저위험군으로 구분하여 대상자의 최종 결과 위험 평가 결과를 제공할 수 있다. 질병 위험도 예측부(170)는 최종 결과 위험 평가 결과에 기반하여 개인 맞춤형 위험 조치 정보를 제공할 수 있다.
질병 위험도 예측부(170)는 만성신장 질환의 부정적 영향 요인의 시계열적 변동 정보를 제공할 수 있다. 또한, 질병 위험도 예측부(170)는 긍정적 영향 요인의 시계열적 변동 정보를 제공할 수 있다. 질병 위험도 예측부(170)는 부정적 영향 요인이 가상 중재될 경우, 긍정적 시계열 요인 변동경로를 제공할 수 있다. 질병 위험도 예측부(170)는 중재 전후 가상시뮬레이션 위험 예측값을 제공할 수 있다.
본원의 일 실시예에 따르면, 사용자는 질병 위험도 예측부(170)가 제공한 개인 맞춤형 위험 조치 정보를 기반으로 개인의 건강상태 개선을 시행하고, 기 설정된 주기(예를 들어, 1년)마다 복수의 상태 변수, 즉, 개인이 인식하고 있는 요인들을 입력하고, 유전자 정보 통계 확률 모델 생성부(150)는 복수의 상태 변수에 기반하여 중간건강상태, 결과, 최종결과를 반복적으로 예측할 수 있다.
도 5는 본원의 일 실시예에 따른 만성신장 질환 위험도 예측 과정의 일 실시예를 설명하기 위한 도면이다.
예시적으로 도 5를 참조하면, 만성신장 질환 질병 위험도 예측 장치(100)는 질병 예측 서버(200)로부터 다기관 코호트 빅데이터 취합 및 연계 정보를 제공받을 수 있다. 질병 예측 서버(200)는 한국인 유전체역학 코호트 기초자료(KoGesm n=21만명), 한국인 유전체역학 코호트 유전자 자료(KoGES, n=1만명), 국가 암 등록 자료 및 통계청 사망원인 자료를 포함할 수 있으나, 이에 한정되는 것은 아니다. 예를 들면, 만성신장 질환 질병 위험도 예측 장치(100)에 한국인 유전체역학 코호트 기초자료(KoGesm n=21만명), 한국인 유전체역학 코호트 유전자 자료(KoGES, n=1만명), 국가 암 등록 자료 및 통계청 사망원인 자료가 저장되어 있을 수 있다.
만성신장 질환 질병 위험도 예측 장치(100)는 기저 측정자료 및 생활습관 역동패턴의 통합모델을 구축할 수 있다. 만성신장 질환 질병 위험도 예측 장치(100)는코호트 기저자료(n=21만명) 기반 건강나이를 모형화할 수 있다. 만성신장 질환 질병 위험도 예측 장치(100)는유전체 역학자료기반 생활습관 역동성 및 유전변이를 연계분석하고 인공지능 모델을 기반으로 통합모델을 구축할 수 있다. 만성신장 질환 질병 위험도 예측 장치(100)는 건강나이, 생활습관 역동성, 유전정보 통합 모델을 구축할 수 있다.
또한, 만성신장 질환 질병 위험도 예측 장치(100)는 한국인 주요질병 위험인자 및 위험 회피 모형을 도출할 수 있다. 만성신장 질환 질병 위험도 예측 장치(100)는 유전자, 과거력, 가족력, 치료력, 생활습관, 식습관, 여성력, 검사수치, 신체계측 등의 입력 정보를 기반으로 기계학습 모델 및 통계학적 모델을 통해 만성신장 질환을 예측할 수 있다.
만성신장 질환 질병 위험도 예측 장치(100)는 개인맞춤 질병위험 및 위험회피 안내지도를 생성할 수 있다. 만성신장 질환 질병 위험도 예측 장치(100)는 개인맞춤 질병위험 및 위험회피 안내지도를 제공함으로써, 개인별 건강상태 개선을 시행하여 질병 위험 확률을 감소시킬 수 있다.
도 6은 본원의 일 실시예에 따른 만성신잘 질환 질병 위험도 예측 장치의 일 실시예를 설명하기 위한 도면이다. 예시적으로 도 6을 참조하면 만성신잘 질환 질병 위험도 예측 장치(100)는 다층 퍼셉트론 구조의 인공신경망 (ANN) 모형을 적용하여 핵십유전정보를 선정할 수 있다. 만성신잘 질환 질병 위험도 예측 장치(100)에 입력되는 변수는 질병의 자연사 개념에 따르는데, 출생 시점부터 결정되어 있는 생식세포 유전자와 이후 반복적인 환경 노출, 환경노출에 의해 결정되는 후생유전자, 반복적 환경 노출과 유전자와의 상호작용, 이후 생체 내에서의 변화를 통해 관찰되는 임상검사 지표들의 변화, 이후 질병에 대한 진단으로 인한 만성신장질환의 발생과 악화, 사망 등을 고려하여 순차적으로 입력되도록 하여 차원을 줄이는 방법을 적용할 수 있다. 예시적으로, 인공신경망에 입력되는 변수는 생식세포와 관련된 유전정보부터 입력하되, 위에서 언급한 원칙에 따라 핵심 유전 정보를 먼저 포함하여 차원을 줄여 첫 번째 층을 만들고, 부가 유전 정보를 추가로 포함하여 차원을 줄여 두 번째 층을 만들며, 다음 생활습관 요인 등의 환경 요인들을 포함하여 차원을 줄여 세 번째 층을 만들고, 다음 임상검사 지표들을 포함하여 네 번째 층을 만들도록 하였다. 이후 은닉층을 거쳐 반복적 훈련을 통해 만성신장질환의 발생을 예측하도록 하였다.
만성신잘 질환 질병 위험도 예측 장치(100)는 모든 입력 요인들(복수의 상태 변수 및 유전자 정보)을 포함하여 질병 발생 및 사망 위험을 예측하는 머신러닝 모형으로, 여러 개의 결정 트리들을 임의적으로 훈련하여 학습하는 방식인 랜덤 포레스트 (Random forest) 과 잘못 분류된 변수에 집중하여 새로운 분류규칙을 반복해서 만드는 방법인 부스팅(Boosting)을 이용하는 방식으로, 이 방식들은 학습을 반복함으로써 예측모형의 정확도를 향상시키는 방법으로 유전정보를 선정할 수 있다.
만성신잘 질환 질병 위험도 예측 장치(100)는 통계적 확률 모형을 이용하여 변수를 선정한 다음 다중 일반인구집단의 평균적인 건강요인 노출을 제외한 시간변이 콕스회귀모형을 이용한 방식을 통해 질병 발생 및 사망 위험을 예측할 수 있다. 통계적 확률 모형을 이용하여 질병 발생 혹은 사망에 관련된 요인 변수들은 사전에 선정 과정을 거쳐 최종 모형에 포함하도록 하였는데, 변수 선정은 콕스비례위험 모형에서 전진선택법, 후진선택법, 단계 삽입법 등의 3가지 과정에서 2번 이상 동일한 변수가 선정될 때 우선적으로 요인 변수로 선정하여 모형을 만든 다음 이 모형에서 각 질병이나 사망과 인과적 측면에서 볼 때 역인과성 관계이거나 (질병 발생 이후 변화되는 인자인 경우) 혹은 우연이나 노이즈, 바이어스로 인해 포함되어졌을 가능성이 있을만한 요인들은 제외하고, 이후 의학적으로 중요한 요인이나 모형에서 빠진 요인 변수를 추가하여 최종 모형을 형성한 다음, 최종 모형을 이용하여 이후 우선 선정된 변수들의 다변량모형에서 공선성 문제가 없으면서 가장 적합한 모형을 선정하여 최적의 요인 변수를 선정한 다음, 이후 의학적으로 중요한 요인 변수이나 통계모형에서 빠진 변수를 추가하여 최종 다변량 모형을 설정하였다. 이 때, 개인의 연령은 통계적 선정에서 유의하던 유의하지 않던 간에 모형에 포함하였으며, 이 방식에 의해 의학적 인과성 모형을 설정하였다. 모형 구축과 검증을 위해 대상자를 7대 3 비율로 구축데이터 (training set)과 검증 데이터 (test set)으로 구분하였으며, 이후 선정된 변수를 이용해 구축데이터 내에서 통계적 모형 기반인 경쟁적 확률 위험 모형을 이용하여 대상자의 향후 질병 발생 위험을 예측하였고, 이를 검증 데이터를 이용한 내부검증 (internal validation)과 5겹 교차검증 (cross-validation)을 통해 질병 발생 예측을 실시하였다. 최종 선정된 모형에서 변수 별 질병 발생 위험에 미치는 영향 (beta=b)을 기반으로 각 대상자별 관측된 (observed) 질병발생 위험 (R)과 기저위험을 나타내는 각 변수 조합 별 기대되는 (expected) 질병의 위험도 (R0) 를 예측하여 아래와 같은 공식을 이용하여 최종적으로 각 대상자 고유의 위험점수 (risk score)를 연산하여 현재 대상자에 대한 만성신장질환 발생위험을 확인할 수 있다.
만성신잘 질환 질병 위험도 예측 장치(100)는 만성신장질환의 발생과 사망 위험에 대한 예측값이 2개의 모형에서 각각 산출된다. 개인의 정보를 입력하였을 때, 개인의 정보들은 정보의 결측 상태 (무응답으로 인한 결측, 인식하지 못하는 요인 정보들 중 알지 못하는 값들로 인한 값없음, 원하는 형태로 구분되지 못하는 경우의 값 등)와 정보의 양 등 많은 차이가 있게 된다. 시간변이 콕스회귀모형의 경우는 최소한의 정보로 최적의 예측 성능을 가지도록 만든 모형이므로, 해당 요인 변수만으로 가동되는 장점이 있으며, 만약 개인이 많은 빅데이터를 가질 경우는 더 예측 성능이 높은 머신러닝 방식의 예측 방법을 채택하는 것이 좋다. 따라서 개인의 정보의 상태와 량을 평가하여 적합한 모형에서 결과를 산출하게끔 하기 위하여 두 가지 모형을 모두 제공하도록 하였으나, 이에 한정되는 것은 아니다.
도7은 본원의 일 실시예에 따른 유전자 정보 통계 확률 모델 생성부(150)의 일 실시예를 설명하기 위한 도면이다. 예시적으로 도 7을 참조하면, 유전자 정보 통계 확률 모델 생성부(150)는 만성신장질환 상식세포 유전체를 입력으로 할 수 있다. 유전자 정보 통계 확률 모델 생성부(150)는 만성신장질환 핵심유전자를 선별할 수 있다. 유전자 정보 통계 확률 모델 생성부(150)만성신장 질환 환경 요인들을 입력으로 할 수 있다. 유전자 정보 통계 확률 모델 생성부(150) 만성신장 질환 핵심 환경요인을 선별할 수 있다. 유전자 정보 통계 확률 모델 생성부(150)는 만성신장질환 핵심유전자 선별 및 만성신장 질환 핵심 환경요인 선별에 기반하여 중간건강상태인 대상자의 현재 신장 기능을 예측할 수 있다. 유전자 정보 통계 확률 모델 생성부(150)는 중간건강상태 이후 향후 만성 신장질환의 발생 위험을 생성할 수 있다. 또한, 유전자 정보 통계 확률 모델 생성부(150)는 향후 만성신장 질환 악화 및 사망 위험을 예측할 수 있다. 유전자 정보 통계 확률 모델 생성부(150)는 향후 만성 신장질환 발생 위험 및 사망 위험 예측 정도를 각각 최고 위험군, 고 위험군, 중간정도 위험군, 저 위험군으로 구분하여 예측 결과를 제공할 수 있다.
질병 위험도 예측부(170)는 만성 신장질환 발생 위험 및 사망 위험 예측 정도에 기반하여 개인(대상자) 맞춤형 개선 지침 및 질병 요인, 건강정보를 제공할 수 있다. 사용자는 질병 위험도 예측부(170)에서 제공한 건강 개선 지침에 기반하여 개인의 건강상태 개선을 시행하고, 기 설정된 주기(예를 들어, 1년)로 반복적으로 입력 값을 입력할 수 있다.
도8은 본원의 일 실시예에 따른 복수의 만성신장 질환의 클러스터링을 나타낸 도면이다. 도 8을 참조하면, 질병 위험도 기계학습 모델 생성부(140)는 복수의 상태 변수들을 만성신장 질환 각각에 해당하는 복수의 상태 변수들끼리 클러스터링 할 수 있다.
도9는 본원의 일 실시예에 따른 만성신장 질환의 질병위험에 대한 안내지도를 시각화한 도면이다. 도 9을 참조하면, 질병 위험도 예측부(170)는 복수의 상태 변수들을 기반으로 만성신장 질환의 질병들의 위험, 안전, 최적 등의 질병위험도에 대한 안내지도를 시각화하여 제공할 수 있다.
이하에서는 만성신장 질환을 예측하는 유전자를 만성신장 질환 질병 위험도 예측 장치(100)에 적용하여 향후 만성신장질환 발생을 예측하는 실시예를 설명하고자 한다.
도 10a는 5-fold cross-validation을 이용하여, 총 100번의 반복을 시행해 유전자들을 조합을 이용해 만성신장질환 발생을 예측결과이다.
도 10b는 인공신경망을 통해 유전자 조합에 따른 만성신장질환 발생의 예측도를 검증한 결과이다.
도 10c는 Q-Q plot과 lambda (1.03305) 값을 통해 추정사구체여과율과 관련하여 집단간 이질성 혹은 숨겨진 관련성이 있는 지 진단하고, Manhattan plot을 통해 추정사구체여과율과 들과의 연관성을 도시한 도면이다.
도 10c를 참조하면, 만성신장질환 유전체 분석 대상자 선정과정을 통해 역학, 유전체 통합 자료를 모두 가지고 있는 대상자 8,840명을 최종 선정하였다. 만성신장질환을 평가할 수 있는 결과변수로는 혈청 크레아티닌 (serum creatinine)을 이용하여 MDRD 공식으로 추정사구체여과율을 이용하여 만성신장질환 발생에 영향을 미치는 유전자를 발굴하였다. 추가적으로 알부민뇨(Urine albumin), 단백뇨(Urine protein)을 이용하여 만성신장질환 발생에 영향을 미치는 유전자를 발굴하였다. 안산안성 역학자료를 이용하여 만성신장질환의 발생에 영향을 미칠 수 있는 나이, 성별, 고혈압 과거력, 당뇨 과거력에 대해 보정을 시행하였고 유전체 분석Q-Q plot과 lambda를 통해 보정해야할 집단 간 이질성이 확인되지 않았음을 확인하고, 유전자에 대한 통계적인 유의성은 (< 1 x 10-6)을 기준으로 하여 각 SNP의 p-value가 그 미만일 경우 유의한 로 선정하였다. Manhattan plot을 통해 만성신장질환 발생과 들과의 연관성을 시각화하였다.
앞서 설명된 결과는 추정사구체여과율과 연관된 유전자를 발굴한 결과이다. 도 10c에 도시된 도면은, Q-Q plot과 lambda (1.03305) 값을 통해 추정사구체여과율과 관련하여 집단간 이질성 혹은 숨겨진 관련성이 있는 지 진단하고, Manhattan plot을 통해 추정사구체여과율과 들과의 연관성을 나타내었다.
도10d는 추정사구체여과율과 연관된 를 나타낸 도면이다.
예시적으로, 도10d의 결과와 같이 만성신장 질환 질병 위험도 예측 장치(100)는 추정사구체여과율과 관련하여 총 15개의를 확인하였으며, 그 중 14개의 Gene 위치를 확인하였다. 염색체 2번에서 유의한 GPD2 유전자가 가장 많이 발견되었으며, 이 유전자는 기존 연구에서 만성신장질환과 관련이 있는 유전자로 알려져 있었다. 또한 염색체 8번의 LOC107986931 유전자는 기존 연구에서 Renal carcinoma와 관련이 있는 유전자로 알려져 있었다.
도 10e는 Q-Q plot과 lambda (1.023052) 값을 통해 Urine albumin과 관련하여 집단간 이질성 혹은 숨겨진 관련성이 있는 지 진단하고, Manhattan plot을 통해 추정사구체여과율과 들과의 연관성을 나타낸 도면이다.
도10f는 Urine albumin과 연관된 를 나타낸 도면이다. 도 10f를 참조하면, 추정사구체여과율과 관련하여 총 41개의 를 확인하였으며, 그중 1개의 Gene 위치를 확인하였다. 특히 알부민뇨와 관련된 유전자들은 모두 염색체 4번에서 발견된 ANXA10 이며, 이 유전자는 기존 연구에서 renal cancer와 관련이 있는 것으로 알려져 있었다.
도 10g는 단백뇨와 만성신장질환 발생과 관련된 유전자를 발굴한 결과이다. 도 10g를 참조하면, Q-Q plot과 lambda (1.025902) 값을 통해 단백뇨와 관련하여 집단간 이질성 혹은 숨겨진 관련성이 있는 지 진단하고, Manhattan plot을 통해 Urine total protein과 들과의 연관성을 보였다.
도10h를 참조하면, 단백뇨와 관련하여 총 3개의 를 확인하였으며, 그중 1개의 Gene 위치를 확인하였다. 특히 단백뇨 관련된 유전자는 염색체 13번에 위치한 GPC6이며, 이 유전자는 기존 연구에서 renal cell carcinoma와 관련이 있는 것으로 보고되어 있었다.
앞서 설명된 도 10a 내지 도 10h의 예시처럼 유전정보는 인공신경망 (ANN) 모형과 기존의 통계적 모형을 이용하여 만성신장질환 발생과 관련된 유전 정보를 발굴한다. 이를 이용하여, 출생 시점부터 결정되어 있는 생식세포 유전자와 이후 반복적인 환경 노출, 환경노출에 의해 결정되는 후생유전자, 반복적 환경 노출과 유전자와의 상호작용, 이후 생체 내에서의 변화를 통해 관찰되는 임상검사 지표들의 변화, 이후 질병에 대한 진단으로 인한 만성신장질환의 발생과 악화, 사망 등을 예측할 수 있다.
또한, 통계 확률 모델에 기반한 만성신장질환 발생 위험 예측에 대해서는 시간변이 콕스회귀모형과 인공신경망 기법으로, 사망 위험 예측에 대해서는 시간변이 콕스회귀모형과 랜덤 포레스트를 이용하였다.
[표 1] 내지 [표3]은 반복 측정된 개인의 생활 습관 및 건강 상태 정보의 재입력을 통해 각 역학적 변수의 시간에 따른 변화를 파악하고 변화 속도를 계산하여, 대상자의 중간건강관리에 따른 건강상태 수정결과와 그에 따라 재예측된 만성신장질환 발생 위험도를 제공한 모형의 예시이다.
표1은 변수선택법 중 전진 선택법(forward)를 적용하여 선정된 변수들의 결과일 수 있다.
Variables P-value
1 Age <0.0001
2 HbA1C <0.0001
3 Sex <0.0001
4 History of hypertension <0.0001
5 Urine proteinuria <0.0001
6 Serum TG <0.0001
7 Waist circumference 0.0037
8 History of diabetes 0.0037
9 Education level 0.0178
10 Blood pressure 0.0110
[표2]는 변수선택법(backward: 제거된 변수 리스트, SLS=0.05) 중 후진제거법을 적용하여 선정된 선정 변수일 수 있다.
Variables P-value
1 Serum ALT 0.9394
2 History of dyslipidemia 0.8963
3 Smoking status 0.5058
4 HDL cholesterol level 0.3024
5 Glucose level 0.2545
6 BUN 0.2043
7 Urine glycosuria 0.1225
8 diet protein intake 0.1199
9 Income 0.0638
[표3]는 변수선택법 중 단계적 선택법(stepwise: SLE=0.2, SLS=0.1)을 적용하여 선정된 선정 변수일 수 있다.
Variables P-value
1 Age <0.0001
2 HbA1C <0.0001
3 Sex <0.0001
4 History of hypertension <0.0001
5 Urine proteinuria <0.0001
6 Serum TG <0.0001
7 Waist circumference 0.0037
8 History of diabetes 0.0037
9 Education level 0.0178
10 Blood pressure 0.0110
11 Diet protein intake 0.1199
예시적으로, [표1] 내지 [표 3]에 도시된 변수선택법을 최종선정된 변수들을 모두 이분형으로 정리하였다. 연령의 경우, 50세 이전과 이후로, 신체 계측치 및 임상수치와 같은 연속형 변수의 경우, 임상적 기준에 의거하여 정상범위와 정상을 벗어난 위험수준 범위로 구분하였다. 이와 같은 과정을 통해 각 변수의 상태별 만성신장질환 발생에 미치는 영향을 평가할 수 있었다.
변수선택법을 통해 선별된 위험요인이 만성신장질환 발생에 미치는 영향을 도10i와 같이 그래프로 도식화하여, 가장 큰 영향을 끼치는 위험요인을 확인할 수 있다.
도10i는 만성신장질환 발생 위험요인의 상관관계를 나타낸 도면이다.
만성신장 질환 질병 위험도 예측 장치(100)는 선정된 콕스 비례위험 모형에서 변수별 질병 발생 위험도에 미치는 영향도(b)값을 이용하여 [수학식 5]와 같이 joint risk (JR)를 연산할 수 있다.
Figure 112017131046759-pat00030
만성신장 질환 질병 위험도 예측 장치(100)는 각 대상자별 관측된 (observed) 질병발생 위험 (R)과 기저위험을 나타내는 각 변수 조합 별 기대되는 (expected) 질병의 위험도 (R0) 를 예측하여 아래와 같은 공식을 이용하여 최종적으로 각 대상자 고유의 risk score를 연산한다.
Figure 112017131046759-pat00031
Figure 112017131046759-pat00032
Figure 112017131046759-pat00033
수학식 6 내지 수학식 8을 이용해 만성신장질환의 발생 위험점수 (risk score)를 예시로 구한 결과는 다음과 같다.
R=(1.10396*나이+0.69081*[성별=여성]+0.10600*education+0.33667*[고혈압 과거력=있었다] +0.46900*[당뇨병 과거력=있었다] +0.32334*[당화혈색소=100 이상]+0.28523*[중성지방=150 이상]+0.31170*[혈압=130, 90이상] +0.65394*[단백뇨]+0.17482*[허리둘레=남자90이상, 여자 80이상]);
R0 = 나이 (1.10396*(0.273926) + 성별 0.69081*(0.266384) + 교육정도 0.10600*(0.020622) + 고혈압 과거력 0.33667*(0.021758) + 당뇨 과거력 0.46900*(0.003997) + 당화혈색소 100이상 0.32334*(0.009157) + 중성지방 150 이상 0.28523*(0.171003) + 혈압 130, 90 이상 0.31170*(0.164121) + 단백뇨 0.65394*(0.000756) + 허리둘레 남자 90이상, 여자 80이상 0.17482*(0.085622));
앞서 설명된 수학식 6 내지 수학식 8을 이용해 전체 대상에 대해 위험점수를 계산하였고, 이를 바탕으로, 만성신장질환의 2년, 5년 ,10년 발생 위험도를 산출할 수 있다.
Figure 112017131046759-pat00034
도 10j의 도면부호 (a)는 만성신장질환 발생확률 그래프이고, 도10j의 도면부호 (b)는 만성신장질환 발생의 주요 요인의 risk score와 10년 발생위험도이다.
예시적으로, 만성신장 질환 질병 위험도 예측 장치(100)는 경쟁 위험 모형을 완성하기 위하여서는 일반 인구집단에서의 각 질병(고혈압, 당뇨병, 비만, 대사증후군 및 만성신장질환)에 대한 발생률과, 각 질병으로 인한 사망률, 전체 사망 원인으로 인한 사망률 자료가 필요하며, 전체 사망률 자료는 통계청의 연령별 사망 원인 통계 자료를 통해, 만성신장 질환으로 인한 사망률은 기존 문헌의 만성신장 질환으로 인한 사망의 인구집단 기여위험도 정보와 통계청의 연령별 사망 원인 통계 자료를 이용해 산출한다. 각 질병에 대한 연령별 발생률은 건강보험공단의 건강검진 표본코호트 자료를 이용하여 산출한다.
[수학식 9]
Figure 112017131046759-pat00035
산출된 연령별 질병의 발생률, 사망률, 전체 사망률을 기반으로 [수학식 9]와 같이 경쟁 위험 모형을 구축한다. 구축된 경쟁 위험 모형은 타당도 검증을 위하여 전체 대상자를 5등분하여 교차 검증을 시행하여 검증과정을 진행한다.
이하에서는 만성신장질환 발생위험 예측모형의 예측력 검증과정을 설명하고자한다.
만성신장질환 발생위험 모형의 예측력 및 검증은 총 3가지 방법을 이용하여 실행하였다. ROC curve와 AUC값을 이용하여 내적 타당도와 교차검증을 시행하고, 기 산출된 Risk score 값에 대해 만성신장질환 발생의 관찰값과 발생 예측값을 비교하였다. 만성신장질환 발생 위험의 optimal cutpoint에 대해 Youden index와 Distance to (0, 1)과 민감도 타당도의 일치도 3가지 방법의 민감도와 타당도를 확인을 통해 구축된 riskscore에 따른 만성신장질환 발생예측의 예측도를 평가하였다.
도11a에 도시된 것처럼, 70%의 training set(대상자: 6,657명) 을 사용하여 구축한 만성신장질환 발생 예측모형에서의 AUC 값은 0.7405, 95% 신뢰구간은 0.7239-0.7570 으로 확인하였다. 30%의 training set (대상자: 2,2853명)을 사용하여 구축한 만성신장질환 발생 예측모형에서의 AUC 값은 0.7257, 95% 신뢰구간은 0.6986-0.7527 으로 확인되었다.
만성신장질환 발생위험의 예측력을 검정하기 위해 교차검증(cross-validation)을 실시하였다. 교차검증의 방법은 boot-straping 기법을 이용하여 training set과 test set에서 각 1,000번의 permutation을 시행하였다. permutation 결과, training set은 6,657,000개, test set은 2,853,000개의 관측치를 확인하였다. 기 산출된 모형의 확률 산출 방식을 그대로 적용하여 validation set의 관찰값과 기댓값이 일치되는지에 대해 교차검증을 시행하였다. 도11b와 같이 training set에 대한 만성신장질환 발생 위험의 예측력 검증값은 AUC=0.7399, 95% 신뢰구간 0.7394-0.7404로 나타남. test set에 대한 예측력은 AUC=0.7255, 95% 신뢰구간 0.7247-0.7264로 나타났다.
도11c는 전체 대상자에 대한 만성신장질환 발생값과 예측값의 비교결과값이다.
도11c를 참조하면, 기 산출된 Risk score 값에 대해 만성신장질환 발생의 관찰값과 발생 예측값을 비교하였다 (10년 발생 위험도 비교), 추적관찰 기간 10년간 만성신장질환 실제 발생값과 모형을 통해 예측한 위험도가 거의 비슷하게 산출된 것을 확인할 수 있었다.
도11d는 training set (대상자: 6,657명)을 이용한 만성신장질환 발생예측 모형의 예측력이다.
도11d를 참조하면, training set에 대해 Yoden index, Distance to (0,1), Sensitivity, Specificity equality의 원칙을 이용하여 optimal cutpoint와 민감도와 타당도를 확인하였다. 상기의 결과에서 training set에서의 AUC 값은 0.7405, 95% 신뢰구간은 0.7239-0.7570로 계산되었다.
Yoden index를 산출하는 방법은 최대값 (J=민감도+특이도-1)을 이용하며, 이 때의 최대값은 0.3752로 산출되었다. 이에 따른 cut-point는 0.2702이며, 민감도=0.6390, 특이도=0.7362를 확인하였다. Distance to (0,1) 방법은 아래의 공식에 따라 값을 산출하였다. 아래 공식에 따라 산출된 최소값은 0.4453이였으며, 이에 따른 cut-point는 0.2655이며, 민감도=0.6528, 특이도=0.7211을 확인하였다.
Distance to (0,1) = SQRT ((1-Sensitivity2)+(1-Specificity2))
도11e를 참조하면, Sensitivity, Specificity equality 방법은 민감도와 특이도의 차이값이 최소인 경우를 뜻하며, 이 때 산출된 최소값은 0.00026이며, 이에 따른 cut-point는 0.2557이며, 민감도=0.6841, 특이도=0.6843을 확인하였다. 아래는 3가지 방법을 이용한 optimal cut-point와 민감도, 타당도를 확인하였다.
도 11f를 참조하면, 이후 재입력된 대상자의 요인 정보를 바탕으로 다음과 같이 대상자 개인의 중간건강관리에 따른 건강상태 수정결과에 따른 위험요인의 변화 양상을 확인한다. 이러한 변화 양상을 바탕으로 대상자의 재입력된 요인을 기반으로 한 만성신장질환의 발생위험 예측이 새로 연산된다.
도 12는 본원의 일 실시예에 따른 만성신장 질환 질병 위험도 예측 방법의 개략적인 흐름도이다. 도 12에 따른 만성신장 질환 질병 위험도 예측 방법은 도 1 내지 도 11를 통해 설명된 만성신장 질환 질병 위험도 예측 장치(100)의 각 부에서 리되는 내용을 개략적으로 설명한다. 따라서 이하 설명되지 않은 내용이라 할지라고, 도 1내지 도 11를 통해 설명된 만성신장 질환 질병 위험도 예측 장치의 동작 설명에 포함되거나 유추 가능하므로 자세한 설명은 생략된다.
도 12을 참조하면, 단계 S121에서 만성신장 질환 질병 위험도 예측 장치(100)는 만성신장 질환의 질환자의 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하여, 유전자 정보와 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 유전자 정보 기계학습 모델을 생성할 수 있다.
단계 S122에서, 만성신장 질환 질병 위험도 예측 장치(100)는 유전자 정보 기계학습 모델을 이용하여 유전자 정보로부터 핵심 유전자 정보를 선택할 수 있다.
단계 S123에서 만성신장 질환 질병 위험도 예측 장치(100)는 만성신장 질환의 질환자의 생활상태 변수 및 건강상태 변수를 포함하는 복수의 상태 변수, 핵심 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하여, 복수의 상태 변수 및 핵심 유전자 정보 중 적어도 하나 이상과 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 질병 위험도 기계학습 모델을 생성할 수 있다.
단계 S124에서 만성신장 질환 질병 위험도 예측 장치(100)는 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 입력받을 수 있다.
단계 S125에서 만성신장 질환 질병 위험도 예측 장치(100)는 질병 위험도 기계학습 모델에 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 대상자의 대상자 질병 위험도를 예측할 수 있다.
전술한 본원의 설명은 예시를 위한 것이며, 본원이 속하는 기술분야의 통상의 지식을 가진 자는 본원의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본원의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본원의 범위에 포함되는 것으로 해석되어야 한다.
100: 만성신장 질환 질병 위험도 예측 장치
110: 정보 입력부
120: 유전자 정보 기계학습 모델 생성부
130: 핵심 유전자 정보 선택부
140: 질병 위험도 기계학습 모델 생성부
150: 유전자 정보 통계확률 모델 생성부
160: 통계확률 모델 생성부
170: 질병 위험도 예측부
200: 질병 서버

Claims (12)

  1. 만성신장 질환의 질병 위험도를 예측하는 장치에 있어서,
    상기 만성신장 질환의 질환자의 유전자 정보 및 상기 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 유전자 정보와 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 유전자 정보 기계학습 모델을 생성하는 유전자 정보 기계학습 모델 생성부;
    상기 만성신장 질환의 질환자의 유전자 정보 및 상기 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 유전자 정보 각각의 존재 유무 또는 값에 따라 상기 만성신장 질환의 질병 위험도를 확률적으로 나타내는 유전자 정보 통계확률 모델을 생성하는 유전자 정보 통계확률 모델 생성부;
    상기 유전자 정보 기계학습 모델 및 상기 유전자 정보 통계확률 모델을 이용하여 상기 유전자 정보로부터 핵심 유전자 정보를 선택하는 핵심 유전자 정보 선택부;
    상기 만성신장 질환의 질환자의 생활상태 변수 및 건강상태 변수를 포함하는 복수의 상태 변수, 상기 핵심 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 복수의 상태 변수 및 핵심 유전자 정보 중 적어도 하나 이상과 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 질병 위험도 기계학습 모델을 생성하는 질병 위험도 기계학습 모델 생성부;
    대상자의 대상자 상태 변수 및 대상자 유전자 정보를 입력받는 정보 입력부; 및
    상기 질병 위험도 기계학습 모델에 상기 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 상기 대상자의 대상자 질병 위험도를 예측하는 질병 위험도 예측부를 포함하되,
    상기 질병 위험도 기계학습 모델 생성부는,
    단일 시점에서 수집한 상기 유전자 정보를 통합 입력하기 위해 제1인공신경망의 마지막 층에 제2인공신경망을 연결하여 상기 유전자 정보와 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 것인, 만성신장 질환 질병 위험도 예측 장치.
  2. 삭제
  3. 제 1 항에 있어서,
    상기 만성신장 질환의 질환자의 상기 복수의 상태 변수, 상기 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 복수의 상태 변수 및 유전자 정보 중 적어도 하나 이상의 존재 유무 또는 값에 따라 상기 만성신장 질환의 질병 위험도를 확률적으로 나타내는 통계확률 모델을 생성하는 통계확률 모델 생성부를 더 포함하되,
    상기 질병 위험도 기계학습 모델 및 상기 유전자 정보 통계확률 모델에 상기 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 상기 대상자의 대상자 질병 위험도를 예측하는 질병 위험도 예측부를 포함하는 만성신장 질환 질병 위험도 예측 장치.
  4. 제 3 항에 있어서,
    상기 통계확률 모델 생성부는,
    상기 만성신장 질환의 질환자의 상기 복수의 상태 변수, 상기 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하고, 상기 복수의 상태 변수 중 상기 만성신장 질환과 연관된 적어도 하나 이상의 상태 변수를 선택하고, 상기 적어도 하나 이상의 상태 변수의 존재 여부 또는 값에 대한 상기 만성신장 질환의 질병 위험도를 확률적으로 나타내는 기본 통계확률 모델을 생성하는 기본 통계확률 모델 생성부; 및
    상기 만성신장 질환과 연관된 유전자 정보의 존재 여부에 따라 상기 만성신장 질환의 질병 위험도에 가중치를 적용함으로써, 기본 통계확률 모델로부터 상기 통계확률 모델을 생성하는 가중치 통계확률 모델 생성부를 포함하는 만성신장 질환 질병 위험도 예측 장치.
  5. 제1항에 있어서,
    상기 유전자 정보 기계학습 모델은 상기 복수의 상태 변수 중 제 1 상태 변수를 입력층으로 하고 상기 복수의 상태 변수 중 제 2 상태 변수를 은닉층으로 할 때, 상기 입력층과 은닉층 사이의 관계의 정도를 학습하는 제 1 학습을 하고,
    상기 은닉층 및 상기 유전자 정보를 입력층으로 하고 상기 질병 위험도를 출력층으로 할 때, 상기 은닉층과 출력층 사이의 관계의 정도를 학습하는 제 2 학습을 함으로써, 상기 복수의 상태 변수 및 유전자 정보 중 적어도 하나 이상과 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 것인, 만성신장 질환 질병 위험도 예측 장치.
  6. 제 1 항에 있어서,
    상기 유전자 정보 기계학습 모델은 상기 복수의 상태 변수의 이전 시점 상태 변수를 입력층으로 하고 상기 복수의 상태 변수의 현재 시점 상태 변수를 은닉층으로 할 때, 상기 입력층과 은닉층 사이의 관계의 정도를 학습하는 제 1 학습을 하고,
    상기 은닉층 및 상기 유전자 정보를 입력층으로 하고 상기 질병 위험도를 출력층으로 할 때, 상기 은닉층과 출력층 사이의 관계의 정도를 학습하는 제 2 학습을 함으로써, 상기 복수의 상태 변수 및 유전자 정보 중 적어도 하나 이상과 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 것인, 만성신장 질환 질병 위험도 예측 장치.
  7. 제 1 항에 있어서,
    상기 유전자 정보 기계학습 모델은 상기 복수의 상태 변수 중 제 1 상태 변수 및 이전 시점 은닉층을 입력층으로 하고 상기 복수의 상태 변수 중 제 2 상태 변수 또는 현재 시점 상태 변수를 은닉층으로 할 때, 상기 입력층과 은닉층 사이의 관계의 정도를 학습하는 제 1 학습을 하고,
    상기 은닉층 및 상기 유전자 정보를 입력층으로 하고 상기 질병 위험도를 출력층으로 할 때, 상기 은닉층과 출력층 사이의 관계의 정도를 학습하는 제 2 학습을 함으로써, 상기 복수의 상태 변수 및 유전자 정보 중 적어도 하나 이상과 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 것이되,
    상기 제 1 학습은 [수학식 1]을 기반으로, 상기 입력층과 은닉층 사이의 관계의 정도를 학습하는 것이되,
    [수학식 1]
    Figure 112017131046759-pat00036

    이때, 상기
    Figure 112017131046759-pat00037
    는 t 시점에서의 은닉층이고, 상기
    Figure 112017131046759-pat00038
    은 이전 시점 은닉층이고,
    Figure 112017131046759-pat00039
    는 제 1 상태 변수이고, 상기
    Figure 112017131046759-pat00040
    는 입력층과 은닉층 사이의 제 1 유형의 관계의 정도를 나타내는 제 1 가중치이고, 상기
    Figure 112017131046759-pat00041
    는 입력층과 은닉층 사이의 제 2 유형의 관계의 정도를 나타내는 제 2 가중치인 것인, 만성신장 질환 질병 위험도 예측 장치.
  8. 제7항에 있어서,
    상기 제 2학습은 상기 [수학식 1] 및 [수학식2]를 기반으로 상기 은닉층과 출력층 사이의 관계의 정도를 학습하는 것이되,
    [수학식 2]
    Figure 112019011534187-pat00042

    이때, 상기 y는 출력층이고, 상기
    Figure 112019011534187-pat00043
    는 은닉층과 출력층 사이의 관계의 정도를 나타내는 제 3 가중치이고,
    Figure 112019011534187-pat00044
    는 은닉층이고, 상기
    Figure 112019011534187-pat00045
    는 입력층 중 유전자 정보와 출력층 사이의 관계의 정도를 나타내는 제4 가중치이고, z는 입력층 중 유전자 정보인 것인, 만성신장 질환 질병 위험도 예측 장치.
  9. 제 1 항에 있어서,
    상기 유전자 정보 기계학습 모델 생성부는,
    [수학식 3]을 기반으로 상기 복수의 상태 변수 및 유전자 정보 중 적어도 하나 이상과 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 기계학습 모델을 생성 시 발생하는 오차에 가중치를 갱신하는 것이되,
    [수학식 3]
    Figure 112017131046759-pat00046

    상기 E는 상기 기계학습 모델 생성부의 오차의 검출값이고, 상기 t는 상기 만성신장 질환의 발생 여부이고, 상기 y는 기계학습 모델을 통해 예측된 질병 위험도이고,
    Figure 112017131046759-pat00047
    는 오차에 따른 과적합(overfitting)을 방지하기 위한 L2 정규식인 것인, 만성신장 질환 질병 위험도 예측 장치.
  10. 제 1항에 있어서,
    상기 질병 위험도 예측부는,
    상기 대상자의 질병 위험도 예측 결과를 기 설정된 분류 항목에 기반하여 시각화하는 것인, 만성신장 질환 질병 위험도 예측 장치.
  11. 제 1항에 있어서,
    상기 질병 위험도 예측부는,
    상기 대상자의 질병 위험도 예측 결과와 연계된 질병 예방 관리 정보를 제공하는 것인, 만성신장 질환 질병 위험도 예측 장치.
  12. 만성신장 질환 질병 위험도 예측 장치에서, 만성신장 질환의 질병 위험도를 예측하는 방법에 있어서,
    유전자 정보 기계학습 모델 생성부에서, 상기 만성신장 질환의 질환자의 유전자 정보 및 상기 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 유전자 정보와 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 유전자 정보 기계학습 모델을 생성하는 단계;
    유전자 정보 통계확률 모델 생성부에서, 상기 만성신장 질환의 질환자의 유전자 정보 및 상기 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 유전자 정보 각각의 존재 유무 또는 값에 따라 상기 만성신장 질환의 질병 위험도를 확률적으로 나타내는 유전자 정보 통계확률 모델을 생성하는 단계;
    핵심 유전자 정보 선택부에서, 상기 유전자 정보 기계학습 모델 및 상기 유전자 정보 통계확률 모델을 이용하여 상기 유전자 정보로부터 핵심 유전자 정보를 선택하는 단계;
    질병 위험도 기계학습 모델 생성부에서, 상기 만성신장 질환의 질환자의 생활상태 변수 및 건강상태 변수를 포함하는 복수의 상태 변수, 상기 핵심 유전자 정보 및 만성신장 질환의 질병 위험도를 입력으로 하여, 상기 복수의 상태 변수 및 핵심 유전자 정보 중 적어도 하나 이상과 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 질병 위험도 기계학습 모델을 생성하는 단계;
    정보 입력부에서, 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 입력받는 단계; 및
    질병 위험도 예측부에서, 상기 질병 위험도 기계학습 모델에 상기 대상자의 대상자 상태 변수 및 대상자 유전자 정보를 적용하여 상기 대상자의 대상자 질병 위험도를 예측하는 단계를 포함하되,
    상기 질병 위험도 기계학습 모델을 생성하는 단계는,
    단일 시점에서 수집한 상기 유전자 정보를 통합 입력하기 위해 제1인공신경망의 마지막 층에 제2인공신경망을 연결하여 상기 유전자 정보와 상기 만성신장 질환의 질병 위험도 사이의 관계의 정도를 학습하는 것인, 만성신장 질환 질병 위험도 예측 방법.
KR1020170183818A 2016-12-30 2017-12-29 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법 KR102024375B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20160183851 2016-12-30
KR1020160183851 2016-12-30

Publications (2)

Publication Number Publication Date
KR20180079209A KR20180079209A (ko) 2018-07-10
KR102024375B1 true KR102024375B1 (ko) 2019-09-23

Family

ID=62709635

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020170183818A KR102024375B1 (ko) 2016-12-30 2017-12-29 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법
KR1020170183817A KR102024373B1 (ko) 2016-12-30 2017-12-29 대사이상 질환의 질병 위험도를 예측하는 장치 및 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020170183817A KR102024373B1 (ko) 2016-12-30 2017-12-29 대사이상 질환의 질병 위험도를 예측하는 장치 및 방법

Country Status (3)

Country Link
US (1) US20190172587A1 (ko)
KR (2) KR102024375B1 (ko)
WO (2) WO2018124831A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102553562B1 (ko) 2022-10-13 2023-07-10 서울대학교산학협력단 유방암 발생 위험도 예측 장치 및 방법

Families Citing this family (118)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11568982B1 (en) 2014-02-17 2023-01-31 Health at Scale Corporation System to improve the logistics of clinical care by selectively matching patients to providers
US10592554B1 (en) 2017-04-03 2020-03-17 Massachusetts Mutual Life Insurance Company Systems, devices, and methods for parallelized data structure processing
US11238989B2 (en) * 2017-11-08 2022-02-01 International Business Machines Corporation Personalized risk prediction based on intrinsic and extrinsic factors
JP7007027B2 (ja) * 2018-03-30 2022-01-24 Necソリューションイノベータ株式会社 予測システム、モデル生成システム、方法およびプログラム
US11798653B2 (en) * 2018-10-18 2023-10-24 Medimmune, Llc Methods for determining treatment for cancer patients
US11621081B1 (en) * 2018-11-13 2023-04-04 Iqvia Inc. System for predicting patient health conditions
KR102311269B1 (ko) * 2018-12-13 2021-10-12 주식회사 케이티 건강 정보 관리 서버, 이를 이용한 건강 정보 관리 방법 및 컴퓨터 프로그램
KR102316403B1 (ko) * 2019-01-03 2021-10-22 서울대학교 산학협력단 만성신장 질환 발생 예측 장치 및 방법
EP3909054A4 (en) * 2019-01-11 2022-10-26 Quadrus Medical Technologies, Inc. SYSTEMS AND METHODS FOR EVALUATION AND EVALUATION OF RENAL FUNCTIONAL DIAGNOSTICS, CLASSIFICATION AND THERAPY RECOMMENDATION
KR102202864B1 (ko) * 2019-03-05 2021-01-15 (주)비바이노베이션 빅데이터 분석 및 인공지능 문진을 통한 질병 예측 정보를 제공하는 사용자 단말기
US11541274B2 (en) 2019-03-11 2023-01-03 Rom Technologies, Inc. System, method and apparatus for electrically actuated pedal for an exercise or rehabilitation machine
US11904202B2 (en) 2019-03-11 2024-02-20 Rom Technolgies, Inc. Monitoring joint extension and flexion using a sensor device securable to an upper and lower limb
US10553319B1 (en) * 2019-03-14 2020-02-04 Kpn Innovations, Llc Artificial intelligence systems and methods for vibrant constitutional guidance
US11915827B2 (en) * 2019-03-14 2024-02-27 Kenneth Neumann Methods and systems for classification to prognostic labels
KR102188115B1 (ko) 2019-03-20 2020-12-07 인천대학교 산학협력단 생성적 적대 신경망을 기초로 암의 예후 예측에 사용되는 바이오 마커의 선정이 가능한 전자 장치 및 그 동작 방법
US11250062B2 (en) * 2019-04-04 2022-02-15 Kpn Innovations Llc Artificial intelligence methods and systems for generation and implementation of alimentary instruction sets
KR102188118B1 (ko) 2019-04-15 2020-12-07 인천대학교 산학협력단 암에 따른 유전자 간의 상관관계에 기초하여 유전자 분산 표현을 위한 유전자 특징 벡터를 생성하는 전자 장치 및 그 동작 방법
US11904207B2 (en) 2019-05-10 2024-02-20 Rehab2Fit Technologies, Inc. Method and system for using artificial intelligence to present a user interface representing a user's progress in various domains
US12102878B2 (en) 2019-05-10 2024-10-01 Rehab2Fit Technologies, Inc. Method and system for using artificial intelligence to determine a user's progress during interval training
US11433276B2 (en) 2019-05-10 2022-09-06 Rehab2Fit Technologies, Inc. Method and system for using artificial intelligence to independently adjust resistance of pedals based on leg strength
US11801423B2 (en) 2019-05-10 2023-10-31 Rehab2Fit Technologies, Inc. Method and system for using artificial intelligence to interact with a user of an exercise device during an exercise session
US11957960B2 (en) 2019-05-10 2024-04-16 Rehab2Fit Technologies Inc. Method and system for using artificial intelligence to adjust pedal resistance
US11205140B2 (en) * 2019-06-03 2021-12-21 Kpn Innovations Llc Methods and systems for self-fulfillment of an alimentary instruction set based on vibrant constitutional guidance
KR102102848B1 (ko) * 2019-06-12 2020-04-22 주식회사 프로카젠 전립선암 위험점수 산출기, 상기 산출기의 동작 방법
TWI774964B (zh) * 2019-06-19 2022-08-21 宏碁股份有限公司 患病機率預測方法與電子裝置
KR102248732B1 (ko) * 2019-06-27 2021-05-06 (주)해피마인드 종합주의력 검사 데이터에 기초하여 주의력 결핍 및 과잉 행동 장애를 분류 및 치료반응을 예측하는 시스템 및 방법
KR102467999B1 (ko) * 2019-06-27 2022-11-17 서울대학교산학협력단 위암의 다층 다요인 패널과 Computational biological network modeling을 통한 위암 발암에 대한 에티옴 모형
US11114193B2 (en) * 2019-07-03 2021-09-07 Kpn Innovations, Llc Methods and systems for optimizing dietary levels utilizing artificial intelligence
KR20210014305A (ko) 2019-07-30 2021-02-09 삼성전자주식회사 생체정보 추정 장치 및 방법
US20210038166A1 (en) * 2019-08-05 2021-02-11 Yeda Research And Development Co. Ltd. Method and system for predicting childhood obesity
CN112349412B (zh) * 2019-08-06 2024-03-22 宏碁股份有限公司 患病机率预测方法与电子装置
KR102303272B1 (ko) * 2019-08-20 2021-09-17 주식회사 프로카젠 전립선암 위험도의 변화 정도 예측 시스템
US11923088B2 (en) * 2019-08-30 2024-03-05 AR & NS Investment, LLC Artificial intelligence-based personalized health maintenance system to generate digital therapeutic environment for multi-modal therapy
US20220409114A1 (en) * 2019-09-17 2022-12-29 Quadrus Medical Technologies, Inc. System and method for personalized kidney evaluation, diagnosis and therapy recommendation
US11701548B2 (en) 2019-10-07 2023-07-18 Rom Technologies, Inc. Computer-implemented questionnaire for orthopedic treatment
US11071597B2 (en) 2019-10-03 2021-07-27 Rom Technologies, Inc. Telemedicine for orthopedic treatment
US11830601B2 (en) 2019-10-03 2023-11-28 Rom Technologies, Inc. System and method for facilitating cardiac rehabilitation among eligible users
US12020799B2 (en) 2019-10-03 2024-06-25 Rom Technologies, Inc. Rowing machines, systems including rowing machines, and methods for using rowing machines to perform treatment plans for rehabilitation
US11282599B2 (en) 2019-10-03 2022-03-22 Rom Technologies, Inc. System and method for use of telemedicine-enabled rehabilitative hardware and for encouragement of rehabilitative compliance through patient-based virtual shared sessions
US11282604B2 (en) 2019-10-03 2022-03-22 Rom Technologies, Inc. Method and system for use of telemedicine-enabled rehabilitative equipment for prediction of secondary disease
US11325005B2 (en) 2019-10-03 2022-05-10 Rom Technologies, Inc. Systems and methods for using machine learning to control an electromechanical device used for prehabilitation, rehabilitation, and/or exercise
US20210134458A1 (en) 2019-10-03 2021-05-06 Rom Technologies, Inc. System and method to enable remote adjustment of a device during a telemedicine session
US11915815B2 (en) 2019-10-03 2024-02-27 Rom Technologies, Inc. System and method for using artificial intelligence and machine learning and generic risk factors to improve cardiovascular health such that the need for additional cardiac interventions is mitigated
US20210142893A1 (en) 2019-10-03 2021-05-13 Rom Technologies, Inc. System and method for processing medical claims
US20210127974A1 (en) 2019-10-03 2021-05-06 Rom Technologies, Inc. Remote examination through augmented reality
US11961603B2 (en) 2019-10-03 2024-04-16 Rom Technologies, Inc. System and method for using AI ML and telemedicine to perform bariatric rehabilitation via an electromechanical machine
US11139060B2 (en) 2019-10-03 2021-10-05 Rom Technologies, Inc. Method and system for creating an immersive enhanced reality-driven exercise experience for a user
US11955221B2 (en) 2019-10-03 2024-04-09 Rom Technologies, Inc. System and method for using AI/ML to generate treatment plans to stimulate preferred angiogenesis
US11282608B2 (en) 2019-10-03 2022-03-22 Rom Technologies, Inc. Method and system for using artificial intelligence and machine learning to provide recommendations to a healthcare provider in or near real-time during a telemedicine session
US11069436B2 (en) 2019-10-03 2021-07-20 Rom Technologies, Inc. System and method for use of telemedicine-enabled rehabilitative hardware and for encouraging rehabilitative compliance through patient-based virtual shared sessions with patient-enabled mutual encouragement across simulated social networks
US12020800B2 (en) 2019-10-03 2024-06-25 Rom Technologies, Inc. System and method for using AI/ML and telemedicine to integrate rehabilitation for a plurality of comorbid conditions
US11270795B2 (en) 2019-10-03 2022-03-08 Rom Technologies, Inc. Method and system for enabling physician-smart virtual conference rooms for use in a telehealth context
US12087426B2 (en) 2019-10-03 2024-09-10 Rom Technologies, Inc. Systems and methods for using AI ML to predict, based on data analytics or big data, an optimal number or range of rehabilitation sessions for a user
US20210134412A1 (en) 2019-10-03 2021-05-06 Rom Technologies, Inc. System and method for processing medical claims using biometric signatures
US11101028B2 (en) 2019-10-03 2021-08-24 Rom Technologies, Inc. Method and system using artificial intelligence to monitor user characteristics during a telemedicine session
US11978559B2 (en) 2019-10-03 2024-05-07 Rom Technologies, Inc. Systems and methods for remotely-enabled identification of a user infection
US11756666B2 (en) 2019-10-03 2023-09-12 Rom Technologies, Inc. Systems and methods to enable communication detection between devices and performance of a preventative action
US11075000B2 (en) 2019-10-03 2021-07-27 Rom Technologies, Inc. Method and system for using virtual avatars associated with medical professionals during exercise sessions
US11915816B2 (en) 2019-10-03 2024-02-27 Rom Technologies, Inc. Systems and methods of using artificial intelligence and machine learning in a telemedical environment to predict user disease states
US20210134425A1 (en) 2019-10-03 2021-05-06 Rom Technologies, Inc. System and method for using artificial intelligence in telemedicine-enabled hardware to optimize rehabilitative routines capable of enabling remote rehabilitative compliance
US11337648B2 (en) 2020-05-18 2022-05-24 Rom Technologies, Inc. Method and system for using artificial intelligence to assign patients to cohorts and dynamically controlling a treatment apparatus based on the assignment during an adaptive telemedical session
US11317975B2 (en) 2019-10-03 2022-05-03 Rom Technologies, Inc. Method and system for treating patients via telemedicine using sensor data from rehabilitation or exercise equipment
US20210128080A1 (en) 2019-10-03 2021-05-06 Rom Technologies, Inc. Augmented reality placement of goniometer or other sensors
US11955223B2 (en) 2019-10-03 2024-04-09 Rom Technologies, Inc. System and method for using artificial intelligence and machine learning to provide an enhanced user interface presenting data pertaining to cardiac health, bariatric health, pulmonary health, and/or cardio-oncologic health for the purpose of performing preventative actions
US11515028B2 (en) 2019-10-03 2022-11-29 Rom Technologies, Inc. Method and system for using artificial intelligence and machine learning to create optimal treatment plans based on monetary value amount generated and/or patient outcome
US20210134432A1 (en) 2019-10-03 2021-05-06 Rom Technologies, Inc. Method and system for implementing dynamic treatment environments based on patient information
US11955222B2 (en) 2019-10-03 2024-04-09 Rom Technologies, Inc. System and method for determining, based on advanced metrics of actual performance of an electromechanical machine, medical procedure eligibility in order to ascertain survivability rates and measures of quality-of-life criteria
US11923065B2 (en) 2019-10-03 2024-03-05 Rom Technologies, Inc. Systems and methods for using artificial intelligence and machine learning to detect abnormal heart rhythms of a user performing a treatment plan with an electromechanical machine
US12062425B2 (en) 2019-10-03 2024-08-13 Rom Technologies, Inc. System and method for implementing a cardiac rehabilitation protocol by using artificial intelligence and standardized measurements
US11887717B2 (en) 2019-10-03 2024-01-30 Rom Technologies, Inc. System and method for using AI, machine learning and telemedicine to perform pulmonary rehabilitation via an electromechanical machine
US11515021B2 (en) 2019-10-03 2022-11-29 Rom Technologies, Inc. Method and system to analytically optimize telehealth practice-based billing processes and revenue while enabling regulatory compliance
US11955220B2 (en) 2019-10-03 2024-04-09 Rom Technologies, Inc. System and method for using AI/ML and telemedicine for invasive surgical treatment to determine a cardiac treatment plan that uses an electromechanical machine
KR102281793B1 (ko) * 2019-10-15 2021-07-26 계명대학교 산학협력단 혈중 메타볼리즘을 이용한 건강 상태 정보 제공 장치 및 그 방법
US11826613B2 (en) 2019-10-21 2023-11-28 Rom Technologies, Inc. Persuasive motivation for orthopedic treatment
WO2021085676A1 (ko) * 2019-10-31 2021-05-06 주식회사 이노제닉스 인공지능 기반 아토피 피부염 예측 및 예방 상품 추천 방법
CN111048214A (zh) * 2019-11-11 2020-04-21 北京荣之联科技股份有限公司 外来畜禽疫病传播态势的预警方法及装置
KR102374326B1 (ko) 2019-11-21 2022-03-15 경북대학교 산학협력단 주의 계층적 적응 신경 퍼지 추론 시스템을 이용한 유방암 예측 방법, 이를 수행하기 위한 기록 매체 및 장치
CN111081334B (zh) * 2019-12-18 2023-04-18 鲁东大学 一种基于风险因素概率组合分析的慢性疾病早期预警方法
KR102186486B1 (ko) * 2019-12-20 2020-12-03 주식회사 슈파스 인공지능 기반의 이미지 분석을 통한 의학적 이벤트 발생 감지 방법, 장치 및 컴퓨터프로그램
KR102446005B1 (ko) * 2020-01-30 2022-09-21 연세대학교 원주산학협력단 딥러닝 기반 건강 위험도 예측을 통한 건강 개선 프로그램 제공 방법
KR102369001B1 (ko) * 2020-02-04 2022-02-28 연세대학교 원주산학협력단 대사 증후군 점수 추정 방법과 이를 이용한 표시 방법
KR102425629B1 (ko) * 2020-03-30 2022-07-28 주식회사 헤링스 사용자의 생활습관 관리 방법 및 장치
KR102558970B1 (ko) * 2020-04-17 2023-07-25 서울대학교병원 뇌동맥류 발병 위험도 예측 장치 및 방법
US11610679B1 (en) * 2020-04-20 2023-03-21 Health at Scale Corporation Prediction and prevention of medical events using machine-learning algorithms
US11107591B1 (en) 2020-04-23 2021-08-31 Rom Technologies, Inc. Method and system for describing and recommending optimal treatment plans in adaptive telemedical or other contexts
KR102264498B1 (ko) * 2020-04-23 2021-06-14 주식회사 바스젠바이오 유병 확률 예측을 위한 컴퓨터 프로그램
KR102489070B1 (ko) * 2020-05-29 2023-01-16 연세대학교 산학협력단 학습 모델 기반의 아토피 피부염 관리 장치 및 그 방법
KR102314107B1 (ko) * 2020-06-02 2021-10-19 (주)어메이징푸드솔루션 식품의 알러지 증상 발현도를 산출하기 위한 플랫폼 제공 장치 및 방법
KR102504883B1 (ko) * 2020-06-05 2023-03-02 인하대학교 산학협력단 인공 지능 기반 기계 학습을 이용한 급성 신부전 발생 예측 장치 및 그 방법
JP7170368B2 (ja) * 2020-07-28 2022-11-14 株式会社シンクメディカル 疾患リスク評価方法、疾患リスク評価装置、及び疾患リスク評価プログラム
US12100499B2 (en) 2020-08-06 2024-09-24 Rom Technologies, Inc. Method and system for using artificial intelligence and machine learning to create optimal treatment plans based on monetary value amount generated and/or patient outcome
US12094582B1 (en) 2020-08-11 2024-09-17 Health at Scale Corporation Intelligent healthcare data fabric system
KR102278646B1 (ko) * 2020-08-12 2021-07-19 주식회사 디이프 고객 맞춤형 식품 추천 시스템
CN112086130B (zh) * 2020-08-13 2021-07-27 东南大学 一种基于测序和数据分析的肥胖风险预测装置的预测方法
KR102478613B1 (ko) * 2020-08-24 2022-12-16 경희대학교 산학협력단 스마트 헬스케어 의사결정 지원 시스템을 위한 진화 가능한 증상-질병 예측 시스템
US12080428B1 (en) 2020-09-10 2024-09-03 Health at Scale Corporation Machine intelligence-based prioritization of non-emergent procedures and visits
US11227690B1 (en) * 2020-09-14 2022-01-18 Opendna Ltd. Machine learning prediction of therapy response
KR102599132B1 (ko) * 2020-11-26 2023-11-09 가톨릭대학교 산학협력단 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램
KR20220077892A (ko) * 2020-12-02 2022-06-09 (주)지놈오피니언 선천적 대사질환 위험도 점수를 이용한 심뇌혈관질환의 위험도 측정 방법
US11164669B1 (en) * 2020-12-29 2021-11-02 Kpn Innovations, Llc. Systems and methods for generating a viral alleviation program
CN112951421A (zh) * 2021-01-26 2021-06-11 吾征智能技术(北京)有限公司 一种基于饮食习惯推导高血压的系统、设备及存储介质
KR102599840B1 (ko) * 2021-02-04 2023-11-07 가톨릭대학교 산학협력단 당뇨병 발병 위험도 산출 시스템, 산출 방법, 및 프로그램
KR102662469B1 (ko) * 2021-02-05 2024-04-30 가천대학교 산학협력단 소비자 직접 의뢰 유전자 검사 기반 피검사자의 맞춤형 영양 가이드 제공 시스템 및 제공 방법
KR102510347B1 (ko) * 2021-02-10 2023-03-20 고려대학교 산학협력단 위암 수술 이후 제2형 당뇨병 예후의 예측 방법
CN112967807B (zh) * 2021-03-03 2023-12-01 吾征智能技术(北京)有限公司 基于饮食行为预测脑卒中的系统、设备及存储介质
US20220318626A1 (en) * 2021-04-05 2022-10-06 Nec Laboratories America, Inc. Meta-training framework on dual-channel combiner network system for dialysis event prediction
KR102417448B1 (ko) * 2021-05-20 2022-07-06 한국과학기술정보연구원 머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치
CN113178261A (zh) * 2021-06-04 2021-07-27 福州大学 基于机器学习的糖尿病预测模型构建方法及系统
KR102646527B1 (ko) * 2021-11-12 2024-03-11 가천대학교 산학협력단 Ai 기반 감염 의심자 분류 장치 및 그 방법
KR102698013B1 (ko) * 2021-07-23 2024-08-23 연세대학교 원주산학협력단 인공 지능 기반 맞춤형 건강 증진 컨텐츠 서비스를 추천하는 방법 및 장치
CA3228968A1 (en) * 2021-08-18 2023-02-23 Navdeep TANGRI Systems and methods for predicting kidney function decline
US20230075176A1 (en) * 2021-09-08 2023-03-09 Optum Services (Ireland) Limited Interactable and interpretable temporal disease risk profiles
CN114358989A (zh) * 2021-12-07 2022-04-15 重庆邮电大学 一种基于标准差和交互信息的慢性疾病特征选择方法
KR20240009132A (ko) 2022-07-13 2024-01-22 포체인스 주식회사 가중치 거리함수를 이용한 질병 예측 장치 및 그 방법
US20240071623A1 (en) * 2022-08-31 2024-02-29 AXL Health, LLC Patient health platform
KR102531776B1 (ko) * 2022-10-31 2023-05-12 대한민국 유전 및 라이프스타일 위험도 평가 기반 제2형 당뇨병 고위험군 진단 방법
JP2024094291A (ja) * 2022-12-27 2024-07-09 トータルフューチャーヘルスケア株式会社 健康管理システム及び健康管理方法
KR102660560B1 (ko) * 2024-02-14 2024-04-25 삼성화재해상보험 주식회사 심뇌혈관 위험도 평가 서비스 제공 방법 및 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050032066A1 (en) * 2003-08-04 2005-02-10 Heng Chew Kiat Method for assessing risk of diseases with multiple contributing factors

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110202486A1 (en) * 2009-07-21 2011-08-18 Glenn Fung Healthcare Information Technology System for Predicting Development of Cardiovascular Conditions
GB201214440D0 (en) * 2012-08-13 2012-09-26 Randox Lab Ltd Kidney disease biomarker
US11101021B2 (en) * 2014-08-08 2021-08-24 Icahn School Of Medicine At Mount Sinai Electronic phenotyping technique for diagnosing chronic kidney disease
WO2016094330A2 (en) * 2014-12-08 2016-06-16 20/20 Genesystems, Inc Methods and machine learning systems for predicting the liklihood or risk of having cancer
KR20160043527A (ko) * 2016-03-31 2016-04-21 강수진 당뇨병 및 당뇨 합병증 관리시스템과 방법
US20170308981A1 (en) * 2016-04-22 2017-10-26 New York University Patient condition identification and treatment

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050032066A1 (en) * 2003-08-04 2005-02-10 Heng Chew Kiat Method for assessing risk of diseases with multiple contributing factors

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102553562B1 (ko) 2022-10-13 2023-07-10 서울대학교산학협력단 유방암 발생 위험도 예측 장치 및 방법

Also Published As

Publication number Publication date
KR102024373B1 (ko) 2019-09-23
WO2018124831A1 (ko) 2018-07-05
KR20180079208A (ko) 2018-07-10
KR20180079209A (ko) 2018-07-10
WO2018124854A1 (ko) 2018-07-05
US20190172587A1 (en) 2019-06-06

Similar Documents

Publication Publication Date Title
KR102024375B1 (ko) 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법
JP7278571B2 (ja) 対象システムの内部状態を推定する支援システム
CN108648827B (zh) 心脑血管疾病风险预测方法及装置
US9589104B2 (en) Self-improving method of using online communities to predict health-related outcomes
Chakradar et al. A non-invasive approach to identify insulin resistance with triglycerides and HDL-c ratio using machine learning
CN111524602A (zh) 一种老年人记忆及认知功能评估筛查预警系统
KR102316403B1 (ko) 만성신장 질환 발생 예측 장치 및 방법
Scott et al. Machine learning in clinical practice: prospects and pitfalls
JP2012064087A (ja) 生活習慣病の診断予測装置、生活習慣病の診断予測方法及びプログラム
Faisal et al. A noninvasive intelligent approach for predicting the risk in dengue patients
JP2012018450A (ja) ニューラルネットワークシステム、ニューラルネットワークシステムの構築方法およびニューラルネットワークシステムの制御プログラム
CN110299207A (zh) 用于慢性病检测中的基于计算机预测模型数据处理方法
CN116564521A (zh) 一种慢性病风险评估模型建立方法、介质及系统
Zhang et al. Identifying the predictors of severe psychological distress by auto-machine learning methods
KR20210001959A (ko) 위암의 다층 다요인 패널과 Computational biological network modeling을 통한 위암 발암에 대한 에티옴 모형
US20230046951A1 (en) System and method for assessing risk of type 2 mellitus diabetes complications
Deepa et al. Experimental evaluation of artificial intelligence assisted heart disease prediction using deep learning principle
Wang et al. Prediction of target range of intact parathyroid hormone in hemodialysis patients with artificial neural network
Ye Developing a predictive model for the risk of diabetes
Galozy Towards Understanding ICU Procedures using Similarities in Patient Trajectories: An exploratory study on the MIMIC-III intensive care database
Rabbi AN INTELLIGENT SYSTEM APPROACH FOR PREDICTING THE RISK OF HEART FAILURE
Sande Statistical Inference for Decision Curve Analysis and Decision Threshold for Statistical Learning in Medical Research
Mallapur Healthcare monitoring and Recommendation model: Hybrid Deep learning Enabled Disease Diagnosis Framework
Taktak et al. Survival analysis in cancer using a partial logistic neural network model with Bayesian regularisation framework: a validation study
Madi Optimal Cut-Points for Diagnostic Variables in Complex Surveys

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant