KR102083995B1 - Disease Network Generating Method using Cohort and Computer Readable Record Medium thereof - Google Patents

Disease Network Generating Method using Cohort and Computer Readable Record Medium thereof Download PDF

Info

Publication number
KR102083995B1
KR102083995B1 KR1020190107933A KR20190107933A KR102083995B1 KR 102083995 B1 KR102083995 B1 KR 102083995B1 KR 1020190107933 A KR1020190107933 A KR 1020190107933A KR 20190107933 A KR20190107933 A KR 20190107933A KR 102083995 B1 KR102083995 B1 KR 102083995B1
Authority
KR
South Korea
Prior art keywords
disease
network
diseases
risk
computer
Prior art date
Application number
KR1020190107933A
Other languages
Korean (ko)
Other versions
KR20190104500A (en
Inventor
한현욱
유종만
반치용
이채원
김강현
남상민
Original Assignee
차의과학대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 차의과학대학교 산학협력단 filed Critical 차의과학대학교 산학협력단
Priority to KR1020190107933A priority Critical patent/KR102083995B1/en
Publication of KR20190104500A publication Critical patent/KR20190104500A/en
Application granted granted Critical
Publication of KR102083995B1 publication Critical patent/KR102083995B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

본 발명은 컴퓨터를 이용하여, 코호트 데이터베이스로부터 질환 발병 네트워크를 구축하는 방법에 관한 것으로, 제어부가, 상대위험도를 산출하는 단계들을 미리 설정된 서로 다른 질환들에 대응하여 상호 순차적으로 반복 수행하여, 상기 상대위험도에 기초한 각 질환 간 이환율의 상호 상관관계를 나타내는 질환 발병 네트워크를 구축하는 단계; 및 출력부가 상기 질환 발병 네트워크를 출력하는 단계를 포함한다.The present invention relates to a method for constructing a disease-causing network from a cohort database using a computer, wherein the control unit repeatedly performs steps for calculating a relative risk in response to different preset diseases, thereby performing the counterpart. Establishing a disease onset network that exhibits a correlation of morbidity between risks based on risk; And outputting the disease-prone network.

Figure R1020190107933
Figure R1020190107933

Description

코호트를 이용한 질환 발병 네트워크 구축 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체 {Disease Network Generating Method using Cohort and Computer Readable Record Medium thereof}Disease Network Generating Method using Cohort and Computer Readable Record Medium

본 발명은, 코호트를 이용한 질환 발병 네트워크 구축 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체에 관한 것으로, 구체적으로 예를 들면, 장기간의 건강보험공단의 임상 데이터를 이용하여 각 질환의 상대위험도를 추출하여 질환 발명 네트워크를 구축하고, 이에 기초한 질환의 발병 가능성 등을 용이하게 예측하게 함으로써, 환자의 건강한 삶을 유도하고 국민의 의료비용 증가 등을 예방할 수 있는 코호트를 이용한 질환 발병 네트워크 구축 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체에 관한 것이다.The present invention relates to a method for establishing a disease onset network using a cohort, and a computer readable recording medium recording the same. Specifically, for example, a disease may be extracted by extracting a relative risk of each disease using clinical data of a long-term health insurance corporation. By constructing the invention network and making it easy to predict the possibility of the disease based on it, a method of establishing a disease onset network using a cohort that can lead to a healthy life of the patient and prevent the increase of medical costs of the people and the computer read the recorded It relates to a possible recording medium.

그동안 생명체 네트워크에 관한 연구는 분자를 매개로한 네트워크에 집중되어 있어 실제 임상적인 효용성에 대해서는 많은 문제가 제기되어 왔다.The research on life networks has been concentrated on molecular networks, which has raised many questions about actual clinical utility.

즉, 분자 기반 질환 네트워크 모델은 유전질환에 국한된 것으로 암 등, 유전체와 밀접하게 연관 되어 있는 질환들(10~20%)에서는 타당성이 일부 보장되나 환자들이 병원을 찾게 되는 대부분의 질환들(80~90%)은 유전과는 관계성이 적은 질환임을 감안할 때 분자기반 질환네트워크를 통해서 모든 질환들 간의 상관성을 탐구하는 데는 한계가 있다는 우려가 있다.In other words, the molecular-based disease network model is limited to genetic diseases, and in some cases (10-20%) that are closely related to the genome, such as cancer, some validity is guaranteed, but most diseases in which patients visit hospitals (80 ~ 90%) are concerned that there is a limit in exploring correlations among all diseases through molecular-based disease networks, given that the disease is less related to heredity.

또한, 질환은 연령, 인종, 성별 등에 따라 발생 패턴이 상이함에도 불구하고 분자유전학적 관점에서 이와 같은 속성들을 전혀 고려하지 않고 하나의 네트워크로 묶어 놓아 해석하기 때문에 한국인에서 특이하게 연관되어 있는 질환의 특이성을 연령, 성별, 사회경제적 지수별 등의 특성에 따라 파악하지 못한다는 문제점을 가지고 있다.In addition, although the pattern of occurrence differs according to age, race, and gender, the specificity of the disease that is specifically related to Koreans is interpreted by grouping them into one network without considering these properties from the viewpoint of molecular genetics. Has a problem in that it cannot be identified according to characteristics such as age, gender, and socioeconomic index.

세계적으로 임상의학적 관점의 네트워크 의학 연구에 대한 중요성이 점차 증가되어 가고 있음에도 국내의 경우 대부분 분자유전학 기반의 전통적인 시스템생물학 연구에만 집중되어 왔는데 이러한 이유는 생물학적 지식 뿐만 아니라 임상 의학적인 지식과 네트워크 관점의 정보학 지식을 함께 갖춘 융합 인력이 부족한 것도 한 원인으로 파악된다.Although the importance of network medical research from the clinical medical point of view is increasing worldwide, most of the cases in Korea have been concentrated on traditional system biology research based on molecular genetics. Lack of converged human resources with knowledge is also a cause.

기존의 네트워크 의학 연구는 분자유전학을 기반으로 서구인의 특성을 반영하여 질환 네트워크를 구성하였기 때문에 한국인에서 발생하는 질환 간에 연관관계를 파악하기는 사실상 어렵다. 국내의 경우, 건강보험공단이나 심사평가원이 10여 년간의 엄청난 규모의 임상 빅데이터를 보유하고 있을 뿐만 아니라 각 병원들은 EMR (Electronic Medical Record) 데이터를 다수 보유하고 있기 때문에 이를 연구에 활용하여 질환 네트워크를 모델링하고 이를 구축한다면 한국인에서 발생하는 유전질환 및 비유전 질환 간의 연관성도 파악할 수 있어 연구의 성과로도 충분한 가치가 있을 뿐만 아니라 국가 보건의료 정책과 대책을 세우는데도 실질적인 도움이 될 수 있을 것으로 이해된다.Since the existing network medical research has formed a disease network reflecting the characteristics of Westerners based on molecular genetics, it is virtually difficult to identify the relationship between diseases occurring in Koreans. In Korea, not only do health insurance corporations and reviewers have huge clinical big data for more than a decade, but also each hospital has a large number of electronic medical record (EMR) data, which can be used in research and disease networks. Modeling and constructing it can also identify the link between genetic and non-genetic diseases occurring in Koreans, and it is worth noting that the results of the research will be of great value and can be of practical help in establishing national health care policies and measures. do.

한편, 국내 보건의료 임상 빅데이터(건강보험공단, 심평원 등)가 폭발적으로 증가하여 이를 보건의료 기초 및 정책 연구를 위한 인프라로 활용할 수 있으며, 2000년대 초반부터 빅데이터를 활용한 의학 연구 분야 중 네트워크 의학 분야에 대한 연구가 본격적으로 연구되기 시작하고, 이와 같은 연구는 기존의 전통적인 연구 방법론인 환원주의에 대한 근본적인 문제점을 보완해 생명체를 하나의 시스템으로 해석해 생명체의 창발요인 (Emerging Property) 탐구하는데 큰 기여를 하였을 것으로 이해된다.On the other hand, Korea's clinical clinical big data (Health Insurance Corporation, Simpyungwon, etc.) has exploded and can be used as an infrastructure for basic medical and policy research.In the early 2000s, the network of medical research fields using big data Research in the field of medicine begins to be studied in earnest, and this research complements the fundamental problem of reductionism, which is a traditional research methodology, and interprets life as a system to explore the emerging properties of life. I understand that you have contributed.

이와 같은 관점에서 순차적으로 병원에 방문하는 환자들의 임상 질환 데이터베이스를 이용하여 어떤 질환이 다른 질환에 영향을 미칠지 예측하는 방법과 이를 시각화하는 방법을 보다 구체적으로 파악하는 것이 바람직하다.From this point of view, it is desirable to understand in detail how to predict which diseases will affect other diseases and how to visualize them using the clinical disease database of patients who visit the hospital sequentially.

[참고문헌][references]

공개특허공보 제10-2016-0043777호 (2016.04.22 공개)Publication No. 10-2016-0043777 (published Apr. 22, 2016)

본 발명의 목적은, 빅 데이터를 이용하여 환자들의 질환에 기초하여 모든 질환들 간의 상관성을 보다 효율적이고 신뢰성 있게 도출할 수 있는 코호트를 이용한 질환 발병 네트워크 구축 방법, 질환 발병 네트워크 시각화 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체를 제공하는 것이다.Disclosure of the Invention An object of the present invention is to construct a disease onset network using a cohort, which can efficiently and reliably derive correlations among all diseases based on diseases of patients using big data, a method of visualizing disease onset networks, and a computer recording the same. To provide a readable recording medium.

또한, 본 발명의 다른 목적은, 코호트가 인구를 잘 대표한다면 한국인에게 발생하는 질환들 간의 상관관계를 파악하여 한국인에게 가장 적합한 정밀의학을 위한 플랫폼으로 활용할 수 있는 코호트를 이용한 질환 발병 네트워크 구축 방법, 질환 발병 네트워크 시각화 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체를 제공하는 것이다.In addition, another object of the present invention, if the cohort well represented the population to identify the correlation between diseases occurring in Koreans disease disease network construction method using a cohort that can be used as a platform for precision medicine most suitable for Koreans, To provide a disease onset network visualization method and a computer-readable recording medium recording the same.

또한, 본 발명의 또 다른 목적은, 질환의 특성을 연령, 성별, 사회경제적 지수별, 요양기관별 등의 다양한 형태로 보여주고 간단하고 편리하게 가공하여 정밀의학을 위한 플랫폼으로 활용할 수 있는 코호트를 이용한 질환 발병 네트워크 구축 방법, 질환 발병 네트워크 시각화 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체를 제공하는 것이다.In addition, another object of the present invention is to show the characteristics of the disease in various forms, such as age, sex, socioeconomic index, nursing institutions, etc., using a cohort that can be used as a platform for precision medicine by processing simply and conveniently To provide a disease onset network construction method, a disease onset network visualization method and a computer-readable recording medium recording the same.

또한, 본 발명의 또 다른 목적은, 환자들의 유전질환 및 비유전질환 간의 연관성도 파악할 수 있으며 이를 보건의료 정책 등에 활용할 수 있는 코호트를 이용한 질환 발병 네트워크 구축 방법, 질환 발병 네트워크 시각화 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체를 제공하는 것이다.In addition, another object of the present invention, it is possible to determine the association between genetic and non-genetic diseases of patients, a disease onset network construction method using a cohort that can be utilized in health care policy, disease onset network visualization method and computer recording the same To provide a readable recording medium.

또한, 본 발명의 또 다른 목적은, 특정 질환이 다른 질환에 상호 영향을 주는 정도를 예측하기 위한 통계 모델을 만들고 이를 효과적으로 시각화할 수 있는 코호트를 이용한 질환 발병 네트워크 구축 방법, 질환 발병 네트워크 시각화 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체를 제공하는 것이다.In addition, another object of the present invention is to create a statistical model for predicting the degree to which a particular disease mutually affects other diseases and to establish a disease onset network using a cohort that can effectively visualize it, a disease onset network visualization method and A computer readable recording medium having recorded thereon is provided.

또한, 본 발명의 또 다른 목적은, 질환 발생의 선후 관계에 있는 네트워크를 구성하고 이를 시각화할 수 있는 코호트를 이용한 질환 발병 예측 방법, 질환 발병 네트워크 시각화 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체를 제공하는 것이다.In addition, another object of the present invention is to provide a method for predicting disease occurrence using a cohort capable of constructing and visualizing a network having a prognostic relationship of disease occurrence, a method for visualizing disease occurrence network, and a computer-readable recording medium recording the same. will be.

상기한 바와 같은 과제를 해결하기 위한 본 발명의 실시 예에 따른 방법은, 컴퓨터를 이용하여, 코호트 데이터베이스로부터 질환 발병 네트워크를 구축하는 방법에 있어서, 제어부가, 상기 코호트 데이터베이스로부터, 대상 질환이 위험 질환에 영향을 미치는 기간으로서 설정된 제1설정기간 동안, 복수의 질환들 중 제1 대상 질환(D1)이 발병하지 않은 인원을 A 그룹으로 분류하는 단계; 상기 제어부가, 상기 A 그룹으로부터 상기 제1설정기간 동안 제2 대상 질환에 대응하는 제2 위험 질환(R=D2)이 발병한 인원을 E 그룹으로 분류하고, 제2 위험 질환(R=D2)이 발병하지 않은 인원을 C 그룹으로 분류하는 단계; 상기 제어부가, 상기 제1설정기간 이후에, 반대로 위험 질환이 대상 질환에 영향을 미치는 기간으로서 설정된 제2설정기간 동안, 상기 E 그룹 중 상기 제1 위험 질환(D1)이 발병한 인원을 E1 그룹으로 분류하고, 상기 C 그룹 중 제2 위험 질환(R=D2)이 발병하지 않은 인원을 C1 그룹으로 분류하는 단계; 상기 제어부가, 상기 E 그룹과 E1 그룹의 상대 인원수 또는 상대 빈도값으로부터 산출되는 제1 상대값과, 상기 C 그룹과 C1 그룹의 상대 인원수 또는 상대 빈도값으로부터 산출되는 제2 상대값으로부터, 상기 제2 위험질환(R=D2)과 상기 대상 질환(D1) 간의 상대위험도를 산출하는 단계; 상기 제어부가, 상기 각 단계들을 상기 복수의 질환들 중 미리 설정된 서로 다른 나머지 질환들을 대상질환 및 위험질환으로 설정하여 상호 순차적으로 반복 수행하여, 상기 상대위험도에 기초한 각 질환 간 이환율의 상호 상관관계를 나타내는 질환 발병 네트워크를 구축하는 단계; 및 출력부가 상기 질환 발병 네트워크를 출력하는 단계를 포함한다.In a method according to an embodiment of the present invention for solving the above problems, in a method for constructing a disease onset network from a cohort database by using a computer, the control unit, from the cohort database, the target disease is a dangerous disease Classifying a person who does not develop a first target disease (D1) among the plurality of diseases in the group A during the first setting period set as a period affecting the group; The control unit may classify the number of persons having a second risk disease (R = D2) corresponding to a second target disease from the group A into the group E, and generate a second risk disease (R = D2). Classifying the unaffected personnel into group C; The control unit, after the first predetermined period, during the second set period in which the dangerous disease affects the target disease on the contrary, the number of people having developed the first dangerous disease D1 in the E group is the E1 group Classifying a person who does not develop a second risk disease (R = D2) in the C group into a C1 group; The control unit is configured to generate the first relative value calculated from the relative number of persons or relative frequency values of the E group and the E1 group, and the second relative value calculated from the relative number of persons or the relative frequency value of the C group and the C1 group. Calculating a relative risk between the risk disease (R = D2) and the target disease (D1); The control unit repeats the steps by sequentially setting different remaining preset diseases among the plurality of diseases as a target disease and a risk disease, and mutually correlating morbidity rates between the diseases based on the relative risk. Constructing an indicative disease onset network; And outputting the disease-prone network.

본 발명에 따르면, 빅 데이터를 이용하여 환자들의 질환에 기초하여 모든 질환들 간의 상관성을 보다 효율적이고 신뢰성 있게 도출할 수 있으며, 코호트가 거의 모든 국민이라면 한국인에게 발생하는 질환들 간의 상관관계를 파악하여 한국인에게 가장 적합한 정밀의학을 위한 플랫폼으로 활용할 수 있는 코호트를 이용한 질환 발병 네트워크 구축 방법, 질환 발병 네트워크 시각화 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체를 제공할 수 있다.According to the present invention, big data can be used to derive correlations among all diseases more efficiently and reliably based on diseases of patients, and if the cohort is almost all citizens, the correlation between diseases occurring in Koreans A disease onset network construction method using a cohort that can be used as a platform for precision medicine that is most suitable for Koreans, a method of visualizing a disease onset network, and a computer readable recording medium recording the same can be provided.

또한, 질환의 특성을 연령, 성별, 사회경제적 지수별, 요양기관별 등의 다양한 형태로 보여주고 간단하고 편리하게 가공할 수 있고, 환자들의 유전질환 및 비유전질환 간의 연관성도 파악할 수 있으며 이를 보건의료 정책 등에 활용할 수 있는 코호트를 이용한 질환 발병 네트워크 구축 방법, 질환 발병 네트워크 시각화 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체를 제공할 수 있다.In addition, the characteristics of the disease can be shown in various forms such as age, sex, socioeconomic index, and nursing institution, and can be processed simply and conveniently. Also, the relationship between the genetic and non-genetic diseases of patients can be identified. A disease onset network construction method using a cohort that can be used for a policy, a method of visualizing a disease onset network, and a computer-readable recording medium recording the same can be provided.

또한, 특정 질환이 다른 질환에 영향을 주는 정도를 예측하기 위한 통계 모델을 만들고 이를 효과적으로 시각화할 수 있으며, 질환 발생의 선후 관계에 있는 네트워크를 구성하고 이를 시각화할 수 있는 코호트를 이용한 질환 발병 네트워크 구축 방법, 질환 발병 네트워크 시각화 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체를 제공할 수 있다.In addition, it is possible to create a statistical model to predict the extent to which a particular disease affects other diseases, and to visualize it effectively, and to establish a disease onset network using a cohort that can construct and visualize the network that is related to the occurrence of disease. A method, a disease onset network visualization method, and a computer readable recording medium recording the same can be provided.

도 1은 본 발명의 일 실시예에 따른 특정질환을 선정하여 질환 발병 예측 방법의 일 예를 설명하기 위한 흐름도,
도 2는 전체 질환 네트워크를 시각화한 일 예,
도 3은 연령별 질환 네트워크를 시각화한 일 예
도 4는 성별 질환 네트워크를 시각화한 일 예이다.
1 is a flowchart illustrating an example of a disease prediction method by selecting a specific disease according to an embodiment of the present invention;
2 is an example of a visualization of an entire disease network;
3 is an example of visualizing disease networks by age
4 is an example of visualization of the gender disease network.

본 발명에 따른 코호트를 이용한 질환 발병 예측 방법, 질환 발병 네트워크 시각화 방법에 대하여 도 1 내지 도 4를 참조하여 구체적으로 설명하면 다음과 같다.The disease onset prediction method and the disease onset network visualization method using the cohort according to the present invention will be described in detail with reference to FIGS. 1 to 4.

도 1은 본 발명의 일 실시예에 따른 질환 발병 예측 방법의 일 예를 설명하기 위한 흐름도이고, 도 2는 전체 질환 네트워크를 시각화한 일 예이며, 도 3은 연령별 질환 네트워크를 시각화한 일 예이고, 도 4는 성별 질환 네트워크를 시각화한 일 예이다.1 is a flowchart illustrating an example of a method for predicting disease occurrence according to an embodiment of the present invention, FIG. 2 is an example of a visualization of an entire disease network, and FIG. 3 is an example of a visualization of an age-specific disease network. 4 is an example of visualizing a gender disease network.

본 발명에 따른 코호트를 이용한 질환 발병 예측 방법은 컴퓨터상에서 수행될 수 있으며, 도시되지는 않았으나 컴퓨터의 통신부 또는 입력부 등을 통해 코호트 데이터를 입력받거나 수집하고, 컴퓨터의 제어부에서 도 1에 도시된 바와 같이, 코호트에서 설정된 제1설정기간 동안 다수의 질환(D1, D2, D3, ..., Dn) 중 발생률을 분석할 제1 대상질환(D1)을 가지지 않은 A집단(A : At risk population)을 구하는 (1)단계와; 상기 A집단에서 상기 제1 대상질환(D1)과 다른 위험요인으로 가정할 다른 제2 대상질환(D2)에 대응하는 어느 하나의 위험요소(Risk factor)를 갖는 제2 위험질환(R=D2)을 가진 E그룹(Exposed)과 상기 제2 위험질환(R=D2)을 가지지 않은 C그룹(Control)으로 분류하고 각각의 인원수((n(E), n(C))를 구하는 (2)단계와; 상기 제1설정기간 이후의 제2설정기간 동안 상기 E그룹 중 상기 제1 대상질환(D1)을 가지는 인원수(n(E`))를 구하는 (3)단계와; 상기 제2설정기간 동안 상기 C그룹 중 상기 제1 대상질환(D1)을 가지는 인원수(n(C1))를 구하는 (4)단계와; 상기 (3)단계와 상기 (4)단계로부터 구한 인원수(n(E1), n(C1))와 상기 (2)단계에서 구한 인원수((n(E), n(C))에 기초하여 상기 제2 위험질환(R=D2)이 상기 제1 대상질환(D1)에 영향을 미치는 상대위험도(RR: Relative Risk, 이하에서 RRR->D로 표시)를 아래 <식 x>로 구하는 (5)단계;를 수행하고, 하기의 순차적이고 반복적인 각 단계 수행에 따른 수행 결과를 시각화한 질병 관계 네트워크를 구축하여 컴퓨터의 출력부를 통해 출력하는 것을 특징으로 하는 질환 발병 예측 방법으로 구성될 수 있다.The disease occurrence prediction method using the cohort according to the present invention may be performed on a computer. Although not shown, the cohort data is received or collected through a communication unit or an input unit of a computer, and the control unit of the computer is shown in FIG. 1. At group A (at risk population) having no first target disease (D1) to analyze the incidence rate among a plurality of diseases (D1, D2, D3, ..., Dn) during the first set period set in the cohort. Obtaining (1); Second risk disease (R = D2) having any one risk factor corresponding to another second target disease D2 to be assumed to be a different risk factor from the first target disease D1 in the group A. (2) classifying the group E into (Exposed) and the group C without the second risk disease (R = D2) and controlling the number of persons ((n (E), n (C)) (3) obtaining a number n (E ′) of the group E having the first target disease D1 during the second setting period after the first setting period; (4) calculating the number of people (n (C1)) having the first target disease (D1) among the C group; and the number of people (n (E1), n obtained from the steps (3) and (4)). The second risk disease (R = D2) affects the first target disease (D1) based on the number of persons ((n (E), n (C)) obtained in step (2)) and (2). The relative risk (RR: Relative Risk, RR R-> D below) is shown below. (5) to obtain the formula (X); and to establish a disease relationship network visualizing the results of performing the following sequential and repetitive steps to develop the disease characterized in that the output through the output of the computer It can be configured as a prediction method.

RRR ->D = n(E1)/n(E) ÷ n(C1)/n(C) -------------- <식 x>RR R- > D = n (E1) / n (E) ÷ n (C1) / n (C) -------------- <expression x>

여기서, 상기 식 x은 상기 제어부가, 상기 E 그룹과 E1 그룹의 상대 인원수 또는 상대 빈도값으로부터 산출되는 제1 상대값(n(E1)/n(E))과, 상기 C 그룹과 C1 그룹의 상대 인원수 또는 상대 빈도값으로부터 산출되는 제2 상대값(n(C1)/n(C))으로부터, 상기 제2 위험질환(R=D2)이 상기 대상질환(D1)에 영향을 미치는 상대위험도 RRR->D를 나누기 연산으로 산출하는 것으로 설명될 수 있다.Here, the expression x is the control unit, the first relative value (n (E1) / n (E)) calculated from the relative number of people or relative frequency value of the E group and the E1 group, and the C group and the C1 group Relative risk RR that the second risk disease (R = D2) affects the target disease (D1) from the second relative value (n (C1) / n (C)) calculated from the relative number of people or the relative frequency value It can be described as calculating R-> D by the division operation.

그리고, 상기 (2)단계에서 상기 제2 위험질환(R=D2)을 복수의 질환들 중 나머지 각 대상 질환(D3, ..., Dn)들에 대응되는 위험질환들(R=D3, ..., R=Dn)로 순차적으로 변경하여 상기 (3)단계에서 상기 (5)단계를 순차적으로 각각 수행하는 (6)단계;를 마친 후, 상기 대상질환(D1) 대신 나머지 각 대상 질환(D2, D3, ..., Dn)에 대한 프로세스로 순차적으로 그 대상 질환을 변경하면서 상기 (1)단계에서 상기 (6)단계를 반복 수행하는 것이 바람직하다. 이에 따라, 상기 각 단계들이 미리 설정된 서로 다른 질환들(D3,D4,...,Dn)에 대응하여 상호 순차적으로 반복 수행되어, 상기 상대위험도에 기초한 각 질환 간 이환율의 상호 상관관계를 나타내는 질환 발병 네트워크가 구축될 수 있는 것이다.In the step (2), the second risk disease (R = D2) corresponds to the risk diseases (R = D3,...) Corresponding to each of the remaining target diseases (D3, ..., Dn) among a plurality of diseases. .., R = Dn) by sequentially changing to step (6) to perform the step (5) in step (3), respectively; after finishing, instead of the target disease (D1) for each remaining target disease ( D2, D3, ..., Dn) it is preferable to repeat the above step (1) to step (1) while sequentially changing the target disease. Accordingly, the steps are repeatedly performed in order to correspond to different preset diseases (D3, D4, ..., Dn) in order to show mutual correlation of morbidity rates between the diseases based on the relative risk. An outbreak network can be built.

보다 구체적으로, 도 1에 도시된 바와 같이, 상기 (2)단계에서 상기 제2 위험질환(R=D2)을 나머지 질환(D3, ..., Dn)에 대응되는 위험 질환(R=D3, ..., R=Dn)로 순차적으로 변경하여 상기 (3)단계에서 상기 (5)단계를 순차적으로 각각 수행하는 (6)단계;를 마친 후(도 1의 이점쇄선 'L2'로 둘러싸인 부분을 D3, ..., Dn에 대하여 순차적으로 수행하는 것을 의미함), 상기 (1)단계에서 상기 (6)단계를 상기 대상질환(D1) 대신 나머지 질환(D2, D3, ..., Dn)에 대한 프로세스로서, 순차적으로 그 대상 질환을 변경하면서 상기 각 단계를 반복 수행하는 것(도 1에서 붉은 점선 'L2'로 둘러싸인 부분을 D2, D3, ..., Dn에 대하여 순차적으로 수행하는 것을 의미함)이 바람직하다.More specifically, as shown in FIG. 1, in the step (2), the second risk disease (R = D2) corresponds to the risk disease (R = D3, corresponding to the remaining diseases (D3, ..., Dn). ..., R = Dn) by sequentially changing the step (3) to perform the step (5) in the step (3); after finishing (part enclosed by the dashed chain line 'L2' of Figure 1) Means D3, ..., Dn sequentially), the step (6) in the step (1) instead of the target disease (D1) the remaining diseases (D2, D3, ..., Dn) As a process for the step, performing the above steps repeatedly while sequentially changing the target disease (sequentially performing the portion surrounded by the red dotted line 'L2' in FIG. 1 for D2, D3, ..., Dn It is preferred that).

여기서, 제1설정기간(X 기간)은 어느 질병이든 질병을 가지고 있는 사람이면 그 질병에 대해 최소 한번 의료기관을 방문할 것이 예상되는 기간인 1년보다 길게 설정되는 것이 바람직하다. 제2설정기간(Y 기간)은 제1설정기간이 경과하여 발생된 대상 질병(D)에 미치는 영향들 중 파악하고자 하는 위험 질환(R)의 영향이 반대로 미치는 기간으로서 설정되는 것이 바람직하다. 예를 들면 위험 질환(R)의 대상 질환(D)에 대한 단기적인 영향을 파악하고자 하면 Y는 1년으로 설정될 수 있고, 민성적인 영향을 파악하고자 하면 Y는 10년으로 설정될 수 있으며, 이 정도의 기간 설정은 상기 기간에 걸친 임상자료가 취합되어 상기 설정된 기간 동안 형성되는 특정 질환과 다른 질환과의 상관관계 내지 발병한 질환이 약물에 의한 것인지에 대한 예측 등을 용이하게 할 수 있어 바람직하다.Here, it is preferable that the first predetermined period (X period) is set to be longer than one year, which is a period in which a person who has a disease is expected to visit a medical institution at least once for the disease. The second setting period (Y period) is preferably set as a period in which the effect of the dangerous disease (R) to be grasped out of the effects on the target disease (D) generated after the first setting period is reversed. For example, Y can be set to one year if you want to determine the short-term impact of a dangerous disease (R) on a target disease (D), and Y can be set to ten years if you want to identify a civil impact. The period setting of the degree is preferable because it is possible to collect the clinical data over the period to facilitate the correlation between the specific disease and other diseases formed during the set period or to predict whether the disease is caused by the drug.

여기서, 모집단 내지 통계의 표본이 되는 코호트는 다양한 데이터베이스를 포함할 수 있으나 건강보험공단이나 심사평가원의 데이터베이스 또는 각 대학병원의 데이터베이스 등을 포함하는 것이 바람직하다.Here, the cohort that is a sample of the population or statistics may include various databases, but it is preferable to include a database of the Health Insurance Corporation or a screening agency or a database of each university hospital.

도 1을 참조하여 보다 상세하게 설명하면 다음과 같다.Referring to Figure 1 in more detail as follows.

먼저, 우선 기간적인 측면에서, 제1설정기간(X 기간)은 제(1)단계(S110)와 제(2)단계(S130)에서 적용되고, 제2설정기간(Y 기간, Y=X+N)은 제(2)단계를 넘어선 제(3)단계(S140), 제(4)단계(S150) 및 제(5)단계 그리고 제(6)단계에 부분적으로 적용된다.First, in terms of first period, the first setting period (X period) is applied in the first step S110 and the second step S130, and the second setting period (Y period, Y = X +). N) is partially applied to the third (3) step (S140), the (4) step (S150) and the (5) step and the (6) step beyond the (2) step.

먼저, 본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, 각 환자에 대해 X 기간 내에 발생률을 분석할 대상이 되는 제1 대상질환(D1)이 발생하였다고 판단(S113)되는 경우 A 집단(도 1의 A1 group)으로 분류하고, 이를 제외한 제1 대상질환(D1)이 발생한 적이 없다고 판단(S117)되면 A집단(도 1의 A group참조)으로 분류한다(전술한 (1)단계 참조),First, when the computer performing the method according to the embodiment of the present invention determines that the first target disease (D1), which is the target of analyzing the incidence rate, occurs for each patient in the X period (S113), group A (Fig. Group A1, and if it is determined that the first target disease D1 has not occurred (S117), it is classified as group A (see group A in FIG. 1) (see step (1) above).

다음, 본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, 상기 A집단에서 상기 제1 대상질환(D1)과 다른 위험요인으로 가정할 다른 어느 하나의 제2 대상 질환에 대응하는 위험요소(Risk factor)를 갖는 제2 위험질환(R=D2)을 가진 E그룹(Exposed, 도 1의 S133 참조)과 상기 제2 위험질환(R=D2)을 가지지 않은 C그룹(Control, 도 1의 137 참조)으로 분류하고 각각의 인원수((n(E), n(C))를 각각 구한다(전술한 (2)단계 참조).Next, the computer which performs the method according to an embodiment of the present invention may include risk factors corresponding to any other second target disease to be assumed as a risk factor different from the first target disease D1 in the group A. Group E (Exposed, see S133 of FIG. 1) having a second risk disease (R = D2) having a factor) and Group C (Control, 137 of FIG. 1) having no second risk disease (R = D2). ) And calculate each number of people ((n (E), n (C)) (see step (2) above).

그런 다음, 본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, 상기 제1설정기간 이후의 제2설정기간 동안 상기 E그룹 중 상기 제1 대상질환(D1)을 가지는 그룹(E1 그룹, S143)과 상기 제1 대상질환(D1)을 가지지 않은 그룹(E1 그룹, S147)으로 분류하여 제1 대상질환(D1)을 가지는 그룹의 인원수(n(E1))를 구한다(전술한 (3)단계 참조).Then, the computer performing the method according to the embodiment of the present invention, the group having the first target disease (D1) of the E group in the second set period after the first set period (E1 group, S143) And the number of people (n (E1)) of the group having the first target disease (D1) by classifying the group (E1 group, S147) without the first target disease (D1) (see step (3) above). ).

또한, 본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, 상기 제2설정기간 동안 상기 C그룹 중 상기 제1 대상질환(D1)을 가지는 그룹(C1 그룹, S153)과 상기 제1 대상질환(D1)을 가지지 않은 그룹(C1 그룹, S157)으로 분류하여 제1 대상질환(D1)을 가지는 그룹의 인원수(n(C1))를 구한다(전술한 (4)단계 참조).In addition, the computer for performing the method according to an embodiment of the present invention, the group (C1 group, S153) having the first target disease (D1) of the C group during the second set period and the first target disease ( The number of persons n (C1) of the group having the first target disease D1 is obtained by classifying the group (C1 group, S157) without D1) (see step (4) above).

상기 (3)단계와 상기 (4)단계로부터 구한 인원수(n(E1), n(C1))와 상기 (2)단계에서 구한 인원수((n(E), n(C))에 기초하여 상기 제2 위험질환(R=D2)이 상기 대상질환(D1)에 영향을 미치는 상대위험도(RR: Relative Risk, 이하에서 RRR->D로 표시)를 아래 <식 x>로 구한다.Based on the number of people (n (E1), n (C1)) obtained from the step (3) and the step (4) and the number of people ((n (E), n (C)) obtained in the step (2), The relative risk (RR: Relative Risk, RR R-> D below) that the second risk disease (R = D2) affects the target disease (D1) is obtained by the following formula (X).

RRR ->D = n(E1)/n(E) ÷ n(C1)/n(C) -------------- <식 x>RR R- > D = n (E1) / n (E) ÷ n (C1) / n (C) -------------- <expression x>

즉, 전술한 <식 x>를 이용하여 상대위험도를 구할 수 있다..In other words, the relative risk can be calculated using the above-described <Equation x>.

여기서, 도 1에 굵고 붉은 이점쇄선으로 둘러싸인 'L2' 부분은 전술한 (2)단계(S130)에서 제2 위험질환(R=D2)인 경우에 적용되는 것이다. 그렇다면 다음으로 수행하여야할 단계는 (1)단계의 제1 대상질환(D1)은 동일하면서 (2)단계에서 제2 위험질환(R=D2)이 아닌 예를 들면 제3질환(D3), 제4질환(D4), 제5질환(D5), ..., 제n질환(Dn)에 대응하여 순차적으로 할당되는 제3 위험질환(R=D3), 제4 위험질환(R=D4), ..., 제n 위험질환(R=Dn)을 설정하고, 각 위험질환에 대한 전술한 (2)단계에서 (5)단계의 과정을 수행하여야 한다. 이 단계를 '(6) 단계'라고 할 수 있다.). Here, the portion 'L2' surrounded by the thick red dashed line in FIG. 1 is applied to the case of the second risk disease (R = D2) in step (2) (S130). Then, the next step to be performed is the first target disease (D1) of step (1) is the same, but not the second risk disease (R = D2) in step (2), for example, the third disease (D3), 4th risk disease (D4), 5th disease (D5), ..., 3rd risk disease (R = D3), 4th risk disease (R = D4) sequentially assigned in response to the n-th disease (Dn), ..., n-th risk disease (R = Dn) is set, and the above-described step (2) to (5) for each risk disease should be performed. This step may be referred to as' (6) step).

즉, 예를 들어 본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, 제1대상 질환(D1)에 대해, 제2 위험질환(R=D2)과 관련된 굵고 붉은 이점쇄선으로 둘러싸인 'L2' 작업과정을 수행하고, 제3 위험질환(R=D3)과 관련된 굵고 붉은 이점쇄선으로 둘러싸인 'L3'의 작업과정을 수행하고, 미도시하였지만 제4 위험질환(R=D4), 제5 위험질환(R=D5)에 대해서도 동일하고, 제n 위험질환(R=Dn) 설정에 대응한 작업과정도 굴고 붉은 이점쇄선으로 둘러싸인 'Ln'의 작업과정으로 도시하였다.That is, for example, a computer performing a method according to an embodiment of the present invention may perform an 'L2' operation surrounded by a thick red double-dotted line associated with a second risk disease (R = D2) for the first target disease (D1). The process of 'L3' enclosed by the thick red dashed line associated with the third risk disease (R = D3), and although not shown, the fourth risk disease (R = D4) and the fifth risk disease ( The same is true for R = D5), and the work process corresponding to the setting of the n-th risk disease (R = Dn) is also shown as the work process of 'Ln' surrounded by a red double-dot chain.

본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, 각 제2 위험질환(R=D2), 제3 위험질환(R=D3), 제4 위험질환(R=D4), 제5위험질환(R=D5), ..., 제n 위험질환(R=Dn)에서 도출한 기초자료에 근거하여 각 위험질환이 대상 질환에 영향을 미치는 정도인 상대위험도를, 각각 전술한 (5)단계의 과정과 <식 x>를 통하여 산출할 수 있다.The computer performing the method according to an embodiment of the present invention, each of the second risk diseases (R = D2), the third risk diseases (R = D3), the fourth risk diseases (R = D4), the fifth risk diseases ( R = D5), ..., based on the basic data derived from the n-th risk disease (R = Dn), the relative risk of each risk disease affecting the target disease, It can be calculated through the process and <Equation x>.

이러한 모든 작업을 하나의 특정 질환인 제1 대상질환(D1)에 대해서만 수행한 결과의 흐름도가 도 1이고 이러한 작업 범위를 표시한 것이 점선으로 둘러싸인 'FC1' 영역에 대응될 수 있다. 본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, 이러한 'FC1'과 동일한 작업을 제2 대상질환(D2), 제3 대상질환(D3), ..., 제n 대상질환(Dn)에 대하여 각각 수행할 수 있고, 이러한 흐름도는 도 1에서 각각 'FC2', 'FC3', ..., 'FCn'으로 도시되어 있다.The flow chart of the result of performing all these operations only for one specific disease (D1), which is one specific disease, is shown in FIG. 1 and the marking of the working ranges may correspond to the 'FC1' region surrounded by dotted lines. The computer which performs the method according to the embodiment of the present invention performs the same operation as the second target disease (D2), the third target disease (D3), ..., n-th target disease (Dn) Each of these flow diagrams is illustrated in FIG. 1 as 'FC2', 'FC3', ..., 'FCn'.

이러한 방법은 각 개인별로 순차적으로 입력된 자료의 합인 모집단 데이터베이스를 이용하여 질환 간의 상관관계를 갖는 유관질환의 선후관계를 결정하는데 이용될 수 있다.This method can be used to determine the prognosis of coronary disease that has a correlation between diseases by using a population database that is a sum of data inputted sequentially by each individual.

그리고, 전술한 각 과정에서 통계적으로 검정을 하는 경우 공지된 카이제곱 검정이나 피셔정확성 검정을 통해 통계적 유의성을 검정할 수 있다. 이 과정에서 상대위험도인 예를 들면, b --> a의 유의수준(significance level)인 P-value가 0.05, 0.01, 0.001을 포함하는 미리 설정된 설정유의수준 값 미만이고, 상대위험도 RRR->D 가 미리 설정된 설정상대위험도보다 큰 쌍만 유의하다고 판단하여, 분석 데이터로서 이용하는 것이 바람직하다.And, if the statistical test in each of the above-described process can be tested for statistical significance through a known chi-square test or Fisher accuracy test. In this process, the relative risk, for example, b-> P-value, which is the significance level of a, is less than the preset set significance level value including 0.05, 0.01, and 0.001, and the relative risk RR R-> It is preferable to judge that only the pair whose D is greater than the preset relative risk is significant and use it as analysis data.

또한, 본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, 상기 각 단계에서 분류되고 구해진 자료에 기초하여 각 코호트의 질환을 선후 관계 매트릭스로 나타내는 (7)단계를 더 수행하되, 상기 (7)단계는, 원시데이터를 가공 없이 그대로 사용하여 매트릭스를 구하는 방법, 원시데이터에서 연속적으로 발병된 질환은 하나의 질환 발병으로 단순화하는 방법, 원시데이터를 초진만을 기준으로 단순화하는 방법을 수행하는 것이 바람직하다. 그리고, 본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, 질환의 발생 방향을 고려하여 각 코호트별로 선행질환과 후행질환의 질환쌍을 추출하고, 상기 질환쌍에 기초하여 어느 하나의 질환이 다른 하나의 질환에 영향을 미치는 상기 상대위험도를 구하기 위하여 분할표(contingency table)를 순차적으로 생성하고, 각 질환별로 상기 상대위험도를 산출하는 것이 바람직하다. 이러한 과정에 대한 설명을 보다 명확하게 이해하고, 전술한 예측 방법에 대한 과정을 보다 구체적으로 설명하면 다음과 같다.In addition, the computer performing the method according to an embodiment of the present invention, further performing step (7) of representing the disease of each cohort in a posterior relationship matrix based on the data classified and obtained in each step, wherein (7) In the step, it is desirable to perform a method of obtaining a matrix using raw data as it is without processing, a method of simplifying the onset of a disease that is continuously occurring in the raw data, and a method of simplifying the raw data based only on the initial basis. . The computer performing the method according to an embodiment of the present invention extracts a disease pair of a preceding disease and a trailing disease for each cohort in consideration of the occurrence direction of the disease, and any one disease is different based on the disease pair. In order to calculate the relative risk affecting one disease, it is preferable to sequentially generate a contingency table and calculate the relative risk for each disease. A more detailed description of this process and a more detailed description of the above-described prediction method are as follows.

먼저, 제1설정기간을 2002년 및 2003년의 2년간으로 하고, 제2설정기간을 2004년부터 2013년의 10년간으로 설정한다. 이렇게 입력된 환자 데이터베이스 자료 (12년치)를 이용하여 질환 선후 관계 매트릭스(matrix)를 구축하는 방법은 다음과 같다.First, the first setting period is set to two years of 2002 and 2003, and the second setting period is set to ten years of 2004 to 2013. The method of constructing the disease prognosis matrix using the inputted patient database data (12 years) is as follows.

먼저, 환자 3명(이하에서 각각 '환자1' '환자2' '환자3'이라 한다)에 대해 12년간 순차적으로 입력되는 질환은 다섯 종류인 D1, D2, D3, D4 및 D5이고, 각 환자별 선후관계의 데이터베이스는 다음과 같을 수 있다. 이하에서 먼저 발생한 질환을 '선행질환'으로 후에 발생한 질환을 '후행질환'이라 한다.First, 12 types of diseases sequentially input for three patients (hereinafter referred to as 'patient 1', 'patient 2' and 'patient 3' respectively) are five types of D1, D2, D3, D4 and D5, and each patient A database of star relationships may be as follows. The disease that occurs first below is referred to as a 'predecessor disease' and the disease that occurs later is referred to as a 'following disease'.

* 환자1 : D1 -- D1 -- D2 -- D3 -- D1 -- D4* Patient 1: D1-D1-D2-D3-D1-D4

* 환자2 : D3 -- D5 -- D1 -- D3* Patient 2: D3-D5-D1-D3

* 환자3 : D2 -- D1 -- D2 -- D3 -- D4 -- D1 -- D1 -- D2* Patient 3: D2-D1-D2-D3-D4-D1-D1-D2

여기서, 선행질환이 후행질환에 영향을 끼친다고 가정할 경우 이를 선행질환과 후행질환으로 이루어진 매트릭스 모델링을 하기 위해 분석하는 방법은 전술한 3가지 방법인, 첫째, 원시데이터를 가공없이 그대로 사용하여 매트릭스를 구성하는 방법, 둘째, 원시데이터에서 연속적으로 발병하는 질환 조합을 하나의 질환으로서 단순화 처리하는 방법, 셋째, 원시데이터를 초진만을 기준으로 이후 반복된 질환은 데이터에서 생략하는 단순화 처리하는 방법의 예를 들 수 있다. 첫째 방법에 비해 둘째, 셋째 방법으로 처리될수록 데이터의 처리량이 감소하고, 처리속도가 빨라질 수 있다.Here, if it is assumed that the preceding disease affects the following disease, the method of analyzing it for matrix modeling consisting of the preceding disease and the following disease is the three methods described above. Second, a method of simplifying a combination of diseases that occur continuously in the raw data as a single disease, and third, an example of a method of simplifying the process to omit subsequent repeated diseases from the data based on the initial data only. Can be mentioned. Compared to the first method, as the second and third methods are processed, the throughput of data can be reduced and the processing speed can be increased.

예를 들어 둘째 방법으로 상기 환자1, 환자2 및 환자3의 선행질환과 후행질환의 원시데이터를 처리하면 다음과 같다. For example, in the second method, the raw data of the preceding and the following diseases of the patients 1, 2 and 3 are processed as follows.

* 환자1 : D1 -- D2 -- D3 -- D1 -- D4* Patient 1: D1-D2-D3-D1-D4

* 환자2 : D3 -- D5 -- D1 -- D3* Patient 2: D3-D5-D1-D3

* 환자3 : D2 -- D1 -- D2 -- D3 -- D4 -- D1 -- D2* Patient 3: D2-D1-D2-D3-D4-D1-D2

그리고, 셋째 방법으로 상기 환자1, 환자2 및 환자3의 선행질환과 후행질환의 원시데이터를 처리하면 다음과 같다.And, in the third method, if the raw data of the preceding and the following diseases of the patient 1, patient 2 and patient 3 is processed as follows.

* 환자1 : D1 -- D2 -- D3 -- D4* Patient 1: D1-D2-D3-D4

* 환자2 : D3 -- D5 -- D1* Patient 2: D3-D5-D1

* 환자3 : D2 -- D1 -- D3 -- D4 * Patient 3: D2-D1-D3-D4

이 중 가장 단순화된 셋째 방법을 적용하여 환자별 선후 방향을 고려한 상호 질환쌍을 추출하는 것이 바람직하며, 그 결과는 다음과 같다.It is preferable to extract a pair of mutual diseases in consideration of the patient's posterior direction by applying the third simplified method, and the results are as follows.

* 환자1 : (D1→D2), (D1→D3), (D1→D4), (D2→D3), (D2→D4), (D3→D4)* Patient 1: (D1 → D2), (D1 → D3), (D1 → D4), (D2 → D3), (D2 → D4), (D3 → D4)

* 환자2 : (D3→D5), (D3→D1), (D5→D1)* Patient 2: (D3 → D5), (D3 → D1), (D5 → D1)

* 환자3 : (D2→D1), (D2→D3), (D2→D4), (D1→D3), (D1→D4), (D3→D4)Patient 3: (D2 → D1), (D2 → D3), (D2 → D4), (D1 → D3), (D1 → D4), (D3 → D4)

그리고, 본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, 이에 기초하여 질환쌍 매트릭스를 다음의 표와 같이 구성한다. In addition, the computer which performs the method according to the embodiment of the present invention configures the disease pair matrix based on the following table.

Figure 112019089911013-pat00001
Figure 112019089911013-pat00001

상기 <표 1>을 참조하면, 질환쌍 매트릭스는 각 질환(D1,D2,D3,D4,D5)에 대응하는 선행질환을 행으로 설정하고, 후행질환을 열로 설정하여, 데이터베이스로부터 분석된 각각의 선행질환 이후 각각의 후행질환이 발병한 경우의 수를 각 매트릭스별로 나타낼 수 있다.Referring to <Table 1>, the disease pair matrix sets each of the preceding diseases corresponding to each disease (D1, D2, D3, D4, D5) to a row, the following disease to a column, and analyzes each of the databases analyzed from the database. The number of cases of each subsequent disease after the preceding disease can be expressed by each matrix.

그리고, 본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, 질환 D1가 질환 D2에 영향을 미치는 상대위험도에 기반한 통계 모델을 만들기 위해 다음과 같은 분할표(contingency table)를 생성하고, 관련 변수들을 산출하여 <표 2>와 같이 삽입한 분할표를 구성할 수 있다.In addition, the computer which performs the method according to an embodiment of the present invention generates a contingency table as follows to create a statistical model based on the relative risk of the disease D1 affecting the disease D2, The partition table inserted in the calculation and inserted as shown in Table 2 can be constructed.

Figure 112019089911013-pat00002
Figure 112019089911013-pat00002

여기서, 본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, D1 질환 이 D2 질환에 영향을 미치는 상대위험도인 'D1 --> D2'를 <식 x>를 응용하여 다음과 같이 구할 수 있다.Here, the computer performing the method according to an embodiment of the present invention can obtain a relative risk of 'D1-> D2', in which D1 disease affects D2 disease, by applying <Formula x> as follows.

상대위험도 RRR ->D = (a/(a+b)) ÷ (c/(c+d)) Relative risk RR R- > D = (a / (a + b)) ÷ (c / (c + d))

이 과정에서 전술한 바와 같이, 통계적으로 카이제곱 검정이나 피셔정확성 검정을 통해 통계적 유의성을 검정하여 실제 RRR->D의 관계에서 유의수준(significance level)인 P-value가 0.05, 0.01, 0.001을 포함하는 미리 설정된 설정유의수준 값 미만이고, 상대위험도 RRR->D 가 미리 설정된 설정상대위험도보다 큰 쌍만 유의하다고 판단하는 것이 바람직하다.As described above, statistical significance is tested by the chi-square test or Fisher accuracy test, and the P-value, which is the significance level in the relationship of actual RR R-> D , is 0.05, 0.01, 0.001. It is desirable to determine that only pairs that are less than the pre-set set significance level value and whose relative risk RR R-> D are greater than the preset set relative risk are significant.

본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, 위와 같은 순서로 질환 코호트 데이터베이스의 모든 질환에 대해 차례로 반복 수행할 수 있다.The computer performing the method according to an embodiment of the present invention may be repeatedly performed in order for all diseases of the disease cohort database in the above order.

이상과 같이 전술한 예와 같은 방법인 질환 발병 예측 방법으로 각종 질환에 대한 자료, 데이터, 정보 등을 도출 내지 추출할 수 있고, 본 발명의 실시 예에 따른 방법을 수행하는 컴퓨터는, 이와 같은 데이터 등을 보다 용이하게 알 수 있고 한 눈에 볼 수 있도록 시각화된 질환 네트워크를 구축하여 출력할 수 있으며, 그 과정은 다음과 같다.As described above, data, data, information, and the like for various diseases may be derived or extracted by a method for predicting disease onset, which is the same as the above-described example, and the computer performing the method according to an embodiment of the present invention may provide such data. Easier to see the back and to visualize the disease network can be built and output at a glance, the process is as follows.

우선, 질환을 노드(node)로 표현하는 방법으로 첫째, 노드를 사각형으로 표시하고 사각형의 크기는 전술한 예의 12년치 데이터의 평균 유병률을 표시하고, 사각형의 세로값은 남자 유병률을 가로값은 여자 유병률을 각각 나타내며, 사각형의 색상은 질환 클래스별(예를 들면, 부인병, 심장질환, 등등)로 상이한 색으로 나타내는 것이 바람직하다. 둘째로는, 노드를 원형으로 표시하고 원형의 크기는 12년치 데이터의 평균 유생률을 나타내며 색깔은 질환 클래스별(예를 들면, 부인병, 심장질환, 등등)로 상이한 색으로 나타내는 것이 바람직하다. First, the disease is expressed as a node. First, the node is represented by a rectangle, and the size of the rectangle represents the average prevalence of the 12-year data of the above example, and the vertical value of the rectangle is male prevalence and the horizontal value is female. The prevalence is shown respectively, and the color of the rectangle is preferably represented by a different color by disease class (eg, gynecological disease, heart disease, etc.). Secondly, it is desirable to represent the node in a circle, the size of the circle represents the average survival rate of the 12-year data, and the color in different colors by disease class (eg, gynecology, heart disease, etc.).

또한, 화살표로 질환 간 상대위험도를 나타내는 에지(Edge)를 표현할 수 있다. 에지의 굵기는 상대위험도의 크기를 나타내고 남성에서 이환률이 높은 경우에는 파란색으로, 여성에서 이환률이 높은 경우에는 빨강색으로, 남성과 여성에서 이환률이 일정 범위 이내 같은 경우에는 연두색으로 표시하는 것이 바람직하다.In addition, an arrow may represent an edge representing the relative risk between diseases. The thickness of the edge represents the magnitude of the relative risk, and it is preferable to mark it in blue when the morbidity is high in men, red when the morbidity is high in women, and light green when the morbidity is within a certain range in men and women. .

이러한 표시 방법으로 시각화한 일 예가 도 2에 도시되어 있다.An example visualized by such a display method is illustrated in FIG. 2.

또한, 본 발명의 실시 예에 따라 구축된 질병 네트워크는, 코호트 데이터베이스로부터 획득된 정보를 이용하므로, 전체 질환 간 상대위험도뿐만 아니라 각 연령별, 사회경제적 지표별, 지역별, 기관별로도 이미지화될 수 있으며, 따라서 각 연령에 따른 질환 네트워크 변화를 탐구하기 위하여 설정된 연령별로 나타내는 연령별 질환 네트워크 시각화 방법(도 3 참조), 성에 따른 질환 네트워크 특징을 탐구하기 위해 성별로 나타내는 성별 질환 네트워크 시각화 방법(도 4 참조), 사회경제적인 지표에 따른 질환 네트워크 특징을 탐구하기 위하여 설정된 사회경제적 지표별로 나타내는 사회경제지표별 질환 네트워크 시각화 방법, 특정 지역에 방문하거나 거주하는 환자들의 질환 네트워크 특징을 탐구하기 위해 설정된 지역별로 나타내는 지역별 질병 네트워크 시각화 방법, 1차, 2차, 3 차 및 요양병원을 포함하는 요양기관별로 방문 내지 입원한 환자들의 질환 네트워크 특징을 탐구하기 위해 설정된 요양기관별로 나타내는 요양기관별 질병 네트워크 시각화 등, 다양한 시각화 처리를 제공할 수 있다.In addition, since the disease network constructed according to an embodiment of the present invention uses information obtained from a cohort database, the disease network may be imaged not only by the relative risk between diseases but also by age, socioeconomic indicator, region, and institution. Therefore, the age-specific disease network visualization method for each age set in order to explore the disease network change according to each age (see FIG. 3), the sex disease network visualization method represented by sex in order to explore the disease network characteristics for gender (see FIG. 4), Disease network visualization method according to socioeconomic indicators set by socioeconomic indicators set to explore disease network characteristics according to socioeconomic indicators, and regional disease represented by region set to explore disease network characteristics of patients visiting or living in a specific area. Net Various visualization processes such as the visualization method of the nursing institution, which is represented by the nursing institution set up to explore the disease network characteristics of patients visited or hospitalized by the nursing institution including primary, secondary, tertiary and nursing hospitals. Can provide.

이러한 코호트를 이용한 질환 발병 예측 방법, 질환 발병 네트워크 시각화 방법은 상기 방법을 컴퓨터에서 실행시키기 위한 컴퓨터로 판독 가능한 기록매체로도 저장되어 활용될 수 있는 것이 바람직하다.The disease onset prediction method and disease onset network visualization method using such a cohort may be stored and utilized as a computer readable recording medium for executing the method on a computer.

이에, 본 발명에 따르면, 빅 데이터를 이용하여 환자들의 질환에 기초하여 모든 질환들 간의 상관성을 보다 효율적이고 신뢰성 있게 도출할 수 있으며, 코호트가 거의 모든 국민이라면 한국인에게 발생하는 질환들 간의 상관관계를 파악하여 한국인에게 가장 적합한 정밀의학을 위한 플랫폼으로 활용할 수 있는 코호트를 이용한 질환 발병 예측 방법, 질환 발병 네트워크 시각화 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체를 제공할 수 있다.Accordingly, according to the present invention, the correlation between all diseases can be derived more efficiently and reliably based on diseases of patients using big data, and if the cohort is almost all citizens, the correlation between diseases occurring in Koreans It is possible to provide a method for predicting disease onset using a cohort, a method for visualizing disease onset network, and a computer-readable recording medium recording the same, which can be used as a platform for precision medicine that is most suitable for Koreans.

또한, 질환의 특성을 연령, 성별, 사회경제적 지수별, 요양기관별 등의 다양한 형태로 보여주고 간단하고 편리하게 가공할 수 있고, 환자들의 유전질환 및 비유전질환 간의 연관성도 파악할 수 있으며 이를 보건의료 정책 등에 활용 할 수 있는 코호트를 이용한 질환 발병 예측 방법, 질환 발병 네트워크 시각화 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체를 제공할 수 있다.In addition, the characteristics of the disease can be shown in various forms such as age, sex, socioeconomic index, and nursing institution, and can be processed simply and conveniently. Also, the relationship between the genetic and non-genetic diseases of patients can be identified. It is possible to provide a method of predicting disease onset using a cohort, a method of visualizing a disease onset network, and a computer-readable recording medium recording the same.

또한, 특정 질환이 다른 질환에 영향을 주는 정도를 예측하기 위한 통계 모델을 만들고 이를 효과적으로 시각화할 수 있으며, 질환 발생의 선후 관계에 있는 네트워크를 구성하고 이를 시각화할 수 있는 코호트를 이용한 질환 발병 예측 방법, 질환 발병 네트워크 시각화 방법 및 이를 기록한 컴퓨터 판독 가능한 기록매체를 제공할 수 있다.In addition, a statistical model for predicting the extent to which a particular disease affects other diseases can be created and effectively visualized, and a method of predicting disease occurrence using a cohort that can construct and visualize a network of prognostic relationships of disease occurrence The present invention provides a method for visualizing a disease-occurring network and a computer-readable recording medium recording the same.

여기서, 본 발명의 일 실시예를 도시하여 설명하였지만, 본 발명의 속하는 기술 분야의 통상의 지식을 가진 자라면 본 발명의 원칙이나 정신에서 벗어나지 않으면서 본 실시예를 변형할 수 있음을 알 수 있을 것이다. 발명의 범위는 첨부된 청구항과 그 균등물에 의해 정해질 것이다.Here, although an embodiment of the present invention has been illustrated and described, it will be appreciated by those skilled in the art that the present embodiment may be modified without departing from the spirit or spirit of the present invention. will be. It is intended that the scope of the invention be defined by the claims appended hereto and their equivalents.

Claims (11)

컴퓨터를 이용하여, 코호트 데이터베이스로부터 질환 발병 네트워크를 구축하는 방법에 있어서,
제어부가, 상기 코호트 데이터베이스로부터, 대상 질환이 위험 질환에 영향을 미치는 기간으로서 설정된 제1설정기간 동안, 복수의 질환들 중 제1 대상 질환(D1)이 발병하지 않은 인원을 A 그룹으로 분류하는 단계;
상기 제어부가, 상기 A 그룹으로부터 상기 제1설정기간 동안 제2 대상 질환에 대응하는 제2 위험 질환(R=D2)이 발병한 인원을 E 그룹으로 분류하고, 제2 위험 질환(R=D2)이 발병하지 않은 인원을 C 그룹으로 분류하는 단계;
상기 제어부가, 상기 제1설정기간 이후에, 반대로 위험 질환이 대상 질환에 영향을 미치는 기간으로서 설정된 제2설정기간 동안, 상기 E 그룹 중 상기 제1 위험 질환(D1)이 발병한 인원을 E1 그룹으로 분류하고, 상기 C 그룹 중 제2 위험 질환(R=D2)이 발병하지 않은 인원을 C1 그룹으로 분류하는 단계;
상기 제어부가, 상기 E 그룹과 E1 그룹의 상대 인원수 또는 상대 빈도값으로부터 산출되는 제1 상대값과, 상기 C 그룹과 C1 그룹의 상대 인원수 또는 상대 빈도값으로부터 산출되는 제2 상대값으로부터, 상기 제2 위험질환(R=D2)과 상기 대상 질환(D1) 간의 상대위험도를 산출하는 단계;
상기 제어부가, 상기 각 단계들을 상기 복수의 질환들 중 미리 설정된 서로 다른 나머지 질환들을 대상질환 및 위험질환으로 설정하여 상호 순차적으로 반복 수행하여, 상기 상대위험도에 기초한 각 질환 간 이환율의 상호 상관관계를 나타내는 질환 발병 네트워크를 구축하는 단계; 및
출력부가 상기 질환 발병 네트워크를 출력하는 단계를 포함하는
컴퓨터를 이용한 코호트 데이터베이스의 질환 발병 네트워크 구축 방법.
In a method for constructing a disease onset network from a cohort database using a computer,
The controller classifying, from the cohort database, a person who does not develop the first target disease D1 among the plurality of diseases in the group A during the first period of time set as the period in which the target disease affects the dangerous disease. ;
The control unit may classify the number of persons having a second risk disease (R = D2) corresponding to a second target disease from the group A into the group E and generate a second risk disease (R = D2). Categorizing the unaffected personnel into group C;
The control unit, after the first setting period, conversely, during the second setting period in which the risk disease affects the target disease, the number of people having developed the first dangerous disease D1 in the E group is group E1. Classifying a person who does not develop a second risk disease (R = D2) in the C group into a C1 group;
The control unit is configured to generate the first relative value calculated from the relative number or relative frequency values of the E group and the E1 group, and the second relative value calculated from the relative number or relative frequency value of the C and C1 groups. Calculating a relative risk between the risk disease (R = D2) and the target disease (D1);
The control unit repeats each of the steps by sequentially setting different remaining preset diseases among the plurality of diseases as a target disease and a risk disease, and mutually correlating morbidity rates between diseases based on the relative risk. Constructing an indicative disease onset network; And
Outputting the disease-prone network;
A method for constructing a disease onset network of a computer cohort database.
제1항에 있어서,
상기 질환 발병 네트워크를 구축하는 단계는,
상기 상호 순차적으로 반복 수행하여 획득된 데이터로부터, 각 그룹 분류에 따라 각 환자별로 발생한 선행질환 및 후행질환들이 나열되는 원시 데이터를 획득하는 단계;
상기 원시 데이터를 단순화 처리하는 단계; 및
상기 단순화된 원시 데이터를 이용하여 질환 간 선후 관계 매트릭스를 산출하는 단계를 더 포함하는
컴퓨터를 이용한 코호트 데이터베이스의 질환 발병 네트워크 구축 방법.
The method of claim 1,
Building the disease onset network,
Obtaining, from the data obtained by repeatedly performing the sequential repetition, raw data in which the predecessor and the following disease occurring for each patient are listed according to each group classification;
Simplifying the raw data; And
Using the simplified raw data to calculate a posterior relationship matrix between diseases;
A method for constructing a disease onset network of a computer cohort database.
제2항에 있어서,
상기 단순화 처리하는 단계는,
상기 원시 데이터에서 연속적으로 발병된 질환은 하나의 질환 발병으로 단순화 처리하거나, 상기 원시 데이터를 초진만을 기준으로 하여 이후 반복된 질환은 상기 원시 데이터에서 생략하는 단순화 처리를 수행하는 단계를 포함하는
컴퓨터를 이용한 코호트 데이터베이스의 질환 발병 네트워크 구축 방법.
The method of claim 2,
The simplification process,
A disease that is continuously developed in the raw data is simplified to one disease outbreak, or a simplified process of eliminating the subsequent repeated disease from the raw data based on the original data only.
A method for constructing a disease onset network of a computer cohort database.
제3항에 있어서,
상기 질환 간 선후 관계 매트릭스를 산출하는 단계는,
상기 단순화된 원시 데이터로부터 선행질환과 후행질환 간의 방향성을 갖는 복수의 질환 쌍을 추출하는 단계; 및
상기 복수의 질환 쌍에 기초하여, 각 질환에 대응하는 선행질환을 행으로 설정하고, 후행질환을 열로 설정하여, 각각의 선행질환 이후 각각의 후행질환이 발병한 경우의 수를 각 매트릭스별로 나타내는 상기 질환 간 선후 관계 매트릭스를 산출하는 단계를 포함하는
컴퓨터를 이용한 코호트 데이터베이스의 질환 발병 네트워크 구축 방법.
The method of claim 3,
Computing the posterior relationship matrix between the diseases,
Extracting a plurality of disease pairs having a direction between a preceding disease and a following disease from the simplified raw data; And
On the basis of the plurality of disease pairs, the preceding diseases corresponding to each disease are set to rows, and the following diseases are set to columns, and the number of cases of each subsequent disease occurring after each preceding disease is indicated for each matrix. Calculating a posterior relationship matrix between diseases.
A method for constructing a disease onset network of a computer cohort database.
제4항에 있어서,
상기 질환 간 선후 관계 매트릭스를 산출하는 단계는,
상기 질환 간 선후 관계 매트릭스의 각 질환 쌍에 대응하는 상기 상대위험도를 분할표(contingency table)를 이용하여 산출하는 단계를 포함하는
컴퓨터를 이용한 코호트 데이터베이스의 질환 발병 네트워크 구축 방법.
The method of claim 4, wherein
Computing the posterior relationship matrix between the diseases,
Calculating the relative risk corresponding to each disease pair in the posterior relationship matrix between the diseases using a contingency table.
A method for constructing a disease onset network of a computer cohort database.
제5항에 있어서,
상기 질환 발병 네트워크를 구축하는 단계는,
상기 질환 간 선후 관계 매트릭스 및 상기 상대위험도에 기초하여, 상기 질환 발병 네트워크를 구축하는 단계를 포함하고,
상기 상기 질환 발병 네트워크를 출력하는 단계는,
상기 질환 발병 네트워크의 상기 질환 간 선후 관계 매트릭스 및 상기 상대위험도를 시각화하여 출력하는 단계를 포함하는
컴퓨터를 이용한 코호트 데이터베이스의 질환 발병 네트워크 구축 방법.
The method of claim 5,
Building the disease onset network,
Constructing the disease onset network based on the posterior relationship matrix between the diseases and the relative risk,
Outputting the disease onset network,
And visualizing and outputting the posterior relationship matrix and the relative risk of the diseases in the disease occurrence network.
A method for constructing a disease onset network of a computer cohort database.
제6항에 있어서,
상기 시각화하여 출력하는 단계는,
각 질환을 노드(node)로 형성하고, 질환 간 방향성을 갖는 상기 상대위험도를 엣지(edge)로 형성하여, 상기 질환 발병 네트워크를 이미지 시각화 처리하는 단계를 포함하는
컴퓨터를 이용한 코호트 데이터베이스의 질환 발병 네트워크 구축 방법.
The method of claim 6,
The step of visualizing and outputting,
Forming each disease as a node, forming the relative risk with an edge between the diseases as an edge, and image-processing the disease-prone network;
A method for constructing a disease onset network of a computer cohort database.
제7항에 있어서,
상기 노드로 형성된 질환은 색상으로 구분되는 사각형 또는 원형으로 표시되며, 상기 제1 설정기간 및 상기 제2 설정 기간에 각각 대응하는 평균 유병율이 그 크기로서 표시되되, 질환이 사각형으로 표시되는 경우 상기 유병율은 성별에 따라 가로 또는 세로 길이로서 구분되도록 표시되는 것을 특징으로 하는
컴퓨터를 이용한 코호트 데이터베이스의 질환 발병 네트워크 구축 방법.
The method of claim 7, wherein
The disease formed by the node is represented by a color-coded square or a circle, and the average prevalence corresponding to the first and second set periods is displayed as the size, and when the disease is represented as a rectangle, the prevalence rate Is characterized in that it is displayed to be divided as a horizontal or vertical length depending on the gender
A method for constructing a disease onset network of a computer cohort database.
제7항에 있어서,
상기 엣지로 형성된 상대위험도는, 화살표로서 방향성을 표시하되 그 굵기는 상대위험도의 크기를 나타내며, 색상으로서 성별간 상대 이환율(morbidity rate)을 나타내는 것을 특징으로 하는
컴퓨터를 이용한 코호트 데이터베이스의 질환 발병 네트워크 구축 방법.
The method of claim 7, wherein
The relative risk formed by the edge is indicated by the arrow, the thickness indicates the magnitude of the relative risk, the color represents the relative morbidity rate (gender morbidity rate)
A method for constructing a disease onset network of a computer cohort database.
제7항에 있어서,
상기 시각화하여 출력하는 단계는,
상기 코호트 데이터베이스로부터 획득된 정보를 이용하여, 연령별, 사회경제적 지표별, 지역별 또는 기관별로 분류 처리한 질환 발병 네트워크를 시각화하여 출력하는 단계를 더 포함하는
컴퓨터를 이용한 코호트 데이터베이스의 질환 발병 네트워크 구축 방법.
The method of claim 7, wherein
The step of visualizing and outputting,
And visualizing and outputting a disease occurrence network classified by age, socio-economic indicator, region or institution by using the information obtained from the cohort database.
A method for constructing a disease onset network of a computer cohort database.
제1항 내지 제10항 중 어느 한 항에 기재된 방법을 컴퓨터에서 실행시기키 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체.A computer-readable recording medium having recorded thereon a program for executing the method according to any one of claims 1 to 10 on a computer.
KR1020190107933A 2019-09-02 2019-09-02 Disease Network Generating Method using Cohort and Computer Readable Record Medium thereof KR102083995B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190107933A KR102083995B1 (en) 2019-09-02 2019-09-02 Disease Network Generating Method using Cohort and Computer Readable Record Medium thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190107933A KR102083995B1 (en) 2019-09-02 2019-09-02 Disease Network Generating Method using Cohort and Computer Readable Record Medium thereof

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020160163260A Division KR20180063492A (en) 2016-12-02 2016-12-02 Disease Forcasting Method using Cohort, Disease Network Visualization Method and Computer Readable Record Medium thereof

Publications (2)

Publication Number Publication Date
KR20190104500A KR20190104500A (en) 2019-09-10
KR102083995B1 true KR102083995B1 (en) 2020-03-03

Family

ID=67950987

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190107933A KR102083995B1 (en) 2019-09-02 2019-09-02 Disease Network Generating Method using Cohort and Computer Readable Record Medium thereof

Country Status (1)

Country Link
KR (1) KR102083995B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102320132B1 (en) * 2020-01-16 2021-11-01 (의)삼성의료재단 Method for evaluating organization health index and computer program for executing for the method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004518463A (en) 2000-11-06 2004-06-24 イルミゲン バイオサイエンシズ,インコーポレイティド Systems and methods for selectively classifying populations
JP2006031190A (en) 2004-07-13 2006-02-02 Ntt Data Corp Risk evaluation device and program
JP2006259809A (en) 2005-03-15 2006-09-28 Ntt Data Corp Incidence evaluating device, and program
JP2007199948A (en) 2006-01-25 2007-08-09 Dainakomu:Kk Disease risk information display device and program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101805597B1 (en) * 2013-02-18 2018-01-10 바이오코아 주식회사 Genome analysis service method for disease

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004518463A (en) 2000-11-06 2004-06-24 イルミゲン バイオサイエンシズ,インコーポレイティド Systems and methods for selectively classifying populations
JP2006031190A (en) 2004-07-13 2006-02-02 Ntt Data Corp Risk evaluation device and program
JP2006259809A (en) 2005-03-15 2006-09-28 Ntt Data Corp Incidence evaluating device, and program
JP2007199948A (en) 2006-01-25 2007-08-09 Dainakomu:Kk Disease risk information display device and program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Cesar A. Hidalgo외 3인. a Dynamic Network Approach for the Study of Human Phenotypes
Michail Doulis. Robustness of disease association measure and network structure in an evolving synthetic cohort

Also Published As

Publication number Publication date
KR20190104500A (en) 2019-09-10

Similar Documents

Publication Publication Date Title
CN105528526B (en) A kind of life cycle dynamical health management system excavated based on traditional Chinese medicine succession with big data
US20190355271A1 (en) Differentially weighted modifiable prescribed history reporting apparatus, systems, and methods for decision support and health
Khalifa et al. Utilizing health analytics in improving the performance of healthcare services: A case study on a tertiary care hospital
CN104572583B (en) Method and system for data densification
US20110301971A1 (en) Healthcare System Planning Tool
US8607153B2 (en) Graphic for displaying multiple assessments of critical care performance
CN111243753A (en) Medical data-oriented multi-factor correlation interactive analysis method
JP2006163465A (en) Medical treatment information analysis apparatus, method, and program
Fine et al. Assessing population-level symptoms of anxiety, depression, and suicide risk in real time using NLP applied to social media data
KR102083995B1 (en) Disease Network Generating Method using Cohort and Computer Readable Record Medium thereof
Ferrández et al. A multi-objective approach to estimate parameters of compartmental epidemiological models. Application to Ebola Virus Disease epidemics
US20210057110A1 (en) Disease network construction method considering stratification according to confounding variable of cohort data and occurrence time between diseases, method for visualizing same, and computer readable recording medium recording same
Jean et al. Predictive modelling of telehealth system deployment
Hasni et al. Hybrid model for a cross‐department efficiency evaluation in healthcare systems
Jarman et al. An integrated framework for risk profiling of breast cancer patients following surgery
Pereira et al. Spatial-temporal monitoring risk analysis and decision-making of COVID-19 distribution by region
KR20180063492A (en) Disease Forcasting Method using Cohort, Disease Network Visualization Method and Computer Readable Record Medium thereof
Saxena et al. Exploring Susceptible-Infectious-Recovered (SIR) Model for COVID-19 Investigation
Usharani et al. Data visualization for healthcare
JP5119821B2 (en) Synonymous disease name selection device
Rao et al. Extracting Insights and Prognosis of Corona Disease
Qamar et al. Predicting the Number of Calories in a Dish Using Just Neural Network
Hakimjavadi et al. Multivariable prediction models for traumatic spinal cord injury: a systematic review
Więckowska Healthcare needs maps—evidence informed healthcare policy
Rao Incubation periods under various anti-retroviral therapies in homogeneous mixing and age-structured dynamical models: a theoretical approach

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant