WO2021025218A1 - 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법 - Google Patents

연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법 Download PDF

Info

Publication number
WO2021025218A1
WO2021025218A1 PCT/KR2019/010258 KR2019010258W WO2021025218A1 WO 2021025218 A1 WO2021025218 A1 WO 2021025218A1 KR 2019010258 W KR2019010258 W KR 2019010258W WO 2021025218 A1 WO2021025218 A1 WO 2021025218A1
Authority
WO
WIPO (PCT)
Prior art keywords
risk
disease
genetic risk
genetic
phenotypic
Prior art date
Application number
PCT/KR2019/010258
Other languages
English (en)
French (fr)
Inventor
조윤성
김병철
박종화
Original Assignee
주식회사 클리노믹스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 클리노믹스 filed Critical 주식회사 클리노믹스
Priority to US17/633,601 priority Critical patent/US20220367060A1/en
Priority to EP19940912.9A priority patent/EP3968340A4/en
Publication of WO2021025218A1 publication Critical patent/WO2021025218A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Definitions

  • the present invention relates to an apparatus and method for predicting disease risk by combining the genetic risk of an associated phenotype, and more particularly, to an apparatus and method for predicting disease risk.
  • GWAS genome sequence translation and full-length genome-wide association study
  • SNP gene single nucleotide polymorphism
  • the Framingham Risk Score (considering gender, age, cholesterol level, blood pressure, diabetes, smoking status, etc.) has been established to clinically measure/determine the risk for coronary heart disease.
  • the figures required for calculating the Framingham Risk Score have a disadvantage in that information measured with medical equipment such as health checkups/medical tests is required.
  • Korean Patent Laid-Open No. 2019-0077997 collects lifestyle and environmental factors affecting the occurrence of diseases through clinical surveys, and integrates the collected lifestyle and environmental factors with genetic factors. And a method of predicting the likelihood of the occurrence of a phenotype.
  • the technical problem to be achieved by the present invention is to obtain a disease genetic risk for a disease and a phenotypic genetic risk for a disease-related phenotype (associated disease, lifestyle, etc.) based on the user's genotype information, and the disease genetic risk. It is to provide an apparatus and method for predicting disease risk by combining the genetic risk of the associated phenotype to obtain the integrated genetic risk for the disease based on the phenotypic genetic risk.
  • the apparatus for predicting disease risk by combining the genetic risk of the associated phenotype according to the present invention is based on the genetic marker information related to the occurrence of the disease and the genotype information of the user.
  • a disease risk acquisition unit that acquires a risk level;
  • a phenotypic risk acquisition unit for acquiring a phenotypic genetic risk for the phenotype based on gene marker information on the phenotype associated with the occurrence of the disease and genotypic information of the user;
  • the integrated risk acquisition unit may acquire the integrated genetic risk based on the disease genetic risk and the phenotypic genetic risk by using a ratio of genetic factors that affect the occurrence of the disease.
  • the disease risk acquisition unit converts the acquired genetic risk of the disease into a relative value compared to the disease genetic risk of another user in the group to which the user belongs, and the phenotypic risk acquisition unit includes the acquired phenotypic genetic risk. Is converted into a relative value compared to the phenotypic genetic risk of another user in the group to which the user belongs, and the integrated risk acquisition unit is converted into a relative value and the phenotypic genetic risk converted into a relative value.
  • the integrated genetic risk may be acquired based on the risk, and the acquired integrated genetic risk may be converted into a relative value compared to the integrated genetic risk of another user in the group to which the user belongs.
  • the phenotypic risk acquisition unit may acquire the phenotypic genetic risk based on gene marker information for the phenotype and genotype information of the user by using an effective size predefined for each state of the phenotype.
  • the phenotypic risk acquisition unit acquires a genetic risk based on gene marker information on the phenotype and genotype information of the user, and determines the acquired genetic risk to the phenotype of another user in the group to which the user belongs.
  • the phenotypic state may be converted to a relative value compared to the enemy risk, and the phenotypic state may be obtained based on the genetic risk converted to the relative value, and an effective size corresponding to the acquired state may be determined as the phenotypic genetic risk.
  • the phenotypic risk acquisition unit when there are a plurality of phenotypes associated with the occurrence of the disease, acquires a genetic risk for each of the plurality of phenotypes, and acquires the phenotypic genetic risk based on the plurality of acquired genetic risks. can do.
  • the method for predicting disease risk by combining the genetic risk of the associated phenotype according to the present invention is based on the genetic marker information related to the occurrence of the disease and the genotype information of the user. Obtaining a risk level; Obtaining a phenotypic genetic risk for the phenotype based on gene marker information on the phenotype associated with the occurrence of the disease and genotype information of the user; And obtaining an integrated genetic risk for the disease based on the acquired genetic risk of the disease and the acquired phenotypic genetic risk.
  • the step of obtaining the integrated genetic risk comprises acquiring the integrated genetic risk based on the disease genetic risk and the phenotypic genetic risk using a ratio of genetic factors that affect the occurrence of the disease. I can.
  • the step of obtaining the genetic risk of the disease comprises converting the acquired genetic risk of the disease to a value relative to the genetic risk of a disease of another user in the group to which the user belongs, and the step of obtaining the phenotypic genetic risk Is, consisting of converting the acquired phenotypic genetic risk to a relative value compared to the phenotypic genetic risk of another user in the group to which the user belongs, and the step of obtaining the integrated genetic risk is converted to a relative value.
  • the integrated genetic risk is obtained based on the expression current genetic risk converted into a relative value of the disease genetic risk, and the acquired integrated genetic risk is calculated as the integrated genetic risk of other users in the group to which the user belongs. It can be made by converting to a relative value in contrast to.
  • the step of obtaining the phenotypic genetic risk may consist of obtaining the phenotypic genetic risk based on the genetic marker information for the phenotype and the genotype information of the user using a predefined effective size for each phenotype state. have.
  • the step of obtaining the phenotypic genetic risk may include obtaining a genetic risk based on gene marker information for the phenotype and genotype information of the user, and calculating the acquired genetic risk as the phenotype of another user in the group to which the user belongs.
  • the phenotype is converted to a relative value compared to the genetic risk for, and the phenotypic state is obtained based on the genetic risk converted to a relative value, and an effective size corresponding to the acquired state is determined as the phenotypic genetic risk.
  • the step of obtaining the phenotypic genetic risk may include obtaining a genetic risk for each of the plurality of phenotypes when there are a plurality of phenotypes associated with the occurrence of the disease, and the phenotypic genetic risk based on the acquired plurality of genetic risks. It can consist of obtaining risk.
  • the computer program according to the present invention for achieving the above technical problem is stored in a computer-readable recording medium and executes any one of the disease risk prediction methods in which the genetic risk of the associated phenotype is combined.
  • the integrated genetic risk for a disease is based on the genetic risk for the disease and the genetic risk for the phenotype associated with the occurrence of the disease.
  • FIG. 1 is a block diagram illustrating an apparatus for predicting disease risk by combining genetic risk of an associated phenotype according to a preferred embodiment of the present invention.
  • FIG. 2 is a flowchart illustrating a method for predicting disease risk by combining the genetic risk of an associated phenotype according to a preferred embodiment of the present invention.
  • FIG. 1 is a block diagram illustrating an apparatus for predicting disease risk by combining genetic risk of an associated phenotype according to a preferred embodiment of the present invention.
  • a disease risk prediction device (hereinafter referred to as a'disease risk prediction device') that combines the genetic risk of a related phenotype according to a preferred embodiment of the present invention 100 is based on a user's genotype information. Acquire the genetic risk of the disease and the phenotypic genetic risk of the disease-related phenotype (related diseases, lifestyle, etc.), and the integrated genetic risk of the disease based on the disease genetic risk and the phenotypic genetic risk. do.
  • the disease risk prediction apparatus 100 may include a storage unit 110, a disease risk acquisition unit 130, a phenotypic risk acquisition unit 150, and an integrated risk acquisition unit 170.
  • the storage unit 110 serves to store programs and data necessary for the operation of the disease risk prediction apparatus 100, and may be divided into a program area and a data area.
  • the program area is a program that controls the overall operation of the disease risk prediction device 100, an operating system (OS) that boots the disease risk prediction device 100, acquisition of a disease genetic risk, acquisition of a phenotypic genetic risk, An application program necessary for the operation of the disease risk prediction apparatus 100 such as acquisition of an integrated genetic risk may be stored.
  • OS operating system
  • the data area is an area in which data generated according to the use of the disease risk prediction device 100 is stored, and information on genetic markers related to the occurrence of a disease, information on phenotypes related to the occurrence of a disease, information on a gene marker for a phenotype, and a state of a phenotype
  • Each effective size information, user's genetic risk information for a disease (disease genetic risk, phenotypic genetic risk, integrated genetic risk, etc.), and personal information of the user can be stored.
  • the disease risk acquisition unit 130 acquires a disease genetic risk for a disease based on gene marker information related to the occurrence of a disease and genotype information of a user.
  • the genetic marker information related to the occurrence of a disease is composed of genetic markers related to the occurrence of a disease, and is classified by disease and stored in the storage unit 110.
  • the disease is “liver cancer”
  • the genetic marker information associated with the occurrence of liver cancer is shown in [Table 1] below.
  • the disease risk acquisition unit 130 determines the disease genetic risk as shown in [Table 2] based on the genetic marker information associated with the occurrence of a disease (liver cancer) as shown in [Table 1] and genotype information of the user. Can be obtained.
  • the disease risk acquisition unit 130 compares the acquired disease genetic risk to the disease genetic risk of other users within the group to which the user belongs (eg, the same country, the same residence area, the same age group, etc.). Can be converted.
  • the reason for converting the genetic risk of a disease into a relative value is that the absolute value of the genetic risk score can vary greatly depending on the number of genetic markers used, and the method of calculating the genetic risk of the disease and the phenotypic genetic risk is different Because it can be done, it is for normalization (0 ⁇ 1) in relative order.
  • the disease risk acquisition unit 130 may convert the acquired disease genetic risk into a percentage (eg, top 33%) representing a relative position compared to the disease genetic risk of other users.
  • the phenotypic risk acquisition unit 150 acquires a phenotypic genetic risk for a phenotype based on gene marker information on a phenotype associated with the occurrence of a disease and genotype information of a user.
  • the information on the phenotype associated with the occurrence of the disease is composed of phenotype information related to the occurrence of the disease, information on the gene marker for the phenotype, information on the effective size of each phenotype, and is classified by disease and stored in the storage unit 110.
  • phenotypic information associated with the occurrence of liver cancer is shown in [Table 3] below
  • gene marker information for the phenotype shown in [Table 3] is shown in [Table 4] to [Table 9] below.
  • Phenotype Genetic marker Risk factor Smoking (nicotine dependence) rs4142041 G rs6265 C rs2036527 A rs667282 C rs3733829 G
  • Phenotype Genetic marker Risk factor Non-alcoholic steatohepatitis rs343064 T rs1836127 T rs643608 C rs4243849 G rs2358462 C
  • the phenotypic risk acquisition unit 150 acquires a genetic risk for each of the plurality of phenotypes when there are a plurality of phenotypes associated with the occurrence of a disease, and acquires a phenotypic genetic risk based on the plurality of acquired genetic risks. can do. For example, if the disease is liver cancer, as shown in [Table 3] above, since there are 6 phenotypes associated with the occurrence of liver cancer, a genetic risk is obtained for each of the 6 phenotypes, and the phenotype is based on the acquired 6 genetic risks.
  • the phenotypic risk acquisition unit 150 may determine the acquired phenotypic genetic risk by using the phenotype of another user in the group to which the user belongs (e.g., the same country, the same residential area, the same age group, etc.). It can be converted to a value relative to the genetic risk.
  • the reason for converting the phenotypic genetic risk to a relative value is that the absolute value of the genetic risk score can vary greatly depending on the number of genetic markers used, and the method of calculating the genetic risk of the disease and the phenotypic genetic risk is different from each other. Because it can be done, it is for normalization (0 ⁇ 1) in relative order.
  • the phenotypic risk acquisition unit 150 converts the genetic risk acquired for each of the plurality of phenotypes into a relative value compared to the corresponding genetic risk of each other user, Phenotypic genetic risk can be obtained based on a plurality of genetic risks converted into relative values.
  • the phenotypic risk acquisition unit 150 may acquire a phenotypic genetic risk based on gene marker information for a phenotype and genotype information of a user by using an effective size predefined for each phenotype state.
  • the phenotypic risk acquisition unit 150 acquires the genetic risk based on the genetic marker information for the phenotype and the genotype information of the user, and uses the acquired genetic risk for the phenotype of another user in the group to which the user belongs. It converts into a relative value compared to the enemy risk, acquires a phenotypic state based on the genetic risk converted into a relative value, and determines an effective size corresponding to the acquired state as a phenotypic genetic risk.
  • the phenotypic risk acquisition unit 150 can acquire the phenotypic genetic risk as shown in [Table 10] below based on the user's genotypic information and the above [Table 3] to [Table 9]. have.
  • a genetic risk score method in which the number of risk factors is arithmetically added to the phenotypic genetic risk was used, but the present invention is not limited thereto, and the genetic risk score, weighted genetic risk score, machine learning method, linear regression analysis Various risk calculation methods, including methods, can be used.
  • the integrated risk acquisition unit 170 calculates the integrated genetic risk for a disease based on the disease genetic risk acquired through the disease risk acquisition unit 130 and the phenotypic genetic risk acquired through the phenotypic risk acquisition unit 150. Can be obtained.
  • the integrated risk acquisition unit 170 may acquire the integrated genetic risk based on the disease genetic risk converted to a relative value and the expression current genetic risk converted to a relative value.
  • the integrated risk acquisition unit 170 may acquire the integrated genetic risk based on the disease genetic risk and the phenotypic genetic risk by using the ratio of the genetic factors that affect the occurrence of the disease. .
  • the ratio of genetic factors affecting the occurrence of a disease represents the proportion of genetic factors that affect the occurrence of a specific disease. For example, if the disease is "liver cancer" and the proportion of genetic factors affecting the occurrence of liver cancer is "61%", the proportion of the genetic factors may be "0.61".
  • the integrated risk acquisition unit 170 may acquire an integrated genetic risk for a disease through [Equation 1] below.
  • Integrated genetic risk a * disease genetic risk + (1-a) * phenotypic genetic risk
  • a represents the ratio of genetic factors that influence the occurrence of the disease.
  • Disease genetic risk and phenotypic genetic risk may be converted to relative values.
  • the disease is “liver cancer”
  • the disease genetic risk converted to a relative value is “top 33%”
  • the phenotypic genetic risk converted to a relative value is “top 7%”
  • the integrated genetics for liver cancer The risk is as shown in [Equation 2] below.
  • the integrated risk acquisition unit 170 may obtain a relative ranking by comparing the acquired integrated genetic risk with the integrated genetic risk of another user, and grade the disease risk as follows based on the acquired relative ranking.
  • FIG. 2 is a flowchart illustrating a method for predicting disease risk by combining the genetic risk of an associated phenotype according to a preferred embodiment of the present invention.
  • the disease risk predicting apparatus 100 acquires a disease genetic risk for a disease based on gene marker information related to the occurrence of a disease and genotype information of a user (S110). At this time, the disease risk prediction apparatus 100 uses the acquired disease genetic risk as a relative value compared to the disease genetic risk of other users in the group to which the user belongs (eg, the same country, the same residential area, the same age group, etc.). Can be converted.
  • the disease risk predicting apparatus 100 acquires a phenotypic genetic risk for a phenotype based on gene marker information on a phenotype associated with the occurrence of a disease and genotype information of a user (S130).
  • the disease risk prediction apparatus 100 obtains a genetic risk for each of the plurality of phenotypes when there are a plurality of phenotypes associated with the occurrence of a disease, and obtains a phenotypic genetic risk based on the acquired plurality of genetic risks. can do.
  • the disease risk prediction apparatus 100 uses the acquired phenotypic genetic risk as a relative value compared to the phenotypic genetic risk of other users in the group to which the user belongs (eg, the same country, the same residential area, the same age group, etc.). Can be converted.
  • the disease risk prediction apparatus 100 converts the genetic risk acquired for each of the plurality of phenotypes into a relative value compared to the corresponding genetic risk of each other user, Phenotypic genetic risk can be obtained based on a plurality of genetic risks converted into relative values.
  • the disease risk prediction apparatus 100 may obtain a phenotypic genetic risk based on gene marker information for a phenotype and genotype information of a user by using an effective size predefined for each phenotype state. That is, the disease risk prediction apparatus 100 acquires a genetic risk based on gene marker information on a phenotype and genotype information of a user, and determines the acquired genetic risk to the phenotype of another user in the group to which the user belongs. It converts into a relative value compared to the enemy risk, acquires a phenotypic state based on the genetic risk converted into a relative value, and determines an effective size corresponding to the acquired state as a phenotypic genetic risk.
  • the disease risk prediction apparatus 100 acquires an integrated genetic risk for a disease based on the acquired disease genetic risk and the acquired phenotypic genetic risk (S150).
  • the disease risk prediction apparatus 100 may acquire the integrated genetic risk based on the disease genetic risk converted to a relative value and the expression current genetic risk converted to a relative value.
  • the disease risk prediction apparatus 100 may obtain an integrated genetic risk based on a disease genetic risk and a phenotypic genetic risk using a ratio of genetic factors that affect the occurrence of a disease. .
  • the disease risk prediction apparatus 100 may convert the acquired integrated genetic risk into a relative value compared to the integrated genetic risk of other users in the group to which the user belongs.
  • the present invention can also be implemented as computer-readable codes on a computer-readable recording medium.
  • the computer-readable recording medium includes all types of recording devices storing data that can be read by a computer. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tapes, floppy disks, and optical data storage devices.

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Genetics & Genomics (AREA)
  • Psychiatry (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Signal Processing (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Physiology (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은, 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법에 대한 것으로, 사용자의 유전형 정보를 기반으로 질병에 대한 질병 유전적 위험도와 질병과 연관된 표현형(연관 질병, 생활습관 등)에 대한 표현형 유전적 위험도를 획득하고, 질병 유전적 위험도와 표현형 유전적 위험도를 기반으로 질병에 대한 통합 유전적 위험도를 획득함으로써, 보다 객관적이고 정확한 질병의 예측이 가능하다.

Description

연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법
본 발명은 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법에 관한 것으로, 더욱 상세하게는 질병의 위험도를 예측하는 장치 및 방법에 관한 것이다.
유전체(Genome) 서열 해독 및 전장유전체 연관분석(Genome-wide association study; GWAS 등)에 의해, 다양한 질병 관련 혹은 표현형 관련 유전자 단일염기다형성(single nucleotide polymorphism; SNP) 마커가 밝혀지고 있다.
그에 따라, 기 과학연구를 통해 보고된 여러 유전자 마커를 활용하여 피검사자의 질병 및 비질병 표현형 발생 가능성을 예측하는 다양한 방법이 보고되고 있고(참고문헌: Schrodi SJ et al. Front. Genet. 2014), 국내외 유전자 검사기관에서도 유사한 방법을 활용하여 질병 및 표현형에 대한 유전적 위험도를 검사해주고 있다.
그러나, 유전적 영향에 의해 100% 발생하는 질병(유전병)을 제외하고, 대부분의 일반 질환(암, 당뇨 등)은 유전적 요인 이외에 생활습관이나 다른 질병의 보유 여부에 의해서도 질병의 발생이 영향을 받게 된다. 따라서, 정확한 질병의 발생 가능성을 예측하기 위해서는, 유전적 요인 외에도 다양한 생활습관 및 환경요인의 통합적인 분석이 중요하다. 최근, 유전적 요인과 비유전적 요인을 동시에 고려한 질병 예측/진단에 대한 연구가 발표되었는데, Goldstein BA et al. Front. Genet. 2014 논문에서는 관동맥성심장병(coronary heart disease)을 대상으로, 임상 위험 점수(clinical risk score)와 유전적 위험 점수(genetic risk score)를 로그-링크 함수(long-link function) 방법을 이용하여 통합하는 방법에 관한 것이다. 그러나, 이 방법은 관동맥성심장병에 대해 임상적으로 위험도를 측정/판단하기 위한, Framingham Risk Score(성별, 연령, 콜레스테롤 수준, 혈압, 당뇨, 흡연상태 등을 고려)가 이미 정립이 되어 있었기에 적용 가능한 방법이었을 뿐더러, Framingham Risk Score 계산에 필요한 수치들은 건강검진/의료검사 등 의학적 장비로 측정한 정보가 필요하다는 단점이 있다.
이러한 단점을 극복하기 위해, 한국공개특허 제2019-0077997호는 질병 발생에 영향을 미치는 생활습관 및 환경요인을 임상설문지를 통하여 수집하고 수집된 생활습관 및 환경요인 요소를 유전적 요소와 통합하여 질병 및 표현형의 발생 가능성을 예측하는 방법에 대해 기재되어 있다.
그러나, 임상설문 방법을 통한 질병과 연관된 표현형(생활습관, 환경요인, 기타 연관 질병 보유 여부)의 수집의 경우, 피검사자의 주관 및 판단 기준에 따라 서로 다른 기준을 가지고 설문 문항에 답을 할 수 있어 부정확한 결과를 유발할 수 있으며, 임상설문에 미응답하는 경우 분석이 불가능하다는 단점이 있다. 따라서, 질병에 대한 유전적 요인 및 관련 표현형 요인을 통합하여 질병을 예측하는데 있어서, 기존 방법들을 보완하는 방법의 개발이 필요하다.
본 발명이 이루고자 하는 기술적 과제는, 사용자의 유전형 정보를 기반으로 질병에 대한 질병 유전적 위험도와 질병과 연관된 표현형(연관 질병, 생활습관 등)에 대한 표현형 유전적 위험도를 획득하고, 질병 유전적 위험도와 표현형 유전적 위험도를 기반으로 질병에 대한 통합 유전적 위험도를 획득하는 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법을 제공하는 데 있다.
상기의 기술적 과제를 달성하기 위한 본 발명에 따른 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치는, 질병의 발생과 연관된 유전자 마커 정보와 사용자의 유전형 정보를 기반으로 상기 질병에 대한 질병 유전적 위험도를 획득하는 질병 위험도 획득부; 상기 질병의 발생과 연관된 표현형에 대한 유전자 마커 정보와 상기 사용자의 유전형 정보를 기반으로 상기 표현형에 대한 표현형 유전적 위험도를 획득하는 표현형 위험도 획득부; 및 상기 질병 위험도 획득부를 통해 획득한 상기 질병 유전적 위험도와 상기 표현형 위험도 획득부를 통해 획득한 상기 표현형 유전적 위험도를 기반으로 상기 질병에 대한 통합 유전적 위험도를 획득하는 통합 위험도 획득부;를 포함한다.
상기 통합 위험도 획득부는, 상기 질병의 발생에 영향을 미치는 유전적 요인의 비율을 이용하여, 상기 질병 유전적 위험도와 상기 표현형 유전적 위험도를 기반으로 상기 통합 유전적 위험도를 획득할 수 있다.
상기 질병 위험도 획득부는, 획득한 상기 질병 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 질병 유전적 위험도와 대비하여 상대적인 값으로 변환하고, 상기 표현형 위험도 획득부는, 획득한 상기 표현형 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 표현형 유전적 위험도와 대비하여 상대적인 값으로 변환하며, 상기 통합 위험도 획득부는, 상대적인 값으로 변환된 상기 질병 유전적 위험도와 상대적인 값으로 변환된 상기 표현현 유전적 위험도를 기반으로 상기 통합 유전적 위험도를 획득하고, 획득한 상기 통합 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 통합 유전적 위험도와 대비하여 상대적인 값으로 변환할 수 있다.
상기 표현형 위험도 획득부는, 상기 표현형의 상태별로 미리 정의된 유효크기를 이용하여, 상기 표현형에 대한 유전자 마커 정보와 상기 사용자의 유전형 정보를 기반으로 상기 표현형 유전적 위험도를 획득할 수 있다.
상기 표현형 위험도 획득부는, 상기 표현형에 대한 유전자 마커 정보와 상기 사용자의 유전형 정보를 기반으로 유전적 위험도를 획득하고, 획득한 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 상기 표현형에 대한 유전적 위험도와 대비하여 상대적인 값으로 변환하며, 상대적인 값으로 변환된 유전적 위험도를 기반으로 상기 표현형의 상태를 획득하고, 획득한 상태에 대응되는 유효크기를 상기 표현형 유전적 위험도로 결정할 수 있다.
상기 표현형 위험도 획득부는, 상기 질병의 발생과 연관된 상기 표현형이 복수개인 경우, 복수개의 상기 표현형 각각에 대하여 유전적 위험도를 획득하고, 획득된 복수개의 유전적 위험도를 기반으로 상기 표현형 유전적 위험도를 획득할 수 있다.
상기의 기술적 과제를 달성하기 위한 본 발명에 따른 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 방법은, 질병의 발생과 연관된 유전자 마커 정보와 사용자의 유전형 정보를 기반으로 상기 질병에 대한 질병 유전적 위험도를 획득하는 단계; 상기 질병의 발생과 연관된 표현형에 대한 유전자 마커 정보와 상기 사용자의 유전형 정보를 기반으로 상기 표현형에 대한 표현형 유전적 위험도를 획득하는 단계; 및 획득한 상기 질병 유전적 위험도와 획득한 상기 표현형 유전적 위험도를 기반으로 상기 질병에 대한 통합 유전적 위험도를 획득하는 단계;를 포함한다.
상기 통합 유전적 위험도 획득 단계는, 상기 질병의 발생에 영향을 미치는 유전적 요인의 비율을 이용하여, 상기 질병 유전적 위험도와 상기 표현형 유전적 위험도를 기반으로 상기 통합 유전적 위험도를 획득하는 것으로 이루어질 수 있다.
상기 질병 유전적 위험도 획득 단계는, 획득한 상기 질병 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 질병 유전적 위험도와 대비하여 상대적인 값으로 변환하는 것으로 이루어지고, 상기 표현형 유전적 위험도 획득 단계는, 획득한 상기 표현형 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 표현형 유전적 위험도와 대비하여 상대적인 값으로 변환하는 것으로 이루어지며, 상기 통합 유전적 위험도 획득 단계는, 상대적인 값으로 변환된 상기 질병 유전적 위험도와 상대적인 값으로 변환된 상기 표현현 유전적 위험도를 기반으로 상기 통합 유전적 위험도를 획득하고, 획득한 상기 통합 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 통합 유전적 위험도와 대비하여 상대적인 값으로 변환하는 것으로 이루어질 수 있다.
상기 표현형 유전적 위험도 획득 단계는, 상기 표현형의 상태별로 미리 정의된 유효크기를 이용하여, 상기 표현형에 대한 유전자 마커 정보와 상기 사용자의 유전형 정보를 기반으로 상기 표현형 유전적 위험도를 획득하는 것으로 이루어질 수 있다.
상기 표현형 유전적 위험도 획득 단계는, 상기 표현형에 대한 유전자 마커 정보와 상기 사용자의 유전형 정보를 기반으로 유전적 위험도를 획득하고, 획득한 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 상기 표현형에 대한 유전적 위험도와 대비하여 상대적인 값으로 변환하며, 상대적인 값으로 변환된 유전적 위험도를 기반으로 상기 표현형의 상태를 획득하고, 획득한 상태에 대응되는 유효크기를 상기 표현형 유전적 위험도로 결정하는 것으로 이루어질 수 있다.
상기 표현형 유전적 위험도 획득 단계는, 상기 질병의 발생과 연관된 상기 표현형이 복수개인 경우, 복수개의 상기 표현형 각각에 대하여 유전적 위험도를 획득하고, 획득된 복수개의 유전적 위험도를 기반으로 상기 표현형 유전적 위험도를 획득하는 것으로 이루어질 수 있다.
상기의 기술적 과제를 달성하기 위한 본 발명에 따른 컴퓨터 프로그램은 컴퓨터로 읽을 수 있는 기록 매체에 저장되어 상기한 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 방법 중 어느 하나를 컴퓨터에서 실행시킨다.
본 발명에 따른 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법에 의하면, 질병에 대한 유전적 위험도와 질병의 발생과 연관된 표현형에 대한 유전적 위험도를 기반으로 질병에 대한 통합 유전적 위험도를 획득함으로써, 보다 객관적이고 정확한 질병의 예측이 가능하다.
도 1은 본 발명의 바람직한 실시예에 따른 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치를 설명하기 위한 블록도이다.
도 2는 본 발명의 바람직한 실시예에 따른 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 방법을 설명하기 위한 흐름도이다.
이하에서 첨부한 도면을 참조하여 본 발명에 따른 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법의 바람직한 실시예에 대해 상세하게 설명한다.
먼저, 도 1을 참조하여 본 발명의 바람직한 실시예에 따른 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치에 대하여 설명한다.
도 1은 본 발명의 바람직한 실시예에 따른 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치를 설명하기 위한 블록도이다.
도 1을 참조하면, 본 발명의 바람직한 실시예에 따른 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치(이하 '질병 위험도 예측 장치'라 한다)(100)는 사용자의 유전형 정보를 기반으로 질병에 대한 질병 유전적 위험도와 질병과 연관된 표현형(연관 질병, 생활습관 등)에 대한 표현형 유전적 위험도를 획득하고, 질병 유전적 위험도와 표현형 유전적 위험도를 기반으로 질병에 대한 통합 유전적 위험도를 획득한다.
이를 위해, 질병 위험도 예측 장치(100)는 저장부(110), 질병 위험도 획득부(130), 표현형 위험도 획득부(150) 및 통합 위험도 획득부(170)를 포함할 수 있다.
저장부(110)는 질병 위험도 예측 장치(100)의 동작에 필요한 프로그램 및 데이터를 저장하는 역할을 수행하며, 프로그램 영역과 데이터 영역으로 구분될 수 있다.
프로그램 영역은 질병 위험도 예측 장치(100)의 전반적인 동작을 제어하는 프로그램, 질병 위험도 예측 장치(100)를 부팅시키는 운영체제(Operating System, OS), 질병 유전적 위험도의 획득, 표현형 유전적 위험도의 획득, 통합 유전적 위험도의 획득 등과 같은 질병 위험도 예측 장치(100)의 동작에 필요한 응용 프로그램 등을 저장할 수 있다.
데이터 영역은 질병 위험도 예측 장치(100)의 사용에 따라 발생하는 데이터가 저장되는 영역으로서, 질병의 발생과 연관된 유전자 마커 정보, 질병의 발생과 연관된 표현형 정보, 표현형에 대한 유전자 마커 정보, 표현형의 상태별 유효크기(effective size) 정보, 질병에 대한 사용자의 유전적 위험도 정보(질병 유전적 위험도, 표현형 유전적 위험도, 통합 유전적 위험도 등), 사용자의 개인 정보 등을 저장할 수 있다.
질병 위험도 획득부(130)는 질병의 발생과 연관된 유전자 마커 정보와 사용자의 유전형 정보를 기반으로 질병에 대한 질병 유전적 위험도를 획득한다.
여기서, 질병의 발생과 연관된 유전자 마커 정보는 질병의 발생에 관련이 있는 유전자 마커들로 이루어져 있으며, 질병별로 구분되어 저장부(110)에 저장되어 있다. 예컨대, 질병이 "간암"인 경우, 간암의 발생과 연관된 유전자 마커 정보는 아래의 [표 1]과 같다.
질병 유전자 마커 위험 인자
간암 rs2596542 T
rs7574865 G
rs9275319 A
rs17401966 A
rs4678680 G
예컨대, 질병 위험도 획득부(130)는 위의 [표 1]과 같은 질병(간암)의 발생과 연관된 유전자 마커 정보와 사용자의 유전형 정보를 기반으로 아래의 [표 2]와 같이 질병 유전적 위험도를 획득할 수 있다.
질병 유전자 마커 위험 인자 사용자의 유전형 질병 유전적 위험도
간암 rs2596542 T C T 5(= 1+2+0+1+1)
s7574865 G GG
s9275319 A GG
s17401966 A AG
s4678680 G GT
여기서, 질병 유전적 위험도를 위험 인자의 수를 산술적으로 더하는 genetic risk score 방식을 이용하였으나, 본 발명은 이에 한정되지 않고 실시예에 따라 genetic risk score, weighted genetic risk score, machine learning 방법, 선형회귀분석 방법 등 다양한 위험도 계산 방식을 이용할 수 있다. 그리고, 질병 위험도 획득부(130)는 획득한 질병 유전적 위험도를 사용자가 소속된 집단(예컨대, 동일 국가, 동일 거주 지역, 동일 연령대 등) 내의 다른 사용자의 질병 유전적 위험도와 대비하여 상대적인 값으로 변환할 수 있다. 이때, 질병 유전적 위험도를 상대적인 값으로 변환하는 이유는, 사용되는 유전자 마커의 수에 따라 genetic risk score 절대값이 크게 변화할 수 있고, 질병 유전적 위험도와 표현형 유전적 위험도의 계산 방법이 서로 상이할 수 있기 때문에, 상대적인 순위로 normalization(0~1)하기 위함이다.
예컨대, 질병 위험도 획득부(130)는 획득한 질병 유전적 위험도를 다른 사용자들의 질병 유전적 위험도와 대비하여 상대적인 위치를 나타내는 백분율(예컨대, 상위 33%)로 변환할 수 있다.
표현형 위험도 획득부(150)는 질병의 발생과 연관된 표현형에 대한 유전자 마커 정보와 사용자의 유전형 정보를 기반으로 표현형에 대한 표현형 유전적 위험도를 획득한다.
여기서, 질병의 발생과 연관된 표현형에 대한 정보는 질병의 발생관 연관된 표현형 정보, 표현형에 대한 유전자 마커 정보, 표현형의 상태별 유효크기 정보 등으로 이루어져 있으며, 질병별로 구분되어 저장부(110)에 저장되어 있다. 예컨대, 간암의 발생과 연관된 표현형 정보는 아래의 [표 3]과 같고, [표 3]에 도시된 표현형에 대한 유전자 마커 정보는 아래의 [표 4] 내지 [표 9]와 같다.
질병 연관된 표현형 상태(등급) 개수 상태별 유효크기
간암 음주(알코올 의존도) 3단계 4.36배(높음) 1.27배(중간) 1배(낮음)
흡연(니코틴 의존도) 2단계 1.50배(흡연) 1배(비흡연)
체질량지수 3단계 1.83배(비만) 1.18배(과체중) 1배(정상)
우울감 3단계 1.20배(높음) 1배(중간) 1배(낮음)
비알코올성 지방간염 2단계 3.10배(높음) 1배(낮음)
간경변 2단계 2.55배(높음) 1배(낮음)
표현형 유전자 마커 위험 인자
음주(알코올 의존도) rs10741210 G
rs1793257 T
rs2400954 C
rs10483282 T
rs2154294 G
표현형 유전자 마커 위험 인자
흡연(니코틴 의존도) rs4142041 G
rs6265 C
rs2036527 A
rs667282 C
rs3733829 G
표현형 유전자 마커 위험 인자
체질량지수 rs17094222 C
rs4146429 C
rs7903146 C
rs718948 C
rs751008 A
표현형 유전자 마커 위험 인자
우울감 rs1457614 C
rs4238010 G
rs9943849 T
rs1545843 A
rs9572423 G
표현형 유전자 마커 위험 인자
비알코올성 지방간염 rs343064 T
rs1836127 T
rs643608 C
rs4243849 G
rs2358462 C
표현형 유전자 마커 위험 인자
간경변 rs738409 G
rs10401969 C
rs6441286 G
rs3790567 A
rs907092 A
이때, 표현형 위험도 획득부(150)는 질병의 발생과 연관된 표현형이 복수개인 경우, 복수개의 표현형 각각에 대하여 유전적 위험도를 획득하고, 획득된 복수개의 유전적 위험도를 기반으로 표현형 유전적 위험도를 획득할 수 있다. 예컨대, 질병이 간암인 경우, 위의 [표 3]과 같이 간암의 발생과 연관된 표현형은 6개이므로, 6개의 표현형 각각에 대해 유전적 위험도를 획득하고, 획득한 6개의 유전적 위험도를 토대로 표현형 유전적 위험도를 획득할 수 있다.또한, 표현형 위험도 획득부(150)는 획득한 표현형 유전적 위험도를 사용자가 소속된 집단(예컨대, 동일 국가, 동일 거주 지역, 동일 연령대 등) 내의 다른 사용자의 표현형 유전적 위험도와 대비하여 상대적인 값으로 변환할 수 있다. 이때, 표현형 유전적 위험도를 상대적인 값으로 변환하는 이유는, 사용되는 유전자 마커의 수에 따라 genetic risk score 절대값이 크게 변화할 수 있고, 질병 유전적 위험도와 표현형 유전적 위험도의 계산 방법이 서로 상이할 수 있기 때문에, 상대적인 순위로 normalization(0~1)하기 위함이다. 여기서, 질병의 발생과 연관된 표현형이 복수개인 경우, 표현형 위험도 획득부(150)는 복수개의 표현형 각각에 대하여 획득한 유전적 위험도를 각각 다른 사용자의 해당 유전적 위험도와 대비하여 상대적인 값으로 변환하고, 상대적인 값으로 변환된 복수개의 유전적 위험도를 토대로 표현형 유전적 위험도를 획득할 수 있다.
보다 자세히 설명하면, 표현형 위험도 획득부(150)는 표현형의 상태별로 미리 정의된 유효크기를 이용하여, 표현형에 대한 유전자 마커 정보와 사용자의 유전형 정보를 기반으로 표현형 유전적 위험도를 획득할 수 있다.
즉, 표현형 위험도 획득부(150)는 표현형에 대한 유전자 마커 정보와 사용자의 유전형 정보를 기반으로 유전적 위험도를 획득하고, 획득한 유전적 위험도를 사용자가 소속된 집단 내의 다른 사용자의 표현형에 대한 유전적 위험도와 대비하여 상대적인 값으로 변환하며, 상대적인 값으로 변환된 유전적 위험도를 기반으로 표현형의 상태를 획득하고, 획득한 상태에 대응되는 유효크기를 표현형 유전적 위험도로 결정할 수 있다.
예컨대, 질병이 간암인 경우, 표현형 위험도 획득부(150)는 사용자의 유전형 정보와 위의 [표 3] 내지 [표 9]를 토대로 아래의 [표 10]과 같이 표현형 유전적 위험도를 획득할 수 있다.
Figure PCTKR2019010258-appb-img-000001
여기서, 표현형 유전적 위험도를 위험 인자의 수를 산술적으로 더하는 genetic risk score 방식을 이용하였으나, 본 발명은 이에 한정되지 않고 실시예에 따라 genetic risk score, weighted genetic risk score, machine learning 방법, 선형회귀분석 방법 등 다양한 위험도 계산 방식을 이용할 수 있다.
통합 위험도 획득부(170)는 질병 위험도 획득부(130)를 통해 획득한 질병 유전적 위험도와 표현형 위험도 획득부(150)를 통해 획득한 표현형 유전적 위험도를 기반으로 질병에 대한 통합 유전적 위험도를 획득할 수 있다.
이때, 통합 위험도 획득부(170)는 상대적인 값으로 변환된 질병 유전적 위험도와 상대적인 값으로 변환된 표현현 유전적 위험도를 기반으로 통합 유전적 위험도를 획득할 수 있다.
보다 자세히 설명하면, 통합 위험도 획득부(170)는 질병의 발생에 영향을 미치는 유전적 요인의 비율을 이용하여, 질병 유전적 위험도와 표현형 유전적 위험도를 기반으로 통합 유전적 위험도를 획득할 수 있다.
여기서, 질병의 발생에 영향을 미치는 유전적 요인의 비율은 유전적 요인이 특정 질병의 발생에 영향을 미치는 비중을 나타낸다. 예컨대, 질병이 "간암"이고, 간암의 발생에 미치는 유전적 요인의 비중이 "61%"라고 하면, 유전적 요인의 비율은 "0.61"이 될 수 있다.
예컨대, 통합 위험도 획득부(170)는 아래의 [수학식 1]을 통해 질병에 대한 통합 유전적 위험도를 획득할 수 있다.
[수학식 1]
통합 유전적 위험도 = a * 질병 유전적 위험도 + (1-a) * 표현형 유전적 위험도
여기서, a는 질병의 발생에 영향을 미치는 유전적 요인의 비율을 나타낸다. 질병 유전적 위험도와 표현형 유전적 위험도는 상대적인 값으로 변환된 값을 이용할 수도 있다.
예컨대, 질병이 "간암"이고, 상대적인 값으로 변환된 질병 유전적 위험도가 "상위 33%"이며, 상대적인 값으로 변환된 표현형 유전적 위험도가 "상위 7%"라고 하면, 간암에 대한 통합 유전적 위험도는 아래의 [수학식 2]와 같다.
[수학식 2]
0.61 * 0.33 + (1-0.61)*0.07 = 0.23
그리고, 통합 위험도 획득부(170)는 획득한 통합 유전적 위험도를 사용자가 소속된 집단 내의 다른 사용자의 통합 유전적 위험도와 대비하여 상대적인 값으로 변환할 수 있다.
예컨대, 통합 위험도 획득부(170)는 획득한 통합 유전적 위험도를 다른 사용자의 통합 유전적 위험도와 대비하여 상대적인 순위를 획득하고, 획득한 상대적인 순위를 토대로 아래와 같이 질병 위험도를 등급화할 수 있다.
상위 1% ~ 25% : 질병 위험도 등급 "상"
상위 26% ~ 50% : 질병 위험도 등급 "중상"
상위 51% ~ 75% : 질병 위험도 등급 "중하"
상위 76% ~ 100% : 질병 위험도 등급 "하"
그러면, 도 2를 참조하여 본 발명의 바람직한 실시예에 따른 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 방법에 대하여 설명한다.
도 2는 본 발명의 바람직한 실시예에 따른 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 방법을 설명하기 위한 흐름도이다.
도 2를 참조하면, 질병 위험도 예측 장치(100)는 질병의 발생과 연관된 유전자 마커 정보와 사용자의 유전형 정보를 기반으로 질병에 대한 질병 유전적 위험도를 획득한다(S110). 이때, 질병 위험도 예측 장치(100)는 획득한 질병 유전적 위험도를 사용자가 소속된 집단(예컨대, 동일 국가, 동일 거주 지역, 동일 연령대 등) 내의 다른 사용자의 질병 유전적 위험도와 대비하여 상대적인 값으로 변환할 수 있다.
그런 다음, 질병 위험도 예측 장치(100)는 질병의 발생과 연관된 표현형에 대한 유전자 마커 정보와 사용자의 유전형 정보를 기반으로 표현형에 대한 표현형 유전적 위험도를 획득한다(S130).
이때, 질병 위험도 예측 장치(100)는 질병의 발생과 연관된 표현형이 복수개인 경우, 복수개의 표현형 각각에 대하여 유전적 위험도를 획득하고, 획득된 복수개의 유전적 위험도를 기반으로 표현형 유전적 위험도를 획득할 수 있다.
또한, 질병 위험도 예측 장치(100)는 획득한 표현형 유전적 위험도를 사용자가 소속된 집단(예컨대, 동일 국가, 동일 거주 지역, 동일 연령대 등) 내의 다른 사용자의 표현형 유전적 위험도와 대비하여 상대적인 값으로 변환할 수 있다. 여기서, 질병의 발생과 연관된 표현형이 복수개인 경우, 질병 위험도 예측 장치(100)는 복수개의 표현형 각각에 대하여 획득한 유전적 위험도를 각각 다른 사용자의 해당 유전적 위험도와 대비하여 상대적인 값으로 변환하고, 상대적인 값으로 변환된 복수개의 유전적 위험도를 토대로 표현형 유전적 위험도를 획득할 수 있다.
보다 자세히 설명하면, 질병 위험도 예측 장치(100)는 표현형의 상태별로 미리 정의된 유효크기를 이용하여, 표현형에 대한 유전자 마커 정보와 사용자의 유전형 정보를 기반으로 표현형 유전적 위험도를 획득할 수 있다. 즉, 질병 위험도 예측 장치(100)는 표현형에 대한 유전자 마커 정보와 사용자의 유전형 정보를 기반으로 유전적 위험도를 획득하고, 획득한 유전적 위험도를 사용자가 소속된 집단 내의 다른 사용자의 표현형에 대한 유전적 위험도와 대비하여 상대적인 값으로 변환하며, 상대적인 값으로 변환된 유전적 위험도를 기반으로 표현형의 상태를 획득하고, 획득한 상태에 대응되는 유효크기를 표현형 유전적 위험도로 결정할 수 있다.
이후, 질병 위험도 예측 장치(100)는 획득한 질병 유전적 위험도와 획득한 표현형 유전적 위험도를 기반으로 질병에 대한 통합 유전적 위험도를 획득한다(S150).
이때, 질병 위험도 예측 장치(100)는 상대적인 값으로 변환된 질병 유전적 위험도와 상대적인 값으로 변환된 표현현 유전적 위험도를 기반으로 통합 유전적 위험도를 획득할 수 있다.
보다 자세히 설명하면, 질병 위험도 예측 장치(100)는 질병의 발생에 영향을 미치는 유전적 요인의 비율을 이용하여, 질병 유전적 위험도와 표현형 유전적 위험도를 기반으로 통합 유전적 위험도를 획득할 수 있다.
그리고, 질병 위험도 예측 장치(100)는 획득한 통합 유전적 위험도를 사용자가 소속된 집단 내의 다른 사용자의 통합 유전적 위험도와 대비하여 상대적인 값으로 변환할 수 있다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터로 읽을 수 있는 기록 매체는 컴퓨터에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 롬(ROM), 램(RAM), 씨디-롬(CD-ROM), 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있다.
이상에서 본 발명의 바람직한 실시예에 대하여 상세하게 설명하였지만 본 발명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 다음의 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.
< 부호의 설명 >
100 : 질병 위험도 예측 장치,
110 : 저장부,
130 : 질병 위험도 획득부,
150 : 표현형 위험도 획득부,
170 : 통합 위험도 획득부,

Claims (13)

  1. 질병의 발생과 연관된 유전자 마커 정보와 사용자의 유전형 정보를 기반으로 상기 질병에 대한 질병 유전적 위험도를 획득하는 질병 위험도 획득부;
    상기 질병의 발생과 연관된 표현형에 대한 유전자 마커 정보와 상기 사용자의 유전형 정보를 기반으로 상기 표현형에 대한 표현형 유전적 위험도를 획득하는 표현형 위험도 획득부; 및
    상기 질병 위험도 획득부를 통해 획득한 상기 질병 유전적 위험도와 상기 표현형 위험도 획득부를 통해 획득한 상기 표현형 유전적 위험도를 기반으로 상기 질병에 대한 통합 유전적 위험도를 획득하는 통합 위험도 획득부;
    를 포함하는 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치.
  2. 제1항에서,
    상기 통합 위험도 획득부는, 상기 질병의 발생에 영향을 미치는 유전적 요인의 비율을 이용하여, 상기 질병 유전적 위험도와 상기 표현형 유전적 위험도를 기반으로 상기 통합 유전적 위험도를 획득하는,
    연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치.
  3. 제1항에서,
    상기 질병 위험도 획득부는, 획득한 상기 질병 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 질병 유전적 위험도와 대비하여 상대적인 값으로 변환하고,
    상기 표현형 위험도 획득부는, 획득한 상기 표현형 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 표현형 유전적 위험도와 대비하여 상대적인 값으로 변환하며,
    상기 통합 위험도 획득부는, 상대적인 값으로 변환된 상기 질병 유전적 위험도와 상대적인 값으로 변환된 상기 표현현 유전적 위험도를 기반으로 상기 통합 유전적 위험도를 획득하고, 획득한 상기 통합 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 통합 유전적 위험도와 대비하여 상대적인 값으로 변환하는,
    연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치.
  4. 제1항에서,
    상기 표현형 위험도 획득부는, 상기 표현형의 상태별로 미리 정의된 유효크기를 이용하여, 상기 표현형에 대한 유전자 마커 정보와 상기 사용자의 유전형 정보를 기반으로 상기 표현형 유전적 위험도를 획득하는,
    연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치.
  5. 제4항에서,
    상기 표현형 위험도 획득부는, 상기 표현형에 대한 유전자 마커 정보와 상기 사용자의 유전형 정보를 기반으로 유전적 위험도를 획득하고, 획득한 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 상기 표현형에 대한 유전적 위험도와 대비하여 상대적인 값으로 변환하며, 상대적인 값으로 변환된 유전적 위험도를 기반으로 상기 표현형의 상태를 획득하고, 획득한 상태에 대응되는 유효크기를 상기 표현형 유전적 위험도로 결정하는,
    연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치.
  6. 제1항에서,
    상기 표현형 위험도 획득부는, 상기 질병의 발생과 연관된 상기 표현형이 복수개인 경우, 복수개의 상기 표현형 각각에 대하여 유전적 위험도를 획득하고, 획득된 복수개의 유전적 위험도를 기반으로 상기 표현형 유전적 위험도를 획득하는,
    연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치.
  7. 질병의 발생과 연관된 유전자 마커 정보와 사용자의 유전형 정보를 기반으로 상기 질병에 대한 질병 유전적 위험도를 획득하는 단계;
    상기 질병의 발생과 연관된 표현형에 대한 유전자 마커 정보와 상기 사용자의 유전형 정보를 기반으로 상기 표현형에 대한 표현형 유전적 위험도를 획득하는 단계; 및
    획득한 상기 질병 유전적 위험도와 획득한 상기 표현형 유전적 위험도를 기반으로 상기 질병에 대한 통합 유전적 위험도를 획득하는 단계;
    를 포함하는 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 방법.
  8. 제7항에서,
    상기 통합 유전적 위험도 획득 단계는, 상기 질병의 발생에 영향을 미치는 유전적 요인의 비율을 이용하여, 상기 질병 유전적 위험도와 상기 표현형 유전적 위험도를 기반으로 상기 통합 유전적 위험도를 획득하는 것으로 이루어지는,
    연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 방법.
  9. 제7항에서,
    상기 질병 유전적 위험도 획득 단계는, 획득한 상기 질병 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 질병 유전적 위험도와 대비하여 상대적인 값으로 변환하는 것으로 이루어지고,
    상기 표현형 유전적 위험도 획득 단계는, 획득한 상기 표현형 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 표현형 유전적 위험도와 대비하여 상대적인 값으로 변환하는 것으로 이루어지며,
    상기 통합 유전적 위험도 획득 단계는, 상대적인 값으로 변환된 상기 질병 유전적 위험도와 상대적인 값으로 변환된 상기 표현현 유전적 위험도를 기반으로 상기 통합 유전적 위험도를 획득하고, 획득한 상기 통합 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 통합 유전적 위험도와 대비하여 상대적인 값으로 변환하는 것으로 이루어지는,
    연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 방법.
  10. 제7항에서,
    상기 표현형 유전적 위험도 획득 단계는, 상기 표현형의 상태별로 미리 정의된 유효크기를 이용하여, 상기 표현형에 대한 유전자 마커 정보와 상기 사용자의 유전형 정보를 기반으로 상기 표현형 유전적 위험도를 획득하는 것으로 이루어지는,
    연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 방법.
  11. 제10항에서,
    상기 표현형 유전적 위험도 획득 단계는, 상기 표현형에 대한 유전자 마커 정보와 상기 사용자의 유전형 정보를 기반으로 유전적 위험도를 획득하고, 획득한 유전적 위험도를 상기 사용자가 소속된 집단 내의 다른 사용자의 상기 표현형에 대한 유전적 위험도와 대비하여 상대적인 값으로 변환하며, 상대적인 값으로 변환된 유전적 위험도를 기반으로 상기 표현형의 상태를 획득하고, 획득한 상태에 대응되는 유효크기를 상기 표현형 유전적 위험도로 결정하는 것으로 이루어지는,
    연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 방법.
  12. 제7항에서,
    상기 표현형 유전적 위험도 획득 단계는, 상기 질병의 발생과 연관된 상기 표현형이 복수개인 경우, 복수개의 상기 표현형 각각에 대하여 유전적 위험도를 획득하고, 획득된 복수개의 유전적 위험도를 기반으로 상기 표현형 유전적 위험도를 획득하는 것으로 이루어지는,
    연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 방법.
  13. 제7항 내지 제12항 중 어느 한 항에 기재된 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 방법을 컴퓨터에서 실행시키기 위하여 컴퓨터로 읽을 수 있는 기록 매체에 저장된 컴퓨터 프로그램.
PCT/KR2019/010258 2019-08-08 2019-08-13 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법 WO2021025218A1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US17/633,601 US20220367060A1 (en) 2019-08-08 2019-08-13 Device and method for predicting risk for disease combined with genetic risk for associated phenotype
EP19940912.9A EP3968340A4 (en) 2019-08-08 2019-08-13 DEVICE AND METHOD FOR PREDICTING THE RISK OF A DISEASE COMBINED WITH THE GENETIC RISK FOR THE ASSOCIATED PHENOTYPE

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2019-0096589 2019-08-08
KR1020190096589A KR102087613B1 (ko) 2019-08-08 2019-08-08 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법

Publications (1)

Publication Number Publication Date
WO2021025218A1 true WO2021025218A1 (ko) 2021-02-11

Family

ID=69809836

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/010258 WO2021025218A1 (ko) 2019-08-08 2019-08-13 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법

Country Status (4)

Country Link
US (1) US20220367060A1 (ko)
EP (1) EP3968340A4 (ko)
KR (1) KR102087613B1 (ko)
WO (1) WO2021025218A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021199324A1 (ja) * 2020-03-31 2021-10-07 日本電信電話株式会社 臨床検査項目決定装置、健康行動支援装置、臨床検査項目決定方法、健康行動支援方法及びコンピュータプログラム
KR102389479B1 (ko) * 2021-11-02 2022-04-25 주식회사 바스젠바이오 시간 변동 공변량 기반의 prs 모델을 이용한 질환별 위험 유전자 변이 정보 생성 장치 및 그 방법
KR102382707B1 (ko) * 2021-11-02 2022-04-08 주식회사 바스젠바이오 다유전자 위험점수를 이용한 시간 의존 연관성 기반의 질환 발병 정보 생성 장치 및 그 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016048251A (ja) * 2010-07-05 2016-04-07 ソニー株式会社 生体情報処理方法および装置、並びに記録媒体
KR101693510B1 (ko) * 2015-12-28 2017-01-17 (주)신테카바이오 개인 전장 유전체의 유전변이정보를 이용한 유전형 분석 시스템 및 방법
KR101693504B1 (ko) * 2015-12-28 2017-01-17 (주)신테카바이오 개인 전장 유전체의 유전변이정보를 이용한 질병원인 발굴 시스템
KR20170134203A (ko) * 2016-05-27 2017-12-06 (주) 메디젠휴먼케어 Snp를 이용한 질병 관련 유전체 분석 시스템 및 장치
KR20190077997A (ko) 2017-12-26 2019-07-04 주식회사 클리노믹스 질병 및 표현형 위험도 예측 장치 및 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180320233A1 (en) * 2017-05-02 2018-11-08 Human Longevity, Inc. Genomics-based, technology-driven medicine platforms, systems, media, and methods

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016048251A (ja) * 2010-07-05 2016-04-07 ソニー株式会社 生体情報処理方法および装置、並びに記録媒体
KR101693510B1 (ko) * 2015-12-28 2017-01-17 (주)신테카바이오 개인 전장 유전체의 유전변이정보를 이용한 유전형 분석 시스템 및 방법
KR101693504B1 (ko) * 2015-12-28 2017-01-17 (주)신테카바이오 개인 전장 유전체의 유전변이정보를 이용한 질병원인 발굴 시스템
KR20170134203A (ko) * 2016-05-27 2017-12-06 (주) 메디젠휴먼케어 Snp를 이용한 질병 관련 유전체 분석 시스템 및 장치
KR20190077997A (ko) 2017-12-26 2019-07-04 주식회사 클리노믹스 질병 및 표현형 위험도 예측 장치 및 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3968340A4

Also Published As

Publication number Publication date
EP3968340A4 (en) 2023-02-01
EP3968340A1 (en) 2022-03-16
KR102087613B1 (ko) 2020-03-11
US20220367060A1 (en) 2022-11-17

Similar Documents

Publication Publication Date Title
WO2021025218A1 (ko) 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법
WO2021025219A1 (ko) 유전적 구성비를 이용한 질병 또는 표현형의 위험도 예측 장치 및 방법
Wallace et al. ATP7B variant penetrance explains differences between genetic and clinical prevalence estimates for Wilson disease
Glatt et al. Successful aging: from phenotype to genotype
WO2021040373A1 (ko) 복합적 스트레스 지수에 기반한 스트레스 관리 방법
WO2017116123A1 (ko) 개인 유전체의 유전변이정보를 이용한 질병원인 발굴 시스템
WO2020111378A1 (ko) 질환 진단 보조를 위한 데이터 분석 방법 및 시스템
WO2012044121A9 (ko) 아벨리노 각막이상증 진단용 시스템
WO2021149913A1 (ko) Ngs 분석에서의 질병 관련 유전자 선별 방법 및 장치
Huyghe et al. A genome-wide analysis of population structure in the Finnish Saami with implications for genetic association studies
WO2020022733A1 (ko) 전장유전체 시퀀싱 기반의 염색체 이상 검출 방법 및 그 용도
WO2018105995A2 (ko) 빅데이터를 활용한 건강정보 예측 장치 및 방법
WO2016117812A1 (ko) 암 바이오마커의 성능 평가 장치 및 방법
WO2017086675A1 (ko) 대사 이상 질환 진단 장치 및 그 방법
Tortelli et al. The structure and diversity of strain-level variation in vaginal bacteria
Napier et al. Characterisation of drug-resistant Mycobacterium tuberculosis mutations and transmission in Pakistan
Wang et al. Gut microbiome in men with chronic prostatitis/chronic pelvic pain syndrome: profiling and its predictive significance
WO2021132920A1 (ko) 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법
Uchoa Cavalcanti et al. Charcot‐Marie‐Tooth disease: Genetic profile of patients from a large Brazilian neuromuscular reference center
Rapti et al. CoverageMaster: comprehensive CNV detection and visualization from NGS short reads for genetic medicine applications
WO2016108348A1 (ko) 치주질환 예측 시스템 및 이를 이용한 치주질환 예측 방법
WO2023158253A1 (ko) 핵산서열 분석 기반 유전자 변이 해석 방법
Uddin et al. Genetic diversity and characterization of M. tuberculosis isolates causing extrapulmonary tuberculosis in Bangladesh
Thomas et al. Lysosomal storage disorders: Novel and frequent pathogenic variants in a large cohort of Indian patients of Pompe, Fabry, Gaucher and Hurler disease
Modi et al. Molecular cytogenetics of the California condor: evolutionary and conservation implications

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19940912

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019940912

Country of ref document: EP

Effective date: 20211209

NENP Non-entry into the national phase

Ref country code: DE