WO2022220624A1 - 혈액세포 돌연변이 정보를 이용한 죽상동맥경화성 심뇌혈관질환의 위험도 예측 방법 - Google Patents

혈액세포 돌연변이 정보를 이용한 죽상동맥경화성 심뇌혈관질환의 위험도 예측 방법 Download PDF

Info

Publication number
WO2022220624A1
WO2022220624A1 PCT/KR2022/005436 KR2022005436W WO2022220624A1 WO 2022220624 A1 WO2022220624 A1 WO 2022220624A1 KR 2022005436 W KR2022005436 W KR 2022005436W WO 2022220624 A1 WO2022220624 A1 WO 2022220624A1
Authority
WO
WIPO (PCT)
Prior art keywords
ldl
information
risk
cholesterol
blood cell
Prior art date
Application number
PCT/KR2022/005436
Other languages
English (en)
French (fr)
Inventor
최수연
송한
선충현
임호균
김수경
임지우
Original Assignee
(주)지놈오피니언
서울대학교병원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)지놈오피니언, 서울대학교병원 filed Critical (주)지놈오피니언
Publication of WO2022220624A1 publication Critical patent/WO2022220624A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Definitions

  • the present invention relates to a method for predicting the risk of atherosclerotic cardiovascular disease based on genetic mutation information of blood cells. More specifically, the present invention relates to a method of providing information for selecting a high-risk group of atherosclerotic cardiovascular disease using LDL-cholesterol index together with genetic mutation information of blood cells.
  • Cardio-cerebrovascular disease is a disease with a large burden of disease and one of the major causes of death in Korea.
  • major chronic diseases excluding cancer
  • the highest mortality rate in 2017 was heart disease, accounting for 60.2 per 100,000 population, followed by cerebrovascular disease with 44.4.
  • the incidence rate is continuously increasing due to the increase in the prevalence of hypertension and diabetes, which are the preceding diseases of cardiovascular disease, and the aging population, and accordingly, the socioeconomic burden is increasing.
  • cardiovascular disease has a characteristic of chronically progressing due to metabolic diseases such as hypertension, diabetes, and dyslipidemia, it is important to perform preventive treatment at an early stage. For this, it is necessary to be able to effectively select the high-risk group for the disease.
  • the high-risk group is selected only with simple clinical information, so the performance limit is clear.
  • the present inventors have studied to secure a method to effectively select a high-risk group of atherosclerotic cardiovascular disease at an early stage and establish an appropriate preventive treatment strategy.
  • the present invention was completed by revealing the correlation between the mutation and the LDL-cholesterol index and providing a method for providing information on the risk of atherosclerotic cardiovascular disease using the same.
  • one aspect of the present invention relates to information on LDL-cholesterol indicators and the presence of genetic mutations in blood cells using a biological sample isolated from a subject, medical information of the subject, or both. Obtaining information, and providing information on the risk of atherosclerotic cardiovascular disease of the subject based on information on the LDL-cholesterol indicator and information on the presence of blood cell genetic mutations. Information comprising it's about how
  • Another aspect of the present invention is an information acquisition unit for obtaining information on LDL-cholesterol indicators and information on the presence or absence of genetic mutations in blood cells using a biological sample isolated from a subject, medical information of the subject, or both.
  • an information providing unit that provides information on the risk of atherosclerotic cardiovascular disease of the subject based on information on the LDL-cholesterol indicator and information on the presence of blood cell genetic mutations.
  • Another aspect of the present invention relates to a computer-readable recording medium storing a computer program for executing the method.
  • the method for providing information on the risk of atherosclerotic cardiovascular disease combines the presence of a blood cell mutation obtained from a biological sample isolated from a subject and/or medical information of the subject and the risk for LDL-cholesterol indicators, From this, it is possible to effectively select the high-risk group of atherosclerotic cardiovascular disease at an early stage. Therefore, this method can maximize the preventive effect of atherosclerotic cardiovascular disease.
  • FIG. 1 is a schematic diagram of a process of measuring the risk of atherosclerotic cardiovascular disease by integrating blood cell genetic mutation information, physical / blood test, and congenital metabolic disease risk information and providing a preventive treatment strategy accordingly.
  • Example 2 shows the results of 6 years of follow-up observation of the incidence of atherosclerotic cardiovascular disease according to the presence or absence of blood cell gene mutations as described in Example 2.
  • Example 3 shows the incidence of atherosclerotic cardiovascular disease according to LDL-cholesterol level (or whether receiving high cholesterol drug treatment) and blood cell gene mutation as described in Example 2.
  • Example 4 shows the incidence of atherosclerotic cardiovascular disease according to the innate LDL-cholesterol risk and blood cell gene mutation as described in Example 4.
  • One aspect of the present invention provides information on LDL-cholesterol indicators and information on the presence or absence of genetic mutations in blood cells using a biological sample isolated from a subject, medical information of the subject, or both, and It provides an information providing method comprising the step of providing information on the risk of atherosclerotic cardiovascular disease of a subject based on information on the LDL-cholesterol indicator and information on the presence of blood cell genetic mutations.
  • biological sample isolated from a subject may mean, but is not limited to, tissue, cells, whole blood, serum, plasma, saliva, sputum, mucus, cerebrospinal fluid, or urine.
  • the subject may include a vertebrate, a mammal, or a human.
  • the human may be a Korean.
  • the term "medical information” refers to information about a subject's health status, such as information about treatment or prevention of a subject's disease, diagnosis or test information for checking the health status, medication or prescription information, etc. do.
  • the medical information may be information on a prescription or administration of a therapeutic agent due to a high level of LDL-cholesterol, for example, a hyperlipidemia therapeutic agent, genetic analysis information of a subject, analysis information of a biological sample of a subject, and the like.
  • LDL-cholesterol indicator refers to an item indicative of a subject's LDL-cholesterol-related health status or a combination of these items.
  • the information on the LDL-cholesterol indicator includes at least one selected from the group consisting of (i) blood LDL-cholesterol level, (ii) whether a hyperlipidemia treatment is prescribed or taken, and (iii) an innate risk for LDL-cholesterol indicator.
  • the innate risk or risk score for the LDL-cholesterol indicator may be calculated according to a preset criterion based on genetic information of a clinical cohort.
  • blood cell gene mutation refers to a mutation in a specific blood cell gene, which may result in poor or absent function of the gene due to such mutation.
  • the mutation may be in the form of missense mutation, frameshift mutation, nonsense mutation or splice mutation, nucleotide substitution, insertion or deletion, and the like.
  • missense mutation refers to a gene mutation in which a single base substitution occurs at a certain site on the DNA chain, and the genetic code of mRNA is changed and designated as an amino acid different from that of the original, thereby affecting a protein.
  • the "frameshift mutation” refers to a gene mutation caused by insertion or deletion of bases in a number not divisible by 3.
  • nonsense mutation refers to a gene mutation in which a codon encoding an original amino acid is changed to a stop codon not encoding an amino acid by one base substitution, so that protein synthesis is stopped at the codon.
  • splice mutation refers to a mutation that occurs through the use of alternative splicing sites within transcribed RNA molecules or between individually transcribed RNA molecules.
  • the blood cell gene mutations are DNMT3A, TET2, ASXL1, RPS15, EP300, TNFAIP3, KMT2D, PPM1D, PHIP, NF1, PRPF40B, SETD2, ASXL2, BCOR, CBL, BRCC3, KDM6A, ATM, STAG2, PDS5B, SMC3, TP53, SMC3 It may include a mutation in one or more genes selected from the group consisting of BCORL1, PTEN, PDSS2, ZRSR2, GNAS, PIK3R1, CARD11, CUX1, CASP8, SUZ12, CHEK2, NOTCH2, JAK1, and JARID2.
  • the genetic mutation may be one or more selected from the group consisting of mutations shown in Table 1 below, but is not limited thereto.
  • the one or more genetic mutations are the aforementioned genes DNMT3A, TET2, ASXL1, RPS15, EP300, TNFAIP3, KMT2D, PPM1D, PHIP, NF1, PRPF40B, SETD2, ASXL2, BCOR, CBL, BRCC3, KDM6A, ATM , STAG2, PDS5B, SMC3, TP53, BCORL1, PTEN, PDSS2, ZRSR2, GNAS, PIK3R1, CARD11, CUX1, CASP8, SUZ12, CHEK2, NOTCH2, JAK1, and mutation of any one gene selected from the group consisting of JARID2
  • the one or more blood cell genetic mutations may further include mutations in one or more genes selected from the group consisting of genes other than the selected one gene.
  • the mutation of the one or more genes may include mutation of the DNMT3A gene.
  • the mutation of the one or more genes is TET2, ASXL1, RPS15, EP300, TNFAIP3, KMT2D, PPM1D, PHIP, NF1, PRPF40B, SETD2, ASXL2, BCOR, CBL, BRCC3, KDM6A, ATM, STAG2, PDS5B, SMC3, It may further include a mutation in one or more genes selected from the group consisting of TP53, BCORL1, PTEN, PDSS2, ZRSR2, GNAS, PIK3R1, CARD11, CUX1, CASP8, SUZ12, CHEK2, NOTCH2, JAK1, and JARID2.
  • Information on the mutation of the blood cell gene is a gene analysis method known in the art, for example, PCR (polymerase chain reaction), Sanger sequencing, microarray, or next generation sequencing. It may be obtained by an inspection method including, but not limited to.
  • the information providing method further comprises the step of determining that the risk for LDL-cholesterol indicator is high and the subject has a high risk of atherosclerotic cardiovascular disease when there is a blood cell genetic mutation.
  • the risk for the LDL-cholesterol indicator is high it can be decided that
  • the innate risk with respect to the LDL-cholesterol indicator may be determined by a method comprising calculating an innate risk score for the indicator by referring to a preset risk score corresponding to genetic information obtained from a biological sample isolated from the subject. have.
  • the genetic information is a gene analysis method known in the art, for example, PCR (polymerase chain reaction), Sanger sequencing (sanger sequencing), microarray (microarray) or next generation sequencing (Next Generation Sequencing) in a test method including It can be obtained by, but is not limited to these methods.
  • the innate risk score may be calculated using, for example, a polygenic risk score calculation method.
  • the preset risk score may be determined based on the genetic information of the genomic population to which the subject belongs and the measurement value of the LDL-cholesterol index.
  • the genetic information may be information about a single nucleotide polymorphism (SNP) gene that affects the LDL-cholesterol index of the individual.
  • SNP single nucleotide polymorphism
  • information on the single nucleotide polymorphism gene may refer to Table 2 below.
  • the preset risk score may be determined by Equation 1 below for a single nucleotide polymorphism (SNP) gene affecting an LDL-cholesterol index.
  • Y is the average value of the LDL-cholesterol index of the target genome population
  • ⁇ SNP is a value indicating the association between the corresponding SNP and the average Y value
  • SNP (0/1/2) is a value according to the genotype of an individual belonging to the target genome group. If there is no risk trait, it is 0, if it is heterozygous, it is 1, if it is homozygote, it is 2,
  • ⁇ 0 is the intercept value of Y
  • ⁇ x1 is a value indicating the correlation between the sex and the average Y value of individuals belonging to the target genome group
  • X1 is a value according to the gender of an individual belonging to the target genome group, and is a value of 1 for male and 0 for female,
  • ⁇ x2 is a value indicating the correlation between the age of an individual belonging to the target genome group and the average Y value
  • X2 represents the age of an individual belonging to the target genome population.
  • the target genomic population may be a clinical cohort by country, race, and/or region, or a combination of two or more clinical cohorts.
  • the correlation can be calculated by adding various health status and lifestyle information that affects metabolic disease indicators such as gender, age, BMI, smoking, hypertension, diabetes, drug use, eating habits, and exercise habits.
  • the influence of the genetic trait corrected for these influences can be calculated using a linear regression analysis method.
  • the preset genetic score may be scored using Equation 1 above. Additionally, the genetic trait influence score for each indicator verified by an external institution may be reflected in the preset genetic score.
  • the ⁇ SNP may be used by estimating a representative value using meta-analysis.
  • the weight due to the size difference of each cohort may be calculated using an inverse variance-weighted model. Specifically, the weight due to the size difference of each cohort may be calculated using Equation 2 below.
  • ⁇ city the risk level of the genotype calculated in the city-based cohort
  • w city the reciprocal of the square of the standard error of the risk of the genotype calculated in the city-based cohort (1/SE i 2 )
  • the value calculated using the meta-analysis may select important genetic traits using, for example, a clumping technique.
  • the clumping technique is a method of selecting one genotype with the highest importance and repeating the method of removing the trait most related to the trait.
  • the effect of 8 million genetic traits on the corresponding index was scored using Equation 1 above for urban-based cohorts and community-based cohorts of Koreans. Additionally, it is possible to include the genetic trait influence score for each indicator verified in foreign papers other than Koreans, even if the score is low. Thereafter, a preset risk score for the LDL-cholesterol index was determined through the meta-analysis and clumping technique, and it is shown in Table 2 below.
  • SNP number phenotype heredity risk trait Risk score (beta) One LDL rs11667610 T -6.856 2 LDL rs34215622 CG -3.4855 3 LDL rs151193009 T -12.9537 4 LDL rs438811 T -4.1322 5 LDL rs387465 A 4.7457 6 LDL rs12740374 T -6.6588 7 LDL rs13306206 A 13.4372 8 LDL rs3846662 A -2.9014 9 LDL rs550057 T 2.8133 10 LDL rs2854725 T 3.5018 11 LDL rs11331996 G 2.4408 12 LDL rs17035665 T -4.4833 13 LDL rs1135062 A 2.6637 14 LDL rs77303550 T -2.5472 15 LDL rs147821144 A -7.9024 16 LDL rs2278426 T -1
  • the innate risk score is, for example, a method of summing the risk scores for 89 SNP genes affecting the LDL-cholesterol index and calculating an average value (multiple gene risk score calculation method) can be determined by
  • the innate risk score may be determined by Equation 3:
  • Y is the final LDL-cholesterol risk score
  • SNP1 is the presence or absence of SNP No. 1 (single nucleotide polymorphism). If there is no risk trait, it is 0, if it is heterozygous, it is 1, if it is homozygote, it is 2, and BETA1 is the risk score (beta) of SNP No. is the value,
  • the innate risk score calculated with reference to the preset risk score belongs to a specific upper section, for example, the top 20%, LDL-cholesterol index for It may further include the step of determining that the risk is high.
  • the “top 20%” is a reference value for the LDL-cholesterol index calculated from the preset risk score.
  • Another aspect of the present invention is an information acquisition unit for obtaining information on LDL-cholesterol indicators and information on the presence or absence of genetic mutations in blood cells using a biological sample isolated from a subject, medical information of the subject, or both. And, based on the information on the LDL-cholesterol indicator and information on the existence of blood cell gene mutations, it provides an information providing system comprising an information providing unit that provides information on the risk of atherosclerotic cardiovascular disease of the subject .
  • the information acquisition unit may receive information on the blood LDL-cholesterol level of the subject, information on the subject's medication or prescription, or sequencing information of the genome or blood cell gene.
  • the information acquisition unit for example, when the blood LDL-cholesterol level is 160 mg/dL or higher or the subject has been prescribed or is taking a hyperlipidemia treatment agent, the LDL-cholesterol index may determine that the risk is high.
  • the information acquisition unit is based on the genetic information (eg, SNP information) obtained from the biological sample isolated from the subject, referring to the preset risk score corresponding to the genetic information to calculate the innate risk score for the LDL-cholesterol index.
  • the genetic information eg, SNP information
  • the information acquisition unit may determine whether there is a blood cell gene mutation based on genetic information (eg, blood cell gene sequencing information) obtained from a biological sample isolated from the subject.
  • genetic information eg, blood cell gene sequencing information
  • the information providing unit may determine that the risk for the LDL-cholesterol indicator is high.
  • the information acquisition unit may include a measurement unit for measuring the LDL-cholesterol level, and may also include a gene analysis unit for obtaining sequencing information about the genome or genetic mutation.
  • the gene analysis unit may include a gene analysis apparatus known in the art, for example, PCR, a Sanger sequencing apparatus, a microarray, or a next generation sequencing apparatus.
  • the information providing unit may determine that the subject has a high risk of atherosclerotic cardiovascular disease.
  • the information providing unit may prevent, alleviate, or treat atherosclerotic cardiovascular disease, or provide information useful therefor.
  • Another aspect of the present invention provides a computer-readable recording medium recording a computer program for executing the above-described information providing method.
  • the computer-readable recording medium may include program instructions, data files, data structures, etc. alone or in combination.
  • the program instructions recorded on the computer-readable recording medium may be specially designed and configured for the present invention, or may be known and used by those skilled in the art of computer software.
  • Examples of the computer-readable recording medium include hard disks, magnetic media such as floppy disks and magnetic tapes, optical recording media such as CD-ROMs and DVDs, and magneto-optical media such as floppy disks. medium), and hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like.
  • Examples of program instructions include not only machine language codes such as those generated by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like.
  • a hardware device may be converted into one or more software modules to perform processing in accordance with the present invention, and vice versa.
  • DNA of blood cells is extracted from the blood sample, and DNMT3A, TET2, ASXL1, RPS15, EP300, TNFAIP3, KMT2D, PPM1D, PHIP, NF1, PRPF40B, SETD2, ASXL2, BCOR, CBL, BRCC3 , KDM6A, ATM, STAG2, PDS5B, SMC3, TP53, BCORL1, PTEN, PDSS2, ZRSR2, GNAS, PIK3R1, CARD11, CUX1, CASP8, SUZ12, CHEK2, NOTCH2, JAK1 and JARID2 gene exon region mutations detected.
  • mutations When mutations are detected, missense mutations, frameshift mutations, nonsense mutations, splice mutations, or insertion/deletion mutations are selected among these mutations, and the mutant sequence fraction is Only mutations greater than 1.5% were reselected. See Table 1 for the selected mutations.
  • Example 2 A study on the correlation between high LDL-cholesterol levels in blood and blood cell mutations among indicators related to the onset of atherosclerotic cardiovascular disease
  • Example 2 Based on the follow-up results performed in Example 1, the existing cardiovascular disease risk factors including the blood cell mutation (eg, gender, age, hypertension, hyperlipidemia, diabetes and smoking) and the incidence of cardiovascular disease were confirmed. .
  • the blood cell mutation eg, gender, age, hypertension, hyperlipidemia, diabetes and smoking
  • the occurrence of atherosclerotic cardiovascular disease was collected by following up 4316 patients under 80 years of age for 6 years. Using the Cox Proportional hazard model, the risk of existing cardiovascular disease risk factors (gender, age, high blood pressure, hyperlipidemia, diabetes and smoking) and the presence or absence of blood cell mutations on the development of cardiovascular disease together analyzed. The results are shown in Table 3 below.
  • cardiovascular disease risk factors shown in Table 3 the risk of atherosclerotic cardiovascular disease according to the presence or absence of blood cell mutations was additionally confirmed.
  • a model predicting disease development using age, high LDL-cholesterol level, and the presence or absence of blood cell mutations were compared.
  • Example 3 Verification of a synergistic increase in the risk of developing atherosclerotic cardiovascular disease due to high LDL-cholesterol level in blood and blood cell mutation
  • Example 2 The interaction between the high LDL-cholesterol level confirmed in Example 2 and the blood cell mutation was further verified using the clinical results of 2096 patients who underwent coronary CT angiography. Specifically, in the group with high LDL-cholesterol levels, coronary CT angiography was performed to observe the number of plaques with stenosis, and the number of plaques was analyzed according to the presence or absence of blood cell mutations. In the group with low LDL-cholesterol, no significant correlation was observed between blood cell mutation and the number of stenotic plaques. However, in the group with high LDL-cholesterol, there was a correlation between blood cell mutation and the number of stenotic plaques. Table 6 shows the results for high LDL-cholesterol levels with significant correlations.
  • Example 4 A study on the correlation between innate LDL-cholesterol risk and blood cell mutation among indicators related to the development of atherosclerotic cardiovascular disease
  • Example 1 Based on the follow-up results conducted in Example 1, if there is a blood cell mutation, the risk of developing atherosclerotic cardiovascular disease is synergistically increased even if the risk of congenital LDL-cholesterol, which is one of the risks of congenital metabolic disease, is high. wanted to check.
  • the relationship between LDL cholesterol and blood cell mutations was analyzed using the innate LDL-cholesterol risk obtained through DNA sequencing in the blood, not the LDL cholesterol level obtained through a blood test.
  • the congenital LDL-cholesterol risk of 4316 people under 80 years of age was determined using the polygenic risk scoring method.
  • the combination of the congenital LDL-cholesterol risk which is information obtained simultaneously through blood DNA analysis without blood test or physical measurement information, and the presence or absence of blood cell mutations, selects a high-risk group with a three-fold higher risk of atherosclerotic cardiovascular disease confirmed that it can be done.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 죽상동맥경화성 심뇌혈관질환의 위험도에 대한 정보 제공 방법에 관한 것이다. 본 발명에 따른 방법은 대상으로부터 분리된 생물학적 시료로부터 얻은 혈액세포 돌연변이의 존재 여부 및 LDL-콜레스테롤 지표에 대한 위험도의 조합으로 죽상동맥경화성 심뇌혈관질환의 고위험군을 조기에 유효하게 선별할 수 있게 한다. 따라서, 이러한 방법은 죽상동맥경화성 심뇌혈관질환의 예방효과를 극대화시킬 수 있다.

Description

혈액세포 돌연변이 정보를 이용한 죽상동맥경화성 심뇌혈관질환의 위험도 예측 방법
본 발명은 혈액세포의 유전자 변이 정보에 기반하여 죽상동맥경화성 심뇌혈관질환의 위험도를 예측하는 방법에 관한 것이다. 보다 구체적으로는, 본 발명은 혈액세포의 유전자 변이 정보와 함께 LDL-콜레스테롤 지표를 이용하여 죽상동맥경화성 심뇌혈관질환의 고위험군을 선별하기 위한 정보를 제공하는 방법에 관한 것이다.
심뇌혈관질환(cardio-cerebrovascular disease)은 우리나라에서 질병부담이 크고 주요 사망 원인 중 하나인 질환이다. 2017년 주요 만성질환 중(암 제외) 사망률이 가장 높은 것은 심장질환으로 인구 10만명당 60.2명으로 나타났으며, 이어서 뇌혈관질환 44.4명으로 나타났다. 또한, 심뇌혈관질환의 선행질환인 고혈압, 당뇨병 등의 유병률 증가 및 고령화로 인해 발병률이 지속적으로 증가하고 있고, 이에 따라 사회경제적 부담이 증가하고 있다.
또한, 심뇌혈관질환은 고혈압, 당뇨병, 이상지질혈증 등의 대사질환이 원인이 되어 만성적으로 진행하는 특성을 가지고 있어 초기에 예방적인 치료를 수행하는 것이 중요하다. 이를 위해서는 해당 질병의 고위험군을 효과적으로 선별할 수 있어야 하는데, 현재는 단순한 임상정보만으로 고위험군을 선별하고 있어 그 성능의 한계가 명확하며, 증상이 나타난 후에 병원을 방문하는 경우가 많아 예방적인 치료에 어려움을 겪고 있다.
최근 연구에 의하면, 조혈모세포의 혈액암 관련 유전자에 돌연변이가 발생하면 기능이상을 가진 면역세포가 증식하며 이는 과도한 염증반응을 일으켜 심뇌혈관질환의 발병 위험을 크게 높이는 것으로 보고되었다. 그러나, 상기 돌연변이는 대상에 따라 그 영향력이 달라지고 기존 심뇌혈관질환 위험요소와의 관련성에 대해 밝혀진 바가 없어 임상적으로 사용하기에 한계가 있다.
이에 본 발명자들은 죽상동맥경화성 심뇌혈관질환의 고위험군을 조기에 효과적으로 선별하여 적절한 예방적 치료전략을 수립할 수 있게 하는 방법을 확보하기 위해 연구한 결과, 죽상동맥경화성 심뇌혈관질환 발병과 관련된 혈액세포 유전자 변이와 LDL-콜레스테롤 지표의 상호관련성을 밝혀내어 이를 이용한 죽상동맥경화성 심뇌혈관질환의 위험도에 대한 정보 제공 방법을 제공함으로써 본 발명을 완성하였다.
상기 목적을 달성하기 위하여, 본 발명의 일 측면은, 대상으로부터 분리된 생물학적 시료, 대상의 의료 정보, 또는 이들 둘 모두를 이용하여 LDL-콜레스테롤 지표에 관한 정보 및 혈액세포 유전자 변이의 존재 여부에 관한 정보를 획득하는 단계, 및 상기 LDL-콜레스테롤 지표에 관한 정보 및 혈액세포 유전자 변이의 존재 여부에 관한 정보에 기초하여 대상의 죽상동맥경화성 심뇌혈관질환 위험도에 관한 정보를 제공하는 단계를 포함하는 정보 제공 방법에 관한 것이다.
본 발명의 다른 측면은, 대상으로부터 분리된 생물학적 시료, 대상의 의료 정보, 또는 이들 둘 모두를 이용하여 LDL-콜레스테롤 지표에 관한 정보 및 혈액세포 유전자 변이의 존재 여부에 관한 정보를 획득하는 정보획득부, 및 상기 LDL-콜레스테롤 지표에 관한 정보 및 혈액세포 유전자 변이의 존재 여부에 관한 정보에 기초하여 대상의 죽상동맥경화성 심뇌혈관질환 위험도에 관한 정보를 제공하는 정보제공부를 포함하는 시스템에 관한 것이다.
본 발명의 또 다른 측면은, 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체에 관한 것이다.
이 외에도, 본 발명을 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공된다.
본 발명에 따른 죽상동맥경화성 심뇌혈관질환의 위험도에 대한 정보 제공 방법은 대상으로부터 분리된 생물학적 시료 및/또는 대상의 의료 정보로부터 얻은 혈액세포 돌연변이의 존재 여부 및 LDL-콜레스테롤 지표에 대한 위험도를 조합하여 이로부터 죽상동맥경화성 심뇌혈관질환의 고위험군을 조기에 유효하게 선별할 수 있게 한다. 따라서, 이러한 방법은 죽상동맥경화성 심뇌혈관질환의 예방 효과를 극대화시킬 수 있다.
도 1은 혈액세포 유전자 변이 정보와, 신체/혈액 검사 및 선천적 대사질환 위험도 정보를 통합하여 죽상동맥경화성 심뇌혈관질환의 위험도를 측정하고 그에 따른 예방적 치료전략을 제공하는 과정의 개략도이다.
도 2는 실시예 2에 설명된 바와 같은 혈액세포 유전자 변이 여부에 따른 죽상동맥경화성 심뇌혈관질환 발병률을 6년 동안 추적 관찰한 결과를 나타낸다.
도 3은 실시예 2에 설명된 바와 같은 LDL-콜레스테롤 수준(또는 고콜레스테롤 약물치료를 받고 있는지의 여부)과 혈액세포 유전자 변이 여부에 따른 죽상동맥경화성 심뇌혈관질환의 발병률을 나타낸다.
도 4는 실시예 4에 설명된 바와 같은 선천적 LDL-콜레스테롤 위험도와 혈액세포 유전자 변이 여부에 따른 죽상동맥경화성 심뇌혈관질환의 발병률을 나타낸다.
이하 본 발명을 상세히 설명한다.
본 발명의 일 측면은, 대상으로부터 분리된 생물학적 시료, 대상의 의료 정보, 또는 이들 둘 모두를 이용하여 LDL-콜레스테롤 지표에 관한 정보 및 혈액세포 유전자 변이의 존재 여부에 관한 정보를 획득하는 단계, 및 상기 LDL-콜레스테롤 지표에 관한 정보 및 혈액세포 유전자 변이의 존재 여부에 관한 정보에 기초하여 대상의 죽상동맥경화성 심뇌혈관질환 위험도에 관한 정보를 제공하는 단계를 포함하는 정보 제공 방법을 제공한다.
본 명세서에 사용되는 바와 같이, 용어 "대상으로부터 분리된 생물학적 시료"는 조직, 세포, 전혈, 혈청, 혈장, 타액, 객담, 점액, 뇌척수액 또는 뇨를 의미할 수 있으나, 이에 제한되지 않는다. 한편, 상기 대상은 척추동물, 포유동물 또는 인간을 포함할 수 있다. 예컨대, 상기 인간은 한국인일 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "의료 정보"는 대상의 질병의 치료 또는 예방에 관한 정보, 건강 상태를 체크하기 위한 진단 또는 검사 정보, 복약 또는 처방 정보 등 대상의 건강 상태에 관한 정보를 의미한다. 구체적으로, 의료 정보는 LDL-콜레스테롤의 높은 수치로 인한 치료제, 예컨대 고지혈증 치료제의 처방 또는 복용 정보, 대상의 유전자 분석 정보, 대상의 생물학적 시료의 분석 정보 등일 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "LDL-콜레스테롤 지표"는 대상의 LDL-콜레스테롤 관련 건강 상태를 나타내는 항목 또는 이들 항목의 조합을 의미한다. 상기 LDL-콜레스테롤 지표에 관한 정보는 (i) 혈중 LDL-콜레스테롤 수준, (ii) 고지혈증 치료제의 처방 또는 복용 여부, 및 (iii) LDL-콜레스테롤 지표에 관한 선천적 위험도로 이루어진 군에서 선택되는 하나 이상을 포함할 수 있다. 구체적으로, 상기 대상의 혈중 LDL-콜레스테롤 수준을 측정하거나, 상기 대상이 LDL-콜레스테롤의 높은 수치로 인한 치료제, 예컨대 고지혈증 치료제를 처방받았거나 복용 중인지를 확인하거나 상기 대상으로부터 분리된 생물학적 시료로부터 얻은 유전 정보에 대응되는 기 설정된 위험 점수를 참조하여 상기 지표에 대한 선천적 위험 점수를 산출함으로써 얻어지는 지표, 또는 이들의 조합을 의미할 수 있다. 예컨대, 상기 대상이 고지혈증 치료제를 복용 중인지를 확인하는 것은 간단한 문진 검사를 통해 이루어질 수 있지만, 이에 제한되지 않는다. 상기 LDL-콜레스테롤 지표에 대한 선천적 위험도 또는 위험 점수는 임상 코호트의 유전 정보 등에 기초하여 미리 설정된 기준에 따라 산출될 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "혈액세포 유전자 변이"는 특정한 혈액세포 유전자의 변이로서, 이러한 변이로 인해 상기 유전자의 기능이 불량해지거나 결여될 수 있는 변이를 의미한다. 상기 변이는 미스센스(missense) 변이, 프레임시프트(frameshift) 변이, 넌센스(nonsense) 변이 또는 스플라이스(splice) 변이, 뉴클레오티드의 치환, 삽입 또는 결실 등의 형태로 이루어질 수 있다.
상기 "미스센스 변이"는 DNA 사슬 위의 어떤 부위에 하나의 염기 치환이 일어나서 mRNA의 유전암호가 변해 본래의 것과는 다른 아미노산으로 지정되어 단백질에 영향을 주게 되는 유전자 돌연변이를 지칭한다.
상기 "프레임시프트 변이"는 염기가 3으로 나누어지지 않는 개수로 삽입되거나 결실되어 일어나는 유전자 돌연변이를 지칭한다.
상기 "넌센스 변이"는 하나의 염기 치환으로 본래의 어느 한 아미노산을 암호화하는 코돈이 아미노산을 암호화하지 않는 종결코돈으로 변화되어 단백질의 합성이 그 코돈이 있는 곳에서 중단되는 유전자 돌연변이를 지칭한다.
상기 "스플라이스 변이"는 전사된 RNA 분자 내 또는 개별적으로 전사된 RNA 분자 사이에 대안적인 스플라이싱 부위의 사용을 통해 발생하는 돌연변이를 지칭한다.
상기 혈액세포 유전자 변이는 DNMT3A, TET2, ASXL1, RPS15, EP300, TNFAIP3, KMT2D, PPM1D, PHIP, NF1, PRPF40B, SETD2, ASXL2, BCOR, CBL, BRCC3, KDM6A, ATM, STAG2, PDS5B, SMC3, TP53, BCORL1, PTEN, PDSS2, ZRSR2, GNAS, PIK3R1, CARD11, CUX1, CASP8, SUZ12, CHEK2, NOTCH2, JAK1, 및 JARID2로 이루어진 군으로부터 선택된 하나 이상의 유전자의 변이를 포함할 수 있다.
상기 유전자 변이는 하기 표 1에 기재된 변이들로 이루어진 군으로부터 선택되는 하나 이상일 수 있으나, 이에 제한되는 것은 아니다.
Gene AA
ASXL1 p.1001Ala_1003Aspfs
ASXL1 p.1275Ser_1276Profs
ASXL1 p.1295Asn_1296Valfs
ASXL1 p.1373Val_1374Glyfs
ASXL1 p.435Ala_436Lysfs
ASXL1 p.589Thr_590Tyrfs
ASXL1 p.590Tyr_591GlninsTer???
ASXL1 p.629His_637Thrfs
ASXL1 p.632His_633Argfs
ASXL1 p.639Ala_643Glyfs
ASXL1 p.641Gly_643Glyfs
ASXL1 p.642Gly_643Glyfs
ASXL1 p.793Thr_794Serfs
ASXL1 p.806Val_807Profs
ASXL1 p.822Leu_823Glufs
ASXL1 p.843Thr_844Profs
ASXL1 p.934Pro_935Thrfs
ASXL1 p.Arg404*
ASXL1 p.Arg417*
ASXL1 p.Arg693*
ASXL1 p.Cys594*
ASXL1 p.Gln1234*
ASXL1 p.Gln546*
ASXL1 p.Gln592*
ASXL1 p.Gln757*
ASXL1 p.Glu379*
ASXL1 p.Leu386*
ASXL1 p.Ser689*
ASXL1 p.Trp1411*
ASXL1 p.Tyr591*
ASXL2 p.1193Thr_1194Valfs
ASXL2 p.512Asn_513Lysfs
ASXL2 p.657Ala_658Aspfs
ASXL2 p.Gln635*
ASXL2 p.Lys432*
ATM p.1902Lys_1903Lysfs
ATM p.Trp2344*
BCOR p.378Val_380Serfs
BCOR p.752Ala_753Arginsfs
BCOR p.Tyr869*
BCORL1 p.1118Met_1119Lysfs
BCORL1 p.223Pro_226Valfs
BRCC3 p.Gln4*
BRCC3 Splice_site_variant
CARD11 p.888Leu_889Serfs
CASP8 Splice_site_variant
CBL p.499Leu_502Leufs
CBL p.66Val_69Cysfs
CBL p.Arg718*
CHEK2 p.563Arg_564Profs
CUX1 p.1384Glu_1434Alafs
DNMT3A p.236Gln_237Lysfs
DNMT3A p.243Pro_244Profs
DNMT3A p.267Asp_268Alafs
DNMT3A p.270Asp_271Lysfs
DNMT3A p.288Gly_289Phefs
DNMT3A p.306Pro_307Glyfs
DNMT3A p.325Arg_326Trpfs
DNMT3A p.337Val_338Valfs
DNMT3A p.354His_355Glnfs
DNMT3A p.366Lys_367Alafs
DNMT3A p.380Gly_381Lysfs
DNMT3A p.382Leu_383Phefs
DNMT3A p.394Thr_395Alafs
DNMT3A p.412Gly_413Phefs
DNMT3A p.435Tyr_436Thrfs
DNMT3A p.440Val_441Glufs
DNMT3A p.443Glu_448Alafs
DNMT3A p.455Lys_456Profs
DNMT3A p.458Lys_459Serfs
DNMT3A p.466Val_467Lysfs
DNMT3A p.477Arg_478Leufs
DNMT3A p.494Ile_495Serfs
DNMT3A p.504Glu_505Hisfs
DNMT3A p.507Leu_508Phefs
DNMT3A p.520Phe_521Leufs
DNMT3A p.525Tyr_526Glnfs
DNMT3A p.545Val_546Leufs
DNMT3A p.561Cys_562Valfs
DNMT3A p.569Gly_574Alafs
DNMT3A p.572Gln_573Alafs
DNMT3A p.572Gln_576Lysfs
DNMT3A p.573Ala_574Alafs
DNMT3A p.585Cys_586Glyfs
DNMT3A p.609Ala_610Asnfs
DNMT3A p.610Asn_611Asnfs
DNMT3A p.626Pro_627Alafs
DNMT3A p.635Val_636Leufs
DNMT3A p.638Leu_640Aspfs
DNMT3A p.639Phe_640Aspfs
DNMT3A p.648Val_649Leufs
DNMT3A p.650Lys_652Leufs
DNMT3A p.668Ser_669Ilefs
DNMT3A p.680Ile_681Metfs
DNMT3A p.680Ile_684Glyfs
DNMT3A p.68Pro_69Alafs
DNMT3A p.695Gln_696Glufs
DNMT3A p.704Ile_705Glyfs
DNMT3A p.731Phe_732Glufs
DNMT3A p.738His_741Argfs
DNMT3A p.750Phe_751Phefs
DNMT3A p.756Asn_757Valfs
DNMT3A p.765Lys_766Argfs
DNMT3A p.766Arg_767Aspfs
DNMT3A p.795Gly_796Asnfs
DNMT3A p.816Glu_817Cysfs
DNMT3A p.818Leu_819Glufs
DNMT3A p.826Phe_827Serfs
DNMT3A p.856Asp_858Leufs
DNMT3A p.871Val_873Tyrfs
DNMT3A p.871Val_880Serfs
DNMT3A p.898Arg_899Hisfs
DNMT3A p.903Pro_905Lysfs
DNMT3A p.Arg320*
DNMT3A p.Arg598*
DNMT3A p.Arg771*
DNMT3A p.Cys514*
DNMT3A p.Cys520*
DNMT3A p.Cys562*
DNMT3A p.Gln248*
DNMT3A p.Gln362*
DNMT3A p.Gln402*
DNMT3A p.Gln527*
DNMT3A p.Gln573*
DNMT3A p.Gln692*
DNMT3A p.Gln842*
DNMT3A p.Gln846*
DNMT3A p.Gln886*
DNMT3A p.Glu235*
DNMT3A p.Glu561*
DNMT3A p.Glu697*
DNMT3A p.Glu774*
DNMT3A p.Glu784*
DNMT3A p.Glu907*
DNMT3A p.Lys632*
DNMT3A p.Trp297*
DNMT3A p.Trp306*
DNMT3A p.Trp314*
DNMT3A p.Trp330*
DNMT3A p.Trp698*
DNMT3A p.Trp753*
DNMT3A p.Trp860*
DNMT3A p.Tyr432*
DNMT3A p.Tyr528*
DNMT3A p.Tyr592*
DNMT3A p.Tyr683*
DNMT3A p.Tyr724*
DNMT3A Splice_site_variant
EP300 Splice_site_variant
GNAS p.757Pro_758Profs
JAK1 p.859Lys_860Profs
JARID2 p.327Val_337Tyrfs
KDM6A p.812Asn_814Valfs
KDM6A Splice_site_variant
KMT2D p.1124Leu_1135Glufs
KMT2D p.1820Gln_1821Lysfs
KMT2D p.2198Tyr_2199Profs
KMT2D p.3495Thr_3496Phefs
KMT2D p.3542Cys_3544Lysfs
KMT2D p.3697Gly_3698Phefs
KMT2D p.4627Pro_4628Thrfs
KMT2D p.4853Pro_4854Aspfs
KMT2D p.Arg1903*
KMT2D p.Trp315*
KMT2D p.Trp4377*
KMT2D Splice_site_variant
NF1 p.675Thr_676Profs
NF1 p.Arg1241*
NF1 p.Arg304*
NF1 Splice_site_variant
NOTCH2 p.Gln310*
PDS5B p.721Pro_722Profs
PDSS2 p.307Ser_308Metfs
PHIP p.1353Arg_1354Aspfs
PHIP p.Arg1483*
PHIP p.Arg163*
PHIP p.Arg1806*
PHIP p.Gly693*
PHIP p.Tyr1375*
PHIP Splice_site_variant
PIK3R1 p.Arg348*
PPM1D p.422Glu_423Glufs
PPM1D p.444Phe_445Serfs
PPM1D p.470Pro_471Glufs
PPM1D p.482Thr_483Leufs
PPM1D p.511Asn_512Leufs
PPM1D p.542Ser_543Glyfs
PPM1D p.Arg552*
PPM1D p.Arg572*
PPM1D p.Glu451*
PPM1D p.Ser516*
PRPF40B p.189Asp_190Aspfs
PTEN Splice_site_variant
RPS15 p.Tyr30*
SETD2 p.1395Asn_1396Aspfs
SETD2 p.884Ser_885Leufs
SETD2 p.Gln1825*
SETD2 p.Gln2321*
SETD2 Splice_site_variant
SMC3 p.293Glu_294Argfs
SMC3 p.Gln1045*
STAG2 p.Arg1242*
STAG2 p.Gln1029*
SUZ12 p.Gln685*
TET2 p.1024Ile_1025Glufs
TET2 p.1185Glu_1186Glyfs
TET2 p.1192Cys_1193Profs
TET2 p.1308Phe_1309Lysfs
TET2 p.1336Tyr_1337LysinsTer???
TET2 p.1437Lys_1438Lysfs
TET2 p.1439Arg_1440Serfs
TET2 p.146Lys_147Lysfs
TET2 p.1515Arg_1516Leufs
TET2 p.1541Gln_1542Argfs
TET2 p.1552Gln_1554Glufs
TET2 p.160Lys_161Aspfs
TET2 p.164Ser_165Phefs
TET2 p.1733Met_1734Glyfs
TET2 p.1755His_1757Serfs
TET2 p.1762Ile_1763Hisfs
TET2 p.1815Leu_1816Hisfs
TET2 p.1828Pro_1829Leufs
TET2 p.1888Pro_1889Asnfs
TET2 p.1889Asn_1891Asnfs
TET2 p.235Asp_236Cysfs
TET2 p.257Asn_258Glufs
TET2 p.269Thr_270Serfs
TET2 p.336Glu_337Asnfs
TET2 p.491Thr_492Alafs
TET2 p.531Leu_532Metfs
TET2 p.560Lys_561Profs
TET2 p.653Gln_654Lysfs
TET2 p.70Asn_71Serfs
TET2 p.715Ser_716Hisfs
TET2 p.751Asn_753Glufs
TET2 p.761His_762Profs
TET2 p.765Asn_770Argfs
TET2 p.80Glu_81Serfs
TET2 p.824Ser_825Serfs
TET2 p.862His_863Hisfs
TET2 p.864Met_865Glnfs
TET2 p.919Leu_920Ilefs
TET2 p.972Cys_973Hisfs
TET2 p.Arg1465*
TET2 p.Arg1516*
TET2 p.Arg544*
TET2 p.Arg550*
TET2 p.Arg83*
TET2 p.Gln1009*
TET2 p.Gln1020*
TET2 p.Gln1546*
TET2 p.Gln321*
TET2 p.Gln341*
TET2 p.Gln626*
TET2 p.Gln632*
TET2 p.Gln644*
TET2 p.Gln652*
TET2 p.Gln659*
TET2 p.Gln734*
TET2 p.Gln745*
TET2 p.Gln810*
TET2 p.Glu149*
TET2 p.Glu456*
TET2 p.Lys1008*
TET2 p.Ser1369*
TET2 p.Ser1607*
TET2 p.Ser509*
TET2 p.Ser825*
TET2 p.Trp954*
TET2 p.Tyr380*
TET2 Splice_site_variant
TNFAIP3 p.135Arg_136Asnfs
TNFAIP3 p.161Arg_162Asnfs
TNFAIP3 p.207Ile_208Valfs
TNFAIP3 p.277Arg_278Aspfs
TNFAIP3 p.306Leu_307Metfs
TNFAIP3 p.321Thr_323Leufs
TNFAIP3 p.338Ile_339Asnfs
TNFAIP3 p.415Asn_416Lysfs
TNFAIP3 p.558Cys_559Hisfs
TNFAIP3 p.571Arg_575Profs
TNFAIP3 p.89Arg_94Leufs
TNFAIP3 p.Gln110*
TNFAIP3 p.Gln59*
TNFAIP3 p.Gly493*
TNFAIP3 p.Lys299*
TNFAIP3 p.Ser220*
TNFAIP3 Splice_site_variant
TP53 p.285Glu_286Glufs
TP53 p.Gln317*
ZRSR2 p.Cys260*
일 구현예에서, 상기 하나 이상의 유전자 변이는 상기 언급된 유전자 DNMT3A, TET2, ASXL1, RPS15, EP300, TNFAIP3, KMT2D, PPM1D, PHIP, NF1, PRPF40B, SETD2, ASXL2, BCOR, CBL, BRCC3, KDM6A, ATM, STAG2, PDS5B, SMC3, TP53, BCORL1, PTEN, PDSS2, ZRSR2, GNAS, PIK3R1, CARD11, CUX1, CASP8, SUZ12, CHEK2, NOTCH2, JAK1, 및 JARID2로 이루어진 군에서 선택되는 어느 하나의 유전자의 변이를 포함할 수 있으며, 이 때, 상기 하나 이상의 혈액세포 유전자 변이는 상기 선택된 하나의 유전자를 제외한 나머지 유전자로 이루어진 군에서 선택되는 하나 이상의 유전자의 변이를 추가로 포함할 수 있다. 예컨대, 상기 하나 이상의 유전자의 변이는 DNMT3A 유전자의 변이를 포함할 수 있다. 이 때, 상기 하나 이상의 유전자의 변이는 TET2, ASXL1, RPS15, EP300, TNFAIP3, KMT2D, PPM1D, PHIP, NF1, PRPF40B, SETD2, ASXL2, BCOR, CBL, BRCC3, KDM6A, ATM, STAG2, PDS5B, SMC3, TP53, BCORL1, PTEN, PDSS2, ZRSR2, GNAS, PIK3R1, CARD11, CUX1, CASP8, SUZ12, CHEK2, NOTCH2, JAK1, 및 JARID2로 이루어진 군으로부터 선택되는 하나 이상의 유전자의 변이를 추가로 포함할 수 있다.
상기 혈액세포 유전자의 변이에 대한 정보는 당업계에 알려진 유전자 분석 방법, 예컨대 PCR(polymerase chain reaction), 생어 염기서열 분석(sanger sequencing), 마이크로어레이(microarray) 또는 차세대 염기서열 분석(Next Generation Sequencing)을 포함하는 검사 방법에 의해 얻어질 수 있으나, 이에 제한되지 않는다 .
다른 구현예에서, 상기 정보 제공 방법은 LDL-콜레스테롤 지표에 대한 위험도가 높고, 혈액세포 유전자 변이가 존재하는 경우에, 그 대상은 죽상동맥경화성 심뇌혈관질환의 위험도가 높은 것으로 결정하는 단계를 추가로 포함할 수 있다.
구체적으로, 상기 혈중 LDL-콜레스테롤 수준이 건강한 개체에서 나타나는 정상 범주를 초과하거나(예컨대 160 mg/dL 이상) 상기 대상이 고지혈증 치료제를 처방 받았거나 복용 중인 경우에, LDL-콜레스테롤 지표에 대한 위험도가 높은 것으로 결정할 수 있다.
또한, LDL-콜레스테롤 지표에 관한 선천적 위험도는 대상으로부터 분리된 생물학적 시료로부터 얻은 유전 정보에 대응되는 기 설정된 위험 점수를 참조하여, 상기 지표에 대한 선천적 위험 점수를 산출하는 것을 포함하는 방법에 의해 결정될 수 있다.
상기 유전 정보는 당업계에 알려진 유전자 분석 방법, 예컨대 PCR(polymerase chain reaction), 생어 염기서열 분석(sanger sequencing), 마이크로어레이(microarray) 또는 차세대 염기서열 분석(Next Generation Sequencing)를 포함하는 검사 방법에 의해 얻어질 수 있으나, 이들 방법에 제한되지 않는다.
상기 선천적 위험 점수는, 예를 들어 다면유전자 위험 점수(polygenic risk score) 산출 방법을 이용하여 산출될 수 있다.
상기 기 설정된 위험 점수는 대상이 속하는 유전체 집단의 유전 정보와 LDL-콜레스테롤 지표에 대한 측정값에 기초하여 결정될 수 있다. 구체적으로, 상기 유전 정보는 개체의 LDL-콜레스테롤 지표에 영향을 주는 단일염기다형성(SNP) 유전자에 대한 정보일 수 있다. 예컨대, 상기 단일염기다형성 유전자에 대한 정보는 하기 표 2를 참조할 수 있다. 한편, 상기 기 설정된 위험 점수는 LDL-콜레스테롤 지표에 영향을 주는 단일염기다형성(SNP) 유전자에 대하여 하기 계산식 1에 의해 결정될 수 있다.
[계산식 1]
Y = β0 + βx1*X1 + βx2*X2 + βx3*X3 + βSNP*SNP(0/1/2)
상기 계산식 1에서,
Y는 대상 유전체 집단의 LDL-콜레스테롤 지표에 대한 평균값이고,
βSNP는 해당 SNP와 평균 Y값의 연관성(association)을 나타내는 값이고,
SNP(0/1/2)는 대상 유전체 집단에 속하는 개체의 유전형질에 따른 값으로, 위험형질이 없으면 0, 이형접합체(heterozygote)이면 1, 동형접합체(homozygote)이면 2의 값이고,
β0 은 Y의 절편 값이고,
βx1은 대상 유전체 집단에 속하는 개체의 성별과 평균 Y값의 연관성을 나타내는 값이고,
X1은 대상 유전체 집단에 속하는 개체의 성별에 따른 값으로, 남성이면 1, 여성이면 0의 값이고,
βx2은 대상 유전체 집단에 속하는 개체의 연령과 평균 Y값의 연관성을 나타내는 값이고,
X2는 대상 유전체 집단에 속하는 개체의 연령을 나타낸다.
상기 대상 유전체 집단은 국가별, 인종별 및/또는 지역별 임상 코호트일 수 있고, 둘 이상의 임상 코호트의 조합일 수 있다.
상기 연관성은 성별, 연령, BMI 외 흡연 여부, 고혈압 여부, 당뇨 여부, 약물복용 여부, 식습관, 운동습관 등 대사질환 지표에 영향을 주는 다양한 건강 상태 및 생활습관 정보를 추가하여 계산할 수 있다. 이들의 영향을 보정한 유전형질의 영향력을 선형 회귀(linear regression) 분석 방법으로 계산할 수 있다.
또한, 상기 기 설정된 유전점수는 상기 계산식 1을 이용하여 점수화된 것일 수 있다. 추가적으로, 기 설정된 유전점수에 외부기관에서 검증된 각 지표에 대한 유전형질 영향 점수를 반영시킬 수 있다.
상기 βSNP는 메타-분석(meta-analysis)을 이용하여 대표값을 추산하여 사용할 수 있다. 이때, 각 코호트의 크기 차이에 의한 가중치는 Inverse variance-weighted model을 이용하여 계산될 수 있다. 구체적으로, 각 코호트의 크기 차이에 의한 가중치는 하기 계산식 2를 이용하여 계산될 수 있다.
[계산식 2]
βSNP-meta =
Figure PCTKR2022005436-appb-img-000001
βcity: 도시기반 코호트에서 계산된 해당 유전형질의 위험도
wcity: 도시기반 코호트에서 계산된 해당 유전형질의 위험도의 표준오차 (standard error)의 제곱의 역수(1/SEi 2)
βasas: 지역기반 코호트에서 계산된 해당 유전형질의 위험도
wasas: 1/SEi 2 지역기반 코호트에서 계산된 해당 유전형질의 위험도의 표준오차(standard error)의 제곱의 역수(1/SEi 2)
상기 메타-분석을 이용하여 계산된 값은, 예컨대 클럼핑(clumping) 기법을 이용하여 중요한 유전형질을 선별할 수 있다. 상기 클럼핑 기법은 가장 중요도가 높은 유전형질 하나를 선별하고 그 형질과 관련이 가장 큰 형질을 제거하는 방법을 반복하는 방법이다.
일 실시예에서, 한국인의 도시기반 코호트 및 지역사회 기반 코호트를 대상으로 하여, 상기 계산식 1을 이용하여 800만개의 유전형질이 해당 지표에 주는 영향을 점수화하였다. 추가적으로, 한국인 외 해외 논문에서 검증된 각 지표에 대한 유전형질 영향 점수를 낮은 점수여도 포함시킬 수 있다. 그 후, 상기 메타-분석 및 클럼핑 기법을 통해 LDL-콜레스테롤 지표에 대한 기 설정된 위험 점수를 결정하고, 이를 하기 표 2에 나타내었다.
SNP 번호 표현형 유전 형질 위험 형질 위험 점수(beta)
1 LDL rs11667610 T -6.856
2 LDL rs34215622 CG -3.4855
3 LDL rs151193009 T -12.9537
4 LDL rs438811 T -4.1322
5 LDL rs387465 A 4.7457
6 LDL rs12740374 T -6.6588
7 LDL rs13306206 A 13.4372
8 LDL rs3846662 A -2.9014
9 LDL rs550057 T 2.8133
10 LDL rs2854725 T 3.5018
11 LDL rs11331996 G 2.4408
12 LDL rs17035665 T -4.4833
13 LDL rs1135062 A 2.6637
14 LDL rs77303550 T -2.5472
15 LDL rs147821144 A -7.9024
16 LDL rs2278426 T -1.9772
17 LDL rs8112638 T 1.9159
18 LDL rs139927802 C -2.0328
19 LDL rs11436234 T -2.1592
20 LDL rs75352129 T 5.2896
21 LDL rs2075650 A -2.7378
22 LDL rs2569540 C -2.3919
23 LDL rs7030248 A -1.7257
24 LDL rs1367117 A 2.6448
25 LDL rs174528 T 1.7267
26 LDL rs142291243 CCTGCACATT -2.0593
27 LDL rs2972558 T -1.6148
28 LDL rs12610257 T 1.4007
29 LDL rs9715911 A 1.8462
30 LDL rs11668477 A 1.8627
31 LDL rs6029568 A -1.828
32 LDL rs1169288 A -1.431
33 LDL rs41280378 T 1.797
34 LDL rs74701849 A 1.9107
35 LDL rs57247013 G 1.4975
36 LDL rs7203821 T -1.7894
37 LDL rs1179041 T 1.4682
38 LDL rs12469758 A 3.1889
39 LDL rs60191209 T 1.5888
40 LDL rs2738446 C -2.4643
41 LDL rs2307111 T -1.4831
42 LDL rs17135399 A -2.3256
43 LDL rs57250632 A -1.5851
44 LDL rs2737245 T -1.6887
45 LDL rs2419604 A 1.5426
46 LDL rs143638926 T -4.5119
47 LDL rs8176720 T 1.3724
48 LDL rs6677122 T -5.1994
49 LDL rs6545966 A 1.2581
50 LDL rs200159426 A 2.0337
51 LDL rs75617080 A -2.5378
52 LDL rs73596816 A 3.1814
53 LDL rs6970673 T -1.104
54 LDL rs7264396 T -1.3997
55 LDL rs6754295 T -1.2991
56 LDL rs6087709 C 1.6627
57 LDL rs529565 T -1.1279
58 LDL rs9958734 T -1.171
59 LDL rs4927207 A -1.4874
60 LDL rs2954029 A 1.2294
61 LDL rs77753011 T 1.8506
62 LDL rs7776054 A 1.3459
63 LDL rs12979495 A -1.2299
64 LDL rs5167 T 1.1207
65 LDL rs4719841 A 0.9549
66 LDL rs10078021 T -1.0836
67 LDL rs6016381 T 1.1121
68 LDL rs12572586 T 1.0644
69 LDL rs4708876 C 1.6565
70 LDL rs13108218 A 1.0681
71 LDL rs11066015 A 1.7658
72 LDL rs1883025 T -1.1948
73 LDL rs2287019 T -1.1702
74 LDL rs2074755 T -1.4709
75 LDL rs35239705 A -1.152
76 LDL rs62074014 A 1.0977
77 LDL rs2332328 T 2.1608
78 LDL rs11563251 T 1.6255
79 LDL rs116961202 A 1.0007
80 LDL rs2642438 A -1.3225
81 LDL rs2183573 A -0.8624
82 LDL rs2694047 A -0.8741
83 LDL rs2306363 T 1.014
84 LDL rs16844401 A 1.3744
85 LDL rs704 A 1.137
86 LDL rs9972882 A -0.8759
87 LDL rs1041968 A 2.0654
88 LDL rs148177611 T 1.3713
89 LDL rs325 T -1.3566
본 발명의 일 구현예에서, 상기 선천적 위험 점수는, 예를 들어 LDL-콜레스테롤 지표에 영향을 주는 89개의 SNP 유전자에 대한 위험 점수를 합산하고 평균값을 산출하는 방법(다면유전자 위험 점수 산출 방법)에 의해 결정될 수 있다.
예컨대, 상기 선천적 위험 점수는 하기 계산식 3에 의해 결정될 수 있다:
[계산식 3]
Y = (SNP1 x BETA1 + SNP2 x BETA2 + SNP3 x BETA3… + SNP89 x BETA89)/89
상기 계산식 3에서,
Y는 최종 LDL-콜레스테롤 위험 점수이고,
SNP1은 1번 SNP(단일염기다형성)의 유무로, 위험형질이 없으면 0, 이형접합체(heterozygote)이면 1, 동형접합체(homozygote)이면 2의 값이고, BETA1은 1번 SNP의 위험 점수(beta) 값이고,
SNP1 내지 SNP89 각각의 위험 형질과 위험 점수는 상기 표 2에 나타낸 바와 같다.
본 발명의 일 구현예에 있어서, 상기 정보 제공 방법은, 상기 기 설정된 위험 점수를 참조하여 산출된 상기 선천적 위험 점수가, 특정 상위 구간, 예컨대 상위 20%에 속하는 경우에, LDL-콜레스테롤 지표에 대한 위험도가 높은 것으로 결정하는 단계를 추가로 포함할 수 있다.
상기 "상위 20%"는 상기 기 설정된 위험 점수로부터 산출된 LDL-콜레스테롤 지표에 대한 기준값이다.
본 발명의 다른 측면은, 대상으로부터 분리된 생물학적 시료, 대상의 의료 정보, 또는 이들 둘 모두를 이용하여 LDL-콜레스테롤 지표에 관한 정보 및 혈액세포 유전자 변이의 존재 여부에 관한 정보를 획득하는 정보획득부, 및 상기 LDL-콜레스테롤 지표에 관한 정보 및 혈액세포 유전자 변이의 존재 여부에 관한 정보에 기초하여 대상의 죽상동맥경화성 심뇌혈관질환 위험도에 관한 정보를 제공하는 정보제공부를 포함하는 정보 제공 시스템을 제공한다.
일 구현예에서, 상기 정보획득부는 대상의 혈중 LDL-콜레스테롤 수준에 대한 정보, 대상의 복약 또는 처방 정보, 또는 유전체 또는 혈액세포 유전자의 시퀀싱 정보 등을 입력 받을 수 있다.
상기 정보획득부는 예컨대 상기 혈중 LDL-콜레스테롤 수준이 160 mg/dL 이상이거나 상기 대상이 고지혈증 치료제를 처방 받았거나 복용 중인 경우에, LDL-콜레스테롤 지표의 위험도가 높은 것으로 결정할 수 있다.
또한, 상기 정보획득부는 대상으로부터 분리된 생물학적 시료로부터 얻은 유전 정보(예컨대, SNP 정보)에 기초하여 그 유전 정보에 대응되는 기 설정된 위험 점수를 참조하여 LDL-콜레스테롤 지표에 관한 선천적 위험 점수를 산출할 수 있다.
또한, 상기 정보획득부는 대상으로부터 분리된 생물학적 시료로부터 얻은 유전 정보(예컨대, 혈액세포 유전자 시퀀싱 정보)에 기초하여 혈액세포 유전자 변이의 존재 여부를 판별할 수 있다. 이 때, 상기 정보제공부는 상기 기 설정된 위험 점수를 참조하여 산출된 상기 선천적 위험 점수가, 예컨대 상위 20%에 속하는 경우에, LDL-콜레스테롤 지표에 대한 위험도가 높은 것으로 결정할 수 있다.
또한, 상기 정보획득부는 LDL-콜레스테롤 수준을 측정하는 측정부를 포함할 수 있고, 또한 유전체 또는 유전자 변이에 대한 시퀀싱 정보를 획득하기 위한 유전자 분석부를 포함할 수 있다. 상기 유전자 분석부는 당업계에 알려진 유전자 분석 장치, 예컨대 PCR, 생어 염기서열 분석 장치, 마이크로어레이 또는 차세대 염기서열 분석(Next Generation Sequencing) 장치를 포함할 수 있다.
다른 구현예에서, 상기 정보제공부는 LDL-콜레스테롤 지표의 위험도가 높고 상기 혈액세포 유전자 변이가 존재하는 경우에, 상기 대상이 죽상동맥경화성 심뇌혈관질환의 위험도가 높은 것으로 결정할 수 있다.
또한, 상기 정보제공부는, 죽상동맥경화성 심뇌혈관질환의 위험도가 높은 경우에, 죽상동맥경화성 심뇌혈관질환을 예방, 완화, 또는 치료하거나 이에 도움이 되는 정보를 함께 제공할 수 있다.
본 발명의 또 다른 측면은 전술한 정보 제공 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체를 제공한다.
상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위하여 하나 이상의 소프트웨어 모듈로 변경될 수 있으며, 그 역도 마찬가지이다.
상기 정보 제공 시스템 및 컴퓨터 판독 가능한 기록 매체의 구성 또는 이와 관련하여 사용되는 용어 등에 대한 설명, 예시 등은 전술한 정보 제공 방법에 관하여 기술된 부분을 참조하여 이들에도 적용될 수 있다.
이하, 본 발명을 하기 실시예에 의하여 더욱 상세하게 설명한다. 단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명의 범위가 이들만으로 한정되는 것은 아니다.
실시예 1. 추적 관찰을 위한 혈액세포 돌연변이의 검출/선별
서울대병원 강남센터로부터 4329명의 혈액 시료를 얻었다. 상기 혈액 시료로부터 혈액세포의 DNA를 추출하고, 차세대 염기서열 분석 방법을 통해 DNMT3A, TET2, ASXL1, RPS15, EP300, TNFAIP3, KMT2D, PPM1D, PHIP, NF1, PRPF40B, SETD2, ASXL2, BCOR, CBL, BRCC3, KDM6A, ATM, STAG2, PDS5B, SMC3, TP53, BCORL1, PTEN, PDSS2, ZRSR2, GNAS, PIK3R1, CARD11, CUX1, CASP8, SUZ12, CHEK2, NOTCH2, JAK1 및 JARID2 유전자의 엑손 영역에 발생한 염기서열 돌연변이를 검출하였다.
돌연변이가 검출된 경우, 이들 돌연변이 중 미스센스(missense) 돌연변이, 프레임시프트(frameshift) 돌연변이, 넌센스(nonsense) 돌연변이, 스플라이스(splice) 돌연변이, 또는 삽입/결실 돌연변이를 선별하고, 돌연변이 염기서열 분율이 1.5%가 넘는 돌연변이만을 다시 선별하였다. 상기 선별된 돌연변이에 대해서는 표 1을 참조한다.
이렇게 선별된 돌연변이를 가진 그룹을 혈액세포 돌연변이 그룹(Mutation(+))으로 정의하고 그렇지 않은 그룹을 보통 그룹(Mutation(-))으로 정의한 후, 이들 그룹에 대해 6년간 죽상동맥경화성 심뇌혈관질환의 발병 여부를 추적 관찰하였다. 이때, 각 그룹에 속하는 사람들의 문진(예를 들어, 성별, 연령 및 흡연 여부), 신체/혈액 검사(예를 들어, 혈압, 콜레스테롤, 혈당) 및 혈액 DNA 검사(예를 들어, 선천적 대사질환 위험도) 정보를 활용하였다.
실시예 2. 죽상동맥경화성 심뇌혈관질환 발병과 관련된 지표 중 혈중 고 LDL-콜레스테롤 수준과 혈액세포 돌연변이의 상호관련성 연구
실시예 1에서 실시한 추적 관찰 결과에 기초하여, 상기 혈액세포 돌연변이를 포함한 기존 심뇌혈관질환 위험요소(예를 들어, 성별, 연령, 고혈압, 고지혈증, 당뇨 및 흡연 여부)와 심뇌혈관질환 발병률을 확인하였다.
80세 미만 4316명을 6년간 추적관찰하여 죽상동맥경화성 심뇌혈관질환의 발생 여부를 수집하였다. 콕스 비례 위험 모형(Cox Proportional hazard model)을 이용하여 기존 심뇌혈관질환 위험요소 유무(성별, 연령, 고혈압, 고지혈증, 당뇨 및 흡연 여부)와 혈액세포 돌연변이 유무가 심뇌혈관질환의 발병에 미치는 위험도를 함께 분석하였다. 그 결과를 하기 표 3에 나타내었다.
HR(95CI) P
Sex(M) 7.28 (2.64-20.06) <0.005
Age 1.05 (1.02-1.08) <0.005
혈액세포 돌연변이 2.14 (1.25-3.67) 0.01
고혈압(HTN) 1.55 (0.99-2.43) 0.06
당뇨(DM) 2.28 (1.42-3.68) <0.005
고지혈증(HL) 1.64 (1.03-2.62) 0.04
흡연(Current Smoking) 1.01 (0.56-1.83) 0.98
상기 표 3에 나타낸 심뇌혈관질환 위험요소 중 혈액세포 돌연변이 유무에 따른 죽상동맥경화성 심뇌혈관질환의 발병에 미치는 위험도를 추가로 확인하였다.
그 결과, 80세 미만인 4316명에서 혈액세포 돌연변이 그룹은, 보통 그룹에 비해, 성별, 연령, 고혈압, 당뇨, 고지혈, 흡연 여부를 보정한 경우에, 죽상동맥경화성 심뇌혈관질환의 발병률이 약 2.14배 높은 것을 확인하였다(도 2).
한편, 혈액세포 돌연변이가 다른 심뇌혈관질환 위험요소와 상호작용하는지를 확인하기 위해, 혈액 시료 제공자에서 직접 측정하거나 혈중 수준을 측정한 지표, 즉, 수축기혈압, 이완기혈압, 총콜레스테롤, LDL-콜레스테롤, HDL-콜레스테롤, 공복혈당, 또는 중성지방 수준이 정상 범위를 벗어난 경우 혈액세포 돌연변이에 따른 죽상경화성 심뇌혈관질환의 발병률을 통계적으로 검증하고, 그 결과를 표 4에 나타내었다. 상기 통계 처리는 log likelihood ratio 검정방법을 이용하였으며 혈액세포 돌연변이 유무와 위험요소의 비정상 여부의 위험을 독립적으로 계산한 모델(독립위험모델)과 혈액세포 돌연변이가 있으면서 위험요소가 비정상인 경우를 고려한 상호작용 모델(상호작용모델)의 우도(likelihood)가 통계적으로 유의하게 차이가 나는지를 검정하였다.
Risk Factor 상호작용모델 독립위험모델 Chisq 자유도 p-value
LDL-콜레스테롤 -478.3 -480.33 4.0726 1 0.04358
총콜레스테롤 -479.32 -480.48 2.3211 1 0.1276
수축기혈압 -481.22 -481.85 1.2571 1 0.2622
HDL-콜레스테롤 -482.42 -483 1.1612 1 0.2812
공복혈당 -479.88 -480.26 0.763 1 0.3824
중성지방 -482.7 -482.91 0.4356 1 0.5092
이완기혈압 -482.78 -482.86 0.1579 1 0.6911
상기 표 4에 나타낸 바와 같이, 혈액세포 돌연변이가 존재하고 혈중 LDL-콜레스테롤 수준이 높은 경우(160 mg/dl 이상)에 죽상동맥경화성 심뇌혈관질환의 위험도가 상승적으로 증가하는 것으로 확인되었다. 이와 대조적으로, 총콜레스테롤, 혈압(수축기 및 이완기), HDL-콜레스테롤, 공복혈당 및 중성지방 수준에 대해서는 유의미한 상호 관련성이 관찰되지 않았다.
또한, 70세 미만 남성에서 LDL-콜레스테롤 수준과 혈액세포 돌연변이 여부에 따른 죽상동맥경화성 심뇌혈관질환의 발병률을 분석하고, 그 결과를 도 3에 나타내었다. 3010명의 70세 미만 남성에서 혈중 LDL-콜레스테롤이 160 mg/dl 이상이거나 현재 고콜레스테롤 약물치료를 받고 있는 그룹과 LDL-콜레스테롤이 정상이면서 고콜레스테롤 약물치료를 받고 있지 않은 그룹으로 나누어 죽상동맥경화성 심뇌혈관질환의 발병을 5년간 관찰하고 생존분석을 수행하였다.
도 3으로부터 알 수 있는 바와 같이, 혈중 LDL-콜레스테롤이 160 mg/dl 이상이거나 현재 고콜레스테롤 약물치료를 받고 있는 사람에게서 혈액세포 돌연변이의 존재가 죽상동맥경화성 심뇌혈관질환의 발병 위험을 상승적으로 증가시키는 것으로 나타났다.
위와 같이 죽상동맥경화성 심뇌혈관질환의 발명 위험의 상승적 증가를 통계적으로 추가로 검증하기 위하여 콕스 비례 위험 회귀(Cox Proportional Hazard Regression) 방법을 사용하여 분석하였다.
구체적으로, 연령, 고 LDL-콜레스테롤 수준 및 혈액세포 돌연변이 존재 여부를 이용하여 질환 발생을 예측한 모델(좌측 모델)과 여기에 고 LDL-콜레스테롤 수준과 혈액세포 돌연변이를 동시에 갖는 경우를 추가한 모델(우측 모델)을 비교하였다.
이때, 표 5의 Anova test 결과로부터 알 수 있는 바와 같이, 고 LDL-콜레스테롤 수준과 혈액세포 돌연변이를 동시에 갖는 경우가 추가된 우측 모델은 유의하게 높은 성능을 나타냈다. 즉, 연령 보정 시 죽상동맥경화성 심뇌혈관질환의 발병 위험이 4.8배 높아졌다
2가지 콕스 비례 위험 모형의 비교
Model Age + [high LDL-c] + [mutant presence] Age + [high LDL-c] + [mutant presence] +
[high LDL-c] * [mutant presence]
Concordance 0.67 0.69
Partial AIC 966.66 964.59
Log-likelihood ratio test 21.84 on 3 df 25.94 on 4 df
-log2(p) of II-ratio test 13.79 14.89
Log-likelihood -478.30 -480.33
Anova test Chisq = 4.0726; DF = 1; P = 0.04358
이러한 결과로부터, 혈액세포 돌연변이 및 혈중 LDL-콜레스테롤 수준의 두 가지 지표를 통해 죽상동맥경화성 심뇌혈관질환의 위험도를 더 정확하게 예측할 수 있다는 것이 확인되었다.
실시예 3. 혈중 고 LDL-콜레스테롤 수준과 혈액세포 돌연변이에 의한 죽상동맥경화성 심뇌혈관질환 발병 위험도의 상승적 증가에 대한 검증
관상동맥 CT 혈관조영술을 시행한 2096명의 임상 결과를 이용하여 실시예 2에서 확인된 고 LDL-콜레스테롤 수준과 혈액세포 돌연변이 간의 상호작용을 추가로 검증하였다. 구체적으로, 고 LDL-콜레스테롤 수준을 갖는 그룹에 대해 관상동맥 CT 혈관조영술을 시행하여 협착이 생긴 플라크 수를 관찰하였고, 플라크 수를 혈액세포 돌연변이 존재 여부에 따라 분석하였다. LDL-콜레스테롤이 높지 않은 그룹에서는 혈액세포 돌연변이와 협착이 생긴 플라크의 수에 유의한 상관관계가 관찰되지 않았다. 하지만 LDL-콜레스테롤이 높은 그룹에서는 혈액세포 돌연변이와 협착이 생긴 플라크의 수에 상관관계가 존재하였다. 유의한 상관관계가 확인된 고 LDL-콜레스테롤 수준에 대한 결과를 표 6에 나타내었다.
Mutant presence Mutant absence Statistics (P)
Number of segments with moderate to severe plaque 0.7±1.8 0.3±1.0 Beta=0.36 (95% CI, 0.03-0.69; P=0.032)
Number of vessels with moderate to severe plaque 0.4±0.9 0.2±0.6 Beta=0.17 (95% CI, -0.02-0.36; P=0.072)
Presence of moderate to severe mixed plaque (%) 8 (16.7%) 44 (8.0%) OR=1.08 (95% CI, 0.99-1.17; P=0.071)
Presence of moderate to severe mixed plaque (%) 8 (16.7%) 43 (7.8%) OR=1.08 (95% CI, 1.0-1.17; P=0.063)
No. Pts with moderate to severe plaque in LM or pLAD (%) 8 (16.7%) 35 (6.4%) OR=1.11 (95% CI, 1.02-1.19; P=0.01)
상기 표에서 알 수 있는 바와 같이, 고 LDL-콜레스테롤 수준을 갖는 그룹에서 혈액세포 돌연변이가 존재하는 경우, 혈액세포 돌연변이가 존재하지 않는 경우에 비해 협착이 생긴 플라크의 수가 유의하게 증가되었고 좌주간지관상동맥(LM) 또는 좌전하행관상동맥(pLAD)에 협착이 있는 플라크가 발생할 위험이 증가한 것으로 나타났다.
실시예 4. 죽상동맥경화성 심뇌혈관질환 발병과 관련된 지표 중 선천적 LDL-콜레스테롤 위험도와 혈액세포 돌연변이의 상호관련성 연구
실시예 1에서 실시한 추적 관찰 결과에 기초하여, 혈액세포 돌연변이가 존재하는 경우에, 선천적 대사질환 위험도 중 하나인 선천적 LDL-콜레스테롤 위험도가 높은 경우에도 죽상동맥경화성 심뇌혈관질환 발병 위험도가 상승적으로 증가되는지를 확인하고자 하였다.
본 실시예에서는, 혈액검사를 통해 얻어지는 LDL콜레스테롤 수준이 아니라 혈액 중 DNA 염기서열 분석을 통해 얻어지는 선천적 LDL-콜레스테롤 위험도를 이용하여 그와 혈액세포 돌연변이의 관계를 분석하였다.
80세 이하 4316명의 선천적 LDL-콜레스테롤 위험도를 다면유전자 위험 점수 산출 방법을 이용하여 결정하였고 이 점수가 높은 상위 20% 그룹을 선천적 LDL-콜레스테롤 위험 그룹으로 정의하였고 나머지 80%를 보통 그룹으로 정의하였다.
그 결과, 혈액세포 돌연변이가 존재할 때, 선천적 LDL-콜레스테롤 위험도가 하위 80%에 속하는 사람(특히, 남성)보다 선천적 LDL-콜레스테롤 위험도가 상위 20%에 속하는 사람(특히, 남성)에게서 죽상동맥경화성 심뇌혈관질환이 유의하게 더 많이 발생하는 것으로 관찰되었다.
도 4로부터 알 수 있는 바와 같이, 혈액세포 돌연변이가 존재할 때, 선천적 LDL-콜레스테롤 위험도가 상위 20%에 속하는 사람은 선천적 LDL-콜레스테롤 위험도가 하위 80%에 속하는 사람보다 약 3.01배 높은(연령이 보정된 경우) 죽상동맥경화성 심뇌혈관질환의 발병률을 보였다.
이러한 결과로부터, 혈액검사 또는 신체계측 정보없이 혈액 DNA 분석을 통해 동시에 얻어지는 정보인 선천적 LDL-콜레스테롤 위험도와 혈액세포 돌연변이 존재 여부의 조합으로 죽상동맥경화성 심뇌혈관질환의 위험도가 3배 이상 높은 고위험군을 선별할 수 있는 것으로 확인되었다.

Claims (22)

  1. 정보 제공 방법으로서,
    대상으로부터 분리된 생물학적 시료, 대상의 의료 정보, 또는 이들 둘 모두를 이용하여 LDL-콜레스테롤 지표에 관한 정보 및 혈액세포 유전자 변이의 존재 여부에 관한 정보를 획득하는 단계, 및
    상기 LDL-콜레스테롤 지표에 관한 정보 및 혈액세포 유전자 변이의 존재 여부에 관한 정보에 기초하여 대상의 죽상동맥경화성 심뇌혈관질환 위험도에 관한 정보를 제공하는 단계를 포함하는
    방법.
  2. 제1항에 있어서,
    상기 LDL-콜레스테롤 지표의 위험도가 높고 상기 혈액세포 유전자 변이가 존재하는 경우에, 상기 대상은 죽상동맥경화성 심뇌혈관질환의 위험도가 높은 것으로 결정하는 단계를 추가로 포함하는
    방법.
  3. 제1항에 있어서,
    상기 LDL-콜레스테롤 지표에 관한 정보는, (i) 혈중 LDL-콜레스테롤 수준, (ii) 고지혈증 치료제의 처방 또는 복용 여부, 및 (iii) LDL-콜레스테롤 지표에 관한 선천적 위험도로 이루어진 군에서 선택되는 하나 이상을 포함하는
    방법.
  4. 제3항에 있어서,
    상기 혈중 LDL-콜레스테롤 수준이 160 mg/dL 이상이거나 상기 대상이 고지혈증 치료제를 처방받았거나 복용 중인 경우에, LDL-콜레스테롤 지표의 위험도가 높은 것으로 결정하는 단계를 추가로 포함하는
    방법.
  5. 제3항에 있어서,
    상기 LDL-콜레스테롤 지표에 관한 선천적 위험도는 상기 대상으로부터 분리된 생물학적 시료로부터 얻은 유전 정보에 대응되는 기 설정된 위험 점수를 참조하여 산출된 선천적 위험 점수로부터 결정되는
    방법.
  6. 제5항에 있어서,
    상기 유전 정보는 LDL-콜레스테롤 수준에 관여하는 유전자의 단일염기다형성의 유무에 관한 정보를 포함하는
    방법.
  7. 제5항에 있어서,
    상기 선천적 위험 점수는 하기 계산식 3에 의해 결정되는
    방법:
    [계산식 3]
    Y = (SNP1 x BETA1 + SNP2 x BETA2 + SNP3 x BETA3 … + SNP89 x BETA89)/89
    상기 계산식 3에서,
    Y는 최종 LDL-콜레스테롤 위험 점수이고,
    SNP1은 1번 SNP(단일염기다형성)의 유무로, 위험형질이 없으면 0, 이형접합체(heterozygote)이면 1, 동형접합체(homozygote)이면 2의 값이고, BETA1은 1번 SNP의 위험 점수(beta) 값이고,
    SNP1 내지 SNP89 각각의 위험 형질과 위험 점수는 하기 표에 나타낸 바와 같다.
    Figure PCTKR2022005436-appb-img-000002
    Figure PCTKR2022005436-appb-img-000003
    Figure PCTKR2022005436-appb-img-000004
  8. 제5항에 있어서,
    상기 기 설정된 위험 점수를 참조하여 산출된 상기 선천적 위험 점수가 상위 20%에 속하는 경우에, LDL-콜레스테롤 지표에 대한 위험도가 높은 것으로 결정하는 단계를 추가로 포함하는
    방법.
  9. 제1항에 있어서,
    상기 혈액세포 유전자 변이는 DNMT3A, TET2, ASXL1, RPS15, EP300, TNFAIP3, KMT2D, PPM1D, PHIP, NF1, PRPF40B, SETD2, ASXL2, BCOR, CBL, BRCC3, KDM6A, ATM, STAG2, PDS5B, SMC3, TP53, BCORL1, PTEN, PDSS2, ZRSR2, GNAS, PIK3R1, CARD11, CUX1, CASP8, SUZ12, CHEK2, NOTCH2, JAK1 및 JARID2로 이루어진 군으로부터 선택되는 하나 이상의 유전자의 변이를 포함하는
    방법.
  10. 제9항에 있어서,
    상기 혈액세포 유전자 변이는 DNMT3A 유전자의 변이를 포함하는
    방법.
  11. 제10항에 있어서,
    상기 혈액세포 유전자 변이는 TET2, ASXL1, RPS15, EP300, TNFAIP3, KMT2D, PPM1D, PHIP, NF1, PRPF40B, SETD2, ASXL2, BCOR, CBL, BRCC3, KDM6A, ATM, STAG2, PDS5B, SMC3, TP53, BCORL1, PTEN, PDSS2, ZRSR2, GNAS, PIK3R1, CARD11, CUX1, CASP8, SUZ12, CHEK2, NOTCH2, JAK1, JARID2 및 이들의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 유전자의 변이를 추가로 포함하는
    방법.
  12. 제1항에 있어서,
    상기 혈액세포 유전자 변이의 존재 여부에 관한 정보는 대상으로부터 분리된 생물학적 시료를 이용한 유전자 분석을 통해 제공되는
    방법.
  13. 제12항에 있어서,
    상기 유전자 분석은 차세대 유전체 시퀀싱 분석법(Next Generation Sequencing, NGS)을 포함하는 방법에 의해 수행되는
    방법.
  14. 정보 제공 시스템으로서,
    대상으로부터 분리된 생물학적 시료, 대상의 의료 정보, 또는 이들 둘 모두를 이용하여 LDL-콜레스테롤 지표에 관한 정보 및 혈액세포 유전자 변이의 존재 여부에 관한 정보를 획득하는 정보획득부, 및
    상기 LDL-콜레스테롤 지표에 관한 정보 및 혈액세포 유전자 변이의 존재 여부에 관한 정보에 기초하여 대상의 죽상동맥경화성 심뇌혈관질환 위험도에 관한 정보를 제공하는 정보제공부를 포함하는
    시스템.
  15. 제14항에 있어서,
    상기 정보제공부는, LDL-콜레스테롤 지표의 위험도가 높고 상기 혈액세포 유전자 변이가 존재하는 경우에, 상기 대상이 죽상동맥경화성 심뇌혈관질환의 위험도가 높은 것으로 결정하는
    시스템
  16. 제14항에 있어서,
    상기 LDL-콜레스테롤 지표에 관한 정보는, (i) 혈중 LDL-콜레스테롤 수준, (ii) 고지혈증 치료제의 처방 또는 복용 여부, 및 (iii) LDL-콜레스테롤 지표에 관한 선천적 위험도로 이루어진 군에서 선택되는 하나 이상을 포함하는
    시스템.
  17. 제14항에 있어서,
    상기 정보제공부는 상기 혈중 LDL-콜레스테롤 수준이 160 mg/dL 이상이거나 상기 대상이 고지혈증 치료제를 처방받았거나 복용 중인 경우에, LDL-콜레스테롤 지표의 위험도가 높은 것으로 결정하는
    시스템.
  18. 제14항에 있어서,
    상기 LDL-콜레스테롤 지표에 관한 선천적 위험도는 상기 대상으로부터 분리된 생물학적 시료로부터 얻은 유전 정보에 대응되는 기 설정된 위험 점수를 참조하여 산출된 선천적 위험 점수로부터 결정되는
    시스템.
  19. 제18항에 있어서,
    상기 기 설정된 위험 점수를 참조하여 산출된 상기 선천적 위험 점수가 상위 20%에 속하는 경우에, LDL-콜레스테롤 지표에 대한 위험도가 높은 것으로 결정하는
    시스템.
  20. 제14항에 있어서,
    상기 혈액세포 유전자 변이는 DNMT3A, TET2, ASXL1, RPS15, EP300, TNFAIP3, KMT2D, PPM1D, PHIP, NF1, PRPF40B, SETD2, ASXL2, BCOR, CBL, BRCC3, KDM6A, ATM, STAG2, PDS5B, SMC3, TP53, BCORL1, PTEN, PDSS2, ZRSR2, GNAS, PIK3R1, CARD11, CUX1, CASP8, SUZ12, CHEK2, NOTCH2, JAK1 및 JARID2로 이루어진 군으로부터 선택되는 하나 이상의 유전자의 변이를 포함하는
    시스템.
  21. 제14항에 있어서,
    상기 혈액세포 유전자 변이의 존재 여부에 관한 정보는 차세대 유전체 시퀀싱 분석법(Next Generation Sequencing, NGS)을 포함하는 유전자 분석을 통해 제공되는
    시스템.
  22. 제1항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는
    컴퓨터 판독 가능한 기록 매체.
PCT/KR2022/005436 2021-04-15 2022-04-14 혈액세포 돌연변이 정보를 이용한 죽상동맥경화성 심뇌혈관질환의 위험도 예측 방법 WO2022220624A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2021-0049445 2021-04-15
KR20210049445 2021-04-15

Publications (1)

Publication Number Publication Date
WO2022220624A1 true WO2022220624A1 (ko) 2022-10-20

Family

ID=83640797

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/005436 WO2022220624A1 (ko) 2021-04-15 2022-04-14 혈액세포 돌연변이 정보를 이용한 죽상동맥경화성 심뇌혈관질환의 위험도 예측 방법

Country Status (2)

Country Link
KR (1) KR102572356B1 (ko)
WO (1) WO2022220624A1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160143113A (ko) * 2015-06-04 2016-12-14 (주) 메디젠휴먼케어 한국인 가족성 고콜레스테롤혈증에서 다유전자 기인성
US20180010185A1 (en) * 2014-11-25 2018-01-11 The Brigham And Women's Hospital, Inc. Method of identifying and treating a person having a predisposition to or afflicted with a cardiometabolic disease
US20200131576A1 (en) * 2017-04-25 2020-04-30 The Brigham And Women's Hospital, Inc. IL-8, IL-6, IL-1 Beta and TET2 and DNMT3A in Atherosclerosis

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101992952B1 (ko) * 2017-11-09 2019-06-25 연세대학교 산학협력단 콜레스테롤 유출능과 관련된 심혈관질환의 발병 위험을 예측하기 위한 조성물, 키트, 및 이를 이용한 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180010185A1 (en) * 2014-11-25 2018-01-11 The Brigham And Women's Hospital, Inc. Method of identifying and treating a person having a predisposition to or afflicted with a cardiometabolic disease
KR20160143113A (ko) * 2015-06-04 2016-12-14 (주) 메디젠휴먼케어 한국인 가족성 고콜레스테롤혈증에서 다유전자 기인성
US20200131576A1 (en) * 2017-04-25 2020-04-30 The Brigham And Women's Hospital, Inc. IL-8, IL-6, IL-1 Beta and TET2 and DNMT3A in Atherosclerosis

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JAISWAL SIDDHARTHA, NATARAJAN PRADEEP, SILVER ALEXANDER J., GIBSON CHRISTOPHER J., BICK ALEXANDER G., SHVARTZ EUGENIA, MCCONKEY MA: "Clonal Hematopoiesis and Risk of Atherosclerotic Cardiovascular Disease", THE NEW ENGLAND JOURNAL OF MEDICINE, MASSACHUSETTS MEDICAL SOCIETY, US, vol. 377, no. 2, 13 July 2017 (2017-07-13), US , pages 111 - 121, XP055977007, ISSN: 0028-4793, DOI: 10.1056/NEJMoa1701719 *
ZHAO PEI JUN, BAN MATTHEW R., IACOCCA MICHAEL A., MCINTYRE ADAM D., WANG JIAN, HEGELE ROBERT A.: "Genetic Determinants of Myocardial Infarction Risk in Familial Hypercholesterolemia", CJC OPEN, vol. 1, no. 5, 1 September 2019 (2019-09-01), pages 225 - 230, XP055977006, ISSN: 2589-790X, DOI: 10.1016/j.cjco.2019.06.001 *

Also Published As

Publication number Publication date
KR20220142950A (ko) 2022-10-24
KR102572356B1 (ko) 2023-08-30

Similar Documents

Publication Publication Date Title
Tada et al. Oligogenic familial hypercholesterolemia, LDL cholesterol, and coronary artery disease
Saxena et al. Genome-wide association study identifies a novel locus contributing to type 2 diabetes susceptibility in Sikhs of Punjabi origin from India
Zeviani et al. Deletions of mitochondrial DNA in Kearns-Sayre syndrome
Morris et al. Interleukin 12B (IL12B) genetic variation and pulmonary tuberculosis: a study of cohorts from The Gambia, Guinea-Bissau, United States and Argentina
Kittles et al. CYP3A4-V and prostate cancer in African Americans: causal or confounding association because of population stratification?
Jinnai et al. Polymorphisms in the prostaglandin E2 receptor subtype 2 gene confer susceptibility to aspirin-intolerant asthma: a candidate gene approach
Thun et al. Causal and synthetic associations of variants in the SERPINA gene cluster with alpha1-antitrypsin serum levels
Thameem et al. The Ser (326) Cys polymorphism of 8-oxoguanine glycosylase 1 (OGG1) is associated with type 2 diabetes in Mexican Americans
Di'Narzo et al. Integrative analysis of the inflammatory bowel disease serum metabolome improves our understanding of genetic etiology and points to novel putative therapeutic targets
Chu et al. Integration of metabolomics, genomics, and immune phenotypes reveals the causal roles of metabolites in disease
Jin et al. Low-frequency coding variants at 6p21. 33 and 20q11. 21 are associated with lung cancer risk in Chinese populations
Bosch et al. Sequencing of GJB2 in Cameroonians and Black South Africans and comparison to 1000 genomes project data support need to revise strategy for discovery of nonsyndromic deafness genes in Africans
Mitchell et al. Genome-wide association study of maternal and inherited effects on left-sided cardiac malformations
Lee et al. Whole-genome sequencing identifies novel functional loci associated with lung function in Puerto Rican youth
Jordan et al. Targeted next‐generation sequencing in a large series of fetuses with severe renal diseases
Chen et al. Exploration of cross-talk and pyroptosis-related gene signatures and molecular mechanisms between periodontitis and diabetes mellitus via peripheral blood mononuclear cell microarray data analysis
Hernández et al. ZNF718, HOXA4, and ZFP57 are differentially methylated in periodontitis in comparison with periodontal health: epigenome‐wide DNA methylation pilot study
Freitas et al. Analysis of renin-angiotensin-aldosterone system gene polymorphisms in resistant hypertension
Li et al. Whole-exome sequencing reveals common and rare variants in immunologic and neurological genes implicated in achalasia
WO2022220624A1 (ko) 혈액세포 돌연변이 정보를 이용한 죽상동맥경화성 심뇌혈관질환의 위험도 예측 방법
WO2015111852A1 (ko) Nudt15 유전자 내의 단일염기다형성 마커를 포함하는 티오퓨린 유도 백혈구 감소증 발병 위험 예측용 조성물
CN113136387B (zh) 早发冠心病相关基因及其检测试剂与应用
Leal et al. A polygenic biomarker to identify patients with severe hypercholesterolemia of polygenic origin
North et al. Evidence for a gene influencing fasting LDL cholesterol and triglyceride levels on chromosome 21q
Sharma et al. A_16_C haplotype in the FcεRIβ gene confers a higher risk for atopic asthma in the Indian population

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22788479

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 22788479

Country of ref document: EP

Kind code of ref document: A1