WO2018139826A1 - Dna 메틸화를 이용한 연령 예측 방법 - Google Patents

Dna 메틸화를 이용한 연령 예측 방법 Download PDF

Info

Publication number
WO2018139826A1
WO2018139826A1 PCT/KR2018/000986 KR2018000986W WO2018139826A1 WO 2018139826 A1 WO2018139826 A1 WO 2018139826A1 KR 2018000986 W KR2018000986 W KR 2018000986W WO 2018139826 A1 WO2018139826 A1 WO 2018139826A1
Authority
WO
WIPO (PCT)
Prior art keywords
age
subject
value
methylation
marker
Prior art date
Application number
PCT/KR2018/000986
Other languages
English (en)
French (fr)
Inventor
이환영
홍새롬
정상은
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Publication of WO2018139826A1 publication Critical patent/WO2018139826A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2533/00Reactions characterised by the enzymatic reaction principle used
    • C12Q2533/10Reactions characterised by the enzymatic reaction principle used the purpose being to increase the length of an oligonucleotide strand
    • C12Q2533/101Primer extension
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Definitions

  • the present invention relates to a method of age estimation using DNA methylation. More specifically, the present invention relates to a method for measuring the methylation level (DNA methylation and non-methylation ratio) for a specific CpG site of a target gene in a sample from a test subject, thereby predicting the age of the test subject. will be.
  • the age of the test subject can be predicted by measuring the DNA methylation level in the saliva sample derived from the test subject and analyzing the methylation ratio using the age prediction method according to the present invention.
  • the age prediction method according to the present invention should be analyzed in comparison with the existing age prediction method for analyzing methylation of 70 or more CpG markers in a human body fluid sample or three CpG markers in saliva, but inaccurate age prediction method.
  • the number of CpG markers to be reduced is reduced to seven types, and the error range of the measured age prediction value is reduced, so that the age of the test subject can be measured quickly and accurately.
  • the age prediction method by measuring methylation of genes mainly has a characteristic of analyzing methylation in more than 70 genes when targeting blood samples (Non-Patent Document 1) or when targeting various tissues (Non-Patent Document 2). ).
  • the age prediction method by saliva or oral epithelial analysis is a method for predicting the age of a test subject by measuring methylation in three genetic markers (Non-Patent Documents 3 and 4). The accuracy is not high.
  • Non-Patent Document 1 Hannum et al., 2013, Mol. Cell, 49: 359.
  • Non-Patent Document 2 Horvath et al., 2013, Genome Biol., 14: R115.
  • Non-Patent Document 3 Bocklandt et al., 2011, PLOS ONE, 6: e14821.
  • Non-Patent Document 4 Eipel et al., 2016, AGING, 8: 1034.
  • Non-Patent Document 5 Jones and Laird, 1999, Nature Genet., 21: 163.
  • Non-Patent Document 6 Souren et al., 2013, Genome Biol., 14: R44.
  • the present invention has been made to solve the problems of the prior art as described above, the object of the present invention is to measure the methylation level and demethylation level at a specific CpG position in the saliva sample derived from the test object and the ratio of non-methylation to methylation
  • the present invention provides a method for predicting or predicting the age of a test subject therefrom.
  • the present inventors select a specific type of CpG to be analyzed in a saliva sample derived from a test subject, and measure the ratio of DNA methylation and demethylation of the selected marker to minimize the error range.
  • the prediction method was established.
  • An object of the present invention is a protein tyrosine phosphatase (non-receptor type 7), SST (somatostatin), cyclic nucleotide gated channel alpha 3 (CNGA3), KLF14 (Kruppel like factor 14), TSSK6 for saliva samples derived from the test subject.
  • CpG markers in gene targets (testis specific serine kinase 6), TBR1 (T-box, brain 1), and SLC12A5 (solute carrier family 12 member 5) (cg18384097, cg00481951, cg19671120, cg14361627, cg08928145, cg12757011, and cg07547549) provides a method for predicting the age of a test subject by measuring the DNA methylation and demethylation ratio of the test subject or a kit for predicting the age of a test subject.
  • the method of providing information about the subject's age prediction comprising a methylation assay step for a specific CpG marker of a gene in a sample obtained from a subject, the method of providing information about the subject's age prediction, wherein the gene is PTPN7 (protein tyrosine phosphatase, non-receptor type 7), SST (somatostatin), CNGA3 (cyclic nucleotide gated channel alpha 3), KLF14 (Kruppel like factor 14), TSSK6 (testis specific serine kinase 6), TBR1 (T-box , brain 1), and SLC12A5 (solute carrier family 12 member 5) provided a method for providing information on the prediction of the age of the subject, one or more genes selected from the group consisting of.
  • PTPN7 protein tyrosine phosphatase, non-receptor type 7
  • SST somatostatin
  • CNGA3 cyclic nucleotide gated channel alpha 3
  • the CpG marker is cg18384097 for PTPN7, cg00481951 for SST, cg19671120 for CNGA3, cg14361627 for KLF14, cg08928145 for TSSK6, cg12757011 for TBR1, and cg07547549 for SLC12A5
  • the methylation analysis step I is a measure of the K value, which is the ratio of methylation and unmethylation levels in each CpG marker, where the K value is Wherein B is a value measuring methylation of the CpG marker, G is a value measuring demethylation of the CpG marker, and the methylation analysis step is a K value for each marker ( And calculating the age of the subject by multiplying N), which is a coefficient for each marker, by the formula "N 1 ".
  • N 1 is -27 to -28
  • N 2 is -28.5 to -29.5
  • N 3 is 9 to 10
  • N 4 is 46.5 to 47.5
  • N 5 Is 86 to 87 the N 6 is 32 to 33
  • the N 7 is 58 to 59
  • the N 8 is 56 to 57
  • the RMSE is 4 to 5, more preferably the N 1 is -27.511 and the N 2 is -29.088, the N 3 is 9.285, the N 4 is 46
  • kits for predicting age of a subject comprising a primer set for methylation analysis of CpG markers in a gene group including PTPN7, SST, CNGA3, KLF14, TSSK6, TBR1, and SLC12A5. It was.
  • the primer set comprises a PCR primer set of SEQ ID NOs: 1 to 14 for amplifying a fragment comprising a methylated portion of a CpG marker and a Single Base Extension (SBE) for the PCR product amplified by the primer set.
  • SBE Single Base Extension
  • the CpG marker is cg18384097 for PTPN7, cg00481951 for SST, cg19671120 for CNGA3, cg14361627 for KLF14, cg08928145 for TSSK6, TBR1 For cg12757011, and cg07547549 for SLC12A5, wherein the subject-derived sample provided any one selected from the group consisting of body fluid, hair root, blood, plasma, serum and saliva.
  • An age prediction device was provided.
  • the CpG marker is cg18384097 for PTPN7, cg00481951 for SST, cg19671120 for CNGA3, cg14361627 for KLF14, cg08928145 for TSSK6, cg12757011 for TBR1, and cg07547549 for SLC12A5, in the above embodiment
  • the methylation level measurement measures the K value, which is the ratio of methylation and unmethylation levels in each CpG marker, wherein the K value is Wherein B in the formula is a measure of methylation of the marker and G is a measure of demethylation of the marker, and in this embodiment the methylation level is determined by a K value for each CpG marker ( ) And multiplying the subject's age by multiplying the N value, which is a coefficient for each CpG marker, wherein the calculating step comprises the K value for the formula " N 1 + N 2 ⁇ cg18384097 " ) + K value for N 3
  • biological sample refers to all samples that can confirm the genetic information of the test object, and preferably may be blood, plasma, serum, saliva, etc., but is not limited thereto as long as it can identify the CpG marker.
  • DNA methylation is a reaction that methylates a base at a specific position on a DNA sequence and occurs in a CpG base sequence in which cytosine and guanine are continuously present among bases constituting the gene sequence (Non-Patent Documents). 5), The methylation of the CpG base sequence is formed by DNA methyl transferase.
  • bisulfite converted DNA refers to a single-strand state DNA in which unmethylated cytosine is converted to uracil by sodium bisulfite treatment.
  • Cytosine methylated by sodium bisulfite treatment remains cytosine as it is, but unmethylated cytosine is converted to uracil, so methylation on DNA can be determined by performing a monobasic polymorphism test on bisulfite converted DNA.
  • the term "kit” refers to a screening device that checks the CpG marker associated with the age prediction of the test subject and provides information necessary for predicting the age.
  • the probe may include a probe or primer set having a sequence complementary to the bisulfite converted DNA sequence of the gene including the CpG marker, wherein the “probe” or “primer” is a CpG marker.
  • the "diagnostic device” predicts the age of the subject from the measurement result of the methylation level for the CpG markers (cg18384097, cg00481951, cg19671120, cg14361627, cg08928145, cg12757011 and cg07547549) of the genes in the saliva sample obtained from the subject.
  • the CpG markers cg18384097, cg00481951, cg19671120, cg14361627, cg08928145, cg12757011 and cg07547549.
  • PCR Polymerase Chain Reaction
  • Multiplex PCR is to carry out an experiment reaction in one tube by putting primers of several loci in one PCR reaction.
  • reagents such as taq polymerase (PCR reaction enzyme) used for analysis, and a great advantage of reducing costs by minimizing the operation of the automatic genotype capillary analyzer.
  • gene identification using DNA methylation analysis has the advantage of significant budget savings given that commercially available expensive reaction reagents are consumed.
  • studies have been actively conducted to establish a multiplex PCR system suitable for the realities of its own countries in the UK, the United States, and other developed countries.
  • the "multiplex snapshot (SNaPshot) reaction” is a primer-based single base extension (SBE) method developed for SNP analysis, which uses a single primer per SNP and analyzes up to several kinds of SNPs in a multiplex reaction. can do.
  • SNP single nucleotide polymorphism
  • SNP Single Nucleotide Polymorphism
  • Two-thirds of these SNPs are known to be mutations between C and T in the nucleotide sequence, and SNP mutations are known to occur once every 1000 in the nucleotide sequence on the genome.
  • SNPs account for about 90% of the mutations occurring in the human genome, and people with similar traits or the same family tree show the same or similar SNP patterns, so clinically susceptible to the disease of the individual. It can be used as an index for predicting and can be used as an index for predicting the effects and side effects on the drug.
  • “Discrimination” in the present invention encompasses quantitative and / or qualitative analysis, including the detection of presence, absence and determination of concentrations. Such methods are well known in the art, and those skilled in the art will appreciate methods appropriate for the practice herein. You will be able to choose. “Discrimination” in the present invention means to measure the methylation level and non-methylation level for the CpG marker of the gene target in the saliva sample derived from the test object to distinguish the age predicted for the test object.
  • the age of the test subject can be predicted by measuring the DNA methylation level in the saliva sample derived from the test subject and analyzing the methylation ratio using the age prediction method according to the present invention.
  • the number of markers to be analyzed has been reduced to seven types compared to the existing age prediction method for analyzing more than 70 DNA methylation in human body fluid samples, and the accuracy of age estimation is improved compared to the method using three CpG markers in saliva. .
  • the age prediction method according to the present invention is cheaper than the conventional various methylation analysis methods and the error range of the measured age prediction value is reduced, so that the age of the test subject can be measured quickly and accurately.
  • 1 relates to the results of measuring the methylation and demethylation levels of specific CpG positions in seven gene targets according to the present invention.
  • 2A, 2B, 2C, and 2D relate to a process of deriving an age prediction formula from methylation data of a test subject in the present invention.
  • 3 relates to variables in an age prediction model using methylation and demethylation ratios of specific CpG positions in seven gene targets according to the present invention.
  • 4A and 4B relate to the result of comparing the estimated age of the test subject calculated using the age prediction model according to the present invention with the actual age of the test subject.
  • 5A, 5B, 5C, 5D, 5E, and 5F illustrate cg00481951 for SST, cg19671120 for CNGA3, cg1967616120 for KLF14, TSSK6, for various races, according to one embodiment of the invention.
  • the present invention provides a method for providing information on the subject's age prediction, comprising a methylation assay of a CpG marker of a gene in a sample obtained from a subject, wherein the gene is PTPN7 (protein tyrosine phosphatase).
  • PTPN7 protein tyrosine phosphatase
  • non-receptor type 7 non-receptor type 7
  • SST somatostatin
  • CNGA3 cyclic nucleotide gated channel alpha 3
  • KLF14 Kruppel like factor 14
  • TSSK6 testis specific serine kinase 6
  • TBR1 T-box, brain 1
  • SLC12A5 solute carrier family 12 member 5
  • the CpG marker is cg18384097 for PTPN7, cg00481951 for SST, cg19671120 for KNGA3, cg14361627 for KLF14, cg08928145 for TSSK6, cg12757011 for TBR1, and SLC12A5 It provides a method of providing information about the age prediction of the subject, cg07547549.
  • a sample derived from a test subject used for predicting age may be blood or saliva as a sample capable of DNA methylation analysis, but is not limited thereto.
  • Gene Targets and Intragene CpG Markers Gene target CpG ID CpG location in DNA PTPN7 (protein tyrosine phosphatase, non-receptor type 7) cg18384097 chr1: 202129566 SST (somatostatin) cg00481951 chr3: 187387650 CNGA3 (cyclic nucleotide gated channel alpha 3) cg19671120 chr2: 98962974 KLF14 (Kruppel like factor 14) cg14361627 chr7: 130419116 TSSK6 (testis specific serine kinase 6) cg08928145 chr19: 19625364 TBR1 (T-box, brain 1) cg12757011 chr2: 162281111 SLC12A5 (solute carrier family 12 member 5) cg07547549 chr20: 44658225
  • PCR template bisulfite converted DNA
  • 5X Primer Mix polymerase (AmpliTaq Gold ® DNA Polymerase; purchased from Applied Biosystems, Foster City, CA), and buffers Gold ST * R 10X Buffer; purchased from Promega, Madicine, WI).
  • AmpliTaq Gold ® DNA Polymerase purchased from Applied Biosystems, Foster City, CA
  • buffers Gold ST * R 10X Buffer purchased from Promega, Madicine, WI.
  • the sequence of the CpG marker to be analyzed in the seven gene targets was confirmed, and primer hybridization temperature, and PCR product size (100-200 bp) were used for the sequence using the Methprimer program and the Pyromark 2.0 program. Primer sequences were designed by selecting similar conditions).
  • composition of the PCR mixture for carrying out multiplex PCR is shown in Table 3 below.
  • primer sequences for SBE on the product prepared according to Example 3.1 were designed by selecting similar conditions for primer hybridization temperature using the BatchPrimer3 program.
  • composition and reaction conditions of the enzyme treatment reactants for the SBE reaction products are shown in Tables 8 and 9 below.
  • Materials required for conducting capillary electrophoresis include dry heating blocks, water baths or thermal cyclers, 3130 capillaries (33 cm x 50 ⁇ m; Applied Biosystems, Foster City, CA), execution optimize polymer (Performance optimized polymer; POP4, Applied Biosystems, Foster City, CA), standard matrix set (DS-02 'dR110, dR6G , dTAMRA TM dROX TM LIZ® Dyes'; Applied Biosystems, Foster City, CA), run Module GS STR POP4 (1 mL) E5, GeneScan TM 120 LIZ TM Size Standard, and Hi-Di TM Formamide (Applied Biosystems, Foster City, CA).
  • Matrix preparation was performed according to the manufacturer's manual.
  • Electrophoresis results were verified using 3130 data acquisition software.
  • the multiplex methylated SNaPshot products according to the present invention were measured for methylation and unmethylation levels in target genes using electrophoresis by electrophoresis. Since all SBE primers were made in the reverse direction, the blue peak represents nucleotide G as the methylation signal and the green peak represents nucleotide A as the unmethylated signal (see FIG. 1).
  • Methylation data for seven CpGs were obtained from 226 saliva samples derived from the Multiplex SNaPshot procedure. The set of 226 subjects was randomly divided into half and one set was divided into a training set for deriving a formula, and the other set was divided into a testing set for verifying a derived formula (see Table 13).
  • Table 13 shows only the results for 15 people.
  • DNA set methylation data from 113 training sets and 7 CpG markers were subjected to multivariate linear regression analysis using IBM's SPSS 23.0 (FIGS. 2A, 2B, 2C, and 2D). The results are summarized (see Table 14).
  • age was estimated using DNA methylation data from 113 testing sets and compared with the actual age.
  • the mean absolute deviation from chronological age (MAD) of the actual age and the estimated age was about 3 years old in both the training set and the test set, and it was confirmed that very accurate age estimation was possible.
  • Example 5.1 The methylation, non-methylation analysis results according to Example 5.1 and the process of Example 5.2 to build an age prediction model as shown in Table 15 (see dotted line in Figure 2d).
  • Age prediction model Target ID Methylation Coefficient Age prediction calculation (Intercept) (intercept) -27.511 27.511 + (-29.088) ⁇ cg18384097 + 9.285 ⁇ cg00481951 + 46.992 ⁇ cg19671120 + 86.268 ⁇ cg14361627 + 32.211 ⁇ cg08928145 + 58.699 ⁇ cg12757011 + 56.384 ⁇ cg07547549 ⁇ 2 RMSE cg18384097 -29.088 cg00481951 9.285 cg19671120 46.992 cg14361627 86.268 cg08928145 32.211 cg12757011 58.699 cg07547549 56.384
  • B indicates the height of the blue peak indicating methylation
  • G indicates the height of the green peak indicating unmethylation (see FIG. 1). Values such as B or G are in the range of 0 to 1.
  • CpG markers e.g., cg18384097
  • CpG markers described in predictive age calculations have corresponding methylation values.
  • Root mean square error (RMSE) of Table 13 and Table 15 is a value related to the error between the predicted age and the actual age in the age prediction model according to the present invention, the RMSE value of the present invention is 4.16.
  • FIGS. 4A and 4B 226 samples of the test subjects of Example 5.2 were calculated by applying the age prediction model shown in Table 13 and analyzed (see FIGS. 4A and 4B).
  • Figure 4a is derived from the set used to derive the age prediction model equation as a training set.
  • the horizontal axis represents the actual age
  • the vertical axis represents the estimated age
  • the training set has a mean absolute deviation (MAD) of 3.13 years and an RMSE of 4.16 years.
  • FIG. 4B is a testing set for verifying a model, and the configuration of the graph is the same as that of FIG.
  • the testing set was similar to the training set with MAD of 3.15 and Error of 4.34, so it was confirmed that the error was less and accurately measured in comparison with the existing methods.
  • the methylation and non-methylation levels were measured by targeting seven markers compared to the CpG marker types used in the existing age prediction method, thereby constructing an age prediction model as described in Table 15 above.
  • the age prediction method according to the present invention it is possible to accurately predict the age of the test object by improving the error range more quickly and at a lower cost than the existing age prediction method (eg, pyrosequencing).
  • HumanMethylation 450K (Illumina, San Diego, Calif.), which provides methylation information for the CpG site, is a DNA methylation microarray using Infinium (R) Human Methylation 450K BeadChip. Amplified sulfite treated DNA, followed by fragmentation, precipitation and resuspension, then hybridized with the HumanMethylation450 bead array, and then scanned into the Illumina iSCAN system according to the manufacturer's protocol.
  • age estimation is performed using a method of providing information about age prediction not only in Korean but also in various other races. It was confirmed that it is possible.
  • the present invention relates to a method of age estimation using DNA methylation.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 DNA 메틸화를 이용한 연령 예측 방법에 관한 것이다. 보다 상세하게는, 본 발명은 검사 대상 유래의 시료 내 표적 유전자의 CpG 마커에 대한 메틸화 수준(DNA 메틸화 및 비메틸화 비율)을 측정하여 이로부터 검사 대상의 연령을 예측하는 방법에 관한 것이다.

Description

DNA 메틸화를 이용한 연령 예측 방법
본 발명은 DNA 메틸화를 이용한 연령 추정 방법에 관한 것이다. 보다 상세하게는, 본 발명은 검사 대상 유래의 시료 내 표적 유전자의 특정 CpG 위치(site)에 대한 메틸화 수준(DNA 메틸화 및 비메틸화 비율)을 측정하여 이로부터 검사 대상의 연령을 예측하는 방법에 관한 것이다.
본 발명에 따른 연령 예측 방법을 사용하여 검사 대상 유래의 타액(saliva) 시료 내 DNA 메틸화 수준을 측정 및 메틸화 비율을 분석함으로서 검사 대상의 연령을 예측할 수 있다. 특히, 인체 체액 시료 내 70개 이상의 CpG 마커에 대해 메틸화를 분석하는 기존 연령 예측 방법이나 타액 내에서 3개의 CpG 마커를 이용하지만 정확도가 떨어지는 연령 예측 방법에 비해 본 발명에 따른 연령 예측 방법에서는 분석해야 할 CpG 마커의 종류가 7가지로 축소되고 측정된 연령 예측 수치의 오차범위가 감소되어 검사 대상의 연령을 빠르고 정확하게 측정할 수 있다.
법과학 및 법의학 분야에서, 범죄 현장에서 발견되는 다양한 생물학적 증거물은 법적 효력이 있는 증거의 확보, 수사의 진행 방향 설정, 사망의 원인 및 종류의 규명, 사후 시간 추정, 사건의 용의자 및 범죄인의 검거 등에서 중요한 역할을 한다. 그러나, 피의자가 특정되지 않은 사건의 경우, 증거물로부터 DNA 유전자형 결과를 효과적으로 얻었다 하더라도 이 분석결과와 DNA database 상에 일치하는 용의자가 나타나지 않으면 그 사건은 미제로 남게 된다. 따라서, 증거물로부터 범죄 용의자와 관련된 추가적인 정보를 얻기 위하여 유럽 등 서구에서는 피부, 머리카락, 홍채 등의 색상 유전정보 분석을 통해 용의자를 추정할 수 있는 방법이 개발되었고, 일부 국가에서는 이를 수사에 사용하고 있다. 그러나, 우리나라를 포함한 아시아 지역에서는 이의 효과적 적용이 불가능한 실정이다.
이에 비하여 나이를 추정하여 용의자의 범위를 좁히는 것은 민족이나 집단에 상관없이 적용 가능하기 때문에 최근 많은 연구가 이루어지고 있으며, 지금까지 연령 추정에 가장 효과적인 바이오마커는 DNA 메틸화 마커로 알려져 있다.
유전자의 메틸화 측정에 의한 연령 예측 방법은 주로 혈액 시료를 대상으로 하거나(비특허문헌 1), 다양한 조직을 대상으로 하는 경우 70개 이상의 유전자 내 메틸화를 분석해야 하는 특성을 가지고 있다(비특허 문헌 2). 혈액이나 조직 분석에 비해 상대적으로 간편한 방법으로서, 타액 또는 구강 상피 분석에 의한 연령 예측 방법은 3개의 유전자 마커 내 메틸화를 측정하여 검사 대상의 연령을 예측하는 방법(비특허문헌 3 및 4)에 관한 것으로 정확도가 높지 않은 편이다.
이에, 연령 예측에 필요한 최소한의 유전자 마커 또는 유전자 내의 특정 CpG 위치 선별 및 상기 마커에 대한 메틸화를 분석하여 빠르고 정확하게 연령을 예측하는 방법이 필요한 실정이다.
(비특허문헌 1)Hannum et al., 2013, Mol. Cell, 49: 359.
(비특허문헌 2)Horvath et al., 2013, Genome Biol., 14: R115.
(비특허문헌 3)Bocklandt et al., 2011, PLOS ONE, 6: e14821.
(비특허문헌 4)Eipel et al., 2016, AGING, 8: 1034.
(비특허문헌 5)Jones and Laird, 1999, Nature Genet., 21: 163.
(비특허문헌 6)Souren et al., 2013, Genome Biol., 14: R44.
본 발명은 상기와 같은 종래의 기술 상의 문제점을 해결하기 위해 안출된 것으로, 본 발명의 목적은 검사 대상 유래의 타액 시료 내 특정 CpG 위치에서의 메틸화 수준 및 비메틸화 수준을 측정하고 메틸화 대비 비메틸화 비율을 분석하여 이로부터 검사 대상의 연령을 예측하는 방법 또는 연령 예측용 키트를 제공하는데 있다.
그러나 본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 과제에 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당 업계에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명자들은 상기 과제를 해결하기 위하여, 검사 대상 유래의 타액 시료 내 분석 대상인 특정한 CpG의 종류를 선별하고, 선별된 마커의 DNA 메틸화 및 비메틸화의 비율을 측정함으로써 오차범위를 최소화시킨 검사 대상의 연령 예측 방법을 구축하였다.
이하, 본원에 기재된 다양한 구체예가 도면을 참조로 기재된다. 하기 설명에서, 본 발명의 완전한 이해를 위해서, 다양한 특이적 상세사항, 예컨대, 특이적 형태, 조성물 및 공정 등이 기재되어 있다. 그러나, 특정의 구체예는 이들 특이적 상세 사항 중 하나 이상 없이, 또는 다른 공지된 방법 및 형태와 함께 실행될 수 있다. 다른 예에서, 공지된 공정 및 제조 기술은 본 발명을 불필요하게 모호하게 하지 않게 하기 위해서, 특정의 상세사항으로 기재되지 않는다. "한 가지 구체예" 또는 "구체예"에 대한 본 명세서 전체를 통한 참조는 구체예와 결부되어 기재된 특별한 특징, 형태, 조성 또는 특성이 본 발명의 하나 이상의 구체예에 포함됨을 의미한다. 따라서, 본 명세서 전체에 걸친 다양한 위치에서 표현된 "한 가지 구체예에서" 또는 "구체예"의 상황은 반드시 본 발명의 동일한 구체예를 나타내지는 않는다. 추가로, 특별한 특징, 형태, 조성, 또는 특성은 하나 이상의 구체예에서 어떠한 적합한 방법으로 조합될 수 있다.
출원서 내 특별한 정의가 없으면 본 출원서에 사용된 모든 과학적 및 기술적인 용어는 본 발명이 속하는 기술분야에서 당업자에 의하여 통상적으로 이해되는 것과 동일한 의미를 가진다.
본 발명의 목적은 검사 대상 유래의 타액 시료에 대하여 PTPN7(protein tyrosine phosphatase, non-receptor type 7), SST(somatostatin), CNGA3(cyclic nucleotide gated channel alpha 3), KLF14(Kruppel like factor 14), TSSK6(testis specific serine kinase 6), TBR1(T-box, brain 1), 및 SLC12A5(solute carrier family 12 member 5)를 포함하는 유전자 표적 내 CpG 마커(cg18384097, cg00481951, cg19671120, cg14361627, cg08928145, cg12757011, 및 cg07547549)의 DNA 메틸화 및 비메틸화 비율을 측정하여 검사 대상의 연령을 예측하는 방법 또는 검사 대상의 연령 예측용 키트를 제공하는 것이다.
본 발명의 일 구체예에서 대상자(subject)로부터 수득한 시료 내 유전자의 특정 CpG 마커에 대한 메틸화 분석(methylation assay) 단계를 포함하는, 대상자의 연령 예측에 관한 정보를 제공하는 방법으로서, 상기 유전자는 PTPN7(protein tyrosine phosphatase, non-receptor type 7), SST(somatostatin), CNGA3(cyclic nucleotide gated channel alpha 3), KLF14(Kruppel like factor 14), TSSK6(testis specific serine kinase 6), TBR1(T-box, brain 1), 및 SLC12A5(solute carrier family 12 member 5)로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자인, 대상자의 연령 예측에 관한 정보를 제공하는 방법을 제공하였다.
상기 구체예에서, 상기 CpG 마커는 PTPN7에 대한 cg18384097, SST에 대한 cg00481951, CNGA3에 대한 cg19671120, KLF14에 대한 cg14361627, TSSK6에 대한 cg08928145, TBR1에 대한 cg12757011, 및 SLC12A5에 대한 cg07547549이고, 상기 메틸화 분석 단계는 각각의 CpG 마커 내 메틸화 및 비메틸화 수준의 비율인 K 값을 측정하는 것으로서 상기 K 값은 수식
Figure PCTKR2018000986-appb-I000001
으로 표현되고 상기 수식 내 B는 CpG 마커의 메틸화를 측정한 수치이며 상기 G는 CpG 마커의 비메틸화를 측정한 수치이며, 상기 메틸화 분석 단계는 각각의 마커에 대한 K 값(
Figure PCTKR2018000986-appb-I000002
)과 각각의 마커에 대한 계수(Coefficient)인 N 값을 곱하여 대상자의 연령을 산출하는 단계를 추가로 포함하는, 대상자의 연령 예측에 관한 정보를 제공하는 방법으로서, 상기 산출 단계는 수식 "N1 + N2×cg18384097에 대한 K 값(
Figure PCTKR2018000986-appb-I000003
) + N3×cg00481951에 대한 K 값(
Figure PCTKR2018000986-appb-I000004
) + N4×cg19671120에 대한 K 값(
Figure PCTKR2018000986-appb-I000005
) + N5×cg14361627에 대한 K 값(
Figure PCTKR2018000986-appb-I000006
) + N6×cg08928145에 대한 K 값(
Figure PCTKR2018000986-appb-I000007
) + N7×cg12757011에 대한 K 값(
Figure PCTKR2018000986-appb-I000008
) + N8×cg07547549에 대한 K 값(
Figure PCTKR2018000986-appb-I000009
) ± 2 RMSE"이며, 상기 구체예에서 상기 N1은 -27 내지 -28이고 상기 N2는 -28.5 내지 -29.5이며 상기 N3은 9 내지 10이며 상기 N4는 46.5 내지 47.5이며 상기 N5는 86 내지 87이며 상기 N6는 32 내지 33이며 상기 N7은 58 내지 59이며 상기 N8은 56 내지 57이며 상기 RMSE는 4 내지 5이며, 더욱 바람직하게는 상기 N1은 -27.511이고 상기 N2는 -29.088이며 상기 N3은 9.285이며 상기 N4는 46.992이며 상기 N5는 86.268이며 상기 N6는 32.211이며 상기 N7은 58.699이며 상기 N8은 56.384이며 상기 RMSE는 4.16이며, 상기 구체예에서 상기 대상자로부터 수득한 시료는 체액, 모근, 혈액, 혈장, 혈청 및 타액(saliva)으로 구성된 군으로부터 선택된 어느 하나인, 대상자의 연령 예측에 관한 정보를 제공하는 방법을 제공하였다.
본 발명의 다른 구체예에서, PTPN7, SST, CNGA3, KLF14, TSSK6, TBR1, 및 SLC12A5를 포함하는 유전자군 내의 CpG 마커의 메틸화 분석용 프라이머 세트를 포함하는 대상자(subject)의 연령 예측용 키트를 제공하였다. 상기 구체예에서, 상기 프라이머 세트는 CpG 마커의 메틸화된 부분을 포함하는 단편을 증폭하기 위한 서열번호 1 내지 14의 PCR 프라이머 세트 및 상기 프라이머 세트에 의해 증폭된 PCR 산물에 대한 SBE(Single Base Extension) 반응을 실시하기 위한 서열번호 16 내지 21의 프라이머 세트이며, 상기 구체예에서, 상기 CpG 마커는 PTPN7에 대한 cg18384097, SST에 대한 cg00481951, CNGA3에 대한 cg19671120, KLF14에 대한 cg14361627, TSSK6에 대한 cg08928145, TBR1에 대한 cg12757011, 및 SLC12A5에 대한 cg07547549이고, 상기 구체예에서 상기 대상자 유래 시료는 체액, 모근, 혈액, 혈장, 혈청 및 타액으로 구성된 군으로부터 선택된 어느 하나인, 대상자의 연령 예측용 키트를 제공하였다.
본 발명의 또 다른 구체예에서, 대상자(subject)로부터 수득한 시료 내 유전자의 메틸화 수준을 측정하는 분석부; 및 상기 메틸화 수준 측정 결과로부터 대상자의 연령을 계산하는 산출부를 포함하는 연령 예측용 기기로서, 상기 유전자는 PTPN7, SST, CNGA3, KLF14, TSSK6, TBR1, 및 SLC12A5로 이루어진 군으로부터 선택된 하나 이상의 유전자인 대상자의 연령 예측용 기기를 제공하였다. 상기 구체예에서, 상기 CpG 마커는 PTPN7에 대한 cg18384097, SST에 대한 cg00481951, CNGA3에 대한 cg19671120, KLF14에 대한 cg14361627, TSSK6에 대한 cg08928145, TBR1에 대한 cg12757011, 및 SLC12A5에 대한 cg07547549이고, 상기 구체예에서 상기 메틸화 수준 측정은 각각의 CpG 마커 내 메틸화 및 비메틸화 수준의 비율인 K 값을 측정하는 것으로서 상기 K 값은 수식
Figure PCTKR2018000986-appb-I000010
으로 표현되고 상기 수식 내 B는 마커의 메틸화를 측정한 수치이며 상기 G는 마커의 비메틸화를 측정한 수치이며, 상기 구체예에서 상기 메틸화 수준 측정은 각각의 CpG 마커에 대한 K 값(
Figure PCTKR2018000986-appb-I000011
)과 각각의 CpG 마커에 대한 계수(Coefficient)인 N 값을 곱하여 대상자의 연령을 산출하는 단계를 추가로 포함하며, 상기 산출 단계는 수식 "N1 + N2×cg18384097에 대한 K 값(
Figure PCTKR2018000986-appb-I000012
) + N3×cg00481951에 대한 K 값(
Figure PCTKR2018000986-appb-I000013
) + N4×cg19671120에 대한 K 값(
Figure PCTKR2018000986-appb-I000014
) + N5×cg14361627에 대한 K 값(
Figure PCTKR2018000986-appb-I000015
) + N6×cg08928145에 대한 K 값(
Figure PCTKR2018000986-appb-I000016
) + N7×cg12757011에 대한 K 값(
Figure PCTKR2018000986-appb-I000017
) + N8×cg07547549에 대한 K 값(
Figure PCTKR2018000986-appb-I000018
) ± 2 RMSE"이며, 상기 구체예에서 상기 N1은 -27 내지 -28이고 상기 N2는 -28.5 내지 -29.5이며 상기 N3는 9 내지 10이며 상기 N4는 46.5 내지 47.5이며 상기 N5는 86 내지 87이며 상기 N6는 32 내지 33이며 상기 N7은 58 내지 59이며 상기 N8은 56 내지 57이며 상기 RMSE 는 4 내지 5이며, 더욱 바람직하게는 상기 N1은 -27.511이고 상기 N2는 -29.088이며 상기 N3는 9.285이며 상기 N4는 46.992이며 상기 N5는 86.268이며 상기 N6는 32.211이며 상기 N7은 58.699이며 상기 N8은 56.384이며 상기 RMSE는 4.16이며, 상기 구체예에서 상기 대상자로부터 수득한 시료는 체액, 모근, 혈액, 혈장, 혈청 및 타액으로 구성된 군으로부터 선택된 어느 하나인, 대상자의 연령 예측용 기기를 제공하였다.
본 발명에서 "생물학적 시료"란 검사 대상의 유전자 정보를 확인할 수 있는 모든 시료를 의미하며, 바람직하게는 혈액, 혈장, 혈청, 타액 등일 수 있으나 CpG 마커를 확인할 수 있는 종류라면 이에 제한되지 않는다.
본 발명에서 "DNA 메틸화"란 DNA 서열상의 특정한 위치의 염기(base)를 메틸화시키는 반응으로서 유전자 서열을 구성하는 염기 중 시토신과 구아닌이 연속해서 존재하는 CpG 염기서열에 발생하는 과정이며(비특허문헌 5), 상기 CpG 염기서열의 메틸화는 DNA 메틸 전이효소에 의해 형성된다. 또한, bisulfite converted DNA는 sodium bisulfite 처리하여 비메틸화된 시토신이 우라실로 변환된 single-strand 상태의 DNA를 의미한다. Sodium bisulfite 처리에 의하여 메틸화된 시토신은 그대로 시토신으로 남지만 비메틸화된 시토신은 우라실로 변환되므로, DNA 상의 메틸화 여부는 bisulfite converted DNA를 대상으로 단일염기다형성 검사를 수행하여 알 수 있다.
본 발명에서, "키트"란 검사 대상의 연령 예측과 연관 관계를 가지고 있는 CpG 마커를 확인하여 연령 예측에 필요한 정보를 제공하는 검진용 기기를 의미하며, 생물학적 시료로부터 상기 CpG 마커의 DNA 메틸화 비율을 확인할 수 있는 형태라면 제한이 없다. 바람직하게는 상기 CpG 마커가 포함된 유전자의 bisulfite converted DNA 염기서열에 대하여 상보적인 서열을 가지는 프로브(probe) 또는 프라이머(primer) 세트를 포함할 수 있으며, 상기 "프로브" 또는 "프라이머"는 CpG 마커를 포함한 유전자의 bisulfite converted DNA 염기서열과 특이적으로 결합할 수 있는 상보적인 서열을 가지는 올리고뉴클레오타이드(oliogonucleotide)를 의미하며, 본 발명의 연령 예측 모델에 필요한 CpG 마커 cg18384097, cg00481951, cg19671120, cg14361627, cg08928145, cg12757011 및 cg07547549의 메틸화 수준을 확인할 수 있는 서열이라면 제한이 없다. 본 발명에서 "진단 기기"는 대상자(subject)로부터 수득한 타액 시료 내 유전자의 CpG 마커(cg18384097, cg00481951, cg19671120, cg14361627, cg08928145, cg12757011 및 cg07547549)에 대한 메틸화 수준의 측정 결과로부터 대상자의 연령을 예측하는 기기로서, 대상자 유래 시료에 대한 CpG 마커의 메틸화 수준을 측정하여 대상자의 연령을 예측할 수 있는 기기라면 제한이 없다.
본 발명에서 "중합효소연쇄반응(PCR, Polymerase Chain Reaction)"은 아주 적은 양의 DNA 만으로도 특정 부위의 DNA 염기서열을 기하급수적으로 증폭시킬 수 있는 간단하고 편리한 방법으로, 증폭하고자 하는 DNA에 특이적으로 결합하여 고온에서도 안정한 Taq DNA 중합효소를 사용하여 변성(denaturation), 어닐링(annealing), 연장(extension)의 과정을 반복적으로 실행함으로써 특정 DNA를 증폭시키게 된다. PCR을 이용한 목적 유전자의 검출은 유전자를 인식하는 프라이머를 이용하여 이를 증폭 및 확인하는 것이다.
본 발명에서 "멀티플렉스 PCR(Multiplex PCR)"이란 한번의 PCR 반응으로 여러 유전좌위들(loci)의 프라이머를 넣고 한 튜브 내에서 실험 반응을 수행하는 것으로서, 멀티플렉스 PCR 시스템을 사용하게 되면 감정인력 및 분석에 사용되는 taq 폴리머라아제(PCR 반응효소) 등 각종의 시약류의 절감 효과와 함께 유전자형 모세관 자동분석기의 가동을 최소화시켜 비용을 줄일 수 있는 큰 장점이 있다. 특히, DNA 메틸화 분석을 이용한 유전자 감식에는 상용화된 고가의 반응시약류들이 소모되는 것을 감안할 때 예산상의 절감효과도 상당히 거둘 수 있는 장점을 지니고 있다. 이렇듯 멀티플렉스 PCR 시스템이 가지는 인력, 예산 면에서의 효용가치로 인하여 유전자감식을 선도하는 영국, 미국을 비롯한 선진국가에서는 자국의 현실에 맞는 멀티플렉스 PCR 시스템을 확립하려는 연구가 활발히 이루어져 왔다.
본 발명에서 "멀티플렉스 스냅샷(SNaPshot) 반응"이란 SNP 분석을 위해 개발된 프라이머-기반 SBE(Single Base Extension) 방법으로서 하나의 SNP당 단일 프라이머를 사용하며 멀티플렉스 반응에서 수십 종류의 SNP까지 분석할 수 있다. 상기 "단일염기다형성(SNP, Single Nucleotide Polymorphism)"이란 인간 유전자 변이의 가장 일반적인 형태로, 유전체(genome) 상에서 A, T, C, G로 구성되는 염기서열의 한 개가 다른 염기서열로 변한 것을 말한다. 이러한 SNP의 2/3는 염기서열 중 C와 T 간의 변이인 것으로 알려져 있고, SNP 변이는 보통 유전체 상의 염기서열에서 1000개당 한번 꼴로 나타난다고 알려져 있다. 또한, SNP는 인간의 유전체에서 발생하는 변이의 약 90%를 차지하고 있고, 비슷한 형질이나 같은 가계도를 가지고 있는 사람들은 동일하거나 또는 비슷한 SNP 패턴을 보이기 때문에, 임상에서 개체의 질병에 대한 감수성(susceptibility)을 예측하는 지표로 사용될 수 있고, 약물에 대한 효과 및 부작용을 예측할 수 있는 지표로도 사용될 수 있다.
본 발명에서 "판별"이란 정량 및/또는 정성 분석을 포함하는 것으로, 존재, 부존재의 검출 및 농도 측정을 포함하는 것으로 이러한 방법은 당업계에 공지되어 있으며, 당업자라면 본원의 실시를 위해 적절한 방법을 선택할 수 있을 것이다. 본 발명에서의 "판별"은 검사대상 유래의 타액 시료 내 유전자 표적의 CpG 마커에 대하여 메틸화 수준 및 비메틸화 수준을 측정하여 검사 대상에 대하여 예측되는 연령을 구분하는 것을 의미한다.
본 발명에 따른 연령 예측 방법을 사용하여 검사 대상 유래의 타액(saliva) 시료 내 DNA 메틸화 수준을 측정 및 메틸화 비율을 분석함으로써 검사 대상의 연령을 예측할 수 있다.
특히, 인체 체액 시료 내 70개 이상의 DNA 메틸화를 분석하는 기존 연령 예측 방법에 비해 분석해야 할 마커의 종류가 7가지로 축소되고, 타액에서 3개의 CpG 마커를 이용한 방법에 비해서 연령 추정의 정확도가 높아졌다. 본 발명에 따른 연령 예측 방법은 기존의 다양한 메틸화 분석 방식에 비해 더 저렴하고 측정된 연령 예측 수치의 오차범위가 축소되어 검사 대상의 연령을 빠르고 정확하게 측정할 수 있다.
도 1은 본 발명에 따른 7가지 유전자 표적 내 특정 CpG 위치의 메틸화 및 비메틸화 수준을 측정한 결과에 관한 것이다.
도 2a, 도 2b, 도 2c, 및 도 2d는 본 발명에서 검사 대상의 메틸화 데이터로부터 연령 예측 수식을 도출하는 과정에 관한 것이다.
도 3은 본 발명에 따른 7가지 유전자 표적 내 특정 CpG 위치의 메틸화 및 비메틸화 비율을 이용한 연령 예측 모델에서의 변수에 관한 것이다.
도 4a, 및 도 4b는 본 발명에 따른 연령 예측 모델을 사용하여 계산된 검사 대상의 추정 연령을 검사 대상의 실제 연령과 비교한 결과에 관한 것이다.
도 5a, 도 5b, 도 5c, 도 5d, 도 5e, 및 도 5f는 본 발명의 일 실시형태에 따라, 다양한 인종을 대상으로, SST에 대한 cg00481951, CNGA3에 대한 cg19671120, KLF14에 대한 cg14361627, TSSK6에 대한 cg08928145, TBR1에 대한 cg12757011, 및 SLC12A5에 대한 cg07547549에 대하여 실제 연령과 메틸화 수준을 나타낸 결과에 관한 것이다.
본 발명은 대상자(subject)로부터 수득한 시료 내 유전자의 CpG 마커에 대한 메틸화 분석(methylation assay) 단계를 포함하는, 대상자의 연령 예측에 관한 정보를 제공하는 방법으로서, 상기 유전자는 PTPN7(protein tyrosine phosphatase, non-receptor type 7), SST(somatostatin), CNGA3(cyclic nucleotide gated channel alpha 3), KLF14(Kruppel like factor 14), TSSK6(testis specific serine kinase 6), TBR1(T-box, brain 1), 및 SLC12A5(solute carrier family 12 member 5)이고, 상기 CpG 마커는 PTPN7에 대한 cg18384097, SST에 대한 cg00481951, CNGA3에 대한 cg19671120, KLF14에 대한 cg14361627, TSSK6에 대한 cg08928145, TBR1에 대한 cg12757011, 및 SLC12A5에 대한 cg07547549인, 대상자의 연령 예측에 관한 정보를 제공하는 방법을 제공한다.
이하, 본 발명을 하기의 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예에 의해 한정되는 것은 아니다.
본 발명에서 연령 예측에 사용하는 검사 대상 유래의 시료는 DNA 메틸화분석이 가능한 시료로서 혈액, 또는 타액일 수 있으나 이에 제한되지는 않는다.
[실시예 1]
분석 대상(CpG 마커)의 선별
다양한 연령대 54명의 피험자로부터 얻은 타액 DNA를 대상으로 Illumina사의 HumanMethylation450 Beadchip array를 수행하여 45만개가 넘는 CpG 마커의 나이에 따른 메틸화 및 비메틸화 변이를 분석하고, 이러한 변이에 대하여 실제 나이와 연관도(correlation)가 높은 순으로 62개의 CpG 마커 후보를 선정하였다. 연령 추정 모델 구축을 위하여 이들 62개 CpG를 대상으로 stepwise linear regression analysis를 수행하여 이 중 통계적 의미가 있는 4개의 CpG 마커를 우선 선정하였고, 후보 마커 중 여기에 포함되지 않았으나 나이와 연관도가 매우 높은 2개의 마커와 기존에 혈액과 타액의 구분에 사용되었던 1개의 CpG 마커를 추가로 선정하였다. 세포 타입 구분 마커(cg18384097)의 경우는 기존에 보고된 문헌(비특허문헌 6)을 참고로 하여 선정하였다. 그 결과, 타액에서 나이와 연관성을 보이는 CpG 마커 6개와 세포 타입 특이적 CpG 마커 1개를 포함하여 총 7개의 CpG 마커를 분석 대상으로 확정하였다(표 1 참조).
유전자 표적 및 유전자 내 CpG 마커
유전자 표적 CpG ID DNA 내의 CpG 위치
PTPN7(protein tyrosine phosphatase, non-receptor type 7) cg18384097 chr1:202129566
SST(somatostatin) cg00481951 chr3:187387650
CNGA3(cyclic nucleotide gated channel alpha 3) cg19671120 chr2:98962974
KLF14(Kruppel like factor 14) cg14361627 chr7:130419116
TSSK6(testis specific serine kinase 6) cg08928145 chr19:19625364
TBR1(T-box, brain 1) cg12757011 chr2:162281111
SLC12A5(solute carrier family 12 member 5) cg07547549 chr20:44658225
[실시예 2]
멀티플렉스 PCR
2.1 실험 재료
상기의 방법으로 선별된 7개의 유전자 표적에 대한 동시 분석에 의해 검사 대상의 연령 예측에 사용 가능한지를 검증하기 위하여, 멀티플렉스 PCR을 실시하였다.
멀티 플렉스 PCR을 진행하기 위해 필요한 실험 재료는 bisulfite converted DNA (PCR template), 5X 프라이머 혼합물(Primer Mix), 중합효소(AmpliTaq Gold® DNA Polymerase; Applied Biosystems, Foster City, CA 로부터 구입), 및 완충액(Gold ST*R 10X Buffer; Promega, Madicine, WI 로부터 구입)이다.
7개 유전자 표적 내 분석 대상인 CpG 마커의 서열을 확인하였고, 상기 서열에 대하여 메쓰프라이머(Methprimer) 프로그램과 파이로마크 2.0(Pyromark 2.0) 프로그램을 사용하여 프라이머 혼성화 온도, 및 PCR 생성물 크기(100~200bp 내외)에 대한 유사한 조건을 선정하여 프라이머 서열을 디자인하였다.
멀티플렉스 PCR을 실시하기 위한 5X 프라이머 혼합물의 서열 및 구성은 하기 표 2와 같다.
5X 프라이머 혼합물(Primer Mix)
표적 ID 프라이머명칭 서열(5'→3') 농도(μM) 증폭사이즈(bp) 서열번호
cg18384097_PTPN7 PTPN7-F TTG TTT TAG TAA GTA TTT GAA GGG G 1.0 167 1
PTPN7-R CAT CAA ATC TAT AAA CAC CCA TAC C 1.0 2
cg00481951_SST SST-F AGG TGA GTT TTT ATT TGG TAT TTA AGA AA 3.0 198 3
SST-R TTT AAA TTA CCC CTT TAC CCT AAT C 3.0 4
cg19671120_CNGA3 CNGA3-F GGA GAG GGA GGT TAT AGG TTT TTT 3.0 162 5
CNGA3-R TCC TTA CCC TAC CAA AAT TTA AAC TT 3.0 6
cg14361627_KLF14 KLF14-F AGG TTG TTG TAA TTT AGA AGT TT 3.0 114 7
KLF14-R ATA TTT AAC AAC CTC AAA AAT TAT CTT ATC 3.0 8
cg08928145_TSSK6 TSSK6-F AGG GAA GYG GAA GGG AAA AAG 5.0 141 9
TSSK6-R ACT AAA AAC CRA ATA ATT CCA ACC ATT CCT 5.0 10
cg12757011_TBR1 TBR1-F GGG TGG GTT TAG GTT TTA GAG TTA 5.0 188 11
TBR1-R ATA AAA TTA TCC TCC TAC AAT TCC C 5.0 12
cg07547549_SLC12A5 SLC12A5-F GGT TTA GTT AAT TTA AGT TAG TT 15.0 129 13
SLC12A5-R AAA CTC AAC TCC ATT AAA ATA CTC C 15.0 14
2.2 실험 방법
멀티플렉스 PCR을 실시하기 위한 PCR 혼합물의 조성은 하기 표 3와 같다.
PCR 혼합물 내 구성요소
PCR 구성요소 부피(㎕)
증류수 ~ 12.4
10X Gold ST*R Buffer 2
5X Primer Mix 4
AmpliTaq Gold (5 U/uL) 0.6(30 U)
Bisulfite converted DNA (10-20 ng) 1 (~ 4)
전체(Total) 20
멀티플렉스 PCR을 실시하는 조건은 하기 표 4와 같다.
멀티플렉스 PCR 조건
단계 온도 시간 사이클 수
1 95 11분 1
2 94 20초 35
3 56 60초
4 72 30초
5 72 7분 1
6 4 연속 soak
[실시예 3]
PCR 반응 후 처리
3.1 멀티플렉스 PCR 생성물의 효소 정제
멀티플렉스 PCR 생성물의 효소(SAP 또는 CIP) 정제에 필요한 구성 요소 및 반응 조건은 하기 표 5와 같다.
효소 정제용 반응물의 구성 및 조건
재료 부피 구분 온도 시간
PCR 생성물 5 ㎕ 단계 1 37 45분
ExoSAP-IT® (USB, Cleveland, OH) 1 ㎕ 단계 2 80 15분
3.2 멀티플렉스 스냅샷(SNaPshot)
반응에 필요한 재료는 3가지로서 10X SBE Primer Mix, 5X Sequencing buffer_BigDye Termination (Applied Biosystems, Foster City, CA), SNaPshotTM Kit (Applied Biosystems, Foster City, CA)이고, 10X SBE 프라이머 혼합물의 조성은 하기 표 6과 같다.
상기 실시예 3.1에 따라 제조된 생성물에 대하여 SBE용 프라이머 서열을 제작하기 위해, 배치프라이머 3(BatchPrimer3) 프로그램을 사용하여 프라이머 혼성화 온도에 대한 유사한 조건을 선정하여 프라이머 서열을 디자인하였다.
10X SBE 프라이머 혼합물(Primer Mix)의 조성
표적 ID 프라이머 명칭 서열(5'→ 3') 농도(uM) 길이(nt, necleotide) 서열번호
PTPN7_cg18384097 PTPN7-SBE CAT ACC CCA ACC AAA CAC TAT AAC 4.0 24 15
SST_cg00481951 SST-SBE (T)9 CCA AAA TCA ACA CCA AAA ATA AAC 10.0 33 16
CNGA3_cg19671120 CNGA3-SBE (T)17 CTA CCA AAA TTT AAA CTT CTC C 10.0 39 17
KLF14_cg14361627 KLF14-SBE (T)19 TTA ACA ACC TCA AAA ATT ATC TTA TCT CC 2.0 48 18
TSSK6_cg08928145 TSSK6-SBE (T)36 CCA AAA ACA CTA AAC CAA AAC 10.0 57 19
TBR1_cg12757011 TBR1-SBE (T)38 ACC TAA ACA ATC CTA TCA AAC AAC AAC 4.0 65 20
SLC12A5_cg07547549 SLC12A5-SBE (T)45 CRA ACR CTA TCC AAA ATA CTA AAA TAC 20.0 72 21
SBE 반응을 위한 반응 혼합물의 조성 및 반응 조건은 하기 표 7과 같다.
SBE 반응을 위한 혼합물(mixture) 및 반응 조건(Thermal cycling)
반응구성요소 부피(㎕) 사이클수 단계 온도 시간
증류수10X SBE Primer Mix5X Sequencing BufferSNaPshot Reaction MixPurified PCR Product ~ 5121> 1 25사이클 단계 1 96℃ 10초
단계 2 50℃ 5초
단계 3 60℃ 30초
전체 10
[실시예 4]
SBE(Single Base Extension) 반응 후 처리
4.1 효소(SAP 또는 CIP) 처리
SBE 반응 생성물에 대한 효소 처리 반응물의 구성 및 반응 조건은 하기 표 8 및 표 9와 같다.
효소 처리용 반응물의 구성
구분 부피(㎕)
SBE 반응 생성물 10
SAP-Recombinant (USB, Cleveland, OH) 1
효소 처리 조건(Thermal Cycling)
구분 온도 시간
단계 1 37℃ 45분
단계 2 80℃ 15분
4.2 모세관 전기영동(Capillary Electrophoresis)
모세관 전기영동의 실시에 필요한 재료는 건조 히팅 블록(heating block), 워터 배쓰(water bath) 또는 열 사이클러(thermal cycler), 3130 모세관(33㎝ x 50 μm; Applied Biosystems, Foster City, CA), 실행 최적화 폴리머(Performance Optimized Polymer; POP4, Applied Biosystems, Foster City, CA), 매트릭스 표준 세트(DS-02 'dR110, dR6G, dTAMRATM dROXTM LIZ® Dyes'; Applied Biosystems, Foster City, CA), Run Module GS STR POP4 (1 mL) E5, GeneScanTM 120 LIZTM Size Standard, 및 Hi-DiTM Formamide (Applied Biosystems, Foster City, CA)이다.
매트릭스 제조는 제조사의 매뉴얼에 따라 실시하였다.
모세관 전기영동에 필요한 구성 및 열 사이클링(thermal cycling) 조건은 하기 표 10 및 표 11과 같다.
전기영동 반응물 구성
구분 부피(㎕)
GeneScanTM 120 LIZTM 사이즈 표준 0.2
Hi-DiTM Formamide 10
SNaPshot 생성물 1 ~ 2
열 사이클링 조건
온도 및 조건 시간
95℃ 5분
4℃
모세관 전기영동은 하기 표 12에 기재된 조건에서 실시하였다.
모세관 전기영동 조건
단계 시행
주입 3초간 실시
전기영동 전압(15kV)에서 실시
수집 8분간 실시
히트 플레이트 60℃가열
전기영동 결과는 3130 데이터 수집 소프트웨어를 사용하여 검증을 실시하였다.
[실시예 5]
분석 결과
5.1 전기영동도(Electropherogram)
도 1에 나타낸 바와 같이, 본 발명에 따른 멀티플렉스 메틸화 SNaPshot 생성물은 전기영동에 의한 전기영동도를 사용하여 표적 유전자 내 메틸화 및 비메틸화 수준을 측정하였다. 모든 SBE 프라이머는 역방향으로 제작되었으므로, 청색 피크는 메틸화 신호로서 뉴클레오타이드 G를 나타내고, 녹색 피크는 비메틸화 신호로서 뉴클레오타이드 A를 나타낸다(도 1 참조).
5.2 연령 예측을 위한 수식 도출
Multiplex SNaPshot 과정을 통해 7개의 CpG에 대한 메틸화 데이터를 226명의 검사대상 유래 타액 시료로부터 획득하였다. 상기 검사 대상 226명을 무작위적으로 절반으로 나눠 한 세트는 수식을 도출하는 Training set로, 나머지 한 세트는 도출된 수식을 검증하는 Testing set로 구분하였다(표 13 참조).
연령 예측 수식 도출을 위한 멀티플렉스 스냅샷 결과
구분 실제 연령(chromological age) cg18384097 cg00481951 cg19671120 cg14361627 cg08928145 cg12757011 cg07547549
1 25 0.2333 0.1363 0.1094 0.0798 0.6798 0.2369 0.2465
2 19 0.3471 0.1202 0.1091 0.0741 0.7198 0.2231 0.2381
3 23 0.5095 0.1350 0.1584 0.0457 0.6016 0.2909 0.2652
4 26 0.7062 0.1538 0.1661 0.0825 0.6281 0.3617 0.2723
5 24 0.3616 0.1482 0.1389 0.0679 0.6407 0.2399 0.2829
6 29 0.5007 0.1919 0.1655 0.0841 0.5699 0.3278 0.3259
7 25 0.2179 0.1571 0.1699 0.0970 0.6764 0.2093 0.2345
8 19 0.3506 0.0800 0.1075 0.0498 0.5302 0.2094 0.2270
9 22 0.5377 0.0991 0.1290 0.0643 0.5674 0.2867 0.2545
10 21 0.5780 0.1382 0.1552 0.0648 0.5541 0.3226 0.2555
11 23 0.2919 0.1429 0.1197 0.0744 0.6787 0.2257 0.2716
12 24 0.7027 0.1739 0.2005 0.0831 0.5963 0.3511 0.3001
13 24 0.3020 0.1281 0.1223 0.0628 0.6534 0.2516 0.1894
14 24 0.5470 0.1072 0.1550 0.0670 0.5888 0.3145 0.2599
15 23 0.2410 0.1385 0.1162 0.0592 0.6331 0.2531 0.2434
참고로, 표 13에는 15명에 대한 결과만을 표시하였다. Training set 113명의 나이와 7개 CpG 마커에서의 DNA 메틸화 데이터를 대상으로 IBM 사의 SPSS 23.0을 이용해 다항 선형 회귀 분석(multivariate linear regression analysis)를 실시하였고(도 2a, 도 2b, 도 2c, 및 도 2d 참조), 결과를 정리하였다(표 14 참조).
다항 선형 회귀 분석 결과
구분 Training set (N=113) Training set (N=113)
개체 MAD RMSE 개체 MAD Error
전체 113 3.13 4.16 113 3.15 4.34
Training set로부터 얻은 모델식의 정확도를 검증하기 위하여, 113명의 testing set로부터 얻은 DNA 메틸화 데이터를 이용하여 연령을 추정하고, 실제 나이와 비교하였다. 이때, 실제 나이와 추정 나이의 절대값 평균(MAD: mean absolute deviation from chronological age)이 training set와 testing set에서 모두 3세 내외로 나와 매우 정확한 연령 추정이 가능함을 확인하였다.
5.3 연령 예측(Age Prediction) 모델
실시예 5.1에 따른 메틸화, 비메틸화 분석 결과 및 실시예 5.2의 과정을 통해 하기 표 15와 같이 연령 예측 모델을 구축하였다(도 2d에서의 점선 표시 참조).
연령 예측 모델
표적 ID 메틸화 계수(Coefficient) 연령 예측 계산
(Intercept) (intercept) -27.511 27.511 + (-29.088)×cg18384097 + 9.285 ×cg00481951 + 46.992 × cg19671120 + 86.268 × cg14361627 + 32.211 × cg08928145 + 58.699 × cg12757011 + 56.384 × cg07547549 ±2 RMSE
cg18384097
Figure PCTKR2018000986-appb-I000019
-29.088
cg00481951 9.285
cg19671120 46.992
cg14361627 86.268
cg08928145 32.211
cg12757011 58.699
cg07547549 56.384
상기 표 15에서, B는 메틸화를 나타내는 청색 피크의 높이를 표시하고, G는 비메틸화를 나타내는 녹색 피크의 높이를 표시한다(도 1 참조). B 또는 G 같은 수치는 0 내지 1의 범위 내에 있다. 예측 연령 계산에 기재된 CpG 마커(예컨대, cg18384097)에는 대응하는 메틸화 값인
Figure PCTKR2018000986-appb-I000020
를 입력하여 검사 대상의 연령을 계산하였다. 상기 표 13 및 표 15의 RMSE(Root mean square error)는 본 발명에 따른 연령 예측 모델에서 예측된 연령과 실제 연령 간의 오차와 관계된 값으로서 본 발명에서 RMSE 값은 4.16이다.
실시예 5.2의 검사대상 226명의 시료에 대하여 표 13에 기재된 연령 예측 모델을 적용하여 연령을 계산하여 분석하였다(도 4a, 및 도 4b 참조). 도 4a는 training set로서 연령 예측 모델 수식을 도출할 때 사용한 세트로부터 도출한 것이다. 도 4a에서의 가로축은 실제 나이를 나타내고, 세로축은 추정된 나이를 나타내며, 대각선은 y=x의 직선으로서 대각선에 가까울수록 실제 나이와 추정 나이가 근접하여 오차가 적음을 의미한다. Training 세트는 실제 나이와 추정된 나이 차의 절댓값의 평균(MAD, Mean absolute deviation)이 3.13세이며, RMSE가 4.16세이다. 도 4b는 모델을 검증하기 위한 testing set로 그래프의 구성이 도 4a의 경우와 동일하도록 구비하여 도출한 것이다. Testing set는 MAD가 3.15, Error가 4.34로 training set와 유사해 연령 추정에 있어서 기존 방법에 비해 오차가 적고 정확하게 측정됨을 확인하였다.
본 발명에서는 기존 연령 예측 방법에 사용하는 CpG 마커 종류에 비해 적은 7가지 마커를 표적으로 메틸화 및 비메틸화 수준을 측정하여 상기 표 15에 기재된 바와 같이 연령 예측 모델을 구축하였다. 본 발명에 따른 연령 예측 방법을 사용하면 기존 연령 예측 방법(예, Pyrosequencing)에 비해 더 저렴한 비용으로 더 빠르고 오차 범위가 개선되어 정확하게 검사 대상의 연령을 예측할 수 있다.
[실시예 5]
본원발명에 따른, 연령 추정 CpG 마커인 SST에 대한 cg00481951, CNGA3에 대한 cg19671120, KLF14에 대한 cg14361627, TSSK6에 대한 cg08928145, TBR1에 대한 cg12757011, 및 SLC12A5에 대한 cg07547549를 사용하여, 한국인뿐만 아니라, 타인종에 대해서도 추가 분석을 실시하였다. 분석 대상 시료는 총 257명의 남아프리카 코마니산 족(‡Khomani San), 코카시안(Caucasian), 히스패닉(Hispanic), 및 한국인(Korean)으로, NCBI에 공개된 HumanMethylation450 자료에서 수득하였다(표 16 참조). CpG 사이트에 대한 메틸화 정보를 제공하는 HumanMethylation 450K(Illumina, San Diego, CA) 자료는 Infinium(®) Human Methylation 450K BeadChip을 사용하여, DNA 메틸화 마이크로어레이를 수행한 것으로, 통상 제조사의 매뉴얼을 따라, 바이설파이트 처리된 DNA를 증폭하고 나서, 절단(fragmentation), 침전(precipitation) 및 재현탁(resuspension)한 후 그 DNA를 HumanMethylation450 비드 어레이와 혼성화한 다음, 제조자의 프로토콜에 따라 Illumina iSCAN 시스템으로 스캔한다.
No 인구 집단 NCBI GEO Accession ID 시료 수 연령대
1 남아프리카 코마니산 족(Khomani San) GSE99029 57명 21 ~ 91 세
2 코카시안 (Caucasian) GSE78874 89명 53 ~ 85 세
3 히스패닉 (Hispanic) GSE78874 57명 36 ~ 88 세
4 한국인 (Korean) GSE92767 54명 18 ~ 73 세
추가 분석을 진행한 결과, 도 5a, 도 5b, 도 5c, 도 5d, 도 5e, 및 도 5f에서 나타내는 바와 같이, 한국인뿐만 아니라 다양한 타인종에서도 연령 예측에 관한 정보제공방법을 이용하여 연령 추정이 가능하다는 것을 확인하였다.
본 명세서에서 인용한 모든 참조문헌, 기사, 공보 및 특허 및 특허 출원이 온전히 본 명세서에 참조로 병합되어 있다. 따라서, 하기 청구의 범위의 진의 및 범주는 상기한 바람직한 실시형태의 설명에 제한되어서는 안 된다.
본 발명은 DNA 메틸화를 이용한 연령 추정 방법에 관한 것이다.
<110> YONSEI UNIVERSITY
<120> Age Predicting method using DNA Methylation level
<130> OPB174011PCT
<150> KR 10-2017-0010915
<151> 2017-01-24
<160> 21
<170> KoPatentIn 3.0
<210> 1
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg18384097_PTPN7-F
<400> 1
ttgttttagt aagtatttga agggg 25
<210> 2
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg18384097_PTPN7-R
<400> 2
catcaaatct ataaacaccc atacc 25
<210> 3
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg00481951_SST-F
<400> 3
aggtgagttt ttatttggta tttaagaaa 29
<210> 4
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg00481951_SST-R
<400> 4
tttaaattac ccctttaccc taatc 25
<210> 5
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg19671120_CNGA3-F
<400> 5
ggagagggag gttataggtt tttt 24
<210> 6
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg19671120_CNGA3-R
<400> 6
tccttaccct accaaaattt aaactt 26
<210> 7
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg14361627_KLF14-F
<400> 7
aggttgttgt aatttagaag ttt 23
<210> 8
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg14361627_KLF14-R
<400> 8
atatttaaca acctcaaaaa ttatcttatc 30
<210> 9
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg08928145_TSSK6-F
<400> 9
agggaagygg aagggaaaaa g 21
<210> 10
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg08928145_TSSK6-R
<400> 10
actaaaaacc raataattcc aaccattcct 30
<210> 11
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg12757011_TBR1-F
<400> 11
gggtgggttt aggttttaga gtta 24
<210> 12
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg12757011_TBR1-R
<400> 12
ataaaattat cctcctacaa ttccc 25
<210> 13
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg07547549_SLC12A5-F
<400> 13
ggtttagtta atttaagtta gtt 23
<210> 14
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> human cg07547549_SLC12A5-R
<400> 14
aaactcaact ccattaaaat actcc 25
<210> 15
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> human PTPN7_cg18384097-SBE
<400> 15
cataccccaa ccaaacacta taac 24
<210> 16
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> human SST_cg00481951-SBE
<400> 16
ccaaaatcaa caccaaaaat aaac 24
<210> 17
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> human CNGA3_cg19671120-SBE
<400> 17
ctaccaaaat ttaaacttct cc 22
<210> 18
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> human KLF14_cg14361627-SBE
<400> 18
ttaacaacct caaaaattat cttatctcc 29
<210> 19
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> human TSSK6_cg08928145-SBE
<400> 19
ccaaaaacac taaaccaaaa c 21
<210> 20
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> human TBR1_cg12757011-SBE
<400> 20
acctaaacaa tcctatcaaa caacaac 27
<210> 21
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> human SLC12A5_cg07547549-SBE
<400> 21
craacrctat ccaaaatact aaaatac 27

Claims (16)

  1. 대상자(subject)로부터 수득한 시료 내 유전자의 CpG 마커에 대한 메틸화 분석(methylation assay) 단계를 포함하는, 대상자의 연령 예측에 관한 정보를 제공하는 방법으로서,
    상기 유전자는 PTPN7(protein tyrosine phosphatase, non-receptor type 7), SST(somatostatin), CNGA3(cyclic nucleotide gated channel alpha 3), KLF14(Kruppel like factor 14), TSSK6(testis specific serine kinase 6), TBR1(T-box, brain 1), 및 SLC12A5(solute carrier family 12 member 5)로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자인, 대상자의 연령 예측에 관한 정보를 제공하는 방법.
  2. 제 1항에 있어서,
    상기 CpG 마커는 PTPN7에 대한 cg18384097, SST에 대한 cg00481951, CNGA3에 대한 cg19671120, KLF14에 대한 cg14361627, TSSK6에 대한 cg08928145, TBR1에 대한 cg12757011, 및 SLC12A5에 대한 cg07547549인, 대상자의 연령 예측에 관한 정보를 제공하는 방법.
  3. 제 1항에 있어서,
    상기 메틸화 분석 단계는 각각의 CpG 마커의 메틸화 및 비메틸화 수준의 비율인 K 값을 측정하는 것으로서, 상기 K 값은 수식
    Figure PCTKR2018000986-appb-I000021
    으로 표현되고 상기 수식 내 B는 마커의 메틸화를 측정한 수치이며 상기 G는 마커의 비메틸화를 측정한 수치인, 대상자의 연령 예측에 관한 정보를 제공하는 방법.
  4. 제 3항에 있어서,
    상기 메틸화 분석 단계는 각각의 CpG 마커에 대한 K 값(
    Figure PCTKR2018000986-appb-I000022
    )과 각각의 마커에 대한 계수(Coefficient)인 N 값을 곱하여 대상자의 연령을 산출하는 단계를 추가로 포함하는, 대상자의 연령 예측에 관한 정보를 제공하는 방법으로서,
    상기 산출 단계는 수식 "N1 + N2×cg18384097에 대한 K 값(
    Figure PCTKR2018000986-appb-I000023
    ) + N3×cg00481951에 대한 K 값(
    Figure PCTKR2018000986-appb-I000024
    ) + N4×cg19671120에 대한 K 값(
    Figure PCTKR2018000986-appb-I000025
    ) + N5×cg14361627에 대한 K 값(
    Figure PCTKR2018000986-appb-I000026
    ) + N6×cg08928145에 대한 K 값(
    Figure PCTKR2018000986-appb-I000027
    ) + N7×cg12757011에 대한 K 값(
    Figure PCTKR2018000986-appb-I000028
    ) + N8×cg07547549에 대한 K 값(
    Figure PCTKR2018000986-appb-I000029
    ) ± 2 RMSE(root-mean-square error)”에 대입하는 단계인, 대상자의 연령 예측에 관한 정보를 제공하는 방법.
  5. 제 4항에 있어서,
    상기 N1은 -27 내지 -28이고 상기 N2는 -28.5 내지 -29.5이며 상기 N3는 9 내지 10이며 상기 N4는 46.5 내지 47.5이며 상기 N5는 86 내지 87이며 상기 N6는 32 내지 33이며 상기 N7은 58 내지 59이며 상기 N8은 56 내지 57이며 상기 RMSE는 4 내지 5인, 대상자의 연령 예측에 관한 정보를 제공하는 방법.
  6. 제 1항에 있어서,
    상기 대상자로부터 수득한 시료는 체액, 모근, 혈액, 혈장, 혈청 및 타액(saliva)으로 구성된 군으로부터 선택된 어느 하나인, 대상자의 연령 예측에 관한 정보를 제공하는 방법.
  7. PTPN7, SST, CNGA3, KLF14, TSSK6, TBR1, 및 SLC12A5를 포함하는 유전자군 내의 CpG 마커의 메틸화 분석용 프라이머 세트를 포함하는 대상자(subject)의 연령 예측용 키트.
  8. 제 7항에 있어서,
    상기 프라이머 세트는 CpG 마커의 메틸화된 부분을 포함하는 단편을 증폭하기 위한 서열번호 1 내지 14의 PCR 프라이머 세트 및 상기 프라이머 세트에 의해 증폭된 PCR 산물에 대한 SBE(Single Base Extension) 반응을 실시하기 위한 서열번호 15 내지 21의 프라이머 세트인, 대상자의 연령 예측용 키트.
  9. 제 7항에 있어서,
    상기 CpG 마커는 PTPN7에 대한 cg18384097, SST에 대한 cg00481951, CNGA3에 대한 cg19671120, KLF14에 대한 cg14361627, TSSK6에 대한 cg08928145, TBR1에 대한 cg12757011, 및 SLC12A5에 대한 cg07547549인, 대상자(subject)의 연령 예측용 키트.
  10. 제 7항에 있어서,
    상기 체액 유래 시료는 체액, 모근, 혈액, 혈장, 혈청 및 타액으로 구성된 군으로부터 선택된 어느 하나인, 대상자의 연령 예측용 키트.
  11. 대상자(subject)로부터 수득한 시료 내 유전자의 CpG 마커의 메틸화 수준을 측정하는 분석부; 및
    상기 메틸화 수준 측정 결과로부터 대상자의 연령을 계산하는 산출부를 포함하는 연령 예측용 기기로서,
    상기 유전자는 PTPN7, SST, CNGA3, KLF14, TSSK6, TBR1, 및 SLC12A5로 이루어진 군으로부터 선택된 하나 이상의 유전자인, 대상자의 연령 예측용 기기.
  12. 제 11항에 있어서,
    상기 CpG 마커는 PTPN7에 대한 cg18384097, SST에 대한 cg00481951, CNGA3에 대한 cg19671120, KLF14에 대한 cg14361627, TSSK6에 대한 cg08928145, TBR1에 대한 cg12757011, 및 SLC12A5에 대한 cg07547549인, 대상자의 연령 예측용 기기.
  13. 제 11항에 있어서,
    상기 메틸화 수준 측정은 각각의 CpG 마커의 메틸화 및 비메틸화 수준의 비율인 K 값을 측정하는 것으로서, 상기 K 값은 수식
    Figure PCTKR2018000986-appb-I000030
    으로 표현되고 상기 수식 내 B는 마커의 메틸화를 측정한 수치이며 상기 G는 마커의 비메틸화를 측정한 수치인, 대상자의 연령 예측용 기기.
  14. 제 13항에 있어서,
    상기 메틸화 수준 측정은 각각의 CpG 마커에 대한 K 값(
    Figure PCTKR2018000986-appb-I000031
    )과 각각의 CpG 마커에 대한 계수(Coefficient)인 N 값을 곱하여 대상자의 연령을 산출하는 단계를 추가로 포함하며, 상기 산출 단계는 수식 "N1 + N2×cg18384097에 대한 K 값(
    Figure PCTKR2018000986-appb-I000032
    ) + N3×cg00481951에 대한 K 값(
    Figure PCTKR2018000986-appb-I000033
    ) + N4×cg19671120에 대한 K 값(
    Figure PCTKR2018000986-appb-I000034
    ) + N5×cg14361627에 대한 K 값(
    Figure PCTKR2018000986-appb-I000035
    ) + N6×cg08928145에 대한 K 값(
    Figure PCTKR2018000986-appb-I000036
    ) + N7×cg12757011에 대한 K 값(
    Figure PCTKR2018000986-appb-I000037
    ) + N8×cg07547549에 대한 K 값(
    Figure PCTKR2018000986-appb-I000038
    ) ± 2 RMSE(root-mean-square error)" 인, 대상자의 연령 예측용 기기.
  15. 제 14항에 있어서,
    상기 N1은 -27 내지 -28이고 상기 N2는 -28.5 내지 -29.5이며 상기 N3는 9 내지 10이며 상기 N4는 46.5 내지 47.5이며 상기 N5는 86 내지 87이며 상기 N6는 32 내지 33이며 상기 N7은 58 내지 59이며 상기 N8은 56 내지 57이며 상기 RMSE는 4 내지 5인, 대상자의 연령 예측용 기기.
  16. 제 11항에 있어서,
    상기 대상자로부터 수득한 시료는 체액, 모근, 혈액, 혈장, 혈청 및 타액으로 구성된 군으로부터 선택된 어느 하나인, 대상자의 연령 예측용 기기.
PCT/KR2018/000986 2017-01-24 2018-01-23 Dna 메틸화를 이용한 연령 예측 방법 WO2018139826A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2017-0010915 2017-01-24
KR1020170010915A KR101873303B1 (ko) 2017-01-24 2017-01-24 타액 내 dna 메틸화를 이용한 연령 예측 방법

Publications (1)

Publication Number Publication Date
WO2018139826A1 true WO2018139826A1 (ko) 2018-08-02

Family

ID=62913876

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2018/000986 WO2018139826A1 (ko) 2017-01-24 2018-01-23 Dna 메틸화를 이용한 연령 예측 방법

Country Status (2)

Country Link
KR (1) KR101873303B1 (ko)
WO (1) WO2018139826A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020074533A1 (en) * 2018-10-08 2020-04-16 Thomas J.C. Matzen Gmbh Method and devices for age determination
WO2022058980A1 (en) 2020-09-21 2022-03-24 Insilico Medicine Ip Limited Methylation data signatures of aging and methods of determining a methylation aging clock

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102170423B1 (ko) * 2019-02-19 2020-10-27 바이오코아 주식회사 체액을 이용한 연령 추적 방법
KR102401159B1 (ko) * 2020-07-13 2022-05-24 대한민국 뼈를 이용한 연령 예측을 위한 방법 및 마커

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012162139A1 (en) * 2011-05-20 2012-11-29 The Regents Of The University Of California Method to estimate age of individual based on epigenetic markers in biological sample
WO2015048665A2 (en) * 2013-09-27 2015-04-02 The Regents Of The University Of California Method to estimate the age of tissues and cell types based on epigenetic markers
US20150259742A1 (en) * 2012-11-09 2015-09-17 The Regents Of The University Of California Methods for predicting age and identifying agents that induce or inhibit premature aging

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012162139A1 (en) * 2011-05-20 2012-11-29 The Regents Of The University Of California Method to estimate age of individual based on epigenetic markers in biological sample
US20150259742A1 (en) * 2012-11-09 2015-09-17 The Regents Of The University Of California Methods for predicting age and identifying agents that induce or inhibit premature aging
WO2015048665A2 (en) * 2013-09-27 2015-04-02 The Regents Of The University Of California Method to estimate the age of tissues and cell types based on epigenetic markers

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZAGHLOOL, S. B. ET AL.: "Association of DNA Methylation with Age, Gender, and Smoking in an Arab Population", CLINICAL EPIGENETICS, vol. 7, no. 6, 22 January 2015 (2015-01-22), pages 1 - 12, XP021213428 *
ZBIEC-PIEKARSKA, R. ET AL.: "Development of a Forensically Useful Age Prediction Method Based on DNA Methylation Analysis", FORENSIC SCIENCE INTERNATIONAL: GENETICS, vol. 17, 5 May 2015 (2015-05-05), pages 173 - 179, XP029239625 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020074533A1 (en) * 2018-10-08 2020-04-16 Thomas J.C. Matzen Gmbh Method and devices for age determination
WO2022058980A1 (en) 2020-09-21 2022-03-24 Insilico Medicine Ip Limited Methylation data signatures of aging and methods of determining a methylation aging clock

Also Published As

Publication number Publication date
KR101873303B1 (ko) 2018-07-02

Similar Documents

Publication Publication Date Title
WO2018139826A1 (ko) Dna 메틸화를 이용한 연령 예측 방법
WO2015068957A1 (en) Method for the detection of multiple target nucleic acids using clamping probes and detection probes
WO2011055916A2 (ko) 장암 진단을 위한 장암 특이적 메틸화 마커 유전자의 메틸화 검출방법
WO2018001258A1 (zh) 一种用于核酸富集捕获的探针及设计方法
WO2015023146A1 (ko) 전암병변의 검출방법
CN101768639A (zh) 一种甘蓝型油菜品种ssr指纹的快捷检测方法
WO2011157222A1 (zh) 淋巴瘤融合基因的联合检测方法及其诊断试剂盒
WO2021182881A1 (ko) 유방암 진단용 다중 바이오마커 및 이의 용도
WO2020105873A1 (ko) 인간 알파코로나바이러스 전장유전체 증폭을 통한 진단키트 및 전장 유전체 서열 확인 방법
WO2021230663A1 (ko) 초기 유방암 환자의 예후 예측 방법
WO2011139032A2 (ko) 표적 유전자의 다양한 변이가 존재하는 유전자 영역을 증폭하기 위한 프라이머 조성물
WO2015167087A1 (ko) Dna 복제수 변이를 이용한 강직성 척추염 발병 위험도 예측 방법
WO2023027418A1 (ko) 구강질환 유발 세균 검출용 조성물 내지 이의 용도
WO2012050353A2 (ko) 표적 폴리뉴클레오티드의 염기서열을 비특이적으로 연장하는 방법
WO2013105801A1 (ko) 만성 골수성 백혈병 융합 유전자형 타이핑용 프로브, 프라이머 및 이의 이용방법
WO2019135477A2 (ko) 다복제유전자를 이용한 쯔쯔가무시병의 진단방법
WO2014157825A1 (ko) 스피드 멀티플렉스 pcr법을 이용한 hla 대립유전자 검사방법 및 검사키트
WO2020122679A1 (en) Method for detecting a target analyte in a sample using an s-shaped function for a slope data set
WO2022045843A1 (en) Method for positive control reaction using pre-positive control composition
WO2014175604A2 (ko) 아벨리노 각막이상증 진단용 조성물 및 이의 진단방법
WO2010140827A9 (ko) 실시간 중합효소연쇄반응을 이용한 hla 대립유전자 자동검사 키트
WO2021034034A1 (ko) 핵산 단편간 거리 정보를 이용한 염색체 이상 검출 방법
WO2022220575A1 (ko) 피부색 판단용 유전자 다형성 마커 및 이의 용도
WO2017209575A1 (en) Evaluation of specificity of oligonucleotides
WO2021075750A1 (ko) 자가 증폭이 가능한 헤어핀 구조의 ngs 라이브러리 제작용 어댑터 및 이를 이용한 ngs 라이브러리 제조방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18744371

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18744371

Country of ref document: EP

Kind code of ref document: A1