CN113817812B - 一种蛋白酶基因甲基化作为脑卒中早期诊断的潜在标志物 - Google Patents
一种蛋白酶基因甲基化作为脑卒中早期诊断的潜在标志物 Download PDFInfo
- Publication number
- CN113817812B CN113817812B CN202010558950.1A CN202010558950A CN113817812B CN 113817812 B CN113817812 B CN 113817812B CN 202010558950 A CN202010558950 A CN 202010558950A CN 113817812 B CN113817812 B CN 113817812B
- Authority
- CN
- China
- Prior art keywords
- cpg
- seq
- primer
- htra1
- dna fragment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000006011 Stroke Diseases 0.000 title claims abstract description 186
- 230000011987 methylation Effects 0.000 title claims abstract description 171
- 238000007069 methylation reaction Methods 0.000 title claims abstract description 171
- 230000002490 cerebral effect Effects 0.000 title claims abstract description 96
- 206010008190 Cerebrovascular accident Diseases 0.000 title claims abstract description 95
- 238000013399 early diagnosis Methods 0.000 title abstract description 15
- 239000003550 marker Substances 0.000 title abstract description 8
- 108091005804 Peptidases Proteins 0.000 title abstract description 6
- 101001041393 Homo sapiens Serine protease HTRA1 Proteins 0.000 claims abstract description 30
- 208000024891 symptom Diseases 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims abstract description 9
- 238000002360 preparation method Methods 0.000 claims abstract description 8
- 239000012634 fragment Substances 0.000 claims description 262
- 108091029430 CpG site Proteins 0.000 claims description 242
- 108020004414 DNA Proteins 0.000 claims description 238
- 101150007028 HTRA1 gene Proteins 0.000 claims description 97
- 238000013178 mathematical model Methods 0.000 claims description 53
- 238000001514 detection method Methods 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 40
- 102000053602 DNA Human genes 0.000 claims description 30
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 30
- 239000002773 nucleotide Substances 0.000 claims description 30
- 125000003729 nucleotide group Chemical group 0.000 claims description 30
- 238000007477 logistic regression Methods 0.000 claims description 19
- 239000003153 chemical reaction reagent Substances 0.000 claims description 7
- 238000007405 data analysis Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 6
- 210000004369 blood Anatomy 0.000 abstract description 25
- 239000008280 blood Substances 0.000 abstract description 25
- 102100021119 Serine protease HTRA1 Human genes 0.000 abstract description 23
- 230000014509 gene expression Effects 0.000 abstract description 23
- 238000003745 diagnosis Methods 0.000 abstract description 14
- 230000000694 effects Effects 0.000 abstract description 7
- 101150093710 clec-87 gene Proteins 0.000 description 66
- 101150024925 cpg-7 gene Proteins 0.000 description 65
- 101150071119 cpg-2 gene Proteins 0.000 description 50
- 101150075908 cpg-4 gene Proteins 0.000 description 50
- 230000000391 smoking effect Effects 0.000 description 48
- 101100328096 Caenorhabditis elegans clec-88 gene Proteins 0.000 description 32
- 101150087279 cpg-8 gene Proteins 0.000 description 32
- 206010012601 diabetes mellitus Diseases 0.000 description 30
- 108010023302 HDL Cholesterol Proteins 0.000 description 28
- 206010020772 Hypertension Diseases 0.000 description 28
- 108010028554 LDL Cholesterol Proteins 0.000 description 27
- 210000000265 leukocyte Anatomy 0.000 description 27
- UFTFJSFQGQCHQW-UHFFFAOYSA-N triformin Chemical compound O=COCC(OC=O)COC=O UFTFJSFQGQCHQW-UHFFFAOYSA-N 0.000 description 26
- 230000007067 DNA methylation Effects 0.000 description 20
- 230000035622 drinking Effects 0.000 description 19
- 101150014604 cpg-3 gene Proteins 0.000 description 16
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 238000004820 blood count Methods 0.000 description 10
- 238000012937 correction Methods 0.000 description 9
- 208000024172 Cardiovascular disease Diseases 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 230000035945 sensitivity Effects 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 6
- 208000001490 Dengue Diseases 0.000 description 6
- 206010012310 Dengue fever Diseases 0.000 description 6
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 6
- 208000025729 dengue disease Diseases 0.000 description 6
- 238000011835 investigation Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 208000030518 CARASIL syndrome Diseases 0.000 description 5
- 210000004027 cell Anatomy 0.000 description 5
- 238000010219 correlation analysis Methods 0.000 description 5
- 239000008103 glucose Substances 0.000 description 5
- 208000033909 Cerebral autosomal recessive arteriopathy-subcortical infarcts-leukoencephalopathy Diseases 0.000 description 4
- 108091081021 Sense strand Proteins 0.000 description 4
- 208000026106 cerebrovascular disease Diseases 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- -1 cpg_4.5 Proteins 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000002526 effect on cardiovascular system Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000001269 time-of-flight mass spectrometry Methods 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 206010008092 Cerebral artery thrombosis Diseases 0.000 description 3
- 208000032382 Ischaemic stroke Diseases 0.000 description 3
- 108010022999 Serine Proteases Proteins 0.000 description 3
- 102000012479 Serine Proteases Human genes 0.000 description 3
- 230000034994 death Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 210000005259 peripheral blood Anatomy 0.000 description 3
- 239000011886 peripheral blood Substances 0.000 description 3
- 238000003908 quality control method Methods 0.000 description 3
- 238000013517 stratification Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000001196 time-of-flight mass spectrum Methods 0.000 description 3
- 208000017667 Chronic Disease Diseases 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 238000003646 Spearman's rank correlation coefficient Methods 0.000 description 2
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 2
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- 230000036772 blood pressure Effects 0.000 description 2
- 238000009530 blood pressure measurement Methods 0.000 description 2
- 230000037396 body weight Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 235000019504 cigarettes Nutrition 0.000 description 2
- 230000035487 diastolic blood pressure Effects 0.000 description 2
- 230000006718 epigenetic regulation Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000035488 systolic blood pressure Effects 0.000 description 2
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 2
- 201000004384 Alopecia Diseases 0.000 description 1
- 241000143060 Americamysis bahia Species 0.000 description 1
- 208000036487 Arthropathies Diseases 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000021910 Cerebral Arterial disease Diseases 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101100507776 Danio rerio htra1b gene Proteins 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 208000032928 Dyslipidaemia Diseases 0.000 description 1
- 208000034534 Gastroenteropancreatic neuroendocrine neoplasm Diseases 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 101000793666 Homo sapiens Calpain-5 Proteins 0.000 description 1
- 101000998897 Homo sapiens Serine protease HTRA3 Proteins 0.000 description 1
- 101000998893 Homo sapiens Serine protease HTRA4 Proteins 0.000 description 1
- 101150069138 HtrA2 gene Proteins 0.000 description 1
- 208000012659 Joint disease Diseases 0.000 description 1
- 208000017170 Lipid metabolism disease Diseases 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 208000031481 Pathologic Constriction Diseases 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101710151387 Serine protease 1 Proteins 0.000 description 1
- 102100032491 Serine protease 1 Human genes 0.000 description 1
- 102100021117 Serine protease HTRA2, mitochondrial Human genes 0.000 description 1
- 102100033197 Serine protease HTRA3 Human genes 0.000 description 1
- 102100033196 Serine protease HTRA4 Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 201000004810 Vascular dementia Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 231100000360 alopecia Toxicity 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000010100 anticoagulation Effects 0.000 description 1
- 230000004872 arterial blood pressure Effects 0.000 description 1
- 210000002565 arteriole Anatomy 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 210000003651 basophil Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- 230000036770 blood supply Effects 0.000 description 1
- 210000002302 brachial artery Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 239000003560 cancer drug Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 206010008118 cerebral infarction Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 230000004087 circulation Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 101150008740 cpg-1 gene Proteins 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 230000008303 genetic mechanism Effects 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 208000017169 kidney disease Diseases 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000008338 local blood flow Effects 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 1
- 229910052753 mercury Inorganic materials 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 239000003805 procoagulant Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000000191 radiation effect Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 230000005586 smoking cessation Effects 0.000 description 1
- 230000036262 stenosis Effects 0.000 description 1
- 208000037804 stenosis Diseases 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 238000012105 stratification Analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 150000003626 triacylglycerols Chemical class 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Public Health (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Theoretical Computer Science (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Primary Health Care (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种蛋白酶基因甲基化作为脑卒中早期诊断的潜在标志物。本发明提供了甲基化HTRA1基因以及HTRA1在血液中的表达程度作为标志物在制备产品中的应用;所述产品具有如下任一功能:(1)辅助诊断脑卒中;(2)在临床症状之前预警卒中。本发明发现血液HTRA1甲基化以及HTRA1在血液中的表达程度可作为脑卒中预警和早期诊断的潜在标志物。本发明对于提高脑卒中诊疗效果均有重要的科学意义和临床应用价值。
Description
技术领域
本发明涉及医学领域,特别涉及一种蛋白酶基因甲基化作为脑卒中早期诊断的潜在标志物。
背景技术
脑卒中是由于脑部供血动脉突然破裂或管腔的阻塞或狭窄,导致脑部的局部血液循环障碍而产生的一系列症状的临床疾病[Lindgren A.Stroke genetics:a review andupdate[J].Journal of Stroke,2014,16(3):114]。2016年全球25岁及以上人群患脑卒中的终生风险约为25%,中国人群患脑卒中风险高达39.3%,其中男性为41.1%,女性为36.7%[Collaborators GBDLRoS,Feigin VL,Nguyen G,Cercy K,Johnson CO,Alam T,etal.Global,regional,and country-specific lifetime risks of stroke,1990and2016.N Engl J Med.2018;379:2429-2437]。《中国心血管病报告2018年》指出,我国心血管疾病现患人数约为2.9亿,其中脑卒中1300万。脑卒中已成为中国居民的首位死因,高于肿瘤及其他疾病[《中国心血管病报告2018》概要.中国循环杂志.34:6-17]。从总体上看,中国脑卒中患病率及死亡率仍处于上升阶段,且脑卒中具有极高的致残率。目前常使用影像学方法来进行脑卒中的诊断,例如CT和核磁共振检查,CT对于出血性脑卒中的灵敏度较高,但对于缺血性脑卒中的灵敏度只有16%,由于辐射的原因不宜频繁使用;核磁共振检查对缺血性脑卒中的灵敏度高于CT且没有辐射影响,但其缺点是较低的可行性、实用性和可及性(设备以及训练有素的人员)。因此,深入探讨脑卒中发生的危险因素、开展脑卒中早期识别和诊断及人群防控研究具有十分重要的意义。
脑卒中是由遗传和环境共同作用的复杂疾病[Benjamin EJ,Muntner P,AlonsoA,Bittencourt MS,Callaway CW,Carson AP,et al.Heart disease and strokestatistics-2019update:A report from the american heartassociation.Circulation.2019;139:e56-e528]。大多数脑卒中是可以预防和治疗的,一般通过普及知识提高意识、避免外源性刺激因素和合理膳食适度运动来进行预防,其治疗效果很大程度上依赖于早期诊断及相应的干预措施。目前,临床上关于脑卒中疾病诊断标志物的灵敏度和特异性很有限,尤其是缺乏早期诊断的标志物,因此更为敏感、特异的早期分子标记物亟待发掘。表观遗传学的兴起为揭示基因的表达调控机制提供了新思路,它是指在基因组DNA序列不发生改变的情况下,基因的表达发生了可遗传的改变[Nicoglou A,Merlin F.Epigenetics:A way to bridge the gap between biological fields.StudHist Philos Biol Biomed Sci.2017;66:73-82]。已有大量研究表明,许多疾病以及重要的生物过程受到表观遗传的调控[Mafficini A,Scarpa A.Genetics and epigenetics ofgastroenteropancreaticneuroendocrine neoplasms.Endocr Rev.2019;40:506-536;Dong N,Shi L,Wang DC,Chen C,Wang X.Role of epigenetics in lung cancerheterogeneity and clinical implication.Semin Cell Dev Biol.2017;64:18-25]。DNA甲基化是表观遗传调控的重要方式之一,是指在DNA甲基化转移酶的作用下,在基因组CpG二核苷酸的胞嘧啶5'碳位共价键结合一个甲基基团[Bird A.Perceptions ofepigenetics.Nature.2007;447:396-398]。DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达[Moore LD,Le T,Fan G.DNAmethylation and its basic function.Neuropsychopharmacology.2013;38:23-38]。本研究通过飞行时间质谱DNA甲基化分析技术在多组样品中进行分析,发现了心脑血管疾病和健康对照组的血液DNA甲基化存在显著差异。因此,血液异常的DNA甲基化信号有可能为心脑血管疾病体外早期诊断带来突破。此外,血液容易收集,DNA甲基化常温较稳定的特点也让其在临床应用中独具优势。因此,探索和开发适用于临床检测需要的灵敏和特异血液DNA甲基化诊断技术对提高心脑血管疾病早期诊疗效果和降低死亡率均有重要的科学意义和临床应用价值。
丝氨酸蛋白酶是一个蛋白酶家族,包含四个成员,HTRA1、HTRA2、HTRA3和HTRA4,其中丝氨酸蛋白酶1(HTRA1)是第一个被发现的[Chien J,Campioni M,Shridhar V,BaldiA.Htra serine proteases as potential therapeutic targets in cancer.CurrCancer Drug Targets.2009;9:451-468]。研究表明,HTRA1基因突变与伴有皮质下梗死和白质脑病的常染色体隐性脑动脉病(Cerebral autosomal recessive arteriopathy withsubcortical infarcts and leukoencephalopathy,CARASIL)密切相关[Preethish-KumarV,Nozaki H,Tiwari S,Vengalil S,Bhat M,Prasad C,et al.Carasil families fromindia with 3novel null mutations in the htra1 gene.Neurology.2017;89:2392-2394],CARASIL患者主要为男性青年人群,临床表现为卒中、痴呆、脱发、腰椎关节病变四种主要的症状,脑部病理发现小动脉呈动脉硬化性表现[Nozaki H,Sekine Y,Fukutake T,Nishimoto Y,Shimoe Y,Shirata A,et al.Characteristic features and progressionof abnormalities on mri for carasil.Neurology.2015;85:459-463]。此外,HTRA1能够抑制转化生长因子β(transforming growth factor-β,TGF-β)信号通路,HTRA1过表达抑制TGF-β前体结合蛋白1与TGF-β1结合[Shiga A,Nozaki H,Yokoseki A,Nihonmatsu M,Kawata H,Kato T,et al.Cerebral small-vessel disease protein htra1 controlsthe amount of tgf-beta1 via cleavage of protgf-beta1.Hum Mol Genet.2011;20:1800-1810],沉默HTRA1表达能够显著增加TGF-β1与细胞膜上受体的结合,诱导和促进颅内小动脉动脉粥样硬化及血管重塑[Liu J,Dong F,Hoh J.Loss of htra1-inducedattenuation of tgf-beta signaling in fibroblasts might not be the mainmechanism of carasil pathogenesis.Proc Natl Acad Sci US A.2015;112:E1693;Beaufort N,Scharrer E,Kremmer E,Lux V,Ehrmann M,Huber R,et al.Cerebral smallvessel disease-related protease htra1 processes latent tgf-beta bindingprotein 1and facilitates tgf-beta signaling.Proc Natl Acad Sci USA.2014;111:16496-16501]。目前关于外周血HTRA1基因甲基化与人群脑卒中关系的研究未见报道,HTRA1基因甲基化与缺血性脑卒中和出血性脑卒中均未见报道。此外,HTRA1基因甲基化与脑卒中的关系在动物模型包括小鼠以及细胞系亦无人报道。
发明内容
本发明的目的是提供一种用于辅助诊断脑卒中疾病的丝氨酸蛋白酶1(HTRA1)甲基化标志物及试剂盒。
第一方面,本发明要求保护甲基化HTRA1基因作为标志物在制备产品中的应用;所述产品具有如下任一功能:
(1)辅助诊断脑卒中;
(2)在临床症状之前预警卒中。
第二方面,本发明要求保护用于检测HTRA1基因甲基化水平的物质在制备产品中的应用;所述产品具有如下任一功能:
(1)辅助诊断脑卒中;
(2)在临床症状之前预警卒中。
第三方面,本发明要求保护用于检测HTRA1基因甲基化水平的物质和储存有数学模型建立方法和/或使用方法的介质在制备产品中的应用;所述产品具有如下任一功能:
(1)辅助诊断脑卒中;
(2)在临床症状之前预警卒中;
所述数学模型按照包括如下步骤的方法获得:
(A1)分别检测n1个A类型样本和n2个B类型样本的HTRA1基因甲基化水平;
(A2)取步骤(A1)获得的所有样本的HTRA1基因甲基化水平数据,按照A类型样本和B类型样本的分类方式,通过二分类逻辑回归法建立数学模型;
其中,(A1)中的n1和n2均可为50以上的正整数。
所述数学模型的使用方法包括如下步骤:
(B1)检测待测样本的HTRA1基因甲基化水平;
(B2)将步骤(B1)获得的所述待测样本的HTRA1基因甲基化水平数据代入所述数学模型,得到检测指数;然后比较检测指数和阈值的大小,根据比较结果确定所述待测样本是A类型样本还是B类型样本;
所述A类型样本和所述B类型样本为如下中的任一种:
(C1)未来2年内发生脑卒中的潜在患者和健康对照;
(C2)未来1.5年内发生脑卒中的潜在患者和健康对照;
(C3)未来1.32年内发生脑卒中的潜在患者和健康对照;
(C4)未来1年内发生脑卒中的潜在患者和健康对照。
其中,所述阈值可根据最大约登指数确定,可以根据实际情况确定为某一个数值比如0.5。大于阈值归为一类,小于阈值归为另外一类,等于阈值作为不确定的灰区。
第四方面,本发明要求保护前文第三方面中所述的“储存有数学模型建立方法和/或使用方法的介质”在制备产品中的应用;所述产品具有如下任一功能:
(1)辅助诊断脑卒中;
(2)在临床症状之前预警卒中。
第五方面,本发明要求保护一种试剂盒。
本发明所要求保护的试剂盒,包括用于检测HTRA1基因甲基化水平的物质;所述试剂盒的用途为如下中的至少一种:
(1)辅助诊断脑卒中;
(2)在临床症状之前预警卒中。
进一步地,所述试剂盒中还含有前文所述的储存有数学模型建立方法和/或使用方法的介质。
第六方面,本发明要求保护一种系统。
本发明所要求保护的系统,包括:
(D1)用于检测HTRA1基因甲基化水平的试剂和/或仪器;
(D2)装置,所述装置包括单元M和单元N。
所述单元M用于建立数学模型,包括数据采集模块、数据分析处理模块和模型输出模块;
所述数据采集模块用于采集(D1)检测得到的n1个A类型样本和n2个B类型样本的HTRA1基因甲基化水平数据。
所述数据分析处理模块能够基于所述数据采集模块采集的n1个A类型样本和n2个B类型样本的HTRA1基因甲基化水平数据,按照A类型样本和B类型样本的分类方式,通过二分类逻辑回归法建立数学模型。
其中,(A1)中的n1和n2均可为50以上的正整数。
所述模型输出模块用于输出所述数据分析处理模块建立的数学模型。
所述单元N用于确定待测样本是A类型样本还是B类型样本,包括数据输入模块、数据运算模块、数据比较模块和结论输出模块。
所述数据输入模块用于输入(D1)检测得到的待测者的HTRA1基因甲基化水平数据。
所述数据运算模块用于将所述待测者HTRA1基因甲基化水平数据代入所述数学模型,计算得到检测指数。
所述数据比较模块用于将所述检测指数与阈值进行比较。
所述结论输出模块用于根据所述数据比较模块的比较结果输出所述待测样本是A类型样本还是B类型样本的结论。
所述A类型样本和所述B类型样本为如下中的任一种:
(C1)未来2年内发生脑卒中的潜在患者和健康对照;
(C2)未来1.5年内发生脑卒中的潜在患者和健康对照;
(C3)未来1.32年内发生脑卒中的潜在患者和健康对照;
(C4)未来1年内发生脑卒中的潜在患者和健康对照。
另外,本发明还要求保护一种检测待测样本是A类型样本还是B类型样本的方法(即辅助诊断脑卒中的方法或者在临床症状之前预警脑卒中的方法)。该方法可包括如下步骤:
(A)可按照包括如下步骤的方法建立数学模型:
(A1)分别检测n1个A类型样本和n2个B类型样本的HTRA1基因甲基化水平;
(A2)取步骤(A1)获得的所有样本的HTRA1基因甲基化水平数据,按照A类型样本和B类型样本的分类方式,通过二分类逻辑回归法建立数学模型;
其中,(A1)中的n1和n2均可为50以上的正整数。
(B)可按照包括如下步骤的方法确定所述待测样本是A类型样本还是B类型样本:
(B1)检测待测样本的HTRA1基因甲基化水平;
(B2)将步骤(B1)获得的所述待测样本的HTRA1基因甲基化水平数据代入所述数学模型,得到检测指数;然后比较检测指数和阈值的大小,根据比较结果确定所述待测样本是A类型样本还是B类型样本;
所述A类型样本和所述B类型样本为如下中的任一种:
(C1)未来2年内发生脑卒中的潜在患者和健康对照;
(C2)未来1.5年内发生脑卒中的潜在患者和健康对照;
(C3)未来1.32年内发生脑卒中的潜在患者和健康对照;
(C4)未来1年内发生脑卒中的潜在患者和健康对照。
其中,所述阈值可根据最大约登指数确定,也可以根据实际情况确定为某一个数值比如0.5。大于阈值归为一类,小于阈值归为另外一类,等于阈值作为不确定的灰区。其中A类型和B类型为相对应的两分类,二分类的分组,哪一组是A类型,哪一组是B类型,要根据具体的数学模型来确定,无需约定。
在实际应用中,以上任一所述数学模型可能会根据DNA甲基化的检测方法以及拟合方式不同有所改变,要根据具体的数学模型来确定,无需约定。
在本发明的实施例中,所述模型具体为log(y/(1-y))=b0+b1x1+b2x2+b3x3+…+bnXn,其中y为因变量即将待测样品的一个或者多个甲基化位点的甲基化值代入模型以后得出的检测指数,b0为常量,x1~xn为自变量即为该待测样品的一个或者多个甲基化位点的甲基化值(每一个值为0-1之间的数值),b1~bn为模型赋予每一个位点甲基化值的权重。
在本发明中,所述模型的建立还可酌情加入年龄、性别、白细胞计数、体重指数、吸烟、饮酒、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等已知参数来提高判别效率。
本发明的实施例中建立的一个具体模型为用于辅助区分未来2年内发生脑卒中的潜在患者和健康对照。所述模型具体为:log(y/(1-y))=-3.795+1.061*HTRA1_E_CpG_1+3.270*HTRA1_E_CpG_2-0.245*HTRA1_E_CpG_3.4+3.264*HTRA1_E_CpG_5+3.185*HTRA1_E_CpG_7+3.305*HTRA1_E_CpG_8.9-0.758*HTRA1_E_CpG_10+2.798*HTRA1_E_CpG_11.12+4.070*HTRA1_E_CpG_13.14.15+2.526*HTRA1_E_CpG_16+0.014*年龄+0.086*性别(男性赋值为1,女性赋值为0)+0.181*白细胞计数+0.005*体重指数+0.261*吸烟(吸烟赋值为1,不吸烟赋值为0)-0.006*饮酒(饮酒赋值为1,不饮酒赋值为0)+0.277*高血压史(有高血压史赋值为1,无高血压史赋值为0)+0.195*糖尿病史(有糖尿病史赋值为1,无糖尿病史赋值为0)+0.268*HDL-C+0.429*LDL-C-0.386*TC+0.142*TG。所述HTRA1_E_CpG_1为SEQ ID No.5所示的DNA片段自5’端第43-44位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_2为SEQ IDNo.5所示的DNA片段自5’端第73-74位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_3.4为SEQ ID No.5所示的DNA片段自5’端第120-121位和第122-123位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_5为SEQ ID No.5所示的DNA片段自5’端第132-133位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_7为SEQ ID No.5所示的DNA片段自5’端第194-195位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_8.9为SEQ ID No.5所示的DNA片段自5’端第204-205位和第206-207位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_10为SEQ ID No.5所示的DNA片段自5’端第225-226位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_11.12为SEQID No.5所示的DNA片段自5’端第240-241位和第248-249位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_13.14.15为SEQ ID No.5所示的DNA片段自5’端第254-255位、第259-260位和第268-269位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_16为SEQ ID No.5所示的DNA片段自5’端第294-295位所示CpG位点的甲基化水平。所述模型的阈值为通过最大约登指数得到的诊断阈值0.53。通过模型计算的检测指数大于0.53的待测者候选为脑卒中潜在患者,小于0.53的待测者候选为无脑卒中。
第七方面,本发明要求保护细胞或机体内HTRA1基因甲基化水平在调控所述细胞或机体内HTRA1基因表达量中的应用。
进一步地,在所述细胞或机体内,所述HTRA1基因甲基化水平越高,所述HTRA1基因表达量越低;所述HTRA1基因甲基化水平越低,所述HTRA1基因表达量越高。
在本发明的具体实施方式中,所述HTRA1基因表达量具体体现为RNA水平的表达。
所述机体可为人。
在本发明的具体实施方式中,未来2年、1.5年、1.32年或1年内发生脑卒中的潜在患者的所述HTRA1基因甲基化水平高于健康对照,相应的,未来2年、1.5年、1.32年或1年内发生脑卒中的潜在患者的所述HTRA1基因表达量低于健康对照。
在上述各方面中,所述检测HTRA1基因甲基化水平为检测血液中HTRA1基因甲基化水平。
在前文各方面中,所述HTRA1基因甲基化水平为HTRA1基因中如下(e1)-(e5)所示片段中全部或部分CpG位点的甲基化水平;
所述甲基化HTRA1基因为HTRA1基因中如下(e1)-(e5)所示片段中全部或部分CpG位点甲基化;
(e1)SEQ ID No.1所示的DNA片段或与其具有80%以上同一性的DNA片段;
(e2)SEQ ID No.2所示的DNA片段或与其具有80%以上同一性的DNA片段;
(e3)SEQ ID No.3所示的DNA片段或与其具有80%以上同一性的DNA片段;
(e4)SEQ ID No.4所示的DNA片段或与其具有80%以上同一性的DNA片段;
(e5)SEQ ID No.5所示的DNA片段或与其具有80%以上同一性的DNA片段。
进一步地,所述“全部或部分CpG位点”具体可为如下任一:
(f1)SEQ ID No.1所示的DNA片段自5’端第164-165位所示CpG位点、SEQ ID No.1所示的DNA片段自5’端第255-256位所示CpG位点、SEQ ID No.1所示的DNA片段自5’端第265-266位所示CpG位点、SEQ ID No.1所示的DNA片段自5’端第282-283位所示CpG位点,或SEQ ID No.1所示的DNA片段自5’端第366-367位所示CpG位点;
(f2)SEQ ID No.2所示的DNA片段自5’端第90-91位所示CpG位点、SEQ ID No.2所示的DNA片段自5’端第155-156位所示CpG位点、SEQ ID No.2所示的DNA片段自5’端第217-218位所示CpG位点、SEQ ID No.2所示的DNA片段自5’端第226-227位所示CpG位点、SEQ IDNo.2所示的DNA片段自5’端第234-235位和第239-240位所示CpG位点,或SEQ ID No.2所示的DNA片段自5’端第263-264位和第269-270位所示CpG位点;
(f3)SEQ ID No.3所示的DNA片段自5’端第95-96位所示CpG位点、SEQ ID No.3所示的DNA片段自5’端第157-158位所示CpG位点、SEQ ID No.3所示的DNA片段自5’端第241-242位所示CpG位点、SEQ ID No.3所示的DNA片段自5’端第258-259位所示CpG位点,或SEQID No.3所示的DNA片段自5’端第268-269位所示CpG位点;
(f4)SEQ ID No.4所示的DNA片段自5’端第33-34位和第35-36位所示CpG位点、SEQID No.4所示的DNA片段自5’端第105-106位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第110-111位和第117-118位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第173-174位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第203-204位和第209-210位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第258-259位、第263-264位和第268-269位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第315-316位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第326-327位、第329-330位和第332-333位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第410-411位所示CpG位点,或SEQ ID No.4所示的DNA片段自5’端第439-440位所示CpG位点;
(f5)SEQ ID No.5所示的DNA片段自5’端第73-74位所示CpG位点、SEQ ID No.5所示的DNA片段自5’端第132-133位所示CpG位点、SEQ ID No.5所示的DNA片段自5’端第194-195位所示CpG位点、SEQ ID No.5所示的DNA片段自5’端第204-205位和第206-207位所示CpG位点、SEQ ID No.5所示的DNA片段自5’端第240-241位和第248-249位所示CpG位点、SEQID No.5所示的DNA片段自5’端第254-255位、第259-260位和第268-269位所示CpG位点,或SEQ ID No.5所示的DNA片段自5’端第294-295位所示CpG位点;
(f6)SEQ ID No.1所示的DNA片段的7个可区分CpG位点;
(f7)SEQ ID No.2所示的DNA片段的9个可区分CpG位点;
(f8)SEQ ID No.3所示的DNA片段的7个可区分CpG位点;
(f9)SEQ ID No.4所示的DNA片段的13个可区分CpG位点;
(f10)SEQ ID No.5所示的DNA片段的10个可区分CpG位点;
(f11)SEQ ID No.1所示的DNA片段的7个可区分CpG位点和SEQ ID No.2所示的DNA片段的9个可区分CpG位点;
(f12)SEQ ID No.1所示的DNA片段的7个可区分CpG位点和SEQ ID No.3所示的DNA片段的7个可区分CpG位点;
(f13)SEQ ID No.1所示的DNA片段的7个可区分CpG位点和SEQ ID No.4所示的DNA片段的13个可区分CpG位点;
(f14)SEQ ID No.1所示的DNA片段的7个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;
(f15)SEQ ID No.2所示的DNA片段的9个可区分CpG位点和SEQ ID No.3所示的DNA片段的7个可区分CpG位点;
(f16)SEQ ID No.2所示的DNA片段的9个可区分CpG位点和SEQ ID No.4所示的DNA片段的13个可区分CpG位点;
(f17)SEQ ID No.2所示的DNA片段的9个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;
(f18)SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ ID No.4所示的DNA片段的13个可区分CpG位点;
(f19)SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;
(f20)SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;
(f21)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点和SEQ ID No.3所示的DNA片段的7个可区分CpG位点;
(f22)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点和SEQ ID No.4所示的DNA片段的13个可区分CpG位点;
(f23)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;
(f24)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ ID No.4所示的DNA片段的13个可区分CpG位点;
(f25)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;
(f26)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;
(f27)SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ ID No.4所示的DNA片段的13个可区分CpG位点;
(f28)SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;
(f29)SEQ ID No.3所示的DNA片段的7个可区分CpG位点、SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;
(f30)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ IDNo.4所示的DNA片段的13个可区分CpG位点;
(f31)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ IDNo.5所示的DNA片段的10个可区分CpG位点;
(f32)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ IDNo.5所示的DNA片段的10个可区分CpG位点;
(f33)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点、SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ IDNo.5所示的DNA片段的10个可区分CpG位点;
(f34)SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点、SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ IDNo.5所示的DNA片段的10个可区分CpG位点;
(f35)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点、SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;
在(f6)-(f35)中,所述SEQ ID No.1所示的DNA片段的7个可区分CpG位点为:SEQID No.1自5’端第60-61位所示CpG位点;第164-165位所示CpG位点;第201-202位所示CpG位点;第255-256位所示CpG位点;第265-266位所示CpG位点;第282-283位所示CpG位点;第366-367位所示CpG位点;
所述SEQ ID No.2所示的DNA片段的9个可区分CpG位点为:SEQ ID No.2自5’端第70-71位所示CpG位点;第90-91位所示CpG位点;第155-156位所示CpG位点;第206-207位所示CpG位点;第217-218位所示CpG位点;第226-227位所示CpG位点;第234-235位和第239-240位所示CpG位点;第263-264位和第269-270位所示CpG位点;第306-307位所示CpG位点;
所述SEQ ID No.3所示的DNA片段的7个可区分CpG位点为SEQ ID No.3自5’端第62-63位所示CpG位点;第95-96位所示CpG位点;第127-128位所示CpG位点;第157-158位所示CpG位点;第241-242位所示CpG位点;第258-259位所示CpG位点;第268-269位所示CpG位点;
所述SEQ ID No.4所示的DNA片段的13个可区分CpG位点为SEQ ID No.4自5’端第33-34位和第35-36位所示CpG位点;第105-106位所示CpG位点;第110-111位和第117-118位所示CpG位点;第166-167位所示CpG位点;第173-174位所示CpG位点;第203-204位和第209-210位所示CpG位点;第258-259位、第263-264位和第268-269位所示CpG位点;第293-294位和第304-305位所示CpG位点;第315-316位所示CpG位点;第326-327位、第329-330位和第332-333位所示CpG位点;第410-411位所示CpG位点;第424-425位所示CpG位点;第439-440位所示CpG位点;
所述SEQ ID No.5所示的DNA片段的10个可区分CpG位点为:SEQ ID No.5自5’端第43-44位所示CpG位点;第73-74位所示CpG位点;第120-121位和第122-123位所示CpG位点;第132-133位所示CpG位点;第194-195位所示CpG位点;第204-205位和第206-207位所示CpG位点;第225-226位所示CpG位点;第240-241位和第248-249位所示CpG位点;第254-255位、第259-260位和第268-269位所示CpG位点;第294-295位所示CpG位点。
在本发明的具体实施方式中,有些相邻的甲基化位点在利用飞行时间质谱进行DNA甲基化分析时由于几个CpG位点位于一个甲基化片段上,峰图无法区分,因而在进行甲基化水平分析、以及构建和使用相关数学模型时将其按照一个甲基化位点进行处理。
在前文各方面中,所述用于检测HTRA1基因甲基化水平的物质包含(或为)用于扩增HTRA1基因全长或部分片段的引物组合。所述用于检测HTRA1基因甲基化水平的试剂包含(或为)用于扩增HTRA1基因全长或部分片段的引物组合。
进一步地,所述部分片段可为如下中至少一个片段:
(g1)SEQ ID No.1所示的DNA片段或其包含的DNA片段;
(g2)SEQ ID No.2所示的DNA片段或其包含的DNA片段;
(g3)SEQ ID No.3所示的DNA片段或其包含的DNA片段;
(g4)SEQ ID No.4所示的DNA片段或其包含的DNA片段;
(g5)SEQ ID No.5所示的DNA片段或其包含的DNA片段;
(g6)与SEQ ID No.1所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(g7)与SEQ ID No.2所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(g8)与SEQ ID No.3所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(g9)与SEQ ID No.4所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(g10)与SEQ ID No.5所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段。
更进一步地,所述引物组合为引物对A和/或引物对B和/或引物对C和/或引物对D和/或引物对E。
所述引物对A为引物A1和引物A2组成的引物对;所述引物A1为SEQ ID No.6或SEQID No.6的第11-34位核苷酸所示的单链DNA;所述引物A2为SEQ ID No.7或SEQ ID No.7的第32-55位核苷酸所示的单链DNA。
所述引物对B为引物B1和引物B2组成的引物对;所述引物B1为SEQ ID No.8或SEQID No.8的第11-35位核苷酸所示的单链DNA;所述引物B2为SEQ ID No.9或SEQ ID No.9的第32-57位核苷酸所示的单链DNA。
所述引物对C为引物C1和引物C2组成的引物对;所述引物C1为SEQ ID No.10或SEQID No.10的第11-35位核苷酸所示的单链DNA;所述引物C2为SEQ ID No.11或SEQ ID No.11的第32-56位核苷酸所示的单链DNA。
所述引物对D为引物D1和引物D2组成的引物对;所述引物D1为SEQ ID No.12或SEQID No.12的第11-35位核苷酸所示的单链DNA;所述引物D2为SEQ ID No.13或SEQ IDNo.13的第32-59位核苷酸所示的单链DNA。
所述引物对E为引物E1和引物E2组成的引物对;所述引物E1为SEQ ID No.14或SEQID No.14的第11-38位核苷酸所示的单链DNA;所述引物E2为SEQ ID No.15或SEQ ID No.15的第32-56位核苷酸所示的单链DNA。
在前文各方面中,所述辅助诊断脑卒中和/或所述在临床症状之前预警卒中的待测者为符合如下任一条件中至少一种的脑卒中潜在患者或者健康对照:
(h1)年龄大于等于65周岁;
(h2)男性;
(h3)吸烟;
(h4)年龄小于65周岁;
(h5)女性;
(h6)不吸烟。
所述吸烟定义为当前吸烟>20支/周,且持续吸烟>3个月/年。
所述脑卒中潜在患者为在未来2年内、1.5年内、1.32年内或者1年内发生脑卒中的潜在患者。
在本发明中,前文所述健康对照可理解为现在及曾经均没有患过脑卒中,以及未来2.5年均不会发生脑卒中。
本发明采用巢式病例对照研究,收集了社区队列入选后2年内新发脑卒中患者作为病例组(病例组在血样采集时均未发病,在血液采集后2年以内发生脑卒中),并按年龄性别匹配2.7年随访期间未发生脑卒中者作为对照组,探讨血液HTRA1甲基化与中国人群脑卒中的关系。研究证明血液HTRA1甲基化可作为脑卒中预警和早期诊断的潜在标志物。本发明对于提高脑卒中诊疗效果均有重要的科学意义和临床应用价值。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、用于检测HTRA1基因甲基化位点的引物设计
经过大量序列和功能分析,本次检测覆盖HTRA1基因启动子区、第一外显子及第一内含子区的五个片段(HTRA1_A、HTRA1_B、HTRA1_C、HTRA1_D和HTRA1_E片段)进行甲基化水平和脑卒中的相关性分析。
HTRA1_A片段(SEQ ID No.1)位于hg19参考基因组chr10:124219200-124221200,正义链。
HTRA1_B片段(SEQ ID No.2)位于hg19参考基因组chr10:124219200-124221200,正义链。
HTRA1_C片段(SEQ ID No.3)位于hg19参考基因组chr10:124219200-124221200,反义链。
HTRA1_D片段(SEQ ID No.4)位于hg19参考基因组chr10:124221500-124223000,正义链。
HTRA1_E片段(SEQ ID No.5)位于hg19参考基因组chr10:124221500-124223000,正义链。
HTRA1_A片段中的CpG位点信息如表1所示。
HTRA1_B片段中的CpG位点信息如表2所示。
HTRA1_C片段中的CpG位点信息如表3所示。
HTRA1_D片段中的CpG位点信息如表4所示。
HTRA1_E片段中的CpG位点信息如表5所示。
表1 HTRA1_A片段中CpG位点信息
CpG位点 | CpG位点在序列中的位置 |
HTRA1_A_1 | SEQ ID No.1自5’端第60-61位 |
HTRA1_A_2 | SEQ ID No.1自5’端第164-165位 |
HTRA1_A_3 | SEQ ID No.1自5’端第201-202位 |
HTRA1_A_4 | SEQ ID No.1自5’端第255-256位 |
HTRA1_A_5 | SEQ ID No.1自5’端第265-266位 |
HTRA1_A_6 | SEQ ID No.1自5’端第282-283位 |
HTRA1_A_7 | SEQ ID No.1自5’端第366-367位 |
表2 HTRA1 B片段中CpG位点信息
CpG位点 | CpG位点在序列中的位置 |
HTRA1_B_2 | SEQ ID No.2自5’端第70-71位 |
HTRA1_B_4 | SEQ ID No.2自5’端第90-91位 |
HTRA1_B_5 | SEQ ID No.2自5’端第155-156位 |
HTRA1_B_6 | SEQ ID No.2自5’端第206-207位 |
HTRA1_B_7 | SEQ ID No.2自5’端第217-218位 |
HTRA1_B_8 | SEQ ID No.2自5’端第226-227位 |
HTRA1_B_9 | SEQ ID No.2自5’端第234-235位 |
HTRA1_B_10 | SEQ ID No.2自5’端第239-240位 |
HTRA1_B_12 | SEQ ID No.2自5’端第263-264位 |
HTRA1_B_13 | SEQ ID No.2自5’端第269-270位 |
HTRA1_B_14 | SEQ ID No.2自5’端第306-307位 |
表3 HTRA1_C片段中CpG位点信息
CpG位点 | CpG位点在序列中的位置 |
HTRA1_C_1 | SEQ ID No.3自5’端第62-63位 |
HTRA1_C_2 | SEQ ID No.3自5’端第95-96位 |
HTRA1_C_3 | SEQ ID No.3自5’端第127-128位 |
HTRA1_C_4 | SEQ ID No.3自5’端第157-158位 |
HTRA1_C_5 | SEQ ID No.3自5’端第241-242位 |
HTRA1_C_6 | SEQ ID No.3自5’端第258-259位 |
HTRA1_C_7 | SEQ ID No.3自5’端第268-269位 |
表4 HTRA1_D片段中CpG位点信息
CpG位点 | CpG位点在序列中的位置 |
HTRA1_D_1 | SEQ ID No.4自5’端第33-34位 |
HTRA1_D_2 | SEQ ID No.4自5’端第35-36位 |
HTRA1_D_3 | SEQ ID No.4自5’端第105-106位 |
HTRA1_D_4 | SEQ ID No.4自5’端第110-111位 |
HTRA1_D_5 | SEQ ID No.4自5’端第117-118位 |
HTRA1_D_7 | SEQ ID No.4自5’端第166-167位 |
HTRA1_D_8 | SEQ ID No.4自5’端第173-174位 |
HTRA1_D_9 | SEQ ID No.4自5’端第203-204位 |
HTRA1_D_10 | SEQ ID No.4自5’端第209-210位 |
HTRA1_D_11 | SEQ ID No.4自5’端第258-259位 |
HTRA1_D_12 | SEQ ID No.4自5’端第263-264位 |
HTRA1_D_13 | SEQ ID No.4自5’端第268-269位 |
HTRA1_D_14 | SEQ ID No.4自5’端第293-294位 |
HTRA1_D_15 | SEQ ID No.4自5’端第304-305位 |
HTRA1_D_16 | SEQ ID No.4自5’端第315-316位 |
HTRA1_D_18 | SEQ ID No.4自5’端第326-327位 |
HTRA1_D_19 | SEQ ID No.4自5’端第329-330位 |
HTRA1_D_20 | SEQ ID No.4自5’端第332-333位 |
HTRA1_D_22 | SEQ ID No.4自5’端第410-411位 |
HTRA1_D_23 | SEQ ID No.4自5’端第424-425位 |
HTRA1_D_24 | SEQ ID No.4自5’端第439-440位 |
表5 HTRA1 E片段中CpG位点信息
CpG位点 | CpG位点在序列中的位置 |
HTRA1_E_1 | SEQ ID No.5自5’端第43-44位 |
HTRA1_E_2 | SEQ ID No.5自5’端第73-74位 |
HTRA1_E_3 | SEQ ID No.5自5’端第120-121位 |
HTRA1_E_4 | SEQ ID No.5自5’端第122-123位 |
HTRA1_E_5 | SEQ ID No.5自5’端第132-133位 |
HTRA1_E_7 | SEQ ID No.5自5’端第194-195位 |
HTRA1_E_8 | SEQ ID No.5自5’端第204-205位 |
HTRA1_E_9 | SEQ ID No.5自5’端第206-207位 |
HTRA1_E_10 | SEQ ID No.5自5’端第225-226位 |
HTRA1_E_11 | SEQ ID No.5自5’端第240-241位 |
HTRA1_E_12 | SEQ ID No.5自5’端第248-249位 |
HTRA1_E_13 | SEQ ID No.5自5’端第254-255位 |
HTRA1_E_14 | SEQ ID No.5自5’端第259-260位 |
HTRA1_E_15 | SEQ ID No.5自5’端第268-269位 |
HTRA1_E_16 | SEQ ID No.5自5’端第294-295位 |
针对五个片段(HTRA1_A片段、HTRA1_B片段、HTRA1_C片段、HTRA1_D片段和HTRA1_E片段)设计特异PCR引物,如表6所示。其中,SEQ ID No.6、SEQ ID No.8、SEQ ID No.10、SEQID No.12和SEQ ID No.14为正向引物,SEQ ID No.7、SEQ ID No.9、SEQ ID No.11、SEQ IDNo.13和SEQ ID No.15为反向引物;SEQ ID No.6、SEQ ID No.8、SEQ ID No.10、SEQ IDNo.12和SEQ ID No.14中自5’端第1至10位为非特异标签,SEQ ID No.6第11至34位、SEQ IDNo.8、SEQ ID No.10和SEQ ID No.12第11至35位、SEQ ID No.14第11至38位为特异引物序列;SEQ ID No.7、SEQ ID No.9、SEQ ID No.11、SEQ ID No.13和SEQ ID No.15自5’端第1至31位为非特异标签,SEQ ID No.7第32至55位、SEQ ID No.9第32至57位、SEQ ID No.11和SEQ ID No.15第32至56位、SEQ ID No.13第32至59位为特异引物序列。引物序列中不包含SNP和CpG位点。
表6 HTRA1甲基化引物序列
扩增片段 | 引物序号 | 引物序列(5’-3’) |
HTRA1_A | SEQ ID No.6 | aggaagagagTTTTGTAGTTTGGTTGTTTAGGGG |
HTRA1_A | SEQ ID No.7 | cagtaatacgactcactatagggagaaggctAAAAAACCTTAACCCAAAATCCAT |
HTRA1_B | SEQ ID No.8 | aggaagagagTATAGGTTTGGTGTTGTTTGGGTAT |
HTRA1_B | SEQ ID No.9 | cagtaatacgactcactatagggagaaggctCCCAAACCCACAATAAAATAATAAAA |
HTRA1_C | SEQ ID No.10 | aggaagagagTGTTTAAGGTTTAGAGGGGTTTTTT |
HTRA1_C | SEQ ID No.11 | cagtaatacgactcactatagggagaaggctTAATTCCATCTACCCCAAAACTACA |
HTRA1_D | SEQ ID No.12 | aggaagagagGGTTATGGAGTGTTTTGAGGGTAAT |
HTRA1_D | SEQ ID No.13 | cagtaatacgactcactatagggagaaggctAAAATAAACTTCTTCCTCATCACTAACC |
HTRA1_E | SEQ ID No.14 | aggaagagagGGTTAGTGATGAGGAAGAAGTTTATTTT |
HTRA1_E | SEQ ID No.15 | cagtaatacgactcactatagggagaaggctACCAATCCCTCTACACTATACTCCC |
实施例2、HTRA1基因甲基化检测及结果分析
一、研究样本
采用流行病学整群抽样方法,于2015年10月至12月对江苏省句容市16个镇的18岁以上社区人群进行调查,基线调查共11151人。本研究通过南京医科大学伦理委员会审查,所有调查对象均签署了知情同意书。
基线调查内容包括收集调查对象的一般人口学资料信息如性别、年龄、籍贯、民族等;询问疾病史、用药史、家族史等,主要包括心血管疾病、糖尿病、肾脏疾病及血脂异常史等;收集吸烟状况、饮酒状况等。吸烟状况分为吸烟(定义为当前吸烟>20支/周,且持续吸烟>3个月/年)、既往吸烟(此研究开始前1年已戒烟)和不吸烟(本研究满足既往吸烟定义的人数为0)。饮酒的定义是目前或过去饮酒≥2次/周且持续饮酒半年。人体测量指标包括体重、血压、身高和腰围。体重测量要求被调查者着轻装,读数精确到0.1kg。血压测量时,被调查对象需满足清晨空腹、未进行剧烈运动,同时静坐休息5分钟。采用水银汞柱血压计测量右臂肱动脉血压,每位被调查者重复血压测量三次,每次需间隔30s以上,若三次收缩压或舒张压测量的差值≥8mmHg,则需加测一次。身高测量时,将皮尺固定在墙上,所有被调查者脱鞋帽,两脚后跟并拢并直立于皮尺,大三角板的直角边用于读数,精确到0.1cm。腰围测量时,在肚脐上1cm处,使用软皮尺贴皮肤围上一圈读数。体质指数(Body mass index,BMI)等于体重(kg)/身高的平方(m2)。此外,被调查者要求清晨空腹采血,共采集两管外周静脉血(抗凝血和促凝血各1管),用于检测生化指标,主要包括白细胞亚型比例、空腹血糖(GLU)、甘油三脂(TG)、高密度脂蛋白胆固醇(HDL-C)、总胆固醇(TC)和低密度脂蛋白胆固醇(LDL-C)等。
每年通过当地医院、疾控中心慢病管理系统、社区卫生服务中心和工作站慢病常规登记项目、社保中心报销数据记录心脑血管疾病发病与死亡信息。队列开始时间为基线调查日期,结局变量为脑卒中发病,对于失访研究对象的随访时间,统一按照随访结束时间的一半来计算。截止随访日期2018年7月13日,共计新发脑卒中234例,我们选择了队列入组后2年内新发脑卒中患者作为病例组,共计139例,经年龄和性别匹配后,选择2.7年随访期间未发生脑卒中者作为对照,共计147例。所有患者离体血液样本都是入组时且发病前收集的。患病情况在后续发病时都经过影像学和病理确诊。
脑卒中病例平均年龄为67.64±9.51岁,对照平均年龄为67.59±9.11岁,两组年龄差异无统计学意义(P>0.05)。性别、BMI、SBP、DBP、吸烟、饮酒、高血压史、糖尿病史、TC、TG、HDL-C、LDL-C、葡萄糖、白细胞计数、中性粒细胞比例、单核细胞、嗜酸性粒细胞和嗜碱性粒细胞比例在两组人群中差异均无统计学意义(P>0.05)。脑卒中病例的中位发病时间(从抽血到脑卒中确诊的时间)为1.32年,对照的中位随访时间(抽血到随访截止日期的时间)为2.71年。详细结果见表7。
表7 研究对象一般人口学特征和临床特征分布情况
注:BMI,体质指数;SBP,收缩压;DBP,舒张压;TC,总胆固醇;Glucose,空腹血糖;TG,甘油三酯;HDL-C,高密度脂蛋白胆固醇;LDL-C,低密度脂蛋白胆固醇。
二、甲基化检测
1、提取血液样本的总DNA。
2、将步骤1制备的血液样本总DNA进行重亚硫酸盐处理(参照Qiagen的DNA甲基化试剂盒说明书操作)。重亚硫酸盐处理后,未发生甲基化的胞嘧啶(C)被转化成尿嘧啶(U),而甲基化的胞嘧啶保持不变,即原来CpG位点的C碱基经重亚硫酸盐处理后转化为C或U。
3、以步骤2经过重亚硫酸盐处理的DNA为模板,采用表6中的5对特异引物对通过DNA聚合酶按照常规PCR反应要求的反应体系进行PCR扩增,5对引物都采用相同的常规PCR体系,且5对引物都按照以下程序进行扩增。
PCR反应程序为:95℃,4min→(95℃,20s→56℃,30s→72℃,2min)45个循环→72℃,5min→4℃,1h。
4、取步骤3的扩增产物,通过飞行时间质谱进行DNA甲基化分析,具体方法如下:
(1)向5μl PCR产物中加入2μl虾碱性磷酸盐(SAP)溶液(0.3ml SAP[0.5U]+1.7mlH2O)然后按照以下程序在PCR仪中孵育(37℃,20min→85℃,5min→4℃,5min);
(2)取出2μl步骤(1)得到的SAP处理后的产物,根据说明书加入5μl T-Cleavage反应体系中,然后在37℃孵育3h;
(3)取步骤(2)的产物,加入19μl去离子水,再用6μg Resin在旋转摇床进行去离子化孵育1h;
(4)2000rpm室温离心5min,将微量上清由Nanodispenser机械手臂上样384SpectroCHIP;
(5)飞行时间质谱分析;获得的数据用SpectroACQUIRE v3.3.1.3软件收集,通过MassArray EpiTyper v1.2软件实现可视化。
上述飞行时间质谱检测使用的试剂均来自于试剂盒(T-Cleavage MassCLEAVEReagent Auto Kit,货号:10129A);上述飞行时间质谱检测使用的检测仪器为 Analyzer Chip Prep Module 384,型号:41243;上述数据分析软件为检测仪器自带软件。
三、质量控制
现场调查:制定严谨的调查问卷,统一衡量标准;调查前对调查员统一培训和考核;正式调查前进行预调查,及时发现和总结问题;问卷由专门的质控人员现场质控,质量不合格的问卷及时退回调查员,重新对研究对象调查;问卷资料双轨录入,并进行一致性检验;现场收集的血标本及时送检。严格按照实验操作要求进行,定期对操作环境紫外消毒;正式实验前进行预实验;随机抽取5%的样本重复飞行时间质谱检测,保证结果一致率达99%以上。双人判读实验结果,整理甲基化数据,保证数据的真实准确性。通过质谱实验,共获得46个可以区别的G峰图。采用SpectroACQUIRE v3.3.1.3软件根据含G峰和A峰面积比较,计算甲基化水平(SpectroACQUIRE v3.3.1.3软件可自动通过计算峰面积得到每个样本在每个CpG位点的甲基化水平)。
四、统计分析
呈正态分布的计量资料采用均数±标准差表示,计数资料用率表示,应用成组t检验或卡方检验进行病例组和对照组一般人口学资料分布差异的比较分析。呈非正态分布的计量资料采用中位数(四分位数间距)表示,采用Mann-Whitney U检验进行病例组和对照组之间差异比较。非条件logistic回归模型用于HTRA1甲基化和脑卒中之间的关联分析,校正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等协变量,以每10%甲基化增量计算比值比(Odds ratio,OR)和95%可信区间(Confidenceinterval,CI)。用Spearman秩相关系数评估两变量之间的统计相关性。通过logistic回归和受试者工作特征曲线(receiver operating characteristic curve,ROC)评价多个CpG位点的组合对脑卒中预警和早期诊断的价值。以双侧P<0.05为差异有统计学意义,所有数据均通过SPSS24.0进行统计分析。
五、结果分析
1、HTRA1甲基化与脑卒中的关联分析
本发明将脑卒中病例按不同的临床发病时间进行关联分析,结果显示,早于临床发病时间2年的139例脑卒中病例HTRA1_A片段5个位点[CpG_2(0.26vs.0.22)、CpG_4(0.23vs.0.19)、CpG_5(0.46vs.0.42)、CpG_6(0.55vs.0.50)、CpG_7(0.69vs.0.65)]、HTRA1_B片段6个位点[CpG_4(0.45vs.0.41)、CpG_5(0.65vs.0.61)、CpG_7(0.76vs.0.72)、CpG_8(0.49vs.0.44)、CpG_9.10(0.64vs.0.59)、CpG_12.13(0.36vs.0.32)]、HTRA1_C片段5个位点[CpG_2(0.24vs.0.20)、CpG_4(0.48vs.0.44)、CpG_5(0.54vs.0.50)、CpG_6(0.69vs.0.64)、CpG_7(0.75vs.0.70)]、HTRA1_D片段10个位点[CpG_1.2(0.21vs.0.17)、CpG_3(0.42vs.0.37)、CpG_4.5(0.51vs.0.47)、CpG_8(0.62vs.0.58)、CpG_9.10(0.73vs.0.68)、CpG_11.12.13(0.29vs.0.24)、CpG_16(0.32vs.0.28)、CpG_18.19.20(0.47vs.0.42)、CpG_22(0.80vs.0.76)、CpG_24(0.34vs.0.30)]和HTRA1_E片段7个位点[CpG_2(0.16vs.0.12)、CpG_5(0.38vs.0.34)、CpG_7(0.53vs.0.48)、CpG_8.9(0.35vs.0.31)、CpG_11.12(0.79vs.0.75)、CpG_13.14.15(0.57vs.0.53)、CpG_16(0.52vs.0.48)]的甲基化水平均显著高于对照;logistic回归结果显示,较正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.23(1.02-1.57),P=0.013;CpG_4:1.24(1.03-1.60),P=0.018;CpG_5:1.28(1.06-1.59),P=0.015;CpG_6:1.33(1.08-1.67),P=0.009;CpG_7:1.28(1.05-1.60),P=0.010]、HTRA1_B[CpG_4:1.30(1.07-1.62),P=0.007;CpG_5:1.32(1.08-1.62),P=0.005;CpG_7:1.29(1.03-1.59),P=0.014;CpG_8:1.21(1.04-1.60),P=0.007;CpG_9.10:1.30(1.04-1.62),P=0.005;CpG_12.13:1.31(1.06-1.61),P=0.004]、HTRA1_C[CpG_2:1.26(1.07-1.61),P=0.008;CpG_4:1.24(1.02-1.59),P=0.013;CpG_5:1.31(1.02-1.61),P=0.005;CpG_6:1.32(1.06-1.62),P=0.006;CpG_7:1.32(1.07-1.61),P=0.007]、HTRA1_D[CpG_1.2:1.27(1.05-1.59),P=0.011;CpG_3:1.32(1.05-1.62),P=0.008;CpG_4.5:1.28(1.06-1.61),P=0.010;CpG_8:1.27(1.04-1.53),P=0.012;CpG_9.10:1.31(1.06-1.61,P=0.013;CpG_11.12.13:1.30(1.03-1.60),P=0.009;CpG_16:1.31(1.05-1.62),P=0.006;CpG_18.19.20:1.30(1.04-1.62),P=0.005;CpG_22:1.29(1.05-1.61),P=0.007;CpG_24:1.31(1.04-1.61),P=0.007]、HTRA1_E[CpG_2:1.23(1.03-1.60),P=0.014;CpG_5:1.23(1.01-1.56),P=0.019;CpG_7:1.33(1.07-1.69),P=0.011;CpG_8.9:1.28(1.05-1.56),P=0.015;CpG_11.12:1.29(1.10-1.69),P=0.016;CpG_13.14.15:1.36(1.07-1.74),P=0.012;CpG_16:1.27(1.02-1.53),P=0.017],具体结果见表8。
有趣的是,早于临床发病时间1.5年(91例)、早于临床发病时间1.32年、(67例)及早于临床发病时间1年(35例)的脑卒中病例上述CpG位点甲基化水平与对照相比差异更显著。早于临床发病时间1.5年的脑卒中病例和对照上述CpG位点甲基化水平分别为HTRA1_A片段5个位点[CpG_2(0.27vs.0.22)、CpG_4(0.24vs.0.19)、CpG_5(0.47vs.0.42)、CpG_6(0.56vs.0.50)、CpG_7(0.70vs.0.65)]、HTRA1_B片段6个位点[CpG_4(0.46vs.0.41)、CpG_5(0.66vs.0.61)、CpG_7(0.77vs.0.72)、CpG_8(0.50vs.0.44)、CpG_9.10(0.65vs.0.59)、CpG_12.13(0.37vs.0.32)]、HTRA1_C片段5个位点[CpG_2(0.25vs.0.20)、CpG_4(0.49vs.0.44)、CpG_5(0.55vs.0.50)、CpG_6(0.70vs.0.64)、CpG_7(0.76vs.0.70)]、HTRA1_D片段10个位点[CpG_1.2(0.22vs.0.17)、CpG_3(0.43vs.0.37)、CpG_4.5(0.52vs.0.47)、CpG_8(0.63vs.0.58)、CpG_9.10(0.74vs.0.68)、CpG_11.12.13(0.30vs.0.24)、CpG_16(0.33vs.0.28)、CpG_18.19.20(0.48vs.0.42)、CpG_22(0.81vs.0.76)、CpG_24(0.35vs.0.30)]和HTRA1_E片段7个位点[CpG_2(0.18vs.0.12)、CpG_5(0.40vs.0.34)、CpG_7(0.54vs.0.48)、CpG_8.9(0.36vs.0.31)、CpG_11.12(0.80vs.0.75)、CpG_13.14.15(0.58vs.0.53)、CpG_16(0.53vs.0.48)];logistic回归结果显示,较正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.34(1.06-1.70),P=0.006;CpG_4:1.33(1.06-1.69),P=0.008;CpG_5:1.38(1.09-1.75),P=0.005;CpG_6:1.43(1.11-1.80),P=0.004;CpG_7:1.38(1.10-1.77),P=0.005]、HTRA1_B[CpG_4:1.40(1.10-1.82),P=0.003;CpG_5:1.42(1.11-1.83),P=0.002;CpG_7:1.39(1.07-1.74),P=0.004;CpG_8:1.35(1.08-1.69),P=0.005;CpG_9.10:1.39(1.12-1.74),P=0.001;CpG_12.13:1.41(1.13-1.78),P=0.002]、HTRA1_C[CpG_2:1.37(1.11-1.71),P=0.006;CpG_4:1.33(1.08-1.69),P=0.003;CpG_5:1.40(1.06-1.72),P=0.002;CpG_6:1.42(1.07-1.76),P=0.001;CpG_7:1.41(1.08-1.74),P=0.001]、HTRA1_D[CpG_1.2:1.37(1.09-1.72),P=0.008;CpG_3:1.42(1.08-1.74),P=0.003;CpG_4.5:1.36(1.10-1.72),P=0.005;CpG_8:1.37(1.07-1.69),P=0.009;CpG_9.10:1.41(1.09-1.78),P=0.004;CpG_11.12.13:1.37(1.06-1.74),P=0.003;CpG_16:1.39(1.07-1.76),P=0.002;CpG_18.19.20:1.38(1.05-1.74),P=0.004;CpG_22:1.33(1.08-1.68),P=0.005;CpG_24:1.39(1.08-1.78),P=0.006]、HTRA1_E[CpG_2:1.31(1.05-1.65),P=0.006;CpG_5:1.35(1.09-1.69),P=0.008;CpG_7:1.40(1.09-1.79),P=0.005;CpG_8.9:1.39(1.08-1.76),P=0.007;CpG_11.12:1.43(1.11-1.89),P=0.003;CpG_13.14.15:1.45(1.17-1.92),P=0.004;CpG_16:1.34(1.09-1.68),P=0.009],详细结果见表9。早于临床发病时间1.32年的脑卒中病例和对照上述CpG位点甲基化水平分别为HTRA1_A片段5个位点[CpG_2(0.29vs.0.22)、CpG_4(0.28vs.0.19)、CpG_5(0.50vs.0.42)、CpG_6(0.59vs.0.50)、CpG_7(0.72vs.0.65)]、HTRA1_B片段6个位点[CpG_4(0.49vs.0.41)、CpG_5(0.69vs.0.61)、CpG_7(0.79vs.0.72)、CpG_8(0.53vs.0.44)、CpG_9.10(0.67vs.0.59)、CpG_12.13(0.40vs.0.32)]、HTRA1_C片段5个位点[CpG_2(0.28vs.0.20)、CpG_4(0.51vs.0.44)、CpG_5(0.58vs.0.50)、CpG_6(0.72vs.0.64)、CpG_7(0.78vs.0.70)]、HTRA1_D片段10个位点[CpG_1.2(0.25vs.0.17)、CpG_3(0.44vs.0.37)、CpG_4.5(0.54vs.0.47)、CpG_8(0.65vs.0.58)、CpG_9.10(0.76vs.0.68)、CpG_11.12.13(0.32vs.0.24)、CpG_16(0.35vs.0.28)、CpG_18.19.20(0.50vs.0.42)、CpG_22(0.83vs.0.76)、CpG_24(0.38vs.0.30)]和HTRA1_E片段7个位点[CpG_2(0.20vs.0.12)、CpG_5(0.43vs.0.34)、CpG_7(0.56vs.0.48)、CpG_8.9(0.38vs.0.31)、CpG_11.12(0.82vs.0.75)、CpG_13.14.15(0.60vs.0.53)、CpG_16(0.56vs.0.48)];logistic回归结果显示,较正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.41(1.09-1.80);CpG_4:1.53(1.15-1.99);CpG_5:1.52(1.14-2.00);CpG_6:1.55(1.19-2.02);CpG_7:1.49(1.11-1.87)]、HTRA1_B[CpG_4:1.54(1.18-2.07);CpG_5:1.57(1.20-2.04);CpG_7:1.48(1.10-1.94);CpG_8:1.42(1.12-1.85);CpG_9.10:1.47(1.16-1.99);CpG_12.13:1.56(1.17-2.08)]、HTRA1_C[CpG_2:1.46(1.13-1.92);CpG_4:1.43(1.14-1.89);CpG_5:1.59(1.15-2.09);CpG_6:1.58(1.15-2.08);CpG_7:1.50(1.11-1.99)]、HTRA1_D[CpG_1.2:1.48(1.13-1.92);CpG_3:1.45(1.10-1.89);CpG_4.5:1.44(1.11-1.88);CpG_8:1.47(1.15-1.89);CpG_9.10:1.51(1.19-2.08);CpG_11.12.13:1.50(1.09-2.07);CpG_16:1.43(1.10-1.87);CpG_18.19.20:1.53(1.15-2.04);CpG_22:1.46(1.09-2.01);CpG_24:1.55(1.18-2.09)]、HTRA1_E[CpG_2:1.42(1.12-1.82);CpG_5:1.50(1.20-1.90);CpG_7:1.52(1.19-1.91);CpG_8.9:1.49(1.11-1.86);CpG_11.12:1.56(1.14-1.94);CpG_13.14.15:1.57(1.19-1.98);CpG_16:1.49(1.14-1.97)],P值均<0.001(表10)。早于临床发病时间1年的脑卒中病例和对照上述CpG位点甲基化水平分别为HTRA1_A片段5个位点[CpG_2(0.32vs.0.22)、CpG_4(0.30vs.0.19)、CpG_5(0.53vs.0.42)、CpG_6(0.62vs.0.50)、CpG_7(0.75vs.0.65)]、HTRA1_B片段6个位点[CpG_4(0.52vs.0.41)、CpG_5(0.71vs.0.61)、CpG_7(0.82vs.0.72)、CpG_8(0.56vs.0.44)、CpG_9.10(0.69vs.0.59)、CpG_12.13(0.42vs.0.32)]、HTRA1_C片段5个位点[CpG_2(0.30vs.0.20)、CpG_4(0.53vs.0.44)、CpG_5(0.61vs.0.50)、CpG_6(0.74vs.0.64)、CpG_7(0.80vs.0.70)]、HTRA1_D片段10个位点[CpG_1.2(0.27vs.0.17)、CpG_3(0.48vs.0.37)、CpG_4.5(0.56vs.0.47)、CpG_8(0.67vs.0.58)、CpG_9.10(0.78vs.0.68)、CpG_11.12.13(0.35vs.0.24)、CpG_16(0.37vs.0.28)、CpG_18.19.20(0.52vs.0.42)、CpG_22(0.85vs.0.76)、CpG_24(0.40vs.0.30)]和HTRA1_E片段7个位点[CpG_2(0.22vs.0.12)、CpG_5(0.45vs.0.34)、CpG_7(0.58vs.0.48)、CpG_8.9(0.41vs.0.31)、CpG_11.12(0.85vs.0.75)、CpG_13.14.15(0.63vs.0.53)、CpG_16(0.58vs.0.48)];logistic回归结果显示,较正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.52(1.13-2.01);CpG_4:1.60(1.17-2.10);CpG_5:1.62(1.19-2.12);CpG_6:1.65(1.21-2.15);CpG_7:1.59(1.14-2.03)]、HTRA1_B[CpG_4:1.62(1.19-2.11);CpG_5:1.67(1.24-2.18);CpG_7:1.58(1.13-2.01);CpG_8:1.50(1.12-1.96);CpG_9.10:1.57(1.17-2.09);CpG_12.13:1.64(1.20-2.13)]、HTRA1_C[CpG_2:1.56(1.15-2.02);CpG_4:1.51(1.17-2.02);CpG_5:1.69(1.25-2.18);CpG_6:1.67(1.18-2.15);CpG_7:1.60(1.13-2.09)]、HTRA1_D[CpG_1.2:1.58(1.16-2.07);CpG_3:1.55(1.11-2.08);CpG_4.5:1.50(1.13-1.99);CpG_8:1.57(1.17-2.07);CpG_9.10:1.63(1.21-2.12);CpG_11.12.13:1.61(1.13-2.10);CpG_16:1.54(1.14-2.03);CpG_18.19.20:1.63(1.18-2.14);CpG_22:1.57(1.09-2.07);CpG_24:1.64(1.20-2.14)]、HTRA1_E[CpG_2:1.49(1.13-1.99);CpG_5:1.61(1.21-2.10);CpG_7:1.63(1.22-2.12);CpG_8.9:1.59(1.13-2.06);CpG_11.12:1.63(1.15-2.09);CpG_13.14.15:1.65(1.20-2.14);CpG_16:1.56(1.16-2.05)],P值均<0.001(表11)。
表8 139例脑卒中病例(早于临床发病时间2年)和147例对照HTRA1基因CpG位点甲基化水平比较
注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。
表9 91例脑卒中病例(早于临床发病时间1.5年)和147例对照HTRA1基因CpG位点甲基化水平比较
注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。
表10 67例脑卒中病例(早于临床发病时间1.32年)和147例对照HTRA1基因CpG位点甲基化水平比较
注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。
表11 35例脑卒中病例(早于临床发病时间1年)和147例对照HTRA1基因CpG位点甲基化水平比较
注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。
2、HTRA1甲基化与脑卒中临床发病时间的相关性分析
将脑卒中病例按早于临床发病时间2年、1.5年、1.32年、1年分别进行HTRA1甲基化与脑卒中发病时间的相关性分析,结果表明,HTRA1_A片段5个位点(CpG_2、CpG_4、CpG_5、CpG_6、CpG_7)、HTRA1_B片段6个位点(CpG_4、CpG_5、CpG_7、CpG_8、CpG_9.10、CpG_12.13)、HTRA1_C片段5个位点(CpG_2、CpG_4、CpG_5、CpG_6、CpG_7)、HTRA1_D片段10个位点(CpG_1.2、CpG_3、CpG_4.5、CpG_8、CpG_9.10、CpG_11.12.13、CpG_16、CpG_18.19.20、CpG_22、CpG_24)和HTRA1_E片段7个位点(CpG_2、CpG_5、CpG_7、CpG_8.9、CpG_11.12、CpG_13.14.15、CpG_16)甲基化程度与脑卒中发病时间均呈负相关(表12-15);尤其早于临床发病时间1.5年、1.32年和1年的脑卒中病例,上述CpG位点甲基化程度与临床发病时间的相关性较强(Spearman秩相关系数绝对值均≥0.550,表13-15)。
表12 HTRA1基因甲基化与脑卒中临床发病时间的相关性(139例脑卒中病例早于临床发病时间2年)
表13 HTRA1基因甲基化与脑卒中临床发病时间的相关性(91例脑卒中病例早于临床发病时间1.5年)
表14 HTRA1基因甲基化与脑卒中临床发病时间的相关性(67例脑卒中病例早于临床发病时间1.32年)
表15 HTRA1基因甲基化与脑卒中临床发病时间的相关性(35例脑卒中病例早于临床发病时间1年)
3、HTRA1甲基化与年龄的相关性
根据研究对象的年龄(65岁)进行分层,分析HTRA1甲基化与脑卒中的关联。结果显示,在年龄≥65岁的人群中,脑卒中病例HTRA1_A片段5个位点[CpG_2(0.27vs.0.22)、CpG_4(0.24vs.0.18)、CpG_5(0.46vs.0.41)、CpG_6(0.55vs.0.50)、CpG_7(0.69vs.0.64)]、HTRA1_B片段6个位点[CpG_4(0.45vs.0.40)、CpG_5(0.65vs.0.60)、CpG_7(0.76vs.0.71)、CpG_8(0.49vs.0.43)、CpG_9.10(0.64vs.0.58)、CpG_12.13(0.37vs.0.32)]、HTRA1_C片段5个位点[CpG_2(0.24vs.0.19)、CpG_4(0.48vs.0.43)、CpG_5(0.54vs.0.49)、CpG_6(0.69vs.0.63)、CpG_7(0.75vs.0.69)]、HTRA1_D片段10个位点[CpG_1.2(0.21vs.0.17)、CpG_3(0.42vs.0.37)、CpG_4.5(0.52vs.0.47)、CpG_8(0.62vs.0.58)、CpG_9.10(0.74vs.0.68)、CpG_11.12.13(0.29vs.0.23)、CpG_16(0.32vs.0.27)、CpG_18.19.20(0.47vs.0.41)、CpG_22(0.80vs.0.75)、CpG_24(0.34vs.0.29)]和HTRA1_E片段7个位点[CpG_2(0.17vs.0.12)、CpG_5(0.38vs.0.34)、CpG_7(0.53vs.0.48)、CpG_8.9(0.35vs.0.31)、CpG_11.12(0.79vs.0.75)、CpG_13.14.15(0.57vs.0.53)、CpG_16(0.52vs.0.47)]的甲基化水平显著高于对照;logistic回归结果显示,较正白细胞亚型比例、性别、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.38(1.10-1.83),P<0.001;CpG_4:1.27(1.07-1.66),P=0.001;CpG_5:1.33(1.10-1.78),P=0.003;CpG_6:1.42(1.18-1.98),P=0.004;CpG_7:1.44(1.17-2.04),P<0.001]、HTRA1_B[CpG_4:1.32(1.09-1.80),P=0.005;CpG_5:1.39(1.10-1.84),P=0.003;CpG_7:1.37(1.12-1.81),P=0.002;CpG_8:1.30(1.10-1.71),P<0.001;CpG_9.10:1.37(1.09-1.87),P<0.001;CpG_12.13:1.42(1.11-1.88),P=0.002]、HTRA1_C[CpG_2:1.34(1.10-1.72),P=0.003;CpG_4:1.26(1.06-1.56),P=0.002;CpG_5:1.38(1.10-1.95),P=0.001;CpG_6:1.42(1.16-1.95),P<0.001;CpG_7:1.39(1.15-1.92),P=0.002]、HTRA1_D[CpG_1.2:1.33(1.06-1.85),P=0.007;CpG_3:1.46(1.13-2.01),P<0.001;CpG_4.5:1.32(1.09-1.63),P=0.004;CpG_8:1.32(1.06-1.68),P=0.009;CpG_9.10:1.39(1.12-1.82),P<0.001;CpG_11.12.13:1.33(1.09-1.76),P<0.001;CpG_16:1.49(1.15-2.03),P<0.001;CpG_18.19.20:1.40(1.09-1.97),P<0.001;CpG_22:1.38(1.07-1.85),P<0.001;CpG_24:1.39(1.10-1.85),P<0.001]、HTRA1_E[CpG_2:1.30(1.07-1.70),P=0.008;CpG_5:1.48(1.08-1.92),P=0.007;CpG_7:1.42(1.08-1.84),P=0.006;CpG_8.9:1.38(1.03-1.79),P=0.010;CpG_11.12:1.44(1.09-1.99),P=0.011;CpG_13.14.15:1.48(1.09-2.00),P=0.009;CpG_16:1.34(1.08-1.70),P=0.007],具体结果见表16。
表16 按年龄分层分析139例早于临床发病时间2年的脑卒中病例和147例对照HTRA1基因CpG位点的甲基化水平比较
注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、性别、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。
4、HTRA1基因甲基化与性别的相关性
根据研究对象的性别进行分层,分析HTRA1甲基化与脑卒中的关联。结果显示,在男性人群中,脑卒中病例HTRA1_A片段5个位点[CpG_2(0.27vs.0.22)、CpG_4(0.24vs.0.19)、CpG_5(0.46vs.0.42)、CpG_6(0.55vs.0.49)、CpG_7(0.69vs.0.64)]、HTRA1_B片段6个位点[CpG_4(0.45vs.0.40)、CpG_5(0.65vs.0.60)、CpG_7(0.76vs.0.71)、CpG_8(0.49vs.0.43)、CpG_9.10(0.64vs.0.57)、CpG_12.13(0.37vs.0.31)]、HTRA1_C片段5个位点[CpG_2(0.25vs.0.19)、CpG_4(0.48vs.0.43)、CpG_5(0.55vs.0.50)、CpG_6(0.69vs.0.63)、CpG_7(0.75vs.0.69)]、HTRA1_D片段10个位点[CpG_1.2(0.21vs.0.16)、CpG_3(0.42vs.0.35)、CpG_4.5(0.51vs.0.45)、CpG_8(0.62vs.0.57)、CpG_9.10(0.74vs.0.67)、CpG_11.12.13(0.29vs.0.23)、CpG_16(0.32vs.0.27)、CpG_18.19.20(0.47vs.0.41)、CpG_22(0.80vs.0.75)、CpG_24(0.34vs.0.29)]和HTRA1_E片段7个位点[CpG_2(0.16vs.0.12)、CpG_5(0.38vs.0.34)、CpG_7(0.53vs.0.48)、CpG_8.9(0.34vs.0.30)、CpG_11.12(0.79vs.0.75)、CpG_13.14.15(0.58vs.0.53)、CpG_16(0.52vs.0.47)]的甲基化水平显著高于对照;logistic回归结果显示,较正白细胞亚型比例、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.37(1.10-1.80),P=0.004;CpG_4:1.25(1.02-1.60),P=0.003;CpG_5:1.36(1.09-1.80),P=0.007;CpG_6:1.45(1.11-1.94),P=0.002;CpG_7:1.36(1.09-1.90),P=0.005]、HTRA1_B[CpG_4:1.34(1.10-1.73),P=0.001;CpG_5:1.39(1.11-1.82),P=0.006;CpG_7:1.39(1.08-1.80),P=0.004;CpG_8:1.34(1.03-1.79),P<0.001;CpG_9.10:1.41(1.13-1.91),P<0.001;CpG_12.13:1.45(1.15-1.92),P<0.001]、HTRA1_C[CpG_2:1.38(1.10-1.81),P<0.001;CpG_4:1.32(1.09-1.69),P=0.001;CpG_5:1.42(1.10-1.94),P=0.002;CpG_6:1.46(1.14-2.02),P<0.001;CpG_7:1.41(1.17-1.89),P<0.001]、HTRA1_D[CpG_1.2:1.39(1.10-1.83),P<0.001;CpG_3:1.37(1.10-1.82),P=0.001;CpG_4.5:1.33(1.07-1.75),P=0.001;CpG_8:1.32(1.09-1.71),P=0.002;CpG_9.10:1.38(1.09-1.80),P<0.001;CpG_11.12.13:1.35(1.10-1.80),P<0.001;CpG_16:1.49(1.13-2.04),P=0.001;CpG_18.19.20:1.37(1.10-1.83),P<0.001;CpG_22:1.40(1.10-1.87),P<0.001;CpG_24:1.33(1.09-1.81),P<0.001]、HTRA1_E[CpG_2:1.29(1.09-1.68),P=0.009;CpG_5:1.36(1.07-1.84),P=0.011;CpG_7:1.39(1.09-1.92),P=0.007;CpG_8.9:1.40(1.05-1.87),P=0.012;CpG_11.12:1.39(1.09-1.92),P=0.008;CpG_13.14.15:1.45(1.07-1.95),P=0.005;CpG_16:1.43(1.13-1.95),P=0.004]。而在女性人群中,上述CpG位点的甲基化水平在脑卒中病例和对照中差异均无统计学意义,具体结果见表17。
表17 按性别分层分析139例早于临床发病时间2年的脑卒中病例和147例对照HTRA1基因CpG位点的甲基化水平比较
注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。
5、HTRA1基因甲基化与吸烟的相关性
研究表明,除遗传机制外,环境因素(如吸烟)可能导致DNA甲基化模式改变。根据研究对象的吸烟状况进行分层,分析HTRA1甲基化与脑卒中的关联。结果显示,在吸烟人群中,脑卒中病例HTRA1_A片段5个位点[CpG_2(0.26vs.0.21)、CpG_4(0.23vs.0.18)、CpG_5(0.47vs.0.41)、CpG_6(0.55vs.0.50)、CpG_7(0.69vs.0.63)]、HTRA1_B片段6个位点[CpG_4(0.45vs.0.41)、CpG_5(0.65vs.0.60)、CpG_7(0.76vs.0.72)、CpG_8(0.49vs.0.43)、CpG_9.10(0.64vs.0.58)、CpG_12.13(0.36vs.0.31)]、HTRA1_C片段5个位点[CpG_2(0.25vs.0.19)、CpG_4(0.48vs.0.43)、CpG_5(0.55vs.0.49)、CpG_6(0.69vs.0.63)、CpG_7(0.75vs.0.69)]、HTRA1_D片段10个位点[CpG_1.2(0.21vs.0.16)、CpG_3(0.42vs.0.35)、CpG_4.5(0.52vs.0.46)、CpG_8(0.62vs.0.56)、CpG_9.10(0.73vs.0.67)、CpG_11.12.13(0.29vs.0.23)、CpG_16(0.32vs.0.27)、CpG_18.19.20(0.47vs.0.41)、CpG_22(0.81vs.0.75)、CpG_24(0.34vs.0.29)]和HTRA1_E片段7个位点[CpG_2(0.16vs.0.12)、CpG_5(0.38vs.0.33)、CpG_7(0.53vs.0.48)、CpG_8.9(0.35vs.0.30)、CpG_11.12(0.79vs.0.75)、CpG_13.14.15(0.58vs.0.53)、CpG_16(0.53vs.0.48)]的甲基化水平显著高于对照;logistic回归结果显示,较正白细胞亚型比例、年龄、性别、饮酒、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.34(1.10-1.78),P=0.005;CpG_4:1.33(1.08-1.71),P=0.004;CpG_5:1.43(1.13-1.96),P<0.001;CpG_6:1.35(1.10-1.85),P=0.006;CpG_7:1.44(1.15-2.03),P<0.001]、HTRA1_B[CpG_4:1.28(1.05-1.66),P=0.010;CpG_5:1.40(1.10-1.93),P=0.005;CpG_7:1.30(1.05-1.72),P=0.006;CpG_8:1.39(1.10-1.83),P=0.001;CpG_9.10:1.42(1.12-1.90),P<0.001;CpG_12.13:1.46(1.16-1.98),P<0.001]、HTRA1_C[CpG_2:1.35(1.10-1.82),P<0.001;CpG_4:1.30(1.05-1.75),P=0.007;CpG_5:1.43(1.13-1.99),P<0.001;CpG_6:1.48(1.16-2.05),P<0.001;CpG_7:1.40(1.13-1.97),P<0.001]、HTRA1_D[CpG_1.2:1.38(1.09-1.81),P=0.001;CpG_3:1.43(1.13-1.97),P<0.001;CpG_4.5:1.37(1.10-1.83),P<0.001;CpG_8:1.31(1.08-1.75),P=0.001;CpG_9.10:1.40(1.09-1.90),P<0.001;CpG_11.12.13:1.39(1.11-1.89),P<0.001;CpG_16:1.38(1.12-1.89),P=0.004;CpG_18.19.20:1.41(1.10-1.95),P<0.001;CpG_22:1.44(1.15-2.05),P<0.001;CpG_24:1.40(1.10-1.95),P<0.001]、HTRA1_E[CpG_2:1.26(1.05-1.70),P=0.007;CpG_5:1.31(1.07-1.85),P=0.006;CpG_7:1.38(1.09-1.96),P=0.005;CpG_8.9:1.41(1.09-1.97),P=0.001;CpG_11.12:1.32(1.05-1.82),P=0.011;CpG_13.14.15:1.43(1.09-2.05),P<0.001;CpG_16:1.33(1.08-1.85),P=0.005],具体结果见表18。
表18 按吸烟与否分层分析139例早于临床发病时间2年的脑卒中病例和147例对照HTRA1基因CpG位点的甲基化水平比较
注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、年龄、性别、饮酒、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。
6、HTRA1基因甲基化与基因表达的相关性
研究表明DNA甲基化能影响基因的表达。因此,本研究随机选取48例上述社区队列入选后2年内新发脑卒中患者作为病例组,并按年龄性别匹配上述2.7年随访期间未发生脑卒中者48例作为对照组。提取外周血白细胞中的RNA,并对其进行反转录,应用荧光定量PCR技术对外周血中HTRA1基因的mRNA表达水平进行检测与分析。结果表明,病例组HTRA1基因的mRNA相对表达水平显著低于对照组(0.75vs.1.26,P=0.006,表19),且HTRA1_A片段5个位点(CpG_2、CpG_4、CpG_5、CpG_6、CpG_7)、HTRA1_B片段6个位点(CpG_4、CpG_5、CpG_7、CpG_8、CpG_9.10、CpG_12.13)、HTRA1_C片段5个位点(CpG_2、CpG_4、CpG_5、CpG_6、CpG_7)、HTRA1_D片段10个位点(CpG_1.2、CpG_3、CpG_4.5、CpG_8、CpG_9.10、CpG_11.12.13、CpG_16、CpG_18.19.20、CpG_22、CpG_24)和HTRA1_E片段7个位点(CpG_2、CpG_5、CpG_7、CpG_8.9、CpG_11.12、CpG_13.14.15、CpG_16)甲基化程度与HTRA1基因的mRNA表达水平均呈负相关(Spearman秩相关系数均≥0.667,表20)。
上述结果表明HTRA1基因甲基化的改变能影响该基因的表达,从而促进脑卒中的发生。
表19 病例组和对照组外周血中HTRA1基因的mRNA表达水平比较
对照(n=48) | 脑卒中病例(n=48) | t/χ2 | P值 |
1.26±0.75 | 0.75±0.39 | 2.851 | 0.006 |
注:内参基因为GAPDH,每个样本设立三个平行样,mRNA的相对表达量用2-ΔΔCt公式计算
表20 HTRA1基因甲基化与基因表达的相关性
7、HTRA1基因甲基化对脑卒中预警和早期诊断的价值
本发明建立的用于辅助脑卒中诊断的数学模型可以达到如下目的:
(1)区分脑卒中患者和无脑卒中对照;
(2)提前预警脑卒中。
数学模型的建立方法如下:
(A)数据来源:步骤一中列出的社区队列入选后2年内新发脑卒中患者139例和2.7年随访期间未发生脑卒中者147例的离体血液样本的目标CpG位点(表1-表5中的一种或多种的组合)甲基化水平(检测方法同步骤二)。
数据可根据实际需要加入年龄、性别、白细胞计数、体重指数、吸烟、饮酒、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等已知参数来提高判别效率。
(B)模型建立
根据需要选取任意两类不同类型患者数据即训练集(例如:早于临床发病时间2年的脑卒中患者和对照、早于临床发病时间1.5年的脑卒中患者和对照、早于临床发病时间1.32年的脑卒中患者和对照、早于临床发病时间1年的脑卒中患者和对照、年龄<65岁的脑卒中患者和年龄<65岁的对照、年龄≥65岁的脑卒中患者和年龄≥65岁的对照、男性脑卒中患者和对照、女性脑卒中患者和对照、吸烟的脑卒中患者和吸烟的对照、不吸烟的脑卒中患者和不吸烟的对照)作为用于建立模型的数据,使用SAS,R,SPSS等统计软件使用二分类逻辑回归的统计方法通过公式建立数学模型。数学模型公式计算出的最大约登指数对应的数值为阈值或直接设定0.5为阈值,待测样品经过测试和代入模型计算后得到的检测指数大于阈值归为一类(B类),小于阈值归为另外一类(A类),等于阈值作为不确定的灰区。在对新的待测样品进行预测来判断属于哪一类时,首先通过DNA甲基化的测定方法检测该待测样品HTRA1基因上一个或者多个CpG位点的甲基化水平,然后将这些甲基化水平的数据代入上述数学模型,计算得到所述待测样本对应的检测指数,然后比较所述待测样本对应的检测指数和阈值的大小,根据比较结果确定所述待测样本属于哪一类样本。
举例:将训练集中HTRA1基因单个CpG位点的甲基化水平或者多个CpG位点组合的甲基化水平的数据通过SAS、R、SPSS等统计软件使用二分类逻辑回归的公式建立用于区分A类和B类的数学模型。该数学模型在此为二类逻辑回归模型,具体为:log(y/(1-y))=b0+b1x1+b2x2+b3x3+…+bnXn,其中y为因变量即将待测样品的一个或者多个甲基化位点的甲基化值代入模型以后得出的检测指数,b0为常量,x1~xn为自变量即为该测试样品的一个或者多个甲基化位点的甲基化值(每一个值为0~1之间的数值),b1~bn为模型赋予每一个位点甲基化值的权重。具体应用时,先根据训练集中已经检测的样本的一个或者多个DNA甲基化位点的甲基化程度(x1~xn)及其已知的分类情况(A类或者B类,分别对y赋值0和1)建立数学模型,由此确定该数学模型的常量b0以及各个甲基化位点的权重b1~bn,并由该数学模型计算出的以最大约登指数对应的数值为阈值或直接设定0.5为划分的阈值。待测样品经过测试和代入模型计算后得到的检测指数即y值大于阈值归为B类,小于阈值归为A类,等于阈值作为不确定的灰区。其中A类和B类为相对应的两分类(二分类的分组,哪一组A类,哪一组是B类,要根据具体的数学模型来确定,在此不做约定)。对受试者的样品进行预测来判断属于哪一类时,首先采集受试者的血液,然后从中提取DNA。将提取的DNA通过重亚硫酸盐转化后,用DNA甲基化的测定方法对受试者HTRA1基因的单个CpG位点的甲基化水平或者多个CpG位点组合的甲基化水平进行检测,然后将检测得到的甲基化数据代入上述数学模型。如果该受试者的HTRA1基因一个或者多个CpG位点的甲基化水平代入上述数学模型后计算出来的值即检测指数大于阈值,则该受试者判定与训练集中检测指数大于阈值的归属一类(B类);如果该受试者的HTRA1基因一个或者多个CpG位点的甲基化水平数据代入上述数学模型后计算出来的值即检测指数小于阈值,则该受试者跟训练集中检测指数小于阈值的归属一类(A类);如果该受试者的HTRA1基因一个或者多个CpG位点的甲基化水平数据代入上述数学模型后计算出来的值即检测指数等于阈值,则不能判断该受试者是A类还是B类。
举例:举例说明HTRA1_E的全部CpG位点(CpG_1,CpG_2,CpG_3.4,CpG_5,CpG_7,CpG_8.9,CpG_10,CpG_11.12,CpG_13.14.15,CpG_16)的甲基化以及数学建模在用于提前2年发现脑卒中患者(提前预警脑卒中)的应用:将早于临床发病时间2年的脑卒中患者和对照训练集(在此为:139例早于临床发病时间2年的脑卒中患者和147例对照)中已经检测的HTRA1_E的全部CpG位点的甲基化水平的数据以及患者的年龄、性别(男性赋值为1,女性赋值为0)、白细胞计数、体重指数、吸烟(吸烟赋值为1,不吸烟赋值为0)、饮酒(饮酒赋值为1,不饮酒赋值为0)、高血压史(有高血压史赋值为1,无高血压史赋值为0)、糖尿病史(有糖尿病史赋值为1,无糖尿病史赋值为0)、HDL-C、LDL-C、TC和TG通过SAS、SPSS软件或R软件使用二分类逻辑回归的公式建立用于提前2年发现脑卒中患者(提前预警脑卒中)的数学模型。该数学模型在此为二类逻辑回归模型,由此确定该数学模型的常量b0以及各个甲基化位点的权重b1~bn,在此例中具体为:log(y/(1-y))=-3.795+1.061*HTRA1_E_CpG_1+3.270*HTRA1_E_CpG_2-0.245*HTRA1_E_CpG_3.4+3.264*HTRA1_E_CpG_5+3.185*HTRA1_E_CpG_7+3.305*HTRA1_E_CpG_8.9-0.758*HTRA1_E_CpG_10+2.798*HTRA1_E_CpG_11.12+4.070*HTRA1_E_CpG_13.14.15+2.526*HTRA1_E_CpG_16+0.014*年龄+0.086*性别+0.181*白细胞计数+0.005*体重指数+0.261*吸烟-0.006*饮酒+0.277*高血压史+0.195*糖尿病史+0.268*HDL-C+0.429*LDL-C-0.386*TC+0.142*TG,其中y为因变量即将待测样品的HTRA1_E的全部CpG位点的甲基化值以及年龄、性别、白细胞计数、体重指数、吸烟、饮酒、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG代入模型以后得出的检测指数。通过最大约登指数得到的诊断阈值(0.53),待测样品的HTRA1_E的全部CpG位点的甲基化水平经过测试后连同其年龄、性别、白细胞计数、体重指数、吸烟、饮酒、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG的信息代入模型进行计算,得到的检测指数即y值大于阈值归为脑卒中潜在患者,小于阈值归为无脑卒中对照,等于阈值则不确定为脑卒中患者还是对照。此模型的曲线下面积(AUC)计算结果为0.78(表21)。具体受试者判断方法举例如下所示,从两位受试者(甲,乙)分别采集血液提取DNA,将提取的DNA通过重亚硫酸盐转化后,用DNA甲基化的测定方法对受试者的HTRA1_E的全部CpG位点的甲基化水平进行检测。然后将检测得到的甲基化水平数据连同受试者的年龄、性别、白细胞计数、体重指数、吸烟、饮酒、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG的信息代入上述数学模型。甲受试者经数学模型后计算出来的值为0.62大于0.53,则甲受试者判定为脑卒中潜在患者;乙受试者的HTRA1_E的全部CpG位点的甲基化水平数据代入上述数学模型后计算出来的值为0.38小于0.53,则乙受试者判定无脑卒中,且未来2年内发生脑卒中的概率小。
(C)模型效果评价
根据上述方法,分别建立用于提前1年、1.32年、1.5年和2年发现脑卒中患者的数学模型,并且通过受试者曲线(ROC曲线)对其有效性进行评价。ROC曲线得出的曲线下面积(AUC)越大,说明模型的区分度越好,分子标志物越有效。采用不同CpG位点进行数学模型构建后的评价结果如表21所示。表21中,1个CpG位点代表HTRA1_A/HTRA1_B/HTRA1_C/HTRA1_D/HTRA1_E扩增片段中任意一个CpG位点,2个CpG位点代表HTRA1_A/HTRA1_B/HTRA1_C/HTRA1_D/HTRA1_E中任意2个CpG位点的组合,3个CpG位点代表HTRA1_A/HTRA1_B/HTRA1_C/HTRA1_D/HTRA1_E中任意3个CpG位点的组合,……以此类推。表中的数值为不同位点组合评价结果的范围值(即任意个CpG位点组合方式的结果均在此范围内)。
本研究结果显示,HTRA1基因甲基化(所有CpG位点)用于提前1年、1.32年、1.5年和2年发现脑卒中的ROC曲线下面积分别为0.92、0.89、0.86、0.82,通过最大约登指数得到的敏感度分别为88.2%、86.0%、83.2%和79.8%,特异度分别为90.6%、86.9%、85.8%和81.2%,提示HTRA1基因甲基化对脑卒中有很好的预警和早期诊断效果。此外,我们进一步分析了HTRA1基因甲基化对不同年龄、性别和吸烟状态的脑卒中的诊断价值,结果显示HTRA1基因甲基化(所有CpG位点)对年龄<65岁和年龄≥65岁者诊断脑卒中的ROC曲线下面积为0.80和0.89,通过最大约登指数得到的敏感度为79.1%和85.9%,特异度为80.4%和87.0%;HTRA1基因甲基化(所有CpG位点)对男性和女性诊断脑卒中的ROC曲线下面积为0.90和0.80,通过最大约登指数得到的敏感度为87.1%和78.9%,特异度为88.4%和80.8%;HTRA1基因甲基化(所有CpG位点)诊断吸烟和不吸烟状态下的脑卒中的ROC曲线下面积为0.89和0.81,通过最大约登指数得到的敏感度为86.3%和79.1%,特异度为87.0%和81.3%。以上结果提示HTRA1基因甲基化对≥65岁人群、男性和吸烟者的脑卒中诊断效果较好(表21)。
表21 HTRA1基因甲基化对脑卒中预警和早期诊断的价值
注:表中的结果是“加入年龄、性别、白细胞计数、体重指数、吸烟、饮酒、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等已知参数”后的结果。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
<110> 南京医科大学
<120> 一种蛋白酶基因甲基化作为脑卒中早期诊断的潜在标志物
<130> GNCLN201336
<160> 15
<170> PatentIn version 3.5
<210> 1
<211> 392
<212> DNA
<213> Artificial sequence
<400> 1
ctctgcagtc tggctgctca gggggatgga ggaggatggg gcttgcaggc aggcacagcc 60
ggtttggaag gtgtcctggc tccagcactc aacttgtggc atgacactca ggggagtcac 120
cctttctggc cctcagtttt ctcctctgta aaataaggaa attcgacaaa aataagttat 180
caccaattta ttcaccacca cgtgtccttt taattccatc tgccccagga ctgcagtggg 240
gagtctttct ttgccgatgg acttcgaaaa tcatcacccc ccgcattttt tgtggttaac 300
cacagctagc caggaactca gggcttctca tcagcagagg cctctgcctc tccagtatcc 360
agggccgaat ggattttggg tcaaggcctc cc 392
<210> 2
<211> 370
<212> DNA
<213> Artificial sequence
<400> 2
cacaggcctg gtgctgcctg ggcacccaga cccacctcca gggtcgccct cagccctcct 60
gatgactctc ggactcgcat ctgtcccaac ggatgcacca aagattctcc agtgggaaat 120
caaatttttg ataacaagtg ttttgaaata atcacgcact tggtgaaaaa tcaaaagagg 180
ggaaaacccc tttcccatct gagaccgctc caccctcgcc agttacgagc tgccgagccg 240
cttcctaggc tctctgcgaa tacggacacg catgccaccc acaacaactt tttaaaagaa 300
tcagacgtgt gaaggattct attcgaatta cttctgctct ctgcttttat cacttcactg 360
tgggtctggg 370
<210> 3
<211> 313
<212> DNA
<213> Artificial sequence
<400> 3
tgcccaaggt ccagaggggt cccccagaaa ggcccaggag cctggggcat gggaaagctg 60
tcggggtccc catgctgact ccctggactc caagcgatat tccataaagc cagggcctcc 120
tggctgcggg agggaggcct tgacccaaaa tccattcggc cctggatact ggagaggcag 180
aggcctctgc tgatgagaag ccctgagttc ctggctagct gtggttaacc acaaaaaatg 240
cggggggtga tgattttcga agtccatcgg caaagaaaga ctccccactg cagtcctggg 300
gcagatggaa tta 313
<210> 4
<211> 480
<212> DNA
<213> Artificial sequence
<400> 4
ggccatggag tgccctgagg gcaaccacac agcgcgggga ccccaggaca aataagagga 60
atgggggcat aaaggaagga gagaagttca ggactgggaa ttggcgcctc gcagagcggc 120
ttcaggacca caagaagtca tttcggttgc tttttcttct atttacgtcc tccgtcccct 180
ttaaaattca ctgctttgat cacgggaccg ctcagtgaaa actgtatgta actcttttgg 240
aaaggaacag tgtttgccgg cccgccccgg agtttctcca aaaagtctac cccgagcagg 300
gaacggtttg gcaccgctct cgtttcggcg gcgttgctgc ctgtcttgct ttcctcgttt 360
tgagccagcc ctacaaaaat gaaagtggct ccttttgaat aagctgaatc gggctttgga 420
tcacgaaatc tgcagaggcg gagaagggac cgggttagtg atgaggaaga agtctacccc 480
<210> 5
<211> 344
<212> DNA
<213> Artificial sequence
<400> 5
ggttagtgat gaggaagaag tctacccctc tgttcctaca gccgcacaca ggacctgttc 60
tggcagggga gacggtggtg atgggggaag gagtggaatg gagcaatgtc taactctctc 120
gcgggacctt ccggagagat gctcctcatc ttcaggcaga ggccatgtgg aaaaataata 180
tcgagttcag cagcggccag ccccgcgttg taggaaccag acagcggggc ttggcagtgc 240
gcttgggcgc agccgtgccg ctgctgccgg accccagtgc tgcctcctca acacgggcag 300
tgccaggaga ggggcatagg ggagcacagt gcagagggac tggt 344
<210> 6
<211> 34
<212> DNA
<213> Artificial sequence
<400> 6
aggaagagag ttttgtagtt tggttgttta gggg 34
<210> 7
<211> 55
<212> DNA
<213> Artificial sequence
<400> 7
cagtaatacg actcactata gggagaaggc taaaaaacct taacccaaaa tccat 55
<210> 8
<211> 35
<212> DNA
<213> Artificial sequence
<400> 8
aggaagagag tataggtttg gtgttgtttg ggtat 35
<210> 9
<211> 57
<212> DNA
<213> Artificial sequence
<400> 9
cagtaatacg actcactata gggagaaggc tcccaaaccc acaataaaat aataaaa 57
<210> 10
<211> 35
<212> DNA
<213> Artificial sequence
<400> 10
aggaagagag tgtttaaggt ttagaggggt ttttt 35
<210> 11
<211> 56
<212> DNA
<213> Artificial sequence
<400> 11
cagtaatacg actcactata gggagaaggc ttaattccat ctaccccaaa actaca 56
<210> 12
<211> 35
<212> DNA
<213> Artificial sequence
<400> 12
aggaagagag ggttatggag tgttttgagg gtaat 35
<210> 13
<211> 59
<212> DNA
<213> Artificial sequence
<400> 13
cagtaatacg actcactata gggagaaggc taaaataaac ttcttcctca tcactaacc 59
<210> 14
<211> 38
<212> DNA
<213> Artificial sequence
<400> 14
aggaagagag ggttagtgat gaggaagaag tttatttt 38
<210> 15
<211> 56
<212> DNA
<213> Artificial sequence
<400> 15
cagtaatacg actcactata gggagaaggc taccaatccc tctacactat actccc 56
Claims (8)
1.用于检测HTRA1基因甲基化水平的物质在制备产品中的应用;所述产品具有如下功能:在临床症状之前预警脑卒中;
所述在临床症状之前预警脑卒中的待测者为脑卒中潜在患者或者健康对照;
所述脑卒中潜在患者为在未来2年内、1.5年内、1.32年内或者1年内发生脑卒中的潜在患者;所述健康对照为现在及曾经均没有患过脑卒中,以及未来2.5年不会发生脑卒中;
所述HTRA1基因甲基化水平为HTRA1基因中如下(e1)-(e5)所示片段中全部CpG位点的甲基化水平:
(e1)SEQ ID No.1所示的DNA片段;
(e2)SEQ ID No.2所示的DNA片段;
(e3)SEQ ID No.3所示的DNA片段;
(e4)SEQ ID No.4所示的DNA片段;
(e5)SEQ ID No.5所示的DNA片段。
2.用于检测HTRA1基因甲基化水平的物质和储存有数学模型建立方法和/或使用方法的介质在制备产品中的应用;所述产品具有如下功能:在临床症状之前预警脑卒中;
所述数学模型按照包括如下步骤的方法获得:
(A1)分别检测n1个A类型样本和n2个B类型样本的HTRA1基因甲基化水平;
(A2)取步骤(A1)获得的所有样本的HTRA1基因甲基化水平数据,按照A类型样本和B类型样本的分类方式,通过二分类逻辑回归法建立数学模型;
所述数学模型的使用方法包括如下步骤:
(B1)检测待测样本的HTRA1基因甲基化水平;
(B2)将步骤(B1)获得的所述待测样本的HTRA1基因甲基化水平数据代入所述数学模型,得到检测指数;然后比较检测指数和阈值的大小,根据比较结果确定所述待测样本是A类型样本还是B类型样本;
所述A类型样本和所述B类型样本为如下中的任一种:
(C1)未来2年内发生脑卒中的潜在患者和健康对照;
(C2)未来1.5年内发生脑卒中的潜在患者和健康对照;
(C3)未来1.32年内发生脑卒中的潜在患者和健康对照;
(C4)未来1年内发生脑卒中的潜在患者和健康对照;
所述健康对照为现在及曾经均没有患过脑卒中,以及未来2.5年不会发生脑卒中;
所述HTRA1基因甲基化水平为HTRA1基因中如下(e1)-(e5)所示片段中全部CpG位点的甲基化水平:
(e1)SEQ ID No.1所示的DNA片段;
(e2)SEQ ID No.2所示的DNA片段;
(e3)SEQ ID No.3所示的DNA片段;
(e4)SEQ ID No.4所示的DNA片段;
(e5)SEQ ID No.5所示的DNA片段。
3.储存有数学模型建立方法和/或使用方法的介质在制备产品中的应用;所述产品具有如下功能:在临床症状之前预警脑卒中;
所述数学模型按照包括如下步骤的方法获得:
(A1)分别检测n1个A类型样本和n2个B类型样本的HTRA1基因甲基化水平;
(A2)取步骤(A1)获得的所有样本的HTRA1基因甲基化水平数据,按照A类型样本和B类型样本的分类方式,通过二分类逻辑回归法建立数学模型;
所述数学模型的使用方法包括如下步骤:
(B1)检测待测样本的HTRA1基因甲基化水平;
(B2)将步骤(B1)获得的所述待测样本的HTRA1基因甲基化水平数据代入所述数学模型,得到检测指数;然后比较检测指数和阈值的大小,根据比较结果确定所述待测样本是A类型样本还是B类型样本;
所述A类型样本和所述B类型样本为如下中的任一种:
(C1)未来2年内发生脑卒中的潜在患者和健康对照;
(C2)未来1.5年内发生脑卒中的潜在患者和健康对照;
(C3)未来1.32年内发生脑卒中的潜在患者和健康对照;
(C4)未来1年内发生脑卒中的潜在患者和健康对照;
所述健康对照为现在及曾经均没有患过脑卒中,以及未来2.5年不会发生脑卒中;
所述HTRA1基因甲基化水平为HTRA1基因中如下(e1)-(e5)所示片段中全部CpG位点的甲基化水平:
(e1)SEQ ID No.1所示的DNA片段;
(e2)SEQ ID No.2所示的DNA片段;
(e3)SEQ ID No.3所示的DNA片段;
(e4)SEQ ID No.4所示的DNA片段;
(e5)SEQ ID No.5所示的DNA片段。
4.根据权利要求1或2所述的应用,其特征在于:所述用于检测HTRA1基因甲基化水平的物质为引物组合。
5.根据权利要求4所述的应用,其特征在于:所述引物组合为引物对A、引物对B、引物对C、引物对D和引物对E;
所述引物对A为引物A1和引物A2组成的引物对;所述引物A1为SEQ ID No.6或SEQ IDNo.6的第11-34位核苷酸所示的单链DNA;所述引物A2为SEQ ID No.7或SEQ ID No.7的第32-55位核苷酸所示的单链DNA;
所述引物对B为引物B1和引物B2组成的引物对;所述引物B1为SEQ ID No.8或SEQ IDNo.8的第11-35位核苷酸所示的单链DNA;所述引物B2为SEQ ID No.9或SEQ ID No.9的第32-57位核苷酸所示的单链DNA;
所述引物对C为引物C1和引物C2组成的引物对;所述引物C1为SEQ ID No.10或SEQ IDNo.10的第11-35位核苷酸所示的单链DNA;所述引物C2为SEQ ID No.11或SEQ ID No.11的第32-56位核苷酸所示的单链DNA;
所述引物对D为引物D1和引物D2组成的引物对;所述引物D1为SEQ ID No.12或SEQ IDNo.12的第11-35位核苷酸所示的单链DNA;所述引物D2为SEQ ID No.13或SEQ ID No.13的第32-59位核苷酸所示的单链DNA;
所述引物对E为引物E1和引物E2组成的引物对;所述引物E1为SEQ ID No.14或SEQ IDNo.14的第11-38位核苷酸所示的单链DNA;所述引物E2为SEQ ID No.15或SEQ ID No.15的第32-56位核苷酸所示的单链DNA。
6.系统,包括:
(D1)用于检测HTRA1基因甲基化水平的试剂和/或仪器;
(D2)装置,所述装置包括单元M和单元N;
所述单元M用于建立数学模型,包括数据采集模块、数据分析处理模块和模型输出模块;
所述数据采集模块用于采集(D1)检测得到的n1个A类型样本和n2个B类型样本的HTRA1基因甲基化水平数据;
所述数据分析处理模块能够基于所述数据采集模块采集的n1个A类型样本和n2个B类型样本的HTRA1基因甲基化水平数据,按照A类型样本和B类型样本的分类方式,通过二分类逻辑回归法建立数学模型;
所述模型输出模块用于输出所述数据分析处理模块建立的数学模型;
所述单元N用于确定待测样本是A类型样本还是B类型样本,包括数据输入模块、数据运算模块、数据比较模块和结论输出模块;
所述数据输入模块用于输入(D1)检测得到的待测者的HTRA1基因甲基化水平数据;
所述数据运算模块用于将所述待测者HTRA1基因甲基化水平数据代入所述数学模型,计算得到检测指数;
所述数据比较模块用于将所述检测指数与阈值进行比较;
所述结论输出模块用于根据所述数据比较模块的比较结果输出所述待测样本是A类型样本还是B类型样本的结论;
所述A类型样本和所述B类型样本为如下中的任一种:
(C1)未来2年内发生脑卒中的潜在患者和健康对照;
(C2)未来1.5年内发生脑卒中的潜在患者和健康对照;
(C3)未来1.32年内发生脑卒中的潜在患者和健康对照;
(C4)未来1年内发生脑卒中的潜在患者和健康对照;
所述健康对照为现在及曾经均没有患过脑卒中,以及未来2.5年不会发生脑卒中;
所述HTRA1基因甲基化水平为HTRA1基因中如下(e1)-(e5)所示片段中全部CpG位点的甲基化水平:
(e1)SEQ ID No.1所示的DNA片段;
(e2)SEQ ID No.2所示的DNA片段;
(e3)SEQ ID No.3所示的DNA片段;
(e4)SEQ ID No.4所示的DNA片段;
(e5)SEQ ID No.5所示的DNA片段。
7.根据权利要求6所述的系统,其特征在于:所述用于检测HTRA1基因甲基化水平的试剂为引物组合。
8.根据权利要求7所述的系统,其特征在于:所述引物组合为引物对A、引物对B、引物对C、引物对D和引物对E;
所述引物对A为引物A1和引物A2组成的引物对;所述引物A1为SEQ ID No.6或SEQ IDNo.6的第11-34位核苷酸所示的单链DNA;所述引物A2为SEQ ID No.7或SEQ ID No.7的第32-55位核苷酸所示的单链DNA;
所述引物对B为引物B1和引物B2组成的引物对;所述引物B1为SEQ ID No.8或SEQ IDNo.8的第11-35位核苷酸所示的单链DNA;所述引物B2为SEQ ID No.9或SEQ ID No.9的第32-57位核苷酸所示的单链DNA;
所述引物对C为引物C1和引物C2组成的引物对;所述引物C1为SEQ ID No.10或SEQ IDNo.10的第11-35位核苷酸所示的单链DNA;所述引物C2为SEQ ID No.11或SEQ ID No.11的第32-56位核苷酸所示的单链DNA;
所述引物对D为引物D1和引物D2组成的引物对;所述引物D1为SEQ ID No.12或SEQ IDNo.12的第11-35位核苷酸所示的单链DNA;所述引物D2为SEQ ID No.13或SEQ ID No.13的第32-59位核苷酸所示的单链DNA;
所述引物对E为引物E1和引物E2组成的引物对;所述引物E1为SEQ ID No.14或SEQ IDNo.14的第11-38位核苷酸所示的单链DNA;所述引物E2为SEQ ID No.15或SEQ ID No.15的第32-56位核苷酸所示的单链DNA。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010558950.1A CN113817812B (zh) | 2020-06-18 | 2020-06-18 | 一种蛋白酶基因甲基化作为脑卒中早期诊断的潜在标志物 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010558950.1A CN113817812B (zh) | 2020-06-18 | 2020-06-18 | 一种蛋白酶基因甲基化作为脑卒中早期诊断的潜在标志物 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113817812A CN113817812A (zh) | 2021-12-21 |
CN113817812B true CN113817812B (zh) | 2024-04-30 |
Family
ID=78911742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010558950.1A Active CN113817812B (zh) | 2020-06-18 | 2020-06-18 | 一种蛋白酶基因甲基化作为脑卒中早期诊断的潜在标志物 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113817812B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103562408A (zh) * | 2011-03-15 | 2014-02-05 | 犹他大学研究基金会 | 诊断和治疗血管相关黄斑病及其症状的方法 |
CN110982907A (zh) * | 2020-02-27 | 2020-04-10 | 上海鹍远生物技术有限公司 | 甲状腺结节相关rDNA甲基化标志物及其应用 |
-
2020
- 2020-06-18 CN CN202010558950.1A patent/CN113817812B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103562408A (zh) * | 2011-03-15 | 2014-02-05 | 犹他大学研究基金会 | 诊断和治疗血管相关黄斑病及其症状的方法 |
CN110982907A (zh) * | 2020-02-27 | 2020-04-10 | 上海鹍远生物技术有限公司 | 甲状腺结节相关rDNA甲基化标志物及其应用 |
Non-Patent Citations (1)
Title |
---|
青年性脑卒中与遗传因素研究进展;贺美文等;医学综述;第24卷(第22期);第4456-4460页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113817812A (zh) | 2021-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Garofano et al. | Pathway-based classification of glioblastoma uncovers a mitochondrial subtype with therapeutic vulnerabilities | |
Gasparetto et al. | Transcription and DNA methylation patterns of blood-derived CD8+ T cells are associated with age and inflammatory bowel disease but do not predict prognosis | |
Brannon et al. | Meta-analysis of clear cell renal cell carcinoma gene expression defines a variant subgroup and identifies gender influences on tumor biology | |
Haugen et al. | Altered gene expression and DNA damage in peripheral blood cells from Friedreich's ataxia patients: cellular model of pathology | |
EP3729439B1 (en) | Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression | |
Yamamoto et al. | Decreased miR-192 expression in peripheral blood of asthmatic individuals undergoing an allergen inhalation challenge | |
US10719579B2 (en) | Validating biomarker measurement | |
JP6055966B2 (ja) | 検出方法 | |
Howrylak et al. | Gene expression profiling of asthma phenotypes demonstrates molecular signatures of atopy and asthma control | |
CN105506115A (zh) | 一种检测诊断遗传性心肌病致病基因的dna文库及其应用 | |
CN112779329B (zh) | 病毒性脑膜炎辅助诊断分子标记物及其应用和试剂盒 | |
CN105603101A (zh) | 检测8个miRNA表达量的系统在制备诊断或辅助诊断肝细胞癌产品中的应用 | |
Liu et al. | ANXA7, PPP3CB, DNAJC9, and ZMYND17 genes at chromosome 10q22 associated with the subgroup of schizophrenia with deficits in attention and executive function | |
Miao et al. | A novel lncRNA-miRNA-mRNA triple network identifies lncRNA TWF1 as an important regulator of miRNA and gene expression in coronary artery disease | |
Zufferey et al. | Epigenetics and methylation in the rheumatic diseases | |
Shi et al. | Gene expression signature for detection of gastric cancer in peripheral blood | |
US20220119885A1 (en) | Dna methylation based biomarkers for life expectancy and morbidity | |
JP2014504881A (ja) | 検出方法 | |
Nowicka et al. | Serum miRNA-based signature indicates radiation exposure and dose in humans: a multicenter diagnostic biomarker study | |
Cheng et al. | A unique circular RNA expression pattern in the peripheral blood of myalgic encephalomyelitis/chronic fatigue syndrome patients | |
Yao et al. | Circulating microRNAs as novel diagnostic biomarkers and prognostic predictors for septic patients | |
CN113817812B (zh) | 一种蛋白酶基因甲基化作为脑卒中早期诊断的潜在标志物 | |
CN104178487A (zh) | Atm基因突变体及其应用 | |
CN108300788A (zh) | 一种用于检测轻型脑外伤的微小核糖核酸组合及其应用 | |
EP3822368A1 (en) | Assessment of pr cellular signaling pathway activity using mathematical modelling of target gene expression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 200072, 3rd to 4th floors, Building 10, No. 351 Yuexiu Road, Hongkou District, Shanghai Applicant after: Tengchen Biotechnology (Shanghai) Co.,Ltd. Address before: 210031 floor 2, building 02, life science and technology Island, No. 11, Yaogu Avenue, Jiangbei new area, Nanjing, Jiangsu Province Applicant before: Nanjing Tengchen Biological Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |