CN117153250B - 烟草依赖个体化干预基因变异位点筛选方法及试剂盒 - Google Patents
烟草依赖个体化干预基因变异位点筛选方法及试剂盒 Download PDFInfo
- Publication number
- CN117153250B CN117153250B CN202311421818.6A CN202311421818A CN117153250B CN 117153250 B CN117153250 B CN 117153250B CN 202311421818 A CN202311421818 A CN 202311421818A CN 117153250 B CN117153250 B CN 117153250B
- Authority
- CN
- China
- Prior art keywords
- site
- reagent
- multiplied
- sites
- pipes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000002637 Nicotiana tabacum Nutrition 0.000 title claims abstract description 32
- 230000001419 dependent effect Effects 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000012216 screening Methods 0.000 title claims abstract description 20
- 206010064571 Gene mutation Diseases 0.000 title description 6
- 244000061176 Nicotiana tabacum Species 0.000 title 1
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 52
- 239000003814 drug Substances 0.000 claims abstract description 44
- 229940079593 drug Drugs 0.000 claims abstract description 40
- 241000208125 Nicotiana Species 0.000 claims abstract description 31
- 238000002670 nicotine replacement therapy Methods 0.000 claims abstract description 25
- IKBZAUYPBWFMDI-UHFFFAOYSA-N 5-bromo-4-methoxy-7-methyl-2,3-dihydro-1h-indene Chemical compound C1=C(Br)C(OC)=C2CCCC2=C1C IKBZAUYPBWFMDI-UHFFFAOYSA-N 0.000 claims abstract description 23
- 229960004367 bupropion hydrochloride Drugs 0.000 claims abstract description 21
- 230000035772 mutation Effects 0.000 claims abstract description 20
- 230000005586 smoking cessation Effects 0.000 claims abstract description 20
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 238000001514 detection method Methods 0.000 claims abstract description 8
- 238000012098 association analyses Methods 0.000 claims abstract description 7
- 239000003153 chemical reaction reagent Substances 0.000 claims description 62
- 239000000523 sample Substances 0.000 claims description 58
- 108020004414 DNA Proteins 0.000 claims description 30
- 102000053602 DNA Human genes 0.000 claims description 30
- 239000007788 liquid Substances 0.000 claims description 27
- 108091034117 Oligonucleotide Proteins 0.000 claims description 18
- 239000011324 bead Substances 0.000 claims description 18
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 15
- 238000009396 hybridization Methods 0.000 claims description 15
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 claims description 14
- 238000003908 quality control method Methods 0.000 claims description 14
- 239000007983 Tris buffer Substances 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 12
- 239000000243 solution Substances 0.000 claims description 12
- 229940095064 tartrate Drugs 0.000 claims description 12
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 claims description 12
- 238000004140 cleaning Methods 0.000 claims description 11
- 102100036194 Cytochrome P450 2A6 Human genes 0.000 claims description 10
- 101000875170 Homo sapiens Cytochrome P450 2A6 Proteins 0.000 claims description 10
- 239000012535 impurity Substances 0.000 claims description 10
- 102000004190 Enzymes Human genes 0.000 claims description 9
- 108090000790 Enzymes Proteins 0.000 claims description 9
- 102100039907 Neuronal acetylcholine receptor subunit alpha-5 Human genes 0.000 claims description 9
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 9
- 238000005406 washing Methods 0.000 claims description 9
- 101000745175 Homo sapiens Neuronal acetylcholine receptor subunit alpha-5 Proteins 0.000 claims description 8
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 claims description 7
- 102000003960 Ligases Human genes 0.000 claims description 7
- 108090000364 Ligases Proteins 0.000 claims description 7
- 230000003321 amplification Effects 0.000 claims description 7
- 239000007853 buffer solution Substances 0.000 claims description 7
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 7
- 239000000126 substance Substances 0.000 claims description 7
- SNICXCGAKADSCV-JTQLQIEISA-N (-)-Nicotine Chemical compound CN1CCC[C@H]1C1=CC=CN=C1 SNICXCGAKADSCV-JTQLQIEISA-N 0.000 claims description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 claims description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 claims description 6
- 229960002715 nicotine Drugs 0.000 claims description 6
- SNICXCGAKADSCV-UHFFFAOYSA-N nicotine Natural products CN1CCCC1C1=CC=CN=C1 SNICXCGAKADSCV-UHFFFAOYSA-N 0.000 claims description 6
- 102100039908 Neuronal acetylcholine receptor subunit alpha-3 Human genes 0.000 claims description 5
- 102100030913 Acetylcholine receptor subunit alpha Human genes 0.000 claims description 4
- 101000726895 Homo sapiens Acetylcholine receptor subunit alpha Proteins 0.000 claims description 4
- 101000745163 Homo sapiens Neuronal acetylcholine receptor subunit alpha-3 Proteins 0.000 claims description 4
- 108010090804 Streptavidin Proteins 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 238000012165 high-throughput sequencing Methods 0.000 claims description 4
- 238000007789 sealing Methods 0.000 claims description 4
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 claims description 3
- 238000001712 DNA sequencing Methods 0.000 claims description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 3
- 238000013461 design Methods 0.000 claims description 3
- 229960000633 dextran sulfate Drugs 0.000 claims description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 claims description 3
- 238000007477 logistic regression Methods 0.000 claims description 3
- 239000013642 negative control Substances 0.000 claims description 3
- 229920000136 polysorbate Polymers 0.000 claims description 3
- 239000013641 positive control Substances 0.000 claims description 3
- 239000012744 reinforcing agent Substances 0.000 claims description 3
- 238000013515 script Methods 0.000 claims description 3
- 239000011780 sodium chloride Substances 0.000 claims description 3
- 102100022725 Acetylcholine receptor subunit beta Human genes 0.000 claims description 2
- 102100022729 Acetylcholine receptor subunit delta Human genes 0.000 claims description 2
- 102100040963 Acetylcholine receptor subunit epsilon Human genes 0.000 claims description 2
- 102100040966 Acetylcholine receptor subunit gamma Human genes 0.000 claims description 2
- 108700028369 Alleles Proteins 0.000 claims description 2
- 102100039182 Ankyrin repeat and protein kinase domain-containing protein 1 Human genes 0.000 claims description 2
- 102100040999 Catechol O-methyltransferase Human genes 0.000 claims description 2
- 108020002739 Catechol O-methyltransferase Proteins 0.000 claims description 2
- 108010020070 Cytochrome P-450 CYP2B6 Proteins 0.000 claims description 2
- 102100038739 Cytochrome P450 2B6 Human genes 0.000 claims description 2
- 102100020756 D(2) dopamine receptor Human genes 0.000 claims description 2
- 102000017679 HTR3A Human genes 0.000 claims description 2
- 102000017678 HTR3B Human genes 0.000 claims description 2
- 101000761343 Homo sapiens 5-hydroxytryptamine receptor 3A Proteins 0.000 claims description 2
- 101000964058 Homo sapiens 5-hydroxytryptamine receptor 3B Proteins 0.000 claims description 2
- 101000678746 Homo sapiens Acetylcholine receptor subunit beta Proteins 0.000 claims description 2
- 101000678765 Homo sapiens Acetylcholine receptor subunit delta Proteins 0.000 claims description 2
- 101000965233 Homo sapiens Acetylcholine receptor subunit epsilon Proteins 0.000 claims description 2
- 101000965219 Homo sapiens Acetylcholine receptor subunit gamma Proteins 0.000 claims description 2
- 101000889403 Homo sapiens Ankyrin repeat and protein kinase domain-containing protein 1 Proteins 0.000 claims description 2
- 101000931901 Homo sapiens D(2) dopamine receptor Proteins 0.000 claims description 2
- 101001122476 Homo sapiens Mu-type opioid receptor Proteins 0.000 claims description 2
- 101000679245 Homo sapiens Neuronal acetylcholine receptor subunit alpha-10 Proteins 0.000 claims description 2
- 101000782865 Homo sapiens Neuronal acetylcholine receptor subunit alpha-2 Proteins 0.000 claims description 2
- 101000745167 Homo sapiens Neuronal acetylcholine receptor subunit alpha-4 Proteins 0.000 claims description 2
- 101000822072 Homo sapiens Neuronal acetylcholine receptor subunit alpha-6 Proteins 0.000 claims description 2
- 101000822103 Homo sapiens Neuronal acetylcholine receptor subunit alpha-7 Proteins 0.000 claims description 2
- 101000822093 Homo sapiens Neuronal acetylcholine receptor subunit alpha-9 Proteins 0.000 claims description 2
- 101000726901 Homo sapiens Neuronal acetylcholine receptor subunit beta-2 Proteins 0.000 claims description 2
- 101000726905 Homo sapiens Neuronal acetylcholine receptor subunit beta-3 Proteins 0.000 claims description 2
- 101000678747 Homo sapiens Neuronal acetylcholine receptor subunit beta-4 Proteins 0.000 claims description 2
- 102100028647 Mu-type opioid receptor Human genes 0.000 claims description 2
- 102100022598 Neuronal acetylcholine receptor subunit alpha-10 Human genes 0.000 claims description 2
- 102100035585 Neuronal acetylcholine receptor subunit alpha-2 Human genes 0.000 claims description 2
- 102100039909 Neuronal acetylcholine receptor subunit alpha-4 Human genes 0.000 claims description 2
- 102100021518 Neuronal acetylcholine receptor subunit alpha-6 Human genes 0.000 claims description 2
- 102100021511 Neuronal acetylcholine receptor subunit alpha-7 Human genes 0.000 claims description 2
- 102100021520 Neuronal acetylcholine receptor subunit alpha-9 Human genes 0.000 claims description 2
- 102100030912 Neuronal acetylcholine receptor subunit beta-2 Human genes 0.000 claims description 2
- 102100030911 Neuronal acetylcholine receptor subunit beta-3 Human genes 0.000 claims description 2
- 102100022728 Neuronal acetylcholine receptor subunit beta-4 Human genes 0.000 claims description 2
- 230000004060 metabolic process Effects 0.000 claims description 2
- 108091091116 miR-4761 stem-loop Proteins 0.000 claims description 2
- 230000003287 optical effect Effects 0.000 claims description 2
- 238000011144 upstream manufacturing Methods 0.000 claims description 2
- 230000000391 smoking effect Effects 0.000 description 10
- 238000002156 mixing Methods 0.000 description 8
- 208000025569 Tobacco Use disease Diseases 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 230000007774 longterm Effects 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 235000019788 craving Nutrition 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 239000002096 quantum dot Substances 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 239000008280 blood Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 2
- 206010008190 Cerebrovascular accident Diseases 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 208000007882 Gastritis Diseases 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 206010057852 Nicotine dependence Diseases 0.000 description 2
- 102000019315 Nicotinic acetylcholine receptors Human genes 0.000 description 2
- 108050006807 Nicotinic acetylcholine receptors Proteins 0.000 description 2
- 208000006011 Stroke Diseases 0.000 description 2
- 208000007271 Substance Withdrawal Syndrome Diseases 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 238000003149 assay kit Methods 0.000 description 2
- 208000026106 cerebrovascular disease Diseases 0.000 description 2
- 208000029078 coronary artery disease Diseases 0.000 description 2
- 230000002526 effect on cardiovascular system Effects 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 230000007614 genetic variation Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 238000002483 medication Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 229940015769 nicotine chewing gum Drugs 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000013558 reference substance Substances 0.000 description 2
- 208000023504 respiratory system disease Diseases 0.000 description 2
- 239000007939 sustained release tablet Substances 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 206010006458 Bronchitis chronic Diseases 0.000 description 1
- 101150007447 CHRNA3 gene Proteins 0.000 description 1
- 101150024238 CHRNA5 gene Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 101150090987 Chrnb4 gene Proteins 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000028937 DNA protection Effects 0.000 description 1
- 206010014561 Emphysema Diseases 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010022998 Irritability Diseases 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 102100026456 POU domain, class 3, transcription factor 3 Human genes 0.000 description 1
- 101710133393 POU domain, class 3, transcription factor 3 Proteins 0.000 description 1
- 208000021063 Respiratory fume inhalation disease Diseases 0.000 description 1
- 208000013738 Sleep Initiation and Maintenance disease Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 102000015296 acetylcholine-gated cation-selective channel activity proteins Human genes 0.000 description 1
- 108040006409 acetylcholine-gated cation-selective channel activity proteins Proteins 0.000 description 1
- 238000011276 addition treatment Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 206010006451 bronchitis Diseases 0.000 description 1
- 229960001058 bupropion Drugs 0.000 description 1
- SNPPWIUOZRMYNY-UHFFFAOYSA-N bupropion Chemical compound CC(C)(C)NC(C)C(=O)C1=CC=CC(Cl)=C1 SNPPWIUOZRMYNY-UHFFFAOYSA-N 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 239000012295 chemical reaction liquid Substances 0.000 description 1
- 208000007451 chronic bronchitis Diseases 0.000 description 1
- 208000023652 chronic gastritis Diseases 0.000 description 1
- 235000019504 cigarettes Nutrition 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 210000002249 digestive system Anatomy 0.000 description 1
- 208000010643 digestive system disease Diseases 0.000 description 1
- 208000000718 duodenal ulcer Diseases 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 230000005713 exacerbation Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 208000021302 gastroesophageal reflux disease Diseases 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 206010022437 insomnia Diseases 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000007794 irritation Effects 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010197 meta-analysis Methods 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 208000000689 peptic esophagitis Diseases 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- JQSHBVHOMNKWFT-DTORHVGOSA-N varenicline Chemical compound C12=CC3=NC=CN=C3C=C2[C@H]2C[C@@H]1CNC2 JQSHBVHOMNKWFT-DTORHVGOSA-N 0.000 description 1
- 229960004751 varenicline Drugs 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开一种烟草依赖个体化干预基因变异位点筛选方法及试剂盒,能够针对患者的基因和位点精确地预测烟草依赖者应该使用哪种药物。方法包括:(1)根据戒烟药物的不同将下机数据分为三组:酒石酸伐尼克兰组,盐酸安非他酮组,以及尼古丁替代疗法(NRT)组,每组分别进行全基因组关联分析GWAS;(2)在文献中筛选候选烟草依赖基因的位点,根据位点证据的强弱,制定证据等级,根据不同的证据等级,对文献中的位点进行分类,选择证据等级最高的位点;(3)对文献位点和GWAS显著性位点进行连锁不平衡分析,获得标签位点。最终将标签位点和重要的文献位点作为试剂盒的检测靶点,组建试剂盒。
Description
技术领域
本发明涉及生物信息学的技术领域,尤其涉及一种烟草依赖个体化干预基因变异位点筛选方法,以及利用该烟草依赖个体化干预基因变异位点筛选方法的试剂盒。
背景技术
已经有大量的研究证实了吸烟可以引起很多疾病,比如呼吸系统疾病、消化系统疾病、心脑血管疾病等。长期吸烟,烟草中的有害物质会侵害呼吸道和肺部,导致各种呼吸系统疾病。例如,吸烟是慢性支气管炎、肺气肿和慢性阻塞性肺疾病的主要诱因之一。而且吸烟会增加肺癌的发病几率。长期大量吸烟还会对消化系统造成不良的影响。食管壁、胃肠粘膜等长期受到烟草的不良刺激,会增加患反流性食管炎、急慢性胃炎、十二指肠溃疡、胃溃疡、胃癌、食道癌等疾病的风险。长期抽烟还可对身体的血管造成进行性的损害,增加患高血压、冠心病、脑卒中、动脉粥样硬化等心脑血管疾病的风险。
吸烟可以成瘾,称为烟草依赖。导致烟草依赖和治疗药物疗效差异的影响因素众多,研究显示遗传因素具有重要的作用,烟草依赖与数百个基因变异相关。烟草依赖相关的慢性病随着烟龄的累积而逐渐显现。吸烟人群患肺癌的风险是不吸烟人群的25倍,患冠心病或卒中的风险是不吸烟者的2~4倍。如果40岁前戒烟,烟草依赖相关疾病的死亡风险降低约90%。
实现永久戒烟十分困难,需要30甚至更多次的尝试才能实现。3%~5%的吸烟者在尝试戒烟后达到6~12个月不吸烟,大部分人会在尝试戒烟后8天内复吸,急性戒断症状(如难以集中注意力,以及焦虑、悲伤、愤怒、沮丧、易怒、失眠和饥饿感加重)和渴望吸烟(烟瘾)是导致戒烟失败的主要原因。戒断症状在一个人尝试戒烟后2天内达到顶峰,并在停止吸烟后1周内大大减轻,但烟瘾往往持续存在并导致复吸。停止吸烟后的1年内,复吸率高达10%,2年后降至2%~4%。此外,远期复吸也有可能发生。
目前有3种能够增加长期戒烟效果的一线临床戒烟用药,包括非处方戒烟药尼古丁替代疗法(nicotine replacement therapy,NRT)(如尼古丁咀嚼胶、和尼古丁贴剂)和2种处方类戒烟药(盐酸安非他酮缓释片和酒石酸伐尼克兰)。我国目前常用的一线戒烟药物有盐酸安非他酮缓释片、酒石酸伐尼克兰以及尼古丁咀嚼胶。
不同的药物对不同烟草依赖者产生不同的疗效以及副作用,而研究表明这种差异是由烟草依赖患者的基因型差异所导致的。多项双生子研究结果显示,尼古丁依赖与遗传相关,其中遗传因素作用约占59%,进一步Meta分析显示,尼古丁依赖还存在性别差异,男女性别遗传因素分别为59%和46%,可见遗传因素在治疗烟草依赖的药物疗效差异中的重要作用。但是,目前尚无可以根据患者的基因型精确地预测应该使用哪种戒烟药物的方法。
发明内容
为克服现有技术的缺陷,本发明要解决的技术问题是提供了一种烟草依赖个体化干预基因变异位点筛选方法,该方法能够针对患者的基因和位点精确地预测烟草依赖者应该使用哪种药物。
本发明的技术方案是:这种烟草依赖个体化干预基因变异位点筛选方法包括以下步骤:
(1)根据戒烟药物的不同将下机数据分为三组:酒石酸伐尼克兰组,盐酸安非他酮组,以及尼古丁替代疗法组,每组分别进行如下步骤的全基因组关联分析GWAS:
(1.1)数据质控,利用Trimmomatic和BBTools组件中的bbduk.sh脚本来获得高质量的有效数据;
(1.2)数据比对;
(1.3)变异位点鉴定,得到百万级别的SNP位点;
(1.4)使用PLINK软件并结合上一步处理好的SNP位点,使用logistic回归模型对BED文件进行分析,获得GWAS summary数据;
(2)在文献中筛选候选烟草的位点,根据位点证据的强弱,制定证据等级,根据不同的证据等级,对文献中的位点进行分类,选择证据等级最高的位点;
(3)通过连锁不平衡分析,将文献中的位点和GWAS数据中得到的位点构建连锁不平衡模块,获得能代表模块的标签位点,通过GWAS数据佐证文献筛选出的位点的重要性;
(4)最终入选了重要的文献位点和标签位点。
本发明根据戒烟药物的不同将下机数据分为三组:酒石酸伐尼克兰组,盐酸安非他酮组,以及尼古丁替代疗法组,每组分别进行如下步骤的全基因组关联分析GWAS,在文献中筛选候选烟草的位点,根据位点证据的强弱,制定证据等级,根据不同的证据等级,对文献中的位点进行分类,选择证据等级最高的位点,结合文献中的位点和GWAS数据中得到的位点,得到最终的候选位点和基因,因此能够针对患者的基因和位点精确地预测烟草依赖者应该使用哪种药物。
还提供了烟草依赖个体化干预基因变异位点筛选方法的试剂盒,本试剂盒应用在戒烟药物的选择上,通过构建样本DNA测序预文库,并使用特异探针对文库进行目标区域捕获富集,捕获后的文库通过高通量测序,实现多个基因多种突变的一次性检测;
试剂盒A部分组分如下:
试剂1:组分名称为末端修复液,成分包括Tris,规格和数量为96 µL×1管;
试剂2:组分名称为末端修复酶,成分包括末端修复酶,规格和数量为192 µL×1管;
试剂3:组分名称为连接缓冲液,成分包括Tris、ATP、二硫苏糖醇,规格和数量为384 µL×1管;
试剂4:组分名称为连接酶,成分包括T4连接酶,规格和数量为192 µL×1管;
试剂5:组分名称为接头,成分包括寡核苷酸,规格和数量为5 µL×32管;
试剂6:组分名称为引物,成分包括寡核苷酸,规格和数量为70 µL×1管;
试剂7:组分名称为扩增液,成分包括Tris、dNTPs、DNA 聚合酶,规格和数量为1390µL×2管;
试剂8:组分名称为封闭液,成分包括寡核苷酸,规格和数量为176 µL×1管;
试剂9:组分名称为杂交液,成分包括吐温、硫酸葡聚糖,规格和数量为672 µL×1管;
试剂10:组分名称为杂交增强剂,成分包括甲酰胺,规格和数量为215 µL×1管;
试剂11:组分名称为捕获探针,成分包括寡核苷酸,规格和数量为211 µL×1管;
试剂12:组分名称为洗杂液SW,成分包括乙二胺四乙酸二钠盐,规格和数量为1152µL×1管;
试剂13:组分名称为洗杂液1,成分包括十二烷基硫酸钠,规格和数量为960 µL×1管;
试剂14:组分名称为洗杂液2,成分包括十二烷基硫酸钠,规格和数量为576 µL×1管;
试剂15:组分名称为洗杂液3,成分包括十二烷基硫酸钠,规格和数量为576 µL×1管;
试剂16:组分名称为磁珠清洗液,成分包括Tris、EDTA、氯化钠,规格和数量为1415µL×4管;
试剂17:组分名称为标签,成分包括寡核苷酸,规格和数量为4 µL×32管;
试剂18:组分名称为阳性对照品,成分包括脱氧核糖核酸,规格和数量为24 µL×1管;
试剂19:组分名称为阴性对照品,成分包括脱氧核糖核酸,规格和数量为24 µL×1管;
试剂盒B部分:
试剂20:组分名称为捕获磁珠,成分包括链霉亲和素磁珠,规格和数量为1760 µL×1管。
附图说明
图1为根据本发明的烟草依赖个体化干预基因变异位点筛选方法的流程图。
具体实施方式
如图1所示,这种烟草依赖个体化干预基因变异位点筛选方法包括以下步骤:
(1)根据戒烟药物的不同将下机数据分为三组:酒石酸伐尼克兰组,盐酸安非他酮组,以及尼古丁替代疗法组,每组分别进行如下步骤的全基因组关联分析GWAS(GenomeWide Association Study,全基因组关联分析,使用全基因组测序的方式来找到疾病的相关位点的一种方法):
(1.1)数据质控,利用Trimmomatic(github.com/usadellab/Trimmomatic)和BBTools组件中的bbduk.sh(Version 38.93)脚本来获得高质量的有效数据;
(1.2)数据比对;
(1.3)变异位点鉴定,得到百万级别的SNP(单核苷酸多态性)位点;
(1.4)使用PLINK软件并结合上一步处理好的SNP位点,使用logistic回归模型(二分类模型)对BED文件进行分析,获得GWAS summary数据;
(2)在文献中筛选候选烟草的位点,根据位点证据的强弱,制定证据等级,根据不同的证据等级,对文献中的位点进行分类,选择证据等级最高的位点;
(3)通过连锁不平衡分析,将文献中的位点和GWAS数据中得到的位点构建连锁不平衡模块,获得能代表模块的标签位点;
(4)最终入选了重要的文献位点和标签位点。
本发明根据戒烟药物的不同将下机数据分为三组:酒石酸伐尼克兰组,盐酸安非他酮组,以及尼古丁替代疗法组,每组分别进行如下步骤的全基因组关联分析GWAS,在文献中筛选候选烟草的位点,根据位点证据的强弱,制定证据等级,根据不同的证据等级,对文献中的位点进行分类,选择证据等级最高的位点,结合文献中的位点和GWAS数据中得到的位点,得到最终的候选位点和基因,因此能够针对患者的基因和位点精确地预测烟草依赖者应该使用哪种药物。
优选地,所述步骤(1.1)中,过滤条件为:去掉接头;去掉3'和5'端质量值低于3的碱基;设置4碱基长的滑窗,如果每个碱基的平均质量值低于15则去掉;将长度少于36 bp的reads移除;通过FastQC软件 (http://www.bioinformatics.babraham.ac.uk/projects/fastqc)过滤后检查测序数据质控后的质量。
优选地,所述步骤(1.2)包括以下分步骤:
(1.2.1)利用BWA软件中的MEM模块(http://bio-bwa.sourceforge.net)进行比对,使用默认参数,将质控得到高质量的数据比对到参考基因组,参考基因组为UCSC的hg38,该方法在大于70-150 bp reads的比对上优于BWA的SW及backtrack模块;
(1.2.2)通过SAMtools 的sort命令(www.htslib.org)对原始比对结果进行排序得到 BAM 格式的文件;
(1.2.3)使用Picard (broadinstitute.github.io/picard/)的默认参数去除光学和PCR重复,得到最初的比对结果。
优选地,所述步骤(1.3)包括以下分步骤:
(1.3.1)使用GATK4的 HaplotypeCaller模块选择默认参数得到原始的突变信息;
(1.3.2)使用GATK4的SelectVariants模块分开SNV及INDEL;
(1.3.3)使用GATK4的VariantFiltration模块过滤低质量的突变位点,得到包含准确SNP信息的vcf文件;参数具体如下:
QD < 2.0 || FS > 60.0 || MQ < 40.0 || MQRankSum < -12.5 ||ReadPosRankSum < -8.0 , indels:QD < 2.0 || FS > 200.0 || ReadPosRankSum < -20.0,QaulByDepth (QD),FisherStrand (FS), RMSMappingQuality (MQ),MappingQualityRankSumTest (MQRankSum), ReadPosRankSumTest (ReadPosRankSum);
(1.3.4)使用GATK4的GenotypeGVCFs模块基于dbSNP138数据库进行SNP注释,给每个SNP标注了rs号;
(1.3.5)使用PLINK v1.90b6.21 64-bit (zzz.bwh.harvard.edu/plink)对得到的SNP的vcf数据进行位点及样本质控。
优选地,所述步骤(1.3.5)包括以下分步骤:
(1.3.5.1)删除在样本中缺失率大于5%的SNP位点;
(1.3.5.2)删除缺失率大于2%的样本,共有2个样本被移除;
(1.3.5.3)通过哈德温伯格平衡进行过滤,阈值为P值< 10-6;
(1.3.5.4)最小等位基因频率过滤,阈值为MAF < 0.01;
(1.3.5.5)使用snpEff软件对所有位点进行基因和功能注释;
(1.3.5.6)使用LDBlockShow程序进行位点间的连锁不平衡分析。
优选地,所述步骤(2)中,证据等级包括位点的P值,OR值,MAF,样本量,文献报道的次数。感兴趣的候选基因包括Chr15q25(包括CHRNA5、CHRNA3和CHRNB4基因簇)、剩余的nAChR亚基基因、编码varenicline转运体(SLC22A2)的基因和血清靶点。酒石酸伐尼克兰对烟碱受体有很高的选择性,但也显示出对5-HT3的和其他常见的烟碱受体中等亲和力。针对尼古丁的不同药物,总结的每种药物的易感基因如下,目前比较被公认的跟烟瘾有关的基因也同样列在其中。
优选地,所述步骤(2)中,基因包括:尼古丁和安非他酮代谢相关CYP2A6, CYP2B6;尼古丁受体CHRNA1, CHRNA2, CHRNA3,CHRNA4, CHRNA5, CHRNA6,CHRNA7, CHRNA9,CHRNA10,CHRNB1, CHRNB2, CHRNB3,CHRNB4, CHRND, CHRNE, CHRNG;酒石酸伐尼克兰转运以及酒石酸伐尼克兰的其他目标LC22A2 (OCT8), HTR3A, HTR3B。
优选地,所述步骤(3)中,最终的候选位点和基因如下:
rs588765,对应基因是CHRNA5,对应药物是酒石酸伐尼克兰,NRT;
rs578776,对应基因是CHRNA3; CHRNA5,对应药物是NRT;
rs4680,对应基因是COMT;MIR4761,对应药物是NRT;
rs1800497,对应基因是ANKK1,对应药物是盐酸安非他酮,NRT;
rs1799971,对应基因是OPRM1,对应药物是NRT;
rs1799732,对应基因是DRD2;LOC105369501,对应药物是盐酸安非他酮,NRT;
rs16969968,对应基因是CHRNA5,对应药物是酒石酸伐尼克兰,盐酸安非他酮和NRT;
rs680244,对应基因是CHRNA5,对应药物是盐酸安非他酮;
CYP2A6*4,对应基因是CYP2A6,对应药物是盐酸安非他酮,NRT;
rs2279343,对应基因是CYP2A6,对应药物是盐酸安非他酮;
rs8109525,对应基因是CYP2A6,对应药物是盐酸安非他酮。
进一步我们验证了这些位点和本发明中GWAS数据得到的显著位点的连锁不平衡,以确定本发明找到的位点的准确性。本发明中的候选位点和GWAS数据得到的显著位点高度连锁不平衡,即这些位点分别在一个GWAS数据得到的显著位点组成的区块内。
还提供了烟草依赖个体化干预基因变异位点筛选方法的试剂盒,本试剂盒应用在戒烟药物的选择上,通过构建样本DNA测序预文库,并使用特异探针对文库进行目标区域捕获富集,捕获后的文库通过高通量测序,实现多个基因多种突变的一次性检测。首先,以基因组DNA为材料,进行DNA片段化、末端修复和加A处理,使用DNA连接酶将带有单分子条码序列(Barcode)的接头连接到DNA模板的两端,经PCR扩增得到预文库;预文库与带有生物素标记的寡核苷酸探针进行液相杂交,并用链霉亲和素(Streptavidin)包被的磁珠对与探针结合的文库进行捕获富集,最后使用带有标签序列(Index)的引物和聚合酶进行PCR扩增得到捕获文库。捕获文库通过高通量测序得到测序数据,经配套的数据分析软件分析后即可得到最终的基因变异信息。
本试剂盒包含阴、阳性对照品,用来监控实验环节和数据分析环节的随机误差及系统误差。
试剂盒A部分组分如下:
试剂1:组分名称为末端修复液,成分包括Tris,规格和数量为96 µL×1管;
试剂2:组分名称为末端修复酶,成分包括打断修复酶,规格和数量为192 µL×1管;
试剂3:组分名称为连接缓冲液,成分包括Tris、ATP、二硫苏糖醇,规格和数量为384 µL×1管;
试剂4:组分名称为连接酶,成分包括T4连接酶,规格和数量为192 µL×1管;
试剂5:组分名称为接头,成分包括寡核苷酸,规格和数量为5 µL×32管;
试剂6:组分名称为引物,成分包括寡核苷酸,规格和数量为70 µL×1管;
试剂7:组分名称为扩增液,成分包括Tris、dNTPs、DNA 聚合酶,规格和数量为1390µL×2管;
试剂8:组分名称为封闭液,成分包括寡核苷酸,规格和数量为176 µL×1管;
试剂9:组分名称为杂交液,成分包括吐温、硫酸葡聚糖,规格和数量为672 µL×1管;
试剂10:组分名称为杂交增强剂,成分包括甲酰胺,规格和数量为215 µL×1管;
试剂11:组分名称为捕获探针,成分包括寡核苷酸,规格和数量为211 µL×1管;
试剂12:组分名称为洗杂液SW,成分包括乙二胺四乙酸二钠盐,规格和数量为1152µL×1管;
试剂13:组分名称为洗杂液1,成分包括十二烷基硫酸钠,规格和数量为960 µL×1管;
试剂14:组分名称为洗杂液2,成分包括十二烷基硫酸钠,规格和数量为576 µL×1管;
试剂15:组分名称为洗杂液3,成分包括十二烷基硫酸钠,规格和数量为576 µL×1管;
试剂16:组分名称为磁珠清洗液,成分包括Tris、EDTA、氯化钠,规格和数量为1415µL×4管;
试剂17:组分名称为标签,成分包括寡核苷酸,规格和数量为4 µL×32管;
试剂18:组分名称为阳性对照品,成分包括脱氧核糖核酸,规格和数量为24 µL×1管;
试剂19:组分名称为阴性对照品,成分包括脱氧核糖核酸,规格和数量为24 µL×1管;
试剂盒B部分:
试剂20:组分名称为捕获磁珠,成分包括链霉亲和素磁珠,规格和数量为1760 µL×1管。
优选地,选取SNP上下游各500bp区域设计探针,影响探针灵敏度的主要因素包括Tm值、长度、GC含量和二级结构,影响探针特异度的主要因素包括:探针方向、探针数量、交叉杂交、复杂度和重复序列。为保证探针的捕获效率和均一性,探针设计过综合考虑了上述因素。使用网页版探针设计软件进行设计和评价探针。10个位点探针信息如下:
位点1:rs588765位于chr15:78573083,探针覆盖区域78572933—78573283;
位点2:rs578776位于chr15:78596058,探针覆盖区域78595828—78596198;
位点3:rs4680位于chr22:19963748,探针覆盖区域19963558—19963888;
位点4:rs1800497位于chr11:113400106,探针覆盖区域113399806—113400351;
位点5:rs1799971位于chr6:154039662,探针覆盖区域154039522—154039917;
位点6:rs1799732位于chr11:113475529,探针覆盖区域113475400—113475833;
位点7:rs16969968位于chr15:78590583,探针覆盖区域78590349—78590742;
位点8:rs680244位于chr15:78578946,探针覆盖区域78578679—78579173;
位点9:rs2279343位于chr19:41009358,探针覆盖区域41008970—41009659;
位点10:rs8109525位于chr19:40986013,探针覆盖区域40985711—40986221。
下面对本发明的实施方式做详细说明。
样本募集:收集来自于烟草依赖患者的血液样本,并且根据服用药物的不同分为三组。对于所有的样本分别进行DNA的提取,建库以及测序。测序平台是illumina的NovaSeq,目标深度是10x。从样本收集到建库测序的每一个步骤都进行了质量控制,对于不合格的样本可以进行及时的补充或者剔除。
1.基因组DNA提取
采用商业化试剂盒,从新鲜或冷冻的全血(用柠檬酸盐、EDTA等抗凝剂处理过的血液)样品中提取基因组DNA。
提取样本总量:适用于起始量为 5 ng~500 ng DNA 的文库构建,为了提升数据质量,建议 DNA 投入量不低于 50 ng。请使用荧光定量进行 DNA 浓度检测。
提取样本质量和纯度:经琼脂糖凝胶电泳检测可判断DNA完整性和蛋白残留情况。Nanodrop A260/A280 = 1.8-2.0;A260/A230>2.0。
2.DNA片段化
提取后的基因组DNA,加入缓冲液和DNA保护液,使用超声波打断仪将DNA打断为200bp左右的片段。
3.末端修复及加A
向打断产物中加入末端修复酶和末端修复缓冲液,混匀后放入PCR仪进行孵育;PCR程序设置:37℃,15min;65℃,30min;4℃,∞。
4.加接头
向末端加A产物中加入接头、连接酶、连接缓冲液,混匀后放入PCR仪进行孵育,20℃连接15min。
5.PCR扩增
连接产物中加入引物和PCR酶混合液,混匀后放入PCR仪进行扩增,PCR程序设置:98℃,45s;(98℃,15s;65℃,30s;72℃,30s) 11-13个循环;72℃ ,1min;4℃,∞。
6.PCR产物纯化
向扩增产物中加入1.5倍的纯化磁珠,混匀后静置;将PCR管放入磁力架中,静置,弃去液体;用现配的80%乙醇,清洗两遍;最后,加入无核酸酶水洗脱。
取1 μL文库使用 Qubit dsDNA HS Assay Kit 试剂在 Qubit 4.0 Fluorometer上进行文库浓度检测,记录文库浓度;取 1 μL 文库使用片段分析仪进行文库片段长度检测。
7.文库与探针杂交
各取500 ng文库在真空浓缩仪中进行浓缩,浓缩完成后,加入杂交反应液(探针、封闭液、杂交缓冲液配制而成),涡旋振荡以确保干燥在管底的DNA 溶解,并短暂离心;在PCR以上进行65℃过夜杂交。
8.目标区域 DNA 捕获
洗杂液置于水浴锅上完全溶解,配置成1ⅹ的工作液;提前将捕获磁珠充分混匀并置于室温平衡,用磁珠清洗液清洗三遍,加入磁珠重悬液混匀后,加入到杂交产物中,吸打混匀;置于垂直旋转混匀仪上,室温结合 30 min;捕获产物用1×的洗杂液进行清洗,最后加入无酶水洗脱,短暂涡旋重悬混匀磁珠。
9.捕获后 PCR 扩增
向重悬后的捕获磁珠中加入测序引物和扩增液,混匀后放入PCR仪进行扩增,PCR程序设置:98℃,45s;(98℃,15s;60℃,30s;72℃,30s)11-13个循环;72℃ ,1min;4℃,∞。
10.扩增后纯化
取出纯化磁珠,平衡至室温,向扩增产物中加入 1.1 倍体积的纯化磁珠混匀后静置;将PCR管放入磁力架中,静置,弃去液体;用现配的80%乙醇,清洗两遍;最后,加入无核酸酶水洗脱。
11.文库质控
取1 μL文库使用 Qubit dsDNA HS Assay Kit 试剂在 Qubit 4.0 Fluorometer上进行文库浓度测定,记录文库浓度; 取 1 μL 文库使用片段分析仪进行片段质检,片段大小应与预文库大小基本一致。
12.上机测序
使用NGS测序平台对文库进行测序,按照仪器使用说明进行150 bp Pair-End模式测序。
13.数据预处理和找突变
对于所有的下机后的fastq数据,首先使用fastqc对每一个样本进行初步的质控,查看数据的质量是否合格,包括碱基的平均质量,GC含量,N含量,Ts/Tv比例等,结果表明1246个样本质控后的数据量全部大于30G,Q30大于85%,样本平均测序深度大于10×,符合标准可用于接下来的分析。然后使用BWA进行比对得到BAM文件,比对的基因组是下载自UCSC的hg38人参考基因组,使用GATK VariantFiltration进行突变的质控,GATKhaplotypeCaller进行多样本的突变查找,最后判读样本的基因型。
依据比对结果,得到的判读样本基因型为表1(部分样本结果)。
表1
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。
Claims (6)
1.烟草依赖个体化干预基因变异位点筛选方法,其特征在于:其包括以下步骤:
(1)根据戒烟药物的不同将下机数据分为三组:酒石酸伐尼克兰组,盐酸安非他酮组,以及尼古丁替代疗法组,每组分别进行如下步骤的全基因组关联分析GWAS:
(1.1)数据质控,利用Trimmomatic和BBTools组件中的bbduk.sh脚本来获得高质量的有效数据;
(1.2)数据比对;
(1.3)变异位点鉴定,得到百万级别的SNP位点;
(1.4)使用PLINK软件并结合上一步处理好的SNP位点,使用logistic回归模型对BED文件进行分析,获得GWAS summary数据;
(2)在文献中筛选候选烟草依赖的位点,根据位点证据的强弱,制定证据等级,根据不同的证据等级,对文献中的位点进行分类,选择证据等级最高的位点;
(3)通过连锁不平衡分析,将文献中的位点和GWAS数据中得到的位点构建连锁不平衡模块,获得能代表模块的标签位点,通过GWAS数据佐证文献筛选出的位点的重要性;
(4)最终入选重要的文献位点和标签位点;
所述步骤(1.1)中,过滤条件为:去掉接头;去掉3'和5'端质量值低于3的碱基;设置4碱基长的滑窗,如果每个碱基的平均质量值低于15则去掉;将长度少于36 bp的reads移除;过滤后检查测序数据质控后的质量;
所述步骤(1.2)包括以下分步骤:
(1.2.1)利用BWA软件中的MEM模块进行比对,使用默认参数,将质控得到高质量的数据比对到参考基因组,参考基因组为UCSC的hg38,该方法在大于70-150 bp reads的比对上优于BWA的SW及backtrack模块;
(1.2.2)通过SAMtools 的sort命令对原始比对结果进行排序得到 BAM 格式的文件;
(1.2.3)使用Picard的默认参数去除光学和PCR重复,得到最初的比对结果;
所述步骤(1.3)包括以下分步骤:
(1.3.1)使用GATK4的 HaplotypeCaller模块选择默认参数得到原始的突变信息;
(1.3.2)使用GATK4的SelectVariants模块分开SNV及INDEL;
(1.3.3)使用GATK4的VariantFiltration模块过滤低质量的突变位点,得到包含准确SNP信息的vcf文件;
(1.3.4)使用GATK4的GenotypeGVCFs模块基于dbSNP138数据库进行SNP注释,给每个SNP标注rs号;
(1.3.5)使用PLINK v1.90b6.21 64-bit对得到的SNP的vcf数据进行位点及样本质控;
所述步骤(1.3.5)包括以下分步骤:
(1.3.5.1)删除在样本中缺失率大于5%的SNP位点;
(1.3.5.2)删除缺失率大于2%的样本,共有2个样本被移除;
(1.3.5.3)通过哈德温伯格平衡进行过滤,阈值为P值< 10-6;
(1.3.5.4)最小等位基因频率过滤,阈值为MAF < 0.01;
(1.3.5.5)使用snpEff软件对所有位点进行基因和功能注释;
(1.3.5.6)使用LDBlockShow程序进行位点间的连锁不平衡分析。
2.根据权利要求1所述的烟草依赖个体化干预基因变异位点筛选方法,其特征在于:所述步骤(2)中,证据等级包括位点的P值,OR值,MAF,样本量,文献报道的次数。
3.根据权利要求2所述的烟草依赖个体化干预基因变异位点筛选方法,其特征在于:所述步骤(2)中,基因包括:尼古丁和盐酸安非他酮代谢相关CYP2A6, CYP2B6;尼古丁受体CHRNA1, CHRNA2, CHRNA3,CHRNA4, CHRNA5, CHRNA6,CHRNA7, CHRNA9, CHRNA10,CHRNB1,CHRNB2, CHRNB3,CHRNB4, CHRND, CHRNE, CHRNG;LC22A2-OCT8, HTR3A, HTR3B。
4.根据权利要求3所述的烟草依赖个体化干预基因变异位点筛选方法,其特征在于:所述步骤(3)中,最终的候选位点和基因如下:
rs588765,对应基因是CHRNA5,对应药物是酒石酸伐尼克兰,NRT;
rs578776,对应基因是CHRNA3; CHRNA5,对应药物是NRT;
rs4680,对应基因是COMT;MIR4761,对应药物是NRT;
rs1800497,对应基因是ANKK1,对应药物是盐酸安非他酮,NRT;
rs1799971,对应基因是OPRM1,对应药物是NRT;
rs1799732,对应基因是DRD2;LOC105369501,对应药物是盐酸安非他酮,NRT;
rs16969968,对应基因是CHRNA5,对应药物是酒石酸伐尼克兰,盐酸安非他酮和NRT;
rs680244,对应基因是CHRNA5,对应药物是盐酸安非他酮;
CYP2A6*4,对应基因是CYP2A6,对应药物是盐酸安非他酮,NRT;
rs2279343,对应基因是CYP2A6,对应药物是盐酸安非他酮;
rs8109525,对应基因是CYP2A6,对应药物是盐酸安非他酮。
5.利用根据权利要求4所述的烟草依赖个体化干预基因变异位点筛选方法的试剂盒,其特征在于:本试剂盒应用在戒烟药物的选择上,通过构建样本DNA测序预文库,并使用特异探针对文库进行目标区域捕获富集,捕获后的文库通过高通量测序,实现多个基因多种突变的一次性检测;
试剂盒A部分组分如下:
试剂1:组分名称为末端修复液,成分包括Tris,规格和数量为96 µL×1管;
试剂2:组分名称为末端修复酶,成分包括末端修复酶,规格和数量为192 µL×1管;
试剂3:组分名称为连接缓冲液,成分包括Tris、ATP、二硫苏糖醇,规格和数量为384 µL×1管;
试剂4:组分名称为连接酶,成分包括T4连接酶,规格和数量为192 µL×1管;
试剂5:组分名称为接头,成分包括寡核苷酸,规格和数量为5 µL×32管;
试剂6:组分名称为引物,成分包括寡核苷酸,规格和数量为70 µL×1管;
试剂7:组分名称为扩增液,成分包括Tris、dNTPs、DNA 聚合酶,规格和数量为1390 µL×2管;
试剂8:组分名称为封闭液,成分包括寡核苷酸,规格和数量为176 µL×1管;
试剂9:组分名称为杂交液,成分包括吐温、硫酸葡聚糖,规格和数量为672 µL×1管;
试剂10:组分名称为杂交增强剂,成分包括甲酰胺,规格和数量为215 µL×1管;
试剂11:组分名称为捕获探针,成分包括寡核苷酸,规格和数量为211 µL×1管;
试剂12:组分名称为洗杂液SW,成分包括乙二胺四乙酸二钠盐,规格和数量为1152 µL×1管;
试剂13:组分名称为洗杂液1,成分包括十二烷基硫酸钠,规格和数量为960 µL×1管;
试剂14:组分名称为洗杂液2,成分包括十二烷基硫酸钠,规格和数量为576 µL×1管;
试剂15:组分名称为洗杂液3,成分包括十二烷基硫酸钠,规格和数量为576 µL×1管;
试剂16:组分名称为磁珠清洗液,成分包括Tris、EDTA、氯化钠,规格和数量为1415 µL×4管;
试剂17:组分名称为标签,成分包括寡核苷酸,规格和数量为4 µL×32管;
试剂18:组分名称为阳性对照品,成分包括脱氧核糖核酸,规格和数量为24 µL×1管;
试剂19:组分名称为阴性对照品,成分包括脱氧核糖核酸,规格和数量为24 µL×1管;
试剂盒B部分:
试剂20:组分名称为捕获磁珠,成分包括链霉亲和素磁珠,规格和数量为1760 µL×1管。
6.根据权利要求5所述的试剂盒,其特征在于:选取SNP上下游各500bp区域设计探针,10个位点探针信息如下:
位点1:rs588765位于chr15:78573083,探针覆盖区域78572933—78573283;
位点2:rs578776位于chr15:78596058,探针覆盖区域78595828—78596198;
位点3:rs4680位于chr22:19963748,探针覆盖区域19963558—19963888;
位点4:rs1800497位于chr11:113400106,探针覆盖区域113399806—113400351;
位点5:rs1799971位于chr6:154039662,探针覆盖区域154039522—154039917;
位点6:rs1799732位于chr11:113475529,探针覆盖区域113475400—113475833;
位点7:rs16969968位于chr15:78590583,探针覆盖区域78590349—78590742;
位点8:rs680244位于chr15:78578946,探针覆盖区域78578679—78579173;
位点9:rs2279343位于chr19:41009358,探针覆盖区域41008970—41009659;
位点10:rs8109525位于chr19:40986013,探针覆盖区域40985711—40986221。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311421818.6A CN117153250B (zh) | 2023-10-31 | 2023-10-31 | 烟草依赖个体化干预基因变异位点筛选方法及试剂盒 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311421818.6A CN117153250B (zh) | 2023-10-31 | 2023-10-31 | 烟草依赖个体化干预基因变异位点筛选方法及试剂盒 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117153250A CN117153250A (zh) | 2023-12-01 |
CN117153250B true CN117153250B (zh) | 2024-03-01 |
Family
ID=88908552
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311421818.6A Active CN117153250B (zh) | 2023-10-31 | 2023-10-31 | 烟草依赖个体化干预基因变异位点筛选方法及试剂盒 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117153250B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101603084A (zh) * | 2009-07-08 | 2009-12-16 | 上海新春苗生物科技发展有限公司 | 吸烟引发肺癌风险基因测评及套组方法 |
CN110910956A (zh) * | 2019-11-21 | 2020-03-24 | 刘强 | 单核苷酸多态性检测汉族人群吸烟成瘾方法 |
CN111518896A (zh) * | 2020-06-28 | 2020-08-11 | 云南中烟工业有限责任公司 | 用于检测尼古丁依赖相关的snp位点的引物组、应用、产品及方法 |
CN115961037A (zh) * | 2022-11-14 | 2023-04-14 | 天津见康华美医学诊断技术有限公司 | 一种检测mpn变异位点的试剂盒及检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0421598D0 (en) * | 2004-09-29 | 2004-10-27 | Cambridge Advanced Tech | Modification of plant development and morphology |
-
2023
- 2023-10-31 CN CN202311421818.6A patent/CN117153250B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101603084A (zh) * | 2009-07-08 | 2009-12-16 | 上海新春苗生物科技发展有限公司 | 吸烟引发肺癌风险基因测评及套组方法 |
CN110910956A (zh) * | 2019-11-21 | 2020-03-24 | 刘强 | 单核苷酸多态性检测汉族人群吸烟成瘾方法 |
CN111518896A (zh) * | 2020-06-28 | 2020-08-11 | 云南中烟工业有限责任公司 | 用于检测尼古丁依赖相关的snp位点的引物组、应用、产品及方法 |
CN115961037A (zh) * | 2022-11-14 | 2023-04-14 | 天津见康华美医学诊断技术有限公司 | 一种检测mpn变异位点的试剂盒及检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117153250A (zh) | 2023-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107190329B (zh) | 基于dna的融合基因定量测序建库、检测方法及其应用 | |
US11584968B2 (en) | Methods for using mosaicism in nucleic acids sampled distal to their origin | |
CN107177670B (zh) | 一种高通量检测帕金森病致病基因突变的方法 | |
WO2017045654A1 (zh) | 确定受体cfDNA样本中供体来源cfDNA比例的方法 | |
CN104531883B (zh) | Pkd1基因突变的检测试剂盒及检测方法 | |
CN107699957B (zh) | 基于dna的融合基因定量测序建库、检测方法及其应用 | |
CN111187810B (zh) | 非诊断治疗目的的多个肿瘤相关基因的检测方法 | |
WO2020233094A1 (zh) | 一种ngs建库分子接头及其制备方法和用途 | |
WO2016049993A1 (zh) | 用于鉴定多个生物样本之间身份关系的方法和系统 | |
CN105734679B (zh) | 核酸靶序列捕获测序文库的制备方法 | |
WO2017202389A1 (zh) | 一种适用于超微量dna测序的接头及其应用 | |
CN114317762B (zh) | 用于检测早期肝癌的三标记物组合物及其试剂盒 | |
WO2023240755A1 (zh) | 用于检测染色体非整倍体及单基因突变的试剂盒及应用 | |
CN114317728B (zh) | 用于检测sma中多种突变的引物组、试剂盒、方法和系统 | |
JP2021528094A (ja) | マイクロサテライト不安定性の検出 | |
CN117153250B (zh) | 烟草依赖个体化干预基因变异位点筛选方法及试剂盒 | |
CN108866154B (zh) | 基于长片段dna捕获和三代测序的无创产前单体型构建方法 | |
CN110592185A (zh) | 一种高胆固醇血症致病基因筛查探针设计方法及其基因芯片 | |
WO2023246949A1 (zh) | 一种用微单倍型判定无创产前亲权关系的方法 | |
CN105838720B (zh) | Ptprq基因突变体及其应用 | |
CN116042610A (zh) | 动态突变str位点的检测探针组合及测序分析方法 | |
CN112695081B (zh) | 原发性胆汁性胆管炎新的易感基因及其应用 | |
CN110423805B (zh) | 用于新生儿黏多糖贮积症基因分型的多重pcr引物系统及其用途 | |
Yahya et al. | Long-read nanopore sequencing of RPGR ORF15 is enhanced following DNase I treatment of MinION flow cells | |
do Lago et al. | Genetic diversity of hepatitis B virus quasispecies in different biological compartments reveals distinct genotypes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |