CN105132573A - 一种两核苷酸合成焦测序定量检测甲基化的方法 - Google Patents
一种两核苷酸合成焦测序定量检测甲基化的方法 Download PDFInfo
- Publication number
- CN105132573A CN105132573A CN201510623069.4A CN201510623069A CN105132573A CN 105132573 A CN105132573 A CN 105132573A CN 201510623069 A CN201510623069 A CN 201510623069A CN 105132573 A CN105132573 A CN 105132573A
- Authority
- CN
- China
- Prior art keywords
- order
- checking
- dna
- base
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000002773 nucleotide Substances 0.000 title claims abstract description 56
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 45
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000011987 methylation Effects 0.000 title claims abstract description 26
- 238000007069 methylation reaction Methods 0.000 title claims abstract description 26
- 238000012175 pyrosequencing Methods 0.000 title abstract description 9
- 108020004414 DNA Proteins 0.000 claims abstract description 76
- 238000012163 sequencing technique Methods 0.000 claims abstract description 54
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 52
- 238000006243 chemical reaction Methods 0.000 claims abstract description 46
- 238000004458 analytical method Methods 0.000 claims abstract description 17
- 102000053602 DNA Human genes 0.000 claims abstract description 14
- 238000001514 detection method Methods 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 14
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 12
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 claims description 12
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 claims description 10
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 claims description 10
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 claims description 10
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 claims description 10
- 238000012408 PCR amplification Methods 0.000 claims description 9
- 239000012634 fragment Substances 0.000 claims description 9
- 238000012098 association analyses Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 7
- 239000011324 bead Substances 0.000 claims description 7
- 238000009396 hybridization Methods 0.000 claims description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 6
- 108010090804 Streptavidin Proteins 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 5
- 238000012986 modification Methods 0.000 claims description 5
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical group NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 238000007400 DNA extraction Methods 0.000 claims description 2
- 108091028664 Ribonucleotide Proteins 0.000 claims description 2
- 241000218636 Thuja Species 0.000 claims description 2
- 229930003756 Vitamin B7 Natural products 0.000 claims description 2
- 239000002253 acid Substances 0.000 claims description 2
- 229960002685 biotin Drugs 0.000 claims description 2
- 235000020958 biotin Nutrition 0.000 claims description 2
- 239000011616 biotin Substances 0.000 claims description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 2
- 230000000295 complement effect Effects 0.000 claims description 2
- 239000007788 liquid Substances 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 2
- 239000002336 ribonucleotide Substances 0.000 claims description 2
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 2
- 239000007790 solid phase Substances 0.000 claims description 2
- 238000012360 testing method Methods 0.000 claims description 2
- 239000011735 vitamin B7 Substances 0.000 claims description 2
- 235000011912 vitamin B7 Nutrition 0.000 claims description 2
- 108090000623 proteins and genes Proteins 0.000 abstract description 8
- 238000010219 correlation analysis Methods 0.000 abstract 1
- GRWZHXKQBITJKP-UHFFFAOYSA-N dithionous acid Chemical compound OS(=O)S(O)=O GRWZHXKQBITJKP-UHFFFAOYSA-N 0.000 abstract 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 12
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 10
- 201000010099 disease Diseases 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 108091029523 CpG island Proteins 0.000 description 6
- 238000001712 DNA sequencing Methods 0.000 description 6
- 108091029430 CpG site Proteins 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000004445 quantitative analysis Methods 0.000 description 4
- 101150028074 2 gene Proteins 0.000 description 3
- 230000007067 DNA methylation Effects 0.000 description 3
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 238000002515 oligonucleotide synthesis Methods 0.000 description 3
- 108010079850 retinoic acid receptor beta Proteins 0.000 description 3
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 3
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 102100033072 DNA replication ATP-dependent helicase DNA2 Human genes 0.000 description 2
- 101000927313 Homo sapiens DNA replication ATP-dependent helicase DNA2 Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- 101150051821 era gene Proteins 0.000 description 2
- BEGBSFPALGFMJI-UHFFFAOYSA-N ethene;sodium Chemical group [Na].C=C BEGBSFPALGFMJI-UHFFFAOYSA-N 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000005257 nucleotidylation Effects 0.000 description 2
- 239000000376 reactant Substances 0.000 description 2
- 238000012882 sequential analysis Methods 0.000 description 2
- IRLPACMLTUPBCL-KQYNXXCUSA-N 5'-adenylyl sulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OS(O)(=O)=O)[C@@H](O)[C@H]1O IRLPACMLTUPBCL-KQYNXXCUSA-N 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 1
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 1
- 102000007347 Apyrase Human genes 0.000 description 1
- 108010007730 Apyrase Proteins 0.000 description 1
- 208000037051 Chromosomal Instability Diseases 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 208000031448 Genomic Instability Diseases 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 102000052575 Proto-Oncogene Human genes 0.000 description 1
- 108700020978 Proto-Oncogene Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 101710183568 Serine/threonine-protein kinase PknK Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008175 fetal development Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000006210 lotion Substances 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000001035 methylating effect Effects 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 125000003396 thiol group Chemical class [H]S* 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种两核苷酸合成焦测序定量检测甲基化的方法,将基因组DNA经亚硫酸氢盐转化后的PCR产物进行两核苷酸合成焦测序,连续记录每个测序反应得到包括两核苷酸种类及其核苷酸合成数目的测序编码信息。通过设定已确定的目标区域序列中所有CG位点中碱基C均不同程度的转化成T,再利用两核苷酸合成焦测序得到的信息,进行关联分析,实现目标区域序列中甲基化的定量分析。本发明能够大幅度提高测序长度,拓宽了传统焦测序的分析范围,适合单样本PCR产物、以及混合样本PCR产物序列的甲基化分析。
Description
技术领域
本发明属于生物技术领域,是一种PCR产物序列分析方法,具体涉及一种两核苷酸合成焦测序定量检测甲基化的方法。
背景技术
人类基因组计划和各种模式生物基因组计划的开展和完成,使人类步入了后基因时代,对当代的生物学研究和医学研究产生了巨大的影响,分子生物学相关学科得到了迅猛的发展。从基因水平上认识生命的差异,疾病发生、发展的规律,以及药物与生命体的相互作用将成为可能。就基因序列分析而言,后基因时代的重点已由全基因组序列测定转移到了对基因组中个体遗传差异及物种间遗传差异的比较。在基础研究方面,DNA的序列分析是进一步研究和改造目的基因的基础,研究疾病基因的遗传规律,克隆致病基因;在应用方面,直接寻找疾病的易感基因突变位点,通过对某一特定疾病的基因组样本中突变基因型进行大规模鉴定和检测,可以获得与该疾病相关基因型的信息。很多常见疾病的遗传学影响可归因于有限的等位基因变异。越来越多的证据表明,DNA甲基化参与了胚胎发育、基因印迹等过程。同时,它在疾病发展中也起着举足轻重的作用。甲基化状态的改变被认为是引起癌症的一个重要因素,这种变化包括基因组整体甲基化水平的降低和CpG岛局部甲基化水平的异常升高,从而导致基因组的不稳定(如染色体的不稳定、原癌基因的表达)和抑癌基因的不表达。
DNA甲基化分析包括定性与定量分析,目前有很多方法可以选择。基因组DNA经过亚硫酸氢盐处理后,原始序列中未被甲基化的胞嘧啶(C)残基转化为尿嘧啶(U),并在PCR扩增中以胸腺嘧啶(T)出现;而被甲基化的胞嘧啶则保持不变。从亚硫酸氢盐转化这条主干道出发,之后可以选择限制性酶切分析、实时定量PCR、Sanger测序、焦磷酸测序、以及高通量DNA测序等。然而,并非所有方法都能提供单个CpG位点的定量数据。样本经亚硫酸氢盐处理后PCR产物的Sanger测序一度被认为是甲基化分析中的金标准,但如果对5-10个克隆测序,这种方法充其量只是半定量。高通量DNA测序对于甲基化研究,带来了非常灵敏的DNA甲基化图谱,以单分子分辨率覆盖整个CpG岛。高通量DNA技术实现了整个CpG岛的更全面覆盖,且单分子分辨率为甲基化模式的异质性提供了前所未有的信息。它能够平行研究多个位点。然而,这些优点也伴随着一些劣势,比如相当大的一笔投资、试剂昂贵、周转时间长、数据分析要求高等。这些特点使得高通量DNA测序技术更适用于在基因组范围内目标区域的确定,而对不同样品在目标区域的CpG位点的定量分析由于样品数量大,如果每个样品都采用高通量DNA测序技术进行分析,则成本就会过于巨大。
传统的焦磷酸测序技术能够快速地检测甲基化的频率,对样品中的甲基化位点进行定性及定量检测。样本经过亚硫酸氢盐处理后的PCR产物在焦测序延伸过程中,根据C和T的掺入量来定量确定单个位点的C-T比例。因此,不同位点的甲基化变异就能被准确检测。由于焦磷酸测序提供了真实的序列数据,甲基化状态也就以序列形式呈现。德国汉诺威医学院Potapova领导的研究小组对高通量DNA测序和焦测序进行了系统的交叉验证(BMCBiotechnology,2011,11:6),对10个原发性肝癌标本中12个位点的甲基化模式在高通量DNA测序所获得的单个CpG位点的甲基化水平与传统焦测序相应值进行比较的统计分析表明,所有单个CpG位点的甲基化水平都有着极佳的一致性。表明传统的焦测序技术是一种可用于目标区域的CpG位点定量分析的简单、价格便宜的分析技术。
然而,传统焦测序技术由于每个反应需要加入相应体积的dNTP,这样,随着测序反应的进行,反应物的体积越来越大,其反应物的浓度也就越来越少,测序的准确性也就越来越低。传统焦测序一般在优化核苷酸加入顺序的前提下也只能测定大约60bp的片段长度(MashayekhiF,RonaghiM.A.Analyticalbiochemistry,2007,363,275-28719),而这种每个甲基化位点需要两个测序反应的实现的传统焦测序技术对甲基化PCR产物的分析就更加受到测序长度的限制。一种变通的方法是将这段长序列用多个测序引物分段进行焦测序。然而,一方面,使用多个测序引物也会增加分析成本;另一方面,由于经过亚硫酸氢盐处理后被甲基化的胞嘧啶则保持不变,因此每个位点被甲基化的程度不同,PCR产物中两种DNA模板的含量也就不同,造成DNA模板类型的复杂,一般很难设计多个测序引物将其序列分段进行测定。因而传统焦测序在对长片段序列甲基化的定量检测中存在不足。最近,我们实验室提出一种基于两核苷酸实时合成测序的方法,该方法通过每次反应同时加入两种dNTPs合成测序,得到两组编码,然后解码这两组编码便能确定测序片段的具体碱基信息(肖鹏峰等,中国发明专利:ZL201210128597.6)。该方法具有大幅提高测序长度,且测序得到的测序信号强度比传单核苷酸合成测序的信号强等特点。然而,该发明专利只针对一个DNA模板样本进行分析,无法对包含多个甲基化的DNA模板序列进行分析,限制了序列分析的范围。由于经过亚硫酸氢盐处理后的PCR产物需要区分C、T碱基,而(dATPαS+dGTP)合成焦测序没有办法区分这两种碱基,因此,两核苷酸的测序不包括这组组合形式。
发明内容
为了克服现有技术中存在的不足,本发明提供一种两核苷酸合成焦测序定量检测甲基化的方法,为样本经过亚硫酸氢盐处理后的PCR产物提供一种快速、高效、灵敏的甲基化定量分析方法。
为实现上述目的,本发明采用以下技术方案:
一种两核苷酸合成焦测序定量检测甲基化的方法,其特征在于:其步骤包括:1)DNA提取;2)亚硫酸氢盐处理;3)PCR扩增;4)测序;5)关联分析;
所述步骤4)的测序方法为:每个测序反应同时加入两种不同的核苷酸,得到由连续单个测序信息构成的一组测序编码信息。
所述步骤4)的具体方法包括以下步骤:
4-1)制备单链DNA模板:将PCR扩增产物与链霉亲和素包裹的磁珠反应,生物素修饰的DNA链固定到所述磁珠上,在0.05-0.2MNaOH溶液下变性;将未固定的另一条DNA链清除;然后用洗液洗涤,得到固定的单链DNA模板;
4-2)测序引物杂交:将测序引物与所述单链DNA模板在杂交反应体系中,70-80℃下放置5-10min,自然冷却至室温,完成杂交;
4-3)测序:配备测序反应体系,与所述步骤3-2)得到的杂交产物混合,单个测序反应选择两核苷酸组合为(dATPαS+dCTP)、(dATPαS+dTTP)、(dGTP+dTTP)、(dCTP+dGTP)、(dCTP+dTTP)之一进行;连续测序反应选择不同的两组两核苷酸组合循环进行,或者根据分析的目标序列优化两核苷酸加入的顺序进行。
所述步骤4-2)中,所述测序引物是一段与单链DNA模板完全互补的一段序列。
所述步骤4)中,每个测序反应获得的测序信息包括两核苷酸种类信息和测序信号强度信息,所述测序信号强度与合成核苷酸数目成正比,即每个测序反应的测序信号强度均能够转化为核苷酸合成的数目。
所述步骤5)中,根据两核苷酸合成焦测序得到的一组测序反应获得编码信息,测序信号强度信息是包含零的正整数,或者是正非整数。
所述步骤5)的具体步骤为:
假定DNA分析片段内所有GC位点碱基“C”全被甲基化,得到一条100%被甲基化的DNA模板1序列,并转化成相应两核苷酸合成焦测序的最大一阶的整数编码信息;同时,假定DNA分析片段内所有GC位点基“C”全未被甲基化,得到一条100%未被甲基化的DNA模板2序列,并转化成相应两核苷酸合成焦测序的最大一阶的整数编码信息;
所述关联分析为:假定容易一个GC位点中C被甲基化的程度为xi,其中0≤xi≤1,那么,在经过亚硫酸氢盐处理的PCR产物这个碱基序列中,含有“C”的DNA模板序列含量为xi,而含有由这个碱基未被甲基化转化而来的“T”DNA模板序列含量则为(1-xi);某个实际测序反应得到的信号强度即核苷酸合成数目等于DNA模板1序列和DNA模板2序列合成测序贡献之和,并由此构建出相应的方程式或方程组,求出xi值,确定该位点的甲基化程度;
当i=1,DNA模板1序列含量为x1,DNA模板2序列含量为(1-x1);
当i=2,该“C”碱基之前的DNA模板1序列含量为x1,该“C”碱基及其之后的DNA模板1序列含量为x2;由该“C”碱基转化成“T”碱基之前的DNA模板2序列含量为(1-x1),由该“C”碱基转化成“T”碱基及其之后的DNA模板2序列含量为(1-x2);
依次类推,当i=i,该“C”碱基之前的DNA模板1序列含量为xi-1,该“C”碱基及其之后的DNA模板1序列含量为xi;由该“C”碱基转化成“T”碱基之前的DNA模板2序列含量为(1-xi-1),由该“C”碱基转化成“T”碱基及其之后的DNA模板2序列含量为(1-xi);将整过PCR产物测序信息上甲基化完成关联分析。
所述步骤2)中,通过采用传统的亚硫酸氢盐转化方法,或者采用市售的试剂盒、按照其操作流程实施。
所述步骤3)中,PCR扩增所用的PCR一条引物为5’端被生物素、氨基或者丙烯酰胺基团修饰,与表面修饰链霉亲合素、羧基的固相载体反应,或者与丙烯酰胺单体聚合反应制备单链DNA模板。
本发明的有益效果是:
本发明与传统焦测序相比,具有如下优点:
1)本发明适合所有经亚硫酸氢盐转化的PCR产物序列的甲基化分析。相对于传统的焦测序分析方法,本发明能够大幅度提高DNA序列的测定长度,拓宽了焦测序的分析范围。
2)本发明能够对经亚硫酸氢盐转化的单个样本PCR产物序列的甲基化进行定量分析,相对于传统的焦测序分析方法,本发明对同一位点甲基化的含量至少提供两个独立的测定数据,数据间可以相互校正,提高了分析的准确度和可靠性。
3)本发明适合多个混合样本的多模板PCR产物分析,可以直接测定混合样本中各个DNA模板的比例,可以用于从大规模样本中寻找、筛选核酸标志物。
4)本发明直接采用商品化、非标记的天然核苷酸进行合成测序,它可以在任何基于实时合成测序的测序平台进行。
附图说明
图1为本发明方法对任意拟定的包含多个甲基化位点的PCR产物DNA模板序列(5’-TTTTGGAG(C/T)TTG(C/T)AG(C/T)TTTG(C/T)GTTTTTG(C/T)-3’,其中(C/T)表示经亚硫酸氢盐转化后PCR产物中的可能碱基信息)两核苷酸合成焦测序定量检测甲基化的方法示意。
图2为人样本RARβ2基因启动子CpG岛的5个甲基化位点按照表1两核苷酸加入顺序得到的焦测序结果。
图3为人样本RARβ2基因启动子CpG岛的5个甲基化位点的关联分析。
具体实施方式
本发明提供的两核苷酸合成焦测序定量检测甲基化的方法,应用两核苷酸同时加入到反应中的测序信息,即每个测序反应得到包括两核苷酸种类及其核苷酸合成数目的测序编码信息,得到一组测序编码信息。然后,根据某个实际测序反应得到的信号强度(核苷酸合成数目)等于一定含量DNA模板1序列和一定含量DNA模板2序列的合成测序贡献之和,并由此构建出相应的方程式(组),求出xi值,确定该位点的甲基化程度。依次类推,可以将整个测序信息中各个位点的甲基化程度确定。
下面结合附图对本发明做进一步说明。
图1为本发明方法对任意拟定的包含多个甲基化位点的PCR产物DNA模板序列(5’-TTTTGGAG(C/T)TTG(C/T)AG(C/T)TTTG(C/T)GTTTTTG(C/T)-3’,其中(C/T)表示经亚硫酸氢盐转化后PCR产物中的可能碱基信息)两核苷酸合成焦测序定量检测甲基化的方法示意;
图中,第一行表示100%的DNA序列1在(dATPαS+dTTP)/(dCTP+dGTP)循环合成焦测序得到的测序信息((AT)0表示(dATPαS+dTTP)没有核苷酸参与合成;(AT)表示(dATPαS+dTTP)参与一个核苷酸合成;(CG)表示(dCTP+dGTP)参与一个核苷酸合成),数字1、2、3、…、n表示对应的测序反应次序;在DNA序列1中,第1、2、3、…、i个碱基C的含量为xi,则在DNA序列2中,第1、2、3、…、i个碱基C转化为对应T碱基的含量为(1-xi);第六行表示100%的DNA序列2在(dATPαS+dTTP)/(dCTP+dGTP)合成循环焦测序得到的测序信息(AT)表示(dATPαS+dTTP)参与一个核苷酸合成;(CG)表示(dCTP+dGTP)参与一个核苷酸合成),数字1、2、3、…、n表示对应的测序反应次序;F1、F2、F3、…、Fn表示第n测序反应的信号强度转化成寡核苷酸合成的数目。
在关联分析中,由于第1个测序反应只将DNA序列2中(1-x1)含量的碱基T进行了测序,因此第1个测序反应的信号强度转化成寡核苷酸合成的数目F1=(1-x1);而第2个测序反应除了将DNA序列1中x1含量的碱基C、G依次进行测序外,还将DNA序列1中碱基G进行了测序,因此第2个测序反应的信号强度转化成寡核苷酸合成的数目F2=2x1+(1-x1)=1+x1;由F1或者F2可以求解出x1。
同理,在第4个测序反应在DNA序列2中,只将(1-x1)含量的碱基G进行测序;而在DNA序列1中,首先对含量x1的G进行测序外,还将依次实施对含量x2的碱基C、G的测定,因此,F4=(1-x1)+x1+2x2=1+2x2;在第5个测序反应在DNA序列2中,只将(1-x2)含量的碱基T进行测序;而在DNA序列1中,则依次对含量x2的TTT进行了测序,因此,F5=(1-x2)+3x2=1+2x2;由F4或者F5可以求解出x2。
依照上述方法,依次可以将每个碱基C的含量求出。
下面结合实施例做进一步说明。
实施例:
人样本RARβ2基因启动子CpG岛的5个甲基化位点分析方法,具体方法包括:
(1)将血样本采用传统的蛋白激酶K与苯酚/氯仿抽提法提取外周血中的基因组DNA;
(2)亚硫酸氢钠修饰基因组DNA:按照CpGenomeTurboBisulfiteModificationKit(Millipore公司)提供的操作流程对基因组DNA进行亚硫酸氢钠处理,并纯化、回收修饰后DNA;
(3)PCR扩增:PCR引物:5’-biotin-GTTGTTTGAGGATTGGGATG-3’,5’-ATACCCAAACAAACCCTACTC-3’与200mg经亚硫酸氢钠处理处理的基因组DNA,0.2mMdNTP,1UTaqDNA聚合酶,1×扩增缓冲液,1.8mMMgCl2的50μLPCR扩增体系进行扩增,扩增条件为:95℃起始变性5min;40个热循环为:94℃变性30s、54℃退火45s、72℃延伸45s;最后72℃延伸7min;
(4)PCR扩增产物与链霉亲和素修饰的磁珠反应,使修饰生物素的DNA链固定到磁珠上,在0.1MNaOH溶液下变性,将未固定的另一条DNA链清除;然后用洗液(10mMTris-Acetate,pH7.6)洗涤,得到固定的单链DNA模板;
(5)将测序引物5′-CCCAAACAAACCCTACTC-3′与磁珠固定的其中一份单链DNA模板模板在反应体系(10mMTris-HCl,2MNaCl,1mMEDTA(乙二胺四乙酸钠),0.1%Tween20,pH7.6)80℃下杂交5min,然后自然冷却至室温,完成杂交;
(6)焦测序反应体系包括0.1MTris-Ac(pH7.7),2mMEDTA(乙二胺四乙酸钠),10mMMg(Ac)2,0.2%BSA(小牛血清蛋白),10mMDTT(二巯苏糖醇),10mMAPS(磷酰硫酸腺),0.4mg/mLPVP(聚乙烯吡咯烷酮),4mMD-luciferin(虫荧光素),2U/mLATPsulfurylase(三磷酸腺苷硫酸化酶),0.4mMluciferase(荧光素酶),2U/mLapyraseVII(三磷酸腺苷双磷酸酶VII),2U/mLDNA聚合酶I(Klenowfragment,exo–);焦测序反应体系与上述(4)杂交产物混合用于测序反应;
(7)将上述(6)的反应体系置于焦测序仪(PSQ96MAsystem(BiotageAB,Uppsala,Sweden))中,按照表1的顺序依次分别加入两核苷酸进行焦测序,得到由按照先后顺序排列的单个测序反应的碱基片段编码信息图2;根据图2提取F1、F4、F7、F9、F11转化为核苷酸数目的信息(10au的峰强度相当于一个核苷酸),并构建方程组:
F1=0.69=1-x1
F4=0.58=1-x2
F7=0.63=1-x3
F9=0.53=1-x4
F11=0.49=1-x5
便可以求出x1=0.31、x2=0.42、x3=0.37、x4=0.47,x5=0.51,即为五个位点的甲基化程度。
表1.100%甲基化或未甲基化PCR产物DNA模板的理论测序结果
测序反应 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
核苷酸 | GT | AC | CT | GT | AC | CT | GT | AC | GT | CT | GT | AC |
DNA1 | 1 | 2 | 2 | 1 | 1 | 2 | 1 | 1 | 1 | 5 | 1 | 3 |
DNA2 | 0 | 3 | 2 | 0 | 2 | 2 | 0 | 3 | 0 | 5 | 0 | 4 |
注:GT表示(dGTP+dTTP),依次类推
DNA1表示100%甲基化序列:CTTAGCGAGCGCAAGAGCTGTAGGGTTAG
DNA2表示100%未甲基化序列:TTTAGTGAGTGTAAGAGTTGTAGGGTTAG
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (8)
1.一种两核苷酸合成焦测序定量检测甲基化的方法,其特征在于:其步骤包括:1)DNA提取;2)亚硫酸氢盐处理;3)PCR扩增;4)测序;5)关联分析;
所述步骤4)的测序方法为:每个测序反应同时加入两种不同的核苷酸,得到由连续单个测序信息构成的一组测序编码信息。
2.如权利要求1所述的两核苷酸合成焦测序定量检测甲基化的方法,其特征在于:所述步骤4)的具体方法包括以下步骤:
4-1)制备单链DNA模板:将PCR扩增产物与链霉亲和素包裹的磁珠反应,生物素修饰的DNA链固定到所述磁珠上,在0.05-0.2MNaOH溶液下变性;将未固定的另一条DNA链清除;然后用洗液洗涤,得到固定的单链DNA模板;
4-2)测序引物杂交:将测序引物与所述单链DNA模板在杂交反应体系中,70-80℃下放置5-10min,自然冷却至室温,完成杂交;
4-3)测序:配备测序反应体系,与所述步骤3-2)得到的杂交产物混合,单个测序反应选择两核苷酸组合为(dATPαS+dCTP)、(dATPαS+dTTP)、(dGTP+dTTP)、(dCTP+dGTP)、(dCTP+dTTP)之一进行;连续测序反应选择不同的两组两核苷酸组合循环进行,或者根据分析的目标序列优化两核苷酸加入的顺序进行。
3.如权利要求2所述的两核苷酸合成焦测序定量检测甲基化的方法,其特征在于:所述步骤4-2)中,所述测序引物是一段与单链DNA模板完全互补的一段序列。
4.如权利要求1或2所述的两核苷酸合成焦测序定量检测甲基化的方法,其特征在于:所述步骤4)中,每个测序反应获得的测序信息包括两核苷酸种类信息和测序信号强度信息,所述测序信号强度与合成核苷酸数目成正比,即每个测序反应的测序信号强度均能够转化为核苷酸合成的数目。
5.如权利要求1所述的两核苷酸合成焦测序定量检测甲基化的方法,其特征在于:所述步骤5)中,根据两核苷酸合成焦测序得到的一组测序反应获得编码信息,测序信号强度信息是包含零的正整数,或者是正非整数。
6.如权利要求5所述的两核苷酸合成焦测序定量检测甲基化的方法,其特征在于:所述步骤5)的具体步骤为:
假定DNA分析片段内所有GC位点碱基“C”全被甲基化,得到一条100%被甲基化的DNA模板1序列,并转化成相应两核苷酸合成焦测序的最大一阶的整数编码信息;同时,假定DNA分析片段内所有GC位点基“C”全未被甲基化,得到一条100%未被甲基化的DNA模板2序列,并转化成相应两核苷酸合成焦测序的最大一阶的整数编码信息;
所述关联分析为:假定容易一个GC位点中C被甲基化的程度为xi,其中0≤xi≤1,那么,在经过亚硫酸氢盐处理的PCR产物这个碱基序列中,含有“C”的DNA模板序列含量为xi,而含有由这个碱基未被甲基化转化而来的“T”DNA模板序列含量则为(1-xi);某个实际测序反应得到的信号强度即核苷酸合成数目等于DNA模板1序列和DNA模板2序列合成测序贡献之和,并由此构建出相应的方程式或方程组,求出xi值,确定该位点的甲基化程度;
当i=1,DNA模板1序列含量为x1,DNA模板2序列含量为(1-x1);
当i=2,该“C”碱基之前的DNA模板1序列含量为x1,该“C”碱基及其之后的DNA模板1序列含量为x2;由该“C”碱基转化成“T”碱基之前的DNA模板2序列含量为(1-x1),由该“C”碱基转化成“T”碱基及其之后的DNA模板2序列含量为(1-x2);
依次类推,当i=i,该“C”碱基之前的DNA模板1序列含量为xi-1,该“C”碱基及其之后的DNA模板1序列含量为xi;由该“C”碱基转化成“T”碱基之前的DNA模板2序列含量为(1-xi-1),由该“C”碱基转化成“T”碱基及其之后的DNA模板2序列含量为(1-xi);将整过PCR产物测序信息上甲基化完成关联分析。
7.如权利要求1所述的两核苷酸合成焦测序定量检测甲基化的方法,其特征在于:所述步骤2)中,通过采用传统的亚硫酸氢盐转化方法,或者采用市售的试剂盒、按照其操作流程实施。
8.如权利要求1所述的两核苷酸合成焦测序定量检测甲基化的方法,其特征在于:所述步骤3)中,PCR扩增所用的PCR一条引物为5’端被生物素、氨基或者丙烯酰胺基团修饰,与表面修饰链霉亲合素、羧基的固相载体反应,或者与丙烯酰胺单体聚合反应制备单链DNA模板。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510623069.4A CN105132573B (zh) | 2015-09-25 | 2015-09-25 | 一种两核苷酸合成焦测序定量检测甲基化的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510623069.4A CN105132573B (zh) | 2015-09-25 | 2015-09-25 | 一种两核苷酸合成焦测序定量检测甲基化的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105132573A true CN105132573A (zh) | 2015-12-09 |
CN105132573B CN105132573B (zh) | 2018-05-25 |
Family
ID=54718138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510623069.4A Expired - Fee Related CN105132573B (zh) | 2015-09-25 | 2015-09-25 | 一种两核苷酸合成焦测序定量检测甲基化的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105132573B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105648084A (zh) * | 2016-03-02 | 2016-06-08 | 东南大学 | 一种两核苷酸实时合成测序检测碱基连续突变序列的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103740824A (zh) * | 2014-01-09 | 2014-04-23 | 东南大学 | 一种两核苷酸实时合成测序图谱鉴定微生物种群的方法 |
CN104894246A (zh) * | 2015-05-21 | 2015-09-09 | 东南大学 | 一种两核苷酸合成测序分析多模板pcr产物的方法 |
-
2015
- 2015-09-25 CN CN201510623069.4A patent/CN105132573B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103740824A (zh) * | 2014-01-09 | 2014-04-23 | 东南大学 | 一种两核苷酸实时合成测序图谱鉴定微生物种群的方法 |
CN104894246A (zh) * | 2015-05-21 | 2015-09-09 | 东南大学 | 一种两核苷酸合成测序分析多模板pcr产物的方法 |
Non-Patent Citations (2)
Title |
---|
张晓丹等: "焦测序技术及其在遗传分析中的应用", 《分析化学》 * |
李金慧等: "DNA甲基化分析方法及相关应用", 《癌变.畸变.突变》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105648084A (zh) * | 2016-03-02 | 2016-06-08 | 东南大学 | 一种两核苷酸实时合成测序检测碱基连续突变序列的方法 |
CN105648084B (zh) * | 2016-03-02 | 2019-07-12 | 东南大学 | 一种两核苷酸实时合成测序检测碱基连续突变序列的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105132573B (zh) | 2018-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111032881B (zh) | 核酸的精确和大规模平行定量 | |
CN104870654B (zh) | 卵子供体妊娠中胎儿非整倍性的无创检测 | |
CN1896284B (zh) | 一种鉴别等位基因类型的方法 | |
CN102634586B (zh) | 一种两核苷酸实时合成dna解码测序方法 | |
CN102433376B (zh) | 基于荧光淬灭的基因变异检测方法及探针 | |
CN103958696B (zh) | 多重核酸分析 | |
CN108504744A (zh) | 一种用于法医检测的微单倍型遗传标记及其试剂盒 | |
CN104894246B (zh) | 一种两核苷酸合成测序分析多模板pcr产物的方法 | |
CN109952381A (zh) | 用于多重检测甲基化dna的方法 | |
CN102634587B (zh) | Dna芯片组合延伸检测碱基连续突变的方法 | |
AU2020104121A4 (en) | rapid batch determination method for the copy number of genome multicopy gene by PCR technology | |
CN103898226B (zh) | 一种线粒体snp荧光标记复合扩增试剂盒及其应用 | |
CN104313168B (zh) | 一种引物选择合成测序分析pcr产物单体型的方法 | |
CN108165618B (zh) | 一种包含核苷酸和3’端可逆封闭核苷酸的dna测序方法 | |
CN101671726B (zh) | 一种检测黄牛prdm16基因单核苷酸多态性的方法 | |
CN105219851A (zh) | 一种焦测序定量检测甲基化的方法 | |
CN115109843A (zh) | 一种多个水稻性状控制基因变异检测功能标记方法 | |
CN105132573A (zh) | 一种两核苷酸合成焦测序定量检测甲基化的方法 | |
CN114438233B (zh) | 一组用于亲缘关系鉴识的X染色体Multi-DIP的同步分型检测体系 | |
CN102605088B (zh) | 一种快速检测α-珠蛋白基因簇拷贝数变异的方法 | |
CN103397089B (zh) | 一种用于染色体数目异常快速检测的半特异性扩增引物组、方法及试剂盒 | |
CN105256030B (zh) | 一种基于两核苷酸合成焦测序寻找新突变/snp位点的方法 | |
CN104152568B (zh) | 高通量str序列核心重复数检测方法 | |
CN104762406B (zh) | 一种两核苷酸不同步合成测序分析pcr产物单体型方法 | |
CN106047990A (zh) | 一种基于两核苷酸合成测序的pcr产物snp分型/突变检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180525 |