CN106674283A - 可完全去疤的可逆末端终止功能核苷酸及其应用 - Google Patents
可完全去疤的可逆末端终止功能核苷酸及其应用 Download PDFInfo
- Publication number
- CN106674283A CN106674283A CN201611161033.XA CN201611161033A CN106674283A CN 106674283 A CN106674283 A CN 106674283A CN 201611161033 A CN201611161033 A CN 201611161033A CN 106674283 A CN106674283 A CN 106674283A
- Authority
- CN
- China
- Prior art keywords
- completely
- nucleotides
- scar
- base
- reversible end
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002441 reversible effect Effects 0.000 title claims abstract description 102
- 239000002773 nucleotide Substances 0.000 title claims abstract description 91
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 91
- 231100000241 scar Toxicity 0.000 title claims abstract description 66
- 208000032544 Cicatrix Diseases 0.000 title abstract 3
- 230000037387 scars Effects 0.000 title abstract 3
- 238000012163 sequencing technique Methods 0.000 claims abstract description 43
- 239000002585 base Substances 0.000 claims description 63
- NBBJYMSMWIIQGU-UHFFFAOYSA-N Propionic aldehyde Chemical compound CCC=O NBBJYMSMWIIQGU-UHFFFAOYSA-N 0.000 claims description 16
- 150000004985 diamines Chemical group 0.000 claims description 15
- 150000001412 amines Chemical class 0.000 claims description 12
- 238000005516 engineering process Methods 0.000 claims description 12
- 239000003054 catalyst Substances 0.000 claims description 10
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 claims description 9
- YNAVUWVOSKDBBP-UHFFFAOYSA-N Morpholine Chemical compound C1COCCN1 YNAVUWVOSKDBBP-UHFFFAOYSA-N 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 6
- 239000003513 alkali Substances 0.000 claims description 5
- VYXSBFYARXAAKO-WTKGSRSZSA-N chembl402140 Chemical compound Cl.C1=2C=C(C)C(NCC)=CC=2OC2=C\C(=N/CC)C(C)=CC2=C1C1=CC=CC=C1C(=O)OCC VYXSBFYARXAAKO-WTKGSRSZSA-N 0.000 claims description 5
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 claims description 5
- 150000003235 pyrrolidines Chemical class 0.000 claims description 4
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 claims description 3
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 claims description 3
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 claims description 3
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 claims description 3
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 claims description 3
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 claims description 3
- 108090000623 proteins and genes Proteins 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 125000003698 tetramethyl group Chemical group [H]C([H])([H])* 0.000 claims 1
- 230000008901 benefit Effects 0.000 abstract description 5
- 150000002009 diols Chemical group 0.000 abstract 1
- 238000006243 chemical reaction Methods 0.000 description 26
- 102100034343 Integrase Human genes 0.000 description 21
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 21
- 239000000758 substrate Substances 0.000 description 17
- 150000001875 compounds Chemical class 0.000 description 16
- 230000007062 hydrolysis Effects 0.000 description 15
- 238000006460 hydrolysis reaction Methods 0.000 description 15
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 13
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 13
- 108020004414 DNA Proteins 0.000 description 12
- 230000015572 biosynthetic process Effects 0.000 description 12
- 238000000034 method Methods 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 8
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 8
- -1 nucleotides pentose Chemical class 0.000 description 8
- 241000894007 species Species 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 239000008367 deionised water Substances 0.000 description 7
- 229910021641 deionized water Inorganic materials 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- 230000004224 protection Effects 0.000 description 6
- JQWHASGSAFIOCM-UHFFFAOYSA-M sodium periodate Chemical compound [Na+].[O-]I(=O)(=O)=O JQWHASGSAFIOCM-UHFFFAOYSA-M 0.000 description 6
- 230000021736 acetylation Effects 0.000 description 5
- 238000006640 acetylation reaction Methods 0.000 description 5
- 229940125904 compound 1 Drugs 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000012165 high-throughput sequencing Methods 0.000 description 5
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 5
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 5
- SPEUIVXLLWOEMJ-UHFFFAOYSA-N 1,1-dimethoxyethane Chemical compound COC(C)OC SPEUIVXLLWOEMJ-UHFFFAOYSA-N 0.000 description 4
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 4
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Natural products CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 4
- 239000003086 colorant Substances 0.000 description 4
- 239000012467 final product Substances 0.000 description 4
- 230000003647 oxidation Effects 0.000 description 4
- 238000007254 oxidation reaction Methods 0.000 description 4
- 239000002253 acid Substances 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 229940126214 compound 3 Drugs 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 238000006384 oligomerization reaction Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- WGTODYJZXSJIAG-UHFFFAOYSA-N tetramethylrhodamine chloride Chemical compound [Cl-].C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C(O)=O WGTODYJZXSJIAG-UHFFFAOYSA-N 0.000 description 3
- SZUVGFMDDVSKSI-WIFOCOSTSA-N (1s,2s,3s,5r)-1-(carboxymethyl)-3,5-bis[(4-phenoxyphenyl)methyl-propylcarbamoyl]cyclopentane-1,2-dicarboxylic acid Chemical compound O=C([C@@H]1[C@@H]([C@](CC(O)=O)([C@H](C(=O)N(CCC)CC=2C=CC(OC=3C=CC=CC=3)=CC=2)C1)C(O)=O)C(O)=O)N(CCC)CC(C=C1)=CC=C1OC1=CC=CC=C1 SZUVGFMDDVSKSI-WIFOCOSTSA-N 0.000 description 2
- QFLWZFQWSBQYPS-AWRAUJHKSA-N (3S)-3-[[(2S)-2-[[(2S)-2-[5-[(3aS,6aR)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoylamino]-3-methylbutanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-4-[1-bis(4-chlorophenoxy)phosphorylbutylamino]-4-oxobutanoic acid Chemical compound CCCC(NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H](NC(=O)CCCCC1SC[C@@H]2NC(=O)N[C@H]12)C(C)C)P(=O)(Oc1ccc(Cl)cc1)Oc1ccc(Cl)cc1 QFLWZFQWSBQYPS-AWRAUJHKSA-N 0.000 description 2
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 229930183912 Cytidylic acid Natural products 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 108010078851 HIV Reverse Transcriptase Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 125000003368 amide group Chemical group 0.000 description 2
- 229940126543 compound 14 Drugs 0.000 description 2
- 229940125782 compound 2 Drugs 0.000 description 2
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 2
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 description 2
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 2
- 150000002466 imines Chemical class 0.000 description 2
- 125000002346 iodo group Chemical group I* 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 229940005657 pyrophosphoric acid Drugs 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000006722 reduction reaction Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 238000011451 sequencing strategy Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- GHYOCDFICYLMRF-UTIIJYGPSA-N (2S,3R)-N-[(2S)-3-(cyclopenten-1-yl)-1-[(2R)-2-methyloxiran-2-yl]-1-oxopropan-2-yl]-3-hydroxy-3-(4-methoxyphenyl)-2-[[(2S)-2-[(2-morpholin-4-ylacetyl)amino]propanoyl]amino]propanamide Chemical compound C1(=CCCC1)C[C@@H](C(=O)[C@@]1(OC1)C)NC([C@H]([C@@H](C1=CC=C(C=C1)OC)O)NC([C@H](C)NC(CN1CCOCC1)=O)=O)=O GHYOCDFICYLMRF-UTIIJYGPSA-N 0.000 description 1
- ONBQEOIKXPHGMB-VBSBHUPXSA-N 1-[2-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]oxy-4,6-dihydroxyphenyl]-3-(4-hydroxyphenyl)propan-1-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1OC1=CC(O)=CC(O)=C1C(=O)CCC1=CC=C(O)C=C1 ONBQEOIKXPHGMB-VBSBHUPXSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- IFJZHMIMIMJXJU-UHFFFAOYSA-N 3-benzoyl-5-iodo-1h-pyrimidine-2,4-dione Chemical compound O=C1C(I)=CNC(=O)N1C(=O)C1=CC=CC=C1 IFJZHMIMIMJXJU-UHFFFAOYSA-N 0.000 description 1
- YYROPELSRYBVMQ-UHFFFAOYSA-N 4-toluenesulfonyl chloride Chemical compound CC1=CC=C(S(Cl)(=O)=O)C=C1 YYROPELSRYBVMQ-UHFFFAOYSA-N 0.000 description 1
- KSNXJLQDQOIRIP-UHFFFAOYSA-N 5-iodouracil Chemical class IC1=CNC(=O)NC1=O KSNXJLQDQOIRIP-UHFFFAOYSA-N 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 241000872931 Myoporum sandwicense Species 0.000 description 1
- UGJBHEZMOKVTIM-UHFFFAOYSA-N N-formylglycine Chemical compound OC(=O)CNC=O UGJBHEZMOKVTIM-UHFFFAOYSA-N 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- UPHDUGROINXAPD-JDSXPTGVSA-N P(O)(=O)(OP(=O)(O)OP(=O)(O)O)OC[C@@H]1[C@H](C[C@@H](O1)C1=CN(C(=O)NC1=O)CCC(C(CN)O)O)O Chemical compound P(O)(=O)(OP(=O)(O)OP(=O)(O)O)OC[C@@H]1[C@H](C[C@@H](O1)C1=CN(C(=O)NC1=O)CCC(C(CN)O)O)O UPHDUGROINXAPD-JDSXPTGVSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- BLRPTPMANUNPDV-UHFFFAOYSA-N Silane Chemical compound [SiH4] BLRPTPMANUNPDV-UHFFFAOYSA-N 0.000 description 1
- 241000218636 Thuja Species 0.000 description 1
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical class O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 125000003172 aldehyde group Chemical group 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 238000005915 ammonolysis reaction Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 238000007068 beta-elimination reaction Methods 0.000 description 1
- 230000031709 bromination Effects 0.000 description 1
- 238000005893 bromination reaction Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- HJMZMZRCABDKKV-UHFFFAOYSA-N carbonocyanidic acid Chemical compound OC(=O)C#N HJMZMZRCABDKKV-UHFFFAOYSA-N 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- GGRHYQCXXYLUTL-UHFFFAOYSA-N chloromethyl 2,2-dimethylpropanoate Chemical compound CC(C)(C)C(=O)OCCl GGRHYQCXXYLUTL-UHFFFAOYSA-N 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 229940125773 compound 10 Drugs 0.000 description 1
- 229940125797 compound 12 Drugs 0.000 description 1
- 229940126142 compound 16 Drugs 0.000 description 1
- 229940125898 compound 5 Drugs 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000006482 condensation reaction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- MQRXZVLOOXQGLF-UHFFFAOYSA-N di(propan-2-yl)silyloxy-di(propan-2-yl)silane Chemical class CC(C)[SiH](C(C)C)O[SiH](C(C)C)C(C)C MQRXZVLOOXQGLF-UHFFFAOYSA-N 0.000 description 1
- UBHZUDXTHNMNLD-UHFFFAOYSA-N dimethylsilane Chemical compound C[SiH2]C UBHZUDXTHNMNLD-UHFFFAOYSA-N 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 150000002085 enols Chemical class 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- ICIWUVCWSCSTAQ-UHFFFAOYSA-M iodate Chemical compound [O-]I(=O)=O ICIWUVCWSCSTAQ-UHFFFAOYSA-M 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- ZLVXBBHTMQJRSX-VMGNSXQWSA-N jdtic Chemical compound C1([C@]2(C)CCN(C[C@@H]2C)C[C@H](C(C)C)NC(=O)[C@@H]2NCC3=CC(O)=CC=C3C2)=CC=CC(O)=C1 ZLVXBBHTMQJRSX-VMGNSXQWSA-N 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- QARBMVPHQWIHKH-UHFFFAOYSA-N methanesulfonyl chloride Chemical compound CS(Cl)(=O)=O QARBMVPHQWIHKH-UHFFFAOYSA-N 0.000 description 1
- 150000002780 morpholines Chemical class 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 125000003170 phenylsulfonyl group Chemical group C1(=CC=CC=C1)S(=O)(=O)* 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- XKJCHHZQLQNZHY-UHFFFAOYSA-N phthalimide Chemical compound C1=CC=C2C(=O)NC(=O)C2=C1 XKJCHHZQLQNZHY-UHFFFAOYSA-N 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 229940083082 pyrimidine derivative acting on arteriolar smooth muscle Drugs 0.000 description 1
- 239000002719 pyrimidine nucleotide Substances 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 229910000077 silane Inorganic materials 0.000 description 1
- 229910000033 sodium borohydride Inorganic materials 0.000 description 1
- 239000012279 sodium borohydride Substances 0.000 description 1
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- MHYGQXWCZAYSLJ-UHFFFAOYSA-N tert-butyl-chloro-diphenylsilane Chemical compound C=1C=CC=CC=1[Si](Cl)(C(C)(C)C)C1=CC=CC=C1 MHYGQXWCZAYSLJ-UHFFFAOYSA-N 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000007039 two-step reaction Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07F—ACYCLIC, CARBOCYCLIC OR HETEROCYCLIC COMPOUNDS CONTAINING ELEMENTS OTHER THAN CARBON, HYDROGEN, HALOGEN, OXYGEN, NITROGEN, SULFUR, SELENIUM OR TELLURIUM
- C07F9/00—Compounds containing elements of Groups 5 or 15 of the Periodic Table
- C07F9/02—Phosphorus compounds
- C07F9/547—Heterocyclic compounds, e.g. containing phosphorus as a ring hetero atom
- C07F9/6561—Heterocyclic compounds, e.g. containing phosphorus as a ring hetero atom containing systems of two or more relevant hetero rings condensed among themselves or condensed with a common carbocyclic ring or ring system, with or without other non-condensed hetero rings
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07F—ACYCLIC, CARBOCYCLIC OR HETEROCYCLIC COMPOUNDS CONTAINING ELEMENTS OTHER THAN CARBON, HYDROGEN, HALOGEN, OXYGEN, NITROGEN, SULFUR, SELENIUM OR TELLURIUM
- C07F9/00—Compounds containing elements of Groups 5 or 15 of the Periodic Table
- C07F9/02—Phosphorus compounds
- C07F9/547—Heterocyclic compounds, e.g. containing phosphorus as a ring hetero atom
- C07F9/6558—Heterocyclic compounds, e.g. containing phosphorus as a ring hetero atom containing at least two different or differently substituted hetero rings neither condensed among themselves nor condensed with a common carbocyclic ring or ring system
- C07F9/65586—Heterocyclic compounds, e.g. containing phosphorus as a ring hetero atom containing at least two different or differently substituted hetero rings neither condensed among themselves nor condensed with a common carbocyclic ring or ring system at least one of the hetero rings does not contain nitrogen as ring hetero atom
-
- C—CHEMISTRY; METALLURGY
- C09—DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
- C09K—MATERIALS FOR MISCELLANEOUS APPLICATIONS, NOT PROVIDED FOR ELSEWHERE
- C09K11/00—Luminescent, e.g. electroluminescent, chemiluminescent materials
- C09K11/06—Luminescent, e.g. electroluminescent, chemiluminescent materials containing organic luminescent materials
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C09—DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
- C09K—MATERIALS FOR MISCELLANEOUS APPLICATIONS, NOT PROVIDED FOR ELSEWHERE
- C09K2211/00—Chemical nature of organic luminescent or tenebrescent compounds
- C09K2211/10—Non-macromolecular compounds
- C09K2211/1018—Heterocyclic compounds
- C09K2211/1025—Heterocyclic compounds characterised by ligands
- C09K2211/1029—Heterocyclic compounds characterised by ligands containing one nitrogen atom as the heteroatom
-
- C—CHEMISTRY; METALLURGY
- C09—DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
- C09K—MATERIALS FOR MISCELLANEOUS APPLICATIONS, NOT PROVIDED FOR ELSEWHERE
- C09K2211/00—Chemical nature of organic luminescent or tenebrescent compounds
- C09K2211/10—Non-macromolecular compounds
- C09K2211/1018—Heterocyclic compounds
- C09K2211/1025—Heterocyclic compounds characterised by ligands
- C09K2211/1044—Heterocyclic compounds characterised by ligands containing two nitrogen atoms as heteroatoms
-
- C—CHEMISTRY; METALLURGY
- C09—DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
- C09K—MATERIALS FOR MISCELLANEOUS APPLICATIONS, NOT PROVIDED FOR ELSEWHERE
- C09K2211/00—Chemical nature of organic luminescent or tenebrescent compounds
- C09K2211/10—Non-macromolecular compounds
- C09K2211/1018—Heterocyclic compounds
- C09K2211/1025—Heterocyclic compounds characterised by ligands
- C09K2211/1088—Heterocyclic compounds characterised by ligands containing oxygen as the only heteroatom
-
- C—CHEMISTRY; METALLURGY
- C09—DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
- C09K—MATERIALS FOR MISCELLANEOUS APPLICATIONS, NOT PROVIDED FOR ELSEWHERE
- C09K2211/00—Chemical nature of organic luminescent or tenebrescent compounds
- C09K2211/10—Non-macromolecular compounds
- C09K2211/1018—Heterocyclic compounds
- C09K2211/1025—Heterocyclic compounds characterised by ligands
- C09K2211/1096—Heterocyclic compounds characterised by ligands containing other heteroatoms
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Materials Engineering (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供可完全去疤的可逆末端终止功能核苷酸及其应用。此功能核苷酸由含有C‑C糖苷键的核苷酸、连接核苷酸的碱基与荧光基团的邻二醇基可切割连接臂、荧光基团三部分构成。其中连接臂可被完全切除(可完全去疤),并且连接臂较短。本发明连接臂的上述优点,有助于实现此可逆末端终止功能核苷酸在引物上高效合成延伸和有效终止,进而实现可逆末端终止测序的长读长。
Description
技术领域
本发明属于生物学技术领域,特别涉及一种可完全除疤的可逆末端终止功能核苷酸及其在高通量测序技术上的应用。其中可逆末端终止功能核苷酸的连接臂可以经过两步反应而被完全去除(可完全去疤),从而实现此可逆末端终止功能核苷酸在引物上高效合成延伸和有效终止,进而实现可逆末端终止测序的长读长。
背景技术
上个世纪七十年代,由Sanger等发明的双脱氧链终止法第一代DNA测序技术,为科学发展做出了重大贡献,成就了“人类基因组计划”。但由于其通量低、成本高等的缺点,所以无法满足多物种大规模基因组测序以及深度和重复测序的需求,于是第二代高通量测序技术应运而生。从2005年至今,二代测序技术发展十分迅猛,各二代测序平台的更新换代速度之快令人目不暇接,其所产生的数据量也呈指数级增长,这极大地推动了几乎所有生物医学领域的研究进展。目前主流二代高通量测序仪所采用的二代测序技术主要有“合成测序法”和“连接测序法”两种。
“可逆末端终止测序法”属于合成测序法(Sequencing By Synthesis,SBS)的一种,由美国哥伦比亚大学的Jing yue Ju教授在2003年首先提出并付诸实践,是目前市场占有率最高、应用前景最被看好的一种二代高通量测序技术(Li Z,Bai X,Ruparel H,etal.Proc Natl AcadSci U S A.2003,100:414-9.)。可逆末端终止法测序反应底物分子是一种具有可逆末端终止功能的核苷酸类似物,称为“可逆末端终止功能核苷酸”(reversible terminator)。与传统Sanger测序法所采用的“双脱氧末端终止功能核苷酸”的最大不同在于,其末端终止基团的引物延伸终止功能是可逆的,可以通过一定的化学转变恢复为正常的、可以再次进行引物延伸的基团。
目前,可逆末端终止功能核苷酸大体可分为两种:(a)第一种在核苷酸戊糖3’端羟基氧上连一个行使可逆末端终止功能的封闭基团。在这种情况下,与碱基上相连的可被切掉的荧光基团仅起到测序指示剂的作用(Guo J,Yu L,Turro NJ,Ju J.Acc ChemRes.2010,43(4),551-63.)。(b)第二种可逆末端终止封闭基团不位于3’端,而连接于碱基上。与碱基相连的荧光基团通常不仅起到测序指示剂的作用,而且也是可逆终止基团的一部分,起到了终止引物延伸的作用(Bowers J,Mitchell J,Beer E,et al.NatMethods.2009,6(8), 593-5.)。这两种可逆末端终止功能核苷酸各有优劣,第一种由于有专门的可逆末端终止基团,可逆终止的效果可能会更好一点。第二种由于3’端没有修饰基团,更容易合成也更容易被DNA聚合酶所接受。
3’末端带有封闭基团的可逆末端终止功能核苷酸目前发展比较成熟并已经商品化的有三种:(1)Illumina Solexa所使用的3’-O-N3可逆末端终止功能核苷酸(BentleyDR,Balasubramanian S,Swerdlow HP,et al.Nature.2008,456(7218),53-9.)。(2)StevenA Benner团队研发的3’-ONH2可逆末端终止功能核苷酸(Hutter D,Kim MJ,Karalkar N.,et al.Nucleos.Nucleot.Nucl.Acids,2010,29,879-895.)。(3)哥伦比亚大学Jing yue Ju团队研发的3’-O-丙烯基可逆末端终止功能核苷酸(Guo J,Yu L,Turro NJ,Ju J.Acc ChemRes.2010,43(4),551-63.)。单就可逆末端终止功能而言,这三种测序试剂的表现都是不错的,其可逆末端终止基团和荧光基团都可以几乎100%地被切除。对于可逆末端终止封闭基团连接于碱基上的可逆末端终止功能核苷酸,目前已商品化的只有Helicos公司的单分子测序仪所采用的'virtual terminator'。
由于可逆末端终止功能核苷酸采用荧光作为测序指示剂,这极大地增强了测序的灵敏性与准确率,同时降低了上样量;并且由于采用了可逆末端终止测序策略,有效地解决了多聚重复序列(例如PolyA)的准确读取问题。这种测序策略可以准确读出大于18个连续的A。Solexa公司正是充分利用和发挥了可逆末端终止测序法的这些优势(并整合了原Illumina在DNA芯片上的优势),在被Illumina购买后不到5年的时间内,迅速地在二代高通量测序市场上脱颖而出,成为了目前市场上应用最广泛的二代高通量测序仪。其在测序成本和测序通量上都击败了其主要竞争对手Life Tech公司ion系列测序平台,但其在读长上的优势并不明显(Chen F,Dong M,Ge M,et al.Genomics ProteomicsBioinformatics.2013,11(1),34-40)。
影响可逆末端终止测序法读长的原因就在于:每一步切除荧光基团后在碱基上留下的连接臂残余(即疤痕)。每读出一个碱基,在延伸的引物上就加上一个带有疤痕的脱氧核苷酸。并且,随着测序引物的合成延伸,这种带有疤痕的脱氧核苷酸越积越多,这会极大地破坏DNA双螺旋结构的稳定性,从而影响DNA聚合酶与底物的结合;另一方面,这种带有疤痕的脱氧核苷酸也会影响DNA聚合酶对底物的识别。
发明内容
为了解决至少部分上述技术问题,本发明的发明人进行了深入研究,并发现通过由含有C-C糖苷键的核苷酸、连接核苷酸的碱基与荧光基团的邻二醇基可切割连接臂和荧光基团三部分构成的可逆末端终止功能核苷酸可完全去除连接臂残余。基于此完成了本发明。具体地,本发明包括以下内容。
本发明的一方面,提供可完全去疤的可逆末端终止功能核苷酸,此功能核苷酸由含有C-C糖苷键的核苷酸、连接核苷酸的碱基与荧光基团的邻二醇基可切割连接臂和荧光基团三部分构成。
在某些实施方案中,含有C-C糖苷键的核苷酸中的核苷酸为选自由dATP、dTTP、dGTP和dCTP组成的组中的至少之一。
在某些实施方案中,邻二醇基可切割连接臂具有如下所述的结构式:
-(CH2)m(CHOH)2(CH2)n-
其中m和n分别为1至5的整数,例如,1、2、3、4或5。
在某些实施方案中,荧光基团选自由Cy3、Cy5、Cy5.5、Cy7、FITC、Alexa 488、Alexa568、JOE、ROX、罗丹明6G(Rhodamine 6G)、四甲基罗丹明(Tetramethyl rhodamine)、丽丝胺(Lissamine)、德克萨斯红(Texas Red)、BODIPY 576/589、BODIPY 630/650和BODIPY 650/665组成的组的至少之一。
在优选的实施方式中,本发明的可逆末端终止功能核苷酸具有下式1所示的化学结构式之一。
本发明的另一方面,提供可完全去疤的可逆末端终止功能核苷酸在高通量测序技术上的应用。
在某些实施方案中,可完全去疤的可逆末端终止功能核苷酸在高通量测序技术上的应用包括下述具体步骤:
1)测序DNA模板及引物的固定;
2)引物延伸:向反应体系加入延伸反应混合液开始进行引物聚合延伸,此混合液主要包括DNA聚合酶(或逆转录酶)及四种不同碱基带有不同颜色荧光的可完全去疤可逆末端终止功能核苷酸;
3)延伸终止:去离子水洗涤,清除延伸反应混合液,终止引物延伸反应;
4)碱基读取:CCD拍照,通过荧光颜色来判定所延伸的碱基的种类;
5)切除连接臂及与其相连的荧光基团:先加入高碘酸钠(NaIO4)溶液切断邻二醇基连接臂去除荧光基团,一定温度下反应一段时间后再用去离子水清洗;然后加入胺类催化剂将剩余的丙醛基完全去除,一定温度下反应一段时间后再用去离子水清洗;
6)重复步骤2-5;
7)序列判读:利用图像分析软件,根据荧光与碱基种类的对应关系,对测序DNA模板进行序列判读。
在某些实施方案中,可逆末端终止功能核苷酸在高通量测序技术上的应用中,步骤2)的DNA聚合酶或逆转录酶为以下酶的一种:Taq、REAP 475、EEAP 442、Vent(exo-)、DeepVent(exo-)、9° Nm、Therminator、Therminator-2、Therminator-3、Bst、Bsu、Klenow、Klenow(exo-)、AffinityScript RT、M-MLV Reverse Transcriptase、ImProm-II ReverseTranscriptase、ThermoScript Reverse Transcriptase、HIV Reverse Transcriptase、Maxima Reverse Transcriptase、ReverAidTM Reverse Transcriptase、SuperScript IIReverse Transcriptase、SuperScript III Reverse Transcriptase、Enhanced AvianReverse Transcriptase。
在某些实施方案中,可逆末端终止功能核苷酸在高通量测序技术上的应用中,步骤5)的胺类催化剂为选自氨基乙酸、吗啉和吡咯烷的至少一种。
在某些实施方案中,本发明的可逆末端终止功能核苷酸可以完全切除连接臂(本发明中,有时也称作可完全去疤)。
在某些实施方案中,本发明的可逆末端终止功能核苷酸的连接臂较短,引物延伸聚合一个带有大荧光基团的可逆末端终止功能核苷酸后,DNA的双螺旋结构由于大沟构成的改变而改变,便无法再聚合第二个,从而达到“延伸且只延伸一个”的目的。
在某些实施方案中,出于完全去除连接臂的考虑,嘧啶碱基5位和嘌呤碱基的7位C被N所取代。这样,完全消除疤痕以后,DNA双螺旋结构不会因可逆末端终止功能核苷酸在引物上的累积而遭到破坏,从而实现可逆末端终止测序法的长读长。
在某些实施方案中,本发明所述的高通量测序属于可逆末端终止测序法,即合成测序法,其利用DNA聚合酶的链延伸反应,边合成边测序,包括多步引物延伸、终止、切除操作。
附图说明
图1:为本发明某些实施方案中的可完全去疤可逆末端终止功能核苷酸的结构式(Dye:荧光基团)。
图2:为本发明某些实施方案中的可完全去除连接臂(完全去疤)过程示意图。
图3:为本发明某些实施方案中的可逆末端终止测序法的具体操作步骤(多步引物延伸、终止、切除)。
图4:为本发明某些实施方案的烯糖化合物的合成路线。
图5:为本发明某些实施方案的可完全去疤dT可逆末端终止功能核苷酸的合成路线。
图6:为本发明某些实施方案的甲苯磺基取代的无疤连接臂的合成路线。
图7:为本发明某些实施方案的可完全去疤dC可逆末端终止功能核苷酸的合成路线。
图8:为本发明某些实施方案的可完全去疤dA可逆末端终止功能核苷酸的合成路线。
图9:为本发明某些实施方案的可完全去疤dG可逆末端终止功能核苷酸的合成路线。
图10:为本发明某些实施方案的可完全去疤dT可逆末端终止功能核苷酸完全去疤反应。
图11:为本发明某些实施方案的可完全去疤可逆末端终止功能胞嘧啶核苷酸(BODIPY 576/589Labeled 1-(5-amino-3,4-dihydroxypentyl)-2'-deoxy-pseudouridine-5'-triphosphate)结构式。
图12:为本发明某些实施方案的单侧引物延伸PAGE电泳图。
图13:为本发明某些实施方案的固定到醛基基片上的测序底物及引物。
具体实施方式
通过解释以下本申请的优选实施方案,本发明的其他目的和优点将变得清楚。
应理解本发明中所述的术语仅仅是为描述特别的实施方式,并非用于限制本发明。另外,对于本发明中的数值范围,应理解为还具体公开了该范围的上限和下限之间的每个中间值。在任何陈述值或陈述范围内的中间值以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。
除非另有说明,否则本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的实验方法、测定或测试方法,但是在本发明的实验、测定或测试中也可以使用与本文所述相似或等同的任何方法。本说明书中提到的所有文献通过引用并入,用以公开和描述与所述文献相关的方法或实验。在与任何并入的文献冲突时,以本说明书的内容为准。
本发明中,名词术语既包括单数形式,也包括复数形式,除非上下文另行明确指出。本发明中所述的“至少之一”或“至少一种”不仅仅指包含“一个”或“一种”的情况,更重要的还包含“多个”或“多种”的情况。
本发明中,术语“可完全去疤”是指可逆末端终止功能核苷酸的连接臂可以被完全切除/去除/消除。其被完全去除的过程可例如如图2所示。首先,连接臂中的邻二醇基被高碘酸盐氧化所切断,从而去除荧光基团。随后,剩余的丙醛基经胺类催化剂催化形成亚胺,亚胺基α位的一个电子引发了β-消除反应,从而使碱基杂环上的N原子与丙醛完全分离,达到完全去除连接臂(疤痕)的目的。
本发明中,术语“含有C-C糖苷键的核苷酸”是指核苷酸中的嘧啶碱基5位或者嘌呤碱基的7位C被N所取代的天然核苷酸的衍生物。它是一种具有可逆末端终止功能的核苷酸类似物,称为“可逆末端终止功能核苷酸”(reversible terminator)。优选地,天然核苷酸为由碱基、核糖或脱氧核糖和磷酸组成。优选所述天然核苷酸选自由dATP、dTTP、dGTP和dCTP组成的组中的至少之一。
本发明中,术语“邻二醇基可切割连接臂”为在邻位上具有两个醇基(-OH)的化合物。优选地,其具有如下所述的结构式:-(CH2)m(CHOH)2(CH2)n-,其中m和n分别为1至5的整数,例如,1、2、3、4或5。在优选的实施方案中,m为2,n为1。
本发明中,术语“荧光基团”为本领域内通常使用的任何荧光基团,包括但不限于Cy3、Cy5、Cy5.5、Cy7、FITC、Alexa 488、Alexa 568、JOE、ROX、罗丹明6G(Rhodamine 6G)、四甲基罗丹明(Tetramethyl rhodamine)、丽丝胺(Lissamine)、德克萨斯红(Texas Red)、BODIPY 576/589、BODIPY 630/650和BODIPY 650/665。在某些实施方案中,荧光基团可组合使用两种以上的上述任何基团。
本发明中,优选地,邻二醇基可切割连接臂通过选自由NH-CO、CO-NH、CO-NH-NH、NH-NH-CO、NH-CO-NH和CO-NH-NH-CO组成的组任何之一与荧光基团连接。
本发明中,“测序”优选指可逆末端终止法测序,其末端终止基团的引物延伸终止功能是可逆的,可以通过一定的化学转变恢复为正常的、可以再次进行引物延伸的基团。所述测序包括但不限于高通量测序。
本发明中,“高通量测序”的具体步骤和方法有多种,在此,仅简单提及下述具体步骤:
1)测序DNA模板及引物的固定;
2)引物延伸:向反应体系加入延伸反应混合液开始进行引物聚合延伸,此混合液主要包括DNA聚合酶(或逆转录酶)及四种不同碱基带有不同颜色荧光的可完全去疤可逆末端终止功能核苷酸;
3)延伸终止:去离子水洗涤,清除延伸反应混合液,终止引物延伸反应;
4)碱基读取:CCD拍照,通过荧光颜色来判定所延伸的碱基的种类;
5)切除连接臂及与其相连的荧光基团:先加入NaIO4溶液切断邻二醇基连接臂去除荧光基团,一定温度下反应一段时间后再用去离子水清洗;然后加入胺类催化剂将剩余的丙醛基完全去除,一定温度下反应一段时间后再用去离子水清洗;
6)重复步骤2-5;
7)序列判读:利用图像分析软件,根据荧光与碱基种类的对应关系,对测序DNA模板进行序列判读。
本发明中,所述步骤2)的DNA聚合酶或逆转录酶包括但不限于以下酶:Taq、REAP475、EEAP 442、Vent(exo-)、Deep Vent(exo-)、9° Nm、Therminator、Therminator-2、Therminator-3、Bst、Bsu、Klenow、Klenow(exo-)、AffinityScript RT、M-MLVReverseTranscriptase、ImProm-II Reverse Transcriptase、ThermoScript ReverseTranscriptase、HIV Reverse Transcriptase、Maxima Reverse Transcriptase、ReverAidTM Reverse Transcriptase、SuperScript II Reverse Transcriptase、SuperScript III Reverse Transcriptase、Enhanced Avian Reverse Transcriptase。
本发明中,步骤5)的胺类催化剂可为本领域内通常使用的催化剂,包括但不限于氨基乙酸、吗啉和吡咯烷。可选地,本发明的催化剂可以使用两种以上的上述不同类型。
本发明中,优选地邻二醇基连接臂连于嘧啶碱基的5位和嘌呤碱基的7位上,这两个位点位于DNA双螺旋结构的大沟部位,能接受比较大的荧光修饰基团。本发明设计的连接臂较短,引物延伸聚合一个带有大荧光集团的可逆末端终止功能核苷酸后,DNA的双螺旋结构由于大沟构成的改变而改变,便无法再聚合第二个,从而达到“延伸且只延伸一个”的目的。另外,出于完全去除连接臂的考虑,嘧啶碱基5位和嘌呤碱基的7位C被N所取代。这样,完全消除疤痕以后,DNA双螺旋结构不会因可逆末端终止功能核苷酸在引物上的累积而遭到破坏,从而实现可逆末端终止测序法的长读长。
本发明所涉及的可逆末端终止测序法属于合成测序法,是利用DNA聚合酶的链延伸反应,边合成边测序,包括多步引物延伸、终止、切除操作。具体步骤如下(参见图3):
1)引物延伸:加入DNA聚合酶以及四种不同碱基带有不同颜色荧光的可完全去疤可逆末端终止功能核苷酸后,引物开始进行聚合延伸;
2)延伸终止:由于dNTPs碱基上带有可逆末端终止基团,使得延伸反应只能延伸聚合一个可完全去疤可逆末端终止功能核苷酸;
3)读取荧光颜色:通过读取可逆末端终止功能核苷酸的荧光颜色可以判断出新聚合在引物上的碱基种类;
4)洗除多余可完全去疤可逆末端终止功能核苷酸;
5)使用NaIO4和胺类催化剂完全去除带有连接臂的荧光基团(完全去疤);
6)洗除被切除的带有连接臂的荧光基团;
7)开始第二轮引物延伸反应。
实施例
实施例1:四种可完全去疤可逆末端终止功能核苷酸的具体合成路线
1、可完全去疤dT可逆末端终止功能核苷酸的合成路线
1)烯糖化合物的制备方法
首先,化合物1胸腺嘧啶核苷的5'-位的羟基经保护后得到化合物2。然后,再用对3'-位上的羟基经叔丁基二苯基氯硅烷保护和碱性水解后得到化合物3。接着,再用叔丁基二甲基硅烷对5'-位的羟基进行保护得到化合物4。最后,化合物4的糖苷键在六甲基二硅胺作用下断裂并碱性水解得到烯糖化合物5(图4)。
2)完全去疤dT可逆末端终止功能核苷酸的制备方法
2-脱氧-D-核糖经2,2-二甲氧基丙烷的保护、磷叶利德反应和水解后得到烯醇类化合物7。化合物7再与邻苯二甲酰亚胺偶联和水解得到化合物8。接着,经氨基保护和氧化及水解后得到邻二醇衍生物9,化合物9再经高碘酸钠氧化和硼氢化钠还原得到单羟基衍生物10。化合物10再经溴化后与N3-苯甲酰基-5-碘尿嘧啶偶联和水解得到5-碘尿嘧啶衍生物12。化合物12与烯糖化合物5偶联得到尿嘧啶核苷衍生物13。13经水解后得到化合物14。化合物14核糖环的3'-位的羟基经乙酰基保护后得到中间体15,15经焦磷酸化和水解后得到核苷酸16。最后,化合物16侧链上的氨基与活化的荧光基团结合得到最终产物“可完全去疤dT可逆末端终止功能核苷酸”(图5)。
2、可完全去疤dC可逆末端终止功能核苷酸的制备方法
1)甲苯磺基取代的无疤连接臂的制备
首先,2-脱氧-D-核糖经保护、水解、氧化和还原等反应得到醇类化合物1。然后,用对甲苯磺酰氯(MsCl)对化合物1苯磺酰化后得到目标化合物2(图6)。
2)可完全去疤dC可逆末端终止功能核苷酸的制备
首先,异胞嘧啶(2-氨基-4-羟基嘧啶,3)经碘代和乙酰化后得到化合物4。然后,4与化合物2偶联得到N-取代的5-碘异胞嘧啶衍生物5。5与烯糖化合物6偶联得到核苷类衍生物7。化合物7经水解除去核糖3’-位保护基后得到化合物8。接着,8经保护和水解及核糖环的3’-位乙酰化后得到化合物9。再经焦磷酸酸化和水解后得到伪异胞核苷酸10。最后,化合物10嘧啶环侧链末端的氨基与活化的荧光基团结合得到最终产物“可完全去疤dC可逆末端终止功能核苷酸”(图7)。
3.可完全去疤dA可逆末端终止功能核苷酸的制备方法
首先,化合物1与醇类衍生物2偶联得到化合物3。然后,3再与烯糖化合物4发生核苷化反应得到核苷衍生物5,再经水解和6-位氨解得到7。接着,化合物7核糖环上的两个的羟基经1,1,3,3-四异丙基二硅氧烷保护后得到中间体8。然后,对6-位氨基进行乙酰化和水解掉核糖环上的硅烷保护基得到9,化合物9再经乙酰化、焦磷酸化和水解后得到核苷酸11。最后,化合物11的侧链上的氨基与活化的荧光基团结合得到最终产物“可完全去疤dA可逆末端终止功能核苷酸”(图8)。
4.可完全去疤dG可逆末端终止功能核苷酸的制备方法
首先,嘧啶衍生物1经二甲基缩醛对的2-位氨基缩合和新戊酸氯甲酯对1-位上的亚胺保护后得到中间体2。然后,再经二甲基缩醛缩合和闭环反应得到中间体3。中间体3经碘代后得到化合物4。化合物4与醇衍生物5偶联得到化合物6。然后,再与烯糖化合物7反应的得到核苷衍生物8,再经水解得到9。接着,对化合物9核糖环3’-位的羟基进行乙酰化得到中间体10。10再经焦磷酸酸化和水解后得到核苷酸11。最后,化合物11侧链上的氨基活化的荧光基团结合得到最终产物“可完全去疤dG可逆末端终止功能核苷酸”(图9)。
实施例2:可逆末端终止功能核苷酸的完全去疤实验
可逆末端终止功能核苷酸的完全去疤实验(以ScarlessdT ReversibleTerminator的切除实验为例说明,图10)采用两步反应。第一步为切断邻二醇基连接臂去除荧光基团:化合物1通过50mM NaIO4(25℃,5min)氧化其碱基侧链上的邻羟基得到侧链醛基衍生物2;第二步为去除丙醛基而完全去疤:侧链含有醛基的衍生物2在胺类催化剂作用下即可完全除疤,得到化合物3。如下表所示,在较温和的反应条件下(55℃),30分钟内即可以完全去除碱基上的丙醛基,完全去疤率可达98-99%。
表1.5’丙醛基胸腺嘧啶核苷酸的完全去疤实验(离子交换HPLC检测)
注:A:100mM氨乙酸基,55℃;B:500mM吗啉,55℃;C:100mM吡咯烷,55℃。
实施例3:酶的筛选及完全去疤可逆末端终止功能核苷酸的单侧引物延伸终止功能实验
通过单侧引物延伸实验,从多种商业化的DNA聚合酶和逆转录酶中筛选获取了多种高效延伸及有效终止(即~100%“延伸且只延伸一个”)完全去疤可逆末端终止功能胸腺嘧啶核苷酸(T)的酶。用于单侧引物延伸的可完全去疤可逆末端终止功能胞嘧啶核苷酸结构式如图11所示。单侧引物延伸PAGE电泳图如图12所示。
反应步骤如下:首先,将5'端32P放射性标记的引物(2.5pmol)与底物(30pmol)经过变性(95℃,5分钟)退火(缓慢降至室温0.1℃/秒)进行杂交反应;然后向反应体系中加入各种DNA聚合酶及逆转录酶(如附图所示),再加入可完全去疤可逆末端终止功能胞嘧啶核苷酸Scarless dT(100μM)启动反应,反应温度如图所示。反应如附图所示时间后,加入等体积的甲酰胺加样缓冲液(2×)终止反应。上样后进行变性聚病烯酰胺凝胶电泳(16%),随后将凝胶干燥并放射自显影。反应底物(Template)与引物(primer)序列顺序如下:
5'-GCG TAA TAC GAC TCA CTA TGG ACG 引物
CGC ATT ATG CTG AGT GAT ACC TGC AAT GTG CTT CTT CTG-5'底物AA(DNA底物)
电泳结果解析:从商业化的11种DNA聚合酶、10种逆转录酶及两种Taq突变体REAP475、REAP 442(Chen,F.,Gaucher,E.A.,Leal,N.A.,etal.Proc.Natl.Acad.Sci.USA.2010,107,1948-1953)中筛选获取了13高效延伸及有效终止(即~100%“延伸且只延伸一个”,即在胶图上显示~100%“N+1"条带)完全去疤可逆末端终止功能胸腺嘧啶核苷酸(Scarless dT)的酶。REAP 475最终被选为下一步多步“引物延伸-终止-读取-切除”可逆末端终止测序试验。
实施例4:多步“引物延伸-终止-读取-切除”可逆末端终止测序试验
本实验目的是通过进行多步引物延伸、终止、读取、切除实验来验证完全去疤可逆末端终止功能核苷酸及其酶的测序应用性。我们首先合成如下5’端带有氨基修饰的DNA序列(包括底物及引物),然后通过点样的办法将其固定到醛基修饰的基片上(图13)。具体遵循如下步骤操作:
(i)引物延伸:向上述基片上加入延伸反应混合液,包括REAP 475(50μg/ml)、四种不同碱基带有不同颜色荧光的可完全去疤可逆末端终止功能核苷酸(scarless dT-BODIPY576/589,scarless dC–Cy3.5,scarless dA-Cy 5,scarless dG–Cy3;浓度均为50μM)、1xThermopol buffer(New EngalndBiolabs,MA),72℃反应15min开始进行引物聚合延伸。
(ii)延伸终止:用去离子水洗涤基片,清除延伸反应混合液,终止引物延伸反应。
(iii)碱基读取:CCD拍照,通过荧光颜色来判定所延伸的碱基的种类。
(iv)切除连接臂及与其相连的荧光基团:先向基片上加入50mM NaIO4溶液,25℃反应5min,去离子水洗涤基片;然后向基片加入500mM吗啉溶液(pH 9),55℃反应20min,去离子水洗涤基片。
(v)重复步骤i-iv。
(vi)序列判读:利用图像分析软件,根据荧光与碱基种类的对应关系,对测序DNA模板进行序列判读。
(vii)结果评估:10次实验,测序准确率超过95%。
参考本申请的优选技术方案详细描述了本申请,然而,需要说明的是,在不脱离本申请的精神的情况下,本领域技术人员可在上述公开内容的基础上做出任何改造、修饰以及变动。本申请包括上述具体实施方案及其任何等同形式。
Claims (10)
1.一种可完全去疤的可逆末端终止功能核苷酸,其由含有C-C糖苷键的核苷酸、连接碱基与荧光基团的邻二醇基可切割连接臂和荧光基团三部分构成。
2.根据权利要求1所述的可完全去疤的可逆末端终止功能核苷酸,其中所述含有C-C糖苷键的核苷酸中的核苷酸为选自由dATP、dTTP、dGTP和dCTP组成的组中的至少之一。
3.根据权利要求1或2所述的可完全去疤的可逆末端终止功能核苷酸,其中所述邻二醇基可切割连接臂具有如下所述的结构式:
-(CH2)m(CHOH)2(CH2)n-
其中m和n分别为1至5的整数。
4.根据权利要求1或2所述的可完全去疤的可逆末端终止功能核苷酸,其中所述邻二醇基可切割连接臂与所述荧光基团通过下述基团之一进行连接:NH-CO、CO-NH、CO-NH-NH、NH-NH-CO、NH-CO-NH或CO-NH-NH-CO。
5.根据权利要求1或2所述的可完全去疤的可逆末端终止功能核苷酸,其中所述荧光基团选自由Cy3、Cy5、Cy5.5、Cy7、FITC、Alexa 488、Alexa 568、JOE、ROX、罗丹明6G、四甲基罗丹明、丽丝胺、德克萨斯红、BODIPY 576/589、BODIPY 630/650和BODIPY 650/665组成的组的至少之一。
6.根据权利要求1或2所述的可完全去疤的可逆末端终止功能核苷酸,其具有下式所示的化学结构式之一:
7.根据权利要求1至6任一项所述的可完全去疤的可逆末端终止功能核苷酸在在基因测序技术中的应用。
8.根据权利要求7所述的应用,其中所述基因测序为高通量测序。
9.根据权利要求7或8所述的应用,其包括下述具体步骤:
1)测序DNA模板及引物的固定;
2)引物延伸;
3)延伸终止;
4)碱基读取;
5)切除连接臂及与其相连的荧光基团:先加入NaIO4溶液切断邻二醇基连接臂去除荧光基团,然后加入胺类催化剂将剩余的丙醛基完全去除;
6)重复步骤2-5;
7)序列判读。
10.根据权利要求9所述的应用,其中步骤5)所述的胺类催化剂为选自氨基乙酸、吗啉和吡咯烷的至少一种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611161033.XA CN106674283A (zh) | 2016-12-15 | 2016-12-15 | 可完全去疤的可逆末端终止功能核苷酸及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611161033.XA CN106674283A (zh) | 2016-12-15 | 2016-12-15 | 可完全去疤的可逆末端终止功能核苷酸及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106674283A true CN106674283A (zh) | 2017-05-17 |
Family
ID=58868168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611161033.XA Pending CN106674283A (zh) | 2016-12-15 | 2016-12-15 | 可完全去疤的可逆末端终止功能核苷酸及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106674283A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110387226A (zh) * | 2018-04-20 | 2019-10-29 | 天津大学 | 一种用于检测肿瘤的荧光探针及用途 |
WO2020094040A1 (zh) * | 2018-11-06 | 2020-05-14 | 南京金斯瑞生物科技有限公司 | 一种基于芯片引物表面萃取的基因高通量合成方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104292117A (zh) * | 2013-07-15 | 2015-01-21 | 上海交通大学 | 酸敏感连接单元的合成及其在dna测序中的用途 |
US8946397B1 (en) * | 2011-04-04 | 2015-02-03 | Steven A. Benner | Tagged nucleosides that leave no scar upon cleavage |
-
2016
- 2016-12-15 CN CN201611161033.XA patent/CN106674283A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8946397B1 (en) * | 2011-04-04 | 2015-02-03 | Steven A. Benner | Tagged nucleosides that leave no scar upon cleavage |
CN104292117A (zh) * | 2013-07-15 | 2015-01-21 | 上海交通大学 | 酸敏感连接单元的合成及其在dna测序中的用途 |
Non-Patent Citations (1)
Title |
---|
姜玉等: "用于DNA合成测序的可断裂连接单元研究现状", 《化学进展》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110387226A (zh) * | 2018-04-20 | 2019-10-29 | 天津大学 | 一种用于检测肿瘤的荧光探针及用途 |
WO2020094040A1 (zh) * | 2018-11-06 | 2020-05-14 | 南京金斯瑞生物科技有限公司 | 一种基于芯片引物表面萃取的基因高通量合成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7137595B2 (ja) | 化学組成物とそれを利用する方法 | |
US20220112552A1 (en) | Design and synthesis of cleavable fluorescent nucleotides as reversible terminators for dna sequencing by synthesis | |
AU2018259202B2 (en) | Compositions and methods for improving sample identification in indexed nucleic acid libraries | |
JP2023071981A (ja) | 酵素不要及び増幅不要の配列決定 | |
CN102648295B (zh) | 用于多重基因分型的多样品索引 | |
EP3129505B1 (en) | Methods for clonal replication and amplification of nucleic acid molecules for genomic and therapeutic applications | |
CN110709089A (zh) | 用于连接荧光标记与用于dna合成测序的碱基的具有不同可裂解连接子的3’-o-改性的核苷酸类似物 | |
EP1842923B1 (en) | Methanesulfonylaminoindole derivatives and labeled oligonucleotide probes containing them | |
JP2007530048A (ja) | 標的ポリヌクレオチドを検出するためのコード化反応およびデコード反応 | |
JP7203276B2 (ja) | メチル化されたdnaの標的領域に基づいてシーケンシングライブラリーを構築する方法及びキット | |
CN101605743A (zh) | 用于产生报告分子的点击化学 | |
WO2006073504A2 (en) | Wobble sequencing | |
WO2015058086A1 (en) | Methods for copy number determination | |
JP2010213709A (ja) | 不連続プライマ−伸長による核酸反復配列の長さ決定 | |
EP1975254A1 (en) | Method of detecting nucleotide sequence with an intramolecular probe | |
CN116323974A (zh) | 多路复用covid-19锁式测定 | |
JP2023526062A (ja) | 組換え末端デオキシヌクレオチジルトランスフェラーゼを使用して修飾塩基を有する核酸の生成 | |
EP3485034B1 (en) | System and method for transposase-mediated amplicon sequencing | |
JP2008535518A (ja) | プソイドイソシトシン核酸塩基誘導体を含む3’改変オリゴヌクレオチド、およびプライマーまたはプローブとしてのその適用 | |
WO2024174850A1 (zh) | 核酸分子的测序方法 | |
CN106674283A (zh) | 可完全去疤的可逆末端终止功能核苷酸及其应用 | |
JP2002514909A (ja) | ハイブリダイゼーション特異性を増強するための組成物および方法 | |
EP3947659A1 (en) | Sequencing by synthesis with energy transfer dye pairs | |
JP2003502013A (ja) | モルホリノ−ヌクレオチドの製造方法、並びに核酸配列の分析およびラベリングのためのその使用 | |
CN103667469A (zh) | 一种基于万能碱基的dna测序方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170517 |
|
WD01 | Invention patent application deemed withdrawn after publication |