CN115197290A - 用于测序的核苷酸类似物 - Google Patents
用于测序的核苷酸类似物 Download PDFInfo
- Publication number
- CN115197290A CN115197290A CN202210404723.2A CN202210404723A CN115197290A CN 115197290 A CN115197290 A CN 115197290A CN 202210404723 A CN202210404723 A CN 202210404723A CN 115197290 A CN115197290 A CN 115197290A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- compound
- nucleotide
- salt
- detectable label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 219
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 49
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 173
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 170
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 170
- 150000001875 compounds Chemical class 0.000 claims description 170
- 239000002773 nucleotide Substances 0.000 claims description 158
- 230000002441 reversible effect Effects 0.000 claims description 118
- 230000000903 blocking effect Effects 0.000 claims description 116
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 claims description 115
- 150000003839 salts Chemical class 0.000 claims description 97
- 229910052760 oxygen Inorganic materials 0.000 claims description 88
- 102000040430 polynucleotide Human genes 0.000 claims description 78
- 108091033319 polynucleotide Proteins 0.000 claims description 78
- 239000002157 polynucleotide Substances 0.000 claims description 78
- 229910052717 sulfur Inorganic materials 0.000 claims description 77
- 238000000034 method Methods 0.000 claims description 63
- 238000003776 cleavage reaction Methods 0.000 claims description 52
- 230000007017 scission Effects 0.000 claims description 52
- 230000000295 complement effect Effects 0.000 claims description 49
- 238000006116 polymerization reaction Methods 0.000 claims description 48
- 238000006243 chemical reaction Methods 0.000 claims description 45
- 239000003153 chemical reaction reagent Substances 0.000 claims description 43
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 claims description 37
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 claims description 32
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 32
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 32
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 32
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 32
- 239000012071 phase Substances 0.000 claims description 29
- 239000000243 solution Substances 0.000 claims description 26
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 23
- 125000003277 amino group Chemical group 0.000 claims description 21
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 claims description 16
- 229930024421 Adenine Natural products 0.000 claims description 16
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 16
- 229960000643 adenine Drugs 0.000 claims description 16
- 229940104302 cytosine Drugs 0.000 claims description 16
- 238000010348 incorporation Methods 0.000 claims description 16
- 229940113082 thymine Drugs 0.000 claims description 16
- 229940035893 uracil Drugs 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 14
- 108020004635 Complementary DNA Proteins 0.000 claims description 11
- 239000007850 fluorescent dye Substances 0.000 claims description 11
- 102100034343 Integrase Human genes 0.000 claims description 10
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 10
- 239000000203 mixture Substances 0.000 claims description 10
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 claims description 8
- 102100029764 DNA-directed DNA/RNA polymerase mu Human genes 0.000 claims description 8
- 239000007790 solid phase Substances 0.000 claims description 8
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 6
- 108091023037 Aptamer Proteins 0.000 claims description 5
- 239000007853 buffer solution Substances 0.000 claims description 5
- 239000003795 chemical substances by application Substances 0.000 claims description 5
- 238000000137 annealing Methods 0.000 claims description 4
- 230000000977 initiatory effect Effects 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims description 4
- 238000001668 nucleic acid synthesis Methods 0.000 claims description 4
- 238000005406 washing Methods 0.000 claims description 4
- 108010025905 Cystine-Knot Miniproteins Proteins 0.000 claims description 2
- 108091008108 affimer Proteins 0.000 claims description 2
- 238000007481 next generation sequencing Methods 0.000 abstract description 8
- 125000005647 linker group Chemical group 0.000 description 92
- 238000003786 synthesis reaction Methods 0.000 description 91
- 230000015572 biosynthetic process Effects 0.000 description 90
- 239000002585 base Substances 0.000 description 81
- 238000005481 NMR spectroscopy Methods 0.000 description 67
- SXAMGRAIZSSWIH-UHFFFAOYSA-N 2-[3-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]-1,2,4-oxadiazol-5-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1=NOC(=N1)CC(=O)N1CC2=C(CC1)NN=N2 SXAMGRAIZSSWIH-UHFFFAOYSA-N 0.000 description 51
- 125000000753 cycloalkyl group Chemical group 0.000 description 35
- 238000001308 synthesis method Methods 0.000 description 35
- 239000000975 dye Substances 0.000 description 34
- 125000005913 (C3-C6) cycloalkyl group Chemical group 0.000 description 33
- 239000000047 product Substances 0.000 description 32
- 239000007787 solid Substances 0.000 description 28
- -1 Nucleoside triphosphate Chemical class 0.000 description 25
- 239000000758 substrate Substances 0.000 description 25
- 239000002777 nucleoside Substances 0.000 description 24
- 238000004128 high performance liquid chromatography Methods 0.000 description 22
- 150000003833 nucleoside derivatives Chemical class 0.000 description 21
- 108020004414 DNA Proteins 0.000 description 19
- 239000002253 acid Substances 0.000 description 14
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 14
- 125000003545 alkoxy group Chemical group 0.000 description 13
- 125000006239 protecting group Chemical group 0.000 description 12
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 description 10
- 241001103592 Okeanos Species 0.000 description 10
- 125000004044 trifluoroacetyl group Chemical group FC(C(=O)*)(F)F 0.000 description 10
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 10
- 125000004191 (C1-C6) alkoxy group Chemical group 0.000 description 9
- 230000008878 coupling Effects 0.000 description 9
- 238000010168 coupling process Methods 0.000 description 9
- 238000005859 coupling reaction Methods 0.000 description 9
- 238000003756 stirring Methods 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 8
- 125000000217 alkyl group Chemical group 0.000 description 8
- 238000012165 high-throughput sequencing Methods 0.000 description 8
- 238000009833 condensation Methods 0.000 description 7
- 230000005494 condensation Effects 0.000 description 7
- 125000002346 iodo group Chemical group I* 0.000 description 7
- IAZDPXIOMUYVGZ-WFGJKAKNSA-N Dimethyl sulfoxide Chemical compound [2H]C([2H])([2H])S(=O)C([2H])([2H])[2H] IAZDPXIOMUYVGZ-WFGJKAKNSA-N 0.000 description 6
- 238000005915 ammonolysis reaction Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 239000007795 chemical reaction product Substances 0.000 description 6
- 239000002077 nanosphere Substances 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- 238000002953 preparative HPLC Methods 0.000 description 6
- FPGGTKZVZWFYPV-UHFFFAOYSA-M tetrabutylammonium fluoride Chemical compound [F-].CCCC[N+](CCCC)(CCCC)CCCC FPGGTKZVZWFYPV-UHFFFAOYSA-M 0.000 description 6
- 229940048102 triphosphoric acid Drugs 0.000 description 6
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 5
- WEVYAHXRMPXWCK-UHFFFAOYSA-N acetonitrile Substances CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 5
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 5
- 238000011068 loading method Methods 0.000 description 5
- 238000010791 quenching Methods 0.000 description 5
- 239000001226 triphosphate Substances 0.000 description 5
- VHYFNPMBLIVWCW-UHFFFAOYSA-N 4-Dimethylaminopyridine Chemical compound CN(C)C1=CC=NC=C1 VHYFNPMBLIVWCW-UHFFFAOYSA-N 0.000 description 4
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 4
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 4
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 229920006395 saturated elastomer Polymers 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 102100036912 Desmin Human genes 0.000 description 3
- 108010044052 Desmin Proteins 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 description 3
- 125000004432 carbon atom Chemical group C* 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 210000005045 desmin Anatomy 0.000 description 3
- 125000001072 heteroaryl group Chemical group 0.000 description 3
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 3
- 230000000379 polymerizing effect Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- HWCKGOZZJDHMNC-UHFFFAOYSA-M tetraethylammonium bromide Chemical compound [Br-].CC[N+](CC)(CC)CC HWCKGOZZJDHMNC-UHFFFAOYSA-M 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 125000002264 triphosphate group Chemical group [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- FTNJQNQLEGKTGD-UHFFFAOYSA-N 1,3-benzodioxole Chemical compound C1=CC=C2OCOC2=C1 FTNJQNQLEGKTGD-UHFFFAOYSA-N 0.000 description 2
- 238000005160 1H NMR spectroscopy Methods 0.000 description 2
- YJLUBHOZZTYQIP-UHFFFAOYSA-N 2-[5-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]-1,3,4-oxadiazol-2-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1=NN=C(O1)CC(=O)N1CC2=C(CC1)NN=N2 YJLUBHOZZTYQIP-UHFFFAOYSA-N 0.000 description 2
- 238000004679 31P NMR spectroscopy Methods 0.000 description 2
- 229960000549 4-dimethylaminophenol Drugs 0.000 description 2
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 2
- PAYRUJLWNCNPSJ-UHFFFAOYSA-N Aniline Chemical compound NC1=CC=CC=C1 PAYRUJLWNCNPSJ-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 101100074187 Caenorhabditis elegans lag-1 gene Proteins 0.000 description 2
- 101100510615 Caenorhabditis elegans lag-2 gene Proteins 0.000 description 2
- 239000004215 Carbon black (E152) Substances 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 2
- 150000008052 alkyl sulfonates Chemical class 0.000 description 2
- 238000010976 amide bond formation reaction Methods 0.000 description 2
- 235000011114 ammonium hydroxide Nutrition 0.000 description 2
- 125000003710 aryl alkyl group Chemical group 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 125000005228 aryl sulfonate group Chemical group 0.000 description 2
- 230000031709 bromination Effects 0.000 description 2
- 238000005893 bromination reaction Methods 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 125000000623 heterocyclic group Chemical group 0.000 description 2
- 229930195733 hydrocarbon Natural products 0.000 description 2
- 150000002430 hydrocarbons Chemical group 0.000 description 2
- 239000007791 liquid phase Substances 0.000 description 2
- 150000007524 organic acids Chemical class 0.000 description 2
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 2
- XHXFXVLFKHQFAL-UHFFFAOYSA-N phosphoryl trichloride Chemical compound ClP(Cl)(Cl)=O XHXFXVLFKHQFAL-UHFFFAOYSA-N 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- BBEAQIROQSPTKN-UHFFFAOYSA-N pyrene Chemical compound C1=CC=C2C=CC3=CC=CC4=CC=C1C2=C43 BBEAQIROQSPTKN-UHFFFAOYSA-N 0.000 description 2
- 150000003254 radicals Chemical group 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 125000001424 substituent group Chemical group 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 125000006552 (C3-C8) cycloalkyl group Chemical group 0.000 description 1
- 125000001399 1,2,3-triazolyl group Chemical group N1N=NC(=C1)* 0.000 description 1
- DXBHBZVCASKNBY-UHFFFAOYSA-N 1,2-Benz(a)anthracene Chemical compound C1=CC=C2C3=CC4=CC=CC=C4C=C3C=CC2=C1 DXBHBZVCASKNBY-UHFFFAOYSA-N 0.000 description 1
- KZEVSDGEBAJOTK-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[5-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]-1,3,4-oxadiazol-2-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CC=1OC(=NN=1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O KZEVSDGEBAJOTK-UHFFFAOYSA-N 0.000 description 1
- UFBJCMHMOXMLKC-UHFFFAOYSA-N 2,4-dinitrophenol Chemical compound OC1=CC=C([N+]([O-])=O)C=C1[N+]([O-])=O UFBJCMHMOXMLKC-UHFFFAOYSA-N 0.000 description 1
- PMKKIDFHWBBGDA-UHFFFAOYSA-N 2-(2,5-dioxopyrrol-1-yl)ethyl methanesulfonate Chemical compound CS(=O)(=O)OCCN1C(=O)C=CC1=O PMKKIDFHWBBGDA-UHFFFAOYSA-N 0.000 description 1
- NGPFHPADAGAUDR-UHFFFAOYSA-N 2-[2-(2-aminoethoxy)ethoxy]acetic acid;hydrochloride Chemical group Cl.NCCOCCOCC(O)=O NGPFHPADAGAUDR-UHFFFAOYSA-N 0.000 description 1
- RUVRGYVESPRHSZ-UHFFFAOYSA-N 2-[2-(2-azaniumylethoxy)ethoxy]acetate Chemical compound NCCOCCOCC(O)=O RUVRGYVESPRHSZ-UHFFFAOYSA-N 0.000 description 1
- VWVRASTUFJRTHW-UHFFFAOYSA-N 2-[3-(azetidin-3-yloxy)-4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]pyrazol-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound O=C(CN1C=C(C(OC2CNC2)=N1)C1=CN=C(NC2CC3=C(C2)C=CC=C3)N=C1)N1CCC2=C(C1)N=NN2 VWVRASTUFJRTHW-UHFFFAOYSA-N 0.000 description 1
- WWSJZGAPAVMETJ-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]-3-ethoxypyrazol-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C=1C(=NN(C=1)CC(=O)N1CC2=C(CC1)NN=N2)OCC WWSJZGAPAVMETJ-UHFFFAOYSA-N 0.000 description 1
- CGMMPMYKMDITEA-UHFFFAOYSA-N 2-ethylbenzoic acid Chemical compound CCC1=CC=CC=C1C(O)=O CGMMPMYKMDITEA-UHFFFAOYSA-N 0.000 description 1
- KPGXRSRHYNQIFN-UHFFFAOYSA-N 2-oxoglutaric acid Chemical class OC(=O)CCC(=O)C(O)=O KPGXRSRHYNQIFN-UHFFFAOYSA-N 0.000 description 1
- GOLORTLGFDVFDW-UHFFFAOYSA-N 3-(1h-benzimidazol-2-yl)-7-(diethylamino)chromen-2-one Chemical compound C1=CC=C2NC(C3=CC4=CC=C(C=C4OC3=O)N(CC)CC)=NC2=C1 GOLORTLGFDVFDW-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-M Bicarbonate Chemical class OC([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-M 0.000 description 1
- 125000000041 C6-C10 aryl group Chemical group 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 108020004998 Chloroplast DNA Proteins 0.000 description 1
- RDFLLVCQYHQOBU-GPGGJFNDSA-O Cyanin Natural products O([C@H]1[C@H](O)[C@H](O)[C@H](O)[C@H](CO)O1)c1c(-c2cc(O)c(O)cc2)[o+]c2c(c(O[C@H]3[C@H](O)[C@@H](O)[C@H](O)[C@H](CO)O3)cc(O)c2)c1 RDFLLVCQYHQOBU-GPGGJFNDSA-O 0.000 description 1
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- CPELXLSAUQHCOX-UHFFFAOYSA-N Hydrogen bromide Chemical class Br CPELXLSAUQHCOX-UHFFFAOYSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- AFVFQIVMOAPDHO-UHFFFAOYSA-M Methanesulfonate Chemical compound CS([O-])(=O)=O AFVFQIVMOAPDHO-UHFFFAOYSA-M 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- MINKKZWNDUUPHC-UHFFFAOYSA-N NC1=CC=CC(=C1N=[N+]=[N-])C(=O)O Chemical group NC1=CC=CC(=C1N=[N+]=[N-])C(=O)O MINKKZWNDUUPHC-UHFFFAOYSA-N 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-N Propionic acid Chemical class CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- DLLXAZJTLIUPAI-XLPZGREQSA-N [[(2r,3s,5r)-5-(2-amino-4-oxo-1h-pyrrolo[2,3-d]pyrimidin-7-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2C=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 DLLXAZJTLIUPAI-XLPZGREQSA-N 0.000 description 1
- AZJLCKAEZFNJDI-DJLDLDEBSA-N [[(2r,3s,5r)-5-(4-aminopyrrolo[2,3-d]pyrimidin-7-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 AZJLCKAEZFNJDI-DJLDLDEBSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 150000001242 acetic acid derivatives Chemical class 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229940045714 alkyl sulfonate alkylating agent Drugs 0.000 description 1
- 238000003975 animal breeding Methods 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 125000003289 ascorbyl group Chemical class [H]O[C@@]([H])(C([H])([H])O*)[C@@]1([H])OC(=O)C(O*)=C1O* 0.000 description 1
- 229940077388 benzenesulfonate Drugs 0.000 description 1
- SRSXLGNVWSONIS-UHFFFAOYSA-M benzenesulfonate Chemical group [O-]S(=O)(=O)C1=CC=CC=C1 SRSXLGNVWSONIS-UHFFFAOYSA-M 0.000 description 1
- 125000003785 benzimidazolyl group Chemical group N1=C(NC2=C1C=CC=C2)* 0.000 description 1
- 125000000499 benzofuranyl group Chemical group O1C(=CC2=C1C=CC=C2)* 0.000 description 1
- 150000001558 benzoic acid derivatives Chemical class 0.000 description 1
- 125000004619 benzopyranyl group Chemical group O1C(C=CC2=C1C=CC=C2)* 0.000 description 1
- 125000004196 benzothienyl group Chemical group S1C(=CC2=C1C=CC=C2)* 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 150000001860 citric acid derivatives Chemical class 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- RDFLLVCQYHQOBU-ZOTFFYTFSA-O cyanin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC(C(=[O+]C1=CC(O)=C2)C=3C=C(O)C(O)=CC=3)=CC1=C2O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 RDFLLVCQYHQOBU-ZOTFFYTFSA-O 0.000 description 1
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 1
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 1
- 238000004163 cytometry Methods 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000012039 electrophile Substances 0.000 description 1
- 125000004185 ester group Chemical group 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- 238000005886 esterification reaction Methods 0.000 description 1
- CCIVGXIOQKPBKL-UHFFFAOYSA-M ethanesulfonate Chemical compound CCS([O-])(=O)=O CCIVGXIOQKPBKL-UHFFFAOYSA-M 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- GVEPBJHOBDJJJI-UHFFFAOYSA-N fluoranthrene Natural products C1=CC(C2=CC=CC=C22)=C3C2=CC=CC3=C1 GVEPBJHOBDJJJI-UHFFFAOYSA-N 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 150000004675 formic acid derivatives Chemical class 0.000 description 1
- VZCYOOQTPOCHFL-OWOJBTEDSA-L fumarate(2-) Chemical class [O-]C(=O)\C=C\C([O-])=O VZCYOOQTPOCHFL-OWOJBTEDSA-L 0.000 description 1
- 125000002541 furyl group Chemical group 0.000 description 1
- 125000004446 heteroarylalkyl group Chemical group 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- 125000004051 hexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 150000003840 hydrochlorides Chemical class 0.000 description 1
- XMBWDFGMSWQBCA-UHFFFAOYSA-N hydrogen iodide Chemical class I XMBWDFGMSWQBCA-UHFFFAOYSA-N 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 150000001261 hydroxy acids Chemical class 0.000 description 1
- 125000002883 imidazolyl group Chemical group 0.000 description 1
- 125000003453 indazolyl group Chemical group N1N=C(C2=C1C=CC=C2)* 0.000 description 1
- 125000001041 indolyl group Chemical group 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 1
- 125000004594 isoindolinyl group Chemical group C1(NCC2=CC=CC=C12)* 0.000 description 1
- 125000002183 isoquinolinyl group Chemical group C1(=NC=CC2=CC=CC=C12)* 0.000 description 1
- 125000001786 isothiazolyl group Chemical group 0.000 description 1
- 125000000842 isoxazolyl group Chemical group 0.000 description 1
- 150000002688 maleic acid derivatives Chemical class 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- WREDNSAXDZCLCP-UHFFFAOYSA-N methanedithioic acid Chemical compound SC=S WREDNSAXDZCLCP-UHFFFAOYSA-N 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000001280 n-hexyl group Chemical group C(CCCCC)* 0.000 description 1
- 125000000740 n-pentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000004123 n-propyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 150000002823 nitrates Chemical class 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 125000002971 oxazolyl group Chemical group 0.000 description 1
- 239000007800 oxidant agent Substances 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- WRMXOVHLRUVREB-UHFFFAOYSA-N phosphono phosphate;tributylazanium Chemical compound OP(O)(=O)OP([O-])([O-])=O.CCCC[NH+](CCCC)CCCC.CCCC[NH+](CCCC)CCCC WRMXOVHLRUVREB-UHFFFAOYSA-N 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 238000009609 prenatal screening Methods 0.000 description 1
- JKANAVGODYYCQF-UHFFFAOYSA-N prop-2-yn-1-amine Chemical compound NCC#C JKANAVGODYYCQF-UHFFFAOYSA-N 0.000 description 1
- 125000003373 pyrazinyl group Chemical group 0.000 description 1
- 125000003226 pyrazolyl group Chemical group 0.000 description 1
- 125000002098 pyridazinyl group Chemical group 0.000 description 1
- 125000004076 pyridyl group Chemical group 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 125000000168 pyrrolyl group Chemical group 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 125000002943 quinolinyl group Chemical group N1=C(C=CC2=CC=CC=C12)* 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 239000002924 silencing RNA Substances 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 150000003890 succinate salts Chemical class 0.000 description 1
- 125000000542 sulfonic acid group Chemical group 0.000 description 1
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 150000003892 tartrate salts Chemical class 0.000 description 1
- LMBFAGIMSUYTBN-MPZNNTNKSA-N teixobactin Chemical compound C([C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@H](CCC(N)=O)C(=O)N[C@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@H]1C(N[C@@H](C)C(=O)N[C@@H](C[C@@H]2NC(=N)NC2)C(=O)N[C@H](C(=O)O[C@H]1C)[C@@H](C)CC)=O)NC)C1=CC=CC=C1 LMBFAGIMSUYTBN-MPZNNTNKSA-N 0.000 description 1
- 125000001973 tert-pentyl group Chemical group [H]C([H])([H])C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 125000000335 thiazolyl group Chemical group 0.000 description 1
- 125000001544 thienyl group Chemical group 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- JOXIMZWYDAKGHI-UHFFFAOYSA-N toluene-4-sulfonic acid Chemical compound CC1=CC=C(S(O)(=O)=O)C=C1 JOXIMZWYDAKGHI-UHFFFAOYSA-N 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- WVLBCYQITXONBZ-UHFFFAOYSA-N trimethyl phosphate Chemical compound COP(=O)(OC)OC WVLBCYQITXONBZ-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/06—Pyrimidine radicals
- C07H19/10—Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H1/00—Processes for the preparation of sugar derivatives
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H17/00—Compounds containing heterocyclic radicals directly attached to hetero atoms of saccharide radicals
- C07H17/04—Heterocyclic radicals containing only oxygen as ring hetero atoms
- C07H17/08—Hetero rings containing eight or more ring members, e.g. erythromycins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/14—Pyrrolo-pyrimidine radicals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/16—Purine radicals
- C07H19/20—Purine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/04—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/10—Nucleotidyl transfering
- C12Q2521/101—DNA polymerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/10—Nucleotidyl transfering
- C12Q2521/107—RNA dependent DNA polymerase,(i.e. reverse transcriptase)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/10—Nucleotidyl transfering
- C12Q2521/131—Terminal transferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/186—Modifications characterised by incorporating a non-extendable or blocking moiety
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
- Plural Heterocyclic Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本发明涉及核酸测序领域。特别地,本发明提供了用于测序的核苷酸类似物,所述核苷酸类似物的碱基上或者糖环3’‑OH带有连接物,可用于NGS测序。本发明还涉及包含所述核苷酸类似物的试剂盒,以及基于所述核苷酸类似物的测序方法。
Description
技术领域
本发明涉及核酸测序领域。具体地,本发明涉及用于测序的核苷酸类似物。
背景技术
NGS测序的出现克服了Sanger测序成本高、测序时间长等缺点,极大地推动了基因测序技术的应用。目前,NGS测序已经在产前筛查、肿瘤诊断、肿瘤治疗、动植物育种等领域深度应用,带动了科技与医学的进步。
带有可逆阻断基团的核苷三磷酸(dNTP)类似物是NGS测序中关键原材料。由于可逆阻断基团的引入,使得dNTP中3’-OH基团可以保留,克服了Sanger测序中的缺点,同时保证了碱基识别的准确性。可以说带有可逆阻断基团的核苷三磷酸类似物(dNTP)是NGS测序中最为关键的技术。而NGS测序中带有可切断linker与可检测标记的核苷酸更是实现碱基检测的关键所在。
发明内容
本发明旨在开发一类在碱基上或者核苷酸糖环3’-OH带有可切断可检测标记的酯基、碳酸酯等dNTP类似物用于NGS测序。
第一类dNTP类似物的结构通式如图1所示,碱基带有可切断可检测标记的核苷酸,包括2’脱氧尿苷三磷酸、2’脱氧胞苷三磷酸、7-脱氮-2’脱氧腺苷三磷酸与7-脱氮--2’脱氧鸟苷三磷酸的主体结构。第一类dNTP类似物中,糖环3’-OH上连接有本领域常规使用的连接在3’-OH上效果优良的任意可逆阻断基团。第二类dNTP类似物的结构通式如图2所示,糖环3’-OH可逆阻断基团上带有可检测标记的核苷酸。
为此,在本发明的第一方面,本发明提供了式I或式II所示的化合物或其盐,
其中:
r1、r2、r3a、r3b、r4各自独立地选自1-6之间的任意整数;
M选自直接键、CH2、NH、O、S;
各X独立地选自O、S、NH;
Y选自直接键、O、S、NH;
各W独立地选自直接键、O、S、NH;
R1、R2、R3、R4、R5中,任意一个为其余各自独立地选自H、叠氮基、硝基、氨基、磺基、羧基、脂肪族烷基(如C1-C6烷基)、环烷基(如C3-C6环烷基)、芳香族烷基(如苯基-C1-C6烷基)、F、I、Br、Cl、烷氧基(如C1-C6烷氧基);
r5、r6、r7各自独立地选自1-6之间的任意整数;
r8、r9各自独立地选自0、1,且r8、r9不同时为0;
M1、M2、M3各自独立地选自直接键、NH、O、S;
Ra选自H、脂肪族烷基(如C1-C6烷基,例如Me、Et、iPr、tBu)、芳香族烷基(如苯基-C1-C6烷基)、环烷基(如C3-C6环烷基);
Rb、Rc中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu)、-ONH2、-OCORx、-OCONHRx,另一个选自H、脂肪族烷基(如C1-C6烷基,例如Me、Et、iPr、tBu)、芳香族烷基(如苯基-C1-C6烷基)、环烷基(如C3-C6环烷基),其中,各Rx独立地选自脂肪族烷基(如C1-C6烷基),环烷基(如C3-C6环烷基)或芳香族烷基(如苯基C1-C6烷基);
各Z独立地选自O,S,BH;
base1、base2各自独立地选自碱基、脱氮碱基或其互变异构体,例如腺嘌呤、7-脱氮腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体;
在一些实施方案中,r1选自1、2、3。
在一些实施方案中,r1为1。
在一些实施方案中,r2选自1、2、3。
在一些实施方案中,r2为1。
在一些实施方案中,r3a、r3b各自独立地选自1、2、3、4、5。
在一些实施方案中,r3a、r3b各自独立地选自1、2、3。
在一些实施方案中,r3a为1。
在一些实施方案中,r3b为2。
在一些实施方案中,r4选自1、2、3。
在一些实施方案中,r4为1。
在一些实施方案中,M选自CH2、O。
在一些实施方案中,各X独立地选自O、S。
在一些实施方案中,X为O。
在一些实施方案中,Y为直接键。
在一些实施方案中,W为直接键。
在一些实施方案中,r5选自1、2、3。
在一些实施方案中,r5为2。
在一些实施方案中,r6选自1、2、3。
在一些实施方案中,r6为1或2。
在一些实施方案中,r7选自1、2、3。
在一些实施方案中,r7为2。
在一些实施方案中,M1选自直接键、NH、O。
在一些实施方案中,M2为NH。
在一些实施方案中,M3选自直接键、NH。
在一些实施方案中,Ra选自H、C1-C6烷基。
在一些实施方案中,Ra为甲基。
在一些实施方案中,Rb、Rc中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基。
在一些实施方案中,Rb、Rc中,任意一个选自-N3、-SS-Me、-SS-Et,另一个为甲基。
在一些实施方案中,Rb、Rc中,任意一个选自-N3、-SS-Me,另一个为甲基。
在一些实施方案中,Z为O。
在本发明的第二方面,本发明提供了式I-1所示的化合物或其盐,
其中:
r1、r2、r3a、r3b各自独立地选自1-6之间的任意整数;
M选自直接键、CH2、NH、O、S;
X选自O、S、NH;
Y选自直接键、O、S、NH;
W选自直接键、O、S、NH;
R1、R2、R3、R4、R5中,任意一个(如R2、R3或R4)为其余各自独立地选自H、叠氮基、硝基、氨基、磺基、羧基、脂肪族烷基(如C1-C6烷基)、环烷基(如C3-C6环烷基)、芳香族烷基(如苯基-C1-C6烷基)、F、I、Br、Cl、烷氧基(如C1-C6烷氧基);
r5、r6各自独立地选自1-6之间的任意整数;
M1、M3各自独立地选自直接键、NH、O、S;
Rb、Rc中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu)、-ONH2、-OCORx、-OCONHRx,另一个选自H、脂肪族烷基(如C1-C6烷基,例如Me、Et、iPr、tBu)、芳香族烷基(如苯基-C1-C6烷基)、环烷基(如C3-C6环烷基),其中,各Rx独立地选自脂肪族烷基(如C1-C6烷基),环烷基(如C3-C6环烷基)或芳香族烷基(如苯基C1-C6烷基);
Z选自O,S,BH;
base1选自碱基、脱氮碱基或其互变异构体,例如腺嘌呤、7-脱氮腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体;
R’表示可逆阻断基团。
在一些实施方案中,r1选自1、2、3。
在一些实施方案中,r1为1。
在一些实施方案中,r2选自1、2、3。
在一些实施方案中,r2为1。
在一些实施方案中,r3a、r3b各自独立地选自1、2、3、4、5。
在一些实施方案中,r3a、r3b各自独立地选自1、2、3。
在一些实施方案中,r3a为1。
在一些实施方案中,r3b为2。
在一些实施方案中,M选自CH2、O。
在一些实施方案中,X选自O、S。
在一些实施方案中,X为O。
在一些实施方案中,Y为直接键。
在一些实施方案中,W为直接键。
在一些实施方案中,r5选自1、2、3。
在一些实施方案中,r5为2。
在一些实施方案中,r6选自1、2、3。
在一些实施方案中,r6为1或2。
在一些实施方案中,M1选自直接键、NH、O。
在一些实施方案中,M3选自直接键、NH。
在一些实施方案中,M1为NH、O或S时,M3为直接键,且M3为NH、O或S时,M1为直接键。
在一些实施方案中,Rb、Rc中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基。
在一些实施方案中,Rb、Rc中,任意一个选自-N3、-SS-Me,另一个为甲基。
在一些实施方案中,Z为O。
在本发明的第三方面,本发明提供了式I-2所示的化合物或其盐,
其中:
r1、r2、r3a、r3b各自独立地选自1-6之间的任意整数;
M选自直接键、CH2、NH、O、S;
X选自O、S、NH;
Y选自直接键、O、S、NH;
W选自直接键、O、S、NH;
R1、R2、R3、R4、R5中,任意一个(如R1或R5)为其余各自独立地选自H、叠氮基、硝基、氨基、磺基、羧基、脂肪族烷基(如C1-C6烷基)、环烷基(如C3-C6环烷基)、芳香族烷基(如苯基-C1-C6烷基)、F、I、Br、Cl、烷氧基(如C1-C6烷氧基);
r5、r6、r7各自独立地选自1-6之间的任意整数;
r8选自0、1,
M1选自直接键、NH、O、S;
Ra选自H、脂肪族烷基(如C1-C6烷基,例如Me、Et、iPr、tBu)、芳香族烷基(如苯基-C1-C6烷基)、环烷基(如C3-C6环烷基);
Z选自O,S,BH;
base1选自碱基、脱氮碱基或其互变异构体,例如腺嘌呤、7-脱氮腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体;
R’表示可逆阻断基团。
在一些实施方案中,r1选自1、2、3。
在一些实施方案中,r1为1。
在一些实施方案中,r2选自1、2、3。
在一些实施方案中,r2为1。
在一些实施方案中,r3a、r3b各自独立地选自1、2、3、4、5。
在一些实施方案中,r3a、r3b各自独立地选自1、2、3。
在一些实施方案中,r3a为1。
在一些实施方案中,r3b为2。
在一些实施方案中,M选自CH2、O。
在一些实施方案中,X选自O、S。
在一些实施方案中,X为O。
在一些实施方案中,Y为直接键。
在一些实施方案中,W为直接键。
在一些实施方案中,r5选自1、2、3。
在一些实施方案中,r5为2。
在一些实施方案中,r6选自1、2、3。
在一些实施方案中,r6为1。
在一些实施方案中,r7选自1、2、3。
在一些实施方案中,r7为2。
在一些实施方案中,M1为直接键。
在一些实施方案中,Ra选自C1-C6烷基。
在一些实施方案中,Ra为甲基。
在一些实施方案中,Z为O。
在本发明的第四方面,本发明提供了式II-1所示的化合物或其盐,
其中:
X选自O、S、NH;
W选自直接键、O、S、NH;
R1、R2、R3、R4、R5中,任意一个(如R3或R4)为其余各自独立地选自H、叠氮基、硝基、氨基、磺基、羧基、脂肪族烷基(如C1-C6烷基)、环烷基(如C3-C6环烷基)、芳香族烷基(如苯基-C1-C6烷基)、F、I、Br、Cl、烷氧基(如C1-C6烷氧基);
r5、r6各自独立地选自1-6之间的任意整数;
M1、M3各自独立地选自直接键、NH、O、S;
Rb、Rc中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu)、-ONH2、-OCORx、-OCONHRx,另一个选自H、脂肪族烷基(如C1-C6烷基,例如Me、Et、iPr、tBu)、芳香族烷基(如苯基-C1-C6烷基)、环烷基(如C3-C6环烷基),其中,各Rx独立地选自脂肪族烷基(如C1-C6烷基),环烷基(如C3-C6环烷基)或芳香族烷基(如苯基C1-C6烷基);
Z选自O,S,BH;
base2选自碱基、脱氮碱基或其互变异构体,例如腺嘌呤、7-脱氮腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体;
在一些实施方案中,X选自O、S。
在一些实施方案中,X为O。
在一些实施方案中,W为直接键。
在一些实施方案中,r5选自1、2、3。
在一些实施方案中,r5为2。
在一些实施方案中,r6选自1、2、3。
在一些实施方案中,r6选自1、2。
在一些实施方案中,M1选自直接键、NH、O。
在一些实施方案中,M3选自直接键、NH。
在一些实施方案中,Rb、Rc中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基。
在一些实施方案中,Rb、Rc中,任意一个为-N3或-SS-Me,另一个为甲基。
在一些实施方案中,Z为O。
在本发明的第五方面,本发明提供了式II-2所示的化合物或其盐,
其中:
X选自O、S、NH;
W选自直接键、O、S、NH;
R1、R2、R3、R4、R5中,任意一个(如R1或R5)为其余各自独立地选自H、叠氮基、硝基、氨基、磺基、羧基、脂肪族烷基(如C1-C6烷基)、环烷基(如C3-C6环烷基)、芳香族烷基(如苯基-C1-C6烷基)、F、I、Br、Cl、烷氧基(如C1-C6烷氧基);
r5、r6、r7选自1-6之间的任意整数;
r8选自0、1;
M1选自直接键、NH、O、S;
Ra选自H、脂肪族烷基(如C1-C6烷基,例如Me、Et、iPr、tBu)、芳香族烷基(如苯基-C1-C6烷基)、环烷基(如C3-C6环烷基);
Z选自O,S,BH;
base2选自碱基、脱氮碱基或其互变异构体,例如腺嘌呤、7-脱氮腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体;
在一些实施方案中,X选自O、S。
在一些实施方案中,X为O。
在一些实施方案中,W为直接键。
在一些实施方案中,r5选自1、2、3。
在一些实施方案中,r5为2。
在一些实施方案中,r6选自1、2、3。
在一些实施方案中,r6为1。
在一些实施方案中,r7选自1、2、3。
在一些实施方案中,r7为2。
在一些实施方案中,M1为直接键。
在一些实施方案中,Ra选自C1-C6烷基。
在一些实施方案中,Ra为甲基。
在一些实施方案中,Z为O。
在一些实施方案中,前述可逆阻断基团R’选自N3-C1-C6烷基、C1-C6烷基-SS-C1-C6烷基、NH2、-ONH2、-OCORz、-OCONHRz,其中,各Rz独立地选自脂肪族烷基(如C1-C6烷基),环烷基(如C3-C6环烷基)或芳香族烷基(如苯基C1-C6烷基)。
在一些实施方案中,R1’、R2’、R3’、R4’、R5’中,任意一个(如R1’或R5’)为其余各自独立地选自H、叠氮基、硝基、氨基、磺基、羧基、脂肪族烷基(如C1-C6烷基)、环烷基(如C3-C6环烷基)、芳香族烷基(如苯基-C1-C6烷基)、F、I、Br、Cl、烷氧基(如C1-C6烷氧基)。
在一些实施方案中,Rb’、Rc’中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu)、-ONH2、-OCORx、-OCONHRx,另一个选自H、脂肪族烷基(如C1-C6烷基,例如Me、Et、iPr、tBu)、芳香族烷基(如苯基-C1-C6烷基)、环烷基(如C3-C6环烷基),其中,各Rx独立地选自脂肪族烷基(如C1-C6烷基),环烷基(如C3-C6环烷基)或芳香族烷基(如苯基C1-C6烷基)。
在一些实施方案中,Rb’、Rc’中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基。
在一些实施方案中,Rb’、Rc’中,任意一个选自-N3、-SS-Me,另一个为甲基。
在本发明的第六方面,本发明还提供了式III所示的化合物或其盐,
其中:
r2选自1、2、3;
r3a选自1、2、3;
r3b选自0、1、2、3;
M选自直接键、O;
rm选自0、1、2、3;
r5选自1、2、3;
r6选自1、2、3;
r10选自1-10之间的任意整数;
r11选自1-6之间的任意整数;
M1选自NH、O;
M1选自NH、O;
M3选自直接键、NH;
Rb、Rc中,任意一个选自-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基;
各Z独立地选自O,S,BH;
base1选自碱基、脱氮碱基或其互变异构体,例如腺嘌呤、7-脱氮腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体;
式III中,R’表示可逆阻断基团。
在一些实施方案中,r2为1。
在一些实施方案中,r3a为1。
在一些实施方案中,r3b选自0、2。
在一些实施方案中,rm选自0、1。
在一些实施方案中,r5为2。
在一些实施方案中,r6为1或2。
在一些实施方案中,r10选自2-6之间的任意整数。
在一些实施方案中,r10为2或6。
在一些实施方案中,r11选自1、2、3。
在一些实施方案中,r11为1。
在一些实施方案中,Rb、Rc中,任意一个为-SS-Me,另一个为甲基。
在一些实施方案中,Z为O。
在一些实施方案中,所述可逆阻断基团R’为R1’、R2’、R3’、R4’、R5’中,任意一个(如R1’或R5’)为另一个(如R3’)选自H、C1-C6烷氧基(如甲氧基),其余为H;Rb’、Rc’中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基。
在一些实施方案中,Rb’、Rc’中,任意一个为-N3、-SS-Me,另一个为甲基。
在一些实施方案中,前述化合物选自以下表A:
表A:
在一些实施方案中,前述化合物或其盐携带额外的可检测标记。
在一些实施方案中,所述化合物或其盐携带的额外的可检测标记是通过亲和试剂(如抗体、适体、亲和物结蛋白)引入的,所述亲和试剂携带所述可检测标记,且所述亲和试剂可以特异性识别并结合所述化合物或其盐的表位。
在一些实施方案中,所述可检测标记与式I、式II、式I-1、式I-2、式II-1或式II-2所示化合物中的R或前述具体化合物中对应于R的结构部分连接。
在一些实施方案中,所述可检测标记与式III所示化合物中的R连接或前述具体化合物中对应于R的结构部分连接。
在一些实施方案中,base1不同,式I所示化合物携带的额外的可检测标记不同。
在一些实施方案中,base2不同,式II所示化合物携带的额外的可检测标记不同。
在一些实施方案中,所述可检测标记为荧光标记。
在一些实施方案中,所述可检测标记选自以下:iF700、
在一些实施方案中,前述化合物选自以下表B:
表B:
在本发明的第七方面,本发明提供了终止核酸合成的方法,其包括:将前述的化合物或其盐掺入待终止的核酸分子中。
在一些实施方案中,所述化合物或其盐的掺入通过末端转移酶、末端聚合酶或逆转录酶来实现。
在一些实施方案中,所述方法包括:使用聚合酶,将所述化合物或其盐掺入待终止的核酸分子中。
在一些实施方案中,所述方法包括:在允许聚合酶进行核苷酸聚合反应的条件下,使用聚合酶进行核苷酸聚合反应,从而将所述化合物或其盐掺入待终止的核酸分子的3'端。
在本发明的第八方面,本发明提供了制备在测序反应中与目标单链多核苷酸互补的生长的多核苷酸的方法,其包括将前述的化合物或其盐掺入所述生长的互补多核苷酸,其中,所述化合物或其盐的掺入防止了任何后续的核苷酸引入所述生长的互补多核苷酸中。
在一些实施方案中,所述化合物或其盐的掺入通过末端转移酶、末端聚合酶或逆转录酶来实现。
在一些实施方案中,所述方法包括:使用聚合酶,将所述化合物或其盐掺入所述生长的互补多核苷酸。
在一些实施方案中,所述方法包括:在允许聚合酶进行核苷酸聚合反应的条件下,使用聚合酶进行核苷酸聚合反应,从而将所述化合物或其盐掺入所述生长的互补多核苷酸的3'端。
在本发明的第九方面,本发明提供了核酸中间体,其是在测定目标单链多核苷酸的序列中形成的,其中,所述核酸中间体是通过以下步骤形成的:
向生长的核酸链中掺入一个与目标单链多核苷酸互补的核苷酸,形成所述核酸中间体,其中,掺入的一个互补核苷酸是前述的化合物或其盐。
在本发明的第十方面,本发明提供了核酸中间体,其是在测定目标单链多核苷酸的序列中形成的,其中,所述核酸中间体是通过以下步骤形成的:
向生长的核酸链中掺入一个与目标单链多核苷酸互补的核苷酸,形成所述核酸中间体,其中,掺入的一个互补核苷酸是前述的化合物或其盐,且所述生长的核酸链中预先掺入至少一个与目标单链多核苷酸互补的核苷酸,预先掺入的至少一个与目标单链多核苷酸互补的核苷酸是已被除去可逆阻断基团和任选的可检测标记的前述的化合物或其盐。
在本发明的第十一方面,本发明提供了测定目标单链多核苷酸的序列的方法,其包括:
1)监测生长的核酸链中与目标单链多核苷酸互补的核苷酸的掺入,其中,掺入的至少一个互补核苷酸是前述的化合物或其盐,以及,
2)确定掺入的核苷酸的类型。
在一些实施方案中,在引入下一个互补核苷酸之前,将所述可逆阻断基团和任选的可检测标记除去。
在一些实施方案中,所述可逆阻断基团和所述可检测标记被同时除去。
在一些实施方案中,所述可逆阻断基团和所述可检测标记被先后除去;例如,在所述可检测标记被除去之后,所述可逆阻断基团被除去,或者,在所述可逆阻断基团被除去之后,所述可检测标记被除去。
在一些实施方案中,所述测定目标单链多核苷酸的序列的方法包括以下步骤:
(a)提供多种不同的核苷酸,其中至少一种核苷酸是前述的化合物或其盐,任选地其余的核苷酸是前述的化合物或其盐;
(b)将所述多种不同的核苷酸掺入目标单链多核苷酸的互补序列中,其中,所述多种不同的核苷酸在检测时可以相互区分开;
(c)检测(b)的核苷酸,从而确定掺入的核苷酸的类型;
(d)除去(b)的核苷酸中的可逆阻断基团和任选的其携带的可检测标记;和
(e)任选地重复步骤(a)-(d)一次或多次;
从而确定所述目标单链多核苷酸的序列。
在一些实施方案中,所述测定目标单链多核苷酸的序列的方法包括以下步骤:
(1)提供第一核苷酸、第二核苷酸、第三核苷酸和第四核苷酸,四种核苷酸中的至少一种是前述的化合物或其盐,任选地其余的核苷酸是前述的化合物或其盐;
(2)将所述四种核苷酸与目标单链多核苷酸进行接触;除去未掺入生长的核酸链中的所述核苷酸;检测掺入生长的核酸链中的所述核苷酸;除去掺入生长的核酸链中的所述核苷酸中的所述可逆阻断基团和任选的其携带的所述可检测标记;
任选地,还包括(3):重复(1)-(2)一次或多次。
在一些实施方案中,所述测定目标单链多核苷酸的序列的方法包括以下步骤:
(a)提供包含双链体、包含至少一种前述的化合物或其盐的核苷酸、聚合酶和切除试剂的混合物;所述双链体包含生长的核酸链以及待测序的核酸链;
(b)进行包含以下步骤(i)、(ii)和(iii)的反应,任选地,重复一次或多次:
步骤(i):使用聚合酶,使所述化合物或其盐掺入生长的核酸链,形成包含可逆阻断基团和任选的可检测标记的核酸中间体:
步骤(ii):对所述核酸中间体进行检测;
步骤(iii):使用切除试剂将所述核酸中间体所包含的可逆阻断基团和任选的所述可检测标记切除。
在一些实施方案中,对所述可逆阻断基团的切除和对所述可检测标记的切除同时进行,或者,对所述可逆阻断基团的切除和对所述可检测标记的切除分步进行(例如,先切除所述可逆阻断基团,或者先切除所述可检测标记)。
在一些实施方案中,对所述可逆阻断基团的切除和对所述可检测标记的切除使用的切除试剂是同样的试剂。
在一些实施方案中,对所述可逆阻断基团的切除和对所述可检测标记的切除使用的切除试剂是不同的试剂。
在一些实施方案中,所述双链体连接于支持物上。
在一些实施方案中,所述生长的核酸链为引物。
在一些实施方案中,所述引物通过退火至待测序的核酸链上,形成所述双链体。
在一些实施方案中,所述双链体、所述化合物或其盐、以及所述聚合酶一起形成含有溶液相和固相的反应体系。
在一些实施方案中,在允许聚合酶进行核苷酸聚合反应的条件下,使用聚合酶,使所述化合物或其盐掺入生长的核酸链,形成包含可逆阻断基团和任选的可检测标记的核酸中间体。
在一些实施方案中,所述聚合酶选自KOD聚合酶或其突变体(例如KOD POL151、KODPOL157、KOD POL171、KOD POL174、KOD POL376、KOD POL391)。
在一些实施方案中,在任意一个检测所述核酸中间体的步骤前,移除前一步骤的反应体系的溶液相,保留连接于支持物上的双链体。
在一些实施方案中,所述切除试剂与所述双链体或所述生长的核酸链在含有溶液相和固相的反应体系中接触。
在一些实施方案中,所述切除试剂能够切除掺入生长的核酸链的化合物中的可逆阻断基团和任选的其携带的可检测标记,并且不会影响双链体骨架上的磷酸二酯键。
在一些实施方案中,在任意一个切除所述核酸中间体所包含的可逆阻断基团和任选的可检测标记的步骤后,移除这一步骤反应体系的溶液相。
在一些实施方案中,在任意一个包含移除操作的步骤之后,进行洗涤操作。
在一些实施方案中,步骤(ii)之后,进一步包括:根据步骤(ii)检测得到的信号,确定步骤(i)中掺入生长的核酸链的化合物的类型,并基于碱基互补配对原则,确定待测序的核酸链中相应位置处的核苷酸类型。
在本发明的第十二方面,本发明提供了试剂盒,其包含至少一个前述的化合物或其盐。
在一些实施方案中,所述试剂盒包含第一、第二、第三和第四化合物,所述第一、第二、第三和第四化合物各自独立地为前述的化合物或其盐。
在一些实施方案中,所述第一化合物中,base1选自腺嘌呤、7-脱氮腺嘌呤或其互变异构体(例如);所述第二化合物中,base1选自胸腺嘧啶、尿嘧啶或其互变异构体(例如);所述第三化合物中,base1选自胞嘧啶或其互变异构体(例如);所述第四化合物中,base1选自鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体(例如)。
在一些实施方案中,所述第一化合物中,base2选自腺嘌呤、7-脱氮腺嘌呤或其互变异构体(例如);所述第二化合物中,base2选自胸腺嘧啶、尿嘧啶或其互变异构体(例如);所述第三化合物中,base2选自胞嘧啶或其互变异构体(例如);所述第四化合物中,base2选自鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体(例如)。
在一些实施方案中,所述第一、第二、第三和第四化合物包含的base1或base2互不相同。
在一些实施方案中,所述第一、第二、第三和第四化合物携带的额外的可检测标记互不相同。
在一些实施方案中,所述试剂盒还包含:用于预处理核酸分子的试剂;用于连接待测序的核酸分子的支持物;用于将待测序的核酸分子与支持物连接(例如,共价或非共价连接)的试剂;用于起始核苷酸聚合反应的引物;用于进行核苷酸聚合反应的聚合酶;一种或多种缓冲溶液;一种或多种洗涤溶液;或其任何组合。
在本发明的第十三方面,本发明提供了前述的化合物或其盐或者前述的试剂盒用于测定目标单链多核苷酸的序列的用途。
另外,在本发明的第十四方面,本发明还提供了式I-1所示的化合物或其盐,
其中:
r1、r2、r3a、r3b各自独立地选自1-6之间的任意整数;
M选自直接键、CH2、NH、O、S;
X选自O、S、NH;
Y选自直接键、O、S、NH;
W选自直接键、O、S、NH;
R1、R2、R3、R4、R5中,任意一个(如R2、R3或R4)为其余各自独立地选自H、叠氮基、硝基、氨基、磺基、羧基、脂肪族烷基(如C1-C6烷基)、环烷基(如C3-C6环烷基)、芳香族烷基(如苯基-C1-C6烷基)、F、I、Br、Cl、烷氧基(如C1-C6烷氧基);
r5、r6各自独立地选自1-6之间的任意整数;
M1、M3各自独立地选自直接键、NH、O、S;
Rb、Rc中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu)、-ONH2、-OCORx、-OCONHRx,另一个选自H、脂肪族烷基(如C1-C6烷基,例如Me、Et、iPr、tBu)、芳香族烷基(如苯基-C1-C6烷基)、环烷基(如C3-C6环烷基),其中,各Rx独立地选自脂肪族烷基(如C1-C6烷基),环烷基(如C3-C6环烷基)或芳香族烷基(如苯基C1-C6烷基);
Z选自O,S,BH;
base1选自碱基、脱氮碱基或其互变异构体,例如腺嘌呤、7-脱氮腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体;
R’表示可逆阻断基团。
在一些实施方案中,r1选自1、2、3。
在一些实施方案中,r1为1。
在一些实施方案中,r2选自1、2、3。
在一些实施方案中,r2为1。
在一些实施方案中,r3a、r3b各自独立地选自1、2、3、4、5。
在一些实施方案中,r3a、r3b各自独立地选自1、2、3。
在一些实施方案中,r3a为1。
在一些实施方案中,r3b为2。
在一些实施方案中,M选自CH2、O。
在一些实施方案中,X选自O、S。
在一些实施方案中,X为O。
在一些实施方案中,Y为直接键。
在一些实施方案中,W为直接键。
在一些实施方案中,r5选自1、2、3。
在一些实施方案中,r5为2。
在一些实施方案中,r6选自1、2、3。
在一些实施方案中,r6为1或2。
在一些实施方案中,M1选自直接键、NH、O。
在一些实施方案中,M3选自直接键、NH。
在一些实施方案中,M1为NH、O或S时,M3为直接键,且M3为NH、O或S时,M1为直接键。
在一些实施方案中,Rb、Rc中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基。
在一些实施方案中,Rb、Rc中,任意一个选自-N3、-SS-Me,另一个为甲基。
在一些实施方案中,Z为O。
在一些具体实施方案中,式I-1所示的化合物中:
r1、r2、r3a、r3b各自独立地选自1-6之间的任意整数;
M选自直接键、CH2、NH、O、S;
X选自O、S、NH;
Y选自直接键、O、S、NH;
W选自直接键、O、S、NH;
r5、r6各自独立地选自1-6之间的任意整数;
M1、M3各自独立地选自直接键、NH、O、S;
Rb、Rc中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基;
Z选自O,S,BH;
base1选自碱基、脱氮碱基或其互变异构体,例如腺嘌呤、7-脱氮腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体;
R’表示可逆阻断基团。
在一些具体实施方案中,r1选自1、2、3。
在一些具体实施方案中,r1为1。
在一些具体实施方案中,r2选自1、2、3。
在一些具体实施方案中,r2为1。
在一些具体实施方案中,r3a、r3b各自独立地选自1、2、3、4、5。
在一些具体实施方案中,r3a、r3b各自独立地选自1、2、3。
在一些具体实施方案中,r3a为1。
在一些具体实施方案中,r3b为2。
在一些具体实施方案中,M选自CH2、O。
在一些具体实施方案中,X选自O、S。
在一些具体实施方案中,X为O。
在一些具体实施方案中,Y为直接键。
在一些具体实施方案中,W为直接键。
在一些具体实施方案中,r5选自1、2、3。
在一些具体实施方案中,r5为2。
在一些具体实施方案中,r6选自1、2、3。
在一些具体实施方案中,r6为1或2。
在一些具体实施方案中,M1选自直接键、NH、O。
在一些具体实施方案中,M3选自直接键、NH。
在一些具体实施方案中,M1为NH、O或S时,M3为直接键,且M3为NH、O或S时,M1为直接键。
在一些具体实施方案中,Rb、Rc中,任意一个选自-N3、-SS-Me,另一个为甲基。
在一些具体实施方案中,Z为O。
在一些实施方案中,前述可逆阻断基团R’选自N3-C1-C6烷基、C1-C6烷基-SS-C1-C6烷基、NH2、-ONH2、-OCORz、-OCONHRz,其中,各Rz独立地选自脂肪族烷基(如C1-C6烷基),环烷基(如C3-C6环烷基)或芳香族烷基(如苯基C1-C6烷基)。
在一些实施方案中,R1’、R2’、R3’、R4’、R5’中,任意一个(如R1’或R5’)为其余各自独立地选自H、叠氮基、硝基、氨基、磺基、羧基、脂肪族烷基(如C1-C6烷基)、环烷基(如C3-C6环烷基)、芳香族烷基(如苯基-C1-C6烷基)、F、I、Br、Cl、烷氧基(如C1-C6烷氧基)。
在一些实施方案中,Rb’、Rc’中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu)、-ONH2、-OCORx、-OCONHRx,另一个选自H、脂肪族烷基(如C1-C6烷基,例如Me、Et、iPr、tBu)、芳香族烷基(如苯基-C1-C6烷基)、环烷基(如C3-C6环烷基),其中,各Rx独立地选自脂肪族烷基(如C1-C6烷基),环烷基(如C3-C6环烷基)或芳香族烷基(如苯基C1-C6烷基)。
在一些实施方案中,Rb’、Rc’中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基。
在一些实施方案中,Rb’、Rc’中,任意一个选自-N3、-SS-Me,另一个为甲基。
在一些具体实施方案中,本发明提供了式I-1所示的化合物或其盐,
其中:
r1、r2、r3a、r3b各自独立地选自1-6之间的任意整数;
优选地,r1选自1、2、3;
更优选地,r1为1;
优选地,r2选自1、2、3;
更优选地,r2为1;
优选地,r3a、r3b各自独立地选自1、2、3、4、5;
更优选地,r3a、r3b各自独立地选自1、2、3;
最优选地,r3a为1;
最优选地,r3b为2;
M选自直接键、CH2、NH、O、S;
优选地,M选自CH2、O;
X选自O、S、NH;
优选地,X选自O、S;
更优选地,X为O;
Y选自直接键、O、S、NH;
优选地,Y为直接键;
W选自直接键、O、S、NH;
优选地,W为直接键;
r5、r6各自独立地选自1-6之间的任意整数;
优选地,r5选自1、2、3;
更优选地,r5为2;
优选地,r6选自1、2、3;
更优选地,r6为1或2;
M1、M3各自独立地选自直接键、NH、O、S;
优选地,M1选自直接键、NH、O;
优选地,M3选自直接键、NH;
更优选地,M1为NH、O或S时,M3为直接键,且M3为NH、O或S时,M1为直接键;
Rb、Rc中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基;
优选地,Rb、Rc中,任意一个选自-N3、-SS-Me,另一个为甲基;
Z选自O,S,BH;
优选地,Z为O;
base1选自碱基、脱氮碱基或其互变异构体,例如腺嘌呤、7-脱氮腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体;
R’表示可逆阻断基团。
Rb’、Rc’中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基,
优选地,Rb’、Rc’中,任意一个选自-N3、-SS-Me,另一个为甲基。
在一些实施方案中,前述化合物选自以下表C:
表C:
在一些实施方案中,前述化合物或其盐携带额外的可检测标记。
在一些实施方案中,所述化合物或其盐携带的额外的可检测标记是通过亲和试剂(如抗体、适体、亲和物、结蛋白)引入的,所述亲和试剂携带所述可检测标记,且所述亲和试剂可以特异性识别并结合所述化合物或其盐的表位。
在一些实施方案中,所述可检测标记与式I-1所示化合物中的R或前述具体化合物中对应于R的结构部分连接。
在一些实施方案中,base1不同,式I-1所示化合物携带的额外的可检测标记不同。
在一些实施方案中,所述可检测标记为荧光标记。
在一些实施方案中,所述可检测标记选自以下:iF700、
在一些实施方案中,所述可检测标记选自以下:iF700、
在一些实施方案中,前述化合物选自以下表D:
表D:
在本发明的第十五方面,本发明提供了终止核酸合成的方法,其包括:将前述的化合物或其盐掺入待终止的核酸分子中。
在一些实施方案中,所述化合物或其盐的掺入通过末端转移酶、末端聚合酶或逆转录酶来实现。
在一些实施方案中,所述方法包括:使用聚合酶,将所述化合物或其盐掺入待终止的核酸分子中。
在一些实施方案中,所述方法包括:在允许聚合酶进行核苷酸聚合反应的条件下,使用聚合酶进行核苷酸聚合反应,从而将所述化合物或其盐掺入待终止的核酸分子的3'端。
在本发明的第十六方面,本发明提供了制备在测序反应中与目标单链多核苷酸互补的生长的多核苷酸的方法,其包括将前述的化合物或其盐掺入所述生长的互补多核苷酸,其中,所述化合物或其盐的掺入防止了任何后续的核苷酸引入所述生长的互补多核苷酸中。
在一些实施方案中,所述化合物或其盐的掺入通过末端转移酶、末端聚合酶或逆转录酶来实现。
在一些实施方案中,所述方法包括:使用聚合酶,将所述化合物或其盐掺入所述生长的互补多核苷酸。
在一些实施方案中,所述方法包括:在允许聚合酶进行核苷酸聚合反应的条件下,使用聚合酶进行核苷酸聚合反应,从而将所述化合物或其盐掺入所述生长的互补多核苷酸的3'端。
在本发明的第十七方面,本发明提供了核酸中间体,其是在测定目标单链多核苷酸的序列中形成的,其中,所述核酸中间体是通过以下步骤形成的:
向生长的核酸链中掺入一个与目标单链多核苷酸互补的核苷酸,形成所述核酸中间体,其中,掺入的一个互补核苷酸是前述的化合物或其盐。
在本发明的第十八方面,本发明提供了核酸中间体,其是在测定目标单链多核苷酸的序列中形成的,其中,所述核酸中间体是通过以下步骤形成的:
向生长的核酸链中掺入一个与目标单链多核苷酸互补的核苷酸,形成所述核酸中间体,其中,掺入的一个互补核苷酸是前述的化合物或其盐,且所述生长的核酸链中预先掺入至少一个与目标单链多核苷酸互补的核苷酸,预先掺入的至少一个与目标单链多核苷酸互补的核苷酸是已被除去可逆阻断基团和任选的可检测标记的前述的化合物或其盐。
在本发明的第十九方面,本发明提供了测定目标单链多核苷酸的序列的方法,其包括:
1)监测生长的核酸链中与目标单链多核苷酸互补的核苷酸的掺入,其中,掺入的至少一个互补核苷酸是前述的化合物或其盐,以及,
2)确定掺入的核苷酸的类型。
在一些实施方案中,在引入下一个互补核苷酸之前,将所述可逆阻断基团和任选的可检测标记除去。
在一些实施方案中,所述可逆阻断基团和所述可检测标记被同时除去。
在一些实施方案中,所述可逆阻断基团和所述可检测标记被先后除去;例如,在所述可检测标记被除去之后,所述可逆阻断基团被除去,或者,在所述可逆阻断基团被除去之后,所述可检测标记被除去。
在一些实施方案中,所述测定目标单链多核苷酸的序列的方法包括以下步骤:
(a)提供多种不同的核苷酸,其中至少一种核苷酸是前述的化合物或其盐,任选地其余的核苷酸是前述的化合物或其盐;
(b)将所述多种不同的核苷酸掺入目标单链多核苷酸的互补序列中,其中,所述多种不同的核苷酸在检测时可以相互区分开;
(c)检测(b)的核苷酸,从而确定掺入的核苷酸的类型;
(d)除去(b)的核苷酸中的可逆阻断基团和任选的其携带的可检测标记;和
(e)任选地重复步骤(a)-(d)一次或多次;
从而确定所述目标单链多核苷酸的序列。
在一些实施方案中,所述测定目标单链多核苷酸的序列的方法包括以下步骤:
(1)提供第一核苷酸、第二核苷酸、第三核苷酸和第四核苷酸,四种核苷酸中的至少一种是前述的化合物或其盐,任选地其余的核苷酸是前述的化合物或其盐;
(2)将所述四种核苷酸与目标单链多核苷酸进行接触;除去未掺入生长的核酸链中的所述核苷酸;检测掺入生长的核酸链中的所述核苷酸;除去掺入生长的核酸链中的所述核苷酸中的所述可逆阻断基团和任选的其携带的所述可检测标记;
任选地,还包括(3):重复(1)-(2)一次或多次。
在一些实施方案中,所述测定目标单链多核苷酸的序列的方法包括以下步骤:
(a)提供包含双链体、包含至少一种前述的化合物或其盐的核苷酸、聚合酶和切除试剂的混合物;所述双链体包含生长的核酸链以及待测序的核酸链;
(b)进行包含以下步骤(i)、(ii)和(iii)的反应,任选地,重复一次或多次:
步骤(i):使用聚合酶,使所述化合物或其盐掺入生长的核酸链,形成包含可逆阻断基团和任选的可检测标记的核酸中间体:
步骤(ii):对所述核酸中间体进行检测;
步骤(iii):使用切除试剂将所述核酸中间体所包含的可逆阻断基团和任选的所述可检测标记切除。
在一些实施方案中,对所述可逆阻断基团的切除和对所述可检测标记的切除同时进行,或者,对所述可逆阻断基团的切除和对所述可检测标记的切除分步进行(例如,先切除所述可逆阻断基团,或者先切除所述可检测标记)。
在一些实施方案中,对所述可逆阻断基团的切除和对所述可检测标记的切除使用的切除试剂是同样的试剂。
在一些实施方案中,对所述可逆阻断基团的切除和对所述可检测标记的切除使用的切除试剂是不同的试剂。
在一些实施方案中,所述双链体连接于支持物上。
在一些实施方案中,所述生长的核酸链为引物。
在一些实施方案中,所述引物通过退火至待测序的核酸链上,形成所述双链体。
在一些实施方案中,所述双链体、所述化合物或其盐、以及所述聚合酶一起形成含有溶液相和固相的反应体系。
在一些实施方案中,在允许聚合酶进行核苷酸聚合反应的条件下,使用聚合酶,使所述化合物或其盐掺入生长的核酸链,形成包含可逆阻断基团和任选的可检测标记的核酸中间体。
在一些实施方案中,所述聚合酶选自KOD聚合酶或其突变体(例如KOD POL151、KODPOL157、KOD POL171、KOD POL174、KOD POL376、KOD POL391)。
在一些实施方案中,在任意一个检测所述核酸中间体的步骤前,移除前一步骤的反应体系的溶液相,保留连接于支持物上的双链体。
在一些实施方案中,所述切除试剂与所述双链体或所述生长的核酸链在含有溶液相和固相的反应体系中接触。
在一些实施方案中,所述切除试剂能够切除掺入生长的核酸链的化合物中的可逆阻断基团和任选的其携带的可检测标记,并且不会影响双链体骨架上的磷酸二酯键。
在一些实施方案中,在任意一个切除所述核酸中间体所包含的可逆阻断基团和任选的可检测标记的步骤后,移除这一步骤反应体系的溶液相。
在一些实施方案中,在任意一个包含移除操作的步骤之后,进行洗涤操作。
在一些实施方案中,步骤(ii)之后,进一步包括:根据步骤(ii)检测得到的信号,确定步骤(i)中掺入生长的核酸链的化合物的类型,并基于碱基互补配对原则,确定待测序的核酸链中相应位置处的核苷酸类型。
在本发明的第二十方面,本发明提供了试剂盒,其包含至少一个前述的化合物或其盐。
在一些实施方案中,所述试剂盒包含第一、第二、第三和第四化合物,所述第一、第二、第三和第四化合物各自独立地为前述的化合物或其盐。
在一些实施方案中,所述第一化合物中,base1选自腺嘌呤、7-脱氮腺嘌呤或其互变异构体(例如);所述第二化合物中,base1选自胸腺嘧啶、尿嘧啶或其互变异构体(例如);所述第三化合物中,base1选自胞嘧啶或其互变异构体(例如);所述第四化合物中,base1选自鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体(例如)。
在一些实施方案中,所述第一、第二、第三和第四化合物包含的base1互不相同。
在一些实施方案中,所述第一、第二、第三和第四化合物携带的额外的可检测标记互不相同。
在一些实施方案中,所述试剂盒还包含:用于预处理核酸分子的试剂;用于连接待测序的核酸分子的支持物;用于将待测序的核酸分子与支持物连接(例如,共价或非共价连接)的试剂;用于起始核苷酸聚合反应的引物;用于进行核苷酸聚合反应的聚合酶;一种或多种缓冲溶液;一种或多种洗涤溶液;或其任何组合。
在本发明的第二十一方面,本发明提供了前述的化合物或其盐或者前述的试剂盒用于测定目标单链多核苷酸的序列的用途。
另外,在本发明的第二十二方面,本发明还进一步提供了一种核苷酸类似物,其由核糖或脱氧核糖、可逆阻断基团、碱基或脱氮碱基或其互变异构体、用于连接可检测标记的连接子和任选的磷酸基团形成,其中,所述连接子包含如下式A或式A’所示的结构:
其中:
Rb、Rc中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu)、-ONH2、-OCORx、-OCONHRx、-S-SO2Rx,另一个选自H、脂肪族烷基(如C1-C6烷基,例如Me、Et、iPr、tBu)、芳香族烷基(如苯基-C1-C6烷基)、环烷基(如C3-C6环烷基),其中,各Rx独立地选自脂肪族烷基(如C1-C6烷基),环烷基(如C3-C6环烷基)或芳香族烷基(如苯基C1-C6烷基);
优选地,Rb、Rc中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基;
更优选地,Rb、Rc中,任意一个选自-N3、-SS-Me、-SS-Et,另一个为甲基;
最优选地,Rb、Rc中,任意一个选自-N3、-SS-Me,另一个为甲基;
Ra选自H、脂肪族烷基(如C1-C6烷基,例如Me、Et、iPr、tBu)、芳香族烷基(如苯基-C1-C6烷基)、环烷基(如C3-C6环烷基);
优选地,Ra选自H、C1-C6烷基;
更优选地,Ra为甲基;
X选自O、S、NH;
优选地,X选自O、S;
更优选地,X为O;
M1选自直接键、NH、O、S、CH2;
优选地,M1选自直接键、NH、O;
优选地,所述可逆阻断基团与所述核糖或脱氧核糖的3’-OH相连,所述碱基或脱氮碱基或其互变异构体与所述核糖或脱氧核糖的1’-C相连,所述任选的磷酸基团与所述核糖或脱氧核糖的5’-OH相连,所述连接子与所述碱基或脱氮碱基或其互变异构体相连。
在一些实施方案中,式A所示的结构如式A-1、式A-2、式A-3、式A-4或式A-5所示,优选如式A-1、式A-2或式A-5所示;或者,式A’所示的结构如式A’-1、式A’-2或式A’-3所示,优选如式A’-1所示;
其中:
Ra、Rb、Rc、X、M1的定义如前所述。
在一些实施方案中,式A所示的结构选自以下:
在一些实施方案中,所述核苷酸类似物具有如下式B所示的结构:
Lx具有前述的式A、式A’、式A-1、式A-2、式A-3、式A-4、式A-5、式A’-1、式A’-2或式A’-3所示的结构式,且Lx的M1端或S端与Lb相连,Lx的O端与La相连;
base1表示碱基或脱氮碱基或其互变异构体;
R’表示可逆阻断基团;
R0表示H或磷酸基团;
La表示所述连接子中用于连接碱基或脱氮碱基或其互变异构体的部分;
Lb表示所述连接子中用于连接可检测标记的部分。
在一些实施方案中,所述核苷酸类似物具有如下式B所示的结构:
其中:
Lx具有如前所述的式A、式A’、式A-1、式A-2、式A-3、式A-4、式A-5、式A’-1、式A’-2或式A’-3所示的结构式,且Lx的M1端或S端与Lb相连,Lx的O端与La相连;
或者优选地,La选自:
或者更优选地,La选自:
或者进一步优选地,La选自:
或者最优选地,La选自:
r1、r2、r3a、r3b、r4各自独立地选自1-6之间的任意整数;
优选地,r1选自1、2、3;
更优选地,r1为1;
优选地,r2选自1、2、3;
更优选地,r2为1;
优选地,r3a、r3b各自独立地选自0、1、2、3、4、5,且r3a、r3b不同时为0;
更优选地,r3a、r3b各自独立地选自0、1、2、3,且r3a、r3b不同时为0;
进一步优选地,r3a选自0、1,r3b选自0、2,且r3a、r3b不同时为0;
最优选地,r3a为1;
最优选地,r3b为2;
优选地,r4选自1、2、3;
更优选地,r4为1;
M选自直接键、CH2、NH、O、S;
优选地,M选自直接键、CH2、O;
更优选地,M选自CH2、O;
最优选地,Lb选自:
rm选自0-6之间的任意整数;
优选地,rm选自0、1、2、3;
更优选地,rm选自0、1;
r5、r6、r7各自独立地选自1-6之间的任意整数;
优选地,r5选自1、2、3;
更优选地,r5为2;
优选地,r6选自1、2、3;
更优选地,r6为1或2;
优选地,r7选自1、2、3;
更优选地,r7为2;
r10选自1-10之间的任意整数;
优选地,r10选自2-6之间的任意整数;
更优选地,r10为2或6;
r11选自1-6之间的任意整数;
优选地,r11选自1、2、3;
更优选地,r11为1;
M1、M2、M3各自独立地选自直接键、NH、O、S、CH2;
优选地,M1选自直接键、NH、O;
优选地,M2为NH;
优选地,M3选自直接键、NH;
base1表示碱基或脱氮碱基;
R’表示可逆阻断基团;
R0表示H或磷酸基团。
在一些实施方案中,所述base1选自腺嘌呤、7-脱氮腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体;
各Z独立地选自O,S,BH;
优选地,Z为O。
在一些实施方案中,所述可逆阻断基团R’选自N3-C1-C6烷基、C1-C6烷基-SS-C1-C6烷基、NH2、-ONH2、-OCORz、-OCONHRz,其中,各Rz独立地选自脂肪族烷基(如C1-C6烷基),环烷基(如C3-C6环烷基)或芳香族烷基(如苯基C1-C6烷基);
R1’、R2’、R3’、R4’、R5’中,任意一个(如R1’或R5’)为其余各自独立地选自H、叠氮基、硝基、氨基、磺基、羧基、脂肪族烷基(如C1-C6烷基)、环烷基(如C3-C6环烷基)、芳香族烷基(如苯基-C1-C6烷基)、F、I、Br、Cl、烷氧基(如C1-C6烷氧基),
Rb’、Rc’中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu)、-ONH2、-OCORx、-OCONHRx,另一个选自H、脂肪族烷基(如C1-C6烷基,例如Me、Et、iPr、tBu)、芳香族烷基(如苯基-C1-C6烷基)、环烷基(如C3-C6环烷基),其中,各Rx独立地选自脂肪族烷基(如C1-C6烷基),环烷基(如C3-C6环烷基)或芳香族烷基(如苯基C1-C6烷基),
优选地,Rb’、Rc’中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基,
更优选地,Rb’、Rc’中,任意一个选自-N3、-SS-Me,另一个为甲基。
在一些实施方案中,所述的核苷酸类似物选自前述表A、表C中的化合物。
在一些实施方案中,所述核苷酸类似物携带额外的可检测标记,且所述可检测标记与连接子(优选Lb)连接;
优选地,所述核苷酸类似物携带的额外的可检测标记是通过亲和试剂(如抗体、适体、亲和物、结蛋白)引入的,所述亲和试剂携带所述可检测标记,且所述亲和试剂可以特异性识别并结合所述核苷酸类似物的表位;优选地,所述可检测标记与所述Lb的末端氨基连接;
优选地,所述可检测标记中的羧基与所述Lb的末端氨基通过形成酰胺键进行连接;
优选地,base1不同,所述核苷酸类似物携带的额外的可检测标记不同;
优选地,所述可检测标记为荧光标记;
优选地,所述可检测标记选自以下:iF700、
在一些实施方案中,所述核苷酸类似物选自前述表B、表D中的化合物。
在本发明的第二十三方面,本发明提供了终止核酸合成的方法,其包括:将前述的核苷酸类似物掺入待终止的核酸分子中;
优选地,所述核苷酸类似物的掺入通过末端转移酶、末端聚合酶或逆转录酶来实现;
优选地,所述方法包括:使用聚合酶,将所述核苷酸类似物掺入待终止的核酸分子中;
优选地,所述方法包括:在允许聚合酶进行核苷酸聚合反应的条件下,使用聚合酶进行核苷酸聚合反应,从而将所述核苷酸类似物掺入待终止的核酸分子的3'端。
在本发明的第二十四方面,本发明提供了制备在测序反应中与目标单链多核苷酸互补的生长的多核苷酸的方法,其包括将前述的核苷酸类似物掺入所述生长的互补多核苷酸,其中,所述核苷酸类似物的掺入防止了任何后续的核苷酸引入所述生长的互补多核苷酸中;
优选地,所述核苷酸类似物的掺入通过末端转移酶、末端聚合酶或逆转录酶来实现;
优选地,所述方法包括:使用聚合酶,将所述核苷酸类似物掺入所述生长的互补多核苷酸;
优选地,所述方法包括:在允许聚合酶进行核苷酸聚合反应的条件下,使用聚合酶进行核苷酸聚合反应,从而将所述核苷酸类似物掺入所述生长的互补多核苷酸的3'端。
在本发明的第二十五方面,本发明提供了核酸中间体,其是在测定目标单链多核苷酸的序列中形成的,其中,
所述核酸中间体是通过以下步骤形成的:
向生长的核酸链中掺入一个与目标单链多核苷酸互补的核苷酸,形成所述核酸中间体,其中,掺入的一个互补核苷酸是前述的核苷酸类似物;
或者,所述核酸中间体是通过以下步骤形成的:
向生长的核酸链中掺入一个与目标单链多核苷酸互补的核苷酸,形成所述核酸中间体,其中,掺入的一个互补核苷酸是前述的核苷酸类似物,且所述生长的核酸链中预先掺入至少一个与目标单链多核苷酸互补的核苷酸,预先掺入的至少一个与目标单链多核苷酸互补的核苷酸是已被除去可逆阻断基团和任选的可检测标记的前述的核苷酸类似物。
在本发明的第二十六方面,本发明提供了测定目标单链多核苷酸的序列的方法,其包括:
1)监测生长的核酸链中与目标单链多核苷酸互补的核苷酸的掺入,其中,掺入的至少一个互补核苷酸是前述的核苷酸类似物,以及,
2)确定掺入的核苷酸的类型;
优选地,在引入下一个互补核苷酸之前,将所述可逆阻断基团和任选的可检测标记除去;
优选地,所述可逆阻断基团和所述可检测标记被同时除去;
优选地,所述可逆阻断基团和所述可检测标记被先后除去;例如,在所述可检测标记被除去之后,所述可逆阻断基团被除去,或者,在所述可逆阻断基团被除去之后,所述可检测标记被除去。
在一些实施方案中,所述方法包括以下步骤:
(a)提供多种不同的核苷酸,其中至少一种核苷酸是前述的核苷酸类似物,任选地其余的核苷酸是前述的核苷酸类似物;
(b)将所述多种不同的核苷酸掺入目标单链多核苷酸的互补序列中,其中,所述多种不同的核苷酸在检测时可以相互区分开;
(c)检测(b)的核苷酸,从而确定掺入的核苷酸的类型;
(d)除去(b)的核苷酸中的可逆阻断基团和任选的其携带的可检测标记;和
(e)任选地重复步骤(a)-(d)一次或多次;
从而确定所述目标单链多核苷酸的序列。
在一些实施方案中,所述方法包括以下步骤:
(1)提供第一核苷酸、第二核苷酸、第三核苷酸和第四核苷酸,四种核苷酸中的至少一种是前述的核苷酸类似物,任选地其余的核苷酸是前述的核苷酸类似物;
(2)将所述四种核苷酸与目标单链多核苷酸进行接触;除去未掺入生长的核酸链中的所述核苷酸;检测掺入生长的核酸链中的所述核苷酸;除去掺入生长的核酸链中的所述核苷酸中的所述可逆阻断基团和任选的其携带的所述可检测标记;
任选地,还包括(3):重复(1)-(2)一次或多次。
在一些实施方案中,所述方法包括以下步骤:
(a)提供包含双链体、包含至少一种前述的核苷酸类似物的核苷酸、聚合酶和切除试剂的混合物;所述双链体包含生长的核酸链以及待测序的核酸链;
(b)进行包含以下步骤(i)、(ii)和(iii)的反应,任选地,重复一次或多次:
步骤(i):使用聚合酶,使所述核苷酸类似物掺入生长的核酸链,形成包含可逆阻断基团和任选的可检测标记的核酸中间体:
步骤(ii):对所述核酸中间体进行检测;
步骤(iii):使用切除试剂将所述核酸中间体所包含的可逆阻断基团和任选的可检测标记切除;
优选地,对所述可逆阻断基团的切除和对所述可检测标记的切除同时进行,或者,对所述可逆阻断基团的切除和对所述可检测标记的切除分步进行(例如,先切除所述可逆阻断基团,或者先切除所述可检测标记);
优选地,对所述可逆阻断基团的切除和对所述可检测标记的切除使用的切除试剂是同样的试剂;
优选地,对所述可逆阻断基团的切除和对所述可检测标记的切除使用的切除试剂是不同的试剂。
在一些实施方案中,所述双链体连接于支持物上;
优选地,所述生长的核酸链为引物;
优选地,所述引物通过退火至待测序的核酸链上,形成所述双链体;
优选地,所述双链体、所述核苷酸类似物、以及所述聚合酶一起形成含有溶液相和固相的反应体系;
优选地,在允许聚合酶进行核苷酸聚合反应的条件下,使用聚合酶,使所述核苷酸类似物掺入生长的核酸链,形成包含可逆阻断基团和任选的可检测标记的核酸中间体;
优选地,所述聚合酶选自KOD聚合酶或其突变体(例如KOD POL151、KOD POL157、KOD POL171、KOD POL174、KOD POL376、KOD POL391);
优选地,在任意一个检测所述核酸中间体的步骤前,移除前一步骤的反应体系的溶液相,保留连接于支持物上的双链体;
优选地,所述切除试剂与所述双链体或所述生长的核酸链在含有溶液相和固相的反应体系中接触;
优选地,所述切除试剂能够切除掺入生长的核酸链的核苷酸类似物中的可逆阻断基团和任选的其携带的可检测标记,并且不会影响双链体骨架上的磷酸二酯键;
优选地,在任意一个切除所述核酸中间体所包含的可逆阻断基团和任选的可检测标记的步骤后,移除这一步骤反应体系的溶液相;
优选地,在任意一个包含移除操作的步骤之后,进行洗涤操作;
优选地,步骤(ii)之后,进一步包括:根据步骤(ii)检测得到的信号,确定步骤(i)中掺入生长的核酸链的核苷酸类似物的类型,并基于碱基互补配对原则,确定待测序的核酸链中相应位置处的核苷酸类型。
在本发明的第二十七方面,本发明提供了试剂盒,其包含至少一个前述的核苷酸类似物;
优选地,所述试剂盒包含第一、第二、第三和第四化合物,所述第一、第二、第三和第四化合物各自独立地为前述的核苷酸类似物;
优选地,所述第一化合物中,base1选自腺嘌呤、7-脱氮腺嘌呤或其互变异构体(例如);所述第二化合物中,base1选自胸腺嘧啶、尿嘧啶或其互变异构体(例如);所述第三化合物中,base1选自胞嘧啶或其互变异构体(例如);所述第四化合物中,base1选自鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体(例如);
优选地,所述第一、第二、第三和第四化合物包含的base1互不相同;
优选地,所述第一、第二、第三和第四化合物携带的额外的可检测标记互不相同。
在一些实施方案中,所述试剂盒还包含:用于预处理核酸分子的试剂;用于连接待测序的核酸分子的支持物;用于将待测序的核酸分子与支持物连接(例如,共价或非共价连接)的试剂;用于起始核苷酸聚合反应的引物;用于进行核苷酸聚合反应的聚合酶;一种或多种缓冲溶液;一种或多种洗涤溶液;或其任何组合。
在本发明的第二十八方面,本发明提供了前述的核苷酸类似物或者前述的试剂盒用于测定目标单链多核苷酸的序列的用途。
附图说明
图1表示本发明实施例的碱基带有可切断(荧光)标记核苷酸类似物;
图2表示本发明实施例的3’-OH可逆阻断基团带有(荧光)标记核苷酸类似物。
具体实施方式
下面通过具体实施例详细描述本发明的实施方式,但是无论如何它们不能解释为对本发明的限制。
除非特殊说明,上述基团和取代基具有药物化学领域的普通含义。
在本说明书的各部分,本发明公开化合物的取代基按照基团种类或范围公开。特别指出,本发明包括这些基团种类和范围的各个成员的每一个独立的次级组合。例如,术语“C1-C6烷基”特别指独立公开的甲基、乙基、C3烷基、C4烷基、C5烷基和C6烷基。
另外,需要说明的是,除非以其他方式明确指出,在本文中通篇采用的描述方式“各…独立地为/选自”和“…各自独立地为/选自”可以互换,均应做广义理解,其既可以是指在不同基团中,相同或不同的符号之间所表达的具体选项之间互相不影响,也可以表示在相同的基团中,相同或不同的符号之间所表达的具体选项之间互相不影响。
术语“脂肪族烷基”指的是任意的含有1-20个碳原子的直链或支链饱和基团,例如,C1-C12烷基,优选C1-C6烷基。
术语“C1-C6烷基”指的是任意的含有1-6个碳原子的直链或支链饱和基团,例如甲基(Me)、乙基(Et)、正丙基、异丙基(iPr)、正丁基、异丁基、叔丁基(tBu)、仲丁基、正戊基、叔戊基、正己基等。
术语“烷氧基”指的是任意上述烷基(例如C1-C6烷基等),其通过氧原子(-O-)连接到分子的其余部分。
术语“环烷基”是指具有饱和环的3-10元单环系统的烃,例如,C3-C8环烷基,优选C3-C6环烷基。
术语“C3-C6环烷基”是指具有饱和环的3-6元单环系统的烃,C3-C6环烷基可以为环丙基、环丁基、环戊基、环己基等。
术语“芳香族烷基”指的是芳基烷基或杂芳基烷基,其中烷基如上文所定义。
术语“杂芳基”是指芳族的杂环,通常为具有1至3个选自N、O或S的杂原子的5-、6-、7-、8-元的杂环;杂芳基环可以任选地进一步稠合或连接于芳族和非芳族的碳环和杂环。所述杂芳基的非限制性的实例为例如吡啶基、吡嗪基、嘧啶基、哒嗪基、吲哚基、咪唑基、噻唑基、异噻唑基、噻噁唑基、吡咯基、苯基-吡咯基、呋喃基、苯基-呋喃基、噁唑基、异噁唑基、吡唑基、噻吩基、苯并呋喃基、苯并噻吩基、苯并1,3-二氧戊环(苯并二噁茂)、异二氢吲哚基、苯并咪唑基、吲唑基、喹啉基、异喹啉基、1,2,3-三唑基、1-苯基-1,2,3-三唑基、2,3-二氢吲哚基、2,3-二氢苯并呋喃基、2,3-二氢苯并噻吩基、苯并吡喃基、2,3-二氢苯并噁嗪基、2,3-二氢喹喔啉基等。
术语“芳基”指的是具有6-14个碳原子的碳环芳族体系的基团,例如C6-C10芳基,优选苯基。
从所有上述描述中,对本领域技术人员显而易见的是,其名称是复合名称的任意基团,例如“苯基C1-C6烷基”,应该指的是常规地从其衍生的部分例如从被苯基取代的C1-C6烷基来构建,其中C1-C6烷基如上文所定义。
如本文所使用,术语“式I、式I-1、式I-2、式II、式II-1、式II-2、式III所示的化合物的盐”的例子是由形成阴离子的有机酸形成的有机酸加合盐,包括但不限于甲酸盐、乙酸盐、丙酸盐、苯甲酸盐、马来酸盐、富马酸盐、琥珀酸盐、酒石酸盐、柠檬酸盐、抗坏血酸盐、α-酮戊二酸盐、α-甘油磷酸盐、烷基磺酸盐或芳基磺酸盐;优选地,所述烷基磺酸盐为甲基磺酸盐或乙基磺酸盐;所述芳基磺酸盐为苯磺酸盐或对甲苯磺酸盐。也可形成合适的无机盐,包括但不限于盐酸盐、氢溴酸盐、氢碘酸盐、硝酸盐、碳酸氢盐和碳酸盐、硫酸盐或磷酸盐等。
本发明中,所述可检测标记与中的末端氨基连接,其包含以下两种情况:1)当r8不为0时,“末端氨基”指的是该结构式最末尾的氨基;2)当r8为0时,该结构式变为M2可以为NH,此时,可以理解的是,“末端氨基”指的是该变更后的结构式最末尾的氨基。
在本发明的方法中,只要是由生长的核酸链和待测序的核酸链这两条链组成的物质,均称其为“双链体”,与生长的核酸链或待测序的核酸链的链长无关,待测序的核酸链可以比生长的核酸链的链长更长。
在本发明的方法中,待测序的核酸分子可以是任何目的核酸分子。在某些优选的实施方案中,所述待测序的核酸分子包含脱氧核糖核苷酸、核糖核苷酸、经修饰的脱氧核糖核苷酸、经修饰的核糖核苷酸、或其任何组合。在本发明的方法中,待测序的核酸分子不受其类型的限制。在某些优选的实施方案中,所述待测序的核酸分子为DNA或RNA。在某些优选的实施方案中,所述待测序的核酸分子可以为基因组DNA,线粒体DNA,叶绿体DNA,mRNA,cDNA,miRNA,或siRNA。在某些优选的实施方案中,所述待测序的核酸分子为线性的或者环状的。在某些优选的实施方案中,所述待测序的核酸分子为双链的或者单链的。例如,所述待测序的核酸分子可以为单链DNA(ssDNA),双链DNA(dsDNA),单链RNA(ssRNA),双链RNA(dsRNA),或者DNA和RNA的杂合体。在某些优选的实施方案中,所述待测序的核酸分子为单链DNA。在某些优选的实施方案中,所述待测序的核酸分子为双链DNA。
在本发明的方法中,待测序的核酸分子不受其来源的限制。在某些优选的实施方案中,待测序的核酸分子可以获自任何来源,例如,任何细胞、组织或生物体(例如,病毒,细菌,真菌,植物和动物)。在某些优选的实施方案中,待测序的核酸分子源自哺乳动物(例如,人、非人灵长类动物、啮齿类动物或犬科动物)、植物、鸟类、爬行类、鱼类、真菌、细菌或病毒。
从细胞、组织或生物体中提取或获得核酸分子的方法是本领域技术人员公知的。合适的方法包括但不限于乙醇沉淀法,氯仿抽提法等。关于此类方法的详细描述可参见例如,J.Sambrook等人,分子克隆:实验室手册,第2版,冷泉港实验室出版社,1989,以及F.M.Ausubel等人,精编分子生物学实验指南,第3版,John Wiley&Sons,Inc.,1995。另外,还可使用各种商业化的试剂盒来从各种来源(例如细胞、组织或生物体)提取核酸分子。
在本发明的方法中,待测序的核酸分子不受其长度的限制。在某些优选的实施方案中,待测序的核酸分子的长度可以为至少10bp,至少20bp,至少30bp,至少40bp,至少50bp,至少100bp,至少200bp,至少300bp,至少400bp,至少500bp,至少1000bp,或者至少2000bp。在某些优选的实施方案中,待测序的核酸分子的长度可以为10-20bp,20-30bp,30-40bp,40-50bp,50-100bp,100-200bp,200-300bp,300-400bp,400-500bp,500-1000bp,1000-2000bp,或者超过2000bp。在某些优选的实施方案中,待测序的核酸分子可具有10-1000bp的长度,以利于进行高通量测序。
在本发明的制备多核苷酸的方法或测序方法中,可使用合适的聚合酶来进行核苷酸聚合反应。在一些示例性实施方案中,所述聚合酶能够以DNA为模板合成新的DNA链(例如DNA聚合酶)。在一些示例性实施方案中,所述聚合酶能够以RNA为模板合成新的DNA链(例如反转录酶)。在一些示例性实施方案中,所述聚合酶能够以DNA或RNA为模板合成新的RNA链(例如RNA聚合酶)。因此,在某些优选的实施方案中,所述聚合酶选自DNA聚合酶,RNA聚合酶,和反转录酶。可根据实际需要,选择合适的聚合酶来进行核苷酸聚合反应。在某些优选的实施方案中,所述聚合反应为聚合酶链式反应(PCR)。在某些优选的实施方案中,所述聚合反应为反转录反应。
在本发明的方法中,可以使用KOD聚合酶或其突变体进行核苷酸聚合反应。KOD聚合酶或其突变体(例如KOD POL151、KOD POL157、KOD POL171、KOD POL174、KOD POL376、KODPOL391)对本发明的修饰的核苷或核苷酸具有可接受的聚合效率。KOD POL391和KODPOL171对本发明的修饰的核苷酸的具有可接受的聚合效率。在某些实施方案中,KODPOL391或KOD POL171对本发明的修饰的核苷酸的聚合效率在70%以上,例如70%-80%、80%-90%或90%-100%。
在本发明的制备多核苷酸的方法或测序方法中,核苷酸的聚合反应在适宜的条件下进行。适宜的聚合条件包括溶液相的组成以及各成分的浓度、溶液相的pH、聚合温度等。在适宜的条件下进行聚合,有利于获得可接受的、甚至高的聚合效率。
在本发明的一些实施方案中,式I、式II、式III、式B所示化合物中,脱氧核糖3'位置处的羟基(-OH)受保护(被R’所保护),因此,它们能够终止聚合酶(例如DNA聚合酶)的聚合作用。例如,当式I、式II、式III、式B所示化合物被引入生长的核酸链的3'端时,由于该化合物的脱氧核糖的3'位置处不存在游离的羟基(-OH),聚合酶将无法继续进行下一轮的聚合反应,从而聚合反应将被终止。在这种情况下,在每一轮的聚合反应中,将有且只有一个碱基被掺入生长的核酸链。
此外,所述式I、式II、式III、式B所示化合物的脱氧核糖3'位置处羟基(-OH)的保护基团(R’)能够被去除,并转变为游离的羟基(-OH)。随后,可使用聚合酶和式I、式II、式III、式B所示化合物对生长的核酸链进行下一轮的聚合反应,并再次引入一个碱基。
因此,所述式I、式II、式III、式B所示化合物的脱氧核糖3'位置处羟基(-OH)可以被可逆阻断:当式I、式II、式III、式B所示化合物被掺入生长的核酸链的3'端时,它们将终止聚合酶继续进行聚合作用,终止生长的核酸链的进一步延伸;并且,在式I、式II、式III、式B所示化合物所包含的阻断基团被去除后,聚合酶将能够继续对生长的核酸链进行聚合作用,继续延伸核酸链。
本文描述的某些实施方案涉及常规可检测标记的使用。可通过任何适合的方法进行检测,包括荧光光谱学或其他光学手段。优选的标记为荧光标记即荧光团,该荧光团在吸收能量后发出限定波长的辐射。已知许多种适合的荧光标记。例如,Welch等人(Chem.Eur.J.5(3):951-960,1999)公开了丹酰基-功能化的荧光部分,其可在本发明中使用。Zhu等人(Cytometry28:206-211,1997)描述了荧光标记Cy3和Cy5的使用,其也可以在本发明中使用。Prober等人(Science238:336-341,1987)、Connell等人(BioTechniques5(4):342-384,1987)、Ansorge等人(Nucl.AcidsRes.15(11):4593-4602,1987)和Smith等人(Nature321:674,1986)也公开了适合使用的标记。其他可商业购得的荧光标记包括但不限于iF700、荧光素、若丹明(包括TMR、德克萨斯红和Rox)、alexa、氟硼荧、吖啶、香豆素、芘、苯并蒽和花青苷。特别说明的是,iF700是本领域常规使用的荧光标记,例如参见US20180223358A1的Table 7,该荧光标记可以市购获得。
本申请中也可以使用多重标记,例如双荧光团FRET盒(Tet.Let.46:8867-8871,2000)、也可以使用多荧光体树枝状系统(J.Am.Chem.Soc.123:8101-8108,2001)。虽然优选荧光标记,对于本领域的普通技术人员来说其他形式的可检测标记也明显适用。例如微颗粒,包括量子点(Empodocles等人,Nature 399:126-130,1999)、金纳米颗粒(Reichert等人,Anal.Chem.72:6025-6029,2000)和微珠(Lacoste等人,Proc.Natl.Acad.Sci USA 97(17):9461-9466,2000)也都可以使用。
本申请也可以使用多组分标记。多组分标记是依赖于与用于检测的另外化合物的相互作用的标记。在生物学中最常用的多组分标记是生物素-链霉亲和素系统。生物素用作与核苷酸或修饰的核苷酸相连接的标记。然后单独加入链霉亲和素使检测发生。可以使用其他多组分系统。例如,二硝基苯酚具有可商业购得的可用于检测的荧光抗体。
在本文描述的某些实施方案中,可以通过亲和试剂(如抗体、适体、亲和物Affimer、结蛋白Knottin)的引入使得修饰的核苷酸或核苷分子携带上文描述的可检测标记,所述亲和试剂可以特异性识别并结合所述修饰的核苷酸或核苷分子的表位,具体原理详见WO2018129214A1。WO2018129214A1中的全部相关内容引入本申请中。
在本文描述的另外一些实施方案中,可以将修饰的核苷酸或核苷分子与上文描述的可检测标记相连接。在某些这类实施方案中,所用的连接基团可裂解。使用可裂解的连接基团确保了在需要时所述标记能够在检测后被除去,这避免了与随后并入的任何标记的核苷酸或核苷的任何干扰信号。
可通过任何适合的方法裂解所述连接基团,包括暴露于酸、碱、亲核试剂、亲电试剂、自由基、金属、还原剂或氧化剂、光、温度、酶等。还可以使用用于断裂碱基处的保护基的相同催化剂裂解本文中讨论的连接基团。如Greene&Wuts,Protective Groups in OrganicSynthesis(有机合成中的保护基),John Wiley&Sons中所公开的,合适的连接基团可修改自标准的化学保护基。Guillier等人(Chem.Rev.100:2092-2157,2000)中还公开了用于固相合成的合适的可裂解的连接基团。
使用术语“可裂解的连接基团”并非意味着需要除去整个连接基团,例如,从核苷酸或修饰的核苷酸中除去。当可检测标记与核苷酸或修饰的核苷酸相连接时,核苷裂解位点可位于连接基团上的位置,该位置能够确保在裂解后一部分的连接基团仍与所述核苷酸或修饰的核苷酸保持连接。
本领域技术人员可知,本申请中的核苷酸在Sanger法测序、第二代高通量测序(NGS测序)和第三代测序(单分子测序)中均具有效用,因为通过使用本文描述的可逆阻断核苷酸类似物可实现逐个检测测序中掺入的核苷酸类型。
下面结合具体实施例对本发明进行进一步的解释说明。需要说明的是,以下各实施例仅列举了四种碱基中的一种碱基的核苷酸类似物的制备方法,本领域技术人员可以参照该方法,制备合成剩余三种碱基的核苷酸类似物。而且,以下各实施例化合物在最后一步与染料相连接时,可以与任意已知的染料进行连接,以下实施例各列举了一种染料,仅为示例,并非对染料选择范围的限制。另外,除非特别说明,否则各原料均可以市购获得。
一、化合物制备实施例
实施例1
linker1的合成
核苷与酸DCC缩合后,TBAF脱去保护基,再利用三磷酸化的三磷酸。氨解后与linker1偶联,在脱去三氟乙酰基,最后与荧光染料偶联得到产品。
实施例2
linker2的合成
对氨基叠氮苯甲酸与三氟乙酰基保护的PEG linker缩合得到linker 2。
核苷与酸DCC缩合后,氨基脱去乙酰基,然后再DCC缩合。利用TBAF脱去保护基,再利用三磷酸化的三磷酸。氨解脱去三氟乙酰基,最后与荧光染料偶联得到产品。
实施例3
linker 3的合成
合成路线与鉴定结果参见实施例7-1。
核苷与酸DCC缩合后,氨基脱去乙酰基,然后再DCC缩合。利用TBAF脱去保护基,再利用三磷酸化的三磷酸。氨解脱去三氟乙酰基,最后与荧光染料偶联得到产品。
实施例4
linker 4的合成
核苷与酸DCC缩合后,利用TBAF脱去保护基,再利用三磷酸化的三磷酸。氨解脱去三氟乙酰基,与linker 4偶联,再脱去linker中三氟乙酰基,最后与荧光染料偶联得到产品。
实施例5
linker 5的合成
实施例6-1
linker 6的合成
合成方法与实施例7-2类似。15mg固体,HPLC纯度>99%。MS[ES(-)],m/z1861.4.1HNMR(400MHz,DMSO-d6)δ10.27(s,1H),8.63-8.58(m,1H),8.36(t,J=13.1Hz,2H),8.09(d,J=6.3Hz,1H),8.00(s,1H),7.92-7.88(m,2H),7.84(d,J=4.5Hz,1H),7.81(s,2H),7.78(d,J=8.6Hz,1H),7.71–7.67(m,1H),7.65-7.62(m,4H),7.49–7.43(m,1H),7.31(dd,J=8.3,3.1Hz,2H),6.67–6.54(m,2H),6.31(dd,J=13.8,5.3Hz,2H),5.68(s,1H),5.30(q,J=6.9Hz,1H),5.26–5.17(m,1H),4.34(dt,J=22.7,3.7Hz,1H),4.22(t,J=4.8Hz,2H),4.13(s,2H),4.11(d,J=5.0Hz,2H),4.08–4.00(m,2H),3.67-3.65(m,1H),3.59–3.56(m,2H),3.22–3.15(m,2H),2.21(t,J=6.6Hz,2H),2.11(d,J=2.3Hz,4H),2.09–2.04(m,4H),1.66(s,3H),1.60(d,J=6.9Hz,3H),1.52(dd,J=14.9,7.4Hz,2H),1.37–1.29(m,2H),1.26(t,J=7.1Hz,4H).
实施例6-2
linker的合成
linker 6的合成方法同实施例6-1。
合成方法与实施例7-1类似,16mg固体,HPLC纯度>99%。MS[ES(-)],m/z1809.3.1HNMR(400MHz,DMSO-d6)δ10.16(s,1H),8.95(d,J=8.2Hz,1H),8.85(t,J=5.5Hz,1H),8.80(s,2H),8.23(d,J=8.2Hz,1H),8.14(d,J=8.4Hz,2H),7.99(d,J=1.7Hz,1H),7.86(d,J=7.6Hz,1H),7.82(d,J=8.5Hz,1H),7.69(dd,J=8.7,1.6Hz,1H),7.62(d,J=3.5Hz,2H),7.52(d,J=7.9Hz,2H),7.45–7.37(m,1H),6.72(s,2H),6.30–6.20(m,1H),5.57-5.54(m,1H),5.31(q,J=6.9Hz,1H),5.22–5.13(m,1H),4.36(d,J=20.9Hz,1H),4.24–4.19(m,2H),4.14(s,2H),4.08(d,J=4.0Hz,1H),4.06–4.00(m,2H),3.80(dd,J=13.1,6.8Hz,2H),3.73–3.69(m,2H),3.67(dd,J=7.0,4.1Hz,2H),3.63(d,J=5.6Hz,2H),2.22(t,J=7.0Hz,2H),2.13(s,3H),2.07(t,J=7.8Hz,5H),1.73–1.66(m,2H),1.65(d,J=6.9Hz,3H),1.60(d,J=7.0Hz,3H),1.17(d,J=6.7Hz,12H),1.00(d,J=2.0Hz,6H).
实施例7-1
(1)步骤1
linker 7的合成
PEG-CF3底物(OKeanos Tech,货号OK20A409)1g溶解在DMF中,加入TSTU(2eq)与N,N二异丙基乙胺(3eq),反应在室温搅拌2h后,加入苯胺底物(OKeanos Tech,货号OK20A408)(1.2eq)。反应4h后,加入水淬灭反应。利用二氯甲烷萃取,浓缩干燥后利用柱分离提纯得到无色油状化合物。MS[ES(-)],m/z 484.3.1H NMR(400MHz,DMSO-d6)δ12.92(s,1H),9.98(s,1H),9.53(t,J=5.2Hz,1H),7.88(d,J=2.0Hz,1H),7.81(d,J=8.4Hz,1H),7.69(dd,J=8.4,2.0Hz,1H),5.48(q,J=6.8Hz,1H),4.11(s,2H),3.68–3.66(m,2H),3.62–3.60(m,2H),3.55(t,J=5.6Hz,2H),3.37(q,J=5.6Hz,2H),2.15(s,3H),1.60(d,J=6.8Hz,3H).
(2)步骤2
将步骤1获得的底物100mg溶解在3mL的DMF中,加入DCC(1.2eq)与DMAP(10%mol),反应搅拌30分钟后,加入羟基酸底物(毕得医药,货号BD628858)(2eq)。反应搅拌12小时后,直接利用制备HPLC进行分离(C18反相柱,250*30mm,)得到白色固体(linker 7)85mg。MS[ES(-)],m/z 585.2.1H NMR(400MHz,DMSO-d6)δ10.06(s,1H),9.53(t,J=5.2Hz,1H),7.92(d,J=2.0Hz,1H),7.82(d,J=8.4Hz,1H),7.73(dd,J=8.4,2.0Hz,1H),5.31(q,J=6.8Hz,1H),4.40–4.30(m,3H),4.11(s,2H),3.88(s,2H),3.78(t,J=4.8Hz,2H),3.68–3.66(m,2H),3.62–3.60(m,2H),3.55(t,J=5.6Hz,2H),3.37(q,J=5.6Hz,2H),2.13(s,3H),1.61(d,J=6.8Hz,3H).
(3)步骤3
碘代U核苷底物(OKeanos Tech,货号OK-N-16001)1g溶解于DMF中,加入Pd(PPh3)4(10mol%),CuI(15mol%),三乙胺(3eq)与底物炔丙胺(OKeanos Tech,货号OK20A410)(1.5eq)在60度条件下反应12h。加入水淬灭反应,DCM萃取。浓缩后柱分离得到白色固体产品1.1g。MS[ES(-)],m/z 491.1.1H NMR(400MHz,DMSO-d6)δ11.67(s,1H),10.00(t,J=5.5Hz,1H),7.94(s,1H),6.12(dd,J=7.6,5.9Hz,1H),5.28(d,J=4.1Hz,1H),4.26-4.12(m,3H),3.88(q,J=2.8Hz,1H),3.81(dd,J=11.5,2.6Hz,1H),3.73(dd,J=11.5,3.1Hz,1H),2.17(ddd,J=13.2,6.0,2.8Hz,1H),2.05(ddd,J=13.3,7.7,5.8Hz,1H),0.87(s,9H),0.08(d,J=1.8Hz,6H).
(4)步骤4
将步骤3获得的底物核苷300mg溶解在10mL的DMF中,加入DCC(1.2eq)与DMAP(10%mol),反应搅拌30分钟后,加入二硫羧酸底物(OKeanos Tech,货号OK20A420)(1.5eq)。反应搅拌12小时后,直接柱分离得到白色固体359mg。MS[ES(-)],m/z 700.3.1HNMR(400MHz,DMSO-d6)δ11.74(s,1H),10.03(t,J=5.5Hz,1H),7.98(s,1H),7.90–7.82(m,1H),7.68–7.58(m,2H),7.47-7.40(m,1H),6.23-6.18(m,1H),5.45-5.42(m,1H),5.20-5.12(m,1H),4.38–4.16(m,3H),3.98–3.87(m,2H),2.60-2.53(m,1H),2.40-2.31(m,1H),2.06(d,J=0.6Hz,3H),1.65(dd,J=7.0,1.0Hz,3H),0.90(s,9H),0.13(d,J=1.2Hz,6H).
(5)步骤5
将步骤4获得的底物核苷300mg溶解在10mL的THF中,在0度下加入TBAF(2eq,1MinTHF),反应在0度搅拌30分钟后,升至室温搅拌4小时。反应直接柱分离得到白色固体200mg。MS[ES(-)],m/z 587.2.1H NMR(400MHz,DMSO-d6)δ11.68(d,J=3.2Hz,1H),10.06(t,J=5.6Hz,1H),8.23(d,J=3.2Hz,1H),7.88–7.78(m,1H),7.66–7.56(m,2H),7.43–7.39(m,1H),6.25–6.13(m,1H),5.48–5.45(m,1H),5.31(t,J=5.2Hz,1H),5.18–5.12(m,1H),4.28–4.16(m,3H),3.76–3.67(m,2H),2.50–2.40(m,2H),2.04(d,J=9.2Hz,3H),1.68–1.59(m,3H).
(6)步骤6
将步骤5获得的底物核苷200mg溶解在5mL的磷酸三甲酯中,在0度下加入三氯氧磷(1.5eq),反应在0度搅拌120分钟后,将反应液加入到三丁基焦磷酸铵(2eq)的DMF(5mL)溶液中,反应在0度继续搅拌3h后,加入0.1M TEAB缓冲液淬灭。反应利用制备HPLC反相柱(C18,流动相:0.1M TEAB-乙腈)分离,浓缩后直接加入浓氨水3mL,反应2h后利用制备HPLC反相柱(C18,流动相:0.1M TEAB-乙腈)分离得到白色固体120mg。MS[ES(-)],m/z 745.5.1HNMR(400MHz,D2O)δ8.51(s,1H),7.90(dd,J=7.9,1.4Hz,1H),7.73(d,J=7.8Hz,1H),7.67(td,J=7.6,1.4Hz,1H),7.48(t,J=7.5Hz,1H),6.45(td,J=9.2,5.7Hz,1H),5.75(t,J=4.7Hz,1H),5.15–5.07(m,1H),4.72–4.64(m,1H),4.39(d,J=3.3Hz,2H),4.07(s,2H),2.82-2.76(m,1H),2.64–2.54(m,1H),2.02(d,J=6.4Hz,3H),1.73(dd,J=7.1,2.2Hz,3H);31P NMR(162MHz,D2O)δ-9.79(dd,J=20.3,9.6Hz,1P),-11.68(d,J=19.2Hz,1P),-22.82(td,J=19.2,6.1Hz,1P).
(7)步骤7
将步骤2获得的linker 7底物20mg溶解在1mL的DMF中,加入TSTU(1.5eq)与二异丙基乙基胺(3eq),反应在室温搅拌120分钟后,加入步骤6获得的核苷酸底物(2eq),反应在室温继续搅拌3h后,加入0.1M TEAB缓冲液淬灭。反应利用制备HPLC反相柱(C18,流动相:0.1MTEAB-乙腈)分离,浓缩后直接加入浓氨水3mL,反应2h后利用制备HPLC反相柱(C18,流动相:0.1M TEAB-乙腈)分离得到白色固体15mg。MS[ES(-)],m/z 1201.7.1H NMR(400MHz,DMSO-d6)δ10.91(s,1H),8.96–8.84(m,1H),8.28(d,J=2.0Hz,1H),8.18(d,J=11.6Hz,1H),7.92(dd,J=8.6,1.5Hz,1H),7.86(d,J=7.1Hz,1H),7.66(d,J=8.7Hz,1H),7.63–7.57(m,2H),7.46–7.38(m,1H),6.21(ddd,J=14.8,8.4,6.2Hz,1H),5.57(s,1H),5.35(q,J=6.8Hz,1H),5.21-5.13(m,1H),4.39(d,J=12.5Hz,2H),4.32(s,2H),4.22(s,2H),4.14(d,J=6.3Hz,2H),4.09(d,J=3.7Hz,2H),4.05(s,2H),3.82–3.79(m,4H),3.68–3.64(m,2H),3.63–3.59(m,2H),2.99–2.93(m,2H),2.60-2.52(m,1H),2.47–2.36(m,1H),2.15(s,3H),2.05(d,J=21.1Hz,3H),1.64(d,J=7.0Hz,3H),1.61(d,J=6.9Hz,3H).
(8)步骤8
将染料(北京澄道科技有限公司,货号CD0014)10mg溶解在0.5mL的DMF中,加入TNTU(1.5eq)与二异丙基乙基胺(3eq),反应在室温搅拌120分钟后,加入步骤7获得的核苷酸底物(2eq),反应在室温继续搅拌3h后,加入0.1M TEAB缓冲液淬灭。反应利用制备HPLC反相柱(C18,流动相:0.1M TEAB-乙腈)分离得到红色固体8mg。HPLC纯度>99%。
MS[ES(-)],m/z 1938.7.1H NMR(400MHz,DMSO-d6)δ10.39(brs,1H),9.15–9.10(m,1H),8.28(d,J=8.8Hz,1H),8.03–8.00(m,1H),7.88–7.79(m,3H),7.76–7.67(m,3H),7.66–7.60(m,3H),7.58–7.39(m,3H),6.99(s,2H),6.80(s,2H),6.27–6.20(m,1H),5.59(d,J=5.6Hz,1H),5.34–5.29(m,1H),5.18(p,J=6.8Hz,1H),4.44–4.29(m,4H),4.14–4.04(m,9H),3.81(t,J=4.8Hz,2H),3.77–3.61(m,7H),3.59–3.51(m,6H),3.40(t,J=6.0Hz,2H),3.19–3.14(m,2H),3.11(t,J=7.6Hz,2H),2.69–2.65(d,J=6.5Hz,4H),2.59–2.55(m,5H),2.46–2.35(m,1H),2.14(d,J=3.5Hz,3H),2.08(s,1H),2.04(s,1H),2.00–1.91(m,4H),1.87–1.80(m,4H),1.70(t,J=7.6Hz,2H),1.65(d,J=7.2Hz,3H),1.60(d,J=6.8Hz,3H).31P NMR(162MHz,DMSO-d6)δ-11.24(d,J=22.7Hz,1P),-12.05(d,J=22.9Hz,1P),-23.63(t,J=22.7Hz,1P).
实施例7-2
linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
合成方法与实施例7-1类似,使用碘代A核苷底物(OKeanos Tech,货号OK-N-16003)替代碘代U核苷底物。MS[ES(-)],m/z 513.2.1H NMR(400MHz,DMSO-d6)δ10.04(t,J=5.5Hz,1H),8.09(s,1H),7.67(s,1H),6.85(s,2H),6.47(t,J=6.7Hz,1H),5.29(d,J=4.2Hz,1H),4.33–4.29(m,1H),4.27(d,J=5.4Hz,2H),3.81(q,J=3.9Hz,1H),3.75(dd,J=11.1,4.1Hz,1H),3.67(dd,J=11.1,4.1Hz,1H),2.43–2.36(m,1H),2.24–2.18(m,1H),0.85(s,9H),0.03(d,J=1.8Hz,6H).
合成方法与实施例7-1类似。MS[ES(-)],m/z 723.1.1H NMR(400MHz,DMSO-d6)δ10.05(s,1H),8.10(d,J=4.4Hz,1H),7.91–7.83(m,1H),7.74(d,J=3.6Hz,1H),7.65–7.56(m,2H),7.46–7.40(m,1H),6.84(brs,2H),6.64–6.48(m,1H),5.58–5.52(m,1H),5.24–5.10(m,1H),4.37–4.15(m,3H),3.95–3.74(m,2H),2.84–2.75(m,1H),2.70–2.54(m,1H),2.06(d,J=1.2Hz,3H),1.64(d,J=7.0Hz,3H),1.28–1.17(m,1H),0.87(s,9H),0.07(dd,J=4.8,2.7Hz,6H).
合成方法与实施例7-1类似。MS[ES(-)],m/z 609.2.1H NMR(400MHz,DMSO-d6)δ10.10(t,J=5.2Hz,1H),8.12(d,J=4.8Hz,1H),7.90(dd,J=7.4,5.0Hz,1H),7.85(s,1H),7.66–7.61(m,2H),7.48–7.43(m,1H),6.82(brs,2H),6.60–6.51(m,1H),5.59(d,J=4.4Hz,1H),5.36(td,J=5.5,1.5Hz,1H),5.21(qd,J=7.0,4.1Hz,1H),4.32(d,J=5.3Hz,2H),4.26–4.20(m,1H),3.75–3.64(m,2H),2.90–2.77(m,1H),2.65–2.51(m,1H),2.09(d,J=8.6Hz,3H),1.67(d,J=7.0Hz,3H).
合成方法与实施例7-1类似。MS[ES(-)],m/z 753.0.1H NMR(400MHz,D2O)δ8.04(d,J=7.1Hz,1H),7.95–7.83(m,2H),7.72–7.56(m,2H),7.49–7.44(m,1H),6.70–6.48(m,1H),5.71(dd,J=17.3,4.9Hz,1H),5.12–5.00(m,1H),4.62(d,J=10.7Hz,1H),4.41–4.21(m,2H),4.18(d,J=8.9Hz,2H),2.78–2.31(m,2H),2.03–1.83(m,3H),1.70(dd,J=10.3,7.1Hz,3H);31P NMR(162MHz,D2O)δ-7.18(dd,J=20.1,13.4Hz,1P),-11.24(d,J=19.0Hz,1P),-22.25(td,J=19.6,11.0Hz,1P).
合成方法与实施例7-1类似。MS[ES(-)],m/z 1225.1.1H NMR(400MHz,DMSO-d6)δ11.18(d,J=6.1Hz,1H),8.37(t,J=5.4Hz,1H),8.21(dd,J=7.4,1.7Hz,1H),8.09(s,1H),7.84(d,J=8.5Hz,1H),7.69–7.58(m,3H),7.47–7.40(m,1H),7.29(s,1H),6.40(s,2H),6.30(dd,J=9.4,5.7Hz,1H),5.66(s,1H),5.35(q,J=6.9Hz,1H),5.20(q,J=6.9Hz,1H),4.41(d,J=12.9Hz,1H),4.34(dd,J=8.4,4.2Hz,1H),4.30(s,2H),4.13–4.08(m,2H),4.06-4.03(m,2H),4.01(s,2H),3.83–3.80(m,2H),3.67(d,J=2.8Hz,2H),3.63-3.61(m,6H),2.98–2.93(m,2H),2.60-2.52(m,1H),2.47–2.36(m,1H),2.13(s,3H),2.07(s,3H),1.64(d,J=7.0Hz,3H),1.61(d,J=6.9Hz,3H).
合成方法与实施例7-1类似,将染料替换为AF532(购自OKeanos Tech,货号OK F532)。13mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1833.0.1H NMR(400MHz,DMSO-d6)δ10.43(t,J=4.8Hz,1H),8.91(t,J=5.6Hz,1H),8.80(s,2H),8.50(t,J=5.6Hz,1H),8.15(d,J=8.8Hz,2H),8.07(d,J=6.4Hz,1H),8.03(s,1H),7.90(dd,J=7.6,2.4Hz,1H),7.84–7.79(m,2H),7.69(d,J=8.4Hz,1H),7.63(d,J=4.4Hz,2H),7.49–7.42(m,3H),6.70(s,2H),6.65–6.58(m,1H),5.69(d,J=2.8Hz,1H),5.33–5.27(m,1H),5.21(qd,J=7.2,2.0Hz,1H),4.45–4.34(m,3H),4.32–4.30(m,1H),4.18(s,2H),4.14(d,J=5.6Hz,3H),4.01(s,3H),3.81–3.77(m,7H),3.73–3.69(m,4H),3.68–3.63(m,7H),3.52(q,J=5.6Hz,4H),2.12(d,J=2.4Hz,3H),2.10(s,1H),2.05(s,1H),1.65(d,J=6.8Hz,3H),1.59(d,J=7.2Hz,3H),0.99(d,J=2.8Hz,5H).31P NMR(162MHz,DMSO-d6)δ-10.99(d,J=20.6Hz,1P),-12.48(d,J=24.0Hz,1P),-23.41(t,J=22.5Hz,1P).
实施例7-3
linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
合成方法与实施例7-1类似,使用碘代G核苷底物(OKeanos Tech,货号OK-N-16004)替代碘代U核苷底物。MS[ES(-)],m/z 529.3.1H NMR(400MHz,DMSO-d6)δ10.48(s,1H),9.98(t,J=5.6Hz,1H),7.21(s,1H),6.38–6.21(m,3H),5.23(d,J=3.8Hz,1H),4.26(s,1H),4.18(d,J=5.6Hz,2H),3.78(q,J=4.0Hz,1H),3.73–3.60(m,2H),2.32–2.19(m,1H),2.13–2.08(m,1H),2.04(s,1H),0.85(s,9H),0.03(d,J=1.8Hz,6H).
合成方法与实施例7-1类似。MS[ES(-)],m/z 739.2.1H NMR(400MHz,DMSO-d6)δ10.53(s,1H),10.00(t,J=5.6Hz,1H),7.83(dd,J=7.5,3.6Hz,1H),7.61–7.58(m,2H),7.48–7.39(m,1H),7.29(d,J=2.0Hz,1H),6.42–6.25(m,3H),5.72(s,1H),5.58–5.46(m,1H),5.16(p,J=7.2Hz,1H),4.25–4.14(m,3H),3.82(t,J=3.6Hz,2H),2.71–2.60(m,1H),2.50–2.45(m,1H),2.07(s,3H),1.75–1.55(m,4H),1.29–0.96(m,2H),0.88(s,9H),0.13–0.02(m,6H).
合成方法与实施例7-1类似。MS[ES(-)],m/z 625.7.1H NMR(400MHz,DMSO-d6)δ10.53(s,1H),10.00(t,J=5.6Hz,1H),7.83(dd,J=7.5,3.6Hz,1H),7.61–7.58(m,2H),7.48–7.39(m,1H),7.29(d,J=2.0Hz,1H),6.42–6.25(m,3H),5.72(s,1H),5.58–5.46(m,1H),5.16(p,J=7.2Hz,1H),4.25–4.14(m,3H),3.82(t,J=3.6Hz,2H),2.71–2.60(m,1H),2.50–2.45(m,1H),2.07(s,3H),1.75–1.55(m,4H),1.29–0.96(m,2H),0.88(s,9H),0.13–0.02(m,6H).
合成方法与实施例7-1类似。MS[ES(-)],m/z 769.2.1H NMR(400MHz,D2O)δ7.81–7.74(m,1H),7.51–7.40(m,3H),7.31(q,J=6.9Hz,1H),6.38–6.19(m,1H),5.65(dd,J=11.2,5.2Hz,1H),5.07–4.96(m,1H),4.53(d,J=20.8Hz,1H),4.35–4.18(m,2H),4.10(s,2H),2.87–2.70(m,1H),2.54–2.40(m,1H),1.97–1.76(m,3H),1.59–1.54(m,3H);31P NMR(162MHz,D2O)δ-9.27(d,J=19.6Hz,1P),-11.36(d,J=18.5Hz,1P),-22.79(td,J=19.2,4.7Hz,1P).
合成方法与实施例7-1类似。MS[ES(-)],m/z 1241.6.1H NMR(400MHz,DMSO-d6)δ11.25(s,1H),8.29(d,J=7.7Hz,2H),7.87(d,J=7.0Hz,2H),7.69–7.58(m,3H),7.47–7.40(m,1H),7.29(s,1H),6.40(s,2H),6.30(dd,J=9.4,5.7Hz,1H),5.66(s,1H),5.35(q,J=6.9Hz,1H),5.20(q,J=6.9Hz,1H),4.41(d,J=12.9Hz,1H),4.34(dd,J=8.4,4.2Hz,1H),4.30(s,2H),4.13–4.08(m,2H),4.06-4.03(m,2H),4.01(s,2H),3.83–3.80(m,2H),3.67(d,J=2.8Hz,2H),3.63-3.61(m,6H),2.98–2.93(m,2H),2.47–2.42(m,1H),2.41–2.30(m,1H),2.13(s,3H),2.07(s,3H),1.66(d,J=7.0Hz,3H),1.62(d,J=6.9Hz,3H).
合成方法与实施例7-1类似,将染料替换为CY5(购自OKeanos Tech,货号OK-F-13103)。18mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1878.9.1H NMR(400MHz,DMSO-d6)δ10.66(brs,1H),10.43(s,1H),8.43–8.32(m,2H),8.03(s,1H),7.92–7.82(m,2H),7.82(d,J=1.6Hz,2H),7.72(dd,J=8.8,2.0Hz,1H),7.66–7.60(m,3H),7.46–7.42(m,1H),7.31(dd,J=8.0,3.6Hz,2H),6.59(t,J=12.4Hz,1H),6.58–6.47(m,1H),6.35–6.27(m,2H),5.66(t,J=5.2Hz,1H),5.31(q,J=7.2Hz,1H),5.20(q,J=7.2Hz,1H),4.45–4.34(m,2H),4.31(t,J=5.2Hz,1H),4.25(t,J=5.2Hz,1H),4.14(s,2H),4.12–4.05(m,5H),4.00(s,2H),3.81(t,J=4.4Hz,2H),3.66–3.64(m,2H),3.58–3.55(m,2H),3.41(t,J=5.6Hz,2H),3.19(q,J=5.6Hz,2H),2.13(d,J=3.6Hz,3H),2.08–2.05(m,2H),1.68(s,9H),1.65(d,J=7.2Hz,2H),1.61(d,J=7.2Hz,2H),1.56–1.49(m,2H),1.35–1.30(m,2H),1.25(t,J=7.2Hz,3H).31P NMR(162MHz,DMSO-d6)δ-11.33(d,J=22.6Hz,1P),-11.92(d,J=22.8Hz,1P),-23.68(t,J=22.6Hz,1P).
实施例7-4
linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
合成方法与实施例7-1类似,使用碘代C核苷底物(OKeanos Tech,货号OK-N-16002)替代碘代U核苷底物。MS[ES(-)],m/z 678.1.1H NMR(400MHz,DMSO-d6)δ7.97(s,1H),7.94–7.79(m,2H),7.65–7.54(m,2H),7.46–7.33(m,1H),6.68(s,1H),6.18–6.14(m,1H),5.40(d,J=6.1Hz,1H),5.16(qd,J=7.0,2.1Hz,1H),4.35–4.24(m,1H),3.97–3.85(m,2H),2.55–2.47(m,1H),2.24–2.16(m,1H),2.04(d,J=3.2Hz,3H),1.63(d,J=7.0Hz,3H),0.89(s,9H),0.12(s,6H).
合成方法与实施例7-1类似。MS[ES(-)],m/z 700.4.1H NMR(400MHz,DMSO-d6)δ9.93(t,J=5.2Hz,1H),7.99(s,1H),7.91(s,1H),7.85(d,J=7.6Hz,1H),7.62(d,J=5.3Hz,2H),7.47–7.40(m,1H),6.97(s,1H),6.25–6.20(m,1H),5.42(d,J=5.9Hz,1H),5.17(qd,J=7.0,2.2Hz,1H),4.36–4.29(m,1H),4.27(d,J=5.2Hz,2H),3.95–3.87(m,2H),2.65–2.52(m,1H),2.27–2.17(m,1H),2.06(d,J=2.8Hz,3H),1.65(d,J=7.0Hz,3H),0.88(s,9H),0.11(d,J=0.8Hz,6H).
合成方法与实施例7-1类似。MS[ES(-)],m/z 580.5.1H NMR(400MHz,DMSO-d6)δ9.94(s,1H),8.18(s,1H),7.89(s,1H),7.82(d,J=7.6Hz,1H),7.61(q,J=4.1,3.0Hz,2H),7.41(t,J=8.1Hz,1H),6.91(s,1H),6.26–6.17(m,1H),5.45(d,J=6.0Hz,1H),5.28(t,J=5.2Hz,1H),5.15(qd,J=7.0,3.6Hz,1H),4.35–4.16(m,3H),3.70(dt,J=5.6,3.3Hz,2H),2.54–2.44(m,1H),2.33–2.26(m,1H),2.04(d,J=5.7Hz,3H),1.63(d,J=7.0Hz,3H).
合成方法与实施例7-1类似。MS[ES(-)],m/z 745.3.1H NMR(400MHz,D2O)δ8.51(s,1H),7.91(d,J=7.7Hz,1H),7.74(d,J=7.9Hz,1H),7.68(t,J=7.7Hz,1H),7.48(t,J=7.5Hz,1H),6.47-6.42(m,1H),5.73(d,J=5.6Hz,1H),5.18–5.06(m,1H),4.71(d,J=9.0Hz,1H),4.39(q,J=12.5Hz,2H),4.09(d,J=1.6Hz,2H),2.83-2.79(m,1H),2.58-2.50(m,1H),2.03(dd,J=3.0,1.5Hz,3H),1.74(d,J=7.0Hz,3H);31P NMR(162MHz,D2O)δ-9.99(d,J=19.4Hz,1P),-11.68(d,J=19.1Hz,1P),-22.93(t,J=19.4Hz,1P).
合成方法与实施例7-1类似。MS[ES(-)],m/z 1201.6.1H NMR(400MHz,DMSO-d6)δ10.99(s,1H),8.75(d,J=7.2Hz,1H),8.23(s,1H),8.07(d,J=7.3Hz,1H),7.87-7.84(m,3H),7.70–7.58(m,3H),7.47–7.37(m,1H),6.95(s,1H),6.23(dd,J=16.7,8.2Hz,1H),5.55(s,1H),5.33(q,J=6.8Hz,1H),5.21-5.14(m,1H),4.44–4.36(m,2H),4.32(dd,J=7.8,4.1Hz,2H),4.24(s,2H),4.13(d,J=3.3Hz,4H),4.04(s,2H),3.82(s,2H),3.68–3.55(m,6H),2.97(s,2H),2.46–2.34(m,2H),2.13(d,J=2.1Hz,3H),2.05(d,J=16.9Hz,3H),1.64(d,J=6.7Hz,3H),1.61(d,J=6.9Hz,3H).
合成方法与实施例7-1类似,其中,将染料替换为iF700商品(iFluorTM700succinimidyl ester,购自AAT Bioquest)。16mg固体,HPLC纯度>99%。MS[ES(-)],m/z1962.8.1H NMR(400MHz,DMSO-d6)δ10.30(s,1H),8.91–8.84(m,1H),8.80–8.74(m,1H),8.41–8.35(m,3H),8.25(t,J=13.2Hz,1H),8.13(d,J=6.4Hz,1H),7.99(s,1H),7.90–7.78(m,4H),7.71(d,J=8.8Hz,1H),7.65–7.60(m,2H),7.53(dd,J=8.0,1.6Hz,1H),7.48–7.37(m,3H),6.94(d,J=8.8Hz,2H),6.65(d,J=8.0z,2H),6.54(t,J=12.6Hz,1H),6.38(d,J=13.6Hz,1H),6.28–6.22(m,1H),6.08(d,J=13.6Hz,1H),5.55(s,1H),5.31(q,J=6.8Hz,1H),5.18(p,J=7.2Hz,1H),4.64(s,2H),4.44–4.30(m,4H),4.14–4.04(m,8H),3.82(t,J=4.4Hz,2H),3.68–3.63(m,3H),3.60–3.43(m,8H),3.39–3.31(m,4H),3.17(s,3H),2.56(t,J=7.2Hz,2H),2.46–2.41(m,1H),2.31–2.25(m,2H),2.12(s,2H),2.08(s,1H),2.04(s,1H),1.80(s,2H),1.65(d,J=6.8Hz,2H),1.60(d,J=7.2Hz,2H),1.47(s,5H).31P NMR(162MHz,DMSO-d6)δ-11.13(d,J=22.3Hz,1P),-11.90(d,J=22.6Hz,1P),-23.56(t,J=22.3Hz,1P).
实施例8
linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
合成方法与实施例7-1类似。15mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1968.4.1H NMR(400MHz,DMSO-d6)δ10.31(d,J=18.9Hz,1H),9.00(s,1H),8.23(d,J=8.9Hz,1H),8.05–7.88(m,3H),7.87–7.77(m,2H),7.72-7.67(m,3H),7.63(dd,J=5.2,3.6Hz,1H),7.57–7.43(m,1H),7.09(s,1H),6.99(s,3H),6.79(d,J=5.3Hz,2H),6.27-6.20(m,1H),5.51(s,1H),5.34–5.28(m,2H),4.44–4.36(m,2H),4.32(d,J=16.2Hz,2H),4.13(s,2H),4.09(s,2H),4.03(s,2H),3.84(s,3H),3.82–3.79(m,2H),3.67–3.64(m,2H),3.42–3.38(m,2H),3.19–3.14(m,2H),3.13–3.08(m,2H),2.89(d,J=3.8Hz,2H),2.70–2.64(m,4H),2.59–2.53(m,6H),2.13(s,5H),2.08(d,J=11.3Hz,2H),1.97(dt,J=10.7,7.0Hz,5H),1.83(dt,J=12.2,6.0Hz,4H),1.71(t,J=7.2Hz,2H),1.63(d,J=7.0Hz,3H),1.60(d,J=6.9Hz,3H),1.23(s,3H).
实施例9
linker的合成
linker 8的合成方法同实施例7-1。MS[ES(-)],m/z 548.2.1H NMR(500MHz,DMSO-d6)δ10.08(s,1H),9.51(s,1H),7.94(d,J=2.0Hz,1H),7.86(d,J=8.6Hz,1H),7.77(dd,J=8.6,2.0Hz,1H),5.70(q,J=6.6Hz,1H),4.41–4.32(m,2H),4.12(s,2H),3.96(s,2H),3.79(t,J=4.6Hz,2H),3.67(dd,J=5.7,3.2Hz,2H),3.61(dd,J=5.7,3.1Hz,2H),3.55(t,J=5.7Hz,2H),3.37(dd,J=11.3,5.6Hz,2H),2.07(s,1H),1.44(d,J=6.7Hz,3H).
合成方法与实施例7-3类似。MS[ES(-)],m/z 1203.2.1H NMR(500MHz,DMSO-d6)δ11.18(s,1H),8.28(d,J=6.3Hz,2H),7.92(d,J=8.5Hz,1H),7.87(d,J=7.7Hz,1H),7.69(d,J=7.1Hz,1H),7.65–7.58(m,2H),7.43(t,J=5.3Hz,1H),7.27(d,J=4.3Hz,1H),6.47–6.32(m,2H),6.32–6.24(m,1H),5.70(q,J=6.5Hz,1H),5.63(s,1H),5.22-5.18(m,1H),4.41-4.37(m,2H),4.32(t,J=4.9Hz,1H),4.28(s,2H),4.26(s,1H),4.11(d,J=5.9Hz,2H),4.04(s,2H),4.01(s,2H),3.82(s,2H),3.66(d,J=13.7Hz,2H),3.63–3.59(m,4H),2.97(s,2H),2.10(d,J=32.7Hz,3H),1.65(d,J=6.9Hz,3H),1.44(d,J=6.6Hz,3H).
合成方法与实施例7-3类似。20mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1842.4.1H NMR(500MHz,DMSO-d6)δ10.55(s,1H),10.38(s,1H),8.42(s,1H),8.35(t,J=13.1Hz,2H),8.03(s,1H),7.88(dd,J=10.9,6.8Hz,3H),7.81(s,2H),7.75(d,J=8.8Hz,1H),7.68–7.58(m,4H),7.47–7.40(m,1H),7.35–7.25(m,3H),6.59(t,J=12.3Hz,1H),6.40(s,2H),6.30(dd,J=13.7,7.2Hz,3H),5.69(q,J=6.6Hz,1H),5.63(s,1H),5.20(q,J=6.8Hz,1H),4.44-4.36(m,2H),4.32(t,J=4.7Hz,1H),4.25(t,J=4.4Hz,1H),4.16–4.09(m,6H),4.06(s,2H),4.00(s,2H),3.84–3.79(m,2H),3.65(dd,J=5.4,3.5Hz,2H),3.59–3.55(m,2H),3.43–3.39(m,2H),3.19(dd,J=11.5,5.8Hz,2H),2.45(dd,J=11.6,6.5Hz,1H),2.38(dd,J=13.6,5.4Hz,1H),2.10(d,J=29.1Hz,3H),2.04(dd,J=12.6,6.9Hz,2H),1.68(s,12H),1.65(d,J=7.0Hz,3H),1.56–1.49(m,2H),1.43(d,J=6.6Hz,3H),1.32(dd,J=14.2,7.8Hz,2H),1.26(d,J=7.0Hz,3H),1.23(s,2H).
实施例10-1
linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
合成方法与实施例7-1类似。MS[ES(-)],m/z 1047.2.1H NMR(400MHz,DMSO-d6)δ11.06(s,1H),8.81(d,J=5.8Hz,1H),8.32(s,1H),8.04(s,1H),7.92(d,J=8.6Hz,1H),7.65(d,J=8.7Hz,1H),6.10(t,J=7.0Hz,1H),5.36(q,J=6.9Hz,1H),4.92(d,J=8.9Hz,1H),4.81(d,J=8.9Hz,1H),4.49–4.43(m,1H),4.41–4.35(m,1H),4.33–4.26(m,1H),4.24(s,2H),4.10(dd,J=10.1,3.4Hz,2H),4.04(s,2H),4.00(dd,J=11.0,5.5Hz,2H),3.83–3.78(m,2H),3.66(d,J=4.8Hz,2H),3.64–3.57(m,6H),2.99–2.91(m,2H),2.37-2.27(m,2H),2.15(d,J=1.1Hz,3H),1.61(d,J=6.9Hz,3H).
合成方法与实施例7-1类似。16mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1783.4.1H NMR(400MHz,DMSO-d6)δ10.39(d,J=18.2Hz,1H),9.00(t,J=5.0Hz,1H),8.13(s,1H),8.03–7.98(m,1H),7.82(d,J=8.6Hz,2H),7.75–7.66(m,3H),7.66–7.60(m,1H),7.58–7.41(m,1H),6.99(s,2H),6.79(d,J=5.6Hz,2H),6.11(t,J=6.9Hz,1H),5.30(q,J=6.9Hz,1H),4.91(d,J=8.9Hz,1H),4.83(d,J=8.9Hz,1H),4.49–4.45(m,1H),4.44–4.32(m,2H),4.14(s,2H),4.11–4.07(m,2H),4.03(s,4H),3.81(t,J=4.4Hz,2H),3.70(d,J=7.8Hz,2H),3.68–3.63(m,2H),3.56(dd,J=9.5,5.3Hz,6H),3.40(t,J=5.9Hz,2H),3.20–3.14(m,2H),3.13–3.06(m,2H),2.67(s,3H),2.58(t,J=7.1Hz,4H),2.40–2.26(m,2H),2.13(s,3H),2.02–1.91(m,4H),1.84(d,J=5.0Hz,4H),1.70(t,J=7.2Hz,1H),1.60(d,J=6.9Hz,3H),1.28–1.16(m,3H),1.01–0.92(m,1H);31P NMR(162MHz,DMSO-d6)δ-11.29(d,J=23.1Hz),-12.09(d,J=23.0Hz),-23.70(t,J=22.7Hz).
实施例10-2
linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
合成方法与实施例7-2类似。MS[ES(-)],m/z 1069.2.1H NMR(400MHz,DMSO-d6)δ11.18(d,J=6.1Hz,1H),8.37(t,J=5.4Hz,1H),8.21(dd,J=7.4,1.7Hz,1H),8.09(s,1H),7.84(d,J=8.5Hz,1H),7.74(d,J=2.4Hz,1H),7.68–7.60(m,1H),6.50(dd,J=8.5,6.1Hz,1H),5.31(q,J=6.9Hz,1H),4.93(d,J=8.9Hz,1H),4.87(d,J=8.9Hz,1H),4.60(d,J=4.3Hz,1H),4.43–4.32(m,2H),4.29(s,2H),4.16–4.09(m,4H),4.01(s,2H),3.98–3.93(m,2H),3.83–3.79(m,2H),3.67(d,J=3.0Hz,2H),3.62(d,J=7.5Hz,4H),2.95(t,J=4.9Hz,2H),2.69–2.62(m,1H),2.39(dd,J=13.0,6.0Hz,1H),2.11(d,J=5.6Hz,3H),1.59(d,J=6.8Hz,3H).
合成方法与实施例7-2类似。18mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1678.3.1H NMR(400MHz,DMSO-d6)δ10.52(d,J=4.9Hz,1H),8.94(t,J=5.0Hz,1H),8.80(s,2H),8.48(t,J=5.3Hz,1H),8.16(d,J=8.4Hz,2H),8.08(s,1H),8.04(s,1H),7.82–7.74(m,2H),7.70(d,J=8.5Hz,1H),7.49(d,J=7.9Hz,2H),6.71(s,2H),6.49(dd,J=8.7,5.9Hz,1H),5.29(q,J=7.0Hz,1H),4.92(d,J=8.9Hz,1H),4.87(d,J=8.9Hz,1H),4.60(d,J=4.8Hz,1H),4.44–4.34(m,2H),4.19(s,2H),4.13(d,J=5.4Hz,2H),4.00(s,2H),3.97–3.92(m,2H),3.82–3.77(m,4H),3.74–3.70(m,2H),3.68-3.63(m,4H),3.53(dd,J=10.6,5.0Hz,2H),2.68–2.63(m,1H),2.39(dd,J=13.1,6.1Hz,1H),2.12(d,J=1.4Hz,3H),1.58(d,J=6.9Hz,3H),1.16(d,J=6.5Hz,6H),1.13(s,6H),0.99(d,J=2.0Hz,6H);31P NMR(162MHz,DMSO-d6)δ-11.12(d,J=22.8Hz),-12.12(d,J=23.4Hz),-23.53(t,J=22.7Hz).
实施例10-3
linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
合成方法与实施例7-3类似。MS[ES(-)],m/z 1085.2.1H NMR(400MHz,DMSO-d6)δ11.24(s,1H),8.25(s,2H),7.86(d,J=8.5Hz,1H),7.66(d,J=8.7Hz,1H),7.18(d,J=2.3Hz,1H),6.49(s,2H),6.23(dd,J=8.9,5.8Hz,1H),5.34(q,J=6.9Hz,1H),4.91(d,J=8.8Hz,1H),4.85(d,J=8.8Hz,1H),4.54(d,J=3.8Hz,1H),4.42-4.31(m,2H),4.29(s,2H),4.12–4.06(m,2H),4.00(s,2H),3.92(s,2H),3.84–3.78(m,2H),3.66(s,2H),3.61(d,J=4.9Hz,4H),2.98–2.89(m,2H),2.61–2.54(m,1H),2.28(dd,J=13.1,5.1Hz,1H),2.13(d,J=1.6Hz,3H),1.61(d,J=6.9Hz,3H).
合成方法与实施例7-3类似。14mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1724.4.1H NMR(400MHz,DMSO-d6)δ10.56(s,1H),10.35(s,1H),8.43–8.29(m,3H),8.01(d,J=1.7Hz,1H),7.89(t,J=5.5Hz,1H),7.86–7.79(m,3H),7.74–7.68(m,1H),7.67–7.59(m,2H),7.31(dd,J=8.3,2.9Hz,2H),7.21(s,1H),6.59(t,J=12.3Hz,1H),6.47(s,2H),6.30(dd,J=13.8,5.2Hz,2H),6.22(dd,J=8.9,5.8Hz,1H),5.31(q,J=6.9Hz,1H),4.91(d,J=8.9Hz,1H),4.86(d,J=8.9Hz,1H),4.53(d,J=4.5Hz,1H),4.44–4.35(m,2H),4.16–4.09(m,4H),4.09–4.04(m,2H),3.99(s,2H),3.97–3.88(m,2H),3.83–3.79(m,2H),3.65(dd,J=5.7,3.4Hz,2H),3.59–3.55(m,2H),3.41(t,J=5.8Hz,2H),3.19(dd,J=11.6,5.9Hz,2H),2.62(dd,J=14.8,5.7Hz,1H),2.29(dd,J=13.3,6.0Hz,1H),2.13(s,3H),2.06(dd,J=9.4,5.0Hz,2H),1.60(d,J=7.0Hz,3H),1.52(dt,J=14.8,7.3Hz,2H),1.33(d,J=6.7Hz,2H),1.25(t,J=7.1Hz,3H);31P NMR(162MHz,DMSO-d6)δ-11.06(d,J=21.0Hz),-12.40(d,J=23.7Hz),-23.60(t,J=22.2Hz).
实施例10-4
linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
合成方法与实施例7-4类似。MS[ES(-)],m/z 1047.2.1H NMR(400MHz,DMSO-d6)δ11.15(s,1H),8.66(d,J=3.9Hz,1H),8.29(dd,J=4.5,1.8Hz,1H),7.94(s,1H),7.88(d,J=8.6Hz,1H),7.78(s,1H),7.69–7.62(m,1H),6.90(s,1H),6.11(t,J=6.3Hz,1H),5.35(q,J=6.9Hz,1H),4.91(d,J=8.9Hz,1H),4.81(d,J=8.9Hz,1H),4.46–4.36(m,2H),4.26(s,2H),4.11(d,J=3.7Hz,4H),4.04(s,2H),4.02–3.91(m,2H),3.84–3.78(m,2H),3.69–3.64(m,2H),3.64–3.56(m,4H),2.94(t,J=4.9Hz,2H),2.31(dd,J=12.2,4.5Hz,1H),2.18-2.15(m,1H),2.14(s,3H),1.61(d,J=6.9Hz,3H).
合成方法与实施例7-4类似。20mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1807.2.1H NMR(400MHz,DMSO-d6)δ10.28(s,1H),8.89(s,1H),8.76(d,J=5.9Hz,2H),8.39(d,J=18.8Hz,3H),8.25(t,J=12.6Hz,1H),7.99(d,J=9.1Hz,2H),7.87(s,1H),7.82(d,J=8.6Hz,1H),7.78(s,1H),7.71(d,J=9.7Hz,1H),7.56–7.51(m,1H),7.47(d,J=8.2Hz,2H),6.99–6.87(m,2H),6.65(d,J=8.2Hz,2H),6.54(t,J=12.6Hz,1H),6.38(d,J=12.7Hz,1H),6.10(t,J=6.0Hz,1H),5.30(q,J=6.9Hz,1H),4.90(d,J=8.9Hz,1H),4.82(d,J=8.9Hz,1H),4.64(s,1H),4.44–4.34(m,2H),4.11(d,J=9.2Hz,4H),4.02(s,2H),3.81(t,J=4.3Hz,2H),3.66–3.62(m,2H),3.59–3.52(m,4H),3.52–3.46(m,2H),3.35(dd,J=11.9,5.9Hz,2H),3.17(s,2H),2.55(d,J=7.2Hz,1H),2.35–2.22(m,3H),2.21–2.15(m,1H),2.12(s,3H),1.80(s,2H),1.59(d,J=6.9Hz,3H),1.47(s,5H);31P NMR(162MHz,DMSO-d6)δ-11.10(d,J=21.6Hz),-12.24(d,J=23.1Hz),-23.61(t,J=22.4Hz).
实施例11
(1)linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
(2)染料的合成
向50mL干燥的圆底烧瓶中依次加入染料AF532(63mg,0.1mmol,1.0eq),TSTU(1.5eq,45.2mg),加毕,加入3ml DMF溶解,最后加入DIPEA(2.5eq,52uL),然后置于45oC油浴搅拌3h,加入PEG linker 2-(2-(2-aminoethoxy)ethoxy)acetic acid(40mg,2.0eq),45oC反应过夜,加入水淬灭反应。使用制备液相纯化得目标产物(65.6mg,85%产率),产物通过MS鉴定。MS[ES(-)],m/z 771.2.
(3)终产物的合成
合成方法与实施例7-2类似,其中,将染料替换为步骤(2)获得的染料。21mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1978.4.1H NMR(400MHz,DMSO-d6)δ10.46(s,1H),8.88(t,J=5.2Hz,1H),8.80(s,2H),8.52(t,J=5.1Hz,1H),8.14(d,J=8.4Hz,2H),8.06(d,J=6.6Hz,1H),8.04(s,1H),7.90(dd,J=7.7,3.0Hz,1H),7.84(dd,J=11.5,6.6Hz,2H),7.74(t,J=5.7Hz,1H),7.69(d,J=8.7Hz,1H),7.64(d,J=3.8Hz,2H),7.49(d,J=8.0Hz,2H),7.47–7.41(m,1H),6.70(s,2H),6.66–6.56(m,1H),5.70(d,J=4.2Hz,1H),5.30(q,J=7.0Hz,1H),5.21(qd,J=6.9,2.1Hz,1H),4.45–4.38(m,2H),4.36–4.28(m,2H),4.14(s,4H),4.09-4.05(m,2H),4.02(s,2H),3.89(s,2H),3.83–3.76(m,4H),3.65-3.63(m,2H),3.61(s,2H),3.58-3.56(m,2H),3.53–3.49(m,2H),3.48–3.44(m,2H),3.30-3.26(m,2H),2.12(d,J=2.0Hz,3H),2.08(d,J=19.2Hz,3H),1.66(d,J=7.0Hz,3H),1.60(d,J=6.9Hz,3H),1.16(d,J=6.6Hz,6H),1.13(s,6H),1.00(s,6H).
实施例12
linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
合成方法与实施例11类似。
实施例13
(1)linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
(2)染料的合成
染料合成方法与实施例11类似。
(3)终产物的合成
合成方法与实施例11类似,其中,将染料替换为步骤(2)获得的染料。23mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 2154.5.1H NMR(400MHz,DMSO-d6)δ8.94(s,1H),8.88–8.83(m,1H),8.80(s,2H),8.56(s,1H),8.13(d,J=8.4Hz,2H),8.10-8.06(m,2H),7.94–7.83(m,4H),7.82(d,J=4.5Hz,1H),7.63(d,J=3.9Hz,2H),7.51(d,J=8.2Hz,2H),7.47-7.43(m,1H),6.71(s,2H),6.65–6.57(m,1H),5.67(s,1H),5.26–5.11(m,2H),4.53–4.41(m,2H),4.40–4.28(m,2H),4.15(d,J=5.2Hz,2H),4.12–4.05(m,2H),4.02(s,4H),3.83(dd,J=8.2,4.3Hz,4H),3.80–3.75(m,2H),3.59(s,4H),3.56(d,J=5.9Hz,4H),2.10(d,J=7.5Hz,5H),2.06(s,2H),1.66(d,J=6.3Hz,6H),1.17(s,6H),0.99(s,6H).
实施例14
linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
染料以及终产物的合成方法与实施例11类似。
实施例15-1
(1)linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
(2)染料的合成
染料合成方法与实施例15-2类似,使用染料AF532替代CY5。
(3)终产物的合成
合成方法与实施例7-2类似,其中,将染料替换为步骤(2)获得的染料。18mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1983.3.1H NMR(400MHz,DMSO-d6)δ10.42(d,J=144.3Hz,1H),8.97-8.80(m,2H),8.50(d,J=30.7Hz,1H),8.14–8.05(m,3H),7.91(d,J=7.8Hz,1H),7.84(dd,J=12.3,8.6Hz,2H),7.75–7.60(m,3H),7.55(d,J=8.3Hz,1H),7.49–7.42(m,1H),7.39–7.25(m,2H),6.97–6.89(m,1H),6.71(s,1H),6.64-6.58(m,1H),5.70–5.64(m,1H),5.34–5.26(m,1H),5.22(qd,J=7.0,1.8Hz,1H),4.58-4.30(m,4H),4.19(s,1H),4.14(s,2H),4.02(s,2H),3.84–3.79(m,2H),3.68–3.65(m,2H),3.60(d,J=4.6Hz,2H),3.27(d,J=4.5Hz,2H),3.15(d,J=8.9Hz,2H),2.74(s,6H),2.12(s,3H),2.09(d,J=19.8Hz,3H),1.67(d,J=6.9Hz,3H),1.60(dd,J=6.6,2.4Hz,3H),1.23(s,2H),1.18–1.13(m,6H),1.00(d,J=1.8Hz,3H).
实施例15-2
(1)linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
(2)染料的合成
向50mL干燥的圆底烧瓶中依次加入染料CY5(250mg,0.38mmol,1.0eq),TSTU(1.2eq,110mg),加毕,加入5ml DMF溶解,最后加入DIPEA(3.0eq,200uL),然后室温搅拌3h,随后,加入带磺酸的片段(114mg,2.0eq),室温搅拌6h,反应完全后,加入水淬灭反应。使用制备液相纯化获得目标产物(325mg,产率89%),产物通过MS鉴定。MS[ES(-)],m/z 807.2.
(3)终产物的合成
合成方法与实施例7-3类似,其中,将染料替换为步骤(2)获得的染料。25mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 2030.4.1H NMR(400MHz,DMSO-d6)δ10.52(s,1H),10.28(s,1H),8.43(d,J=2.5Hz,1H),8.34(t,J=13.0Hz,2H),8.00(s,1H),7.97(d,J=6.3Hz,1H),7.87(d,J=7.6Hz,1H),7.86–7.81(m,2H),7.80(s,2H),7.73(dd,J=8.6,1.9Hz,1H),7.67–7.58(m,4H),7.47–7.41(m,1H),7.34(d,J=8.4Hz,1H),7.30(dd,J=5.8,2.4Hz,2H),6.70(t,J=12.4Hz,1H),6.39(s,2H),6.37–6.24(m,3H),5.64(t,J=4.0Hz,1H),5.31(q,J=6.8Hz,1H),5.24–5.16(m,1H),4.42–4.34(m,3H),4.33–4.23(m,2H),4.13(s,2H),4.12(d,J=5.4Hz,2H),4.08–4.02(m,2H),4.00(s,2H),3.83–3.79(m,2H),3.66–3.62(m,2H),3.58–3.55(m,2H),3.43–3.39(m,2H),3.23-3.16(m,2H),2.76(dd,J=13.9,7.9Hz,2H),2.41–2.32(m,1H),2.13(d,J=1.9Hz,5H),2.08(s,1H),1.66(d,J=7.1Hz,3H),1.61(d,J=6.9Hz,3H),1.59–1.50(m,2H),1.40(dd,J=16.1,9.0Hz,2H),1.25(t,J=7.1Hz,4H).
实施例16
(1)linker的合成
linker 7的合成方法以及产物鉴定结果同实施例7-1。
(2)染料的合成
染料合成方法与实施例15-2类似,使用染料AF532替代CY5。
(3)终产物的合成
合成方法与实施例7-2类似,其中,将染料替换为步骤(2)获得的染料。22mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1984.3.1H NMR(400MHz,DMSO-d6)δ10.28(s,1H),8.81(s,3H),8.51(s,1H),8.13(d,J=8.4Hz,2H),8.08(d,J=6.2Hz,1H),8.00(s,1H),7.96–7.88(m,2H),7.82(dd,J=12.3,6.3Hz,2H),7.67(dd,J=12.5,6.7Hz,2H),7.64(s,2H),7.52(d,J=8.0Hz,2H),7.48–7.41(m,1H),6.72(s,2H),6.64–6.57(m,1H),5.67-5,64(m,1H),5.30(q,J=6.4Hz,1H),5.21(t,J=6.1Hz,1H),4.47–4.27(m,4H),4.13(s,4H),4.11–4.06(m,2H),4.02(s,2H),3.89(s,2H),3.80(dd,J=12.6,5.7Hz,4H),3.68–3.64(m,2H),3.62(s,2H),3.57(dd,J=11.3,5.1Hz,2H),3.49(s,4H),3.47(d,J=2.6Hz,4H),3.25(d,J=5.7Hz,2H),3.21(dd,J=11.6,5.8Hz,2H),2.69–2.65(m,1H),2.57(dd,J=5.7,2.7Hz,1H),2.31(t,J=6.5Hz,3H),2.12(s,2H),2.11(d,J=3.4Hz,3H),2.07(s,2H),2.06(s,2H),1.66(d,J=7.1Hz,3H),1.60(d,J=7.1Hz,3H),1.17(d,J=6.6Hz,6H),1.14(s,6H),1.01(d,J=1.9Hz,6H).
实施例17
linker的合成
linker 9的合成方法与实施例7-1类似。
合成方法与实施例7-2类似,25mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1934.3.1H NMR(400MHz,DMSO-d6)δ10.21(d,J=3.5Hz,1H),9.05(d,J=4.9Hz,1H),8.85(t,J=5.5Hz,1H),8.81(s,2H),8.13(d,J=8.4Hz,2H),8.09(d,J=6.6Hz,1H),7.99(s,1H),7.95–7.88(m,3H),7.72(dd,J=13.2,7.5Hz,2H),7.66–7.59(m,2H),7.51-7.43(m,3H),6.71(s,2H),6.67–6.58(m,1H),5.70(d,J=3.4Hz,1H),5.30(q,J=6.6Hz,1H),5.25–5.17(m,1H),4.82-4.70(m,2H),4.38–4.28(m,2H),4.21(d,J=4.3Hz,3H),4.12(s,2H),4.09–4.01(m,2H),3.89(s,2H),3.82–3.77(m,2H),3.64(dd,J=4.7,2.1Hz,2H),3.61(s,2H),3.58(dd,J=5.4,2.9Hz,2H),3.53–3.49(m,2H),3.49–3.43(m,2H),3.29(dd,J=11.8,5.9Hz,2H),2.62–2.52(m,2H),2.16(s,3H),2.08(d,J=17.6Hz,3H),1.66(d,J=7.0Hz,3H),1.59(d,J=6.9Hz,3H),1.16(d,J=6.5Hz,6H),1.14(d,J=1.2Hz,6H),1.00(d,J=2.1Hz,6H).
实施例18
linker的合成
linker 9的合成方法与实施例7-1类似。
实施例19
linker的合成
乙基苯甲酸在酸的条件下酯化,然后利用NBS溴代得到溴代产物。随后利用硫酸盐制备得到中间体,再利用硫醇胺制备二硫键化合物,水解后与PEG片段缩合得到linker 10。MS[ES(-)],m/z 599.1.1H NMR(500MHz,DMSO-d6)δ9.59(s,1H),7.80(dd,J=14.3,6.9Hz,2H),7.59(q,J=8.1Hz,2H),7.42–7.36(m,1H),5.13(q,J=6.9Hz,1H),4.44-4.33(m,2H),3.89(s,2H),3.85(s,2H),3.81–3.75(m,2H),3.61(s,2H),3.55(s,4H),3.51(t,J=5.7Hz,2H),3.35(dd,J=10.6,5.2Hz,2H),3.30–3.23(m,2H),1.63(d,J=7.0Hz,3H).
合成方法与实施例7-3类似。MS[ES(-)],m/z 1254.2.1H NMR(500MHz,DMSO-d6)δ8.54(s,1H),7.95(s,1H),7.89–7.83(m,1H),7.76(d,J=5.1Hz,1H),7.63(d,J=6.0Hz,2H),7.58(d,J=6.7Hz,2H),7.46–7.37(m,2H),7.30–7.18(m,1H),6.69–6.63(m,1H),6.35(s,2H),5.56(dd,J=6.2,5.2Hz,1H),5.32(t,J=4.8Hz,1H),5.20(dd,J=9.6,4.7Hz,1H),5.14–5.07(m,1H),4.44(s,2H),4.37–4.25(m,2H),4.12(dd,J=3.2,2.3Hz,2H),4.01(s,4H),3.89–3.84(m,2H),3.83(dd,J=6.8,4.4Hz,2H),3.63(d,J=7.7Hz,2H),3.56(s,4H),3.45–3.42(m,2H),2.45(d,J=1.9Hz,1H),2.36(d,J=0.6Hz,1H),2.02-1.96(m,6H),1.66–1.60(m,6H).
合成方法与实施例7-3类似。16mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1893.4.1H NMR(500MHz,DMSO-d6)δ10.53(s,1H),8.46–8.30(m,2H),7.87(d,J=6.8Hz,2H),7.81(s,2H),7.79(d,J=7.8Hz,1H),7.65-7.62(m,3H),7.58(q,J=7.8Hz,2H),7.46–7.36(m,2H),7.31(d,J=8.2Hz,2H),7.29(s,1H),6.59(t,J=12.3Hz,1H),6.40(s,2H),6.34–6.20(m,3H),5.63(s,1H),5.22-5.18(m,1H),5.13(q,J=6.9Hz,1H),4.49-4.44(m,1H),4.41-4.37(m,1H),4.32(s,1H),4.26(s,1H),4.12(d,J=5.0Hz,2H),4.07(t,J=8.0Hz,2H),4.00(s,2H),3.85(s,2H),3.82(t,J=4.0Hz,,3H),3.53(s,4H),3.52(s,2H),3.40–3.35(m,2H),3.29–3.24(m,2H),3.17(d,J=5.7Hz,2H),2.13(s,1H),2.06(d,J=4.0Hz,1H),1.67(s,12H),1.65(d,J=6.9Hz,3H),1.62(d,J=6.9Hz,3H),1.56–1.49(m,2H),1.35-1.29(m,2H),1.26-1.23(m,6H).
实施例20-1
linker的合成
linker 11的合成方法与实施例7-1类似。MS[ES(-)],m/z 585.1.1H NMR(500MHz,DMSO-d6)δ9.97(s,1H),9.59(s,1H),8.04(d,J=2.1Hz,1H),7.89(dd,J=8.6,2.1Hz,1H),7.55(d,J=8.6Hz,1H),5.13(q,J=6.9Hz,1H),4.44–4.34(m,2H),4.09(s,2H),3.87(s,2H),3.78(s,2H),3.66(dd,J=5.7,3.1Hz,2H),3.61(dd,J=5.6,3.1Hz,2H),3.55(t,J=5.7Hz,2H),3.37(dd,J=11.0,5.4Hz,2H),2.10(s,3H),1.62(d,J=7.0Hz,3H).
合成方法与实施例7-3类似。MS[ES(-)],m/z 1240.2.1H NMR(500MHz,DMSO-d6)δ10.83(s,1H),8.44–8.36(m,1H),8.25(s,1H),8.03–7.91(m,1H),7.87(d,J=7.8Hz,1H),7.66–7.58(m,2H),7.52(d,J=8.7Hz,1H),7.48–7.40(m,1H),7.33(d,J=8.2Hz,1H),7.30–7.23(m,1H),7.07(d,J=8.3Hz,1H),6.41-6.37(m,2H),6.35–6.27(m,1H),5.64(s,1H),5.22-5.16(m,2H),4.51–4.41(m,1H),4.41–4.35(m,1H),4.34(d,J=4.7Hz,1H),4.26(s,1H),4.25(s,2H),4.15–4.10(m,2H),4.05(s,4H),3.82(s,2H),3.68–3.58(m,6H),3.55–3.51(m,2H),2.63(t,J=7.1Hz,1H),2.37(d,J=13.0Hz,1H),2.11(d,J=18.7Hz,3H),2.08(s,3H),1.66(d,J=6.9Hz,3H),1.60(d,J=6.9Hz,3H).
合成方法与实施例7-3类似。18mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1779.4.1H NMR(500MHz,DMSO-d6)δ10.51(s,1H),10.21(s,1H),8.43–8.29(m,3H),8.12(s,1H),7.91(dd,J=10.0,3.2Hz,2H),7.87(d,J=7.4Hz,1H),7.81(s,2H),7.64-7.62(m,4H),7.53(d,J=8.6Hz,1H),7.44(td,J=7.2,1.8Hz,1H),7.35–7.28(m,3H),7.27(d,J=4.8Hz,1H),7.07(d,J=8.5Hz,1H),6.59(t,J=12.3Hz,1H),6.37(s,1H),6.31(dd,J=14.2,6.9Hz,3H),5.63(s,1H),5.23–5.16(m,1H),5.13(q,J=7.0Hz,1H),4.48–4.39(m,2H),4.33(t,J=4.2Hz,1H),4.26(t,J=3.5Hz,1H),4.13(s,2H),4.11(s,2H),4.06(s,2H),4.00(s,2H),3.83–3.80(m,2H),3.65-3.63(m,2H),3.56(dd,J=7.8,3.4Hz,2H),3.53(d,J=7.3Hz,2H),3.40(d,J=5.4Hz,2H),3.19(dd,J=11.3,5.7Hz,2H),2.63(t,J=5.4Hz,1H),2.41–2.34(m,1H),2.13(s,1H),2.10–2.06(m,6H),1.68(s,12H),1.65(d,J=7.0Hz,3H),1.61(d,J=6.9Hz,3H),1.54–1.49(m,2H),1.32(dd,J=12.2,6.8Hz,2H),1.25(dd,J=11.3,4.5Hz,9H).
实施例20-2
linker的合成
linker的合成方法与实施例20-1类似。
合成路线与实施例20-1类似。
实施例21
linker的合成
linker 12的合成方法与实施例7-1类似。MS[ES(-)],m/z 629.2.1H NMR(500MHz,DMSO-d6)δ9.53(s,1H),8.22(t,J=5.7Hz,1H),7.85(d,J=8.7Hz,1H),7.14(d,J=2.5Hz,1H),6.96(dd,J=8.8,2.5Hz,1H),5.33(q,J=6.8Hz,1H),4.63–4.53(m,2H),4.40-4.30(m,2H),3.94(s,2H),3.79(t,J=4.5Hz,2H),3.52–3.48(m,4H),3.46–3.43(m,2H),3.36–3.32(m,4H),3.29(dd,J=11.8,5.9Hz,2H),2.13(s,3H),1.62(d,J=7.0Hz,3H).
合成方法与实施例7-3类似。MS[ES(-)],m/z 1284.2.1H NMR(500MHz,DMSO-d6)δ8.77(s,1H),8.46(dd,J=14.7,6.2Hz,1H),7.89(dd,J=17.9,8.1Hz,2H),7.66–7.60(m,2H),7.47–7.41(m,1H),7.30(d,J=4.2Hz,1H),7.09(d,J=1.9Hz,1H),7.07–6.99(m,1H),6.51–6.35(m,2H),6.35–6.23(m,1H),5.64(s,1H),5.35(d,J=6.9Hz,1H),5.20(dd,J=6.9,2.8Hz,1H),4.66(s,2H),4.44–4.38(m,1H),4.37–4.33(m,1H),4.32(d,J=4.8Hz,1H),4.25(t,J=4.2Hz,1H),4.11(d,J=5.2Hz,2H),4.05–4.02(m,2H),4.01(s,2H),3.83–3.80(m,2H),3.62(s,2H),3.51(d,J=7.5Hz,4H),3.45(d,J=5.5Hz,4H),3.29–3.25(m,2H),2.49–2.43(m,1H),2.41-2.36(m,1H),2.10(d,J=26.1Hz,6H),1.66(d,J=7.0Hz,3H),1.62(d,J=6.9Hz,3H).
合成方法与实施例7-3类似。21mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1924.4.1H NMR(500MHz,DMSO-d6)δ10.55(s,1H),8.49(d,J=6.0Hz,1H),8.36(t,J=12.9Hz,2H),7.89–7.84(m,2H),7.81(s,2H),7.65–7.59(m,3H),7.47–7.40(m,1H),7.31(dd,J=8.2,1.4Hz,2H),7.12(d,J=2.2Hz,1H),7.01–6.94(m,1H),6.59(t,J=12.2Hz,1H),6.40(s,2H),6.30(dd,J=13.2,4.5Hz,2H),5.60(d,J=58.2Hz,1H),5.33(q,J=6.9Hz,1H),5.20(dd,J=12.8,5.8Hz,1H),4.58(s,2H),4.44–4.33(m,2H),4.33–4.28(m,1H),4.28–4.22(m,1H),4.13(dd,J=11.7,5.6Hz,2H),4.09–4.05(m,2H),4.00(s,2H),3.82–3.79(m,2H),3.48(s,2H),3.45–3.42(m,2H),3.38–3.34(m,2H),3.28(dd,J=11.5,5.8Hz,2H),3.16(dd,J=11.3,5.5Hz,2H),2.13(s,1H),2.12(s,2H),2.08–2.03(m,3H),1.68(s,9H),1.65(d,J=6.2Hz,3H),1.61(d,J=6.9Hz,3H),1.55–1.49(m,2H),1.35–1.30(m,2H),1.25(dd,J=12.0,4.4Hz,6H).
实施例22
linker的合成
linker 13的合成方法与实施例7-1类似。。MS[ES(-)],m/z 599.1.1H NMR(500MHz,DMSO-d6)δ9.53(s,1H),8.81(t,J=5.5Hz,1H),8.05(s,1H),7.84(s,2H),5.17(q,J=7.0Hz,1H),4.50–4.31(m,2H),3.84(s,2H),3.80–3.77(m,2H),3.55(d,J=6.1Hz,2H),3.53(s,4H),3.49(t,J=5.8Hz,2H),3.43(dd,J=11.5,5.7Hz,2H),3.32(dd,J=10.7,5.3Hz,2H),2.09(s,3H),1.67(d,J=7.0Hz,3H).
合成方法与实施例7-3类似。MS[ES(-)],m/z 1099.2.1H NMR(500MHz,DMSO-d6)δ9.36(s,1H),8.43(s,1H),8.06(d,J=7.9Hz,2H),7.92(d,J=8.2Hz,1H),7.20(s,1H),6.45(s,2H),6.23(dd,J=8.8,6.0Hz,1H),5.18(q,J=7.1Hz,1H),4.90(d,J=8.8Hz,1H),4.85(d,J=8.8Hz,1H),4.53(d,J=4.0Hz,1H),4.51–4.36(m,2H),4.14–4.05(m,4H),4.01(s,2H),3.90(dd,J=11.1,6.1Hz,2H),3.85–3.80(m,2H),3.63–3.58(m,6H),3.54(s,4H),2.62–2.54(m,1H),2.28(dd,J=12.9,5.5Hz,1H),2.09(d,J=2.8Hz,3H),1.66(d,J=7.0Hz,3H).
合成方法与实施例7-3类似。13mg固体,HPLC纯度>99%。
MS[ES(-)],m/z 1738.4.1H NMR(500MHz,DMSO-d6)δ10.55(s,1H),8.91(s,1H),8.45(t,J=5.6Hz,1H),8.35(t,J=13.0Hz,2H),8.04(s,1H),7.92–7.84(m,3H),7.80(d,J=1.7Hz,2H),7.64(ddd,J=8.2,3.7,1.5Hz,2H),7.31(dd,J=8.3,3.0Hz,2H),7.22(s,1H),6.59(t,J=12.3Hz,1H),6.46(s,2H),6.30(dd,J=13.7,4.3Hz,2H),6.21(dd,J=8.9,5.8Hz,1H),5.15(q,J=6.9Hz,1H),4.90(d,J=8.9Hz,1H),4.85(d,J=8.9Hz,1H),4.53(d,J=3.9Hz,1H),4.51–4.44(m,1H),4.44–4.38(m,1H),4.15-4.09(m,4H),4.09–4.03(m,2H),3.99(s,2H),3.97–3.87(m,2H),3.84–3.80(m,2H),3.76–3.72(m,2H),3.44–3.41(m,2H),3.38–3.34(m,4H),3.15(dd,J=11.6,5.8Hz,2H),2.91–2.88(m,2H),2.66–2.60(m,1H),2.28(dd,J=13.1,5.6Hz,1H),2.08(s,3H),2.07–2.02(m,2H),1.67(s,12H),1.65(d,J=8.0Hz,3H),1.56–1.48(m,2H),1.35–1.29(m,2H),1.26-1.22(m,5H).
实施例23
linker的合成
合成路线与实施例19类似。
实施例24
合成路线与实施例7-3类似。
实施例25
合成路线与实施例7-3类似。
实施例26
linker 2的合成方法参见实施例2。
核苷与linker 2DCC缩合得到酯化产物,随后脱去TBS保护基、三磷酸化以及氨解后得到片段,片段与染料偶联得到产品。
实施例27
合成路线与实施例19类似。
实施例28
合成路线与实施例7-1类似。
实施例29
合成路线与实施例7-1类似。
实施例30
合成路线与实施例7-1类似。
实施例31
合成路线与实施例7-1类似。
实施例32
合成路线与实施例7-1类似。
实施例33
合成路线与实施例7-1类似。
实施例34
合成路线参考实施例19。
实施例35
合成路线与实施例22类似。
实施例36
合成路线与实施例19类似。
实施例37
合成路线与实施例8类似。
实施例38
合成路线与实施例7-2类似。
实施例39
合成路线与实施例6-2类似。
实施例40
合成路线与实施例19类似。
实施例41
合成路线与实施例22类似。
实施例42
linker 2的合成参见实施例2。
化合物缩合后得到TBS保护核苷,氨解去掉乙酰基后,与linker2 DCC缩合,脱去TBS保护基,三磷酸化后再氨基得到氨基化合物,最后标记荧光染料得到产品。
实施例43
linker的合成
Linker在DCC缩合条件下反应,脱去TBS保护基,三磷酸化后得到三磷酸。氨基脱去三氟乙酰基,最后与染料缩合得到产品。
实施例44
linker 2的合成
linker 2在DCC缩合条件下反应,脱去TBS保护基,三磷酸化后得到三磷酸。氨基脱去三氟乙酰基,最后与染料缩合得到产品。
实施例45
linker的合成
合成路线与实施例2类似。
实施例46
linker的合成
linker的合成参见实施例3。
实施例47
linker的合成
合成路线与实施例2类似。
实施例48
linker的合成
linker是2-(2-(2-氨基乙氧基)乙氧基)乙酸盐酸盐,直接购买自安耐吉化学,货号A012027。
合成路线与实施例19类似。
二、测序效果评估实施例
以下四种cold dNTP可以参照PCT/CN2021/125262中实施例三十、实施例三十一、实施例三十二、实施例三十三的制备方法进行合成。
具体地:
合成路线如下:
MW=692。1H NMR(400MHz,D2O)δ7.90–7.82(m,2H),7.69–7.58(m,2H),7.46–7.39(m,1H),6.47–6.35(m,1H),5.73(s,1H),5.10-5.01(m,1H),4.57(dd,J=13.6,3.0Hz,1H),4.41–4.24(m,2H),2.65–2.52(m,2H),1.98(d,J=15.2Hz,3H),1.94(s,3H),1.68(d,J=7.2Hz,3H).
合成路线如下:
MW=717。1H NMR(400MHz,D2O)δ8.14(t,J=3.1Hz,1H),7.82(dd,J=8.1,3.1Hz,1H),7.55(q,J=3.2Hz,2H),7.38-7.34(m,1H),6.31-6.22(m,1H),5.76(d,J=4.1Hz,1H),5.10–5.00(m,1H),4.65–4.55(m,1H),4.36-4.21(m,2H),3.02–2.94(m,1H),2.71–2.61(m,1H),1.94(dd,J=22.2,3.2Hz,3H),1.62(dd,J=7.2,3.3Hz,3H).
合成路线如下:
MW=677。1H NMR(400MHz,D2O)δ8.08–8.00(m,1H),7.91–7.84(m,1H),7.72–7.59(m,2H),7.49–7.40(m,1H),6.48–6.40(m,1H),6.19(dd,J=7.7,2.3Hz,1H),5.73–5.64(m,1H),5.13–5.02(m,1H),4.60(d,J=12.6Hz,1H),4.36-4.27(m,2H),2.71-2.64(m,1H),2.55–2.44(m,1H),2.00(dd,J=9.5,2.2Hz,3H),1.69(dd,J=7.2,2.1Hz,3H).
合成路线如下:
MW=701。1H NMR(400MHz,D2O)δ8.53(dd,J=5.2,1.8Hz,1H),8.18–8.10(m,1H),7.83(d,J=7.8Hz,1H),7.55-7.51(m,2H),7.38-7.34(m,1H),6.49-6.40(m,1H),5.81–5.73(m,1H),5.07-5.00(m,1H),4.67–4.57(m,1H),4.39–4.18(m,2H),3.06–2.95(m,1H),2.75(ddd,J=21.2,14.2,5.6Hz,1H),1.93(dd,J=25.1,1.9Hz,3H),1.60(dd,J=6.9,4.0Hz,3H).
测序例1
核苷酸底物
(1)hot dNTP:实施例7-1至7-4合成获得的四种终产物(命名为SSEB Hot Mix_V8),结构如下。
(2)cold dNTP:如上所述方法合成以下四种cold dNTP,结构如下。
按照MGISEQ-2000测序仪操作规程,使用上述核苷酸底物以及MGISEQ-2000高通量测序试剂套装(FCL SE50)进行测序。
1.利用Ecoli测序文库制备DNA纳米球。
2.将DNA纳米球装载到BGISEQ2000测序芯片上。
3.将装载完成的测序芯片加载至BGISEQ2000测序仪上,设置测序流程,hot dNTP聚合:60℃2min;cold dNTP聚合:60℃2min;信号采集;切除阻断基团:65℃2min。
4.下机数据进行basecall分析,输出测序指标、比对率、错误率、Q30等,结果见表1。
结果表明,此类核苷酸类似物在高通量测序中起到良好的可逆阻断效果,可实现逐个检测测序中掺入的核苷酸类型。
表1 Basecall分析结果
核苷酸类似物hot dNTP Mix | SSEB Hot Mix_V8 |
参考基因(Reference) | Ecoli |
循环数(Cycle Number) | 51 |
Q30(%) | 92.67 |
Lag(%) | 0.43 |
Runon(%) | 0.31 |
ESR(%) | 82.60 |
比对率(Mapping Rate,%) | 98.15 |
平均错误率(AvgError Rate,%) | 0.50 |
注:
1、Q30(%)指Basecall结果错误率低于0.001(准确性高于99.9%)的base占有比率;
2、Lag(%)指测序滞后所占比率;
3、Runon(%)指测序超前所占比率;
4、ESR(%)指经过过滤最终测序所得的reads数(Total Reads)占Basecall能识别出来的DNB数量(DNB Number)的比率。
测序例2
核苷酸底物
(1)hot dNTP:实施例7-1、7-4、11、15-2合成获得的四种终产物(命名为SSEB HotMix-V8V9V11),结构如下。
(2)cold dNTP:通过常规方法合成四种cold dNTP,结构如下。
按照MGISEQ-2000测序仪操作规程,使用上述核苷酸底物以及MGISEQ-2000高通量测序试剂套装(FCL PE100)进行测序。
1.利用Ecoli测序文库制备DNA纳米球;
2.将DNA纳米球装载到BGISEQ2000测序芯片上;
3.将装载完成的测序芯片加载至BGISEQ2000测序仪上,设置测序流程,hot dNTP聚合:55℃30s;cold dNTP聚合:55℃60s;信号采集;切除阻断基团:55℃8s。
4.下机数据进行basecall分析,输出测序指标、比对率、错误率、Q30等,结果见表2。
结果表明,此类核苷酸类似物在高通量测序中起到良好的可逆阻断效果,可实现逐个检测测序中掺入的核苷酸类型。
表2 Basecall分析结果
核苷酸类似物hot dNTP Mix | SSEB Hot Mix-V8V9V11 |
参考基因(Reference) | Ecoli |
循环数(Cycle Number) | 212 |
Q30(%) | 95.79 |
Lag 1(%) | 0.08 |
Lag 2(%) | 0.11 |
Runon 1(%) | 0.12 |
Runon 2(%) | 0.26 |
ESR(%) | 76.81 |
比对率(Mapping Rate,%) | 99.89 |
平均错误率(AvgError Rate,%) | 0.15 |
测序例3
核苷酸底物
(1)hot dNTP:实施例10-1、10-2、10-3、10-4合成获得的四种终产物(命名为SSEBHot Mix-N3),结构如下。
(2)cold dNTP:通过常规方法合成四种cold dNTP,结构如下。
按照MGISEQ-2000测序仪操作规程,使用上述核苷酸底物以及MGISEQ-2000高通量测序试剂套装(FCL PE100)进行测序。
1.利用Ecoli测序文库制备DNA纳米球;
2.将DNA纳米球装载到BGISEQ2000测序芯片上;
3.将装载完成的测序芯片加载至BGISEQ2000测序仪上,设置测序流程,hot dNTP聚合:60℃2min;cold dNTP聚合:60℃2min;信号采集;切除阻断基团:65℃2min。
4.下机数据进行basecall分析,输出测序指标、比对率、错误率、Q30等,结果见表3。
结果表明,此类核苷酸类似物在高通量测序中起到良好的可逆阻断效果,可实现逐个检测测序中掺入的核苷酸类型。
表3 Basecall分析结果
核苷酸类似物hot dNTP Mix | SSEB Hot Mix-N<sub>3</sub> |
参考基因(Reference) | Ecoli |
循环数(Cycle Number) | 53 |
Q30(%) | 95.45 |
Lag 1(%) | 0.20 |
Lag 2(%) | 0.22 |
Runon 1(%) | 0.43 |
Runon 2(%) | 0.45 |
ESR(%) | 80.29 |
比对率(Mapping Rate,%) | 96.82 |
平均错误率(AvgError Rate,%) | 0.57 |
Claims (16)
1.式I-1所示的化合物或其盐,
其中:
r1、r2、r3a、r3b各自独立地选自1-6之间的任意整数;
优选地,r1选自1、2、3;
更优选地,r1为1;
优选地,r2选自1、2、3;
更优选地,r2为1;
优选地,r3a、r3b各自独立地选自1、2、3、4、5;
更优选地,r3a、r3b各自独立地选自1、2、3;
最优选地,r3a为1;
最优选地,r3b为2;
M选自直接键、CH2、NH、O、S;
优选地,M选自CH2、O;
X选自O、S、NH;
优选地,X选自O、S;
更优选地,X为O;
Y选自直接键、O、S、NH;
优选地,Y为直接键;
W选自直接键、O、S、NH;
优选地,W为直接键;
r5、r6各自独立地选自1-6之间的任意整数;
优选地,r5选自1、2、3;
更优选地,r5为2;
优选地,r6选自1、2、3;
更优选地,r6为1或2;
M1、M3各自独立地选自直接键、NH、O、S;
优选地,M1选自直接键、NH、O;
优选地,M3选自直接键、NH;
更优选地,M1为NH、O或S时,M3为直接键,且M3为NH、O或S时,M1为直接键;
Rb、Rc中,任意一个选自-N3、-SS-C1-C6烷基(如-SS-Me,-SS-Et,-SS-iPr,-SS-t-Bu),另一个选自C1-C6烷基;
优选地,Rb、Rc中,任意一个选自-N3、-SS-Me,另一个为甲基;
Z选自O,S,BH;
优选地,Z为O;
base1选自碱基、脱氮碱基或其互变异构体,例如腺嘌呤、7-脱氮腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体;
R’表示可逆阻断基团。
4.权利要求1-3任一项所述的化合物或其盐,其中,所述化合物或其盐携带额外的可检测标记;
优选地,所述化合物或其盐携带的额外的可检测标记是通过亲和试剂(如抗体、适体、Affimer、Knottin)引入的,所述亲和试剂携带所述可检测标记,且所述亲和试剂可以特异性识别并结合所述化合物或其盐的表位;
或者优选地,所述可检测标记与权利要求1-2任一项所述的式I-1所示化合物中的R或权利要求3的化合物中对应于R的结构部分连接;
优选地,base1不同,式I-1所示化合物携带的额外的可检测标记不同;
优选地,所述可检测标记为荧光标记;
优选地,所述可检测标记选自以下:iF700、
6.终止核酸合成的方法,其包括:将权利要求1-5任一项所述的化合物或其盐掺入待终止的核酸分子中;
优选地,所述化合物或其盐的掺入通过末端转移酶、末端聚合酶或逆转录酶来实现;
优选地,所述方法包括:使用聚合酶,将所述化合物或其盐掺入待终止的核酸分子中;
优选地,所述方法包括:在允许聚合酶进行核苷酸聚合反应的条件下,使用聚合酶进行核苷酸聚合反应,从而将所述化合物或其盐掺入待终止的核酸分子的3'端。
7.制备在测序反应中与目标单链多核苷酸互补的生长的多核苷酸的方法,其包括将权利要求1-5中任一项所述的化合物或其盐掺入所述生长的互补多核苷酸,其中,所述化合物或其盐的掺入防止了任何后续的核苷酸引入所述生长的互补多核苷酸中;
优选地,所述化合物或其盐的掺入通过末端转移酶、末端聚合酶或逆转录酶来实现;
优选地,所述方法包括:使用聚合酶,将所述化合物或其盐掺入所述生长的互补多核苷酸;
优选地,所述方法包括:在允许聚合酶进行核苷酸聚合反应的条件下,使用聚合酶进行核苷酸聚合反应,从而将所述化合物或其盐掺入所述生长的互补多核苷酸的3'端。
8.核酸中间体,其是在测定目标单链多核苷酸的序列中形成的,其中,
所述核酸中间体是通过以下步骤形成的:
向生长的核酸链中掺入一个与目标单链多核苷酸互补的核苷酸,形成所述核酸中间体,其中,掺入的一个互补核苷酸是权利要求1-5中任一项所述的化合物或其盐;
或者,所述核酸中间体是通过以下步骤形成的:
向生长的核酸链中掺入一个与目标单链多核苷酸互补的核苷酸,形成所述核酸中间体,其中,掺入的一个互补核苷酸是权利要求1-5中任一项所述的化合物或其盐,且所述生长的核酸链中预先掺入至少一个与目标单链多核苷酸互补的核苷酸,预先掺入的至少一个与目标单链多核苷酸互补的核苷酸是已被除去可逆阻断基团和任选的可检测标记的权利要求1-5中任一项所述的化合物或其盐。
9.测定目标单链多核苷酸的序列的方法,其包括:
1)监测生长的核酸链中与目标单链多核苷酸互补的核苷酸的掺入,其中,掺入的至少一个互补核苷酸是权利要求1-5中任一项所述的化合物或其盐,以及,
2)确定掺入的核苷酸的类型;
优选地,在引入下一个互补核苷酸之前,将所述可逆阻断基团和任选的可检测标记除去;
优选地,所述可逆阻断基团和所述可检测标记被同时除去;
优选地,所述可逆阻断基团和所述可检测标记被先后除去;例如,在所述可检测标记被除去之后,所述可逆阻断基团被除去,或者,在所述可逆阻断基团被除去之后,所述可检测标记被除去。
10.权利要求9的方法,其包括以下步骤:
(a)提供多种不同的核苷酸,其中至少一种核苷酸是权利要求4-5任一项所述的化合物或其盐,任选地其余的核苷酸是权利要求1-5任一项所述的化合物或其盐;
(b)将所述多种不同的核苷酸掺入目标单链多核苷酸的互补序列中,其中,所述多种不同的核苷酸在检测时可以相互区分开;
(c)检测(b)的核苷酸,从而确定掺入的核苷酸的类型;
(d)除去(b)的核苷酸中的可逆阻断基团和任选的其携带的可检测标记;和
(e)任选地重复步骤(a)-(d)一次或多次;
从而确定所述目标单链多核苷酸的序列。
11.权利要求9的方法,其包括以下步骤:
(1)提供第一核苷酸、第二核苷酸、第三核苷酸和第四核苷酸,四种核苷酸中的至少一种是权利要求4-5中任一项所述的化合物或其盐,任选地其余的核苷酸是权利要求1-5任一项所述的化合物或其盐;
(2)将所述四种核苷酸与目标单链多核苷酸进行接触;除去未掺入生长的核酸链中的所述核苷酸;检测掺入生长的核酸链中的所述核苷酸;除去掺入生长的核酸链中的所述核苷酸中的所述可逆阻断基团和任选的其携带的所述可检测标记;
任选地,还包括(3):重复(1)-(2)一次或多次。
12.权利要求9的方法,其包括以下步骤:
(a)提供包含双链体、包含至少一种权利要求4-5中任一项所述的化合物或其盐的核苷酸、聚合酶和切除试剂的混合物;所述双链体包含生长的核酸链以及待测序的核酸链;
(b)进行包含以下步骤(i)、(ii)和(iii)的反应,任选地,重复一次或多次:
步骤(i):使用聚合酶,使所述化合物或其盐掺入生长的核酸链,形成包含可逆阻断基团和任选的可检测标记的核酸中间体:
步骤(ii):对所述核酸中间体进行检测;
步骤(iii):使用切除试剂将所述核酸中间体所包含的可逆阻断基团和任选的可检测标记切除;
优选地,对所述可逆阻断基团的切除和对所述可检测标记的切除同时进行,或者,对所述可逆阻断基团的切除和对所述可检测标记的切除分步进行(例如,先切除所述可逆阻断基团,或者先切除所述可检测标记);
优选地,对所述可逆阻断基团的切除和对所述可检测标记的切除使用的切除试剂是同样的试剂;
优选地,对所述可逆阻断基团的切除和对所述可检测标记的切除使用的切除试剂是不同的试剂。
13.权利要求12的方法,其中,所述双链体连接于支持物上;
优选地,所述生长的核酸链为引物;
优选地,所述引物通过退火至待测序的核酸链上,形成所述双链体;
优选地,所述双链体、所述化合物或其盐、以及所述聚合酶一起形成含有溶液相和固相的反应体系;
优选地,在允许聚合酶进行核苷酸聚合反应的条件下,使用聚合酶,使所述化合物或其盐掺入生长的核酸链,形成包含可逆阻断基团和任选的可检测标记的核酸中间体;
优选地,所述聚合酶选自KOD聚合酶或其突变体(例如KOD POL151、KOD POL157、KODPOL171、KOD POL174、KOD POL376、KOD POL391);
优选地,在任意一个检测所述核酸中间体的步骤前,移除前一步骤的反应体系的溶液相,保留连接于支持物上的双链体;
优选地,所述切除试剂与所述双链体或所述生长的核酸链在含有溶液相和固相的反应体系中接触;
优选地,所述切除试剂能够切除掺入生长的核酸链的化合物中的可逆阻断基团和任选的其携带的可检测标记,并且不会影响双链体骨架上的磷酸二酯键;
优选地,在任意一个切除所述核酸中间体所包含的可逆阻断基团和任选的可检测标记的步骤后,移除这一步骤反应体系的溶液相;
优选地,在任意一个包含移除操作的步骤之后,进行洗涤操作;
优选地,步骤(ii)之后,进一步包括:根据步骤(ii)检测得到的信号,确定步骤(i)中掺入生长的核酸链的化合物的类型,并基于碱基互补配对原则,确定待测序的核酸链中相应位置处的核苷酸类型。
14.试剂盒,其包含至少一个权利要求1-5任一项所述的化合物或其盐;
优选地,所述试剂盒包含第一、第二、第三和第四化合物,所述第一、第二、第三和第四化合物各自独立地为权利要求1-5任一项所述的化合物或其盐;
优选地,所述第一化合物中,base1选自腺嘌呤、7-脱氮腺嘌呤或其互变异构体(例如);所述第二化合物中,base1选自胸腺嘧啶、尿嘧啶或其互变异构体(例如);所述第三化合物中,base1选自胞嘧啶或其互变异构体(例如);所述第四化合物中,base1选自鸟嘌呤、7-脱氮鸟嘌呤或其互变异构体(例如);
优选地,所述第一、第二、第三和第四化合物包含的base1互不相同;
优选地,所述第一、第二、第三和第四化合物携带的额外的可检测标记互不相同。
15.权利要求14的试剂盒,其中,所述试剂盒还包含:用于预处理核酸分子的试剂;用于连接待测序的核酸分子的支持物;用于将待测序的核酸分子与支持物连接(例如,共价或非共价连接)的试剂;用于起始核苷酸聚合反应的引物;用于进行核苷酸聚合反应的聚合酶;一种或多种缓冲溶液;一种或多种洗涤溶液;或其任何组合。
16.权利要求1-5任一项所述的化合物或其盐或者权利要求14-15任一项所述的试剂盒用于测定目标单链多核苷酸的序列的用途。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2021103557854 | 2021-04-01 | ||
CN202110355785 | 2021-04-01 | ||
CNPCT/CN2022/080021 | 2022-03-09 | ||
CN2022080021 | 2022-03-09 | ||
CN202210334918.4A CN115197291A (zh) | 2021-04-01 | 2022-03-31 | 用于测序的核苷酸类似物 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210334918.4A Division CN115197291A (zh) | 2021-04-01 | 2022-03-31 | 用于测序的核苷酸类似物 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115197290A true CN115197290A (zh) | 2022-10-18 |
Family
ID=83458067
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210404723.2A Pending CN115197290A (zh) | 2021-04-01 | 2022-03-31 | 用于测序的核苷酸类似物 |
CN202210334918.4A Pending CN115197291A (zh) | 2021-04-01 | 2022-03-31 | 用于测序的核苷酸类似物 |
CN202210403302.8A Pending CN115197289A (zh) | 2021-04-01 | 2022-03-31 | 用于测序的核苷酸类似物 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210334918.4A Pending CN115197291A (zh) | 2021-04-01 | 2022-03-31 | 用于测序的核苷酸类似物 |
CN202210403302.8A Pending CN115197289A (zh) | 2021-04-01 | 2022-03-31 | 用于测序的核苷酸类似物 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20240209439A1 (zh) |
EP (1) | EP4317168A1 (zh) |
JP (1) | JP2024513207A (zh) |
KR (1) | KR20230166114A (zh) |
CN (3) | CN115197290A (zh) |
AU (1) | AU2022251249A1 (zh) |
CA (1) | CA3214986A1 (zh) |
WO (1) | WO2022206922A1 (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009051807A1 (en) * | 2007-10-19 | 2009-04-23 | The Trustees Of Columbia University In The City Of New York | Design and synthesis of cleavable fluorescent nucleotides as reversible terminators for dna sequencing by synthesis |
CN108779138A (zh) * | 2015-09-28 | 2018-11-09 | 哥伦比亚大学董事会 | 用作dna合成测序的可逆终止物的基于新的二硫键接头的核苷酸的设计与合成 |
WO2019071474A1 (zh) * | 2017-10-11 | 2019-04-18 | 深圳华大智造科技有限公司 | 修饰的核苷或核苷酸 |
CN109661232A (zh) * | 2016-05-23 | 2019-04-19 | 纽约哥伦比亚大学董事会 | 核苷酸衍生物及其使用方法 |
CN112218640A (zh) * | 2018-03-15 | 2021-01-12 | 哥伦比亚大学董事会 | 核苷酸类似物及其在核酸测序和分析中的用途 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018129214A1 (en) | 2017-01-04 | 2018-07-12 | Complete Genomics, Inc. | Stepwise sequencing by non-labeled reversible terminators or natural nucleotides |
JP2023546741A (ja) * | 2020-10-21 | 2023-11-07 | ビージーアイ シェンチェン | 修飾ヌクレオシド又はヌクレオチド |
-
2022
- 2022-03-31 WO PCT/CN2022/084601 patent/WO2022206922A1/zh active Application Filing
- 2022-03-31 CA CA3214986A patent/CA3214986A1/en active Pending
- 2022-03-31 US US18/284,054 patent/US20240209439A1/en active Pending
- 2022-03-31 CN CN202210404723.2A patent/CN115197290A/zh active Pending
- 2022-03-31 CN CN202210334918.4A patent/CN115197291A/zh active Pending
- 2022-03-31 CN CN202210403302.8A patent/CN115197289A/zh active Pending
- 2022-03-31 AU AU2022251249A patent/AU2022251249A1/en active Pending
- 2022-03-31 EP EP22779102.7A patent/EP4317168A1/en active Pending
- 2022-03-31 JP JP2023560439A patent/JP2024513207A/ja active Pending
- 2022-03-31 KR KR1020237037677A patent/KR20230166114A/ko unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009051807A1 (en) * | 2007-10-19 | 2009-04-23 | The Trustees Of Columbia University In The City Of New York | Design and synthesis of cleavable fluorescent nucleotides as reversible terminators for dna sequencing by synthesis |
CN108779138A (zh) * | 2015-09-28 | 2018-11-09 | 哥伦比亚大学董事会 | 用作dna合成测序的可逆终止物的基于新的二硫键接头的核苷酸的设计与合成 |
CN109661232A (zh) * | 2016-05-23 | 2019-04-19 | 纽约哥伦比亚大学董事会 | 核苷酸衍生物及其使用方法 |
WO2019071474A1 (zh) * | 2017-10-11 | 2019-04-18 | 深圳华大智造科技有限公司 | 修饰的核苷或核苷酸 |
CN112218640A (zh) * | 2018-03-15 | 2021-01-12 | 哥伦比亚大学董事会 | 核苷酸类似物及其在核酸测序和分析中的用途 |
Also Published As
Publication number | Publication date |
---|---|
AU2022251249A1 (en) | 2023-11-16 |
CA3214986A1 (en) | 2022-10-06 |
WO2022206922A1 (zh) | 2022-10-06 |
CN115197289A (zh) | 2022-10-18 |
EP4317168A1 (en) | 2024-02-07 |
KR20230166114A (ko) | 2023-12-06 |
US20240209439A1 (en) | 2024-06-27 |
JP2024513207A (ja) | 2024-03-22 |
CN115197291A (zh) | 2022-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3794012B1 (en) | Compositions and methods for chemical cleavage and deprotection of surface-bound oligonucleotides | |
CN105164106B (zh) | 多次甲基化合物和其作为荧光标记物的用途 | |
CN108290870B (zh) | 多次甲基化合物和其作为荧光标记物的用途 | |
EP0915901A1 (en) | Propargylethoxyamino nucleotides | |
JPH10506270A (ja) | 新規な塩基対形成スキームの使用による非特異的ハイブリダイゼーションの減少 | |
CN101605743A (zh) | 用于产生报告分子的点击化学 | |
AU2008201041A1 (en) | Primer, primer set, and nucleic acid amplification method and mutation detection method using the same | |
CN111094315B (zh) | 用于测序应用中的核苷酸的短悬垂臂连接基 | |
EP2891714B1 (en) | Method for analyzing target nucleic acid, kit, and analyzer | |
CN106459001A (zh) | 多次甲基化合物和其作为荧光标记物的用途 | |
WO2022083686A1 (zh) | 修饰的核苷或核苷酸 | |
CN113105516A (zh) | 光可断裂的荧光标记化合物及用途 | |
CN108251516B (zh) | Dna单分子测序方法与测序系统 | |
EP3124622A1 (en) | Fluorescent labeled single-stranded nucleic acid and use thereof | |
CN113004358A (zh) | 一种硒或硫代胸腺嘧啶核苷-5’-三磷酸及其合成方法 | |
US20230332197A1 (en) | Nucleosides and nucleotides with 3' vinyl blocking group | |
JP2001526639A (ja) | 三環式塩基類似体 | |
CN115197290A (zh) | 用于测序的核苷酸类似物 | |
US20220195518A1 (en) | Methods and compositions for nucleic acid sequencing | |
WO2023280156A1 (zh) | 修饰的核苷或核苷酸 | |
WO2023186815A1 (en) | Labeled avidin and methods for sequencing | |
CN117567536A (zh) | 荧光标记核苷酸在dna合成测序以及单分子测序中的应用 | |
CN118239996A (zh) | 荧光标记核苷酸在dna合成测序以及单分子测序中的应用 | |
CN103232511B (zh) | 光可裂解基团保护的三磷酸脱氧尿苷衍生物及其合成方法和应用 | |
CN118546193A (zh) | 用于氧化亚磷酸三酯的氧化剂及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40074523 Country of ref document: HK |