CN112638925A - 具有3’-羟基封闭基团的核苷和核苷酸以及它们在多核苷酸测序方法中的用途 - Google Patents
具有3’-羟基封闭基团的核苷和核苷酸以及它们在多核苷酸测序方法中的用途 Download PDFInfo
- Publication number
- CN112638925A CN112638925A CN201980042583.5A CN201980042583A CN112638925A CN 112638925 A CN112638925 A CN 112638925A CN 201980042583 A CN201980042583 A CN 201980042583A CN 112638925 A CN112638925 A CN 112638925A
- Authority
- CN
- China
- Prior art keywords
- nucleotide
- nucleoside
- group
- optionally substituted
- nucleotides
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 384
- 239000002773 nucleotide Substances 0.000 title claims abstract description 371
- 239000002777 nucleoside Substances 0.000 title claims abstract description 137
- 230000000903 blocking effect Effects 0.000 title claims abstract description 124
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 107
- 108091033319 polynucleotide Proteins 0.000 title claims description 119
- 239000002157 polynucleotide Substances 0.000 title claims description 119
- 102000040430 polynucleotide Human genes 0.000 title claims description 119
- 125000003835 nucleoside group Chemical group 0.000 title claims description 34
- 238000000034 method Methods 0.000 claims abstract description 101
- 150000003833 nucleoside derivatives Chemical class 0.000 claims abstract description 87
- 125000002777 acetyl group Chemical class [H]C([H])([H])C(*)=O 0.000 claims abstract 2
- -1 C2-C6Alkenyl radical Chemical class 0.000 claims description 87
- 238000006243 chemical reaction Methods 0.000 claims description 85
- KDLHZDBZIXYQEI-UHFFFAOYSA-N Palladium Chemical compound [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 claims description 78
- 239000000243 solution Substances 0.000 claims description 78
- 125000005647 linker group Chemical group 0.000 claims description 73
- 125000000217 alkyl group Chemical group 0.000 claims description 44
- 238000010348 incorporation Methods 0.000 claims description 44
- 150000003254 radicals Chemical class 0.000 claims description 43
- 238000003776 cleavage reaction Methods 0.000 claims description 33
- 229910052736 halogen Inorganic materials 0.000 claims description 33
- 150000002367 halogens Chemical class 0.000 claims description 33
- 230000007017 scission Effects 0.000 claims description 33
- YICAEXQYKBMDNH-UHFFFAOYSA-N 3-[bis(3-hydroxypropyl)phosphanyl]propan-1-ol Chemical compound OCCCP(CCCO)CCCO YICAEXQYKBMDNH-UHFFFAOYSA-N 0.000 claims description 29
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical group NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 claims description 28
- 239000001226 triphosphate Substances 0.000 claims description 28
- 235000011178 triphosphate Nutrition 0.000 claims description 28
- 125000003118 aryl group Chemical group 0.000 claims description 27
- 125000000623 heterocyclic group Chemical group 0.000 claims description 25
- 108091034117 Oligonucleotide Proteins 0.000 claims description 24
- 125000000171 (C1-C6) haloalkyl group Chemical group 0.000 claims description 22
- 125000003601 C2-C6 alkynyl group Chemical group 0.000 claims description 22
- 239000000872 buffer Substances 0.000 claims description 22
- 229910052799 carbon Inorganic materials 0.000 claims description 21
- 230000000295 complement effect Effects 0.000 claims description 21
- XYFCBTPGUUZFHI-UHFFFAOYSA-N Phosphine Chemical compound P XYFCBTPGUUZFHI-UHFFFAOYSA-N 0.000 claims description 20
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 20
- 239000003054 catalyst Substances 0.000 claims description 17
- 229910052763 palladium Inorganic materials 0.000 claims description 17
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 claims description 16
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 15
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 15
- 102000004190 Enzymes Human genes 0.000 claims description 15
- 108090000790 Enzymes Proteins 0.000 claims description 15
- 229910019142 PO4 Inorganic materials 0.000 claims description 14
- 230000003362 replicative effect Effects 0.000 claims description 14
- 125000001424 substituent group Chemical group 0.000 claims description 14
- 125000004737 (C1-C6) haloalkoxy group Chemical group 0.000 claims description 11
- 125000001072 heteroaryl group Chemical group 0.000 claims description 11
- 239000010452 phosphate Substances 0.000 claims description 11
- 235000021317 phosphate Nutrition 0.000 claims description 11
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 claims description 10
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 claims description 10
- 229910000073 phosphorus hydride Inorganic materials 0.000 claims description 10
- 125000004093 cyano group Chemical group *C#N 0.000 claims description 9
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 claims description 9
- 125000000882 C2-C6 alkenyl group Chemical group 0.000 claims description 8
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 claims description 8
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 8
- JMXMXKRNIYCNRV-UHFFFAOYSA-N bis(hydroxymethyl)phosphanylmethanol Chemical group OCP(CO)CO JMXMXKRNIYCNRV-UHFFFAOYSA-N 0.000 claims description 8
- DIHKMUNUGQVFES-UHFFFAOYSA-N n,n,n',n'-tetraethylethane-1,2-diamine Chemical compound CCN(CC)CCN(CC)CC DIHKMUNUGQVFES-UHFFFAOYSA-N 0.000 claims description 8
- 229910052760 oxygen Inorganic materials 0.000 claims description 8
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 7
- 125000004070 6 membered heterocyclic group Chemical group 0.000 claims description 6
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 claims description 6
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 claims description 6
- 239000007983 Tris buffer Substances 0.000 claims description 6
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 claims description 6
- 150000003013 phosphoric acid derivatives Chemical class 0.000 claims description 6
- 150000003512 tertiary amines Chemical class 0.000 claims description 6
- 238000005406 washing Methods 0.000 claims description 6
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 claims description 5
- KWYHDKDOAIKMQN-UHFFFAOYSA-N N,N,N',N'-tetramethylethylenediamine Chemical compound CN(C)CCN(C)C KWYHDKDOAIKMQN-UHFFFAOYSA-N 0.000 claims description 5
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 5
- 125000003710 aryl alkyl group Chemical group 0.000 claims description 5
- 239000006172 buffering agent Substances 0.000 claims description 5
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 claims description 5
- 150000003141 primary amines Chemical class 0.000 claims description 5
- 125000006570 (C5-C6) heteroaryl group Chemical group 0.000 claims description 4
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 claims description 4
- 239000004471 Glycine Substances 0.000 claims description 4
- 150000001642 boronic acid derivatives Chemical class 0.000 claims description 4
- GNVMUORYQLCPJZ-UHFFFAOYSA-N carbamothioic s-acid Chemical group NC(S)=O GNVMUORYQLCPJZ-UHFFFAOYSA-N 0.000 claims description 4
- 239000001301 oxygen Substances 0.000 claims description 4
- 230000009471 action Effects 0.000 claims description 3
- 125000002228 disulfide group Chemical group 0.000 claims description 3
- 150000003335 secondary amines Chemical class 0.000 claims description 3
- PZIJUXHDLWNNRW-UHFFFAOYSA-N 2-[bis(2-hydroxyethyl)phosphanyl]ethanol Chemical compound OCCP(CCO)CCO PZIJUXHDLWNNRW-UHFFFAOYSA-N 0.000 claims description 2
- 150000004649 carbonic acid derivatives Chemical class 0.000 claims description 2
- 102100034343 Integrase Human genes 0.000 claims 2
- DHKHKXVYLBGOIT-UHFFFAOYSA-N acetaldehyde Diethyl Acetal Natural products CCOC(C)OCC DHKHKXVYLBGOIT-UHFFFAOYSA-N 0.000 abstract description 16
- GNVMUORYQLCPJZ-UHFFFAOYSA-M Thiocarbamate Chemical compound NC([S-])=O GNVMUORYQLCPJZ-UHFFFAOYSA-M 0.000 abstract description 11
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 81
- 150000007523 nucleic acids Chemical class 0.000 description 60
- 102000039446 nucleic acids Human genes 0.000 description 56
- 108020004707 nucleic acids Proteins 0.000 description 56
- 239000000203 mixture Substances 0.000 description 54
- 238000003786 synthesis reaction Methods 0.000 description 50
- 239000000975 dye Substances 0.000 description 48
- 150000002500 ions Chemical class 0.000 description 46
- 230000015572 biosynthetic process Effects 0.000 description 44
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 42
- 239000002585 base Substances 0.000 description 42
- 235000019439 ethyl acetate Nutrition 0.000 description 36
- 150000001875 compounds Chemical class 0.000 description 34
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 34
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 33
- YMWUJEATGCHHMB-UHFFFAOYSA-N methylene chloride Substances ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 32
- 230000002829 reductive effect Effects 0.000 description 32
- 239000007787 solid Substances 0.000 description 32
- 125000004432 carbon atom Chemical group C* 0.000 description 31
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 30
- 229910052757 nitrogen Inorganic materials 0.000 description 30
- 238000001514 detection method Methods 0.000 description 26
- 239000007850 fluorescent dye Substances 0.000 description 25
- 108020004414 DNA Proteins 0.000 description 23
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 21
- 235000000346 sugar Nutrition 0.000 description 21
- 150000001241 acetals Chemical class 0.000 description 20
- 125000004429 atom Chemical group 0.000 description 20
- 238000003818 flash chromatography Methods 0.000 description 20
- AFQIYTIJXGTIEY-UHFFFAOYSA-N hydrogen carbonate;triethylazanium Chemical compound OC(O)=O.CCN(CC)CC AFQIYTIJXGTIEY-UHFFFAOYSA-N 0.000 description 19
- 125000006239 protecting group Chemical group 0.000 description 19
- 125000000304 alkynyl group Chemical group 0.000 description 18
- 239000007864 aqueous solution Substances 0.000 description 18
- 238000003491 array Methods 0.000 description 18
- HGCIXCUEYOPUTN-UHFFFAOYSA-N cyclohexene Chemical compound C1CCC=CC1 HGCIXCUEYOPUTN-UHFFFAOYSA-N 0.000 description 18
- 125000003342 alkenyl group Chemical group 0.000 description 17
- 239000012043 crude product Substances 0.000 description 17
- 238000003199 nucleic acid amplification method Methods 0.000 description 17
- 238000002360 preparation method Methods 0.000 description 17
- 239000000741 silica gel Substances 0.000 description 17
- 229910002027 silica gel Inorganic materials 0.000 description 17
- 239000000126 substance Substances 0.000 description 17
- 239000000758 substrate Substances 0.000 description 17
- 230000003321 amplification Effects 0.000 description 16
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 16
- 125000004122 cyclic group Chemical group 0.000 description 15
- 239000003153 chemical reaction reagent Substances 0.000 description 14
- 238000004128 high performance liquid chromatography Methods 0.000 description 14
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 13
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 13
- CSNNHWWHGAXBCP-UHFFFAOYSA-L magnesium sulphate Substances [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 13
- 239000003921 oil Substances 0.000 description 13
- 229920006395 saturated elastomer Polymers 0.000 description 13
- 239000003039 volatile agent Substances 0.000 description 13
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 12
- 229940013085 2-diethylaminoethanol Drugs 0.000 description 12
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 12
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 12
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 12
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 12
- 239000002904 solvent Substances 0.000 description 12
- 125000001313 C5-C10 heteroaryl group Chemical group 0.000 description 11
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 11
- 125000005842 heteroatom Chemical group 0.000 description 11
- 229910052739 hydrogen Inorganic materials 0.000 description 11
- 239000001257 hydrogen Substances 0.000 description 11
- 239000010410 layer Substances 0.000 description 11
- 239000012074 organic phase Substances 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 239000007858 starting material Substances 0.000 description 11
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 11
- PHIYHIOQVWTXII-UHFFFAOYSA-N 3-amino-1-phenylpropan-1-ol Chemical compound NCCC(O)C1=CC=CC=C1 PHIYHIOQVWTXII-UHFFFAOYSA-N 0.000 description 10
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 239000011324 bead Substances 0.000 description 10
- 239000007853 buffer solution Substances 0.000 description 10
- 125000004404 heteroalkyl group Chemical group 0.000 description 10
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 10
- 230000000670 limiting effect Effects 0.000 description 10
- 239000012071 phase Substances 0.000 description 10
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 10
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 10
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 10
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 9
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 9
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 description 9
- 125000002947 alkylene group Chemical group 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 238000003556 assay Methods 0.000 description 9
- 125000002837 carbocyclic group Chemical group 0.000 description 9
- 239000003795 chemical substances by application Substances 0.000 description 9
- 239000000460 chlorine Substances 0.000 description 9
- ZXSBDSGRQIWJPM-UHFFFAOYSA-N dimethylcarbamothioic s-acid Chemical compound CN(C)C(S)=O ZXSBDSGRQIWJPM-UHFFFAOYSA-N 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- 125000006714 (C3-C10) heterocyclyl group Chemical group 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- ROSDSFDQCJNGOL-UHFFFAOYSA-N Dimethylamine Chemical compound CNC ROSDSFDQCJNGOL-UHFFFAOYSA-N 0.000 description 8
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- XXROGKLTLUQVRX-UHFFFAOYSA-N allyl alcohol Chemical compound OCC=C XXROGKLTLUQVRX-UHFFFAOYSA-N 0.000 description 8
- 239000011521 glass Substances 0.000 description 8
- 239000012044 organic layer Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000002441 reversible effect Effects 0.000 description 8
- 235000010378 sodium ascorbate Nutrition 0.000 description 8
- PPASLZSBLFJQEF-RKJRWTFHSA-M sodium ascorbate Substances [Na+].OC[C@@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RKJRWTFHSA-M 0.000 description 8
- 229960005055 sodium ascorbate Drugs 0.000 description 8
- PPASLZSBLFJQEF-RXSVEWSESA-M sodium-L-ascorbate Chemical compound [Na+].OC[C@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RXSVEWSESA-M 0.000 description 8
- 229910052717 sulfur Inorganic materials 0.000 description 8
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 7
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 7
- 229920005654 Sephadex Polymers 0.000 description 7
- 239000012507 Sephadex™ Substances 0.000 description 7
- 125000004452 carbocyclyl group Chemical group 0.000 description 7
- 125000000753 cycloalkyl group Chemical group 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000013467 fragmentation Methods 0.000 description 7
- 238000006062 fragmentation reaction Methods 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 150000004713 phosphodiesters Chemical class 0.000 description 7
- 238000003756 stirring Methods 0.000 description 7
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 description 6
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 6
- UEEJHVSXFDXPFK-UHFFFAOYSA-N N-dimethylaminoethanol Chemical compound CN(C)CCO UEEJHVSXFDXPFK-UHFFFAOYSA-N 0.000 description 6
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 6
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 6
- HSFWRNGVRCDJHI-UHFFFAOYSA-N alpha-acetylene Natural products C#C HSFWRNGVRCDJHI-UHFFFAOYSA-N 0.000 description 6
- 239000012267 brine Substances 0.000 description 6
- 229940104302 cytosine Drugs 0.000 description 6
- 125000002534 ethynyl group Chemical group [H]C#C* 0.000 description 6
- 238000009472 formulation Methods 0.000 description 6
- 239000000017 hydrogel Substances 0.000 description 6
- 239000002077 nanosphere Substances 0.000 description 6
- 150000003839 salts Chemical class 0.000 description 6
- 239000000377 silicon dioxide Substances 0.000 description 6
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 6
- HPALAKNZSZLMCH-UHFFFAOYSA-M sodium;chloride;hydrate Chemical compound O.[Na+].[Cl-] HPALAKNZSZLMCH-UHFFFAOYSA-M 0.000 description 6
- 239000011550 stock solution Substances 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 5
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 5
- 238000001712 DNA sequencing Methods 0.000 description 5
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 description 5
- 239000000654 additive Substances 0.000 description 5
- 125000003277 amino group Chemical group 0.000 description 5
- 239000005546 dideoxynucleotide Substances 0.000 description 5
- 235000011180 diphosphates Nutrition 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000005284 excitation Effects 0.000 description 5
- 150000002430 hydrocarbons Chemical group 0.000 description 5
- 238000011065 in-situ storage Methods 0.000 description 5
- PENAXHPKEVTBLF-UHFFFAOYSA-L palladium(2+);prop-1-ene;dichloride Chemical compound [Pd+]Cl.[Pd+]Cl.[CH2-]C=C.[CH2-]C=C PENAXHPKEVTBLF-UHFFFAOYSA-L 0.000 description 5
- 238000010791 quenching Methods 0.000 description 5
- 230000000171 quenching effect Effects 0.000 description 5
- 239000011541 reaction mixture Substances 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- YBBRCQOCSYXUOC-UHFFFAOYSA-N sulfuryl dichloride Chemical compound ClS(Cl)(=O)=O YBBRCQOCSYXUOC-UHFFFAOYSA-N 0.000 description 5
- FPGGTKZVZWFYPV-UHFFFAOYSA-M tetrabutylammonium fluoride Chemical compound [F-].CCCC[N+](CCCC)(CCCC)CCCC FPGGTKZVZWFYPV-UHFFFAOYSA-M 0.000 description 5
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 5
- 229940113082 thymine Drugs 0.000 description 5
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 4
- 102100031780 Endonuclease Human genes 0.000 description 4
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 4
- 241001089723 Metaphycus omega Species 0.000 description 4
- 101150003085 Pdcl gene Proteins 0.000 description 4
- 108091028664 Ribonucleotide Proteins 0.000 description 4
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 4
- 229960000583 acetic acid Drugs 0.000 description 4
- 230000000996 additive effect Effects 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 239000012298 atmosphere Substances 0.000 description 4
- 229910052801 chlorine Inorganic materials 0.000 description 4
- 239000013058 crude material Substances 0.000 description 4
- 238000010511 deprotection reaction Methods 0.000 description 4
- 239000001177 diphosphate Substances 0.000 description 4
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 4
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 4
- 239000011737 fluorine Substances 0.000 description 4
- 229910052731 fluorine Inorganic materials 0.000 description 4
- 125000000524 functional group Chemical group 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 238000004255 ion exchange chromatography Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 239000003446 ligand Substances 0.000 description 4
- 229910052751 metal Inorganic materials 0.000 description 4
- 239000002184 metal Substances 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000002808 molecular sieve Substances 0.000 description 4
- 150000004712 monophosphates Chemical class 0.000 description 4
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 4
- 239000003208 petroleum Substances 0.000 description 4
- 150000003003 phosphines Chemical class 0.000 description 4
- XHXFXVLFKHQFAL-UHFFFAOYSA-N phosphoryl trichloride Chemical compound ClP(Cl)(Cl)=O XHXFXVLFKHQFAL-UHFFFAOYSA-N 0.000 description 4
- 238000006116 polymerization reaction Methods 0.000 description 4
- 239000002336 ribonucleotide Substances 0.000 description 4
- 125000002652 ribonucleotide group Chemical group 0.000 description 4
- 229910000162 sodium phosphate Inorganic materials 0.000 description 4
- 125000006850 spacer group Chemical group 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 239000011593 sulfur Substances 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- IMFACGCPASFAPR-UHFFFAOYSA-N tributylamine Chemical compound CCCCN(CCCC)CCCC IMFACGCPASFAPR-UHFFFAOYSA-N 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- SGPUHRSBWMQRAN-UHFFFAOYSA-N 2-[bis(1-carboxyethyl)phosphanyl]propanoic acid Chemical compound OC(=O)C(C)P(C(C)C(O)=O)C(C)C(O)=O SGPUHRSBWMQRAN-UHFFFAOYSA-N 0.000 description 3
- VHYFNPMBLIVWCW-UHFFFAOYSA-N 4-Dimethylaminopyridine Chemical compound CN(C)C1=CC=NC=C1 VHYFNPMBLIVWCW-UHFFFAOYSA-N 0.000 description 3
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 3
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 3
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 3
- 108020004635 Complementary DNA Proteins 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 125000003545 alkoxy group Chemical group 0.000 description 3
- QGZKDVFQNNGYKY-UHFFFAOYSA-N ammonia Natural products N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 3
- 235000011114 ammonium hydroxide Nutrition 0.000 description 3
- 235000010323 ascorbic acid Nutrition 0.000 description 3
- 239000011668 ascorbic acid Substances 0.000 description 3
- 229960005070 ascorbic acid Drugs 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 229910021538 borax Inorganic materials 0.000 description 3
- 150000001721 carbon Chemical group 0.000 description 3
- 239000003638 chemical reducing agent Substances 0.000 description 3
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 3
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 3
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 3
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 3
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 3
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 125000005843 halogen group Chemical group 0.000 description 3
- 239000012456 homogeneous solution Substances 0.000 description 3
- 239000005457 ice water Substances 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 125000006574 non-aromatic ring group Chemical group 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 125000004430 oxygen atom Chemical group O* 0.000 description 3
- 229910052698 phosphorus Inorganic materials 0.000 description 3
- 239000011574 phosphorus Substances 0.000 description 3
- 125000004193 piperazinyl group Chemical group 0.000 description 3
- 238000002953 preparative HPLC Methods 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 125000002568 propynyl group Chemical group [*]C#CC([H])([H])[H] 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 150000003212 purines Chemical class 0.000 description 3
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 3
- 229940005657 pyrophosphoric acid Drugs 0.000 description 3
- 238000012175 pyrosequencing Methods 0.000 description 3
- 125000000719 pyrrolidinyl group Chemical group 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 3
- 229910000029 sodium carbonate Inorganic materials 0.000 description 3
- 239000001488 sodium phosphate Substances 0.000 description 3
- 235000010339 sodium tetraborate Nutrition 0.000 description 3
- 239000007790 solid phase Substances 0.000 description 3
- 125000003003 spiro group Chemical group 0.000 description 3
- 238000013112 stability test Methods 0.000 description 3
- 238000012430 stability testing Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- PXQLVRUNWNTZOS-UHFFFAOYSA-N sulfanyl Chemical class [SH] PXQLVRUNWNTZOS-UHFFFAOYSA-N 0.000 description 3
- 125000000037 tert-butyldiphenylsilyl group Chemical group [H]C1=C([H])C([H])=C([H])C([H])=C1[Si]([H])([*]C(C([H])([H])[H])(C([H])([H])[H])C([H])([H])[H])C1=C([H])C([H])=C([H])C([H])=C1[H] 0.000 description 3
- 229910052723 transition metal Inorganic materials 0.000 description 3
- 150000003624 transition metals Chemical class 0.000 description 3
- DQWPFSLDHJDLRL-UHFFFAOYSA-N triethyl phosphate Chemical compound CCOP(=O)(OCC)OCC DQWPFSLDHJDLRL-UHFFFAOYSA-N 0.000 description 3
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 3
- BSVBQGMMJUBVOD-UHFFFAOYSA-N trisodium borate Chemical compound [Na+].[Na+].[Na+].[O-]B([O-])[O-] BSVBQGMMJUBVOD-UHFFFAOYSA-N 0.000 description 3
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 3
- 238000000870 ultraviolet spectroscopy Methods 0.000 description 3
- 229920002554 vinyl polymer Polymers 0.000 description 3
- 125000006716 (C1-C6) heteroalkyl group Chemical group 0.000 description 2
- LBUJPTNKIBCYBY-UHFFFAOYSA-N 1,2,3,4-tetrahydroquinoline Chemical compound C1=CC=C2CCCNC2=C1 LBUJPTNKIBCYBY-UHFFFAOYSA-N 0.000 description 2
- IGERFAHWSHDDHX-UHFFFAOYSA-N 1,3-dioxanyl Chemical group [CH]1OCCCO1 IGERFAHWSHDDHX-UHFFFAOYSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- VAKXPQHQQNOUEZ-UHFFFAOYSA-N 3-[4-[[bis[[1-(3-hydroxypropyl)triazol-4-yl]methyl]amino]methyl]triazol-1-yl]propan-1-ol Chemical compound N1=NN(CCCO)C=C1CN(CC=1N=NN(CCCO)C=1)CC1=CN(CCCO)N=N1 VAKXPQHQQNOUEZ-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 2
- YNAVUWVOSKDBBP-UHFFFAOYSA-N Morpholine Chemical compound C1COCCN1 YNAVUWVOSKDBBP-UHFFFAOYSA-N 0.000 description 2
- 229910019213 POCl3 Inorganic materials 0.000 description 2
- GLUUGHFHXGJENI-UHFFFAOYSA-N Piperazine Chemical compound C1CNCCN1 GLUUGHFHXGJENI-UHFFFAOYSA-N 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- 125000005631 S-sulfonamido group Chemical group 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 235000019270 ammonium chloride Nutrition 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 239000008346 aqueous phase Substances 0.000 description 2
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 description 2
- 125000003785 benzimidazolyl group Chemical group N1=C(NC2=C1C=CC=C2)* 0.000 description 2
- YNHIGQDRGKUECZ-UHFFFAOYSA-L bis(triphenylphosphine)palladium(ii) dichloride Chemical compound [Cl-].[Cl-].[Pd+2].C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1.C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1 YNHIGQDRGKUECZ-UHFFFAOYSA-L 0.000 description 2
- 235000012745 brilliant blue FCF Nutrition 0.000 description 2
- RYYVLZVUVIJVGH-UHFFFAOYSA-N caffeine Chemical compound CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 125000000392 cycloalkenyl group Chemical group 0.000 description 2
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 125000004446 heteroarylalkyl group Chemical group 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 125000002632 imidazolidinyl group Chemical group 0.000 description 2
- 125000001041 indolyl group Chemical group 0.000 description 2
- 229910017053 inorganic salt Inorganic materials 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 125000000904 isoindolyl group Chemical group C=1(NC=C2C=CC=CC12)* 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 229910001496 lithium tetrafluoroborate Inorganic materials 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000011859 microparticle Substances 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 125000002911 monocyclic heterocycle group Chemical group 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 125000002757 morpholinyl group Chemical group 0.000 description 2
- 229910000069 nitrogen hydride Inorganic materials 0.000 description 2
- 239000012038 nucleophile Substances 0.000 description 2
- 229940127073 nucleoside analogue Drugs 0.000 description 2
- YJVFFLUZDVXJQI-UHFFFAOYSA-L palladium(ii) acetate Chemical compound [Pd+2].CC([O-])=O.CC([O-])=O YJVFFLUZDVXJQI-UHFFFAOYSA-L 0.000 description 2
- 239000008363 phosphate buffer Substances 0.000 description 2
- RLOWWWKZYUNIDI-UHFFFAOYSA-N phosphinic chloride Chemical compound ClP=O RLOWWWKZYUNIDI-UHFFFAOYSA-N 0.000 description 2
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 2
- 150000008300 phosphoramidites Chemical class 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 229920000867 polyelectrolyte Polymers 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 125000004368 propenyl group Chemical group C(=CC)* 0.000 description 2
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- IGFXRKMLLMBKSA-UHFFFAOYSA-N purine Chemical compound N1=C[N]C2=NC=NC2=C1 IGFXRKMLLMBKSA-UHFFFAOYSA-N 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 125000006413 ring segment Chemical group 0.000 description 2
- 235000012239 silicon dioxide Nutrition 0.000 description 2
- JQWHASGSAFIOCM-UHFFFAOYSA-M sodium periodate Chemical compound [Na+].[O-]I(=O)(=O)=O JQWHASGSAFIOCM-UHFFFAOYSA-M 0.000 description 2
- 159000000000 sodium salts Chemical group 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000012421 spiking Methods 0.000 description 2
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- MHYGQXWCZAYSLJ-UHFFFAOYSA-N tert-butyl-chloro-diphenylsilane Chemical compound C=1C=CC=CC=1[Si](Cl)(C(C)(C)C)C1=CC=CC=C1 MHYGQXWCZAYSLJ-UHFFFAOYSA-N 0.000 description 2
- YAPQBXQYLJRXSA-UHFFFAOYSA-N theobromine Chemical compound CN1C(=O)NC(=O)C2=C1N=CN2C YAPQBXQYLJRXSA-UHFFFAOYSA-N 0.000 description 2
- 150000003573 thiols Chemical class 0.000 description 2
- 125000006273 (C1-C3) alkyl group Chemical group 0.000 description 1
- 125000004178 (C1-C4) alkyl group Chemical group 0.000 description 1
- 125000006700 (C1-C6) alkylthio group Chemical group 0.000 description 1
- 125000006728 (C1-C6) alkynyl group Chemical group 0.000 description 1
- 125000006730 (C2-C5) alkynyl group Chemical group 0.000 description 1
- 125000006552 (C3-C8) cycloalkyl group Chemical group 0.000 description 1
- 125000005940 1,4-dioxanyl group Chemical group 0.000 description 1
- UBTJZUKVKGZHAD-UPRLRBBYSA-N 1-[(2r,4s,5r)-5-[[bis(4-methoxyphenyl)-phenylmethoxy]methyl]-4-hydroxyoxolan-2-yl]-5-methylpyrimidine-2,4-dione Chemical compound C1=CC(OC)=CC=C1C(C=1C=CC(OC)=CC=1)(C=1C=CC=CC=1)OC[C@@H]1[C@@H](O)C[C@H](N2C(NC(=O)C(C)=C2)=O)O1 UBTJZUKVKGZHAD-UPRLRBBYSA-N 0.000 description 1
- GAUSMJHDHCSZOX-UHFFFAOYSA-N 2,2,2-trifluoro-n-prop-2-ynylacetamide Chemical compound FC(F)(F)C(=O)NCC#C GAUSMJHDHCSZOX-UHFFFAOYSA-N 0.000 description 1
- IMSODMZESSGVBE-UHFFFAOYSA-N 2-Oxazoline Chemical compound C1CN=CO1 IMSODMZESSGVBE-UHFFFAOYSA-N 0.000 description 1
- 125000000069 2-butynyl group Chemical group [H]C([H])([H])C#CC([H])([H])* 0.000 description 1
- PMUNIMVZCACZBB-UHFFFAOYSA-N 2-hydroxyethylazanium;chloride Chemical compound Cl.NCCO PMUNIMVZCACZBB-UHFFFAOYSA-N 0.000 description 1
- 125000000094 2-phenylethyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000006201 3-phenylpropyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000005986 4-piperidonyl group Chemical group 0.000 description 1
- 125000004487 4-tetrahydropyranyl group Chemical group [H]C1([H])OC([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- GVUOPSNMFBICMM-UHFFFAOYSA-N 5-bromo-6-morpholin-4-yl-1h-pyrimidine-2,4-dione Chemical compound OC1=NC(O)=C(Br)C(N2CCOCC2)=N1 GVUOPSNMFBICMM-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 125000003341 7 membered heterocyclic group Chemical group 0.000 description 1
- 101710092462 Alpha-hemolysin Proteins 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 101710125089 Bindin Proteins 0.000 description 1
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 description 1
- 125000000041 C6-C10 aryl group Chemical group 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 108091028732 Concatemer Proteins 0.000 description 1
- 229910021595 Copper(I) iodide Inorganic materials 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- OIVLITBTBDPEFK-UHFFFAOYSA-N DIHYDRO-URACILE Natural products O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical class C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- LPHGQDQBBGAPDZ-UHFFFAOYSA-N Isocaffeine Natural products CN1C(=O)N(C)C(=O)C2=C1N(C)C=N2 LPHGQDQBBGAPDZ-UHFFFAOYSA-N 0.000 description 1
- 229910013075 LiBF Inorganic materials 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 229910003244 Na2PdCl4 Inorganic materials 0.000 description 1
- WKDDICBTQWGDFL-UHFFFAOYSA-N O.O.O.O.O.O.O.O.O.[Na].[Na].[Na].[Na].[Na].[Na].[Na].[Na].[Na] Chemical compound O.O.O.O.O.O.O.O.O.[Na].[Na].[Na].[Na].[Na].[Na].[Na].[Na].[Na] WKDDICBTQWGDFL-UHFFFAOYSA-N 0.000 description 1
- 239000012425 OXONE® Substances 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910002666 PdCl2 Inorganic materials 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 229910006024 SO2Cl2 Inorganic materials 0.000 description 1
- 229910006069 SO3H Inorganic materials 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 1
- DHXVGJBLRPWPCS-UHFFFAOYSA-N Tetrahydropyran Chemical compound C1CCOCC1 DHXVGJBLRPWPCS-UHFFFAOYSA-N 0.000 description 1
- ACIAHEMYLLBZOI-ZZXKWVIFSA-N Unsaturated alcohol Chemical compound CC\C(CO)=C/C ACIAHEMYLLBZOI-ZZXKWVIFSA-N 0.000 description 1
- LEHOTFFKMJEONL-UHFFFAOYSA-N Uric Acid Chemical compound N1C(=O)NC(=O)C2=C1NC(=O)N2 LEHOTFFKMJEONL-UHFFFAOYSA-N 0.000 description 1
- TVWHNULVHGKJHS-UHFFFAOYSA-N Uric acid Natural products N1C(=O)NC(=O)C2NC(=O)NC21 TVWHNULVHGKJHS-UHFFFAOYSA-N 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 125000005073 adamantyl group Chemical group C12(CC3CC(CC(C1)C3)C2)* 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 125000004450 alkenylene group Chemical group 0.000 description 1
- 125000004183 alkoxy alkyl group Chemical group 0.000 description 1
- 150000001343 alkyl silanes Chemical group 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 150000001413 amino acids Chemical group 0.000 description 1
- 125000004103 aminoalkyl group Chemical group 0.000 description 1
- 125000002178 anthracenyl group Chemical group C1(=CC=CC2=CC3=CC=CC=C3C=C12)* 0.000 description 1
- 125000006615 aromatic heterocyclic group Chemical group 0.000 description 1
- 125000005110 aryl thio group Chemical group 0.000 description 1
- 125000004104 aryloxy group Chemical group 0.000 description 1
- HONIICLYMWZJFZ-UHFFFAOYSA-N azetidine Chemical compound C1CNC1 HONIICLYMWZJFZ-UHFFFAOYSA-N 0.000 description 1
- 125000003828 azulenyl group Chemical group 0.000 description 1
- 125000001164 benzothiazolyl group Chemical group S1C(=NC2=C1C=CC=C2)* 0.000 description 1
- 125000004196 benzothienyl group Chemical group S1C(=CC2=C1C=CC=C2)* 0.000 description 1
- 125000004541 benzoxazolyl group Chemical group O1C(=NC2=C1C=CC=C2)* 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- NYENCOMLZDQKNH-UHFFFAOYSA-K bis(trifluoromethylsulfonyloxy)bismuthanyl trifluoromethanesulfonate Chemical compound [Bi+3].[O-]S(=O)(=O)C(F)(F)F.[O-]S(=O)(=O)C(F)(F)F.[O-]S(=O)(=O)C(F)(F)F NYENCOMLZDQKNH-UHFFFAOYSA-K 0.000 description 1
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- 230000005587 bubbling Effects 0.000 description 1
- 125000004369 butenyl group Chemical group C(=CCC)* 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 125000000480 butynyl group Chemical group [*]C#CC([H])([H])C([H])([H])[H] 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 229960001948 caffeine Drugs 0.000 description 1
- VJEONQKOZGKCAK-UHFFFAOYSA-N caffeine Natural products CN1C(=O)N(C)C(=O)C2=C1C=CN2C VJEONQKOZGKCAK-UHFFFAOYSA-N 0.000 description 1
- 125000000609 carbazolyl group Chemical group C1(=CC=CC=2C3=CC=CC=C3NC12)* 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000000423 cell based assay Methods 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 150000004697 chelate complex Chemical class 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 125000000259 cinnolinyl group Chemical group N1=NC(=CC2=CC=CC=C12)* 0.000 description 1
- LSXDOTMGLUJQCM-UHFFFAOYSA-M copper(i) iodide Chemical compound I[Cu] LSXDOTMGLUJQCM-UHFFFAOYSA-M 0.000 description 1
- 239000010779 crude oil Substances 0.000 description 1
- 229940097362 cyclodextrins Drugs 0.000 description 1
- 125000000596 cyclohexenyl group Chemical group C1(=CCCCC1)* 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- RAFNCPHFRHZCPS-UHFFFAOYSA-N di(imidazol-1-yl)methanethione Chemical compound C1=CN=CN1C(=S)N1C=CN=C1 RAFNCPHFRHZCPS-UHFFFAOYSA-N 0.000 description 1
- 125000000723 dihydrobenzofuranyl group Chemical group O1C(CC2=C1C=CC=C2)* 0.000 description 1
- JAZCSWFKVAHBLR-UHFFFAOYSA-N dihydrogen phosphate;phenylazanium Chemical compound OP(O)(O)=O.NC1=CC=CC=C1 JAZCSWFKVAHBLR-UHFFFAOYSA-N 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 125000005879 dioxolanyl group Chemical group 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 239000012039 electrophile Substances 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 125000003700 epoxy group Chemical group 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000012065 filter cake Substances 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000005187 foaming Methods 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 125000002541 furyl group Chemical group 0.000 description 1
- 230000005251 gamma ray Effects 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 239000012362 glacial acetic acid Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 125000006038 hexenyl group Chemical group 0.000 description 1
- 125000004051 hexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000005980 hexynyl group Chemical group 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 125000002636 imidazolinyl group Chemical group 0.000 description 1
- 125000002883 imidazolyl group Chemical group 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 description 1
- 125000003253 isopropoxy group Chemical group [H]C([H])([H])C([H])(O*)C([H])([H])[H] 0.000 description 1
- 125000002183 isoquinolinyl group Chemical group C1(=NC=CC2=CC=CC=C12)* 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 125000001786 isothiazolyl group Chemical group 0.000 description 1
- 125000003965 isoxazolidinyl group Chemical group 0.000 description 1
- 125000003971 isoxazolinyl group Chemical group 0.000 description 1
- 125000000842 isoxazolyl group Chemical group 0.000 description 1
- WGJJZRVGLPOKQT-UHFFFAOYSA-K lanthanum(3+);trifluoromethanesulfonate Chemical compound [La+3].[O-]S(=O)(=O)C(F)(F)F.[O-]S(=O)(=O)C(F)(F)F.[O-]S(=O)(=O)C(F)(F)F WGJJZRVGLPOKQT-UHFFFAOYSA-K 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 125000001160 methoxycarbonyl group Chemical group [H]C([H])([H])OC(*)=O 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 125000002950 monocyclic group Chemical group 0.000 description 1
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 125000001624 naphthyl group Chemical group 0.000 description 1
- 125000001326 naphthylalkyl group Chemical group 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 description 1
- 239000012299 nitrogen atmosphere Substances 0.000 description 1
- DUUPDCPVCHSTFF-UHFFFAOYSA-N nonane Chemical compound [CH2]CCCCCCCC DUUPDCPVCHSTFF-UHFFFAOYSA-N 0.000 description 1
- 238000003499 nucleic acid array Methods 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- XSXHWVKGUXMUQE-UHFFFAOYSA-N osmium dioxide Inorganic materials O=[Os]=O XSXHWVKGUXMUQE-UHFFFAOYSA-N 0.000 description 1
- 125000005880 oxathiolanyl group Chemical group 0.000 description 1
- 125000000160 oxazolidinyl group Chemical group 0.000 description 1
- 125000005968 oxazolinyl group Chemical group 0.000 description 1
- 125000002971 oxazolyl group Chemical group 0.000 description 1
- 125000003551 oxepanyl group Chemical group 0.000 description 1
- AHHWIHXENZJRFG-UHFFFAOYSA-N oxetane Chemical compound C1COC1 AHHWIHXENZJRFG-UHFFFAOYSA-N 0.000 description 1
- 125000003566 oxetanyl group Chemical group 0.000 description 1
- 239000007800 oxidant agent Substances 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 238000007248 oxidative elimination reaction Methods 0.000 description 1
- 238000002751 oxidative stress assay Methods 0.000 description 1
- HXNFUBHNUDHIGC-UHFFFAOYSA-N oxypurinol Chemical compound O=C1NC(=O)N=C2NNC=C21 HXNFUBHNUDHIGC-UHFFFAOYSA-N 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- LXNAVEXFUKBNMK-UHFFFAOYSA-N palladium(II) acetate Substances [Pd].CC(O)=O.CC(O)=O LXNAVEXFUKBNMK-UHFFFAOYSA-N 0.000 description 1
- PIBWKRNGBLPSSY-UHFFFAOYSA-L palladium(II) chloride Chemical compound Cl[Pd]Cl PIBWKRNGBLPSSY-UHFFFAOYSA-L 0.000 description 1
- JKDRQYIYVJVOPF-FDGPNNRMSA-L palladium(ii) acetylacetonate Chemical compound [Pd+2].C\C([O-])=C\C(C)=O.C\C([O-])=C\C(C)=O JKDRQYIYVJVOPF-FDGPNNRMSA-L 0.000 description 1
- ZOUWOGOTHLRRLS-UHFFFAOYSA-N palladium;phosphane Chemical compound P.[Pd] ZOUWOGOTHLRRLS-UHFFFAOYSA-N 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 125000002255 pentenyl group Chemical group C(=CCCC)* 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 125000001147 pentyl group Chemical group C(CCCC)* 0.000 description 1
- 125000005981 pentynyl group Chemical group 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- WRMXOVHLRUVREB-UHFFFAOYSA-N phosphono phosphate;tributylazanium Chemical compound OP(O)(=O)OP([O-])([O-])=O.CCCC[NH+](CCCC)CCCC.CCCC[NH+](CCCC)CCCC WRMXOVHLRUVREB-UHFFFAOYSA-N 0.000 description 1
- 150000003014 phosphoric acid esters Chemical class 0.000 description 1
- 125000004592 phthalazinyl group Chemical group C1(=NN=CC2=CC=CC=C12)* 0.000 description 1
- 125000003386 piperidinyl group Chemical group 0.000 description 1
- 125000005936 piperidyl group Chemical group 0.000 description 1
- 125000003367 polycyclic group Chemical group 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- OKBMCNHOEMXPTM-UHFFFAOYSA-M potassium peroxymonosulfate Chemical compound [K+].OOS([O-])(=O)=O OKBMCNHOEMXPTM-UHFFFAOYSA-M 0.000 description 1
- 230000036515 potency Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- OSFBJERFMQCEQY-UHFFFAOYSA-N propylidene Chemical compound [CH]CC OSFBJERFMQCEQY-UHFFFAOYSA-N 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 238000002731 protein assay Methods 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 125000003373 pyrazinyl group Chemical group 0.000 description 1
- 125000003072 pyrazolidinyl group Chemical group 0.000 description 1
- 125000002755 pyrazolinyl group Chemical group 0.000 description 1
- 125000003226 pyrazolyl group Chemical group 0.000 description 1
- 125000002098 pyridazinyl group Chemical group 0.000 description 1
- 125000004076 pyridyl group Chemical group 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 229940048084 pyrophosphate Drugs 0.000 description 1
- 125000004929 pyrrolidonyl group Chemical group N1(C(CCC1)=O)* 0.000 description 1
- 125000000168 pyrrolyl group Chemical group 0.000 description 1
- 125000002943 quinolinyl group Chemical group N1=C(C=CC2=CC=CC=C12)* 0.000 description 1
- 239000002516 radical scavenger Substances 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000013557 residual solvent Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 239000012047 saturated solution Substances 0.000 description 1
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 238000004557 single molecule detection Methods 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical class [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- AKHNMLFCWUSKQB-UHFFFAOYSA-L sodium thiosulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=S AKHNMLFCWUSKQB-UHFFFAOYSA-L 0.000 description 1
- 235000019345 sodium thiosulphate Nutrition 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 125000000475 sulfinyl group Chemical group [*:2]S([*:1])=O 0.000 description 1
- 125000003375 sulfoxide group Chemical group 0.000 description 1
- 125000003718 tetrahydrofuranyl group Chemical group 0.000 description 1
- 125000001412 tetrahydropyranyl group Chemical group 0.000 description 1
- 125000005958 tetrahydrothienyl group Chemical group 0.000 description 1
- 125000004632 tetrahydrothiopyranyl group Chemical group S1C(CCCC1)* 0.000 description 1
- 229960004559 theobromine Drugs 0.000 description 1
- 125000001113 thiadiazolyl group Chemical group 0.000 description 1
- 125000005458 thianyl group Chemical group 0.000 description 1
- 125000001984 thiazolidinyl group Chemical group 0.000 description 1
- 125000002769 thiazolinyl group Chemical group 0.000 description 1
- 125000000335 thiazolyl group Chemical group 0.000 description 1
- 125000001544 thienyl group Chemical group 0.000 description 1
- 125000003777 thiepinyl group Chemical group 0.000 description 1
- 125000004568 thiomorpholinyl group Chemical group 0.000 description 1
- 125000004306 triazinyl group Chemical group 0.000 description 1
- 125000001425 triazolyl group Chemical group 0.000 description 1
- ZMANZCXQSJIPKH-UHFFFAOYSA-O triethylammonium ion Chemical compound CC[NH+](CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-O 0.000 description 1
- WVLBCYQITXONBZ-UHFFFAOYSA-N trimethyl phosphate Chemical compound COP(=O)(OC)OC WVLBCYQITXONBZ-UHFFFAOYSA-N 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940116269 uric acid Drugs 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/06—Pyrimidine radicals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/06—Pyrimidine radicals
- C07H19/10—Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/16—Purine radicals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/16—Purine radicals
- C07H19/20—Purine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2523/00—Reactions characterised by treatment of reaction samples
- C12Q2523/10—Characterised by chemical treatment
- C12Q2523/107—Chemical cleaving agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/117—Modifications characterised by incorporating modified base
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/186—Modifications characterised by incorporating a non-extendable or blocking moiety
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
本公开的实施方案涉及具有缩醛或硫代氨基甲酸酯3’‑OH封闭基团的核苷酸和核苷分子。本文还提供了制备这种核苷酸和核苷分子的方法,以及含有3’‑OH封闭基团的完全官能化的核苷酸在测序应用中的用途。
Description
背景
技术领域
本公开一般性地涉及包含3’-羟基保护基的核苷酸、核苷或寡核苷酸以及它们在多核苷酸测序方法中的用途。还公开了制备3’-羟基保护的核苷酸、核苷或寡核苷酸的方法。
相关技术描述
分子研究的进展部分是由于用于表征分子或其生物学反应的技术的改进。特别地,对核酸DNA和RNA的研究得益于用于序列分析和杂交事件研究技术的开发。
改进了核酸研究的技术的一个实例是开发固定核酸的制备阵列(fabricatedarray)。这些阵列通常由固定在固相载体材料上的多核苷酸的高密度基质组成。参见,例如,Fodor等人,Trends Biotech.12:19-26,1994,其描述了使用由掩模(mask)保护但在限定区域暴露以允许适当修饰的核苷酸亚磷酰胺连接的化学敏化玻璃表面来组装核酸的方法。也可以通过将已知多核苷酸“点”在固相载体上的预定位置上的技术来制造制备阵列(例如,Stimpson等人,Proc.Natl.Acad.Sci.92:6379-6383,1995)。
确定与阵列结合的核酸的核苷酸序列的方法称为“边合成边测序(sequencing bysynthesis)”或“SBS”。这种用于确定DNA序列的技术理想条件下需要受控地(即,一次一个)掺入与被测序的核酸相对的正确的互补核苷酸。由于每个核苷酸残基一次一个地被测序,因此可以通过在多次循环中添加核苷酸来进行精确测序,从而防止发生一系列不受控制的掺入。在除去标记部分和随后的下一轮测序之前,使用连接于其上的适当标记读取掺入的核苷酸。
为了确保仅发生单个掺入,每个被标记的核苷酸(其被添加到生长链中以确保仅掺入一个核苷酸)中都包括结构修饰(保护基团(protecting group)或封闭基团(blockinggroup))。加入具有保护基团的核苷酸后,在不干扰被测序DNA完整性的反应条件下,除去保护基团。然后,测序循环可以继续掺入下一个受保护的、标记的核苷酸。
为了适用于DNA测序,核苷酸,通常是核苷三磷酸,一般需要3’-羟基保护基团,以防止一旦加入核苷酸上的碱基后用于将该核苷酸掺入多核苷酸链的聚合酶继续复制。可加到核苷酸上并且仍然合适的基团类型有很多限制。所述保护基团应防止另外的核苷酸分子被添加到多核苷酸链中,同时易于从糖部分中除去而不会对多核苷酸链造成破坏。此外,修饰的核苷酸需要与聚合酶或用于将其掺入多核苷酸链的另一种合适的酶相容。因此,理想的保护基团必须表现出长期稳定性,可被聚合酶有效地掺入,阻止核苷酸二次掺入或进一步掺入,并具有在不破坏多核苷酸结构的温和条件下(优选在水性条件下)被除去的能力。
在此之前已有可逆的保护基团被描述。例如,Metzker等人(Nucleic AcidsResearch,22(20):4259-4267,1994)公开了八种3’-修饰的2-脱氧核糖核苷5’-三磷酸酯(3’-修饰的dNTP)的合成和使用,并在两种DNA模板测定中对掺入活性进行了试验。WO2002/029003描述了一种测序方法,该方法可以包括在聚合酶反应中使用烯丙基保护基团将DNA的增长链上的3’-OH基团封闭。
另外,先前在国际申请公开WO 2004/018497和WO 2014/139596中报道了许多可逆保护基团的开发和在DNA相容条件下对其进行脱保护的方法,其各自通过引用整体并入本文。
概述
每个R1a和R1b独立地为H、C1-C6烷基、C1-C6卤代烷基、C1-C6烷氧基、C1-C6卤代烷氧基、氰基、卤素、任选取代的苯基或任选取代的芳烷基;
每个R2a和R2b独立地为H、C1-C6烷基、C1-C6卤代烷基、氰基或卤素;
或者,R1a和R2a与它们所连接的原子一起形成任选取代的五至八元杂环基;
R3为H、任选取代的C2-C6烯基、任选取代的C3-C7环烯基、任选取代的C2-C6炔基或任选取代的(C1-C6亚烷基)Si(R4)3;以及
每个R4独立地为H、C1-C6烷基或任选取代的C6-C10芳基。在一些实施方案中,当每个R1a和R1b为H或C1-C6烷基时,R2a和R2b均为H,然后R3为取代的C2-C6烯基、任选取代的C3-C7环烯基、任选取代的C2-C6炔基或任选取代的(C1-C6亚烷基)Si(R4)3。在一些实施方案中,当每个R1a、R1b、R2a和R2b为H,然后R3不为H。
每个R5和R6独立地为H、C1-C6烷基、C2-C6烯基、C2-C6炔基、C1-C6卤代烷基、C2-C8烷氧基烷基、任选取代的–(CH2)m–苯基、任选取代的–(CH2)n–(5或6元杂芳基)、任选取代的–(CH2)k–C3-C7碳环基或任选取代的–(CH2)p–(3至7元杂环基);
每个–(CH2)m–、–(CH2)n–、–(CH2)k–和–(CH2)p–为任选取代的;以及
每个m、n、k和p独立地为0、1、2、3或4。
本公开的一些实施方案涉及包含本文所述的3’-OH封闭的核苷酸分子的寡核苷酸或多核苷酸。
本公开的一些实施方案涉及制备在测序反应中与靶单链多核苷酸互补的生长多核苷酸的方法,其包含将本文所述的核苷酸分子掺入到生长的互补多核苷酸中,其中所述核苷酸的掺入防止了任何后续核苷酸引入到生长的互补多核苷酸中。在一些实施方案中,所述核苷酸的掺入通过聚合酶、末端脱氧核苷酸转移酶(TdT)或逆转录酶完成。在一个实施方案中,所述掺入通过聚合酶(例如DNA聚合酶)完成。
本公开的一些进一步的实施方案涉及确定靶单链多核苷酸序列的方法,其包含:
(a)将本文所述的包含3’-OH封闭基团和可检测标记的核苷酸掺入与靶多核苷酸链的至少一部分互补的复制多核苷酸链中;
(b)检测掺入到复制多核苷酸链中的核苷酸的身份(identity);以及
(c)从掺入复制多核苷酸链中的核苷酸中化学除去标记和3’-OH封闭基团。
在一些实施方案中,所述测序方法进一步包含(d)将化学除去的标记和3’封闭基团从复制多核苷酸链上洗去。在一些实施方案中,该洗去步骤还除去了未掺入的核苷酸。在一些这样的实施方案中,在引入下一个互补核苷酸之前,先除去掺入核苷酸的3’封闭基团和可检测标记。在一些进一步的实施方案中,所述3’封闭基团和可检测标记在单个化学反应步骤中被除去。在一些实施方案中,本文所述的测序掺入进行至少50次、至少100次、至少150次、至少200次或至少250次。
本公开的一些进一步的实施方案涉及试剂盒,其包含多种本文所述的核苷酸或核苷分子及其包装材料。本文阐述的核苷酸、核苷、寡核苷酸或试剂盒可用于检测、测量或鉴定生物系统(包括例如,其过程或组分)。可以使用核苷酸、寡核苷酸或试剂盒的示例性技术包括测序、表达分析、杂交分析、遗传分析、RNA分析、细胞测定(例如,细胞结合或细胞功能分析)或蛋白质测定(例如,蛋白结合测定或蛋白活性测定)。所述使用可以在用于执行特定技术的自动化仪器上实现,例如自动化测序仪器。所述测序仪器可以含有两个或更多个以不同波长工作的激光器,以区分不同的可检测标记。
附图说明
图1为示出了在65℃的缓冲溶液中各种3’封闭的核苷酸的稳定性随时间变化的线形图。
图2A为示出了剩余核苷酸(原料)的百分比(%)随时间变化的线形图,其比较了溶液中具有3’-AOM封闭基团的核苷酸与具有3’-O-叠氮基甲基(-CH2N3)封闭基团的核苷酸的解封闭率。
图2B为示出了3’解封闭的核苷酸的百分比(%)随时间变化的线形图,其比较了溶液中具有各种缩醛封闭基团的3’封闭的核苷酸的解封闭率。
图3C示出了与具有3’-O-叠氮基封闭基团的标准ffN相比,在掺入混合物中使用具有3’-AOM封闭基团的全官能化核苷酸(ffN)的测序错误率。
图4A和4B各自示出了主要测序指标的比较,其包括分别使用两种不同DNA聚合酶(Pol 812和Pol 1901)的具有3’-AOM和3’-O-叠氮基甲基封闭基团的全官能化核苷酸的定相(phasing)、预定相(pre-phasing)和错误率。
图5为示出了在45℃的缓冲溶液中具有3’-AOM或3’-O-叠氮基甲基封闭基团的全官能化核苷酸的测序稳定性随时间变化的线形图。
图6为示出了在65℃的缓冲溶液中具有各种3’封闭基团的核苷的稳定性随时间变化的线形图。
发明详述
本公开的实施方案涉及具有3’-OH乙缩醛或硫代氨基甲酸酯封闭基团的核苷和核苷酸,其用于测序应用,例如,边合成边测序(SBS)。这些封闭基团与本领域已知的那些相比在溶液中提供了更好的稳定性。特别是3’-OH封闭基团在合成全官能化核苷酸(ffNs)的过程中具有改进的稳定性,并且在配制、储存和在测序仪器上操作期间在溶液中也具有很好的稳定性。另外,本文所述的3’-OH封闭基团也可以实现低的预定相、较低的信号衰减以改善数据质量,这使得可以从测序应用中进行更长的读取。
定义
除非另有定义,否则本文中使用的所有技术和科学术语具有与本领域普通技术人员通常所理解的相同含义。术语“包括”以及该术语的其他形式(例如“include”,“includes”和“included”)的使用不是限制性的。术语“具有”以及该术语的其他形式(例如“have”,“has”和“had”)的使用不是限制性的。如在本说明书中所使用的,无论是在过渡性短语中还是在权利要求的主体中,术语“包含”(“comprise(s)”和“comprising”)均应被解释为具有开放式含义。也就是说,以上术语将与短语“至少具有”或“至少包括”同义地解释。例如,当在方法(process)的上下文中使用时,术语“包含”表示该方法至少包括所列举的步骤,但是可以包括其他的步骤。当在化合物、组合物或装置的上下文中使用时,术语“包含”是指该化合物、组合物或装置至少包括所列举的特征或组分,但是也可以包括其他的特征或组分。
如本文所用,常见的有机缩写定义如下:
℃ 温度(摄氏度)
dATP 脱氧腺苷三磷酸
dCTP 脱氧胞苷三磷酸
dGTP 脱氧鸟苷三磷酸
dTTP 脱氧胸苷三磷酸
ddNTP 双脱氧核苷三磷酸
ffN 全官能化核苷酸
RT 室温
SBS 边合成边测序
SM 原料
如本文所用,术语“阵列”是指连接到一个或多个基板(substrate)上的不同探针分子的群体,使得不同的探针分子可以根据相对位置彼此区分。阵列可以包括不同的探针分子,每个探针分子位于基板上的不同可寻址位置。可选地或附加地,阵列可以包括各自带有不同探针分子的相互分离的基板,其中不同的探针分子可以根据基板连接的表面上基板的位置或根据基板在液体中的位置来识别。其中相互分离的基板位于表面上的示例性阵列包括但不限于包括孔中的珠的那些阵列,例如在美国专利6,355,431B1、US 2002/0102578和PCT公开WO 00/63437中所述。可以在本发明中用于例如使用诸如荧光激活细胞分选仪(FACS)之类的微流体装置区分液体阵列中的珠的示例性形式(format)描述于例如美国专利6,524,793中。可以在本发明中使用的阵列的其他示例包括但不限于在美国专利5,429,807;5,436,327;5,561,071;5,583,211;5,658,734;5,837,858;5,874,219;5,919,523;6,136,269;6,287,768;6,287,776;6,288,220;6,297,006;6,291,193;6,346,413;6,416,949;6,482,591;6,514,751和6,610,482;以及WO 93/17126;WO 95/11995;WO 95/35505;EP742 287以及EP 799 897中所描述的那些阵列。
如本文所用,术语“共价连接”或“共价键合”是指化学键的形成,其特征在于原子间共享电子对。例如,共价连接的聚合物涂层是指相对于经由其他方式例如粘附或静电相互作用,与基板的官能化表面形成化学键的聚合物涂层。应当理解,共价连接到表面上的聚合物也可以通过除共价连接之外的其他方式键合。
如本文所用,任何“R”基团表示可连接至所示原子的取代基。R基团可以是取代的或未取代的。如果两个“R”基团被描述为“与它们所连接的原子一起”形成一个环或环系统,则意味着原子、插入键和两个R基团的集合单元是所列举的环。例如,当存在以下亚结构时:
且R1和R2定义为选自氢和烷基或R1和R2与它们所连接的原子一起形成芳基或碳环基,则意味着R1和R2可以选自氢或烷基或者具有以下结构的亚结构:
其中A是包含所示双键的芳基环或碳环基。
应当理解,根据上下文,一些基团的命名约定可以包括一价基团(mono-radical)或二价基团(di-radical)。例如,当取代基需要两个点与分子的其余部分连接时,应理解该取代基是二价基团。例如,被识别为需要两个连接点的烷基的取代基包括二价基团,例如–CH2–、–CH2CH2–、–CH2CH(CH3)CH2–等。其他基团命名约定清楚地表明该基团是二价基团,例如“亚烷基”或“亚烯基”。
如本文所用,术语“卤素”或“卤代”是指元素周期表第7列中的任何辐射稳定原子,例如氟、氯、溴或碘,其中优选为氟和氯。
如本文所用,“Ca至Cb”,其中“a”和“b”为整数,是指烷基、烯基或炔基中的碳原子数或环烷基或芳基的环原子数。即,烷基、烯基、炔基、环烷基的环和芳基的环可含有“a”至“b”(包括端值)的碳原子。例如,“C1至C4烷基”是指具有1至4个碳的所有烷基,即CH3-、CH3CH2-、CH3CH2CH2-、(CH3)2CH-、CH3CH2CH2CH2-、CH3CH2CH(CH3)-和(CH3)3C-;C3至C4环烷基是指具有3至4个碳原子的所有环烷基,即环丙基和环丁基。类似地,“4至6元杂环基”是指具有4至6个总环原子的所有杂环基,例如氮杂环丁烷、氧杂环丁烷、噁唑啉、吡咯烷、哌啶、哌嗪、吗啉等。如果未针对烷基、烯基、炔基、环烷基或芳基指定“a”和“b”,则假定在这些定义中描述最宽的范围。如本文所用,术语“C1-C6”包括C1、C2、C3、C4、C5和C6,以及由两个数字中的任何一个定义的范围。例如,C1-C6烷基包括C1、C2、C3、C4、C5和C6烷基、C2-C6烷基、C1-C3烷基等。类似地,C2-C6烯基包括C2、C3、C4、C5和C6烯基、C2-C5烯基、C3-C4烯基等;以及C2-C6炔基包括C2、C3、C4、C5和C6炔基、C2-C5炔基、C3-C4炔基等。C3-C8环烷基每个包括含有3、4、5、6、7和8个碳原子或两个数字中的任何一个所定义的范围的烃环,例如C3-C7环烷基或C5-C6环烷基。
如本文所用,“烷基”是指完全饱和(即,不包含双键或三键)的直链或支链烃链。所述烷基可以具有1至20个碳原子(无论何时出现,诸如“1至20”之类的数值范围是指给定范围内的每个整数;例如,“1至20个碳原子”是指该烷基可包括1个碳原子、2个碳原子、3个碳原子等,直至包括20个碳原子,尽管本定义也涵盖其中未指定数字范围的术语“烷基”的出现)。所述烷基也可以是具有1至9个碳原子的中等大小的烷基。所述烷基也可以是具有1至6个碳原子的低级烷基。所述烷基可以被指定为“C1-C4烷基”或类似的名称。仅作为示例,“C1-C6烷基”表示在烷基链中存在一至六个碳原子,即,所述烷基链选自甲基、乙基、丙基、异丙基、正丁基、异丁基、仲丁基和叔丁基。典型的烷基包括但不限于甲基、乙基、丙基、异丙基、丁基、异丁基、叔丁基、戊基、己基等。
如本文所用,“烷氧基”是指式-OR,其中R是如上定义的烷基,例如“C1-C9烷氧基”,包括但不限于甲氧基、乙氧基、正丙氧基、1-甲基乙氧基(异丙氧基)、正丁氧基、异丁氧基、仲丁氧基和叔丁氧基等。
如本文所用,“烯基”是指含有一个或多个双键的直链或支链烃链。所述烯基基团可以具有2至20个碳原子,尽管本定义也涵盖了其中未指定数值范围的术语“烯基”的出现。所述烯基还可以是具有2至9个碳原子的中等尺寸的烯基。所述烯基基团也可以是具有2至6个碳原子的低级烯基。所述烯基可以被指定为“C2-C6烯基”或类似的名称。仅作为示例,“C2-C6烯基”表示在烯基链中有二至六个碳原子,即,所述烯基链选自乙烯基、丙烯基-1-基、丙烯-2-基、丙烯-3-基、丁烯-1-基、丁烯-2-基、丁烯-3-基、丁烯-4-基、1-甲基丙烯-1-基、2-甲基丙烯-1-基、1-乙基-乙烯-1-基、2-甲基-丙烯-3-基、丁-1,3-二烯基、丁-1,2-二烯基和丁-1,2-二烯-4-基。典型的烯基包括但绝不限于乙烯基、丙烯基、丁烯基、戊烯基和己烯基等。
如本文所用,“炔基”是指含有一个或多个三键的直链或支链烃链。所述炔基可以具有2至20个碳原子,尽管本定义也涵盖了其中未指定数值范围的术语“炔基”的出现。所述炔基也可以是具有2至9个碳原子的中等尺寸的炔基。所述炔基也可以是具有2至6个碳原子的低级炔基。所述炔基可以被指定为“C2-C6炔基”或类似的名称。仅作为示例,“C2-C6炔基”表示在炔基链中有2至6个碳原子,即,所述炔基链选自乙炔基、丙炔-1-基、丙炔-2-基、丁炔-1-基、丁炔-3-基、丁炔-4-基和2-丁炔基。典型的炔基包括但绝不限于乙炔基、丙炔基、丁炔基、戊炔基和己炔基等。
如本文所用,“杂烷基”是指在链骨架中含有一个或多个杂原子(即,除碳以外的元素,包括但不限于氮、氧和硫)的直链或支链的烃链。所述杂烷基可以具有1至20个碳原子,尽管本定义也涵盖了未指定数值范围的术语“杂烷基”的出现。所述杂烷基也可以是具有1至9个碳原子的中等尺寸的杂烷基。所述杂烷基也可以是具有1至6个碳原子的低级杂烷基。所述杂烷基可以被指定为“C1-C6杂烷基”或类似的名称。所述杂烷基可以包含一个或多个杂原子。仅作为示例,“C4-C6杂烷基”表示在杂烷基链中存在四个至六个碳原子,并且在该链的链骨架中存在另外一个或多个杂原子。
术语“芳族”是指具有共轭π电子系统的环或环系统,并且包括碳环芳族基团(例如,苯基)和杂环芳族基团(例如,吡啶)。该术语包括单环或稠环多环(即,共享相邻原子对的环)基团,条件是整个环系统是芳族的。
如本文所用,“芳基”是指在环骨架中仅包含碳的芳族环或环系统(即,两个或更多个共享两个相邻碳原子的稠合环)。当所述芳基为环系统时,系统中的每个环都是芳族的。所述芳基可具有6至18个碳原子,尽管本定义也涵盖其中未指定数值范围的术语“芳基”的出现。在一些实施方案中,所述芳基具有6至10个碳原子。所述芳基可被称为“C6-C10芳基”、“C6或C10芳基”或类似名称。芳基的实例包括但不限于苯基、萘基、薁基和蒽基。
“芳烷基”或“芳基烷基”是经由亚烷基连接的作为取代基的芳基,例如“C7-14芳烷基”等,包括但不限于苄基、2-苯基乙基、3-苯基丙基和萘烷基。在一些情况下,所述亚烷基是低级亚烷基(即,C1-C6亚烷基)。
如本文所用,“杂芳基”是指在环骨架中含有一个或多个杂原子(即除碳以外的元素,包括但不限于氮、氧和硫)的芳族环或环系统(即,两个或更多个共享两个相邻原子的稠合环)。当所述杂芳基是环系统时,系统中的每个环都是芳族的。所述杂芳基可具有5-18个环成员(即,构成环骨架的原子数,包括碳原子和杂原子),尽管本定义还涵盖了其中未指定数值范围的术语“杂芳基”的出现。在一些实施方案中,所述杂芳基具有5至10个环成员或5至7个环成员。所述杂芳基可被指定为“5-7元杂芳基”、“5-10元杂芳基”或类似名称。杂芳基环的实例包括但不限于呋喃基、噻吩基、酞嗪基、吡咯基、噁唑基、噻唑基、咪唑基、吡唑基、异噁唑基、异噻唑基、三唑基、噻二唑基、吡啶基、哒嗪基、嘧啶基、吡嗪基、三嗪基、喹啉基、异喹啉基、苯并咪唑基、苯并噁唑基、苯并噻唑基、吲哚基、异吲哚基和苯并噻吩基。
“杂芳烷基”或“杂芳基烷基”是经由亚烷基连接的作为取代基的杂芳基。实例包括但不限于2-噻吩基甲基,3-噻吩基甲基,呋喃基甲基,噻吩基乙基,吡咯基烷基(pyrrolylalkyl),吡啶基烷基,异噁唑基烷基和咪唑基烷基。在一些情况下,所述亚烷基是低级亚烷基(即,C1-C6亚烷基)。
如本文所用,“碳环基”是指在环系统骨架中仅包含碳原子的非芳族环或环系统。当所述碳环基为环系统时,两个或多个环可以以稠合、桥连或螺接方式连接在一起。所述碳环基可以具有任何程度的饱和度,条件是环系统中的至少一个环不是芳族的。因此,碳环基包括环烷基、环烯基和环炔基。所述碳环基团可以具有3至20个碳原子,尽管本定义还涵盖了其中未指定数值范围的术语“碳环基”的出现。所述碳环基团也可以是具有3至10个碳原子的中等尺寸的碳环基。所述碳环基团也可以是具有3至6个碳原子的碳环基。所述碳环基团可以被指定为“C3-C6碳环基”或类似的名称。碳环基环的实例包括但不限于环丙基、环丁基、环戊基、环己基、环己烯基、2,3-二氢茚、双环[2.2.2]辛基、金刚烷基和螺[4.4]壬基。
如本文所用,“环烷基”是指完全饱和的碳环基环或环系统。实例包括环丙基、环丁基、环戊基和环己基。
如本文所用,“杂环基”是指在环骨架中包含至少一个杂原子的非芳族环或环系统。杂环基可以以稠合、桥接或螺旋连接的方式连接在一起。杂环基可以具有任何程度的饱和度,条件是该环系统中的至少一个环不是芳族的。所述杂原子可以存在于环系统的非芳族或芳族环中。所述杂环基可具有3至20个环成员(即,构成环骨架的原子数,包括碳原子和杂原子),尽管本定义还涵盖了其中未指定数字范围的术语“杂环基”的出现。所述杂环基也可以是具有3至10个环成员的中等大小的杂环基。所述杂环基也可以是具有3至6个环成员的杂环基。所述杂环基可被指定为“3-6元杂环基”或类似名称。在优选的六元单环杂环基中,所述杂原子选自O、N或S中的至多三个,并且在优选的五元单环杂环基中,所述杂原子选自选自O、N或S的一个或两个杂原子。杂环基环的实例包括但不限于氮杂吖啶基、咔唑基、曾啉基(cinnolinyl)、二氧戊环基、咪唑啉基、咪唑烷基、吗啉基、氧杂环丙基、氧杂环庚基(oxepanyl)、硫杂环庚基(thiepanyl)、哌啶基、哌嗪基、二氧代哌嗪基、吡咯烷基、吡咯烷酮基、吡咯烷二酮基、4-哌啶酮基、吡唑啉基、吡唑烷基、1,3-二氧杂环己二烯基(1,3-dioxinyl)、1,3-二噁烷基、1,4-二氧杂环己二烯基、1,4-二噁烷基、1,3-氧硫杂环己基、1,4-氧硫杂环己烯基(1,4-oxathiinyl)、1,4-氧硫杂环己基、2H-1,2-噁嗪基、三噁烷基、六氢-1,3,5-三嗪基、1,3-二氧杂环戊二烯基、1,3-二氧杂环戊烷基、1,3-二硫杂环戊二烯基、1,3-二硫杂环戊烷基、异噁唑啉基、异噁唑烷基、噁唑啉基、噁唑烷基、噁唑啉酮基、噻唑啉基、噻唑烷基、1,3-氧杂硫杂环戊烷基(1,3-oxathiolanyl)、吲哚基、异吲哚基、四氢呋喃基、四氢吡喃基、四氢噻吩基、四氢噻喃基、四氢-1,4-噻嗪基、硫吗啉基、二氢苯并呋喃基、苯并咪唑烷基和四氢喹啉。
“O-羧基”是指“-OC(=O)R”,其中R选自如本文所定义的氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5-10元杂芳基和3-10元杂环基。
“C-羧基”是指“-C(=O)OR”基团,其中R选自如本文所定义的氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5-10元杂芳基和3-10元杂环基。非限制性实例包括甲羧基(即,-C(=O)OH)。
“磺酰基”是指“-SO2R”,其中R选自如本文所定义的氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5-10元杂芳基和3-10元杂环基。
“亚磺基”基团是指“-S(=O)OH”基团。
“S-磺酰胺基”是指“-SO2NRARB”,其中RA和RB分别独立地选自如本文所定义的氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5-10元杂芳基和3-10元杂环基。
“N-磺酰胺基”基团是指“-N(RA)SO2RB”基团,其中RA和RB分别独立地选自如本文所定义的氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5-10元杂芳基和3-10元杂环基。
“C-酰胺基”基团是指“-C(=O)NRARB”基团,其中RA和RB分别独立地选自如本文所定义的氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5-10元杂芳基和3-10元杂环基。
“N-酰胺基”基团是指“-N(RA)C(=O)RB”基团,其中RA和RB分别独立地选自如本文所定义的氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5-10元杂芳基和3-10元杂环基。
“氨基”基团是指“-NRARB”基团,其中RA和RB分别独立地选自如本文所定义的氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5-10元杂芳基和3-10元杂环基。非限制性实例包括游离氨基(即,-NH2)。
“氨基烷基”基团是指经由亚烷基基团连接的氨基基团。
“烷氧基烷基”基团是指经由亚烷基基团连接的烷氧基基团,例如“C2-C8烷氧基烷基”等。
如本文所用,取代基衍生自未取代的母体基团,其中一个或多个氢原子已被另一原子或基团交换。除非另有说明,否则当一个基团被认为是“取代的”时,则意味着该基团被一个或多个独立地选自以下的取代基取代:C1-C6烷基、C1-C6烯基、C1-C6炔基、C1-C6杂烷基、C3-C7碳环基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、C3-C7-碳环基-C1-C6-烷基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、3-10元杂环基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、3-10元杂环基-C1-C6-烷基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、芳基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、芳基(C1-C6)烷基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、5-10元杂芳基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、5-10元杂芳基(C1-C6)烷基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、卤素、-CN、羟基、C1-C6烷氧基、C1-C6烷氧基(C1-C6)烷基(即,醚)、芳氧基、巯基(sulfhydryl和mercapto)、卤代(C1-C6)烷基(例如–CF3)、卤代(C1-C6)烷氧基(例如–OCF3)、(C1-C6)烷基硫基、芳硫基、氨基、氨基(C1-C6)烷基、硝基、O-氨基甲酰基、N-氨基甲酰基、O-硫代氨基甲酰基、N-硫代氨基甲酰基、C-酰胺基、N-酰胺基、S-磺酰胺基、N-磺酰胺基、C-羧基、O-羧基、酰基、氰氧基、异氰酸基、氰硫基(thiocyanato)、异硫氰基(isothiocyanato)、亚磺酰基、磺酰基、-SO3H、亚砜基、-OSO2C1-4烷基和氧代(=O)。无论何处基团被描述为“任选取代的”,该基团可以被上述取代基取代。
如本文所用,术语“羟基”是指-OH基团。
如本文所用,术语“氰基”是指“-CN”基团。
如本文所用,术语“叠氮基”是指–N3基团。
如本文所用,“核苷酸”包括含氮杂环碱基、糖和一个或多个磷酸基团。它们是核酸序列的单体单元。在RNA中,所述糖是核糖,而在DNA中是脱氧核糖,即缺少在核糖中存在的羟基基团的糖。含氮杂环碱基可以是嘌呤或嘧啶碱基。嘌呤碱基包括腺嘌呤(A)和鸟嘌呤(G),及其修饰的衍生物或类似物。嘧啶碱基包括胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U),及其修饰的衍生物或类似物。所述脱氧核糖的C-1原子与嘧啶的N-1或嘌呤的N-9键合。
如本文所用,“核苷”在结构上与核苷酸相似,但是缺少磷酸酯部分。核苷类似物的一个实例是其中标记与碱基连接且没有连接糖分子的磷酸基的类似物。如本领域技术人员所理解的,术语“核苷”在本文中以其一般意义使用。实例包括但不限于包含核糖部分的核糖核苷和包含脱氧核糖部分的脱氧核糖核苷。修饰的戊糖部分是其中氧原子已被碳替代和/或碳已被硫或氧原子替代的戊糖部分。“核苷”是可以具有取代的碱基和/或糖部分的单体。另外,可以将核苷掺入更大的DNA和/或RNA聚合物和寡聚物中。
如本领域技术人员所理解的,术语“嘌呤碱基”在本文中以其普通含义使用,并且包括其互变异构体。类似地,术语“嘧啶碱基”在本文中以本领域技术人员所理解的普通含义使用,并且包括其互变异构体。任选取代的嘌呤碱基的非限制性列表包括嘌呤、腺嘌呤、鸟嘌呤、次黄嘌呤、黄嘌呤、别黄嘌呤、7-烷基鸟嘌呤(例如7-甲基鸟嘌呤)、可可碱、咖啡因、尿酸和异鸟嘌呤。嘧啶碱基的实例包括但不限于胞嘧啶、胸腺嘧啶、尿嘧啶、5,6-二氢尿嘧啶和5-烷基胞嘧啶(例如5-甲基胞嘧啶)。
如本文所用,当寡核苷酸或多核苷酸被描述为“包含”本文所述的核苷或核苷酸时,是指本文所述的核苷或核苷酸与寡核苷酸或多核苷酸形成共价键。类似地,当将核苷或核苷酸描述为寡核苷酸或多核苷酸的一部分时,例如“掺入”寡核苷酸或多核苷酸中,这意味着本文所述的核苷或核苷酸与寡核苷酸或多核苷酸形成共价键。在一些这样的实施方案中,在本文所述的寡核苷酸或多核苷酸的3’羟基基团与核苷酸的5’磷酸基团之间形成共价键,作为在寡核苷酸或多核苷酸的3’碳原子与所述核苷酸的5’碳原子之间的磷酸二酯键。
如本文所用,“衍生物”或“类似物”是指具有修饰的碱基部分和/或修饰的糖部分的合成核苷酸或核苷衍生物。在例如Scheit在Nucleotide Analogs(John Wiley&Son,1980)和Uhlman等人在Chemical Reviews 90:543-584,1990中论述了此类衍生物和类似物。核苷酸类似物还可包含修饰的磷酸二酯连接键,包括硫代磷酸酯,二硫代磷酸酯,烷基-磷酸酯,苯胺磷酸酯和氨基磷酸酯连接键。本文所用的“衍生物”、“类似物”和“修饰的”可以互换使用,并且被本文所定义的术语“核苷酸”和“核苷”所涵盖。
如本文所用,术语“磷酸酯”以其本领域技术人员所理解的普通含义使用,并且包括其质子化形式(例如)。如本文所用,术语“单磷酸酯”、“二磷酸酯”和“三磷酸酯”以其本领域技术人员所理解的普通含义使用,并且包括质子化形式。
如本文所用,术语“保护基团”是指添加至分子以防止分子中现有基团进行不希望的化学反应的任何原子或原子团。有时,“保护基团(protecting group)”和“封闭基团(blocking group)”可以互换使用。
如本文所用,前缀“光”或“光-”意味着与光或电磁辐射有关。该术语可以涵盖全部或部分电磁光谱,包括但不限于通常被称为光谱的无线电、微波、红外光、可见光、紫外光、X射线或伽马射线部分的一个或多个范围。所述光谱的所述部分可以是被表面的金属区域(例如本文所述的那些金属)阻挡的部分。可选地或另外地,所述光谱的所述部分可以是穿过诸如由玻璃、塑料、二氧化硅或本文阐述的其他材料制成的区域表面的间隙区域的部分。在特定的实施方案中,可以使用能够穿过金属的辐射。可选地或另外地,可以使用被玻璃、塑料、二氧化硅或本文阐述的其他材料掩蔽的辐射。
如本文所用,术语“定相”(phasing)是指在SBS中的现象,该现象是由3’终止子和荧光团的不完全除去,并不能通过聚合酶在给定的测序循环中完成部分DNA链在簇内的掺入引起的。预定相(pre-phasing)是由于没有有效的3’终止子的核苷酸的掺入而引起的,其中由于终止失败,该掺入事件提前了1个循环。定相和预定相会导致特定循环内测得的信号强度包括当前循环的信号以及之前和之后循环的噪声。随着循环数的增加,受定相和预定相影响的每个簇的序列部分增加,从而妨碍了对正确碱基的识别。边合成边测序(SBS)期间存在痕量的未保护或未封闭(unprotected或unblocked)的3’-OH核苷酸,可以引起预定相。所述未封闭的3’-OH核苷酸可能在生产过程中或可能在存储和试剂处理过程中产生。因此,发现降低预定相发生率的核苷酸类似物是令人惊讶的,并且在SBS应用中提供了优于现有核苷酸类似物的巨大优势。例如,提供的核苷酸类似物可以导致更快的SBS循环时间、更低的定相和预定相值以及更长的测序读取长度。
3’-羟基乙缩醛封闭基团
每个R1a和R1b独立地为H、C1-C6烷基、C1-C6卤代烷基、C1-C6烷氧基、C1-C6卤代烷氧基、氰基、卤素、任选取代的苯基或任选取代的芳烷基;
每个R2a和R2b独立地为H、C1-C6烷基、C1-C6卤代烷基、氰基或卤素;
或者,R1a和R2a与它们所连接的原子一起形成任选取代的五至八元杂环基;
R3为H、任选取代的C2-C6烯基、任选取代的C3-C7环烯基、任选取代的C2-C6炔基或任选取代的(C1-C6亚烷基)Si(R4)3;以及
每个R4独立地为H、C1-C6烷基或任选取代的C6-C10芳基;条件是当每个R1a、R1b、R2a和R2b为H时,则R3不为H。
本公开的一些进一步的实施方案涉及具有式(I)结构的化合物:其中R’为H、一磷酸酯、二磷酸酯、三磷酸酯、硫代磷酸酯、磷酸酯类似物、连接至含活性磷基团的–O–或受保护基团保护的–O–;R”为H或OH;B为核苷碱基;每个R1a、R1b、R2a、R2b和R3如上定义。在一些进一步的实施方案中,B为 在一些进一步的实施方案中,核苷碱基与可检测标记(例如,荧光染料)共价结合,任选地通过连接基团,例如,B为在一些这样的实施方案中,R’为三磷酸酯。在一些这样的实施方案中,R”为H。
在本文所述的乙缩醛封闭基团的一些实施方案中,至少R1a和R1b中的一个为H。在一些这样的实施方案中,每个R1a和R1b为H。在一些其他实施方案中,至少R1a和R1b中的一个为C1-C6烷基,例如,甲基、乙基、异丙基或叔丁基。在一些实施方案中,每个R2a和R2b独立地为H、卤素或C1-C6烷基。在一些这样的实施方案中,至少R2a和R2b中的一个为H或C1-C6烷基。在一些这样的实施方案中,每个R2a和R2b为H。在一些这样的实施方案中,每个R2a和R2b为C1-C6烷基,例如甲基、乙基、异丙基或叔丁基。在一个实施方案中,每个R2a和R2b为甲基。在一些这样的实施方案中,每个R2a和R2b独立地为C1-C6烷基或卤素。在一些这样的实施方案中,R2a为H,以及R2b为卤素或C1-C6烷基。
在本文所述的乙缩醛封闭基团的一些实施方案中,R3为任选取代的C2-C6烯基。在一些这样的实施方案中,R3为C2-C6烯基(例如,乙烯基、丙烯基),其任选地被一个或多个独立地选自以下的取代基取代:卤素、C1-C6烷基、C1-C6卤代烷基及其组合。在一些进一步的实施方案中,R3为
在一些其他实施方案中,R3为任选取代的C2-C6炔基。在一些这样的实施方案中,R3为C2-C6炔基(例如乙炔基,丙炔基),其任选地被一个或多个独立地选自以下的取代基取代:卤素、C1-C6烷基、C1-C6卤代烷基及其组合。在一个实施方案中,R3为任选取代的乙炔基在一些其他实施方案中,R3为任选取代的(C1-C6亚烷基)Si(R4)3。在一些这样的实施方案中,至少一个R4为C1-4烷基。在一些进一步的实施方案中,每个R4为C1-C4烷基,例如,甲基、乙基、异丙基或叔丁基。在一个实施方案中,R3为–(CH2)-SiMe3。在一些可选的实施方案中,R3为C1-C6烷基。
在一些可选的实施方案中,R1a和R2a与它们所连接的原子一起形成五至七元杂环基。在一些这样的实施方案中,R1a和R2a与它们所连接的原子一起形成六元杂环基。在一些这样的实施方案中,所述六元杂环基具有结构在一些进一步的实施方案中,至少R1b、R2b和R3中的一个为H。在一些其他实施方案中,至少R1b、R2b和R3中的一个为C1-C6烷基。在一个实施方案中,每个R1b、R2b和R3为H。
在一些进一步的实施方案中,式(I)的化合物也由式(Ia)表示:
其中每个R2c和R2d独立地为H、卤素(例如,氟、氯)、C1-C6烷基(例如,甲基、乙基或异丙基)或C1-C6卤代烷基(例如,-CHF2、-CH2F或–CF3)。在一些这样的实施方案中,R1a和R1b中的一个为H。在一些这样的实施方案中,每个R1a和R1b为H。在一些其他实施方案中,至少R1a和R1b中的一个为C1-C6烷基,例如,甲基、乙基、异丙基或叔丁基。在一些实施方案中,每个R2a和R2b独立地为H、卤素或C1-C6烷基。在一些这样的实施方案中,每个R2a和R2b为H。在一些这样的实施方案中,每个R2c和R2d独立地为H、卤素或C1-C6烷基。在一些这样的实施方案中,每个R2c和R2d为C1-C6烷基,例如甲基、乙基、异丙基或叔丁基。在一个实施方案中,每个R2c和R2d为甲基。在一些这样的实施方案中,每个R2c和R2d独立地为卤素。在一些这样的实施方案中,R2c为H,以及R2d为H、卤素(氟、氯)或C1-C6烷基(例如,甲基、乙基、异丙基或叔丁基)。在进一步的实施方案中,每个R1a和R1b为H;R2a为H;R2b为H、卤素或甲基;R2c为H;以及R2d为H、卤素、甲基、乙基、异丙基或叔丁基。
本文所述的封闭基团的非限制性实施方案,包括具有选自以下的结构的那些:
3’-羟基硫代氨基甲酸酯封闭基团
每个R5和R6独立地为H、C1-C6烷基、C2-C6烯基、C2-C6炔基、C1-C6卤代烷基、C2-C8烷氧基烷基、任选取代的–(CH2)m–苯基、任选取代的–(CH2)n–(5或6元杂芳基)、任选取代的–(CH2)k–C3-C7碳环基或任选取代的–(CH2)p–(3至7元杂环基);
或者,R5和R6与它们所连接的原子一起形成任选取代的五至七元杂环基;
每个–(CH2)m–、–(CH2)n–、–(CH2)k–和–(CH2)p–为任选取代的;以及
每个m、n、k和p独立地为0、1、2、3或4。
一些另外的实施方案涉及式(II)的化合物:
其中R’为H、一磷酸酯、二磷酸酯、三磷酸酯、硫代磷酸酯、磷酸酯类似物、连接至含活性磷基团的–O–或受保护基团保护的–O–;R”为H或OH;B为核苷碱基;每个R5和R6如上定义。在一些进一步的实施方案中,B为 在一些进一步的实施方案中,核苷碱基与可检测标记(例如,荧光染料)共价结合,任选地通过连接基团,例如,B为在一些这样的实施方案中,R’为三磷酸酯。在一些这样的实施方案中,R”为H。
在本文所述的硫代氨基甲酸酯封闭基团的一些实施方案中,至少R5和R6中的一个为H。在一些这样的实施方案中,每个R5和R6为H。在一些这样的实施方案中,R5为H和R6为C1-C6烷基,例如,甲基、乙基、异丙基或叔丁基。在一些这样的实施方案中,R5为H和R6为C2-C6烯基(例如,乙烯基或烯丙基)或C2-C6炔基(例如,乙炔基或丙炔基)。在一些这样的实施方案中,R5为H和R2为任选取代的–(CH2)m–苯基、任选取代的–(CH2)n–(5或6元杂芳基)、任选取代的–(CH2)k–C3-C7碳环基或任选取代的–(CH2)p–(3至7元杂环基)。在一些进一步的实施方案中,所述C3-C7碳环基可以为C3-C7环烷基或C3-C7环烯基。所述3至7元杂环基可以在环结构中包含零或一个双键。在进一步的实施方案中,R5为H和R6为任选取代的–(CH2)m–苯基、任选取代的–(CH2)n–6元杂芳基、任选取代的–(CH2)k–C5或C6碳环基或任选取代的–(CH2)p–(5或6元杂环基)。在一些实施方案中,m、n、k或p为0。在其他实施方案中,m、n、k或p为1或2。在一些其他实施方案中,至少R5和R6中的一个为C1-C6烷基,例如,甲基、乙基、异丙基或叔丁基。在一些进一步的实施方案中,R5和R6均为C1-C6烷基。在一个实施方案中,R5和R6均为甲基。
在一些可选的实施方案中,R5和R6与它们所连接的原子一起形成任选取代的五至七元杂环基。在一些这样的实施方案中,R5和R6与它们所连接的原子一起形成任选取代的哌啶基。
本公开的另外的实施方案涉及包含本文所述的核苷或核苷酸的寡核苷酸或多核苷酸。
在本文所述的封闭基团的任何实施方案中,当基团被描述为“任选取代的”时,它可以是未取代的或取代的。
在本文所述的具有3’-羟基封闭基团的核苷酸或核苷的任何实施方案中,所述核苷或核苷酸可以共价连接于可检测的标记(例如,荧光团),任选地经由连接基团。所述连接基团可以是可断裂的或不可断裂的。在一些这样的实施方案中,所述可检测的标记(例如,荧光团)经由可断裂的连接基团共价连接于核苷或核苷酸的核苷碱基。在一些其他实施方案中,所述可检测的标记(例如,荧光团)经由可断裂的连接基团共价连接于核苷或核苷酸的3’氧。在一些进一步的实施方案中,这样的可断裂的连接基团可以包含叠氮基部分或二硫键部分,乙缩醛部分或硫代氨基甲酸酯部分。在一些实施方案中,所述3’羟基封闭基团和可断裂的连接基团(和连接的标记)可以在相同或基本相同的化学反应条件下除去,例如,所述封闭基团和所述可检测的标记可以在单个化学反应中除去。在其他实施方案中,所述封闭基团和所述可检测的标记在两个分开的步骤中被除去。
在一些实施方案中,本文所述的核苷酸或核苷包含2’脱氧核糖。在另一些其他方面,所述2’脱氧核糖在糖环的5’位置含有一个、两个或三个磷酸基团。在另一方面,本文所述的核苷酸是核苷三磷酸。
在一些实施方案中,与现有技术中公开的标准3’-OH封闭基团(例如,3’-O-叠氮基甲基保护基团)保护的相同核苷酸或核苷相比,本文所述的3’封闭的核苷酸或核苷在储存期间的溶液中或在测序应用期间的试剂处理中提供了优异的稳定性。例如,与在相同条件下相同时间段内的叠氮基甲基保护的3’-OH相比,本文公开的乙缩醛或硫代氨基甲酸酯封闭基团可赋予至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%、700%、800%、900%、1000%、1500%、2000%、2500%或3000%的改进的稳定性,从而降低了预定相值并获得更长的测序读取长度。在一些实施方案中,所述稳定性是在环境温度或低于环境温度(例如4-10℃)的温度下测量的。在其他实施方案中,所述稳定性是在升高的温度下测量的,例如40℃、45℃、50℃、55℃、60℃或65℃。在一些这样的实施方案中,所述稳定性是在碱性pH环境的溶液中测量的,例如,在pH9.0、9.2、9.4、9.6、9.8或10.0。在一些这样的实施方案中,所述稳定性在有或没有诸如聚合酶(例如,DNA聚合酶)、末端脱氧核苷酸转移酶或逆转录酶的酶的存在下测量的。
在一些实施方案中,与现有技术中公开的标准3’-OH封闭基团(例如,3’-O-叠氮基甲基保护基团)保护的相同核苷酸或核苷相比,本文所述的3’封闭的核苷酸或核苷在测序应用的化学断裂步骤期间的溶液中提供了优异的解封闭率。例如,与使用标准解封闭试剂(例如三(羟基丙基)膦)的叠氮基甲基保护的3’-OH相比,本文公开的乙缩醛或硫代氨基甲酸酯封闭基团可以赋予至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、300%、400%、500%、600%、700%、800%、900%、1000%、1500%或2000%的改进的解封闭率,从而减少了测序循环的总时间。在一些实施方案中,所述解封闭率是在环境温度或低于环境温度(例如4-10℃)的温度下测量的。在其他实施方案中,所述解封闭率是在升高的温度下测量的,例如40℃、45℃、50℃、55℃、60℃或65℃。在一些这样的实施方案中,所述解封闭率是在碱性pH环境的溶液中测量的,例如,在pH9.0、9.2、9.4、9.6、9.8或10.0。在一些这样的实施方案中,所述解封闭试剂与底物(即3’封闭的核苷或核苷酸)的摩尔比为约10∶1、约5∶1、约2∶1或约1∶1。
在一些实施方案中,钯解封闭试剂(例如,Pd(0)用于除去3’缩醛封闭基团(例如,AOM封闭基团)。Pd可能与AOM基团的两个氧原子以及烯丙基基团的双键形成螯合配合物,使得解封闭试剂直接邻近要被除去的官能团,并且可以导致加速的解封闭率。
3’-OH封闭基团的脱保护
本文所述的3’-乙缩醛封闭基团可在各种化学条件下除去或断裂。对于含有乙烯基或烯基部分的乙缩醛封闭基团非限制性断裂条件包括Pd(II)配合物,例如Pd(OAc)2或烯丙基氯化钯(II)二聚体,在膦配体,例如三(羟基甲基)膦(THMP)或三(羟基丙基)膦(THP或THPP)的存在下。对于那些含有炔基基团(例如,乙炔基)的封闭基团,它们也可以通过Pd(II)配合物(例如,Pd(OAc)2或烯丙基氯化钯(II)二聚体)在膦配体(例如,THP或THMP)的存在下除去。
钯断裂试剂
在一些实施方案中,本文所述的乙缩醛封闭基团可被钯催化剂断裂。在一些这样的实施方案中,所述钯催化剂是水溶性的。在一些这样的实施方案中,为Pd(0)配合物(例如,(3,3′,3″-次膦基三(苯磺酸基)钯(0)九钠盐九水合物)。在一些情况下,所述Pd(0)配合物可以通过诸如烯烃、醇、胺、膦或金属氢化物等试剂还原Pd(II)配合物而原位生成。合适的钯源包括Na2PdCl4、Pd(CH3CN)2Cl2、(PdCl(C3H5))2、[Pd(C3H5)(THP)]Cl、[Pd(C3H5)(THP)2]Cl、Pd(OAc)2、Pd(Ph3)4、Pd(dba)2、Pd(Acac)2、PdCl2(COD)和Pd(TFA)2。在一个这样的实施方案中,从Na2PdCl4原位产生Pd(0)配合物。在另一个实施方案中,所述钯源为烯丙基氯化钯(II)二聚体[(PdCl(C3H5))2]。在一些实施方案中,通过将Pd(II)配合物与膦混合在水溶液中生成Pd(0)配合物。合适的膦包括水溶性膦,例如三(羟基丙基)膦(THP)、三(羟基甲基)膦(THMP)、1,3,5-三氮杂-7-磷杂金刚烷(PTA,1,3,5-triaza-7-phosphaadamantane)、二水合双(对-磺酰苯基)苯基膦化二钾盐(bis(p-sulfonatophenyl)phenylphosphine dihydratepotassium salt)、三(羧乙基)膦(TCEP)和三苯基膦-3,3’,3”-三磺酸三钠盐。
在一些实施方案中,所述Pd(0)通过将Pd(II)配合物[(PdCl(C3H5))2]与THP混合原位制备。Pd(II)配合物与THP的摩尔比约为1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9或1:10。在一些进一步的实施方案中,可以添加一种或多种还原剂,例如抗坏血酸或其盐(例如,抗坏血酸钠)。在一些实施方案中,该断裂混合物可包含另外的缓冲剂,例如伯胺、仲胺、叔胺、碳酸盐、磷酸盐或硼酸盐,或其组合。在一些进一步的实施方案中,所述缓冲剂包括乙醇胺(EA)、三(羟基甲基)氨基甲烷(Tris)、甘氨酸、碳酸钠、磷酸钠、硼酸钠、2-二甲基氨基乙醇(DMEA)、2-二乙基氨基乙醇(DEEA)、N,N,N′,N′-四甲基乙二胺(TEMED)或N,N,N′,N′-四乙基乙二胺(TEEDA),或其组合。在一个实施方案中,所述缓冲试剂为DEEA。在另一个实施方案中,所述缓冲剂包含一种或多种无机盐,例如碳酸盐、磷酸盐或硼酸盐,或其组合。在一个实施方案中,所述无机盐是钠盐。
可选的,在(NH4)2MoS4的存在下,含有封闭基团的炔基部分也可以被断裂。炔基部分的其他非限制性断裂条件包括与THPTA配体(三(3-羟基丙基三唑基甲基)胺)形成的Cu(II)配合物和抗坏血酸。含有六元杂环的封闭基团(例如,四氢吡喃)的非限制性断裂条件包括环糊精或Ln(OTf)3(三氟甲磺酸镧)。含有烷基硅烷基团(例如,-CH2SiMe3)的封闭基团的非限制性断裂条件包括LiBF(四氟硼酸锂)。其他缩醛封闭基团可以通过LiBF4或Bi(OTf)3(三氟甲磺酸铋)除去,例如–O(CH2)O-C1-C6烷基。以下的方案1中说明了用于断裂所述的各种封闭基团的非限制性示例性条件。
方案1. 3’-解封闭条件的图解
另外,–CH2N3中的叠氮基可以被膦转化为氨基。可选的,–CH2N3中的叠氮基可通过使该分子与硫醇(尤其是水溶性硫醇,如二硫苏糖醇(DTT))接触而转化为氨基。在一个实施方案中,所述膦为THP。
与线性化的兼容性
为了使核酸测序反应的通量最大化,能够并行地测序多个模板分子是有利的。使用核酸阵列技术可以实现多个模板的并行处理。这些阵列通常由固定在固相载体上的多核苷酸的高密度基质组成。
WO 98/44151和WO 00/18957均描述了核酸扩增方法,该方法允许将扩增产物固定在固相载体上,以形成由簇或“集群(colony)”组成的阵列,所述簇或“集群”由多个相同的固定化多核苷酸链和多条相同的固定化互补链形成。这种类型的阵列在本文中称为“簇阵列(clustered array)”。存在于根据这些方法制备的簇阵列上的DNA集群中的核酸分子可提供用于测序反应的模板,例如WO 98/44152中所述。诸如WO 98/44151和WO 00/18957中所述的固相扩增反应的产物是通过对固定化多核苷酸链和固定化互补链对退火而形成的所谓的“桥接(bridged)”结构,两条链均在5’端连接至固相载体。为了提供用于核酸测序的更合适的模板,优选除去“桥接”结构中的所述固定化链中的一条的基本上全部或至少一部分,以产生至少部分为单链的模板。因此,所述模板为单链的部分可用于与测序引物杂交。除去“桥接”双链核酸结构中一条固定化链的全部或部分的过程称为“线性化”。线性化有多种方式,包括但不限于酶促断裂、光化学断裂或化学断裂。线性化方法的非限制性实例公开于PCT公开WO 2007/010251、美国专利公开2009/0088327、美国专利公开2009/0118128和美国申请62/671,816,通过引用将其全部内容并入。
在一些实施方案中,脱保护或除去3’-OH封闭基团的条件也与线性化过程相兼容。在一些进一步的实施方案中,所述脱保护条件与化学线性化过程兼容,其包括使用Pd配合物和膦,例如Pd(OAc)2和THP。在一些实施方案中,所述Pd配合物是Pd(II)配合物,其在膦存在下会原位生成Pd(0)。
除非另有说明,否则对核苷酸的提及也旨在适用于核苷。
标记的核苷酸
根据本公开的一个方面,所描述的3’-OH封闭的核苷酸还包含可检测的标记,并且这种核苷酸称为标记的核苷酸。所述标记(例如,荧光染料)可以通过任选的连接基团,通过多种方法进行结合,包括疏水吸引、离子吸引和共价连接。在一些方面,所述染料通过共价连接而结合至基板。更特别地,所述共价连接是借助于连接基团。在一些情况下,这种标记的核苷酸也被称为“修饰的核苷酸”。
标记的核苷和核苷酸可用于标记酶促合成形成的多核苷酸,所述酶促合成为例如,作为非限制性实例,PCR扩增、等温扩增、固相扩增、多核苷酸测序(例如,固相测序)、切口平移(nick translation)反应。
在一些实施方案中,所述染料可以通过核苷碱基共价连接于寡核苷酸或核苷酸。例如,所述标记的核苷酸或寡核苷酸可具有通过连接基团部分连接至嘧啶碱基的C5位置或7-脱氮嘌呤碱基的C7位置的标记。
除非另有说明,否则对核苷酸的提及也旨在适用于核苷。除非另有说明,本发明还将提及DNA进行进一步描述,尽管该描述也适用于RNA、PNA和其他核酸。
连接基团
在本文所述的一些实施方案中,本文所述的核苷酸或核苷分子的嘌呤或嘧啶碱基可与如上所述的可检测标记连接。在一些这样的实施方案中,使用的连接基团是可断裂的。使用可断裂的连接基团可确保检测到标记后,如果需要的话,将其除去,从而避免与后续掺入的任何标记的核苷酸或核苷产生任何干扰信号。在一些实施方案中,可断裂的连接基团包含叠氮基部分、–O-C2-C6烯基部分(例如,-O-烯丙基)、二硫键部分、乙缩醛部分(与本文所述的3’乙缩醛封闭基团相同或相似)或硫代氨基甲酸酯部分(与本文所述的3’乙缩醛封闭基团相同或相似)。
在一些其他实施方案中,使用的连接基团是不可断裂的。由于在每种掺入了本发明的标记的核苷酸的情况下,都不需要随后掺入任何核苷酸,因此不需要从核苷酸上除去标记。
可断裂的连接基团是本领域已知的,并且可以应用常规化学方法将连接基团连接至核苷碱基和标记。可以通过任何合适的方法断裂该连接基团,包括暴露于酸、碱、亲核试剂、亲电试剂、自由基、金属、还原剂或氧化剂、光、温度、酶等。本文所述的连接基团也可以用与断裂3’-O-封闭基团的键相同的催化剂断裂。合适的连接基团可适应于标准化学保护基团,如Greene&Wuts,Protective Groups in Organic Synthesis,John Wiley&Sons中所公开的。用于固相合成的其他合适的可断裂的连接基团在Guillier等人(Chem.Rev.100:2092-2157,2000)中公开。
在所述可检测的标记连接至碱基的情况下,可以将连接基团连接至核苷碱基的任何位置,只要沃森-克里克碱基配对仍可以进行。在嘌呤碱基的情况下,所述连接基团优选经由嘌呤或优选的脱氮嘌呤类似物的7位、经由8-修饰的嘌呤、经由N-6修饰的腺苷或N-2修饰的鸟嘌呤连接。对于嘧啶,优选经由胞嘧啶、胸腺嘧啶或尿嘧啶的5-位和胞嘧啶的N-4位进行连接。
在一些实施方案中,所述连接基团可包含间隔单元(spacer unit)。所述连接基团的长度无关紧要,只要所述标记与核苷酸保持足够的距离,以不干扰核苷酸与酶(例如聚合酶)之间的任何相互作用即可。
在一些实施方案中,所述连接基团可以由与3’-OH保护基团相似的官能团组成。这将使脱保护和解封闭过程更有效,因为仅需一次处理即可除去所述标记和所述保护基团。
术语“可断裂的连接基团”的使用并不意味着暗示需要除去整个连接基团。断裂位点可以位于连接基团上的位置,该位置确保在断裂后连接基团的一部分仍与染料和/或基板部分保持连接。作为非限制性实例,可断裂的连接基团可以是亲电可断裂的连接基团、亲核可断裂的连接基团、光可断裂的连接基团、在还原条件、氧化条件下可断裂的(例如含二硫键或叠氮基的连接基团)、经由使用安全拉手(safety-catch)连接基团可断裂的和通过消除机制可断裂的。使用可断裂的连接基团将染料化合物连接至基板部分可确保如果需要的话,所述标记在检测后被除去,从而避免了下游步骤中的任何干扰信号。
有用的连接基团可以在PCT公开WO 2004/018493(通过引用并入本文)中找到,其实例包括可以使用水溶性的膦或由过渡金属和至少部分水溶性的配体(例如,Pd(II)配合物和THP)形成的水溶性过渡金属催化剂断裂的连接基团。后者在水溶液中至少形成部分水溶性的过渡金属配合物。此类可断裂的连接基团可用于将核苷酸的碱基连接至标记,例如本文所述的染料。
特定的连接基团包括在PCT公开WO 2004/018493(通过引用并入本文)中公开的那些连接基团,例如包括下式的部分的那些:
(其中X选自O、S、NH和NQ,其中Q为C1-10取代或未取代的烷基基团,Y选自O、S、NH和N(烯丙基),T为氢或C1-C10取代或未取代的烷基基团,*表示该部分与核苷酸或核苷的其余部分连接的位置)。在一些方面,所述连接基团将核苷酸的碱基连接至标记,例如本文所述的染料化合物。
连接基团的其他实例包括美国公开2016/0040225(通过引用并入本文)中公开的那些,例如包括下式的部分的那些:
本文所示的连接基团部分可包含核苷酸/核苷与所述标记之间的全部或部分连接基团结构。
连接基团(“L”)的另外的实例包括下式的部分:
其中B为核苷碱基;Z为–N3(叠氮基)、–O-C1-C6烷基、–O-C2-C6烯基或–O-C2-C6炔基;以及Fl包含荧光标记,其可能包含另外的连接基团结构。本领域普通技术人员理解,标记通过所述标记的官能团(例如,羧基)与连接基团的官能团(例如,氨基)反应而与连接基团共价键合。
在特定的实施方案中,可以改变荧光染料(荧光团)和鸟嘌呤碱基之间的连接基团的长度,例如,通过插入聚乙二醇间隔基,从而使其与通过本领域已知的其他连接键连接至鸟嘌呤碱基的相同荧光团相比,荧光强度更高。示例性的连接基团及其性质在PCT公开WO2007020457(通过引用并入本文)中阐述。连接基团的设计,特别是其增加的长度,可在掺入多核苷酸(例如DNA)中时提高与鸟苷核苷酸的鸟嘌呤碱基相连的荧光团的亮度。因此,当所述染料用于需要检测连接到含鸟嘌呤核苷酸的荧光染料标记的任何分析方法中时,连接基团包含式–((CH2)2O)n–(其中n是2到50之间的整数)的间隔基团是有利的,如WO 2007/020457中所述。
核苷和核苷酸可以在糖或核碱基的位点被标记。如本领域中已知的,“核苷酸”由含氮碱基、糖和一个或多个磷酸基团组成。在RNA中所述糖,是核糖,在DNA中是脱氧核糖(即,缺乏在核糖中存在的羟基的糖)。所述含氮碱基是嘌呤或嘧啶的衍生物。所述嘌呤为腺嘌呤(A)和鸟嘌呤(G),所述嘧啶为胞嘧啶(C)和胸腺嘧啶(T)或在RNA的情况下为尿嘧啶(U)。脱氧核糖的C-1原子与嘧啶的N-1或嘌呤的N-9键合。核苷酸也是核苷的磷酸酯,所述核苷在所述糖的C-3或C-5连接的羟基上发生酯化作用。核苷酸通常是单、二或三磷酸酯。
“核苷”在结构上与核苷酸相似,但是缺少磷酸部分。核苷类似物的实例是其中标记与碱基连接而糖分子上没有磷酸基团的核苷类似物。
尽管所述碱基通常被称为嘌呤或嘧啶,但本领域技术人员将理解,不会改变核苷酸或核苷进行沃森-克里克碱基配对的能力的衍生物和类似物是可行的。“衍生物”或“类似物”是指其核心结构与母体化合物相同或非常相似,但具有化学或物理修饰(例如不同或另外的侧基,其使所述衍生核苷酸或核苷与另一个分子连接)的化合物或分子。例如,所述碱基可以是脱氮嘌呤。在特定的实施方案中,所述衍生物应能够进行沃森-克里克配对。“衍生物”和“类似物”还包括,例如,具有修饰的碱基部分和/或修饰的糖部分的合成核苷酸或核苷衍生物。这样的衍生物和类似物在例如Scheit,Nucleotide analogs(John Wiley&Son,1980)和Uhlman等人,Chemical Reviews 90:543-584,1990中论述。核苷酸类似物还可以包含修饰的磷酸二酯连接键,包括硫代磷酸酯、二硫代磷酸酯、烷基-磷酸酯、苯胺磷酸酯、氨基磷酸酯连接键等。
染料可以(例如,通过连接基团)连接到核苷酸碱基的任何位置。在特定的实施方案中,沃森-克里克碱基配对仍然可以对所得的类似物进行。特定的核苷碱基标记位点包括嘧啶碱基的C5位置或7-脱氮嘌呤碱基的C7位置。如上所述,可以使用连接基团将染料共价连接于核苷或核苷酸。
在特定的实施方案中,所述标记的核苷或核苷酸可以是酶可合并的和酶可扩展的。因此,连接基团部分可以具有足够的长度以将核苷酸连接至化合物,从而该化合物不会显著干扰核酸复制酶对核苷酸的整体结合和识别。因此,所述连接基团也可以包含间隔单元。该间隔单元将例如,核苷酸碱基与断裂位点或标记隔开。
用本文所述染料标记的核苷或核苷酸可具有下式:
其中染料为染料化合物;B为核苷碱基,例如尿嘧啶、胸腺嘧啶、胞嘧啶、腺嘌呤、鸟嘌呤等;L为任选的连接基团,其可以存在或可以不存在;R’可以是H、一磷酸酯、二磷酸酯、三磷酸酯、硫代磷酸酯、磷酸酯类似物、连接至含活性磷基团的–O–或–O–受封闭基团保护;R”’可以是H、OH、亚磷酰胺或本文所述的3′-OH封闭基团,以及R”为H或OH。当R”’是亚磷酰胺时,R’是酸可断裂的羟基保护基团,其允许后续的单体在自动合成条件下偶联。
在特定的实施方案中,连接基团(在染料和核苷酸之间)和封闭基团都存在并且是分开的部分。在特定的实施方案中,连接基团和封闭基团都可以在基本相似的条件下断裂。因此,解封闭过程可能更有效,因为仅需一次处理即可除去染料化合物和封闭基团。然而,在一些实施方案中,连接基和封闭基团不需要在相似条件下可断裂,而是在不同条件下可单独断裂。
本公开还包括掺入染料化合物的多核苷酸。这样的多核苷酸可以是分别由磷酸二酯连接键连接的脱氧核糖核苷酸或核糖核苷酸组成的DNA或RNA。多核苷酸可包含与本文所述的至少一个修饰的核苷酸(例如,用染料化合物标记的)组合的天然存在的核苷酸、除本文所述的标记的核苷酸以外的非天然存在的(或修饰的)核苷酸或其任何组合。根据本公开的多核苷酸还可包括非天然骨架连接键和/或非核苷酸化学修饰。也考虑由包含至少一个标记的核苷酸的核糖核苷酸和脱氧核糖核苷酸的混合物组成的嵌合结构。
本文所述的非限制性示例性标记的核苷酸包括:
其中L代表连接基团,R代表如上所述的糖残基、或5’位被一个、两个或三个磷酸取代的糖残基。
在一些实施方案中,非限制性示例性荧光染料缀合物如下所示:
其中PG代表本文所述的3’-羟基封闭基团。在本文所述的标记的核苷酸的任何实施方案中,该核苷酸是核苷三磷酸。
试剂盒
本公开还提供了试剂盒,其包含一个或多个本文所述的3’封闭的核苷和/或核苷酸,例如,式(I)、(Ia)或(II)的3’封闭的核苷酸。这种试剂盒通常包括至少一种用染料标记的3’封闭的核苷酸或核苷以及至少一种其他组分。所述其他组分可以是在本文所述的方法确定的或在下面的实施例部分中一种或多种组分。可以组合到本公开的试剂盒中的组分的一些非限制性实例在下面阐述。
在一个特定的实施方案中,试剂盒可包括至少一种标记的3’封闭的核苷酸或核苷以及标记的或未标记的核苷酸或核苷。例如,可以将用染料标记的核苷酸与未标记的或天然的核苷酸和/或与荧光标记的核苷酸或其任何组合以组合提供。核苷酸的组合可以作为分开的单独成分提供(例如,每个容器或试管一种核苷酸类型),也可以作为核苷酸混合物(例如,在同一容器或试管中混合两种或多种核苷酸)提供。
当试剂盒包含用染料化合物标记的多种(特别是两种或三种,或更特别是四种)3’封闭的核苷酸时,该不同的核苷酸可以用不同的染料化合物标记,或者一个核苷酸可以是暗的,其不具有染料化合物。当所述不同的核苷酸被不同的染料化合物标记时,所述试剂盒的特征是所述染料化合物是光谱上可区分的荧光染料。如本文所用,术语“光谱上可区分的荧光染料”是指当在一个样本中存在两种或更多种此类染料时,其以可被荧光检测设备(例如,基于商用毛细管的DNA测序平台)区分的波长发射荧光能量的荧光染料。当以试剂盒形式提供被荧光染料化合物标记的两种核苷酸时,一些实施方案的特征在于,光谱上可区分的荧光染料可以在相同的波长下被激发,例如被相同的激光激发。当以试剂盒形式提供用荧光染料化合物标记的四种3’封闭的核苷酸(A、C、T和G)时,一些实施方案的特征是,两种光谱上可区分的荧光染料都可以在一个波长下被激发,而其他两种在光谱上可区分的染料都可以在另一波长被激发。特定的激发波长是488nm和532nm。
在一个实施方案中,试剂盒包括用第一种染料标记的第一种3’封闭的核苷酸和用第二种染料标记的第二种核苷酸,其中所述染料的最大吸光度差异至少为10nm,特别是20nm至50nm。更特别地,所述两种染料化合物的斯托克斯位移在15-40nm之间,其中“斯托克斯位移”是峰吸收波长与峰发射波长之间的距离。
在一个可选的实施方案中,本公开的试剂盒可以包含3’封闭的核苷酸,其中相同的碱基用两种或更多种不同的染料标记。可以用第一种染料标记第一种核苷酸(例如,3’封闭的T核苷三磷酸或3’封闭的G核苷三磷酸)。第二种核苷酸(例如,3’封闭的C核苷三磷酸)可以用与第一种染料光谱上不同的第二种染料标记,例如“绿色”染料的吸收小于600nm,以及“蓝色”染料的吸收小于500nm,例如400nm至500nm,特别是450nm至460nm。第三种核苷酸(例如,3’封闭的A核苷三磷酸)可以标记为第一种和第二种染料的混合物,或第一种、第二种和第三种染料的混合物,以及第四种核苷酸(例如,3’封闭的G核苷三磷酸或3’封闭的T核苷三磷酸)可能是“暗的”且没有标记。在一个实例中,所述核苷酸1-4可以被标记为“蓝色”、“绿色”、“蓝色/绿色”和暗的。为了进一步简化仪器,可以用两种在单一激光下激发的染料标记四种核苷酸,因此核苷酸1-4的标记可以是“蓝色1”、“蓝色2”、“蓝色1/蓝色2”和暗的。
在特定的实施方案中,所述试剂盒可以包含四种标记的3’封闭的核苷酸(例如,A、C、T、G),其中每种类型的核苷酸包含相同的3’封闭基团和荧光标记,并且其中每种荧光标记具有不同的荧光最大值且每个荧光标记都可与其他三种标记区分开。所述试剂盒可以使两个或多个荧光标记具有相似的最大吸光度,但具有不同的斯托克斯位移。在一些其他实施方案中,一种所述核苷酸未标记。
尽管本文针对具有用不同染料化合物标记的不同核苷酸的构型例示了试剂盒,但是应理解,试剂盒可包括具有相同染料化合物的2、3、4或更多个不同核苷酸。在一些实施方案中,所述试剂盒还包括酶和适合该酶作用的缓冲液。在一些这样的实施方案中,所述酶是聚合酶、末端脱氧核苷酸转移酶或逆转录酶。在特定的实施方案中,所述酶是DNA聚合酶,例如DNA聚合酶812(Pol 812)或DNA聚合酶1901(Pol 1901)。在例如,2019年10月31日提交的美国专利申请16/670,876和2019年12月4日提交的美国专利申请16/703,569中描述了Pol812和Pol 1901聚合酶的氨基酸序列,其通过引用并入本文。
此类试剂盒中包括的其他组分可能包括缓冲液等。本公开的核苷酸和包括不同核苷酸的混合物的其他任何核苷酸组分,可以以在使用前稀释的浓缩形式提供在试剂盒中。在这样的实施方案中,也可以包括合适的稀释缓冲液。同样,在本文阐述的方法中确定的一种或多种组分可以包括在本公开的试剂盒中。
测序方法
根据本公开的标记的核苷酸或核苷可用于任何分析方法中,例如包括检测连接于核苷酸或核苷的荧光标记的方法,无论该标记的核苷酸或核苷是单独存在还是掺入或相连于较大分子结构或缀合物中。在本文中,术语“掺入多核苷酸”可以表示5’磷酸参与构成磷酸二酯键连接至第二个(修饰或未修饰的)核苷酸的3’-OH基团,该第二个核苷酸本身可以形成更长的多核苷酸链的一部分。本文所述核苷酸的3’端可以或可以不参与构成磷酸二酯键连接至其他(修饰或未修饰)核苷酸的5’磷酸。因此,在一个非限制性实施方案中,本公开提供了检测掺入到多核苷酸中的核苷酸的方法,该方法包括:(a)将本公开的至少一种核苷酸掺入多核苷酸中,以及(b)通过检测与所述核苷酸连接的染料化合物的荧光信号检测掺入多核苷酸的核苷酸。
该方法可以包括:合成步骤(a),其将根据本发明的一种或多种核苷酸掺入多核苷酸中;和检测步骤(b),其通过检测或定量测量掺入多核苷酸中的一种或多种核苷酸的荧光来检测掺入多核苷酸中的一种或多种核苷酸。
本申请的一些实施方案涉及测序方法,包括:(a)将至少一种本文所述的标记的核苷酸掺入多核苷酸中;以及(b)通过检测与所述核苷酸连接的新的荧光染料的荧光信号来检测掺入多核苷酸中的标记的核苷酸。
本公开的一些实施方案涉及确定靶单链多核苷酸序列的方法,其包含:
(a)将本文所述的包含3’-OH封闭基团和可检测标记的核苷酸掺入与靶多核苷酸链的至少一部分互补的复制多核苷酸链中;
(b)检测掺入复制多核苷酸链中的核苷酸的身份;以及
(c)从掺入复制多核苷酸链中的核苷酸中化学除去标记和3’封闭基团。
在一些实施方案中,所述测序方法进一步包含(d)将化学除去的标记和3’封闭基团从复制多核苷酸链上洗去。在一些这样的实施方案中,在引入下一个互补核苷酸之前,先除去3′封闭基团和所述可检测的标记。在一些进一步的实施方案中,所述3’封闭基团和可检测标记在单个化学反应步骤中被除去。在一些实施方案中,所述洗涤步骤(d)还除去未掺入的核苷酸。在一些进一步的实施方案中,在标记和3′封闭基团化学断裂后的洗涤步骤中也使用钯清除剂。
在一些实施方案中,重复步骤(a)至(d),直到确定了模板多核苷酸链部分的序列为止。在一些这样的实施方案中,步骤(a)至(d)重复至少50次、至少75次、至少100次、至少150次、至少200次、至少250次或至少300次。
在一些实施方案中,所述标记和3’封闭基团在两个分开的化学反应中被除去。在一些这样的实施方案中,从掺入复制多核苷酸链的核苷酸中除去标记包含使包括所述掺入的核苷酸的复制链与第一断裂溶液接触。在一些这样的实施方案中,所述第一个断裂溶液包含膦,例如三烷基膦。三烷基膦的非限制性实例包括三(羟基丙基)膦(THP)、三(2-羧乙基)膦(TCEP)、三(羟基甲基)膦(THMP)或三(羟基乙基)膦(THEP)。在一个实施方案中,所述第一断裂溶液含有THP。在一些这样的实施方案中,从掺入复制的多核苷酸链中的核苷酸中除去3’封闭基团包含使包括所述掺入的核苷酸的复制链与第二断裂溶液接触。在一些这样的实施方案中,所述第二断裂溶液包含钯(Pd)催化剂。在一些进一步的实施方案中,所述Pd催化剂是Pd(0)催化剂。在一些这样的实施方案中,所述Pd(0)通过将Pd(II)配合物[(PdCl(C3H5))2]与THP混合原位制备。Pd(II)配合物与THP的摩尔比约为1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9或1:10。在一实施方案中,Pd∶THP的摩尔比为1∶5。在一些进一步的实施方案中,可以添加一种或多种还原剂,例如抗坏血酸或其盐(例如,抗坏血酸钠)。在一些实施方案中,第二断裂溶液可包含一种或多种缓冲剂,例如伯胺、仲胺、叔胺、碳酸盐、磷酸盐或硼酸盐,或其组合。在一些进一步的实施方案中,所述缓冲剂包括乙醇胺(EA)、三(羟基甲基)氨基甲烷(Tris)、甘氨酸、碳酸钠、磷酸钠、硼酸钠、2-二甲基氨基乙醇(DMEA)、2-二乙基氨基乙醇(DEEA)、N,N,N′,N′-四甲基乙二胺(TEMED)或N,N,N′,N′-四乙基乙二胺(TEEDA),或其组合。在一个实施方案中,所述缓冲试剂为DEEA。在另一个实施方案中,所述缓冲剂包含一种或多种无机盐,例如碳酸盐、磷酸盐或硼酸盐,或其组合。在一个实施方案中,所述无机盐是钠盐。在一些其他实施方案中,所述第二断裂溶液含有NaIO4或在一些进一步的实施方案中,所述3’封闭的核苷酸含有AOM基团,所述第二断裂溶液含有钯(Pd)催化剂和本文所述的一种或多种缓冲剂(例如,叔胺,如DEEA)并具有pH约为9.0至10.0(例如,9.6或9.8)。
在一些可选的实施方案中,所述标记和3’-OH封闭基团在单个化学反应中被除去。在一些这样的实施方案中,所述标记通过可断裂连接基团与核苷酸连接,所述可断裂连接基团与3’封闭基团包含相同的部分,例如,所述连接基团和3′封闭基团均可以包含如本文所述的缩醛部分或硫代氨基甲酸酯部分在一些这样的实施方案中,所述单个化学反应在含有上述Pd催化剂的断裂溶液中进行。
在一些进一步的实施方案中,掺入步骤(a)中使用的核苷酸是完全官能化的A、C、T和G核苷三磷酸,每个核苷酸均包含本文所述的3’封闭基团。在一些这样的实施方案中,与用标准3′-O-叠氮基甲基封闭基团保护的相同核苷酸相比,本文的核苷酸在测序过程中的溶液中提供了优异的稳定性。例如,与在相同条件下相同时间段内的叠氮基甲基保护的3’-OH相比,本文公开的乙缩醛或硫代氨基甲酸酯封闭基团可赋予至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%、700%、800%、900%、1000%、1500%、2000%、2500%或3000%的改进的稳定性,从而降低了预定相值并获得更长的测序读取长度。在一些实施方案中,所述稳定性是在环境温度或低于环境温度(例如4-10℃)的温度下测量的。在其他实施方案中,所述稳定性是在升高的温度下测量的,例如40℃、45℃、50℃、55℃、60℃或65℃。在一些这样的实施方案中,所述稳定性是在碱性pH环境的溶液中测量的,例如,在pH9.0、9.2、9.4、9.6、9.8或10.0。在一些进一步的实施方案中,具有本文所述的3’封闭的核苷酸的预定相值在经过50、100或150个SBS循环后,小于约0.25、0.24、0.23、0.22、0.21、0.20、0.19、0.18、0.17、0.16、0.15、0.14、0.13、0.12、0.11、0.10、0.09、0.08、0.07、0.06或0.05。在一些进一步的实施方案中,所述的3’封闭的核苷酸的所述定相值在经过50、100或150个SBS循环后,小于约0.25、0.24、0.23、0.22、0.21、0.20、0.19、0.18、0.17、0.16、0.15、0.14、0.13、0.12、0.11、0.10、0.09、0.08、0.07、0.06或0.05。在一个实施方案中,每个ffN都包含所述3’-AOM基团。
在一些实施方案中,与标准3’-O-叠氮基甲基封闭基团保护的相同核苷酸相比,本文所述的3’封闭的核苷酸在测序运行的化学断裂步骤期间的溶液中提供了优异的解封闭率。例如,与使用标准解封闭试剂(例如三(羟基丙基)膦)的叠氮基甲基保护的3’-OH相比,本文公开的乙缩醛(例如,AOM)或硫代氨基甲酸酯封闭基团可以赋予至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、300%、400%、500%、600%、700%、800%、900%、1000%、1500%或2000%的改进的解封闭率,从而减少了测序循环的总时间。在一些实施方案中,每个核苷酸的解封闭时间减少了约5%、10%、20%、30%、40%、50%或60%。例如,在一定化学反应条件下,3′-AOM和3′-O-叠氮基甲基的解封闭时间分别为约4-5秒和约9-10秒。在一些实施方案中,AOM封闭基团的半衰期(t1/2)比叠氮基甲基封闭基团快至少1、2、3、4、5、6、7、8、9或10倍。在一些这样的实施方案中,AOM的t1/2约为1分钟而叠氮基甲基的t1/2约为11分钟。在一些实施方案中,所述解封闭率是在环境温度或低于环境温度(例如4-10℃)的温度下测量的。在其他实施方案中,所述解封闭率是在升高的温度下测量的,例如40℃、45℃、50℃、55℃、60℃或65℃。在一些这样的实施方案中,所述解封闭率是在碱性pH环境的溶液中测量的,例如,在pH9.0、9.2、9.4、9.6、9.8或10.0。在一些这样的实施方案中,所述解封闭试剂与底物(即3’保护的核苷或核苷酸)的摩尔比为约10∶1、约5∶1、约2∶1、约1∶1、约1:2、约1:5或约1:10。在一个实施方案中,每个ffN都包含所述3’-AOM基团。
在本文所述的方法的任何实施方案中,所述标记的核苷酸是核苷三磷酸。在本文所述的方法的任何实施方案中,所述靶多核苷酸链连接至固相载体,例如流动池。
在一个实施方案中,在合成步骤中,通过聚合酶的作用将至少一个核苷酸掺入多核苷酸中。在一些这样的实施方案中,所述聚合酶可以是DNA聚合酶Pol 812或Pol 1901。然而,可以使用将核苷酸连接至多核苷酸的其他方法,例如化学寡核苷酸合成或标记的寡核苷酸与未标记的寡核苷酸的链接(ligation)。因此,当涉及核苷酸和多核苷酸时,术语“掺入”可以涵盖通过化学方法以及酶促方法进行的多核苷酸合成。
在一个具体的实施方案中,进行合成步骤,并且任选地包含将模板多核苷酸链与包含本公开的标记的3′封闭的核苷酸的反应混合物一起温育。还可以在允许退火至模板多核苷酸链的多核苷酸链上的游离3’-OH基团与所述核苷酸上的5’磷酸基团之间形成磷酸二酯连接键的条件下提供聚合酶。因此,合成步骤可以包括按照核苷酸与模板链的互补碱基配对的指导的多核苷酸链的形成。
在所述方法的所有实施方案中,可以在将掺入了所述标记的核苷酸的多核苷酸链退火至模板链的同时,或者在其中两条链分离的变性步骤之后,进行检测步骤。在合成步骤和检测步骤之间可以包括其他步骤,例如化学或酶促反应步骤或纯化步骤。特别地,可以分离或纯化掺入了所述标记的核苷酸的靶链,然后进一步加工或用于后续的分析中。举例来说,在合成步骤中用本文所述的核苷酸标记的靶多核苷酸可随后用作标记的探针或引物。在其他实施方案中,本文所述的合成步骤的产物可以进行进一步的反应步骤,并且如果需要,可以纯化或分离这些后续步骤的产物。
熟悉标准分子生物学技术的人员将熟知合成步骤的合适条件。在一个实施方案中,合成步骤可以类似于使用核苷酸前体(包括本文所述的核苷酸)的标准引物延伸反应,以在合适的聚合酶存在下形成与模板链互补的延伸靶链。在其他实施方案中,合成步骤本身可以构成扩增反应的一部分,从而产生标记的双链扩增产物,该产物由退火的互补链组成,所述退火的互补链源自靶标和模板多核苷酸链的复制。其他示例性合成步骤包括切口平移(nick translation)、链置换聚合(strand displacement polymerization)、随机引发的DNA标记(random primed DNA labeling)等。用于合成步骤的特别有用的聚合酶是一种能够催化本文所述核苷酸掺入的酶。可以使用多种天然存在的或修饰的聚合酶。举例来说,可将热稳定的聚合酶用于使用热循环条件进行的合成反应,而对于等温引物延伸反应,可以不需要热稳定的聚合酶。能够将根据本公开的核苷酸掺入的合适的热稳定聚合酶包括在WO 2005/024010或WO06/120433中描述的那些,其各自通过引用并入本文。在较低温度(例如37℃)下进行的合成反应中,聚合酶不一定需要是热稳定的聚合酶,因此聚合酶的选择取决于许多因素,例如反应温度、pH、链置换活性等。
在特定的非限制性实施方案中,本公开涵盖了核酸测序、重测序、全基因组测序、单核苷酸多态性评分、涉及掺入多核苷酸中时本文所述的标记的核苷酸或核苷的检测的任何其他应用的方法。有利于包含荧光染料的核苷酸标记的多核苷酸的使用的多种其他应用中的任何一种都可以使用本文所述染料标记的核苷酸或核苷。
在一个特定的实施方案中,本公开提供了根据本公开的标记的核苷酸在多核苷酸边合成边测序(SBS)反应中的用途。边合成边测序通常涉及使用聚合酶或连接酶在5’至3’方向上向生长中的多核苷酸链顺序添加一个或多个核苷酸或寡核苷酸,以形成与待测序模板核酸互补的延伸多核苷酸链。存在于一个或多个添加的核苷酸中的碱基的身份可以在检测或“成像”步骤中确定。所述添加的碱基的身份可以在每个核苷酸掺入步骤之后确定。然后可以使用常规的沃森-克里克碱基配对规则来推断模板的序列。例如,在对单核苷酸多态性进行评分时,使用本文所述的标记的核苷酸来确定单碱基的身份可能是有用的,并且这种单碱基延伸反应在本公开的范围内。
在本公开的一个实施方案中,模板多核苷酸的序列通过检测本文所述的一个或多个3′封闭的核苷酸掺入到与待测序的模板多核苷酸互补的新生链中而确定,所述核苷酸的掺入通过检测连接到该掺入的核苷酸上的荧光标记来进行。所述模板多核苷酸的测序可以用合适的引物引发(或制备为发夹构建体(hairpin construct),其将包含引物作为所述发夹的一部分),并且所述新生链以逐步方式延伸,其通过在聚合酶催化反应下向引物的3’端添加核苷酸进行。
在特定的实施方案中,每个不同的核苷三磷酸(A、T、G和C)可以被互不相同的荧光团标记,并且还在3’位置包含一个封闭基团以防止不受控制的聚合。可选的,四种核苷酸之一可能未标记(暗的)。所述聚合酶将核苷酸掺入与模板多核苷酸互补的新生链中,并且所述封闭基团阻止核苷酸的进一步掺入。任何未结合的核苷酸可以被洗掉,并且可以通过合适的方式(例如电荷耦合装置,其使用激光激发和合适的发射滤光片)光学“读取”来自每个掺入的核苷酸的荧光信号。然后可以同时或顺序除去(脱保护)3’-封闭基团和荧光染料化合物,以暴露新生链以进一步掺入核苷酸。通常,将在每个掺入步骤后确定掺入的核苷酸的身份,但这并不是严格必要的。类似地,美国专利5,302,509(其通过引用并入本文)公开了对固定在固相载体上的多核苷酸进行测序的方法。
如上所述,该方法利用在DNA聚合酶存在下将荧光标记的3′-封闭的核苷酸A、G、C和T掺入到与固定的多核苷酸互补的生长链中。所述聚合酶掺入了与靶多核苷酸互补的碱基,但是被3’-封闭基团阻止了进一步的添加。然后可以确定掺入的核苷酸的标记,并通过化学断裂除去封闭基团以允许进一步的聚合发生。在边合成边测序反应中待测序的核酸模板可以是期望测序的任何多核苷酸。用于测序反应的核酸模板通常将包含具有游离3’-OH基团的双链区域,其用作引物或作为在测序反应中进一步添加其他核苷酸的起始点。所述待测序模板的区域将突出(overhang)互补链上的该游离3’-OH基团。所述待测序模板的突出端区域可以是单链也可以是双链,条件是在与待测序模板链互补的链上“存在缺口”,以提供用于测序反应的起始的游离3’-OH基团。在这样的实施方案中,测序可以通过链置换进行。在一些实施方案中,可以加入带有游离3’-OH基团的引物作为与待测序模板的单链区域杂交的单独组分(例如,短寡核苷酸)。可选的,所述引物和所述待测序的模板链可各自形成能够形成分子内双链体(例如发夹环结构)的部分自互补核酸链的一部分。发夹多核苷酸及其可与固相载体连接的方法在PCT公开WO 01/57248和WO 2005/047301中公开,其各自通过引用并入本文。可以将核苷酸连续地添加至生长的引物中,从而导致在5’至3’方向上的多核苷酸链的合成。可以确定已经添加的碱基的性质(特别是但不必须,在每次添加核苷酸后确定)从而提供核酸模板的序列信息。因此,经由与所述核苷酸的5’磷酸基团形成磷酸二酯连接键,使所述核苷酸与核酸链的游离3’-OH基团结合,从而将核苷酸掺入到核酸链(或多核苷酸)中。
待测序的核酸模板可以是DNA或RNA,或甚至是由脱氧核苷酸和核糖核苷酸组成的杂交分子。所述核酸模板可以包含天然存在和/或非天然存在的核苷酸以及天然或非天然的骨架连接键,条件是它们不阻止模板在测序反应中的复制。
在一些实施方案中,所述待测序的核酸模板可以经由本领域已知的任何合适的连接方法,例如通过共价连接,连接至固相载体。在一些实施方案中,模板多核苷酸可以直接连接至固相载体(例如,基于二氧化硅的载体)。然而,在本公开的其他实施方案中,可以以某种方式修饰固相载体的表面以允许模板多核苷酸的直接共价连接,或通过水凝胶或聚电解质多层(polyelectrolyte multilayer)固定所述模板多核苷酸,所述水凝胶或聚电解质多层本身可以非共价连接到固相载体。
边合成边测序的实施方案和替代方案
一些实施方案包括焦磷酸测序技术。焦磷酸测序检测当特定的核苷酸掺入到新生链中时无机焦磷酸酯(PPi)的释放,(Ronaghi,M.,Karamohamed,S.,Pettersson,B.,Uhlen,M.和Nyren,P.(1996)"Real-time DNA sequencing using detection of pyrophosphaterelease."Analytical Biochemistry 242(1),84-9;Ronaghi,M.(2001)"Pyrosequencingsheds light on DNA sequencing."Genome Res.11(1),3-11;Ronaghi,M.,Uhlen,M.和Nyren,P.(1998)"A sequencing method based on real-time pyrophosphate."Science281(5375),363;美国专利6,210,891;6,258,568和6,274,320,这些公开通过引用整体并入本文)。在焦磷酸测序中,释放的PPi可以通过被ATP硫化酶立即转化为三磷酸腺苷(ATP)来检测,并且经由荧光素酶产生的光子检测生成的ATP的水平。可以将待测序的核酸连接到阵列中的特征(features)上,并且可以对该阵列进行成像以捕获由于在该阵列的特征上掺入核苷酸而产生的化学发光信号。用特定的核苷酸类型(例如A,T,C或G)处理所述阵列后,可以获得图像。添加每种核苷酸类型后获得的图像根据阵列中检测的特征不同而会有所不同。图像中的这些差异反映了阵列上所述特征的不同序列内容。但是,每个特征的相对位置在图像中将保持不变。可以使用本文阐述的方法来存储、处理和分析图像。例如,可以以与本文示例的基于可逆终止子的测序方法从不同的检测通道获得图像相同的方式处理用每种不同的核苷酸类型对所述阵列进行处理后获得的图像。
在另一种示例性的SBS类型中,循环测序是通过逐步加入可逆的终止子核苷酸来完成的,所述可逆的终止子核苷酸包含例如,可断裂或可光漂白的染料标记,例如WO 04/018497和美国专利7,057,026中所述的,其公开通过引用并入本文。该方法由Solexa(现在为Illumina,Inc.)商品化,并且也描述在WO 91/06678和WO 07/123,744中,其各自通过引用并入本文。荧光标记的终止子(两个终止子均可被逆转)的可用性,和断裂的荧光标记有助于有效的循环可逆终止(CRT)测序。聚合酶也可以被共同工程化以有效地掺入这些修饰的核苷酸并从这些修饰的核苷酸延伸。
优选地,在基于可逆终止子的测序实施方案中,所述标记在SBS反应条件下基本上不抑制延伸。但是,所述检测标记可以通过断裂或降解而除去。在将标记掺入阵列的核酸特征中后可以捕获图像。在特定实施方案中,每个循环涉及将四种不同核苷酸类型同时递送至阵列,并且每种核苷酸类型具有光谱上不同的标记。然后可以获取四个图像,每个图像都使用对四种不同标记中的一种具有选择性的检测通道。可选的,可以顺序添加不同的核苷酸类型,并且可以在每个添加步骤之间获得所述阵列的图像。在这样的实施方案中,每个图像将显示已掺入特定类型核苷酸的核酸特征。由于每个特征的序列内容不同,在不同的图像中将存在或不存在不同的特征。但是,所述特征的相对位置在图像中将保持不变。如本文所述,可以存储、处理和分析从这种可逆终止子-SBS方法获得的图像。在图像捕获步骤之后,可以除去标记,并且可以除去可逆终止子部分以用于后续的核苷酸添加和检测循环。在特定的循环中和在后续的循环之前检测到标记的除去后可以提供减少循环之间的背景信号和串扰的优势。有用的标记和除去方法的示例如下。
一些实施方案可以使用少于四种不同的标记来利用对四种不同核苷酸的检测。例如,SBS可以利用在美国专利公开2013/0079232的并入材料中描述的方法和系统来执行。作为第一个实例,可以在相同波长下检测一对核苷酸类型,但是基于该对中一个成员相对于另一个成员的强度差异,或基于该对中一个成员的变化(例如经由化学修饰,光化学修饰或物理修饰)来区分,所述变化导致相较于该对中的其他成员所检测到的信号的明显的信号出现或消失。作为第二个实例,可以在特定条件下检测四种不同核苷酸类型中的三种,而第四种核苷酸类型缺乏在那些条件下可检测到的标记,或者在那些条件下被最小程度地检测到(例如,由于背景荧光而导致的最小检测等)。前三种核苷酸类型向核酸中的掺入可以基于它们各自信号的存在来确定,并且可以根据对任何信号的不存在或最小检测来确定第四种核苷酸类型向核酸中的掺入。作为第三个实例,一种核苷酸类型可以包括在两个不同通道中检测到的标记,而其他核苷酸类型在不超过一个通道中被检测到。前述的三个示例性配置不被认为是互斥的,并且可以以各种组合使用。结合所有三个实例的示例性实施方案为基于荧光的SBS方法,其使用在第一通道中检测到的第一核苷酸类型(例如,具有被第一激发波长激发时在第一通道中检测到的标记的dATP)、在第二个通道中检测到的第二种核苷酸类型(例如,具有第二个激发波长激发时在第二个通道中检测到的标记的dCTP)、在第一个和第二个通道中均检测到的第三种核苷酸类型(例如,具有在被第一和/或第二激发波长激发时在两个通道中均检测到的至少一个标记的dTTP)和缺少标记(在任一通道中均未被检测到或最小程度地检测到)的第四种核苷酸类型(例如,不具有标记的dGTP)。
此外,如美国公开专利2013/0079232中的并入材料中所述,可以使用单个通道获得测序数据。在这种所谓的单染料测序方法中,标记第一核苷酸类型,但是在产生第一图像之后将标记除去,并且仅在产生第一图像之后才标记第二核苷酸类型。第三核苷酸类型在第一图像和第二图像中均保留其标记,而第四核苷酸类型在两个图像中均未标记。
一些实施方案可以利用通过链接(ligation)技术的测序。这样的技术利用DNA连接酶掺入寡核苷酸并鉴定这些寡核苷酸的掺入。所述寡核苷酸通常具有与寡核苷酸杂交的序列中的特定核苷酸的身份相关的不同标记。与其他SBS方法一样,在用标记的测序试剂处理一个阵列的核酸特征后,可以获得图像。每个图像将显示已结合了特定类型标记的核酸特征。由于每个特征的序列内容不同,因此在不同的图像中将存在或不存在不同的特征,但是所述特征的相对位置在图像中将保持不变。如本文所述,可以存储、处理和分析从基于链接的测序方法获得的图像。可以与本文所述的方法和系统一起使用的示例性SBS系统和方法在美国专利6,969,488、6,172,218和6,306,597中论述,其公开内容通过引用整体并入本文。
一些实施方案可以利用纳米孔测序(Deamer,D.W.&Akeson,M."Nanopores andnucleic acids:prospects for ultrarapid sequencing."Trends Biotechnol.18,147-151(2000);Deamer,D.和D.Branton,"Characterization ofnucleic acids by nanoporeanalysis",Acc.Chem.Res.35:817-825(2002);Li,J.,M.Gershow,D.Stein,E.Brandin和J.A.Golovchenko,"DNA molecules and configurations in a solid-state nanoporemicroscope"Nat.Mater.2:611-615(2003),其公开内容通过引用整体并入本文)。在这样的实施方案中,靶核酸穿过纳米孔。所述纳米孔可以是合成的孔或生物膜蛋白,例如α-溶血素。当靶核酸通过纳米孔时,可以通过测量孔的电导率的波动来识别每个碱基对。(美国专利7,001,792;Soni,G.V.&Meller,"A.Progress toward ultrafast DNA sequencingusing solid-state nanopores."Clin.Chem.53,1996-2001(2007);Healy,K."Nanopore-based single-molecule DNA analysis."Nanomed.2,459-481(2007);Cockroft,S.L.,Chu,J.,Amorin,M.&Ghadiri,M.R."A single-molecule nanopore device detects DNApolymerase activity with single-nucleotide resolution."J.Am.Chem.Soc.130,818-820(2008),其公开内容通过引用整体并入本文)。如本文所述,可以存储、处理和分析从纳米孔测序获得的数据。特别地,根据本文阐述的光学图像和其他图像的示例性处理,可以将数据作为图像处理。
测序方法的一些其他实施方案涉及在纳米球测序技术中使用本文所述的3’解封闭的核苷酸,例如在美国专利9,222,132中描述的那些,该专利的公开内容通过引用并入本文。通过滚环扩增(RCA)方法,可能会产生大量离散的DNA纳米球。然后将所述纳米球混合物分布到包含允许单个纳米球与每个位置关联的特征的图案化滑动表面上。在DNA纳米球的产生过程中,DNA被片段化并链接到四种衔接子(adapter)序列中的第一种。模板被扩增、环化并用II型核酸内切酶切割。添加第二组衔接子,然后进行扩增、环化和切割。其余两种衔接子重复此过程。最终产品是具有四种衔接子的环形模板,每种衔接子由模板序列分隔。文库分子经过滚环扩增步骤,生成大量称为DNA纳米球的串联体,然后将其沉积在流动池中。Goodwin等人,“Coming of age:ten years of next-generation sequencingtechnologies,”Nat Rev Genet.2016;17(6):333-51。
一些实施方案可以利用涉及实时监测DNA聚合酶活性的方法。可以通过例如在美国专利5,426,038中所述的带有荧光团的聚合酶和γ-磷酸酯标记的核苷酸之间的荧光共振能量转移(FRET)相互作用来检测核苷酸的掺入,例如,美国专利7,329,492和7,211,414所述,其全部内容通过引用并入本文,或可用零模波导(zero-mode waveguides)检测核苷酸的掺入,例如美国专利7,315,019所述,其通过引用并入本文,并使用荧光核苷酸类似物和工程化的聚合酶,例如,美国专利7,405,281和美国专利2008/0108082所述,其通过引用并入本文。可以将照明限制在表面束缚的聚合酶周围的仄普托升(zeptoliter)量级的体积,这样可以在低背景下观察到荧光标记的核苷酸的掺入(Levene,MJ等人,“"Zero-modewaveguides for single-molecule analysis at high concentrations."Science 299,682-686(2003);Lundquist,PM等人,"Parallel confocal detection of singlemolecules in real time."Opt.Lett.33,1026-1028(2008);Korlach,J.等人,"Selectivealuminum passivation for targeted immobilization of single DNA polymerasemolecules in zero-mode waveguide nano structures."Proc.Natl.Acad.Sci.USA 105,1176-1181(2008),其公开内容通过引用整体并入本文)。如本文所述,可以存储、处理和分析从这种方法获得的图像。
一些SBS实施方案包括检测将核苷酸掺入延伸产物后释放的质子。例如,基于检测释放的质子的测序可以使用电检测器和相关的技术,其可以从Ion Torrent(Guilford,CT,Life Technologies的子公司)商购获得,或者可以使用美国公开专利2009/0026082;2009/0127589;2010/0137143;以及2010/0282617中所述的测序方法和系统,其全部内容通过引用并入本文。本文阐述的使用动力学排斥来扩增靶核酸的方法可以容易地应用于用于检测质子的基板。更具体地,本文阐述的方法可以用于产生用于检测质子的扩增子的克隆群体。
上述SBS方法可以有利地以多重形式进行,使得同时操作多个不同的靶核酸。在特定的实施方案中,可以在共同的反应容器中或在特定基板的表面上处理不同的靶核酸。这使得可以方便地递送测序试剂、除去未反应的试剂并以多重方式检测掺入事件。在使用表面结合的靶核酸的实施方案中,所述靶核酸可以呈阵列形式。在阵列形式中,所述靶核酸通常可以以空间上可区分的方式结合至表面。所述靶核酸可以通过直接共价连接、连接至珠(bead)或其他颗粒或结合至聚合酶或连接于表面的其他分子来结合。所述阵列可以在每个位点(也称为特征)包括靶核酸的单个拷贝或者在每个位点或特征可以存在具有相同序列的多个拷贝。可以通过扩增方法如桥接扩增或乳液PCR产生多个拷贝,如下文进一步详细描述。
本文阐述的方法可以使用具有各种密度的特征的阵列,例如,至少约10个特征/cm2、100个特征/cm2、500个特征/cm2、1,000个特征/cm2、5,000个特征/cm2、10,000个特征/cm2、50,000个特征/cm2、100,000个特征/cm2、1,000,000个特征/cm2、5,000,000个特征/cm2或更高。
本文阐述的方法的优点在于它们提供了快速且有效的平行的多个靶核酸的检测。因此,本公开提供了能够使用本领域已知的技术,例如以上举例说明的技术,制备和检测核酸的集成系统。因此,本公开的集成系统可以包括能够将扩增试剂和/或测序试剂递送至一个或多个固定的DNA片段的流体组件,该系统包括的组件诸如泵、阀、容器、流体管线等。流动池可以在集成系统中配置和/或用于检测靶核酸。示例性的流动池在例如美国专利公开2010/0111768和美国专利13/273,666中所述,其各自通过引用并入本文。如对于流动池所例示的,集成系统的一个或多个流体组件可以用于扩增方法和检测方法。以核酸测序实施方案为例,集成系统的一个或多个流体组件可以用于本文阐述的扩增方法和用于测序方法中的测序试剂的递送,例如上文举例说明的那些。可选的,集成系统可以包括单独的流体系统以执行扩增方法和检测方法。能够产生扩增的核酸并且还能够确定核酸序列的集成测序系统的实例包括但不限于MiSeqTM平台(Illumina,Inc.,San Diego,CA)和美国专利13/273,666中描述的装置,其通过引用并入本文。
其中多核苷酸已经直接连接到基于二氧化硅的载体上的阵列是例如在WO 00/06770(通过引用并入本文)中公开的那些阵列,其中多核苷酸通过玻璃上的侧链环氧基团与多核苷酸上的内部氨基的反应固定在玻璃载体上。另外,多核苷酸可以通过基于硫的亲核试剂与固相载体的反应而连接于固相载体,例如,如WO 2005/047301中所述(通过引用并入本文)。固相负载的模板多核苷酸的进一步的实例是其中模板多核苷酸连接到负载于基于二氧化硅的固相载体或其他固相载体上的水凝胶,例如,WO 00/31148、WO 01/01143、WO02/12566、WO 03/014392、美国专利6,465,178和WO 00/53812中所述,其各自通过引用并入本文。
在其上可以固定模板多核苷酸的特定表面是聚丙烯酰胺水凝胶。聚丙烯酰胺水凝胶描述于以上引用的参考文献和WO 2005/065814中,其通过引用并入本文。可以使用的具体水凝胶包括在WO 2005/065814和美国公开专利2014/0079923中。在一个实施方案中,所述水凝胶是PAZAM(聚N-(5-叠氮基乙酰胺基戊基)丙烯酰胺-共-丙烯酰胺)。
DNA模板分子可以连接于珠或微粒上,例如,如美国专利6,172,218(通过引用并入本文)中所述。与珠或微粒的连接可用于测序应用。可以制备珠文库,其中每个珠包含不同的DNA序列。在Nature,437,376-380(2005);Science,309,5741,1728-1732(2005)中描述了示例性库及其创建方法,其各自通过引用并入本文中。使用本文阐述的核苷酸对这种珠的阵列进行测序在本公开的范围内。
要测序的模板可以形成固相载体上“阵列”的一部分,在这种情况下,所述阵列可以采用任何方便的形式。因此,本公开的方法适用于所有类型的高密度阵列,包括单分子阵列、簇阵列和珠阵列。本公开的标记的核苷酸可以用于在基本上任何类型的阵列上的模板测序,包括但不限于通过将核酸分子固定在固相载体上形成的那些。
然而,本发明的标记的核苷酸在簇阵列的测序的情况下是特别有利的。在簇阵列中,阵列上的不同区域(通常称为位点或特征)包含多个多核苷酸模板分子。通常,所述多个多核苷酸分子不能通过光学手段单独分辨,而是被检测为整体。取决于阵列的形成方式,阵列上的每个位点可包含一个单独的多核苷酸分子的多个拷贝(例如,该位点对于特定的单链或双链核酸物种而言是同源的)或甚至是少量不同多核苷酸分子的多个拷贝(例如,两个不同核酸种类的多个拷贝)。可以使用本领域通常已知的技术产生核酸分子的簇阵列。举例来说,WO 98/44151和WO 00/18957(其各自并入本文)描述了核酸的扩增方法,其中模板和扩增产物均在固相载体上保持固定以形成由固定核酸分子的簇或“集群”组成的阵列。存在于根据这些方法制备的簇阵列上的核酸分子是用于使用被本发明的染料化合物标记的核苷酸进行测序的合适模板。
本公开的标记的核苷酸也可用于单分子阵列上模板的测序。如本文所用,术语“单分子阵列”或“SMA”是指在固相载体上分布(或排列)的多核苷酸分子群体,其中任何单个多核苷酸与该群体的所有其他分子的间隔为能够单独地分辨单个多核苷酸分子的间隔。因此,在一些实施方案中,固定在固相载体表面上的靶核酸分子能够通过光学手段分辨。这意味着一个或多个各自代表一个多核苷酸的不同信号将在所使用的特定成像设备的可分辨区域内发生。
可以实现单分子检测,其中阵列上的相邻多核苷酸分子之间的间隔为至少100nm,更特别地至少250nm,还更特别地至少300nm,甚至更特别地至少350nm。因此,每个分子可以作为单分子荧光点被单独分辨和检测,并且所述单分子荧光点的荧光也表现出单步光致漂白。
术语“单独分辨”和“单独分辨率”在本文中用于指定,当可视化时,能够将阵列上的一个分子与其相邻分子区分开。所述阵列上单个分子之间的分离将部分地通过用于分辨单个分子的特定技术来确定。通过参考公开的申请WO 00/06770和WO 01/57248将理解单分子阵列的一般特征,其各自通过引用并入本文。尽管本公开的核苷酸的一种用途是在边合成边测序反应中,但是所述核苷酸的使用不限于此类方法。实际上,所述核苷酸可有利地用于需要检测与掺入多核苷酸中的核苷酸相连的荧光标记的任何测序方法中。
特别地,本公开的标记的核苷酸可以用于自动荧光测序方案中,特别是基于Sanger和其同事的链终止测序方法的荧光染料-终止子循环测序。此类方法通常使用酶和循环测序将荧光标记的双脱氧核苷酸掺入引物延伸测序反应中。所谓的Sanger测序方法和相关方案(Sanger型)利用带有标记的双脱氧核苷酸的随机链终止。
因此,本公开还涵盖标记的核苷酸,其为在3’和2’位置均缺乏羟基的双脱氧核苷酸,此类双脱氧核苷酸适用于Sanger型测序方法等。
应当认识到,本公开的掺入3’-封闭基团的标记的核苷酸也可以在Sanger方法和相关方案中使用,因为通过使用具有3’-OH封闭基团的核苷酸可以实现通过使用双脱氧核苷酸获得的相同效果:两者均防止后续核苷酸的掺入。当在Sanger型测序方法中使用根据本发明的具有3’封闭基团的核苷酸时,应当理解的是,与核苷酸连接的染料化合物或可检测标记不需要通过可断裂的连接基团连接,因为掺入本公开的标记的核苷酸的每个实例不需要随后掺入核苷酸,因此不需要从核苷酸上除去所述标记。
在本文描述的方法的任何实施方案中,测序应用中使用的核苷酸是本文描述的3’封闭的核苷酸,例如,式(I)、(Ia)或(II)的核苷酸。在任何实施方案中,3’封闭的核苷酸是核苷三磷酸。
实施例
在以下实施例中进一步详细公开了另外的实施方案,其决不旨在限制权利要求的范围。
实施例1. 3’-乙缩醛封闭的核苷的制备
在该实施例中,根据方案2制备了各种3’-乙缩醛保护的T核苷。
方案2
T1的制备:向经烤箱干燥的氮气净化的100mL烧瓶中加入5-碘-2’-脱氧尿苷(5.0g,14.12mmol)。将其与30mL的吡啶共蒸发3次,然后置于氮气下。加入无水吡啶(25mL),并将该反应在室温下搅拌直至获得均匀溶液(~15分钟)。将混合物在冰水浴中冷却至0℃,并在剧烈搅拌下(~1小时)缓慢滴加叔丁基二苯基氯硅烷(4.04mL,15.5mmol)。将反应在0℃下保持8小时,直到所有原料被消耗(TLC)。加入饱和氯化铵水溶液(~15mL),并使反应温热至室温。将混合物用乙酸乙酯(100mL)稀释,并用饱和氯化铵水溶液(200mL)洗涤。分离有机层,并将水层用乙酸乙酯(4x50mL)萃取。合并有机层,干燥(MgSO4)并真空浓缩,在高真空下除去残留的溶剂后得到~8g澄清的黄色油状物。该粗产物T1通过硅胶快速柱色谱纯化,为白色结晶固体。产量为6.94g(83%)。LC-MS(电喷雾负离子)591.08[M-H]。
T2的制备:在氮气下将T1(6.23g,10.5mmol)、碘化亚铜(I)(200mg,1.05mmol)和二(三苯基膦)二氯化钯(II)(369mg,0.526mmol)加入烤箱干燥的氮气净化的棕色500mL三颈烧瓶中。该烧瓶避光,并加入无水脱气的DMF(200mL)。向该溶液中加入2,2,2-三氟-N-丙-2-炔基乙酰胺(4.74g,31.6mmol),然后加入脱气的三乙胺(2.92mL,21.0mmol)。当通过TLC分析观察到不再有原料时,将反应在室温、氮气下搅拌6小时。在真空中(~15分钟)除去挥发物并在高真空下(~1小时)除去DMF,得到褐色残余物。将其溶解于乙酸乙酯(200mL)中,并用0.1M EDTA水溶液(2x200mL)萃取。合并水层并进一步用乙酸乙酯(200mL)萃取。合并有机相,干燥(MgSO4)并在真空中(~30分钟)除去挥发物,并在高真空下(~1小时)进一步干燥,得到约8g粗制棕色/黄色油。通过硅胶快速柱色谱法纯化该混合物,为灰白色固体。产量:6.0g(85%)。LC-MS(电喷雾负离子)614.19[M-H]。
T3的制备:在氮气下,向烘箱中干燥的氮气净化的100mL含起始核苷T2(2.0g,3.25mmol)的烧瓶中,室温下一次加入无水DMSO(6.9ml,97.5mmol)并搅拌直至形成均匀的溶液。分别先后滴加乙酸(11.1mL,195mmol)和乙酸酐(15.1mL,162.09mmol)(各自约5分钟)。将该混合物温热至50℃并搅拌直至通过TLC检测(EtOAc/石油醚3∶2)完全消耗起始核苷(~5小时)。然后将该反应浓缩至一半体积,并用冰浴冷却至约0.5℃。通过缓慢加入冷(~0.5℃)NaHCO3(饱和水溶液)(45mL)开始后处理,然后进一步搅拌直至不再观察到起泡沫(~15分钟)。使溶液温热至室温,然后将水相萃取至EtOAc(3x100mL)中。合并的有机层经MgSO4干燥,过滤,并在减压下并进一步在高真空下蒸发挥发物。粗产物T3通过快速色谱在硅胶上纯化,为灰白色固体。产量:1.79g(82%)。LC-MS(电喷雾负离子)674.20[M-H]-。
T4的制备:在N2下向起始核苷T3(1.79g,2.649mmol)在无水CH2Cl2(50mL)中的溶液中添加环己烯(1.34mL,13.2mmol)。将该混合物用冰浴冷却至0℃并在氮气气氛下缓慢滴加(约20分钟)蒸馏的硫酰氯(322μL,3.97mmol)。在该温度下搅拌20分钟后,TLC(EtOAc:石油醚=3:2v/v)表示起始核苷已全部消耗。然后如方案3所示,通过直接滴加新鲜蒸馏的相应的不饱和醇(5当量),将氯化物中间体淬灭。所得溶液在室温搅拌2小时,然后减压蒸发挥发物。将油状残余物在EtOAc∶盐水(3∶2)(125mL)之间分配。分离有机层并将水层进一步萃取到EtOAc(2x50mL)中。合并的有机萃取物经MgSO4干燥,过滤,并在减压下蒸发挥发物。将油状残余物在EtOAc∶盐水(3∶2)(125mL)之间分配。分离有机层,并将水层进一步萃取到EtOAc(2x50mL)中。合并的有机萃取物经MgSO4干燥,过滤,并在减压下蒸发挥发物。通过快速色谱在硅胶上纯化粗产物T4以得到最终产物,为黄色油状物。产量:AOM:1.20g(69%);PrOM:1.29g(71%);DPrOM:1.34g(71%)。
3’-AOM:黄色油状物。LC-MS(电喷雾负离子)[M-H]684.24。
3’-PrOM:黄色油状物。LC-MS(电喷雾负离子)[M-H]682.22。
3’-DPrOM:黄色油状物。LC-MS(电喷雾负离子)[M-H]710.25。
方案3.
T5的制备:室温,氮气下向的50mL圆底烧瓶中的原料T4(1.04g,1.516mmol)中加入无水THF(9mL)。然后逐滴加入TBAF(1.0M于THF中,1.7mL,1.70mmol),搅拌该溶液直至所有原料被消耗(TLC)(~2小时)。在反应过程中溶液变成橙色。真空除去挥发物以得到橙色残余物,将其溶于EtOAc(100mL)中,并用NaHCO3(饱和水溶液)(60mL)分离。分离成两层,并用EtOAc(60mL)萃取水层。合并有机层,干燥(MgSO4),过滤并蒸发,得到粗产物,为黄色油状物。该粗产物通过硅胶快速色谱纯化以得到澄清的黄色油状物。产量:AOM:637mg(94%);PrOM:526mg(78%);DPrOM:617mg(86%)。
3’-AOM:澄清黄色油状物。LC-MS(电喷雾负离子)[M-H]446.12。
3’-PrOM:澄清黄色油状物。(526mg 78%)。LC-MS(电喷雾负离子):[M-H]444.10。
3’-DPrOM:澄清黄色油状物。(617mg 86%)。LC-MS(电喷雾负离子):[M-H]472.13。
另外,按照与上述相似的方式制备了另外两个3’封闭的T核苷(3’-eAOM T和3’-iAOM T)。3’-iAOM T:LC-MS(ES):(负离子)m/z 325.5(M-H+),(正离子)327.3(M+H+)。3’-eAOM T:LC-MS(ES):(正离子)m/z 341.3(M+1H+)。
实施例2. 3’-OH封闭基团稳定性试验
在该实施例中,在掺入缓冲溶液中与标准5’-mP 3’-O-叠氮基甲基T核苷酸平行进行5’-mP 3’-AOM T核苷酸的稳定性试验。
缓冲溶液的配制
将100mL乙醇胺缓冲液(pH 9.8)、100mM NaCl和2.5mM EDTA溶液中的1mL 0.1mM的每种5’-一磷酸酯3’保护的T核苷酸在65℃加热块中温育2周。在设定的时间点,取40μL等分试样并通过HPLC分析,以确定残留的封闭的核苷酸和最终形成的未封闭的核苷酸的百分数。
与具有AOM、PrOM、DPrOM乙缩醛保护基团和标准的叠氮基甲基封闭基团的5’-一磷酸酯3’-封闭的核苷酸有关的稳定性试验结果示于图1中。观察到具有AOM、PrOM和DPrOM封闭基团的3’封闭的核苷一磷酸酯在溶液中降低解封闭率方面提供了30-50倍以上的改进。该实验模拟了将相应的完全官能化的核苷酸(ffN)存储在测序设备药盒(cartridge)中的掺入混合物中时的表现。这些缩醛保护基团提供的稳定性改进也将导致测序运行中较低的预定相率。最后,它提高了掺入混合试剂的保存期限。
实施例3. 3’-AOM解封闭试验
在这个例子中,对5’-mP 3’-AOM T和标准的5’-mP 3’-O-叠氮基甲基T核苷酸的解封闭试验是在每个封闭基团的独特的溶液中分开进行的。制定了条件以尽可能模仿Illumina的标准解封闭试剂,并按照相同的方法学。在所有试验中,活性解封闭试剂、缓冲液和核苷的浓度均保持相同,但是每种成分的标识都是唯一的。这样,观察到的各个解封闭化学作用之间的速率差异不能归因于制剂浓度的差异。
标准叠氮基甲基解封闭条件
核苷酸:5’-一磷酸酯3’-O-叠氮基甲基T。活性解封闭试剂:三(羟基丙基)膦(THP)(1M于18mΩ水中)。(任选)添加剂:抗坏血酸钠(0.1mM于18mΩ水中)。最终浓度=1mM。缓冲液:乙醇胺pH9.8(2M于18mΩ水中)。淬灭剂:H2O2。
AOM解封闭条件
核苷酸:5’-一磷酸酯3’-O-叠氮基甲基T。在氮气下的玻璃小瓶中,将3’-AOM T的储备液在100mM乙醇胺缓冲液(pH 9.8)中稀释至0.1mM。加入抗坏血酸钠添加剂的储备液至终浓度为0.1mM并将该溶液搅拌5分钟。为了开始测定,将解封闭试剂(Pd/THP=1/5;抗坏血酸钠;乙醇胺)在室温下添加至所述搅拌溶液中,终浓度为1mM THP。在指定的时间点,取40μL等分试样,并用6μL 1:3的EDTA/H2O2(0.025:0.075M)混合物淬灭。HPLC分析是通过测量HPLC色谱图中出现的起始核苷峰、3’-OH峰以及任何其他核苷酸峰的面积来进行的。没有观察到其他基于核苷酸的副产物。
比较结果示于图2A。据观察,与标准的叠氮基甲基封闭基团相比,AOM在溶液中的解封闭率方面提供了10倍的速率改进。该实验的目的是模拟在解封闭步骤中相应的ffN在测序中的表现。解封闭速度的显著提高将允许采用冲洗式(flush-through)解封闭步骤代替一些Illumina测序平台通常使用的10至20秒温育时间。因此,解封闭率将对边合成边测序(SBS)循环时间产生重大影响。
将类似的实验条件用于3’-eAOM T和3’-iAOM T的解封闭测定。作为一个单独的改变,Pd催化剂与底物的比例降低至5:1,以便观察到解封闭率的较小差异。3’-AOM T被用作参考,结果在图2B中示出。这些结果表明,在该特定浓度的Pd催化剂解封闭试剂下,eAOM和iAOM的解封闭率比AOM慢2-3倍。可以预期,当Pd催化剂与底物的比例较高时,AOM封闭基团的取代版本和未取代版本之间的解封闭率差异会较小。
实施例4.测序中钯断裂混合物的优化
实施例2中所述的解封闭反应中使用的Pd/THP催化剂对空气非常敏感。当暴露在空气中时,它显示出大量的活性损失。在这个实施例中,开发了氧化应力测定法(oxidationstress assay)以评估钯断裂混合物的不同制剂的空气敏感性。
将0.5mL的Pd断裂混合物等分到5mL玻璃小瓶中,并在室温下对空气开放3小时。如下通过测量3’-AOM T的断裂来评估氧化的断裂混合物的残余活性。在100mM断裂混合缓冲液中将3’-AOM T的储备液稀释至0.1mM。加入抗坏血酸钠的储备溶液至终浓度为1mM,然后将氧化断裂混合物稀释至终浓度1/20。1小时后,立即用10μL 1:1的EDTA/H2O2混合物(0.25:0.25M)淬灭40μL溶液,并通过HPLC分析。在该实验中,筛选了各种缓冲试剂,包括:伯胺(例如乙醇胺、Tris和甘氨酸);叔胺(例如2-二甲基氨基乙醇((DMEA)、2-二乙基氨基乙醇(DEEA)、N,N,N′,N′-四甲基乙二胺(TEMED)或N,N,N′,N′-四乙基乙二胺(TEEDA));以及各种无机盐(例如硼酸盐、碳酸盐、磷酸盐)。观察到无机缓冲剂(例如硼酸钠、碳酸钠、磷酸钠)提供了最佳的空气稳定性,并且钯配合物保留了高的%活性。另外,与伯胺相比,叔胺还显著改善了Pd断裂混合物的稳定性。
基于这些发现,制备了两种钯断裂混合物。在第一个实例中,将250mM硼酸盐缓冲水溶液的储备液用水(14mL)稀释(pH 9.6,20mL),然后加入THP(1M于100mM Tris中,pH 9,5mL,5.0mmol)和烯丙基氯化钯(II)二聚体(183mg,0.5mmol)。将该混合物在室温下剧烈搅拌几分钟,然后加入1M抗坏血酸钠水溶液(0.5mL,0.5mmol)、5M NaCl水溶液(10mL)和10%v/v吐温20(0.5mL)。在第二个实例中,将2M DEEA缓冲水溶液的储备液(pH 9.6,0.6mL)用水(7.6mL)稀释,然后加入THP(1M于100mM Tris中,pH 9,1.2mL,1.2mmol)和固体烯丙基氯化钯(II)二聚体(43.9mg,0.12mmol)。将该混合物在室温下剧烈搅拌几分钟,然后加入1M抗坏血酸钠水溶液(0.12mL,0.12mmol)、5M NaCl水溶液(2.4mL)和10%v/v吐温20(0.12mL)。
实施例5.全官能化核苷酸的制备及其在测序应用中的用途
方案4. 3’-AOM-ffC-LN3-SO7181的合成
中间体AOM C2的合成:在N2下,将核苷C1(0.5g,0.64mmol)溶于无水DCM(12mL)中,并将混合物冷却至0℃。加入环己烯(0.32mL,3.21mmol),然后逐滴加入SO2Cl2(1.0M于DCM中,1.27mL,1.27mmol)。加入另外的环己烯(0.32mL,3.21mmol),然后快速将反应转移至旋转蒸发仪以在减压下除去所有挥发物。固体残余物另外在高真空下干燥10分钟,然后在N2下溶于无水DCM(5mL)中。将混合物冷却至0℃,并逐滴加入冰冷的烯丙醇(5mL)。将反应在0℃下搅拌2h,然后通过添加饱和NaHCO3水溶液(50mL)和DCM(30mL)淬灭。分离成两相,水层用EtOAc(2x50mL)萃取。合并有机层,经MgSO4干燥,过滤,并将挥发物减压蒸发。该粗产物通过快速色谱在硅胶上使用EtOAc/石油醚纯化以得到AOM C2,为白色固体(264mg,52%产率)。LC-MS(电喷雾负离子):[M-H]787,[M+Cl]823。
中间体AOM C3的合成:在N2下,将AOM C2(246mg,0.31mmol)溶于无水THF(9.5mL)中,并将该混合物冷却至0℃。加入乙酸(0.054mL,0.94mmol),然后逐滴加入TBAF(1.0M于THF中,5wt.%水,0.99mL,0.94mmol)。将该反应在0℃下搅拌5h,然后用EtOAc(20mL)稀释,然后倒入0.05M HCl水溶液(20mL)中。分离成两层,将水层用EtOAc(2x20mL)萃取。合并有机层,经MgSO4干燥,过滤,并将挥发物减压蒸发。粗产物通过快速色谱在硅胶上使用DCM/EtOAc纯化以得到AOM C3,为淡黄色固体(114mg,66%产率)。LC-MS(电喷雾负离子):[M-H]549,[M+H2O-H]567,[M+Cl]585,(正离子电喷雾):[M+H]551,[M+H2O+H]569。
中间体AOM C4的合成:将AOM C3(0.114g,0.21mmol)、新鲜活化的分子筛、质子海绵(0.066g,0.31mmol)和磁力搅拌器置于N2下,并添加无水磷酸三甲酯(1.0mL)。将该反应混合物冷却至-10℃,并逐滴加入新鲜蒸馏的POCl3(23μL,0.25mmol)。将该反应在-10℃下搅拌1小时。将焦磷酸的二-三-正丁基铵盐溶液(0.5M于DMF中,1.7mL,0.85mmol)和无水三-正丁基胺(0.41mL,1.74mmol)预先混合,并一次加入冰冷的活化核苷溶液中。将该混合物在室温下剧烈搅拌5分钟。将该反应混合物倒入单独的含有剧烈搅拌的2M TEAB水溶液(~10mL)的烧瓶中。将该反应烧瓶用少量H2O冲洗,并将洗涤液加入2M TEAB溶液中。然后将合并的混合物在室温搅拌4小时,然后减压蒸发溶剂。将残余物溶于NH3水溶液(35%,~10mL)中并在室温下搅拌过夜。将该反应真空浓缩,并通过快速色谱法在DEAE-Sephadex上纯化。产物通过制备型HPLC进一步纯化以得到纯AOM C4(62μmol,30%产率,通过UV-Vis光谱测定,λmax=294nm,ε=8600M-1cm-1)。LC-MS(电喷雾负离子):[M-H]589。
3’-AOM-ffC-LN3-SO7181的合成:在N2下,将LN3-SO7181(0.0205mmol)溶于无水DMA(4mL)。加入N,N-二异丙基乙基胺(28.6μL,0.164mmol),然后加入TSTU(0.1M于DMA中,234μL,0.0234mmol)。将该反应在N2下室温搅拌1小时。同时,将AOM C4(0.0101mmol)的水溶液在减压下蒸发至干,重悬于0.1M TEAB水溶液(400μL)中并添加到LN3-SO7181溶液中。将该反应在室温搅拌17.5小时,然后用0.1M TEAB水溶液(4mL)淬灭。通过快速色谱法在DEAE-Sephadex上纯化粗产物。该产物通过制备型HPLC进一步纯化以得到纯3’-AOM-ffC-LN3-SO7181(6.81μmol,67%产率,通过UV-Vis光谱测定,λmax=644nm,ε=200000M-1cm-1)。LC-MS(电喷雾负离子):[M-H]1561,[M-2H]781,[M-3H]520。
方案5. 3’-AOM-ffA的合成
中间体AOM A2的合成:在N2氛围下,将核苷A1(716mg,0.95mmol)溶于10mL无水二氯甲烷中,添加环己烯(481μL,4.75mmol),并将溶液冷却至约-15℃。逐滴加入硫酰氯(蒸馏的,92μL,1.14mmol),并将该反应搅拌20分钟。在所有原料都消耗完之后,添加额外的环己烯(481μL,4.75mmol),并将该反应混合物减压蒸发至干。残余物用氮气快速净化,然后在0℃搅拌下加入烯丙醇(5mL,~100mmol)。将该反应在0℃搅拌1小时,然后用50mL饱和NaHCO3水溶液淬灭。将该混合物用2x100mL的乙酸乙酯萃取。合并的有机相用100mL水和100mL盐水洗涤,然后经MgSO4干燥,过滤并蒸发至干。残余物通过快速色谱在硅胶上使用石油醚/EtOAc纯化。60%产率(435mg,0.57mmol)。LC-MS(ES和CI):(正离子)m/z763(M+H+);(负离子)m/z761(M-H+)。
中间体AOM A3的合成:在N2氛围下将核苷AOM A2(476mg,0.62mmol)溶解在无水THF(5mL)中,然后添加1.0M TBAF(750μL,0.75mmol)的THF溶液。将该溶液室温搅拌1.5小时。该溶液用50mL EtOAc稀释,然后用100mL NaH2PO4饱和溶液(pH=3)洗涤,并用100mL盐水洗涤。有机相经MgSO4干燥,过滤并蒸发至干。残余物通过快速色谱在硅胶上使用EtOAc/MeOH纯化。90%收率(292mg,0.55mmol)。LC-MS(ES和CI):(正离子)m/z525(M+H+);(负离子)m/z 523(M-H+)。
中间体AOM A4的合成:将核苷AOM A3(285mg,0.544mmol)经P2O5减压干燥18小时。在氮气下,向其中加入无水磷酸三乙酯(2mL)和一些新鲜活化的分子筛,然后将反应烧瓶在冰浴中冷却至0℃。逐滴添加新鲜蒸馏的POCl3(61μL,0.65mmol),然后添加Proton(175mg,0.816mmol)。添加完成后,将该反应在0℃下进一步搅拌15分钟。然后,快速加入0.5M的焦磷酸的二-三-正丁基铵盐(5.4mL,2.72mmol)的无水DMF溶液,然后立即加入三-正丁基胺(540μL,2.3mmol)。将该反应在冰水浴中再保持10分钟,然后将其倒入1M三乙基碳酸氢铵水溶液(TEAB,20mL)中淬灭,并在室温下搅拌4小时。在减压下蒸发所有溶剂。将35%的氨水溶液(20mL)加入上述残余物中,并将该混合物在室温下搅拌至少5小时。然后减压蒸发溶剂。首先通过离子交换色谱在DEAE-Sephadex A25(100g)上纯化粗产物。用三乙基碳酸氢铵水溶液梯度洗脱该柱。合并含有三磷酸酯的部分,并在减压下将溶剂蒸发至干。使用YMC-Pack-Pro C18柱,通过制备规模的HPLC进一步纯化粗物质,用0.1M TEAB和乙腈洗脱。获得化合物AOM A4的三乙基铵盐的形式。56%产率(306μmol)。LC-MS(ES和CI):(负离子)m/z 612(M-H+);(正离子)m/z 614(M+H+),715(M+Et3NH+)。
ffA合成的一般程序:将染料连接剂(0.020mmol)溶于2mL无水N,N’-二甲基乙酰胺(DMA)。加入N,N’-二异丙基乙基胺(28.4μL,0.163mmol),然后加入N,N,N’,N’-四甲基-O-(N-琥珀酰亚胺基)脲四氟硼酸盐的0.1M无水DMA(TSTU,232μL,0.023mmol)溶液。将该反应在氮气下室温搅拌1小时。同时,将三磷酸AOM A4(0.01mmol)的水溶液在减压下蒸发至干,并重悬于200μL的0.1M三乙基碳酸氢铵(TEAB)水溶液中。将活化的染料-连接剂溶液加入到三磷酸酯中,并将反应室温搅拌18小时。首先通过离子交换色谱在DEAE-Sephadex A25(25g)上纯化粗产物。合并含有三磷酸酯的部分,并在减压下将溶剂蒸发至干。使用YMC-Pack-Pro C18柱,通过制备规模的RP-HPLC进一步纯化粗物质。3’-AOM-ffA-LN3-NR7180A:38%产率(3.8μmol)。LC-MS(ES):(负离子)m/z 1459(M-H+),729(M-2H+),486(M-3H+)。3’-AOM-ffA-LN3-BL-NR550S0:37%产率(3.7μmol)。LC-MS(ES):(负离子)m/z 1771(M-H+),885(M-2H+),589(M-3H+)。3’-AOM ffA-LN3-BL-NR650C5:51%产率(51μmol)。LC-MS(ES):(负离子)m/z 1917(M-H+),958(M-2H+),645(M-3H+)。
方案6. 3’-AOM-pppG的合成
中间体AOM G4的合成:在N2氛围下将已知的核苷dG3(100mg,0.143mmol)溶解在10mL无水二氯甲烷中,添加环己烯(72μL,0.714mmol),并将溶液冷却至-12℃。逐滴加入硫酰氯(蒸馏的,(1M,于DCM中),171μL,0.171mmol),并将该反应搅拌10分钟。加入额外的环己烯(72μL,0.714mmol),并将反应在-12℃搅拌30分钟。在减压下将反应蒸发至干,用氮气净化残余物,并在-12℃搅拌下加入冰冷的净烯丙醇(蒸馏的,0.8mL,12mmol)。将该反应在-12℃搅拌60分钟,然后用2mL饱和NaHCO3水溶液淬灭。该混合物用乙酸乙酯(2mL)分离,水层用乙酸乙酯萃取。合并的有机相用4mL水和4mL盐水洗涤,经MgSO4干燥,过滤并蒸发成粗品油状物。残余物通过快速色谱在硅胶上纯化以得到AOM G4,为澄清油状物。36%产率(50.9mg,0.072mmol)。LC-MS(ES和CI):(正离子)m/z 710[M+H]+;(负离子)m/z 708[M-H]-。
中间体AOM G5的合成:在N2氛围下将核苷AOM-G4(111mg,0.156mmol)溶解在无水THF(5mL)中。加入乙酸(27μL,0.468mmol),然后加入1.0M TBAF(296μL,0.296mmol)的THF溶液。将该溶液室温搅拌5小时。该溶液用10mL EtOAc稀释,用10mL 0.05M HCl水溶液洗涤,有机相分离。用乙酸乙酯萃取水相。合并的有机相经MgSO4干燥,过滤并蒸发至干。残余物通过快速色谱在硅胶上纯化以得到AOM G5,为白色固体。44%产率(32.4mg,0.068mmol)。LC-MS(ES和CI):(正离子)m/z 472[M+H]+;(负离子)m/z 470[M-H]-。
3’-AOM-pppG的合成:将核苷AOM-G5(79mg,0.168mmol)和新鲜活化的分子筛一起经P2O5减压干燥18小时。在氮气下加入Proton(175mg,0.816mmol)和无水磷酸三乙酯(0.8mL),并在室温下搅拌1小时。将该反应烧瓶在冰浴中冷却至0℃,逐滴加入新鲜蒸馏的POCl3(19μL,0.202mmol),并将反应在0℃搅拌15分钟。然后,快速加入0.5M的焦磷酸的二-三-正丁基铵盐(1.68mL,0.84mmol)的无水DMF溶液,然后立即加入三-正丁基胺(168μL,0.705mmol)。将该反应物从冰/水浴中移出并剧烈搅拌5分钟,然后将其倒入1M三乙基碳酸氢铵水溶液(TEAB,6mL)中淬灭,并室温搅拌18小时。减压蒸发所有溶剂。将残余物溶于35%氨水溶液(10mL)中,并室温搅拌至少5小时。然后减压蒸发溶剂,并与水进一步共蒸发。首先通过离子交换色谱在DEAE-Sephadex A25(50g)上纯化粗产物。用线性梯度的三乙铵水溶液洗脱该柱。收集含有三磷酸酯的部分,并在减压下将溶剂蒸发至干。使用YMC-Pack-ProC18柱,通过制备规模的HPLC进一步纯化粗物质。得到3’-AOM-pppG的三乙基铵盐。24%产率(39.7μmol)。LC-MS(ES和CI):(负离子)m/z 576[M-H]-;(正离子)m/z 578[M+H]+。
以与3’-AOM ffA和ffC的制备中所述相似的方式合成3’-AOM-ffT-LN3-NR550S0。
方案7. 3’-AOM-ffT-LN3’-NR550S0的合成
中间体T1的合成:将5-碘-2’-脱氧尿苷(3g,8.4mmol)和乙酸钯(II)(1.6g,7.14mmol)溶解于干燥脱气的DMF中,然后加入N-烯丙基三氟乙酰胺(6.4mL,42mmol)。将该溶液置于真空下,然后用氮气净化3次,然后添加脱气的三乙胺(2.3mL,16.8mmol)。将该溶液加热至80℃2小时。将该黑色混合物冷却至室温,然后用50mL甲醇稀释。加入约0.5g活性炭,并将该溶液在硅藻土上过滤,然后减压蒸发以得到褐色稠油状物。将该粗产物通过色谱纯化在硅胶上使用EtOAc/MeOH洗脱。产量:(2.27g,5.99mmol)。LC-MS(ES和CI):(负离子)m/z 378(M-H+)。
中间体T2的合成:将5-[3-(2,2,2-三氟乙酰胺基)-烯丙基]-2’-脱氧尿苷(T1)(2.55g,6.72mmol)溶解于无水DMF中。加入咪唑(1.37g,20.1mmol),然后加入4-(二甲基氨基)吡啶(410mg,3.36mmol)。将反应冷却至0℃,然后分三部分以30分钟的间隔缓慢加入叔丁基(氯)二苯基硅烷(1.92mL,7.39mmol)。将反应在0℃下搅拌6小时。然后蒸发溶剂,并将残余物重悬于200mL EtOAc中,并用2x200 mL饱和NaHCO3水溶液和200mL水洗涤,然后用100mL盐水洗涤。有机相经MgSO4干燥,过滤并蒸发至干。通过快速色谱法在硅胶上使用DCM/EtOAc纯化粗产物。68%产率(2.806g,4.54mmol)。LC-MS(ES和CI):(正离子)m/z 618(M+H+);(负离子)m/z 616(M-H+)。
中间体T3的合成:将5’-O-(叔丁基二苯基甲硅烷基)-5-[3-(2,2,2-三氟乙酰胺基)-烯丙基]-2’-脱氧尿苷(T2)(2.8g,4.53mmol)溶于10mL无水DMSO(136mmol)中,然后加入冰乙酸(16mL,272mmol)和乙酸酐(16mL,158mmol)。将该反应加热至50℃6小时,然后用200mL的饱和NaHCO3水溶液淬灭。溶液停止鼓泡后,将其用2x 150mL EtOAc萃取。合并有机相,并用2x200mL的饱和NaHCO3水溶液、200mL水和100mL盐水洗涤。有机相经MgSO4干燥,过滤并蒸发至干。通过快速色谱法在硅胶上使用DCM/EtOAc纯化粗产物。77%产率(2.375g,3.51mmol)。LC-MS(ES和CI):(正离子)m/z 678(M+H+);(负离子)m/z 676(M-H+)。
中间体T4的合成:在N2氛围下中将5’-O-(叔丁基二苯基甲硅烷基)-3’-O-甲基甲硫基-5-[3-(2,2,2-三氟乙酰胺基)-烯丙基]-2’-脱氧尿苷(T3)(310mg,0.45mmol)溶解于5mL无水二氯甲烷中,加入环己烯(228μL,2.25mmol),并将溶液冷却至约-15℃。逐滴加入硫酰氯(蒸馏的,55μL,0.675mmol),并将该反应搅拌20分钟。在所有原料都消耗完之后,添加额外的环己烯(228μL,2.25mmol),并将该反应减压蒸发至干。残余物用氮气快速净化,然后于0℃搅拌下加入冰冷的烯丙醇(2.5mL)。将该反应于0℃搅拌35分钟,然后用25mL饱和NaHCO3水溶液淬灭,然后用100mL饱和NaHCO3水溶液进一步稀释。将该混合物用2x 50mL乙酸乙酯萃取。合并的有机相经MgSO4干燥,过滤并蒸发至干。通过快速色谱法在硅胶上使用DCM/EtOAc纯化残余物。69%产率(214mg,0.311mmol)。LC-MS(ES和CI):(正离子)m/z 688(M+H+);(负离子)m/z 686(M-H+)。
中间体T5的合成:在N2氛围下,将5’-O-(叔丁基二苯基甲硅烷基)-3’-O-烯丙氧基甲基-5-[3-(2,2,2-三氟乙酰胺基)-烯丙基]-2’-脱氧尿苷(T4)(210mg,0.305mmol)溶于无水THF(3mL)中。加入1.0M TBAF的THF溶液(367μL,0.367mmol)。将该溶液室温搅拌3小时。该溶液用50mL EtOAc稀释,然后用50mL饱和NaH2PO4(pH=3),50mL水洗涤。有机相经MgSO4干燥,过滤并蒸发至干。将残余物通过快速色谱在硅胶上使用DCM/EtOAc纯化。95%产率(130mg,0.289mmol)。LC-MS(ES和CI):(负离子)m/z 448(M-H+),484(M+Cl-)。
中间体T6的合成:将3’-O-烯丙氧基甲基-5-[3-(2,2,2-三氟乙酰胺基)-烯丙基]-2’-脱氧尿苷(T5)(120mg,0.267mmol)经P2O5减压干燥18小时。在氮气下向其中加入无水磷酸三乙酯(1mL)和一些新鲜活化的分子筛,然后将该反应瓶冷却至0℃。逐滴添加新鲜蒸馏的POCl3(30μL,0.32mmol),然后添加Proton(85mg,0.40mmol)。添加完成后,将该反应0℃进一步搅拌15分钟。然后,快速加入0.5M的焦磷酸的二-三-正丁基铵盐(2.7mL,1.33mmol)的无水DMF溶液,然后立即加入三-正丁基胺(270μL,1.2mmol)。将该反应在冰水浴中再保持10分钟,然后将其倒入1M三乙基碳酸氢铵水溶液(TEAB,10mL)中淬灭,并室温搅拌4小时。减压蒸发所有溶剂。将35%的氨水溶液(10mL)加入上述残余物中,并将该混合物室温搅拌18小时。然后减压蒸发溶剂,将残余物重悬于10mL的0.1M TEAB中并过滤。首先通过离子交换色谱在DEAE-Sephadex A25(100g)上纯化滤液。用三乙基碳酸氢铵水溶液(TEAB)洗脱该柱。合并含有三磷酸酯的部分,并在减压下将溶剂蒸发至干。使用YMC-Pack-Pro C18柱,通过制备规模HPLC进一步纯化粗物质。得到化合物T6为三乙基铵盐。33%产率(89μmol)。LC-MS(ES和CI):(负离子)m/z 592(M-H+),295(M-2H+)。
3’-AOM-ffT-LN3’-NR550S0的合成:在N2下将干燥的已知化合物LN3-NR550S0(0.015mmol)溶于无水DMA(2mL)。加入N,N-二异丙基乙基胺(17μL,0.1mmol),然后加入TSTU(0.1M于DMA中,180μL,0.018mmol)。在N2下将该反应室温搅拌1小时。同时,在减压下将T6水溶液(0.01mmol)蒸发至干,重悬于0.1M TEAB水溶液(200μL)中,并添加到LN3-NR550S0溶液中。将该反应室温搅拌18小时,然后用0.1M TEAB水溶液(4mL)淬灭。通过快速色谱在DEAE-Sephadex上纯化粗产物。产物通过制备型HPLC进一步纯化以得到纯3’-AOM-ffT-LN3’-NR550S0。67%产率(41μmol,通过UV-Vis光谱法测定,λmax=550nm,ε=125000M-1cm-1)LC-MS(ES):(负离子)m/z1521(M-H+),761(M-2H+),507(M-3H+)。
边合成边测序实验
随后使用Illumina仪器对ffN进行测序试验。除了包括这些ffN的新掺入混合物外,所有标准商品试剂都被使用。使用标准的2x150配方。除了标准的边合成边测序(SBS)方案外,还加入了5秒温育的钯断裂混合物(如实施例4中所述的Pd:THP=1/5于DEEA中)中以解封闭3’-AOM。
在第一个实验中,将以下ffN用于掺入混合物中:3’-AOM-ffT-LN3-NR550S0、3’-AOM-ffA-LN3-BL-NR550S0、3’-AOM-ffA-LN3-BL-NR650C5、3’-AOM-ffA-LN3-NR7180A、3’-AOM-ffC-LN3-SO7181和3’-AOM-pppG(暗G)。并且读段1的测序结果总结如下。
%PF:26个循环后簇通过过滤器的百分比
在第二个实验中,类似于上述3’-AOM-pppG的制备方法,合成了未标记的3’-AOM-pppT(LC-MS(ES):(负离子)m/z 551(M-H+))。它在商品绿色ffG-LN3-PEG12-ATTO532(在Illumina 4-通道系统上使用)的存在下用于测序,并且使用与上述第一个实验中所述相同的ffA和ffC。结果总结如下。定相和预定相值有显著改善,并且未观察到信号衰减(图3A)。此外,读段1和读段2的错误率也都降低了。
在另一个实验中,掺入混合物包含3’-AOM-ffT-LN3’-NR550S0、3’-AOM-ffA-LN3-BL-NR550S0、3’-AOM-ffA-LN3-BL-NR650C5、3’-AOM-ffA-LN3-NR7180A、3’-AOM-ffC-LN3-SO7181和3’-AOM-pppG(暗G)。与之前的运行相似,将5秒钟温育的含有钯催化剂(Pd/THP=1:10;实施例4中所述的100mM DEEA)的断裂混合物添加到标准SBS循环中。使用标准的DNA聚合酶,但掺入时间为2倍。没有观察到信号衰减表型(图3B)。此外,将这些测序结果与带有标准叠氮基甲基封闭基团的ffNs的商品运行(平均值为3;N=3)进行了比较。观察到错误率几乎相同(图3C)。测序结果总结如下。
另外,将具有3’-AOM封闭基团的ffN的主要测序指标与包括DNA聚合酶Pol 812的标准商品试剂盒产生的主要测序指标进行了比较,比较结果示于图4A。由于改善了3’-AOM-ffNs的稳定性,观察到非常低的预定相。但是,即使使用2倍的掺入时间,定相仍然会提高。
在另一个实验中,使用了不同的DNA聚合酶(Pol 1901)代替商品试剂盒(Pol 812)中的DNA聚合酶。Pol 1901允许在测序中使用标准的1倍掺入时间,而不是上述的2倍掺入时间。此外,与标准运行相比,Pd断裂混合物中的温育减少了一半。这样可以在整个SBS化学循环中节省10%的时间。测序指标显著提高并超过了从含有3’-O-叠氮基甲基封闭基团的标准商品试剂盒中获得的值(图4B)。
3’封闭基团在测序中的稳定性试验
为了证明具有3’-AOM的ffN的稳定性得到改善,将它们与具有3’-O-叠氮基甲基基团的标准ffN进行了平行比较。两组ffN在标准掺入混合物制剂中(仅排除DNA聚合酶)45℃温育几天。对于每个时间点,在负载到之前,直接添加新鲜的聚合酶以完成掺入混合物。使用了先前描述的测序条件。预定相%是混合物中3’OH-ffN的百分比的直接指标,因此与3’封闭基团的稳定性直接相关。记录并绘制两组ffN的预定相值(图5)。在45℃,观察到含有3’-AOM的ffN似乎比具有3’-O-叠氮基甲基基团的标准ffN稳定6倍。测序指标也证实了在溶液中的稳定性测定过程中观察到的趋势–3’-AOM封闭基团比3’-O-叠氮基甲基组稳定得多。
实施例6. 3’-O-硫代氨基甲酸酯封闭的核苷的制备
在该实施例中,根据方案8制备了各种3’-O-硫代氨基甲酸酯保护的T核苷。
方案8. 3’-O-二甲基硫代氨基甲酸酯T核苷的合成
T-7的制备:向烤箱干燥的氮气净化的100mL烧瓶中加入5’-O-(4,4’-二甲氧基三苯甲基)胸苷(1.0g,1.836mmol)。将其与无水DMF(3x 20mL)共蒸发,并置于氮气下。加入无水DCM(9.2mL)和4-二甲基氨基吡啶(224mg,0.184mmol),并在室温下搅拌直至形成均匀溶液。然后在氮气流中快速加入1,1’-硫代羰基二咪唑(360mg,2.02mmol),将反应重新密封并室温搅拌2小时,直到所有原料耗尽。将反应混合物通过硅胶垫过滤,并将滤饼用EtOAc(10mL)洗涤。真空除去挥发物,该粗品残余物无需进一步纯化即可使用。
T-8的制备:上一步的化合物T-7在真空干燥后立即使用。在氮气下将该残余物置于25mL圆底烧瓶,并加入二甲基胺(2M于THF中,7.3mL,14.6mmol),并将反应搅拌2小时,直至根据TLC所有原料被消耗掉。真空除去所有挥发物以形成澄清的粗品残余物,将其通过快速柱色谱在硅胶上纯化以得到T-8,为白色固体。产量:1.15g(99%)。LC-MS(电喷雾负离子)630.23[M-H]。
T-9的制备:将起始核苷T-8(320mg,0.504mmol)溶于空气中的50mL圆底烧瓶中的少量乙腈中。一次性添加5:1的AcOH/H2O溶液(12.5mL:2.5mL),并在室温下搅拌反应直至所有原料都被消耗掉(2-4小时)。在真空下蒸发所有挥发物并将残余物在甲苯(2x 60mL)中共蒸发,得到粗产物,为灰白色固体。该粗产物通过快速柱色谱纯化以得到T-9,为白色固体。产量:123mg(74%)。LC-MS(电喷雾负离子)[M-H]328.10。
按照相似合成步骤使用相应的MeNH2或NH3,还制备了具有两种其他硫代氨基甲酸酯保护基团的核苷。一般反应方案如下所示:
3’-O-硫代氨基甲酸酯封闭基团稳定性试验
在掺入缓冲液中与标准5’-mP 3’-O-叠氮基甲基T核苷酸平行进行5’-mP3’-DMTCT核苷酸的稳定性试验。
对于5’-mP 3’-DMTC T和5’-mP 3’-O-叠氮基甲基T,最终溶液体积都为1mL、相应核苷酸的终浓度都为0.1mM。缓冲水溶液的其他成分包括乙醇胺(EA)、乙醇胺HCl、NaCl(100mM)和EDTA(2.5mM)。该缓冲溶液的浓度如下:0.5M EA缓冲液、0.5M NaCl、0.01M EDTA。
稳定性试验方法学
将200μL的10倍缓冲溶液添加到1.7mL聚丙烯弹簧锁微管(snap lock microtube)中,并用准确体积的18mΩ水稀释。然后加入相应的核苷,将小瓶密封并通过倒置、轻轻搅拌或用微量移液器泵吸混合。取40μL等分试样并通过HPLC分析以作为起始(或t=0)值。然后将小瓶放在设定为65℃的预热加热套中,盖上一层厚的铝箔,然后加热一个月。定期(第1周:每天一次。第2-4周:每2天1次)取40μL等分试样,并通过HPLC分析以确定样品中原料的百分比和解封闭的(3’-OH)核苷酸的百分比。通过测量起始核苷酸峰和3’OH峰的面积进行HPLC分析。这些值用于计算解封闭的核苷酸的百分比,其以图形表示,并用于比较在掺入缓冲液中的样品之间的稳定性。图6示出了65℃三种不同的硫代氨基甲酸酯3’封闭的核苷酸与被3’-O-叠氮基甲基封闭基团封闭的核苷酸的稳定性的比较结果。据观察,虽然具有3’–O-C(=S)NH2或3’–O-C(=S)NHCH3的核苷酸比标准3’-O-叠氮基甲基基团保护的核苷酸不稳定,但是具有3’-DMTC的核苷酸在9天的试验期间内赋予了改善的稳定性。因此,DMTC表现出优于标准叠氮基甲基封闭基团的稳定性。
实施例7. 3’-O-硫代氨基甲酸酯封闭基团脱保护试验
在这个例子中,对5’-mP 3’-DMTC T和标准的5’-mP 3’-O-叠氮基甲基T核苷酸的解封闭或解封闭试验是在每种封闭基团的独特的溶液中分开进行的。制定了条件以尽可能模仿Illumina的标准解封闭试剂,并按照相同的方法学。在所有试验中,活性解封闭试剂、缓冲液和核苷的浓度均保持相同,但是每种成分的标识都是唯一的。这样,观察到的各个解封闭化学作用之间的速率差异不能归因于制剂浓度的差异。
解封闭试验通用方法学
将每种反应组分单独配制为于18mΩ水中的浓缩储备液,适当保存,并按以下特定顺序合并等分试样。通过加入预配制的解封闭试剂开始反应。终浓度:核苷(0.1mM)、活性解封闭试剂(1mM)、添加剂(解封闭试剂特有的)、缓冲液(100mM)。终体积:2000μL。
在3mL玻璃小瓶中加入预配制的缓冲溶液,然后加入预配制的添加剂溶液。用准确体积的18mΩ水稀释并搅拌10分钟。然后加入核苷酸溶液的等分试样并搅拌5分钟。然后取40μL等分试样,加入淬灭剂并通过HPLC分析,作为参考峰(或t=0分钟)。然后将解封闭试剂一次性加入搅拌溶液中并开始计时。在指定的时间点,取40μL等分试样,并立即用适当的淬灭剂淬灭,然后通过HPLC分析,以确定在这些指定的时间点发生的解封闭的核苷酸的量。结果以图形方式绘制,并用于比较解封闭效率(efficiency)和效能(efficacy)。
DMTC解封闭
核苷酸:5’-mP 3’-DMTCT。活性解封闭试剂:NaIO4(0.1M于18mΩ水中)或(0.1M于18mΩ水中)。添加剂:无。NaIO4缓冲液:pH 6.75磷酸盐缓冲液(1M于18mΩ水中)。缓冲液:pH 8.65磷酸盐缓冲液(1M于18mΩ水中)。淬灭剂:硫代硫酸钠。3’-O-叠氮基甲基解封闭条件与实施例3中所述的相同。
Claims (50)
每个R1a和R1b独立地为H、C1-C6烷基、C1-C6卤代烷基、C1-C6烷氧基、C1-C6卤代烷氧基、氰基、卤素、任选取代的苯基或任选取代的芳烷基;
每个R2a和R2b独立地为H、C1-C6烷基、C1-C6卤代烷基、氰基或卤素;
或者,R1a和R2a与它们所连接的原子一起形成任选取代的五至八元杂环基;
R3为H、任选取代的C2-C6烯基、任选取代的C3-C7环烯基、任选取代的C2-C6炔基或任选取代的(C1-C6亚烷基)Si(R4)3;以及
每个R4独立地为H、C1-C6烷基或任选取代的C6-C10芳基;条件是当每个R1a、R1b、R2a和R2b为H,则R3不为H。
2.权利要求1的核苷或核苷酸,其中R1a和R1b中至少一个为H。
3.权利要求2的核苷或核苷酸,其中每个R1a和R1b为H。
4.权利要求1-3中任一项的核苷或核苷酸,其中每个R2a和R2b独立地为H、卤素或C1-C6烷基。
5.权利要求4的核苷或核苷酸,其中每个R2a和R2b为H。
6.权利要求4的核苷或核苷酸,其中每个R2a和R2b独立地为C1-C6烷基或卤素。
7.权利要求6的核苷或核苷酸,其中每个R2a和R2b为甲基。
8.权利要求4的核苷或核苷酸,其中R2a为H,以及R2b为卤素或C1-C6烷基。
9.权利要求1至7中任一项的核苷或核苷酸,其中R3为任选地被一个或多个独立地选自以下的取代基取代的C2-C6炔基:卤素、C1-C6烷基、C1-C6卤代烷基及其组合。
11.权利要求1至7中任一项的核苷或核苷酸,其中R3为任选地被一个或多个独立地选自以下的取代基取代的C2-C6烯基:卤素、C1-C6烷基、C1-C6卤代烷基及其组合。
13.权利要求1至7中任一项的核苷或核苷酸,其中R3为任选取代的(C1-C6亚烷基)Si(R4)3且其中每个R4为C1-C6烷基。
14.权利要求13的核苷或核苷酸,其中R3为–(CH2)-SiMe3。
15.权利要求1的核苷或核苷酸,其中R1a和R2a与它们所连接的原子一起形成六元杂环基。
17.权利要求15或16的核苷或核苷酸,其中每个R1b、R2b和R3为H。
20.权利要求19的核苷或核苷酸,其中R5和R6至少一个为H或C1-C6烷基。
21.权利要求20的核苷或核苷酸,其中每个R5和R6为H。
22.权利要求20的核苷或核苷酸,其中R5为H,且R6为C1-C6烷基、C2-C6烯基、C2-C6炔基、任选取代的–(CH2)m–苯基或任选取代的–(CH2)n–6元杂芳基,以及其中m和n各自为0或1。
23.权利要求20的核苷或核苷酸,其中每个R5和R6为C1-C6烷基。
24.权利要求23的核苷或核苷酸,其中每个R5和R6为甲基。
26.权利要求1至25中任一项所述的核苷或核苷酸,其中所述核苷或核苷酸任选地经由可断裂的连接基团与可检测的标记共价连接。
27.权利要求26的核苷或核苷酸,其中所述可检测标记经由可断裂的连接基团与核苷或核苷酸的核苷碱基共价连接。
28.权利要求26的核苷或核苷酸,其中所述可检测标记经由可断裂的连接基团与核苷或核苷酸的3’-氧共价连接。
29.权利要求27或28的核苷或核苷酸,其中所述连接基团是包含叠氮基部分、-O-烯丙基部分、二硫键部分、乙缩醛部分或硫代氨基甲酸酯部分的可断裂的连接基团。
30.权利要求27至29中任一项的核苷或核苷酸,其中所述3’-OH封闭基团和可断裂的连接基团可以在相同的化学反应条件下除去。
31.权利要求1至30中任一项的核苷或核苷酸,其包含2’-脱氧核糖。
32.权利要求31的核苷或核苷酸,其中所述核苷酸是核苷三磷酸。
33.寡核苷酸,其包含权利要求1至32中任一项的核苷酸。
34.制备在测序反应中与靶单链多核苷酸互补的生长多核苷酸的方法,其包括将权利要求1至32中任一项的核苷酸掺入到生长的互补多核苷酸中,其中所述核苷酸的掺入防止了任何后续核苷酸引入到生长的互补多核苷酸中。
35.权利要求34所述的方法,其中所述核苷酸的掺入通过聚合酶、末端脱氧核苷酸转移酶或逆转录酶完成。
36.确定靶单链多核苷酸序列的方法,其包括:
(a)将权利要求26至32中任一项的核苷酸掺入到与靶多核苷酸链的至少一部分互补的复制多核苷酸链中;
(b)检测掺入到复制多核苷酸链中的核苷酸的身份;以及
(c)从掺入到复制多核苷酸链中的核苷酸中化学除去标记和3’封闭基团。
37.权利要求36所述的方法,其进一步包括(d)将化学除去的标记和3’封闭基团从复制多核苷酸链上洗去。
38.权利要求37所述的方法,其进一步包括重复步骤(a)至(d),直到确定模板多核苷酸链的该部分的序列为止。
39.权利要求37所述的方法,其中,将步骤(a)至(d)重复至少50次。
40.权利要求36至39中任一项所述的方法,其中所述标记和3’封闭基团在单个化学反应中从掺入到复制多核苷酸链的核苷酸中被除去。
41.权利要求40所述的方法,其中步骤(c)包括使掺入的核苷酸与包含钯催化剂的断裂溶液接触。
42.权利要求36至39中任一项所述的方法,其中所述标记和3’封闭基团在两个分开的化学反应中从掺入到复制多核苷酸链中的核苷酸中被除去。
43.权利要求41所述的方法,其中步骤(c)包括使掺入的核苷酸与包含膦的断裂溶液和包含钯催化剂的断裂溶液接触。
44.权利要求41或43所述的方法,其中所述膦是三(羟甲基)膦、三(羟乙基)膦或三(羟丙基)膦。
45.权利要求41、43或44中任一项所述的方法,其中所述包含钯催化剂的断裂溶液还包含一种或多种选自伯胺、仲胺、叔胺、碳酸盐、磷酸盐和硼酸盐及其组合的缓冲剂。
46.权利要求45所述的方法,其中所述缓冲剂选自乙醇胺(EA)、三(羟甲基)氨基甲烷(Tris)、甘氨酸、碳酸盐、磷酸盐、硼酸盐、2-二甲基氨基甲醇(DMEA)、2-二乙基氨基甲醇(DEEA)、N,N,N′,N′-四甲基乙二胺(TEMED)和N,N,N′,N′-四乙基乙二胺(TEEDA)及其组合。
47.试剂盒,其包含权利要求1至32中任一项的一种或多种核苷或核苷酸。
48.权利要求47所述的试剂盒,其进一步包含酶和适合于所述酶作用的缓冲液。
49.权利要求48所述的试剂盒,其中,所述酶是聚合酶、末端脱氧核苷酸转移酶或逆转录酶。
50.权利要求49所述的试剂盒,其中所述聚合酶是DNA聚合酶。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862784994P | 2018-12-26 | 2018-12-26 | |
US201862784970P | 2018-12-26 | 2018-12-26 | |
US62/784,970 | 2018-12-26 | ||
US62/784,994 | 2018-12-26 | ||
PCT/EP2019/086926 WO2020136170A2 (en) | 2018-12-26 | 2019-12-23 | Nucleosides and nucleotides with 3'-hydroxy blocking groups |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112638925A true CN112638925A (zh) | 2021-04-09 |
Family
ID=69143579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980042583.5A Pending CN112638925A (zh) | 2018-12-26 | 2019-12-23 | 具有3’-羟基封闭基团的核苷和核苷酸以及它们在多核苷酸测序方法中的用途 |
Country Status (13)
Country | Link |
---|---|
US (3) | US11293061B2 (zh) |
EP (1) | EP3902814A2 (zh) |
JP (1) | JP2022515944A (zh) |
KR (1) | KR20210109439A (zh) |
CN (1) | CN112638925A (zh) |
AU (1) | AU2019412494A1 (zh) |
BR (1) | BR112020026668A2 (zh) |
CA (1) | CA3103634A1 (zh) |
IL (2) | IL279562A (zh) |
MX (1) | MX2020013454A (zh) |
SG (1) | SG11202012557XA (zh) |
WO (1) | WO2020136170A2 (zh) |
ZA (1) | ZA202007841B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024077410A1 (zh) * | 2022-10-09 | 2024-04-18 | 深圳市真迈生物科技有限公司 | 还原叠氮甲氧基类基团的方法、测序方法及试剂盒 |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102594019B1 (ko) * | 2018-12-17 | 2023-10-26 | 일루미나 케임브리지 리미티드 | 폴리뉴클레오타이드 서열분석에 사용하기 위한 조성물 |
US11293061B2 (en) | 2018-12-26 | 2022-04-05 | Illumina Cambridge Limited | Sequencing methods using nucleotides with 3′ AOM blocking group |
KR20220107231A (ko) | 2019-11-27 | 2022-08-02 | 일루미나 케임브리지 리미티드 | 사이클로옥타테트라엔 함유 염료 및 조성물 |
US11787831B2 (en) | 2020-06-22 | 2023-10-17 | Illumina Cambridge Limited | Nucleosides and nucleotides with 3′ acetal blocking group |
US11981964B2 (en) | 2020-07-28 | 2024-05-14 | Illumina Cambridge Limited | Substituted coumarin dyes and uses as fluorescent labels |
US20230279483A1 (en) * | 2022-03-04 | 2023-09-07 | Element Biosciences, Inc. | Double-stranded splint adaptors and methods of use |
US20230279382A1 (en) * | 2022-03-04 | 2023-09-07 | Element Biosciences, Inc. | Single-stranded splint strands and methods of use |
US20220195196A1 (en) | 2020-12-17 | 2022-06-23 | Illumina Cambridge Limited | Alkylpyridinium coumarin dyes and uses in sequencing applications |
US20220195516A1 (en) | 2020-12-17 | 2022-06-23 | Illumina Cambridge Limited | Methods, systems and compositions for nucleic acid sequencing |
US20220195517A1 (en) | 2020-12-17 | 2022-06-23 | Illumina Cambridge Limited | Long stokes shift chromenoquinoline dyes and uses in sequencing applications |
US20220195518A1 (en) | 2020-12-22 | 2022-06-23 | Illumina Cambridge Limited | Methods and compositions for nucleic acid sequencing |
CN112986207A (zh) * | 2021-02-03 | 2021-06-18 | 杭州苏铂科技有限公司 | 表面拉曼增强光纤探头及其制备方法 |
AU2022269804A1 (en) | 2021-05-05 | 2023-11-02 | Illumina Cambridge Limited | Fluorescent dyes containing bis-boron fused heterocycles and uses in sequencing |
BR112023024130A2 (pt) | 2021-05-20 | 2024-01-30 | Illumina Cambridge Ltd | Composições e métodos para sequenciamento por síntese |
US20230047225A1 (en) | 2021-08-14 | 2023-02-16 | Illumina, Inc. | Polymerases, compositions, and methods of use |
CN117813401A (zh) | 2021-09-22 | 2024-04-02 | 因美纳有限公司 | 使用纳米孔对多核苷酸进行测序 |
US20230212667A1 (en) | 2021-12-29 | 2023-07-06 | Illumina Cambridge Limited | Methods of nucleic acid sequencing using surface-bound primers |
CA3223115A1 (en) | 2022-03-28 | 2023-10-05 | Xiaolin Wu | Labeled avidin and methods for sequencing |
US20230314322A1 (en) | 2022-03-29 | 2023-10-05 | Illumina, Inc. | Systems and methods of sequencing polynucleotides |
CA3222797A1 (en) * | 2022-03-31 | 2023-10-05 | Ramesh NEELAKANDAN | Nucleosides and nucleotides with 3' vinyl blocking group |
CA3223128A1 (en) | 2022-03-31 | 2023-10-05 | Illumina, Inc. | Compositions and methods for improving sequencing signals |
WO2023229884A2 (en) * | 2022-05-27 | 2023-11-30 | Illumina, Inc. | 3'-blocked nucleotides, methods of deblocking the same, and methods of synthesizing polynucleotides using the same |
US20230383342A1 (en) | 2022-05-31 | 2023-11-30 | Illumina Cambridge Limited | Compositions and methods for nucleic acid sequencing |
WO2024003087A1 (en) | 2022-06-28 | 2024-01-04 | Illumina, Inc. | Fluorescent dyes containing fused tetracyclic bis-boron heterocycle and uses in sequencing |
US20240140939A1 (en) | 2022-09-30 | 2024-05-02 | Illumina Cambridge Limited | Compositions and methods for reducing photo damage during sequencing |
US20240141427A1 (en) | 2022-09-30 | 2024-05-02 | Illumina, Inc. | Polymerases, compositions, and methods of use |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0104857A1 (en) * | 1982-09-28 | 1984-04-04 | Beecham Group Plc | Deoxyuridine compounds, methods for preparing them and their use in medicine |
WO2002029003A2 (en) * | 2000-10-06 | 2002-04-11 | The Trustees Of Columbia University In The City Of New York | Massive parallel method for decoding dna and rna |
WO2004018497A2 (en) * | 2002-08-23 | 2004-03-04 | Solexa Limited | Modified nucleotides for polynucleotide sequencing |
WO2009054922A1 (en) * | 2007-10-19 | 2009-04-30 | The Trustees Of Columbia University In The City Of New York | Dna sequencing with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators |
WO2012162429A2 (en) * | 2011-05-23 | 2012-11-29 | The Trustees Of Columbia University In The City Of New York | Dna sequencing by synthesis using raman and infrared spectroscopy detection |
WO2014139596A1 (en) * | 2013-03-15 | 2014-09-18 | Illumina Cambridge Limited | Modified nucleosides or nucleotides |
CN105315318A (zh) * | 2015-11-06 | 2016-02-10 | 山东大学 | 一种α‐L‐鼠李糖苷酶在制备5-氟-2’-脱氧脲苷衍生物中的应用 |
Family Cites Families (93)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5936696A (ja) * | 1982-08-20 | 1984-02-28 | Taiho Yakuhin Kogyo Kk | 2′―デオキシ―5―置換ウリジン誘導体及びそれを含有する抗腫瘍剤 |
US4772691A (en) | 1985-06-05 | 1988-09-20 | The Medical College Of Wisconsin, Inc. | Chemically cleavable nucleotides |
DE3529478A1 (de) | 1985-08-16 | 1987-02-19 | Boehringer Mannheim Gmbh | 7-desaza-2'desoxyguanosin-nukleotide, verfahren zu deren herstellung und deren verwendung zur nukleinsaeure-sequenzierung |
US5242796A (en) | 1986-07-02 | 1993-09-07 | E. I. Du Pont De Nemours And Company | Method, system and reagents for DNA sequencing |
GB8822228D0 (en) | 1988-09-21 | 1988-10-26 | Southern E M | Support-bound oligonucleotides |
US5800992A (en) | 1989-06-07 | 1998-09-01 | Fodor; Stephen P.A. | Method of detecting nucleic acids |
US5547839A (en) | 1989-06-07 | 1996-08-20 | Affymax Technologies N.V. | Sequencing of surface immobilized polymers utilizing microflourescence detection |
US6346413B1 (en) | 1989-06-07 | 2002-02-12 | Affymetrix, Inc. | Polymer arrays |
DE3924454A1 (de) | 1989-07-24 | 1991-02-07 | Cornelis P Prof Dr Hollenberg | Die anwendung von dna und dna-technologie fuer die konstruktion von netzwerken zur verwendung in der chip-konstruktion und chip-produktion (dna chips) |
US5302509A (en) | 1989-08-14 | 1994-04-12 | Beckman Instruments, Inc. | Method for sequencing polynucleotides |
CA2044616A1 (en) | 1989-10-26 | 1991-04-27 | Roger Y. Tsien | Dna sequencing |
ES2097925T3 (es) | 1991-09-18 | 1997-04-16 | Affymax Tech Nv | Metodo para sintetizar diversas colecciones de oligomeros. |
JP3939338B2 (ja) | 1991-11-22 | 2007-07-04 | アフィメトリックス, インコーポレイテッド | ポリマー合成に対する組合わせの戦略 |
DE69333650T2 (de) | 1992-02-19 | 2006-01-12 | The Public Health Research Institute Of The City Of New York, Inc. | Neue anordnungn von oligonukleotiden und ihr nutzen zum sortieren, isolieren, sequenzieren und manipulieren von nukleinsäuren |
US5583211A (en) | 1992-10-29 | 1996-12-10 | Beckman Instruments, Inc. | Surface activated organic polymers useful for location - specific attachment of nucleic acids, peptides, proteins and oligosaccharides |
US5472672A (en) | 1993-10-22 | 1995-12-05 | The Board Of Trustees Of The Leland Stanford Junior University | Apparatus and method for polymer synthesis using arrays |
US6156501A (en) | 1993-10-26 | 2000-12-05 | Affymetrix, Inc. | Arrays of modified nucleic acid probes and methods of use |
EP0730663B1 (en) | 1993-10-26 | 2003-09-24 | Affymetrix, Inc. | Arrays of nucleic acid probes on biological chips |
US5429807A (en) | 1993-10-28 | 1995-07-04 | Beckman Instruments, Inc. | Method and apparatus for creating biopolymer arrays on a solid support surface |
US5807522A (en) | 1994-06-17 | 1998-09-15 | The Board Of Trustees Of The Leland Stanford Junior University | Methods for fabricating microarrays of biological samples |
US6232465B1 (en) | 1994-09-02 | 2001-05-15 | Andrew C. Hiatt | Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides |
US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
US5556752A (en) | 1994-10-24 | 1996-09-17 | Affymetrix, Inc. | Surface-bound, unimolecular, double-stranded DNA |
WO1996027025A1 (en) | 1995-02-27 | 1996-09-06 | Ely Michael Rabani | Device, compounds, algorithms, and methods of molecular characterization and manipulation with molecular parallelism |
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
US5624711A (en) | 1995-04-27 | 1997-04-29 | Affymax Technologies, N.V. | Derivatization of solid supports and methods for oligomer synthesis |
US5545531A (en) | 1995-06-07 | 1996-08-13 | Affymax Technologies N.V. | Methods for making a device for concurrently processing multiple biological chip assays |
AU7398996A (en) | 1995-10-11 | 1997-04-30 | Luminex Corporation | Multiplexed analysis of clinical specimens apparatus and method |
US5658734A (en) | 1995-10-17 | 1997-08-19 | International Business Machines Corporation | Process for synthesizing chemical compounds |
US6458530B1 (en) | 1996-04-04 | 2002-10-01 | Affymetrix Inc. | Selecting tag nucleic acids |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
US6297006B1 (en) | 1997-01-16 | 2001-10-02 | Hyseq, Inc. | Methods for sequencing repetitive sequences and for determining the order of sequence subfragments |
WO1998033939A1 (fr) | 1997-01-31 | 1998-08-06 | Hitachi, Ltd. | Procede pour determiner une sequence de base d'acide nucleique et appareil correspondant |
JP2002503954A (ja) | 1997-04-01 | 2002-02-05 | グラクソ、グループ、リミテッド | 核酸増幅法 |
WO1998044152A1 (en) | 1997-04-01 | 1998-10-08 | Glaxo Group Limited | Method of nucleic acid sequencing |
EP0985142A4 (en) | 1997-05-23 | 2006-09-13 | Lynx Therapeutics Inc | SYSTEM AND APPARATUS FOR THE SEQUENTIAL TREATMENT OF ANALYTES |
US6969488B2 (en) | 1998-05-22 | 2005-11-29 | Solexa, Inc. | System and apparatus for sequential processing of analytes |
US6465178B2 (en) | 1997-09-30 | 2002-10-15 | Surmodics, Inc. | Target molecule attachment to surfaces |
US6485944B1 (en) | 1997-10-10 | 2002-11-26 | President And Fellows Of Harvard College | Replica amplification of nucleic acid arrays |
WO1999019341A1 (en) | 1997-10-10 | 1999-04-22 | President & Fellows Of Harvard College | Replica amplification of nucleic acid arrays |
US6087102A (en) | 1998-01-07 | 2000-07-11 | Clontech Laboratories, Inc. | Polymeric arrays and methods for their use in binding assays |
US6287776B1 (en) | 1998-02-02 | 2001-09-11 | Signature Bioscience, Inc. | Method for detecting and classifying nucleic acid hybridization |
JP3944996B2 (ja) | 1998-03-05 | 2007-07-18 | 株式会社日立製作所 | Dnaプローブアレー |
US6031078A (en) | 1998-06-16 | 2000-02-29 | Millennium Pharmaceuticals, Inc. | MTbx protein and nucleic acid molecules and uses therefor |
US6335155B1 (en) * | 1998-06-26 | 2002-01-01 | Sunesis Pharmaceuticals, Inc. | Methods for rapidly identifying small organic molecule ligands for binding to biological target molecules |
DE69928265T3 (de) | 1998-07-30 | 2013-11-28 | Illumina Cambridge Ltd. | Matrizen von biomolekülen und ihre verwendung in sequenzierung |
GB0002310D0 (en) | 2000-02-01 | 2000-03-22 | Solexa Ltd | Polynucleotide sequencing |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
US6277628B1 (en) | 1998-10-02 | 2001-08-21 | Incyte Genomics, Inc. | Linear microarrays |
US6391937B1 (en) | 1998-11-25 | 2002-05-21 | Motorola, Inc. | Polyacrylamide hydrogels and hydrogel arrays made from polyacrylamide reactive prepolymers |
AU3174600A (en) | 1999-03-10 | 2000-09-28 | Asm Scientific, Inc. | A method for direct nucleic acid sequencing |
US6355431B1 (en) | 1999-04-20 | 2002-03-12 | Illumina, Inc. | Detection of nucleic acid amplification reactions using bead arrays |
EP1923471B1 (en) | 1999-04-20 | 2012-12-19 | Illumina, Inc. | Detection of nucleic acid reactions on bead arrays |
US6664061B2 (en) | 1999-06-25 | 2003-12-16 | Amersham Biosciences Ab | Use and evaluation of a [2+2] photoaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix |
US6372813B1 (en) | 1999-06-25 | 2002-04-16 | Motorola | Methods and compositions for attachment of biomolecules to solid supports, hydrogels, and hydrogel arrays |
US6274320B1 (en) | 1999-09-16 | 2001-08-14 | Curagen Corporation | Method of sequencing a nucleic acid |
US6770441B2 (en) | 2000-02-10 | 2004-08-03 | Illumina, Inc. | Array compositions and methods of making same |
US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
GB0013276D0 (en) | 2000-06-01 | 2000-07-26 | Amersham Pharm Biotech Uk Ltd | Nucleotide analogues |
CN100462433C (zh) | 2000-07-07 | 2009-02-18 | 维西根生物技术公司 | 实时序列测定 |
WO2002012566A2 (en) | 2000-08-09 | 2002-02-14 | Motorola, Inc. | The use and evaluation of a [2+2] photocycloaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix |
WO2002044425A2 (en) | 2000-12-01 | 2002-06-06 | Visigen Biotechnologies, Inc. | Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity |
US7057026B2 (en) * | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
GB2395953A (en) | 2002-08-23 | 2004-06-09 | Solexa Ltd | Labelled nucleotides |
GB0321306D0 (en) | 2003-09-11 | 2003-10-15 | Solexa Ltd | Modified polymerases for improved incorporation of nucleotide analogues |
GB0326073D0 (en) | 2003-11-07 | 2003-12-10 | Solexa Ltd | Improvements in or relating to polynucleotide arrays |
JP2007525571A (ja) | 2004-01-07 | 2007-09-06 | ソレクサ リミテッド | 修飾分子アレイ |
CN101914620B (zh) | 2004-09-17 | 2014-02-12 | 加利福尼亚太平洋生命科学公司 | 核酸测序的方法 |
EP1888743B1 (en) | 2005-05-10 | 2011-08-03 | Illumina Cambridge Limited | Improved polymerases |
GB0514936D0 (en) | 2005-07-20 | 2005-08-24 | Solexa Ltd | Preparation of templates for nucleic acid sequencing |
GB0517097D0 (en) | 2005-08-19 | 2005-09-28 | Solexa Ltd | Modified nucleosides and nucleotides and uses thereof |
US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
EP2018622B1 (en) | 2006-03-31 | 2018-04-25 | Illumina, Inc. | Systems for sequence by synthesis analysis |
US7754429B2 (en) | 2006-10-06 | 2010-07-13 | Illumina Cambridge Limited | Method for pair-wise sequencing a plurity of target polynucleotides |
WO2008051530A2 (en) | 2006-10-23 | 2008-05-02 | Pacific Biosciences Of California, Inc. | Polymerase enzymes and reagents for enhanced nucleic acid sequencing |
EP2653861B1 (en) | 2006-12-14 | 2014-08-13 | Life Technologies Corporation | Method for sequencing a nucleic acid using large-scale FET arrays |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
US8349167B2 (en) | 2006-12-14 | 2013-01-08 | Life Technologies Corporation | Methods and apparatus for detecting molecular interactions using FET arrays |
US8617811B2 (en) | 2008-01-28 | 2013-12-31 | Complete Genomics, Inc. | Methods and compositions for efficient base calling in sequencing reactions |
US20100137143A1 (en) | 2008-10-22 | 2010-06-03 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
US8951781B2 (en) | 2011-01-10 | 2015-02-10 | Illumina, Inc. | Systems, methods, and apparatuses to image a sample for biological or chemical analysis |
EP3290528B1 (en) | 2011-09-23 | 2019-08-14 | Illumina, Inc. | Methods and compositions for nucleic acid sequencing |
US9012022B2 (en) | 2012-06-08 | 2015-04-21 | Illumina, Inc. | Polymer coatings |
GB201414098D0 (en) | 2014-08-08 | 2014-09-24 | Illumina Cambridge Ltd | Modified nucleotide linkers |
WO2017079498A2 (en) | 2015-11-06 | 2017-05-11 | Intelligent Biosystems, Inc. | Nucleotide analogues |
CN110234403A (zh) * | 2017-01-27 | 2019-09-13 | 詹森生物科技公司 | 作为sting激动剂的环状二核苷酸 |
RU2766688C2 (ru) | 2018-05-15 | 2022-03-15 | Иллумина, Инк. | Композиции и способы химического расщепления и снятия защиты для связанных с поверхностью олигонуклеотидов |
CN112673098B (zh) | 2018-10-31 | 2023-01-06 | 亿明达股份有限公司 | 聚合酶、组合物及使用方法 |
CA3103739A1 (en) | 2018-12-05 | 2020-06-11 | Illumina, Inc. | Polymerases, compositions, and methods of use |
KR102594019B1 (ko) | 2018-12-17 | 2023-10-26 | 일루미나 케임브리지 리미티드 | 폴리뉴클레오타이드 서열분석에 사용하기 위한 조성물 |
US11293061B2 (en) | 2018-12-26 | 2022-04-05 | Illumina Cambridge Limited | Sequencing methods using nucleotides with 3′ AOM blocking group |
WO2022006051A1 (en) | 2020-06-29 | 2022-01-06 | Anovent Pharmaceutical (U.S.), Llc | Formulation of tocilizumab and method for treating covid-19 by inhalation |
-
2019
- 2019-12-20 US US16/724,088 patent/US11293061B2/en active Active
- 2019-12-23 JP JP2020572455A patent/JP2022515944A/ja active Pending
- 2019-12-23 AU AU2019412494A patent/AU2019412494A1/en active Pending
- 2019-12-23 KR KR1020207037454A patent/KR20210109439A/ko unknown
- 2019-12-23 SG SG11202012557XA patent/SG11202012557XA/en unknown
- 2019-12-23 CN CN201980042583.5A patent/CN112638925A/zh active Pending
- 2019-12-23 BR BR112020026668-0A patent/BR112020026668A2/pt unknown
- 2019-12-23 WO PCT/EP2019/086926 patent/WO2020136170A2/en active Search and Examination
- 2019-12-23 MX MX2020013454A patent/MX2020013454A/es unknown
- 2019-12-23 EP EP19832696.9A patent/EP3902814A2/en active Pending
- 2019-12-23 CA CA3103634A patent/CA3103634A1/en active Pending
-
2020
- 2020-12-15 ZA ZA2020/07841A patent/ZA202007841B/en unknown
- 2020-12-17 IL IL279562A patent/IL279562A/en unknown
- 2020-12-21 IL IL279644A patent/IL279644A/en unknown
-
2022
- 2022-03-30 US US17/708,498 patent/US11827931B2/en active Active
-
2023
- 2023-10-17 US US18/488,801 patent/US20240150827A1/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0104857A1 (en) * | 1982-09-28 | 1984-04-04 | Beecham Group Plc | Deoxyuridine compounds, methods for preparing them and their use in medicine |
WO2002029003A2 (en) * | 2000-10-06 | 2002-04-11 | The Trustees Of Columbia University In The City Of New York | Massive parallel method for decoding dna and rna |
WO2004018497A2 (en) * | 2002-08-23 | 2004-03-04 | Solexa Limited | Modified nucleotides for polynucleotide sequencing |
WO2009054922A1 (en) * | 2007-10-19 | 2009-04-30 | The Trustees Of Columbia University In The City Of New York | Dna sequencing with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators |
WO2012162429A2 (en) * | 2011-05-23 | 2012-11-29 | The Trustees Of Columbia University In The City Of New York | Dna sequencing by synthesis using raman and infrared spectroscopy detection |
WO2014139596A1 (en) * | 2013-03-15 | 2014-09-18 | Illumina Cambridge Limited | Modified nucleosides or nucleotides |
CN105315318A (zh) * | 2015-11-06 | 2016-02-10 | 山东大学 | 一种α‐L‐鼠李糖苷酶在制备5-氟-2’-脱氧脲苷衍生物中的应用 |
Non-Patent Citations (3)
Title |
---|
MICHAEL L.METZKER等: "Termination of DNA synthesis by novel 3\'-modifieddeoxyribonucleoside 5\'-triphosphates", 《NUCLEIC ACIDS RESEACH》, vol. 22, no. 20, XP093062154, DOI: 10.1093/nar/22.20.4259 * |
WALTER HEIDMANN等: "Festpasensynthese von oligonucleotiden, 11 Verwendung eines neuartigen hydrophilen perlpolymerisats als trager", 《MAKROMOL.CHEM.》, vol. 181, no. 12, XP055681106, DOI: 10.1002/macp.1980.021811207 * |
YAMSHITA J-I等: "Studies on antitumor agents.VII.Antitumor activities of O-alkoxyalkyl de rivatives of 2’-deoxy-5-trifluoromethyluridine", 《CHEMICAL AND PHARMACHETICAL BULLETIN》, vol. 35, no. 6 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024077410A1 (zh) * | 2022-10-09 | 2024-04-18 | 深圳市真迈生物科技有限公司 | 还原叠氮甲氧基类基团的方法、测序方法及试剂盒 |
Also Published As
Publication number | Publication date |
---|---|
WO2020136170A3 (en) | 2020-08-13 |
BR112020026668A2 (pt) | 2021-03-30 |
WO2020136170A2 (en) | 2020-07-02 |
SG11202012557XA (en) | 2021-01-28 |
US20200216891A1 (en) | 2020-07-09 |
US20220220553A1 (en) | 2022-07-14 |
US11827931B2 (en) | 2023-11-28 |
IL279562A (en) | 2021-01-31 |
US20240150827A1 (en) | 2024-05-09 |
IL279644A (en) | 2021-03-01 |
ZA202007841B (en) | 2023-04-26 |
US11293061B2 (en) | 2022-04-05 |
JP2022515944A (ja) | 2022-02-24 |
CA3103634A1 (en) | 2020-07-02 |
AU2019412494A1 (en) | 2021-01-07 |
EP3902814A2 (en) | 2021-11-03 |
MX2020013454A (es) | 2021-04-28 |
KR20210109439A (ko) | 2021-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112638925A (zh) | 具有3’-羟基封闭基团的核苷和核苷酸以及它们在多核苷酸测序方法中的用途 | |
JP7307686B2 (ja) | 第二級アミン置換クマリン化合物、および蛍光標識としてのそれらの使用 | |
US11787831B2 (en) | Nucleosides and nucleotides with 3′ acetal blocking group | |
US20220380389A1 (en) | Fluorescent dyes containing bis-boron fused heterocycles and uses in sequencing | |
KR20230121556A (ko) | 긴 스토크스 이동 크로메노퀴놀린 염료 및 서열분석 응용에서의 용도 | |
US20220195196A1 (en) | Alkylpyridinium coumarin dyes and uses in sequencing applications | |
RU2818762C2 (ru) | Нуклеозиды и нуклеотиды с 3’-гидрокси блокирующими группами и их применение в способах секвенирования полинуклеотидов | |
CN112639128A (zh) | 利用光可切换标记进行核酸测序的方法和组合物 | |
US20240132532A1 (en) | Methods of sequencing using nucleotides with 3' acetal blocking group | |
US20230313292A1 (en) | Chromenoquinoline dyes and uses in sequencing | |
NZ770894A (en) | Nucleosides and nucleotides with 3'-hydroxy blocking groups and their use in polynucleotide sequencing methods | |
US20230383342A1 (en) | Compositions and methods for nucleic acid sequencing | |
CN117916390A (zh) | 用于边合成边测序的组合物和方法 | |
CA3223362A1 (en) | Methods of detecting methylcytosine and hydroxymethylcytosine by sequencing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |