RU2818762C2 - Nucleosides and nucleotides with 3'-hydroxy blocking groups and their use in methods of sequencing polynucleotides - Google Patents
Nucleosides and nucleotides with 3'-hydroxy blocking groups and their use in methods of sequencing polynucleotides Download PDFInfo
- Publication number
- RU2818762C2 RU2818762C2 RU2020141465A RU2020141465A RU2818762C2 RU 2818762 C2 RU2818762 C2 RU 2818762C2 RU 2020141465 A RU2020141465 A RU 2020141465A RU 2020141465 A RU2020141465 A RU 2020141465A RU 2818762 C2 RU2818762 C2 RU 2818762C2
- Authority
- RU
- Russia
- Prior art keywords
- nucleotide
- group
- nucleotides
- paragraphs
- sequencing
- Prior art date
Links
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 396
- 239000002773 nucleotide Substances 0.000 title claims abstract description 387
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 124
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 124
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 124
- 230000000903 blocking effect Effects 0.000 title claims abstract description 123
- 238000000034 method Methods 0.000 title claims abstract description 115
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 110
- 239000002777 nucleoside Substances 0.000 title description 81
- 125000003835 nucleoside group Chemical group 0.000 title description 28
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 54
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 52
- 238000006243 chemical reaction Methods 0.000 claims abstract description 49
- 229910052799 carbon Inorganic materials 0.000 claims abstract description 30
- 108091034117 Oligonucleotide Proteins 0.000 claims abstract description 27
- 230000000295 complement effect Effects 0.000 claims abstract description 23
- 239000000126 substance Substances 0.000 claims abstract description 21
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 claims abstract description 16
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 claims abstract description 14
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 claims abstract description 14
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 claims abstract description 10
- KDLHZDBZIXYQEI-UHFFFAOYSA-N Palladium Chemical compound [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 claims description 80
- 125000005647 linker group Chemical group 0.000 claims description 79
- 239000000243 solution Substances 0.000 claims description 77
- 150000007523 nucleic acids Chemical class 0.000 claims description 67
- 102000039446 nucleic acids Human genes 0.000 claims description 62
- 108020004707 nucleic acids Proteins 0.000 claims description 62
- 239000000975 dye Substances 0.000 claims description 59
- 239000000203 mixture Substances 0.000 claims description 52
- 239000003153 chemical reaction reagent Substances 0.000 claims description 33
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 claims description 32
- 238000003776 cleavage reaction Methods 0.000 claims description 32
- 230000007017 scission Effects 0.000 claims description 32
- YICAEXQYKBMDNH-UHFFFAOYSA-N 3-[bis(3-hydroxypropyl)phosphanyl]propan-1-ol Chemical compound OCCCP(CCCO)CCCO YICAEXQYKBMDNH-UHFFFAOYSA-N 0.000 claims description 31
- 239000001226 triphosphate Substances 0.000 claims description 30
- 235000011178 triphosphate Nutrition 0.000 claims description 27
- 239000007850 fluorescent dye Substances 0.000 claims description 25
- 229910052757 nitrogen Inorganic materials 0.000 claims description 24
- 238000010348 incorporation Methods 0.000 claims description 23
- 229910052739 hydrogen Inorganic materials 0.000 claims description 22
- 229910052763 palladium Inorganic materials 0.000 claims description 21
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 claims description 21
- XYFCBTPGUUZFHI-UHFFFAOYSA-N Phosphine Chemical compound P XYFCBTPGUUZFHI-UHFFFAOYSA-N 0.000 claims description 20
- 102000004190 Enzymes Human genes 0.000 claims description 19
- 108090000790 Enzymes Proteins 0.000 claims description 19
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 18
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 18
- 239000000872 buffer Substances 0.000 claims description 18
- 239000003054 catalyst Substances 0.000 claims description 18
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 17
- 230000003321 amplification Effects 0.000 claims description 16
- 230000003139 buffering effect Effects 0.000 claims description 12
- 239000001257 hydrogen Substances 0.000 claims description 12
- KWYHDKDOAIKMQN-UHFFFAOYSA-N N,N,N',N'-tetramethylethylenediamine Chemical compound CN(C)CCN(C)C KWYHDKDOAIKMQN-UHFFFAOYSA-N 0.000 claims description 11
- 150000001721 carbon Chemical group 0.000 claims description 11
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 claims description 11
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 claims description 10
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 10
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 10
- DIHKMUNUGQVFES-UHFFFAOYSA-N n,n,n',n'-tetraethylethane-1,2-diamine Chemical compound CCN(CC)CCN(CC)CC DIHKMUNUGQVFES-UHFFFAOYSA-N 0.000 claims description 10
- 229910000073 phosphorus hydride Inorganic materials 0.000 claims description 10
- 229910052717 sulfur Inorganic materials 0.000 claims description 10
- 229910052760 oxygen Inorganic materials 0.000 claims description 9
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 claims description 8
- 239000007983 Tris buffer Substances 0.000 claims description 8
- 150000001642 boronic acid derivatives Chemical class 0.000 claims description 8
- 150000005323 carbonate salts Chemical class 0.000 claims description 8
- 239000012634 fragment Substances 0.000 claims description 8
- 150000003013 phosphoric acid derivatives Chemical class 0.000 claims description 8
- 150000003839 salts Chemical class 0.000 claims description 8
- 238000005406 washing Methods 0.000 claims description 8
- JMXMXKRNIYCNRV-UHFFFAOYSA-N bis(hydroxymethyl)phosphanylmethanol Chemical group OCP(CO)CO JMXMXKRNIYCNRV-UHFFFAOYSA-N 0.000 claims description 7
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 claims description 7
- 150000003512 tertiary amines Chemical class 0.000 claims description 6
- 239000004471 Glycine Substances 0.000 claims description 5
- 235000010323 ascorbic acid Nutrition 0.000 claims description 5
- 239000011668 ascorbic acid Substances 0.000 claims description 5
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 claims description 5
- GNVMUORYQLCPJZ-UHFFFAOYSA-N carbamothioic s-acid Chemical group NC(S)=O GNVMUORYQLCPJZ-UHFFFAOYSA-N 0.000 claims description 5
- 150000003141 primary amines Chemical class 0.000 claims description 5
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims description 5
- 229960005070 ascorbic acid Drugs 0.000 claims description 4
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 claims description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 3
- 230000009471 action Effects 0.000 claims description 3
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 claims description 3
- 125000002228 disulfide group Chemical group 0.000 claims description 3
- 239000002516 radical scavenger Substances 0.000 claims description 3
- PZIJUXHDLWNNRW-UHFFFAOYSA-N 2-[bis(2-hydroxyethyl)phosphanyl]ethanol Chemical compound OCCP(CCO)CCO PZIJUXHDLWNNRW-UHFFFAOYSA-N 0.000 claims description 2
- 108091028732 Concatemer Proteins 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims description 2
- UEEJHVSXFDXPFK-UHFFFAOYSA-N N-dimethylaminoethanol Chemical compound CN(C)CCO UEEJHVSXFDXPFK-UHFFFAOYSA-N 0.000 claims 4
- 125000000008 (C1-C10) alkyl group Chemical group 0.000 claims 2
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 claims 1
- 125000000467 secondary amino group Chemical class [H]N([*:1])[*:2] 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 9
- -1 modified nucleotide phosphoramidites Chemical class 0.000 description 82
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 81
- 150000003833 nucleoside derivatives Chemical class 0.000 description 55
- 239000002585 base Substances 0.000 description 53
- 150000002500 ions Chemical class 0.000 description 46
- 239000011541 reaction mixture Substances 0.000 description 44
- 125000003118 aryl group Chemical group 0.000 description 39
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 38
- 235000019439 ethyl acetate Nutrition 0.000 description 36
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 35
- 150000001875 compounds Chemical class 0.000 description 34
- 125000004432 carbon atom Chemical group C* 0.000 description 33
- 239000007787 solid Substances 0.000 description 32
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 31
- 230000002829 reductive effect Effects 0.000 description 31
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 29
- 125000004452 carbocyclyl group Chemical group 0.000 description 28
- 125000000623 heterocyclic group Chemical group 0.000 description 26
- 238000001514 detection method Methods 0.000 description 25
- 125000000217 alkyl group Chemical group 0.000 description 23
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 23
- 125000006239 protecting group Chemical group 0.000 description 22
- 229910052736 halogen Inorganic materials 0.000 description 21
- 150000002367 halogens Chemical class 0.000 description 21
- 108020004414 DNA Proteins 0.000 description 20
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 20
- 125000004429 atom Chemical group 0.000 description 20
- 125000000882 C2-C6 alkenyl group Chemical group 0.000 description 19
- 125000003601 C2-C6 alkynyl group Chemical group 0.000 description 19
- AFQIYTIJXGTIEY-UHFFFAOYSA-N hydrogen carbonate;triethylazanium Chemical compound OC(O)=O.CCN(CC)CC AFQIYTIJXGTIEY-UHFFFAOYSA-N 0.000 description 19
- 239000000758 substrate Substances 0.000 description 19
- HGCIXCUEYOPUTN-UHFFFAOYSA-N cyclohexene Chemical compound C1CCC=CC1 HGCIXCUEYOPUTN-UHFFFAOYSA-N 0.000 description 18
- 150000001241 acetals Chemical class 0.000 description 17
- 238000007792 addition Methods 0.000 description 17
- 125000000304 alkynyl group Chemical group 0.000 description 17
- 125000004122 cyclic group Chemical group 0.000 description 17
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 17
- 238000002360 preparation method Methods 0.000 description 17
- 238000003556 assay Methods 0.000 description 16
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 16
- 125000000171 (C1-C6) haloalkyl group Chemical group 0.000 description 15
- PHIYHIOQVWTXII-UHFFFAOYSA-N 3-amino-1-phenylpropan-1-ol Chemical compound NCCC(O)C1=CC=CC=C1 PHIYHIOQVWTXII-UHFFFAOYSA-N 0.000 description 15
- 125000003342 alkenyl group Chemical group 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 15
- 239000012043 crude product Substances 0.000 description 15
- 238000003818 flash chromatography Methods 0.000 description 15
- 238000004128 high performance liquid chromatography Methods 0.000 description 15
- 230000000670 limiting effect Effects 0.000 description 15
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 13
- 238000000451 chemical ionisation Methods 0.000 description 13
- 239000003921 oil Substances 0.000 description 13
- 239000003039 volatile agent Substances 0.000 description 13
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 12
- DHKHKXVYLBGOIT-UHFFFAOYSA-N acetaldehyde Diethyl Acetal Natural products CCOC(C)OCC DHKHKXVYLBGOIT-UHFFFAOYSA-N 0.000 description 12
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 12
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 12
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 12
- 239000000047 product Substances 0.000 description 12
- 239000000741 silica gel Substances 0.000 description 12
- 229910002027 silica gel Inorganic materials 0.000 description 12
- 239000002904 solvent Substances 0.000 description 12
- 239000007858 starting material Substances 0.000 description 12
- 238000010511 deprotection reaction Methods 0.000 description 11
- 125000005842 heteroatom Chemical group 0.000 description 11
- 239000010410 layer Substances 0.000 description 11
- 239000012074 organic phase Substances 0.000 description 11
- SNOOUWRIMMFWNE-UHFFFAOYSA-M sodium;6-[(3,4,5-trimethoxybenzoyl)amino]hexanoate Chemical compound [Na+].COC1=CC(C(=O)NCCCCCC([O-])=O)=CC(OC)=C1OC SNOOUWRIMMFWNE-UHFFFAOYSA-M 0.000 description 11
- 125000004737 (C1-C6) haloalkoxy group Chemical group 0.000 description 10
- 125000001313 C5-C10 heteroaryl group Chemical group 0.000 description 10
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 10
- 229910019142 PO4 Inorganic materials 0.000 description 10
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 10
- 239000000460 chlorine Substances 0.000 description 10
- 125000004404 heteroalkyl group Chemical group 0.000 description 10
- 125000001072 heteroaryl group Chemical group 0.000 description 10
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 10
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 10
- WXHIJDCHNDBCNY-UHFFFAOYSA-N palladium dihydride Chemical compound [PdH2] WXHIJDCHNDBCNY-UHFFFAOYSA-N 0.000 description 10
- 229920006395 saturated elastomer Polymers 0.000 description 10
- 125000001424 substituent group Chemical group 0.000 description 10
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 10
- 125000006714 (C3-C10) heterocyclyl group Chemical group 0.000 description 9
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 9
- 125000002947 alkylene group Chemical group 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 239000011521 glass Substances 0.000 description 9
- 239000010452 phosphate Substances 0.000 description 9
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 9
- 239000011550 stock solution Substances 0.000 description 9
- ROSDSFDQCJNGOL-UHFFFAOYSA-N Dimethylamine Chemical compound CNC ROSDSFDQCJNGOL-UHFFFAOYSA-N 0.000 description 8
- GNVMUORYQLCPJZ-UHFFFAOYSA-M Thiocarbamate Chemical compound NC([S-])=O GNVMUORYQLCPJZ-UHFFFAOYSA-M 0.000 description 8
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 description 8
- XXROGKLTLUQVRX-UHFFFAOYSA-N allyl alcohol Chemical compound OCC=C XXROGKLTLUQVRX-UHFFFAOYSA-N 0.000 description 8
- 239000011324 bead Substances 0.000 description 8
- 239000007853 buffer solution Substances 0.000 description 8
- 125000000753 cycloalkyl group Chemical group 0.000 description 8
- 230000029087 digestion Effects 0.000 description 8
- ZXSBDSGRQIWJPM-UHFFFAOYSA-N dimethylcarbamothioic s-acid Chemical compound CN(C)C(S)=O ZXSBDSGRQIWJPM-UHFFFAOYSA-N 0.000 description 8
- 235000011180 diphosphates Nutrition 0.000 description 8
- 239000012044 organic layer Substances 0.000 description 8
- 230000002441 reversible effect Effects 0.000 description 8
- 239000000377 silicon dioxide Substances 0.000 description 8
- PPASLZSBLFJQEF-RKJRWTFHSA-M sodium ascorbate Substances [Na+].OC[C@@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RKJRWTFHSA-M 0.000 description 8
- 235000010378 sodium ascorbate Nutrition 0.000 description 8
- 229960005055 sodium ascorbate Drugs 0.000 description 8
- PPASLZSBLFJQEF-RXSVEWSESA-M sodium-L-ascorbate Chemical compound [Na+].OC[C@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RXSVEWSESA-M 0.000 description 8
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 7
- 229920005654 Sephadex Polymers 0.000 description 7
- 239000012507 Sephadex™ Substances 0.000 description 7
- 239000012267 brine Substances 0.000 description 7
- 125000004093 cyano group Chemical group *C#N 0.000 description 7
- 235000021317 phosphate Nutrition 0.000 description 7
- 239000000523 sample Substances 0.000 description 7
- HPALAKNZSZLMCH-UHFFFAOYSA-M sodium;chloride;hydrate Chemical compound O.[Na+].[Cl-] HPALAKNZSZLMCH-UHFFFAOYSA-M 0.000 description 7
- 238000003756 stirring Methods 0.000 description 7
- 125000003161 (C1-C6) alkylene group Chemical group 0.000 description 6
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 description 6
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 6
- 238000001712 DNA sequencing Methods 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- 101150003085 Pdcl gene Proteins 0.000 description 6
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 6
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 6
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 6
- TWKVUTXHANJYGH-UHFFFAOYSA-L allyl palladium chloride Chemical class Cl[Pd]CC=C.Cl[Pd]CC=C TWKVUTXHANJYGH-UHFFFAOYSA-L 0.000 description 6
- HSFWRNGVRCDJHI-UHFFFAOYSA-N alpha-acetylene Natural products C#C HSFWRNGVRCDJHI-UHFFFAOYSA-N 0.000 description 6
- 229940104302 cytosine Drugs 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 125000002534 ethynyl group Chemical group [H]C#C* 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 125000005843 halogen group Chemical group 0.000 description 6
- 239000000017 hydrogel Substances 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 239000002102 nanobead Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000004809 thin layer chromatography Methods 0.000 description 6
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 5
- 241000872931 Myoporum sandwicense Species 0.000 description 5
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 description 5
- 239000000654 additive Substances 0.000 description 5
- 230000000996 additive effect Effects 0.000 description 5
- 125000003277 amino group Chemical group 0.000 description 5
- 239000007864 aqueous solution Substances 0.000 description 5
- 125000003710 aryl alkyl group Chemical group 0.000 description 5
- 239000013058 crude material Substances 0.000 description 5
- 125000000392 cycloalkenyl group Chemical group 0.000 description 5
- 230000005284 excitation Effects 0.000 description 5
- 150000002430 hydrocarbons Chemical group 0.000 description 5
- 238000011065 in-situ storage Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 239000012299 nitrogen atmosphere Substances 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000010791 quenching Methods 0.000 description 5
- 230000000171 quenching effect Effects 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 125000006850 spacer group Chemical group 0.000 description 5
- FPGGTKZVZWFYPV-UHFFFAOYSA-M tetrabutylammonium fluoride Chemical compound [F-].CCCC[N+](CCCC)(CCCC)CCCC FPGGTKZVZWFYPV-UHFFFAOYSA-M 0.000 description 5
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 5
- 229940035893 uracil Drugs 0.000 description 5
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 5
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 4
- 108020004635 Complementary DNA Proteins 0.000 description 4
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 4
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 4
- 102100031780 Endonuclease Human genes 0.000 description 4
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 4
- 229960000583 acetic acid Drugs 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 125000004183 alkoxy alkyl group Chemical group 0.000 description 4
- 125000003545 alkoxy group Chemical group 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 239000001177 diphosphate Substances 0.000 description 4
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 4
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 125000000524 functional group Chemical group 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 238000004255 ion exchange chromatography Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 239000003446 ligand Substances 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 239000002808 molecular sieve Substances 0.000 description 4
- 150000004712 monophosphates Chemical class 0.000 description 4
- 239000003208 petroleum Substances 0.000 description 4
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 4
- 150000003003 phosphines Chemical class 0.000 description 4
- RLOWWWKZYUNIDI-UHFFFAOYSA-N phosphinic chloride Chemical compound ClP=O RLOWWWKZYUNIDI-UHFFFAOYSA-N 0.000 description 4
- 238000012175 pyrosequencing Methods 0.000 description 4
- 150000003254 radicals Chemical class 0.000 description 4
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 4
- 239000011593 sulfur Substances 0.000 description 4
- YBBRCQOCSYXUOC-UHFFFAOYSA-N sulfuryl dichloride Chemical compound ClS(Cl)(=O)=O YBBRCQOCSYXUOC-UHFFFAOYSA-N 0.000 description 4
- 229940113082 thymine Drugs 0.000 description 4
- IMFACGCPASFAPR-UHFFFAOYSA-N tributylamine Chemical compound CCCCN(CCCC)CCCC IMFACGCPASFAPR-UHFFFAOYSA-N 0.000 description 4
- SGPUHRSBWMQRAN-UHFFFAOYSA-N 2-[bis(1-carboxyethyl)phosphanyl]propanoic acid Chemical compound OC(=O)C(C)P(C(C)C(O)=O)C(C)C(O)=O SGPUHRSBWMQRAN-UHFFFAOYSA-N 0.000 description 3
- VHYFNPMBLIVWCW-UHFFFAOYSA-N 4-Dimethylaminopyridine Chemical compound CN(C)C1=CC=NC=C1 VHYFNPMBLIVWCW-UHFFFAOYSA-N 0.000 description 3
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 229910021538 borax Inorganic materials 0.000 description 3
- 239000003638 chemical reducing agent Substances 0.000 description 3
- 229910052801 chlorine Inorganic materials 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 3
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 239000012456 homogeneous solution Substances 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 239000005457 ice water Substances 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 125000004430 oxygen atom Chemical group O* 0.000 description 3
- 229910052698 phosphorus Inorganic materials 0.000 description 3
- 239000011574 phosphorus Substances 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 238000006116 polymerization reaction Methods 0.000 description 3
- 238000002953 preparative HPLC Methods 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 125000002568 propynyl group Chemical group [*]C#CC([H])([H])[H] 0.000 description 3
- 150000003212 purines Chemical class 0.000 description 3
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 3
- 150000003230 pyrimidines Chemical class 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 125000002652 ribonucleotide group Chemical group 0.000 description 3
- 238000010898 silica gel chromatography Methods 0.000 description 3
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 3
- 235000017557 sodium bicarbonate Nutrition 0.000 description 3
- 229910000029 sodium carbonate Inorganic materials 0.000 description 3
- 239000001488 sodium phosphate Substances 0.000 description 3
- 229910000162 sodium phosphate Inorganic materials 0.000 description 3
- 235000010339 sodium tetraborate Nutrition 0.000 description 3
- 239000007790 solid phase Substances 0.000 description 3
- 238000004611 spectroscopical analysis Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 229910052723 transition metal Inorganic materials 0.000 description 3
- 150000003624 transition metals Chemical class 0.000 description 3
- DQWPFSLDHJDLRL-UHFFFAOYSA-N triethyl phosphate Chemical compound CCOP(=O)(OCC)OCC DQWPFSLDHJDLRL-UHFFFAOYSA-N 0.000 description 3
- 125000002264 triphosphate group Chemical group [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 3
- BSVBQGMMJUBVOD-UHFFFAOYSA-N trisodium borate Chemical compound [Na+].[Na+].[Na+].[O-]B([O-])[O-] BSVBQGMMJUBVOD-UHFFFAOYSA-N 0.000 description 3
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 3
- 229920002554 vinyl polymer Polymers 0.000 description 3
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 2
- 125000006716 (C1-C6) heteroalkyl group Chemical group 0.000 description 2
- LBUJPTNKIBCYBY-UHFFFAOYSA-N 1,2,3,4-tetrahydroquinoline Chemical compound C1=CC=C2CCCNC2=C1 LBUJPTNKIBCYBY-UHFFFAOYSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- VAKXPQHQQNOUEZ-UHFFFAOYSA-N 3-[4-[[bis[[1-(3-hydroxypropyl)triazol-4-yl]methyl]amino]methyl]triazol-1-yl]propan-1-ol Chemical compound N1=NN(CCCO)C=C1CN(CC=1N=NN(CCCO)C=1)CC1=CN(CCCO)N=N1 VAKXPQHQQNOUEZ-UHFFFAOYSA-N 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical class [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 2
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 2
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 2
- 229910013063 LiBF 4 Inorganic materials 0.000 description 2
- YNAVUWVOSKDBBP-UHFFFAOYSA-N Morpholine Chemical compound C1COCCN1 YNAVUWVOSKDBBP-UHFFFAOYSA-N 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- GLUUGHFHXGJENI-UHFFFAOYSA-N Piperazine Chemical compound C1CNCCN1 GLUUGHFHXGJENI-UHFFFAOYSA-N 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- 125000005631 S-sulfonamido group Chemical group 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 2
- 229910052782 aluminium Inorganic materials 0.000 description 2
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N ammonia Natural products N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 235000019270 ammonium chloride Nutrition 0.000 description 2
- 235000011114 ammonium hydroxide Nutrition 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 239000008346 aqueous phase Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- YNHIGQDRGKUECZ-UHFFFAOYSA-L bis(triphenylphosphine)palladium(ii) dichloride Chemical compound [Cl-].[Cl-].[Pd+2].C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1.C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1 YNHIGQDRGKUECZ-UHFFFAOYSA-L 0.000 description 2
- 235000012745 brilliant blue FCF Nutrition 0.000 description 2
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- RYYVLZVUVIJVGH-UHFFFAOYSA-N caffeine Chemical compound CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004182 chemical digestion Methods 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 239000005549 deoxyribonucleoside Substances 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 239000005546 dideoxynucleotide Substances 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 238000001704 evaporation Methods 0.000 description 2
- 230000008020 evaporation Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 239000011737 fluorine Substances 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 125000001188 haloalkyl group Chemical group 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 229910017053 inorganic salt Inorganic materials 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 150000002739 metals Chemical class 0.000 description 2
- 239000011859 microparticle Substances 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 239000012038 nucleophile Substances 0.000 description 2
- PENAXHPKEVTBLF-UHFFFAOYSA-L palladium(2+);prop-1-ene;dichloride Chemical compound [Pd+]Cl.[Pd+]Cl.[CH2-]C=C.[CH2-]C=C PENAXHPKEVTBLF-UHFFFAOYSA-L 0.000 description 2
- 150000002972 pentoses Chemical class 0.000 description 2
- 239000008363 phosphate buffer Substances 0.000 description 2
- WRMXOVHLRUVREB-UHFFFAOYSA-N phosphono phosphate;tributylazanium Chemical compound OP(O)(=O)OP([O-])([O-])=O.CCCC[NH+](CCCC)CCCC.CCCC[NH+](CCCC)CCCC WRMXOVHLRUVREB-UHFFFAOYSA-N 0.000 description 2
- 150000008300 phosphoramidites Chemical class 0.000 description 2
- 125000003386 piperidinyl group Chemical group 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 125000004368 propenyl group Chemical group C(=CC)* 0.000 description 2
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- IGFXRKMLLMBKSA-UHFFFAOYSA-N purine Chemical compound N1=C[N]C2=NC=NC2=C1 IGFXRKMLLMBKSA-UHFFFAOYSA-N 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000004007 reversed phase HPLC Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 125000006413 ring segment Chemical group 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 150000003335 secondary amines Chemical class 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 159000000000 sodium salts Chemical group 0.000 description 2
- 125000003003 spiro group Chemical group 0.000 description 2
- 239000011232 storage material Substances 0.000 description 2
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 2
- MHYGQXWCZAYSLJ-UHFFFAOYSA-N tert-butyl-chloro-diphenylsilane Chemical compound C=1C=CC=CC=1[Si](Cl)(C(C)(C)C)C1=CC=CC=C1 MHYGQXWCZAYSLJ-UHFFFAOYSA-N 0.000 description 2
- YAPQBXQYLJRXSA-UHFFFAOYSA-N theobromine Chemical compound CN1C(=O)NC(=O)C2=C1N=CN2C YAPQBXQYLJRXSA-UHFFFAOYSA-N 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- 150000003573 thiols Chemical class 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 125000004178 (C1-C4) alkyl group Chemical group 0.000 description 1
- 125000006727 (C1-C6) alkenyl group Chemical group 0.000 description 1
- 125000006700 (C1-C6) alkylthio group Chemical group 0.000 description 1
- 125000006728 (C1-C6) alkynyl group Chemical group 0.000 description 1
- 125000006729 (C2-C5) alkenyl group Chemical group 0.000 description 1
- 125000006730 (C2-C5) alkynyl group Chemical group 0.000 description 1
- 125000006645 (C3-C4) cycloalkyl group Chemical group 0.000 description 1
- 125000006552 (C3-C8) cycloalkyl group Chemical group 0.000 description 1
- IGERFAHWSHDDHX-UHFFFAOYSA-N 1,3-dioxanyl Chemical group [CH]1OCCCO1 IGERFAHWSHDDHX-UHFFFAOYSA-N 0.000 description 1
- JPRPJUMQRZTTED-UHFFFAOYSA-N 1,3-dioxolanyl Chemical group [CH]1OCCO1 JPRPJUMQRZTTED-UHFFFAOYSA-N 0.000 description 1
- FLOJNXXFMHCMMR-UHFFFAOYSA-N 1,3-dithiolanyl Chemical group [CH]1SCCS1 FLOJNXXFMHCMMR-UHFFFAOYSA-N 0.000 description 1
- KFHQOZXAFUKFNB-UHFFFAOYSA-N 1,3-oxathiolanyl Chemical group [CH]1OCCS1 KFHQOZXAFUKFNB-UHFFFAOYSA-N 0.000 description 1
- 125000005940 1,4-dioxanyl group Chemical group 0.000 description 1
- UBTJZUKVKGZHAD-UPRLRBBYSA-N 1-[(2r,4s,5r)-5-[[bis(4-methoxyphenyl)-phenylmethoxy]methyl]-4-hydroxyoxolan-2-yl]-5-methylpyrimidine-2,4-dione Chemical compound C1=CC(OC)=CC=C1C(C=1C=CC(OC)=CC=1)(C=1C=CC=CC=1)OC[C@@H]1[C@@H](O)C[C@H](N2C(NC(=O)C(C)=C2)=O)O1 UBTJZUKVKGZHAD-UPRLRBBYSA-N 0.000 description 1
- GAUSMJHDHCSZOX-UHFFFAOYSA-N 2,2,2-trifluoro-n-prop-2-ynylacetamide Chemical compound FC(F)(F)C(=O)NCC#C GAUSMJHDHCSZOX-UHFFFAOYSA-N 0.000 description 1
- IMSODMZESSGVBE-UHFFFAOYSA-N 2-Oxazoline Chemical compound C1CN=CO1 IMSODMZESSGVBE-UHFFFAOYSA-N 0.000 description 1
- 125000000069 2-butynyl group Chemical group [H]C([H])([H])C#CC([H])([H])* 0.000 description 1
- PMUNIMVZCACZBB-UHFFFAOYSA-N 2-hydroxyethylazanium;chloride Chemical compound Cl.NCCO PMUNIMVZCACZBB-UHFFFAOYSA-N 0.000 description 1
- 125000000094 2-phenylethyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000006201 3-phenylpropyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000005986 4-piperidonyl group Chemical group 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 125000004070 6 membered heterocyclic group Chemical group 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 description 1
- 238000001353 Chip-sequencing Methods 0.000 description 1
- 229910021595 Copper(I) iodide Inorganic materials 0.000 description 1
- JPVYNHNXODAKFH-UHFFFAOYSA-N Cu2+ Chemical compound [Cu+2] JPVYNHNXODAKFH-UHFFFAOYSA-N 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- LPHGQDQBBGAPDZ-UHFFFAOYSA-N Isocaffeine Natural products CN1C(=O)N(C)C(=O)C2=C1N(C)C=N2 LPHGQDQBBGAPDZ-UHFFFAOYSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 239000012425 OXONE® Substances 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 1
- DHXVGJBLRPWPCS-UHFFFAOYSA-N Tetrahydropyran Chemical compound C1CCOCC1 DHXVGJBLRPWPCS-UHFFFAOYSA-N 0.000 description 1
- ACIAHEMYLLBZOI-ZZXKWVIFSA-N Unsaturated alcohol Chemical compound CC\C(CO)=C/C ACIAHEMYLLBZOI-ZZXKWVIFSA-N 0.000 description 1
- LEHOTFFKMJEONL-UHFFFAOYSA-N Uric Acid Chemical compound N1C(=O)NC(=O)C2=C1NC(=O)N2 LEHOTFFKMJEONL-UHFFFAOYSA-N 0.000 description 1
- TVWHNULVHGKJHS-UHFFFAOYSA-N Uric acid Natural products N1C(=O)NC(=O)C2NC(=O)NC21 TVWHNULVHGKJHS-UHFFFAOYSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 125000000641 acridinyl group Chemical group C1(=CC=CC2=NC3=CC=CC=C3C=C12)* 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 125000005073 adamantyl group Chemical group C12(CC3CC(CC(C1)C3)C2)* 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 125000004450 alkenylene group Chemical group 0.000 description 1
- 150000001343 alkyl silanes Chemical group 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 150000001413 amino acids Chemical group 0.000 description 1
- 125000006620 amino-(C1-C6) alkyl group Chemical group 0.000 description 1
- 125000004103 aminoalkyl group Chemical group 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 125000002178 anthracenyl group Chemical group C1(=CC=CC2=CC3=CC=CC=C3C=C12)* 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- 125000006615 aromatic heterocyclic group Chemical group 0.000 description 1
- 125000005110 aryl thio group Chemical group 0.000 description 1
- 125000004104 aryloxy group Chemical group 0.000 description 1
- 229940072107 ascorbate Drugs 0.000 description 1
- 239000012298 atmosphere Substances 0.000 description 1
- 125000002785 azepinyl group Chemical group 0.000 description 1
- HONIICLYMWZJFZ-UHFFFAOYSA-N azetidine Chemical compound C1CNC1 HONIICLYMWZJFZ-UHFFFAOYSA-N 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 125000003828 azulenyl group Chemical group 0.000 description 1
- 125000003785 benzimidazolyl group Chemical group N1=C(NC2=C1C=CC=C2)* 0.000 description 1
- 125000001164 benzothiazolyl group Chemical group S1C(=NC2=C1C=CC=C2)* 0.000 description 1
- 125000004196 benzothienyl group Chemical group S1C(=CC2=C1C=CC=C2)* 0.000 description 1
- 125000004541 benzoxazolyl group Chemical group O1C(=NC2=C1C=CC=C2)* 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- NYENCOMLZDQKNH-UHFFFAOYSA-K bis(trifluoromethylsulfonyloxy)bismuthanyl trifluoromethanesulfonate Chemical compound [Bi+3].[O-]S(=O)(=O)C(F)(F)F.[O-]S(=O)(=O)C(F)(F)F.[O-]S(=O)(=O)C(F)(F)F NYENCOMLZDQKNH-UHFFFAOYSA-K 0.000 description 1
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- 125000004369 butenyl group Chemical group C(=CCC)* 0.000 description 1
- 125000000480 butynyl group Chemical group [*]C#CC([H])([H])C([H])([H])[H] 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 229960001948 caffeine Drugs 0.000 description 1
- VJEONQKOZGKCAK-UHFFFAOYSA-N caffeine Natural products CN1C(=O)N(C)C(=O)C2=C1C=CN2C VJEONQKOZGKCAK-UHFFFAOYSA-N 0.000 description 1
- 125000000609 carbazolyl group Chemical group C1(=CC=CC=2C3=CC=CC=C3NC12)* 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 150000001805 chlorine compounds Chemical class 0.000 description 1
- 125000000259 cinnolinyl group Chemical group N1=NC(=CC2=CC=CC=C12)* 0.000 description 1
- 238000010549 co-Evaporation Methods 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 230000000536 complexating effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- LSXDOTMGLUJQCM-UHFFFAOYSA-M copper(i) iodide Chemical compound I[Cu] LSXDOTMGLUJQCM-UHFFFAOYSA-M 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 239000010779 crude oil Substances 0.000 description 1
- 125000000596 cyclohexenyl group Chemical group C1(=CCCCC1)* 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- RAFNCPHFRHZCPS-UHFFFAOYSA-N di(imidazol-1-yl)methanethione Chemical compound C1=CN=CN1C(=S)N1C=CN=C1 RAFNCPHFRHZCPS-UHFFFAOYSA-N 0.000 description 1
- 125000000723 dihydrobenzofuranyl group Chemical group O1C(CC2=C1C=CC=C2)* 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 125000005879 dioxolanyl group Chemical group 0.000 description 1
- UNZGQTOBCSKUQP-UHFFFAOYSA-L dipotassium;4-[phenyl-(4-sulfonatophenyl)phosphanyl]benzenesulfonate Chemical compound [K+].[K+].C1=CC(S(=O)(=O)[O-])=CC=C1P(C=1C=CC(=CC=1)S([O-])(=O)=O)C1=CC=CC=C1 UNZGQTOBCSKUQP-UHFFFAOYSA-L 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 239000012039 electrophile Substances 0.000 description 1
- 238000000132 electrospray ionisation Methods 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 125000003700 epoxy group Chemical group 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- 238000005886 esterification reaction Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000012065 filter cake Substances 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000004992 fission Effects 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 125000002541 furyl group Chemical group 0.000 description 1
- 230000005251 gamma ray Effects 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 239000012362 glacial acetic acid Substances 0.000 description 1
- 125000004475 heteroaralkyl group Chemical group 0.000 description 1
- 125000004446 heteroarylalkyl group Chemical group 0.000 description 1
- 125000006038 hexenyl group Chemical group 0.000 description 1
- 125000004051 hexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000005980 hexynyl group Chemical group 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- GQZXNSPRSGFJLY-UHFFFAOYSA-N hydroxyphosphanone Chemical compound OP=O GQZXNSPRSGFJLY-UHFFFAOYSA-N 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 125000002632 imidazolidinyl group Chemical group 0.000 description 1
- 125000002636 imidazolinyl group Chemical group 0.000 description 1
- 125000002883 imidazolyl group Chemical group 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- PQNFLJBBNBOBRQ-UHFFFAOYSA-N indane Chemical compound C1=CC=C2CCCC2=C1 PQNFLJBBNBOBRQ-UHFFFAOYSA-N 0.000 description 1
- 125000003387 indolinyl group Chemical group N1(CCC2=CC=CC=C12)* 0.000 description 1
- 125000001041 indolyl group Chemical group 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229910052816 inorganic phosphate Inorganic materials 0.000 description 1
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 description 1
- 125000004594 isoindolinyl group Chemical group C1(NCC2=CC=CC=C12)* 0.000 description 1
- 125000000904 isoindolyl group Chemical group C=1(NC=C2C=CC=CC12)* 0.000 description 1
- 125000003253 isopropoxy group Chemical group [H]C([H])([H])C([H])(O*)C([H])([H])[H] 0.000 description 1
- 125000002183 isoquinolinyl group Chemical group C1(=NC=CC2=CC=CC=C12)* 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 125000001786 isothiazolyl group Chemical group 0.000 description 1
- 125000003965 isoxazolidinyl group Chemical group 0.000 description 1
- 125000003971 isoxazolinyl group Chemical group 0.000 description 1
- 125000000842 isoxazolyl group Chemical group 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000011967 lanthanide triflate Substances 0.000 description 1
- 229910001496 lithium tetrafluoroborate Inorganic materials 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229910052987 metal hydride Inorganic materials 0.000 description 1
- 150000004681 metal hydrides Chemical class 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 125000002950 monocyclic group Chemical group 0.000 description 1
- 125000002757 morpholinyl group Chemical group 0.000 description 1
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 239000002086 nanomaterial Substances 0.000 description 1
- 125000001624 naphthyl group Chemical group 0.000 description 1
- 125000001326 naphthylalkyl group Chemical group 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 125000000160 oxazolidinyl group Chemical group 0.000 description 1
- 125000005968 oxazolinyl group Chemical group 0.000 description 1
- 125000002971 oxazolyl group Chemical group 0.000 description 1
- 125000003551 oxepanyl group Chemical group 0.000 description 1
- AHHWIHXENZJRFG-UHFFFAOYSA-N oxetane Chemical compound C1COC1 AHHWIHXENZJRFG-UHFFFAOYSA-N 0.000 description 1
- 239000007800 oxidant agent Substances 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 238000002751 oxidative stress assay Methods 0.000 description 1
- 125000000466 oxiranyl group Chemical group 0.000 description 1
- HXNFUBHNUDHIGC-UHFFFAOYSA-N oxypurinol Chemical compound O=C1NC(=O)N=C2NNC=C21 HXNFUBHNUDHIGC-UHFFFAOYSA-N 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- LXNAVEXFUKBNMK-UHFFFAOYSA-N palladium(II) acetate Substances [Pd].CC(O)=O.CC(O)=O LXNAVEXFUKBNMK-UHFFFAOYSA-N 0.000 description 1
- YJVFFLUZDVXJQI-UHFFFAOYSA-L palladium(ii) acetate Chemical compound [Pd+2].CC([O-])=O.CC([O-])=O YJVFFLUZDVXJQI-UHFFFAOYSA-L 0.000 description 1
- JKDRQYIYVJVOPF-FDGPNNRMSA-L palladium(ii) acetylacetonate Chemical compound [Pd+2].C\C([O-])=C\C(C)=O.C\C([O-])=C\C(C)=O JKDRQYIYVJVOPF-FDGPNNRMSA-L 0.000 description 1
- ZOUWOGOTHLRRLS-UHFFFAOYSA-N palladium;phosphane Chemical compound P.[Pd] ZOUWOGOTHLRRLS-UHFFFAOYSA-N 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000002161 passivation Methods 0.000 description 1
- 125000002255 pentenyl group Chemical group C(=CCCC)* 0.000 description 1
- 125000001147 pentyl group Chemical group C(CCCC)* 0.000 description 1
- 125000005981 pentynyl group Chemical group 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 125000004592 phthalazinyl group Chemical group C1(=NN=CC2=CC=CC=C12)* 0.000 description 1
- 125000004193 piperazinyl group Chemical group 0.000 description 1
- 125000003367 polycyclic group Chemical group 0.000 description 1
- 229920000867 polyelectrolyte Polymers 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- OKBMCNHOEMXPTM-UHFFFAOYSA-M potassium peroxymonosulfate Chemical compound [K+].OOS([O-])(=O)=O OKBMCNHOEMXPTM-UHFFFAOYSA-M 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 125000003373 pyrazinyl group Chemical group 0.000 description 1
- 125000003072 pyrazolidinyl group Chemical group 0.000 description 1
- 125000002755 pyrazolinyl group Chemical group 0.000 description 1
- 125000003226 pyrazolyl group Chemical group 0.000 description 1
- 125000002098 pyridazinyl group Chemical group 0.000 description 1
- 125000004076 pyridyl group Chemical group 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 125000000719 pyrrolidinyl group Chemical group 0.000 description 1
- 125000004929 pyrrolidonyl group Chemical group N1(C(CCC1)=O)* 0.000 description 1
- 125000000168 pyrrolyl group Chemical group 0.000 description 1
- 125000002943 quinolinyl group Chemical group N1=C(C=CC2=CC=CC=C12)* 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000013557 residual solvent Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 1
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- AKHNMLFCWUSKQB-UHFFFAOYSA-L sodium thiosulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=S AKHNMLFCWUSKQB-UHFFFAOYSA-L 0.000 description 1
- 235000019345 sodium thiosulphate Nutrition 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 125000000213 sulfino group Chemical group [H]OS(*)=O 0.000 description 1
- 125000004213 tert-butoxy group Chemical group [H]C([H])([H])C(O*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 125000003718 tetrahydrofuranyl group Chemical group 0.000 description 1
- 125000001412 tetrahydropyranyl group Chemical group 0.000 description 1
- 125000003507 tetrahydrothiofenyl group Chemical group 0.000 description 1
- 125000004632 tetrahydrothiopyranyl group Chemical group S1C(CCCC1)* 0.000 description 1
- 229960004559 theobromine Drugs 0.000 description 1
- 125000001113 thiadiazolyl group Chemical group 0.000 description 1
- 125000001984 thiazolidinyl group Chemical group 0.000 description 1
- 125000002769 thiazolinyl group Chemical group 0.000 description 1
- 125000000335 thiazolyl group Chemical group 0.000 description 1
- 125000001544 thienyl group Chemical group 0.000 description 1
- 125000004568 thiomorpholinyl group Chemical group 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 125000004306 triazinyl group Chemical group 0.000 description 1
- 125000001425 triazolyl group Chemical group 0.000 description 1
- ZMANZCXQSJIPKH-UHFFFAOYSA-O triethylammonium ion Chemical compound CC[NH+](CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-O 0.000 description 1
- WVLBCYQITXONBZ-UHFFFAOYSA-N trimethyl phosphate Chemical compound COP(=O)(OC)OC WVLBCYQITXONBZ-UHFFFAOYSA-N 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940116269 uric acid Drugs 0.000 description 1
- 125000005500 uronium group Chemical group 0.000 description 1
- 238000001291 vacuum drying Methods 0.000 description 1
- 238000007738 vacuum evaporation Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Abstract
Description
Настоящее раскрытие в общем относится к нуклеотидам, нуклеозидам или олигонуклеотидам, содержащим 3’-гидрокси защитные группы, и к их применению в способах секвенирования полинуклеотидов. Также раскрываются способы получения 3’-гидрокси защищенных нуклеотидов, нуклеозидов или олигонуклеотидов.The present disclosure generally relates to nucleotides, nucleosides or oligonucleotides containing 3'-hydroxy protecting groups, and their use in polynucleotide sequencing methods. Methods for preparing 3'-hydroxy protected nucleotides, nucleosides or oligonucleotides are also disclosed.
Описание родственной областиDescription of related area
К успехам в исследовании молекул отчасти привели улучшения технологий, используемых для характеристики молекул или их биологических реакций. В частности, исследование нуклеиновых кислот - ДНК и РНК - выиграло от разработки технологий, используемых для анализа последовательностей и исследований событий гибридизации.Advances in molecular research have been driven in part by improvements in the technologies used to characterize molecules or their biological reactions. In particular, the study of nucleic acids—DNA and RNA—has benefited from the development of technologies used for sequence analysis and studies of hybridization events.
Примером технологий, которые улучшили исследование нуклеиновых кислот, является разработка готовых к применению чипов иммобилизованных нуклеиновых кислот. Данные чипы типично состоят из высокоплотной матрицы полинуклеотидов, иммобилизованных на веществе твердой подложки. См., например, Fodor et al., Trends Biotech. 12: 19-26, 1994, в которой описываются пути сборки нуклеиновых кислот с использованием химически сенсибилизированной стеклянной поверхности, защищенной маской, но экспонированной в определенных областях для обеспечения присоединения подходящим образом модифицированных нуклеотидфосфорамидитов. Готовые к применению чипы также могут быть изготовлены методикой «нанесения в виде пятен» известных полинуклеотидов на твердую подложку в заданных положениях (например, Stimpson et al., Proc. Natl. Acad. Sci. 92: 6379-6383, 1995).An example of technologies that have improved nucleic acid research is the development of ready-to-use immobilized nucleic acid chips. These chips typically consist of a high-density array of polynucleotides immobilized on a solid support material. See, for example, Fodor et al., Trends Biotech. 12: 19-26, 1994, which describes ways to assemble nucleic acids using a chemically sensitized glass surface, protected by a mask, but exposed in certain areas to allow the attachment of suitably modified nucleotide phosphoramidites. Ready-to-use chips can also be made by "spotting" known polynucleotides onto a solid support at predetermined positions (eg, Stimpson et al., Proc. Natl. Acad. Sci. 92: 6379-6383, 1995).
Один способ определения нуклеотидной последовательности нуклеиновой кислоты, связанной с чипом, называется «секвенирование посредством синтеза» или «SBS». Данная методика определения последовательности ДНК в идеале требует контролируемого (т.е. по очереди) включения правильного комплементарного нуклеотида напротив секвенируемой нуклеиновой кислоты. Это обеспечивает точное секвенирование посредством добавления нуклеотидов в многочисленных циклах, так как каждый нуклеотидный остаток секвенируется по очереди, таким образом, предотвращая осуществление неконтролируемых серий включений. Включенный нуклеотид считывается с использованием подходящей метки, присоединенной к нему, перед удалением группировки метки и последующим дальнейшим циклом секвенирования.One method of determining the nucleotide sequence of a nucleic acid associated with a chip is called sequencing-by-synthesis or SBS. This DNA sequencing technique ideally requires the controlled (i.e., sequential) incorporation of the correct complementary nucleotide opposite the nucleic acid being sequenced. This ensures accurate sequencing by adding nucleotides in multiple rounds as each nucleotide residue is sequenced in turn, thus preventing uncontrolled series of additions from occurring. The included nucleotide is read using a suitable tag attached to it, before removing the tag cluster and subsequent further round of sequencing.
Для обеспечения того, что происходит только одно включение, в каждый меченый нуклеотид, который добавляется к растущей цепи, включается структурная модификация («защитная группа» или «блокирующая группа») для обеспечения того, что включается только один нуклеотид. После добавления нуклеотида с защитной группой защитная группа затем удаляется при условиях реакции, которые не мешают целостности секвенируемой ДНК. Цикл секвенирования может затем продолжаться с включением следующего защищенного меченого нуклеотида.To ensure that only one incorporation occurs, a structural modification ("protecting group" or "blocking group") is included in each labeled nucleotide that is added to the growing strand to ensure that only one nucleotide is incorporated. After adding a nucleotide with a protecting group, the protecting group is then removed under reaction conditions that do not interfere with the integrity of the DNA being sequenced. The sequencing cycle can then continue with the inclusion of the next protected labeled nucleotide.
Для того, чтобы быть полезными в секвенировании ДНК нуклеотиды, которые обычно представляют собой нуклеотидтрифосфаты, обычно требуют 3’-гидрокси защитной группы, чтобы предотвращать продолжение репликации полимеразой, используемой для включения в полинуклеотидную цепь, как только добавляется основание на нуклеотиде. Имеется много ограничений по типам групп, которые могут быть добавлены на нуклеотид и все еще являются подходящими. Защитная группа должна предотвращать добавление дополнительных нуклеотидных молекул в полинуклеотидную цепь, в то же самое время будучи легко удаляемой от сахарного фрагмента, без вызова повреждения полинуклеотидной цепи. Кроме того, модифицированному нуклеотиду нужно быть совместимым с полимеразой или другим подходящим ферментом, используемым для его включения в полинуклеотидную цепь. Идеальная защитная группа, следовательно, должна демонстрировать долговременную стабильность, быть эффективно включаемой полимеразным ферментом, вызывать блокирование вторичного или дальнейшего включения нуклеотидов и иметь способность к удалению при мягких условиях, которые не вызывают повреждение структуры полинуклеотида, предпочтительно при водных условиях.To be useful in DNA sequencing, nucleotides, which are typically nucleotide triphosphates, typically require a 3'-hydroxy protecting group to prevent the polymerase used to be incorporated into the polynucleotide chain from continuing replication once a base on the nucleotide is added. There are many restrictions on the types of groups that can be added to a nucleotide and still be suitable. The protecting group should prevent the addition of additional nucleotide molecules to the polynucleotide chain, while at the same time being easily removed from the sugar moiety without causing damage to the polynucleotide chain. In addition, the modified nucleotide must be compatible with the polymerase or other suitable enzyme used to incorporate it into the polynucleotide chain. An ideal protecting group should therefore exhibit long-term stability, be efficiently incorporated by the polymerase enzyme, cause blocking of secondary or further incorporation of nucleotides, and be removable under mild conditions that do not cause damage to the polynucleotide structure, preferably under aqueous conditions.
Обратимые защитные группы были описаны ранее. Например, Metzker et al., (Nucleic Acids Research, 22 (20): 4259-4267, 1994) раскрывает синтез и применение восьми 3’-модифицированных 2-дезоксирибонуклеозид-5'-трифосфатов (3'-модифицированный дНТФ) и тестирование в двух анализах ДНК-матрицы на активность включения. В WO 2002/029003 описан способ секвенирования, который может включать применение аллильной защитной группы для кэппирования 3’-ОН группы на растущей цепи ДНК в полимеразной реакции.Reversible protecting groups have been described previously. For example, Metzker et al., (Nucleic Acids Research, 22 (20): 4259-4267, 1994) discloses the synthesis and use of eight 3'-modified 2-deoxyribonucleoside 5'-triphosphates (3'-modified dNTP) and testing in two DNA template assays for incorporation activity. WO 2002/029003 describes a sequencing method that may involve the use of an allyl protecting group to cap a 3'-OH group on a growing DNA strand in a polymerase reaction.
Кроме того, разработка целого ряда обратимых защитных групп и способов снятия их защиты при совместимых с ДНК условиях была ранее описана в публикациях международных заявок № WO 2004/018497 и WO 2014/139596, каждая из которых является тем самым включенной посредством ссылки во всей ее полноте.In addition, the development of a variety of reversible protecting groups and methods for deprotecting them under DNA-compatible conditions has previously been described in International Application Publications No. WO 2004/018497 and WO 2014/139596, each of which is hereby incorporated by reference in its entirety .
КРАТКОЕ ИЗЛОЖЕНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION
Некоторые воплощения настоящего раскрытия относятся к нуклеотиду или нуклеозиду, содержащему рибозу или дезоксирибозу, имеющую удаляемую 3’-ОН защитную или блокирующую группу, образующую структуру ковалентно присоединенную к атому 3’-углерода, в которой:Some embodiments of the present disclosure provide a nucleotide or nucleoside containing ribose or deoxyribose having a 3'-OH leaving protecting or blocking group forming the structure covalently attached to the 3' carbon atom, in which:
каждый R1a и R1b независимо представляет собой Н, С1-С6 алкил, С1-С6 галогеналкил, С1-С6 алкокси, С1-С6 галогеналкокси, циано, галоген, возможно замещенный фенил или возможно замещенный аралкил;each R 1a and R 1b independently represents H, C 1 -C 6 alkyl, C 1 -C 6 haloalkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkoxy, cyano, halogen, optionally substituted phenyl or optionally substituted aralkyl ;
каждый R2a и R2b независимо представляет собой Н, С1-С6 алкил, С1-С6 галогеналкил, циано или галоген;each R 2a and R 2b independently represents H, C 1 -C 6 alkyl, C 1 -C 6 haloalkyl, cyano or halogen;
в качестве альтернативы, R1a и R2a, наряду с атомами, к которым они присоединяются, образуют возможно замещенную пяти-восьмичленную гетеро цикл ильную группу;alternatively, R 1a and R 2a , along with the atoms to which they are attached, form an optionally substituted five to eight membered heterocyclyl group;
R3 представляет собой Н, возможно замещенный С2-С6 алкенил, возможно замещенный С3-С7 циклоалкенил, возможно замещенный С2-С6 алкинил или возможно замещенный (С1-С6 алкилен)Si(R4)3; иR 3 is H, optionally substituted C 2 -C 6 alkenyl, optionally substituted C 3 -C 7 cycloalkenyl, optionally substituted C 2 -C 6 alkynyl or optionally substituted (C 1 -C 6 alkylene)Si(R 4 ) 3 ; And
каждый R4 независимо представляет собой Н, С1-С6 алкил или возможно замещенный С6-С10 арил. В некоторых воплощениях, когда каждый R1a и R1b представляет собой Н или C1-C6 алкил, оба R2a и R2b представляют собой Н, тогда R3 представляет собой замещенный С2-С6 алкенил, возможно замещенный С3-С7 циклоалкенил, возможно замещенный С2-С6 алкинил или возможно замещенный (C1-C6 алкилен)Si(R4)3. В некоторых воплощениях, когда каждый R1a, R1b, R2a и R2b представляет собой Н, тогда R3 не является Н.each R 4 independently represents H, C 1 -C 6 alkyl or optionally substituted C 6 -C 10 aryl. In some embodiments, when R 1a and R 1b are each H or C 1 -C 6 alkyl, both R 2a and R 2b are H, then R 3 is substituted C 2 -C 6 alkenyl, optionally substituted C 3 - C 7 cycloalkenyl, optionally substituted C 2 -C 6 alkynyl or optionally substituted (C 1 -C 6 alkylene)Si(R 4 ) 3 . In some embodiments, when R1a , R1b , R2a , and R2b are each H, then R3 is not H.
Некоторые воплощения настоящего раскрытия относятся к нуклеозиду или нуклеотиду, содержащему рибозу или дезоксирибозу, имеющую удаляемую блокирующую 3’-ОН группу, образующую структуру ковалентно присоединенную к 3’-атому углерода, в которой:Some embodiments of the present disclosure provide a nucleoside or nucleotide containing ribose or deoxyribose having a removable 3'-OH blocking group forming the structure covalently attached to the 3' carbon atom, in which:
каждый из R5 и R6 независимо представляет собой Н, С1-С6 алкил, С2-С6 алкенил, С2-С6 алкинил, С1-С6 галогеналкил, С2-С8 алкоксиалкил, возможно замещенный -(СН2)m-фенил, возможно замещенныйeach of R 5 and R 6 independently represents H, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 1 -C 6 haloalkyl, C 2 -C 8 alkoxyalkyl, optionally substituted - (CH 2 ) m -phenyl, possibly substituted
-(СН2)n-(5 или 6-членный гетероарил), возможно замещенный-(СН2)k-С3-С7 карбоциклил или возможно замещенный -(СН2)р-(3-7-членный гетероциклил);-(SN2)n-(5 or 6 membered heteroaryl), possibly substituted-(CH2)k-WITH3-WITH7 carbocyclyl or possibly substituted -(CH2)R-(3-7 membered heterocyclyl);
каждый из -(СН2)m-, -(СН2)n- -(СН2)k- и -(СН2)p- является возможно замещенным; иeach of -(CH 2 ) m -, -(CH 2 ) n - -(CH 2 ) k - and -(CH 2 ) p - is optionally substituted; And
каждый из m, n, k и р независимо представляет собой 0, 1, 2, 3 или 4.m, n, k, and p are each independently 0, 1, 2, 3, or 4.
Некоторые воплощения настоящего раскрытия относятся к олигонуклеотиду или полинуклеотиду, содержащему 3’-ОН-блокированную молекулу нуклеотида, описанную в данном документе.Some embodiments of the present disclosure relate to an oligonucleotide or polynucleotide containing a 3'-OH-blocked nucleotide molecule described herein.
Некоторые воплощения настоящего раскрытия относятся к способу получения растущего полинуклеотида, комплементарного целевому одноцепочечному полинуклеотиду, в реакции секвенирования, включающему включение молекулы нуклеотида, описанной в данном документе, в растущий комплементарный поли нуклеотид, где включение данного нуклеотида предотвращает введение любого последующего нуклеотида в растущий комплементарный полинуклеотид. В некоторых воплощениях включение данного нуклеотида осуществляется полимеразой, терминальной дезоксинуклеотидилтрансферазой (TdT) или обратной транскриптазой. В одном воплощении включение осуществляется полимеразой (например, ДНК-полимеразой).Some embodiments of the present disclosure relate to a method of producing a growing polynucleotide complementary to a target single-stranded polynucleotide in a sequencing reaction comprising incorporating a nucleotide molecule described herein into a growing complementary polynucleotide, wherein inclusion of the nucleotide prevents the introduction of any subsequent nucleotide into the growing complementary polynucleotide. In some embodiments, the incorporation of a given nucleotide is accomplished by a polymerase, terminal deoxynucleotidyl transferase (TdT), or reverse transcriptase. In one embodiment, the incorporation is accomplished by a polymerase (eg, DNA polymerase).
Некоторые другие воплощения настоящего раскрытия относятся к способу определения последовательности целевого одноцепочечного полинуклеотида, включающему:Certain other embodiments of the present disclosure provide a method for determining the sequence of a target single-stranded polynucleotide, comprising:
(a) включение нуклеотида, содержащего 3’-ОН блокирующую группу и выявляемую метку, как описано в данном документе, в копию полинуклеотидной цепи, комплементарной по меньшей мере части целевой полинуклеотидной цепи;(a) incorporating a nucleotide containing a 3'-OH blocking group and a detectable tag as described herein into a copy of the polynucleotide chain complementary to at least a portion of the target polynucleotide chain;
(b) выявление идентичности нуклеотида, включенного в копию полинуклеотидной цепи; и(b) identifying the identity of a nucleotide included in a copy of the polynucleotide chain; And
(с) химическое удаление метки и 3’-ОН блокирующей группы из нуклеотида, включенного в копию полинуклеотидной цепи.(c) chemical removal of the tag and 3'-OH blocking group from a nucleotide included in a copy of the polynucleotide chain.
В некоторых воплощениях способ секвенирования дополнительно включает (d) отмывку химически удаленных метки и 3'-блокирующей группы от копии полинуклеотидной цепи. В некоторых воплощениях такая стадия отмывки также удаляет не включенные нуклеотиды. В некоторых таких воплощениях 3'-блокирующая группа и выявляемая метка включенного нуклеотида удаляются перед введением следующего комплементарного нуклеотида. В некоторых других воплощениях 3’-блокирующая группа и выявляемая метка удаляются в одной стадии химической реакции. В некоторых воплощениях последовательное включение, описанное в данном документе, проводится по меньшей мере 50 раз, по меньшей мере 100 раз, по меньшей мере 150 раз, по меньшей мере 200 раз или по меньшей мере 250 раз.In some embodiments, the sequencing method further comprises (d) washing the tag and 3' blocking group chemically removed from a copy of the polynucleotide chain. In some embodiments, this washing step also removes unincorporated nucleotides. In some such embodiments, the 3' blocking group and detectable tag of the included nucleotide are removed before the introduction of the next complementary nucleotide. In some other embodiments, the 3' blocking group and the detectable tag are removed in a single chemical reaction step. In some embodiments, the sequential actuation described herein is performed at least 50 times, at least 100 times, at least 150 times, at least 200 times, or at least 250 times.
Некоторые другие воплощения настоящего раскрытия относятся к наборам, содержащим целый ряд молекул нуклеотидов или нуклеозидов, описанных в данном документе, и их упаковочные материалы. Нуклеотиды, нуклеозиды, олигонуклеотиды или наборы, которые излагаются в данном документе, могут использоваться для выявления, измерения или идентификации биологической системы (включая, например, ее процессы и компоненты). Типичные методики, в которых могут использоваться нуклеотиды, олигонуклеотиды или наборы, включают секвенирование, анализ экспрессии, анализ гибридизации, генетический анализ, анализ РНК, клеточный анализ (например, связывание с клеткой или анализ клеточной функции) или анализ белка (например, анализ связывания белка или анализ активности белка). Данное применение может осуществляться на автоматическом приборе для выполнения конкретной методики, таком как автоматический секвенатор. Секвенатор может содержать два или более чем два лазера, работающих при разных длинах волн, для различения между разными выявляемыми метками.Certain other embodiments of the present disclosure provide kits containing a variety of nucleotide or nucleoside molecules described herein and packaging materials therefor. The nucleotides, nucleosides, oligonucleotides or kits that are set forth herein can be used to detect, measure or identify a biological system (including, for example, its processes and components). Typical techniques in which nucleotides, oligonucleotides or kits may be used include sequencing, expression analysis, hybridization analysis, genetic analysis, RNA analysis, cellular analysis (eg, cell binding or cell function assay), or protein analysis (eg, protein binding assay or protein activity assay). This application can be carried out on an automatic instrument for performing a specific technique, such as an automatic sequencer. The sequencer may contain two or more than two lasers operating at different wavelengths to distinguish between different detectable marks.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВBRIEF DESCRIPTION OF GRAPHIC MATERIALS
ФИГ. 1 представляет собой график, иллюстрирующий стабильность разных 3' блокированных нуклеотидов как функцию времени в буферном растворе при 65°С.FIG. 1 is a graph illustrating the stability of various 3' blocked nucleotides as a function of time in buffer solution at 65°C.
ФИГ. 2А представляет собой график, иллюстрирующий процентную долю (%) остающегося нуклеотида (исходное вещество) как функцию времени при сравнении скорости деблокирования нуклеотида с 3’-АОМ блокирующей группой с нуклеотидом с 3’-О-азидометильной (-CH2N3) блокирующей группой в растворе.FIG. 2A is a graph illustrating the percentage (%) of nucleotide (starting material) remaining as a function of time when comparing the rate of unblocking of a nucleotide with a 3'-AOM blocking group with a nucleotide with a 3'-O-azidomethyl (-CH 2 N 3 ) blocking group in solution.
ФИГ. 2В представляет собой график, иллюстрирующий процентную долю (%) 3' деблокированных нуклеотидов как функцию времени при сравнении скорости деблокирования 3' блокированных нуклеотидов с разными ацетальными блокирующими группами в растворе.FIG. 2B is a graph illustrating the percentage (%) of 3' unblocked nucleotides as a function of time when comparing the rate of unblocking of 3' blocked nucleotides with different acetal blocking groups in solution.
ФИГ. 3А и 3В иллюстрируют результаты секвенирования на приборе Illumina MiniSeq® с использованием полностью функционализированных нуклеотидов (ffN) с 3’-АОМ блокирующей группой в смеси для включения.FIG. 3A and 3B illustrate sequencing results on an Illumina MiniSeq® instrument using fully functionalized nucleotides (ffN) with a 3'-AOM blocking group in the inclusion mixture.
ФИГ. 3С иллюстрирует показатель ошибки секвенирования с использованием полностью функционализированных нуклеотидов (ffN) с 3’-АОМ блокирующей группой в смеси для включения по сравнению со стандартными ffN с 3’-О-азидометильной блокирующей группой.FIG. 3C illustrates the sequencing error rate using fully functionalized nucleotides (ffN) with a 3'-AOM blocking group in the inclusion mixture compared to standard ffNs with a 3'-O-azidomethyl blocking group.
ФИГ. 4А и 4В каждая иллюстрирует сравнение первичных показателей секвенирования, включающих фазирование, предфазирование и показатель ошибок, с использованием полностью функционализированных нуклеотидов с 3’-АОМ и 3’-О-азидометильными блокирующими группами с использованием двух разных ДНК-полимераз (Pol 812 и Pol 1901) соответственно.FIG. 4A and 4B each illustrate a comparison of raw sequencing metrics including phasing, prephasing, and error rates using fully functionalized nucleotides with 3'-AOM and 3'-O-azidomethyl blocking groups using two different DNA polymerases (Pol 812 and Pol 1901 ) respectively.
ФИГ. 5 представляет собой график, иллюстрирующий стабильность секвенирования полностью функционализированных нуклеотидов с 3’-АОМ и 3’-О-азидометильными блокирующими группами как функцию времени в буферном растворе при 45°С.FIG. 5 is a graph illustrating the sequencing stability of fully functionalized nucleotides with 3'-AOM and 3'-O-azidomethyl blocking groups as a function of time in buffer solution at 45°C.
ФИГ. 6 представляет собой график, иллюстрирующий стабильность нуклеозидов с разными 3' блокирующими группами как функцию времени в буферном растворе при 65°С.FIG. 6 is a graph illustrating the stability of nucleosides with different 3' blocking groups as a function of time in buffer solution at 65°C.
ФИГ. 7 представляет собой график, иллюстрирующий процентную долю (%) остающегося 3' блокированного нуклеотида как функцию времени при сравнении скорости расщепления (деблокирования) тиокарбаматной 3' блокирующей группы диметилтиокарбамата (DMTC) при двух разных условиях (Oxone® или NaIO4) со скоростью расщепления 3’-О-азидометильной (3'-O-CH2N3) блокирующей группы.FIG. 7 is a graph illustrating the percentage (%) of 3' blocked nucleotide remaining as a function of time when comparing the rate of cleavage (deblocking) of the dimethylthiocarbamate (DMTC) thiocarbamate 3' blocking group under two different conditions (Oxone® or NaIO 4 ) with the rate of cleavage 3 '-O-azidomethyl (3'-O-CH 2 N 3 ) blocking group.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION
Воплощения настоящего раскрытия относятся к нуклеозидам и нуклеотидам с 3’-ОН ацетальной или тиокарбаматной блокирующими группами для приложений секвенирования, например, секвенирования посредством синтеза (SBS). Данные блокирующие группы обеспечивают лучшую стабильность в растворе по сравнению с блокирующими группами, известными в данной области. В частности, 3’-ОН блокирующие группы имеют улучшенную стабильность во время синтеза полностью функционализированных нуклеотидов (ffN) и также большую стабильность в растворе во время приготовления в виде препарата, хранения и действия на секвенаторах. Кроме того, с 3’-ОН блокирующими группами, описанными в данном документе, также могут достигаться низкое предфазирование, меньшее угасание сигнала для улучшенного качества данных, что обеспечивает более длинные считываемые фрагменты из приложений секвенирования.Embodiments of the present disclosure relate to nucleosides and nucleotides with 3'-OH acetal or thiocarbamate blocking groups for sequencing applications, such as sequencing by synthesis (SBS). These blocking groups provide better stability in solution compared to blocking groups known in the art. In particular, 3'-OH blocking groups have improved stability during the synthesis of fully functionalized nucleotides (ffN) and also greater stability in solution during formulation, storage, and operation on sequencers. Additionally, with the 3'-OH blocking groups described herein, low prephasing, less signal decay for improved data quality can also be achieved, enabling longer reads from sequencing applications.
ОпределенияDefinitions
Если не определено иначе, все технические и научные термины, использованные в данном документе, имеют такое значение, которое является общедоступным для обычного специалиста в данной области. Применение термина «включающий», а также других форм, таких как «включают», «включает» и «включенный», не является ограничивающим. Применение термина «имеющий», а также других форм, таких как «имеют», «имеет» и «имел», не является ограничивающим. Термины «содержат(жит)» и «содержащий» в том виде, в котором они используются в данном описании изобретения, независимо оттого, в переходной фразе или в отличительной части формулы изобретения, следует интерпретировать как имеющие неограничивающее значение. То есть, приведенные выше термины следует интерпретировать синонимично с фразами «имеющий по меньшей мере» или «включающий по меньшей мере». Например, при использовании в контексте способа, термин «содержащий» означает то, что данный способ включает по меньшей мере перечисленные этапы, но может включать дополнительные этапы. При использовании в контексте соединения, композиции или устройства термин «содержащий» означает то, что соединение, композиция или устройство включает по меньшей мере перечисленные характеристики или компоненты, но также может включать дополнительные характеристики или компоненты.Unless otherwise defined, all technical and scientific terms used herein have the meaning that is within the meaning of ordinary skill in the art. The use of the term “including,” as well as other forms such as “include,” “includes,” and “included,” is not intended to be limiting. The use of the term “having”, as well as other forms such as “have”, “has” and “had”, is not limiting. The terms “comprise” and “comprising” as used in this specification, whether in a transitional phrase or a distinctive portion of the claims, are to be interpreted as having a non-limiting meaning. That is, the above terms should be interpreted synonymously with the phrases “having at least” or “including at least.” For example, when used in the context of a method, the term “comprising” means that the method includes at least the listed steps, but may include additional steps. When used in the context of a compound, composition, or device, the term “comprising” means that the compound, composition, or device includes at least the listed features or components, but may also include additional features or components.
В том виде, в котором они используются в данном документе, обычные сокращения органических соединений определяются следующим образом:As used herein, the usual abbreviations for organic compounds are defined as follows:
Термин «чип» в том виде, в котором он используется в данном документе, относится к популяции разных молекул-зондов, которые присоединяются к одному или более чем одному субстрату, таким образом, что разные молекулы-зонды могут быть дифференцированы друг от друга согласно относительному положению. Чип может включать разные молекулы-зонды, каждая из которых располагается в отличном адресуемом месте на субстрате. Альтернативно или дополнительно, чип может включать отельные субстраты, причем каждый несет отличную молекулу-зонд, где разные молекулы-зонды могут быть идентифицированы согласно положениям субстратов на поверхности, к которой присоединяются субстраты, или согласно положениям субстратов в жидкости. Типичные чипы, в которых отдельные субстраты располагаются на поверхности, включают, без ограничения, чипы, включающие шарики в лунках, как описано, например, в патенте США №6355431 В1, US 2002/0102578 и публикации РСТ № WO 00/63437. Типичные форматы, которые можно использовать в данном изобретении для различения шариков в жидком чипе, например, с использованием микроструйного прибора, такого как сортер флуоресцентно активированных клеток (FACS), описываются, например, в патенте США №6524793. Другие примеры чипов, которые можно использовать в данном изобретении, включают, без ограничения, чипы, описанные в патентах США №5429807; 5436327; 5561071; 5583211; 5658734; 5837858; 5874219; 5919523; 6136269; 6287768; 6287776; 6288220; 6297006; 6291193; 6346413; 6416949; 6482591; 6514751 и 6610482; и WO 93/17126; WO 95/11995; WO 95/35505; ЕР 742287; и ЕР 799897.The term "chip" as used herein refers to a population of different probe molecules that are attached to one or more than one substrate, such that the different probe molecules can be differentiated from each other according to relative position. The chip may include different probe molecules, each positioned at a distinct addressable location on the substrate. Alternatively or additionally, the chip may include separate substrates, each carrying a different probe molecule, where the different probe molecules can be identified according to the positions of the substrates on the surface to which the substrates are attached, or according to the positions of the substrates in the liquid. Typical chips in which individual substrates are disposed on a surface include, but are not limited to, chips comprising beads in wells, as described, for example, in US Pat. No. 6,355,431 B1, US 2002/0102578 and PCT Publication No. WO 00/63437. Typical formats that can be used in this invention to distinguish beads in a liquid chip, for example, using a microfluidic device such as a fluorescence activated cell sorter (FACS), are described, for example, in US patent No. 6524793. Other examples of chips that can be used in this invention include, but are not limited to, those described in US Pat. No. 5,429,807; 5436327; 5561071; 5583211; 5658734; 5837858; 5874219; 5919523; 6136269; 6287768; 6287776; 6288220; 6297006; 6291193; 6346413; 6416949; 6482591; 6514751 and 6610482; and WO 93/17126; WO 95/11995; WO 95/35505; EP 742287; and EP 799897.
Термин «ковалентно присоединенный» или «ковалентно связанный» в том виде, в котором он используется в данном документе, относится к образованию химического связывания, которое отличается обобществлением пар электронов между атомами. Например, ковалентно присоединенное полимерное покрытие относится к полимерному покрытию, которое образует химические связи с функционализированной поверхностью субстрата, по сравнению с присоединением к поверхности посредством других способов, например, адгезии или электростатического взаимодействия. Будет понятно то, что полимеры, которые ковалентно присоединяются к поверхности, также могут быть связаны посредством других способов, помимо ковалентного присоединения.The term "covalently attached" or "covalently bonded" as used herein refers to the formation of a chemical bond that is characterized by the sharing of pairs of electrons between atoms. For example, a covalently attached polymer coating refers to a polymer coating that forms chemical bonds with the functionalized surface of a substrate, as opposed to attaching to the surface through other means, such as adhesion or electrostatic interaction. It will be appreciated that polymers that are covalently attached to a surface may also be linked by means other than covalent attachment.
Любая(бые) группа(пы) «R» в том виде, в котором данный термин используется в данном документе, представляет заместители, которые могут быть присоединены к указанному атому. Группа R может быть замещенной или незамещенной. Если две группы «R» описываются как «вместе с атомами, к которым они присоединяются» формирующие кольцо или кольцевую систему, это означает то, что совокупным блоком атомов, расположенных между связей и двух групп R является описанное кольцо. Например, при наличии следующей подструктуры:Any "R" group(s) as the term is used herein represents substituents that can be attached to the indicated atom. The R group may be substituted or unsubstituted. If two "R" groups are described as "together with the atoms to which they are attached" forming a ring or ring system, this means that the aggregate block of atoms located between the bonds and two R groups is the described ring. For example, given the following substructure:
и R1, и R2 определяются как выбранные из группы, состоящей из водорода и алкила, или R1 и R2 совместно с атомами, к которым они присоединяются, образуют арил или карбоциклил, это означает то, что R1 и R2 могут быть выбраны из водорода или алкила, или альтернативно, данная подструктура имеет структуру:both R 1 and R 2 are defined as being selected from the group consisting of hydrogen and alkyl, or R 1 and R 2 together with the atoms to which they are added form aryl or carbocyclyl, which means that R 1 and R 2 can be selected from hydrogen or alkyl, or alternatively, the given substructure has the structure:
где А представляет собой арильное кольцо или карбоциклил, содержащий указанную двойную связь.where A represents an aryl ring or a carbocyclyl containing said double bond.
Следует понимать то, что определенные соглашения по названию радикалов могут включать либо монорадикал, либо дирадикал, в зависимости от контекста. Например, в случае, где заместитель требует две точки присоединения к остальной молекуле, понятно то, что данный заместитель представляет собой дирадикал. Например, заместитель, идентифицированный как алкил, который требует две точки присоединения, включает дирадикалы, такие как -СН2- -СН2СН2-, -СН2СН(СН3)СН2- и тому подобные. Другие соглашения по наименованию радикалов ясно указывают то, что данный радикал представляет собой дирадикал, такой как «алкилен» или «алкенилен».It should be understood that certain radical naming conventions may include either a monoradical or a diradical, depending on the context. For example, in the case where a substituent requires two points of attachment to the rest of the molecule, it is clear that the substituent is a diradical. For example, a substituent identified as alkyl that requires two points of attachment includes diradicals such as -CH 2 - -CH 2 CH 2 -, -CH 2 CH(CH 3 )CH 2 - and the like. Other radical naming conventions clearly indicate that the radical is a diradical such as "alkylene" or "alkenylene".
Термин «галоген» или «галоген-» в том виде, в котором он используется в данном документе, означает любой из радиоактивно стабильных атомов столбца 7 Периодической таблицы элементов, например, фтор, хлор, бром или йод, причем фтор и хлор являются предпочтительными.The term “halogen” or “halo-” as used herein means any of the radioactively stable atoms in column 7 of the Periodic Table of the Elements, such as fluorine, chlorine, bromine or iodine, with fluorine and chlorine being preferred.
Термин «от Са до Cb», в котором «а» и «b» представляют собой целые числа, в том виде, в котором он используется в данном документе, относится к числу атомов углерода в алкильной, алкенильной или алкинильной группе, или к числу атомов кольца циклоалкильной или арильной группы. То есть, данный алкил, алкенил, алкинил, кольцо циклоалкила и кольцо арила может содержать от «а» до «b» включительно атомов углерода. Например, «С1-С4 алкильная» группа относится ко всем алкильным группам, имеющим от 1 до 4 углеродов, то есть, СН3-, СН3СН2-, СН3СН2СН2-, (СН3)2СН-, СН3СН2СН2СН2-, СН3СН2СН(СН3)- и (СН3)3С-; С3-С4 циклоалкильная группа относится ко всем циклоалкильным группам, имеющим от 3 до 4 атомов углерода, то есть, циклопропильной и циклобутильной. Аналогичным образом, «4-6-членная гетероциклильная» группа относится ко всем гетеро цикл ильным группам с 4-6 общими атомами кольца, например, к азетидину, оксэтану, оксазолину, пирролидину, пиперидину, пиперазину, морфолину и тому подобным. Если не обозначены «а» и «b» по отношению к алкильной, алкенильной, алкинильной, циклоалкильной или арильной группе, следует предполагать самый широкий интервал, описываемый в данных определениях. Термин «С1-С6» в том виде, в котором он используется в данном документе, включает С1, С2, С3, С4, С5 и С6, и интервал, определенный любыми двумя данными числами. Например, С1-С6 алкил включает С1, С2, С3, С4, С5 и С6 алкил, С2-С6 алкил, С1-С3 алкил и т.д. Аналогичным образом, С2-С6 алкенил включает С2, С3, С4, С5 и С6 алкенил, С2-С5 алкенил, С3-С4 алкенил и т.д.; и С2-С6 алкинил включает С2, С3, С4, С5 и С6 алкинил, С2-С5 алкинил, С3-С4 алкинил и т.д. Каждый С3-С8 циклоалкил включает углеводородное кольцо, содержащее 3, 4, 5, 6, 7 и 8 атомов углерода, или интервал, определенный любыми двумя числами, как, например, С3-С7 циклоалкил или С5-С6 циклоалкил.The term "C a to C b ", in which "a" and "b" are integers, as used herein, refers to the number of carbon atoms in an alkyl, alkenyl or alkynyl group, or to the number of ring atoms of the cycloalkyl or aryl group. That is, a given alkyl, alkenyl, alkynyl, cycloalkyl ring and aryl ring may contain from “a” to “b”, inclusive, carbon atoms. For example, "C 1 -C 4 alkyl" group refers to all alkyl groups having from 1 to 4 carbons, that is, CH 3 -, CH 3 CH 2 -, CH 3 CH 2 CH 2 -, (CH 3 ) 2 CH-, CH 3 CH 2 CH 2 CH 2 -, CH 3 CH 2 CH(CH 3 )- and (CH 3 ) 3 C-; The C 3 -C 4 cycloalkyl group refers to all cycloalkyl groups having from 3 to 4 carbon atoms, that is, cyclopropyl and cyclobutyl. Likewise, a “4-6 membered heterocyclyl” group refers to all heterocyclyl groups with 4-6 common ring atoms, for example, azetidine, oxetane, oxazoline, pyrrolidine, piperidine, piperazine, morpholine and the like. Unless "a" and "b" are indicated with respect to an alkyl, alkenyl, alkynyl, cycloalkyl or aryl group, the widest range described in these definitions should be assumed. The term "C 1 -C 6 " as used herein includes C 1 , C 2 , C 3 , C 4 , C 5 and C 6 , and the interval defined by any two of these numbers. For example, C 1 -C 6 alkyl includes C 1 , C 2 , C 3 , C 4 , C 5 and C 6 alkyl, C 2 -C 6 alkyl, C 1 -C 3 alkyl, etc. Likewise, C 2 -C 6 alkenyl includes C 2 , C 3 , C 4 , C 5 and C 6 alkenyl, C 2 -C 5 alkenyl, C 3 -C 4 alkenyl, etc.; and C 2 -C 6 alkynyl includes C 2 , C 3 , C 4 , C 5 and C 6 alkynyl, C 2 -C 5 alkynyl, C 3 -C 4 alkynyl, etc. Each C 3 -C 8 cycloalkyl includes a hydrocarbon ring containing 3, 4, 5, 6, 7 and 8 carbon atoms, or a range defined by any two numbers, such as C 3 -C 7 cycloalkyl or C 5 -C 6 cycloalkyl.
Термин «алкил» в том виде, в котором он используется в данном документе, относится к прямой или разветвленной углеводородной цепи, которая является полностью насыщенной (т.е. не содержит двойные или тройные связи). Алкильная группа может иметь от 1 до 20 атомов углерода (числовое значение, такое как «от 1 до 20» всякий раз, когда оно появляется в данном документе, относится к каждому целому числу в данном интервале, например, «от 1 до 20 атомов углерода» означает то, что алкильная группа может состоять из 1 атома углерода, 2 атомов углерода, 3 атомов углерода и т.д., вплоть до и включая 20 атомов углерода, хотя настоящее определение также охватывает появление термина «алкил», где не обозначается числовой интервал). Алкильная группа также может представлять собой алкил среднего размера, имеющий от 1 до 9 атомов углерода. Алкильная группа также могла бы представлять собой низший алкил, имеющий от 1 до 6 атомов углерода. Алкильная группа может быть обозначена как «С1-С4алкил» или аналогичными обозначениями. Лишь в качестве примера, «С1-С6алкил» указывает то, что в алкильной цепи имеется от одного до шести атомов углерода, т.е. алкильная цепь выбрана из группы, состоящей из метила, этила, пропила, изопропила, н-бутила, изобутила, втор-бутила и трет-бутила. Типичные алкильные группы включают метил, этил, пропил, изопропил, бутил, изобутил, третичный бутил, пентил, гексил и тому подобные, но ни в коей мере не ограничиваются ими.The term "alkyl" as used herein refers to a straight or branched hydrocarbon chain that is fully saturated (ie, does not contain double or triple bonds). An alkyl group may have from 1 to 20 carbon atoms (a numerical value such as "1 to 20" whenever it appears herein refers to each integer in the range, e.g. "1 to 20 carbon atoms " means that an alkyl group may consist of 1 carbon atom, 2 carbon atoms, 3 carbon atoms, etc., up to and including 20 carbon atoms, although this definition also covers the occurrence of the term "alkyl" where no numerical designation is given interval). The alkyl group may also be a medium-sized alkyl having from 1 to 9 carbon atoms. The alkyl group could also be lower alkyl having from 1 to 6 carbon atoms. An alkyl group may be designated "C 1 -C 4 alkyl" or similar designations. By way of example only, "C 1 -C 6 alkyl" indicates that the alkyl chain has from one to six carbon atoms, i.e. the alkyl chain is selected from the group consisting of methyl, ethyl, propyl, isopropyl, n-butyl, isobutyl, sec-butyl and tert-butyl. Typical alkyl groups include, but are not in any way limited to, methyl, ethyl, propyl, isopropyl, butyl, isobutyl, tertiary butyl, pentyl, hexyl, and the like.
Термин «алкокси» в том виде, в котором он используется в данном документе, относится к формуле -OR, в которой R представляет собой алкил, как определяется выше, как, например, «С1-С9 алкокси», включая метокси, этокси, н-пропокси, 1-метилэтокси (изопропокси), н-бутокси, изобутокси, втор-бутокси и трет-бутокси, и тому подобные, но не ограничиваясь ими.The term "alkoxy" as used herein refers to the formula -OR in which R is alkyl as defined above, such as "C 1 -C 9 alkoxy", including methoxy, ethoxy , n-propoxy, 1-methylethoxy (isopropoxy), n-butoxy, isobutoxy, sec-butoxy and tert-butoxy, and the like, but not limited to.
Термин «алкенил» в том виде, в котором он используется в данном документе, относится к прямой или разветвленной углеводородной цепи, содержащей одну или более чем одну двойную связь. Данная алкенильная группа может иметь от 2 до 20 атомов углерода, хотя настоящее определение также охватывает появление термина «алкенил», где числовой интервал не обозначается. Алкенильная группа также может представлять собой алкенил среднего размера, имеющий от 2 до 9 атомов углерода. Алкенильная группа также могла бы быть низшим алкенилом, имеющим от 2 до 6 атомов углерода. Алкенильная группа может быть обозначена как «С2-С6 алкенил» или аналогичными обозначениями. Лишь в качестве примера, «С2-С6 алкенил» указывает на то, что в алкенильной цепи имеется от двух до шести атомов углерода, т.е. данная алкенильная цепь выбрана из группы, состоящей из этенила, пропен-1-ила, пропен-2-ила, пропен-3-ила, бутен-1-ила, бутен-2-ила, бутен-3-ила, бутен-4-ила, 1-метил-пропен-1-ила, 2-метил-пропен-1-ила, 1-этил-этен-1-ила, 2-метил-пропен-3-ила, бута-1,3-диенила, бута-1,2-диенила и бута-1,2-диен-4-ила.The term "alkenyl" as used herein refers to a straight or branched hydrocarbon chain containing one or more double bonds. A given alkenyl group may have from 2 to 20 carbon atoms, although the present definition also covers the occurrence of the term "alkenyl" where no numerical range is designated. The alkenyl group may also be a medium sized alkenyl group having from 2 to 9 carbon atoms. The alkenyl group could also be lower alkenyl, having from 2 to 6 carbon atoms. An alkenyl group may be designated "C 2 -C 6 alkenyl" or similar designations. By way of example only, “C 2 -C 6 alkenyl” indicates that the alkenyl chain has from two to six carbon atoms, i.e. the alkenyl chain is selected from the group consisting of ethenyl, propen-1-yl, propen-2-yl, propen-3-yl, buten-1-yl, buten-2-yl, buten-3-yl, buten-4 -yl, 1-methyl-propen-1-yl, 2-methyl-propen-1-yl, 1-ethyl-ethen-1-yl, 2-methyl-propen-3-yl, buta-1,3-dienyl , buta-1,2-dienyl and buta-1,2-dien-4-yl.
Типичные алкенильные группы включают, но ни к коей мере не ограничиваются этенилом, пропенилом, бутенилом, пентенилом и гексенилом, и тому подобными.Typical alkenyl groups include, but are in no way limited to ethenyl, propenyl, butenyl, pentenyl and hexenyl, and the like.
Термин «алкинил» в том виде, в котором он используется в данном документе, относится к прямой или разветвленной углеводородной цепи, содержащей одну или более чем одну тройную связь. Данная алкинильная группа может иметь от 2 до 20 атомов углерода, хотя настоящее определение также охватывает появление термина «алкинил», где не обозначается числовой интервал. Алкинильная группа также может представлять собой алкинил среднего размера, имеющий от 2 до 9 атомов углерода. Алкинильная группа также могла бы быть низшим алкинилом, имеющим от 2 до 6 атомов углерода. Алкинильная группа может быть обозначена как «С2-С6 алкинил» или аналогичными обозначениями. Лишь в качестве примера, «С2-С6 алкинил» указывает на то, что в алкинильной цепи имеется от двух до шести атомов углерода, т.е. данная алкинильная цепь выбрана из группы, состоящей из этинила, пропин-1-ила, пропин-2-ила, бутин-1-ила, бутин-3-ила, бутин-4-ила и 2-бутинила. Типичные алкинильные группы включают, но ни к коей мере не ограничиваются этинилом, пропинилом, бутинилом, пентинилом и гексинилом, и тому подобными.The term "alkynyl" as used herein refers to a straight or branched hydrocarbon chain containing one or more triple bonds. A given alkynyl group may have from 2 to 20 carbon atoms, although the present definition also covers the occurrence of the term "alkynyl" where no numerical range is indicated. The alkynyl group may also be a medium sized alkynyl group having from 2 to 9 carbon atoms. The alkynyl group could also be a lower alkynyl group having from 2 to 6 carbon atoms. An alkynyl group may be designated "C 2 -C 6 alkynyl" or similar designations. By way of example only, "C 2 -C 6 alkynyl" indicates that the alkynyl chain has from two to six carbon atoms, i.e. the alkynyl chain is selected from the group consisting of ethynyl, propyn-1-yl, propyn-2-yl, butyn-1-yl, butyn-3-yl, butyn-4-yl and 2-butynyl. Typical alkynyl groups include, but are by no means limited to, ethynyl, propynyl, butynyl, pentynyl and hexynyl, and the like.
Термин «гетероалкил» в том виде, в котором он используется в данном документе, относится к прямой или разветвленной углеводородной цепи, содержащей один или более чем один гетероатом, то есть, отличный от углерода элемент в остове цепи, включающий азот, кислород и серу, но не ограничивающийся ими. Гетероалкильная группа может иметь от 1 до 20 атомов углерода, хотя настоящее определение также охватывает появление термина «гетероалкил», где не обозначается числовой интервал. Гетероалкильная группа также может представлять собой гетероалкил среднего размера, имеющий от 1 до 9 атомов углерода. Данная гетероалкильная группа также могла бы быть низшим гетероалкилом, имеющим от 1 до 6 атомов углерода. Данная гетероалкильная группа может быть обозначена «С1-С6 гетероалкил» или аналогичными обозначениями. Данная гетероалкильная группа может содержать один или более чем один гетероатом. Лишь в качестве примера, «С4-С6 гетероалкил» указывает то, что имеется от четырех до шести атомов углерода в гетероалкильной цепи и дополнительно один или более чем один гетероатом в остове цепи.The term "heteroalkyl" as used herein refers to a straight or branched hydrocarbon chain containing one or more than one heteroatom, that is, a non-carbon element in the backbone of the chain including nitrogen, oxygen and sulfur, but not limited to them. A heteroalkyl group may have from 1 to 20 carbon atoms, although the present definition also covers the occurrence of the term "heteroalkyl" where no numerical range is designated. The heteroalkyl group may also be a medium-sized heteroalkyl having from 1 to 9 carbon atoms. This heteroalkyl group could also be a lower heteroalkyl having from 1 to 6 carbon atoms. This heteroalkyl group may be designated "C 1 -C 6 heteroalkyl" or similar designations. A given heteroalkyl group may contain one or more than one heteroatom. By way of example only, "C 4 -C 6 heteroalkyl" indicates that there are four to six carbon atoms in the heteroalkyl chain and additionally one or more than one heteroatom in the backbone of the chain.
Термин «ароматический» относится к кольцу или кольцевой системе, имеющей систему конъюгированных пи-электронов, и он включает как карбоциклическую ароматическую (например, фенильную), так и гетероциклическую ароматическую группы (например, пиридин). Данный термин включает моноциклическую группу или полициклическую группу с конденсированным кольцом (т.е. кольца, которые имеют общие смежные пары атомов), при условии, что вся кольцевая система является ароматической.The term "aromatic" refers to a ring or ring system having a system of conjugated pi electrons, and it includes both carbocyclic aromatic (eg phenyl) and heterocyclic aromatic groups (eg pyridine). This term includes a monocyclic group or a polycyclic group with a fused ring (i.e., rings that share adjacent pairs of atoms), provided that the entire ring system is aromatic.
Термин «арил» в том виде, в котором он используется в данном документе, относится к ароматическому кольцу или кольцевой системе (т.е. к двум или более чем двум конденсированным кольцам, которые имеют два общих смежных атома углерода), содержащей только углерод в остове кольца. Когда арил представляет собой кольцевую систему, каждое кольцо в данной системе является ароматическим. Арильная группа может иметь от 6 до 18 атомов углерода, хотя настоящее определение также охватывает появление термина «арил», где не обозначается числовой интервал. В некоторых воплощениях арильная группа имеет от 6 до 10 атомов углерода. Данная арильная группа может быть обозначена как «С6-С10 арил», «С6 или С10 арил» или аналогичными обозначениями. Примеры арильных групп включают фенил, нафтил, азуленил и антраценил, но не ограничиваются ими.The term "aryl" as used herein refers to an aromatic ring or ring system (i.e., two or more fused rings that share two adjacent carbon atoms) containing only the carbon at the core of the ring. When aryl is a ring system, each ring in the system is aromatic. An aryl group may have from 6 to 18 carbon atoms, although the present definition also covers the occurrence of the term "aryl" where no numerical range is indicated. In some embodiments, the aryl group has from 6 to 10 carbon atoms. This aryl group may be designated "C 6 -C 10 aryl", "C 6 or C 10 aryl" or similar designations. Examples of aryl groups include, but are not limited to, phenyl, naphthyl, azulenyl, and anthracenyl.
«Аралкил» или «арилалкил» представляет собой арильную группу, присоединенную, в качестве заместителя, через алкиленовую группу, как, например, «С7-14 аралкил» и тому подобные, включающую бензил, 2-фенилэтил, 3-фенилпропил и нафтилалкил, но не ограничивающуюся ими. В некоторых случаях алкиленовая группа представляет собой низшую алкиленовую группу (т.е. С1-С6 алкиленовую группу)."Aralkyl" or "arylalkyl" is an aryl group attached, as a substituent, through an alkylene group, such as "C 7-14 aralkyl" and the like, including benzyl, 2-phenylethyl, 3-phenylpropyl and naphthylalkyl, but not limited to them. In some cases, the alkylene group is a lower alkylene group (ie, a C 1 -C 6 alkylene group).
Термин «гетероарил» в том виде, в котором он используется в данном документе, относится к ароматическому кольцу или кольцевой системе (т.е. к двум или более чем двум конденсированным кольцам, которые имеют два смежных атома), которая(рые) содержит(жат) один или более чем один гетероатом, то есть, к отличному от углерода элементу в остове кольца, включающему азот, кислород и серу, но не ограничивающемуся ими. Когда гетероарил представляет собой кольцевую систему, каждое кольцо в данной системе является ароматическим. Гетероарильная группа может иметь 5-18 членов кольца (т.е. число атомов, составляющих остов кольца, включая атомы углерода и гетероатомы), хотя настоящее определение также охватывает появление термина «гетероарил», где не обозначается числовой интервал. В некоторых воплощениях гетероарильная группа имеет от 5 до 10 членов кольца или от 5 до 7 членов кольца. Гетероарильная группа может быть обозначена как «5-7-членный гетероарил», «5-10-членный гетероарил» или аналогичными обозначениями. Примеры гетероарильных колец включают фурил, тиенил, фталазинил, пирролил, оксазолил, тиазолил, имидазолил, пиразолил, изоксазолил, изотиазолил, триазолил, тиадиазолил, пиридинил, пиридазинил, пиримидинил, пиразинил, триазинил, хинолинил, изохинолинил, бензимидазолил, бензоксазолил, бензотиазолил, индолил, изоиндолил и бензотиенил, но не ограничиваются ими.The term "heteroaryl" as used herein refers to an aromatic ring or ring system (i.e., two or more fused rings that have two adjacent atoms) which contains ( zhat) one or more than one heteroatom, that is, to an element other than carbon in the backbone of the ring, including, but not limited to, nitrogen, oxygen and sulfur. When heteroaryl is a ring system, each ring in the system is aromatic. A heteroaryl group may have 5-18 ring members (ie, the number of atoms constituting the backbone of the ring, including carbon atoms and heteroatoms), although the present definition also covers the occurrence of the term “heteroaryl” where no numerical range is indicated. In some embodiments, the heteroaryl group has from 5 to 10 ring members or from 5 to 7 ring members. A heteroaryl group may be designated "5-7 membered heteroaryl", "5-10 membered heteroaryl" or similar designations. Examples of heteroaryl rings include furyl, thienyl, phthalazinyl, pyrrolyl, oxazolyl, thiazolyl, imidazolyl, pyrazolyl, isoxazolyl, isothiazolyl, triazolyl, thiadiazolyl, pyridinyl, pyridazinyl, pyrimidinyl, pyrazinyl, triazinyl, quinolinyl, isoquinolinyl, benzimidazolyl, benzoxazolyl, benzothiazolyl, indolyl, isoindolyl and benzothienyl, but are not limited to them.
«Гетероаралкил» или «гетероарилалкил» представляет собой гетероарильную группу, соединенную, в качестве заместителя, через алкиленовую группу. Примеры включают 2-тиенилметил, 3-тиенилметил, фурилметил, тиенилэтил, пирролилалкил, пиридилалкил, изоксазоллилалкил и имидазолилалкил. В некоторых случаях алкиленовая группа представляет собой низшую алкиленовую группу (т.е. С1-С6 алкиленовую группу)."Heteroaralkyl" or "heteroarylalkyl" is a heteroaryl group linked, as a substituent, through an alkylene group. Examples include 2-thienylmethyl, 3-thienylmethyl, furylmethyl, thienylethyl, pyrrolylalkyl, pyridylalkyl, isoxazollylalkyl and imidazolylalkyl. In some cases, the alkylene group is a lower alkylene group (ie, a C 1 -C 6 alkylene group).
Термин «карбоциклил» в том виде, в котором он используется в данном документе, означает неароматическое циклическое кольцо или кольцевую систему, содержащую только атомы углерода в остове кольцевой системы. Когда карбоциклил представляет собой кольцевую систему, два или более чем два кольца могут быть связаны друг с другом конденсированным, мостиковым или спиро-соединенным способом. Карбоциклилы могут иметь любую степень насыщения, при условии, что по меньшей мере одно кольцо в данной кольцевой системе не является ароматическим. Таким образом, карбоциклилы включают циклоалкилы, циклоалкенилы и циклоалкинилы. Карбоциклильная группа может иметь от 3 до 20 атомов углерода, хотя настоящее определение также охватывает появление термина «карбоциклил», где не обозначается числовой интервал. Карбоциклильная группа также может представлять собой карбоциклил среднего размера, имеющий от 3 до 10 атомов углерода. Карбоциклильная группа также может представлять собой карбоциклил, имеющий от 3 до 6 атомов углерода. Карбоциклильная группа может быть обозначена «С3-С6 карбоциклил» или аналогичными обозначениями. Примеры карбо цикл ильных колец включают циклопропил, циклобутил, циклопентил, циклогексил, циклогексенил, 2,3-дигидро-инден, бицикл[2.2.2]октанил, адамантил и спиро[4.4]нонанил, но не ограничиваются ими.The term "carbocyclyl" as used herein means a non-aromatic cyclic ring or ring system containing only carbon atoms in the backbone of the ring system. When the carbocyclyl is a ring system, two or more than two rings may be linked to each other in a fused, bridged or spiro-linked manner. Carbocyclyls can have any degree of saturation, as long as at least one ring in the ring system is non-aromatic. Thus, carbocyclyls include cycloalkyls, cycloalkenyls and cycloalkynyls. A carbocyclyl group may have from 3 to 20 carbon atoms, although the present definition also covers the occurrence of the term "carbocyclyl" where no numerical range is indicated. The carbocyclyl group may also be a medium sized carbocyclyl having from 3 to 10 carbon atoms. The carbocyclyl group may also be a carbocyclyl group having from 3 to 6 carbon atoms. A carbocyclyl group may be designated "C 3 -C 6 carbocyclyl" or similar designations. Examples of carbocyclyl rings include, but are not limited to, cyclopropyl, cyclobutyl, cyclopentyl, cyclohexyl, cyclohexenyl, 2,3-dihydro-indene, bicycl[2.2.2]octanyl, adamantyl, and spiro[4.4]nonanyl.
Термин «циклоалкил» в том виде, в котором он используется в данном документе, означает полностью насыщенное карбоциклильное кольцо или кольцевую систему. Примеры включают циклопропил, циклобутил, циклопентил и циклогексил.The term "cycloalkyl" as used herein means a fully saturated carbocyclyl ring or ring system. Examples include cyclopropyl, cyclobutyl, cyclopentyl and cyclohexyl.
Термин «гетероциклил» в том виде, в котором он используется в данном документе, означает неароматическое циклическое кольцо или кольцевую систему, содержащую по меньшей мере один гетероатом в остове кольца. Гетероциклилы могут быть связаны друг с другом конденсированным, мостиковым или спиро-связанным способом. Гетероциклилы могут иметь любую степень насыщения, при условии, что по меньшей мере одно кольцо в данной кольцевой системе не является ароматическим. Гетероатом(мы) может(гут) присутствовать либо в неароматическом, либо в ароматическом кольце в кольцевой системе. Гетероциклическая группа может иметь от 3 до 20 членов кольца (т.е. число атомов, составляющих остов кольца, включая атомы углерода и гетероатомы), хотя настоящее определение также охватывает появление термина «гетероциклил», где не обозначается числовой интервал. Гетероциклильная группа также может представлять собой гетероциклил среднего размера, имеющий от 3 до 10 членов кольца. Данная гетероциклильная группа также могла бы быть гетероциклилом, имеющим от 3 до 6 членов кольца. Данная гетероциклильная группа может быть обозначена как «3-6-членный гетероциклил» или аналогичными обозначениями. В предпочтительных шестичленных моноциклических гетероциклилах гетероатом(мы) выбран(ны) из одного-трех О, N или S, и в предпочтительных пятичленных моноциклических гетероциклилах гетероатом(мы) выбран(ны) из одного или двух гетероатомов, выбранных из О, N или S. Примеры гетероциклильных колец включают азепинил, акридинил, карбазолил, циннолинил, диоксоланил, имидазолинил, имидазолидинил, морфолинил, оксиранил, оксепанил, тиепанил, пиперидинил, пиперазинил, диоксопиперазинил, пирролидинил, пирролидонил, пирролидионил, 4-пиперидонил, пиразолинил, пиразолидинил, 1,3-диоксинил, 1,3-диоксанил, 1,4-диоксинил, 1,4-диоксанил, 1,3-оксатианил, 1,4-оксатиинил, 1,4-оксатианил, 2Н-1,2-оксазинил, триоксанил, гексагидро-1,3,5-триазинил, 1,3-диоксолил, 1,3-диоксоланил, 1,3-дитиолил, 1,3-дитиоланил, изоксазолинил, изоксазолидинил, оксазолинил, оксазолидинил, оксазолидинонил, тиазолинил, тиазолидинил, 1,3-оксатиоланил, индолинил, изоиндолинил, тетрагидрофуранил, тетрагидропиранил, тетрагидротиофенил, тетрагидротиопиранил, тетрагидро-1,4-тиазинил, тиаморфолинил, дигидробензофуранил, бензимидазолидинил и тетрагидрохинолин, но не ограничиваются ими.The term “heterocyclyl” as used herein means a non-aromatic cyclic ring or ring system containing at least one heteroatom in the core of the ring. Heterocyclyls can be linked to each other in a fused, bridged or spiro-linked manner. Heterocyclyls can have any degree of saturation, as long as at least one ring in the ring system is non-aromatic. The heteroatom(s) may be present on either a non-aromatic or an aromatic ring in a ring system. A heterocyclic group may have from 3 to 20 ring members (ie, the number of atoms that make up the core of the ring, including carbon atoms and heteroatoms), although the present definition also covers the occurrence of the term “heterocyclyl” where no numerical range is indicated. The heterocyclyl group may also be a medium-sized heterocyclyl group having from 3 to 10 ring members. This heterocyclyl group could also be a heterocyclyl having 3 to 6 ring members. This heterocyclyl group may be designated "3-6 membered heterocyclyl" or similar designations. In preferred six-membered monocyclic heterocyclyls, the heteroatom(s) are selected from one to three O, N or S, and in preferred five-membered monocyclic heterocyclyls, the heteroatom(s) are selected from one or two heteroatoms selected from O, N or S Examples of heterocyclyl rings include azepinyl, acridinyl, carbazolyl, cinnolinyl, dioxolanyl, imidazolinyl, imidazolidinyl, morpholinyl, oxiranyl, oxepanyl, tiepanyl, piperidinyl, piperazinyl, dioxopiperazinyl, pyrrolidinyl, pyrrolidonyl, pyrrolidionyl, 4-piperidonyl, pyrazolinyl, pyrazolidinyl, 1,3 -dioxynyl, 1,3-dioxanyl, 1,4-dioxynyl, 1,4-dioxanyl, 1,3-oxathianyl, 1,4-oxathiinyl, 1,4-oxathianyl, 2H-1,2-oxazinyl, trioxanyl, hexahydro -1,3,5-triazinyl, 1,3-dioxolyl, 1,3-dioxolanyl, 1,3-dithiolyl, 1,3-dithiolanyl, isoxazolinyl, isoxazolidinyl, oxazolinyl, oxazolidinyl, oxazolidinonyl, thiazolinyl, thiazolidinyl, 1,3 -oxathiolanyl, indolinyl, isoindolinyl, tetrahydrofuranyl, tetrahydropyranyl, tetrahydrothiophenyl, tetrahydrothiopyranyl, tetrahydro-1,4-thiazinyl, thiamorpholinyl, dihydrobenzofuranyl, benzimidazolidinyl and tetrahydroquinoline.
«О-карбокси» группа относится к группе «-OC(=O)R», в которой R выбран из водорода, С1-С6 алкила, С2-С6 алкенила, С2-С6 алкинила, С3-С7 карбоциклила, С6-С10 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.The "O-carboxy" group refers to the group "-OC(=O)R", in which R is selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 3 - C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl as defined herein.
«С-карбокси» группа относится к группе «-C(=O)OR», в которой R выбран из группы, состоящей из водорода, С1-С6 алкила, С2-С6 алкенила, С2-С6 алкинила, С3-С7 карбоциклила, С6-С10 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе. Неограничивающий пример включает карбоксил (т.е. -С(=O)ОН).The "C-carboxy" group refers to the group "-C(=O)OR", in which R is selected from the group consisting of hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl , C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl, as defined herein. A non-limiting example includes carboxyl (ie -C(=O)OH).
«Сульфонильная» группа относится к группе «-SO2R», в которой R выбран из водорода, С1-С6 алкила, С2-С6 алкенила, С2-С6 алкинила, С3-С7 карбоциклила, С6-С10 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.A "sulfonyl" group refers to the group "-SO 2 R" in which R is selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl as defined herein.
«Сульфино» группа относится к группе «-S(=O)OH».The “sulfino” group refers to the “-S(=O)OH” group.
«S-сульфонамидо» группа относится к группе «-SO2NRARB», в которой каждый из RA и RB независимо выбран из водорода, С1-С6 алкила, С2-С6 алкенила, С2-С6 алкинила, С3-С7 карбоциклила, С6-С10 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.The "S-sulfonamido" group refers to the group "-SO 2 NR A R B ", in which each of R A and RB is independently selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 - C 6 alkynyl, C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl, as defined herein.
«N-сульфонамидо» группа относится к группе «-N(RA)SO2Rb», в которой каждый из RA и RB независимо выбран из водорода, С1-С6 алкила, С2-С6 алкенила, С2-С6 алкинила, С3-С7 карбоциклила, С6-С10 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.The "N-sulfonamido" group refers to the group "-N( RA )SO 2 R b ", in which each of RA and RB is independently selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl, as defined herein.
«С-амидо» группа относится к группе «-C(=O)NRARB», в которой каждый из RA и RB независимо выбран из водорода, С1-С6 алкила, С2-С6 алкенила, С2-С6 алкинила, С3-С7 карбоциклила, С6-С10 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.The "C-amido" group refers to the group "-C(=O)NR A R B ", in which each of R A and R B is independently selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl, as defined herein.
«N-амидо» группа относится к группе «-N(RA)C(=O)RB», в которой каждый из RA и RB независимо выбран из водорода, С1-С6 алкила, С2-С6 алкенила, С2-С6 алкинила, С3-С7 карбоциклила, С6-С10 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.An "N-amido" group refers to the group "-N(R A )C(=O)R B ", in which each of R A and R B is independently selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl, as defined herein.
«Аминогруппа» относится к группе «-NRARB», в которой каждый из RA и RB независимо выбран из водорода, С1-С6 алкила, С2-С6 алкенила, С2-С6 алкинила, С3-С7 карбоциклила, С6-С10 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе. Неограничивающий пример включает свободный амино (т.е. -NH2)."Amino group" refers to the group "-NR A R B ", in which each of R A and R B is independently selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl, as defined herein. A non-limiting example includes free amino (ie -NH 2 ).
«Аминоалкильная» группа относится к аминогруппе, присоединенной через алкиленовую группу.An "aminoalkyl" group refers to an amino group attached via an alkylene group.
«Алкоксиалкильная» группа относится к алкоксигруппе, присоединенной через алкиленовую группу, такой как «С2-С8 алкоксиалкил» и тому подобное.An "alkoxyalkyl" group refers to an alkoxy group attached through an alkylene group, such as "C 2 -C 8 alkoxyalkyl" and the like.
Замещенная группа в том виде, в котором данный термин используется в данном документе, происходит от незамещенной родительской группы, в которой была замена одного или более чем одного атома водорода на другой атом или группу. Если не указано иное, когда группа считается «замещенной», подразумевается то, что данная группа замещена одним или более чем одним заместителем, независимо выбранным из C1-C6 алкила, С1-С6 алкенила, С1-С6 алкинила, С1-С6 гетероалкила, С3-С7 карбоциклила (возможно замещенного галоген-, С1-С6 алкилом, С1-С6 алкокси, С1-С6 галогеналкилом и С1-С6 галогеналкокси), С3-С7 карбоциклил-С1-С6-алкила (возможно замещенного галоген-, С1-С6 алкилом, С1-С6 алкокси, С1-С6 галогенал килом и C1-C6 галогеналкокси), 3-10-членного гетероциклила (возможно замещенного галоген-, С1-С6 алкилом, С1-С6 алкокси, С1-С6 галогенал килом и С1-С6 галогеналкокси), 3-10-членного гетероциклил-С1-С6-алкила (возможно замещенного галоген-, C1-C6 алкилом, С1-С6 алкокси, С1-С6 галогеналкилом и C1-C6 галогеналкокси), арила (возможно замещенного галоген-, С1-С6 алкилом, С1-С6 алкокси, C1-C6 галогеналкилом и С1-С6 галогеналкокси), арил(С1-С6)алкила (возможно замещенного галоген-, С1-С6 алкилом, С1-С6 алкокси, С1-С6 галогеналкилом и С1-С6 галогеналкокси), 5-10-членного гетероарила (возможно замещенного галоген-, С1-С6 алкилом, C1-C6 алкокси, С1-С6 галогеналкилом и С1-С6 галогеналкокси), 5-10-членного гетероарил(С1-С6)алкила (возможно замещенного галоген-, С1-С6 алкилом, С1-С6 алкокси, С1-С6 галогеналкилом и С1-С6 галогеналкокси), галоген-, -CN, гидрокси, С1-С6 алкокси, С1-С6 алкокси(С1-С6)алкила (т.е. простой эфир), арилокси, сульфгидрила (меркапто), галоген(С1-С6)алкила (например, -CF3), галогенC1-С6)алкокси (например, -OCF3), С1-С6 алкилтио, арилтио, амино, амино(C1-C6)алкила, нитро, О-карбамила, N-карбамила, О-тиокарбамила, N-тиокарбамила, С-амидо, N-амидо, S-сульфонамидо, N-сульфонамидо, С-карбокси, О-карбокси, ацила, цианато, изоцианато, тиоцианато, изотиоцианато, сульфинила, сульфонила, -SO3H, сульфино, -OSO2C1-4алкила и оксо (=O). Во всех случаях если группа описывается как «возможно замещенная», данная группа может быть замещена приведенными выше заместителями.A substituted group, as the term is used herein, is derived from an unsubstituted parent group in which one or more hydrogen atoms have been replaced by another atom or group. Unless otherwise indicated, when a group is considered "substituted", it is meant that the group is substituted with one or more substituents independently selected from C 1 -C 6 alkyl, C 1 -C 6 alkenyl, C 1 -C 6 alkynyl, C 1 -C 6 heteroalkyl, C 3 -C 7 carbocyclyl (possibly substituted with halogen, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), C 3 -C 7 carbocyclyl-C 1 -C 6 -alkyl (possibly substituted with halogen-, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), 3- 10-membered heterocyclyl (possibly substituted with halogen-, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), 3-10-membered heterocyclyl-C 1 - C 6 -alkyl (possibly substituted with halogen-, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), aryl (possibly substituted with halogen-, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), aryl(C 1 -C 6 )alkyl (possibly substituted with halogen, C 1 -C 6 alkyl, C 1 - C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), 5-10 membered heteroaryl (possibly substituted with halogen, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), 5-10-membered heteroaryl (C 1 -C 6 )alkyl (possibly substituted with halogen-, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), halogen-, -CN, hydroxy, C 1 -C 6 alkoxy, C 1 -C 6 alkoxy (C 1 -C 6 )alkyl (i.e. ether), aryloxy, sulfhydryl (mercapto), halogen(C 1 -C 6 )alkyl (for example, -CF 3 ), halogenC 1 -C 6 )alkoxy (for example, -OCF 3 ), C 1 -C 6 alkylthio, arylthio, amino, amino(C 1 -C 6 )alkyl, nitro, O-carbamyl, N-carbamyl, O-thiocarbamyl, N-thiocarbamyl, C-amido, N-amido, S-sulfonamido, N-sulfonamido, C- carboxy, O-carboxy, acyl, cyanato, isocyanato, thiocyanato, isothiocyanato, sulfinyl, sulfonyl, -SO 3 H, sulfin, -OSO 2 C1-4alkyl and oxo (=O). In all cases, if a group is described as "optionally substituted", the group may be substituted with the substituents listed above.
Термин «гидрокси» в том виде, в котором он используется в данном документе, относится к группе -ОН.The term "hydroxy" as used herein refers to the -OH group.
Термин «цианогруппа» в том виде, в котором он используется в данном документе, относится к группе «-CN».The term "cyano group" as used herein refers to the "-CN" group.
Термин «азидо» в том виде, в котором он используется в данном документе, относится к группе -N3.The term "azido" as used herein refers to the -N 3 group.
Термин «нуклеотид» в том виде, в котором он используется в данном документе, включает азотсодержащее гетероциклическое основание, сахар и одну или более чем одну фосфатную группу. Они представляют собой мономерные звенья последовательности нуклеиновой кислоты. В РНК сахар представляет собой рибозу, а в ДНК - дезоксирибозу, т.е. сахар с отсутствием гидроксильной группы, которая присутствует в рибозе. Азотсодержащим гетероциклическим основанием может быть пуриновое или пиримидиновое основание. Пуриновые основания включают аденин (А) и гуанин (G), и их модифицированные производные или аналоги. Пиримидиновые основания включают цитозин (С), тимин (Т) и урацил (U), и их модифицированные производные или аналоги. Атом С-1 дезоксирибозы связывается с N-1 пиримидина или N-9 пурина.The term "nucleotide" as used herein includes a nitrogen-containing heterocyclic base, a sugar, and one or more phosphate groups. They are monomeric units of a nucleic acid sequence. In RNA, the sugar is ribose, and in DNA it is deoxyribose, i.e. a sugar lacking the hydroxyl group found in ribose. The nitrogen-containing heterocyclic base may be a purine or pyrimidine base. Purine bases include adenine (A) and guanine (G), and their modified derivatives or analogs. Pyrimidine bases include cytosine (C), thymine (T), and uracil (U), and their modified derivatives or analogs. The C-1 atom of deoxyribose binds to N-1 of pyrimidine or N-9 of purine.
«Нуклеозид» в том виде, в котором данный термин используется в данном документе, является структурно сходным с нуклеотидом, но с отсутствием фосфатных группировок. Примером аналога нуклеозида был бы аналог, в котором с основанием связывается метка, и отсутствует фосфатная группа, присоединенная к молекуле сахара. Термин «нуклеозид» используется в данном документе в его исходном смысле, как понятно специалистам в данной области. Примеры включают рибонуклеозид, содержащий рибозный фрагмент, и дезоксирибонуклеозид, содержащий дезоксирибозный фрагмент, но не ограничиваются ими. Модифицированный пентозный фрагмент представляет собой пентозный фрагмент, в котором атом кислорода был заменен углеродом, и/или углерод был заменен серой или атомом кислорода. «Нуклеозид» представляет собой мономер, который имеет замещенное основание и/или сахарный фрагмент. Дополнительно, нуклеозид может быть включен в большие полимеры ДНК и/или РНК и олигомеры.A "nucleoside" as the term is used herein is structurally similar to a nucleotide but lacks the phosphate moieties. An example of a nucleoside analog would be one in which a tag is bound to the base and there is no phosphate group attached to the sugar molecule. The term "nucleoside" is used herein in its original sense, as understood by those skilled in the art. Examples include, but are not limited to, a ribonucleoside containing a ribose moiety and a deoxyribonucleoside containing a deoxyribose moiety. A modified pentose moiety is a pentose moiety in which the oxygen atom has been replaced by carbon, and/or the carbon has been replaced by sulfur or an oxygen atom. A "nucleoside" is a monomer that has a substituted base and/or sugar moiety. Additionally, the nucleoside may be included in large DNA and/or RNA polymers and oligomers.
Термин «пуриновое основание» используется в данном документе в его исходном смысле, как понятно специалистам в данной области, и включает его таутомеры. Аналогичным образом, термин «пиримидиновое основание» используется в данном документе в его исходном смысле, как понятно специалистам в данной области, и включает его таутомеры. Неограничивающий список возможно замещенных пуриновых оснований включает пурин, аденин, гуанин, гипоксантин, ксантин, аллоксантин, 7-алкилгуанин (например, 7-метилгуанин), теобромин, кофеин, мочевую кислоту и изогуанин. Примеры пиримидиновых оснований включают цитозин, тимин, урацил, 5,6-дигидроурацил и 5-алкилцитозин (например, 5-метилцитозин), но не ограничиваются ими.The term “purine base” is used herein in its original sense, as understood by those skilled in the art, and includes its tautomers. Likewise, the term “pyrimidine base” is used herein in its original sense, as understood by those skilled in the art, and includes tautomers thereof. A non-limiting list of possibly substituted purine bases includes purine, adenine, guanine, hypoxanthine, xanthine, alloxanthine, 7-alkylguanine (eg, 7-methylguanine), theobromine, caffeine, uric acid and isoguanine. Examples of pyrimidine bases include, but are not limited to, cytosine, thymine, uracil, 5,6-dihydrouracil, and 5-alkylcytosine (eg, 5-methylcytosine).
При описании олигонуклеотида или полинуклеотида, в том виде, в котором данные термины используются в данном документе, как «содержащих» нуклеозид или нуклеотид, описанный в данном документе, это означает то, что нуклеозид или нуклеотид, описанный в данном документе, образует ковалентную связь сданным олигонуклеотидом или полинуклеотидом. Аналогичным образом, при описании нуклеозида или нуклеотида как части олигонуклеотида или полинуклеотида, таких как «включенные в» олигонуклеотид или полинуклеотид, это означает то, что нуклеозид или нуклеотид, описанный в данном документе, образует ковалентную связь с данным олигонуклеотидом или полинуклеотидом. В некоторых таких воплощениях ковалентная связь образуется между 3’-гидроксигруппой олигонуклеотида или полинуклеотида с 5'-фосфатной группой нуклеотида, описанного в данном документе, в виде фосфодиэфирной связи между 3' атомом углерода олигонуклеотида или полинуклеотида и 5' атомом углерода данного нуклеотида.When an oligonucleotide or polynucleotide, as these terms are used herein, is described as “containing” a nucleoside or nucleotide described herein, it means that the nucleoside or nucleotide described herein forms a covalent bond oligonucleotide or polynucleotide. Likewise, when describing a nucleoside or nucleotide as part of an oligonucleotide or polynucleotide, such as “incorporated into” an oligonucleotide or polynucleotide, it means that the nucleoside or nucleotide described herein forms a covalent bond with the oligonucleotide or polynucleotide. In some such embodiments, a covalent bond is formed between the 3'-hydroxy group of the oligonucleotide or polynucleotide with the 5'-phosphate group of the nucleotide described herein, in the form of a phosphodiester bond between the 3' carbon atom of the oligonucleotide or polynucleotide and the 5' carbon atom of the nucleotide.
Термин «производное» или «аналог» в том виде, в котором он используется в данном документе, означает синтетическое нуклеотидное или нуклеозидное производное, имеющее модифицированные фрагменты основания и/или модифицированные фрагменты сахара. Такие производные и аналоги обсуждаются, например, в Scheit, Nucleotide Analogs (John Wiley & Son, 1980) и Uhlman et al., Chemical Reviews 90:543-584, 1990. Нуклеотидные аналоги также могут содержать модифицированные фосфодиэфирные связи, включающие фосфоротиоатные, фосфородитиоатные, алкил-фосфонатные,The term “derivative” or “analogue” as used herein means a synthetic nucleotide or nucleoside derivative having modified base moieties and/or modified sugar moieties. Such derivatives and analogs are discussed, for example, in Scheit, Nucleotide Analogs (John Wiley & Son, 1980) and Uhlman et al., Chemical Reviews 90:543-584, 1990. Nucleotide analogs may also contain modified phosphodiester bonds, including phosphorothioate, phosphorodithioate , alkyl phosphonate,
фосфоранилидатные и фосфорамидатные связи. Термины «производное», «аналог» и «модифицированный» в том виде, в котором они используются в данном документе, могут использоваться взаимозаменяемо и охватываются терминами «нуклеотид» и «нуклеозид», определенными в данном документе.phosphoranidate and phosphoramidate bonds. The terms “derivative,” “analog,” and “modified,” as used herein, may be used interchangeably and are encompassed by the terms “nucleotide” and “nucleoside” as defined herein.
Термин «фосфат» в том виде, в котором он используется в данном документе, используется в его обычном смысле, как понятно специалистам в данной области, и включает его протонированные формы (например, ). Термины «монофосфат», «дифосфат» и «трифосфат» в том виде, в котором они используются в данном документе, используется в их обычном смысле, как понятно специалистам в данной области, и включают протонированные формы.The term “phosphate” as used herein is used in its ordinary sense as understood by those skilled in the art and includes its protonated forms (e.g. ). The terms "monophosphate", "diphosphate" and "triphosphate" as used herein are used in their ordinary sense as understood by those skilled in the art and include the protonated forms.
Термины «защитная группа» и «защитные группы» в том виде, в котором они используются в данном документе, относятся к любому атому или группе атомов, которые добавляются к молекуле для того, чтобы предотвращать нежелательные химические реакции существующих групп в молекуле. Иногда термины «защитная группа» и «блокирующая группа» могут использоваться взаимозаменяемо.The terms “protecting group” and “protecting groups” as used herein refer to any atom or group of atoms that is added to a molecule to prevent unwanted chemical reactions of existing groups in the molecule. Sometimes the terms "protecting group" and "blocking group" may be used interchangeably.
Приставки «фото» или «фото-» в том виде, в котором они используются в данном документе, означают относящиеся к световому или электромагнитному излучению. Данный термин может охватывать весь электромагнитный спектр или часть электромагнитного спектра, включая один или более чем один интервал, обычно известный как радио, микроволновые, инфракрасные, видимые, ультрафиолетовые, рентгеновские или гамма-лучевые части спектра, но не ограничиваясь ими. Данная часть спектра может представлять собой часть спектра, которая блокируется металлической областью поверхности, как, например, теми металлами, которые изложены в данном документе. Альтернативно или дополнительно, данная часть спектра может представлять собой часть спектра, которая проходит через промежуточную область поверхности, такую как область, сделанная из стекла, пластмассы, диоксида кремния или другого вещества, изложенного в данном документе. В конкретных воплощениях может использоваться излучение, которое способно проходить через металл. Альтернативно или дополнительно, может использоваться излучение, которое маскируется стеклом, пластмассой, диоксидом кремния или другим веществом, изложенным в данном документе.The prefixes “photo” or “photo-” as used herein refer to light or electromagnetic radiation. The term may cover all or part of the electromagnetic spectrum, including, but not limited to, one or more than one range commonly known as the radio, microwave, infrared, visible, ultraviolet, x-ray or gamma ray portions of the spectrum. This portion of the spectrum may be a portion of the spectrum that is blocked by a metallic region of the surface, such as those metals disclosed herein. Alternatively or additionally, this portion of the spectrum may be the portion of the spectrum that passes through an intermediate surface region, such as a region made of glass, plastic, silica, or other substance set forth herein. In particular embodiments, radiation that is capable of passing through metal may be used. Alternatively or additionally, radiation may be used that is masked by glass, plastic, silica, or other substance set forth herein.
Термин «фазирование» в том виде, в котором он используется в данном документе, относится к явлению в SBS, которое вызвано неполным удалением 3' терминаторов и флуорофоров, и неудачей в завершении включения части цепей ДНК в кластеры посредством полимераз в данном цикле секвенирования. Предфазирование вызвано включением нуклеотидов без эффективных 3' терминаторов, где событие включения идет 1 циклом ранее из-за неудачи терминации. Фазирование и предфазирование вызывают то, что измеренные интенсивности сигнала для конкретного цикла состоят из сигнала от текущего цикла, а также из шума от предшествующего и последующего циклов. По мере увеличения числа циклов, доля последовательностей на кластер, подвергавшихся фазированию и предфазированию, увеличивается, затрудняя идентификацию правильного основания. Предфазирование может быть вызвано присутствием следового количества незащищенных или неблокированных 3’-ОН нуклеотидов во время секвенирования посредством синтеза (SBS). Незащищенные 3’-ОН нуклеотиды могли бы быть получены во время процессов изготовления или возможно во время хранения и процессов манипуляций с реагентами. Соответственно, открытие аналогов нуклеотидов, которые уменьшают частоту предфазирования, является неожиданным и обеспечивает большое преимущество в приложениях SBS над существующими аналогами нуклеотидов. Например, предоставленные аналоги нуклеотидов могут приводить к более короткому времени цикла SBS, меньшим значениям фазирования и предфазирования, и большей длине считываемых фрагментов секвенирования.The term "phasing" as used herein refers to a phenomenon in SBS that is caused by incomplete removal of 3' terminators and fluorophores, and failure to complete the incorporation of a portion of DNA strands into clusters by polymerases in a given sequencing run. Prephasing is caused by the incorporation of nucleotides without effective 3' terminators, where the incorporation event occurs 1 cycle earlier due to termination failure. Phasing and prephasing cause the measured signal intensities for a particular cycle to consist of the signal from the current cycle as well as noise from the preceding and subsequent cycles. As the number of cycles increases, the proportion of sequences per cluster that undergo phasing and prephasing increases, making identification of the correct base difficult. Prephasing can be caused by the presence of trace amounts of exposed or unblocked 3'-OH nucleotides during sequencing by synthesis (SBS). Unprotected 3'-OH nucleotides could be generated during manufacturing processes or possibly during storage and reagent handling processes. Accordingly, the discovery of nucleotide analogs that reduce the frequency of prephasing is unexpected and provides a major advantage in SBS applications over existing nucleotide analogs. For example, the provided nucleotide analogues can result in shorter SBS cycle times, lower phasing and prephasing values, and longer sequencing read lengths.
3’-Гидроксиацетальные блокирующие группы3'-Hydroxyacetal blocking groups
Некоторые воплощения настоящего раскрытия относятся к молекуле нуклеотида или нуклеозида, содержащей рибозу или дезоксирибозу, имеющую удаляемую 3’-ОН защитную или блокирующую группу, образующую структуру ковалентно присоединенную к 3’-атому углерода, в которой: каждый R1a и R1b независимо представляет собой Н, С1-С6 алкил, С1-С6 галогеналкил, С1-С6 алкокси, С1-С6 галогеналкокси, циано, галоген, возможно замещенный фенил или возможно замещенный аралкил;Some embodiments of the present disclosure provide a nucleotide or nucleoside molecule containing ribose or deoxyribose having a 3'-OH leaving protecting or blocking group forming the structure covalently attached to the 3' carbon atom, in which: each R 1a and R 1b independently represents H, C 1 -C 6 alkyl, C 1 -C 6 haloalkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkoxy , cyano, halogen, optionally substituted phenyl or optionally substituted aralkyl;
каждый R2a и R2b независимо представляет собой Н, С1-С6 алкил, С1-С6 галогеналкил, циано или галоген;each R 2a and R 2b independently represents H, C 1 -C 6 alkyl, C 1 -C 6 haloalkyl, cyano or halogen;
в качестве альтернативы, R1a и R2a, наряду с атомами, к которым они присоединяются, образуют возможно замещенную пяти-восьмичленную гетеро цикл ильную группу;alternatively, R 1a and R 2a , along with the atoms to which they are attached, form an optionally substituted five to eight membered heterocyclyl group;
R3 представляет собой Н, возможно замещенный С2-С6 алкенил, возможно замещенный С3-С7 циклоалкенил, возможно замещенный С2-С6 алкинил или возможно замещенный (С1-С6 алкилен)Si(R4)3; иR 3 is H, optionally substituted C 2 -C 6 alkenyl, optionally substituted C 3 -C 7 cycloalkenyl, optionally substituted C 2 -C 6 alkynyl or optionally substituted (C 1 -C 6 alkylene)Si(R 4 ) 3 ; And
каждый R4 независимо представляет собой Н, C1-C6 алкил или возможно замещенный С6-С10 арил при условии, что когда каждый R1a, R1b, R2a и R2b представляет собой Н, тогда R3 не является Н.each R 4 independently represents H, C 1 -C 6 alkyl or optionally substituted C 6 -C 10 aryl with the proviso that when R 1a , R 1b , R 2a and R 2b are each H, then R 3 is not H .
Некоторые другие воплощения настоящего раскрытия относятся к соединению, имеющему структуру Формулы (I):Some other embodiments of the present disclosure relate to a compound having the structure of Formula (I):
в которой R' представляет собой Н, монофосфат, дифосфат, трифосфат, тиофосфат, аналог сложного эфира фосфата, -О-, присоединенный к реакционноспособной фосфоросодержащей группе, или -О-, защищенный защитной группой; R" представляет собой Н или ОН; В представляет собой нуклеиновое основание; каждый из R1a, R1b, R2a, R2b и R3 определяется выше. wherein R' is H, monophosphate, diphosphate, triphosphate, thiophosphate, phosphate ester analogue, -O- attached to a reactive phosphorus-containing group, or -O- protected by a protecting group; R" represents H or OH; B represents a nucleic base; each of R 1a , R 1b , R 2a , R 2b and R 3 is defined above.
В некотором другом воплощении В представляет собой is В некоторых других воплощениях нуклеиновое основание ковалентно связывается с выявляемой меткой (например, флуоресцентным краситетем (Dye)), возможно через линкер, например, В представляет собой В некоторых таких воплощениях R' представляет собой трифосфат. В некотором таком воплощении R" представляет собой Н.In some other embodiment, B represents is In some other embodiments, the nucleic base is covalently linked to a detectable label (eg, fluorescent dye (Dye)), optionally via a linker, for example, B is In some such embodiments, R' is a triphosphate. In some such embodiment, R" is H.
В некоторых воплощениях ацетальной блокирующей группы, описанной в данном документе, по меньшей мере один из R1a и R1b представляет собой Н. В некоторых таких воплощениях каждый R1a и R1b представляет собой Н. В некоторых других воплощениях по меньшей мере один из R1a и R1b представляет собой С1-С6 алкил, например, метил, этил, изопропил или трет-бутил. В некоторых воплощениях каждый из R2a и R2b независимо представляет собой Н, галоген или С1-С6 алкил. В некоторых воплощениях по меньшей мере один из R2a и R2b представляет собой Н или С1-С6 алкил. В некотором таком воплощении каждый R2a и R2b представляет собой Н. В некотором таком воплощении каждый R2a и R2b представляет собой С1-С6 алкил, например, метил, этил, изопропил или трет-бутил. В одном воплощении каждый R2a и R2b представляет собой метил. В некоторых таких воплощениях каждый из R2a и R2b независимо представляет собой С1-С6 алкил или галоген. В некоторых таких воплощениях R2a представляет собой Н, и R2b представляет собой галоген или С1-С6 алкил.In some embodiments of the acetal blocking group described herein, at least one of R 1a and R 1b is H. In some such embodiments, R 1a and R 1b are each H. In some other embodiments, at least one of R 1a and R 1b is C 1 -C 6 alkyl, for example methyl, ethyl, isopropyl or tert-butyl. In some embodiments, R 2a and R 2b are each independently H, halogen, or C 1 -C 6 alkyl. In some embodiments, at least one of R 2a and R 2b is H or C 1 -C 6 alkyl. In some such embodiment, R 2a and R 2b are each H. In some such embodiment, R 2a and R 2b are each C 1 -C 6 alkyl, for example, methyl, ethyl, isopropyl or tert-butyl. In one embodiment, R 2a and R 2b are each methyl. In certain such embodiments, R 2a and R 2b are each independently C 1 -C 6 alkyl or halogen. In some such embodiments, R 2a is H and R 2b is halogen or C 1 -C 6 alkyl.
В некоторых воплощениях ацетальной блокирующей группы, описанной в данном документе, R3 возможно замещен С2-С6 алкенилом. В некоторых таких воплощениях R3 представляет собой С2-С6 алкенил (например, винил, пропенил), возможно замещенный одним или более чем одним заместителем, независимо выбранным из группы, состоящей из галогена, С1-С6 алкила, С1-С6 галогеналкила и их комбинаций. В некоторых других воплощениях R3 представляет собой In some embodiments of the acetal blocking group described herein, R 3 is optionally substituted with C 2 -C 6 alkenyl. In some such embodiments, R 3 is C 2 -C 6 alkenyl (eg, vinyl, propenyl), optionally substituted with one or more substituents independently selected from the group consisting of halogen, C 1 -C 6 alkyl, C 1 - With 6 haloalkyl and their combinations. In some other embodiments, R 3 is
В некоторых других воплощениях R3 возможно замещен С2-С6 алкинилом. В некоторых таких воплощениях R3 представляет собой С2-С6 алкинил (например, этинил, пропинил), возможно замещенный одним или более чем одним заместителем, независимо выбранным из группы, состоящей из галогена, С1-С6 алкила, С1-С6 галогеналкила и их комбинаций. В одном воплощении R3 возможно замещен этинилом В некоторых других воплощениях, R3 возможно замещен (С1-С6алкилене)Si(R4)3. В некоторых таких воплощениях по меньшей мере один из R4 представляет собой С1-4 алкил. В некоторых других воплощениях каждый один из R4 представляет собой С1-С4 алкил, например, метил, этил, изопропил или трет-бутил. В одном воплощении, R3 представляет собой -(CH2)-SiMe3. В некоторых альтернативных воплощениях R3 представляет собой С1-С6 алкил.In some other embodiments, R 3 is optionally substituted with C 2 -C 6 alkynyl. In certain such embodiments, R 3 is C 2 -C 6 alkynyl (eg, ethynyl, propynyl), optionally substituted with one or more substituents independently selected from the group consisting of halogen, C 1 -C 6 alkyl, C 1 - With 6 haloalkyl and their combinations. In one embodiment, R 3 is optionally substituted with ethynyl In some other embodiments, R 3 is optionally substituted with (C 1 -C 6 alkylene)Si(R 4 ) 3 . In some such embodiments, at least one of R 4 is C 1-4 alkyl. In some other embodiments, each one of R 4 is C 1 -C 4 alkyl, for example, methyl, ethyl, isopropyl or tert-butyl. In one embodiment, R 3 is -(CH 2 )-SiMe 3 . In some alternative embodiments, R 3 represents C 1 -C 6 alkyl.
В некоторых альтернативных воплощениях R1a и R2a совместно с атомами, к которым они присоединяются, образуют пяти-семичленный гетероциклил. В некоторых таких воплощениях R1a и R2a совместно с атомами, к которым они присоединяются, образуют шестичленный гетероциклил. В некоторых таких воплощениях шестичленная гетероциклильная группа имеет структуру В некоторых других воплощениях по меньшей мере один из каждого R1b, R2b и R3 представляет собой Н. В некоторых других воплощениях по меньшей мере один из каждого R1b, R2b и R3 представляет собой C1-C6 алкил. В одном воплощении каждый R1b, R2b и R3 представляет собой Н.In some alternative embodiments, R 1a and R 2a together with the atoms to which they are attached form a five- to seven-membered heterocyclyl. In some such embodiments, R 1a and R 2a together with the atoms to which they are attached form a six-membered heterocyclyl. In some such embodiments, the six-membered heterocyclyl group has the structure In certain other embodiments, at least one of each R 1b , R 2b , and R 3 is H. In certain other embodiments, at least one of each R 1b , R 2b , and R 3 is C 1 -C 6 alkyl. In one embodiment, R 1b , R 2b and R 3 are each H.
В некоторых других воплощениях соединение Формулы (I) также представлено Формулой (Ia):In certain other embodiments, the compound of Formula (I) is also represented by Formula (Ia):
где каждый R2c и R2d независимо представляет собой Н, галоген (например, фтор-, хлор-), С1-С6 алкил (например, метил, этил или изопропил) или С1-С6 галогеналкил (например, -CHF2, -CH2F или -CF3). В некоторых таких воплощениях один из R1a и R1b представляет собой Н. В некоторых таких воплощениях каждый R1a и R1b представляет собой Н. В некоторых других воплощениях по меньшей мере один из R1a и R1b представляет собой С1-С6 алкил, например, метил, этил, изопропил или трет-бутил. В некоторых воплощениях каждый из R2a и R2b независимо представляет собой Н, галоген или C1-C6 алкил. В некотором таком воплощении, каждый R2a и R2b представляет собой Н. В некоторых таких воплощениях каждый из R2c и R2d независимо представляет собой Н, галоген или С1-С6 алкил. В некоторых таких воплощениях каждый R2c и R2d представляет собой С1-С6 алкил, например, метил, этил, изопропил или трет-бутил. В одном воплощении каждый R2c и R2d представляет собой метил. В некоторых таких воплощениях каждый R2c и R2d независимо представляет собой галоген. В некоторых таких воплощениях R2c представляет собой Н, и R2d представляет собой Н, галоген (фтор-, хлор-) или С1-С6 алкил (например, метил, этил, изопропил или трет-бутил). В других воплощениях каждый R1a и R1b представляет собой Н; R2a представляет собой Н; R2b представляет собой Н, галоген или метил; R2c представляет собой Н; и R2d представляет собой Н, галоген, метил, этил, изопропил или трет-бутил. wherein each R 2c and R 2d independently represents H, halogen (eg fluoro-, chloro-), C 1 -C 6 alkyl (eg methyl, ethyl or isopropyl) or C 1 -C 6 haloalkyl (eg -CHF 2 , -CH 2 F or -CF 3 ). In some such embodiments, one of R 1a and R 1b is H. In some such embodiments, each of R 1a and R 1b is H. In some other embodiments, at least one of R 1a and R 1b is C 1 -C 6 alkyl, for example methyl, ethyl, isopropyl or tert-butyl. In some embodiments, R 2a and R 2b are each independently H, halogen, or C 1 -C 6 alkyl. In some such embodiment, R 2a and R 2b are each H. In some such embodiments, R 2c and R 2d are each independently H, halogen, or C 1 -C 6 alkyl. In some such embodiments, R 2c and R 2d are each C 1 -C 6 alkyl, for example, methyl, ethyl, isopropyl or tert-butyl. In one embodiment, R 2c and R 2d are each methyl. In some such embodiments, R 2c and R 2d are each independently halogen. In some such embodiments, R 2c is H, and R 2d is H, halogen (fluoro-, chloro-) or C 1 -C 6 alkyl (eg, methyl, ethyl, isopropyl or tert-butyl). In other embodiments, R 1a and R 1b are each H; R 2a represents H; R 2b is H, halogen or methyl; R 2c represents H; and R 2d is H, halogen, methyl, ethyl, isopropyl or tert-butyl.
Неограничивающие воплощения блокирующих групп, описанных в данном документе, включают группы, имеющие структуру, выбранную из группы, состоящей из: ковалентно присоединенной к 3’-углероду рибозы или дезоксирибозы.Non-limiting embodiments of the blocking groups described herein include groups having a structure selected from the group consisting of: covalently attached to the 3' carbon of ribose or deoxyribose.
3’-Гидрокситиокарбаматные блокирующие группы3'-Hydroxythiocarbamate blocking groups
Некоторые дополнительные воплощения настоящего раскрытия относятся к нуклеозиду или нуклеотиду, содержащему рибозу или дезоксирибозу, имеющую удаляемую 3’-ОН блокирующую группу, образующую структуру ковалентно присоединенную к 3'-атому углерода, в которой:Some further embodiments of the present disclosure relate to a nucleoside or nucleotide containing ribose or deoxyribose having a 3'-OH leaving blocking group forming the structure covalently attached to the 3' carbon atom, in which:
каждый из R5 и R6 независимо представляет собой Н, С1-С6 алкил, С2-С6 алкенил, С2-С6 алкинил, С1-С6 галогеналкил, С2-С8 алкоксиалкил, возможно замещенный -(СН2)m-фенил, возможно замещенныйeach of R 5 and R 6 independently represents H, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 1 -C 6 haloalkyl, C 2 -C 8 alkoxyalkyl, optionally substituted - (CH 2 ) m -phenyl, possibly substituted
-(СН2)n-(5 или 6-членный гетероарил), возможно замещенный-(СН2)k-С3-С7 карбоциклил или возможно замещенный-(СН2)р-(3-7-членный гетероциклил);-(CH 2 ) n -(5 or 6 membered heteroaryl), optionally substituted-(CH 2 ) k -C 3 -C 7 carbocyclyl or optionally substituted-(CH 2 ) p -(3-7 membered heterocyclyl);
в качестве альтернативы, R5 и R6, совместно с атомами, к которым они присоединяются, образуют возможно замещенный пяти-семичленный гетероциклил;alternatively, R 5 and R 6 , together with the atoms to which they are attached, form an optionally substituted five- to seven-membered heterocyclyl;
каждый из -(СН2)m-, -(СН2)n-, -(СН2)k- и -(СН2)p- возможно является замещенным; иeach of -(CH 2 ) m -, -(CH 2 ) n -, -(CH 2 ) k - and -(CH 2 ) p - is optionally substituted; And
каждый из m, n, k и р независимо равен 0, 1, 2, 3 или 4.each of m, n, k and p is independently equal to 0, 1, 2, 3 or 4.
Некоторые дополнительные воплощения относятся к соединению Формулы (II):Some additional embodiments relate to the compound of Formula (II):
в котором R' представляет собой Н, монофосфат, дифосфат, трифосфат, тиофосфат, аналог сложного эфира фосфата, -О-, присоединенный к реакционноспособной фосфоросодержащей группе, или -О-, защищенный защитной группой; R" представляет собой Н или ОН; В представляет собой нуклеиновое основание; каждый из R5 и R6 является таким, как определено выше. В некотором другом воплощении В представляет собой wherein R' is H, monophosphate, diphosphate, triphosphate, thiophosphate, phosphate ester analogue, -O- attached to a reactive phosphorus-containing group, or -O- protected by a protecting group; R" is H or OH; B is a nucleic acid base; R5 and R6 are each as defined above. In some other embodiment, B is
В некоторых других воплощениях нуклеиновое основание ковалентно связывается с выявляемой меткой (например, флуоресцентным красителем), возможно через линкер, например, В представляет собой В некоторых таких воплощениях R' представляет собой трифосфат.В некотором таком воплощении R" представляет собой Н. In some other embodiments, the nucleic base is covalently linked to a detectable label (eg, a fluorescent dye), possibly through a linker, for example, B is In some such embodiments, R' is a triphosphate. In some such embodiment, R" is H.
В некоторых воплощениях тиокарбаматной блокирующей группы, описанной в данном документе, по меньшей мере один из R5 и R6 представляет собой Н. В некоторых таких воплощениях каждый R5 и R6 представляет собой Н. В некоторых таких воплощениях R5 представляет собой Н, и R6 представляет собой С1-С6 алкил, например, метил, этил, изопропил или трет-бутил. В некоторых таких воплощениях R5 представляет собой Н, и R6 представляет собой С2-С6 алкенил (например, винил или аллил) или С2-С6 алкинил (например, этинил или пропинил). В некоторых таких воплощениях R5 представляет собой Н, и R2 представляет собой возможно замещенный -(СН2)m-фенил, возможно замещенный -(СН2)n-(5-или 6-членный гетероарил), возможно замещенный -(СН2)k-С3-С7 карбоциклил или возможно замещенный -(СН2)р-(3-7-членный гетероциклил). В некотором другом воплощении С3-С7 карбоциклильная группа может представлять собой С3-С7 циклоалкил или С3-С7 циклоалкенил. 3-7-членная гетероциклильная группа может содержать ноль или одну двойную связь в структуре кольца. В других воплощениях R5 представляет собой Н, и R6 представляет собой возможно замещенный (СН2)m-фенил, возможно замещенный -(СН2)n-6-членный гетероарил, возможно замещенный -(СН2)k-С5 или С6 карбоциклил, или возможно замещенный -(СН2)p-(5- или 6-членный гетероциклил). В некоторых воплощениях m, n, k или р равен 0. В других воплощениях m, n, k или р равен 1 или 2. В некоторых других воплощениях по меньшей мере один из R5 и R6 представляет собой С1-С6 алкил, например, метил, этил, изопропил или трет-бутил. В некоторых других воплощениях и R5, и R6 представляет собой С1-С6 алкил. В одном воплощении и R5, и R6 представляет собой метил.In some embodiments of the thiocarbamate blocking group described herein, at least one of R 5 and R 6 is H. In some such embodiments, R 5 and R 6 are each H. In some such embodiments, R 5 is H. and R 6 is C 1 -C 6 alkyl, for example methyl, ethyl, isopropyl or tert-butyl. In some such embodiments, R 5 is H and R 6 is C 2 -C 6 alkenyl (eg, vinyl or allyl) or C 2 -C 6 alkynyl (eg, ethynyl or propynyl). In some such embodiments, R 5 is H, and R 2 is optionally substituted -(CH 2 ) m -phenyl, optionally substituted -(CH 2 ) n -(5- or 6-membered heteroaryl), optionally substituted -(CH 2 ) k -C 3 -C 7 carbocyclyl or possibly substituted -(CH 2 ) p -(3-7-membered heterocyclyl). In some other embodiment, the C 3 -C 7 carbocyclyl group may be C 3 -C 7 cycloalkyl or C 3 -C 7 cycloalkenyl. A 3-7 membered heterocyclyl group may contain zero or one double bond in the ring structure. In other embodiments, R 5 is H and R 6 is optionally substituted (CH 2 ) m -phenyl, optionally substituted -(CH 2 ) n -6-membered heteroaryl, optionally substituted -(CH 2 ) k -C 5 or C 6 carbocyclyl, or possibly substituted -(CH 2 ) p -(5- or 6-membered heterocyclyl). In some embodiments, m, n, k, or p is 0. In other embodiments, m, n, k, or p is 1 or 2. In some other embodiments, at least one of R 5 and R 6 is C 1 -C 6 alkyl eg methyl, ethyl, isopropyl or tert-butyl. In some other embodiments, both R 5 and R 6 are C 1 -C 6 alkyl. In one embodiment, both R 5 and R 6 are methyl.
В некоторых альтернативных воплощениях R5 и R6 совместно с атомами, к которым они присоединены, образуют возможно замещенный пяти-семичленный гетероциклил. В некоторых таких воплощениях R5 и R6 совместно с атомами, к которым они присоединены, образуют возможно замещенный пиперидинил.In some alternative embodiments, R 5 and R 6 together with the atoms to which they are attached form an optionally substituted five- to seven-membered heterocyclyl. In some such embodiments, R 5 and R 6 together with the atoms to which they are attached form an optionally substituted piperidinyl.
Неограничивающие воплощения 3’-О-тиокарбаматных блокирующих групп, описанных в данном документе, включающие воплощения, имеющие структуру, выбранную из группы, состоящей из ковалентно присоединяются к 3’-углероду рибозы или дезоксирибозы.Non-limiting embodiments of the 3'-O-thiocarbamate blocking groups described herein, including embodiments having a structure selected from the group consisting of covalently attached to the 3' carbon of ribose or deoxyribose.
Дополнительные воплощения настоящего раскрытия относятся к олигонуклеотиду или полинуклеотиду, содержащему нуклеозид или нуклеотид, описанный в данном документе.Additional embodiments of the present disclosure relate to an oligonucleotide or polynucleotide containing a nucleoside or nucleotide described herein.
В любом из воплощений блокирущих групп, описанных в данном документе, когда группа описывается как «возможно замещенная», она может быть либо незамещенной, либо замещенной.In any of the embodiments of the blocking groups described herein, when a group is described as “optionally substituted,” it may be either unsubstituted or substituted.
В любых воплощениях нуклеотидов или нуклеозидов с 3' гидрокси блокирующей группой, описанной в данном документе, нуклеозид или нуклеотид может быть ковалентно присоединен к выявляемой метке (например, флуорофор), возможно через линкер. Данный линкер может быть расщепляемым или нерасщепляемым. В некоторых таких воплощениях выявляемая метка (например, флуорофор) ковалентно присоединена к нуклеиновому основанию нуклеозида или нуклеотида через расщепляемый линкер. В некоторых других воплощениях выявляемая метка (например, флуорофор) ковалентно присоединена к 3' кислороду нуклеозида или нуклеотида через расщепляемый линкер. В некоторых других воплощениях такой расщепляемый линкер может содержать азидный фрагмент или дисульфидный фрагмент, ацетальный фрагмент или тиокарбаматный фрагмент. В некоторых воплощениях 3' гидрокси блокирующая группа и расщепляемый линкер (и присоединенная метка) могут быть удалены при таких же или по существу таких же условиях химической реакции, например, блокирующая группа и выявляемая метка могут быть удалены в одной химической реакции. В других воплощениях блокирующая группа и выявляемая метка удаляются за две отдельные стадии.In any embodiments of nucleotides or nucleosides with a 3' hydroxy blocking group described herein, the nucleoside or nucleotide can be covalently attached to a detectable label (eg, a fluorophore), possibly through a linker. This linker may be cleavable or non-cleavable. In some such embodiments, a detectable label (eg, a fluorophore) is covalently attached to the nucleic acid base of the nucleoside or nucleotide through a cleavable linker. In some other embodiments, a detectable label (eg, a fluorophore) is covalently attached to the 3' oxygen of the nucleoside or nucleotide through a cleavable linker. In some other embodiments, such a cleavable linker may contain an azide moiety or a disulfide moiety, an acetal moiety, or a thiocarbamate moiety. In some embodiments, the 3' hydroxy blocking group and the cleavable linker (and attached tag) can be removed under the same or substantially the same chemical reaction conditions, for example, the blocking group and the detectable tag can be removed in a single chemical reaction. In other embodiments, the blocking group and the detectable label are removed in two separate steps.
В некоторых воплощениях нуклеотиды или нуклеозиды, описанные в данном документе, содержат 2'-дезоксирибозу. В некоторых других аспектах 2'-дезоксирибоза содержит одну, две или три фосфатные группы в 5' положении сахарного кольца. В некотором другом аспекте нуклеотиды, описанные в данном документе, представляют собой нуклеотидтрифосфат.In some embodiments, the nucleotides or nucleosides described herein contain 2'-deoxyribose. In some other aspects, 2'-deoxyribose contains one, two, or three phosphate groups at the 5' position of the sugar ring. In another aspect, the nucleotides described herein are nucleotide triphosphate.
В некоторых воплощениях 3' блокированные нуклеотиды или нуклеозиды, описанные в данном документе, обеспечивают превосходные стабильность в растворе во время хранения или обращение с реагентами во время приложений секвенирования по сравнению с такими же нуклеотидами или нуклеозидами, защищенными стандартной 3’-ОН блокирующей группой, раскрытой в предшествующем уровне техники, например, 3’-О-азидометильной защитной группой. Например, ацетальные или тиокарбаматные блокирующие группы, раскрытые в данном документе, могут придавать по меньшей мере на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500%, 2000%, 2500% или 3000% улучшенную стабильность по сравнению с защищенной азидометилом 3’-ОН при тех же самых условиях в течение такого же периода времени, уменьшая посредством этого значения предфазирования и приводя к большим длинам считываемых фрагментов при секвенировании. В некоторых воплощениях стабильность измеряется при температуре окружающей среды или при температуре ниже температуры окружающей среды (как, например, 4-10°С). В других воплощениях стабильность измеряется при повышенной температуре, такой как 40°С, 45°С, 50°С, 55°С, 60°С или 65°С. В некоторых таких воплощениях стабильность измеряется в растворе в среде с основным рН, например, при рН 9,0; 9,2; 9,4; 9,6; 9,8 или 10,0. В некоторых таких воплощениях стабильность измеряется с присутствием или без присутствия фермента, такого как полимераза (например, ДНК-полимераза), терминальная дезоксинуклеотидил трансфераза или обратная транскриптаза.In some embodiments, the 3' blocked nucleotides or nucleosides described herein provide superior stability in solution during storage or reagent handling during sequencing applications compared to the same nucleotides or nucleosides protected by the standard 3'-OH blocking group disclosed in the prior art, for example, a 3'-O-azidomethyl protecting group. For example, acetal or thiocarbamate blocking groups disclosed herein can impart at least 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100 %, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500%, 2000%, 2500% or 3000% improved stability compared to azidomethyl protected 3'- OH under the same conditions for the same period of time, thereby reducing prephasing values and leading to longer read lengths during sequencing. In some embodiments, stability is measured at ambient temperature or at a temperature below ambient temperature (such as 4-10°C). In other embodiments, stability is measured at elevated temperature, such as 40°C, 45°C, 50°C, 55°C, 60°C, or 65°C. In some such embodiments, stability is measured in solution at a basic pH environment, for example, pH 9.0; 9.2; 9.4; 9.6; 9.8 or 10.0. In some such embodiments, stability is measured with or without the presence of an enzyme, such as a polymerase (eg, DNA polymerase), terminal deoxynucleotidyl transferase, or reverse transcriptase.
В некоторых воплощениях 3' блокированные нуклеотиды или нуклеозиды, описанные в данном документе, обеспечивают превосходную скорость деблокирования в растворе во время стадии химического расщепления приложений по секвенированию по сравнению с такими же нуклеотидами или нуклеозидами, защищенными стандартной 3’-ОН блокирующей группой, раскрытой в предшествующем уровне техники, например, 3’-О-азидометильной защитной группой. Например, ацетальные или тиокарбаматные блокирующие группы, раскрытые в данном документе, могут придавать по меньшей мере на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500% или 2000% улучшенную скорость деблокирования по сравнению с защищенной азидометилом 3’-ОН с использованием стандартного деблокирующего реагента (такого как трис(гидроксипропил)фосфин), уменьшая, посредством этого, общее время для цикла секвенирования. В некоторых воплощениях скорость деблокирования измеряется при температуре окружающей среды или температуре ниже температуры окружающей среды (такой как 4-10°С). В других воплощениях скорость деблокирования измеряется при повышенной температуре, такой как 40°С, 45°С, 50°С, 55°С, 60°С или 65°С. В некоторых таких воплощениях скорость деблокирования измеряется в растворе в среде с основным рН, например, при рН 9,0; 9,2; 9,4; 9,6; 9,8 или 10,0. В некоторых таких воплощениях молярное отношение деблокирующего реагента к субстрату (т.е. 3' блокированному нуклеозиду или нуклеотиду) составляет примерно 10:1, примерно 5:1, примерно 2:1 или примерно 1:1.In some embodiments, the 3' blocked nucleotides or nucleosides described herein provide superior release rates in solution during the chemical digestion step of sequencing applications compared to the same nucleotides or nucleosides protected by the standard 3'-OH blocking group disclosed in the preceding prior art, for example, a 3'-O-azidomethyl protecting group. For example, acetal or thiocarbamate blocking groups disclosed herein can impart at least 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100 %, 150%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500% or 2000% improved release rate compared to azidomethyl protected 3'-OH with using a standard deblocking reagent (such as tris(hydroxypropyl)phosphine), thereby reducing the overall time for a sequencing run. In some embodiments, the release rate is measured at ambient or sub-ambient temperature (such as 4-10°C). In other embodiments, the release rate is measured at an elevated temperature, such as 40°C, 45°C, 50°C, 55°C, 60°C, or 65°C. In some such embodiments, the deblocking rate is measured in solution in a basic pH environment, for example, pH 9.0; 9.2; 9.4; 9.6; 9.8 or 10.0. In some such embodiments, the molar ratio of deblocking reagent to substrate (ie, 3' blocked nucleoside or nucleotide) is about 10:1, about 5:1, about 2:1, or about 1:1.
В некоторых воплощениях палладиевый деблокирущий реагент (например, для удаления 3' ацетальных блокирующих групп (например, блокирующей группы АОМ) используется Pd(0)). Pd может образовать хелатированный комплекс с двумя атомами кислорода группы АОМ, а также с двойной связью аллильной группы, обеспечивая удаление деблокирующего реагента в непосредственной близости от функциональной группы, и может приводить к повышенной скорости деблокирования.In some embodiments, a palladium deblocking reagent (eg, Pd(0) is used to remove 3' acetal blocking groups (eg, an AOM blocking group)). Pd can form a chelated complex with the two oxygen atoms of the AOM group as well as the double bond of the allyl group, allowing removal of the deblocking reagent in close proximity to the functional group, and can result in an increased rate of deblocking.
Снятие защиты 3’-ОН блокирующих группDeprotection of 3'-OH blocking groups
3’-ацетальные блокирующие группы, описанные в данном документе, могут быть удалены или расщеплены при разных химических условиях. Для ацетальных блокирующих групп которые содержат винильный или алкенильный фрагмент, неограничивающее условие расщепления включает комплекс Pd(II), такой как Pd(OAc)2 или димер аллилPd(II) хлорида, в присутствии фосфинового лиганда, например, трис(гидроксиметил)фосфина (ТНМР) или трис(гидроксипропил)фосфина (ТНР или ТНРР). Для тех блокирующих групп, которые содержат алкинильную группу (например, этинил), они также могут быть удалены посредством комплекса Pd(II) (например, Pd(OAc)2 или димер аллилPd(II) хлорида) в присутствии фосфинового лиганда (например, ТНР или ТНМР).The 3'-acetal blocking groups described herein can be removed or cleaved under a variety of chemical conditions. For acetal blocking groups which contain a vinyl or alkenyl moiety, the non-limiting cleavage condition includes a Pd(II) complex, such as Pd(OAc) 2 or an allylPd(II) chloride dimer, in the presence of a phosphine ligand, such as tris(hydroxymethyl)phosphine (THMP) or tris( hydroxypropyl)phosphine (THP or THPP). For those blocking groups that contain an alkynyl group (eg ethynyl), they can also be removed by a Pd(II) complex (eg Pd(OAc) 2 or allylPd(II) chloride dimer) in the presence of a phosphine ligand (eg THP or TNMR).
Палладиевые расщепляющие реагентыPalladium decomposition reagents
В некоторых воплощениях ацетальная блокирующая группа, описанная в данном документе, может быть расщеплена палладиевым катализатором. В некоторых таких воплощениях Pd катализатор является водорастворимым. В некоторых таких воплощениях он представляет собой комплекс Pd(0) (например, нонагидрат нонанатриевой соли трис(3,3',3"-фосфинидинтрис(бензолсульфонато)палладия(0)). В некоторых случаях комплекс Pd(0) может быть генерирован in situ из-за восстановления комплекса Pd(II) посредством таких реагентов, как алкены, спирты, амины, фосфины или гидриды металлов. Подходящие источники палладия включают Na2PdCl4, Pd(CH3CN)2Cl2: (PdCl(C3H5))2, [Pd(C3H5)(THP)]Cl, [Pd(C3H5)(THP)2]Cl, Pd(OAc)2, Pd(Ph3)4, Pd(dba)2, Pd(Acac)2, PdCl2(COD), и Pd(TFA)2. В одном таком воплощении комплекс Pd(0) генерируется in situ из Na2PdCl4. В другом воплощении источником палладия является димер хлорида аллилпалладия(II) [(PdCl(C3H5))2]. В некоторых воплощениях комплекс Pd(0) генерируется в водном растворе посредством смешивания комплекса Pd(II) с фосфином. Подходящие фосфины включают водорастворимые фосфины, такие как трис(гидроксипропил)фосфин (ТНР), трис(гидроксиметил)фосфин (ТНМР), 1,3,5-триаза-7-фосфаадамантан (РТА), калиевая соль бис(п-сульфонатофенил)фенилфосфина, трис(карбоксиэтил)фосфин (ТСЕР) и тринатриевая соль трифенилфосфин-3,3',3"-трисульфоновой кислоты.In some embodiments, the acetal blocking group described herein can be cleaved with a palladium catalyst. In some such embodiments, the Pd catalyst is water soluble. In some such embodiments, it is a Pd(0) complex (e.g., tris(3,3',3"-phosphinidintris(benzenesulfonato)palladium(0) nonasodium salt). In some cases, the Pd(0) complex can be generated in in situ due to the reduction of the Pd(II) complex by reagents such as alkenes, alcohols, amines, phosphines or metal hydrides. Suitable sources of palladium include Na 2 PdCl 4 , Pd(CH 3 CN) 2 Cl 2: (PdCl(C 3 H 5 )) 2 , [Pd(C 3 H 5 )(THP)]Cl, [Pd(C 3 H 5 )(THP) 2 ]Cl, Pd(OAc) 2 , Pd(Ph 3 ) 4 , Pd( dba) 2 , Pd(Acac) 2 , PdCl 2 (COD), and Pd(TFA) 2 . In one such embodiment, the Pd(0) complex is generated in situ from Na 2 PdCl 4 . In another embodiment, the palladium source is an allyl palladium chloride dimer. (II) [(PdCl(C 3 H 5 )) 2 ] In some embodiments, the Pd(0) complex is generated in aqueous solution by mixing the Pd(II) complex with a phosphine. Suitable phosphines include water-soluble phosphines such as tris(hydroxypropyl) phosphine (THP), tris(hydroxymethyl)phosphine (THMP), 1,3,5-triaza-7-phosphadamantane (PTA), bis(p-sulfonatophenyl)phenylphosphine potassium salt, tris(carboxyethyl)phosphine (TCEP) and trisodium salt triphenylphosphine-3,3',3"-trisulfonic acid.
В некоторых воплощениях Pd(0) получают смешиванием комплекса Pd(II) [(PdCI(C3H5))2] с ТНР in situ. Молярное отношение комплекса Pd(II) и ТНР может составлять примерно 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 или 1:10. В некоторых других воплощениях может быть добавлен один или более чем один восстановитель, такой как аскорбиновая кислота или ее соль (например, аскорбат натрия). В некоторых воплощениях расщепляющая смесь может содержать дополнительные буферизующие реагенты, такие как первичный амин, вторичный амин, третичный амин, карбонатная соль, фосфатная соль или боратная соль или их комбинации. В некоторых других воплощениях буферизующий реагент содержит этаноламин (ЕА), трис(гидроксиметил)аминометан (Tris), глицин, карбонат натрия, фосфат натрия, борат натрия, 2-диметиламинометанол (DMEA), 2-диэтиламинометанол (DEEA), N,N,N',N'-тетраметилэтилендиамин (TEMED) или N,N,N',N'-тетраэтилэтилендиамин (TEEDA), или их комбинации. В одном воплощении буферизующий реагент представляет собой DEEA. В другом воплощении буферизующий реагент содержит одну или более чем одну неорганическую соль, такую как карбонатная соль, фосфатная соль или боратная соль, или их комбинации. В одном воплощении неорганическая соль представляет собой натриевую соль.In some embodiments, Pd(0) is prepared by mixing the Pd(II) complex [(PdCI(C 3 H 5 )) 2 ] with THP in situ. The molar ratio of Pd(II) complex to THP can be about 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 or 1:10. In some other embodiments, one or more reducing agents, such as ascorbic acid or a salt thereof (eg, sodium ascorbate), may be added. In some embodiments, the cleavage mixture may contain additional buffering reagents, such as a primary amine, a secondary amine, a tertiary amine, a carbonate salt, a phosphate salt, or a borate salt, or combinations thereof. In some other embodiments, the buffering reagent contains ethanolamine (EA), tris(hydroxymethyl)aminomethane (Tris), glycine, sodium carbonate, sodium phosphate, sodium borate, 2-dimethylaminomethanol (DMEA), 2-diethylaminomethanol (DEEA), N,N, N',N'-tetramethylethylenediamine (TEMED) or N,N,N',N'-tetraethylethylenediamine (TEEDA), or combinations thereof. In one embodiment, the buffering reagent is DEEA. In another embodiment, the buffering reagent contains one or more inorganic salts, such as a carbonate salt, a phosphate salt, or a borate salt, or combinations thereof. In one embodiment, the inorganic salt is a sodium salt.
В качестве альтернативы, алкинильный фрагмент, содержащий блокирующие группы, также может расщепляться в присутствии (NH4)2MoS4. Другое неограничивающее условие расщепления для алкинильного фрагмента включает комплекс Cu(II) с лигандом ТНРТА (трис(3-гидроксипропилтриазолилметил)амин), и аскорбат. Неограничивающие условия расщепления для блокирующих групп, содержащих шестичленный гетероцикл (например, тетрагидропиран), включают циклодекстрин или Ln(OTf)3 (лантанида трифлат). Неограничивающее условие расщепления для блокирующих групп, содержащих алкилсилановую группу (например, -CH2SiMe3), включает LiBF4 (тетрафторборат лития). Другие ацетальные блокирующие группы, такие как -O(CH2)O-C1-C6 алкил, могут быть удалены посредством LiBF4 или Bi(OTf)3 (трифлат висмута). Неограничивающие типичные условия для расщепления описанных разных блокирующих групп иллюстрируются на Схеме 1 ниже.Alternatively, an alkynyl moiety containing blocking groups can also be cleaved in the presence of (NH 4 ) 2 MoS 4 . Another non-limiting cleavage condition for the alkynyl moiety involves complexing Cu(II) with the ligand THPTA (tris(3-hydroxypropyltriazolylmethyl)amine), and ascorbate. Non-limiting cleavage conditions for blocking groups containing a six-membered heterocycle (eg, tetrahydropyran) include cyclodextrin or Ln(OTf) 3 (lanthanide triflate). A non-limiting cleavage condition for blocking groups containing an alkylsilane group (eg, -CH 2 SiMe 3 ) includes LiBF 4 (lithium tetrafluoroborate). Other acetal blocking groups, such as -O(CH 2 )OC 1 -C 6 alkyl, can be removed by LiBF 4 or Bi(OTf) 3 (bismuth triflate). Non-limiting typical conditions for the cleavage of the various blocking groups described are illustrated in Scheme 1 below.
Схема 1. Иллюстрация 3’-деблокирующих условий (Dye+Linker - краситель+линкер)Scheme 1. Illustration of 3'-deblocking conditions (Dye + Linker - dye + linker)
3’-тиокарбаматные блокирующие группы, описанные в данном документе, могут быть удалены или расщеплены при разных химических условиях. Неограничивающие типичные условия для расщепления тиокарбаматных блокирующих групп, описанных в данном документе, включают NaIO4 и Oxone® (калия пероксимоносульфат).The 3'-thiocarbamate blocking groups described herein can be removed or cleaved under a variety of chemical conditions. Non-limiting typical conditions for the cleavage of thiocarbamate blocking groups described herein include NaIO 4 and Oxone® (potassium peroxymonosulfate).
Кроме того, азидогруппа в -CH2N3 может быть превращена в аминогруппу посредством фосфина. В качестве альтернативы, азидогруппа в -CH2N3 может быть превращена в аминогруппу посредством приведения в контакт таких молекул с тиолами, в частности, с водорастворимыми тиолами, такими как дитиотрейтол (DTT). В одном воплощении фосфин представляет собой ТНР.In addition, the azido group in -CH 2 N 3 can be converted to an amino group via phosphine. Alternatively, the azido group in -CH 2 N 3 can be converted to an amino group by contacting such molecules with thiols, in particular water-soluble thiols such as dithiothreitol (DTT). In one embodiment, the phosphine is THP.
Совместимость с линеаризациейLinearization compatible
Для того чтобы максимизировать производительность реакций секвенирования нуклеиновых кислот, полезной является возможность параллельного секвенирования множества молекул-матриц. Параллельная обработка многих матриц может достигаться с применением технологии чипа нуклеиновых кислот. Данные чипы типично состоят из высокоплотной матрицы полинуклеотидов, иммобилизованных на веществе твердой подложки.In order to maximize the throughput of nucleic acid sequencing reactions, the ability to sequence multiple template molecules in parallel is useful. Parallel processing of many templates can be achieved using nucleic acid chip technology. These chips typically consist of a high-density array of polynucleotides immobilized on a solid support material.
Как в WO 98/44151, так и в WO 00/18957 описываются способы амплификации нуклеиновой кислоты, которые обеспечивают иммобилизацию продуктов амплификации на твердой подложке для того, чтобы образовать чипы, состоящие из кластеров или «колоний», образованных из множества идентичных иммобилизованных полинуклеотидных цепей и множества идентичных иммобилизованных комплементарных цепей. Чипы данного типа называются в данном документе «кластерными чипами». Молекулы нуклеиновой кислоты, присутствующие в колониях ДНК на кластерных чипах, полученных согласно данным способам, могут предоставлять матрицы для реакций секвенирования, например, как описано в WO 98/44151. Продукты реакций твердофазной амплификации, такие как продукты, описанные в WO 98/44151 и WO 00/18957, представляют собой так называемые «мостиковые» структуры, образованные отжигом пар иммобилизованных полинуклеотидных цепей и иммобилизованных комплементарных цепей, причем оба типа цепей присоединяются к твердой подложке на 5'-конце. Для того чтобы предоставить более подходящие матрицы для секвенирования нуклеиновых кислот, предпочтительным является удаление по существу всей или по меньшей мере части одной из иммобилизованных цепей в «мостиковой» структуре для того, чтобы получить матрицу, которая является по меньшей мере частично одноцепочечной. Часть матрицы, которая является одноцепочечной, будет, таким образом, доступной для гибридизации с праймером секвенирования. Процесс удаления всей или части одной иммобилизованной цепи в «мостиковой» двухцепочечной структуре нуклеиновой кислоты называется «линеаризацией». Существуют разные способы линеаризации, включающие ферментативное расщепление, фотохимическое расщепление или химическое расщепление, но не ограничивающиеся ими. Неограничивающие примеры способов линеаризации раскрываются в публикации РСТ № WO 2007/010251, публикации патента США №2009/0088327, публикации патента США №2009/0118128 и заявке на патент США 62/671816, которые включаются посредством ссылки во всей их полноте.Both WO 98/44151 and WO 00/18957 describe nucleic acid amplification methods that immobilize the amplification products on a solid support to form chips consisting of clusters or “colonies” formed from multiple identical immobilized polynucleotide chains and multiple identical immobilized complementary chains. This type of chip is referred to in this document as “cluster chips.” Nucleic acid molecules present in DNA colonies on cluster chips obtained according to these methods can provide templates for sequencing reactions, for example, as described in WO 98/44151. The products of solid phase amplification reactions, such as those described in WO 98/44151 and WO 00/18957, are so-called “bridge” structures formed by annealing pairs of immobilized polynucleotide chains and immobilized complementary strands, both types of chains being attached to a solid support on 5' end. In order to provide more suitable templates for nucleic acid sequencing, it is preferred to remove substantially all or at least a portion of one of the immobilized strands in the bridge structure in order to obtain a template that is at least partially single-stranded. The portion of the template that is single-stranded will thus be available for hybridization with the sequencing primer. The process of removing all or part of one immobilized strand in a bridged double-stranded nucleic acid structure is called “linearization.” There are various linearization methods including, but not limited to, enzymatic digestion, photochemical digestion, or chemical digestion. Non-limiting examples of linearization methods are disclosed in PCT Publication No. WO 2007/010251, US Patent Publication No. 2009/0088327, US Patent Publication No. 2009/0118128, and US Patent Application No. 62/671816, which are incorporated by reference in their entirety.
В некоторых воплощениях условие для снятия защиты или удаления 3’-ОН блокирующих групп также является совместимым с процессами линеаризации. В некоторых других воплощениях условие снятия защиты является совместимым с процессом химической линеаризации, который включает применение комплекса Pd и фосфина, например, Pd(OAc)2 и ТНР. В некоторых воплощениях комплекс Pd представляет собой комплекс Pd(II), который генерирует Pd(0) in situ в присутствии фосфина.In some embodiments, the condition for deprotection or removal of 3'-OH blocking groups is also compatible with linearization processes. In some other embodiments, the deprotection condition is compatible with a chemical linearization process that involves the use of a complex of Pd and a phosphine, for example, Pd(OAc) 2 and THP. In some embodiments, the Pd complex is a Pd(II) complex that generates Pd(0) in situ in the presence of phosphine.
Если не указано иное, ссылка на нуклеотиды также подразумевается применимой к нуклеозидам.Unless otherwise stated, reference to nucleotides is also intended to apply to nucleosides.
Меченые нуклеотидыLabeled nucleotides
Согласно одному аспекту данного раскрытия описанный 3’-ОН блокированный нуклеотид также содержит выявляемую метку, и такой нуклеотид называется меченым нуклеотидом. Метка (например, флуоресцентный краситель) может быть конъюгирована через возможный линкер посредством множества способов, включая гидрофобное притяжение, ионное притяжение и ковалентное присоединение. В некоторых аспектах красители конъюгируются с субстратом посрдством ковалентного присоединения. Более конкретно, ковалентное присоединение осуществляется посредством линкерной группы. В некоторых случаях такие меченые нуклеотиды также называются «модифицированными нуклеотидами».According to one aspect of this disclosure, the described 3'-OH blocked nucleotide also contains a detectable label, and such nucleotide is called a labeled nucleotide. A label (eg, a fluorescent dye) can be conjugated through a possible linker through a variety of methods, including hydrophobic attraction, ionic attraction, and covalent attachment. In some aspects, dyes are conjugated to a substrate through covalent attachment. More specifically, covalent attachment is accomplished through a linker group. In some cases, such labeled nucleotides are also called "modified nucleotides".
Меченые нуклеозиды и нуклеотиды являются полезными для мечения полинуклеотидов, образованных ферментативным синтезом, как, например, в качестве неограничивающего примера, в ПЦР-амплификации, изотермической амплификации, твердофазной амплификации, секвенировании полинуклеотидов (например, твердофазное секвенирование), реакциях ник-трансляции и тому подобных.Labeled nucleosides and nucleotides are useful for labeling polynucleotides formed by enzymatic synthesis, such as, by way of non-limiting example, in PCR amplification, isothermal amplification, solid-phase amplification, polynucleotide sequencing (e.g., solid-phase sequencing), nick-translation reactions, and the like .
В некоторых воплощениях данный краситель может ковалентно присоединяться колигонуклеотидам или нуклеотидам посредством нуклеотидного основания. Например, меченый нуклеотид или олигонуклеотид может иметь метку, присоединенную к С5 положению пиримидинового основания или к С7 положению 7-деазапуринового основания через линкерный фрагмент.In some embodiments, the dye may be covalently attached to oligonucleotides or nucleotides via a nucleotide base. For example, a labeled nucleotide or oligonucleotide may have a label attached to the C5 position of a pyrimidine base or to the C7 position of a 7-deazapurine base via a linker moiety.
Если не указано иное, ссылка на нуклеотиды также подразумевается как применимая к нуклеозидам. Настоящая заявка также будет дополнительно описана со ссылкой на ДНК, хотя данное описание также будет применимым к РНК, ПНК (пептидная нуклеиновая кислота) и другим нуклеиновым кислотам, если не указано иное.Unless otherwise indicated, reference to nucleotides is also intended to apply to nucleosides. The present application will also be further described with reference to DNA, although this description will also apply to RNA, PNA (peptide nucleic acid) and other nucleic acids unless otherwise noted.
ЛинкерыLinkers
В некоторых воплощениях, описанных в данном документе, пуриновое или пиримидиновое основание нуклеотидных или нуклеозидных молекул, описанных в данном документе, может быть связано с выявляемой меткой, как описано выше. В некоторых таких воплощениях используемые линкеры являются расщепляемыми. Применение расщепляемых линкеров обеспечивает то, что метка может, если требуется, удаляться после выявления, избегая какого-либо мешающего сигнала с любым меченым нуклеотидом или нуклеозидом, включенным далее. В некоторых воплощениях расщепляемый линкер содержит азидный фрагмент, -O-С2-С6 алкенильный фрагмент (например, -О-аллил), дисульфидный фрагмент, ацетальный фрагмент (такой же или аналогичный 3’-ацетальной блокирующей группе, описанной в данном документе) или тиокарбаматный фрагмент (такую же или аналогичную 3’-ацетальной блокирующей группе, описанной в данном документе).In some embodiments described herein, the purine or pyrimidine base of the nucleotide or nucleoside molecules described herein may be linked to a detectable label as described above. In some such embodiments, the linkers used are cleavable. The use of cleavable linkers ensures that the label can, if desired, be removed after detection, avoiding any interfering signal with any labeled nucleotide or nucleoside included below. In some embodiments, the cleavable linker contains an azide moiety, an -O-C 2 -C 6 alkenyl moiety (e.g., -O-allyl), a disulfide moiety, an acetal moiety (same or similar to the 3'-acetal blocking group described herein) or a thiocarbamate moiety (same or similar to the 3'-acetal blocking group described herein).
В некоторых других воплощениях используемые линкеры являются нерасщепляемыми. Поскольку в каждом случае, когда включается меченый нуклеотид по изобретению, затем не нужно включать нуклеотиды, и, таким образом, от данного нуклеотида не нужно удалять метку.In some other embodiments, the linkers used are non-cleavable. Because in each case where a labeled nucleotide of the invention is included, no nucleotides then need to be included, and thus no label needs to be removed from the given nucleotide.
В данной области известны расщепляемые линкеры, и для присоединения линкера к нуклеотидному основанию и метке можно применять традиционную химию. Данный линкер может расщепляться любым походящим способом, включая воздействие кислот, оснований, нуклеофилов, электрофилов, радикалов, металлов, восстановителей или окислителей, света, температуры, ферментов и т.д. Линкер, как обсуждается в данном документе, также может расщепляться тем же самым катализатором, используемым для расщепления связи 3’-О-блокирующей группы. Подходящие линкеры могут быть адаптированы из стандартных химических защитных групп, как раскрыто в Greene & Wuts, Protective Groups in Organic Synthesis, John Wiley & Sons. Другие подходящие расщепляемые линкеры, используемые в твердофазном синтезе, раскрываются в Guillier et al. (Chem. Rev. 100:2092-2157, 2000).Cleavable linkers are known in the art, and conventional chemistry can be used to attach the linker to the nucleotide base and tag. This linker can be cleaved by any suitable means, including exposure to acids, bases, nucleophiles, electrophiles, radicals, metals, reducing or oxidizing agents, light, temperature, enzymes, etc. The linker, as discussed herein, can also be cleaved by the same catalyst used to cleave the bond of the 3'-O-blocking group. Suitable linkers can be adapted from standard chemical protecting groups as disclosed in Greene & Wuts, Protective Groups in Organic Synthesis, John Wiley & Sons. Other suitable cleavable linkers used in solid phase synthesis are disclosed in Guillier et al. (Chem. Rev. 100:2092-2157, 2000).
Когда выявляемая метка присоединяется к основанию, линкер может присоединяться в любом положении на нуклеотидном основании, при условии, что все еще может осуществляться образование пар оснований по Уотсону-Крику. В контексте пуриновых оснований предпочтительным является, если линкер присоединяется посредством 7-положения пурина или предпочтительного деазапуринового аналога, через 8-модифицированный пурин, через N-6 модифицированный аденозин или N-2 модифицированный гуанин. Для пиримидинов присоединение предпочтительно осуществляется через 5-положение на цитозине, тимидине или урациле и N-4 положение на цитозине.When a detectable tag is attached to a base, the linker can attach at any position on the nucleotide base as long as Watson-Crick base pairing can still occur. In the context of purine bases, it is preferred if the linker is attached via the 7-position of a purine or a preferred deazapurine analogue, via an 8-modified purine, via an N-6 modified adenosine or an N-2 modified guanine. For pyrimidines, the attachment is preferably via the 5-position on cytosine, thymidine or uracil and the N-4 position on cytosine.
В некоторых воплощениях линкер может содержать спейсерное звено. Длина данного линкера не является важной, при условии, что метка удерживается на достаточном расстоянии от нуклеотида таким образом, чтобы не мешать какому-либо взаимодействию между нуклеотидом и ферментом, например, полимеразой.In some embodiments, the linker may contain a spacer unit. The length of a given linker is not important as long as the label is kept at a sufficient distance from the nucleotide so as not to interfere with any interaction between the nucleotide and an enzyme, such as a polymerase.
В некоторых воплощениях линкер может состоять из аналогичной функциональной группы, такой как 3’-ОН защитная группа. Это будет делать более эффективными снятие защиты и способ осуществления снятия защиты, так как будет требоваться только одна обработка для удаления как метки, так и защитной группы.In some embodiments, the linker may consist of a similar functional group, such as a 3'-OH protecting group. This will make the deprotection and deprotection process more efficient since only one processing will be required to remove both the label and the protecting group.
Применение термина «расщепляемый линкер» не означает то, что он подразумевает, что требуется удаление целого линкера. Сайт расщепления может быть расположен в положении на линкере, которое обеспечивает то, что часть линкера остается присоединенной к группировке красителя и/или субстрата после расщепления. Расщепляемые линкеры, в качестве неограничивающего примера, могут представлять собой электрофильно расщепляемые линкеры, нуклеофильно расщепляемые линкеры, фоторасщепляемые линкеры, расщепляемые при восстановительных условиях (например, линкеры, содержащие дисульфид или азид), окислительных условиях, расщепляемые посредством применения линкеров с защелкой или расщепляемые посредством механизмов элиминации. Применение расщепляемого линкера для присоединения соединения-красителя к группировке субстрата обеспечивает то, что метка, если требуется, может быть удалена после выявления, избегая какого-либо мешающего сигнала на последующих стадиях.The use of the term "cleavable linker" is not intended to imply that removal of the entire linker is required. The cleavage site may be located at a position on the linker that ensures that a portion of the linker remains attached to the dye and/or substrate moiety after cleavage. Cleavable linkers, by way of non-limiting example, can be electrophilically cleavable linkers, nucleophilically cleavable linkers, photocleavable linkers, cleavable under reducing conditions (e.g., disulfide or azide containing linkers), oxidative conditions, cleavable through the use of latch linkers, or cleavable through mechanisms elimination. The use of a cleavable linker to attach the dye compound to the substrate moiety ensures that the label, if required, can be removed after detection, avoiding any interfering signal in subsequent steps.
Полезные линкерные группы можно найти в публикации РСТ № WO 2004/018493 (включенной в данный документ посредством ссылки), примеры которых включают линкеры, которые могут расщепляться с использованием водорастворимых фосфинов или водорастворимых катализаторов на основе переходных металлов, образованных из переходного металла и по меньшей мере частично водорастворимых лигандов, например, комплекса Pd(II) и ТНР. В водном растворе последние образуют по меньшей мере частично водорастворимые комплексы переходного металла. Такие расщепляемые линкеры можно использовать для соединения оснований нуклеотидов с метками, такими как красители, изложенные в данном документе.Useful linker groups can be found in PCT Publication No. WO 2004/018493 (incorporated herein by reference), examples of which include linkers that can be cleaved using water-soluble phosphines or water-soluble transition metal catalysts formed from a transition metal and at least partially water-soluble ligands, for example, the Pd(II) complex and THP. In aqueous solution, the latter form at least partially water-soluble transition metal complexes. Such cleavable linkers can be used to connect nucleotide bases to labels, such as the dyes set forth herein.
Конкретные линкеры включают линкеры, раскрытые в публикации РСТ № WO 2004/018493 (включена в данный документ посредством ссылки), такие как линкеры, которые включают фрагменты следующих формул:Specific linkers include those disclosed in PCT Publication No. WO 2004/018493 (incorporated herein by reference), such as linkers that include portions of the following formulas:
(где X выбран из группы, содержащей О, S, NH и NQ, где Q представляет собой С1-10 замещенную или незамещенную алкильную группу, Y выбран из группы, содержащей О, S, NH и N(аллил), Т представляет собой водород или С1-10 замещенную или незамещенную алкильную группу, и * указывает, где данный фрагмент соединен с остальной частью нуклеотида или нуклеозида). В некоторых аспектах линкеры соединяют основания нуклеотидов с метками, такими как, например, соединения-красители, описанные в данном документе.(where X is selected from the group containing O, S, NH and NQ, where Q is a C 1-10 substituted or unsubstituted alkyl group, Y is selected from the group containing O, S, NH and N(allyl), T is hydrogen or a C 1-10 substituted or unsubstituted alkyl group, and * indicates where the fragment is connected to the rest of the nucleotide or nucleoside). In some aspects, linkers connect nucleotide bases to tags, such as, for example, dye compounds described herein.
Дополнительные примеры линкеров включают линкеры, раскрытые в публикации США №2016/0040225 (включена в данный документ посредством ссылки), такие как линкеры, включающие фрагменты следующих формул:Additional examples of linkers include those disclosed in US Publication No. 2016/0040225 (incorporated herein by reference), such as linkers comprising portions of the following formulas:
Линкерные фрагменты, проиллюстрированные в данном документе, могут содержать полную или частичную структуру линкера между нуклеотидами/нуклеозидами и метками.The linker moieties illustrated herein may contain full or partial linker structure between nucleotides/nucleosides and tags.
Дополнительные примеры линкеров («L») включают фрагменты следующих формул:Additional examples of linkers (“L”) include portions of the following formulas:
где В представляет собой нуклеиновое основание; Z представляет собой -N3 (азидо), -О-C1-C6 алкил, -O-С2-С6 алкенил или -O-С2-С6 алкинил; и FI содержит флуоресцентную метку, которая может содержать дополнительную линкерную структуру. Обычному специалисту в данной области понятно то, что метка ковалентно связывается с линкером посредством осуществления взаимодействия функциональной группы метки (например, карбоксил) с функциональной группой линкера (например, амино). where B represents a nucleic base; Z represents -N 3 (azido), -O-C 1 -C 6 alkyl, -O-C 2 -C 6 alkenyl or -O-C 2 -C 6 alkynyl; and FI contains a fluorescent label, which may contain an additional linker structure. One of ordinary skill in the art will appreciate that a label is covalently linked to a linker by reacting a functional group of the label (eg, carboxyl) with a functional group of the linker (eg, amino).
В конкретных воплощениях длина линкера между флуоресцентным красителем (флуорофор) и гуаниновым основанием может быть изменена, например, введением полиэтиленгликолевой спейсерной группы, увеличивая, посредством этого, интенсивность флуоресценции по сравнению с таким же флуорофором, присоединенным к гуаниновому основанию через другие связи, известные в данной области. Типичные линкеры и их свойства излагаются в публикации РСТ № WO 2007020457 (включена в данный документ посредством ссылки). Конструкция линкеров и особенно их увеличенная длина могут обеспечивать улучшения в яркости флуорофоров, присоединенных к гуаниновым основаниям гуанозиновых нуклеотидов при включении в полинуклеотиды, такие как ДНК. Таким образом, когда краситель предназначен для применения в любом способе анализа, в котором требуется выявление метки флуоресцентного красителя, присоединенной к гуанинсодержащему нуклеотиду, полезным является, если линкер содержит спейсерную группу формулы -((СН2)2O)n- где n представляет собой целое число от 2 до 50, как описано в WO 2007/020457.In specific embodiments, the length of the linker between the fluorescent dye (fluorophore) and the guanine base can be changed, for example, by introducing a polyethylene glycol spacer group, thereby increasing the fluorescence intensity compared to the same fluorophore attached to the guanine base through other linkages known in the art. areas. Typical linkers and their properties are set forth in PCT Publication No. WO 2007020457 (incorporated herein by reference). The design of the linkers, and especially their increased length, can provide improvements in the brightness of fluorophores attached to the guanine bases of guanosine nucleotides when incorporated into polynucleotides such as DNA. Thus, when the dye is intended for use in any assay that requires detection of a fluorescent dye tag attached to a guanine-containing nucleotide, it is useful if the linker contains a spacer group of the formula -((CH 2 ) 2 O) n - where n is an integer from 2 to 50, as described in WO 2007/020457.
Нуклеозиды и нуклеотиды могут быть мечеными в сайтах на сахаре или нуклеиновом основании. Как известно в данной области, «нуклеотид» состоит из азотистого основания, сахара и одной или более чем одной фосфатной группы. В РНК сахаром является рибоза, а в ДНК - дезоксирибоза, т.е. сахар, не имеющий гидроксильной группы, которая присутствует в рибозе. Азотистое основание представляет собой производное пурина или пиримидина. Пуринами являются аденин (А) и гуанин (G), а пиримидинами являются цитозин (С) и тимин (Т) или, в контексте РНК - урацил (U). Атом С-1 дезоксирибозы связывается с N-1 пиримидина или N-9 пурина. Нуклеотид также представляет собой сложный фосфатный эфир нуклеозида с этерификацией, происходящей на гидроксильной группе, присоединенной к С-3 или С-5 сахара. Нуклеотиды обычно представляют собой моно-, ди- или трифосфаты.Nucleosides and nucleotides can be labeled at sites on the sugar or nucleic acid base. As is known in the art, a "nucleotide" consists of a nitrogenous base, a sugar, and one or more phosphate groups. In RNA the sugar is ribose, and in DNA it is deoxyribose, i.e. a sugar that does not have a hydroxyl group, which is present in ribose. The nitrogenous base is a purine or pyrimidine derivative. Purines are adenine (A) and guanine (G), and pyrimidines are cytosine (C) and thymine (T) or, in the context of RNA, uracil (U). The C-1 atom of deoxyribose binds to N-1 of pyrimidine or N-9 of purine. A nucleotide is also a phosphate ester of a nucleoside with esterification occurring on the hydroxyl group attached to the C-3 or C-5 of the sugar. Nucleotides are usually mono-, di- or triphosphates.
«Нуклеозид» является структурно сходным с нуклеотидом, но у него отсутствуют фосфатные фрагменты. Примером аналога нуклеозида был бы аналог, в котором метка связывается с основанием, и отсутствует фосфатная группа, присоединенная к молекуле сахара.A "nucleoside" is structurally similar to a nucleotide, but lacks the phosphate moieties. An example of a nucleoside analog would be one in which the label binds to the base and there is no phosphate group attached to the sugar molecule.
Хотя основание обычно называют пурином или пиримидином, специалисту будет понятно то, что доступны производные и аналоги, которые не изменяют способность нуклеотида или нуклеозида к образованию пар оснований по Уотсону-Крику. «Производное» или «аналог» означает соединение или молекулу, структура ядра которой является такой же или имеет близкое сходство со структурой родительского соединения, но которое имеет химическую или физическую модификацию, такую как, например, другая или дополнительная боковая группа, которая позволяет производному нуклеотида или нуклеозида связываться с другой молекулой. Например, данное основание может представлять собой деазапурин. В конкретных воплощениях данные производные должны быть способны к образованию пар по Уотсону-Крику. «Производное» и «аналог» также включает, например, синтетическое производное нуклеотида или нуклеозида, имеющее модифицированные фрагменты основания и/или модифицированные фрагменты сахара. Такие производные и аналоги обсуждаются, например, в Scheit, Nucleotide analogs (John Wiley & Son, 1980) и Uhlman et al., Chemical Reviews 90:543-584, 1990. Аналоги нуклеотидов также могут содержать модифицированные фосфодиэфирные связи, включающие фосфоротиоатные, фосфородитиоатные, алкилфосфонатные, фосфоранилидатные, фосфорамидатные связи и тому подобные.Although the base is commonly referred to as a purine or pyrimidine, one skilled in the art will appreciate that derivatives and analogs are available that do not alter the Watson-Crick base pairing ability of the nucleotide or nucleoside. "Derivative" or "analogue" means a compound or molecule whose core structure is the same or closely similar to the structure of the parent compound, but which has a chemical or physical modification, such as, for example, a different or additional side group that allows the nucleotide to be derived or nucleoside to bind to another molecule. For example, the base may be deazapurine. In specific embodiments, these derivatives must be capable of forming Watson-Crick pairs. "Derivative" and "analog" also include, for example, a synthetic derivative of a nucleotide or nucleoside having modified base moieties and/or modified sugar moieties. Such derivatives and analogs are discussed, for example, in Scheit, Nucleotide analogs (John Wiley & Son, 1980) and Uhlman et al., Chemical Reviews 90:543-584, 1990. Nucleotide analogs may also contain modified phosphodiester linkages, including phosphorothioate, phosphorodithioate , alkylphosphonate, phosphoranilidate, phosphoramidate bonds and the like.
Краситель может быть присоединен в любом положении на нуклеотидном основании, например, через линкер. В конкретных воплощениях образование пар оснований по Уотсону-Крику все еще может осуществляться для образующегося в результате аналога. Конкретные сайты мечения нуклеинового основания включают положение С5 пиримидинового основания или положение С7 7-деазапуринового основания. Как описано выше, линкерную группу можно использовать для ковалентного присоединения красителя к нуклеозиду или нуклеотиду.The dye can be attached at any position on the nucleotide base, for example through a linker. In certain embodiments, Watson-Crick base pairing can still be performed for the resulting analogue. Specific nucleobase labeling sites include the C5 position of the pyrimidine base or the C7 position of the 7-deazapurine base. As described above, a linker group can be used to covalently attach a dye to a nucleoside or nucleotide.
В конкретных воплощениях меченый нуклеозид или нуклеотид может быть ферментативно включаемым и ферментативно удлиняемым. Соответственно, линкерный фрагмент может иметь достаточную длину для соединения нуклеотида с соединением, таким образом, что данное соединение не мешает значительно общему связыванию и распознаванию нуклеотида ферментом репликации нуклеиновой кислоты. Таким образом, данный линкер также может содержать спейсерный элемент. Данный спейсер, например, помещает на расстоянии нуклеотидное основание от сайта расщепления или метки.In specific embodiments, the labeled nucleoside or nucleotide may be enzymatically incorporated and enzymatically extended. Accordingly, the linker fragment may be of sufficient length to connect a nucleotide to a compound such that the connection does not significantly interfere with the overall binding and recognition of the nucleotide by the nucleic acid replication enzyme. Thus, this linker may also contain a spacer element. This spacer, for example, places a nucleotide base at a distance from the cleavage site or tag.
Нуклеозиды или нуклеотиды, меченные красителями, описанными в данном документе, могут иметь следующую формулу:Nucleosides or nucleotides labeled with the dyes described herein may have the following formula:
где, Dye представляет собой соединение-краситель, В представляет собой нуклеиновое основание, такое как, например, урацил, тимин, цитозин, аденин, гуанин и тому подобные; L представляет собой возможную линкерную группу, которая может присутствовать или может не присутствовать; R' может представлять собой Н, монофосфат, дифосфат, трифосфат, тиофосфат, аналог сложного фосфатного эфира, -О-, присоединенный к реакционноспособной фосфоросодержащей группе, или -О-, защищенный блокирующей группой; R''' может представлять собой Н, ОН, фосфорамидит, или 3’-ОН блокирующую группу, описанную в данном документе, и R" представляет собой Н или ОН. Когда R''' представляет собой фосфорамидит, R' представляет собой кислоторасщепляемую гидрокси защитную группу, которая обеспечивает последующее связывание мономера при условиях автоматического синтеза.wherein Dye is a dye compound, B is a nucleic acid base such as, for example, uracil, thymine, cytosine, adenine, guanine and the like; L represents a possible linker group which may or may not be present; R' may be H, monophosphate, diphosphate, triphosphate, thiophosphate, phosphate ester analog, -O- attached to a reactive phosphorus-containing group, or -O- protected by a blocking group; R'' may be H, OH, phosphoramidite, or a 3'-OH blocking group as described herein, and R" is H or OH. When R''' is phosphoramidite, R' is an acid-cleavable hydroxy a protecting group that ensures subsequent binding of the monomer under automatic synthesis conditions.
В конкретном воплощении присутствуют и линкер (между красителем и нуклеотидом), и блокирующая группа, и они являются отдельными фрагментами. В конкретных воплощениях и линкер, и блокирующая группа являются расщепляемыми при по существу аналогичных условиях. Таким образом, способы снятия защиты и снятия блокировки могут быть более эффективными, так как будет требоваться только одна обработка для удаления и соединения-красителя, и блокирующей группы. Однако в некоторых воплощениях линкеру и блокирующей группе не нужно быть расщепляемыми при аналогичных условиях, вместо этого они являются индивидуально расщепляемыми при отличных условиях.In a particular embodiment, both a linker (between the dye and the nucleotide) and a blocking group are present and are separate moieties. In certain embodiments, both the linker and the blocking group are cleavable under substantially similar conditions. Thus, the deprotection and deblocking methods may be more efficient since only one treatment will be required to remove both the dye compound and the blocking group. However, in some embodiments, the linker and blocking group do not need to be cleavable under similar conditions, but instead are individually cleavable under different conditions.
Данное раскрытие также охватывает полинуклеотиды, включающие соединения-красители. Такие полинуклеотиды могут представлять собой ДНК или РНК, содержащие, соответственно, дезоксирибонуклеотиды или рибонуклеотиды, соединенные в фосфодиэфирной связи. Полинуклеотиды могут содержать встречающиеся в природе нуклеотиды, нуклеотиды, не встречающиеся в природе (или модифицированные), отличные от меченых нуклеотидов, описанных в данном документе, или любую их комбинацию в комбинации с по меньшей мере одним модифицированным нуклеотидом (например, меченным соединением-красителем), как изложено в данном документе. Полинуклеотиды согласно данному раскрытию также могут включать неприродные связи остова и/или ненуклеотидные химические модификации. Химерные структуры, состоящие из смесей рибонуклеотидов и дезоксирибонуклеотидов, содержащие по меньшей мере один меченый нуклеотид, также рассматриваются.This disclosure also covers polynucleotides including dye compounds. Such polynucleotides may be DNA or RNA containing, respectively, deoxyribonucleotides or ribonucleotides linked in a phosphodiester bond. The polynucleotides may contain naturally occurring nucleotides, non-naturally occurring (or modified) nucleotides other than the labeled nucleotides described herein, or any combination thereof in combination with at least one modified nucleotide (e.g., a labeled dye compound) , as set forth in this document. The polynucleotides of this disclosure may also include non-natural backbone linkages and/or non-nucleotide chemical modifications. Chimeric structures consisting of mixtures of ribonucleotides and deoxyribonucleotides containing at least one labeled nucleotide are also contemplated.
Неограничивающие типичные меченые нуклеотиды, как описано в данном документе, включают следующие: Non-limiting exemplary labeled nucleotides as described herein include the following:
где L представляет линкер, и R представляет остаток сахара, как описано выше, или остаток сахара с 5'-положением, замещенным одним, двумя или тремя фосфатами.where L represents a linker and R represents a sugar residue as described above, or a sugar residue with the 5' position substituted by one, two or three phosphates.
В некоторых воплощениях неограничивающие типичные конъюгаты с флуоресцентными красителями показаны ниже:In some embodiments, non-limiting typical fluorescent dye conjugates are shown below:
где PG означает группы, блокирующие 3' гидрокси, описанные в данном документе. В любых воплощениях меченого нуклеотида, описанного в данном документе, данный нуклеотид представляет собой нуклеотидтрифосфат.where PG refers to the 3' hydroxy blocking groups described herein. In any embodiments of the labeled nucleotide described herein, the nucleotide is a nucleotide triphosphate.
НаборыSets
Согласно настоящему раскрытию также предложены наборы, включающие один или более чем один 3' блокированный нуклеозид и/или нуклеотид, описанный в данном документе, например, 3' блокированный нуклеотид Формулы (I), (Ia) или (II). Такие наборы обычно будут включать по меньшей мере один 3' блокированный нуклеотид или нуклеозид, меченный красителем, наряду с по меньшей мере одним дополнительным компонентом. Дополнительный(ные) компонент(ты) может(гут) представлять собой один или более чем один компонент, идентифицированный в способе, изложенном в данном документе, или в разделе Примеров ниже. Некоторые неограничивающие примеры компонентов, которые могут быть объединены в набор по настоящему раскрытию, излагаются ниже.The present disclosure also provides kits comprising one or more 3' blocked nucleosides and/or nucleotides described herein, for example, a 3' blocked nucleotide of Formula (I), (Ia) or (II). Such kits will typically include at least one 3' blocked nucleotide or dye-labeled nucleoside, along with at least one additional component. The additional component(s) may be one or more than one component identified in the method set forth herein or in the Examples section below. Some non-limiting examples of components that may be combined in the present disclosure are set forth below.
В конкретном воплощении набор может включать по меньшей мере один меченый 3' блокированный нуклеотид или нуклеозид совместно с мечеными или немечеными нуклеотидами или нуклеозидами. Например, нуклеотиды, меченные красителями, могут быть поставлены в комбинации с немечеными или природными нуклеотидами и/или с флуоресцентно мечеными нуклеотидами или их любой комбинацией. Комбинации нуклеотидов могут быть предоставлены в виде отдельных индивидуальных компонентов (например, один тип нуклеотида на сосуд или пробирку) или в виде смесей нуклеотидов (например, два или более чем два нуклеотида, смешанных в том те самом сосуде или пробирке).In a particular embodiment, the kit may include at least one labeled 3' blocked nucleotide or nucleoside together with labeled or unlabeled nucleotides or nucleosides. For example, dye-labeled nucleotides may be provided in combination with unlabeled or naturally occurring nucleotides and/or fluorescently labeled nucleotides or any combination thereof. Combinations of nucleotides may be provided as separate individual components (eg, one type of nucleotide per vial or tube) or as mixtures of nucleotides (eg, two or more than two nucleotides mixed in the same vial or tube).
Когда наборы содержат множество, в частности, два или три, или более, в частности, четыре 3' блокированных нуклеотида, меченных соединением-красителем, разные нуклеотиды могут быть меченными разными соединениями-красителями, или один может быть темным - без соединений-красителей. Когда разные нуклеотиды являются меченными разными соединениями-красителями, характеристикой данных наборов является именно то, что соединения-красители представляют собой спектрально различимые флуоресцентные красители. Термин «спектрально различимые флуоресцентные красители» в том виде, в котором он используется в данном документе, относится к флуоресцентным красителям, которые испускают флуоресцентную энергию при длинах волн, которые могут быть различены оборудованием для выявления флуоресценции (например, имеющаяся в продаже платформа секвенирования ДНК на основе капилляров) при присутствии в одном образце двух или более чем двух таких красителей. Когда два нуклеотида, меченных соединениями-флуоресцентными красителями, поставляются в виде набора, характеристикой некоторых воплощений является именно то, что спектрально различимые флуоресцентные красители могут быть возбуждены при одинаковой длине волны, как, например, посредством того же самого лазера. Когда четыре 3' блокированных нуклеотида (А, С, Т и G), меченных соединениями-флуоресцентными красителями, поставляются в виде набора, характеристикой некоторых воплощений является именно то, что два из спектрально различимых флуоресцентных красителей могут быть оба возбуждены при одной длине волны, а другие два спектрально различимых красителя могут быть оба возбуждены при другой длине волны. Конкретными длинами волн возбуждения являются 488 нм и 532 нм.When the arrays contain multiple, in particular two or three or more, in particular four 3' blocked nucleotides labeled with a dye compound, different nucleotides may be labeled with different dye compounds, or one may be dark without dye compounds. When different nucleotides are labeled with different dye compounds, the characteristic of these kits is that the dye compounds are spectrally distinguishable fluorescent dyes. The term "spectrally detectable fluorescent dyes" as used herein refers to fluorescent dyes that emit fluorescent energy at wavelengths that can be detected by fluorescence detection equipment (e.g., a commercially available DNA sequencing platform on capillary base) in the presence of two or more than two such dyes in one sample. When two nucleotides labeled with fluorescent dye compounds are supplied as a set, it is a feature of some embodiments that the spectrally distinct fluorescent dyes can be excited at the same wavelength, such as by the same laser. When four 3' blocked nucleotides (A, C, T and G) labeled with fluorescent dye compounds are supplied as a set, a characteristic of some embodiments is that two of the spectrally distinguishable fluorescent dyes can both be excited at the same wavelength, and the other two spectrally distinct dyes can both be excited at a different wavelength. The specific excitation wavelengths are 488 nm and 532 nm.
В одном воплощении набор включает первый 3' блокированный нуклеотид, меченный первым красителем, и второй нуклеотид, меченный вторым красителем, где данные красители имеют различие в максимуме поглощения по меньшей мере 10 нм, в частности, от 20 нм до 50 нм. Более конкретно два данных соединения-красителя имеют Стоксовы сдвиги от 15 до 40 нм, где «стоксов сдвиг» представляет собой расстояние между длинами волн пика поглощения и пика испускания.In one embodiment, the kit includes a first 3' blocked nucleotide labeled with a first dye and a second nucleotide labeled with a second dye, wherein the dyes have a difference in absorbance maximum of at least 10 nm, in particular from 20 nm to 50 nm. More specifically, the two dye compounds have Stokes shifts of 15 to 40 nm, where the “Stokes shift” is the distance between the wavelengths of the absorption peak and the emission peak.
В альтернативном воплощении наборы по данному раскрытию могут содержать 3’-блокированные нуклеотиды, где то же самое основание мечено двумя или более чем двумя разными красителями. Первый нуклеотид (например, 3' блокированный нуклеотидтрифосфат Т или 3' блокированный нуклеотидтрифосфат G) может метиться первым красителем. Второй нуклеотид (например, 3' блокированный нуклеотидтрифосфат С) может метиться вторым красителем, спектрально отличным от первого красителя, например, «зеленым» красителем, поглощающим при меньше, чем 600 нм, и «синим» красителем, поглощающим при меньше, чем 500 нм, например, при 400-500 нм, в частности 450-460 нм). Третий нуклеотид (например, 3' блокированный нуклеотидтрифосфат А) может метиться в виде смеси первого и второго красителей или смеси первого, второго и третьего красителей, а четвертый нуклеотид (например, 3' блокированный нуклеотидтрифосфат G или 3' блокированный нуклеотидтрифосфат Т) может быть «темным» и не содержит метки. В одном примере нуклеотиды 1-4 могут быть меченными «синим», «зеленым», «сине-зеленым» и темным. Для дальнейшего упрощения оборудования четыре нуклеотида могут метиться двумя красителями, возбуждаемыми одним лазером, и, таким образом, мечение нуклеотидов 1-4 может представлять собой «синий 1», «синий 2», «синий 1/синий 2» и темный.In an alternative embodiment, the kits of this disclosure may contain 3'-blocked nucleotides, where the same base is labeled with two or more different dyes. A first nucleotide (eg, 3' blocked nucleotide triphosphate T or 3' blocked nucleotide triphosphate G) may be labeled with a first dye. The second nucleotide (e.g., 3' blocked nucleotide triphosphate C) may be labeled with a second dye that is spectrally different from the first dye, for example, a “green” dye that absorbs at less than 600 nm and a “blue” dye that absorbs at less than 500 nm , for example, at 400-500 nm, in particular 450-460 nm). The third nucleotide (e.g., 3' blocked nucleotide triphosphate A) may be labeled as a mixture of the first and second dyes or a mixture of the first, second and third dyes, and the fourth nucleotide (e.g., 3' blocked nucleotide triphosphate G or 3' blocked nucleotide triphosphate T) may be " dark" and does not contain a label. In one example, nucleotides 1-4 may be labeled blue, green, blue-green, and dark. To further simplify the equipment, four nucleotides can be labeled with two dyes excited by a single laser, and thus the labeling of nucleotides 1-4 can be blue 1, blue 2, blue 1/blue 2, and dark.
В конкретных воплощениях данные наборы могут содержать четыре меченых 3' блокированных нуклеотида (например, А, С, Т, G), где каждый тип нуклеотида содержит такую же 3' блокирующую группу и флуоресцентную метку, и где каждая флуоресцентная метка имеет отличный максимум флуоресценции, и каждая из флуоресцентных меток отличается от других трех меток. Данные наборы могут быть такими, что две или более чем две флуоресцентные метки имеют аналогичный максимум поглощения, но отличный стоксов сдвиг. В некоторых других воплощениях один тип нуклеотида является немеченым.In specific embodiments, these kits may contain four labeled 3' blocked nucleotides (e.g., A, C, T, G), where each type of nucleotide contains the same 3' blocking group and a fluorescent label, and where each fluorescent label has a different fluorescence maximum, and each of the fluorescent marks is different from the other three marks. These arrays may be such that two or more than two fluorescent labels have a similar absorption maximum but a different Stokes shift. In some other embodiments, one type of nucleotide is unlabeled.
Хотя наборы и иллюстрируются в данном документе примерами в отношении конфигураций, имеющих разные нуклеотиды, которые метятся разными соединениями-красителями, будет понятно то, что данные наборы могут включать 2, 3, 4 или более разных нуклеотидов, которые имеют такое же соединение-краситель. В некоторых воплощениях данный набор также включает фермент и подходящий для действия фермента буфер. В некоторых таких воплощениях фермент представляет собой полимеразу, терминальную дезоксинуклеотидилтрансферазу или обратную транскриптазу. В конкретных воплощениях данный фермент представляет собой ДНК-полимеразу, такую как ДНК-полимераза 812 (Pol 812) или ДНК-полимераза 1901 (Pol 1901). Аминокислотные последовательности полимераз Pol 812 и Pol 1901 описываются, например, в заявках на патент США №16/670876, поданной 31 октября 2019 г., и 16/703569, поданной 4 декабря 2019 г., которые обе включаются в данный документ посредством ссылки.Although the sets are exemplified herein with respect to configurations having different nucleotides that are labeled with different dye compounds, it will be appreciated that the sets may include 2, 3, 4 or more different nucleotides that have the same dye compound. In some embodiments, the kit also includes an enzyme and a buffer suitable for the action of the enzyme. In some such embodiments, the enzyme is a polymerase, terminal deoxynucleotidyl transferase, or reverse transcriptase. In specific embodiments, the enzyme is a DNA polymerase, such as DNA polymerase 812 (Pol 812) or DNA polymerase 1901 (Pol 1901). The amino acid sequences of the polymerases Pol 812 and Pol 1901 are described, for example, in US patent applications No. 16/670876, filed October 31, 2019, and 16/703569, filed December 4, 2019, both of which are incorporated herein by reference.
Другие компоненты, подлежащие включению в такие наборы, могут включать буферы и тому подобное. Нуклеотиды по настоящему раскрытию и любые другие нуклеотидные компоненты, включающие смеси разных нуклеотидов, могут быть предоставлены в данном наборе в концентрированном виде для разведения перед применением. В таких воплощениях также может быть включен подходящий буфер для разведения. Опять-таки, в набор по настоящему раскрытию может быть включен один или более чем один компонент, идентифицированный в способе, изложенном в данном документе.Other components to be included in such kits may include buffers and the like. The nucleotides of the present disclosure and any other nucleotide components, including mixtures of different nucleotides, may be provided in this kit in concentrated form for dilution before use. In such embodiments, a suitable dilution buffer may also be included. Again, one or more than one components identified in the method set forth herein may be included in the kit of the present disclosure.
Способы секвенированияSequencing methods
Меченые нуклеотиды или нуклеозиды согласно настоящему раскрытию можно использовать в любом способе анализа, таком как способ, который включает выявление флуоресцентной метки, присоединенной к нуклеотиду или нуклеозиду, независимо от того, самой ли по себе или включенной в или ассоциированной с большей молекулярной структурой или конъюгатом. В данном контексте термин «включенный в полинуклеотид» может означать то, что 5'-фосфат соединяется в фосфодиэфирной связи с 3’-ОН группой второго (модифицированного или немодифицированного) нуклеотида, который сам может образовать часть более длинной полинуклеотидной цепи. 3' конец нуклеотида, изложенного в данном документе, может быть связан или может не быть связан в фосфодиэфирной связи с 5'-фосфатом другого (модифицированного или немодифицированного) нуклеотида. Таким образом, в одном неограничивающем воплощении согласно данному раскрытию предложен способ выявления нуклеотида, включенного в полинуклеотид, который включает: (а) включение по меньшей мере одного нуклеотида по раскрытию в полинуклеотид и (b) выявление нуклеотида(дов), включенного(ных) в данный полинуклеотид посредством выявления флуоресцентного сигнала от соединения-красителя, присоединенного к указанному(ным) нуклеотиду(дам).The labeled nucleotides or nucleosides of the present disclosure can be used in any assay method, such as a method that involves detecting a fluorescent label attached to the nucleotide or nucleoside, whether alone or included in or associated with a larger molecular structure or conjugate. As used herein, the term "embedded in a polynucleotide" may mean that the 5'-phosphate is linked in a phosphodiester bond to the 3'-OH group of a second (modified or unmodified) nucleotide, which itself may form part of a longer polynucleotide chain. The 3' end of a nucleotide set forth herein may or may not be linked in a phosphodiester bond to the 5'-phosphate of another (modified or unmodified) nucleotide. Thus, in one non-limiting embodiment according to this disclosure, there is provided a method for detecting a nucleotide included in a polynucleotide, which includes: (a) including at least one nucleotide of the disclosure in the polynucleotide and (b) identifying the nucleotide(s) included in a given polynucleotide by detecting a fluorescent signal from a dye compound attached to said nucleotide(s).
Данный способ может включать: стадию синтеза (а), в которой один или более чем один нуклеотид согласно данному раскрытию включается в полинуклеотид, и стадию выявления (b), в которой один или более чем один нуклеотид, включенный в полинуклеотид, выявляется посредством выявления или количественного измерения их флуоресценции.The method may include: a synthesis step (a), in which one or more than one nucleotide according to this disclosure is included in a polynucleotide, and a detection step (b), in which one or more than one nucleotide included in the polynucleotide is detected by detection or quantitative measurement of their fluorescence.
Некоторые воплощения настоящей заявки направлены на способы секвенирования, включающие: (а) включение по меньшей мере одного меченого нуклеотида, как описано в данном документе, в полинуклеотид и (b) выявление меченого(ных) нуклеотида(дов), включенного(ных) в данный полинуклеотид, посредством выявления флуоресцентного сигнала от нового флуоресцентного красителя, присоединенного куказанному(ным) полинуклеотиду(дам).Some embodiments of the present application are directed to sequencing methods comprising: (a) incorporating at least one labeled nucleotide as described herein into a polynucleotide and (b) identifying the labeled nucleotide(s) included in the polynucleotide. polynucleotide, by detecting a fluorescent signal from a new fluorescent dye attached to the specified polynucleotide(s).
Некоторые воплощения настоящего раскрытия относятся к способу определения последовательности целевого одноцепочечного полинуклеотида, включающему:Some embodiments of the present disclosure provide a method for determining the sequence of a target single-stranded polynucleotide, comprising:
(a) включение нуклеотида, содержащего 3’-ОН блокирующую группу и выявляемую метку, как описано в данном документе, в копию полинуклеотидной цепи, комплементарной по меньшей мере части целевой полинуклеотидной цепи;(a) incorporating a nucleotide containing a 3'-OH blocking group and a detectable tag as described herein into a copy of the polynucleotide chain complementary to at least a portion of the target polynucleotide chain;
(b) выявление идентичности нуклеотида, включенного в копию полинуклеотидной цепи; и(b) identifying the identity of a nucleotide included in a copy of the polynucleotide chain; And
(c) осуществление химического удаления метки и 3’-ОН блокирующей группы из нуклеотида, включенного в копию полинуклеотидной цепи.(c) effecting chemical removal of the tag and the 3'-OH blocking group from a nucleotide included in a copy of the polynucleotide chain.
В некоторых воплощениях способ секвенирования дополнительно включает (d) отмывку химически удаленной метки и 3' блокирующей группы от копии полинукеотидной цепи. В некоторых таких воплощениях 3' блокирующая группа и выявляемая метка удаляются перед введением следующего комплементарного нуклеотида. В некоторых других воплощениях 3' блокирующая группа и выявляемая метка удаляются за один этап химической реакции. В некотором воплощении стадия промывки (d) также удаляет не включенные нуклеотиды. В некоторых других воплощениях на стадии промывки после химического расщепления метки и 3' блокирующей группы также используется палладиевый акцептор радикалов.In some embodiments, the sequencing method further comprises (d) washing the chemically removed tag and 3' blocking group from a copy of the polynucleotide chain. In some such embodiments, the 3' blocking group and detectable tag are removed before introducing the next complementary nucleotide. In some other embodiments, the 3' blocking group and detectable tag are removed in a single chemical reaction step. In some embodiment, washing step (d) also removes unincorporated nucleotides. In some other embodiments, a palladium radical scavenger is also used in the washing step after chemical cleavage of the label and 3' blocking group.
В некоторых воплощениях стадии (a)-(d) повторяют, пока не определится последовательность части матричной полинуклеотидной цепи. В некоторых воплощениях стадии (a)-(d) повторяют по меньшей мере 50 раз, по меньшей мере 75 раз, по меньшей мере 100 раз, по меньшей мере 150 раз, по меньшей мере 200 раз, по меньшей мере 250 раз или по меньшей мере 300 раз.In some embodiments, steps (a)-(d) are repeated until the sequence of a portion of the template polynucleotide chain is determined. In some embodiments, steps (a)-(d) are repeated at least 50 times, at least 75 times, at least 100 times, at least 150 times, at least 200 times, at least 250 times, or at least at least 300 times.
В некоторых воплощениях метка и 3' блокирующая группа удаляются в двух отдельных химических реакциях. В некоторых таких воплощениях удаление метки от нуклеотида, включенного в копию полинуклеотидной цепи, включает приведение в контакт копии цепи, включающей данный включенный нуклеотид, с первым расщепляющим раствором. В некотором таком воплощении первый расщепляющий раствор содержит фосфин, такой как триал килфосфин. Неограничивающие примеры триалкилфосфинов включаютIn some embodiments, the tag and the 3' blocking group are removed in two separate chemical reactions. In some such embodiments, removing the label from a nucleotide included in a copy of the polynucleotide strand includes contacting the copy of the strand including the included nucleotide with a first digestion solution. In some such embodiment, the first cleavage solution contains a phosphine, such as trial kylphosphine. Non-limiting examples of trialkylphosphines include
трис(гидроксипропил)фосфин (ТНР), трис-(2-карбоксиэтил)фосфин (ТСЕР), трис(гидроксиметил)фосфин (ТНМР) или трис(гидроксиэтил)фосфин (ТНЕР). В одном воплощении первый расщепляющий раствор содержит ТНР. В некоторых таких воплощениях удаление 3' блокирующей группы из нуклеотида, включенного в копию полинуклеотидной цепи, включает приведение в контакт копии цепи, включающей данный включенный нуклеотид, со вторым расщепляющим раствором. В некоторых таких воплощениях второй расщепляющий раствор содержит палладиевый (Pd) катализатор. В некоторых других воплощениях Pd катализатор представляет собой Pd(0) катализатор. В некоторых таких воплощениях Pd(0) получают смешиванием комплекса Pd(II) [(PdCl(C3H5))2] с ТНР in situ. Молярное отношение комплекса Pd(II) и ТНР может составлять 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 или 1:10. В одном воплощении молярное отношение Pd:THP составляет 1:5. В некоторых других воплощениях можно добавлять один или более чем один восстановитель, такой как аскорбиновая кислота или ее соль (например, аскорбат натрия). В некоторых воплощениях второй расщепляющий раствор может содержать один или более чем один буферизующий реагент, такой как первичный амин, вторичный амин, третичный амин, карбонатная соль, фосфатная соль или боратная соль, или их комбинации. В некоторых других воплощениях буферизующий реагент содержит этаноламин (ЕА),tris(hydroxypropyl)phosphine (THP), tris-(2-carboxyethyl)phosphine (TCEP), tris(hydroxymethyl)phosphine (THMP) or tris(hydroxyethyl)phosphine (THEP). In one embodiment, the first cleavage solution contains THP. In some such embodiments, removing a 3' blocking group from a nucleotide included in a copy of the polynucleotide strand involves contacting the copy of the strand including the included nucleotide with a second cleavage solution. In some such embodiments, the second cleavage solution contains a palladium (Pd) catalyst. In some other embodiments, the Pd catalyst is a Pd(0) catalyst. In some such embodiments, Pd(0) is prepared by mixing the Pd(II) complex [(PdCl(C 3 H 5 )) 2 ] with THP in situ. The molar ratio of Pd(II) complex and THP can be 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 or 1:10. In one embodiment, the Pd:THP molar ratio is 1:5. In some other embodiments, one or more reducing agents, such as ascorbic acid or a salt thereof (eg, sodium ascorbate), can be added. In some embodiments, the second cleavage solution may contain one or more buffering reagents, such as a primary amine, a secondary amine, a tertiary amine, a carbonate salt, a phosphate salt, or a borate salt, or combinations thereof. In some other embodiments, the buffering reagent contains ethanolamine (EA),
трис(гидроксиметил)аминометан (Tris), глицин, карбонат натрия, фосфат натрия, борат натрия, 2-диметиламинометанол (DMEA), 2-диэтиламинометанол (DEEA), N,N,N',N'-тетраметилэтилендиамин (TEMED) или N,N,N',N'-тетраэтилэтилендиамин (TEEDA), или их комбинации. В одном воплощении буферизующий реагент представляет собой DEEA. В другом воплощении буферизующий реагент содержит одну или более чем одну неорганическую соль, такую как карбонатна соль, фосфатная соль или боратная соль, или их комбинации. В одном воплощении неорганическая соль представляет собой натриевую соль. В некоторых других воплощениях 3' блокированный нуклеотид содержит группу АОМ, а второй расщепляющий раствор содержит палладиевый (Pd) катализатор и один или более чем один буферизующий реагент, описанный в данном документе (например, третичный амин, такой как DEEA), и имеет рН от примерно 9,0 до примерно 10,0 (например, 9,6 или 9,8).tris(hydroxymethyl)aminomethane (Tris), glycine, sodium carbonate, sodium phosphate, sodium borate, 2-dimethylaminomethanol (DMEA), 2-diethylaminomethanol (DEEA), N,N,N',N'-tetramethylethylenediamine (TEMED) or N ,N,N',N'-tetraethylethylenediamine (TEEDA), or combinations thereof. In one embodiment, the buffering reagent is DEEA. In another embodiment, the buffering reagent contains one or more inorganic salts, such as a carbonate salt, a phosphate salt or a borate salt, or combinations thereof. In one embodiment, the inorganic salt is a sodium salt. In some other embodiments, the 3' blocked nucleotide contains an AOM group, and the second cleavage solution contains a palladium (Pd) catalyst and one or more than one buffering reagent described herein (e.g., a tertiary amine such as DEEA), and has a pH of about 9.0 to about 10.0 (for example, 9.6 or 9.8).
В некоторых альтернативных воплощениях метку и 3’-ОН блокирующую группу удаляют в одной химической реакции. В некоторых таких воплощениях метка присоединяется к нуклеотиду через расщепляемый линкер, содержащий такой же фрагмент, что и 3' блокирующая группа, например, и линкер, и 3' блокирующая группа могут содержать ацетальный фрагмент или тиокарбаматный фрагмент как описано в данном документе. В некотором таком воплощении одна химическая реакция проводится в расщепляющем растворе, содержащем Pd катализатор, описанный выше.In some alternative embodiments, the tag and the 3'-OH blocking group are removed in a single chemical reaction. In some such embodiments, the label is attached to the nucleotide through a cleavable linker containing the same moiety as the 3' blocking group, e.g., both the linker and the 3' blocking group may contain an acetal moiety or thiocarbamate fragment as described in this document. In some such embodiment, one chemical reaction is carried out in a cleavage solution containing the Pd catalyst described above.
В некоторых других воплощениях нуклеотиды, используемые на стадии включения (а), представляют собой полностью функционализированные нуклеотидтрифосфаты А, С, Т и G, причем каждый содержит 3' блокирующую группу, описанную в данном документе. В некоторых таких воплощениях нуклеотиды, описанные в данном документе, обеспечивают превосходную стабильность в растворе во время циклов секвенирования по сравнению с такими же нуклеотидами, защищенными стандартной 3’-О-азидометильной блокирующей группой. Например, ацетальная или тиокарбаматная блокирующие группы, раскрытые в данном документе, могут придавать по меньшей мере на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500%, 2000%, 2500% или 3000% улучшенную стабильность по сравнению с защищенной азидометилом 3’-ОН при тех же самых условиях в течение такого же периода времени, уменьшая, посредством этого, значения предфазирования и приводя к большим длинам считываемых фрагментов при секвенировании. В некоторых воплощениях стабильность измеряется при температуре окружающей среды или при температуре ниже температуры окружающей среды (такой как 4-10°С). В других воплощениях стабильность измеряется при повышенной температуре, такой как 40°С, 45°С, 50°С, 55°С, 60°С или 65°С. В некоторых таких воплощениях стабильность измеряется в растворе при основном рН среды, например, при рН 9,0; 9,2; 9,4; 9,6; 9,8 или 10,0. В некоторых других воплощениях значение предфазирования с 3' блокированным нуклеотидом, описанным в данном документе, составляет меньше, чем примерно 0,25; 0,24; 0,23; 0,22; 0,21; 0,20; 0,19; 0,18; 0,17; 0,16; 0,15; 0,14; 0,13; 0,12; 0,11; 0,10; 0,09; 0,08; 0,07; 0,06 или 0,05 после более чем 50, 100 или 150 циклов SBS. В некоторых других воплощениях значение предфазирования с 3' блокированным нуклеотидом составляет меньше, чем примерно 0,25; 0,24; 0,23; 0,22; 0,21; 0,20; 0,19; 0,18; 0,17; 0,16; 0,15; 0,14; 0,13; 0,12; 0,11; 0,10; 0,09; 0,08; 0,07; 0,06 или 0,05 после более чем 50, 100 или 150 циклов SBS. В одном воплощении каждый ffN содержит группу 3’-АОМ.In certain other embodiments, the nucleotides used in incorporation step (a) are fully functionalized nucleotide triphosphates A, C, T, and G, each containing a 3' blocking group as described herein. In some such embodiments, the nucleotides described herein provide superior stability in solution during sequencing runs compared to the same nucleotides protected by a standard 3'-O-azidomethyl blocking group. For example, acetal or thiocarbamate blocking groups disclosed herein can impart at least 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100 %, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500%, 2000%, 2500% or 3000% improved stability compared to azidomethyl protected 3'- OH under the same conditions for the same period of time, thereby reducing prephasing values and resulting in longer read lengths when sequencing. In some embodiments, stability is measured at ambient temperature or at a temperature below ambient temperature (such as 4-10°C). In other embodiments, stability is measured at elevated temperature, such as 40°C, 45°C, 50°C, 55°C, 60°C, or 65°C. In some such embodiments, stability is measured in solution at the basic pH of the environment, for example, pH 9.0; 9.2; 9.4; 9.6; 9.8 or 10.0. In some other embodiments, the prephasing value with the 3' blocked nucleotide described herein is less than about 0.25; 0.24; 0.23; 0.22; 0.21; 0.20; 0.19; 0.18; 0.17; 0.16; 0.15; 0.14; 0.13; 0.12; 0.11; 0.10; 0.09; 0.08; 0.07; 0.06 or 0.05 after more than 50, 100 or 150 SBS cycles. In some other embodiments, the 3' blocked nucleotide prephasing value is less than about 0.25; 0.24; 0.23; 0.22; 0.21; 0.20; 0.19; 0.18; 0.17; 0.16; 0.15; 0.14; 0.13; 0.12; 0.11; 0.10; 0.09; 0.08; 0.07; 0.06 or 0.05 after more than 50, 100 or 150 SBS cycles. In one embodiment, each ffN contains a 3'-AOM group.
В некоторых воплощениях 3' блокированные нуклеотиды, описанные в данном документе, обеспечивают превосходную скорость деблокирования в растворе после стадии химического расщепления цикла секвенирования, по сравнению с такими же нуклеотидами, защищенными стандартной 3’-О-азидометильной блокирующей группой. Например, ацетальная (например, АОМ) или тиокарбаматная блокирующие группы, раскрытые в данном документе, могут придавать по меньшей мере на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500% или 2000% улучшенную скорость деблокирования по сравнению с 3’-ОН, защищенной азидометилом, с использованием стандартного деблокирущего реагента (такого как трис(гидроксипропил)фосфин), уменьшая, посредством этого, общее время для цикла секвенирования. В некоторых воплощениях время деблокирования для каждого нуклеотида уменьшается примерно на 5%, 10%, 20%, 30%, 40%, 50% или 60%. Например, время деблокирования для 3’-АОМ и 3’-О-азидометила составляет примерно 4-5 секунд и примерно 9-10 секунд, соответственно, при определенных условиях химической реакции. В некоторых воплощениях время полужизни (t1/2) блокирующей группы АОМ по меньшей мере в 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 раз меньше, чем азидометильной блокирующей группы. В некотором таком воплощении t1/2 АОМ составляет примерно 1 минуту, тогда как t1/2 азидометила составляет примерно 11 минут. В некоторых воплощениях скорость деблокирования измеряется при температуре окружающей среды или при температуре ниже температуры окружающей среды (такой как 4-10°С). В других воплощениях скорость деблокирования измеряется при повышенной температуре, такой как 40°С, 45°С, 50°С, 55°С, 60°С или 65°С. В некоторых таких воплощениях скорость деблокирования измеряется в растворе в среде с основным рН, например, при рН 9,0; 9,2; 9,4; 9,6; 9,8 или 10,0. В некоторых таких воплощениях молярное отношение деблокирующего реагента к субстрату (т.е. 3' блокированному нуклеозиду или нуклеотиду) составляет примерно 10:1, примерно 5:1, примерно 2:1, примерно 1:1, примерно 1:2, примерно 1:5 или примерно 1:10. В одном воплощении каждый ffN содержит группу 3’-АОМ.In some embodiments, the 3' blocked nucleotides described herein provide superior release rates in solution after the chemical cleavage step of the sequencing run, compared to the same nucleotides protected by a standard 3'-O-azidomethyl blocking group. For example, acetal (eg, AOM) or thiocarbamate blocking groups disclosed herein can impart at least 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% , 90%, 100%, 150%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500% or 2000% improved release speed compared to 3' -OH protected with azidomethyl using a standard deblocking reagent (such as tris(hydroxypropyl)phosphine), thereby reducing the overall sequencing run time. In some embodiments, the unblocking time for each nucleotide is reduced by about 5%, 10%, 20%, 30%, 40%, 50%, or 60%. For example, the release time for 3'-AOM and 3'-O-azidomethyl is about 4-5 seconds and about 9-10 seconds, respectively, under certain chemical reaction conditions. In some embodiments, the half-life (t 1/2 ) of the AOM blocking group is at least 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 times less than the azidomethyl blocking group. In some such embodiment, the t1 /2 of AOM is about 1 minute, while the t1 /2 of azidomethyl is about 11 minutes. In some embodiments, the release rate is measured at ambient temperature or at a temperature below ambient temperature (such as 4-10°C). In other embodiments, the release rate is measured at an elevated temperature, such as 40°C, 45°C, 50°C, 55°C, 60°C, or 65°C. In some such embodiments, the deblocking rate is measured in solution in a basic pH environment, for example, pH 9.0; 9.2; 9.4; 9.6; 9.8 or 10.0. In some such embodiments, the molar ratio of deblocking reagent to substrate (i.e., 3' blocked nucleoside or nucleotide) is about 10:1, about 5:1, about 2:1, about 1:1, about 1:2, about 1 :5 or approximately 1:10. In one embodiment, each ffN contains a 3'-AOM group.
В любых воплощениях способов, описанных в данном документе, меченый нуклеотид представляет собой нуклеотидтрифосфат. В любых воплощениях способа, описанного в данном документе, цепь целевого полинуклеотида присоединяется к твердой подложке, такой как проточная ячейка.In any embodiments of the methods described herein, the labeled nucleotide is a nucleotide triphosphate. In any embodiments of the method described herein, a strand of the target polynucleotide is attached to a solid support, such as a flow cell.
В одном воплощении по меньшей мере один нуклеотид включается в полинуклеотид на стадии синтеза посредством действия фермента полимеразы. В некоторых таких воплощениях полимераза может представлять собой ДНК-полимеразу Pol 812 или Pol 1901. Однако можно использовать другие способы присоединения нуклеотидов к полинуклеотидам, как, например, химический синтез олигонуклеотидов или лигирование меченых олигонуклеотидов с немечеными олигонуклеотидами. Следовательно, термин «включение» при использовании по отношению к нуклеотиду и полинуклеотиду может охватывать синтез полинуклеотида химическими способами, а также ферментативными способами.In one embodiment, at least one nucleotide is incorporated into a polynucleotide during synthesis through the action of a polymerase enzyme. In some such embodiments, the polymerase may be DNA polymerase Pol 812 or Pol 1901. However, other methods of joining nucleotides to polynucleotides can be used, such as chemical synthesis of oligonucleotides or ligation of labeled oligonucleotides to unlabeled oligonucleotides. Therefore, the term "incorporation" when used in relation to a nucleotide and a polynucleotide can cover the synthesis of a polynucleotide by chemical methods as well as enzymatic methods.
В конкретном воплощении стадия синтеза проводится и возможно может включать инкубирование цепи полинуклеотида-матрицы с реакционной смесью, содержащей меченые 3' блокированные нуклеотиды по данному раскрытию. Полимераза также может быть предоставлена при условиях, которые обеспечивают образование фосфодиэфирной связи между свободной 3’-ОН группой на цепи полинуклеотида, подвергнутого отжигу с цепью полинуклеотида-матрицы, и 5' фосфатной группой на нуклеотиде. Таким образом, стадия синтеза может включать образование цепи полинуклеотида в том виде, в котором оно управляется комплементарным образованием пар нуклеотидов с цепью матрицы.In a particular embodiment, the synthesis step is carried out and may optionally include incubating the template polynucleotide strand with a reaction mixture containing labeled 3' blocked nucleotides according to this disclosure. The polymerase may also be provided under conditions that allow formation of a phosphodiester bond between the free 3'-OH group on the polynucleotide chain annealed to the template polynucleotide chain and the 5' phosphate group on the nucleotide. Thus, the synthesis step may involve the formation of a polynucleotide strand as driven by complementary nucleotide pairing with the template strand.
Во всех воплощениях данных способов стадия выявления может проводиться, в то время как цепь полинуклеотида, в которую включаются меченые нуклеотиды, подвергается отжигу с цепью матрицы или после стадии денатурации, на которой две данные цепи разделяются. Другие стадии, например, стадии химической или ферментативной реации, или стадии очистки, могут быть включены между стадией синтеза и стадией выявления. В частности, целевая цепь, включающая меченый(ные) нуклеотид(ды), может быть выделена или очищена и затем подвергнута дальнейшей обработке или использована в последующем анализе. В качестве примера, целевые полинуклеотиды, меченные нуклеотидом(дами), как описано в данном документе, на стадии синтеза могут быть затем использованы в качестве меченых зондов или праймеров. В других воплощениях продукт стадии синтеза, изложенный в данном документе, может быть подвергнут дальнейшим стадиям реакции и, если желательно, продукт данных последующих стадий очищают или выделяют.In all embodiments of these methods, the detection step may be carried out while the polynucleotide strand into which the labeled nucleotides are included is annealed to the template strand or after a denaturation step in which the two strands are separated. Other steps, for example chemical or enzymatic reaction steps, or purification steps, may be included between the synthesis step and the detection step. In particular, the target strand including the labeled nucleotide(s) can be isolated or purified and then further processed or used in subsequent analysis. As an example, target polynucleotides labeled with nucleotide(s) as described herein in the synthesis step can then be used as labeled probes or primers. In other embodiments, the product of the synthesis step set forth herein may be subjected to further reaction steps and, if desired, the product of these subsequent steps is purified or isolated.
Подходящие условия для стадии синтеза будут хорошо известны знакомым со стандартными методиками молекулярной биологии. В одном воплощении стадия синтеза может быть аналогичной стандартной реакции достройки праймера с использованием нуклеотидов-предшественников, включающих нуклеотиды, как описано в данном документе, с образованием достроенной целевой цепи, комплементарной цепи матрицы, в присутствии подходящего фермента полимеразы. В других воплощениях стадия синтеза может сама образовать часть реакции амплификации, продуцирующей меченый двухцепочечный продукт амплификации, состоящий из подвергнувшихся отжигу комплементарных цепей, полученных в результате копирования целевой и матричной полинуклеотидных цепей. Другие типичные стадии синтеза включают ник-трансляцию, полимеризацию с вытеснением цепи, случайное мечение ДНК с праймерами и т.д. Особенно полезным ферментом-полимеразой для стадии синтеза является полимераза, которая способна катализировать включение нуклеотидов, как изложено в данном документе. Можно использовать целый ряд встречающихся в природе или модифицированных полимераз. В качестве примера, для синтетической реакции, которая проводится с использованием условий термоциклирования, можно использовать термостабильную полимеразу, тогда как термостабильная полимераза может быть нежелательной для изотермических реакций достройки праймера. Подходящие термостабильные полимеразы, которые способны включать нуклеотиды согласно данному раскрытию, включают полимеразы, описанные в WO 2005/024010 или WO 06/120433, каждая из которых включается в данный документ посредством ссылки. В синтетических реакциях, которые проводятся при меньших температурах, таких как 37°С, ферменты-полимеразы не обязательно должны быть термостабильными полимеразами, следовательно, выбор полимеразы будет зависеть от целого ряда факторов, таких как температура реакции, рН, активность вытеснения цепи и тому подобных.Suitable conditions for the synthesis step will be well known to those familiar with standard molecular biology techniques. In one embodiment, the synthesis step may be similar to a standard primer extension reaction using precursor nucleotides comprising nucleotides as described herein to form an extended target strand complementary to the template strand, in the presence of a suitable polymerase enzyme. In other embodiments, the synthesis step may itself form part of an amplification reaction producing a labeled double-stranded amplification product consisting of annealed complementary strands resulting from copying of the target and template polynucleotide chains. Other typical synthesis steps include nick translation, strand displacement polymerization, random DNA labeling with primers, etc. A particularly useful polymerase enzyme for the synthesis step is one that is capable of catalyzing the incorporation of nucleotides, as set forth herein. A variety of naturally occurring or modified polymerases can be used. As an example, for a synthetic reaction that is carried out using thermocycling conditions, a thermostable polymerase may be used, whereas a thermostable polymerase may not be desirable for isothermal primer extension reactions. Suitable thermostable polymerases that are capable of incorporating nucleotides according to this disclosure include the polymerases described in WO 2005/024010 or WO 06/120433, each of which is incorporated herein by reference. In synthetic reactions that are carried out at lower temperatures, such as 37°C, polymerase enzymes do not necessarily need to be thermostable polymerases, therefore the choice of polymerase will depend on a number of factors such as reaction temperature, pH, chain displacement activity and the like .
В конкретных неограничивающих воплощениях данное раскрытие охватывает способы секвенирования нуклеиновых кислот, повторного секвенирования, полногеномного секвенирования, подсчета однонуклеотидных полиморфизмов, любое другое приложение, включающее выявление меченого нуклеотида или нуклеозида, изложенных в данном документе, при их включении в полинуклеотид. В любом из множества других приложений, выигрывающих от применения полинуклеотидов, меченных нуклеотидами, содержащими флуоресцентные красители, можно использовать меченые нуклеотиды или нукеозиды с красителями, изложенные в данном документе.In specific non-limiting embodiments, this disclosure covers methods for nucleic acid sequencing, resequencing, whole genome sequencing, single nucleotide polymorphism counting, any other application involving the detection of a labeled nucleotide or nucleoside as set forth herein when incorporated into a polynucleotide. Any of the many other applications that benefit from the use of polynucleotides labeled with nucleotides containing fluorescent dyes can use the labeled nucleotides or nuceosides with dyes set forth herein.
В конкретном воплощении согласно данному раскрытию предложено применение меченых нуклеотидов согласно данному раскрытию в реакции секвенирования полинуклеотида посредством синтеза (SBS). Секвенирование посредством синтеза обычно включает последовательное добавление одного или более чем одного нуклеотида или олигонуклеотида к растущей полинуклеотидной цепи в направлении от 5' до 3' с использованием полимеразы или лигазы для того, чтобы образовать удлиненную полинуклеотидную цепь, комплементарную нуклеиновой кислоте-матрице, подлежащей секвенированию. Идентичность основания, присутствующего в одном или более чем одном добавленном нуклеотиде, может быть определена на этапе выявления или «визуализации». Идентичность добавленного основания может быть определена после каждой стадии включения нуклеотида. Последовательность матрицы может быть затем выведена с использованием традиционных правил образования пар оснований по Уотсону-Крику. Применение меченых нуклеотидов, изложенных в данном документе, для определения идентичности одного основания может быть полезным, например, в подсчете однонуклеотидных полиморфизмов, и такие реакции достройки на одно основание находятся в пределах объема данного раскрытия.In a specific embodiment, this disclosure provides the use of labeled nucleotides according to this disclosure in a polynucleotide sequencing by synthesis (SBS) reaction. Sequencing by synthesis typically involves the sequential addition of one or more nucleotides or oligonucleotides to a growing polynucleotide chain in the 5' to 3' direction using a polymerase or ligase to form an extended polynucleotide chain complementary to the template nucleic acid to be sequenced. The identity of the base present in one or more than one added nucleotide can be determined during the detection or "visualization" step. The identity of the added base can be determined after each nucleotide incorporation step. The template sequence can then be deduced using traditional Watson-Crick base pairing rules. The use of labeled nucleotides set forth herein to determine single base identity may be useful, for example, in the counting of single nucleotide polymorphisms, and such single base extension reactions are within the scope of this disclosure.
В одном воплощении настоящего раскрытия последовательность полинуклеотида-матрицы определяется посредством выявления включения одного или более чем одного 3' блокированного нуклеотида, описанного в данном документе, в растущую цепь, комплементарную полинуклеотиду-матрице, подлежащему секвенированию, посредством выявления флуоресцентной(ных) метки(ток), присоединенной(ных) к включенному(ным) нуклеотиду(дам). Секвенирование полинуклеотида-матрицы может быть запущено с использованием подходящего праймера (или он может быть получен в виде конструкции шпильки, которая будет содержать праймер как часть шпильки), и растущая цепь достраивается ступенчато посредством добавления нуклеотидов к 3' концу праймера в реакции, катализируемой полимеразой.In one embodiment of the present disclosure, the sequence of a template polynucleotide is determined by detecting the inclusion of one or more 3' blocked nucleotides described herein in a growing strand complementary to the template polynucleotide to be sequenced by detecting fluorescent tag(s) , attached to the included nucleotide(s). Sequencing of the template polynucleotide can be started using a suitable primer (or it can be produced as a hairpin construct that will contain the primer as part of the hairpin), and the growing strand is completed stepwise by adding nucleotides to the 3' end of the primer in a polymerase-catalyzed reaction.
В конкретных воплощениях каждый из разных нуклеотидтрифосфатов (А, Т, G и С) может метиться уникальным флуорофором и также содержит блокирующую группу в 3' положении для предотвращения неконтролируемой полимеризации. В качестве альтернативы, один из четырех нуклеотидов может быть немеченым (темным). Фермент-полимераза включает нуклеотид в растущую цепь, комплементарную полинуклеотиду-матрице, и блокирующая группа предотвращает дальнейшее включение нуклеотидов. Любые невключенные нуклеотиды могут быть отмыты, и флуоресцентный сигнал от каждого включенного нуклеотида может быть «считан» оптически посредством подходящих средств, таких как прибор с зарядовой связью с использованием возбуждения лазером и подходящих фильтров испускания. 3’-блокирующая группа и соединения-флуоресцентные красители могут быть затем удалены (снятие защиты) одновременно или последовательно для экспонирования растущей цепи для дальнейшего включения нуклеотидов. Типично идентичность включенного нуклеотида будет определяться после каждой стадии включения, но это не является строго существенным. Аналогичным образом, в патенте США №5302509 (который включен в данный документ посредством ссылки) раскрыт способ секвенирования полинуклеотидов, иммобилизованных на твердой подложке.In specific embodiments, each of the different nucleotide triphosphates (A, T, G and C) may be labeled with a unique fluorophore and also contains a blocking group at the 3' position to prevent uncontrolled polymerization. Alternatively, one of the four nucleotides may be unlabeled (dark). The polymerase enzyme incorporates a nucleotide into a growing strand complementary to the template polynucleotide, and the blocking group prevents further incorporation of nucleotides. Any unincorporated nucleotides can be washed away, and the fluorescent signal from each incorporated nucleotide can be "read" optically by suitable means, such as a charge-coupled device using laser excitation and suitable emission filters. The 3' blocking group and fluorescent dye compounds can then be removed (deprotection) simultaneously or sequentially to expose the growing chain for further incorporation of nucleotides. Typically the identity of the incorporated nucleotide will be determined after each incorporation step, but this is not strictly essential. Similarly, US Pat. No. 5,302,509 (which is incorporated herein by reference) discloses a method for sequencing polynucleotides immobilized on a solid support.
В данном способе, как проиллюстрировано примерами выше, используется включение флуоресцентно меченых, 3’-блокированных нуклеотидов A, G, С и Т в растущую цепь, комплементарную иммобилизованному полинуклеотиду, в присутствии ДНК-полимеразы. Данная полимераза включает основание, комплементарное целевому полинуклеотиду, но дальнейшее добавление ей предотвращается посредством 3'-блокирующей группы. Затем может быть определена метка включенного нуклеотида, и блокирующая группа удаляется посредством химического расщепления с обеспечением дальнейшей полимеризации. Нуклеиновая кислота-матрица, подлежащая секвенированию в реакции секвенирования посредством синтеза, может представлять собой любой полинуклеотид, который желательно секвенировать. Нуклеиновая кислота-матрица для реакции секвенирования будет типично содержать двухцепочечную область, имеющую свободную 3’-ОН группу, которая служит в качестве праймера или точки инициации для добавления дальнейших нуклеотидов в реакции секвенирования. Область матрицы, подлежащая секвенированию, будет формировать липкий конец с этой свободной 3’-ОН группой на комплементарной цепи. Область с липким концом матрицы, подлежащая секвенированию, может быть одноцепочечной, но может быть двухцепочечной, при условии, что «присутствует одноцепочесный разрыв» на цепи, комплементарной цепи матрицы, подлежащей секвенированию, с предоставлением свободной 3’-ОН группы для инициации реакции секвенирования. В таких воплощениях секвенирование может идти посредством замещения цепи. В некоторых воплощениях в качестве отдельного компонента может быть добавлен праймер, несущий свободную 3’-ОН группу (например, короткий олигонуклеотид), который гибридизуется с одноцепочечной областью матрицы, подлежащей секвенированию. В качестве альтернативы, каждый из праймера и цепи матрицы, подлежащей секвенированию, могут образовать часть частично комплементарной самой себе цепи нуклеиновой кислоты, способной формировать внутримолекулярный дуплекс, такой как, например, структура петли шпильки. Полинуклеотиды шпильки и способы, посредством которых они могут быть присоединены к твердым подложкам, раскрываются в публикациях РСТ № WO 01/57248 и WO 2005/047301, каждая из которых включается в данный документ посредством ссылки. Нуклеотиды могут добавляться к растущему праймеру последовательно, приводя к синтезу полинуклеотидной цепи в направлении от 5' к 3'. Природа основания, которое было добавлено, может быть определена, в частности, но не обязательно после добавления каждого нуклеотида, предоставляя, таким образом, информацию о последовательности для матрицы нуклеиновой кислоты. Таким образом, нуклеотид включается в цепь нуклеиновой кислоты (или полинуклеотид) посредством соединения данного нуклеотида со свободной 3’-ОН группой цепи нуклеиновой кислоты через образование фосфодиэфирной связи с 5' фосфатной группой нуклеотида.This method, as illustrated by the examples above, uses the incorporation of fluorescently labeled, 3'-blocked nucleotides A, G, C and T into a growing strand complementary to the immobilized polynucleotide in the presence of DNA polymerase. This polymerase includes a base complementary to the target polynucleotide, but further addition is prevented by a 3' blocking group. The label of the included nucleotide can then be determined and the blocking group is removed by chemical cleavage to allow further polymerization. The template nucleic acid to be sequenced in a sequencing reaction by synthesis may be any polynucleotide that is desired to be sequenced. A template nucleic acid for a sequencing reaction will typically comprise a double-stranded region having a free 3'-OH group that serves as a primer or initiation point for adding further nucleotides to the sequencing reactions. The region of the template to be sequenced will form a sticky end with this free 3'-OH group on the complementary strand. The sticky end region of the template to be sequenced may be single-stranded, but may be double-stranded, provided that a "single-strand break is present" on a strand complementary to the template strand to be sequenced, providing a free 3'-OH group to initiate the sequencing reaction. In such embodiments, sequencing may proceed through strand displacement. In some embodiments, a primer carrying a free 3'-OH group (eg, a short oligonucleotide) that hybridizes to the single-stranded region of the template to be sequenced may be added as a separate component. Alternatively, the primer and template strand to be sequenced may each form part of a partially complementary nucleic acid strand capable of forming an intramolecular duplex, such as, for example, a hairpin loop structure. Hairpin polynucleotides and methods by which they can be attached to solid supports are disclosed in PCT Publication No. WO 01/57248 and WO 2005/047301, each of which is incorporated herein by reference. Nucleotides can be added to the growing primer sequentially, resulting in the synthesis of a polynucleotide chain in the 5' to 3' direction. The nature of the base that has been added may be determined, particularly but not necessarily after the addition of each nucleotide, thereby providing sequence information for the nucleic acid template. Thus, a nucleotide is incorporated into a nucleic acid chain (or polynucleotide) by combining the nucleotide with a free 3'-OH group of the nucleic acid chain through the formation of a phosphodiester bond with the 5' phosphate group of the nucleotide.
Нуклеиновая кислота-матрица, подлежащая секвенированию, может представлять собой ДНК или РНК, или даже гибридную молекулу, состоящую из дезоксинуклеотидов и рибонуклеотидов. Нуклеиновая кислота-матрица может содержать встречающиеся в природе и/или невстречающиеся в природе нуклеотиды и природные или неприродные связи остова, при условии, что они не предотвращают копирование матрицы в реакции секвенирования.The template nucleic acid to be sequenced may be DNA or RNA, or even a hybrid molecule consisting of deoxynucleotides and ribonucleotides. The template nucleic acid may contain naturally occurring and/or non-naturally occurring nucleotides and natural or non-natural backbone linkages, provided they do not prevent copying of the template in the sequencing reaction.
В некоторых воплощениях нуклеиновая кислота-матрица, подлежащая секвенированию, может быть присоединена к твердой подложке посредством любого подходящего способа связывания, известного в данной области, например, посредством ковалентного присоединения. В некоторых воплощениях полинуклеотиды матрицы могут присоединяться непосредственно к твердой подложке (например, подложка на основе диоксида кремния). Однако в других воплощениях данного раскрытия поверхность твердой подложки может быть некоторым способом модифицирована таким образом, чтобы обеспечивать либо прямое ковалентное присоединение полинуклеотидов матрицы, либо для иммобилизации полинуклеотидов матрицы через гидрогель или мультислой полиэлектролита, который сам может быть нековалентно присоединен к твердой подложке.In some embodiments, the template nucleic acid to be sequenced can be attached to a solid support by any suitable coupling method known in the art, such as covalent attachment. In some embodiments, the template polynucleotides may be attached directly to a solid support (eg, a silica support). However, in other embodiments of this disclosure, the surface of the solid support may be modified in some manner to permit either direct covalent attachment of the template polynucleotides or to immobilize the template polynucleotides through a hydrogel or polyelectrolyte multilayer, which itself may be non-covalently attached to the solid support.
Воплощения и альтернативы секвенирования посредством синтезаImplementations and alternatives of sequencing by synthesis
Некоторые воплощения включают методики пиросеквенирования. Пиросеквенирование выявляет высвобождение неорганического фосфата (PPi) по мере того, как конкретные нуклеотиды включаются в растущую цепь (Ronaghi, М., Karamohamed, S., Pettersson, В., Uhlen, М. and Nyren, P. (1996) "Real-time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242(1), 84-9; Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing." Genome Res. 11(1), 3-11; Ronaghi, M., Uhlen, M. and Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281(5375), 363; патенты США №6210891; 6258568 и 6274320, раскрытия которых включаются в данный документ посредством ссылки во всей их полноте). При пиросеквенировании высвобожденный PPi может быть выявлен посредством немедленного превращения до аденозинтрифосфата (АТФ) АТФ-сульфуразой, и уровень генерированного АТФ выявляется посредством продуцированных люциферазой фотонов. Нуклеиновые кислоты, подлежащие секвенированию, могут быть присоединены к элементам на чипе, и данный чип может быть визуализирован для фиксации хемилюминисцентных сигналов, которые продуцируются из-за включения нуклеотидов в элементы чипа. Может быть получено изображение после обработки чипа конкретным типом нуклеотида (например, А, Т, С или G). Изображения, полученные после добавления каждого типа нуклеотида, будут отличаться в отношении того, какие элементы на чипе выявляются. Данные различия на изображении отражают разное содержание последовательности элементов на чипе. Однако относительные положения каждого элемента будут оставаться неизменными на изображениях. Данные изображения можно сохранять, обрабатывать и анализировать с использованием способов, изложенных в данном документе. Например, изображениями, полученными после обработки чипа каждым другим типом нуклеотида, можно манипулировать таким же способом, как проиллюстрировано в данном документе примерами для изображений, полученных от разных каналов выявления для способов секвенирования, основанных на обратимом терминаторе.Some embodiments include pyrosequencing techniques. Pyrosequencing detects the release of inorganic phosphate (PPi) as specific nucleotides are incorporated into the growing chain (Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M. and Nyren, P. (1996) "Real- time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242(1), 84-9; Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing." Genome Res. 11(1), 3-11; Ronaghi , M., Uhlen, M. and Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281(5375), 363; US patents 6210891 and 6274320, the disclosures of which are included herein. document by reference in their entirety). In pyrosequencing, released PPi can be detected by immediate conversion to adenosine triphosphate (ATP) by ATP sulfurase, and the level of ATP generated is detected by photons produced by luciferase. Nucleic acids to be sequenced can be attached to elements on a chip, and the chip can be imaged to capture the chemiluminescent signals that are produced due to the incorporation of nucleotides into elements of the chip. An image can be obtained after treating the chip with a specific type of nucleotide (for example, A, T, C or G). The images obtained after adding each type of nucleotide will differ in what features on the chip are detected. These differences in the image reflect the different content of the sequence of elements on the chip. However, the relative positions of each element will remain the same in the images. The image data can be stored, processed and analyzed using the methods described herein. For example, images obtained after processing the chip with each other type of nucleotide can be manipulated in the same manner, as illustrated herein by examples for images obtained from different detection channels for reversible terminator-based sequencing methods.
В другом показательном типе SBS циклическое секвенирование осуществляется поэтапным добавлением нуклеотидов с обратимым терминатором, содержащим, например, расщепляемую или фотообесцвечиваемую метку-краситель, как описано, например, в WO 04/018497 и патенте США №7057026, раскрытия которых включаются в данный документ посредством ссылки. Данный подход выводится на рынок Solexa (теперь Illumina, Inc.) и также описывается в WO 91/06678 и WO 07/123744, каждая из которых включается в данный документ посредством ссылки. Доступность флуоресцентно меченых терминаторов, в которых и терминация может быть обращена, и флуоресцентная метка расщеплена, облегчает эффективное циклическое секвенирование на основе обратимой терминации (CRT). Полимеразы также могут быть подвергнуты соинженении для эффективного включения и достройки от этих модифицированных нуклеотидов.In another exemplary type of SBS, cycle sequencing is accomplished by stepwise addition of nucleotides with a reversible terminator containing, for example, a cleavable or photobleachable dye tag, as described, for example, in WO 04/018497 and US Pat. No. 7,057,026, the disclosures of which are incorporated herein by reference. . This approach is being marketed by Solexa (now Illumina, Inc.) and is also described in WO 91/06678 and WO 07/123744, each of which is incorporated herein by reference. The availability of fluorescently labeled terminators, in which both termination can be reversed and the fluorescent tag cleaved, facilitates efficient cycle sequencing based on reversible termination (CRT). Polymerases can also be co-engineered to efficiently incorporate and extend from these modified nucleotides.
Предпочтительно в воплощениях секвенирования на основе обратимого терминатора метки по существу не ингибируют достройку при условиях реакции SBS. Однако выявляемые метки могут быть удаляемыми, например, посредством расщепления или деградации. Изображения могут фиксироваться после включения меток в упорядоченные элементы с нуклеиновыми кислотами. В конкретных воплощениях каждый цикл включает одновременную доставку четырех разных типов нуклеотидов на чип, и каждый тип нуклеотида имеет спектрально отличную метку. Затем можно получить четыре изображения, причем в каждом используется выявляющий канал, который является селективным для одной из четырех разных меток. В качестве альтернативы, разные типы нуклеотидов могут быть добавлены последовательно, и изображение чипа может быть получено между каждой стадией добавления. В таких воплощениях каждое изображение будет показывать элементы с нуклеиновыми кислотами, которые включили нуклеотиды конкретного типа. Разные элементы будут присутствовать или отсутствовать на разных изображениях из-за разного содержания последовательности каждого элемента. Однако относительное положение данных элементов будет оставаться на изображениях неизменным. Изображения, полученные от таких способов SBS на основе обратимого терминатора, можно сохранять, обрабатывать и анализировать, как изложено в данном документе. После стадии фиксации изображения метки можно удалять, а фрагменты обратимого терминатора можно удалять для последующих циклов присоединения и выявления нуклеотидов. Удаление меток после их выявления в конкретном цикле и перед последующим циклом может давать преимущество уменьшения фонового сигнала и перекрывания между циклами. Примеры полезных меток и способов удаления излагаются ниже.Preferably, in embodiments of reversible terminator sequencing, the tags do not substantially inhibit extension under SBS reaction conditions. However, the detected marks may be removable, for example, by cleavage or degradation. Images can be captured by incorporating tags into ordered nucleic acid elements. In specific embodiments, each cycle involves the simultaneous delivery of four different types of nucleotides to the chip, and each type of nucleotide has a spectrally distinct label. Four images can then be acquired, each using a detection channel that is selective for one of four different marks. Alternatively, different types of nucleotides can be added sequentially, and an image of the chip can be obtained between each addition step. In such embodiments, each image will show nucleic acid elements that include a particular type of nucleotide. Different elements will be present or absent in different images due to the different sequence content of each element. However, the relative position of these elements will remain unchanged in the images. Images obtained from such reversible terminator SBS methods can be stored, processed and analyzed as described herein. After the image fixation step, tags can be removed and reversible terminator fragments can be removed for subsequent rounds of addition and nucleotide detection. Removing cues after they have been identified in a particular run and before a subsequent run may have the benefit of reducing background signal and overlap between runs. Examples of useful tags and removal methods are outlined below.
В некоторых воплощениях может использоваться выявление четырех разных нуклеотидов с использованием меньше, чем четырех разных меток. Например, SBS можно осуществлять с использованием способов и систем, описанных во включенных материалах публикации США №2013/0079232. В качестве первого примера пару типов нуклеотидов можно выявлять при той же самой длине волны, но различать на основе различия в интенсивности для одного члена пары по сравнению с другим или на основе изменения одного члена пары (например, посредством химической модификации, фотохимической модификации или физической модификации), которое вызывает появление или исчезновение различимого сигнала по сравнению с сигналом, выявляемым для другого члена пары. В качестве второго примера, три из четырех разных типов нуклеотидов можно выявлять при конкретных условиях, тогда как четвертый тип нуклеотида не имеет метки, которая выявляется при данных условиях, или она минимально выявляется при данных условиях (например, минимальное выявление из-за фоновой флуоресценции и т.д.). Включение первых трех типов нуклеотидов в нуклеиновую кислоту может определяться на основе присутствия их соответствующих сигналов, а включение четвертого типа нуклеотида в нуклеиновую кислоту может определяться на основе отсутствия или минимального выявления какого-либо сигнала. В качестве третьего примера один тип нуклеотида может включать метку(ки), которая(рые) выявляется(ются) в двух разных каналах, тогда как другие типы нуклеотидов выявляются в не более чем одном из каналов. Три вышеупомянутые типичные конфигурации не считаются взаимоисключающими и могут использоваться в разных комбинациях. Типичное воплощение, которое объединяет все три примера, представляет собой способ SBS на основе флуоресценции, в котором используется первый тип нуклеотида, который выявляется в первом канале (например, дАТФ, имеющий метку, которая выявляется в первом канале при возбуждении посредством первой длины волны возбуждения), второй тип нуклеотида, который выявляется во втором канале (например, дЦТФ, имеющий метку, которая выявляется во втором канале при возбуждении посредством второй длины волны возбуждения), третий тип нуклеотида, который выявляется как в первом, так и во втором канале (например, дТТФ, имеющий по меньшей мере одну метку, которая выявляется в обоих каналах при возбуждении посредством первой и/или второй длины волны возбуждения), и четвертый тип нуклеотида, который не имеет метки, то есть не выявляется или минимально выявляется в любом из каналов (например, дГТФ, не имеющий метки).In some embodiments, detection of four different nucleotides using less than four different labels may be used. For example, SBS can be performed using the methods and systems described in the included materials of US Publication No. 2013/0079232. As a first example, a pair of nucleotide types may be detected at the same wavelength but distinguished based on a difference in intensity for one member of the pair compared to the other or based on a change in one member of the pair (e.g., through chemical modification, photochemical modification, or physical modification ), which causes the appearance or disappearance of a distinguishable signal compared to the signal detected for the other member of the pair. As a second example, three of four different types of nucleotides can be detected under particular conditions, whereas a fourth type of nucleotide has no label that is detected under given conditions, or is only minimally detectable under given conditions (e.g., minimal detection due to background fluorescence and etc.). The inclusion of the first three types of nucleotides in a nucleic acid can be determined based on the presence of their respective signals, and the inclusion of a fourth type of nucleotide in a nucleic acid can be determined based on the absence or minimal detection of any signal. As a third example, one type of nucleotide may include tag(s) that are detected in two different channels, while other types of nucleotides are detected in at most one of the channels. The above three typical configurations are not considered mutually exclusive and can be used in different combinations. A typical embodiment that combines all three examples is a fluorescence-based SBS method that uses a first type of nucleotide that is detected in a first channel (e.g., dATP having a label that is detected in the first channel when excited by a first excitation wavelength) , a second type of nucleotide that is detected in the second channel (e.g., dCTP having a label that is detected in the second channel when excited by a second excitation wavelength), a third type of nucleotide that is detected in both the first and second channels (e.g. dTTP having at least one label that is detected in both channels when excited by the first and/or second excitation wavelength), and a fourth type of nucleotide that is unlabeled, that is, not detected or minimally detected in either channel (e.g. , unlabeled dGTP).
Кроме того, как описано во включенных материалах публикации США №2013/0079232, данные секвенирования могут быть получены с использованием одного канала. В таких так называемых подходах секвенирования с одним красителем первый тип нуклеотида является меченым, но метка удаляется после получения первого изображения, и второй тип нуклеотида метится только после получения первого изображения. Третий тип нуклеотида сохраняет его метку как на первом, так и на втором изображении, а четвертый тип нуклеотида остается немеченым на обоих изображениях.In addition, as described in the included materials of US Publication No. 2013/0079232, sequencing data can be obtained using a single channel. In these so-called single-dye sequencing approaches, the first type of nucleotide is labeled, but the label is removed after the first image is acquired, and the second type of nucleotide is labeled only after the first image is acquired. The third type of nucleotide retains its label in both the first and second images, and the fourth type of nucleotide remains unlabeled in both images.
В некоторых воплощениях может использоваться секвенирование посредством методик лигирования. В таких методиках используется ДНК-лигаза для включения олигонуклеотидов и идентификации включения таких олигонуклеотидов. Данные олигонуклеотиды типично имеют разные метки, которые коррелируют с идентичностью конкретного нуклеотида в последовательности, с которой гибридизуется данный олигонуклеотид. Как и с другими способами SBS, изображения могут быть получены после обработки чипа элементов с нуклеиновыми кислотами с использованием меченых реагентов для секвенирования. На каждом изображении будут показаны элементы с нуклеиновыми кислотами, которые включили метки конкретного типа. Разные элементы будут присутствовать или отсутствовать на разных изображениях из-за разного содержания последовательности каждого элемента, но относительное положение данных элементов останется неизменным на изображениях. Изображения, полученные от способов секвенирования на основе лигирования можно хранить, обрабатывать и анализировать, как изложено в данном документе. Типичные системы и способы SBS, которые можно использовать со способами и системами, описанными в данном документе, описываются в патентах США №6969488, 6172218 и 6306597, раскрытия которых включаются в данный документ посредством ссылки во всей их полноте.In some embodiments, sequencing via ligation techniques may be used. Such techniques use DNA ligase to incorporate oligonucleotides and identify the inclusion of such oligonucleotides. These oligonucleotides typically have different labels that correlate with the identity of the particular nucleotide in the sequence to which the oligonucleotide hybridizes. As with other SBS methods, images can be obtained after processing the nucleic acid element chip using labeled sequencing reagents. Each image will show elements with nucleic acids that have included a specific type of tag. Different elements will be present or absent in different images due to the different sequence content of each element, but the relative position of these elements will remain the same in the images. Images obtained from ligation-based sequencing methods can be stored, processed and analyzed as described herein. Exemplary SBS systems and methods that can be used with the methods and systems described herein are described in US Pat. Nos. 6,969,488, 6,172,218, and 6,306,597, the disclosures of which are incorporated herein by reference in their entirety.
В некоторых воплощениях может использоваться секвенирование на основе нанопор (Deamer, D.W. & Akeson, М. "Nanopores and nucleic acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000); Deamer, D. and D. Branton, "Characterization of nucleic acids by nanopore analysis", Асе, Chem, Res. 35:817-825 (2002); Li, J., M. Gershow, D. Stein, E. Brandin, and J.A. Golovchenko, "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2:611-615 (2003), раскрытия которых включаются в данный документ посредством ссылки во всей их полноте). В таких воплощениях целевая нуклеиновая кислота проходит через нанопору. Нанопора может представлять собой синтетическую пору или белок биологической мембраны, такой как а-хемолизин. По мере прохождения целевой нуклеиновой кислоты через нанопору каждая пара оснований может быть идентифицирована посредством измерения колебаний в электрической проводимости данной поры (патент США №7001792; Soni, G.V. & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin. Chem. 53, 1996-2001 (2007); Healy, K. "Nanopore-based single-molecule DNA analysis." Nanomed. 2, 459-481 (2007); Cockroft, S.L, Chu, J., Amorin, M. & Ghadiri, M.R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. Chem. Soc. 130, 818-820 (2008), раскрытия которых включаются в данный документ посредством ссылки во всей их полноте). Данные, полученные от секвенирования на основе нанопор, можно сохранять, обрабатывать и анализировать, как изложено в данном документе. В частности, данные можно обрабатывать в виде изображения согласно типичной обработке оптических изображений и других изображений, как изложено в данном документе.In some embodiments, nanopore-based sequencing may be used (Deamer, D.W. & Akeson, M. "Nanopores and nucleic acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000); Deamer, D. and D. Branton , "Characterization of nucleic acids by nanopore analysis", Ace, Chem, Res. 35:817-825 (2002); Li, J., M. Gershow, D. Stein, E. Brandin, and J.A. and configurations in a solid-state nanopore microscope" Nat. Mater. 2:611-615 (2003), the disclosures of which are incorporated herein by reference in their entirety). In such embodiments, the target nucleic acid passes through the nanopore. The nanopore may be a synthetic pore or a biological membrane protein such as α-chemolysin. As the target nucleic acid passes through the nanopore, each base pair can be identified by measuring fluctuations in the electrical conductivity of that pore (U.S. Patent No. 7001792; Soni, G.V. & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin Chem. 53, 1996-2001 (2007); Healy, K. "Nanopore-based single-molecule DNA analysis." Nanomed. 2, 459-481 (2007); & Ghadiri, M.R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. 130, 818-820 (2008), the disclosures of which are incorporated herein by reference. their completeness). Data obtained from nanopore-based sequencing can be stored, processed and analyzed as described herein. In particular, the data may be processed in image form according to typical processing of optical images and other images as set forth herein.
Некоторые другие воплощения способа секвенирования включают применение 3' блокированного нуклеотида, описанного в данном документе, в методике секвенирования на основе наношарика, такой как методики, описанные в патенте США №9222132, раскрытие которого включается посредством ссылки. Посредством способа амплификации по типу катящегося кольца (RCA) можно получать большое число дискретных наношариков ДНК. Смесь наношариков затем распределяется на структурированной поверхности предментного стекла, содержащей элементы, которые обеспечивают ассоциацию одиночного наношарика с каждым положением. При получении наношариков ДНК ДНК фрагментируется и лигируется с первой из четырех адапторных последовательностей. Матрица амплифицируется, циркуляризируется и расщепляется эндонуклеазой типа II. Добавляют второй набор адапторов, с последующей амплификацией, циркуляризацией и расщеплением. Данный способ повторяется для остальных двух адапторов. Конечный продукт представляет собой кольцевую матрицу с четырьмя адапторами, причем каждый разделен последовательностью матрицы. Молекулы библиотеки подвергаются стадии амплификации по типу катящегося кольца, генерируя большую массу конкатемеров, именуемых наношариками ДНК, которые затем наносятся на проточную ячейку. Goodwin et al., "Coming of age: ten years of next-generation sequencing technologies," Nat Rev Genet. 2016; 17(6):333-51.Some other embodiments of the sequencing method include the use of the 3' blocked nucleotide described herein in a nanobead-based sequencing technique, such as the techniques described in US Pat. No. 9,222,132, the disclosure of which is incorporated by reference. Through the rolling circle amplification (RCA) method, a large number of discrete DNA nanobeads can be obtained. The mixture of nanobeads is then distributed on a structured glass slide surface containing elements that ensure the association of a single nanobead with each position. When producing DNA nanobeads, the DNA is fragmented and ligated to the first of four adapter sequences. The template is amplified, circularized, and cleaved by type II endonuclease. A second set of adapters is added, followed by amplification, circularization and cleavage. This method is repeated for the remaining two adapters. The final product is a ring matrix with four adapters, each separated by a matrix sequence. The library molecules undergo a rolling ring amplification step, generating a large mass of concatemers called DNA nanobeads, which are then applied to the flow cell. Goodwin et al., "Coming of age: ten years of next-generation sequencing technologies," Nat Rev Genet. 2016; 17(6):333-51.
В некоторых воплощениях могут использоваться способы, включающие мониторинг активности ДНК-полимеразы в реальном времени. Включения нуклеотидов можно выявлять посредством взаимодействий резонансного переноса энергии флуоресценции (FRET) между полимеразой, несущей флуорофор, и нуклеотидами, меченными у-фосфатом, как описано, например, в патентах США №7329492 и 7211414, которые оба включаются в данный документ посредством ссылки, или включения нуклеотидов можно выявлять с использованием волноводов с нулевой модой, как описано, например, в патенте США №7315019, который включается в данный документ посредством ссылки, и с использованием флуоресцентных аналогов нуклеотидов и модифицированных полимераз, как описывается, например, в патенте США №7405281 и публикации США №2008/0108082, которые оба включаются в данный документ посредством ссылки. Освещение может ограничиваться объемом в масштабе зептолитров вокруг связанной с поверхностью полимеразы таким образом, что включение флуоресцентно меченых нуклеотидов можно наблюдать с малым фоном (Levene, М.J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003); Lundquist, P.M. et al. "Parallel confocal detection of single molecules in real time." Opt. Lett. 33, 1026-1028 (2008); Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008), раскрытия которых включаются в данный документ посредством ссылки во всей их полноте). Изображения, полученные от таких способов, можно сохранять, обрабатывать и анализировать, как изложено в данном документе.In some embodiments, methods may be used that include monitoring DNA polymerase activity in real time. Nucleotide inclusions can be detected through fluorescence resonance energy transfer (FRET) interactions between a fluorophore-carrying polymerase and γ-phosphate-labeled nucleotides, as described, for example, in US Pat. Nos. 7,329,492 and 7,211,414, both of which are incorporated herein by reference, or Nucleotide inclusions can be detected using zero-mode waveguides, as described, for example, in US Pat. No. 7,315,019, which is incorporated herein by reference, and using fluorescent nucleotide analogues and modified polymerases, as described, for example, in US Pat. No. 7,405,281 and US Publication No. 2008/0108082, both of which are incorporated herein by reference. Illumination can be limited to the zeptoliter-scale volume around the surface-bound polymerase such that the incorporation of fluorescently labeled nucleotides can be observed with little background (Levene, M.J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003); Lundquist, P. M. et al. "Parallel confocal detection of single molecules in real time." Opt. 33, 1026-1028 (2008); aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008), the disclosures of which are incorporated herein by reference in their entirety) . Images obtained from such methods can be stored, processed and analyzed as described herein.
Некоторые воплощения SBS включают выявление протона, высвобожденного при включении нуклеотида в продукт достройки. Например, в секвенировании на основе выявления высвобожденных протонов могут использоваться электрический детектор и ассоциированные методики, которые имеются в продаже у Ion Torrent (Guilford, СТ, подразделение Life Technologies), или способы и системы секвенирования, описанные в публикациях США №2009/0026082; 2009/0127589; 2010/0137143 и 2010/0282617, которые все включаются в данный документ посредством ссылки. Способы, изложенные в данном документе для амплификации целевых нуклеиновых кислот с использованием кинетического исключения, могут быть легко применены к субстратам, используемым для выявления протонов. Более конкретно, способы, изложенные в данном документе, можно использовать для получения клональных популяций ампиконов, которые используются для выявления протонов.Some embodiments of SBS involve detecting a proton released upon incorporation of a nucleotide into an extension product. For example, released proton sequencing may use an electrical detector and associated techniques that are commercially available from Ion Torrent (Guilford, CT, a division of Life Technologies), or the sequencing methods and systems described in US Publication No. 2009/0026082; 2009/0127589; 2010/0137143 and 2010/0282617, all of which are incorporated herein by reference. The methods outlined herein for amplifying target nucleic acids using kinetic exclusion can be readily applied to substrates used for proton detection. More specifically, the methods set forth herein can be used to generate clonal ampicon populations that are used for proton detection.
Приведенные выше способы SBS можно преимущественно осуществлять в мультиплексных форматах таким образом, что манипуляции с многими разными целевыми нуклеиновыми кислотами осуществляются одновременно. В конкретных воплощениях разные целевые нуклеиновые кислоты можно обрабатывать в общем реакционном сосуде или на поверхности конкретного субстрата. Это обеспечивает удобную доставку реагентов для секвенирования, удаление непрореагировавших реагентов и выявление событий включения мультиплексным способом. В воплощениях с использованием связанных с поверхностью целевых нуклеиновых кислот целевые нуклеиновые кислоты могут находиться в формате чипа. В формате чипа целевые нуклеиновые кислоты типично могут связываться с поверхностью пространственно различимым способом. Целевые нуклеиновые кислоты могут связываться посредством прямого ковалентного присоединения, присоединения к шарику или другой частице, или связывания с полимеразой или другой молекулой, которая присоединяется к поверхности. Данный чип может включать одну копию целевой нуклеиновой кислоты в каждом сайте (также именуемом элементом) или много копий, имеющих ту же самую последовательность, могут присутствовать в каждом сайте или элементе. Многие копии могут продуцироваться такими способами амплификации, как мостиковая амплификация или эмульсионная ПЦР (полимеразная цепная реакция), как описано с дополнительными подробностями ниже.The above SBS methods can advantageously be carried out in multiplex formats such that many different target nucleic acids are manipulated simultaneously. In specific embodiments, different target nucleic acids can be processed in a common reaction vessel or on the surface of a specific substrate. This enables convenient delivery of sequencing reagents, removal of unreacted reagents, and detection of inclusion events in a multiplex manner. In embodiments using surface-bound target nucleic acids, the target nucleic acids may be in a chip format. In a chip format, target nucleic acids can typically bind to a surface in a spatially distinct manner. Target nucleic acids can be bound by direct covalent attachment, attachment to a bead or other particle, or binding to a polymerase or other molecule that is attached to a surface. A given chip may include one copy of the target nucleic acid at each site (also called an element), or many copies having the same sequence may be present at each site or element. Many copies can be produced by amplification methods such as bridge amplification or emulsion PCR (polymerase chain reaction), as described in further detail below.
В способах, изложенных в данном документе, могут использоваться чипы, имеющие элементы в любой из целого ряда плотностей, включающих, например, по меньшей мере примерно 10 элементов/см2, 100 элементов/см2, 500 элементов/см2, 1000 элементов/см2, 5000 элементов/см2, 10000 элементов/см2, 50000 элементов/см2, 100000 элементов/см2, 1000000 элементов/см2, 5000000 элементов/см2 или больше.The methods set forth herein may use chips having elements in any of a range of densities including, for example, at least about 10 elements/cm 2 , 100 elements/cm 2 , 500 elements/cm 2 , 1000 elements/cm 2 cm2 , 5000 elements/ cm2 , 10000 elements/ cm2 , 50000 elements/ cm2 , 100000 elements/ cm2 , 1000000 elements/ cm2 , 5000000 elements/ cm2 or more.
Преимуществом способов, изложенных в данном документе, является то, что они обеспечивают быстрое и эффективное параллельное выявление большого количества целевой нуклеиновой кислоты. Соответственно, согласно настоящему раскрытию предложены интегрированные системы, способные получать и выявлять нуклеиновые кислоты с использованием методик, известных в данной области, такие как системы, проиллюстрированные примерами выше. Таким образом, интегрированная система по настоящему раскрытию может включать жидкостные компоненты, способные доставлять амплификационные реагенты и/или реагенты для секвенирования к одному или более чем одному иммобилизованному фрагменту ДНК, систему, содержащую такие компоненты, как насосы, клапаны, резервуары, жидкостные линии и тому подобное. В интегрированной системе для выявления целевых нуклеиновых кислот может быть сконфигурирована и/или использована проточная ячейка. Типичные проточные ячейки описываются, например, в публикации США №2010/0111768 и публикации США с серийным номером 13/273666, каждая из которых включается в данный документ посредством ссылки. Как проиллюстрировано примерами для проточных ячеек, для способа амплификации и для способа выявления можно использовать один или более чем один жидкостный компонент интегрированной системы. Беря в качестве примера воплощение секвенирования нуклеиновой кислоты, один или более чем один жидкостный компонент интегрированной системы можно использовать для способа амплификации, изложенного в данном документе, и для доставки реагентов для секвенирования в способе секвенирования, таком как способы, проиллюстрированные примерами выше. В качестве альтернативы, интегрированная система может включать отдельные жидкостные системы для осуществления способов амплификации и для осуществления способов выявления. Примеры интегрированных систем секвенирования, которые способны создавать амплифицированные нуклеиновые кислоты и также определять последовательность данных нуклеиновых кислот, включают, без ограничения, платформу MiSeq™ (Illumina, Inc., San Diego, CA) и устройства, описанные в публикации США с серийным №13/273666, которые включаются в данный документ посредством ссылки.An advantage of the methods described herein is that they provide rapid and efficient parallel detection of large quantities of target nucleic acid. Accordingly, the present disclosure provides integrated systems capable of obtaining and detecting nucleic acids using techniques known in the art, such as the systems exemplified above. Thus, the integrated system of the present disclosure may include fluid components capable of delivering amplification reagents and/or sequencing reagents to one or more immobilized DNA fragments, a system containing components such as pumps, valves, reservoirs, fluid lines, and the like. similar. In an integrated system, a flow cell may be configured and/or used to detect target nucleic acids. Exemplary flow cells are described, for example, in US Publication No. 2010/0111768 and US Publication Serial No. 13/273666, each of which is incorporated herein by reference. As illustrated by the flow cell examples, one or more fluid components of the integrated system can be used for the amplification method and for the detection method. Taking an embodiment of nucleic acid sequencing as an example, one or more liquid components of an integrated system can be used for the amplification method set forth herein and for delivering sequencing reagents in a sequencing method such as the methods illustrated in the examples above. Alternatively, the integrated system may include separate fluid systems for carrying out the amplification methods and for carrying out the detection methods. Examples of integrated sequencing systems that are capable of generating amplified nucleic acids and also determining the sequence of these nucleic acids include, but are not limited to, the MiSeq™ platform (Illumina, Inc., San Diego, CA) and devices described in US Publication Serial No. 13/ 273666, which are incorporated herein by reference.
Чипы, в которых полинуклеотиды были непосредственно присоединены к подложкам на основе диоксида кремния, представляют собой чипы, например, раскрытые в WO 00/06770 (включенной в данный документ посредством ссылки), где полинуклеотиды иммобилизуются на стеклянной подложке посредством реакции между боковой эпоксидной группой на стекле со внутренней аминогруппой на полинуклеотиде. Кроме того, полинуклеотиды могут быть присоединены к твердой подложке посредством реакции нуклеофила на основе серы с твердой подложкой, например, как описано в WO 2005/047301 (включена в данный документ посредством ссылки). Еще одним другим примером матричных полинуклеотидов на твердой подложке является случай, где матричные полинуклеотиды присоединяются к гидрогелевой подложке на подложках на основе диоксида кремния или другого твердого вещества, например, как описано в WO 00/31148, WO 01/01143, WO 02/12566, WO 03/014392, патенте США №6465178 и WO 00/53812, каждый из которых включается в данный документ посредством ссылки.Chips in which polynucleotides have been directly attached to silica substrates are chips, such as those disclosed in WO 00/06770 (incorporated herein by reference), where the polynucleotides are immobilized on a glass substrate by reaction between a pendant epoxy group on the glass with an internal amino group on the polynucleotide. In addition, polynucleotides can be attached to a solid support by reacting a sulfur-based nucleophile with the solid support, for example, as described in WO 2005/047301 (incorporated herein by reference). Yet another example of template polynucleotides on a solid support is where template polynucleotides are attached to a hydrogel support on silica or other solid supports, for example as described in WO 00/31148, WO 01/01143, WO 02/12566, WO 03/014392, US Patent No. 6465178 and WO 00/53812, each of which is incorporated herein by reference.
Конкретная поверхность, на которой могут быть иммобилизованы матричные полинуклеотиды, представляет собой полиакриламидный гидрогель. Полиакриламидные гидрогели описываются в ссылках, процитированных выше, и в WO 2005/065814, которая включается в данный документ посредством ссылки. Конкретные гидрогели, которые можно использовать, включают гидрогели, описанные в WO 2005/065814 и публикации США №2014/0079923. В одном воплощении гидрогель представляет собой PAZAM (поли(N-(5-азидоацетамидилпентил)акриламид-соакриламид)).A particular surface on which template polynucleotides can be immobilized is a polyacrylamide hydrogel. Polyacrylamide hydrogels are described in the references cited above and in WO 2005/065814, which is incorporated herein by reference. Specific hydrogels that can be used include those described in WO 2005/065814 and US Publication No. 2014/0079923. In one embodiment, the hydrogel is PAZAM (poly(N-(5-azidoacetamidylpentyl)acrylamide-coacrylamide)).
Молекулы ДНК-матрицы могут быть присоединены к шарикам или микрочастицам, например, как описано в патенте США №6172218 (который включен в данный документ посредством ссылки). Присоединение к шарикам или микрочастицам может быть полезным для приложений секвенирования. Могут быть получены библиотеки шариков, где каждый шарик содержит разные последовательности ДНК. Типичные библиотеки и способы их создания описываются в Nature, 437, 376-380 (2005); Science, 309, 5741, 1728-1732 (2005), каждая из которых включается в данный документ посредством ссылки. Секвенирование чипов таких шариков с использованием нуклеотидов, изложенных в данном документе, находится в пределах объема данного раскрытия.Template DNA molecules can be attached to beads or microparticles, for example, as described in US Pat. No. 6,172,218 (which is incorporated herein by reference). Attachment to beads or microparticles may be useful for sequencing applications. Bead libraries can be generated where each bead contains a different DNA sequence. Typical libraries and methods for their construction are described in Nature, 437, 376-380 (2005); Science, 309, 5741, 1728-1732 (2005), each of which is incorporated herein by reference. Sequencing chips of such beads using the nucleotides set forth herein is within the scope of this disclosure.
Матрицы, которые подлежат секвенированию, могут образовать часть «чипа» на твердой подложке, причем в данном случае чип может принимать любую удобную форму. Таким образом, способ по данному раскрытию применим ко всем типам высокоплотных чипов, включая одномолекулярные чипы, кластерные чипы и шариковые чипы. Меченые нуклеотиды по настоящему раскрытию можно использовать для секвенирования матриц по существу на любом типе чипа, включая чипы, образованные иммобилизацией молекул нуклеиновых кислот на твердой подложке, но не ограничиваясь ими.The templates to be sequenced can form part of a “chip” on a solid support, and in this case the chip can take any convenient shape. Thus, the method of this disclosure is applicable to all types of high-density chips, including single-molecule chips, cluster chips, and ball chips. The labeled nucleotides of the present disclosure can be used for sequencing templates on essentially any type of chip, including, but not limited to, chips formed by immobilizing nucleic acid molecules on a solid support.
Однако меченые нуклеотиды по данному раскрытию являются особенно полезными в контексте секвенирования кластерных чипов. В кластерных чипах отличные области на чипе (часто именуемые сайты или элементы) содержат многие молекулы полинуклеотида-матрицы. В общем, данные многие молекулы полинуклеотидов не являются индивидуально разрешимыми посредством оптических средств и, вместо этого, выявляются как единое целое. В зависимости от того, как образуется чип, каждый сайт на чипе может содержать многие копии одной индивидуальной молекулы полинуклеотида (например, данный сайт является гомогенным в отношении конкретного вида одно- или двухцепочечной нуклеиновой кислоты) или даже многие копии малого числа разных молекул полинуклеотидов (например, многие копии двух разных видов нуклеиновых кислот). Кластерные чипы молекул нуклеиновой кислоты могут быть получены с использованием общеизвестных в данной области методик. В качестве примера, WO 98/44151 и WO 00/18957, каждая из которых включается в данный документ, описывает способы амплификации нуклеиновых кислот, где и матрица, и продукты амплификации остаются иммобилизованными на твердой подложке для того, чтобы образовать чипы, состоящие из кластеров или «колоний» иммобилизованных молекул нуклеиновых кислот. Молекулы нуклеиновых кислот, присутствующие на кластерных чипах, полученных согласно данным способам, представляют собой подходящие матрицы для секвенирования с использованием нуклеотидов, меченных соединениями-красителями по данному раскрытию.However, the labeled nucleotides of this disclosure are particularly useful in the context of cluster chip sequencing. In cluster chips, distinct regions on the chip (often called sites or elements) contain many template polynucleotide molecules. In general, these multiple polynucleotide molecules are not individually resolved by optical means and are instead detected as a unit. Depending on how the chip is formed, each site on the chip may contain many copies of one individual polynucleotide molecule (e.g., a given site is homogeneous for a particular type of single- or double-stranded nucleic acid) or even many copies of a small number of different polynucleotide molecules (e.g. , many copies of two different types of nucleic acids). Cluster chips of nucleic acid molecules can be prepared using techniques generally known in the art. By way of example, WO 98/44151 and WO 00/18957, each of which are incorporated herein, describe methods for amplifying nucleic acids where both the template and the amplification products remain immobilized on a solid support to form chips consisting of clusters or “colonies” of immobilized nucleic acid molecules. The nucleic acid molecules present on cluster chips prepared according to these methods are suitable templates for sequencing using nucleotides labeled with the dye compounds of this disclosure.
Меченые нуклеотиды по настоящему раскрытию также являются полезными в секвенировании матриц на одномолекулярных чипах. Термин «одномолекулярный чип» или «SMA» в том виде, в котором он используется в данном документе, относится к популяции молекул полинуклеотидов, распределенных (или выстроенных) над твердой подложкой, где расстояние любого индивидуального полинуклеотида от всех других в популяции является таким, что возможно индивидуально разрешать индивидуальные молекулы полинуклеотидов. Целевые молекулы нуклеиновых кислот, иммобилизованных на поверхности твердой подложки, в некоторых воплощениях могут быть, таким образом, способны к разрешению оптическими средствами. Это означает то, что один или более чем один отличный сигнал, каждый представляющий один полинуклеотид, будет появляться в пределах разрешаемой области конкретного используемого визуализирующего устройства.The labeled nucleotides of the present disclosure are also useful in sequencing templates on single-molecule chips. The term "single molecule chip" or "SMA" as used herein refers to a population of polynucleotide molecules distributed (or arrayed) over a solid support, where the distance of any individual polynucleotide from all others in the population is such that it is possible to individually resolve individual polynucleotide molecules. Target nucleic acid molecules immobilized on the surface of a solid support may, in some embodiments, thus be capable of resolution by optical means. This means that one or more distinct signals, each representing a single polynucleotide, will appear within the resolution region of the particular imaging device being used.
Может достигаться выявление одиночных молекул, где расстояние между смежными молекулами полинуклеотидов на чипе составляет по меньшей мере 100 нм, более конкретно по меньшей мере 250 нм, еще более конкретно по меньшей мере 300 нм, даже более конкретно по меньшей мере 350 нм. Таким образом, каждая молекула является индивидуально разрешимой и выявляемой в виде флуоресцентной точки одной молекулы, и флуоресценция от указанной флуоресцентной точки одной молекулы также демонстрирует одноэтапное фотообесцвечивание.Detection of single molecules can be achieved where the distance between adjacent polynucleotide molecules on the chip is at least 100 nm, more particularly at least 250 nm, even more particularly at least 300 nm, even more particularly at least 350 nm. Thus, each molecule is individually resolvable and detectable as a single-molecule fluorescent dot, and the fluorescence from said single-molecule fluorescent dot also exhibits one-step photobleaching.
Термины «индивидуально разрешимый» и «индивидуальное разрешение» используются в данном документе для точного определения того, что, при визуализации, возможно различение одной молекулы на чипе от ее соседних молекул. Разделение между индивидуальными молекулами на чипе будет определяться, отчасти, конкретной методикой, используемой для разрешения индивидуальных молекул. Общие характеристики одномолекулярных чипов будут понятными посредством ссылки на опубликованные заявки WO 00/06770 и WO 01/57248, каждая из которых включается в данный документ посредством ссылки. Хотя одним применением нуклеотидов по данному раскрытию является применение в реакциях секвенирования посредством синтеза, польза данных нуклеотидов не ограничивается такими способами. На самом деле, данные нуклеотиды можно с пользой использовать в любой методологии секвенирования, которая требует выявления флуоресцентных меток, присоединенных к нуклеотидам, включенным в полинуклеотид.The terms "individually resolvable" and "individually resolved" are used herein to specifically define that, when imaged, it is possible to distinguish one molecule on a chip from its neighboring molecules. The separation between individual molecules on a chip will be determined, in part, by the specific technique used to resolve individual molecules. The general characteristics of single-molecule chips will be understood by reference to published applications WO 00/06770 and WO 01/57248, each of which is incorporated herein by reference. Although one use of the nucleotides of this disclosure is in sequencing reactions by synthesis, the usefulness of these nucleotides is not limited to such methods. In fact, these nucleotides can be usefully used in any sequencing methodology that requires the detection of fluorescent tags attached to nucleotides included in a polynucleotide.
В частности, меченые нуклеотиды по данному раскрытию можно использовать в протоколах автоматического флуоресцентного секвенирования, в частности, циклического секвенирования с флуоресцентным красителем-терминатором, на основе способа секвенирования с обрывом цепи Сэнджера и сотрудников. В таких способах обычно используются ферменты и циклическое секвенирование для включения флуоресцентно меченых дидезоксинуклеотидов в реакцию секвенирования с достройкой праймера. Так называемые способы секвенирования по Сэнджеру и родственные протоколы (сэнджеровского типа) используют рандомизированный обрыв цепи с мечеными дидезоксинуклеоидами.In particular, the labeled nucleotides of this disclosure can be used in automated fluorescent sequencing protocols, particularly fluorescent dye terminator cycle sequencing, based on the chain termination sequencing method of Sanger and co-workers. Such methods typically use enzymes and cycle sequencing to incorporate fluorescently labeled dideoxynucleotides into the primer extension sequencing reaction. So-called Sanger sequencing methods and related (Sanger-type) protocols use randomized chain termination with labeled dideoxynucleoids.
Таким образом, настоящее раскрытие также охватывает меченые нуклеотиды, которые представляют собой дидезоксинуклеоиды, не имеющие гидроксильных групп в обоих положениях: 3' и 2', причем такие дидезоксинуклеоиды подходят для применения в способах секвенирования сэнджеровского типа и тому подобных.Thus, the present disclosure also covers labeled nucleotides that are dideoxynucleoids lacking hydroxyl groups at both the 3' and 2' positions, such dideoxynucleoids being suitable for use in Sanger-type sequencing methods and the like.
Будет понятно то, что меченые нуклеотиды по настоящему раскрытию, включающие 3' блокирующие группы, также могут быть полезными с способах по Сэнджеру и родственных протоколах, так как такой же эффект, достигаемый посредством применения дидезоксинуклеотидов, может достигаться с использованием нуклеотидов, имеющих 3’-ОН блокирующие группы: и те, и другие предотвращают включение последующих нуклеотидов. Когда нуклеотиды согласно настоящему раскрытию, имеющие 3' блокирующую группу, следует использовать в способах секвенирования сенджеровского типа, будет очевидно то, что соединения-красители или выявляемые метки, присоединенные к данным нуклеотидам, не должны присоединяться через расщепляемые линкеры, так как в каждом случае, где включается меченый нуклеотид по данному раскрытию, далее не должны включаться нуклеотиды, и, таким образом, метка не должна удаляться от нуклеотида.It will be understood that the labeled nucleotides of the present disclosure, including 3' blocking groups, can also be useful with Sanger and related protocols, since the same effect achieved by using dideoxynucleotides can be achieved using nucleotides having 3'- OH blocking groups: both prevent the incorporation of subsequent nucleotides. When nucleotides of the present disclosure having a 3' blocking group are to be used in Sanger sequencing methods, it will be appreciated that the dye compounds or detectable tags attached to the nucleotides should not be attached via cleavable linkers, since in each case, where a labeled nucleotide of this disclosure is included, no further nucleotides should be included, and thus the label should not be removed from the nucleotide.
В любых воплощениях способов, описанных в данном документе, нуклеотид, используемый в приложении секвенирования, представляют собой 3' блокированный нуклеотид, описанный в данном документе, например, нуклеотид Формулы (I), (Ia) или (II). В любых воплощениях 3' блокированный нуклеотид представляет собой нуклеотидтрифосфат.In any embodiments of the methods described herein, the nucleotide used in the sequencing application is a 3' blocked nucleotide described herein, for example, a nucleotide of Formula (I), (Ia) or (II). In any embodiments, the 3' blocked nucleotide is a nucleotide triphosphate.
ПРИМЕРЫEXAMPLES
Дополнительные воплощения раскрываются с дополнительными подробностями с следующих примерах, которые ни в коей мере не предназначены для того, чтобы ограничивать объем формулы изобретения.Additional embodiments are disclosed in further detail with the following examples, which are in no way intended to limit the scope of the claims.
Пример 1. Получение нуклеозидов, блокированных 3’-ацеталем Example 1. Preparation of 3'-acetal-capped nucleosides
В данном примере получали разные нуклеозиды Т, защищенные 3’-ацеталем, согласно Схеме 2.In this example, various 3'-acetal protected nucleosides T were prepared according to Scheme 2.
Получение T1: в высушенную в печи, продутую азотом 100 мл колбу добавляли 5-йод-2'-дезоксиуридин (5,0 г, 14,12 ммоль). Его совместно выпаривали 3 раза с 30 мл пиридина, затем помещали под азот. Добавляли безводный пиридин (25 мл), и данную реакционную смесь перемешивали при комнатной температуре, пока не получался гомогенный раствор (~15 минут). Данную смесь охлаждали до 0°С в бане со льдом-водой, и медленно добавляли трет-бутилдифенилсилил хлорид (4,04 мл, 15,5 ммоль) по каплям с энергичным перемешиванием (~1 часа). Данную реакционную смесь поддерживали при 0°С в течение 8 часов, пока весь SM не потреблялся при определении посредством ТСХ (тонкослойная хроматография). Добавляли насыщенный водный раствор хлорида аммония (~15 мл), и давали данной реакционной смеси нагреться до комнатной температуры. Данную смесь разбавляли этилацетатом (100 мл) и промывали насыщенным водным хлоридом аммония (200 мл). Органический слой отделяли, и водный слой экстрагировали этилацетатом (4×50 мл). Органические слои объединяли, сушили (MgSO4) и концентрировали в вакууме с получением ~8 г прозрачного желтого масла после удаления остаточного растворителя под высоким вакуумом. Неочищенный продукт Т1 очищали колоночной флэш-хроматографией на диоксиде кремния в виде белого кристаллического вещества. Выход составляет 6,94 г (83%). ЖХ-МС (жидкостная хроматография-масс-спектрометрия) (элетрораспылительная, в режиме отрицательно заряженных ионов) 591,08 [М-Н].Preparation T1: 5-iodo-2'-deoxyuridine (5.0 g, 14.12 mmol) was added to an oven-dried, nitrogen-purged 100 mL flask. It was co-evaporated 3 times with 30 ml of pyridine, then placed under nitrogen. Anhydrous pyridine (25 ml) was added and the reaction mixture was stirred at room temperature until a homogeneous solution was obtained (~15 minutes). This mixture was cooled to 0°C in an ice-water bath, and tert-butyldiphenylsilyl chloride (4.04 mL, 15.5 mmol) was added slowly dropwise with vigorous stirring (~1 hour). This reaction mixture was maintained at 0°C for 8 hours until all SM was consumed as determined by TLC (thin layer chromatography). Saturated aqueous ammonium chloride (~15 mL) was added and the reaction mixture was allowed to warm to room temperature. This mixture was diluted with ethyl acetate (100 ml) and washed with saturated aqueous ammonium chloride (200 ml). The organic layer was separated and the aqueous layer was extracted with ethyl acetate (4×50 ml). The organic layers were combined, dried (MgSO 4 ) and concentrated in vacuo to give ~8 g of a clear yellow oil after removal of residual solvent under high vacuum. The crude product T1 was purified by flash silica column chromatography as a white crystalline solid. The yield is 6.94 g (83%). LC-MS (liquid chromatography-mass spectrometry) (electrospray, negative ion mode) 591.08 [M-N].
Получение T2: в высушенную в печи, продутую азотом коричневую 500 мл трехгорлую колбу добавляли Т1 (6,23 г, 10,5 ммоль), йодид меди(I) (200 мг, 1,05 ммоль) и бис(трифенилфосфин)палладия(II) дихлорид (369 мг, 0,526 ммоль) под азотом. Данную колбу защищали от света, и добавляли безводный дегазированный DMF (диметилформамид) (200 мл). К данному раствору добавляли 2,2,2-трифтор-N-проп-2-инил-ацетамид (4,74 г, 31,6 ммоль), с последующим добавлением дегазированного триэтиламина (2,92 мл, 21,0 ммоль). Данную реакционную смесь перемешивали при комнатной температуре под азотом в течение 6 часов до того момента, когда не наблюдали дополнительного исходного вещества посредством анализа ТСХ. Летучие вещества удаляли в вакууме (~15 мин), a DMF удаляли под сильным вакуумом (~1 часа) до коричневого осадка. Его растворяли в этилацетате (200 мл) и экстрагировали 0,1 М EDTA (этилендиаминтетрауксусная кислота) в воде (2×200 мл). Водные слои объединяли и дополнительно экстрагировали этилацетатом (200 мл). Органические фазы объединяли, сушили (MgSO4), летучие вещества удаляли в вакууме (~30 мин) и дополнительно сушили под сильным вакуумом (~1 часа) с получением примерно 8 г неочищенного коричневого/желтого масла. Данную смесь очищали колоночной флэш-хроматографией на силикагеле в виде беловатого твердого вещества. Выход: 6,0 г (85%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) 614,19 [М-Н].Preparation of T2: T1 (6.23 g, 10.5 mmol), copper(I) iodide (200 mg, 1.05 mmol) and bis(triphenylphosphine)palladium( II) dichloride (369 mg, 0.526 mmol) under nitrogen. The flask was protected from light and anhydrous degassed DMF (200 ml) was added. To this solution was added 2,2,2-trifluoro-N-prop-2-ynyl-acetamide (4.74 g, 31.6 mmol), followed by the addition of degassed triethylamine (2.92 mL, 21.0 mmol). This reaction mixture was stirred at room temperature under nitrogen for 6 hours until no additional starting material was observed by TLC analysis. Volatiles were removed under vacuum (~15 min) and DMF was removed under high vacuum (~1 hour) to a brown precipitate. It was dissolved in ethyl acetate (200 ml) and extracted with 0.1 M EDTA (ethylenediaminetetraacetic acid) in water (2 x 200 ml). The aqueous layers were combined and further extracted with ethyl acetate (200 ml). The organic phases were combined, dried (MgSO 4 ), volatiles were removed in vacuo (~30 min) and further dried under high vacuum (~1 hour) to obtain approximately 8 g of a crude brown/yellow oil. This mixture was purified by flash column chromatography on silica gel as an off-white solid. Yield: 6.0 g (85%). LC-MS (electrospray, negative ion mode) 614.19 [M-H].
Получение Т3: в высушенную в печи, продутую азотом 100 мл колбу, содержащую исходный нуклеозид T2 (2,0 г, 3,25 ммоль), под азотом добавляли одной порцией безводный DMSO (диметилсульфоксид) (6,9 мл, 97,5 ммоль) при комнатной температуре и перемешивали, пока не образовался гомогенный раствор. Добавляли по каплям уксусную кислоту (11,1 мл, 195 ммоль), с последующим добавлением по каплям уксусного ангидрида (15,1 мл, 162,09 ммоль) (~5 минут каждый). Данную смесь нагревали до 50°С и перемешивали до полного потребления исходного нуклеозида (~5 часов) при определении ТСХ (EtOAc/петролейный эфир 3:2). Данную реакционную смесь затем концентрировали до половины объема и охлаждали с использованием бани со льдом до приблизительно 0,5°С. Обработку начинали медленным добавлением холодного (~0,5°С) NaHCO3 (водн., насыщ.) (45 мл), и обеспечивали дальнейшее перемешивание до тех пор, пока больше не наблюдалось шипение (~15 мин). Данному раствору давали нагреться до комнатной температуры, затем водную фазу экстрагировали в EtOAc (3×100 мл). Объединенные органические слои сушили над MgSO4, фильтровали, и летучие вещества выпаривали при пониженном давлении и дополнительно посредством сильного вакуума. Неочищенный продукт Т3 очищали флэш-хроматографией на силикагеле в виде беловатого твердого вещества. Выход: 1,79 г (82%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) 674,20 [М-Н]-.Preparation of T3: To an oven-dried, nitrogen-purged 100 mL flask containing the starting nucleoside T2 (2.0 g, 3.25 mmol), under nitrogen, anhydrous DMSO (6.9 mL, 97.5 mmol) was added in one portion ) at room temperature and stirred until a homogeneous solution was formed. Acetic acid (11.1 mL, 195 mmol) was added dropwise, followed by acetic anhydride (15.1 mL, 162.09 mmol) dropwise (~5 minutes each). This mixture was heated to 50°C and stirred until complete consumption of the starting nucleoside (~5 hours) as determined by TLC (EtOAc/petroleum ether 3:2). This reaction mixture was then concentrated to half volume and cooled using an ice bath to approximately 0.5°C. The treatment was started by slowly adding cold (~0.5°C) NaHCO 3 (aq, sat) (45 ml) and continued stirring until no more fizzing was observed (~15 min). This solution was allowed to warm to room temperature, then the aqueous phase was extracted into EtOAc (3×100 ml). The combined organic layers were dried over MgSO 4 , filtered, and the volatiles were evaporated under reduced pressure and additionally under high vacuum. The crude product T3 was purified by flash silica gel chromatography as an off-white solid. Yield: 1.79 g (82%). LC-MS (electrospray, negative ion mode) 674.20 [M-H] - .
Получение Т4: в раствор исходного нуклеозида Т3 (1,79 г, 2,649 ммоль) в безводном CH2Cl2 (50 мл) под N2 добавляли циклогексен (1,34 мл, 13,2 ммоль). Данную смесь охлаждали в бане со льдом до 0°С, и медленно добавляли по каплям дистиллированный сульфурилхлорид (322 мкл, 3,97 ммоль) (~20 мин) под N2. После перемешивания в течение 20 мин при данной температуре ТСХ (EtOAc:петролейный эфир - 3:2 (об./об.)) показала полное потребление исходного нуклеозида. Хлоридное промежуточное соединение затем гасили прямым добавлением по каплям свежеперегнанного соответствующего ненасыщенного спирта (5 экв.), как показано на Схеме 3. Образующийся раствор перемешивали при комнатной температуре в течение 2 часов, с последующим выпариванием летучих веществ при пониженном давлении. Маслянистый остаток распределяли между EtOAc:рассолом (3:2) (125 мл). Органический слой отделяли, и водный слой дополнительно экстрагировали в EtOAc (2×50 мл). Объединенные органические экстракты сушили над MgSO4, фильтровали и летучие вещества выпаривали при пониженном давлении. Маслянистый остаток распределяли между EtOAc:рассолом (3:2) (125 мл). Органический слой отделяли, и водный слой дополнительно экстрагировали в EtOAc (2×50 мл). Объединенные органические экстракты сушили над MgSO4, фильтровали и летучие вещества выпаривали при пониженном давлении. Неочищенные продукты Т4 очищали флэш-хроматографией на силикагеле с получением конечных продуктов в виде желтого масла. Выход: 1,20 г (69%) для АОМ; 1,29 г (71%) для PrOM; 1,34 г (71%) для DPrOM.Preparation of T4: cyclohexene (1.34 ml, 13.2 mmol) was added to a solution of the starting nucleoside T3 (1.79 g, 2.649 mmol) in anhydrous CH 2 Cl 2 (50 ml) under N 2 . This mixture was cooled in an ice bath to 0°C, and distilled sulfuryl chloride (322 μl, 3.97 mmol) was slowly added dropwise (~20 min) under N 2 . After stirring for 20 minutes at this temperature, TLC (EtOAc:petroleum ether - 3:2 (v/v)) showed complete consumption of the starting nucleoside. The chloride intermediate was then quenched by direct dropwise addition of freshly distilled corresponding unsaturated alcohol (5 eq.) as shown in Scheme 3. The resulting solution was stirred at room temperature for 2 hours, followed by evaporation of the volatiles under reduced pressure. The oily residue was partitioned between EtOAc:brine (3:2) (125 ml). The organic layer was separated and the aqueous layer was further extracted into EtOAc (2×50 ml). The combined organic extracts were dried over MgSO 4 , filtered and the volatiles were evaporated under reduced pressure. The oily residue was partitioned between EtOAc:brine (3:2) (125 ml). The organic layer was separated and the aqueous layer was further extracted into EtOAc (2×50 ml). The combined organic extracts were dried over MgSO 4 , filtered and the volatiles were evaporated under reduced pressure. The crude T4 products were purified by flash silica gel chromatography to give the final products as a yellow oil. Yield: 1.20 g (69%) for AOM; 1.29 g (71%) for PrOM; 1.34 g (71%) for DPrOM.
3’-АОМ: желтое масло. ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) [М-Н] 684,24.3'-AOM: yellow oil. LC-MS (electrospray, negative ion mode) [M-H] 684.24.
3’-PrOM: желтое масло. ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) [М-Н] 682,22.3'-PrOM: yellow oil. LC-MS (electrospray, negative ion mode) [M-H] 682.22.
3’-DprOM: желтое масло. ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) [М-Н] 710,25.3'-DprOM: yellow oil. LC-MS (electrospray, negative ion mode) [M-H] 710.25.
Получение Т5: в исходное вещество Т4 (1,04 г, 1,516 ммоль) в 50 мл круглодонной колбе под азотом добавляли безводный THF (9 мл) при комнатной температуре. Затем добавляли по каплям TBAF (1,0 М в THF, 1,7 мл, 1,70 ммоль), и данный раствор перемешивали, пока не поглощалось все SM, при определении посредством ТСХ (~2 часа). Данный раствор становился оранжевым по ходу реакции. Летучие вещества удаляли под вакуумом с получением оранжевого остатка, который растворяли в EtOAc (100 мл) и разделяли с NaHCO3 (насыщ. водн.) (60 мл). Два слоя разделяли, и водный слой экстрагировали EtOAc (60 мл). Органические слои объединяли, сушили (MgSO4), фильтровали и упаривали с получением неочищенного продукта в виде желтого масла. Данный неочищенный продукт очищали флэш-хроматографией на силикагеле с получением прозрачного желтого масла. Выход: 637 мг (94%) для АОМ; 526 мг (78%) для PrOM; 617 мг (86%) для DPrOM.Preparation of T5: Anhydrous THF (9 mL) was added to the starting material T4 (1.04 g, 1.516 mmol) in a 50 mL round bottom flask under nitrogen at room temperature. TBAF (1.0 M in THF, 1.7 mL, 1.70 mmol) was then added dropwise and the solution was stirred until all SM was absorbed as determined by TLC (~2 hours). This solution turned orange as the reaction progressed. Volatiles were removed in vacuo to leave an orange residue, which was dissolved in EtOAc (100 ml) and partitioned with NaHCO 3 (sat. aq.) (60 ml). The two layers were separated and the aqueous layer was extracted with EtOAc (60 ml). The organic layers were combined, dried (MgSO 4 ), filtered and evaporated to give the crude product as a yellow oil. This crude product was purified by flash chromatography on silica gel to give a clear yellow oil. Yield: 637 mg (94%) for AOM; 526 mg (78%) for PrOM; 617 mg (86%) for DPrOM.
3’-АОМ: прозрачное желтое масло. ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 446,12.3'-AOM: clear yellow oil. LC-MS (electrospray, negative ion mode): [M-H] 446.12.
3’-PrOM: прозрачное желтое масло (526 мг, 78%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 444,10.3'-PrOM: clear yellow oil (526 mg, 78%). LC-MS (electrospray, negative ion mode): [M-H] 444.10.
3’-DPrOM: прозрачное желтое масло (617 мг, 86%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 472,13.3'-DPrOM: clear yellow oil (617 mg, 86%). LC-MS (electrospray, negative ion mode): [M-H] 472.13.
Кроме того, получали два дополнительных 3' блокированных нуклеозида Т (3’-еАОМ Т и 3’-iAOM Т), следуя аналогичному способу, как описано выше. 3’-iAOM Т: ЖХ-МС (ЭР): (отрицательный ион) m/z 325,5 (М-Н+), (положительный ион) 327,3 (М+Н+). 3’-еАОМ Т: ЖХ-МС (ЭР): (положительный ион) m/z 341,3 (М+1Н+).In addition, two additional 3' blocked T nucleosides (3'eAOM T and 3'iAOM T) were prepared following a similar method as described above. 3'-iAOM T: LC-MS (ER): (negative ion) m/z 325.5 (M-H + ), (positive ion) 327.3 (M + H + ). 3'-eAOM T: LC-MS (ER): (positive ion) m/z 341.3 (M+1H + ).
Пример 2. Анализ стабильности 3’-ОН блокирующей группыExample 2 Stability Analysis of 3'-OH Blocking Group
В данном примере анализы стабильности для нуклеотида 5'-mP 3’-АОМ проводили параллельно в растворе буфера для включения со стандартом - нуклеотидом 5'-mP 3’-О-азидометил Т.In this example, stability assays for the nucleotide 5'-mP 3'-AOM were carried out in parallel in an inclusion buffer solution with a standard nucleotide 5'-mP 3'-O-azidomethyl T.
Приготовление бубэерного раствораPreparation of bubeer solution
1 мл 0,1 мМ каждого 5'-монофосфат 3’-защищенного нуклеотида Т в растворе 100 мМ этаноламинного буфера (рН 9,8), 100 мМ NaCl и 2,5 мМ EDTA инкубировали при 65°С в нагревательном блоке в течение 2 недель. В установленные моменты времени отбирали 40 мкл аликвоты и анализировали ВЭЖХ (высокоэффективная жидкостная хроматография) для определения процентной доли остающегося блокированного нуклеотида и окончательного образования неблокированного нуклеотида.1 ml of 0.1 mM each 5'-monophosphate 3'-protected nucleotide T in a solution of 100 mM ethanolamine buffer (pH 9.8), 100 mM NaCl and 2.5 mM EDTA was incubated at 65°C in a heating block for 2 weeks At specified time points, 40 μl aliquots were removed and analyzed by HPLC (high performance liquid chromatography) to determine the percentage of blocked nucleotide remaining and the final formation of unblocked nucleotide.
Результаты анализа стабильности, относящиеся к 5'-монофосфат 3'-защищенным нуклеотидам с ацетальными защитными группами АОМ, PrOM, DPrOM и стандартной азидометильной блокирующей группой, иллюстрируются на ФИГ. 1. Наблюдали то, что 3' блокированный нуклеотид монофосфат с блокирующими группами АОМ, PrOM и DPrOM давал более чем 30-50-кратное улучшение в уменьшении скорости деблокирования в растворе. Данный эксперимент имитирует то, как соответствующие полностью функционализированные нуклеотиды (ffN) вели бы себя при хранении в смеси для включения на картридже устройства для секвенирования. Улучшение стабильности, обеспечиваемое данными ацетальными защитными группами, также приводило бы к меньшему показателю предфазирования в циклах секвенирования. Наконец, оно улучшает срок хранения реагента - смеси для включения.The results of the stability analysis related to 5'-monophosphate 3'-protected nucleotides with acetal protecting groups AOM, PrOM, DPrOM and a standard azidomethyl blocking group are illustrated in FIG. 1. It was observed that 3' blocked nucleotide monophosphate with blocking groups AOM, PrOM and DPrOM gave more than 30-50-fold improvement in reducing the deblocking rate in solution. This experiment simulates how the corresponding fully functionalized nucleotides (ffN) would behave when stored in a mixture for inclusion on a sequencing device cartridge. The improved stability provided by these acetal protecting groups would also result in less prephasing in sequencing runs. Finally, it improves the shelf life of the reagent mixture to be included.
Пример 3. Анализ деблокирования 3’-АОМExample 3: 3'-AOM Deblocking Assay
В данном примере анализы деблокирования для 5'-mP 3’-АОМ Т и стандартного нуклеотида 5'-mP 3’-О-азидометильного Т проводили индивидуально в растворе, уникальном для каждой блокирующей группы. Создавали условия для имитации стандартного деблокирующего реагента Illumina настолько близко, насколько это возможно, и следовали одинаковой методологии. Поддерживали одинаковые концентрации активного деблокирующего реагента, буфера и нуклеозида во всех анализах, но идентичность каждого компонента была уникальной. При данном способе наблюдаемое различие в скорости между индивидуальными химиями деблокирования не может быть обусловлено различиями в концентрации препарата.In this example, unblocking assays for 5'-mP 3'-AOM T and the standard nucleotide 5'-mP 3'-O-azidomethyl T were performed individually in a solution unique to each blocking group. Conditions were set to mimic the standard Illumina release reagent as closely as possible and followed the same methodology. The same concentrations of active deblocking reagent, buffer, and nucleoside were maintained in all assays, but the identity of each component was unique. With this method, the observed differences in rates between individual deblocking chemistries cannot be due to differences in drug concentration.
Стандартные условия деблокирования азидометилаStandard conditions for azidomethyl deprotection
Нуклеотид: 5'-монофосфат 3’-О-азидометил Т. Активный деблокирующий реагент: трис(гидроксипропил)фосфин (ТНР) (1 М в 18 мΩ воде). (Возможная) добавка: аскорбат натрия (0,1 мМ в 18 мΩ воде), конечная концентрация - 1 мМ. Буфер: этаноламин, рН 9,8 (2 М в 18 мΩ воде). Гасящий реагент: H2O2.Nucleotide: 5'-monophosphate 3'-O-azidomethyl T. Active deblocking reagent: tris(hydroxypropyl)phosphine (THP) (1 M in 18 mΩ water). (Possible) additive: sodium ascorbate (0.1 mM in 18 mΩ water), final concentration 1 mM. Buffer: ethanolamine, pH 9.8 (2 M in 18 mΩ water). Quenching reagent: H 2 O 2 .
Условия деблокирования А ОМConditions for releasing A OM
Нуклеотид: 5'-монофосфат 3’-О-азидометил Т. Маточный раствор 3’-АОМ Т разводили до 0,1 мМ в 100 мМ этаноламинном буфере (рН 9,8) в стеклянном сосуде под азотом. Маточный раствор добавки - аскорбата натрия - добавляли до конечной концентрации 0,1 мМ, и данный раствор перемешивали 5 минут. Для начала данного анализа добавляли в перемешиваемый раствор при комнатной температуре деблокирующие реагенты (Pd/THP - 1/5; аскорбат натрия; этаноламин) до конечной концентрации 1 мМ ТНР. В определенные моменты времени отбирали 40 мкл аликвоты и гасили 6 мкл смеси 1:3 EDTA/H2O2 (0,025:0,075 М). Проводили анализ ВЭЖХ посредством измерения площади пика исходного нуклеозида, пика 3’-ОН и любых других пиков нуклеотидов, которые появляются на хроматограмме ВЭЖХ. Не наблюдали других побочных продуктов на основе нуклеотидов.Nucleotide: 3'-O-azidomethyl T 5'-monophosphate. The stock solution of 3'-AOM T was diluted to 0.1 mM in 100 mM ethanolamine buffer (pH 9.8) in a glass vessel under nitrogen. A stock solution of the additive, sodium ascorbate, was added to a final concentration of 0.1 mM, and this solution was stirred for 5 minutes. To begin this assay, deblocking reagents (Pd/THP - 1/5; sodium ascorbate; ethanolamine) were added to a stirred solution at room temperature to a final concentration of 1 mM THP. At certain time points, 40 μl aliquots were removed and quenched with 6 μl of a mixture of 1:3 EDTA/H 2 O 2 (0.025:0.075 M). HPLC analysis was performed by measuring the area of the parent nucleoside peak, the 3'-OH peak, and any other nucleotide peaks that appeared in the HPLC chromatogram. No other nucleotide-based byproducts were observed.
Сравнительный результат показан на ФИГ. 2А. Наблюдали то, что АОМ обеспечивал 10-кратное улучшение скорости в показателях скорости деблокирования в растворе по сравнению со стандартной азидометильной блокирующей группой. Данный эксперимент служит цели имитации того, как соответствующие ffN вели бы себя при секвенировании во время стадии деблокирования. Существенное улучшение скорости деблокирования обеспечивало бы деблокирующую стадию в виде промывки вместо 10-20-секундного времени инкубации, типично используемого в определенных платформах секвенирования от Illumina. В результате скорость деблокирования будет иметь значительное влияние на время цикла секвенирования посредством синтеза (SBS).The comparative result is shown in FIG. 2A. It was observed that AOM provided a 10-fold improvement in terms of deblocking rate in solution compared to the standard azidomethyl blocking group. This experiment serves the purpose of simulating how the corresponding ffNs would behave when sequenced during the unblocking step. A significant improvement in deblocking speed would provide a deblocking wash step instead of the 10-20 second incubation times typically used in certain Illumina sequencing platforms. As a result, the release rate will have a significant impact on the sequencing-by-synthesis (SBS) turnaround time.
Аналогичные экспериментальные условия использовали для анализа деблокирования для 3’-еАОМ Т и 3’-iAOM Т. В качестве единственного изменения отношение Pd катализатора к субстрату уменьшали до 5:1 для того, чтобы наблюдать менее отчетливые различия в скорости деблокирования. 3’-АОМ Т использовали в качестве контроля, и результаты иллюстрируются на ФИГ. 2В. Данные результаты показали то, что скорость деблокирования еАОМ и iAOM в 2-3 раза медленнее, чем АОМ при данной конкретной концентрации деблокирующего реагента с Pd катализатором. Можно ожидать то, что данное различие в скорости деблокирования среди замещенной версии и незамещенной версии блокирующих групп АОМ было бы меньше при более высоком отношении Pd катализатора к субстрату.Similar experimental conditions were used for deblocking assays for 3'-eAOM T and 3'-iAOM T. As a single change, the Pd catalyst to substrate ratio was reduced to 5:1 in order to observe less distinct differences in deblocking rates. 3'-AOM T was used as a control and the results are illustrated in FIG. 2B. These results showed that the deblocking rate of eAOM and iAOM is 2-3 times slower than AOM at a given specific concentration of the deblocking reagent with a Pd catalyst. It can be expected that this difference in deblocking rate between the substituted version and the unsubstituted version of the AOM blocking groups would be smaller at a higher Pd catalyst to substrate ratio.
Пример 4. Оптимизация палладиевой расщепляющей смеси для секвенированияExample 4: Optimization of Palladium Digestion Mixture for Sequencing
Pd/THP катализатор, используемый в реакции деблокирования, описанной в Примере 2, является очень воздухочувствительным. При воздействии воздуха он демонстрировал существенную потерю активности. В данном примере разрабатывали анализ окислительного стресса для оценки воздухочувствительности разных препаратов палладиевой расщепляющей смеси.The Pd/THP catalyst used in the deprotection reaction described in Example 2 is very air sensitive. When exposed to air, it showed a significant loss of activity. In this example, an oxidative stress assay was developed to evaluate the air sensitivity of different palladium cleavage mixture preparations.
0,5 мл Pd расщепляющей смеси аликвотировали в 5 мл стеклянный флакон и оставляли открытой для воздуха в течение 3 часов при комнатной температуре. Остаточную активность окисленной расщепляющей смеси оценивали посредством измерения расщепления 3’-АОМ следующим образом. Маточный раствор 3’-АОМ Т разводили до 0,1 мМ в 100 мМ буфере для расщепляющей смеси. Добавляли маточный раствор аскорбата натрия до конечной концентрации 1 мМ, с последующей окисленной расщепляющей смесью до конечного разведения 1/20. Через 1 час 40 мкл раствора немедленно гасили 10 мкл смеси 1:1 EDTA/H202 (0,25:0,25 М) и анализировали посредством ВЭЖХ. В данном эксперименте подвергали скринингу разные буферные реагенты, включая: первичные амины (такие как этаноламин, Tris и глицин); третичные амины (такие как 2-диметиламинометанол (DMEA), 2-диэтиламинометанол (DEEA), N,N,N',N'-тетраметилэтилендиамин (TEMED) или N,N,N',N'-тетраэтилэтилендиамин (TEEDA)); и разные неорганические соли (такие как боратная соль, карбонатная соль, фосфатная соль). Наблюдали то, что неорганические буферные реагенты (такие как борат натрия, карбонат натрия, фосфат натрия) обеспечивали наилучшую стабильность на воздухе, и палладиевый комплекс сохранял высокий % активностей. Кроме того, третичные амины также существенно улучшали стабильность Pd расщепляющей смеси по сравнению с первичными аминами.0.5 ml of Pd digestion mixture was aliquoted into a 5 ml glass vial and left open to air for 3 hours at room temperature. The residual activity of the oxidized cleavage mixture was assessed by measuring 3'-AOM cleavage as follows. The 3'-AOM T stock solution was diluted to 0.1 mM in 100 mM digestion buffer. Sodium ascorbate stock solution was added to a final concentration of 1 mM, followed by an oxidized digestion mixture to a final dilution of 1/20. After 1 hour, 40 μl of the solution was immediately quenched with 10 μl of a mixture of 1:1 EDTA/H 2 0 2 (0.25:0.25 M) and analyzed by HPLC. In this experiment, various buffer reagents were screened, including: primary amines (such as ethanolamine, Tris, and glycine); tertiary amines (such as 2-dimethylaminomethanol (DMEA), 2-diethylaminomethanol (DEEA), N,N,N',N'-tetramethylethylenediamine (TEMED) or N,N,N',N'-tetraethylethylenediamine (TEEDA)); and various inorganic salts (such as borate salt, carbonate salt, phosphate salt). It was observed that inorganic buffer reagents (such as sodium borate, sodium carbonate, sodium phosphate) provided the best stability in air, and the palladium complex retained a high % of activities. In addition, tertiary amines also significantly improved the stability of the Pd cleavage mixture compared to primary amines.
На основе этих данных получали две палладиевые расщепляющие смеси. В первом примере маточный раствор 250 мМ водн. боратного буфера (рН 9,6, 20 мл) разводили водой (14 мл) перед добавлением маточного раствора ТНР (1 М в 100 мМ Tris, рН 9, 5 мл, 5,0 ммоль) и димера аллилпалладия (II) хлорида (183 мг, 0,5 ммоль). Данную смесь энергично перемешивали в течение нескольких минут при комнатной температуре перед добавлением 1 М водн. аскорбата натрия (0,5 мл, 0,5 ммоль), 5 М водн. NaCl (10 мл) и 10% об./об. Tween 20 (0,5 мл). Во втором примере маточный раствор 2 М водн. буфера DEEA (рН 9,6, 0,6 мл) разводили водой (7,6 мл) перед добавлением маточного раствора ТНР (1 М в 100 мМ Tris, рН 9, 1,2 мл, 1,2 ммоль) и твердого димера аллилпалладия (II) хлорида (43,9 мг, 0,12 ммоль). Данную смесь энергично перемешивали в течение нескольких минут при комнатной температуре перед добавлением 1 М водн. аскорбата натрия (0,12 мл, 0,12 ммоль), 5 М водн. NaCl (2,4 мл) и 10% об./об. Tween 20 (0,12 мл).Based on these data, two palladium fission mixtures were prepared. In the first example, the stock solution is 250 mM aq. borate buffer (pH 9.6, 20 mL) was diluted with water (14 mL) before adding THP stock solution (1 M in 100 mM Tris, pH 9. 5 mL, 5.0 mmol) and allyl palladium(II) chloride dimer (183 mg, 0.5 mmol). This mixture was stirred vigorously for several minutes at room temperature before adding 1 M aq. sodium ascorbate (0.5 ml, 0.5 mmol), 5 M aq. NaCl (10 ml) and 10% v/v. Tween 20 (0.5 ml). In the second example, the stock solution is 2 M aq. DEEA buffer (pH 9.6, 0.6 mL) was diluted with water (7.6 mL) before adding THP stock solution (1 M in 100 mM Tris, pH 9, 1.2 mL, 1.2 mmol) and solid dimer allylpalladium(II) chloride (43.9 mg, 0.12 mmol). This mixture was stirred vigorously for several minutes at room temperature before adding 1 M aq. sodium ascorbate (0.12 ml, 0.12 mmol), 5 M aq. NaCl (2.4 ml) and 10% v/v. Tween 20 (0.12 ml).
Пример 5. Получение полностью функционализированных нуклеотидов и применения для приложения секвенированияExample 5: Preparation of Fully Functionalized Nucleotides and Use for Sequencing Applications
В данном примере подробно описывается получение разных полностью функционализированных нуклеотидов (ffN) с 3’-АОМ блокирующей группой. Данные ffN также использовали в приложении секвенирования посредством синтеза на платформе Illumina MiniSeq®.This example details the preparation of various fully functionalized nucleotides (ffN) with a 3'-AOM blocking group. The ffN data were also used in a sequencing-by-synthesis application on the Illumina MiniSeq® platform.
Синтез промежуточного соединения АОМ С2: нуклеозид С1 (0,5 г, 0,64 ммоль) растворяли в безводном DCM (12 мл) под N2, и данную смесь охлаждали до 0°С. Добавляли циклогексен (0,32 мл, 3,21 ммоль), с последующим добавлением по каплям SO2Cl2 (1,0 М в DCM, 1,27 мл, 1,27 ммоль). Добавляли дополнительный циклогексен (0,32 мл, 3,21 ммоль) перед быстрым переносом данной реакционной смеси на ротационный испаритель для удаления всех летучих веществ при пониженном давлении. Твердый остаток дополнительно сушили под сильным вакуумом в течение 10 мин перед растворением в безводном DCM (5 мл) под N2. Данную смесь охлаждали до 0°С, и добавляли по каплям ледяной аллиловый спирт (5 мл). Данную реакционную смесь перемешивали при 0°С в течение 2 ч перед гашением посредством добавления насыщ. водн. NaHCO3 (50 мл) и DCM (30 мл). Две фазы разделяли, и водный слой экстрагировали EtOAc (2×50 мл). Органические слои объединяли, сушили над MgSO4, фильтровали, и летучие вещества выпаривали при пониженном давлении. Неочищенный продукт очищали флэш-хроматографией на силикагеле с использованием EtOAc/петролейного эфира с получением АОМ С2 в виде белого твердого вещества (264 мг, выход 52%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 787, [M+Cl] 823.Synthesis of AOM intermediate C2: Nucleoside C1 (0.5 g, 0.64 mmol) was dissolved in anhydrous DCM (12 ml) under N 2 and the mixture was cooled to 0°C. Cyclohexene (0.32 mL, 3.21 mmol) was added, followed by dropwise addition of SO 2 Cl 2 (1.0 M in DCM, 1.27 mL, 1.27 mmol). Additional cyclohexene (0.32 mL, 3.21 mmol) was added before quickly transferring this reaction mixture to a rotary evaporator to remove all volatiles under reduced pressure. The solid residue was further dried under high vacuum for 10 min before dissolving in anhydrous DCM (5 ml) under N 2 . This mixture was cooled to 0°C and ice-cold allylic alcohol (5 ml) was added dropwise. This reaction mixture was stirred at 0°C for 2 hours before quenching by adding sat. aq. NaHCO 3 (50 ml) and DCM (30 ml). The two phases were separated and the aqueous layer was extracted with EtOAc (2×50 ml). The organic layers were combined, dried over MgSO 4 , filtered, and the volatiles were evaporated under reduced pressure. The crude product was purified by flash chromatography on silica gel using EtOAc/petroleum ether to give AOM C2 as a white solid (264 mg, 52% yield). LC-MS (electrospray, negative ion mode): [M-H] 787, [M+Cl] 823.
Синтез промежуточного соединения АОМ С3: АОМ С2 (246 мг, 0,31 ммоль) растворяли в безводном THF (9,5 мл) под N2, и данную смесь охлаждали до 0°С. Добавляли уксусную кислоту (0,054 мл, 0,94 ммоль), с последующим добавлением по каплям TBAF (1,0 М в THF, 5% воды по массе, 0,99 мл, 0,94 ммоль). Данную реакционную смесь перемешивали при 0°С в течение 5 ч перед разведением EtOAc (20 мл) и затем выливали в 0,05 М HCl водн. (20 мл). Два слоя разделяли, и водный слой экстрагировали EtOAc (2×20 мл). Органические слои объединяли, сушили над MgSO4, фильтровали, и летучие вещества выпаривали при пониженном давлении. Неочищенный продукт очищали флэш-хроматографией на силикагеле с использованием DCM/EtOAc, с получением АОМ С3 в виде желтоватого твердого вещества (114 мг, выход 66%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 549, [М+H2O-Н] 567, [M+Cl] 585, (электрораспылительная, в режиме положительно заряженных ионов): [М+Н] 551, [М+H2O+Н] 569.Synthesis of intermediate compound AOM C3: AOM C2 (246 mg, 0.31 mmol) was dissolved in anhydrous THF (9.5 ml) under N 2 and the mixture was cooled to 0°C. Acetic acid (0.054 mL, 0.94 mmol) was added, followed by dropwise addition of TBAF (1.0 M in THF, 5% water by weight, 0.99 mL, 0.94 mmol). This reaction mixture was stirred at 0°C for 5 hours before diluting with EtOAc (20 ml) and then poured into 0.05 M HCl aq. (20 ml). The two layers were separated and the aqueous layer was extracted with EtOAc (2×20 ml). The organic layers were combined, dried over MgSO 4 , filtered, and the volatiles were evaporated under reduced pressure. The crude product was purified by flash chromatography on silica gel using DCM/EtOAc to give AOM C3 as a yellowish solid (114 mg, 66% yield). LC-MS (electrospray, negative ion mode): [M-H] 549, [M+H 2 O-H] 567, [M+Cl] 585, (electrospray, positive ion mode): [M +H] 551, [M+H 2 O+H] 569.
Синтез промежуточного соединения АОМ С4: АОМ С3 (0,114 г, 0,21 ммоль), свежеактивированные 4А молекулярные сита, протонную губку (0,066 г, 0,31 ммоль) и магнитную мешалку помещали под N2, и добавляли безводный триметилфосфат (1,0 мл). Данную реакционную смесь охлаждали при ~10°С, и добавляли по каплям свежеперегнанный POCl3 (23 мкл, 0,25 ммоль). Данную реакционную смесь перемешивали при ~10°С в течение 1 часа. Раствор пирофосфата в виде бис-три-н-бутиламмониевой соли (0,5 М в DMF, 1,7 мл, 0,85 ммоль) и безводного три-н-бутиламина (0,41 мл, 1,74 ммоль) предварительно смешивали и добавляли в ледяной раствор активированных нуклеозидов одной порцией. Данную смесь энергично перемешивали в течение 5 минут при комнатной температуре. Данную реакционную смесь выливали в отдельную колбу, содержащую энергично перемешиваемый водн. раствор 2 М ТЕАВ (~10 мл). Данную реакционную колбу промывали маленьким количеством H2O, и промывки добавляли в 2 М раствор ТЕАВ. Объединенную смесь затем перемешивали при комнатной температуре в течение 4 часов, после чего выпаривали растворитель при пониженном давлении. Остаток растворяли в водн. NH3 (35%, ~10 мл) и перемешивали при комнатной температуре в течение ночи. Данную реакционную смесь концентрировали под вакуумом и очищали флэш-хроматографией на DEAE-Sephadex. Продукт дополнительно очищали препаративной ВЭЖХ с получением чистого АОМ С4 (62 мкмоль, выход 30%, определенный спектрометрией в УФ(ультрафиолетовой)-видимой области, λmax равно 294 нм, ε равно 8600 М-1 см-1). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 589.Synthesis of intermediate compound AOM C4: AOM C3 (0.114 g, 0.21 mmol), freshly activated 4A molecular sieves, proton sponge (0.066 g, 0.31 mmol) and a magnetic stirrer were placed under N 2 , and anhydrous trimethylphosphate (1.0) was added ml). This reaction mixture was cooled at ~10°C, and freshly distilled POCl 3 (23 μl, 0.25 mmol) was added dropwise. This reaction mixture was stirred at ~10°C for 1 hour. A solution of pyrophosphate as bis-tri-n-butylammonium salt (0.5 M in DMF, 1.7 ml, 0.85 mmol) and anhydrous tri-n-butylamine (0.41 ml, 1.74 mmol) was premixed and added to an ice-cold solution of activated nucleosides in one portion. This mixture was stirred vigorously for 5 minutes at room temperature. This reaction mixture was poured into a separate flask containing vigorously stirred aq. solution of 2 M TEAB (~10 ml). This reaction flask was washed with a small amount of H 2 O, and the washes were added to a 2 M TEAB solution. The combined mixture was then stirred at room temperature for 4 hours, after which the solvent was evaporated under reduced pressure. The residue was dissolved in aq. NH 3 (35%, ~10 ml) and stirred at room temperature overnight. This reaction mixture was concentrated in vacuo and purified by flash chromatography on DEAE-Sephadex. The product was further purified by preparative HPLC to obtain pure AOM C4 (62 μmol, 30% yield, determined by UV-vis spectrometry, λ max equal to 294 nm, ε equal to 8600 M -1 cm -1 ). LC-MS (electrospray, negative ion mode): [M-N] 589.
Синтез 3'-AOM-ffC-LN3-SO7181: LN3-SO7181 (0,0205 ммоль) растворяли в безводном DMA (4 мл) под N2. Добавляли N,N-диизопропилэтиламин (28,6 мкл, 0,164 ммоль), с последующим добавлением TSTU (0,1 М в DMA, 234 мкл, 0,0234 ммоль). Реакционную смесь перемешивали под N2 при комнатной температуре в течение 1 часа. Тем временем, водный раствор АОМ С4 (0,0101 ммоль) выпаривали досуха при пониженном давлении, ресуспендировали в 0,1 М водн. ТЕАВ (400 мкл) и добавляли в раствор LN3-SO7181. Данную реакционную смесь перемешивали при RT (комнатная температура) в течение 17,5 часов и затем гасили 0,1 М водн. ТЕАВ (4 мл). Неочищенный продукт очищали флэш-хроматографией на DEAE-Sephadex. Данный продукт дополнительно очищали препаративной ВЭЖХ с получением чистого 3’-АОМ-ffC-LN3-SO7181 (6,81 мкмоль, выход 67%, определенный спектрометрией в УФ-видимой области, λmax равно 644 нм, ε равно 200000 М-1 см-1). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 1561, [М-2Н] 781, [М-3Н] 520.Synthesis of 3'-AOM-ffC-LN3-SO7181: LN3-SO7181 (0.0205 mmol) was dissolved in anhydrous DMA (4 ml) under N 2 . N,N-Diisopropylethylamine (28.6 μL, 0.164 mmol) was added, followed by TSTU (0.1 M in DMA, 234 μL, 0.0234 mmol). The reaction mixture was stirred under N 2 at room temperature for 1 hour. Meanwhile, an aqueous solution of AOM C4 (0.0101 mmol) was evaporated to dryness under reduced pressure, resuspended in 0.1 M aq. TEAB (400 μL) and added to the LN3-SO7181 solution. This reaction mixture was stirred at RT (room temperature) for 17.5 hours and then quenched with 0.1 M aq. TEAB (4 ml). The crude product was purified by flash chromatography on DEAE-Sephadex. This product was further purified by preparative HPLC to obtain pure 3'-AOM-ffC-LN3-SO7181 (6.81 µmol, 67% yield, determined by UV-visible spectrometry, λ max = 644 nm, ε = 200,000 M -1 cm -1 ). LC-MS (electrospray, negative ion mode): [M-H] 1561, [M-2H] 781, [M-3H] 520.
Синтез промежуточного соединения АОМ А2: нуклеозид А1 (716 мг, 0,95 ммоль) растворяли в 10 мл безводного дихлорметана под атмосферой N2, добавляли циклогексен (481 мкл, 4,75 ммоль), и данный раствор охлаждали до приблизительно -15°С. Добавляли по каплям сульфурилхлорид (перегнанный, 92 мкл, 1,14 ммоль), и данную реакционную смесь перемешивали в течение 20 минут. После того как все исходное вещество потреблялось, добавляли дополнительную часть циклогексена (481 мкл, 4,75 ммоль), и данную реакционную смесь выпаривали досуха при пониженном давлении. Остаток быстро продували азотом, затем добавляли аллиловый спирт (5 мл, ~100 ммоль) при перемешивании при 0°С. Данную реакционную смесь перемешивали при 0°С в течение 1 часа, затем гасили 50 мл насыщенного водн. NaHCO3. Данную реакционную смесь экстрагировали 2× 100 мл этилацетата. Объединенные органические фазы промывали 100 мл воды и 100 мл рассола, затем сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с использованием петролейного эфира/EtOAc. Выход 60% (435 мг, 0,57 ммоль). ЖХ-МС (ЭР (электрораспылительная ионизация) и ХИ (химическая ионизация): (положительный ион) m/z 763 (М+Н+); (отрицательный ион) m/z 761 (М-Н+).Synthesis of AOM intermediate A2: nucleoside A1 (716 mg, 0.95 mmol) was dissolved in 10 ml of anhydrous dichloromethane under N 2 atmosphere, cyclohexene (481 μl, 4.75 mmol) was added and this solution was cooled to approximately -15°C . Sulfuryl chloride (distilled, 92 µl, 1.14 mmol) was added dropwise and the reaction mixture was stirred for 20 minutes. After all of the starting material had been consumed, additional cyclohexene (481 μL, 4.75 mmol) was added and the reaction mixture was evaporated to dryness under reduced pressure. The residue was quickly purged with nitrogen, then allyl alcohol (5 ml, ~100 mmol) was added with stirring at 0°C. This reaction mixture was stirred at 0°C for 1 hour, then quenched with 50 ml of saturated aq. NaHCO3 . This reaction mixture was extracted with 2×100 ml ethyl acetate. The combined organic phases were washed with 100 ml water and 100 ml brine, then dried over MgSO 4 , filtered and evaporated to dryness. The residue was purified by flash chromatography on silica gel using petroleum ether/EtOAc. Yield 60% (435 mg, 0.57 mmol). LC-MS (ES (electrospray ionization) and CI (chemical ionization): (positive ion) m/z 763 (M+H + ); (negative ion) m/z 761 (M-H + ).
Синтез промежуточного соединения АОМ A3: нуклеозид АОМ А2 (476 мг, 0,62 ммоль) растворяли в сухом THF (5 мл) под атмосферой N2, затем добавляли раствор 1,0 М TBAF в THF (750 мкл, 0,75 ммоль). Данный раствор перемешивали при комнатной температуре в течение 1,5 часов. Данный раствор разбавляли 50 мл EtOAc, затем промывали 100 мл насыщ. NaH2PO4 (рН 3) и 100 мл рассола. Органическую фазу сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с использованием EtOAc/МеОН. Выход 90% (292 мг, 0,55 ммоль). ЖХ-МС (ЭР и ХИ): (положительный ион) m/z 525 (М+Н+); (отрицательный ион) m/z 523 (М-Н+).Synthesis of intermediate AOM A3: AOM A2 nucleoside (476 mg, 0.62 mmol) was dissolved in dry THF (5 ml) under N 2 atmosphere, then a solution of 1.0 M TBAF in THF (750 μl, 0.75 mmol) was added. . This solution was stirred at room temperature for 1.5 hours. This solution was diluted with 50 ml EtOAc, then washed with 100 ml sat. NaH 2 PO 4 (pH 3) and 100 ml of brine. The organic phase was dried over MgSO 4 , filtered and evaporated to dryness. The residue was purified by flash chromatography on silica gel using EtOAc/MeOH. Yield 90% (292 mg, 0.55 mmol). LC-MS (ER and CI): (positive ion) m/z 525 (M+H + ); (negative ion) m/z 523 (M-H + ).
Синтез промежуточного соединения АОМ А4: нуклеозид АОМ A3 (285 мг, 0,544 ммоль) сушили при пониженном давлении над P2O5 в течение 18 ч. Добавляли к нему под азотом безводный триэтилфосфат (2 мл) и некоторое количество свежеактивированных 4 молекулярных сит, затем данную реакционную колбу охлаждали до 0°С в бане со льдом. Добавляли по каплям свежеперегнанный POCl3 (61 мкл, 0,65 ммоль), с последующим добавлением Proton Sponge® (175 мг, 0,816 ммоль). После добавления данную реакционную смесь дополнительно перемешивали при 0°С в течение 15 мин. Затем быстро добавляли 0,5 М раствор пирофосфата в виде бис-три-н-бутиламмониевой соли (5,4 мл, 2,72 ммоль) в безводном DMF, с последующим немедленным добавлением три-н-бутиламина (540 мкл, 2,3 ммоль). Данную реакционную смесь выдерживали в бане со льдом-водой в течение еще 10 минут, затем гасили выливанием ее в 1 М водный триэтиламмония бикарбонат (ТЕАВ, 20 мл) и перемешивали при комнатной температуре в течение 4 часов. Все растворители выпаривали при пониженном давлении. Добавляли в приведенный выше остаток 35%-ный водный раствор аммония (20 мл), и данную смесь перемешивали при комнатной температуре в течение по меньшей мере 5 часов. Затем выпаривали растворители при пониженном давлении. Неочищенный продукт очищали сначала ионообменной хроматографией на DEAE-Sephadex А25 (100 г). Колонку элюировали градиентом водного триэтиламмония бикарбоната. Фракции, содержащие трифосфат, объединяли, и растворитель выпаривали досуха при пониженном давлении. Неочищенное вещество дополнительно очищали ВЭЖХ в препаративном масштабе с использованием колонки YMC-Pack-Pro С18, элюируя 0,1 М ТЕАВ и ацетонитрилом. ЖХ-МС (ЭР и ХИ): (отрицательный ион) m/z 612 (М-Н+); (положительный ион) m/z 614 (М+Н+), 715 (M+Et3NH+).Synthesis of intermediate AOM A4: AOM A3 nucleoside (285 mg, 0.544 mmol) was dried under reduced pressure over P 2 O 5 for 18 hours. Anhydrous triethyl phosphate (2 ml) and some freshly activated 4 were added to it under nitrogen. molecular sieves, then this reaction flask was cooled to 0°C in an ice bath. Freshly distilled POCl 3 (61 µl, 0.65 mmol) was added dropwise, followed by Proton Sponge® (175 mg, 0.816 mmol). After addition, this reaction mixture was further stirred at 0°C for 15 minutes. A 0.5 M solution of bis-tri-n-butylammonium pyrophosphate (5.4 mL, 2.72 mmol) in anhydrous DMF was then quickly added, followed immediately by tri-n-butylamine (540 μL, 2.3 mmol). This reaction mixture was kept in an ice-water bath for an additional 10 minutes, then quenched by pouring it into 1 M aqueous triethylammonium bicarbonate (TEAB, 20 ml) and stirred at room temperature for 4 hours. All solvents were evaporated under reduced pressure. 35% aqueous ammonium solution (20 ml) was added to the above residue and the mixture was stirred at room temperature for at least 5 hours. The solvents were then evaporated under reduced pressure. The crude product was first purified by ion exchange chromatography on DEAE-Sephadex A25 (100 g). The column was eluted with a gradient of aqueous triethylammonium bicarbonate. The fractions containing the triphosphate were combined and the solvent was evaporated to dryness under reduced pressure. The crude material was further purified by preparative scale HPLC using a YMC-Pack-Pro C18 column, eluting with 0.1 M TEAB and acetonitrile. LC-MS (ER and CI): (negative ion) m/z 612 (M-H + ); (positive ion) m/z 614 (M+H + ), 715 (M+Et 3 NH + ).
Общая методика синтеза ffA: краситель-линкер (0,020 ммоль) растворяли в 2 мл безводного N,N'-диметилацетамида (DMA). Добавляли N,N'-диизопропилэтиламин (28,4 мкл, 0,163 ммоль), с последующим добавлением N,N,N',N'-тетраметил-O-(N-сукцинимидил)урония тетрафторбората в виде 0,1 М раствора в безводном DMA (TSTU, 232 мкл, 0,023 ммоль). Данную реакционную смесь перемешивали под азотом при комнатной температуре в течение 1 часа. Тем временем водный раствор трифосфата АОМ А4 (0,01 ммоль) выпаривали досуха при пониженном давлении и ресуспендпровали в 200 мкл 0,1 М раствора триэтиламмония бикарбоната (ТЕАВ) в воде. В данный трифосфат добавляли раствор активированного красителя-линкера, и реакционную смесь перемешивали при комнатной температуре в течение 18 часов. Неочищенный продукт очищали сначала ионообменной хроматографией на DEAE-Sephadex А25 (25 г). Фракции, содержащие трифосфат, объединяли, и растворитель выпаривали досуха при пониженном давлении. Неочищенное вещество дополнительно очищали ВЭЖХ-ОФ (высокоэффективная жидкостная хроматография с обращенной фазой) в препаративном масштабе с использованием колонки YMC-Pack-Pro С18. 3’-АОМ-ffA-LN3-NR7180A: выход 38% (3,8 мкмоль). ЖХ-МС (ЭР): (отрицательный ион) m/z 1459 (М-Н+), 729 (М-2Н+), 486 (М-3Н4). 3'-AOM-ffA-LN3-BL-NR550S0: выход 37% (3,7 мкмоль). ЖХ-МС (ЭР): (отрицательный ион) m/z 1771 (М-Н+), 885 (М-2Н+), 589 (М-3Н+). 3’-АОМ ffA-LN3-BL-NR650C5: выход 51% (51 мкмоль). ЖХ-МС (ЭР): (отрицательный ион) m/z 1917 (М-Н+), 958 (М-2Н+), 645 (М-3Н+).General procedure for the synthesis of ffA: linker dye (0.020 mmol) was dissolved in 2 ml of anhydrous N,N'-dimethylacetamide (DMA). N,N'-diisopropylethylamine (28.4 µl, 0.163 mmol) was added, followed by N,N,N',N'-tetramethyl-O-(N-succinimidyl)uronium tetrafluoroborate as a 0.1 M solution in anhydrous DMA (TSTU, 232 µl, 0.023 mmol). This reaction mixture was stirred under nitrogen at room temperature for 1 hour. Meanwhile, an aqueous solution of AOM A4 triphosphate (0.01 mmol) was evaporated to dryness under reduced pressure and resuspended in 200 μl of a 0.1 M solution of triethylammonium bicarbonate (TEAB) in water. An activated dye-linker solution was added to this triphosphate, and the reaction mixture was stirred at room temperature for 18 hours. The crude product was first purified by ion exchange chromatography on DEAE-Sephadex A25 (25 g). The fractions containing the triphosphate were combined and the solvent was evaporated to dryness under reduced pressure. The crude material was further purified by RP-HPLC (reverse phase high performance liquid chromatography) on a preparative scale using a YMC-Pack-Pro C18 column. 3'-AOM-ffA-LN3-NR7180A: yield 38% (3.8 µmol). LC-MS (ES): (negative ion) m/z 1459 (M-H + ), 729 (M-2H + ), 486 (M-3H 4 ). 3'-AOM-ffA-LN3-BL-NR550S0: yield 37% (3.7 µmol). LC-MS (ES): (negative ion) m/z 1771 (M-H + ), 885 (M-2H + ), 589 (M-3H + ). 3'-AOM ffA-LN3-BL-NR650C5: yield 51% (51 µmol). LC-MS (ES): (negative ion) m/z 1917 (M-H + ), 958 (M-2H + ), 645 (M-3H + ).
Синтез промежуточного соединения АОМ G4: известный нуклеозид dG3 (100 мг, 0,143 ммоль) растворяли в 10 мл безводного дихлорметана под атмосферой N2, добавляли циклогексен (72 мкл, 0,714 ммоль), и данный раствор охлаждали до -12°С. Добавляли по каплям сульфурилхлорид (перегнанный, (1 M в DCM), 171 мкл, 0,171 ммоль), и данную реакционную смесь перемешивали в течение 10 мин. Добавляли дополнительную часть циклогексена (72 мкл, 0,714 ммоль), и данную реакционную смесь перемешивали в течение 30 мин при -12°С. Данную реакционную смесь выпаривали досуха при пониженном давлении, остаток продували азотом, и добавляли ледяной чистый аллиловый спирт (перегнанный, 0,8 мл, 12 ммоль) при перемешивании при -12°С. Данную реакционную смесь перемешивали при -12°С в течение 60 мин, затем гасили 2 мл насыщенного водн. NaHCO3. Данную смесь разделяли с этилацетатом (2 мл), водный слой экстрагировали этилацетатом. Объединенные органические фазы промывали 4 мл воды и 4 мл рассола, сушили над MgSO4, фильтровали и упаривали до неочищенного масла. Остаток очищали флэш-хроматографией на силикагеле с получением АОМ G4 в виде прозрачного масла. Выход 36% (50,9 мг, 0,072 ммоль). ЖХ-МС (ЭР и ХИ): (положительный ион) m/z 710 [М+Н]+; (отрицательный ион) m/z 708 [М-Н]-.Synthesis of intermediate compound AOM G4: the known nucleoside dG3 (100 mg, 0.143 mmol) was dissolved in 10 ml of anhydrous dichloromethane under an atmosphere of N 2 , cyclohexene (72 μl, 0.714 mmol) was added and this solution was cooled to -12°C. Sulfuryl chloride (distilled, (1 M in DCM), 171 µl, 0.171 mmol) was added dropwise and the reaction mixture was stirred for 10 minutes. An additional portion of cyclohexene (72 μl, 0.714 mmol) was added and the reaction mixture was stirred for 30 minutes at -12°C. This reaction mixture was evaporated to dryness under reduced pressure, the residue was purged with nitrogen, and ice-cold pure allylic alcohol (distilled, 0.8 mL, 12 mmol) was added with stirring at -12°C. This reaction mixture was stirred at -12°C for 60 minutes, then quenched with 2 ml of saturated aq. NaHCO3 . This mixture was separated with ethyl acetate (2 ml), the aqueous layer was extracted with ethyl acetate. The combined organic phases were washed with 4 ml water and 4 ml brine, dried over MgSO 4 , filtered and evaporated to a crude oil. The residue was purified by flash chromatography on silica gel to give AOM G4 as a clear oil. Yield 36% (50.9 mg, 0.072 mmol). LC-MS (ER and CI): (positive ion) m/z 710 [M+H] + ; (negative ion) m/z 708 [M-H] - .
Синтез промежуточного соединения АОМ G5: нуклеозид AOM-G4 (111 мг, 0,156 ммоль) растворяли в сухом THF (5 мл) в атмосфере N2. Добавляли уксусную кислоту (27 мкл, 0,468 ммоль), с последующим добавлением раствора 1,0 М TBAF в THF (296 мкл, 0,296 ммоль). Данный раствор перемешивали при комнатной температуре в течение 5 часов. Данный раствор разбавляли 10 мл EtOAc, промывали 10 мл 0,05 М водн. HCl, и органическую фазу отделяли. Водную фазу экстрагировали этилацетатом. Объединенные органические фазы сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с получением АОМ G5 в виде белого твердого вещества. Выход 44% (32,4 мг, 0,068 ммоль). ЖХ-МС (ЭР и ХИ): (положительный ион) m/z 472 [М+Н]+; (отрицательный ион) m/z 470 [М-Н]-.Synthesis of AOM G5 intermediate: AOM-G4 nucleoside (111 mg, 0.156 mmol) was dissolved in dry THF (5 ml) under N 2 atmosphere. Acetic acid (27 μL, 0.468 mmol) was added, followed by the addition of a solution of 1.0 M TBAF in THF (296 μL, 0.296 mmol). This solution was stirred at room temperature for 5 hours. This solution was diluted with 10 ml of EtOAc, washed with 10 ml of 0.05 M aq. HCl, and the organic phase was separated. The aqueous phase was extracted with ethyl acetate. The combined organic phases were dried over MgSO 4 , filtered and evaporated to dryness. The residue was purified by flash chromatography on silica gel to obtain AOM G5 as a white solid. Yield 44% (32.4 mg, 0.068 mmol). LC-MS (ER and CI): (positive ion) m/z 472 [M+H] + ; (negative ion) m/z 470 [M-H] - .
Синтез 3’-AOM-pppG: нуклеозид AOM-G5 (79 мг, 0,168 ммоль) со свежеактивированными 4 молекулярными ситами сушили при пониженном давлении над P2O5 в течение 18 ч. Добавляли под азотом Proton Sponge® (175 мг, 0,816 ммоль) и безводный триэтилфосфат (0,8 мл) и перемешивали при комнатной температуре в течение 1 часа. Реакционную колбу охлаждали до 0°С в ледяной бане, добавляли по каплям свежеперегнанный POCl3 (19 мкл, 0,202 ммоль), и данную реакционную смесь перемешивали при 0°С в течение 15 минут. Затем быстро добавляли 0,5 М раствор пирофосфата в виде бис-три-н-бутиламмониевой соли (1,68 мл, 0,84 ммоль) в безводном DMF, с последующим немедленным добавлением три-н-бутиламина (168 мкл, 0,705 ммоль). Данную реакционную смесь удаляли из бани со льдом/водой и энергично перемешивали в течение 5 минут, затем гасили вливанием ее в 1 М водный триэтиламмония бикарбонат (ТЕАВ, 6 мл) и перемешивали при комнатной температуре в течение 18 часов. Все растворители выпаривали при пониженном давлении. Остаток растворяли в 35%-ном водном растворе аммиака (10 мл) и перемешивали при комнатной температуре в течение по меньшей мере 5 часов. Растворители затем выпаривали при пониженном давлении и дополнительно совместно выпаривали с водой. Неочищенный продукт сперва очищали ионообменной хроматографией на DEAE-Sephadex А25 (50 г). Колонку элюировали линейным градиентом водного триэтиламмония. Фракции, содержащие трифосфат, отбирали, и растворитель выпаривали досуха при пониженном давлении. Неочищенное вещество дополнительно очищали ВЭЖХ в препаративном масштабе с использованием колонки YMC-Pack-Pro С18. 3’-AOM-pppG получали в виде триэтиламмониевой соли. Выход 24% (39,7 мкмоль). ЖХ-МС (ЭР и ХИ): (отрицательно заряженный ион) m/z 576 [М-Н]-; (положительно заряженный ион) m/z 578 [М+Н]+.Synthesis of 3'-AOM-pppG: nucleoside AOM-G5 (79 mg, 0.168 mmol) with freshly activated 4 molecular sieves were dried under reduced pressure over P 2 O 5 for 18 hours. Proton Sponge® (175 mg, 0.816 mmol) and anhydrous triethyl phosphate (0.8 ml) were added under nitrogen and stirred at room temperature for 1 hour. The reaction flask was cooled to 0°C in an ice bath, freshly distilled POCl 3 (19 μL, 0.202 mmol) was added dropwise, and the reaction mixture was stirred at 0°C for 15 minutes. A 0.5 M solution of pyrophosphate as bis-tri-n-butylammonium salt (1.68 ml, 0.84 mmol) in anhydrous DMF was then quickly added, followed by the immediate addition of tri-n-butylamine (168 µl, 0.705 mmol) . This reaction mixture was removed from the ice/water bath and stirred vigorously for 5 minutes, then quenched by pouring it into 1 M aqueous triethylammonium bicarbonate (TEAB, 6 ml) and stirred at room temperature for 18 hours. All solvents were evaporated under reduced pressure. The residue was dissolved in 35% aqueous ammonia (10 ml) and stirred at room temperature for at least 5 hours. The solvents were then evaporated under reduced pressure and further co-evaporated with water. The crude product was first purified by ion exchange chromatography on DEAE-Sephadex A25 (50 g). The column was eluted with a linear gradient of aqueous triethylammonium. Fractions containing triphosphate were collected and the solvent was evaporated to dryness under reduced pressure. The crude material was further purified by HPLC on a preparative scale using a YMC-Pack-Pro C18 column. 3'-AOM-pppG was obtained as triethylammonium salt. Yield 24% (39.7 µmol). LC-MS (ER and CI): (negatively charged ion) m/z 576 [M-H] - ; (positively charged ion) m/z 578 [M+H] + .
3'-AOM-ffT-LN3-NR550S0 синтезировали аналогично тому, как описано при получении 3’-АОМ ffA и ffC.3′-AOM-ffT-LN3-NR550S0 was synthesized in the same manner as described for the preparation of 3′-AOM ffA and ffC.
Синтез промежуточного соединения Т1: 5-йод-2'-дезоксиуридин (3 г, 8,4 ммоль) и ацетат палладия(II) (1,6 г, 7,14 ммоль) растворяли в сухом дегазированном DMF, затем добавляли N-аллилтрифторацетамид (6,4 мл, 42 ммоль). Раствор помещали под вакуум, затем продували азотом 3 раза, затем добавляли дегазированный триэтиламин (2,3 мл, 16,8 ммоль). Данный раствор нагревали до 80°С в течение 2 часов. Черную смесь охлаждали до комнатной температуры, затем разбавляли 50 мл метанола. Добавляли приблизительно 0,5 г активированного угля, и данный раствор фильтровали на целите, затем выпаривали при пониженном давлении с получением коричневого густого масла. Это неочищенное вещество очищали хроматографией на силикагеле с использованием EtOAc/МеОН. Выход: (2,27 г, 5,99 ммоль). ЖХ-МС (ЭР и ХИ): (отрицательно заряженный ион) m/z 378 (М-Н+).Synthesis of intermediate T1: 5-iodo-2'-deoxyuridine (3 g, 8.4 mmol) and palladium(II) acetate (1.6 g, 7.14 mmol) were dissolved in dry degassed DMF, then N-allyltrifluoroacetamide was added (6.4 ml, 42 mmol). The solution was placed under vacuum, then purged with nitrogen 3 times, then degassed triethylamine (2.3 mL, 16.8 mmol) was added. This solution was heated to 80°C for 2 hours. The black mixture was cooled to room temperature, then diluted with 50 ml of methanol. Approximately 0.5 g of activated carbon was added and the solution was filtered on Celite, then evaporated under reduced pressure to obtain a brown thick oil. This crude material was purified by silica gel chromatography using EtOAc/MeOH. Yield: (2.27 g, 5.99 mmol). LC-MS (ER and CI): (negatively charged ion) m/z 378 (M-H + ).
Синтез промежуточного соединения Т2: 5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т1) (2,55 г, 6,72 ммоль) растворяли в сухом DMF. Добавляли имидазол (1,37 г, 20,1 ммоль), с последующим добавлением 4-(диметиламино)пиридина (410 мг, 3,36 ммоль). Данную реакционную смесь охлаждали до 0°С, затем медленно добавляли 3 порциями трет-бутил(хлор)дифенилсилан (1,92 мл, 7,39 ммоль) с интервалами 30 минут.Данную реакционную смесь перемешивали при 0°С в течение 6 часов. Растворитель затем выпаривали, остаток ресуспендировали в 200 мл EtOAc и промывали 2× 200 мл водн. насыщенного NaHCO3 и 200 мл воды, затем 100 мл рассола. Органическую фазу сушили над MgSO4, фильтровали и выпаривали досуха. Неочищенный продукт очищали флэш-хроматографией на диоксиде кремния с использованием DCM/EtOAc. Выход 68% (2,806 г, 4,54 ммоль). ЖХ-МС (ЭР и ХИ): (положительно заряженный ион) m/z 618 (М+Н+); (отрицательно заряженный ион) m/z 616 (М-Н+).Synthesis of intermediate T2: 5-[3-(2,2,2-trifluoroacetamido)-allyl]-2'-deoxyuridine (T1) (2.55 g, 6.72 mmol) was dissolved in dry DMF. Imidazole (1.37 g, 20.1 mmol) was added, followed by 4-(dimethylamino)pyridine (410 mg, 3.36 mmol). This reaction mixture was cooled to 0°C, then tert-butyl(chloro)diphenylsilane (1.92 mL, 7.39 mmol) was slowly added in 3 portions at 30 minute intervals. This reaction mixture was stirred at 0°C for 6 hours. The solvent was then evaporated, the residue was resuspended in 200 ml EtOAc and washed with 2× 200 ml aq. saturated NaHCO 3 and 200 ml of water, then 100 ml of brine. The organic phase was dried over MgSO 4 , filtered and evaporated to dryness. The crude product was purified by flash silica chromatography using DCM/EtOAc. Yield 68% (2.806 g, 4.54 mmol). LC-MS (ER and CI): (positively charged ion) m/z 618 (M+H + ); (negatively charged ion) m/z 616 (M-H + ).
Синтез промежуточного соединения Т3: 5'-O-(трет-бутилдифенилсилил)-5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т2) (2,8 г, 4,53 ммоль) растворяли в 10 мл безводного DMSO (136 ммоль), затем добавляли ледяную уксусную кислоту (16 мл, 272 ммоль) и уксусный ангидрид (16 мл, 158 ммоль). Данную реакционную смесь нагревали до 50°С в течение 6 часов, затем гасили 200 мл водн. насыщенного NaHCO3. После того как в растворе прекратили образовываться пузырьки, его экстрагировали 2× 150 мл EtOAc. Органические фазы объединяли и промывали 2×200 мл водн. насыщенного NaHCO3, 200 мл воды и 100 мл рассола. Органическую фазу сушили над MgSO4, фильтровали и выпаривали досуха. Неочищенный продукт очищали флэш-хроматографией на диоксиде кремния с использованием DCM/EtOAc. Выход 77% (2,375 г, 3,51 ммоль). ЖХ-МС (ЭР и ХИ): (положительный ион) m/z 678 (М+Н+); (отрицательный ион) m/z 676 (М-Н4).Synthesis of intermediate T3: 5'-O-(tert-butyldiphenylsilyl)-5-[3-(2,2,2-trifluoroacetamido)-allyl]-2'-deoxyuridine (T2) (2.8 g, 4.53 mmol) was dissolved in 10 ml of anhydrous DMSO (136 mmol), then glacial acetic acid (16 ml, 272 mmol) and acetic anhydride (16 ml, 158 mmol) were added. This reaction mixture was heated to 50°C for 6 hours, then quenched with 200 ml of aq. saturated NaHCO 3 . Once the solution stopped forming bubbles, it was extracted with 2 x 150 ml EtOAc. The organic phases were combined and washed with 2×200 ml aq. saturated NaHCO 3 , 200 ml of water and 100 ml of brine. The organic phase was dried over MgSO 4 , filtered and evaporated to dryness. The crude product was purified by flash silica chromatography using DCM/EtOAc. Yield 77% (2.375 g, 3.51 mmol). LC-MS (ER and CI): (positive ion) m/z 678 (M+H + ); (negative ion) m/z 676 (M-H 4 ).
Синтез промежуточного соединения Т4: 5'-O-(трет-бутилдифенилсилил)-3'-O-метилтиометил-5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т3) (310 мг, 0,45 ммоль) растворяли в 5 мл безводного дихлорметана в атмосфере N2, добавляли циклогексен (228 мкл, 2,25 ммоль), и данный раствор охлаждали до приблизительно -15°С. Сульфурилхлорид (перегнанный, 55 мкл, 0,675 ммоль) добавляли по каплям, и данную реакционную смесь перемешивали в течение 20 минут. После потребления всего исходного вещества добавляли дополнительную часть циклогексена (228 мкл, 2,25 ммоль), и данную реакционную смесь выпаривали досуха при пониженном давлении.Synthesis of intermediate T4: 5'-O-(tert-butyldiphenylsilyl)-3'-O-methylthiomethyl-5-[3-(2,2,2-trifluoroacetamido)allyl]-2'-deoxyuridine (T3) (310 mg, 0.45 mmol) was dissolved in 5 ml of anhydrous dichloromethane under N 2 atmosphere, cyclohexene (228 μl, 2.25 mmol) was added and this solution was cooled to approximately -15°C. Sulfuryl chloride (distilled, 55 μl, 0.675 mmol) was added dropwise and the reaction mixture was stirred for 20 minutes. After all the starting material had been consumed, an additional portion of cyclohexene (228 μL, 2.25 mmol) was added and the reaction mixture was evaporated to dryness under reduced pressure.
Остаток быстро продували азотом, затем добавляли ледяной аллиловый спирт (2,5 мл) при перемешивании при 0°С. Данную реакционную смесь перемешивали при 0°С в течение 35 минут, затем гасили 25 мл насыщенного водн. NaHCO3, затем дополнительно разбавляли 100 мл насыщенного водн. NaHCO3. Данную смесь экстрагировали 2×50 мл этилацетата. Объединенные органические фазы сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с использованием DCM/EtOAc. Выход 69% (214 мг, 0,311 ммоль). ЖХ-МС (ЭР и ХИ): (положительно заряженный ион) m/z 688 (М+Н+); (отрицательно заряженный ион) m/z 686 (М-Н+).The residue was quickly purged with nitrogen, then ice-cold allylic alcohol (2.5 ml) was added with stirring at 0°C. This reaction mixture was stirred at 0°C for 35 minutes, then quenched with 25 ml of saturated aq. NaHCO 3 , then further diluted with 100 ml saturated aq. NaHCO3 . This mixture was extracted with 2×50 ml ethyl acetate. The combined organic phases were dried over MgSO 4 , filtered and evaporated to dryness. The residue was purified by flash chromatography on silica gel using DCM/EtOAc. Yield 69% (214 mg, 0.311 mmol). LC-MS (ER and CI): (positively charged ion) m/z 688 (M+H + ); (negatively charged ion) m/z 686 (M-H + ).
Синтез промежуточного соединения Т5: 5'-O-(трет-бутилдифенилсилил)-3'-O-аллилоксиметил-5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т4) (210 мг, 0,305 ммоль) растворяли в сухом THF (3 мл) под атмосферой N2. Добавляли раствор 1,0 М TBAF в THF (367 мкл, 0,367 ммоль). Данный раствор перемешивали при комнатной температуре в течение 3 часов. Раствор разбавляли 50 мл EtOAc, затем промывали 50 мл насыщ. NaH2PO4 (рН 3) и 50 мл воды. Органическую фазу сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с использованием DCM/EtOAc. Выход 95% (130 мг, 0,289 ммоль). ЖХ-МС (ЭР и ХИ): (отрицательно заряженный ион) m/z 448 (М-Н+), 484 (М+Cl-).Synthesis of intermediate T5: 5'-O-(tert-butyldiphenylsilyl)-3'-O-allyloxymethyl-5-[3-(2,2,2-trifluoroacetamido)allyl]-2'-deoxyuridine (T4) (210 mg, 0.305 mmol) was dissolved in dry THF (3 ml) under N 2 atmosphere. A solution of 1.0 M TBAF in THF (367 μL, 0.367 mmol) was added. This solution was stirred at room temperature for 3 hours. The solution was diluted with 50 ml EtOAc, then washed with 50 ml sat. NaH 2 PO 4 (pH 3) and 50 ml of water. The organic phase was dried over MgSO 4 , filtered and evaporated to dryness. The residue was purified by flash chromatography on silica gel using DCM/EtOAc. Yield 95% (130 mg, 0.289 mmol). LC-MS (ER and CI): (negatively charged ion) m/z 448 (M-H + ), 484 (M+Cl - ).
Синтез промежуточного соединения Т6: 3'-O-аллилоксиметил-5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т5) (120 мг, 0,267 ммоль) сушили при пониженном давлении над P2O5 в течение 18 ч. Добавляли к нему под азотом безводный триэтилфосфат (1 мл) и некоторое количество свежеактивированных 4 молекулярных сит, затем колбу с реакционной смесью охлаждали до 0°С. Добавляли по каплям свежеперегнанный POCl3 (30 мкл, 0,32 ммоль), с последующим добавлением Proton Sponge® (85 мг, 0,40 ммоль). После добавления данную реакционную смесь дополнительно перемешивали при 0°С в течение 15 минут. Затем быстро добавляли 0,5 М раствор пирофосфата в виде бис-три-н-бутиламмониевой соли (2,7 мл, 1,33 ммоль) в безводном DMF, с последующим немедленным добавлением три-н-бутиламина (270 мкл, 1,2 ммоль). Данную реакционную смесь выдерживали в бане со льдом-водой в течение еще 10 минут, затем гасили вливанием ее в 1 М водный триэтиламмония бикарбонат (ТЕАВ, 10 мл) и перемешивали при комнатной температуре в течение 4 часов. Все растворители выпаривали при пониженном давлении. В вышеупомянутый остаток добавляли 35%-ный водный раствор аммиака (10 мл), и данную смесь перемешивали при комнатной температуре в течение 18 часов. Растворители затем выпаривали при пониженном давлении, остаток ресуспендировали в 10 мл 0,1 М ТЕАВ и фильтровали. Фильтрат сперва очищали ионообменной хроматографией на DEAE-Sephadex А25 (100 г). Колонку элюировали водным триэтиламмония бикарбонатом (ТЕАВ). Фракции, содержащие трифосфат, объединяли, и растворитель выпаривали досуха при пониженном давлении. Неочищенное вещество дополнительно очищали ВЭЖХ в препаративном масштабе с использованием колонки YMC-Pack-Pro С18. Соединение Т6 получали в виде триэтиламмониевой соли. Выход 33% (89 мкмоль). ЖХ-МС (ЭР и ХИ): (отрицательно заряженный ион) m/z 592 (М-Н+), 295 (М-2Н+).Synthesis of intermediate T6: 3'-O-allyloxymethyl-5-[3-(2,2,2-trifluoroacetamido)allyl]-2'-deoxyuridine (T5) (120 mg, 0.267 mmol) dried under reduced pressure over P 2 O 5 for 18 hours. Anhydrous triethyl phosphate (1 ml) and a certain amount of freshly activated 4 were added to it under nitrogen. molecular sieves, then the flask with the reaction mixture was cooled to 0°C. Freshly distilled POCl 3 (30 µl, 0.32 mmol) was added dropwise, followed by Proton Sponge® (85 mg, 0.40 mmol). After addition, this reaction mixture was further stirred at 0°C for 15 minutes. A 0.5 M solution of bis-tri-n-butylammonium pyrophosphate (2.7 mL, 1.33 mmol) in anhydrous DMF was then quickly added, followed immediately by tri-n-butylamine (270 μL, 1.2 mmol). This reaction mixture was kept in an ice-water bath for an additional 10 minutes, then quenched by pouring it into 1 M aqueous triethylammonium bicarbonate (TEAB, 10 ml) and stirred at room temperature for 4 hours. All solvents were evaporated under reduced pressure. A 35% aqueous ammonia solution (10 ml) was added to the above residue, and the mixture was stirred at room temperature for 18 hours. The solvents were then evaporated under reduced pressure and the residue was resuspended in 10 ml of 0.1 M TEAB and filtered. The filtrate was first purified by ion exchange chromatography on DEAE-Sephadex A25 (100 g). The column was eluted with aqueous triethylammonium bicarbonate (TEAB). The fractions containing the triphosphate were combined and the solvent was evaporated to dryness under reduced pressure. The crude material was further purified by HPLC on a preparative scale using a YMC-Pack-Pro C18 column. Compound T6 was obtained as triethylammonium salt. Yield 33% (89 µmol). LC-MS (ER and CI): (negatively charged ion) m/z 592 (M-H + ), 295 (M-2H + ).
Синтез S'-AOM-ffT-LN3'-NRSSOSO: высушенное известное соединение LN3-NR550S0 (0,015 ммоль) растворяли в безводном DMA (2 мл) под N2. Добавляли N,N-диизопропилэтиламин (17 мкл, 0,1 ммоль), с последующим добавлением TSTU (0,1 М в DMA, 180 мкл, 0,018 ммоль). Данную реакционную смесь перемешивали под N2 при комнатной температуре в течение 1 часа. Тем временем, водный раствор Т6 (0,01 ммоль) выпаривали досуха при пониженном давлении, ресуспендировали в 0,1 М водн. ТЕАВ (200 мкл) и добавляли в раствор LN3-NR550S0. Данную реакционную смесь перемешивали при RT в течение 18 часов и затем гасили 0,1 М водн. ТЕАВ (4 мл). Неочищенный продукт очищали флэш-хроматографией на DEAE-Sephadex. Продукт дополнительно очищали препаративной ВЭЖХ с получением чистого 3'-AOM-ffT-LN3'-NR550S0. Выход 67% (41 мкмоль, при определении спектрометрией в УФ-видимой области, λmax равно 550 нм, е равен 125000 М-1 см-1). ЖХ-МС (ЭР): (отрицательно заряженный ион) m/z 1521 (М-Н+),761 (М-2Н4), 507 (М-3Н+).Synthesis of S'-AOM-ffT-LN3'-NRSSOSO: The dried known compound LN3-NR550S0 (0.015 mmol) was dissolved in anhydrous DMA (2 ml) under N 2 . N,N-Diisopropylethylamine (17 μL, 0.1 mmol) was added, followed by TSTU (0.1 M in DMA, 180 μL, 0.018 mmol). This reaction mixture was stirred under N 2 at room temperature for 1 hour. Meanwhile, an aqueous solution of T6 (0.01 mmol) was evaporated to dryness under reduced pressure, resuspended in 0.1 M aq. TEAB (200 μl) and added to the LN3-NR550S0 solution. This reaction mixture was stirred at RT for 18 hours and then quenched with 0.1 M aq. TEAB (4 ml). The crude product was purified by flash chromatography on DEAE-Sephadex. The product was further purified by preparative HPLC to obtain pure 3'-AOM-ffT-LN3'-NR550S0. Yield 67% (41 µmol, as determined by spectrometry in the UV-visible region, λ max equal to 550 nm, e equal to 125000 M -1 cm -1 ). LC-MS (ES): (negatively charged ion) m/z 1521 (M-H + ), 761 (M-2H 4 ), 507 (M-3H + ).
Эксперименты по секвенированию посредством синтезаSequencing-by-synthesis experiments
ffN затем анализировали в секвенировании с использованием прибора Illumina MiniSeq®. За исключением новой смеси для включения, включающей данные ffN, использовали все стандартные имеющиеся в продаже реагенты. Использовали стандартный рецепт 2×150. Помимо стандартных протоколов секвенирования посредством синтеза (SBS), добавляли 5-секундную инкубацию в растворе палладиевой расщепляющей смеси (Pd:THP равно 1/5 в DEEA, как описано в Примере 4) для разблокирования 3’-АОМ.ffN was then analyzed by sequencing using an Illumina MiniSeq® instrument. With the exception of the new inclusion mixture including these ffN, all standard commercially available reagents were used. We used the standard 2×150 recipe. In addition to standard sequencing-by-synthesis (SBS) protocols, a 5-second incubation in a palladium digest solution (Pd:THP equal to 1/5 in DEEA as described in Example 4) was added to unblock the 3'-AOM.
В первом эксперименте использовали следующие ffN в смеси для включения: 3'-AOM-ffT-LN3-NR550S0, 3'-AOM-ffA-LN3-BL-NR550S0, 3'-AOM-ffA-LN3-BL-NR650C5, 3'-AOM-ffA-LN3-NR7180A, 3'-AOM-ffC-LN3-SO7181 и 3’-AOM-pppG (темный G), и результат секвенирования для считываемого фрагмента 1 обобщается ниже.In the first experiment, the following ffNs were used in the inclusion mixture: 3'-AOM-ffT-LN3-NR550S0, 3'-AOM-ffA-LN3-BL-NR550S0, 3'-AOM-ffA-LN3-BL-NR650C5, 3' -AOM-ffA-LN3-NR7180A, 3′-AOM-ffC-LN3-SO7181 and 3′-AOM-pppG (dark G), and the sequencing result for read 1 is summarized below.
Во втором эксперименте немеченый 3’-АОМ-рррТ синтезировали аналогично получению 3’-AOM-pppG, описанному выше (ЖХ-МС (ЭР): (отрицательно заряженный ион) m/z 551 (М-Н4)). Его использовали в присутствии имеющегося в продаже зеленого ffG-LN3-PEG12-ATT0532 (используется на 4-канальных системах Illumina) в секвенировании, и использовались такие же ffA и ffC, что и ffA и ffC, описанные в первом эксперименте выше. Результаты обобщаются ниже. Имелись значительные улучшения по значениям фазирования и предфазирования, и не наблюдали затухания сигнала (ФИГ. 3А). Кроме того, также уменьшались показатели ошибки и для считываемого фрагмента 1, и для считываемого фрагмента 2.In the second experiment, unlabeled 3'-AOM-pppT was synthesized similarly to the preparation of 3'-AOM-pppG described above (LC-MS (ES): (negative ion) m/z 551 (M-H 4 )). It was used in the presence of the commercially available green ffG-LN3-PEG12-ATT0532 (used on 4-channel Illumina systems) in sequencing, and the same ffA and ffC were used as the ffA and ffC described in the first experiment above. The results are summarized below. There were significant improvements in phasing and prephasing values, and no signal attenuation was observed (FIG. 3A). In addition, the error rates for both read fragment 1 and read fragment 2 also decreased.
В другом эксперименте использовали смесь для включения, содержащую 3'-AOM-ffT-LN3'-NR550S0, 3'-AOM-ffA-LN3-BL-NR550S0, 3'-AOM-ffA-LN3-BL-NR650C5, 3'-AOM-ffA-LN3-NR7180A, 3'-AOM-ffC-LN3-S07181 и 3’-AOM-pppG (темный G). Аналогично предыдущим прогонам, в стандартный цикл SBS добавляли 5-секундную инкубацию с расщепляющей смесью, содержащей палладиевый катализатор (Pd/THP равно 1:10; 100 мМ DEEA, как описано в Примере 4). Использовали стандартную ДНК-полимеразу MiniSeq®, но с 2-кратным временем включения. Не наблюдали фенотип затухания сигнала (ФИГ. 3В). Кроме того, данные результаты секвенирования сравнивали с прогонами имеющейся в продаже MiniSeq® (среднее из 3; N равно 3), используя ffN со стандартной азидометильной блокирующей группой. Наблюдали то, что показатели ошибок были почти идентичными (ФИГ. 3С). Результаты секвенирования обобщаются ниже.In another experiment, an inclusion mixture containing 3'-AOM-ffT-LN3'-NR550S0, 3'-AOM-ffA-LN3-BL-NR550S0, 3'-AOM-ffA-LN3-BL-NR650C5, 3'- AOM-ffA-LN3-NR7180A, 3′-AOM-ffC-LN3-S07181, and 3′-AOM-pppG (dark G). Similar to previous runs, a 5-second incubation with a digestion mixture containing palladium catalyst (Pd/THP equal to 1:10; 100 mM DEEA, as described in Example 4) was added to the standard SBS run. Standard MiniSeq® DNA polymerase was used, but with a 2-fold turn-on time. No signal attenuation phenotype was observed (FIG. 3B). Additionally, these sequencing results were compared to commercially available MiniSeq® runs (average of 3; N = 3) using ffN with a standard azidomethyl blocking group. It was observed that the error rates were almost identical (FIG. 3C). The sequencing results are summarized below.
Кроме того, первичные показатели секвенирования для ffN с 3’-АОМ блокирующими группами сравнивали с первичными показателями секвенирования, полученными посредством стандартного имеющегося в продаже набора MiniSeq®, включающего ДНК-полимеразу Pol 812, и на ФИГ. 4А демонстрируются сравнимые результаты. Очень низкое предфазирование наблюдалось из-за улучшенной стабильности 3’-AOM-ffN. Однако фазирование все еще было повышенным, даже если использовали 2-кратное время включения.In addition, raw sequencing metrics for ffN with 3'-AOM blocking groups were compared to raw sequencing metrics generated by a standard commercially available MiniSeq® kit including Pol 812 DNA polymerase and FIG. 4A shows comparable results. Very low prephasing was observed due to the improved stability of 3′-AOM-ffN. However, phasing was still elevated even when 2x the on time was used.
В еще одном другом эксперименте использовали другую ДНК-полимеразу (Pol 1901) вместо ДНК-полимеразы в имеющихся в продаже наборах MiniSeq® (Pol 812). Pol 1901 обеспечивала стандартное 1× время включения в секвенировании вместо 2-кратного времени включения, описанного выше. Кроме того, инкубация в Pd расщепляющей смеси была уменьшена наполовину по сравнению со стандартным прогоном. Это обеспечивало 10%-ную экономию времени при полном химическом цикле SBS. Показатели секвенирования были значительно улучшенными и превышали значения, полученные от стандартных имеющихся в продаже наборов, содержащих 3’-О-азидометильную блокирующую группу (ФИГ. 4 В).In yet another experiment, a different DNA polymerase (Pol 1901) was used instead of the DNA polymerase in the commercially available MiniSeq® kits (Pol 812). Pol 1901 provided the standard 1× turn-on time in sequencing instead of the 2× turn-on time described above. In addition, the Pd incubation of the digestion mixture was reduced by half compared to the standard run. This provided a 10% time saving for the complete SBS chemical cycle. Sequencing performance was significantly improved and exceeded that obtained from standard commercially available kits containing a 3'-O-azidomethyl blocking group (FIG. 4 B).
Анализ стабильности 3' блокирующей группы при секвенированииAnalysis of the stability of the 3' blocking group during sequencing
Для демонстрации улучшения стабильности ffN с 3’-АОМ их сравнивали параллельно со стандартными ffN MiniSeq® с 3’-О-азидометильной группой. Два набора ffN инкубировали при 45°С в течение нескольких суток в стандартных препаратах смесей для включения, исключая только ДНК-полимеразу. Для каждого момента времени добавляли свежую полимеразу для завершения получения смеси для включения непосредственно перед загрузкой на MiniSeq®. Использовали условия секвенирования, описанные ранее. % предфазирования является прямым индикатором процентной доли 3'ОН-ffN, присутствующих в смеси, следовательно, он непосредственно коррелирует со стабильностью 3' блокирующей группы. Значения предфазирования для обоих наборов ffN записывали и откладывали на графике (ФИГ. 5). При 45° наблюдали то, что ffN, содержащие 3’-АОМ, оказывались в 6 раз более стабильными, чем стандартные ffN с 3’-О-азидометильной группой. Показатели секвенирования также подтверждали тенденцию, наблюдаемую во время анализа стабильности в растворе - 3’-АОМ блок был значительно более стабильным, чем 3’-О-азидометильная группа.To demonstrate the improved stability of ffNs with a 3'-AOM, they were compared in parallel to standard MiniSeq® ffNs with a 3'-O-azidomethyl group. Two sets of ffN were incubated at 45°C for several days in standard inclusion mixture preparations, excluding only DNA polymerase. For each time point, fresh polymerase was added to complete the inclusion mixture immediately before loading onto the MiniSeq®. Sequencing conditions described previously were used. % prephasing is a direct indicator of the percentage of 3'OH-ffN present in the mixture, therefore it directly correlates with the stability of the 3' blocking group. Prephasing values for both sets of ffN were recorded and plotted (FIG. 5). At 45°, it was observed that ffNs containing 3'-AOM were 6 times more stable than standard ffNs with a 3'-O-azidomethyl group. Sequencing performance also confirmed the trend observed during solution stability analysis—the 3'-AOM block was significantly more stable than the 3'-O-azidomethyl group.
Пример 6. Получение нуклеозидов, блокированных 3’-О-тиокарбаматом В данном примере получали разные нуклеозиды Т, защищенные 3’-О-тиокарбаматом, согласно Схеме 8.Example 6. Preparation of 3'-O-thiocarbamate-protected nucleosides In this example, various 3'-O-thiocarbamate-protected nucleosides T were prepared according to Scheme 8.
Получение Т-7: в высушенную в печи, продутую азотом 100 мл колбу добавляли 5'-O-(4,4'-диметокситритил)тимидин (1,0 г, 1,836 ммоль). Данную смесь совместно выпаривали с безводным DMF (3×20 мл) и помещали под азотом. Добавляли безводный DCM (9,2 мл) и 4-диметиламинопиридин (224 мг, 0,184 ммоль), и перемешивали при комнатной температуре, пока не образовался гомогенный раствор. Затем быстро добавляли 1,1'-тиокарбонилдиимидазол (360 мг, 2,02 ммоль) через струю азота, реакционную смесь повторно запечатывали и перемешивали при комнатной температуре в течение 2 часов, пока не потреблялось все исходное вещество. Данную реакционную смесь фильтруют через слой силикагеля, и остаток на фильтре промывают EtOAc (10 мл). Летучие вещества удаляли в вакууме, и неочищенный остаток использовали без дальнейшей очистки.Preparation of T-7: 5'-O-(4,4'-dimethoxytrityl)thymidine (1.0 g, 1.836 mmol) was added to an oven-dried, nitrogen-purged 100 mL flask. This mixture was co-evaporated with anhydrous DMF (3×20 ml) and placed under nitrogen. Anhydrous DCM (9.2 mL) and 4-dimethylaminopyridine (224 mg, 0.184 mmol) were added and stirred at room temperature until a homogeneous solution was formed. 1,1'-thiocarbonyldiimidazole (360 mg, 2.02 mmol) was then quickly added under a stream of nitrogen and the reaction mixture was resealed and stirred at room temperature for 2 hours until all starting material was consumed. This reaction mixture is filtered through a pad of silica gel and the filter cake is washed with EtOAc (10 ml). Volatiles were removed in vacuo and the crude residue was used without further purification.
Получение Т-8: соединение Т-7 с предыдущей стадии использовали немедленно после сушки в вакууме. Остаток помещали под азотом в 25 мл круглодонной колбе, добавляли диметиламин (2 M в THF, 7,3 мл, 14,6 ммоль), и данную реакционную смесь перемешивали в течение 2 часов, пока все исходное вещество не потреблялось согласно ТСХ. Все летучие вещества удаляли в вакууме с образованием прозрачного неочищенного остатка, который очищали колоночной флэш-хроматографией на силикагеле с получением Т-8 в виде белого твердого вещества. Выход: 1,15 г (99%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) 630,23 [М-Н].Preparation of T-8: Compound T-7 from the previous step was used immediately after vacuum drying. The residue was placed under nitrogen in a 25 mL round bottom flask, dimethylamine (2 M in THF, 7.3 mL, 14.6 mmol) was added and the reaction mixture was stirred for 2 hours until all starting material was consumed by TLC. All volatiles were removed in vacuo to leave a clear crude residue, which was purified by flash column chromatography on silica gel to give T-8 as a white solid. Yield: 1.15 g (99%). LC-MS (electrospray, negative ion mode) 630.23 [M-H].
Получение Т-9: исходный нуклеозид Т-8 (320 мг, 0,504 ммоль) растворяли в минимальном количестве ацетонитрила в 50 мл круглодонной колбе на воздухе. Добавляли за один прием раствор АсОН/H2O 5:1 (12,5 мл: 2,5 мл), и данную реакционную смесь перемешивали при комнатной температуре, пока не потреблялось все исходное вещество (2-4 часа). Выпаривание всех летучих веществ под вакуумом и совместное выпаривание остатка в толуоле (2×60 мл) давало неочищенный продукт в виде беловатого твердого вещества. Данный неочищенный продукт очищали колоночной флэш-хроматографией с получением Т-9 в виде белого твердого вещества. Выход: 123 мг (74%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) [М-Н] 328,10.Preparation of T-9: the starting nucleoside T-8 (320 mg, 0.504 mmol) was dissolved in a minimal amount of acetonitrile in a 50 ml round-bottom flask in air. A 5:1 AcOH/H 2 O solution (12.5 ml: 2.5 ml) was added at one time and the reaction mixture was stirred at room temperature until all the starting material was consumed (2-4 hours). Evaporation of all volatiles under vacuum and co-evaporation of the residue in toluene (2 x 60 ml) gave the crude product as a whitish solid. This crude product was purified by flash column chromatography to give T-9 as a white solid. Yield: 123 mg (74%). LC-MS (electrospray, negative ion mode) [M-H] 328.10.
Следуя аналогичной синтетической методике с использованием соответствующих MeNH2 или NH3, также получали нуклеозиды с двумя тиокарбаматными защитными группами. Общая схема реакции демонстрируется ниже:Following a similar synthetic procedure using the appropriate MeNH 2 or NH 3 , nucleosides with two thiocarbamate protecting groups were also prepared. The general reaction scheme is shown below:
Анализ стабильности 3’-О-тиокарбаматных блокирующих группAnalysis of the stability of 3'-O-thiocarbamate blocking groups
Анализы стабильности для нуклеотида 5'-mP 3’-DMTC Т проводили параллельно в растворе буфера для включения со стандартным нуклеотидом 5'-mP 3’-О-азидометил Т.Stability assays for the nucleotide 5'-mP 3'-DMTC T were performed in parallel in inclusion buffer solution with the standard nucleotide 5'-mP 3'-O-azidomethyl T.
И для 5'-mP 3’-DMTC Т, и для 5'-mP 3’-О-азидометил Т конечный объем раствора составлял 1 мл, и конечные концентрации соответствующих нуклеотидов состаляли 0,1 мМ для обоих. Другие компоненты водного буферного раствора включают этаноламин (ЕА), этаноламин HCl, NaCl (100 мМ) и EDTA (2,5 мМ). Данный буферный раствор имеет следующую концентрацию: 0,5 М буфер ЕА, 0,5 М NaCl, 0,01 М EDTA.For both 5'-mP 3'-DMTC T and 5'-mP 3'-O-azidomethyl T, the final solution volume was 1 ml, and the final concentrations of the corresponding nucleotides were 0.1 mM for both. Other components of the aqueous buffer solution include ethanolamine (EA), ethanolamine HCl, NaCl (100 mM) and EDTA (2.5 mM). This buffer solution has the following concentration: 0.5 M buffer EA, 0.5 M NaCl, 0.01 M EDTA.
Методология анализа стабильностиStability Analysis Methodology
200 мкл 10× буферного раствора добавляли в 1,7 мл полипропиленовую микропробирку с крышкой с защелкой и разводили правильным объемом 18 мΩ воды. Затем добавляли соответствующий нуклеозид, флакон закупоривали и осуществляли перемешивание посредством переворачивания, легкого перемешивания или отсасывания микропипеткой. Отбирали 40 мкл аликвоту и анализировали посредством ВЭЖХ для того, чтобы она действовала в качестве исходного значения (или t равно 0). Данные флаконы затем помещали в предварительно нагретый до 65°С колбонагреватель, покрывали толстым слоем алюминиевой фольги и оставляли нагреваться в течение одного месяца. Периодически отбирали 40 мкл аликвоты (неделя 1: один раз в сутки. Недели 2-4:1 раз каждые 2 суток) и анализировали посредством ВЭЖХ для определения процентной доли исходного вещества и процентной доли деблокированного (3’-ОН) нуклеотида в данных образцах. Анализ ВЭЖХ проводили посредством измерения площади пика исходного нуклеотида и пика 3'ОН. Данные значения использовали для расчета графически процентной доли деблокированного нуклеотида, который присутствовал, и использовали для сравнения стабильности в буфере для включения между образцами. На ФИГ. 6 проиллюстрированы сравнительные результаты стабильности трех разных 3' блокированных тиокарбаматом нуклеотидов с нуклеотидами, блокированными 3’-О-азидометильной блокирующей группой, при 65°С. Наблюдали то, что в то время как нуклеотид с 3'-O-C(=S)NH2 или 3'-O-C(=S)NHCH3 был менее стабильным, чем нуклеотид, защищенный стандартной 3’-О-азидометильной группой, нуклеотид с 3’-DMTC придавал улучшенную стабильность во время 9-сутокчного периода анализа. DMTC, как таковой, демонстрировал превосходную стабильность над стандартной азидометильной блокирующей группой.200 μL of 10× buffer solution was added to a 1.7 mL polypropylene microtube with a snap cap and diluted with the correct volume of 18 mΩ water. The appropriate nucleoside was then added, the vial was capped, and mixing was accomplished by inversion, gentle stirring, or micropipette suction. A 40 μl aliquot was taken and analyzed by HPLC to act as the input value (or t equal to 0). These vials were then placed in a heating mantle preheated to 65°C, covered with a thick layer of aluminum foil and allowed to heat for one month. 40 μl aliquots were taken periodically (week 1: once daily. Weeks 2-4: 1 times every 2 days) and analyzed by HPLC to determine the percentage of starting material and the percentage of deblocked (3'-OH) nucleotide in these samples. HPLC analysis was performed by measuring the peak area of the parent nucleotide and the 3'OH peak. These values were used to graphically calculate the percentage of unblocked nucleotide that was present and used to compare stability in inclusion buffer between samples. In FIG. 6 illustrates comparative stability results of three different 3' thiocarbamate-blocked nucleotides with 3'-O-azidomethyl blocking group-blocked nucleotides at 65°C. It was observed that while a nucleotide with 3'-OC(=S)NH 2 or 3'-OC(=S)NHCH 3 was less stable than a nucleotide protected by a standard 3'-O-azidomethyl group, a nucleotide with 3'-DMTC provided improved stability during the 9-day assay period. DMTC, as such, exhibited superior stability over the standard azidomethyl blocking group.
Пример 7. Анализ деблокирования 3’-О-тиокарбаматной блокирующей группыExample 7 Deblocking Assay for 3'-O-thiocarbamate Blocking Group
В данном примере деблокирование или анализы деблокирования для 5'-mP 3’-DMTC Т и стандартного 5'-mP 3’-О-азидометил Т проводили индивидуально в уникальном растворе для каждой блокирующей группы. Были созданы условия для имитации стандартного деблокирующего реагента Illumina настолько близко, насколько это возможно, и следуя той же самой методологии. Поддерживали те же самые концентрации активного деблокирующего реагента, буфера и нуклеозида во всех анализах, но идентичность каждого компонента была уникальной. Данным способом наблюдаемое различие в скорости между индивидуальными химиями деблокирования не может быть обусловлено различиями в концентрации препарата.In this example, deblocking or deblocking assays for 5'-mP 3'-DMTC T and standard 5'-mP 3'-O-azidomethyl T were performed individually in a unique solution for each blocking group. Conditions were set to mimic the standard Illumina release reagent as closely as possible and following the same methodology. The same concentrations of active deblocking reagent, buffer, and nucleoside were maintained in all assays, but the identity of each component was unique. In this manner, the observed differences in rates between individual deblocking chemistries cannot be due to differences in drug concentration.
Общая методология анализа деблокированияGeneral methodology for release analysis
Каждый компонент реакции готовили индивидуально в виде концентрированного маточного раствора в 18 мΩ воде, хранили надлежащим образом, и аликвоты объединяли в конкретном порядке, приведенном ниже. Реакция начиналась добавлением предварительно приготовленного деблокирующего реагента. Конечные концентрации: нуклеозид (0,1 мМ), активный деблокирующий реагент (1 мМ), добавка (специфичная по отношению к деблокирующему реагенту), буфер (100 мМ). Конечный объем: 2000 мкл.Each reaction component was prepared individually as a concentrated stock solution in 18 mΩ water, stored appropriately, and aliquots were combined in the specific order given below. The reaction was started by adding a previously prepared deblocking reagent. Final concentrations: nucleoside (0.1 mM), active deblocking reagent (1 mM), additive (specific to the deblocking reagent), buffer (100 mM). Final volume: 2000 µl.
В 3 мл стеклянный флакон добавляли предварительно приготовленный буферный раствор, с последующим добавлением предварительно приготовленной добавки. Данную смесь разбавляли правильным объемом 18 мΩ воды и перемешивали в течение 10 минут. Затем добавляли аликвоту раствора нуклеотида и перемешивали в течение 5 минут. Затем отбирали 40 мкл аликвоту, добавляли гасящий реагент и анализировали посредством ВЭЖХ в качестве эталонного пика (или t равно 0 мин). Затем добавляли к перемешиваемому раствору в один прием деблокирующий реагент, и начинался отсчет времени. В определенные моменты времени отбирали 40 мкл аликвоты и немедленно гасили подходящим гасящим реагентом, затем анализировали посредством ВЭЖХ для определения количества деблокированного нуклеотида, который появлялся в данные определенные моменты времени. Результаты графически откладывали на графике и использовали для сравнения эффективности и действенности деблокирования.A pre-prepared buffer solution was added to a 3 ml glass vial, followed by the addition of a pre-prepared additive. This mixture was diluted with the correct volume of 18 mΩ water and stirred for 10 minutes. An aliquot of the nucleotide solution was then added and mixed for 5 minutes. A 40 μL aliquot was then removed, a quenching reagent was added, and analyzed by HPLC as a reference peak (or t = 0 min). Then the deblocking reagent was added to the stirred solution in one step, and the countdown began. At specific time points, 40 μl aliquots were removed and immediately quenched with a suitable quenching reagent, then analyzed by HPLC to determine the amount of released nucleotide that appeared at those specific time points. The results were plotted graphically and used to compare the effectiveness and efficiency of release.
Деблокирование DMTCDMTC release
Нуклеотид: 5'-mP 3'-DMTC Т. Активный деблокирующий реагент: NaIO4 (0,1 М в 18 мΩ воде) или Oxone® (0,1 М в 18 мΩ воде). Добавка: нет. Буфер для NaIO4: фосфатный буфер с рН 6,75 (1 М в 18 мΩ воде). Буфер для Oxone®: фосфатный буфер с рН 8,65 (1 М в 18 мΩ воде). Гасящий реагент: тиосульфат натрия. Условия деблокирования 3'-О-азидометила являются такими же, как условия, описанные в Примере 3.Nucleotide: 5'-mP 3'-DMTC T. Active deblocking reagent: NaIO 4 (0.1 M in 18 mΩ water) or Oxone® (0.1 M in 18 mΩ water). Additive: no. Buffer for NaIO 4 : phosphate buffer with pH 6.75 (1 M in 18 mΩ water). Buffer for Oxone®: phosphate buffer pH 8.65 (1 M in 18 mΩ water). Quenching reagent: sodium thiosulfate. The conditions for deprotection of 3'-O-azidomethyl are the same as those described in Example 3.
Анализ ВЭЖХ проводили посредством измерения площади пика исходного нуклеозида, пика 3'-ОН и любых других пиков нуклеотидов, которые появляются на хроматограмме ВЭЖХ. Данные значения использовали для расчета процентной доли исходного нуклеотида и деблокированного нуклеотида, которую представляли графически и использовали для сравнения скорости, эффективности и действенности деблокирования между образцами. Сравнительный результат показан на ФИГ. 7. Наблюдали то, что деблокирование DMTC с использованием NaIO4 не было эффективным. Однако % остающегося исходного вещества был значительно меньше для нуклеотида с блокирующей группой DMTC при расщеплении DMTC с использованием Oxone®. В заключение, DMTC продемонстрировал превосходную скорость деблокирования (с Oxone®) над скоростью деблокирования стандартной азидометильной блокирующей группы.HPLC analysis was performed by measuring the area of the parent nucleoside peak, the 3'-OH peak, and any other nucleotide peaks that appear in the HPLC chromatogram. These values were used to calculate the percentage of original nucleotide and unblocked nucleotide, which was presented graphically and used to compare the rate, efficiency and effectiveness of unblocking between samples. The comparative result is shown in FIG. 7. It was observed that deblocking of DMTC using NaIO 4 was not effective. However, the % of starting material remaining was significantly less for the nucleotide with the DMTC blocking group when cleaving DMTC using Oxone®. In conclusion, DMTC demonstrated superior deprotection rate (with Oxone®) over that of the standard azidomethyl blocking group.
Claims (65)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62/784,970 | 2018-12-26 | ||
US62/784,994 | 2018-12-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2020141465A RU2020141465A (en) | 2023-01-26 |
RU2818762C2 true RU2818762C2 (en) | 2024-05-06 |
Family
ID=
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002029003A2 (en) * | 2000-10-06 | 2002-04-11 | The Trustees Of Columbia University In The City Of New York | Massive parallel method for decoding dna and rna |
WO2004018497A2 (en) * | 2002-08-23 | 2004-03-04 | Solexa Limited | Modified nucleotides for polynucleotide sequencing |
RU2563808C2 (en) * | 2007-01-11 | 2015-09-20 | Новартис Аг | Modified capsular saccharide, method for production and use thereof |
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002029003A2 (en) * | 2000-10-06 | 2002-04-11 | The Trustees Of Columbia University In The City Of New York | Massive parallel method for decoding dna and rna |
WO2004018497A2 (en) * | 2002-08-23 | 2004-03-04 | Solexa Limited | Modified nucleotides for polynucleotide sequencing |
RU2563808C2 (en) * | 2007-01-11 | 2015-09-20 | Новартис Аг | Modified capsular saccharide, method for production and use thereof |
Non-Patent Citations (1)
Title |
---|
METZKER M.L. et al. Termination of dna synthesis by novel 3'-modified-deoxyribonucleoside 5'-triphosphates // Nucleic acids research, 1994, vol. 22, no. 20, p. 4259-4267. * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11827931B2 (en) | Methods of preparing growing polynucleotides using nucleotides with 3′ AOM blocking group | |
US11787831B2 (en) | Nucleosides and nucleotides with 3′ acetal blocking group | |
US20220195517A1 (en) | Long stokes shift chromenoquinoline dyes and uses in sequencing applications | |
US20220380389A1 (en) | Fluorescent dyes containing bis-boron fused heterocycles and uses in sequencing | |
US20220195196A1 (en) | Alkylpyridinium coumarin dyes and uses in sequencing applications | |
RU2818762C2 (en) | Nucleosides and nucleotides with 3'-hydroxy blocking groups and their use in methods of sequencing polynucleotides | |
US20240182963A1 (en) | Methods of sequencing using 3' blocked nucleotides | |
US20230313292A1 (en) | Chromenoquinoline dyes and uses in sequencing | |
NZ770894A (en) | Nucleosides and nucleotides with 3'-hydroxy blocking groups and their use in polynucleotide sequencing methods | |
WO2023232829A1 (en) | Compositions and methods for nucleic acid sequencing | |
JP2024519372A (en) | Compositions and methods for sequencing by synthesis | |
WO2024003087A1 (en) | Fluorescent dyes containing fused tetracyclic bis-boron heterocycle and uses in sequencing |