KR20230031837A - 3' 아세탈 블로킹기를 갖는 뉴클레오시드 및 뉴클레오티드 - Google Patents
3' 아세탈 블로킹기를 갖는 뉴클레오시드 및 뉴클레오티드 Download PDFInfo
- Publication number
- KR20230031837A KR20230031837A KR1020227045221A KR20227045221A KR20230031837A KR 20230031837 A KR20230031837 A KR 20230031837A KR 1020227045221 A KR1020227045221 A KR 1020227045221A KR 20227045221 A KR20227045221 A KR 20227045221A KR 20230031837 A KR20230031837 A KR 20230031837A
- Authority
- KR
- South Korea
- Prior art keywords
- nucleotide
- polynucleotide
- group
- nucleoside
- nucleotides
- Prior art date
Links
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 398
- 239000002773 nucleotide Substances 0.000 title claims abstract description 390
- 230000000903 blocking effect Effects 0.000 title claims abstract description 120
- 239000002777 nucleoside Substances 0.000 title claims abstract description 93
- 125000003835 nucleoside group Chemical group 0.000 title claims abstract description 23
- DHKHKXVYLBGOIT-UHFFFAOYSA-N acetaldehyde Diethyl Acetal Natural products CCOC(C)OCC DHKHKXVYLBGOIT-UHFFFAOYSA-N 0.000 title abstract description 18
- 125000002777 acetyl group Chemical class [H]C([H])([H])C(*)=O 0.000 title abstract description 18
- 238000012163 sequencing technique Methods 0.000 claims abstract description 145
- 238000000034 method Methods 0.000 claims abstract description 127
- 150000003833 nucleoside derivatives Chemical class 0.000 claims abstract description 73
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical group OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 claims abstract description 19
- 125000000171 (C1-C6) haloalkyl group Chemical group 0.000 claims abstract description 14
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 claims abstract description 14
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 claims abstract description 14
- 229910052736 halogen Inorganic materials 0.000 claims abstract description 13
- 150000002367 halogens Chemical class 0.000 claims abstract description 12
- 229910052760 oxygen Inorganic materials 0.000 claims abstract description 12
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 claims abstract description 11
- 229910052717 sulfur Inorganic materials 0.000 claims abstract description 11
- KDLHZDBZIXYQEI-UHFFFAOYSA-N Palladium Chemical compound [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 claims description 218
- 239000002157 polynucleotide Substances 0.000 claims description 162
- 108091033319 polynucleotide Proteins 0.000 claims description 161
- 102000040430 polynucleotide Human genes 0.000 claims description 161
- 239000000243 solution Substances 0.000 claims description 109
- 238000003776 cleavage reaction Methods 0.000 claims description 101
- 230000007017 scission Effects 0.000 claims description 90
- 238000006243 chemical reaction Methods 0.000 claims description 74
- 125000005647 linker group Chemical group 0.000 claims description 68
- -1 phosphate ester Chemical class 0.000 claims description 66
- 229910052763 palladium Inorganic materials 0.000 claims description 60
- 239000003153 chemical reaction reagent Substances 0.000 claims description 57
- 239000002516 radical scavenger Substances 0.000 claims description 51
- 101150003085 Pdcl gene Proteins 0.000 claims description 46
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 claims description 45
- 125000003118 aryl group Chemical group 0.000 claims description 44
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 43
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 claims description 40
- 125000004452 carbocyclyl group Chemical group 0.000 claims description 34
- 239000003054 catalyst Substances 0.000 claims description 34
- 230000000295 complement effect Effects 0.000 claims description 32
- 238000010348 incorporation Methods 0.000 claims description 32
- 108091034117 Oligonucleotide Proteins 0.000 claims description 30
- 239000007787 solid Substances 0.000 claims description 30
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 claims description 29
- 239000000872 buffer Substances 0.000 claims description 29
- 150000001875 compounds Chemical class 0.000 claims description 29
- 239000000126 substance Substances 0.000 claims description 29
- 239000001226 triphosphate Chemical class 0.000 claims description 28
- 235000011178 triphosphate Nutrition 0.000 claims description 27
- 125000000623 heterocyclic group Chemical group 0.000 claims description 26
- XYFCBTPGUUZFHI-UHFFFAOYSA-N Phosphine Chemical compound P XYFCBTPGUUZFHI-UHFFFAOYSA-N 0.000 claims description 24
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 claims description 24
- 239000007850 fluorescent dye Substances 0.000 claims description 24
- WXHIJDCHNDBCNY-UHFFFAOYSA-N palladium dihydride Chemical compound [PdH2] WXHIJDCHNDBCNY-UHFFFAOYSA-N 0.000 claims description 23
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical class OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 claims description 23
- 239000004471 Glycine Substances 0.000 claims description 22
- 238000003491 array Methods 0.000 claims description 22
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 20
- 125000000882 C2-C6 alkenyl group Chemical group 0.000 claims description 19
- 125000003601 C2-C6 alkynyl group Chemical group 0.000 claims description 19
- 125000001313 C5-C10 heteroaryl group Chemical group 0.000 claims description 18
- 102000004190 Enzymes Human genes 0.000 claims description 18
- 108090000790 Enzymes Proteins 0.000 claims description 18
- 125000006239 protecting group Chemical group 0.000 claims description 18
- 150000003839 salts Chemical class 0.000 claims description 16
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 claims description 15
- VVJKKWFAADXIJK-UHFFFAOYSA-N Allylamine Chemical compound NCC=C VVJKKWFAADXIJK-UHFFFAOYSA-N 0.000 claims description 15
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 14
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 14
- 238000005406 washing Methods 0.000 claims description 14
- 239000004201 L-cysteine Substances 0.000 claims description 13
- 235000013878 L-cysteine Nutrition 0.000 claims description 13
- 230000003139 buffering effect Effects 0.000 claims description 13
- 125000005843 halogen group Chemical group 0.000 claims description 13
- XXROGKLTLUQVRX-UHFFFAOYSA-N allyl alcohol Chemical compound OCC=C XXROGKLTLUQVRX-UHFFFAOYSA-N 0.000 claims description 12
- 229910000073 phosphorus hydride Inorganic materials 0.000 claims description 12
- 150000003512 tertiary amines Chemical class 0.000 claims description 12
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims description 11
- CFCNTIFLYGKEIO-UHFFFAOYSA-N 2-isocyanoacetic acid Chemical compound OC(=O)C[N+]#[C-] CFCNTIFLYGKEIO-UHFFFAOYSA-N 0.000 claims description 10
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 claims description 10
- 235000011180 diphosphates Nutrition 0.000 claims description 10
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 claims description 9
- KWYHDKDOAIKMQN-UHFFFAOYSA-N N,N,N',N'-tetramethylethylenediamine Chemical compound CN(C)CCN(C)C KWYHDKDOAIKMQN-UHFFFAOYSA-N 0.000 claims description 9
- 238000005520 cutting process Methods 0.000 claims description 9
- 238000011065 in-situ storage Methods 0.000 claims description 9
- 150000003013 phosphoric acid derivatives Chemical class 0.000 claims description 9
- UEEJHVSXFDXPFK-UHFFFAOYSA-N N-dimethylaminoethanol Chemical compound CN(C)CCO UEEJHVSXFDXPFK-UHFFFAOYSA-N 0.000 claims description 8
- 150000001642 boronic acid derivatives Chemical class 0.000 claims description 8
- 150000005323 carbonate salts Chemical class 0.000 claims description 8
- 229960002887 deanol Drugs 0.000 claims description 8
- 239000012972 dimethylethanolamine Substances 0.000 claims description 8
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 claims description 8
- DIHKMUNUGQVFES-UHFFFAOYSA-N n,n,n',n'-tetraethylethane-1,2-diamine Chemical compound CCN(CC)CCN(CC)CC DIHKMUNUGQVFES-UHFFFAOYSA-N 0.000 claims description 8
- 150000003003 phosphines Chemical class 0.000 claims description 8
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 claims description 8
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 claims description 7
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 claims description 7
- 229910019142 PO4 Inorganic materials 0.000 claims description 7
- 150000001413 amino acids Chemical class 0.000 claims description 7
- 150000003141 primary amines Chemical class 0.000 claims description 7
- 150000003335 secondary amines Chemical class 0.000 claims description 7
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 6
- 229940024606 amino acid Drugs 0.000 claims description 6
- 235000001014 amino acid Nutrition 0.000 claims description 6
- AGBQKNBQESQNJD-UHFFFAOYSA-M lipoate Chemical compound [O-]C(=O)CCCCC1CCSS1 AGBQKNBQESQNJD-UHFFFAOYSA-M 0.000 claims description 6
- 235000019136 lipoic acid Nutrition 0.000 claims description 6
- 239000010452 phosphate Substances 0.000 claims description 6
- 229960002663 thioctic acid Drugs 0.000 claims description 6
- 150000003573 thiols Chemical class 0.000 claims description 6
- 239000007983 Tris buffer Substances 0.000 claims description 5
- ABBZJHFBQXYTLU-UHFFFAOYSA-N but-3-enamide Chemical compound NC(=O)CC=C ABBZJHFBQXYTLU-UHFFFAOYSA-N 0.000 claims description 5
- 229910052801 chlorine Inorganic materials 0.000 claims description 5
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 5
- 235000018417 cysteine Nutrition 0.000 claims description 5
- 239000001177 diphosphate Chemical class 0.000 claims description 5
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 claims description 5
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 5
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 claims description 5
- JKANAVGODYYCQF-UHFFFAOYSA-N prop-2-yn-1-amine Chemical compound NCC#C JKANAVGODYYCQF-UHFFFAOYSA-N 0.000 claims description 5
- 108010024636 Glutathione Proteins 0.000 claims description 4
- PWKSKIMOESPYIA-BYPYZUCNSA-N L-N-acetyl-Cysteine Chemical compound CC(=O)N[C@@H](CS)C(O)=O PWKSKIMOESPYIA-BYPYZUCNSA-N 0.000 claims description 4
- 239000002253 acid Substances 0.000 claims description 4
- MZGNSEAPZQGJRB-UHFFFAOYSA-N dimethyldithiocarbamic acid Chemical compound CN(C)C(S)=S MZGNSEAPZQGJRB-UHFFFAOYSA-N 0.000 claims description 4
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical class [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 claims description 4
- 229960001484 edetic acid Drugs 0.000 claims description 4
- FPULFENIJDPZBX-UHFFFAOYSA-N ethyl 2-isocyanoacetate Chemical compound CCOC(=O)C[N+]#[C-] FPULFENIJDPZBX-UHFFFAOYSA-N 0.000 claims description 4
- DNJIEGIFACGWOD-UHFFFAOYSA-N ethyl mercaptane Natural products CCS DNJIEGIFACGWOD-UHFFFAOYSA-N 0.000 claims description 4
- 229960003180 glutathione Drugs 0.000 claims description 4
- NBZBKCUXIYYUSX-UHFFFAOYSA-N iminodiacetic acid Chemical compound OC(=O)CNCC(O)=O NBZBKCUXIYYUSX-UHFFFAOYSA-N 0.000 claims description 4
- 150000004712 monophosphates Chemical class 0.000 claims description 4
- JCBJVAJGLKENNC-UHFFFAOYSA-M potassium ethyl xanthate Chemical compound [K+].CCOC([S-])=S JCBJVAJGLKENNC-UHFFFAOYSA-M 0.000 claims description 4
- ZMWBGRXFDPJFGC-UHFFFAOYSA-M potassium;propan-2-yloxymethanedithioate Chemical compound [K+].CC(C)OC([S-])=S ZMWBGRXFDPJFGC-UHFFFAOYSA-M 0.000 claims description 4
- TVDSBUOJIPERQY-UHFFFAOYSA-N prop-2-yn-1-ol Chemical compound OCC#C TVDSBUOJIPERQY-UHFFFAOYSA-N 0.000 claims description 4
- HCJTYESURSHXNB-UHFFFAOYSA-N propynamide Chemical compound NC(=O)C#C HCJTYESURSHXNB-UHFFFAOYSA-N 0.000 claims description 4
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical class [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 claims description 4
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 claims description 4
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- CRXFROMHHBMNAB-UHFFFAOYSA-N methyl 2-isocyanoacetate Chemical compound COC(=O)C[N+]#[C-] CRXFROMHHBMNAB-UHFFFAOYSA-N 0.000 claims description 3
- 150000002823 nitrates Chemical class 0.000 claims description 3
- 239000011574 phosphorus Substances 0.000 claims description 3
- 229910052698 phosphorus Inorganic materials 0.000 claims description 3
- JKDRQYIYVJVOPF-FDGPNNRMSA-L palladium(ii) acetylacetonate Chemical compound [Pd+2].C\C([O-])=C\C(C)=O.C\C([O-])=C\C(C)=O JKDRQYIYVJVOPF-FDGPNNRMSA-L 0.000 claims description 2
- 102100034343 Integrase Human genes 0.000 claims 2
- KZTWONRVIPPDKH-UHFFFAOYSA-N 2-(piperidin-1-yl)ethanol Chemical compound OCCN1CCCCC1 KZTWONRVIPPDKH-UHFFFAOYSA-N 0.000 claims 1
- 125000000415 L-cysteinyl group Chemical group O=C([*])[C@@](N([H])[H])([H])C([H])([H])S[H] 0.000 claims 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 claims 1
- 150000007523 nucleic acids Chemical class 0.000 abstract description 57
- 102000039446 nucleic acids Human genes 0.000 abstract description 55
- 108020004707 nucleic acids Proteins 0.000 abstract description 55
- 239000000203 mixture Substances 0.000 description 72
- 239000000975 dye Substances 0.000 description 50
- 238000003786 synthesis reaction Methods 0.000 description 49
- YICAEXQYKBMDNH-UHFFFAOYSA-N 3-[bis(3-hydroxypropyl)phosphanyl]propan-1-ol Chemical compound OCCCP(CCCO)CCCO YICAEXQYKBMDNH-UHFFFAOYSA-N 0.000 description 47
- 230000015572 biosynthetic process Effects 0.000 description 46
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 34
- 125000004432 carbon atom Chemical group C* 0.000 description 33
- 125000000217 alkyl group Chemical group 0.000 description 28
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 27
- 238000001514 detection method Methods 0.000 description 26
- 108020004414 DNA Proteins 0.000 description 24
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 23
- 229910052757 nitrogen Inorganic materials 0.000 description 23
- 239000011734 sodium Substances 0.000 description 22
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 21
- 150000001450 anions Chemical class 0.000 description 21
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 18
- 230000003321 amplification Effects 0.000 description 18
- 125000004122 cyclic group Chemical group 0.000 description 18
- 238000003199 nucleic acid amplification method Methods 0.000 description 18
- 238000012512 characterization method Methods 0.000 description 17
- 125000001424 substituent group Chemical group 0.000 description 17
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 17
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 16
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 16
- 229910052739 hydrogen Inorganic materials 0.000 description 16
- AFQIYTIJXGTIEY-UHFFFAOYSA-N hydrogen carbonate;triethylazanium Chemical compound OC(O)=O.CCN(CC)CC AFQIYTIJXGTIEY-UHFFFAOYSA-N 0.000 description 16
- 239000000758 substrate Substances 0.000 description 16
- 239000000460 chlorine Substances 0.000 description 15
- 230000005284 excitation Effects 0.000 description 15
- SNOOUWRIMMFWNE-UHFFFAOYSA-M sodium;6-[(3,4,5-trimethoxybenzoyl)amino]hexanoate Chemical compound [Na+].COC1=CC(C(=O)NCCCCCC([O-])=O)=CC(OC)=C1OC SNOOUWRIMMFWNE-UHFFFAOYSA-M 0.000 description 15
- 235000000346 sugar Nutrition 0.000 description 15
- 125000003342 alkenyl group Chemical group 0.000 description 14
- 125000000304 alkynyl group Chemical group 0.000 description 14
- 239000001257 hydrogen Substances 0.000 description 14
- 125000002947 alkylene group Chemical group 0.000 description 13
- 239000007864 aqueous solution Substances 0.000 description 13
- 125000004429 atom Chemical group 0.000 description 13
- 229960002433 cysteine Drugs 0.000 description 13
- 238000002474 experimental method Methods 0.000 description 13
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 13
- 239000012071 phase Substances 0.000 description 13
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 12
- 125000006714 (C3-C10) heterocyclyl group Chemical group 0.000 description 11
- 239000012043 crude product Substances 0.000 description 11
- 235000019439 ethyl acetate Nutrition 0.000 description 11
- 125000005842 heteroatom Chemical group 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 11
- PPASLZSBLFJQEF-RKJRWTFHSA-M sodium ascorbate Substances [Na+].OC[C@@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RKJRWTFHSA-M 0.000 description 11
- 235000010378 sodium ascorbate Nutrition 0.000 description 11
- 229960005055 sodium ascorbate Drugs 0.000 description 11
- PPASLZSBLFJQEF-RXSVEWSESA-M sodium-L-ascorbate Chemical compound [Na+].OC[C@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RXSVEWSESA-M 0.000 description 11
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 description 10
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 10
- 229910052799 carbon Inorganic materials 0.000 description 10
- 125000000753 cycloalkyl group Chemical group 0.000 description 10
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 10
- 238000003818 flash chromatography Methods 0.000 description 10
- 125000004404 heteroalkyl group Chemical group 0.000 description 10
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 10
- 230000002441 reversible effect Effects 0.000 description 10
- 125000004737 (C1-C6) haloalkoxy group Chemical group 0.000 description 9
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 9
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 239000011324 bead Substances 0.000 description 9
- 125000001072 heteroaryl group Chemical group 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 239000002904 solvent Substances 0.000 description 9
- 229940113082 thymine Drugs 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- 229920001213 Polysorbate 20 Polymers 0.000 description 8
- 150000001768 cations Chemical class 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 230000006698 induction Effects 0.000 description 8
- 238000002156 mixing Methods 0.000 description 8
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 8
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 229920006395 saturated elastomer Polymers 0.000 description 8
- 239000000741 silica gel Substances 0.000 description 8
- 229910002027 silica gel Inorganic materials 0.000 description 8
- 239000011780 sodium chloride Substances 0.000 description 8
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 7
- 125000003545 alkoxy group Chemical group 0.000 description 7
- 125000003277 amino group Chemical group 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000002255 enzymatic effect Effects 0.000 description 7
- 239000012074 organic phase Substances 0.000 description 7
- 239000000523 sample Substances 0.000 description 7
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 6
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 6
- JMXMXKRNIYCNRV-UHFFFAOYSA-N bis(hydroxymethyl)phosphanylmethanol Chemical compound OCP(CO)CO JMXMXKRNIYCNRV-UHFFFAOYSA-N 0.000 description 6
- 239000000017 hydrogel Substances 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 150000002500 ions Chemical class 0.000 description 6
- 239000011807 nanoball Substances 0.000 description 6
- 239000001301 oxygen Substances 0.000 description 6
- IWTQNSMPJLXKLL-UHFFFAOYSA-M potassium;2-isocyanoacetate Chemical group [K+].[O-]C(=O)C[N+]#[C-] IWTQNSMPJLXKLL-UHFFFAOYSA-M 0.000 description 6
- 239000003039 volatile agent Substances 0.000 description 6
- PHIYHIOQVWTXII-UHFFFAOYSA-N 3-amino-1-phenylpropan-1-ol Chemical compound NCCC(O)C1=CC=CC=C1 PHIYHIOQVWTXII-UHFFFAOYSA-N 0.000 description 5
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 5
- 238000001712 DNA sequencing Methods 0.000 description 5
- 102100031780 Endonuclease Human genes 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 239000001045 blue dye Substances 0.000 description 5
- 150000001721 carbon Chemical group 0.000 description 5
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 5
- 229940104302 cytosine Drugs 0.000 description 5
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 5
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 5
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 5
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 5
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 5
- 239000005546 dideoxynucleotide Substances 0.000 description 5
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000004128 high performance liquid chromatography Methods 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 150000002430 hydrocarbons Chemical group 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 235000021317 phosphate Nutrition 0.000 description 5
- 229940035893 uracil Drugs 0.000 description 5
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 4
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 4
- 229920005654 Sephadex Polymers 0.000 description 4
- 239000012507 Sephadex™ Substances 0.000 description 4
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 description 4
- 239000012230 colorless oil Substances 0.000 description 4
- 239000013058 crude material Substances 0.000 description 4
- HGCIXCUEYOPUTN-UHFFFAOYSA-N cyclohexene Chemical compound C1CCC=CC1 HGCIXCUEYOPUTN-UHFFFAOYSA-N 0.000 description 4
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 125000000524 functional group Chemical group 0.000 description 4
- 238000004255 ion exchange chromatography Methods 0.000 description 4
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 4
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 150000003212 purines Chemical class 0.000 description 4
- 238000012175 pyrosequencing Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 4
- 239000000377 silicon dioxide Substances 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 239000011593 sulfur Substances 0.000 description 4
- SGPUHRSBWMQRAN-UHFFFAOYSA-N 2-[bis(1-carboxyethyl)phosphanyl]propanoic acid Chemical compound OC(=O)C(C)P(C(C)C(O)=O)C(C)C(O)=O SGPUHRSBWMQRAN-UHFFFAOYSA-N 0.000 description 3
- PTHDBHDZSMGHKF-UHFFFAOYSA-N 2-piperidin-2-ylethanol Chemical compound OCCC1CCCCN1 PTHDBHDZSMGHKF-UHFFFAOYSA-N 0.000 description 3
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 3
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 3
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 description 3
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 3
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 3
- 239000008346 aqueous phase Substances 0.000 description 3
- 125000003710 aryl alkyl group Chemical group 0.000 description 3
- 239000012267 brine Substances 0.000 description 3
- 239000006172 buffering agent Substances 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 125000001309 chloro group Chemical group Cl* 0.000 description 3
- 125000004093 cyano group Chemical group *C#N 0.000 description 3
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 239000012299 nitrogen atmosphere Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000012044 organic layer Substances 0.000 description 3
- 125000004430 oxygen atom Chemical group O* 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 150000008300 phosphoramidites Chemical class 0.000 description 3
- 238000006116 polymerization reaction Methods 0.000 description 3
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 3
- 150000003230 pyrimidines Chemical class 0.000 description 3
- 150000003254 radicals Chemical class 0.000 description 3
- 238000004007 reversed phase HPLC Methods 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 125000002652 ribonucleotide group Chemical group 0.000 description 3
- HPALAKNZSZLMCH-UHFFFAOYSA-M sodium;chloride;hydrate Chemical compound O.[Na+].[Cl-] HPALAKNZSZLMCH-UHFFFAOYSA-M 0.000 description 3
- 239000007790 solid phase Substances 0.000 description 3
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 3
- 238000004448 titration Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- 239000011534 wash buffer Substances 0.000 description 3
- 125000003161 (C1-C6) alkylene group Chemical group 0.000 description 2
- 125000006716 (C1-C6) heteroalkyl group Chemical group 0.000 description 2
- LBUJPTNKIBCYBY-UHFFFAOYSA-N 1,2,3,4-tetrahydroquinoline Chemical compound C1=CC=C2CCCNC2=C1 LBUJPTNKIBCYBY-UHFFFAOYSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- 125000001494 2-propynyl group Chemical group [H]C#CC([H])([H])* 0.000 description 2
- YCLSOMLVSHPPFV-UHFFFAOYSA-N 3-(2-carboxyethyldisulfanyl)propanoic acid Chemical compound OC(=O)CCSSCCC(O)=O YCLSOMLVSHPPFV-UHFFFAOYSA-N 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- YNAVUWVOSKDBBP-UHFFFAOYSA-N Morpholine Chemical compound C1COCCN1 YNAVUWVOSKDBBP-UHFFFAOYSA-N 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- GLUUGHFHXGJENI-UHFFFAOYSA-N Piperazine Chemical compound C1CNCCN1 GLUUGHFHXGJENI-UHFFFAOYSA-N 0.000 description 2
- 125000005631 S-sulfonamido group Chemical group 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 229960000583 acetic acid Drugs 0.000 description 2
- 125000004183 alkoxy alkyl group Chemical group 0.000 description 2
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 2
- HSFWRNGVRCDJHI-UHFFFAOYSA-N alpha-acetylene Natural products C#C HSFWRNGVRCDJHI-UHFFFAOYSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N ammonia Natural products N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 235000011114 ammonium hydroxide Nutrition 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 235000010323 ascorbic acid Nutrition 0.000 description 2
- 239000011668 ascorbic acid Substances 0.000 description 2
- 229960005070 ascorbic acid Drugs 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 229910021538 borax Inorganic materials 0.000 description 2
- 235000012745 brilliant blue FCF Nutrition 0.000 description 2
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- RYYVLZVUVIJVGH-UHFFFAOYSA-N caffeine Chemical compound CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 2
- IJOOHPMOJXWVHK-UHFFFAOYSA-N chlorotrimethylsilane Chemical compound C[Si](C)(C)Cl IJOOHPMOJXWVHK-UHFFFAOYSA-N 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 2
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 2
- 239000005549 deoxyribonucleoside Substances 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 2
- 125000002534 ethynyl group Chemical group [H]C#C* 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 239000011737 fluorine Substances 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 125000001153 fluoro group Chemical group F* 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 239000012362 glacial acetic acid Substances 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 239000005457 ice water Substances 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 229910052738 indium Inorganic materials 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 229910017053 inorganic salt Inorganic materials 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 239000010410 layer Substances 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000011859 microparticle Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000002808 molecular sieve Substances 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 230000005257 nucleotidylation Effects 0.000 description 2
- 150000002972 pentoses Chemical class 0.000 description 2
- RLOWWWKZYUNIDI-UHFFFAOYSA-N phosphinic chloride Chemical compound ClP=O RLOWWWKZYUNIDI-UHFFFAOYSA-N 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 101150113223 pppA gene Proteins 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 125000000719 pyrrolidinyl group Chemical group 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 125000006413 ring segment Chemical group 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 2
- 229910000029 sodium carbonate Inorganic materials 0.000 description 2
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 description 2
- 239000001488 sodium phosphate Substances 0.000 description 2
- 229910000162 sodium phosphate Inorganic materials 0.000 description 2
- 159000000000 sodium salts Chemical group 0.000 description 2
- 235000010339 sodium tetraborate Nutrition 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 125000003003 spiro group Chemical group 0.000 description 2
- 239000011232 storage material Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 125000000213 sulfino group Chemical group [H]OS(*)=O 0.000 description 2
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 2
- FPGGTKZVZWFYPV-UHFFFAOYSA-M tetrabutylammonium fluoride Chemical compound [F-].CCCC[N+](CCCC)(CCCC)CCCC FPGGTKZVZWFYPV-UHFFFAOYSA-M 0.000 description 2
- YAPQBXQYLJRXSA-UHFFFAOYSA-N theobromine Chemical compound CN1C(=O)NC(=O)C2=C1N=CN2C YAPQBXQYLJRXSA-UHFFFAOYSA-N 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- IMFACGCPASFAPR-UHFFFAOYSA-N tributylamine Chemical compound CCCCN(CCCC)CCCC IMFACGCPASFAPR-UHFFFAOYSA-N 0.000 description 2
- DQWPFSLDHJDLRL-UHFFFAOYSA-N triethyl phosphate Chemical compound CCOP(=O)(OCC)OCC DQWPFSLDHJDLRL-UHFFFAOYSA-N 0.000 description 2
- BSVBQGMMJUBVOD-UHFFFAOYSA-N trisodium borate Chemical compound [Na+].[Na+].[Na+].[O-]B([O-])[O-] BSVBQGMMJUBVOD-UHFFFAOYSA-N 0.000 description 2
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 2
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 2
- 229910052727 yttrium Inorganic materials 0.000 description 2
- AEELXMHQIJJMKP-QWWZWVQMSA-N (2r,3r)-3-sulfanylbutane-1,2,4-triol Chemical compound OC[C@@H](O)[C@H](S)CO AEELXMHQIJJMKP-QWWZWVQMSA-N 0.000 description 1
- 125000006573 (C1-C10) heteroaryl group Chemical group 0.000 description 1
- 125000006727 (C1-C6) alkenyl group Chemical group 0.000 description 1
- 125000004191 (C1-C6) alkoxy group Chemical group 0.000 description 1
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 1
- 125000006700 (C1-C6) alkylthio group Chemical group 0.000 description 1
- 125000006728 (C1-C6) alkynyl group Chemical group 0.000 description 1
- 125000006729 (C2-C5) alkenyl group Chemical group 0.000 description 1
- 125000006730 (C2-C5) alkynyl group Chemical group 0.000 description 1
- 125000006552 (C3-C8) cycloalkyl group Chemical group 0.000 description 1
- FXXRPTKTLVHPAR-UHFFFAOYSA-N 1,3,5-triaza-7-phosphaadamantane Chemical compound C1N(C2)CN3CN1CP2C3 FXXRPTKTLVHPAR-UHFFFAOYSA-N 0.000 description 1
- JPRPJUMQRZTTED-UHFFFAOYSA-N 1,3-dioxolanyl Chemical group [CH]1OCCO1 JPRPJUMQRZTTED-UHFFFAOYSA-N 0.000 description 1
- KFHQOZXAFUKFNB-UHFFFAOYSA-N 1,3-oxathiolanyl Chemical group [CH]1OCCS1 KFHQOZXAFUKFNB-UHFFFAOYSA-N 0.000 description 1
- 125000005940 1,4-dioxanyl group Chemical group 0.000 description 1
- DTEOTBZSHQGFIF-UHFFFAOYSA-N 12h-chromeno[2,3-h]quinoline Chemical group C1=CC=NC2=C3CC4=CC=CC=C4OC3=CC=C21 DTEOTBZSHQGFIF-UHFFFAOYSA-N 0.000 description 1
- BWZVCCNYKMEVEX-UHFFFAOYSA-N 2,4,6-Trimethylpyridine Chemical compound CC1=CC(C)=NC(C)=C1 BWZVCCNYKMEVEX-UHFFFAOYSA-N 0.000 description 1
- GVNVAWHJIKLAGL-UHFFFAOYSA-N 2-(cyclohexen-1-yl)cyclohexan-1-one Chemical compound O=C1CCCCC1C1=CCCCC1 GVNVAWHJIKLAGL-UHFFFAOYSA-N 0.000 description 1
- IMSODMZESSGVBE-UHFFFAOYSA-N 2-Oxazoline Chemical compound C1CN=CO1 IMSODMZESSGVBE-UHFFFAOYSA-N 0.000 description 1
- PZIJUXHDLWNNRW-UHFFFAOYSA-N 2-[bis(2-hydroxyethyl)phosphanyl]ethanol Chemical compound OCCP(CCO)CCO PZIJUXHDLWNNRW-UHFFFAOYSA-N 0.000 description 1
- PWKSKIMOESPYIA-UHFFFAOYSA-N 2-acetamido-3-sulfanylpropanoic acid Chemical compound CC(=O)NC(CS)C(O)=O PWKSKIMOESPYIA-UHFFFAOYSA-N 0.000 description 1
- 125000000069 2-butynyl group Chemical group [H]C([H])([H])C#CC([H])([H])* 0.000 description 1
- 125000000094 2-phenylethyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])([H])* 0.000 description 1
- RGPSXEGIFWXCDR-UHFFFAOYSA-N 3-cyano-3-oxopropanoic acid Chemical compound OC(=O)CC(=O)C#N RGPSXEGIFWXCDR-UHFFFAOYSA-N 0.000 description 1
- 125000006201 3-phenylpropyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000005986 4-piperidonyl group Chemical group 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 101710092462 Alpha-hemolysin Proteins 0.000 description 1
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonium chloride Substances [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 description 1
- LQMDYXNSECYZOU-BHDDXSALSA-N CC(C)(C)[Si](C1=CC=CC=C1)(C1=CC=CC=C1)OC[C@H]([C@H](C1)O)O[C@H]1N(C=C(C(N)=N1)I)C1=O Chemical compound CC(C)(C)[Si](C1=CC=CC=C1)(C1=CC=CC=C1)OC[C@H]([C@H](C1)O)O[C@H]1N(C=C(C(N)=N1)I)C1=O LQMDYXNSECYZOU-BHDDXSALSA-N 0.000 description 1
- JPHCYSJTWVHHNH-UPRLRBBYSA-N CC(C)(C)[Si](C1=CC=CC=C1)(C1=CC=CC=C1)OC[C@H]([C@H](C1)O)O[C@H]1N(C=C(C(NC(C1=CC=CC=C1)=O)=N1)I)C1=O Chemical compound CC(C)(C)[Si](C1=CC=CC=C1)(C1=CC=CC=C1)OC[C@H]([C@H](C1)O)O[C@H]1N(C=C(C(NC(C1=CC=CC=C1)=O)=N1)I)C1=O JPHCYSJTWVHHNH-UPRLRBBYSA-N 0.000 description 1
- 101150065749 Churc1 gene Proteins 0.000 description 1
- 108091028732 Concatemer Proteins 0.000 description 1
- 108010025905 Cystine-Knot Miniproteins Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- LPHGQDQBBGAPDZ-UHFFFAOYSA-N Isocaffeine Natural products CN1C(=O)N(C)C(=O)C2=C1N(C)C=N2 LPHGQDQBBGAPDZ-UHFFFAOYSA-N 0.000 description 1
- IFQSXNOEEPCSLW-DKWTVANSSA-N L-cysteine hydrochloride Chemical class Cl.SC[C@H](N)C(O)=O IFQSXNOEEPCSLW-DKWTVANSSA-N 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- OHLUUHNLEMFGTQ-UHFFFAOYSA-N N-methylacetamide Chemical compound CNC(C)=O OHLUUHNLEMFGTQ-UHFFFAOYSA-N 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 102100038239 Protein Churchill Human genes 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 1
- LEHOTFFKMJEONL-UHFFFAOYSA-N Uric Acid Chemical compound N1C(=O)NC(=O)C2=C1NC(=O)N2 LEHOTFFKMJEONL-UHFFFAOYSA-N 0.000 description 1
- TVWHNULVHGKJHS-UHFFFAOYSA-N Uric acid Natural products N1C(=O)NC(=O)C2NC(=O)NC21 TVWHNULVHGKJHS-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 125000000641 acridinyl group Chemical group C1(=CC=CC2=NC3=CC=CC=C3C=C12)* 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 125000005073 adamantyl group Chemical group C12(CC3CC(CC(C1)C3)C2)* 0.000 description 1
- 108091008108 affimer Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 125000004450 alkenylene group Chemical group 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000006620 amino-(C1-C6) alkyl group Chemical group 0.000 description 1
- 125000004103 aminoalkyl group Chemical group 0.000 description 1
- 125000002178 anthracenyl group Chemical group C1(=CC=CC2=CC3=CC=CC=C3C=C12)* 0.000 description 1
- 125000006615 aromatic heterocyclic group Chemical group 0.000 description 1
- 125000005110 aryl thio group Chemical group 0.000 description 1
- 125000004104 aryloxy group Chemical group 0.000 description 1
- 125000002785 azepinyl group Chemical group 0.000 description 1
- HONIICLYMWZJFZ-UHFFFAOYSA-N azetidine Chemical compound C1CNC1 HONIICLYMWZJFZ-UHFFFAOYSA-N 0.000 description 1
- 125000003828 azulenyl group Chemical group 0.000 description 1
- 125000003785 benzimidazolyl group Chemical group N1=C(NC2=C1C=CC=C2)* 0.000 description 1
- ZYGHJZDHTFUPRJ-UHFFFAOYSA-N benzo-alpha-pyrone Natural products C1=CC=C2OC(=O)C=CC2=C1 ZYGHJZDHTFUPRJ-UHFFFAOYSA-N 0.000 description 1
- 125000001164 benzothiazolyl group Chemical group S1C(=NC2=C1C=CC=C2)* 0.000 description 1
- 125000004196 benzothienyl group Chemical group S1C(=CC2=C1C=CC=C2)* 0.000 description 1
- 125000004541 benzoxazolyl group Chemical group O1C(=NC2=C1C=CC=C2)* 0.000 description 1
- PASDCCFISLVPSO-UHFFFAOYSA-N benzoyl chloride Chemical compound ClC(=O)C1=CC=CC=C1 PASDCCFISLVPSO-UHFFFAOYSA-N 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- 230000005587 bubbling Effects 0.000 description 1
- 125000004369 butenyl group Chemical group C(=CCC)* 0.000 description 1
- 125000000480 butynyl group Chemical group [*]C#CC([H])([H])C([H])([H])[H] 0.000 description 1
- 229960001948 caffeine Drugs 0.000 description 1
- VJEONQKOZGKCAK-UHFFFAOYSA-N caffeine Natural products CN1C(=O)N(C)C(=O)C2=C1C=CN2C VJEONQKOZGKCAK-UHFFFAOYSA-N 0.000 description 1
- 125000000609 carbazolyl group Chemical group C1(=CC=CC=2C3=CC=CC=C3NC12)* 0.000 description 1
- 125000006297 carbonyl amino group Chemical group [H]N([*:2])C([*:1])=O 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000009920 chelation Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 150000001805 chlorine compounds Chemical class 0.000 description 1
- 125000000259 cinnolinyl group Chemical group N1=NC(=CC2=CC=CC=C12)* 0.000 description 1
- GBRBMTNGQBKBQE-UHFFFAOYSA-L copper;diiodide Chemical compound I[Cu]I GBRBMTNGQBKBQE-UHFFFAOYSA-L 0.000 description 1
- 229960000956 coumarin Drugs 0.000 description 1
- 235000001671 coumarin Nutrition 0.000 description 1
- 125000000332 coumarinyl group Chemical group O1C(=O)C(=CC2=CC=CC=C12)* 0.000 description 1
- 125000000392 cycloalkenyl group Chemical group 0.000 description 1
- 125000004850 cyclobutylmethyl group Chemical group C1(CCC1)C* 0.000 description 1
- 125000000596 cyclohexenyl group Chemical group C1(=CCCCC1)* 0.000 description 1
- 125000004186 cyclopropylmethyl group Chemical group [H]C([H])(*)C1([H])C([H])([H])C1([H])[H] 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000010511 deprotection reaction Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 125000005879 dioxolanyl group Chemical group 0.000 description 1
- CVKCKLNGVYHFAX-UHFFFAOYSA-L dipotassium;4-[phenyl-(4-sulfonatophenyl)phosphanyl]benzenesulfonate;dihydrate Chemical compound O.O.[K+].[K+].C1=CC(S(=O)(=O)[O-])=CC=C1P(C=1C=CC(=CC=1)S([O-])(=O)=O)C1=CC=CC=C1 CVKCKLNGVYHFAX-UHFFFAOYSA-L 0.000 description 1
- 125000002228 disulfide group Chemical group 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 125000003700 epoxy group Chemical group 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- 238000005886 esterification reaction Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 125000002541 furyl group Chemical group 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 239000001046 green dye Substances 0.000 description 1
- 125000004475 heteroaralkyl group Chemical group 0.000 description 1
- 125000004446 heteroarylalkyl group Chemical group 0.000 description 1
- 125000006038 hexenyl group Chemical group 0.000 description 1
- 125000004051 hexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000005980 hexynyl group Chemical group 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 125000002632 imidazolidinyl group Chemical group 0.000 description 1
- 125000002636 imidazolinyl group Chemical group 0.000 description 1
- 125000002883 imidazolyl group Chemical group 0.000 description 1
- PQNFLJBBNBOBRQ-UHFFFAOYSA-N indane Chemical compound C1=CC=C2CCCC2=C1 PQNFLJBBNBOBRQ-UHFFFAOYSA-N 0.000 description 1
- 125000003387 indolinyl group Chemical group N1(CCC2=CC=CC=C12)* 0.000 description 1
- 125000001041 indolyl group Chemical group 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 description 1
- 125000000904 isoindolyl group Chemical group C=1(NC=C2C=CC=CC12)* 0.000 description 1
- 125000003253 isopropoxy group Chemical group [H]C([H])([H])C([H])(O*)C([H])([H])[H] 0.000 description 1
- 125000002183 isoquinolinyl group Chemical group C1(=NC=CC2=CC=CC=C12)* 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 125000001786 isothiazolyl group Chemical group 0.000 description 1
- 125000003965 isoxazolidinyl group Chemical group 0.000 description 1
- 125000003971 isoxazolinyl group Chemical group 0.000 description 1
- 125000000842 isoxazolyl group Chemical group 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 229910052987 metal hydride Inorganic materials 0.000 description 1
- 150000004681 metal hydrides Chemical class 0.000 description 1
- GDOPTJXRTPNYNR-UHFFFAOYSA-N methyl-cyclopentane Natural products CC1CCCC1 GDOPTJXRTPNYNR-UHFFFAOYSA-N 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 125000002950 monocyclic group Chemical group 0.000 description 1
- 125000002757 morpholinyl group Chemical group 0.000 description 1
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000001624 naphthyl group Chemical group 0.000 description 1
- 125000001326 naphthylalkyl group Chemical group 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 description 1
- 125000006574 non-aromatic ring group Chemical group 0.000 description 1
- 238000003499 nucleic acid array Methods 0.000 description 1
- 238000003203 nucleic acid sequencing method Methods 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 125000000160 oxazolidinyl group Chemical group 0.000 description 1
- 125000005968 oxazolinyl group Chemical group 0.000 description 1
- 125000002971 oxazolyl group Chemical group 0.000 description 1
- 125000003551 oxepanyl group Chemical group 0.000 description 1
- AHHWIHXENZJRFG-UHFFFAOYSA-N oxetane Chemical compound C1COC1 AHHWIHXENZJRFG-UHFFFAOYSA-N 0.000 description 1
- 125000000466 oxiranyl group Chemical group 0.000 description 1
- 125000004043 oxo group Chemical group O=* 0.000 description 1
- HXNFUBHNUDHIGC-UHFFFAOYSA-N oxypurinol Chemical compound O=C1NC(=O)N=C2NNC=C21 HXNFUBHNUDHIGC-UHFFFAOYSA-N 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- PENAXHPKEVTBLF-UHFFFAOYSA-L palladium(2+);prop-1-ene;dichloride Chemical group [Pd+]Cl.[Pd+]Cl.[CH2-]C=C.[CH2-]C=C PENAXHPKEVTBLF-UHFFFAOYSA-L 0.000 description 1
- LXNAVEXFUKBNMK-UHFFFAOYSA-N palladium(II) acetate Substances [Pd].CC(O)=O.CC(O)=O LXNAVEXFUKBNMK-UHFFFAOYSA-N 0.000 description 1
- YJVFFLUZDVXJQI-UHFFFAOYSA-L palladium(ii) acetate Chemical compound [Pd+2].CC([O-])=O.CC([O-])=O YJVFFLUZDVXJQI-UHFFFAOYSA-L 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 125000002255 pentenyl group Chemical group C(=CCCC)* 0.000 description 1
- 125000001147 pentyl group Chemical group C(CCCC)* 0.000 description 1
- 125000005981 pentynyl group Chemical group 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 1
- 150000003014 phosphoric acid esters Chemical class 0.000 description 1
- 125000004592 phthalazinyl group Chemical group C1(=NN=CC2=CC=CC=C12)* 0.000 description 1
- 125000004193 piperazinyl group Chemical group 0.000 description 1
- 125000003386 piperidinyl group Chemical group 0.000 description 1
- 125000003367 polycyclic group Chemical group 0.000 description 1
- 229920000867 polyelectrolyte Polymers 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000012041 precatalyst Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 125000004368 propenyl group Chemical group C(=CC)* 0.000 description 1
- 125000002568 propynyl group Chemical group [*]C#CC([H])([H])[H] 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 238000002731 protein assay Methods 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 125000003373 pyrazinyl group Chemical group 0.000 description 1
- 125000003072 pyrazolidinyl group Chemical group 0.000 description 1
- 125000002755 pyrazolinyl group Chemical group 0.000 description 1
- 125000003226 pyrazolyl group Chemical group 0.000 description 1
- 125000002098 pyridazinyl group Chemical group 0.000 description 1
- 125000004076 pyridyl group Chemical group 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 125000000168 pyrrolyl group Chemical group 0.000 description 1
- 125000002943 quinolinyl group Chemical group N1=C(C=CC2=CC=CC=C12)* 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- YAYGSLOSTXKUBW-UHFFFAOYSA-N ruthenium(2+) Chemical compound [Ru+2] YAYGSLOSTXKUBW-UHFFFAOYSA-N 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 238000004557 single molecule detection Methods 0.000 description 1
- HTYYQKUMFAEOJL-UHFFFAOYSA-M sodium;2-isocyanoacetate Chemical compound [Na+].[O-]C(=O)C[N+]#[C-] HTYYQKUMFAEOJL-UHFFFAOYSA-M 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 125000004434 sulfur atom Chemical group 0.000 description 1
- YBBRCQOCSYXUOC-UHFFFAOYSA-N sulfuryl dichloride Chemical compound ClS(Cl)(=O)=O YBBRCQOCSYXUOC-UHFFFAOYSA-N 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 125000004213 tert-butoxy group Chemical group [H]C([H])([H])C(O*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 125000003507 tetrahydrothiofenyl group Chemical group 0.000 description 1
- 125000004632 tetrahydrothiopyranyl group Chemical group S1C(CCCC1)* 0.000 description 1
- 229960004559 theobromine Drugs 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 125000001113 thiadiazolyl group Chemical group 0.000 description 1
- 125000001984 thiazolidinyl group Chemical group 0.000 description 1
- 125000002769 thiazolinyl group Chemical group 0.000 description 1
- 125000000335 thiazolyl group Chemical group 0.000 description 1
- 125000001544 thienyl group Chemical group 0.000 description 1
- 125000001583 thiepanyl group Chemical group 0.000 description 1
- 125000004568 thiomorpholinyl group Chemical group 0.000 description 1
- MYAJTCUQMQREFZ-UHFFFAOYSA-K tppts Chemical compound [Na+].[Na+].[Na+].[O-]S(=O)(=O)C1=CC=CC(P(C=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=C(C=CC=2)S([O-])(=O)=O)=C1 MYAJTCUQMQREFZ-UHFFFAOYSA-K 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 125000004306 triazinyl group Chemical group 0.000 description 1
- 125000001425 triazolyl group Chemical group 0.000 description 1
- QQQSFSZALRVCSZ-UHFFFAOYSA-N triethoxysilane Chemical compound CCO[SiH](OCC)OCC QQQSFSZALRVCSZ-UHFFFAOYSA-N 0.000 description 1
- FTVLMFQEYACZNP-UHFFFAOYSA-N trimethylsilyl trifluoromethanesulfonate Chemical compound C[Si](C)(C)OS(=O)(=O)C(F)(F)F FTVLMFQEYACZNP-UHFFFAOYSA-N 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 229940116269 uric acid Drugs 0.000 description 1
- 125000005500 uronium group Chemical group 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/06—Pyrimidine radicals
- C07H19/10—Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H1/00—Processes for the preparation of sugar derivatives
- C07H1/02—Phosphorylation
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/06—Pyrimidine radicals
- C07H19/073—Pyrimidine radicals with 2-deoxyribosyl as the saccharide radical
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/16—Purine radicals
- C07H19/173—Purine radicals with 2-deoxyribosyl as the saccharide radical
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/16—Purine radicals
- C07H19/20—Purine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/02—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with ribosyl as saccharide radical
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/04—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/117—Modifications characterised by incorporating modified base
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/101—Sanger sequencing method, i.e. oligonucleotide sequencing using primer elongation and dideoxynucleotides as chain terminators
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/55—Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
- Medicinal Preparation (AREA)
Abstract
3' 아세탈 블로킹기를 갖는 뉴클레오시드 및 뉴클레오티드
본 발명은 절단가능한 링커를 통해 검출가능한 표지에 부착된 핵산염기를 포함하는 뉴클레오시드 또는 뉴클레오티드로서, 상기 뉴클레오시드 또는 뉴클레오티드는 리보스 또는 2' 데옥시리보스 부분 및 3'-OH 블로킹기(3'-OH blocking group)를 포함하고, 상기 절단가능한 링커는 하기 구조의 부분을 포함하는, 뉴클레오시드 또는 뉴클레오티드에 관한 것이다:
상기 식에서,
X 및 Y는 각각 독립적으로 O 또는 S이고;
R1a, R1b, R2, R3a 및 R3b는 각각 독립적으로 H, 할로겐, 비치환 또는 치환된 C1-C6 알킬, 또는 C1-C6 할로알킬이다.
또한, 이러한 뉴클레오티드 및 뉴클레오시드 분자를 제조하는 방법, 및 시퀀싱(sequencing) 응용을 위한 3' 아세탈 블로킹기를 포함하는 완전 작용화된 뉴클레오티드의 용도가 본 명세서에 제공된다.
본 발명은 절단가능한 링커를 통해 검출가능한 표지에 부착된 핵산염기를 포함하는 뉴클레오시드 또는 뉴클레오티드로서, 상기 뉴클레오시드 또는 뉴클레오티드는 리보스 또는 2' 데옥시리보스 부분 및 3'-OH 블로킹기(3'-OH blocking group)를 포함하고, 상기 절단가능한 링커는 하기 구조의 부분을 포함하는, 뉴클레오시드 또는 뉴클레오티드에 관한 것이다:
상기 식에서,
X 및 Y는 각각 독립적으로 O 또는 S이고;
R1a, R1b, R2, R3a 및 R3b는 각각 독립적으로 H, 할로겐, 비치환 또는 치환된 C1-C6 알킬, 또는 C1-C6 할로알킬이다.
또한, 이러한 뉴클레오티드 및 뉴클레오시드 분자를 제조하는 방법, 및 시퀀싱(sequencing) 응용을 위한 3' 아세탈 블로킹기를 포함하는 완전 작용화된 뉴클레오티드의 용도가 본 명세서에 제공된다.
Description
우선권 출원의 참조에 의한 원용
본 출원은 전체적으로 본 명세서에 참고로 포함되는 2020년 6월 22일자로 출원된 미국 가출원 제63/042,240호에 대한 우선권의 이익을 주장한다.
기술분야
본 발명은 일반적으로 3' 아세탈 블로킹기(blocking group)를 포함하는 뉴클레오티드, 뉴클레오시드 또는 올리고뉴클레오티드, 및 폴리뉴클레오티드 시퀀싱 방법에서의 이들의 용도에 관한 것이다. 3' 블로킹된 뉴클레오티드, 뉴클레오시드 또는 올리고뉴클레오티드를 제조하는 방법이 또한 개시된다.
분자 연구의 진보는 부분적으로 분자 또는 분자의 생물학적 반응을 특성화하는데 사용되는 기술의 향상에 의해 주도되었다. 특히, 핵산 DNA와 RNA에 대한 연구는 서열 분석과 하이브리디제이션 사건 연구에 사용되는 기술 개발에 의해 혜택을 받았다.
핵산 연구를 개선한 기술의 예는 고정화 핵산의 제조된 어레이의 개발이다. 이러한 어레이는 전형적으로 고체 지지체 재료 상에 고정된 폴리뉴클레오티드의 고밀도 매트릭스로 구성된다. 예를 들어, 마스크로 보호되는 화학적으로 증감된 유리 표면을 사용하지만, 적절하게 변형된 뉴클레오티드 포스포르아미다이트의 부착을 허용하기 위해 한정된 영역에 노출되는 핵산을 조립하는 방법을 설명하는 문헌[Fodor et al., Trends Biotech. 12: 19-26, 1994]을 참조한다. 제조된 어레이는 또한 기지의 폴리뉴클레오티드를 소정 위치에서 고체 지지체 상에 "스포팅(spotting)"하는 기술에 의해 제조될 수 있다 (예를 들어, 문헌[Stimpson et al., Proc. Natl. Acad. Sci. 92: 6379-6383, 1995]).
어레이에 결합된 핵산의 뉴클레오티드 서열을 결정하는 한 가지 방법은 "합성에 의한 시퀀싱(sequencing by synthesis)" 또는 "SBS"라고 한다. DNA 서열을 결정하기 위한 이러한 기술은 이상적으로는 시퀀싱되는 핵산에 대한 정확한 상보적 뉴클레오티드의 제어된(즉, 한 번에 하나씩) 도입을 필요로 한다. 이것은 각각의 뉴클레오티드 잔기가 한 번에 하나씩 시퀀싱되어 제어되지 않은 일련의 도입이 발생하는 것을 방지함에 따라 다수의 사이클에서 뉴클레오티드를 첨가함으로써 정확한 시퀀싱을 가능하게 한다. 도입된 뉴클레오티드는 표지 부분(label moiety)의 제거 및 그 후의 다음 라운드의 시퀀싱 전에 이에 부착된 적절한 표지를 사용하여 리딩된다.
단 하나의 도입만이 일어나는 것을 보장하기 위해, 구조적 변형("보호기" 또는 "블로킹기")이 단 하나의 뉴클레오티드만 도입되도록 성장 사슬에 부가되는 각각의 표지된 뉴클레오티드에 포함된다. 보호기를 갖는 뉴클레오티드가 부가된 후에, 이어서 보호기는 시퀀싱되는 DNA의 완전성을 방해하지 않는 반응 조건 하에서 제거된다. 그 후에, 시퀀싱 사이클은 다음의 보호되고 표지된 뉴클레오티드의 도입을 계속할 수 있다.
DNA 시퀀싱에 유용하도록, 통상 뉴클레오티드 트라이포스페이트인 뉴클레오티드는 일반적으로, 뉴클레오티드 상의 염기가 부가되면 폴리뉴클레오티드 사슬에 뉴클레오티드를 도입하는데 사용되는 폴리머라제가 복제를 계속하는 것을 방지하도록 3'-하이드록시 보호기를 필요로 한다. 뉴클레오티드 상에 부가될 수 있고 여전히 적합할 수 있는 기의 유형에는 많은 제한이 있다. 보호기는 추가의 뉴클레오티드 분자가 폴리뉴클레오티드 사슬에 부가되는 것을 방지하는 동시에, 폴리뉴클레오티드 사슬에 손상을 주지 않으면서 당 부분에서 쉽게 제거될 수 있어야 한다. 또한, 변형된 뉴클레오티드는 이를 폴리뉴클레오티드 사슬에 도입하는데 사용되는 폴리머라제 또는 다른 적절한 효소에 적합해야 한다. 따라서, 이상적인 보호기는 장기적 안정성을 나타내어야 하고, 폴리머라제 효소에 의해 효율적으로 도입되어야 하며, 2차 또는 추가의 뉴클레오티드 도입을 차단해야 하고, 폴리뉴클레오티드 구조에 손상을 일으키지 않는 온화한 조건 하에서, 바람직하게는 수성 조건 하에서 제거되는 능력을 가져야 한다.
가역적 보호기는 이전에 설명되었다. 예를 들어, 문헌[Metzker et al., Nucleic Acids Research, 22 (20): 4259-4267, 1994]에는 8개의 3'-변형된 2-데옥시리보뉴클레오시드 5'-트라이포스페이트(3'-변형된 dNTP)의 합성 및 용도와, 도입 활성에 대한 2개의 DNA 주형 분석에서의 테스팅이 개시되어 있다. WO 2002/029003호는 폴리머라제 반응에서 성장하는 DNA 가닥 상의 3'-OH 기를 캡핑하기 위해 알릴 보호기를 사용하는 것을 포함할 수 있는 시퀀싱 방법을 기술한다.
또한, 다수의 가역적 보호기 및 DNA 적합성 조건 하에서 이를 탈보호하는 방법의 개발은 이전에 국제 출원 공개 WO 2004/018497호 및 WO 2014/139596호에 보고되었으며, 이들 각각은 전체적으로 본 명세서에 참고로 포함된다.
본 발명의 일부 실시 형태는 절단가능한 링커를 통해 검출가능한 표지에 부착된 핵산염기를 포함하는 뉴클레오티드 또는 뉴클레오시드로서, 상기 뉴클레오시드 또는 뉴클레오티드는 리보스 또는 2' 데옥시리보스 부분 및 3'-OH 블로킹기를 포함하고, 상기 절단가능한 링커는 하기 구조의 부분을 포함하는, 뉴클레오티드 또는 뉴클레오시드에 관한 것이다:
상기 식에서, X 및 Y는 각각 독립적으로 O 또는 S이고; R1a, R1b, R2, R3a 및 R3b는 각각 독립적으로 H, 할로겐, 비치환 또는 치환된 C1-C6 알킬, 또는 C1-C6 할로알킬이다.
본 발명의 일부 실시 형태는 본 명세서에 기재된 3'-OH 블로킹된 표지된 뉴클레오티드를 포함하는 올리고뉴클레오티드 또는 폴리뉴클레오티드에 관한 것이다.
본 발명의 일부 실시 형태는 시퀀싱 반응에서 표적 단일 가닥 폴리뉴클레오티드에 상보적인 성장하는 폴리뉴클레오티드를 제조하는 방법으로서, 본 명세서에 기재된 뉴클레오티드 분자를 성장하는 상보적 폴리뉴클레오티드에 도입시키는 단계를 포함하며, 상기 뉴클레오티드의 도입은 성장하는 상보적 폴리뉴클레오티드에 임의의 후속 뉴클레오티드가 도입되는 것을 방지하는 방법에 관한 것이다. 일부 실시 형태에서, 뉴클레오티드의 도입은 폴리머라제, 터미널 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 또는 역전사효소에 의해 달성된다. 일 실시 형태에서, 상기 도입은 폴리머라제(예를 들어, DNA 폴리머라제)에 의해 달성된다.
본 발명의 추가의 일부 실시 형태는,
(a) 본 명세서에 기재된 뉴클레오티드를 표적 폴리뉴클레오티드 가닥의 적어도 일부에 상보적인 카피 폴리뉴클레오티드 가닥에 도입하는 단계;
(b) 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드의 동일성(identity)을 검출하는 단계; 및
(c) 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드로부터 표지 및 3'-OH 블로킹기를 화학적으로 제거하는 단계를 포함하는, 표적 단일 가닥 폴리뉴클레오티드의 서열을 결정하는 방법에 관한 것이다.
일부 실시 형태에서, 검출 단계는 검출가능한 표지로부터 하나 이상의 형광 신호 측정값을 취해 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드의 동일성을 결정하는 것을 포함한다. 일부 실시 형태에서, 시퀀싱 방법은 추가로, (d) 절단 후 세척 용액을 사용하여, 화학적으로 제거된 표지 및 3'-OH 블로킹기를 카피 폴리뉴클레오티드 가닥으로부터 씻어내는 단계를 포함한다. 일부 실시 형태에서, 이러한 세척 단계는 또한 도입되지 않은 뉴클레오티드를 제거한다. 다른 실시 형태에서, 상기 방법은 단계 (b) 전에 카피 폴리뉴클레오티드 가닥으로부터 도입되지 않은 뉴클레오티드를 세척하는 별도의 세척 단계를 포함할 수 있다. 일부 그러한 실시 형태에서, 도입된 뉴클레오티드의 3'-OH 블로킹기 및 검출가능한 표지는 다음 상보적 뉴클레오티드를 도입하기 전에 제거된다. 추가의 일부 실시 형태에서, 3'-OH 블로킹기 및 검출가능한 표지는 화학 반응의 단일 단계에서 제거된다. 일부 실시 형태에서, 본 명세서에 기재된 순차적 도입은 50회 이상, 100회 이상, 150회 이상, 200회 이상 또는 250회 이상 행해진다.
본 발명의 추가의 일부 실시 형태는 본 명세서에 기재된 다수의 뉴클레오티드 또는 뉴클레오시드 분자 및 이를 위한 패키징 재료를 포함하는 키트에 관한 것이다. 본 명세서에 기재된 뉴클레오티드, 뉴클레오시드, 올리고뉴클레오티드 또는 키트는 생물학적 시스템(예를 들어, 이의 프로세스 또는 성분을 포함함)을 검출, 측정 또는 확인하는 데 사용될 수 있다. 뉴클레오티드, 뉴클레오시드, 올리고뉴클레오티드 또는 키트를 사용할 수 있는 예시적인 기술에는 시퀀싱, 발현 분석, 하이브리디제이션 분석, 유전자 분석, RNA 분석, 세포 분석(예를 들어, 세포 결합 또는 세포 기능 분석) 또는 단백질 분석(예를 들어, 단백질 결합 분석 또는 단백질 활성 분석)이 포함된다. 이러한 사용은 자동화 시퀀싱 기기와 같은 특정 기술을 수행하기 위한 자동화 기기에서 행해질 수 있다. 시퀀싱 기기는 상이한 검출가능한 표지를 구별하기 위해 상이한 파장에서 작동하는 2개 이상의 레이저를 포함할 수 있다.
도 1은 다양한 비율의 트리스(하이드록시프로필)포스핀(THP)이 사용되는 경우, [(알릴)PdCl]2와 Na2PdCl4의 3'-OH 디블로킹 효율을 비교하는 라인 차트이다.
도 2는 AOL 링커 부분 및 3'-AOM 블로킹기를 갖는 표준 완전 작용화된 뉴클레오티드(ffN)와 비교하여, LN3 링커 부분 및 3'-O-아지도메틸 블로킹기를 갖는 ffN의 시간 함수로서 퍼센트 전위상화(prephasing) 값을 나타내는 라인 차트이다.
도 3은 절단 후 세척 단계에서 팔라듐 스캐빈저를 사용하거나 사용하지 않고 3'-AOM 블로킹기를 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나(Illumina)의 MiniSeq® 기기에서의 위상화(phasing) 값의 비교를 예시한다.
도 4는 3'-O-아지도메틸 블로킹기를 갖는 표준 ffN을 사용한 동일한 시퀀싱 메트릭스와 비교하여, 팔라듐 스캐빈저가 사용된 경우, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 MiniSeq® 기기에서의 위상화, 전위상화 및 에러율을 포함하는 1차 시퀀싱 메트릭스를 예시한다.
도 5는 글리신 또는 에탄올아민이 각각 도입 믹스에 사용되는 경우, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 MiniSeq® 기기에서의 위상화 및 전위상화를 포함하는 1차 시퀀싱 메트릭스의 비교를 예시한다.
도 6은 3'-O-아지도메틸 블로킹기를 갖는 표준 ffN을 사용한 동일한 시퀀싱 메트릭스와 비교하여, 글리신이 도입 믹스에 사용된 경우, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 MiniSeq® 기기에서의 위상화, 전위상화 및 에러율을 포함하는 1차 시퀀싱 메트릭스를 예시한다.
도 7a 및 도 7b는 각각, 3'-O-아지도메틸 블로킹기를 갖는 표준 ffN을 사용한 동일한 시퀀싱 메트릭스와 비교하여, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 iSeq™ 기기에서의 2 × 300회 시퀀싱 런의 에러율 및 Q30 시퀀싱 메트릭스를 예시한다.
도 8a 및 도 8b는 각각, 3'-O-아지도메틸 블로킹기를 갖는 표준 ffN을 사용한 동일한 시퀀싱 메트릭스와 비교하여, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 iSeq™ 기기에서의 2 × 150회 시퀀싱 런의 에러율 및 Q30 시퀀싱 메트릭스를 예시한다.
도 9a 내지 도 9e는 녹색 레이저 출력이 일정한 경우, 청색 레이저 출력의 함수로서 1차 시퀀싱 메트릭스(위상화, 신호 감쇠율, 에러율)를 예시한다. 시퀀싱 실험은 3'-O-아지도메틸 블로킹기를 갖는 표준 프로토콜 및 ffN을 사용한 동일한 시퀀싱 메트릭스와 비교하여, 팔라듐 스캐빈저 L-시스테인이 사용된 경우, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용하여 일루미나의 NovaSeqTM 기기에서 행해졌다.
도 10은 표준 효소 선형화를 사용한 동일한 ffN의 SBS와 비교하여, 동일한 팔라듐 절단 믹스가 SBS의 화학적 선형화의 제1 단계에서도 사용된 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 iSeq™ 기기(1 ×150회 사이클)에 대한 1차 시퀀싱 메트릭스(%PF, 에러율, Q30 및 신호 감쇠)를 예시한다.
도 2는 AOL 링커 부분 및 3'-AOM 블로킹기를 갖는 표준 완전 작용화된 뉴클레오티드(ffN)와 비교하여, LN3 링커 부분 및 3'-O-아지도메틸 블로킹기를 갖는 ffN의 시간 함수로서 퍼센트 전위상화(prephasing) 값을 나타내는 라인 차트이다.
도 3은 절단 후 세척 단계에서 팔라듐 스캐빈저를 사용하거나 사용하지 않고 3'-AOM 블로킹기를 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나(Illumina)의 MiniSeq® 기기에서의 위상화(phasing) 값의 비교를 예시한다.
도 4는 3'-O-아지도메틸 블로킹기를 갖는 표준 ffN을 사용한 동일한 시퀀싱 메트릭스와 비교하여, 팔라듐 스캐빈저가 사용된 경우, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 MiniSeq® 기기에서의 위상화, 전위상화 및 에러율을 포함하는 1차 시퀀싱 메트릭스를 예시한다.
도 5는 글리신 또는 에탄올아민이 각각 도입 믹스에 사용되는 경우, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 MiniSeq® 기기에서의 위상화 및 전위상화를 포함하는 1차 시퀀싱 메트릭스의 비교를 예시한다.
도 6은 3'-O-아지도메틸 블로킹기를 갖는 표준 ffN을 사용한 동일한 시퀀싱 메트릭스와 비교하여, 글리신이 도입 믹스에 사용된 경우, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 MiniSeq® 기기에서의 위상화, 전위상화 및 에러율을 포함하는 1차 시퀀싱 메트릭스를 예시한다.
도 7a 및 도 7b는 각각, 3'-O-아지도메틸 블로킹기를 갖는 표준 ffN을 사용한 동일한 시퀀싱 메트릭스와 비교하여, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 iSeq™ 기기에서의 2 × 300회 시퀀싱 런의 에러율 및 Q30 시퀀싱 메트릭스를 예시한다.
도 8a 및 도 8b는 각각, 3'-O-아지도메틸 블로킹기를 갖는 표준 ffN을 사용한 동일한 시퀀싱 메트릭스와 비교하여, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 iSeq™ 기기에서의 2 × 150회 시퀀싱 런의 에러율 및 Q30 시퀀싱 메트릭스를 예시한다.
도 9a 내지 도 9e는 녹색 레이저 출력이 일정한 경우, 청색 레이저 출력의 함수로서 1차 시퀀싱 메트릭스(위상화, 신호 감쇠율, 에러율)를 예시한다. 시퀀싱 실험은 3'-O-아지도메틸 블로킹기를 갖는 표준 프로토콜 및 ffN을 사용한 동일한 시퀀싱 메트릭스와 비교하여, 팔라듐 스캐빈저 L-시스테인이 사용된 경우, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용하여 일루미나의 NovaSeqTM 기기에서 행해졌다.
도 10은 표준 효소 선형화를 사용한 동일한 ffN의 SBS와 비교하여, 동일한 팔라듐 절단 믹스가 SBS의 화학적 선형화의 제1 단계에서도 사용된 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 iSeq™ 기기(1 ×150회 사이클)에 대한 1차 시퀀싱 메트릭스(%PF, 에러율, Q30 및 신호 감쇠)를 예시한다.
본 발명의 실시 형태는 시퀀싱 애플리케이션, 예를 들어 합성에 의한 시퀀싱(sequencing-by-synthesis, SBS)을 위한 3' 아세탈 블로킹기를 갖는 뉴클레오시드 및 뉴클레오티드에 관한 것이다. 일부 실시 형태에서, 뉴클레오시드 또는 뉴클레오티드는 단일 반응 단계에서 3' 아세탈 블로킹기 및 표지의 절단을 가능하게 하는 아세탈 부분을 포함하는 절단가능한 링커를 통해 공유 결합된 표지를 포함한다. 3' 아세탈 블로킹기는 완전 작용화된 뉴클레오티드(ffN)의 합성 동안 안정성 향상을 제공하며, 또한 시퀀싱 기기에서의 제법, 보관 및 작동 시에 용액 중에서의 뛰어난 안정성을 제공한다. 또한, 본 명세서에 기재된 3' 아세탈 블로킹기는 데이터 품질 개선을 위해 낮은 전위상화, 신호 감쇠 저하를 달성할 수도 있으며, 이는 시퀀싱 애플리케이션에서 보다 긴 리드(read)를 가능하게 한다.
정의
달리 정의되지 않는 한, 본 명세서에 사용된 모든 기술 및 과학 용어는 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 용어 "포함하는"뿐만 아니라 "포함하다", "포함한다", 및 "포함된"과 같은 다른 형태의 사용은 제한적이지 않다. 용어 "갖는"뿐만 아니라 "갖다", "갖는다", 및 "가진"과 같은 다른 형태의 사용은 제한적이지 않다. 본 명세서에 사용되는 바와 같이, 청구항의 전제부에서든 또는 본문에서든, 용어 "포함한다" 및 "포함하는"은 개방형(open-ended) 의미를 갖는 것으로 해석되어야 한다. 즉, 상기 용어는 어구 "적어도 갖는" 또는 "적어도 포함하는"과 동의어로 해석되어야 한다. 예를 들어, 공정과 관련하여 사용되는 경우, 용어 "포함하는"은 공정이 적어도 언급된 단계들을 포함하지만, 추가의 단계들을 포함할 수 있음을 의미한다. 화합물, 조성물 또는 장치와 관련하여 사용되는 경우, 용어 "포함하는"은 화합물, 조성물 또는 장치가 적어도 언급된 특징부들 또는 구성요소들을 포함하지만, 또한 추가의 특징부들 또는 구성요소들을 포함할 수 있음을 의미한다.
일정 범위의 값이 제공되는 경우, 상한 및 하한, 상기 범위의 상한과 하한 사이의 각각의 중간값은 실시 형태 내에 포함되는 것으로 이해된다.
본 명세서에 사용되는 일반적인 유기 약어는 하기와 같이 정의된다:
본 명세서에 사용되는 용어 "어레이"는 상이한 프로브 분자가 상대적 위치에 따라 서로 구별될 수 있도록 하나 이상의 기질에 부착된 상이한 프로브 분자의 집단을 지칭한다. 어레이는 기질 상의 상이한 어드레스가능한 위치에 각각 위치한 상이한 프로브 분자를 포함할 수 있다. 대안적으로 또는 추가로, 어레이는 각각 상이한 프로브 분자를 갖는 별개의 기질을 포함할 수 있으며, 여기서 상이한 프로브 분자는 기질이 부착된 표면 상의 기질의 위치에 따라 또는 액체 중에서의 기질의 위치에 따라 식별될 수 있다. 별도의 기질이 표면에 위치하는 예시적인 어레이는 예를 들어, 미국 특허 제6,355,431 B1호, US 2002/0102578호 및 국제 공개 제WO 00/63437호에 기재된 바와 같이, 웰에 비드를 포함하는 것들을 포함하지만 이에 한정되지 않는다. 예를 들어, 형광 활성화 세포 분별기(FACS) 와 같은 마이크로유체 소자를 사용하여 액체 어레이에서 비드를 구별하기 위해 본 발명에서 사용될 수 있는 예시적인 포맷은 예를 들어, 미국 특허 제6,524,793호에 기재되어 있다. 본 발명에서 사용될 수 있는 어레이의 추가의 예는 미국 특허 제5,429,807호; 제5,436,327호; 제5,561,071호; 제5,583,211호; 제5,658,734호; 제5,837,858호; 제5,874,219호; 제5,919,523호; 제6,136,269호; 제6,287,768호; 제6,287,776호; 제6,288,220호; 제6,297,006호; 제6,291,193호; 제6,346,413호; 제6,416,949호; 제6,482,591호; 제6,514,751호 및 제6,610,482호; 국제 특허 공개 제WO 93/17126호; 국제 특허 공개 제WO 95/11995호; 국제 특허 공개 제WO 95/35505호; EP 742 287호; 및 EP 799 897호에 기재된 것들을 포함하지만 이에 한정되지 않는다.
본 명세서에 사용되는 용어 "공유 결합된(covalently attached)" 또는 "공유 결합된(covalently bonded)"은 원자들 사이에 전자쌍을 공유하는 것을 특징으로 하는 화학 결합의 형성을 지칭한다. 예를 들어, 공유 결합된 폴리머 코팅은 다른 수단, 예를 들어 접착 또는 정전기 상호작용을 통한 표면에 대한 부착과 비교하여, 기질의 작용화 표면과 화학 결합을 형성하는 폴리머 코팅을 지칭한다. 표면에 공유 결합된 폴리머는 또한 공유 결합 이외의 수단을 통해 결합될 수 있음이 이해될 것이다.
본 명세서에 사용되는 임의의 "R" 기(들)은 표시된 원자에 부착될 수 있는 치환기를 나타낸다. R 기는 치환 또는 비치환될 수 있다. 2개의 "R" 기가 "이들이 부착되어 있는 원자와 함께" 고리 또는 고리계를 형성하는 것으로 언급되어 있는 경우, 이는 원자, 개재 결합 및 2개의 R 기의 집합적 단위가 언급된 고리임을 의미한다. 예를 들어, 하기 하위구조: 가 존재하고, R1 및 R2는 수소 및 알킬로 이루어진 군으로부터 선택되는 것으로 정의되거나, R1과 R2 는 이들이 부착되어 있는 원자와 함께 아릴 또는 카르보사이클릴을 형성하는 경우, 이는, R1 및 R2는 수소 또는 알킬로부터 선택될 수 있거나, 또는 대안적으로, 이 하위구조가 하기 구조를 가짐을 의미한다:
(상기 식에서, A는 표현된 이중 결합을 함유하는 아릴 고리 또는 카르보사이클릴임).
소정의 라디칼 명명 규약은 문맥에 따라 모노-라디칼 또는 다이-라디칼 중 어느 하나를 포함할 수 있음이 이해되어야 한다. 예를 들어, 치환기가 분자의 나머지 부분에 대한 2개의 부착점을 필요로 하는 경우, 치환기는 다이-라디칼인 것으로 이해된다. 예를 들어, 2개의 부착점을 필요로 하는 알킬로 확인되는 치환기는 다이-라디칼, 예컨대 -CH2-, -CH2CH2-, -CH2CH(CH3)CH2- 등을 포함한다. 다른 라디칼 명명 규약은 라디칼이 "알킬렌" 또는 "알케닐렌"과 같은 다이-라디칼임을 명확하게 나타낸다.
본 명세서에 사용되는 용어 "할로겐" 또는 "할로"는 원소 주기율표의 17족의 방사성 안정 원자, 예를 들어 불소, 염소, 브롬 또는 요오드 중 임의의 하나를 의미하며, 불소 및 염소가 바람직하다.
본 명세서에 사용되는 "Ca 내지 Cb"(여기서, a" 및 "b"는 정수임)는 알킬기, 알케닐기 또는 알키닐기의 탄소 원자수, 또는 사이클로알킬기 또는 아릴기의 고리 원자수를 지칭한다. 즉, 알킬, 알케닐, 알키닐, 사이클로알킬 고리 및 아릴 고리는 "a" 내지 "b"개(종점 포함)의 탄소 원자를 포함할 수 있다. 예를 들어, "C1 내지 C4 알킬"기는 1개 내지 4개의 탄소를 갖는 모든 알킬기, 즉, CH3-, CH3CH2-, CH3CH2CH2-, (CH3)2CH-, CH3CH2CH2CH2-, CH3CH2CH(CH3)- 및 (CH3)3C-를 지칭하고; C3 내지 C4 사이클로알킬기는 3개 또는 4개의 탄소 원자를 갖는 모든 사이클로알킬기, 즉, 사이클로프로필 및 사이클로부틸을 지칭한다. 유사하게, "4원 내지 6원 헤테로사이클릴"기는 4 내지 6개의 총 고리 원자를 갖는 모든 헤테로사이클릴기, 예를 들어 아제티딘, 옥세탄, 옥사졸린, 피롤리딘, 피페리딘, 피페라진, 모르폴린 등을 지칭한다. "a" 및 "b"가 알킬기, 알케닐기, 알키닐기, 사이클로알킬기 또는 아릴기에 관하여 지정되어 있지 않다면, 이들 정의에 기재된 가장 넓은 범위가 가정되어야 한다. 본 명세서에 사용되는 용어 "C1-6"는 C1, C2, C3, C4, C5 및 C6, 및 임의의 이들 2개의 숫자에 의해 정의되는 범위를 포함한다. 예를 들어, C1-C6 알킬은 C1, C2, C3, C4, C5 및 C6 알킬, C2-C6 알킬, C1-C3 알킬 등을 포함한다. 유사하게, C2-C6 알케닐은 C2, C3, C4, C5 및 C6 알케닐, C2-C5 알케닐, C3-C4 알케닐 등을 포함하며; C2-C6 알키닐은 C2, C3, C4, C5 및 C6 알키닐, C2-C5 알키닐, C3-C4 알키닐 등을 포함한다. C3-C8 사이클로알킬은 각각 3개, 4개, 5개, 6개, 7개 및 8개의 탄소 원자, 또는 임의의 이들 2개의 숫자에 의해 정의되는 범위, 예컨대 C3-C7 사이클로알킬 또는 C5-C6 사이클로알킬을 포함하는 탄화수소 고리를 포함한다.
본 명세서에 사용되는 "알킬"은 완전 포화된(즉, 이중 또는 삼중 결합을 포함하지 않는) 직쇄 또는 분지쇄 탄화수소 사슬을 지칭한다. 알킬기는 1개 내지 20개의 탄소 원자를 가질 수 있다(본 명세서에 나타날 때마다, "1 내지 20"과 같은 수치 범위는 주어진 범위 내의 각각의 정수를 지칭하며; 예를 들어, "1개 내지 20개의 탄소 원자"는 알킬기가 1개의 탄소 원자, 2개의 탄소 원자, 3개의 탄소 원자 등, 20개를 포함하여 20개 이하의 탄소 원자로 이루어질 수 있음을 의미하지만, 본 정의는 또한 수치 범위가 지정되지 않은 용어 "알킬"의 경우도 포함한다). 알킬기는 또한 1개 내지 9개의 탄소 원자를 갖는 중간 크기 알킬일 수 있다. 알킬기는 또한 1개 내지 6개의 탄소 원자를 갖는 저급 알킬일 수 있다. 알킬기는 "C1-C4알킬" 또는 유사한 명칭으로 지정될 수 있다. 단지 예로서, "C1-C6알킬"은 알킬 사슬에 1개 내지 6개의 탄소 원자가 존재함을 나타내는데, 즉, 알킬 사슬은 메틸, 에틸, 프로필, 아이소-프로필, n-부틸, 아이소-부틸, sec-부틸 및 t-부틸로 이루어진 군으로부터 선택된다. 전형적인 알킬기는 메틸, 에틸, 프로필, 아이소프로필, 부틸, 아이소부틸, 삼차 부틸, 펜틸, 헥실 등을 포함하지만 결코 이로 한정되지 않는다.
본 명세서에 사용되는 "알콕시"는 화학식 -OR(여기서, R은 상기에 정의된 바와 같은 알킬임)을 지칭하는 것으로, 이는 예를 들어, "C1-C9 알콕시"이며, 이에는 메톡시, 에톡시, n-프로폭시, 1-메틸에톡시(아이소프로폭시), n-부톡시, 아이소-부톡시, sec-부톡시, 및 tert-부톡시 등이 포함되지만 이로 한정되지 않는다.
본 명세서에 사용되는 "알케닐"은 하나 이상의 이중 결합을 포함하는 직쇄 또는 분지형 탄화수소 사슬을 지칭한다. 알케닐기는 2개 내지 20개의 탄소 원자를 가질 수 있지만, 본 정의는 수치 범위가 지정되지 않은 용어 "알케닐"의 경우도 포함한다. 알케닐기는 또한 2개 내지 9개의 탄소 원자를 갖는 중간 크기 알케닐일 수 있다. 알케닐기는 또한 2개 내지 6개의 탄소 원자를 갖는 저급 알케닐일 수 있다. 알케닐기는 "C2-C6 알케닐" 또는 유사한 명칭으로 지정될 수 있다. 단지 예로서, "C2-C6 알케닐"은 알케닐 사슬에 2개 내지 6개의 탄소 원자가 존재함을 나타내며, 즉, 알케닐 사슬은 에테닐, 프로펜-1-일, 프로펜-2-일, 프로펜-3-일, 부텐-1-일, 부텐-2-일, 부텐-3-일, 부텐-4-일, 1-메틸-프로펜-1-일, 2-메틸-프로펜-1-일, 1-에틸-에텐-1-일, 2-메틸-프로펜-3-일, 부타-1,3-다이에닐, 부타-1,2,-다이에닐, 및 부타-1,2-다이엔-4-일로 이루어진 군으로부터 선택된다. 전형적인 알케닐기에는 에테닐, 프로페닐, 부테닐, 펜테닐, 및 헥세닐 등이 포함되지만 결코 이로 한정되지 않는다.
본 명세서에 사용되는 "알키닐"은 하나 이상의 삼중 결합을 포함하는 직쇄 또는 분지형 탄화수소 사슬을 지칭한다. 알키닐기는 2개 내지 20개의 탄소 원자를 가질 수 있지만, 본 정의는 수치 범위가 지정되지 않은 용어 "알키닐"의 경우도 포함한다. 알키닐기는 또한 2개 내지 9개의 탄소 원자를 갖는 중간 크기 알키닐일 수 있다. 알키닐기는 또한 2개 내지 6개의 탄소 원자를 갖는 저급 알키닐일 수 있다. 알키닐기는 "C2-C6 알키닐" 또는 유사한 명칭으로 지정될 수 있다. 단지 예로서, "C2-C6 알키닐"은 알키닐 사슬에 2개 내지 6개의 탄소 원자가 존재함을 나타내는데, 즉, 알키닐 사슬은 에티닐, 프로핀-1-일, 프로핀-2-일, 부틴-1-일, 부틴-3-일, 부틴-4-일, 및 2-부티닐로 이루어진 군으로부터 선택된다. 전형적인 알키닐기에는 에티닐, 프로피닐, 부티닐, 펜티닐, 및 헥시닐 등이 포함되지만 결코 이로 한정되지 않는다.
본 명세서에 사용되는 "헤테로알킬"은 사슬 골격에 하나 이상의 헤테로원자, 즉, 질소, 산소 및 황을 포함하지만 이로 한정되지 않는 탄소 이외의 원소를 포함하는 직쇄 또는 분지형 탄화수소 사슬을 지칭한다. 헤테로알킬기는 1개 내지 20개의 탄소 원자를 가질 수 있지만, 본 정의는 수치 범위가 지정되지 않은 용어 "헤테로알킬"의 경우도 포함한다. 헤테로알킬기는 또한 1개 내지 9개의 탄소 원자를 갖는 중간 크기 헤테로알킬일 수 있다. 헤테로알킬기는 또한 1개 내지 6개의 탄소 원자를 갖는 저급 헤테로알킬일 수 있다. 헤테로알킬기는 "C1-C6 헤테로알킬" 또는 유사한 명칭으로 지정될 수 있다. 헤테로알킬기는 하나 이상의 헤테로원자를 포함할 수 있다. 단지 예로서, "C4-C6 헤테로알킬"은 헤테로알킬 사슬에 4개 내지 6개의 탄소 원자가 존재하고, 게다가 사슬의 골격에 하나 이상의 헤테로원자가 존재함을 나타낸다.
용어 "방향족"은 컨쥬게이트된 π 전자계를 갖는 고리 또는 고리계를 지칭하며, 카르보사이클릭 방향족 기(예를 들어, 페닐) 및 헤테로사이클릭 방향족 기(예를 들어, 피리딘)를 모두 포함한다. 이 용어는, 전체 고리계가 방향족이라면, 모노사이클릭 또는 융합 고리 폴리사이클릭(즉, 인접한 원자쌍을 공유하는 고리) 기를 포함한다.
본 명세서에 사용되는 "아릴"은 고리 골격에 탄소만을 포함하는 방향족 고리 또는 고리계(즉, 2개의 인접한 탄소 원자를 공유하는 2개 이상의 융합 고리)를 지칭한다. 아릴이 고리계일 때, 계의 모든 고리는 방향족이다. 아릴기는 6개 내지 18개의 탄소 원자를 가질 수 있지만, 본 정의는 수치 범위가 지정되지 않은 용어 "아릴"의 경우도 포함한다. 일부 실시 형태에서, 아릴 기는 6 내지 10개의 탄소 원자를 갖는다. 아릴기는 "C6-C10 아릴", "C6 또는 C10 아릴", 또는 유사한 명칭으로 지정될 수 있다. 아릴기의 예에는 페닐, 나프틸, 아줄레닐, 및 안트라세닐이 포함되지만 이로 한정되지 않는다.
"아르알킬" 또는 "아릴알킬"은 치환기로서, 알킬렌기를 통해 연결된 아릴기, 예컨대 "C7-14 아르알킬" 등이며, 이에는 벤질, 2-페닐에틸, 3-페닐프로필, 및 나프틸알킬이 포함되지만 이로 한정되지 않는다. 경우에 따라서는, 알킬렌기는 저급 알킬렌기(즉, C1-C6 알킬렌기)이다.
본 명세서에 사용되는 "헤테로아릴"은 고리 골격에 하나 이상의 헤테로원자, 즉, 질소, 산소 및 황을 포함하지만 이로 한정되지 않는 탄소 이외의 원소를 포함하는 방향족 고리 또는 고리계(즉, 2개의 인접한 원자를 공유하는 2개 이상의 융합 고리)를 지칭한다. 헤테로아릴이 고리계일 때, 계의 모든 고리는 방향족이다. 헤테로아릴기는 5개 내지 18개의 고리 구성원(즉, 탄소 원자 및 헤테로원자를 포함하는 고리 골격을 구성하는 원자수)을 가질 수 있지만, 본 정의는 수치 범위가 지정되지 않은 용어 "헤테로아릴"의 경우도 포함한다. 일부 실시 형태에서, 헤테로아릴기는 5개 내지 10개의 고리 구성원 또는 5 내지 7개의 고리 구성원을 갖는다. 헤테로아릴기는 "5원 내지 7원 헤테로아릴", "5원 내지 10원 헤테로아릴", 또는 유사한 명칭으로 지정될 수 있다. 헤테로아릴 고리의 예에는 푸릴, 티에닐, 프탈라지닐, 피롤릴, 옥사졸릴, 티아졸릴, 이미다졸릴, 피라졸릴, 아이소옥사졸릴, 아이소티아졸릴, 트라이아졸릴, 티아다이아졸릴, 피리디닐, 피리다지닐, 피리미디닐, 피라지닐, 트라이아지닐, 퀴놀리닐, 아이소퀴놀리닐, 벤즈이미다졸릴, 벤족사졸릴, 벤조티아졸릴, 인돌릴, 아이소인돌릴, 및 벤조티에닐이 포함되지만 이로 한정되지 않는다.
"헤테로아르알킬" 또는 "헤테로아릴알킬"은 치환기로서, 알킬렌기를 통해 연결된 헤테로아릴기이다. 예에는 2-티에닐메틸, 3-티에닐메틸, 푸릴메틸, 티에닐에틸, 피롤릴알킬, 피리딜알킬, 아이소옥사졸릴알킬, 및 이미다졸릴알킬이 포함되지만 이로 한정되지 않는다. 경우에 따라서는, 알킬렌기는 저급 알킬렌기(즉, C1-C6 알킬렌기)이다.
본 명세서에 사용되는 "카르보사이클릴"은 고리계 골격에 탄소 원자만을 포함하는 비방향족 사이클릭 고리 또는 고리계를 의미한다. 카르보사이클릴이 고리계인 경우에는, 2개 이상의 고리가 융합된, 가교된 또는 스피로 연결된 형태로 함께 결합될 수 있다. 카르보사이클릴은 고리계의 적어도 하나의 고리가 방향족이 아니면 임의의 포화도를 가질 수 있다. 따라서, 카르보사이클릴에는 사이클로알킬, 사이클로알케닐, 및 사이클로알키닐이 포함된다. 카르보사이클릴기는 3개 내지 20개의 탄소 원자를 가질 수 있지만, 본 정의는 수치 범위가 지정되지 않은 용어 "카르보사이클릴"의 경우도 포함한다. 카르보사이클릴기는 또한 3개 내지 10개의 탄소 원자를 갖는 중간 크기 카르보사이클릴일 수 있다. 카르보사이클릴기는 또한 3개 내지 6개의 탄소 원자를 갖는 카르보사이클릴일 수 있다. 카르보사이클릴기는 "C3-C6카르보사이클릴" 또는 유사한 명칭으로 지정될 수 있다. 카르보사이클릴 고리의 예에는 사이클로프로필, 사이클로부틸, 사이클로펜틸, 사이클로헥실, 사이클로헥세닐, 2,3-다이하이드로-인덴, 바이사이클[2.2.2]옥타닐, 아다만틸, 및 스피로 [4.4]노나닐이 포함되지만 이로 한정되지 않는다.
본 명세서에 사용되는 "사이클로알킬"은 완전 포화 카르보사이클릴 고리 또는 고리계를 의미한다. 예에는 사이클로프로필, 사이클로부틸, 사이클로펜틸, 및 사이클로헥실이 포함된다.
본 명세서에 사용되는 "헤테로사이클릴"은 고리 골격에 적어도 하나의 헤테로원자를 포함하는 비방향족 사이클릭 고리 또는 고리계를 의미한다. 헤테로사이클릴은 융합된, 가교된 또는 스피로 연결된 형태로 함께 결합될 수 있다. 헤테로사이클릴은 고리계의 적어도 하나의 고리가 방향족이 아니면 임의의 포화도를 가질 수 있다. 헤테로원자(들)는 고리계의 비방향족 또는 방향족 고리 중 어느 하나에 존재할 수 있다. 헤테로사이클릴기는 3개 내지 20개의 고리 구성원(즉, 탄소 원자 및 헤테로원자를 포함하는 고리 골격을 구성하는 원자수)을 가질 수 있지만, 본 정의는 수치 범위가 지정되지 않은 용어 "헤테로사이클릴"의 경우도 포함한다. 헤테로사이클릴기는 또한 3개 내지 10개의 고리 구성원을 갖는 중간 크기 헤테로사이클릴일 수 있다. 헤테로사이클릴기는 또한 3개 내지 6개의 고리 구성원을 갖는 헤테로사이클릴일 수 있다. 헤테로사이클릴기는 "3원 내지 6원 헤테로사이클릴" 또는 유사한 명칭으로 지정될 수 있다. 바람직한 6원 모노사이클릭 헤테로사이클릴에서, 헤테로원자(들)는 O, N 또는 S 중 1개 내지 3개로부터 선택되고, 바람직한 5원 모노사이클릭 헤테로사이클릴에서, 헤테로원자(들)는 O, N 또는 S로부터 선택되는 1개 또는 2개의 헤테로원자로부터 선택된다. 헤테로사이클릴 고리의 예에는 아제피닐, 아크리디닐, 카르바졸릴, 신놀리닐, 다이옥솔라닐, 이미다졸리닐, 이미다졸리디닐, 모르폴리닐, 옥시라닐, 옥세파닐, 티에파닐, 피페리디닐, 피페라지닐, 다이옥소피페라지닐, 피롤리디닐, 피롤리디닐, 피롤리디오닐, 4-피페리도닐, 피라졸리닐, 피라졸리디닐, 1,3-다이옥시닐, 1,3-다이옥사닐, 1,4-다이옥시닐, 1,4-다이옥사닐, 1,3-옥사티아닐, 1,4-옥사티이닐, 1,4-옥사티아닐, 2H-1,2-옥사지닐, 트라이옥사닐, 헥사하이드로-1,3,5-트라이아지닐, 1,3-다이옥솔릴, 1,3-다이옥솔라닐, 1,3-다이티올릴, 1,3-다이티올라닐, 아이소옥사졸리닐, 아이소옥사졸리디닐, 옥사졸리닐, 옥사졸리디닐, 옥사졸리디노닐, 티아졸리닐, 티아졸리디닐, 1,3-옥사티올라닐, 인돌리닐, 아이소인돌리닐, 테트라하이드로푸라닐, 테트라하이드로피라닐, 테트라하이드로티오페닐, 테트라하이드로티오피라닐, 테트라하이드로-1,4-티아지닐, 티아모르폴리닐, 다이하이드로벤조푸라닐, 벤즈이미다졸리디닐, 및 테트라하이드로퀴놀린이 포함되지만 이로 한정되지 않는다.
본 명세서에 사용되는 "알콕시알킬" 또는 "(알콕시)알킬"은 알킬렌기를 통해 연결된 알콕시기, 예컨대 C2-C8 알콕시알킬, 또는 (C1-C6 알콕시)C1-C6 알킬, 예를 들어 -(CH2)1-3-OCH3를 지칭한다.
본 명세서에 사용되는 "-O-알콕시알킬" 또는 "-O-(알콕시)알킬"은 -O-(알킬렌)기를 통해 연결된 알콕시기, 예컨대 -O-(C1-C6 알콕시)C1-C6 알킬, 예를 들어, -O-(CH2)1-3-OCH3를 지칭한다.
본 명세서에 사용되는 "(헤테로사이클릴)알킬"은 치환기로서, 상기에 정의된 바와 같은 알킬렌기를 통해 연결된 상기에 정의된 바와 같은 헤테로사이클릭기 또는 헤테로사이클릴기를 지칭한다. (헤테로사이클릴)알킬의 알킬렌기 및 헤테로사이클릴기는 치환 또는 비치환될 수 있다. 예에는 (테트라하이드로-2H-피란-4-일)메틸, (피페리딘-4-일)에틸, (피페리딘-4-일)프로필, (테트라하이드로-2H-티오피란-4-일)메틸, 및 (1,3-티아지난-4-일)메틸이 포함되지만 이로 한정되지 않는다.
본 명세서에 사용되는 "(사이클로알킬)알킬" 또는 "(카르보사이클릴)알킬"은 치환기로서, 알킬렌기를 통해 연결된 사이클로알킬기 또는 카르보사이클릴기(본 명세서에 정의된 바와 같음)를 지칭한다. 예에는 사이클로프로필메틸, 사이클로부틸메틸, 사이클로펜틸에틸, 및 사이클로헥실프로필이 포함되지만 이로 한정되지 않는다.
"O-카르복시" 기는 "-OC(=O)R" 기를 지칭하며, 여기서 R은 수소, C1-C6 알킬, C2-C6 알케닐, C2-C6 알키닐, C3-C7 카르보사이클릴, C6-C10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
"C-카르복시" 기는 "-C(=O)OR" 기를 지칭하며, 여기서 R은 수소, C1-C6 알킬, C2-C6 알케닐, C2-C6 알키닐, C3-C7 카르보사이클릴, C6-C10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로 이루어진 군으로부터 선택되며, 이는 본 명세서에 정의된 바와 같다. 비제한적인 예에는 카르복실(즉, -C(=O)OH)이 포함된다.
"설포닐" 기는 "-SO2R" 기를 지칭하며, 여기서 R은 수소, C1-C6 알킬, C2-C6 알케닐, C2-C6 알키닐, C3-C7 카르보사이클릴, C6-C10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
"설피노" 기는 "-S(=O)OH" 기를 지칭한다.
"S-설폰아미도" 기는 "-SO2NRARB" 기를 지칭하며, 여기서 RA 및 RB는 각각 독립적으로 수소, C1-C6 알킬, C2-C6 알케닐, C2-C6 알키닐, C3-C7 카르보사이클릴, C6-C10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
"N-설폰아미도" 기는 "-N(RA)SO2RB" 기를 지칭하며, 여기서 RA 및 RB는 각각 독립적으로 수소, C1-C6 알킬, C2-C6 알케닐, C2-C6 알키닐, C3-C7 카르보사이클릴, C6-C10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
"C-아미도" 기는 " -C(=O)NRARB" 기를 지칭하며, 여기서 RA 및 RB는 각각 독립적으로 수소, C1-C6 알킬, C2-C6 알케닐, C2-C6 알키닐, C3-C7 카르보사이클릴, C6-C10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
"N-아미도" 기는 "-N(RA)C(=O)RB" 기를 지칭하며, 여기서 RA 및 RB는 각각 독립적으로 수소, C1-C6 알킬, C2-C6 알케닐, C2-C6 알키닐, C3-C7 카르보사이클릴, C6-C10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
"아미노" 기는 "-NRARB" 기를 지칭하며, 여기서 RA 및 RB는 각각 독립적으로 수소, C1-C6 알킬, C2-C6 알케닐, C2-C6 알키닐, C3-C7 카르보사이클릴, C6-C10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다. 비제한적인 예에는 유리 아미노(즉, -NH2)가 포함된다.
"아미노알킬" 기는 알킬렌기를 통해 연결된 아미노기를 지칭한다.
"(알콕시)알킬" 기는 알킬렌기를 통해 연결된 알콕시기, 예컨대 "(C1-C6 알콕시) C1-C6 알킬" 등을 지칭한다.
본 명세서에 사용되는 용어 "하이드록시"는 -OH 기를 지칭한다.
본 명세서에 사용되는 용어 "시아노" 기는 "-CN" 기를 지칭한다.
본 명세서에 사용되는 용어 "아지도"는 -N3 기를 지칭한다.
본 명세서에 사용되는 용어 "프로파르길아민"은 프로파르길기()로 치환된 아미노기를 지칭한다. 프로파르길아민이 문맥에서 2가 부분으로서 사용되는 경우, 이는 를 포함하며, 여기서 RA는 수소, C1-C6 알킬, C2-C6 알케닐, C2-C6 알키닐, C3-C7 카르보사이클릴, C6-C10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
본 명세서에 사용되는 용어 "프로파르길아미드"는 프로파르길기()로 치환된 C-아미도기 또는 N-아미도기를 지칭한다. 프로파르길아미드가 문맥에서 2가 부분으로서 사용되는 경우, 이는 또는 를 포함하며, 여기서 RA는 수소, C1-C6 알킬, C2-C6 알케닐, C2-C6 알키닐, C3-C7 카르보사이클릴, C6-C10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
본 명세서에 사용되는 용어 "알릴아민"은 알릴기(CH2=CH-CH2-)로 치환된 아미노기를 지칭한다. 알릴아민이 문맥에서 2가 부분으로서 사용되는 경우, 이는 -CH=CH-CH2-NRA-를 포함하며, 여기서 RA는 수소, C1-C6 알킬, C2-C6 알케닐, C2-C6 알키닐, C3-C7 카르보사이클릴, C6-C10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
본 명세서에 사용되는 용어 "알릴아미드"는 알릴기(CH2=CH-CH2-)로 치환된 C-아미도기 또는 N-아미도기를 지칭한다. 알릴아미드가 문맥에서 2가 부분으로서 사용되는 경우, 이는 -CH=CH-CH2-NRA-C(=O)- 또는 -CH=CH-CH2-C(=O)-NRA-를 포함하며, 여기서 RA는 수소, C1-C6 알킬, C2-C6 알케닐, C2-C6 알키닐, C3-C7 카르보사이클릴, C6-C10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
기가 "임의로 치환된"으로 기재되는 경우, 이는 비치환 또는 치환될 수 있다. 마찬가지로, 기가 "치환된"인 것으로 기술되는 경우, 치환기는 하나 이상의 표시된 치환기로부터 선택될 수 있다. 본 명세서에 사용되는 치환된 기는 비치환된 모 기(parent group)의 하나 이상의 수소 원자를 다른 원자 또는 기로 교환한 것으로부터 유도된다. 달리 지시되지 않는 한, 기가 "치환된" 것으로 간주되는 경우, 그 기는 C1-C6 알킬, C1-C6 알케닐, C1-C6 알키닐, C1-C6 헤테로알킬, C3-C7 카르보사이클릴(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬 및 C1-C6 할로알콕시로 임의로 치환됨), C3-C7카르보사이클릴-C1-C6-알킬(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬 및 C1-C6 할로알콕시로 임의로 치환됨), 3원 내지 10원 헤테로사이클릴(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬 및 C1-C6 할로알콕시로 임의로 치환됨), 3원 내지 10원 헤테로사이클릴-C1-C6-알킬(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬 및 C1-C6 할로알콕시로 임의로 치환됨), 아릴(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬 및 C1-C6 할로알콕시로 임의로 치환됨), (아릴)C1-C6 알킬(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬 및 C1-C6 할로알콕시로 임의로 치환됨), 5원 내지 10원 헤테로아릴(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬 및 C1-C6 할로알콕시로 임의로 치환됨), (5원 내지 10원 헤테로아릴)C1-C6 알킬(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬 및 C1-C6 할로알콕시로 임의로 치환됨), 할로, -CN, 하이드록시, C1-C6 알콕시, (C1-C6 알콕시)C1-C6 알킬, -O(C1-C6 알콕시)C1-C6 알킬; (C1-C6 할로알콕시)C1-C6 알킬; -O(C1-C6 할로알콕시)C1-C6 알킬; 아릴옥시, 설프히드릴(메르캅토), 할로(C1-C6)알킬(예를 들어, -CF3), 할로(C1-C6)알콕시(예를 들어, -OCF3), C1-C6 알킬티오, 아릴티오, 아미노, 아미노(C1-C6)알킬, 니트로, O-카르바밀, N-카르바밀, O-티오카르바밀, N-티오카르바밀, C-아미도, N-아미도, S-설폰아미도, N-설폰아미도, C-카르복시, O-카르복시, 아실, 시아나토, 아이소시아나토, 티오시아나토, 아이소티오시아나토, 설피닐, 설포닐, -SO3H, 설피노, -OSO2C1-4알킬, 모노포스페이트, 다이포스페이트, 트라이포스페이트 및 옥소(=O)로부터 독립적으로 선택되는 하나 이상의 치환기로 치환된 것을 의미한다. 기가 "임의로 치환된"으로 기재되어 있는 경우에는 언제든지, 그 기는 상기 치환기로 치환될 수 있다.
치환기가 다이-라디칼로서 표시된(즉, 분자의 나머지에 대해 2개의 부착점을 갖는) 경우는 어느 경우이든, 달리 지시되지 않는 한 치환기는 어떠한 방향 배치로도 부착될 수 있음이 이해되어야 한다. 따라서, 예를 들어, -AE- 또는 로 표시된 치환기는 A가 분자의 가장 왼쪽의 부착점에 부착되도록 치환기가 배향되는 것뿐만 아니라, A가 분자의 가장 오른쪽의 부착점에 부착되는 경우도 포함한다. 또한, 기 또는 치환기가 로 표시되고, L이 임의로 존재하는 링커 부분으로 정의되는 경우; L이 존재하지 않는 경우(또는 부재하는 경우), 이러한 기 또는 치환기는 와 상응한다.
본 명세서에 사용되는 "뉴클레오티드"는 질소 함유 헤테로사이클릭 염기, 당, 및 하나 이상의 포스페이트기를 포함한다. 이들은 핵산 서열의 단량체 단위이다. RNA에서, 당은 리보스이고, DNA에서는 데옥시리보스, 즉, 리보스에 존재하는 하이드록실기가 결여되어 있는 당이다. 질소 함유 헤테로사이클릭 염기는 퓨린 또는 피리미딘 염기일 수 있다. 퓨린 염기는 아데닌(A) 및 구아닌(G), 및 이의 변형 유도체 또는 유사체를 포함한다. 피리미딘 염기는 시토신(C), 티민(T), 및 우라실(U), 및 이들의 변형 유도체 또는 유사체를 포함한다. 데옥시리보스의 C-1 원자는 피리미딘의 N-1 또는 퓨린의 N-9에 결합된다.
본 명세서에 사용되는 "뉴클레오시드"는 뉴클레오티드와 구조적으로 유사하지만 포스페이트 부분이 존재하지 않는다. 뉴클레오시드 유사체의 한 예는 표지가 염기에 연결되어 있고 당 분자에 부착된 포스페이트기가 없는 것일 것이다. 용어 "뉴클레오시드"는 당업자에게 명백한 이의 통상적인 의미로 본 명세서에 사용된다. 예에는 리보스 부분을 포함하는 리보뉴클레오시드 및 데옥시리보스 부분을 포함하는 데옥시리보뉴클레오시드가 포함되지만 이로 한정되지 않는다. 변형된 펜토스 부분은 산소 원자가 탄소로 치환되고/되거나 탄소가 황 또는 산소 원자로 치환된 펜토스 부분이다. "뉴클레오시드"는 치환된 염기 및/또는 당 부분을 가질 수 있는 단량체이다. 게다가, 뉴클레오시드는 더 큰 DNA 및/또는 RNA 폴리머 및 올리고머에 도입될 수 있다.
용어 "퓨린 염기"는 당업자에게 명백한 이의 통상적인 의미로 본 명세서에 사용되며, 이의 호변이성질체를 포함한다. 유사하게, 용어 "피리미딘 염기"는 당업자에게 명백한 이의 통상적인 의미로 본 명세서에 사용되며, 이의 호변이성질체를 포함한다. 임의로 치환된 퓨린 염기의 비제한적인 목록은 퓨린, 데아자퓨린, 아데닌, 7-데아자 아데닌, 구아닌, 7-데아자 구아닌, 하이포잔틴, 잔틴, 알록산틴, 7-알킬구아닌(예를 들어, 7-메틸구아닌), 테오브로민, 카페인, 요산 및 아이소구아닌을 포함한다. 피리미딘 염기의 예에는 시토신, 티민, 우라실, 5,6-다이하이드로우라실 및 5-알킬시토신(예를 들어, 5-메틸시토신)이 포함되지만 이로 한정되지 않는다.
본 명세서에 사용되는 바와 같이, 올리고뉴클레오티드 또는 폴리뉴클레오티드가 본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드를 "포함하는" 또는 "로 표지된" 것으로 기재될 때, 그것은 본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드가 올리고뉴클레오티드 또는 폴리뉴클레오티드와 공유 결합을 형성한다는 것을 의미한다. 유사하게, 뉴클레오시드 또는 뉴클레오티드가 올리고뉴클레오티드 또는 폴리뉴클레오티드의 일부로서 기재될 때, 예컨대 올리고뉴클레오티드 또는 폴리뉴클레오티드 "에 도입된" 것으로 기재될 때, 그것은 본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드가 올리고뉴클레오티드 또는 폴리뉴클레오티드와 공유 결합을 형성한다는 것을 의미한다. 일부 그러한 실시 형태에서, 공유 결합은 올리고뉴클레오티드 또는 폴리뉴클레오티드의 3' 탄소 원자와 뉴클레오티드의 5' 탄소 원자 사이의 포스포다이에스테르 결합으로서, 올리고뉴클레오티드 또는 폴리뉴클레오티드의 3' 하이드록시기와 본 명세서에 기재된 뉴클레오티드의 5' 포스페이트기 사이에 형성된다.
본 명세서에 사용되는 용어 "절단가능한 링커"는 전체 링커가 제거되어야 하는 것을 내포하는 것으로 의미하지 않는다. 절단 부위는 링커의 일부가 절단 후 검출가능한 표지 및/또는 뉴클레오시드 또는 뉴클레오티드 부분에 부착된 채로 남아 있는 것을 보장하는 링커 상의 위치에 위치될 수 있다.
본 명세서에 사용되는 "유도체" 및 "유사체"는 변형된 염기 부분 및/또는 변형된 당 부분을 갖는 합성 뉴클레오티드 또는 뉴클레오시드 유도체를 의미한다. 그러한 유도체 및 유사체는, 예를 들어 문헌[Scheit, Nucleotide Analogs (John Wiley & Son, 1980)] 및 문헌[Uhlman et al., Chemical Reviews 90:543-584, 1990]에 논의되어 있다. 뉴클레오티드 유사체는 또한, 포스포로티오에이트, 포스포로다이티오에이트, 알킬-포스포네이트, 포스포르아닐리데이트 및 포스포르아미데이트 결합을 포함한 변형된 포스포다이에스테르 결합을 포함할 수 있다. 본 명세서에 사용되는 "유도체", "유사체" 및 "변형된"은 상호교환 가능하게 사용될 수 있으며, 본 명세서에 정의된 용어 "뉴클레오티드" 및 "뉴클레오시드"에 의해 포함된다.
본 명세서에 사용되는 용어 "포스페이트"는 당업자에게 명백한 이의 통상적인 의미로 사용되고, 이의 양성자화 형태(예를 들어, 및 )를 포함한다. 본 명세서에 사용되는 용어 "모노포스페이트", "다이포스페이트" 및 "트라이포스페이트"는 당업자에게 명백한 이의 통상적인 의미로 사용되고, 양성자화 형태를 포함한다.
본 명세서에 사용되는 용어 "보호기" 및 "보호기들"은 분자 내의 기존의 기가 원치 않는 화학 반응을 거치는 것을 방지하기 위해 분자에 부가되는 임의의 원자 또는 원자들의 군을 지칭한다. 때때로, "보호기"와 "블로킹 기"는 상호교환 가능하게 사용될 수 있다.
본 명세서에 사용되는 용어 "위상화"는 3' 터미네이터 및 플루오로포어의 불완전한 제거 및 주어진 시퀀싱 사이클에서의 폴리머라제에 의한 클러스터 내로의 일부 DNA 가닥의 도입 실패로 인한 SBS에서의 현상을 지칭한다. 전위상화는 유효한 3' 터미네이터를 갖지 않는 뉴클레오티드의 도입으로 인해 야기되는데, 여기서는 이러한 도입 사건이 종결 실패로 인해 1 사이클 먼저 앞서 간다. 위상화 및 전위상화는 특정 사이클에 대해 측정된 신호 강도가 현재 사이클로로부터의 신호뿐만 아니라 선행 사이클 및 후행 사이클로부터의 잡음으로 이루어지게 한다. 사이클 횟수가 증가함에 따라, 위상화 및 전위상화에 의해 영향을 받는 클러스터당 서열의 분율이 증가하여, 올바른 염기의 확인을 방해한다. 전위상화는 합성에 의한 시퀀싱(SBS) 동안 미량의 비보호 또는 비블로킹된 3'-OH 뉴클레오티드의 존재로 인해 발생될 수 있다. 비보호된 3'-OH 뉴클레오티드는 제조 공정 동안 또는 가능하게는 저장 및 시약 취급 과정 동안 생성될 수 있다. 따라서, 전위상화의 발생률을 감소시키는 뉴클레오티드 유사체의 발견은 놀랍고, 기존의 뉴클레오티드 유사체에 비해 SBS 응용에서 큰 이점을 제공한다. 예를 들어, 제공된 뉴클레오티드 유사체는 보다 빠른 SBS 사이클 시간, 보다 낮은 위상화 및 전위상화 값, 및 보다 긴 시퀀싱 리드 길이를 가져올 수 있다.
3' 아세탈 블로킹기를 갖는 뉴클레오시드 또는 뉴클레오티드
본 발명의 일부 실시 형태는 절단가능한 링커를 통해 검출가능한 표지에 부착된 핵산염기, 및 리보스 또는 데옥시리보스 부분을 포함하는 뉴클레오티드 또는 뉴클레오시드 분자 - 상기 절단가능한 링커는 하기 구조의 부분을 포함함 - 에 관한 것이다:
상기 식에서, X 및 Y는 각각 독립적으로 O 또는 S이고; R1a, R1b, R2, R3a 및 R3b는 각각 독립적으로 H, 할로겐, 비치환 또는 치환된 C1-C6 알킬, 또는 C1-C6 할로알킬이다. 일부 실시 형태에서, 리보스 또는 데옥시리보스 부분은 본 명세서에 기재된 3'-OH 보호기를 포함한다. 일부 실시 형태에서, 절단가능한 링커는 추가로 L1 또는 L2, 또는 둘 다를 포함할 수 있으며, 여기서 L1 및 L2는 하기에 상세히 기술된다.
일부 실시 형태에서, 본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드는 화학식 (I)의 구조를 포함하거나 갖는다:
[화학식 (I)]
상기 식에서, B는 핵산염기이고;
R4는 H 또는 OH이며;
R5는 H, 3'-OH 블로킹기 또는 포스포르아미다이트이고;
R6는 H, 모노포스페이트, 다이포스페이트, 트라이포스페이트, 티오포스페이트, 포스페이트 에스테르 유사체, 반응성 인 함유 기 또는 하이드록시 보호기이며;
L1 및 L2는 각각 독립적으로 임의로 존재하는 링커 부분이다.
본 명세서에 기재된 절단가능한 링커 부분의 일부 실시 형태에서, X 및 Y는 각각 O이다. 다른 일부 실시 형태에서, X는 S이고, Y는 O이거나, X는 O이고, Y는 S이다. 일부 실시 형태에서, R1a, R1b, R2, R3a 및 R3b는 각각 H이다. 다른 실시 형태에서, R1a, R1b, R2, R3a 및 R3b 중 적어도 하나는 할로겐(예를 들어, 플루오로, 클로로) 또는 비치환된 C1-C6 알킬(예를 들어, 메틸, 에틸, 아이소프로필, 아이소부틸 또는 t-부틸)이다. 일부 그러한 경우에는, R1a 및 R1b는 각각 H이고, R2, R3a 및 R3b 중 적어도 하나는 비치환된 C1-C6 알킬 또는 할로겐(예를 들어, R2는 비치환된 C1-C6 알킬이고, R3a 및 R3b는 각각 H이거나; R2는 H이고, R3a 및 R3b 중 하나 또는 둘 다는 할로겐 또는 비치환된 C1-C6 알킬임)이다. 일 실시 형태에서, 절단가능한 링커 또는 L은 ("AOL" 링커 부분)를 포함한다.
본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드의 일부 실시 형태에서, 핵산염기 (화학식 (I)에서 "B")는 퓨린(아데닌 또는 구아닌), 데아자 퓨린 또는 피리미딘(예를 들어, 시토신, 티민 또는 우라실)이다. 추가의 일부 실시 형태에서, 데아자 퓨린은 7-데아자 퓨린(예를 들어, 7-데아자 아데닌 또는 7-데아자 구아닌)이다. B의 비제한적인 예는 , , , , , 또는 , 또는 이들의 임의로 치환된 유도체 및 유사체를 포함한다. 추가의 일부 실시 형태에서, 표지된 핵산염기는 구조
본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드의 일부 실시 형태에서, 리보스 또는 데옥시리보스 부분은 3'-OH 블로킹기를 포함한다(즉, 화학식 (I)의 R5는 3'-OH 블로킹기임). 일부 실시 형태에서, 3'-OH 블로킹기 또는 R5는 이고, 여기서 Ra, Rb, Rc, Rd 및 Re는 각각 독립적으로 H, 할로겐, 비치환 또는 치환된 C1-C6 알킬, 또는 C1-C6 할로알킬이다. 추가의 일부 실시 형태에서, Ra 및 Rb는 각각 H이고, Rc, Rd 및 Re 중 적어도 하나는 독립적으로 할로겐(예를 들어, 플루오로, 클로로) 또는 비치환된 C1-C6 알킬(예를 들어, 메틸, 에틸, 아이소프로필, 아이소부틸 또는 t-부틸)이다. 예를 들어, Rc는 비치환된 C1-C6 알킬이고, Rd 및 Re는 각각 H이다. 다른 예에서, Rc는 H이고, Rd 및 Re 중 하나 또는 둘 다는 할로겐 또는 비치환된 C1-C6 알킬이다. R5의 다른 비제한적인 실시 형태는 , , , , , 또는 를 포함한다. 일 실시 형태에서, R5는 이고, 3' 산소와 함께, 리보스 또는 데옥시리보스 부분의 3' 탄소 원자에 부착된 ("AOM") 기를 형성한다. 다른 실시 형태에서, 3'-OH 블로킹기 또는 R5는 아지도 부분(예를 들어, -CH2N3 또는 아지도메틸)을 포함할 수 있다. 3'-OH 블로킹기의 추가의 실시 형태는 전체적으로 본 명세서에 참고로 포함되는 미국 특허 공개 제2020/0216891 A1호에 기재되어 있으며, 리보스 또는 데옥시리보스 부분의 3' 탄소 원자에 부착된 , , 및 와 같은 3' 아세탈 블로킹기의 추가의 예를 포함한다.
본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드의 일부 다른 실시 형태에서, 화학식 (I)의 R5는 포스포르아미다이트이다. 이러한 실시 형태에서, R6는 산 절단가능한 하이드록시 보호기이며, 이는 자동화 합성 조건 하에서 후속 단량체 커플링을 가능하게 한다.
본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드의 일부 실시 형태에서, L1은 존재하고, L1은 프로파르길아민, 프로파르길아미드, 알릴아민, 알릴아미드 및 이들의 임의로 치환된 변이체로 이루어진 군으로부터 선택되는 부분을 포함한다. 추가의 일부 실시 형태에서, L1은 , ,, , , , 또는 를 포함하거나 이것들이다. 추가의 일부 실시 형태에서, 별표 *는 핵산염기에 대한 L1의 부착점(예를 들어, 피리미딘 염기의 C5 위치 또는 7-데아자 퓨린 염기의 C7 위치)을 나타낸다.
일부 실시 형태에서, 본 명세서에 기재된 뉴클레오티드는 완전 작용화된 뉴클레오티드(ffN)이고, 본 명세서에 기재된 3'-OH 블로킹기 및 본 명세서에 기재된 절단가능한 링커를 통해 핵산염기에 공유 결합된 염료 화합물을 포함하며, 상기 절단가능한 링커는 구조 , , 또는 의 L1을 포함하고, *는 핵산염기에 대한 L1의 부착점(예를 들어, 시토신, 티민 또는 우라실 염기의 C5 위치, 또는 7-데아자 아데닌 또는 7-데아자 구아닌의 C7 위치)을 나타낸다. 어떤 경우에는, 본 명세서에 기재된 알릴아민 또는 알릴아미드 링커를 갖는 ffN은 ffN-DB 또는 ffN-(DB)이라고도 하며, 여기서 "DB"는 링커 부분의 이중 결합을 나타낸다. 어떤 경우에는, 하나 이상의 ffN이 ffN-DB인 ffN 세트(ffA, ffT, ffC 및 ffG 포함)를 사용한 시퀀싱 런은 본 명세서에 기재된 프로파르길아민 또는 프로파르길아미드 링커 부분(ffN-PA 또는 ffN-(PA)로도 알려짐)을 갖는 ffN 세트와 비교하여, ffN의 우수한 도입률을 제공한다. 예를 들어, 본 명세서에 기재된 알릴아민 또는 알릴아미드 링커 부분 및 3'-AOM 블로킹기를 갖는 ffN-DB 세트는 동일한 기간 동안 동일한 조건에서 3'-O-아지도메틸 블로킹기를 갖는 ffN-PA 세트와 비교하여, 도입률을 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 300%, 400% 또는 500% 향상시켜, 위상화 값을 향상시킬 수 있다. 다른 실시 형태에서, 도입률/도입 속도는 기질(예를 들어, 플로우 셀 또는 cBot 시스템) 표면의 표면 동역학 Vmax로 측정된다. 예를 들어, 3'-AOM 블로킹기를 갖는 ffN-DB 세트는 동일한 기간 동안 동일한 조건에서 3'-O-아지도메틸 블로킹기를 갖는 ffN-PA 세트와 비교하여, Vmax 값(ms-1)을 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 300%, 400% 또는 500% 향상시킬 수 있다. 일부 실시 형태에서, 도입률/도입 속도는 주위 온도에서 또는 주위 온도 미만의 온도(예컨대, 4 내지 10℃)에서 측정된다. 다른 실시 형태에서, 도입률/도입 속도는 고온, 예컨대 40℃, 45℃, 50℃, 55℃, 60℃ 또는 65℃에서 측정된다. 일부 그러한 실시 형태에서, 도입률/도입 속도는 염기성 pH 환경, 예를 들어 pH 9.0, 9.2, 9.4, 9.6, 9.8 또는 10.0의 용액에서 측정된다. 일부 그러한 실시 형태에서, 도입률/도입 속도는 효소, 예컨대 폴리머라제(예를 들어, DNA 폴리머라제), 터미널 데옥시뉴클레오티딜 트랜스퍼라제 또는 역전사효소의 존재에 의해 측정된다. 일부 실시 형태에서, ffN-DB는 ffT-DB, ffC-DB 또는 ffA-DB이다. 일 실시 형태에서, 본 명세서에 기재된 위상화 값이 개선된 ffN-DB 세트는 ffT-DB, ffC, ffA 및 ffG를 포함한다. 다른 실시 형태에서, 본 명세서에 기재된 위상화 값이 개선된 ffN-DB 세트는 ffT-DB, ffC-DB, ffA 및 ffG를 포함한다. 또 다른 실시 형태에서, 본 명세서에 기재된 위상화 값이 개선된 ffN-DB 세트는 ffT-DB, ffC-DB, ffA-DB 및 ffG를 포함한다.
추가의 일부 실시 형태에서, 본 명세서서에 기재된 뉴클레오티드의 핵산염기가 티민 또는 이의 임의로 치환된 유도체 및 유사체인 경우(즉, 뉴클레오티드가 T임), L1은 알릴아민 부분 또는 알릴아미드 부분, 또는 이들의 임의로 치환된 변이체를 포함한다. 특정 예에서, L1은 , , 또는 를 포함하거나 이것들이고, *는 티민 염기의 C5 위치에 대한 L1의 부착점을 나타낸다. 일부 실시 형태에서, 본 명세서에 기재된 T 뉴클레오티드는 티민 염기의 C5 위치에 직접 부착된 , , 또는 를 포함하는 절단가능한 링커를 통해 염료 분자로 표지된 완전 작용화된 T 뉴클레오티드(ffT) (즉, ffT-DB)이다. 어떤 경우에는, ffT-DB가 팔라듐 촉매의 존재 하에 시퀀싱 응용에 사용되는 경우, 위상화, 전위상화 및 에러율과 같은 시퀀싱 메트릭스를 크게 개선시킬 수 있다. 예를 들어, 본 명세서에 기재된 3'-AOM 블로킹기를 갖는 ffT-DB가 사용되는 경우, 3'-O-아지도메틸 블로킹기를 갖는 표준 ffT-PA가 사용되는 경우와 비교하여, 본 명세서에 기재된 하나 이상의 시퀀싱 메트릭스를 적어도 50%, 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500%, 2000%, 2500% 또는 3000% 개선시킬 수 있다.
본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드의 추가의 일부 실시 형태는 화학식 (Ia), (Ia'), (Ib), (Ic), (Ic') 또는 (Id)를 갖는 것을 포함한다:
본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드의 추가의 일부 실시 형태에서, L2는 존재하며, L2는 , 또는 를 포함하고, 여기서 n 및 m은 각각 독립적으로 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10의 정수이며, 페닐 부분은 임의로 치환된다. 일부 그러한 실시 형태에서, n은 5이고, L2의 페닐 부분은 비치환된다. 추가의 일부 실시 형태에서, m은 4이다.
본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드의 임의의 실시 형태에서, 절단가능한 링커 또는 L1/L2는 추가로 다이설파이드 부분 또는 아지도 부분(예컨대, 또는 ), 또는 이들의 조합을 포함할 수 있다. L1 또는 L2에 도입될 수 있는 링커 부분의 추가의 비제한적인 예는,
본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드의 임의의 실시 형태에서, 뉴클레오시드 또는 뉴클레오티드는 2' 데옥시리보스 부분을 포함한다(즉, 화학식 (I) 및 (Ia)-(Id)의 R4는 H임). 일부 추가의 측면에서, 2' 데옥시리보스는 당 고리의 5' 위치에 1개, 2개 또는 3개의 포스페이트기를 포함한다. 일부 추가의 측면에서, 본 명세서에 기재된 뉴클레오티드는 뉴클레오티드 트라이포스페이트이다(즉, 화학식 (I) 및 화학식 (Ia) 내지 화학식 (Id)의 R6는 트라이포스페이트를 형성함).
본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드의 임의의 실시 형태에서, 검출가능한 표지는 형광 염료를 포함할 수 있다.
본 발명의 추가의 실시 형태는 본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드를 포함하는 올리고뉴클레오티드 또는 폴리뉴클레오티드에 관한 것이다. 예를 들어, 화학식 (Ia')의 뉴클레오티드를 포함하는 올리고뉴클레오티드 또는 폴리뉴클레오티드는 하기 구조를 포함한다:
. 일부 그러한 실시 형태에서, 올리고뉴클레오티드 또는 폴리뉴클레오티드는 주형 또는 표적 폴리뉴클레오티드에 하이브리디제이션된다. 일부 그러한 실시 형태에서, 주형 폴리뉴클레오티드는 고체 지지체에 고정화된다.
본 발명의 추가의 실시 형태는 다수의 고정화된 주형 또는 표적 폴리뉴클레오티드의 어레이를 포함하는 고체 지지체에 관한 것이며, 이러한 고정화된 주형 또는 표적 폴리뉴클레오티드의 적어도 일부는 본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드를 포함하는 올리고뉴클레오티드 또는 폴리뉴클레오티드에 하이브리디제이션된다.
본 명세서에 기재된 뉴클레오티드 또는 뉴클레오시드의 임의의 실시 형태에서, 3'-OH 블로킹기 및 절단가능한 링커(및 부착된 표지)는 동일하거나 실질적으로 동일한 화학 반응 조건 하에 제거될 수 있으며, 예를 들어 3'-OH 블로킹기 및 검출가능한 표지는 단일 화학 반응으로 제거될 수 있다. 다른 실시 형태에서, 3'-OH 블로킹기 및 검출가능한 표지는 2개의 별개의 단계에서 제거된다.
일부 실시 형태에서, 본 명세서에 기재된 3' 블로킹된 뉴클레오티드 또는 뉴클레오시드는 종래 기술에 개시된 표준 3'-OH 블로킹기, 예를 들어 3'-O-아지도메틸 보호기로 보호된 동일한 뉴클레오티드 또는 뉴클레오시드와 비교하여, 시퀀싱 응용 중에 저장 또는 시약 핸들링 동안 용액 또는 동결건조된 형태에서 우수한 안정성을 제공한다. 예를 들어, 본 명세서에 개시된 아세탈 블로킹기는 동일한 기간 동안 동일한 조건에서 아지도메틸 보호된 3'-OH와 비교하여, 안정성을 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500%, 2000%, 2500% 또는 3000% 향상시켜, 전위상화 값을 감소시키고, 시퀀싱 리드 길이를 더 길게 할 수 있다. 일부 실시 형태에서, 안정성은 주위 온도에서 또는 주위 온도 미만의 온도(예컨대, 4 내지 10℃)에서 측정된다. 다른 실시 형태에서, 안정성은 고온, 예컨대 40℃, 45℃, 50℃, 55℃, 60℃ 또는 65℃에서 측정된다. 일부 그러한 실시 형태에서, 안정성은 염기성 pH 환경, 예를 들어 pH 9.0, 9.2, 9.4, 9.6, 9.8 또는 10.0의 용액에서 측정된다. 일부 그러한 실시 형태에서, 안정성은 효소, 예컨대 폴리머라제(예를 들어, DNA 폴리머라제), 터미널 데옥시뉴클레오티딜 트랜스퍼라제 또는 역전사효소의 존재 유무에 관계없이 측정된다.
일부 실시 형태에서, 본 명세서에 기재된 3' 블로킹된 뉴클레오티드 또는 뉴클레오시드는 종래 기술에 개시된 표준 3'-OH 블로킹기, 예를 들어 3'-O-아지도메틸 보호기로 보호된 동일한 뉴클레오티드 또는 뉴클레오시드와 비교하여, 시퀀싱 응용의 화학 절단 단계 동안 용액에서 우수한 디블로킹률(deblocking rate)을 제공한다. 예를 들어, 본 명세서에 개시된 아세탈 블로킹기는 표준 디블로킹 시약(예컨대, 트리스(하이드록시프로필)포스핀)을 사용한 아지도메틸 보호된 3'-OH와 비교하여, 디블로킹률을 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500% 또는 2000% 향상시켜, 시퀀싱 사이클의 전체 시간을 감소시킬 수 있다. 일부 실시 형태에서, 디블로킹률은 주위 온도에서 또는 주위 온도 미만의 온도(예컨대, 4 내지 10℃)에서 측정된다. 다른 실시 형태에서, 디블로킹률은 고온, 예컨대 40℃, 45℃, 50℃, 55℃, 60℃ 또는 65℃에서 측정된다. 일부 그러한 실시 형태에서, 디블로킹률은 염기성 pH 환경, 예를 들어 pH 9.0, 9.2, 9.4, 9.6, 9.8 또는 10.0의 용액에서 측정된다. 일부 그러한 실시 형태에서, 디블로킹 시약 대 기질(즉, 3' 블로킹된 뉴클레오시드 또는 뉴클레오티드)의 몰비는 약 10:1, 약 5:1, 약 2:1 또는 약 1:1이다.
일부 실시 형태에서, 팔라듐 디블로킹 시약(예를 들어, Pd(0))은 3' 아세탈 블로킹기(예를 들어, AOM 블로킹기)를 제거하는데 사용된다. Pd는 AOM기의 2개의 산소 원자뿐만 아니라, 알릴기의 이중 결합과 킬레이트화 착물을 형성하여, 작용기 바로 근처에 있는 디블로킹 시약을 제거할 수 있으며, 디블로킹률을 가속화할 수 있다. 예를 들어, 화학식 (Ia), (Ia'), (Ib), (Ic), (Ic') 또는 (Id)를 갖는 본 명세서에 기재된 도입된 뉴클레오티드의 링커 및 3' 블로킹기의 Pd 절단 후에, 카피 폴리뉴클레오티드 상의 나머지 링커 작제물은 다음 구조를 포함할 수 있다:
(Ia-1), (Ia'-1), (Ib-1), (Ic-1), (Ic'-1) 또는 (Id-1). 구불구불한 선은 카피 폴리뉴클레오티드 가닥의 나머지 포스포다이에스테르 결합에 대한 산소의 부착을 나타낸다. 예를 들어,
알릴 아미도 또는 프로파르길 아미도 부분은 추가로 Pd 촉매에 의해 절단될 수 있다. 또한, 검출가능한 표지에 부착된 나머지 링커 작제물은 하기 구조를 갖는다:
절단가능한 링커의 절단 조건
본 명세서에 기재된 절단가능한 링커는 다양한 화학적 조건 하에서 제거되거나 절단될 수 있다. 비제한적인 절단 조건은 수용성 포스핀 리간드, 예를 들어 트리스(하이드록시프로필)포스핀(THP 또는 THPP) 또는 트리스(하이드록시메틸)포스핀(THMP)의 존재 하에서의 팔라듐 촉매, 예컨대 Pd(II) 착물(예를 들어, Pd(OAc)2 , 알릴Pd(II) 클로라이드 이량체[(알릴)PdCl]2 또는 Na2PdCl4)을 포함한다. 일부 실시 형태에서, 3' 아세탈 블로킹기는 절단가능한 링커에 대한 것과 동일하거나 실질적으로 동일한 절단 조건 하에서 절단될 수 있다.
팔라듐 촉매
일부 실시 형태에서, 본 명세서에 기재된 3' 아세탈 블로킹기 및 절단가능한 링커는 팔라듐 촉매에 의해 절단될 수 있다. 일부 그러한 실시 형태에서, Pd 촉매는 수용성이다. 일부 그러한 실시 형태에서, Pd 촉매는 Pd(0) 착물(예를 들어, 트리스(3,3',3"-포스피니딘트리스(벤젠설포네이토)팔라듐(0) 9나트륨염 9수화물))이다. 일부 경우에, Pd(0) 착물은 알켄, 알코올, 아민, 포스핀, 또는 금속 수소화물과 같은 시약에 의해 Pd(II) 착물의 환원으로부터 계내(in situ)에서 생성될 수 있다. 적절한 팔라듐 공급원은 Pd(CH3CN)2Cl2, [PdCl(알릴)]2, [Pd(알릴)(THP)]Cl, [Pd(알릴)(THP)2]Cl, Pd(OAc)2, Pd(PPh3)4, Pd(dba)2, Pd(Acac)2, PdCl2(COD) 및 Pd(TFA)2를 포함한다. 그러한 일 실시 형태에서, Pd(0) 착물은 Na2PdCl4로부터 계내에서 생성된다. 다른 실시 형태에서, 팔라듐 공급원은 알릴 팔라듐(II) 클로라이드 이량체[(알릴)PdCl]2 또는 [PdCl(C3H5)]2이다. 일부 실시 형태에서, Pd(0) 촉매는 Pd(II) 착물을 포스핀과 혼합함으로써 수용액 중에서 생성된다. 적절한 포스핀은 수용성 포스핀, 예컨대 트리스(하이드록시프로필)포스핀(THP), 트리스(하이드록시메틸)포스핀(THMP), 1,3,5-트라이아자-7-포스파아다만탄(PTA), 비스(p-설포네이토페닐)페닐포스핀 2수화물 칼륨염, 트리스(카르복시에틸)포스핀(TCEP) 및 트라이페닐포스핀-3,3',3"-트라이설폰산 삼나트륨염을 포함한다.
일부 실시 형태에서, 팔라듐 촉매는 계내에서 [(알릴)PdCl]2를 THP와 혼합함으로써 제조된다. [(알릴)PdCl]2와 THP의 몰비는 약 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 또는 1:10일 수 있다. 일 실시 형태에서, [(알릴)PdCl]2 대 THP의 몰비는 1:10이다. 일부 다른 실시 형태에서, 팔라듐 촉매는 계내에서 수용성 Pd 시약 Na2PdCl4를 THP와 혼합함으로써 제조된다. Na2PdCl4와 THP의 몰비는 약 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 또는 1:10일 수 있다. 일 실시 형태에서, Na2PdCl4 대 THP의 몰비는 약 1:3이다. 다른 실시 형태에서, Na2PdCl4 대 THP의 몰비는 약 1:3.5이다. 추가의 일부 실시 형태에서, 아스코르브산 또는 이의 염(예를 들어, 아스코르브산 나트륨)과 같은 하나 이상의 환원제가 첨가될 수 있다. 일부 실시 형태에서, 절단 혼합물은 추가의 완충 시약, 예컨대 일차 아민, 이차 아민, 삼차 아민, 천연 아미노산, 비천연 아미노산, 카르보네이트염, 포스페이트염 또는 보레이트염, 또는 이들의 조합을 함유할 수 있다. 추가의 일부 실시 형태에서, 완충 시약은 에탄올아민(EA), 트리스(하이드록시메틸)아미노메탄(Tris), 글리신, 탄산나트륨, 인산나트륨, 붕산나트륨, 다이메틸에탄올아민(DMEA), 다이에틸에탄올아민(DEEA), N,N,N',N'-테트라메틸에틸렌다이아민(TMEDA), N,N,N',N'-테트라에틸에틸렌다이아민(TEEDA) 또는 2-피페리딘 에탄올, 또는 이들의 조합을 포함한다. 일 실시 형태에서, 하나 이상의 완충 시약은 DEEA를 포함한다. 다른 실시 형태에서, 하나 이상의 완충 시약은 하나 이상의 무기염, 예컨대 카르보네이트염, 포스페이트염 또는 보레이트염, 또는 이들의 조합을 함유한다. 일 실시 형태에서, 무기염은 나트륨염이다.
다른 실시 형태에서, 절단가능한 링커의 절단 조건은 3'-OH 블로킹기의 절단 조건과 상이하다. 예를 들어, 3' 블로킹기가 3'-O-아지도메틸인 경우, -CH2N3 부분은 포스핀에 의해 아미노기로 전환될 수 있다. 대안적으로, -CH2N3 중의 아지도기는 이러한 분자를 티올, 특히 다이티오트레이톨(DTT)과 같은 수용성 티올과 접촉시켜 아미노기로 전환될 수 있다. 일 실시 형태에서, 포스핀은 THP이다.
선형화와의 적합성
핵산 시퀀싱 반응의 처리량을 최대화하기 위해, 다수의 주형 분자를 병행하여 시퀀싱할 수 있는 것이 유리하다. 다수의 주형의 병행 처리는 핵산 어레이 기술을 사용하여 달성될 수 있다. 이러한 어레이는 전형적으로 고체 지지체 재료 상에 고정된 폴리뉴클레오티드의 고밀도 매트릭스로 구성된다.
WO 98/44151 및 WO 00/18957은 모두, 복수의 동일한 고정된 폴리뉴클레오티드 가닥 및 복수의 동일한 고정된 상보적 가닥으로부터 형성된 클러스터 또는 "콜로니"로 구성된 어레이를 형성하기 위해 증폭 산물이 고체 지지체 상에 고정되도록 하는 핵산 증폭 방법을 기술한다. 이러한 유형의 어레이는 본 명세서에서 "클러스터링된 어레이"로 지칭된다. 이들 방법에 따라 제조된 클러스터링된 어레이 상의 DNA 콜로니에 존재하는 핵산 분자는, 예를 들어 WO 98/44152에 기재된 바와 같이, 시퀀싱 반응을 위한 주형을 제공할 수 있다. WO 98/44151 및 WO 00/18957에 기재된 것과 같은 고상 증폭 반응의 산물은 고정된 폴리뉴클레오티드 가닥과 고정된 상보적 가닥 쌍의 어닐링에 의해 형성된 소위 "가교된" 구조이며, 두 가닥은 모두 5' 말단에서 고체 지지체에 부착된다. 핵산 시퀀싱에 더욱 적합한 주형을 제공하기 위해, "가교된" 구조에서 고정된 가닥 중 하나의 실질적으로 전부 또는 적어도 일부를 제거하여, 적어도 부분적으로 단일 가닥인 주형을 생성하는 것이 바람직하다. 따라서, 단일 가닥인 주형의 부분은 시퀀싱 프라이머에 대한 하이브리디제이션에 사용가능할 것이다. "가교된" 이중 가닥 핵산 구조에서 고정된 하나의 가닥 전체 또는 일부를 제거하는 과정은 "선형화"로 지칭된다. 효소적 절단, 광화학적 절단 또는 화학적 절단을 포함하지만 이에 한정되지 않는 다양한 선형화 방법이 있다. 선형화 방법의 비제한적인 예는 전체적으로 참고로 포함되는 국제 특허 공개 제WO 2007/010251호, 미국 특허 공개 제2009/0088327호, 미국 특허 공개 제2009/0118128호 및 미국 특허 공개 제2019/0352327호에 개시되어 있다.
특히, 증폭(예를 들어, 브릿지 증폭 또는 배제 증폭)은 다수의 동일한 고정된 표적 폴리뉴클레오티드 가닥 및 다수의 동일한 고정된 상보적 가닥으로부터 형성된 클러스터 또는 "콜로니"로 구성된 어레이를 형성한다. 표적 가닥 및 상보적 가닥은 적어도 부분적으로 이중 가닥 폴리뉴클레오티드 복합체를 형성하고, 두 가닥은 모두 5' 말단에서 고체 지지체에 고정된다. 이중 가닥 폴리뉴클레오티드는 팔라듐 촉매의 수용액과 접촉되며, 이는 적어도 부분적으로 단일 가닥인 주형을 생성하기 위해 알릴 변형된 뉴클레오시드(예를 들어, 알릴 변형된 T 뉴클레오시드)를 포함하는 절단 부위에서 하나의 가닥을 절단하여 하나의 고정된 가닥의 적어도 일부를 제거한다. 따라서, 단일 가닥인 주형의 부분은 SBS의 제1 라운드(리드 1)를 개시하기 위해 시퀀싱 프라이머에 대한 하이브리디제이션에 사용가능할 것이다. 일부 실시 형태에서, 알릴 변형된 뉴클레오시드는 P5 프라이머 서열에 존재한다. 이러한 방법은 이러한 제거 또는 절단이 P5 프라이머 상의 U 위치를 절단하기 위해 효소 USER를 사용하는 효소적 절단 반응에 의해 촉진되는 표준 효소 선형화와 비교하여, 제1 화학적 선형화로 지칭된다.
일부 실시 형태에서, 절단가능한 링커의 절단 및/또는 3'-OH 블로킹기의 탈보호 또는 제거에 대한 조건은 또한 선형화 공정에 적합하다. 추가의 일부 실시 형태에서, 이러한 절단 조건은 Pd 착물 및 포스핀의 사용을 포함하는 화학적 선형화 공정에 적합하다. 일부 실시 형태에서, Pd 착물은 Pd(II) 착물(예를 들어, Pd(OAc)2, [(알릴)PdCl]2 또는 Na2PdCl4)이며, 포스핀(예를 들어, THP)의 존재 하에 계내에서 Pd(0)를 생성한다. P5 프라이머 서열에서 알릴 변형된 T 뉴클레오시드를 절단하기 위해 Pd 촉매를 사용하는 화학적 선형화 공정은 전체적으로 참고로 포함되는 미국 특허 공개 제2019/0352327호에 상세히 설명되어 있다. 추가의 실시 형태에서, 본 명세서에 개시된 Pd 절단 믹스(예를 들어, DEEA를 함유하는 완충액 중의 [Pd(알릴)Cl]2 및 THP)는 제1 화학적 선형화 단계에서 직접 사용될 수 있다. 시약 수 감소로 기기(유체 및 카트리지)를 더욱 단순화할 수 있다.
달리 지시되지 않는 한, 뉴클레오티드에 대한 언급은 또한 뉴클레오시드에 적용 가능하도록 의도된다.
표지된 뉴클레오티드
본 발명의 한 측면에 따라, 기재된 3'-OH 블로킹된 뉴클레오티드는 또한 검출가능한 표지를 포함하며, 이러한 뉴클레오티드는 표지된 뉴클레오티드 또는 완전 작용화된 뉴클레오티드(ffN)라고 한다. 표지(예를 들어, 형광 염료)는 소수성 인력, 이온성 인력 및 공유 결합을 포함하는 다양한 수단에 의해 절단가능한 링커를 통해 컨쥬게이트될 수 있다. 일부 측면에서, 염료는 절단가능한 링커를 통해 공유 결합에 의해 뉴클레오티드에 컨쥬게이트될 수 있다. 일부 경우에, 그러한 표지된 뉴클레오티드는 "변형된 뉴클레오티드"로도 지칭된다. 당업자는 표지가 표지의 작용기(예를 들어, 카르복실)를 링커의 작용기(예를 들어, 아미노)와 반응시킴으로써 링커에 공유 결합될 수 있음을 이해한다.
표지된 뉴클레오시드 및 뉴클레오티드는, 비제한적인 예로서, PCR 증폭, 등온 증폭, 고체상 증폭, 폴리뉴클레오티드 시퀀싱(예를 들어, 고체상 시퀀싱), 닉 번역(nick translation) 반응 등에서와 같이 효소적 합성에 의해 형성된 폴리뉴클레오티드를 표지화하는 데 유용하다.
일부 실시 형태, 염료는 뉴클레오티드 염기를 통해 올리고뉴클레오티드 또는 뉴클레오티드에 공유 결합될 수 있다. 예를 들어, 표지된 뉴클레오티드 또는 올리고뉴클레오티드는 절단가능한 링커 부분을 통해 피리미딘 염기의 C5 위치 또는 7-데아자퓨린 염기의 C7 위치에 부착된 표지를 가질 수 있다.
달리 지시되지 않는 한, 뉴클레오티드에 대한 언급은 또한 뉴클레오시드에 적용 가능하도록 의도된다. 본 출원은 또한 DNA와 관련하여 더욱 상세히 설명될 것이지만, 달리 명시되지 않는 한, 설명은 RNA, PNA 및 다른 핵산에도 적용될 것이다.
뉴클레오시드 및 뉴클레오티드는 당 또는 핵산염기 상의 부위에 표지될 수 있다. 당업계에 알려진 바와 같이, "뉴클레오티드"는 질소성 염기(nitrogenous base), 당 및 하나 이상의 포스페이트기로 이루어진다. RNA에서, 당은 리보스이고, DNA에서는 데옥시리보스, 즉, 리보스에 존재하는 하이드록시기가 결여되어 있는 당이다. 질소성 염기는 퓨린 또는 피리미딘의 유도체이다. 퓨린은 아데닌(A) 및 구아닌(G)이고, 피리미딘은 시토신(C) 및 티민(T), 또는 RNA와 관련해서는, 우라실(U)이다. 데옥시리보스의 C-1 원자는 피리미딘의 N-1 또는 퓨린의 N-9에 결합된다. 뉴클레오티드는 또한 뉴클레오시드의 포스페이트 에스테르이며, 이때 에스테르화는 당의 C-3 또는 C-5에 부착된 하이드록시기에서 발생한다. 뉴클레오티드는 통상 모노, 다이 또는 트라이포스페이트이다.
"뉴클레오시드"는 뉴클레오티드와 구조적으로 유사하지만 포스페이트 부분이 결여되어 있다. 뉴클레오시드 유사체의 한 예는 표지가 염기에 연결되어 있고 당 분자에 부착된 포스페이트기가 없는 것일 것이다.
염기는 통상 퓨린 또는 피리미딘으로 지칭되지만, 당업자는 왓슨-크릭 염기쌍 형성(Watson-Crick base pairing)을 거치는 뉴클레오티드 또는 뉴클레오시드의 능력을 변경시키지 않는 유도체 및 유사체가 이용가능하다는 것을 인식할 것이다. "유도체" 또는 "유사체"는, 코어 구조가 모 화합물의 코어 구조와 동일하거나 근접하게 유사하지만, 예를 들어 유도체 뉴클레오티드 또는 뉴클레오시드가 다른 분자에 연결될 수 있게 하는 상이한 또는 추가적인 측기와 같은 화학적 또는 물리적 변형을 갖는 화합물 또는 분자를 의미한다. 예를 들어, 염기는 데아자퓨린일 수 있다. 특정 실시 형태에서, 유도체는 왓슨-크릭 쌍형성을 거칠 수 있어야 한다. "유도체" 및 "유사체"는 또한, 예를 들어, 변형된 염기 부분 및/또는 변형된 당 부분을 갖는 합성 뉴클레오티드 또는 뉴클레오시드 유도체를 포함한다. 그러한 유도체 및 유사체는, 예를 들어 문헌[Scheit, Nucleotide analogs (John Wiley & Son, 1980) 및 Uhlman et al., Chemical Reviews 90:543-584, 1990]에 논의되어 있다. 뉴클레오티드 유사체는 또한 포스포로티오에이트, 포스포로다이티오에이트, 알킬-포스포네이트, 포스포르아닐리데이트, 포스포르아미다이트 결합 등을 포함한 변형된 포스포다이에스테르 결합을 포함할 수 있다.
특정 실시 형태에서, 표지된 뉴클레오시드 또는 뉴클레오티드는 효소적으로 도입가능하고 효소적으로 신장가능할 수 있다. 따라서, 링커 부분은 화합물이 핵산 복제 효소에 의한 뉴클레오티드의 전체적인 결합 및 인식을 크게 방해하지 않도록 뉴클레오티드를 화합물에 연결하기에 충분한 길이를 가질 수 있다. 따라서, 링커는 또한 스페이서 단위를 포함할 수 있다. 스페이서는, 예를 들어 절단 부위 또는 표지로부터 뉴클레오티드 염기를 이격시킨다.
본 발명은 또한 염료 화합물을 도입시킨 폴리뉴클레오티드를 포함한다. 그러한 폴리뉴클레오티드는 포스포다이에스테르 결합으로 연결된 데옥시리보뉴클레오티드들 또는 리보뉴클레오티드들로 각각 구성된 DNA 또는 RNA일 수 있다. 폴리뉴클레오티드는 본 명세서에 기재된 바와 같은 적어도 하나의 변형된(예를 들어, 염료 화합물로 표지된) 뉴클레오티드와 조합된, 본 명세서에 기재된 표지된 뉴클레오티드 이외의 천연 발생 뉴클레오티드, 비천연 발생(또는 변형된) 뉴클레오티드, 또는 이들의 임의의 조합을 포함할 수 있다. 본 발명에 따른 폴리뉴클레오티드는 또한 비천연 골격 결합 및/또는 비-뉴클레오티드 화학적 변형을 포함할 수 있다. 적어도 하나의 표지된 뉴클레오티드를 포함하는 리보뉴클레오티드 및 데옥시리보뉴클레오티드의 혼합물로 구성된 키메라 구조가 또한 고려된다.
본 명세서에 기재된 바와 같은 비제한적인 예시적인 표지된 뉴클레오티드는 하기를 포함한다:
여기서, L은 절단가능한 링커(임의로 본 명세서에 기재된 L2를 포함함)를 나타내고, R은 상술한 바와 같은 리보스 또는 데옥시리보스 부분, 또는 1개, 2개 또는 3개의 포스페이트로 치환된 5' 위치를 갖는 리보스 또는 데옥시리보스 부분을 나타낸다.
일부 실시 형태에서, 비제한적인 예시적인 형광 염료 컨쥬게이트가 하기에 나타나 있다:
여기서, PG는 본 명세서에 기재된 3'-OH 블로킹기를 나타내고; n은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10의 정수이며; k는 0, 1, 2, 3, 4 또는 5이다. 일 실시 형태에서, -O-PG는 AOM이다. 다른 실시 형태에서, -O-PG는 -O-아지도메틸이다. 일 실시 형태에서, n은 5이다. 는 링커 부분의 아미노기와 염료의 카르복실기 사이의 반응의 결과로서 염료와 절단가능한 링커의 연결점을 지칭한다.
시퀀싱 방법
본 발명에 따른 표지된 뉴클레오티드 또는 뉴클레오시드는 단독으로의 것이든, 더 큰 분자 구조 또는 컨쥬게이트에 도입되거나 그와 회합된 것이든 어느 것이든 간에, 뉴클레오티드 또는 뉴클레오시드에 부착된 형광 표지의 검출을 포함하는 방법과 같은 임의의 분석 방법에 사용될 수 있다. 이와 관련하여, 용어 "폴리뉴클레오티드에 도입된"은 5' 포스페이트가, 자체가 더 긴 폴리뉴클레오티드 사슬의 일부를 형성할 수 있는 제2(변형된 또는 비변형된) 뉴클레오티드의 3'-OH기에 포스포다이에스테르 결합으로 연결된 것을 의미할 수 있다. 본 명세서에 기재된 뉴클레오티드의 3' 말단은 추가의(변형된 또는 비변형된) 뉴클레오티드의 5' 포스페이트에 포스포다이에스테르 결합으로 연결될 수 있거나 연결되지 않을 수 있다. 따라서, 비제한적인 일 실시 형태에서, 본 발명은 폴리뉴클레오티드에 도입되는 뉴클레오티드를 검출하는 방법을 제공하며, 상기 방법은 (a) 본 발명의 적어도 하나의 뉴클레오티드를 폴리뉴클레오티드에 도입시키는 단계, 및 (b) 상기 뉴클레오티드(들)에 부착된 검출가능한 표지(예를 들어, 형광 화합물)로부터의 형광 신호를 검출함으로써 상기 폴리뉴클레오티드에 도입된 상기 뉴클레오티드(들)를 검출하는 단계를 포함한다. 이 방법은, 본 발명에 따른 하나 이상의 뉴클레오티드를 폴리뉴클레오티드에 도입시키는 합성 단계 (a) 및 상기 폴리뉴클레오티드에 도입된 하나 이상의 뉴클레오티드(들)를 그들의 형광을 검출하거나 정량적으로 측정함으로써 검출하는 검출 단계 (b)를 포함할 수 있다.
본 발명의 추가의 측면은 시퀀싱 반응에서 표적 단일 가닥 폴리뉴클레오티드에 상보적인 성장하는 폴리뉴클레오티드를 제조하는 방법으로서, 본 명세서에 기재된 뉴클레오티드를 성장하는 상보적 폴리뉴클레오티드에 도입하는 단계를 포함하며, 상기 뉴클레오티드의 도입은 성장하는 상보적 폴리뉴클레오티드에 임의의 후속 뉴클레오티드가 도입되는 것을 방지하는 방법에 관한 것이다.
본 발명의 일부 실시 형태는,
(a) 본 명세서에 기재된 3'-OH 블로킹기 (3' 산소에 부착됨) 및 본 명세서에 기재된 검출가능한 표지를 포함하는 뉴클레오티드(예를 들어, dATP, dCTP, dGTP, dTTP 또는 dUTP)를 표적 폴리뉴클레오티드 가닥의 적어도 일부에 상보적인 카피 폴리뉴클레오티드 가닥에 도입하는 단계;
(b) 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드의 동일성을 검출하는 단계; 및
(c) 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드로부터 표지 및 3'-OH 블로킹기를 화학적으로 제거하는 단계를 포함하는, 표적 단일 가닥 폴리뉴클레오티드의 서열을 결정하는 방법에 관한 것이다.
일부 실시 형태에서, 시퀀싱 방법은 추가로, (d) 절단 후 세척 용액을 사용하여, 화학적으로 제거된 표지 및 3'-OH 블로킹기를 카피 폴리뉴클레오티드 가닥으로부터 씻어내는 단계를 포함한다. 일부 그러한 실시 형태에서, 3'-OH 블로킹기 및 검출가능한 표지는 다음 상보적 뉴클레오티드를 도입하기 전에 제거된다. 일부 실시 형태에서, 세척 단계 (d)는 또한 도입되지 않은 뉴클레오티드를 제거한다. 다른 실시 형태에서, 상기 방법은 단계 (b) 전에 카피 폴리뉴클레오티드 가닥으로부터 도입되지 않은 뉴클레오티드를 세척하는 별도의 세척 단계를 포함할 수 있다.
일부 실시 형태에서, 단계 (a) 내지 단계 (d)는 표적 폴리뉴클레오티드 가닥의 부분의 서열이 결정될 때까지 반복된다. 일부 그러한 실시 형태에서, 단계 (a) 내지 단계 (d)는 적어도 50회, 적어도 75회, 적어도 100회, 적어도 150회, 적어도 200회, 적어도 250회 또는 적어도 300회 반복된다.
도입 믹스
본 명세서에 기재된 방법의 일부 실시 형태에서, 도입 단계로도 지칭되는 단계 (a)는 하나 이상의 뉴클레오티드(예를 들어, dATP, dCTP, dGTP, 및 dTTP 또는 dUTP)를 함유하는 혼합물을 폴리머라제 및 하나 이상의 완충제를 포함하는 도입 용액 중에서 카피 폴리뉴클레오티드/표적 폴리뉴클레오티드 복합체와 접촉시키는 단계를 포함한다. 일부 그러한 실시 형태에서, 폴리머라제는 DNA 폴리머라제, 예를 들어, Pol 812, Pol 1901, Pol 1558 또는 Pol 963이다. Pol 812, Pol 1901, Pol 1558 또는 Pol 963 DNA 폴리머라제의 아미노산 서열은 예를 들어, 본 명세서에 참고로 포함되는 미국 특허 공개 제2020/0131484 A1호 및 제2020/0181587 A1호에 기재되어 있다. 일부 실시 형태에서, 하나 이상의 완충제는 일차 아민, 이차 아민, 삼차 아민, 천연 아미노산 또는 비천연 아미노산, 또는 이들의 조합을 포함한다. 추가의 실시 형태에서, 완충제는 에탄올아민 또는 글리신, 또는 이들의 조합을 포함한다. 일 실시 형태에서, 완충제는 글리신을 포함하거나, 글리신이다. 일부 실시 형태에서, 도입 믹스에 글리신을 사용하면, 동일한 조건에서 에탄올아민(EA)과 같은 표준 완충제와 비교하여, 위상화 값을 향상시킬 수 있다. 예를 들어, 글리신의 사용은 동일한 조건 하에서 사용된 에탄올아민과 비교하여, 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 300%, 400% 또는 500% 저하 또는 감소된 위상화 값을 제공한다. 어떤 경우에는, 글리신의 사용은 적어도 50회 사이클의 SBS 시퀀싱 런에서 약 0.15%, 0.1%, 0.09%, 0.08%, 0.07%, 0.06%, 0.05%, 0.04%, 0.03%, 0.02% 또는 0.01% 미만의 % 위상화 값을 제공한다. 추가의 실시 형태에서, 글리신의 사용은 적어도 150회 사이클의 SBS 시퀀싱 런의 리드 1에서 약 0.08% 미만의 % 위상화 값을 제공한다.
절단가능한 믹스
본 명세서에 기재된 방법의 일부 실시 형태에서, 절단 단계로도 지칭되는 단계 (c)는 도입된 뉴클레오티드 및 카피 폴리뉴클레오티드 가닥을 본 명세서에 기재된 팔라듐 촉매를 포함하는 절단 용액과 접촉시키는 것을 포함한다. 일부 그러한 실시 형태에서, 3'-OH 블로킹기 및 검출가능한 표지는 반응의 단일 단계에서 제거된다. 이러한 일 실시 형태에서, 3' 블로킹기는 AOM이며, 절단가능한 링커는 AOL 부분을 포함하며, 이들 둘 다는 화학 반응의 단일 단계에서 제거되거나 절단된다. 추가의 일부 실시 형태에서, 절단 용액(절단 믹스라고도 함)은 본 명세서에 기재된 Pd 촉매를 포함한다.
추가의 일부 실시 형태에서, Pd 촉매는 Pd(0) 촉매이다. 일부 그러한 실시 형태에서, Pd(0)는 계내에서 Pd(II) 시약을 하나 이상의 포스핀 리간드와 혼합함으로써 제조된다. 일부 그러한 실시 형태에서, 팔라듐 촉매는 계내에서 [(알릴)PdCl]2를 THP와 혼합함으로써 제조될 수 있다. [(알릴)PdCl]2와 THP의 몰비는 약 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 또는 1:10일 수 있다. 일 실시 형태에서, [(알릴)PdCl]2 대 THP의 몰비는 1:10이다(즉, Pd:THP의 몰비는 1:5임). 일부 다른 실시 형태에서, 팔라듐 촉매는 계내에서 수용성 Pd(II) 시약 Na2PdCl4를 THP와 혼합함으로써 제조될 수 있다. Na2PdCl4와 THP의 몰비는 약 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 또는 1:10일 수 있다. 일 실시 형태에서, Na2PdCl4 대 THP의 몰비는 약 1:3이다. 다른 실시 형태에서, Na2PdCl4 대 THP의 몰비는 약 1:3.5이다. Pd 촉매의 다른 비제한적인 예에는 Pd(CH3CN)2Cl2가 포함된다.
추가의 일부 실시 형태에서, 아스코르브산 또는 이의 염(예를 들어, 아스코르브산 나트륨)과 같은 하나 이상의 환원제가 첨가될 수 있다. 일부 실시 형태에서, 절단 용액은 하나 이상의 완충 시약, 예컨대 일차 아민, 이차 아민, 삼차 아민, 카르보네이트염, 포스페이트염 또는 보레이트염, 또는 이들의 조합을 함유할 수 있다. 추가의 일부 실시 형태에서, 완충 시약은 에탄올아민(EA), 트리스(하이드록시메틸)아미노메탄(Tris), 글리신, 탄산나트륨, 인산나트륨, 붕산나트륨, 다이메틸에탄올아민(DMEA), 다이에틸에탄올아민(DEEA), N,N,N',N'-테트라메틸에틸렌다이아민(TEMED), N,N,N',N'-테트라에틸에틸렌다이아민(TEEDA) 또는 2-피페리딘 에탄올, 또는 이들의 조합을 포함한다. 일 실시 형태에서, 완충 시약은 DEEA를 포함하거나, DEEA이다. 다른 실시 형태에서, 완충 시약은 하나 이상의 무기염, 예컨대 카르보네이트염, 포스페이트염 또는 보레이트염, 또는 이들의 조합을 함유한다. 일 실시 형태에서, 무기염은 나트륨염이다. 추가의 실시 형태에서, 절단 용액은 팔라듐 (Pd) 촉매(예를 들어, [(알릴)PdCl]2/THP 또는 Na2PdCl4 /THP) 및 본 명세서에 기재된 하나 이상의 완충 시약(예를 들어, 삼차 아민, 예컨대 DEEA)을 함유하며, pH가 약 9.0 내지 약 10.0(예를 들어, 9.6 또는 9.8)이다.
다른 실시 형태에서, 표지 및 3' 블로킹기는 2개의 별개의 화학 반응에서 제거된다. 어떤 경우에는, 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드로부터 표지를 제거하는 것은 도입된 뉴클레오티드를 포함하는 카피 가닥을 본 명세서에 기재된 Pd 촉매를 함유하는 제1 절단 용액과 접촉시키는 것을 포함한다. 어떤 경우에는, 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드로부터 3'-OH 블로킹기를 제거하는 것은 도입된 뉴클레오티드를 포함하는 카피 가닥을 제2 절단 용액과 접촉시키는 것을 포함한다. 일부 그러한 실시 형태에서, 제2 절단 용액은 하나 이상의 포스핀, 예컨대 트라이알킬포스핀을 함유한다. 트라이알킬포스핀의 비제한적인 예에는 트리스(하이드록시프로필)포스핀(THP), 트리스-(2-카르복시에틸)포스핀(TCEP), 트리스(하이드록시메틸)포스핀(THMP) 또는 트리스(하이드록시에틸)포스핀(THEP)이 포함된다. 일 실시 형태에서, 3'-OH 블로킹기는 3'-O-아지도메틸이고, 제2 절단 용액은 THP를 함유한다.
일부 실시 형태에서, 본 명세서에 기재된 절단 용액은 또한 본 명세서에 기재된 이전의 화학적 선형화 단계에서 사용될 수 있다. 특히, 시퀀싱에 대비하여 클러스터링된 폴리뉴클레오티드의 화학적 선형화는 고체 지지체 상에 고정된 이중 가닥 폴리뉴클레오티드의 하나 이상의 제1 가닥의 팔라듐 촉매 절단에 의해 달성되어, 시퀀싱 프라이머에 대한 하이브리디제이션 및 후속 시퀀싱 응용(예를 들어, 합성에 의한 시퀀싱의 제1 라운드(리드 1))에 사용할 수 있게 되는 단일 가닥(또는 적어도 부분적으로 단일 가닥) 주형을 생성한다. 일부 실시 형태에서, 각각의 이중 가닥 폴리뉴클레오티드는 제1 가닥 및 제2 가닥을 포함한다. 제1 가닥은 고체 지지체에 고정된 제1 신장 프라이머를 신장시킴으로써 생성된다. 일부 실시 형태에서, 제1 가닥은 팔라듐 착물(예를 들어, Pd(0) 착물)에 의해 절단될 수 있는 절단 부위를 포함한다. 특정한 실시 형태에서, 절단 부위는 제1 가닥의 제1 신장 프라이머 부분에 위치한다. 추가의 실시 형태에서, 절단 부위는 알릴 작용기를 갖는 티민 뉴클레오시드 또는 뉴클레오티드 유사체를 포함한다. 본 명세서에 기재된 방법의 일부 실시 형태에서, 표적 단일 가닥 폴리뉴클레오티드는 이중 가닥 폴리뉴클레오티드로부터 상보적 가닥을 화학적으로 절단함으로써 형성된다. 추가의 실시 형태에서, 이중 가닥의 상보적 가닥 및 표적 폴리뉴클레오티드는 모두 이들의 5' 말단 상의 고체 지지체에 고정된다. 추가의 일부 실시 형태에서, 상보적 가닥의 화학적 절단은 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드로부터 검출가능한 표지 및 3'-OH 블로킹기를 화학적으로 제거하는 것과 동일한 반응 조건 하에서 수행된다(즉, 본 명세서에 기재된 방법의 단계 (c)). 일 실시 형태에서, 제1 화학적 선형화는 본 명세서에 기재된 동일한 절단 믹스를 이용한다.
팔라듐(Pd) 스캐빈저
Pd는 대부분 비활성 Pd(II) 형태로 DNA에 달라붙는 능력이 있으며, 이는 DNA와 폴리머라제 사이의 결합을 방해하여 위상화를 증가시킬 수 있다. Pd 스캐빈저 화합물을 포함하는 절단 후 세척 조성물은 디블로킹 단계 후에 사용될 수 있다. 예를 들어, 국제 특허 공개 제WO 2020/126593호는 스캔 조성물 및/또는 절단 후 세척 조성물에 포함될 수 있는 3,3'-다이티오다이프로피온산(DDPA) 및 리포산(LA)과 같은 Pd 스캐빈저를 개시하고 있다. 절단 후 세척 용액에서 이러한 스캐빈저를 사용하는 목적은 Pd(0)를 스캐빈징하고, Pd(0)를 비활성 Pd(II) 형태로 전환시켜, 전위상화 값 및 시퀀싱 메트릭스를 개선하고, 신호 열화를 감소시키고, 시퀀싱 리드 길이를 신장시키는 것이다.
본 명세서에 기재된 방법의 일부 실시 형태에서, 방법의 단계 (a)는 폴리머라제, 적어도 하나의 팔라듐 스캐빈저 및 하나 이상의 완충제를 포함하는 도입 용액에서 카피 폴리뉴클레오티드 가닥과 뉴클레오티드를 접촉시키는 것을 포함한다. 일부 실시 형태에서, 도입 용액 중의 Pd 스캐빈저는 Pd(0) 스캐빈저이다. 일부 그러한 실시 형태에서, Pd 스캐빈저는 -O-알릴, -S-알릴, -NR-알릴 및 -N+RR'-알릴로 이루어진 군으로부터 독립적으로 선택되는 하나 이상의 알릴 부분을 포함하며, 여기서 R은 H, 비치환 또는 치환된 C1-C6 알킬, 비치환 또는 치환된 C2-C6 알케닐, 비치환 또는 치환된 C2-C6 알키닐, 비치환 또는 치환된 C6-C10 아릴, 비치환 또는 치환된 5원 내지 10원 헤테로아릴, 비치환 또는 치환된 C3-C10 카르보사이클릴, 또는 비치환 또는 치환된 5원 내지 10원 헤테로사이클릴이고; R'은 H, 비치환된 C1-C6 알킬 또는 치환된 C1-C6 알킬이다.
일부 그러한 실시 형태에서, 도입 용액 중의 Pd(0) 스캐빈저는 하나 이상의 -O-알릴 부분을 포함한다. 추가의 일부 실시 형태에서, Pd(0) 스캐빈저는 , , , ,, , , , , , , , 또는 , 또는 이들의 조합을 포함하거나, 이것들이다. 대체 Pd(0) 스캐빈저는 전체적으로 참고로 포함되는 미국 특허 출원 제63/190983호에 개시되어 있다.
일부 실시 형태에서, 도입 용액 중의 하나 이상의 알릴 부분을 포함하는 Pd(0) 스캐빈저의 농도는 약 0.1 mM 내지 약 100 mM, 0.2 mM 내지 약 75 mM, 약 0.5 mM 내지 약 50 mM, 약 1 mM 내지 약 20 mM, 또는 약 2 mM 내지 약 10 mM이다. 추가의 실시 형태에서, Pd(0) 스캐빈저의 농도는 약 0.5 mM, 1 mM, 1.5 mM, 2 mM, 2.5 mM, 3 mM, 3.5 mM, 4 mM, 4.5 mM, 5 mM, 5.5 mM, 6 mM, 6.5 mM, 7 mM, 7.5 mM, 8 mM, 8.5 mM, 9 mM, 9.5 mM, 10 mM, 12.5 mM, 15 mM, 17.5 mM 또는 20 mM이다. 추가의 실시 형태에서, 도입 용액의 pH는 약 9 내지 10이다.
일부 실시 형태에서, 하나 이상의 알릴 부분을 포함하는 팔라듐 스캐빈저에 대한 팔라듐 촉매(출발 용액 중에서)의 몰비는 약 1:100, 1:50, 1:20, 1:10 또는 1:5이다.
본 명세서에 기재된 방법의 다른 일부 실시 형태에서, 본 명세서에 기재된 하나 이상의 알릴 부분을 포함하는 Pd(0) 스캐빈저는 카피 폴리뉴클레오티드 중의 도입된 뉴클레오티드의 동일성을 검출하기 위해 하나 이상의 형광 측정을 수행할 때 단계 (b)에 사용되는 스캐닝 용액에 존재한다. 또 다른 실시 형태에서, 하나 이상의 알릴 부분을 포함하는 Pd(0) 스캐빈저는 도입 용액 및 스캐닝 용액에 존재할 수 있다.
본 명세서에 기재된 방법의 추가의 일부 실시 형태에서, 절단 후 세척 단계는 표지 및 3' 블로킹기가 제거된 후에 사용된다. 일부 그러한 실시 형태에서, 하나 이상의 팔라듐 스캐빈저는 또한 표지 및 3' 블로킹기의 절단 후에 세척 단계에 사용된다. 추가의 일부 실시 형태에서, 절단 후 세척 용액 중의 하나 이상의 Pd 스캐빈저는 Pd(II) 스캐빈저를 포함한다. 일부 그러한 실시 형태에서, 팔라듐 스캐빈저는 아이소시아노아세테이트(ICNA) 염, 시스테인 또는 이의 염, 또는 이들의 조합을 포함한다. 일 실시 형태에서, 팔라듐 스캐빈저는 칼륨 아이소시아노아세테이트 또는 나트륨 아이소시아노아세테이트를 포함하거나, 이것들이다. 다른 실시 형태에서, 팔라듐 스캐빈저는 시스테인 또는 이의 염(예를 들어, L-시스테인 또는 L-시스테인 HCl염)을 포함하거나, 이것들이다. 절단 후 세척 용액 중의 팔라듐 스캐빈저의 다른 비제한적인 예는 에틸 아이소시아노아세테이트, 메틸 아이소시아노아세테이트, N-아세틸-L-시스테인, 칼륨 에틸잔토게네이트(PEX 또는 KS-C(=S)-OEt), 칼륨 아이소프로필 잔테이트, 글루타티온, 리포산, 에틸렌다이아민테트라아세트산(EDTA), 이미노다이아세트산, 나이트릴로다이아세트산, 트라이메르캅토-S-트라이아진, 다이메틸다이티오카르바메이트, 다이티오트레이톨, 메르캅토에탄올, 알릴 알코올, 프로파르길 알코올, 티올, 삼차 아민 및/또는 삼차 포스핀, 또는 이들의 조합을 포함할 수 있다.
추가의 실시 형태에서, 절단 후 세척 용액 중의 L-시스테인과 같은 Pd(II) 스캐빈저의 농도는 약 0.1 mM 내지 약 100 mM, 0.2 mM 내지 약 75 mM, 약 0.5 mM 내지 약 50 mM, 약 1 mM 내지 약 20 mM, 또는 약 2 mM 내지 약 10 mM이다. 추가의 실시 형태에서, L-시스테인과 같은 Pd(II) 스캐빈저의 농도는 약 1 mM, 2 mM, 3 mM, 4 mM, 5 mM, 6 mM, 6.5 mM, 7 mM, 8 mM, 9 mM, 10 mM, 12.5 mM, 15 mM, 17.5 mM 또는 20 mM이다. 일 실시 형태에서, 절단 후 세척 용액 중의 L-시스테인 또는 이의 염과 같은 Pd(II) 스캐빈저의 농도는 약 10 mM이다.
본 명세서에 기재된 방법의 다른 일부 실시 형태에서, 모든 Pd 스캐빈저(예를 들어, Pd(0) 및 Pd(II) 스캐빈저 둘 다)는 도입 용액 및/또는 스캐닝 용액에 존재하며, 상기 방법은 미량의 잔류 Pd 종을 제거하기 위한 특정 절단 후 세척 단계를 포함하지 않는다.
본 명세서에 기재된 방법의 일부 실시 형태에서, Pd 스캐빈저(예를 들어, 하나 이상의 알릴 부분을 갖는 Pd(0) 스캐빈저)의 사용은 팔라듐 스캐빈저를 사용하지 않고 동일한 조건에서의 동일한 시퀀싱 런과 비교하여, 전위상화 값을 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900% 또는 1000% 감소시킬 수 있다. 일부 그러한 실시 형태에서, Pd(0) 스캐빈저는 적어도 50회 사이클의 SBS 시퀀싱 런에서 시퀀싱 런의 전위상화 값을 약 0.1%, 0.09%, 0.08%, 0.07%, 0.06%, 0.05%, 0.04%, 0.03%, 0.02% 또는 0.01% 미만으로 감소시킬 수 있다. 일부 실시 형태에서, 전위상화 값은 50회 사이클, 75회 사이클, 100회 사이클, 125회 사이클, 150회 사이클, 200회 사이클, 250회 사이클 또는 300회 사이클 후에 측정된 값을 지칭한다.
추가의 일부 실시 형태에서, 팔라듐 스캐빈저(예를 들어, L-시스테인 또는 이의 염과 같은 Pd(II) 스캐빈저)는 팔라듐 스캐빈저를 사용하지 않고 동일한 조건에서의 동일한 시퀀싱 런과 비교하여, 전위상화 값 또는 위상화 값을 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900% 또는 1000% 감소시킬 수 있다. 일부 그러한 실시 형태에서, Pd 스캐빈저의 사용은 적어도 50회 사이클의 SBS 시퀀싱 런에서 약 0.2%, 0.15%, 0.1%, 0.09%, 0.08%, 0.07%, 0.06%, 0.05%, 0.04%, 0.03%, 0.02% 또는 0.01% 미만의 % 위상화 값을 제공한다. 일부 실시 형태에서, 위상화 값은 50회 사이클, 75회 사이클, 100회 사이클, 125회 사이클, 150회 사이클, 200회 사이클, 250회 사이클 또는 300회 사이클 후에 측정된 값을 지칭한다. 추가의 실시 형태에서, 하나 이상의 Pd 스캐빈저의 사용은 적어도 150회 사이클의 SBS 시퀀싱 런의 리드 1에서 약 0.05% 미만의 % 위상화 값을 제공한다.
일부 실시 형태에서, 본 명세서에 기재된 절단 후 세척 용액은 또한 검출 단계(즉, 본 명세서에 기재된 방법의 단계 (b)) 전에 별도의 세척 단계에서 사용되어, 단계 (a)로부터 도입되지 않은 뉴클레오티드를 씻어낼 수 있다.
추가의 일부 실시 형태에서, 도입 단계 (a)에 사용되는 뉴클레오티드는 각각, 본 명세서에 기재된 3' 블로킹기(예를 들어, 3'-AOM) 및 절단가능한 링커(예를 들어, AOL 링커 부분을 포함하는 절단가능한 링커)를 포함하는 완전 작용화된 A, C, T 및 G 뉴클레오티드 트라이포스페이트이다. 일부 그러한 실시 형태에서, 본 발명의 뉴클레오티드는 표준 3'-O-아지도메틸 블로킹기로 보호된 동일한 뉴클레오티드와 비교하여, 시퀀싱 런 동안 용액에서 우수한 안정성을 제공한다. 예를 들어, 본 명세서에 개시된 3' 아세탈 블로킹기는 동일한 기간 동안 동일한 조건에서 아지도메틸 보호된 3'-OH와 비교하여, 안정성을 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500%, 2000%, 2500% 또는 3000% 향상시켜, 전위상화 값을 감소시키고, 시퀀싱 리드 길이를 더 길게 할 수 있다. 일부 실시 형태에서, 안정성은 주위 온도에서 또는 주위 온도 미만의 온도(예컨대, 4 내지 10℃)에서 측정된다. 다른 실시 형태에서, 안정성은 고온, 예컨대 40℃, 45℃, 50℃, 55℃, 60℃ 또는 65℃에서 측정된다. 일부 그러한 실시 형태에서, 안정성은 염기성 pH 환경, 예를 들어 pH 9.0, 9.2, 9.4, 9.6, 9.8 또는 10.0의 용액에서 측정된다. 추가의 일부 실시 형태에서, 본 명세서에 기재된 3' 블로킹된 뉴클레오티드를 사용한 전위상화 값은 SBS의 50회, 100회 또는 150회 사이클을 초과한 후에 약 0.25, 0.24, 0.23, 0.22, 0.21, 0.20, 0.19, 0.18, 0.17, 0.16, 0.15, 0.14, 0.13, 0.12, 0.11, 0.10, 0.09, 0.08, 0.07, 0.06 또는 0.05 미만이다. 추가의 일부 실시 형태에서, 3' 블로킹된 뉴클레오티드를 사용한 위상화 값은 SBS의 50회, 100회 또는 150회 사이클을 초과한 후에 약 0.25, 0.24, 0.23, 0.22, 0.21, 0.20, 0.19, 0.18, 0.17, 0.16, 0.15, 0.14, 0.13, 0.12, 0.11, 0.10, 0.09, 0.08, 0.07, 0.06 또는 0.05 미만이다. 일 실시 형태에서, 각각의 ffN은 3'-AOM 기를 포함한다.
일부 실시 형태에서, 본 명세서에 기재된 3' 블로킹된 뉴클레오티드는 표준 3'-O-아지도메틸 블로킹기로 보호된 동일한 뉴클레오티드와 비교하여, 시퀀싱 런의 화학 절단 단계 동안 용액에서 우수한 디블로킹률을 제공한다. 예를 들어, 본 명세서에 개시된 3' 아세탈(예를 들어, AOM) 블로킹기는 표준 디블로킹 시약(예컨대, 트리스(하이드록시프로필)포스핀)을 사용한 아지도메틸 보호된 3'-OH와 비교하여, 디블로킹률을 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500% 또는 2000% 향상시켜, 시퀀싱 사이클의 전체 시간을 감소시킬 수 있다. 일부 실시 형태에서, 각각의 뉴클레오티드의 디블로킹 시간은 약 5%, 10%, 20%, 30%, 40%, 50% 또는 60% 감소된다. 예를 들어, 3'-AOM 및 3'-O-아지도메틸의 디블로킹 시간은 각각, 특정한 화학 반응 조건 하에서 약 4 내지 5초 및 약 9 내지 10초이다. 일부 실시 형태에서, AOM 블로킹기의 반감기(t 1/2)는 아지도메틸 블로킹기보다 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10배 빠르다. 일부 그러한 실시 형태에서, AOM의 t1/2는 약 1분인 반면에, 아지도메틸의 t1/2는 약 11분이다. 일부 실시 형태에서, 디블로킹률은 주위 온도에서 또는 주위 온도 미만의 온도(예컨대, 4 내지 10℃)에서 측정된다. 다른 실시 형태에서, 디블로킹률은 고온, 예컨대 40℃, 45℃, 50℃, 55℃, 60℃ 또는 65℃에서 측정된다. 일부 그러한 실시 형태에서, 디블로킹률은 염기성 pH 환경, 예를 들어 pH 9.0, 9.2, 9.4, 9.6, 9.8 또는 10.0의 용액에서 측정된다. 일부 그러한 실시 형태에서, 디블로킹 시약 대 기질(즉, 3' 블로킹된 뉴클레오시드 또는 뉴클레오티드)의 몰비는 약 10:1, 약 5:1, 약 2:1, 약 1:1, 약 1:2, 약 1:5 또는 약 1:10이다. 일 실시 형태에서, 각각의 ffN은 3'-AOM 블로킹기 및 AOL 링커 부분을 포함한다.
본 명세서에 기재된 방법의 임의의 실시 형태에서, 표지된 뉴클레오티드는 2' 데옥시리보스를 갖는 뉴클레오티드 트라이포스페이트이다. 본 명세서에 기재된 방법의 임의의 실시 형태에서, 표적 폴리뉴클레오티드 가닥은 고체 지지체, 예컨대 플로우셀에 부착된다.
일 실시 형태에서, 적어도 하나의 뉴클레오티드는 폴리머라제 효소의 작용에 의해 합성 단계에서 폴리뉴클레오티드에 도입된다. 일부 그러한 실시 형태에서, 폴리머라제는 DNA 폴리머라제 Pol 812 또는 Pol 1901일 수 있다. 그러나, 예를 들어 화학적 올리고뉴클레오티드 합성 또는 비표지된 올리고뉴클레오티드에 대한 표지된 올리고뉴클레오티드의 라이게이션과 같은 뉴클레오티드를 폴리뉴클레오티드에 연결하는 다른 방법이 사용될 수 있다. 따라서, 뉴클레오티드 및 폴리뉴클레오티드와 관련하여 사용될 때, 용어 "도입시키는"은 화학적 방법뿐만 아니라 효소적 방법에 의한 폴리뉴클레오티드 합성을 포함할 수 있다.
특정 실시 형태에서, 합성 단계가 수행되며, 임의로 주형 폴리뉴클레오티드 가닥을 본 발명의 표지된 3' 블로킹된 뉴클레오티드를 포함하는 반응 혼합물과 함께 인큐베이션하는 단계를 포함할 수 있다. 폴리머라제는 또한, 주형 폴리뉴클레오티드 가닥에 어닐링된 폴리뉴클레오티드 가닥 상의 유리 3'-OH 기와 뉴클레오티드 상의 5' 포스페이트기 사이의 포스포다이에스테르 결합의 형성을 가능하게 하는 조건 하에서 제공될 수 있다. 따라서, 합성 단계는 주형 가닥에 대한 뉴클레오티드의 상보적 염기쌍 형성에 의해 유도된 바와 같은 폴리뉴클레오티드 가닥의 형성을 포함할 수 있다.
상기 방법의 모든 실시 형태에서, 검출 단계는 표지된 뉴클레오티드가 도입된 폴리뉴클레오티드 가닥이 주형 또는 표적 가닥에 어닐링되는 동안에, 또는 2개의 가닥이 분리되는 변성 단계 후에 수행될 수 있다. 추가의 단계, 예를 들어 화학적 또는 효소적 반응 단계 또는 정제 단계가 합성 단계와 검출 단계 사이에 포함될 수 있다. 특히, 표지된 뉴클레오티드(들)를 도입시킨 표적 가닥은 단리되거나 정제되고, 이어서 추가로 처리되거나 후속 분석에 사용될 수 있다. 예로서, 후속으로, 합성 단계에서의 본 명세서에 기재된 바와 같은 뉴클레오티드(들)로 표지된 표적 폴리뉴클레오티드는 표지된 프로브 또는 프라이머로서 사용될 수 있다. 다른 실시 형태에서, 본 명세서에 기재된 합성 단계의 산물은 추가의 반응 단계를 거칠 수 있으며, 필요하다면, 이들 후속 단계의 산물은 정제되거나 단리될 수 있다.
합성 단계에 적합한 조건은 표준 분자 생물학 기법에 익숙한 자들에게 잘 알려져 있을 것이다. 일 실시 형태에서, 합성 단계는 적절한 폴리머라제 효소의 존재 하에서 본 명세서에 기재된 바와 같은 뉴클레오티드를 포함한 뉴클레오티드 전구체를 사용하여 주형 가닥에 상보적인 신장된 표적 가닥을 형성하는 표준 프라이머 신장 반응과 유사할 수 있다. 다른 실시 형태에서, 합성 단계는 그 자체로서, 표적 폴리뉴클레오티드 가닥 및 주형 폴리뉴클레오티드 가닥의 카피로부터 유도되는 어닐링된 상보적 가닥들로 구성된 표지된 이중 가닥 증폭 산물을 생성하는 증폭 반응의 일부를 형성할 수 있다. 다른 예시적인 합성 단계에는 닉 번역, 가닥 치환 중합, 랜덤 프라이밍된 DNA 라벨링 등이 포함된다. 합성 단계에 특히 유용한 폴리머라제 효소는 본 명세서에 기재된 바와 같은 뉴클레오티드의 도입을 촉진시킬 수 있는 것이다. 다양한 천연 발생 또는 변형된 폴리머라제가 사용될 수 있다. 예로서, 열안정성 폴리머라제가 열사이클링 조건을 사용하여 수행되는 합성 반응에는 사용될 수 있는 반면, 열안정성 폴리머라제는 등온 프라이머 신장 반응에 바람직하지 않을 수 있다. 본 발명에 따른 뉴클레오티드를 도입시킬 수 있는 적절한 열안정성 폴리머라제는 WO 2005/024010 또는 WO 06/120433에 기재된 것들을 포함하며, 이들 각각은 본 명세서에 참고로 포함된다. 37℃와 같은 더 낮은 온도에서 수행되는 합성 반응에서, 폴리머라제 효소는 반드시 열안정성 폴리머라제일 필요는 없으며, 이에 따라 폴리머라제의 선택은 반응 온도, pH, 가닥-치환 활성 등과 같은 다수의 인자에 좌우될 것이다.
구체적인 비제한적인 실시 형태에서, 본 발명은 핵산 시퀀싱 방법, 리시퀀싱(re-sequencing) 방법, 전체 게놈 시퀀싱 방법, 단일 뉴클레오티드 다형 점수화(single nucleotide polymorphism scoring) 방법, 폴리뉴클레오티드에 도입될 때 본 명세서에 기재된 표지된 뉴클레오티드 또는 뉴클레오시드의 검출을 수반하는 임의의 다른 응용을 포함한다. 형광 염료를 포함하는 뉴클레오티드로 표지된 폴리뉴클레오티드의 사용으로 이익을 얻는 임의의 다양한 다른 응용이 본 명세서에 기재된 염료를 갖는 표지된 뉴클레오티드 또는 뉴클레오시드를 사용할 수 있다.
특정 실시 형태에서, 본 발명은 폴리뉴클레오티드 합성에 의한 시퀀싱(SBS) 반응에 있어서의 본 발명에 따른 표지된 뉴클레오티드의 사용을 제공한다. 합성에 의한 시퀀싱은 일반적으로, 시퀀싱하고자 하는 주형 핵산에 상보적인 신장된 폴리뉴클레오티드 사슬을 형성하기 위해 폴리머라제 또는 리가제를 사용하여 5'에서 3' 방향으로 성장하는 폴리뉴클레오티드 사슬에 하나 이상의 뉴클레오티드 또는 올리고뉴클레오티드를 순차적으로 부가하는 것을 수반한다. 부가된 뉴클레오티드(들) 중 하나 이상에 존재하는 염기의 동일성은 검출 또는 "이미징" 단계에서 결정될 수 있다. 부가된 염기의 동일성은 각각의 뉴클레오티드 도입 단계 후에 결정될 수 있다. 이어서, 주형의 서열은 통상적인 왓슨-크릭 염기쌍 형성 규칙을 사용하여 추론될 수 있다. 단일 염기의 동일성의 결정을 위해 본 명세서에 기재된 표지된 뉴클레오티드의 사용은, 예를 들어 단일 뉴클레오티드 다형의 점수화에 유용할 수 있으며, 그러한 단일 염기 신장 반응은 본 발명의 범주 내에 있다.
본 발명의 일 실시 형태에서, 주형 폴리뉴클레오티드의 서열은 도입된 뉴클레오티드(들)에 부착된 형광 표지(들)의 검출을 통해 시퀀싱하고자 하는 주형 폴리뉴클레오티드에 상보적인 신생(nascent) 가닥에로의 하나 이상의 3' 블로킹된 뉴클레오티드의 도입을 검출함으로써 결정된다. 주형 폴리뉴클레오티드의 시퀀싱은 적절한 프라이머를 사용하여 프라이밍될 수 있고(또는 헤어핀의 일부로서 프라이머를 함유할 헤어핀 작제물로서 제조될 수 있고), 신생 사슬은 폴리머라제 촉매 반응에서 프라이머의 3' 말단에 대한 뉴클레오티드의 부가에 의해 단계적으로 신장된다.
특정 실시 형태에서, 상이한 뉴클레오티드 트라이포스페이트(A, T, G 및 C) 각각은 특유의 플루오로포어로 표지될 수 있으며, 또한 제어되지 않은 중합을 방지하기 위해 3' 위치에 블로킹기를 포함한다. 대안적으로, 4개의 뉴클레오티드 중 하나는 비표지될 수 있다(암색). 폴리머라제 효소는 주형 폴리뉴클레오티드에 상보적인 신생 사슬 내로 뉴클레오티드를 도입시키며, 블로킹기는 뉴클레오티드의 추가 도입을 방지한다. 임의의 도입되지 않은 뉴클레오티드는 세척될 수 있고, 각각의 도입된 뉴클레오티드로부터의 형광 신호는 적절한 방출 필터 및 레이저 여기를 사용하는 전하 결합 소자와 같은 적절한 수단에 의해 광학적으로 "리드" 될 수 있다. 이어서, 3'-블로킹기 및 형광 염료 화합물을 동시에 또는 순차적으로 제거하여(탈보호하여) 추가의 뉴클레오티드 도입을 위해 신생 사슬을 노출시킬 수 있다. 전형적으로, 도입된 뉴클레오티드의 동일성은 각각의 도입 단계 후에 결정될 것이지만, 이것이 절대적으로 필수적인 것은 아니다. 유사하게, 미국 특허 제5,302,509호(본 명세서에 참고로 포함됨)는 고체 지지체 상에 고정된 폴리뉴클레오티드를 시퀀싱하는 방법을 개시한다.
상기에 예시된 바와 같이, 이 방법은 DNA 폴리머라제의 존재 하에서, 고정화된 폴리뉴클레오티드에 상보적인 성장 가닥 내로의 형광 표지된 3'-블로킹된 뉴클레오티드 A, G, C, 및 T의 도입을 이용한다. 폴리머라제는 표적 폴리뉴클레오티드에 상보적인 염기를 도입시키지만, 3'-블로킹기에 의해 더 이상의 부가는 방지된다. 이어서, 도입된 뉴클레오티드의 표지를 결정할 수 있으며, 블로킹기를 화학적 절단에 의해 제거하여 추가의 중합이 일어날 수 있게 할 수 있다. 합성에 의한 시퀀싱 반응에서 시퀀싱하고자 하는 핵산 주형은 시퀀싱이 요구되는 임의의 폴리뉴클레오티드일 수 있다. 시퀀싱 반응을 위한 핵산 주형은 전형적으로 시퀀싱 반응에서 추가의 뉴클레오티드의 부가를 위한 프라이머 또는 개시점으로서의 역할을 하는 유리 3'-OH 기를 갖는 이중 가닥 영역을 포함할 것이다. 시퀀싱하고자 하는 주형의 영역은 상보적 가닥 상의 이러한 유리 3'-OH 기를 오버행(overhang)할 것이다. 시퀀싱하고자 하는 주형의 오버행 영역은 단일 가닥일 수 있지만, 시퀀싱하고자 하는 주형 가닥에 상보적인 가닥 상에 "닉이 존재하여" 시퀀싱 반응의 개시를 위한 유리 3'-OH 기를 제공한다면 이중 가닥일 수 있다. 그러한 실시 형태에서, 시퀀싱은 가닥 치환에 의해 진행될 수 있다. 특정한 실시 형태에서, 유리 3'-OH 기를 갖는 프라이머가 시퀀싱하고자 하는 주형의 단일 가닥 영역에 하이브리디제이션되는 별개의 성분(예를 들어, 짧은 올리고뉴클레오티드)으로서 부가될 수 있다. 대안적으로, 프라이머 및 시퀀싱하고자 하는 주형 가닥은 각각, 예를 들어 헤어핀 루프 구조와 같은 분자내 이중체를 형성할 수 있는 부분적으로 자가상보적인 핵산 가닥의 일부를 형성할 수 있다. 헤어핀 폴리뉴클레오티드 및 이들이 고체 지지체에 부착될 수 있는 방법이 국제 특허 출원 공개 WO 01/57248호 및 WO 2005/047301호에 개시되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다. 뉴클레오티드를 성장하는 프라이머에 연속적으로 부가할 수 있으며, 그 결과 5'에서 3' 방향으로 폴리뉴클레오티드 사슬이 합성될 수 있다. 부가된 염기의 성질은 각각의 뉴클레오티드 부가 후에 - 특히 그러나 반드시 그러한 것은 아님 - 결정되며, 이로써 핵산 주형에 대한 서열 정보를 제공할 수 있다. 따라서, 핵산 가닥(또는 폴리뉴클레오티드) 내로의 뉴클레오티드의 도입이, 뉴클레오티드의 5' 포스페이트기와의 포스포다이에스테르 결합의 형성을 통해 핵산 가닥의 유리 3'-OH 기에 뉴클레오티드를 연결함으로써 행해진다.
시퀀싱하고자 하는 핵산 주형은 DNA 또는 RNA, 또는 심지어 데옥시뉴클레오티드 및 리보뉴클레오티드로 구성된 하이브리드 분자일 수 있다. 핵산 주형은, 시퀀싱 반응에서 주형의 카피를 방해하지 않는 한, 천연 발생 및/또는 비천연 발생 뉴클레오티드 및 천연 또는 비천연 골격 결합을 포함할 수 있다.
특정한 실시 형태에서, 시퀀싱하고자 하는 핵산 주형은 당업계에 알려진 임의의 적절한 결합 방법을 통해, 예를 들어 공유 결합을 통해 고체 지지체에 부착될 수 있다. 특정한 실시 형태에서, 주형 폴리뉴클레오티드는 고체 지지체(예를 들어, 실리카 기반 지지체)에 직접 부착될 수 있다. 그러나, 본 발명의 다른 실시 형태에서, 고체 지지체의 표면은 주형 폴리뉴클레오티드의 직접 공유 결합을 가능하게 하거나, 그 자체가 고체 지지체에 비공유적으로 결합될 수 있는 하이드로겔 또는 다가전해질 다층을 통해 주형 폴리뉴클레오티드를 고정화하도록 어떤 방법으로든 개질될 수 있다.
합성에 의한 시퀀싱의 실시 형태 및 대안
일부 실시 형태는 파이로시퀀싱 기술을 포함한다. 파이로시퀀싱은 특정 뉴클레오티드가 신생 가닥에 도입될 때 무기 파이로포스페이트(PPi)의 방출을 검출한다(문헌[Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M. and Nyren, P. (1996) "Real-time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242(1), 84-9]; 문헌[Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing." Genome Res. 11(1), 3-11]; 문헌[Ronaghi, M., Uhlen, M. and Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281(5375), 363]; 미국 특허 제6,210,891호; 미국 특허 제6,258,568호 및 미국 특허 제6,274,320호, 이들의 개시 내용은 전체적으로 본 명세서에 참고로 포함됨). 파이로시퀀싱에서, 방출된 PPi는 ATP 설퍼릴라제에 의해 아데노신 트라이포스페이트(ATP)로 즉시 전환됨으로써 검출될 수 있고, 생성된 ATP의 레벨은 루시페라제-생성된 광자를 통해 검출될 수 있다. 시퀀싱될 핵산은 어레이 내의 특징부에 부착될 수 있고, 어레이는 어레이의 특징부에서의 뉴클레오티드의 도입으로 인해 생성되는 화학발광 신호를 포획하기 위해 이미징될 수 있다. 이미지는 어레이가 특정 뉴클레오티드 유형(예를 들어, A, T, C 또는 G)으로 처리된 후에 얻어질 수 있다. 각각의 뉴클레오티드 유형의 첨가 후에 얻어지는 이미지는 어레이 내의 어떤 특징부가 검출되는 지에 따라 상이할 것이다. 이미지에서의 이러한 차이는 어레이 상의 특징부의 상이한 서열 콘텐츠를 반영한다. 그러나, 각각의 특징부의 상대적인 위치는 이미지에서 변하지 않은 채로 있을 것이다. 이미지는 본 명세서에 기재된 방법을 사용하여 저장, 처리 및 분석될 수 있다. 예를 들어, 어레이를 각각의 상이한 뉴클레오티드 유형으로 처리한 후에 얻어진 이미지는 가역적 종결자 기반 시퀀싱 방법을 위해 상이한 검출 채널로부터 얻은 이미지에 대해 본 명세서에 예시된 것과 동일한 방식으로 취급될 수 있다
SBS의 다른 예시적인 유형에서, 사이클 시퀀싱은 예를 들어, 그 개시 내용이 본 명세서에 참고로 포함되는 국제 특허 공개 WO 04/018497호 및 미국 특허 제7,057,026호에 기재된 바와 같은 절단가능한 또는 광표백성 염료 표지를 포함하는 가역적 종결자 뉴클레오티드의 단계적 부가에 의해 달성된다. 이러한 접근법은 솔렉사(Solexa, 현재 일루미나, 인코포레이티드)에 의해 상업화되고 있으며, 또한 각각이 본 명세서에 참고로 포함되는 국제 특허 공개 WO 91/06678호 및 WO 07/123,744호에 기재되어 있다. 종결이 역전될 수 있고, 형광 표지가 절단될 수 있는 형광 표지된 종결자의 이용가능성은 효율적인 주기적 가역적 종결(CRT) 시퀀싱을 용이하게 한다. 폴리머라제는 또한 이러한 변형된 뉴클레오티드를 효율적으로 도입하고 신장하도록 공동 조작될 수 있다.
바람직하게는 가역적 종결자 기반 시퀀싱 실시 형태에서, 표지는 SBS 반응 조건 하에서 신장을 실질적으로 저해하지 않는다. 그러나, 검출 표지는 예를 들어, 절단 또는 분해에 의해 제거될 수 있다. 이미지는 배열된 핵산 특징부에 표지를 포함시킨 후에 캡처될 수 있다. 특정 실시 형태에서, 각각의 사이클은 어레이에 4종의 상이한 뉴클레오티드 유형을 동시에 전달하는 것을 포함하고, 각각의 뉴클레오티드 유형은 스펙트럼적으로 구별되는 표지를 갖는다. 이어서 각각 4개의 상이한 표지 중 하나에 대해 선택적인 검출 채널을 사용하여 4개의 이미지가 얻어질 수 있다. 대안적으로, 상이한 뉴클레오티드 유형은 순차적으로 부가될 수 있으며, 각각의 부가 단계 사이에 어레이의 이미지가 얻어질 수 있다. 이러한 실시 형태에서, 각각의 이미지는 특정 유형의 뉴클레오티드가 도입된 핵산 특징부를 나타낼 것이다. 상이한 특징부는 각각의 특징부의 상이한 서열 콘텐츠로 인해 상이한 이미지에 존재하거나 존재하지 않을 것이다. 그러나, 특징부의 상대적인 위치는 이미지에서 변하지 않은 채로 있을 것이다. 이러한 가역적 종결자-SBS 방법으로부터 얻어진 이미지는 본 명세서에 기재된 바와 같이 저장, 처리 및 분석될 수 있다. 이미지 캡처 단계 후에, 표지는 제거될 수 있고, 가역적 종결자 부분은 뉴클레오티드 부가 및 검출의 후속 사이클을 위해 제거될 수 있다. 특정 사이클에서 검출된 후에 그리고 후속 사이클 전에 표지의 제거는 사이클 사이의 배경 신호 및 크로스토크(crosstalk)를 감소시키는 이점을 제공할 수 있다. 유용한 표지 및 제거 방법의 예가 하기에 기재되어 있다.
일부 실시 형태는 4개 미만의 상이한 표지를 사용하여 4개의 상이한 뉴클레오티드의 검출을 사용할 수 있다. 예를 들어, SBS는 미국 특허 공개 제2013/0079232호에 포함된 문헌에 기술된 방법 및 시스템을 사용하여 수행될 수 있다. 첫 번째 예로서, 한 쌍의 뉴클레오티드 유형이 동일한 파장에서 검출될 수 있지만, 그 쌍의 하나의 구성원에 대해 다른 구성원과 비교한 강도의 차이에 기초하여, 또는 그 쌍의 다른 구성원에 대해 검출된 신호와 비교하여, 명백한 신호가 나타나거나 사라지게 하는 (예를 들어, 화학적 변형, 광화학적 변형 또는 물리적 변형을 통한) 그 쌍의 하나의 구성원에 대한 변화에 기초하여 구별될 수 있다. 두 번째 예로서, 4개의 상이한 뉴클레오티드 유형 중 3개가 특정 조건 하에서 검출될 수 있는 반면, 제4 뉴클레오티드 유형은 그러한 조건 하에서 검출 가능한 표지가 결여되어 있거나, 그러한 조건 하에서 최소한으로 검출된다(예를 들어, 배경 형광 등으로 인한 최소 검출). 핵산 내로의 첫 번째 3개의 뉴클레오티드 유형의 도입은 이의 각각의 신호의 존재를 기반으로 결정될 수 있고, 핵산 내로의 제4 뉴클레오티드 유형의 도입은 임의의 신호의 부재 또는 최소 검출을 기반으로 결정될 수 있다. 세 번째 예로서, 하나의 뉴클레오티드 유형은 2개의 상이한 채널에서 검출되는 표지(들)를 포함할 수 있는 반면, 다른 뉴클레오티드 유형은 단 하나의 채널에서만 검출된다. 상술한 3개의 예시적인 구성은 상호 배타적인 것으로 간주되지 않으며, 다양한 조합으로 사용될 수 있다. 모든 3개의 예를 조합한 예시적인 실시형태는 제1 채널에서 검출되는 제1 뉴클레오티드 유형(예를 들어, 제1 여기 파장에 의해 여기되는 경우 제1 채널에서 검출되는 표지를 갖는 dATP), 제2 채널에서 검출되는 제2 뉴클레오티드 유형(예를 들어, 제2 여기 파장에 의해 여기되는 경우 제2 채널에서 검출되는 표지를 갖는 dCTP), 제1 채널 및 제2 채널 둘 다에서 검출되는 제3 뉴클레오티드 유형(예를 들어, 제1 여기 파장 및/또는 제2 여기 파장에 의해 여기되는 경우 두 채널 모두에서 검출되는 적어도 하나의 표지를 갖는 dTTP) 및 어느 하나의 채널에서도 검출되지 않거나 최소한으로 검출되는 표지가 결여된 제4 뉴클레오티드 유형(예를 들어, 표지를 갖지 않는 dGTP)을 사용하는 형광 기반 SBS 방법이다.
또한, 미국 특허 공개 제2013/0079232호에 포함된 문헌에 기술된 바와 같이, 시퀀싱 데이터는 단일 채널을 사용하여 얻어질 수 있다. 이러한 소위 1 염료 시퀀싱 접근법에서, 제1 뉴클레오티드 유형은 표지화되지만, 표지는 제1 이미지가 생성된 후에 제거되고, 제2 뉴클레오티드 유형은 제1 이미지가 생성된 후에만 표지화된다. 제3 뉴클레오티드 유형은 제1 이미지 및 제2 이미지 둘 모두에서 이의 표지를 보유하고, 제4 뉴클레오티드 유형은 두 이미지에서 표지화되지 않은 상태로 유지된다.
일부 실시 형태는 라이게이션 기술에 의한 시퀀싱을 사용할 수 있다. 이러한 기술은 DNA 리가제를 사용하여 올리고뉴클레오티드를 도입하고 이러한 올리고뉴클레오티드의 도입을 확인한다. 올리고뉴클레오티드는 전형적으로 올리고뉴클레오티드가 하이브리디제이션되는 서열에서 특정 뉴클레오티드의 동일성과 상관관계가 있는 상이한 표지를 갖는다. 다른 SBS 방법에서와 같이, 이미지는 핵산 특징부의 어레이를 표지화된 시퀀싱 시약으로 처리한 후에 얻어질 수 있다. 각각의 이미지는 특정 유형의 표지가 도입된 핵산 특징부를 나타낼 것이다. 상이한 특징부는 각각의 특징부의 상이한 서열 콘텐츠로 인해 상이한 이미지로 존재하거나 존재하지 않을 것이지만, 특징부의 상대적인 위치는 이미지에서 변화되지 않은 상태로 유지될 것이다. 라이게이션 기반 시퀀싱 방법으로부터 얻어진 이미지들은 본 명세서에 기재된 바와 같이 저장, 처리 및 분석될 수 있다. 본 명세서에 기술된 방법 및 시스템과 함께 사용될 수 있는 예시적인 SBS 시스템 및 방법은 이들의 개시 내용이 전체적으로 본 명세서에 참고로 포함되는 미국 특허 제6,969,488호, 제6,172,218호 및 제6,306,597호에 기술되어 있다.
일부 실시 형태는 나노포어 시퀀싱을 이용할 수 있다(문헌[Deamer, D. W. & Akeson, M. "Nanopores and nucleic acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000)]; 문헌[Deamer, D. and D. Branton, "Characterization of nucleic acids by nanopore analysis", Acc. Chem . Res. 35:817-825 (2002)]; 문헌[Li, J., M. Gershow, D. Stein, E. Brandin, and J. A. Golovchenko, "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2:611-615 (2003)], 이들의 개시 내용은 전체적으로 본 명세서에 참고로 포함됨). 이러한 실시 형태에서, 표적 핵산은 나노포어를 통과한다. 나노포어는 합성 포어 또는 생물학적 막 단백질, 예컨대, α-용혈소일 수 있다. 표적 핵산이 나노포어를 통과할 때, 각각의 염기쌍은 나노포어의 전기 전도도의 변동을 측정함으로써 확인될 수 있다. (미국 특허 제7,001,792호; 문헌[Soni, G. V. & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin. Chem. 53, 1996-2001 (2007)]; 문헌[Healy, K. "Nanopore-based single-molecule DNA analysis." Nanomed. 2, 459-481 (2007)]; 문헌[Cockroft, S. L., Chu, J., Amorin, M. & Ghadiri, M. R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. Chem . Soc . 130, 818-820 (2008)], 이들의 개시 내용은 전체적으로 본 명세서에 참고로 포함됨). 나노포어 시퀀싱으로부터 얻어진 데이터는 본 명세서에 기재된 바와 같이 저장, 처리 및 분석될 수 있다. 특히, 데이터는 본 명세서에 언급된 광학 이미지 및 다른 이미지의 예시적인 처리에 따라 이미지으로서 처리될 수 있다.
시퀀싱 방법의 일부 다른 실시 형태는 그 개시 내용이 참고로 포함되는 미국 특허 제9,222,132호에 기술된 바과 같은 나노볼 시퀀싱 기술에서 본 명세서에 기재된 3' 블로킹된 뉴클레오티드를 사용하는 것을 포함한다. 롤링 서클 증폭(Rolling Circle Amplification, RCA) 과정을 통해, 다수의 별개의 DNA 나노볼이 생성될 수 있다. 이어서, 나노볼 혼합물은 단일 나노볼이 각 위치와 연관될 수 있게 하는 특징부를 포함하는 패턴화된 슬라이드 표면 상에 분포된다. DNA 나노볼 생성에서, DNA는 단편화되어 4개의 어댑터 서열 중 첫 번째에 라이게이션된다. 주형은 II형 엔도뉴클레아제로 증폭, 원형화 및 절단된다. 제2 세트의 어댑터가 부가된 후에, 증폭, 원형화 및 절단이 이루어진다. 이 프로세스는 나머지 두 어댑터에 대해 반복된다. 최종 산물은 각각 주형 서열에 의해 분리된 4개의 어댑터를 갖는 원형 주형이다. 라이브러리 분자는 롤링 서클 증폭 단계를 거쳐, DNA 나노볼이라고 하는 대량의 콘카테머(concatemer)를 생성한 다음에, 플로우 셀에 증착된다. 문헌[Goodwin et al., "Coming of age: ten years of next-generation sequencing technologies," Nat Rev Genet. 2016;17(6):333-51].
일부 실시 형태는 DNA 폴리머라제 활성의 실시간 모니터링을 포함하는 방법을 이용할 수 있다. 뉴클레오티드 도입은 예를 들어, 미국 특허 제7,329,492호 및 제7,211,414호(이들 둘 다는 본 명세서에 참고로 포함됨)에 기술된 바와 같이 형광단 보유 폴리머라제와 γ-포스페이트 표지된 뉴클레오티드 간의 형광 공명 에너지 전달(FRET) 상호작용을 통해 검출될 수 있거나, 뉴클레오티드 도입은 예를 들어, 미국 특허 제7,315,019호(이는 본 명세서에 참고로 포함됨)에 기술된 바와 같은 제로-모드 도파관으로 그리고 예를 들어, 미국 특허 제7,405,281호 및 미국 특허 공개 제2008/0108082호(이들 둘 다는 본 명세서에 참고로 포함됨)에 기술된 바와 같은 형광 뉴클레오티드 유사체 및 조작된 폴리머라제를 사용하여 검출될 수 있다. 조명은 형광 표지된 뉴클레오티드의 도입이 저 백그라운드에서 관찰될 수 있도록 표면 테더링된(surface-tethered) 폴리머라제 주변의 젭토리터 스케일(zeptoliter-scale)의 부피로 제한될 수 있다(문헌[Levene, M. J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003)]; 문헌[Lundquist, P. M. et al. "Parallel confocal detection of single molecules in real time." Opt . Lett . 33, 1026-1028 (2008)]; 문헌[Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc . Natl . Acad . Sci . USA 105, 1176-1181 (2008)], 이들의 개시 내용은 전체적으로 본 명세서에 참고로 포함됨). 이러한 방법으로부터 얻어진 이미지는 본 명세서에 기재된 바와 같이 저장, 처리 및 분석될 수 있다.
일부 SBS 실시 형태는 신장 산물 내로의 뉴클레오티드의 도입 시 방출되는 양성자의 검출을 포함한다. 예를 들어, 방출된 양성자의 검출에 기초한 시퀀싱은 아이온 토렌트(Ion Torrent; 미국 코네티컷주 길포드 소재, 라이프 테크놀로지스(Life Technologies)의 자회사)로부터 시판되고 있는 전기적 검출기 및 관련 기술, 또는 미국 특허 출원 공개 제2009/0026082호; 제2009/0127589호; 제2010/0137143호; 및 제2010/0282617호(이들 모두는 본 명세서에 참고로 포함됨)에 기재된 시퀀싱 방법 및 시스템을 사용할 수 있다. 운동력학적 배제를 사용하여 표적 핵산을 증폭하기 위한 본 명세서에 제시된 방법은 양성자를 검출하는 데 사용되는 기재에 용이하게 적용될 수 있다. 더 구체적으로, 본 명세서에 제시된 방법은 양성자를 검출하는 데 사용되는 앰플리콘의 클론성 집단을 생성하는 데 사용될 수 있다.
상기 SBS 방법은 멀티플렉스 포맷으로 유리하게 수행되어 다수의 상이한 표적 핵산이 동시에 조작될 수 있다. 특정 실시 형태에서, 상이한 표적 핵산이 일반적인 반응 용기에서 또는 특정 기질의 표면에서 처리될 수 있다. 이것은 멀티플렉스 방식으로 시퀀싱 시약의 전달, 미반응 시약의 제거 및 도입 이벤트의 검출을 편리하게 해준다. 표면 결합된 표적 핵산을 사용한 실시 형태에서, 표적 핵산은 어레이 포맷으로 존재할 수 있다. 어레이 포맷에서, 표적 핵산은 통상 공간적으로 구별가능한 방식으로 표면에 결합될 수 있다. 표적 핵산은 직접 공유 결합, 비드 또는 다른 입자에 대한 부착 또는 표면에 부착된 폴리머라제 또는 다른 분자에 대한 결합에 의해 결합될 수 있다. 어레이는 각각의 부위(특징부라고도 지칭됨)에서 표적 핵산의 단일 카피를 포함할 수 있거나, 동일한 서열을 갖는 다수의 카피가 각각의 부위 또는 특징부에 존재할 수 있다. 다수의 카피는 본 명세서에 더욱 상세하게 기술된 바와 같은 증폭 방법, 예컨대 브릿지 증폭 또는 에멀젼 PCR에 의해 생성될 수 있다.
본 명세서에 기재된 방법은 예를 들어, 적어도 약 10개의 특징부/㎠, 100개의 특징부/㎠, 500개의 특징부/㎠, 1,000개의 특징부/㎠, 5,000개의 특징부/㎠, 10,000개의 특징부/㎠, 50,000개의 특징부/㎠, 100,000개의 특징부/㎠, 1,000,000개의 특징부/㎠, 5,000,000개의 특징부/㎠ 또는 그 이상을 포함하는, 다양한 밀도들 중 임의의 밀도의 특징부를 갖는 어레이를 사용할 수 있다.
본 명세서에 제시된 방법의 이점은 이들이 병렬로 복수의 표적 핵산의 신속하고 효율적인 검출을 제공한다는 것이다. 따라서, 본 발명은 상기에 예시된 것과 같은 당업계에 공지된 기술을 사용하여 핵산을 제조 및 검출할 수 있는 통합 시스템을 제공한다. 따라서, 본 발명의 통합 시스템은 증폭 시약 및/또는 시퀀싱 시약을 하나 이상의 고정된 DNA 단편으로 전달할 수 있는 유체 구성요소를 포함할 수 있으며, 시스템은 펌프, 밸브, 저장소, 유체 라인 등과 같은 구성요소를 포함한다. 플로우 셀은 표적 핵산의 검출을 위한 통합된 시스템으로 구성되고/되거나 사용될 수 있다. 예시적인 플로우 셀은 예를 들어, 미국 특허 공개 제2010/0111768호 및 미국 특허 공개 제13/273,666호에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다. 플로우 셀에 대해 예시된 바와 같이, 통합 시스템의 유체 구성요소 중 하나 이상이 증폭 방법 및 검출 방법에 사용될 수 있다. 핵산 시퀀싱 실시 형태를 예로 들면, 통합된 시스템의 하나 이상의 유체 구성요소가 본 명세서에 제시된 증폭 방법 및 상기 예시된 것과 같은 시퀀싱 방법에서의 시퀀싱 시약의 전달을 위해 사용될 수 있다. 대안적으로, 통합 시스템은 증폭 방법을 수행하기 위해 그리고 검출 방법을 수행하기 위해 별개의 유체 시스템을 포함할 수 있다. 증폭된 핵산을 생성하고 또한 핵산의 서열을 결정할 수 있는 통합 시퀀싱 시스템의 예는, 제한 없이, MiSeqTM 플랫폼(미국 캘리포니아주 샌디에고 소재의 일루미나, 인크.) 및 본 명세서에 참고로 포함된 미국 특허 출원 제13/273,666호에 개시된 장치를 포함한다.
폴리뉴클레오티드가 실리카 기반 지지체에 직접 부착된 어레이는, 예를 들어 국제 특허 공개 제WO 00/06770호(본 명세서에 참고로 포함됨)에 개시된 것들이며, 여기서는 폴리뉴클레오티드가 유리 상의 펜던트 에폭사이드기와 폴리뉴클레오티드 상의 내부 아미노기 사이의 반응에 의해 유리 지지체 상에 고정화된다. 게다가, 폴리뉴클레오티드는 예를 들어, 국제 특허 공개 제WO 2005/047301호(본 명세서에 참고로 포함됨)에 기재된 바와 같이, 황 기반 친핵체와 고체 지지체의 반응에 의해 고체 지지체에 부착될 수 있다. 고체 지지된 주형 폴리뉴클레오티드의 또 다른 추가의 예는 주형 폴리뉴클레오티드가 실리카 기반 또는 다른 고체 지지체 상에 지지된 하이드로겔에 부착되어 있는 경우로서, 이는, 예를 들어 국제 특허 공개 제WO 00/31148호, 제WO 01/01143호, 제WO 02/12566호, 제WO 03/014392호, 제WO 00/53812호 및 미국 특허 제6,465,178호에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다.
주형 폴리뉴클레오티드가 고정화될 수 있는 특정 표면은 폴리아크릴아미드 하이드로겔이다. 폴리아크릴아미드 하이드로겔은 상기에 인용된 참고문헌에 그리고 국제 특허 공개 제WO 2005/065814호에 기재되어 있으며, 이는 본 명세서에 참고로 포함된다. 사용될 수 있는 구체적인 하이드로겔은 국제 특허 공개 제WO 2005/065814호 및 미국 특허 공개 제2014/0079923호에 기재된 것들을 포함한다. 일 실시 형태에서, 하이드로겔은 PAZAM(폴리(N-(5-아지도아세트아미딜펜틸) 아크릴아미드-코-아크릴아미드))이다.
DNA 주형 분자는, 예를 들어 미국 특허 제6,172,218호(이는 본 명세서에 참고로 포함됨)에 기재된 바와 같이 비드 또는 마이크로입자에 부착될 수 있다. 비드 또는 마이크로입자에 대한 부착은 시퀀싱 응용에 유용할 수 있다. 비드 라이브러리가 제조될 수 있으며, 여기서는 각각의 비드가 상이한 DNA 서열을 포함한다. 예시적인 라이브러리 및 이의 생성 방법은 문헌[Nature, 437, 376-380 (2005)]; 문헌[Science, 309, 5741, 1728-1732 (2005)]에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다. 본 명세서에 기재된 뉴클레오티드를 사용하는 그러한 비드들의 어레이의 시퀀싱은 본 발명의 범주 내에 있다.
시퀀싱하고자 하는 주형은 고체 지지체 상의 "어레이"의 일부를 형성할 수 있으며, 이 경우에 어레이는 임의의 편리한 형태를 취할 수 있다. 따라서, 본 발명의 방법은 단일-분자 어레이, 클러스터링된 어레이, 및 비드 어레이를 포함한 모든 유형의 고밀도 어레이에 적용가능하다. 본 발명의 표지된 뉴클레오티드는, 고체 지지체 상에의 핵산 분자의 고정화에 의해 형성된 것들을 포함하지만 이로 한정되지 않는 본질적으로 임의의 유형의 어레이 상의 주형을 시퀀싱하는 데 사용될 수 있다.
그러나, 본 발명의 표지된 뉴클레오티드는 클러스터링된 어레이의 시퀀싱과 관련하여 특히 유리하다. 클러스터링된 어레이에서, 어레이 상의 별개의 영역(종종 부위 또는 특징부로 지칭됨)들은 다수의 폴리뉴클레오티드 주형 분자를 포함한다. 일반적으로, 이러한 다수의 폴리뉴클레오티드 분자는 광학적 수단에 의해 개별적으로 해상가능하지 않고 대신에 앙상블(ensemble)로서 검출된다. 어레이가 어떻게 형성되는지에 따라, 어레이 상의 각각의 부위는 하나의 개별 폴리뉴클레오티드 분자의 다수의 카피(예를 들어, 그 부위는 특정 단일- 또는 이중-가닥 핵산 종에 대해 균질함) 또는 심지어 소수의 상이한 폴리뉴클레오티드 분자들의 다수의 카피(예를 들어, 2개의 상이한 핵산 종의 다수의 카피)를 포함할 수 있다. 핵산 분자들의 클러스터링된 어레이는 당업계에서 일반적으로 알려진 기법을 사용하여 생성될 수 있다. 예로서, 각각 전체적으로 본 명세서에 참고로 포함되는 국제 특허 공개 제WO 98/44151호 및 제WO 00/18957호는 핵산의 증폭 방법을 기재하는데, 여기서는 고정화된 핵산 분자들의 클러스터들 또는 "콜로니"들로 구성된 어레이를 형성하기 위하여, 주형 및 증폭 산물이 고체 지지체 상에 고정화된 채로 남아 있다. 이들 방법에 따라 제조된 클러스터링된 어레이 상에 존재하는 핵산 분자들은 본 발명의 염료 화합물로 표지된 뉴클레오티드를 사용하여 시퀀싱하기에 적합한 주형이다.
본 발명의 표지된 뉴클레오티드는 또한 단일 분자 어레이 상의 주형의 시퀀싱에 유용하다. 본 명세서에 사용되는 용어 "단일 분자 어레이" 또는 "SMA"는 고체 지지체 상에 분포된(또는 배열된) 폴리뉴클레오티드 분자들의 집단을 지칭하며, 여기서 집단의 모든 다른 것들로부터 임의의 개별 폴리뉴클레오티드의 간격은 개별 폴리뉴클레오티드 분자들을 개별적으로 해상하는 것이 가능하도록 하는 것이다. 따라서, 고체 지지체의 표면 상에 고정화된 표적 핵산 분자는 일부 실시 형태에서 광학적 수단에 의해 해상될 수 있다. 이는, 각각의 신호가 하나의 폴리뉴클레오티드를 나타내는 하나 이상의 별개의 신호가, 사용되는 특정 이미징 장치의 해상가능한 영역 내에서 발생할 것임을 의미한다.
어레이 상의 인접한 폴리뉴클레오티드 분자들 사이의 간격이 적어도 100 nm, 더 특히 적어도 250 nm, 훨씬 더 특히 적어도 300 nm, 더욱 더 특히 적어도 350 nm인 단일 분자 검출이 달성될 수 있다. 따라서, 각각의 분자는 개별적으로 해상가능하고 단일 분자 형광점으로서 검출가능하고, 상기 단일 분자 형광점으로부터의 형광은 또한 단일 단계 광표백을 나타낸다.
용어 "개별적으로 해상된" 및 "개별 해상도"는, 시각화될 때, 어레이 상의 하나의 분자를 그의 이웃하는 분자와 구별하는 것이 가능함을 명시하기 위해 본 명세서에서 사용된다. 어레이 상의 개별 분자들 사이의 분리는 개별 분자들을 해상하는 데 사용되는 특정 기법에 의해 부분적으로 결정될 것이다. 단일 분자 어레이의 일반적인 특징은 국제 특허 공개 제WO 00/06770호 및 제WO 01/57248호를 참조함으로써 이해될 것이며, 이들 각각은 본 명세서에 참고로 포함된다. 본 발명의 뉴클레오티드의 한 가지 용도가 합성에 의한 시퀀싱 반응에 대한 것이지만, 뉴클레오티드의 유용성은 그러한 방법으로 제한되지 않는다. 실제로, 뉴클레오티드는 폴리뉴클레오티드에 도입된 뉴클레오티드에 부착된 형광 표지의 검출을 필요로 하는 임의의 시퀀싱 방법에서 유리하게 사용될 수 있다.
특히, 본 발명의 표지된 뉴클레오티드는 자동화 형광 시퀀싱 프로토콜, 특히 생어(Sanger) 및 그 동료들의 사슬 종결 시퀀싱 방법에 기초한 형광 염료-종결자 사이클 시퀀싱에 사용될 수 있다. 그러한 방법은 일반적으로 효소, 및 프라이머 신장 시퀀싱 반응에서 형광 표지된 다이데옥시뉴클레오티드를 도입시키는 사이클 시퀀싱을 사용한다. 이른바 생어 시퀀싱 방법, 및 관련 프로토콜(Sanger-type)은 표지된 다이데옥시뉴클레오티드를 갖는 랜덤화된 사슬 종결을 이용한다.
따라서, 본 발명은 또한 3' 및 2' 위치 둘 모두에서 하이드록실기가 결여된 다이데옥시뉴클레오티드인 표지된 뉴클레오티드를 포함하며, 그러한 다이데옥시뉴클레오티드는 생어 유형 시퀀싱 방법 등에 사용하기에 적합하다.
3' 블로킹기를 도입시킨 본 발명의 표지된 뉴클레오티드 - 이것은 인식될 것임 - 가 또한 생어 방법 및 관련 프로토콜에 이용될 수 있는데, 그 이유는, 다이데옥시 뉴클레오티드를 사용함으로써 달성되는 것과 동일한 효과가 3'-OH 블로킹기를 갖는 뉴클레오티드를 사용함으로써 달성될 수 있기 때문이다: 둘 모두는 후속 뉴클레오티드의 도입을 방지한다. 본 발명에 따르고 3' 블로킹기를 갖는 뉴클레오티드가 생어 유형 시퀀싱 방법에서 사용되는 경우, 뉴클레오티드에 부착된 염료 화합물 또는 검출가능한 표지는 절단가능한 링커를 통해 연결될 필요가 없음이 이해될 것인데, 그 이유는, 본 발명의 표지된 뉴클레오티드가 도입되는 각각의 경우에, 뉴클레오티드는 후속으로 도입될 필요가 없으며, 이에 따라 표지는 뉴클레오티드로부터 제거될 필요가 없기 때문이다.
본 명세서에 기재된 SBS 방법의 임의의 실시 형태에서, 시퀀싱 응용에 사용되는 뉴클레오티드는 본 명세서에 기재된 3' 블로킹된 뉴클레오티드, 예를 들어 화학식 (I) 및 화학식 (Ia) 내지 화학식 (Id)의 뉴클레오티드이다. 임의의 실시 형태에서, 3' 블로킹된 뉴클레오티드는 뉴클레오티드 트라이포스페이트이다.
특정 시퀀싱 방법에서, 도입된 뉴클레오티드는 비표지된다. 하나 이상의 형광 염료를 함유하는 표지된 친화성 시약을 사용하여, 도입 후에 하나 이상의 형광 표지가 도입될 수 있다. 예를 들어, 단계 (a)의 도입 완충액에서 4개의 상이한 유형의 뉴클레오티드(예를 들어, dATP, dCTP, dGTP 및 dTTP 또는 dUTP) 중 1개, 2개, 3개 또는 각각은 비표지될 수 있다. 4가지 유형의 뉴클레오티드(예를 들어, dNTP)는 각각 본 명세서에 기재된 3'-OH 블로킹기(예를 들어, 3'-AOM)를 갖는데, 이는 단일 염기만이 카피 폴리뉴클레오티드의 3' 말단에 폴리머라제에 의해 부가될 수 있기 때문이다. 비표지된 뉴클레오티드의 도입 후에, 이어서, 도입된 dNTP에 특이적으로 결합하는 친화성 시약이 도입되어, 도입된 dNTP를 포함하는 표지된 연장 산물을 제공한다. 합성에 의한 시퀀싱에서의 비표지된 뉴클레오티드 및 친화성 시약의 용도는 미국 특허 개 제2013/0079232 호에 개시되어 있다. 비표지된 뉴클레오티드를 사용한 본 발명의 변형된 시퀀싱 방법은 하기 단계를 포함할 수 있다:
(a'-1) 본 명세서에 기재된 3'-OH 블로킹기 (3' 산소에 부착됨)를 포함하는 뉴클레오티드(예를 들어, dATP, dCTP, dGTP, dTTP 또는 dUTP)를 표적 폴리뉴클레오티드 가닥의 적어도 일부에 상보적인 카피 폴리뉴클레오티드 가닥에 도입하여, 신장된 카피 폴리뉴클레오티드를 생성하는 단계;
(a'-2) 신장된 카피 폴리뉴클레오티드를 하나의 친화성 시약이 도입된 비표지된 뉴클레오티드에 특이적으로 결합하는 조건 하에서 친화성 시약 세트와 접촉시켜, 표지된 신장된 카피 폴리뉴클레오티드를 제공하는 단계;
(b') 표지된 신장된 카피 폴리뉴클레오티드의 하나 이상의 형광 측정을 수행함으로써 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드의 동일성을 검출하는 단계; 및
(c') 신장된 카피 폴리뉴클레오티드로부터 검출가능한 표지를 화학적으로 제거하고, 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드로부터 3'-OH 블로킹기를 화학적으로 제거하는 단계.
친화성 시약은 뉴클레오티드의 합텐 부분(예컨대, 스트렙타비딘-비오틴, 항 DIG 및 DIG, 항 DNP 및 DNP), 항체(항체의 결합 단편, 단일 사슬 항체, 이중특이적 항체 등을 포함하지만 이에 한정되지 않음), 앱타머(aptamer), 노틴(knottin), 아피머(affimer), 또는 적절한 특이성 및 친화성으로 도입된 뉴클레오티드에 결합하는 임의의 다른 공지된 제제에 결합할 수 있는 소분자 또는 단백질 태그를 포함할 수 있다. 추가의 실시 형태에서, 하나의 친화성 시약은 동일한 형광 염료의 다수의 카피로 표지될 수 있다. 일부 실시 형태에서, Pd 촉매는 또한 표지된 친화성 시약을 제거한다. 예를 들어, 비표지된 뉴클레오티드의 합텐 부분은 Pd 촉매에 의해 절단될 수 있는, 본 명세서에 기재된 바와 같은 절단가능한 링커 (예를 들어, AOL 링커)를 통해 핵산염기에 부착될 수 있다. 일부 실시 형태에서, 상기 방법은 본 명세서에 기재된 절단 후 세척 단계 (d)를 추가로 포함한다. 일부 실시 형태에서, 상기 방법은 표적 폴리뉴클레오티드 가닥의 적어도 일부의 서열이 결정될 때까지 단계 (a'-1) 내지 (c') 또는 (a'-1) 내지 (d)를 반복하는 것을 추가로 포함한다. 일부 실시 형태에서, 사이클은 적어도 50회, 적어도 100회, 적어도 150회, 적어도 200회, 적어도 250회 또는 적어도 300회 반복된다.
키트
본 발명은 또한 본 명세서에 기재된 하나 이상의 3' 블로킹된 뉴클레오시드 및/또는 뉴클레오티드, 예를 들어 화학식 (I) 및 화학식 (Ia) 내지 화학식 (Id)의 3' 블로킹된 뉴클레오티드를 포함하는 키트를 제공한다. 이러한 키트는 일반적으로 적어도 하나의 추가의 성분과 함께 검출가능한 표지(예를 들어, 형광 염료)를 포함하는 적어도 하나의 3' 블로킹된 뉴클레오티드 또는 뉴클레오시드를 포함할 것이다. 추가의 성분(들)은 본 명세서에 기재된 방법에서 또는 하기 실시예 섹션에서 확인된 성분들 중 하나 이상일 수 있다. 본 발명의 키트 내로 조합될 수 있는 성분들의 일부 비제한적인 예가 하기에 기재된다. 추가의 일부 실시 형태에서, 키트는 본 명세서에 기재된 완전 작용화된 뉴클레오티드의 4가지 유형의 표지된 뉴클레오티드(A, C, T 및 G)를 포함할 수 있으며, 여기서 각 유형의 뉴클레오티드는 본 명세서에 기재된 3'-AOM 블로킹기 및 AOL 링커 부분을 포함한다. 추가의 실시 형태에서, G는 비표지되고, AOL 링커를 포함하지 않는다. 또 다른 실시 형태에서, 하나 이상의 나머지 3개의 뉴클레오티드(즉, A, C 및 T)는 알릴아민 또는 알릴아미드 링커 부분인 L1을 포함한다. 일 실시 형태에서, 키트는 본 명세서에 기재된 비표지된 ffG, 표지된 ffA(들), 표지된 ffC 및 표지된 ffT-DB를 포함한다. 다른 실시 형태에서, 키트는 비표지된 ffG, 표지된 ffA(들), 표지된 ffC-DB 및 표지된 ffT-DB를 포함한다.
특정 실시 형태에서, 키트는 표지된 또는 비표지된 뉴클레오티드 또는 뉴클레오시드와 함께, 적어도 하나의 표지된 3' 블로킹된 뉴클레오티드 또는 뉴클레오시드를 포함할 수 있다. 예를 들어, 염료로 표지된 뉴클레오티드는 비표지 또는 천연 뉴클레오티드 및/또는 형광 표지된 뉴클레오티드, 또는 이들의 임의의 조합과 조합되어 공급될 수 있다. 뉴클레오티드들의 조합은 별개의 개별 성분들(예를 들어, 베셀(vessel) 또는 튜브당 하나의 뉴클레오티드 유형)로서 또는 뉴클레오티드 혼합물(예를 들어, 동일한 베셀 또는 튜브 내에서 혼합된 2개 이상의 뉴클레오티드)로서 제공될 수 있다.
키트가 염료 화합물로 표지된 복수의, 특히 2개, 또는 3개, 또는 더 특히는 4개의 3' 블로킹된 뉴클레오티드를 포함하는 경우, 이들 상이한 뉴클레오티드들은 상이한 염료 화합물들로 표지될 수 있거나, 하나는 염료 화합물을 함유하지 않아서 암색(dark)일 수 있다. 상이한 뉴클레오티드들이 상이한 염료 화합물들로 표지되는 경우, 이러한 염료 화합물들은 스펙트럼적으로 구별가능한 형광 염료라는 것이 상기 키트의 특징이다. 본 명세서에 사용되는 바와 같이, 용어 "스펙트럼적으로 구별가능한 형광 염료"는 2개 이상의 그러한 염료가 하나의 샘플 내에 존재할 때 형광 검출 장비(예를 들어, 시판 모세관 기반 DNA 시퀀싱 플랫폼)에 의해 구별될 수 있는 파장에서 형광 에너지를 방출하는 형광 염료를 지칭한다. 형광 염료 화합물들로 표지된 2개의 뉴클레오티드가 키트 형태로 공급될 때, 스펙트럼적으로 구별가능한 형광 염료들이, 예를 들어 동일한 레이저에 의해 동일한 파장에서 여기될 수 있다는 것이 일부 실시 형태의 특징이다. 형광 염료 화합물들로 표지된 4개의 3' 블로킹된 뉴클레오티드(A, C, T 및 G)가 키트 형태로 공급될 때, 스펙트럼적으로 구별가능한 형광 염료들 중 2개가 모두 하나의 파장에서 여기될 수 있고, 나머지 다른 2개의 스펙트럼적으로 구별가능한 염료가 모두 다른 파장에서 여기될 수 있다는 것이 일부 실시 형태의 특징이다. 특정 여기 파장은 488 nm 및 532 nm이다.
일 실시 형태에서, 키트는 제1 염료로 표지된 제1의 3' 블로킹된 뉴클레오티드 및 제2 염료로 표지된 제2 뉴클레오티드를 포함하며, 이들 염료는 적어도 10 nm, 특히 20 nm 내지 50 nm의 흡광도 최대치의 차이를 갖는다. 더 특히는, 이들 2개의 염료 화합물은 15 내지 40 nm의 스토크스 이동(Stokes shift)을 가지며, 여기서 "스토크스 이동"은 피크 흡수 파장과 피크 방출 파장 사이의 거리이다.
대안적인 실시 형태에서, 본 발명의 키트는 동일한 염기가 2개 이상의 상이한 염료로 표지된 3' 블로킹된 뉴클레오티드를 포함할 수 있다. 제1 뉴클레오티드(예를 들어, 3' 블로킹된 T 뉴클레오티드 트라이포스페이트 또는 3' 블로킹된 G 뉴클레오티드 트라이포스페이트)는 제1 염료로 표지될 수 있다. 제2 뉴클레오티드(예를 들어, 3' 블로킹된 C 뉴클레오티드 트라이포스페이트)는 제1 염료와 스펙트럼적으로 구별되는 제2 염료, 예를 들어 600 nm 미만에서 흡수하는 "녹색" 염료로 표지될 수 있으며, "청색" 염료는 500 nm 미만, 예를 들어 400 nm 내지 500 nm, 특히 450 nm 내지 460 nm에서 흡수한다. 제3 뉴클레오티드(예를 들어, 3' 블로킹된 A 뉴클레오티드 트라이포스페이트)는 제1 염료와 제2 염료의 혼합물, 또는 제1, 제2 및 제3 염료의 혼합물로 표지될 수 있으며, 제4 뉴클레오티드(예를 들어, 3' 블로킹된 G 뉴클레오티드 트라이포스페이트 또는 3' 블로킹된 T 뉴클레오티드 트라이포스페이트)는 '암색'일 수 있고, 표지를 포함하지 않는다. 일례를 들면, 뉴클레오티드 1 내지 뉴클레오티드 4는 '청색', '녹색', '청색/녹색', 및 암색으로 표지될 수 있다. 계측을 더 단순화하기 위하여, 4개의 뉴클레오티드가 단일 레이저로 여기되는 2개의 염료로 표지될 수 있으며, 이에 따라 뉴클레오티드 1 내지 뉴클레오티드 4의 표지화는 '청색 1', '청색 2', '청색 1/청색 2', 및 암색일 수 있다.
특정 실시 형태에서, 키트는 4개의 표지된 3' 블로킹된 뉴클레오티드(예를 들어, A, C, T, G)를 포함할 수 있으며, 여기서 각각의 유형의 뉴클레오티드는 동일한 3' 블로킹기 및 형광 표지를 포함하고, 각각의 형광 표지는 별개의 형광 최대값을 갖고, 각각의 형광 표지는 다른 3개의 표지와 구별될 수 있다. 키트는 형광 표지 중 2개 이상이 유사한 흡광도 최대치를 갖지만 상이한 스토크스 이동을 갖도록 할 수 있다. 다른 일부 실시 형태에서, 한 유형의 뉴클레오티드가 비표지된다.
키트가 상이한 염료 화합물들로 표지된 상이한 뉴클레오티드들을 갖는 구성들에 관하여 본 명세서에서 예시되어 있지만, 키트는 동일한 염료 화합물을 갖는 2개, 3개, 4개 또는 그 이상의 상이한 뉴클레오티드들을 포함할 수 있음이 이해될 것이다. 일부 실시 형태에서, 키트는 또한 효소 및 효소 작용에 적합한 완충액을 포함한다. 일부 그러한 실시 형태에서, 효소는 폴리머라제, 터미널 데옥시뉴클레오티딜 트랜스퍼라제 또는 역전사효소이다. 특정 실시 형태에서, 효소는 DNA 폴리머라제, 예컨대 DNA 폴리머라제 812(Pol 812) 또는 DNA 폴리머라제 1901(Pol 1901)이다. 추가의 일부 실시 형태에서, 키트는 본 명세서에 기재된 도입 믹스를 포함할 수 있다. 추가의 실시 형태에서, 본 명세서에 기재된 도입 믹스를 포함하는 키트는 또한 적어도 하나의 Pd 스캐빈저(예를 들어, 하나 이상의 알릴 부분을 포함하는 본 명세서에 기재된 Pd(0) 스캐빈저)를 포함한다. Pd 스캐빈저는 -O-알릴, -S-알릴, -NR-알릴 및 -N+RR'-알릴로 이루어진 군으로부터 각각 독립적으로 선택되는 하나 이상의 알릴 부분을 포함하며, 여기서 R은 H, 비치환 또는 치환된 C1-C6 알킬, 비치환 또는 치환된 C2-C6 알케닐, 비치환 또는 치환된 C2-C6 알키닐, 비치환 또는 치환된 C6-C10 아릴, 비치환 또는 치환된 5원 내지 10원 헤테로아릴, 비치환 또는 치환된 C3-C10 카르보사이클릴, 또는 비치환 또는 치환된 5원 내지 10원 헤테로사이클릴이고; R'은 H, 비치환된 C1-C6 알킬 또는 치환된 C1-C6 알킬이다. 일부 그러한 실시 형태에서, 도입 용액 중의 Pd(0) 스캐빈저는 하나 이상의 -O-알릴 부분을 포함한다. 추가의 일부 실시 형태에서, Pd(0) 스캐빈저는 , , , ,, , , , , , , , 또는 , 또는 이들의 조합을 포함하거나, 이것들이다. 대체 Pd(0) 스캐빈저는 전체적으로 참고로 포함되는 미국 특허 출원 제63/190983호에 개시되어 있다. 일 실시 형태에서, 도입 믹스 중의 Pd(0) 스캐빈저는 를 포함하거나 이것이다. 다른 실시 형태에서, 도입 믹스 중의 Pd(0) 스캐빈저는 를 포함하거나 이것이다.
그러한 키트에 포함될 다른 성분은 완충액 등을 포함할 수 있다. 본 발명의 뉴클레오티드, 및 상이한 뉴클레오티드들의 혼합물을 포함한 다른 임의의 뉴클레오티드 성분이 사용 전에 희석되도록 농축된 형태로 키트에 제공될 수 있다. 그러한 실시 형태에서, 적절한 희석 완충액이 또한 포함될 수 있다. 예를 들어, 도입 믹스 키트는 일차 아민, 이차 아민, 삼차 아민, 천연 아미노산 또는 비천연 아미노산, 또는 이들의 조합으로부터 선택되는 하나 이상의 완충제를 포함할 수 있다. 추가의 실시 형태에서, 도입 믹스 중의 완충제는 에탄올아민 또는 글리신, 또는 이들의 조합을 포함한다.
게다가, 본 명세서에 기재된 방법에서 확인된 성분들 중 하나 이상이 본 발명의 키트에 포함될 수 있다. 추가의 일부 실시 형태에서, 키트는 본 명세서에 기재된 팔라듐 촉매를 포함할 수 있다. 일부 실시 형태에서, Pd 촉매는 Pd(II) 착물(즉, Pd 전촉매)을 본 명세서에 기재된 하나 이상의 수용성 포스핀과 혼합하여 생성된다. 일부 그러한 실시 형태에서, Pd 촉매를 함유하는 키트는 절단 믹스 키트이다. 추가의 실시 형태에서, 절단 믹스 키트는 활성 Pd(0) 종을 생성하기 위한 Pd(알릴)Cl]2 또는 Na2PdCl4 및 수용성 포스핀 THP를 함유할 수 있다. Pd(II) 착물(예를 들어, Pd(알릴)Cl]2 또는 Na2PdCl4) 대 수용성 포스핀(예를 들어, THP)의 몰비는 약 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 또는 1:10일 수 있다. 추가의 실시 형태에서, 절단 믹스 키트는 또한 일차 아민, 이차 아민, 삼차 아민, 카르보네이트염, 포스페이트염 및 보레이트염, 및 이들의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 완충 시약을 함유할 수 있다. 절단 믹스 키트 중의 완충 시약의 비제한적인 예는 에탄올아민(EA), 트리스(하이드록시메틸)아미노메탄(Tris), 글리신, 카르보네이트염, 포스페이트염, 보레이트염, 다이메틸에탄올아민(DMEA), 다이에틸에탄올아민(DEEA), N,N,N',N'-테트라메틸에틸렌다이아민(TEMED), N,N,N',N'-테트라에틸에틸렌다이아민(TEEDA), 2-피페리딘 에탄올 및 이들의 조합으로 이루어진 군으로부터 선택된다. 일 실시 형태에서, 절단 믹스 키트는 DEEA를 함유한다. 다른 실시 형태에서, 절단 믹스 키트는 2-피페리딘 에탄올을 함유한다.
추가의 일부 실시 형태에서, 키트는 하나 이상의 팔라듐 스캐빈저(예를 들어, 본 명세서에 기재된 Pd(II) 스캐빈저)를 포함할 수 있다. 일부 그러한 실시 형태에서, 키트는 절단 후 세척 완충액 키트이다. 절단 후 세척 완충액 키트 중의 Pd 스캐빈저의 비제한적인 예는 아이소시아노아세테이트(ICNA) 염, 에틸 아이소시아노아세테이트, 메틸 아이소시아노아세테이트, 시스테인 또는 이의 염, L-시스테인 또는 이의 염, N-아세틸-L-시스테인, 칼륨 에틸잔토게네이트, 칼륨 아이소프로필 잔테이트, 글루타티온, 리포산, 에틸렌다이아민테트라아세트산(EDTA), 이미노다이아세트산, 나이트릴로다이아세트산, 트라이메르캅토-S-트라이아진, 다이메틸다이티오카르바메이트, 다이티오트레이톨, 메르캅토에탄올, 알릴 알코올, 프로파르길 알코올, 티올, 삼차 아민 및/또는 삼차 포스핀, 또는 이들의 조합을 포함한다. 일 실시 형태에서, 절단 후 세척 완충액 키트는 L-시스테인 또는 이의 염을 포함한다.
본 명세서에 기재된 키트의 임의의 실시 형태에서, Pd 스캐빈저(예를 들어, 본 명세서에 기재된 Pd(0) 또는 Pd(II) 스캐빈저)는 Pd 촉매와 별도의 용기/구획에 있다.
실시예
추가의 실시 형태가 하기 실시예에서 더욱 상세히 개시되며, 이러한 실시예는 어떤 식으로든 청구범위의 범위를 제한하고자 의도되지 않는다.
실시예 1. 3'AOM 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드의 합성
반응도식 1. AOL 링커 부분의 합성
중간체 AOL LN2의 합성:
아세탈 화합물 LN1 (2.43 g, 9.6 mmol)을 N2 하에 무수 CH2Cl2 (100 mL)에 용해시키고, 용액을 빙욕으로 0℃로 냉각시켰다. 2,4.6-트라이메틸피리딘 (7.6 mL, 57.5 mmol)을 첨가한 후에, 트라이메틸실릴 트라이플루오로메탄설포네이트 (7.0 mL, 38.7 mmol)를 적가하였다. 혼합물을 0℃에서 2시간 동안 교반하한 다음에, 알릴 알코올 (13 mL, 191.1 mmol)을 첨가하여, 반응물을 하룻밤 동안 환류시켰다. 반응물을 MeOH/H2O의 98:2 혼합물로 켄칭(quenching)하고, 얻어진 용액을 추가로 실온에서 3시간 동안 교반하였다. 혼합물을 CH2Cl2 (100 mL) 및 물 (200 mL)로 희석하고, 수층을 2N HCl로 pH 2 내지 3으로 산성화하였다. 수층을 분리하고, 유기층을 추가로 산성수로 추출하였다. 유기층을 MgSO4로 건조시키고, 여과하여, 휘발성 물질을 감압 하에 증발시켰다. 조생성물을 실리카 겔 상에서 플래시 크로마토그래피로 정제하여, 무색 오일 (2.56 g, 86%)로서의 AOL LN2를 얻었다.
중간체 AOL LN3의 합성:
에탄올 (17.5 mL) 중의 AOL LN2 (2.17 g, 7.0 mmol)의 용액에, 4M NaOH 수용액 (17.5 mL, 70 mmol)을 첨가하여, 혼합물을 실온에서 3시간 동안 교반하였다. 이 시간 후에, 모든 휘발성 물질을 감압 하에 제거하여, 잔류물을 물 75 mL에 용해시켰다. 용액을 2 N HCl로 pH 2 내지 3으로 산성화한 후에, 다이클로로메탄 (DCM)으로 추출하였다. 합한 유기 분획을 MgSO4로 건조시키고, 여과하여, 휘발성 물질을 감압 하에 증발시켰다. -20℃에서 보관 시에 고화하는 무색 오일 (1.65 g, 84%)로서의 AOL LN3를 추가의 정제없이 얻었다. LC-MS (ES): (음이온) m/z 281 (M-H+); (양이온) m/z 305 (M+Na+).
중간체 AOL LN4의 합성:
무수 DMF (20 mL) 중의 AOL LN3 (1.62 g, 5.74 mmol)의 용액을 5분간 진공 하에 교반한 후에, 빙욕으로 0oC로 냉각시켰다. N,N-다이아이소프로필에틸아민 (1.2 mL, 6.89 mmol)을 N2 하에 적가한 다음에, PyBOP (3.30 g, 6.34 mmol)를 적가하였다. 반응물을 0oC에서 30분간 교반한 다음에, 무수 DMF (3.0 mL) 중의 N-(5-아미노펜틸)-2,2,2-트라이플루오로아세트아미드 하이드로클로라이드 염 (1.62 g, 6.90 mmol)의 용액을 첨가한 직후에, 추가의 N,N-다이아이소프로필에틸아민 (1.4 mL, 8.04 mmol)을 첨가하였다. 반응물을 빙욕으로부터 제거하여, 실온에서 4시간 동안 교반하였다. 휘발성 물질을 감압 하에 제거하고, 잔류물을 EtOAc (150 mL)에 용해시켰다. 용액을 20 mM KHSO4 수용액, 물 및 포화 NaHCO3 수용액으로 추출하였다. 유기층을 MgSO4로 건조시키고, 여과하여, 휘발성 물질을 감압 하에 증발시켰다. 조생성물을 실리카 겔 상에서 플래시 크로마토그래피로 정제하여, 무색 오일 (2.16 g, 82%)로서의 AOL LN4를 얻었다. LC-MS (ES): (음이온) m/z 461 (M-H+), 497 (M-Cl-).
AOL 링커 부분의 합성
CH3CN (13 mL) 중의 AOL LN4 (350 mg, 0.76 mmol)의 용액에, TEMPO (48 mg, 0.31 mmol), 이어서 물 (6.5 mL) 중의 NaH2PO4·2H2O (762 mg, 4.88 mmol) 및 NaClO2 (275 mg, 3.04 mmol)의 용액을 첨가하였다. NaClO 수용액 (14% 유효 염소, 0.83 mL, 1.94 mmol)을 첨가하였더니, 용액은 즉시 암갈색으로 변하였다. 반응물을 실온에서 6시간 동안 교반한 다음에, 혼합물이 무색으로 변할 때까지 100mM Na2S2O3 수용액으로 켄칭하였다. 아세토니트릴을 감압 하에 제거하고, 잔류물을 물로 희석하여, 트라이에틸아민으로 염기성화하였다. 수상을 EtOAc (10 mL)로 추출한 후에, 감압 하에 농축시켰다. 조생성물을 C18 상에서 역상 플래시 크로마토그래피로 정제하여, 무색 오일 (트라이에틸암모늄염, 310 mg, 71%)로서의 AOL을 얻었다. LC-MS (ES): (음이온) m/z 475 (M-H+); (양이온) m/z 499 (M+Na+), 578 (M+Et3NH+).
AOL-NH
2
링커 부분의 합성
메탄올 (10 mL) 중의 AOL (446 mg, 0.94 mmol)의 용액에, NH3 aq. (35%, 40 mL)를 첨가하여, 혼합물을 실온에서 5.5시간 동안 교반하였다. 이 시간 후에, 모든 휘발성 물질을 감압 하에 제거하고, 조생성물을 C18 상에서 역상 플래시 크로마토그래피로 정제하여, 백색 고체 (정량적)로서의 AOL NH 2 를 얻었다. 1H NMR (400 ㎒, DMSO-d 6): δ (ppm) 8.86 (t, J = 5.5 ㎐, 1H, CONH), 8.28 (s, 3H, NH3 +), 7.85 (s, 1H, Ar-H), 7.41 (d, J = 7.6 ㎐, 1H, Ar-H), 7.31 (t, J = 7.9 ㎐, 1H, Ar-H), 7.03 (ddd, J = 8.1, 2.5, 1.1 ㎐, 1H, Ar-H), 5.87 (ddt, J = 17.2, 10.5, 5.3 ㎐, 1H, OCH2 CHCH2), 5.24 (dq, J = 17.2, 1.7 ㎐, 1H, OCH2CHCH 2 , Ha), 5.09 (dq, J = 10.5, 1.5 ㎐, 1H, OCH2CHCH 2 , Hb), 5.02 (dd, J = 6.7, 2.4 ㎐, 1H, OCHO), 4.41 (dd, J = 12.2, 2.5 ㎐, 1H, OCH2, Ha), 4.18 - 3.99 (m, 3H, OCH 2 CHCH2 및 OCH2, Hb), 3.94 - 3.81 (m, 2H, OCH 2 COOH), 3.49 - 3.39 (m, 1H, CH2, Ha), 3.21-3.10 (m, 1H, CH2, Hb), 2.86 - 2.70 (m, 2H, CH2), 1.81 - 1.39 (m, 6H, CH2). 13C NMR (101 ㎒, DMSO-d 6): δ (ppm) 172.9, 166.1, 158.0, 136.2, 135.2, 129.3, 120.4, 119.3, 116.0, 111.3, 99.0, 68.8, 67.7, 66.8, 38.7, 38.4, 27.8, 26.3, 23.0. LC-MS (ESI): (음이온) 379 (M-H); (양이온) m/z 381 (M+H+).
염료-AOL 링커 커플링을 위한 일반적인 절차:
염료 카르복실레이트 (0.15 mmol)를 6 mL의 무수 N,N'-다이메틸포름아미드 (DMF)에 용해시켰다. N,N-다이아이소프로필에틸아민 (136 μL, 0.78 mmol)를 첨가한 후에, 무수 DMF 중의 0.5 M 용액으로서의 N,N,N',N'-테트라메틸-O-(N-석신이미딜)우로늄 테트라플루오로보레이트 (TSTU, 300 μL, 0.15 mmol)를 첨가하였다. 반응물을 질소 하에 실온에서 1시간 동안 교반하였다. 물 (400 μL) 중의 AOL NH 2 (0.10 mmol)의 용액을 활성화 염료 용액에 첨가하여, 반응물을 실온에서 3시간 동안 교반하였다. 조생성물을 분취용 스케일 RP-HPLC로 정제하였다.
AOL-SO7181의 특성화: 54% 수율 (54 μmol). LC-MS (ES): (음이온) m/z 1002 (M-H+); (양이온) m/z 1004 (M+H+).
AOL-AF550POPOS0의 특성화: 88% 수율 (88 μmol). LC-MS (ES): (음이온) m/z 1034 (M-H+), 516 (M-2H+); (양이온) m/z 1036 (M+H+), 1137 (M+ Et3NH+).
AOL-NR7180A의 특성화: 24% 수율 (23.9 μmol). LC-MS (ES): (양이온) m/z = 880 (M+H)+.
AOL-NR550S0의 특성화: 22% 수율 (21.9 μmol). LC-MS (ES): (양이온) m/z = 963 (M+H)+. (음이온) m/z = 961 (M-H+).
반응도식 2. 5'-트라이포스페이트-3'-AOM-A(DB) 뉴클레오티드의 합성
중간체 A2의 합성:
화합물 A1 (319 mg, 0.419 mmol)을 N2 분위기 하에 0.8 mL의 무수 DCM에 용해시킨 다음에, 펜타메틸사이클로펜타다이에닐트리스 (아세토니트릴)루테늄(II) 헥사플루오로포스페이트 ([RuCp*(MeCN)3]PF6, 42 mg, 0.08 mmol), 이어서 트라이에톡시실란 (231 μL, 1.25 mmol)을 첨가하였다. 반응물을 N2 하에 실온에서 1시간 동안 교반하였다. 그 다음에, 용액을 DCM으로 희석하고, 실리카 겔 플러그 상에서 여과하여, 아세트산에틸로 세정하였다. 용액을 감압 하에 증발시키고, 진공 하에 10분간 건조시킨 다음에, 잔류물을 2 mL의 무수 THF에 용해시켰다. 요오드화구리 (15 mg, 0.08 mmol) 및 THF 중의 1 M TBAF 용액 (920 μL, 0.919 mmol)을 첨가하였다. 반응물을 실온에서 2.5시간 동안 교반한 다음에, EtOAc로 희석하여, 포화 NH4Cl로 추출하였다. 수상을 EtOAc로 추출하였다. 풀링된(pooled) 유기상을 MgSO4로 건조시키고, 여과하여, 증발 건조시켰다. 잔류물을 실리카 상에서 플래시 크로마토그래피로 정제하였다. 수율: 125 mg (0.237 mmol). LC-MS (ES 및 CI): (양이온) m/z 527 (M+H+).
중간체 A3의 합성:
뉴클레오시드 A2 (155 mg, 0.294 mmol)를 감압 하에 P2O5로 18시간 동안 건조시켰다. 무수 트라이에틸 포스페이트 (1 mL) 및 약간의 새로 활성화된 4 Å 분자체를 질소 하에 이것에 첨가한 다음에, 반응 플라스크를 빙욕에서 0℃로 냉각시켰다. 새로 증류된 POCl3 (33 μL, 0.353 mmol), 이어서 프로톤 스펀지(Proton Sponge)® (113 mg, 0.53 mmol)를 적가하였다. 적가 후에, 반응물을 추가로 0℃에서 15분간 교반하였다. 그 다음에, 무수 DMF 중의 비스-트라이-n-부틸암모늄염으로서의 0.5 M 파이로포스페이트 용액 (2.94 mL, 1.47 mmol)을 신속하게 첨가한 직후에, 트라이-n-부틸 아민 (294 μL, 1.32 mmol)을 첨가하였다. 반응물을 추가로 10분간 빙수욕에 유지한 다음에, 이것을 1 M 트라이에틸암모늄 바이카르보네이트 수용액 (TEAB, 10 mL)에 부어 켄칭하여, 실온에서 4시간 동안 교반하였다. 모든 용매를 감압 하에 증발시켰다. 35% 암모니아 수용액 (10 mL)을 상기 잔류물에 첨가하여, 혼합물을 실온에서 적어도 5시간 동안 교반하였다. 그 다음에 용매를 감압 하에 증발시켰다. 조생성물을 먼저, DEAE-세파덱스(Sephadex) A25 (50 g) 상에서 이온 교환 크로마토그래피로 정제하였다. 컬럼을 트라이에틸암모늄 바이카르보네이트 수용액(TEAB)으로 용리하였다. 트라이포스페이트를 함유하는 분획을 풀링하고, 용매를 감압 하에 증발 건조시켰다. 조물질을 추가로 분취용 스케일 HPLC로 정제하였다. 화합물 A3를 트라이에틸암모늄염으로서 얻었다. 수율: 134 μmol (46%). LC-MS (ESI): (음이온) m/z 614 (M-H+).
뉴클레오티드 트라이포스페이트-AOL 링커의 일반적인 합성:
화합물 AOL (0.120 mmol)을 2 x 2 mL의 무수 N,N'-다이메틸포름아미드 (DMF)로 공증발시키고, 3 mL의 무수 N,N'-다이메틸아세트아미드 (DMA)에 용해시켰다. N,N-다이아이소프로필에틸아민 (70 μL, 0.4 mmol), 이어서 N,N,N',N'-테트라메틸-O-(N-석신이미딜)우로늄 테트라플루오로보레이트 (TSTU, 36 mg, 0.120 mmol)를 첨가하였다. 반응물을 질소 하에 실온에서 1시간 동안 교반하였다. 한편, 뉴클레오티드 트라이포스페이트 수용액 (0.08 mmol)을 감압 하에 증발 건조시키고, 300 μL의 0.1 M 트라이에틸암모늄 바이카르보네이트 (TEAB) 수용액에 재현탁시켰다. 활성화된 링커 용액을 트라이포스페이트에 첨가하고, 반응물을 실온에서 18시간 동안 교반하여, RP-HPLC로 모니터링하였다. 용액을 농축시킨 다음에, 10 mL의 진한 NH4OH 수용액을 첨가하였다. 반응물을 실온에서 24시간 동안 교반한 다음에, 감압 하에 증발시켰다. 조생성물을 먼저, 트라이에틸암모늄 바이카르보네이트 (TEAB) 수용액으로 용리하는 DEAE-세파덱스 A25 (50 g) 상에서 이온 교환 크로마토그래피로 정제하였다. 트라이포스페이트를 함유하는 분획을 풀링하고, 용매를 감압 하에 증발 건조시켰다. 조물질을 추가로 분취용 스케일 HPLC로 정제하였다.
pppA(DB)-(3'AOM)-AOL의 특성화: 수율: 60 μmol, (75%). LC-MS (ES): (음이온) m/z 976 (M-H+), 488 (M-2H+).
pppA(DB)-(3'AOM)-AOL의 특성화: 수율: 68 μmol, (72%). 1H NMR (400 ㎒, D2O): δ (ppm) 7.94 (d, J = 1.7 ㎐, 1H, H-2), 7.32 (d, J = 1.6 ㎐, 1H, H-8), 7.10 - 6.96 (m, 2H, Ar), 6.95 - 6.87 (m, 2H, Ar), 6.41 - 6.31 (m, 1H, 1'-CH), 6.01 - 5.81 (m, 2H, CH 알릴), 5.29 (ddq, J = 17.2, 6.1, 1.4 ㎐, 2H, CHH 알릴), 5.20 (ddt, J = 10.5, 3.8, 1.1 ㎐, 2H, CHH 알릴), 5.02 (td, J = 4.4, 2.4 ㎐, 1H, O-CH2-O 링커), 4.92 - 4.81 (m, 2H, 3'-O-CH2-O), 4.53 (dd, J = 4.9, 2.4 ㎐, 1H, 3'-CH), 4.39 (dd, J = 16.1, 4.0 ㎐, 1H, O-CHH 링커), 4.32 - 4.19 (m, 2H, O-CHH 링커, 4'-CH), 4.17 - 4.01 (m, 8H, 5'-CH2, CH2O 링커, CH2-O 알릴), 3.25 - 3.11 (m, 2H, CH 2 -NHCO), 3.04 (q, J = 7.3 ㎐, 18H, Et3N), 2.92 - 2.82 (m, 2H, CH2-N 링커), 2.55 - 2.41 (m, 2H, 2'-CH2), 1.59 (p, J = 7.6 ㎐, 2H, CH 2 -CH2-N 링커), 1.47 (p, J = 7.1 ㎐, 2H, CH 2 -CH2-NHCO), 1.31 (tt, J = 8.3, 4.4 ㎐, 2H, CH 2 -CH2-CH2-N 링커), 1.15 (t, J = 7.3 ㎐, 26H). 31P NMR (162 ㎒, D2O): δ (ppm) -6.18 (d, J = 20.6 ㎐, γP), -11.32 (d, J = 19.3 ㎐, aP), -22.20 (t, J = 19.9 ㎐, βP).
반응도식 3. 5'-트라이포스페이트-3'-AOM-C(DB) 뉴클레오티드의 합성
중간체 C1의 합성
5-요오도-5'-O-(tert-부틸다이페닐실릴)-2'-데옥시시티딘 (3 g, 5.07 mmol)을 30 mL의 무수 피리딘에 용해시킨 다음에, 클로로트라이메틸실란 (1.29 mL, 10.1 mmol)을 적가하였다. 반응물을 실온에서 1시간 동안 교반한 다음에, 빙욕에 넣고, 염화벤조일 (648 μL, 5.6 mmol)을 서서히 적가하였다. 반응물을 빙욕으로부터 제거한 다음에, 실온에서 1시간 동안 교반하였다. 완료 시에, 용액을 빙욕에 넣고, 50 mL의 냉수로 켄칭한 다음에, 50 mL의 메탄올 및 20 mL의 피리딘을 첨가하여, 현탁액을 실온에서 하룻밤 동안 교반하였다. 용매를 감압 하에 증발시켜, 잔류물을 200 mL의 EtOAc에 용해시키고, 2 x 200 mL의 포화 NaHCO3 및 100 mL의 염수로 추출하였다. 유기상을 MgSO4로 건조시키고, 여과하여, 증발 건조시켰다. 조생성물을 실리카 겔 상에서 플래시 크로마토그래피로 정제하여, C1을 얻었다. 수율: 2.535 g (3.64 mmol, 73%). LC-MS (ESI): (양이온) m/z 696 (M+H+), 797 (M+Et3NH+).
중간체 C2의 합성
N-벤조일-5-요오도-5'-O-(tert-부틸다이페닐실릴)-2'-데옥시시티딘 (C1) (695 mg, 1 mmol) 및 아세트산팔라듐(II) (190 mg, 0.85 mmol)을 무수 탈가스 DMF (10 mL)에 용해시킨 다음에, N-알릴트라이플루오로아세트아미드 (7.65 mL, 5 mmol)를 첨가하였다. 용액을 진공 하에 두고, 질소로 3회 퍼징한 다음에, 탈가스된 트라이에틸아민 (278 μL, 2 mmol)을 첨가하였다. 용액을 약 80℃로 가열시키고, 1시간 동안 빛으로부터 보호하였다. 얻어진 흑색 혼합물을 실온으로 냉각시킨 다음에, 50 mL의 EtOAc로 희석한 후에, 100 mL의 물로 추출하였다. 그 후에, 수상을 EtOAc로 추출하였다. 유기상을 풀링하여, MgSO4로 건조시키고, 여과하여, 증발 건조시켰다. 조생성물을 실리카 겔 상에서 플래시 크로마토그래피로 정제하여, C2를 얻었다. 수율: 305 mg (0.42 mmol, 42%). LC-MS (ES 및 CI): (양이온) m/z 721 (M+H+), 797 (M+Et3NH+).
중간체 C3의 합성
N-벤조일-5-[3-(2,2,2-트라이플루오로아세트아미도)-알릴]-5'-O-(tert-부틸다이페닐실릴)2'-데옥시시티딘 (C2) (350 mg, 0.486 mmol)을 1.1 mL의 무수 DMSO (14.5 mmol)에 용해시킨 다음에, 빙초산 (1.7 mL, 29.1 mmol) 및 무수 아세트산 (1.7 mL, 17 mmol)을 첨가하였다. 반응물을 6시간 동안 60℃로 가열시킨 다음에, 50 mL의 포화 NaHCO3 수용액으로 켄칭하였다. 용액이 버블링을 멈춘 후에, EtOAc로 추출하였다. 유기상을 풀링하고, 포화 NaHCO3 수용액, 물 및 염수로 세정하였다. 유기상을 MgSO4로 건조시키고, 여과하여, 증발 건조시켰다. 조생성물을 실리카 겔 상에서 플래시 크로마토그래피로 정제하여, C3를 얻었다. 수율: 226 mg (0.289 mmol, 60%). LC-MS (ESI): (양이온) m/z 781 (M+H+), 882 (M+Et3NH+).
중간체 C4의 합성
N-벤조일-5-[3-(2,2,2-트라이플루오로아세트아미도)-알릴]-5'-O-(tert-부틸다이페닐실릴)-3'-O-메틸티오메틸-2'-데옥시시티딘 (C3) (210 mg, 0.27 mmol)을 N2 분위기 하에 5 mL의 무수 DCM에 용해시키고, 사이클로헥센 (136 μL, 1.35 mmol)을 첨가하여, 용액을 약 -10℃로 냉각시켰다. 무수 DCM 중의 1 M의 새로 증류된 염화설퍼릴 용액 (320 μL, 0.32 mmol)을 적가하여, 반응물을 20분간 교반하였다. 모든 출발 물질이 소모된 후에, 추가 부분의 사이클로헥센 (136 μL, 1.35 mmol)을 첨가하여, 반응물을 감압 하에 증발 건조시켰다. 잔류물을 질소로 신속하게 퍼징한 다음에, 잔류물을 2.5 mL의 빙냉 무수 DCM에 용해시키고, 빙냉 알릴 알코올 (2.5 mL)을 0℃에서 교반하면서 첨가하였다. 반응물을 0℃에서 3시간 동안 교반한 다음에, 포화 NaHCO3 수용액으로 켄칭한 후에, 추가로 포화 NaHCO3 수용액으로 희석하였다. 혼합물을 EtOAc로 추출하였다. 풀링된 유기상을 MgSO4로 건조시키고, 여과하여, 증발 건조시켰다. 잔류물을 실리카 겔 상에서 플래시 크로마토그래피로 정제하여, C4를 얻었다. 수율: 58% (124 mg, 0.157 mmol). LC-MS (ESI): (양이온) m/z 791 (M+H+).
중간체 C5의 합성
N-벤조일-5-[3-(2,2,2-트라이플루오로아세트아미도)-알릴]-5'-O-(tert-부틸다이페닐실릴)-3'-O-알릴옥시메틸-2'-데옥시시티딘 (C4) (120 mg, 0.162 mmol)을 N2 분위기 하에 무수 THF (5 mL)에 용해시킨 다음에, 0℃로 두었다. 빙초산 (29 μL, 0.486 mmol)을 첨가한 직후에, THF 중의 1.0 M TBAF 용액 (486 μL, 0.486 mmol)을 첨가하였다. 용액을 0℃에서 3시간 동안 교반하였다. 용액을 EtOAc로 희석한 다음에, 0.025N HCl 및 염수로 추출하였다. 유기상을 MgSO4로 건조시키고, 여과하여, 증발 건조시켰다. 잔류물을 실리카 겔 상에서 플래시 크로마토그래피로 정제하여, C5를 얻었다. 수율: 50 mg (0.090 mmol, 55%). LC-MS (ESI): (양이온) m/z 553 (M+H+); (음이온) m/z 551 (M-H+), 587 (M+Cl-).
중간체 C6의 합성
N-벤조일-3'-O-알릴옥시메틸-5-[3-(2,2,2-트라이플루오로아세트아미도)-알릴]-2'-데옥시시티딘 (C5) (50 mg, 0.09 mmol)을 감압 하에 P2O5로 18시간 동안 건조시켰다. 무수 트라이에틸 포스페이트 (1 mL) 및 약간의 새로 활성화된 4 Å 분자체를 질소 하에 이것에 첨가한 다음에, 반응 플라스크를 빙욕에서 0℃로 냉각시켰다. 새로 증류된 POCl3 (10 μL, 0.108 mmol), 이어서 프로톤 스펀지® (29 mg, 0.135 mmol)를 적가하였다. 적가 후에, 반응물을 추가로 0℃에서 15분간 교반하였다. 그 다음에, 무수 DMF 중의 비스-트라이-n-부틸암모늄염으로서의 0.5 M 파이로포스페이트 용액 (1 mL, 0.45 mmol)을 신속하게 첨가한 직후에, 트라이-n-부틸 아민 (100 μL, 0.4 mmol)을 첨가하였다. 반응물을 추가로 10분간 빙수욕에 유지한 다음에, 이것을 1 M 트라이에틸암모늄 바이카르보네이트 수용액 (TEAB, 10 mL)에 부어 켄칭하여, 실온에서 4시간 동안 교반하였다. 모든 용매를 감압 하에 증발시켰다. 35% 암모니아 수용액 (5 mL)을 상기 잔류물에 첨가하여, 혼합물을 실온에서 18시간 동안 교반하였다. 그 다음에 용매를 감압 하에 증발시키고, 잔류물을 10 mL의 0.1 M TEAB에 재현탁시켜, 여과하였다. 여과액을 먼저, DEAE-세파덱스 A25 (50 g) 상에서 이온 교환 크로마토그래피로 정제하였다. 컬럼을 트라이에틸암모늄 바이카르보네이트로 용리하였다. 트라이포스페이트를 함유하는 분획을 풀링하고, 용매를 감압 하에 증발 건조시켰다. 조물질을 추가로 분취용 스케일 HPLC로 정제하였다. 화합물 C6를 트라이에틸암모늄염으로서 얻었다. 수율: 40.6 μmol (45%), ε290 = 5041 M-1cm-1 기준. 1H NMR (400 ㎒, D2O): δ (ppm) 8.23 (s, 1H, H-6), 6.53 (dd, J = 15.5, 0.9 ㎐, 1H, Ar-CH=), 6.42 - 6.24 (m, 2H, Ar-CH=CH-, 1'-CH), 5.98 (ddt, J = 17.3, 10.4, 5.9 ㎐, 1H, O-CH2-CH=), 5.37 (dq, J = 17.3, 1.6 ㎐, 1H, CHH=), 5.29 (ddt, J = 10.4, 1.6, 1.1 ㎐, 1H, CHH=), 4.89 (s, 2H, O-CH2-O), 4.60 (dt, J = 6.2, 3.1 ㎐, 1H, 3'-CH), 4.39 (t, J = 2.7 ㎐, 1H, 4'-CH), 4.35 (dq, J = 12.0, 3.8 ㎐, 1H, 5'-CHH), 4.28 - 4.21 (m, 1H, 5'-CHH), 4.20 (ddt, J = 6.0, 2.7, 1.4 ㎐, 1H, =CH-CH 2 -O), 3.73 (dt, J = 7.2, 1.4 ㎐, 2H, CH 2 -NH2), 3.18 (q, J = 7.3 ㎐, 20H, Et3N), 2.59 (ddd, J = 14.1, 6.1, 3.3 ㎐, 1H, 2'-CHH), 2.37 (ddd, J = 14.2, 7.2, 6.1 ㎐, 1H, 2'-CHH), 1.27 (t, J = 7.3 ㎐, 31H, Et3N).31P NMR (162 ㎒, D2O): δ (ppm) -6.06 (d, J = 20.7 ㎐, γP), -11.24 (d, J = 19.1 ㎐, aP), -21.95 (t, J = 19.7 ㎐, βP). LC-MS (ESI): (음이온) m/z 591 (M-H+).
또한, 5'-트라이포스페이트-3'-AOM-C 뉴클레오티드, 구조:
및 의 5'-트라이포스페이트-3'-AOM-T (DB) 뉴클레오티드 및 상응하는 ffC 및 ffT (DB)도 제조하였다. 최종적으로, 5'-트라이포스페이트-3'-AOM-G (ffG-(3'-AOM)로도 지칭됨)도 제조하였다. 상세한 합성은 미국 특허 공개 제2020/0216891호에 기재되어 있다.
AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드의 일반적인 합성
염료-COOH (0.02 mmol) 또는 염료-AOL (0.02 mmol)을 2x 2 mL의 무수 N,N '-다이메틸포름아미드 (DMF)로 공증발시킨 다음에, 2 mL의 무수 N,N '-다이메틸아세트아미드 (DMA)에 용해시켰다. N,N-다이아이소프로필에틸아민 (17 μL, 0.1 mmol), 이어서 N,N,N',N'-테트라메틸-O-(N-석신이미딜)우로늄 테트라플루오로보레이트 (TSTU, 6 mg, 0.02 mmol)를 첨가하였다. 반응물을 질소 하에 실온에서 1시간 동안 교반하였다. 한편, 뉴클레오티드 트라이포스페이트 수용액 (0.01 mmol)을 감압 하에 증발 건조시키고, 200 μL의 0.1 M 트라이에틸암모늄 바이카르보네이트 (TEAB) 수용액에 재현탁시켰다. 활성화된 염료 용액을 뉴클레오티드 트라이포스페이트에 첨가하고, 반응물을 실온에서 18시간 동안 교반하여, RP-HPLC로 모니터링하였다. 조생성물을 먼저, 트라이에틸암모늄 바이카르보네이트 (TEAB, 0.1 M 내지 1 M) 수용액의 선형 구배로 용리하는 DEAE-세파덱스 A25 (25 g) 상에서 이온 교환 크로마토그래피로 정제하였다. 트라이포스페이트를 함유하는 분획을 풀링하고, 용매를 감압 하에 증발 건조시켰다. 조물질을 추가로 분취용 스케일 HPLC로 정제하였다.
ffA-(3'AOM)-AOL-BL-NR650C5의 특성화: 66% 수율, (6.6 μmol). LC-MS (ES): (음이온) m/z 1931 (M-H+), 965 (M-2H+).
ffA-(3'AOM)-AOL-BL-NR550s0의 특성화: 65% 수율 (6.5 μmol). LC-MS (ES): (음이온) m/z 1784 (M-H+), 891 (M-2H+).
ffA(DB)-(3'AOM)-AOL-BL-NR650C5의 특성화: 31% 수율 (3.1 μmol). LC-MS (ES): (음이온) m/z 1933 (M-H+), 965 (M-2H+), 644 (M-3H+).
ffA(DB)-(3'AOM)-AOL-NR7181A의 특성화: 21% 수율 (2.12 μmol). LC-MS (ES): (음이온) m/z = 1475 (M-H+).
ffA-(3'-AOM)-AOL-NR7180A의 특성화: 41% 수율 (4.1 μmol). LC-MS (ES): (음이온) m/z 1472 (M-H+), 736 (M-2H+).
ffA(DB)-(3'-AOM)-AOL-BL-NR550s0의 특성화: 21% 수율 (2.1 μmol). LC-MS (ES): (음이온) m/z 1786 (M-H+), 892 (M-2H+), 594 (M-3H+).
ffC(DB)-(3'AOM)-AOL-SO7181의 특성화: 48% 수율, (4.87 μmol). LC-MS (ES): (음이온) m/z 1577 (M-H+), 788 (M-2H+), 525 (M-3H+).
ffC-(3'-AOM)-AOL-SO7181의 특성화: 56% 수율 (5.6 μmol). LC-MS (ES): (음이온) m/z 1575 (M-H+), 787 (M-2H+).
ffT(DB)-3'AOM-AOL-AF550POPOS0의 특성화: 46% 수율 (4.6 μmol). LC-MS (ES): (음이온) m/z 1609 (M-H+), 804 (M-2H+), 536 (M-3H+).
ffT(DB)-(3'AOM)-AOL-NR550s0의 특성화: 38% 수율 (3.8 μmol). LC-MS (ES): (음이온) m/z = 1535 (M-H+).
실시예 2. 상이한 팔라듐 시약 제제의 용액 절단 효율
도 1은 팔라듐 시약의 3가지 상이한 제제의 용액 절단 효율의 비교를 예시한다: 1) 10 mM [(알릴)PdCl]2, 100 mM THP, 100 mM 에탄올아민 완충액, 10 mM 아스코르브산나트륨 2) 20 mM Na2PdCl4, 60 mM THP, 100 mM N,N'-다이에틸에탄올아민, 10 mM 아스코르브산나트륨, 1M NaCl, 0.1% 트윈(Tween) 20 3) 20 mM Na2PdCl4, 70 mM THP, 100 mM N,N'-다이에틸에탄올아민, 10mM 아스코르브산나트륨, 1M NaCl, 0.1% 트윈 20. 3'-AOM-뉴클레오티드 기질의 상대 절단률을 측정하여, 절단 효율을 결정하였다. 간략하게, 100 mM 완충액 중의 3'-AOM 뉴클레오티드 기질의 0.1 mM 용액에, 팔라듐 시약의 스톡 용액을 Pd 종에서 1 mM의 최종 농도로 첨가하였다. 용액을 실온에서 인큐베이션하고, 설정 시점에서 반응물로부터 분취량을 취해, 이를 1:1 EDTA/H2O2 용액 (0.1:0.1 M)으로 켄칭하고, 이를 3'-OH 뉴클레오티드의 형성 및 3'-AOM 뉴클레오티드 기질의 소실에 대해 HPLC로 분석하여, 반응 동역학을 모니터링하였다. 도 1에 도시된 바와 같이, Na2PdCl4의 절단 효율은 [(알릴)PdCl]2에서의 THP 10당량과 비교하여, THP 3 또는 3.5당량만 사용된 경우의 [(알릴)PdCl]2의 절단 효율과 비슷하다.
실시예 3: 용액에서의 AOM-AOL ffN 안정성 연구 및 시퀀싱 성능
도 2는 스트레스된 표준 MiniSeq® ffN과 비교하여, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN) (표지된 ffT-DB, 표지된 ffA 및 표지된 ffC, 및 비표지된 ffG를 포함함)의 전위상화 성능을 예시한다. 두 세트의 ffN을 DNA 폴리머라제 만을 제외한 표준 도입 믹스 제제에서 수일간 45℃에서 인큐베이션하였다. 각 시점에 대해, 새로운 폴리머라제를 첨가하여, MiniSeq®에 로딩하기 직전에 도입 믹스를 완료하였다. 이전에 기재된 시퀀싱 조건을 사용하였다. 전위상화%는 믹스에 존재하는 3'OH-ffN의 비율의 직접적인 지표이므로, 3' 블로킹기의 안정성과 직접적으로 관련이 있다. 두 세트의 ffN에 대한 전위상화 값을 기록하고, 플롯하였다(도 2). 표준물과 비교하여, AOM-AOL-ffN은 전위상화의 어떠한 증가도 나타내지 않았으며, 3'-O-아지도메틸 블로킹기 및 LN3 링커 부분를 갖는 표준 ffN보다도 상당히 더 안정한 것으로 나타났다.
실시예 4. 시퀀싱 반응에서의 팔라듐 스캐빈저의 사용
도 3은 절단 후 세척 단계에서 칼륨 아이소시아노아세테이트를 사용하는 경우와 사용하지 않는 경우에서의, 3'-AOM 블로킹기 및 표준 LN3 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN) (표지된 ffT-DB, 표지된 ffA 및 표지된 ffC, 및 비표지된 ffG를 포함함)를 사용한 일루미나의 MiniSeq® 기기에서의 위상화 값의 비교를 예시한다. 시퀀싱 실험은 표준 도입 믹스 시약이 3'-AOM 블로킹기 및 표준 LN3 링커 부분을 갖는 ffN을 함유하는 새로 제조된 도입 믹스로 대체되고, 새로 제조된 팔라듐 절단 시약 용액(10 mM [(알릴)PdCl]2, 100 mM THP, 100 mM 에탄올아민 완충액, 10 mM 아스코르브산나트륨, 1M NaCl, 0.1% 트윈 20)이 비어 있는 웰에 첨가된 카트리지를 사용하여 일루미나의 MiniSeq® 기기에서 수행하였다. 칼륨 아이소시아노아세테이트를 표준 Miniseq® 절단 후 세척 용액에 10 mM의 최종 농도로 첨가하였다. 시퀀싱 실험은 표준 합성에 의한 시퀀싱(SBS) 프로토콜에 더하여, 팔라듐 절단 시약 용액과 함께 5초간 배양을 포함한 2 x151회 사이클 레시피를 사용하여 수행하였다. 도 3에 도시된 바와 같이, 10 mM 칼륨 아이소시아노아세테이트가 절단 후 세척 용액에 사용된 경우, % 위상화가 0.183에서 0.075로 감소된 것으로 관찰되었다.
도 4는 3'-O-아지도메틸 블로킹기 및 LN3 링커 부분을 갖는 표준 ffN을 사용한 동일한 시퀀싱 메트릭스와 비교하여, 팔라듐 스캐빈저가 사용된 경우, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN) (표지된 ffT-DB, 표지된 ffA 및 표지된 ffC, 및 비표지된 ffG를 포함함)를 사용한 일루미나의 MiniSeq® 기기에서의 위상화, 전위상화 및 에러율을 포함하는 1차 시퀀싱 메트릭스를 예시한다. 시퀀싱 실험은 도입 믹스 시약 및 표준 절단 시약이 각각, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 함유하는 새로 제조된 도입 믹스와, 새로 제조된 팔라듐 절단 시약 용액(10 mM [(알릴)PdCl]2, 100 mM THP, 100 mM N,N'-다이에틸에탄올아민 완충액, 10 mM 아스코르브산나트륨, 1M NaCl, 0.1% 트윈 20)으로 대체된 표준 카트리지를 사용하여 2x151회 사이클 레시피를 실행하여 일루미나의 MiniSeq®에서 수행하였다. 칼륨 아이소시아노아세테이트 (ICNA)를 표준 Miniseq® 절단 후 세척 용액에 10 mM의 최종 농도로 첨가하였다. 3'-O-아지도메틸 블로킹기를 갖는 표준 ffN을 사용한 대조군 시퀀싱 실험을 표준 MiniSeq® 키트 및 레시피를 사용하여 수행하였다. 결과는 전위상화 및 더 중요하게는 에러율의 개선을 보여 주었으며, 이는 단일 절단 단계로 이러한 AOM-AOL SBS 화학의 전체 효율성을 입증한다.
실시예 5. 시퀀싱 반응에서의 글리신의 사용
도 5는 글리신 또는 에탄올아민이 각각 도입 믹스에 사용되는 경우, 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 MiniSeq® 기기에서의 위상화 및 전위상화를 포함하는 1차 시퀀싱 메트릭스의 비교를 예시한다. 본 실시예에서, 전체 ffN 세트는 3'-AOM-ffA-AOL (표지됨), 3'-AOM-ffG-AOL (비표지됨), 3'-AOM-ffT (DB)-AOL (표지됨) 및 3'-AOM-ffC (DB)-AOL (표지됨)을 포함한다. 도 5에 도시된 바와 같이, 글리신이 도입 완충액에 사용된 경우, 에탄올아민을 함유하는 표준 도입 완충액과 비교할 때 위상화 값이 상당히 감소된 것으로 관찰되었다. 글리신을 사용했을 때 전위상화 값이 약간 증가하였지만, 유의미한 증가는 아닌 것으로 간주되었다. 시퀀싱 실험은 표준 도입 믹스 시약 및 표준 절단 시약이 각각, 50 mM 에탄올아민 또는 50 mM 글리신 완충액 중의 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 함유하는 새로 제조된 도입 믹스와, 새로 제조된 팔라듐 절단 시약 용액(10 mM [(알릴)PdCl]2, 100 mM THP, 100 mM N,N'-다이에틸에탄올아민 완충액, 10 mM 아스코르브산나트륨, 1M NaCl, 0.1% 트윈 20)으로 대체된 카트리지를 사용하여 표준 MiniSeq® 기기에서 수행하였다. 칼륨 아이소시아노아세테이트 (ICNA)를 표준 Miniseq 절단 후 세척 용액에 10 mM의 최종 농도로 첨가하였다. 표준 2 x151회 사이클 MiniSeq 레시피를 사용하였다.
도 6은 3'-O-아지도메틸 블로킹기 및 LN3 링커 부분을 갖는 표준 ffN을 사용한 동일한 시퀀싱 메트릭스와 비교하여, 3'-AOM 및 AOL 링커를 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용한 일루미나의 MiniSeq® 기기에서의 위상화, 전위상화 및 에러율을 포함하는 1차 시퀀싱 메트릭스를 예시한다. 본 실시예에서, 전체 ffN 세트는 3'-AOM-ffA-AOL (표지됨), 3'-AOM-ffG-AOL (비표지됨), 3'-AOM-ffT (DB)-AOL (표지됨) 및 3'-AOM-ffC (DB)-AOL (표지됨)을 포함한다. 시퀀싱 실험은 표준 도입 믹스 시약 및 표준 절단 시약이 각각, 50 mM 글리신 완충액 중의 3'-AOM 블로킹기를 갖는 완전 작용화된 뉴클레오티드(ffN)를 함유하는 새로 제조된 도입 믹스와, 새로 제조된 팔라듐 절단 시약 용액(10 mM [(알릴)PdCl]2, 100 mM THP, 100 mM N,N'-다이에틸에탄올아민 완충액, 10 mM 아스코르브산나트륨, 1M NaCl, 0.1% 트윈 20)으로 대체된 카트리지로 로딩된 표준 MiniSeq® 기기에서 2x151회 사이클 레시피를 사용하여 수행하였다. 칼륨 아이소시아노아세테이트를 표준 Miniseq® 절단 후 세척 용액에 10 mM의 최종 농도로 첨가하였다. 결과는 표준 ffN에 의해 달성된 에러율과 비교하여, 에러율이 더욱 개선되었음을 보여주었다. 도 5의 메트릭스와 비교하여, AOM-AOL 시리즈의 위상화 개선은 글리신 완충액의 사용 및 3'-AOM-ffC (DB)-AOL의 사용으로 인한 것으로 여겨진다.
실시예
6. iSeq
™에서의 합성에 의한 시퀀싱
도 7a 및 도 7b는 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용하여 일루미나의 iSeq™ 기기에서 수행한 합성에 의한 시퀀싱 2×300회 사이클에 대한 에러율 및 Q30 스코어를 포함하는 1차 시퀀싱 메트릭스의 비교를 예시한다. 본 실시예에서, 전체 AOM ffN 세트는 3'-AOM-ffA(DB)-AO-염료 1, 3'-AOM-ffG (비표지됨), 3'-AOM-ffT(DB)-AOL-NR550S0 및 3'-AOM-ffC(DB)-AOL-염료 2를 포함한다. 전체 아지도메틸(AZM) ffN 세트는 3'-아지도메틸 블로킹기, 프로파르길아미도 및 LN3 링커를 갖는 동일한 ffN을 포함한다. 염료 1은 ffA와 컨쥬게이트되는 경우에 구조 부분 을 갖는, 미국 특허 출원 제63/127061호에 개시된 크로메노퀴놀린 염료이다. 염료 2는 ffC와 컨쥬게이트되는 경우에 구조 부분 을 갖는, 미국 특허 공개 제2018/0094140호에 개시된 쿠마린 염료이다. NR550S0는 기지의 녹색 염료이다.
시퀀싱 실험은 표준 도입 믹스 시약 및 표준 절단 시약이 각각, 300% 농도의 폴리머라제 1901(Pol 1901) (360 ㎍/mL)을 사용한 50 mM 에탄올아민 또는 50 mM 글리신 완충액 중의 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 함유하는 새로 제조된 도입 믹스와, 새로 제조된 팔라듐 절단 시약 용액(10 mM [(알릴)PdCl]2, 100 mM THP, 100 mM N,N'-다이에틸에탄올아민 완충액, 10 mM 아스코르브산나트륨, 1M NaCl, 0.1% 트윈 20)으로 대체된 카트리지를 사용하여 표준 iSeq™ 기기에서 수행하였다. L-시스테인을 표준 iSeq™ 절단 후 세척 용액에 10 mM의 최종 농도로 첨가하였다. 2 × 301회 사이클 iSeq™ 레시피를 2회 여기/1회 방출 프로토콜에 사용하였다. 특히, iSeq™ 기기는 제1 이미지를 녹색 여기광(약 520 nm)으로, 제2 이미지를 청색 여기광(약 450 nm)으로 촬영하도록 설정되었다. 표준 시퀀싱 레시피를 사용하여, 2 × 301회 사이클 동안 SBS 사이클(도입, 이어서 이미징, 이어서 절단)을 수행하였다. 시퀀싱 메트릭스는 하기 표에 요약되어 있다.
AOM ffN 세트는 뛰어난 성능을 제공하여, 리드 1과 리드 2 둘 다에 대해 우수한 에러율 및 Q30을 제공하는 것으로 관찰되었다. AOM ffN 세트를 사용한 위상화 값은 AZM ffN 세트에 의해 생성된 값과 비슷하였다. 그러나, AOM ffN 세트는 상당히 낮은 전위상화 값을 생성하였다.
도 8a 및 도 8b는 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용하여 일루미나의 iSeq™ 기기에서 수행한 합성에 의한 시퀀싱 2×150회 사이클에 대한 에러율 및 Q30 스코어를 포함하는 1차 시퀀싱 메트릭스의 비교를 예시한다. 본 실시예에서, 전체 AOM ffN 세트는 3'-AOM-ffA(DB)-AO-염료 1, 3'-AOM-ffG (비표지됨), 3'-AOM-ffT(DB)-AOL-NR550S0 및 3'-AOM-ffC(DB)-AOL-염료 2를 포함한다. 전체 AZM ffN 세트는 3'-아지도메틸 블로킹기, 프로파르길아미도 및 LN3 링커를 갖는 동일한 ffN을 포함한다. 시퀀싱 실험은 표준 도입 믹스 시약 및 표준 절단 시약이 각각, 300% 농도의 Pol 1901 (360 ㎍/mL)을 사용한 50 mM 에탄올아민 또는 50 mM 글리신 완충액 중의 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 함유하는 새로 제조된 도입 믹스와, 새로 제조된 팔라듐 절단 시약 용액(10 mM [(알릴)PdCl]2, 100 mM THP, 100 mM N,N'-다이에틸에탄올아민 완충액, 10 mM 아스코르브산나트륨, 1M NaCl, 0.1% 트윈 20)으로 대체된 카트리지를 사용하여 표준 iSeq™ 기기에서 수행하였다. L-시스테인을 표준 iSeq™ 절단 후 세척 용액에 10 mM의 최종 농도로 첨가하였다. 2 × 301회 사이클 iSeq™ 레시피를 2회 여기/1회 방출 프로토콜에 사용하였다. 특히, iSeq™ 기기는 제1 이미지를 녹색 여기광(약 520 nm)으로, 제2 이미지를 청색 여기광(약 450 nm)으로 촬영하도록 설정되었다. 표준 시퀀싱 레시피를 사용하여, 2 × 301회 사이클 동안 SBS 사이클(도입, 이어서 이미징, 이어서 절단)을 수행하였다.
AZM ffN의 도입 믹스 접촉 시간은 약 24.1초인 반면에, AOM ffN의 도입 믹스 접촉 시간은 약 29.1초이었다. 그러나, AOM ffN의 더 긴 도입은 더 빠른 디블로킹 시간에 의해 보상되었다. 절단 믹스 접촉 시간은 AZM ffN 세트의 경우 약 10.2초와는 대조적으로, 약 5.8초이었다. 이와 같이, AZM 및 AOM ffN 세트에 대한 총 인큐베이션 시간은 각각, 약 34.4 및 34.9이었다. 시퀀싱 메트릭스는 하기 표에 요약되어 있다.
게다가, AOM ffN 세트는 뛰어난 성능을 제공하여, 리드 1과 리드 2 둘 다에 대해 우수한 에러율 및 Q30을 제공하는 것으로 관찰되었다. 또한, AOM ffN 세트는 더 낮은 전위상화 값을 생성하였다.
실시예
7. 청색
레이저 출력 적정을 사용한
NovaSeq
™에서의 합성에 의한 시퀀싱
SBS 시퀀싱에서 청색광에 장시간 노출되면, 광 흡수량과 출력 밀도가 증가하여 고 레벨의 신호 지연 및 위상화가 일어나는 것으로 관찰되었다. 본 실시예는 청색 레이저 적정 시퀀싱 실험에서 AOM ffN과 AZM ffN의 성능을 비교한다.
본 실험에서, 변형된 청색/녹색 여기 NovaSeq™ 상의 AOM ffN 세트를 사용한 1×151회 런 SBS를 3' 아지도메틸 블로킹기 및 LN3 링커를 갖는 표준 ffN 세트와 비교하였다. 사용된 플로우셀은 490 nm 피치 BEER2 플로우셀이었다. 청색 레이저 출력의 출력 구성은 600mW, 800mW, 1000mW, 1400mW, 1800mW 및 2400mW이었다. 녹색 레이저 출력은 1000 mM로 일정하였다. 하기 표준 AZM ffN을 사용하였다: 녹색 ffT (LN3-AF550POPOS0), 암색 G, 적색 ffC (LN3-SO7181), 청색 ffC (sPA-청색 염료 A), 청색 ffA (LN3-BL-청색 염료 A), 녹색 ffA (LN3-BL-NR550S0). AOM ffN 세트의 경우, 하기 ffN을 사용하였다: 녹색 ffT (ffT(DB)-AOL-AF550POPOS0), 암색 G, 적색 ffC (ffC(DB)-AOL-SO7181), 청색 ffC (ffC(DB)-AOL-청색 염료 A), 청색 ffA (ffA(DB)-AOL-BL-청색 염료 A), 녹색 ffA (ffA(DB)-AOL-BL-NR550S0). 청색 염료 표지된 AOM ffC 및 ffA의 구조는 하기에 예시된다:
AOM ffN 세트 SBS 런의 경우, 하기 변형을 행하였다. 먼저, 10 mM L-시스테인을 절단 후 세척 용액에 첨가하였다. 절단 믹스는 하기 성분을 포함한다: DEEA 완충액 중의 Na2PdCl4. 2회의 10초 대기 단계를 절단 후 세척 단계에 부가하였다. 또한, 60초의 정적 도입 대기 시간을 사용하였다 (AZM ffn의 38초와는 대조적으로). 도 9a는 두 ffN 세트가 더 낮은 청색 레이저 출력에서 유사한 위상화 값을 갖지만, AOM ffN 세트가 증가된 청색 레이저 출력 적정에 대해 덜 민감하였다는 것을 보여준다(AZM 위상화 기울기에 비해 완만한 위상화 기울기로 표시됨). 또한, AOM ffN이 훨씬 더 낮은 전위상화를 갖는 것으로 관찰되었다. 도 9b에 예시된 바와 같이, AOM ffN 세트는 더 높은 청색 레이저 출력에서 상당히 낮은 신호 감쇠를 나타내었다. 도 9c 및 도 9d는 사이클 수의 함수로서 평균 에러율을 예시한다. 도 9d는 도 9c의 확대도이다. 결과는 AZM ffN이 더 낮은 청색 레이저 출력에서 초기 사이클에서 더 낮은 에러율을 나타내었지만, AOM ffN 세트가 더 높은 청색 레이저 출력을 사용한 후속 사이클에서 훨씬 더 양호하게 수행되었음을 보여준다. 도 9e는151회 사이클에서의 평균 에러율을 요약한다. 게다가, AOM ffN 세트는 높은 레이저 출력에서(예를 들어, 1400 mW, 1800 mW 및 2400 mW에서) AZM ffN 세트를 능가하였다.
실시예 8. Pd 절단 믹스를 사용한 제1 화학적 선형화
본 실시예에서, SBS에 사용된 Pd 절단 믹스를 클러스터링 단계 후에 제1 화학적 선형화 단계에서 테스트하였다. 실험은 화학적 선형화를 표준 효소 선형화와 비교하였는데, 여기서 이중 가닥 폴리뉴클레오티드 중 하나의 절단은 USER에 의해 용이하게 되어, P5 프라이머 상의 U 위치가 절단되었다. 1 × 150회 사이클 SBS는 3'-AOM 블로킹기 및 AOL 링커 부분을 갖는 완전 작용화된 뉴클레오티드(ffN)를 사용하여 일루미나의 iSeq™ 기기에서 행하였다. 본 실시예에서, 전체 AOM ffN 세트는 실시예 6에 기재된 바와 같이, 3'-AOM-ffA(DB)-AO-염료 1, 3'-AOM-ffG (비표지됨), 3'-AOM-ffT(DB)-AOL-NR550S0 및 3'-AOM-ffC(DB)-AOL-염료 2를 포함한다. 특히, iSeq™ 기기는 제1 이미지를 녹색 여기광(약 520 nm)으로, 제2 이미지를 청색 여기광(약 450 nm)으로 촬영하도록 설정되었다(2회 여기/1회 방출 프로토콜 사용). iSeq™ 기기에 사용된 플로우 셀을 변형된 P5/P7 프라이머로 그래프팅하여, P5 프라이머의 제1 화학적 선형화를 가능하게 하였다. 화학적 선형화 단계를 63℃에서 30초간 인큐베이션된 Pd 절단 믹스(DEEA를 함유하는 완충액 중의 10 mM [Pd(알릴)Cl]2 및 100 mM THP)에서 행하였다. 2개의 상이한 선형화 방법을 사용하는 SBS 시퀀싱 메트릭스가 도 10에 예시되어 있다. Pd 절단 믹스가 제1 화학적 선형화 단계에서 사용된 경우, 모든 1차 시퀀싱 메트릭스가 표준 관찰 범위 내에 속하는 것으로 관찰되었다. 본 실험은 단일 시약 믹스가 2개의 별개의 시퀀싱 단계 - 선형화 단계 및 SBS 절단 단계 - 에서 사용될 수 있는데, 이는 기기(유체 및 카트리지)를 더욱 단순화할 수 있게 한다.
Claims (52)
- 절단가능한 링커를 통해 검출가능한 표지에 부착된 핵산염기를 포함하는 뉴클레오시드 또는 뉴클레오티드로서, 상기 뉴클레오시드 또는 뉴클레오티드는 리보스 또는 2' 데옥시리보스 부분 및 3'-OH 블로킹기(3'-OH blocking group)를 포함하고, 상기 절단가능한 링커는 하기 구조의 부분을 포함하는, 뉴클레오시드 또는 뉴클레오티드:
상기 식에서,
X 및 Y는 각각 독립적으로 O 또는 S이고;
R1a, R1b, R2, R3a 및 R3b는 각각 독립적으로 H, 할로겐, 비치환 또는 치환된 C1-C6 알킬, 또는 C1-C6 할로알킬이다. - 제1항 또는 제2항에 있어서, X 및 Y는 각각 O인, 뉴클레오시드 또는 뉴클레오티드.
- 제1항 내지 제3항 중 어느 한 항에 있어서, R1a, R1b, R2, R3a 및 R3b는 각각 H인, 뉴클레오시드 또는 뉴클레오티드.
- 제1항 내지 제3항 중 어느 한 항에 있어서, R1a, R1b, R2, R3a 및 R3b 중 하나 이상은 할로겐 또는 비치환된 C1-C6 알킬인, 뉴클레오시드 또는 뉴클레오티드.
- 제5항에 있어서, R1a 및 R1b는 각각 H이고, R2, R3a 및 R3b 중 하나는 비치환된 C1-C6 알킬인, 뉴클레오시드 또는 뉴클레오티드.
- 제2항 내지 제6항 중 어느 한 항에 있어서, B는 퓨린, 데아자 퓨린 또는 피리미딘인, 뉴클레오시드 또는 뉴클레오티드.
- 제2항 내지 제9항 중 어느 한 항에 있어서, L1은 존재하고, L1은 프로파르길아민, 프로파르길아미드, 알릴아민, 알릴아미드 및 이들의 임의로 치환된 변이체로 이루어진 군으로부터 선택되는 부분을 포함하는, 뉴클레오시드 또는 뉴클레오티드.
- 제13항에 있어서, n은 5인, 뉴클레오시드 또는 뉴클레오티드.
- 제13항 또는 제14항에 있어서, m은 4인, 뉴클레오시드 또는 뉴클레오티드.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 뉴클레오티드는 2' 데옥시리보스 부분을 포함하는 뉴클레오티드 트라이포스페이트인, 뉴클레오시드 또는 뉴클레오티드.
- 제1항 내지 제16항 중 어느 한 항의 뉴클레오티드를 포함하는 올리고뉴클레오티드 또는 폴리뉴클레오티드.
- 제17항에 있어서, 주형 폴리뉴클레오티드에 하이브리디제이션(hybridization)되는, 올리고뉴클레오티드 또는 폴리뉴클레오티드.
- 제18항에 있어서, 상기 주형 폴리뉴클레오티드는 고체 지지체에 고정되는, 올리고뉴클레오티드 또는 폴리뉴클레오티드.
- 제19항에 있어서, 상기 고체 지지체는 다수의 고정된 주형 폴리뉴클레오티드 어레이를 포함하는, 올리고뉴클레오티드 또는 폴리뉴클레오티드.
- 시퀀싱(sequencing) 반응에서 표적 단일 가닥 폴리뉴클레오티드에 상보적인 성장하는 폴리뉴클레오티드를 제조하는 방법으로서, 제1항 내지 제16항 중 어느 한 항의 뉴클레오티드를 성장하는 상보적 폴리뉴클레오티드에 도입하는 단계를 포함하며, 상기 뉴클레오티드의 도입은 성장하는 상보적 폴리뉴클레오티드에 임의의 후속 뉴클레오티드가 도입되는 것을 방지하는 방법.
- 제21항에 있어서, 상기 뉴클레오티드의 도입은 폴리머라제, 터미널 데옥시뉴클레오티딜 트랜스퍼라제 또는 역전사효소에 의해 달성되는, 방법.
- (a) 제1항 내지 제16항 중 어느 한 항의 뉴클레오티드를 표적 폴리뉴클레오티드 가닥의 적어도 일부에 상보적인 카피 폴리뉴클레오티드 가닥에 도입하는 단계;
(b) 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드의 동일성(identity)을 검출하는 단계; 및
(c) 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드로부터 검출가능한 표지 및 3'-OH 블로킹기를 화학적으로 제거하는 단계를 포함하는, 표적 단일 가닥 폴리뉴클레오티드의 서열을 결정하는 방법. - 제23항에 있어서, (d) 절단 후 세척 용액을 사용하여, 화학적으로 제거된 표지 및 3'-OH 블로킹기를 카피 폴리뉴클레오티드 가닥으로부터 씻어내는 단계를 추가로 포함하는, 방법.
- 제24항에 있어서, 상기 표적 폴리뉴클레오티드 가닥의 적어도 일부의 서열이 결정될 때까지 단계 (a) 내지 단계 (d)를 반복하는 것을 추가로 포함하는, 방법.
- 제25항에 있어서, 단계 (a) 내지 단계 (d)는 적어도 50회, 적어도 100회 또는 적어도 150회 반복되는, 방법.
- 제23항 내지 제26항 중 어느 한 항에 있어서, 단계 (c)는 도입된 뉴클레오티드를 팔라듐 촉매를 포함하는 절단 용액과 접촉시키는 것을 포함하는, 방법.
- 제27항에 있어서, 상기 팔라듐 촉매는 팔라듐 착물 및 수용성 포스핀으로부터 계내에서(in situ) 생성된 팔라듐 (0) 촉매인, 방법.
- 제28항에 있어서, 상기 팔라듐 착물은 [Pd(알릴)Cl]2, Na2PdCl4, [Pd(알릴)(THP)]Cl, [Pd(알릴)(THP)2]Cl, Pd(CH3CN)2Cl2, Pd(OAc)2, Pd(PPh3)4, Pd(dba)2, Pd(Acac)2, PdCl2(COD) 또는 Pd(TFA)2, 또는 이들의 조합을 포함하는, 방법.
- 제29항에 있어서, 상기 팔라듐 착물은 [Pd(알릴)Cl]2 또는 Na2PdCl4를 포함하는, 방법.
- 제27항 내지 제30항 중 어느 한 항에 있어서, 상기 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드로부터의 검출가능한 표지 및 3'-OH 블로킹기는 단일 화학 반응으로 제거되는, 방법.
- 제27항 내지 제31항 중 어느 한 항에 있어서, 상기 절단 용액은 일차 아민, 이차 아민, 삼차 아민, 카르보네이트염, 포스페이트염 및 보레이트염, 및 이들의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 완충 시약을 추가로 포함하는, 방법.
- 제32항에 있어서, 상기 절단 용액 중의 완충 시약은 에탄올아민(EA), 트리스(하이드록시메틸)아미노메탄(Tris), 글리신, 카르보네이트염, 포스페이트염, 보레이트염, 다이메틸에탄올아민(DMEA), 다이에틸에탄올아민(DEEA), N,N,N',N'-테트라메틸에틸렌다이아민(TEMED), N,N,N',N'-테트라에틸에틸렌다이아민(TEEDA), 2-피페리딘 에탄올 및 이들의 조합으로 이루어진 군으로부터 선택되는, 방법.
- 제27항 내지 제33항 중 어느 한 항에 있어서, 단계 (a)는 폴리머라제, 적어도 하나의 팔라듐 스캐빈저 및 하나 이상의 완충제를 포함하는 도입 용액에서 카피 폴리뉴클레오티드 가닥과 뉴클레오티드를 접촉시키는 것을 포함하는, 방법.
- 제34항에 있어서, 상기 도입 용액 중의 완충제는 일차 아민, 이차 아민, 삼차 아민, 천연 아미노산 또는 비천연 아미노산, 또는 이들의 조합을 포함하는, 방법.
- 제35항에 있어서, 상기 도입 용액 중의 완충제는 에탄올아민 또는 글리신, 또는 이들의 조합을 포함하는, 방법.
- 제34항 내지 제36항 중 어느 한 항에 있어서, 상기 도입 용액 중의 팔라듐 스캐빈저는 -O-알릴, -S-알릴, -NR-알릴 및 -N+RR'-알릴로 이루어진 군으로부터 독립적으로 선택되는 하나 이상의 알릴 부분을 포함하며,
여기서 R은 H, 비치환 또는 치환된 C1-C6 알킬, 비치환 또는 치환된 C2-C6 알케닐, 비치환 또는 치환된 C2-C6 알키닐, 비치환 또는 치환된 C6-C10 아릴, 비치환 또는 치환된 5원 내지 10원 헤테로아릴, 비치환 또는 치환된 C3-C10 카르보사이클릴, 또는 비치환 또는 치환된 5원 내지 10원 헤테로사이클릴이고;
R'은 H, 비치환된 C1-C6 알킬 또는 치환된 C1-C6 알킬인, 방법. - 제27항 내지 제38항 중 어느 한 항에 있어서, 상기 절단 후 세척 용액은 하나 이상의 팔라듐 스캐빈저를 포함하는, 방법.
- 제39항에 있어서, 상기 절단 후 세척 용액 중의 하나 이상의 팔라듐 스캐빈저는 아이소시아노아세테이트(ICNA) 염, 에틸 아이소시아노아세테이트, 메틸 아이소시아노아세테이트, 시스테인 또는 이의 염, L-시스테인 또는 이의 염, N-아세틸-L-시스테인, 칼륨 에틸잔토게네이트, 칼륨 아이소프로필 잔테이트, 글루타티온, 리포산, 에틸렌다이아민테트라아세트산(EDTA), 이미노다이아세트산, 나이트릴로다이아세트산, 트라이메르캅토-S-트라이아진, 다이메틸다이티오카르바메이트, 다이티오트레이톨, 메르캅토에탄올, 알릴 알코올, 프로파르길 알코올, 티올, 삼차 아민 및/또는 삼차 포스핀, 또는 이들의 조합을 포함하는, 방법.
- 제23항 내지 제40항 중 어느 한 항에 있어서, 상기 표적 단일 가닥 폴리뉴클레오티드는 이중 가닥 폴리뉴클레오티드로부터 상보적 가닥을 화학적으로 절단함으로써 형성되는, 방법.
- 제41항에 있어서, 상기 상보적 가닥의 화학적 절단은 카피 폴리뉴클레오티드 가닥에 도입된 뉴클레오티드로부터 검출가능한 표지 및 3'-OH 블로킹기를 화학적으로 제거하는 것과 동일한 반응 조건 하에서 수행되는, 방법.
- 제1항 내지 제16항 중 어느 한 항의 하나 이상의 뉴클레오시드 또는 뉴클레오티드를 포함하는 키트.
- 제43항에 있어서, 효소, 적어도 하나의 Pd(0) 스캐빈저 및 하나 이상의 완충제를 추가로 포함하는 키트.
- 제44항에 있어서, 상기 효소는 DNA 폴리머라제, 터미널 데옥시뉴클레오티딜 트랜스퍼라제 또는 역전사효소인, 키트.
- 제44항에 있어서, 상기 Pd(0) 스캐빈저는 -O-알릴, -S-알릴, -NR-알릴 및 -N+RR'-알릴로 이루어진 군으로부터 각각 독립적으로 선택되는 하나 이상의 알릴 부분을 포함하며,
여기서 R은 H, 비치환 또는 치환된 C1-C6 알킬, 비치환 또는 치환된 C2-C6 알케닐, 비치환 또는 치환된 C2-C6 알키닐, 비치환 또는 치환된 C6-C10 아릴, 비치환 또는 치환된 5원 내지 10원 헤테로아릴, 비치환 또는 치환된 C3-C10 카르보사이클릴, 또는 비치환 또는 치환된 5원 내지 10원 헤테로사이클릴이고;
R'은 H, 비치환된 C1-C6 알킬 또는 치환된 C1-C6 알킬인, 키트. - 제43항 내지 제47항 중 어느 한 항에 있어서, 팔라듐 촉매를 추가로 포함하는, 키트.
- 제48항에 있어서, 상기 팔라듐 촉매는 Pd(II) 착물 및 하나 이상의 수용성 포스핀으로부터 계내에서 생성된 Pd(0) 촉매인, 키트.
- 제49항에 있어서, 상기 Pd(II) 착물은 [Pd(알릴)Cl]2 또는 Na2PdCl4인, 키트.
- 제49항 또는 제50항에 있어서, 하나 이상의 Pd(II) 스캐빈저를 추가로 포함하며, 상기 Pd(II) 스캐빈저는 아이소시아노아세테이트(ICNA) 염, 에틸 아이소시아노아세테이트, 메틸 아이소시아노아세테이트, 시스테인 또는 이의 염, L-시스테인 또는 이의 염, N-아세틸-L-시스테인, 칼륨 에틸잔토게네이트, 칼륨 아이소프로필 잔테이트, 글루타티온, 리포산, 에틸렌다이아민테트라아세트산(EDTA), 이미노다이아세트산, 나이트릴로다이아세트산, 트라이메르캅토-S-트라이아진, 다이메틸다이티오카르바메이트, 다이티오트레이톨, 메르캅토에탄올, 알릴 알코올, 프로파르길 알코올, 티올, 삼차 아민 및/또는 삼차 포스핀, 또는 이들의 조합을 포함하는, 키트.
- 제51항에 있어서, 상기 Pd(II) 스캐빈저는 L-시스테인 또는 이의 염인, 키트.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063042240P | 2020-06-22 | 2020-06-22 | |
US63/042,240 | 2020-06-22 | ||
PCT/EP2021/066886 WO2021259881A1 (en) | 2020-06-22 | 2021-06-21 | Nucleosides and nucleotides with 3' acetal blocking group |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230031837A true KR20230031837A (ko) | 2023-03-07 |
Family
ID=76765108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227045221A KR20230031837A (ko) | 2020-06-22 | 2021-06-21 | 3' 아세탈 블로킹기를 갖는 뉴클레오시드 및 뉴클레오티드 |
Country Status (16)
Country | Link |
---|---|
US (2) | US11787831B2 (ko) |
EP (1) | EP4168421A1 (ko) |
JP (1) | JP2023531009A (ko) |
KR (1) | KR20230031837A (ko) |
CN (1) | CN115867560A (ko) |
AU (1) | AU2021295081A1 (ko) |
BR (1) | BR112022026056A2 (ko) |
CA (1) | CA3177293A1 (ko) |
CL (1) | CL2022003661A1 (ko) |
CO (1) | CO2022018487A2 (ko) |
IL (1) | IL297992A (ko) |
MA (1) | MA58991A1 (ko) |
MX (1) | MX2022016492A (ko) |
PE (1) | PE20230492A1 (ko) |
WO (1) | WO2021259881A1 (ko) |
ZA (1) | ZA202211847B (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023531009A (ja) * | 2020-06-22 | 2023-07-20 | イルミナ ケンブリッジ リミテッド | 3’アセタールブロッキング基を有するヌクレオシド及びヌクレオチド |
BR112023024130A2 (pt) * | 2021-05-20 | 2024-01-30 | Illumina Cambridge Ltd | Composições e métodos para sequenciamento por síntese |
AU2022424380A1 (en) | 2021-12-29 | 2024-01-18 | Illumina, Inc. | Methods of nucleic acid sequencing using surface-bound primers |
WO2023229884A2 (en) | 2022-05-27 | 2023-11-30 | Illumina, Inc. | 3'-blocked nucleotides, methods of deblocking the same, and methods of synthesizing polynucleotides using the same |
US20240141427A1 (en) | 2022-09-30 | 2024-05-02 | Illumina, Inc. | Polymerases, compositions, and methods of use |
WO2024077410A1 (zh) * | 2022-10-09 | 2024-04-18 | 深圳市真迈生物科技有限公司 | 还原叠氮甲氧基类基团的方法、测序方法及试剂盒 |
WO2024137765A1 (en) | 2022-12-22 | 2024-06-27 | Illumina, Inc. | Transition-metal catalyst compositions and methods for sequencing by synthesis |
US20240247311A1 (en) | 2022-12-22 | 2024-07-25 | Illumina, Inc. | Palladium catalyst compositions and methods for sequencing by synthesis |
AU2023419253A1 (en) | 2022-12-27 | 2024-10-03 | Illumina, Inc. | Methods of sequencing using 3´ allyl blocked nucleotides |
US20240327909A1 (en) | 2023-03-30 | 2024-10-03 | Illumina, Inc. | Compositions and methods for nucleic acid sequencing |
Family Cites Families (103)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5936696A (ja) | 1982-08-20 | 1984-02-28 | Taiho Yakuhin Kogyo Kk | 2′―デオキシ―5―置換ウリジン誘導体及びそれを含有する抗腫瘍剤 |
EP0104857A1 (en) | 1982-09-28 | 1984-04-04 | Beecham Group Plc | Deoxyuridine compounds, methods for preparing them and their use in medicine |
US4772691A (en) | 1985-06-05 | 1988-09-20 | The Medical College Of Wisconsin, Inc. | Chemically cleavable nucleotides |
DE3529478A1 (de) | 1985-08-16 | 1987-02-19 | Boehringer Mannheim Gmbh | 7-desaza-2'desoxyguanosin-nukleotide, verfahren zu deren herstellung und deren verwendung zur nukleinsaeure-sequenzierung |
US5242796A (en) | 1986-07-02 | 1993-09-07 | E. I. Du Pont De Nemours And Company | Method, system and reagents for DNA sequencing |
GB8822228D0 (en) | 1988-09-21 | 1988-10-26 | Southern E M | Support-bound oligonucleotides |
US5547839A (en) | 1989-06-07 | 1996-08-20 | Affymax Technologies N.V. | Sequencing of surface immobilized polymers utilizing microflourescence detection |
US6346413B1 (en) | 1989-06-07 | 2002-02-12 | Affymetrix, Inc. | Polymer arrays |
US5800992A (en) | 1989-06-07 | 1998-09-01 | Fodor; Stephen P.A. | Method of detecting nucleic acids |
DE3924454A1 (de) | 1989-07-24 | 1991-02-07 | Cornelis P Prof Dr Hollenberg | Die anwendung von dna und dna-technologie fuer die konstruktion von netzwerken zur verwendung in der chip-konstruktion und chip-produktion (dna chips) |
US5302509A (en) | 1989-08-14 | 1994-04-12 | Beckman Instruments, Inc. | Method for sequencing polynucleotides |
CA2044616A1 (en) | 1989-10-26 | 1991-04-27 | Roger Y. Tsien | Dna sequencing |
ES2097925T3 (es) | 1991-09-18 | 1997-04-16 | Affymax Tech Nv | Metodo para sintetizar diversas colecciones de oligomeros. |
ATE241426T1 (de) | 1991-11-22 | 2003-06-15 | Affymetrix Inc A Delaware Corp | Verfahren zur herstellung von polymerarrays |
EP1382386A3 (en) | 1992-02-19 | 2004-12-01 | The Public Health Research Institute Of The City Of New York, Inc. | Novel oligonucleotide arrays and their use for sorting, isolating, sequencing, and manipulating nucleic acids |
US5583211A (en) | 1992-10-29 | 1996-12-10 | Beckman Instruments, Inc. | Surface activated organic polymers useful for location - specific attachment of nucleic acids, peptides, proteins and oligosaccharides |
US5472672A (en) | 1993-10-22 | 1995-12-05 | The Board Of Trustees Of The Leland Stanford Junior University | Apparatus and method for polymer synthesis using arrays |
US6156501A (en) | 1993-10-26 | 2000-12-05 | Affymetrix, Inc. | Arrays of modified nucleic acid probes and methods of use |
EP0730663B1 (en) | 1993-10-26 | 2003-09-24 | Affymetrix, Inc. | Arrays of nucleic acid probes on biological chips |
US5429807A (en) | 1993-10-28 | 1995-07-04 | Beckman Instruments, Inc. | Method and apparatus for creating biopolymer arrays on a solid support surface |
US5807522A (en) | 1994-06-17 | 1998-09-15 | The Board Of Trustees Of The Leland Stanford Junior University | Methods for fabricating microarrays of biological samples |
US6232465B1 (en) | 1994-09-02 | 2001-05-15 | Andrew C. Hiatt | Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides |
US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
US5556752A (en) | 1994-10-24 | 1996-09-17 | Affymetrix, Inc. | Surface-bound, unimolecular, double-stranded DNA |
WO1996027025A1 (en) | 1995-02-27 | 1996-09-06 | Ely Michael Rabani | Device, compounds, algorithms, and methods of molecular characterization and manipulation with molecular parallelism |
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
US5624711A (en) | 1995-04-27 | 1997-04-29 | Affymax Technologies, N.V. | Derivatization of solid supports and methods for oligomer synthesis |
US5545531A (en) | 1995-06-07 | 1996-08-13 | Affymax Technologies N.V. | Methods for making a device for concurrently processing multiple biological chip assays |
ATE496288T1 (de) | 1995-10-11 | 2011-02-15 | Luminex Corp | Gleichzeitige mehrfachanalyse klinischer proben |
US5658734A (en) | 1995-10-17 | 1997-08-19 | International Business Machines Corporation | Process for synthesizing chemical compounds |
US6458530B1 (en) | 1996-04-04 | 2002-10-01 | Affymetrix Inc. | Selecting tag nucleic acids |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
US6297006B1 (en) | 1997-01-16 | 2001-10-02 | Hyseq, Inc. | Methods for sequencing repetitive sequences and for determining the order of sequence subfragments |
WO1998033939A1 (fr) | 1997-01-31 | 1998-08-06 | Hitachi, Ltd. | Procede pour determiner une sequence de base d'acide nucleique et appareil correspondant |
JP2001517948A (ja) | 1997-04-01 | 2001-10-09 | グラクソ、グループ、リミテッド | 核酸配列決定法 |
AU6846698A (en) | 1997-04-01 | 1998-10-22 | Glaxo Group Limited | Method of nucleic acid amplification |
CA2291180A1 (en) | 1997-05-23 | 1998-11-26 | Lynx Therapeutics, Inc. | System and apparatus for sequential processing of analytes |
US6969488B2 (en) | 1998-05-22 | 2005-11-29 | Solexa, Inc. | System and apparatus for sequential processing of analytes |
US6465178B2 (en) | 1997-09-30 | 2002-10-15 | Surmodics, Inc. | Target molecule attachment to surfaces |
JP2001519538A (ja) | 1997-10-10 | 2001-10-23 | プレジデント・アンド・フェローズ・オブ・ハーバード・カレッジ | 核酸アレイのレプリカ増幅 |
US6485944B1 (en) | 1997-10-10 | 2002-11-26 | President And Fellows Of Harvard College | Replica amplification of nucleic acid arrays |
US6087102A (en) | 1998-01-07 | 2000-07-11 | Clontech Laboratories, Inc. | Polymeric arrays and methods for their use in binding assays |
US6287776B1 (en) | 1998-02-02 | 2001-09-11 | Signature Bioscience, Inc. | Method for detecting and classifying nucleic acid hybridization |
JP3944996B2 (ja) | 1998-03-05 | 2007-07-18 | 株式会社日立製作所 | Dnaプローブアレー |
US6031078A (en) | 1998-06-16 | 2000-02-29 | Millennium Pharmaceuticals, Inc. | MTbx protein and nucleic acid molecules and uses therefor |
US6335155B1 (en) | 1998-06-26 | 2002-01-01 | Sunesis Pharmaceuticals, Inc. | Methods for rapidly identifying small organic molecule ligands for binding to biological target molecules |
IL141148A0 (en) | 1998-07-30 | 2002-02-10 | Solexa Ltd | Arrayed biomolecules and their use in sequencing |
GB0002310D0 (en) | 2000-02-01 | 2000-03-22 | Solexa Ltd | Polynucleotide sequencing |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
US6277628B1 (en) | 1998-10-02 | 2001-08-21 | Incyte Genomics, Inc. | Linear microarrays |
US6391937B1 (en) | 1998-11-25 | 2002-05-21 | Motorola, Inc. | Polyacrylamide hydrogels and hydrogel arrays made from polyacrylamide reactive prepolymers |
US6255476B1 (en) * | 1999-02-22 | 2001-07-03 | Pe Corporation (Ny) | Methods and compositions for synthesis of labelled oligonucleotides and analogs on solid-supports |
JP2002537858A (ja) | 1999-03-10 | 2002-11-12 | エーエスエム サイエンティフィック, インコーポレイテッド | 核酸の配列を直接決定するための方法 |
WO2000063437A2 (en) | 1999-04-20 | 2000-10-26 | Illumina, Inc. | Detection of nucleic acid reactions on bead arrays |
US6355431B1 (en) | 1999-04-20 | 2002-03-12 | Illumina, Inc. | Detection of nucleic acid amplification reactions using bead arrays |
US6372813B1 (en) | 1999-06-25 | 2002-04-16 | Motorola | Methods and compositions for attachment of biomolecules to solid supports, hydrogels, and hydrogel arrays |
US6664061B2 (en) | 1999-06-25 | 2003-12-16 | Amersham Biosciences Ab | Use and evaluation of a [2+2] photoaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix |
US6274320B1 (en) | 1999-09-16 | 2001-08-14 | Curagen Corporation | Method of sequencing a nucleic acid |
US6770441B2 (en) | 2000-02-10 | 2004-08-03 | Illumina, Inc. | Array compositions and methods of making same |
US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
GB0013276D0 (en) | 2000-06-01 | 2000-07-26 | Amersham Pharm Biotech Uk Ltd | Nucleotide analogues |
US20030064366A1 (en) | 2000-07-07 | 2003-04-03 | Susan Hardin | Real-time sequence determination |
AU2001279244A1 (en) | 2000-08-09 | 2002-02-18 | Motorola, Inc. | The use and evaluation of a (2+2) photocycloaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix |
EP1337541B1 (en) * | 2000-10-06 | 2007-03-07 | The Trustees of Columbia University in the City of New York | Massive parallel method for decoding DNA and RNA |
WO2002044425A2 (en) | 2000-12-01 | 2002-06-06 | Visigen Biotechnologies, Inc. | Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
SI3363809T1 (sl) * | 2002-08-23 | 2020-08-31 | Illumina Cambridge Limited | Modificirani nukleotidi za polinukleotidno sekvenciranje |
PT2119722T (pt) | 2002-08-23 | 2016-12-12 | Illumina Cambridge Ltd | Nucleótidos marcados |
GB0321306D0 (en) | 2003-09-11 | 2003-10-15 | Solexa Ltd | Modified polymerases for improved incorporation of nucleotide analogues |
GB0326073D0 (en) | 2003-11-07 | 2003-12-10 | Solexa Ltd | Improvements in or relating to polynucleotide arrays |
EP3175914A1 (en) | 2004-01-07 | 2017-06-07 | Illumina Cambridge Limited | Improvements in or relating to molecular arrays |
WO2006044078A2 (en) | 2004-09-17 | 2006-04-27 | Pacific Biosciences Of California, Inc. | Apparatus and method for analysis of molecules |
EP1888743B1 (en) | 2005-05-10 | 2011-08-03 | Illumina Cambridge Limited | Improved polymerases |
GB0514936D0 (en) | 2005-07-20 | 2005-08-24 | Solexa Ltd | Preparation of templates for nucleic acid sequencing |
GB0517097D0 (en) | 2005-08-19 | 2005-09-28 | Solexa Ltd | Modified nucleosides and nucleotides and uses thereof |
US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
CA2648149A1 (en) | 2006-03-31 | 2007-11-01 | Solexa, Inc. | Systems and devices for sequence by synthesis analysis |
US7754429B2 (en) | 2006-10-06 | 2010-07-13 | Illumina Cambridge Limited | Method for pair-wise sequencing a plurity of target polynucleotides |
AU2007309504B2 (en) | 2006-10-23 | 2012-09-13 | Pacific Biosciences Of California, Inc. | Polymerase enzymes and reagents for enhanced nucleic acid sequencing |
EP2639578B1 (en) | 2006-12-14 | 2016-09-14 | Life Technologies Corporation | Apparatus for measuring analytes using large scale fet arrays |
US8349167B2 (en) | 2006-12-14 | 2013-01-08 | Life Technologies Corporation | Methods and apparatus for detecting molecular interactions using FET arrays |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
EP3431615A3 (en) | 2007-10-19 | 2019-02-20 | The Trustees of Columbia University in the City of New York | Dna sequencing with non-fluorescent nucleotide reversible terminators cleavable label modified nucleotide terminators |
WO2009097368A2 (en) | 2008-01-28 | 2009-08-06 | Complete Genomics, Inc. | Methods and compositions for efficient base calling in sequencing reactions |
US20100137143A1 (en) | 2008-10-22 | 2010-06-03 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
US8951781B2 (en) | 2011-01-10 | 2015-02-10 | Illumina, Inc. | Systems, methods, and apparatuses to image a sample for biological or chemical analysis |
WO2012162429A2 (en) | 2011-05-23 | 2012-11-29 | The Trustees Of Columbia University In The City Of New York | Dna sequencing by synthesis using raman and infrared spectroscopy detection |
PT3623481T (pt) * | 2011-09-23 | 2021-10-15 | Illumina Inc | Composições para sequenciação de ácidos nucleicos |
US9012022B2 (en) | 2012-06-08 | 2015-04-21 | Illumina, Inc. | Polymer coatings |
KR102230831B1 (ko) * | 2013-03-15 | 2021-03-22 | 일루미나 케임브리지 리미티드 | 변형된 뉴클레오사이드 또는 뉴클레오타이드 |
GB201414098D0 (en) | 2014-08-08 | 2014-09-24 | Illumina Cambridge Ltd | Modified nucleotide linkers |
WO2017079498A2 (en) * | 2015-11-06 | 2017-05-11 | Intelligent Biosystems, Inc. | Nucleotide analogues |
CN105315318B (zh) | 2015-11-06 | 2019-04-19 | 山东大学 | 一种α‐L‐鼠李糖苷酶在制备5-氟-2’-脱氧脲苷衍生物中的应用 |
EP3473637A4 (en) * | 2016-06-21 | 2020-01-22 | Genedesign, Inc. | METHOD FOR SYNTHESIS OF RIBONUCLEIC ACID H-PHOSPHONATE MONOMER AND OLIGONUCLEOTID SYNTHESIS USING THIS MONOMER |
JP2019525916A (ja) * | 2016-07-27 | 2019-09-12 | ロシュ イノベーション センター コペンハーゲン エーエス | 5’s−lnaヌクレオチドおよびオリゴヌクレオチド |
US10385214B2 (en) | 2016-09-30 | 2019-08-20 | Illumina Cambridge Limited | Fluorescent dyes and their uses as biomarkers |
FI3794012T3 (fi) | 2018-05-15 | 2024-01-08 | Illumina Inc | Koostumuksia ja menetelmiä pintaan sitoutuneiden oligonukleotidien kemiallista pilkkomista ja suojauksen poistoa varten |
MX2020013347A (es) | 2018-10-31 | 2021-04-28 | Illumina Inc | Polimerasas, composiciones y metodos de uso. |
BR112020026655A2 (pt) | 2018-12-05 | 2021-04-06 | Illumina, Inc. | Polimerases, composições e métodos de uso |
CA3103744A1 (en) | 2018-12-17 | 2020-06-25 | Pietro GATTI-LAFRANCONI | Compositions for use in polynucleotide sequencing |
US11293061B2 (en) | 2018-12-26 | 2022-04-05 | Illumina Cambridge Limited | Sequencing methods using nucleotides with 3′ AOM blocking group |
JP2023531009A (ja) * | 2020-06-22 | 2023-07-20 | イルミナ ケンブリッジ リミテッド | 3’アセタールブロッキング基を有するヌクレオシド及びヌクレオチド |
-
2021
- 2021-06-21 JP JP2022578720A patent/JP2023531009A/ja active Pending
- 2021-06-21 AU AU2021295081A patent/AU2021295081A1/en active Pending
- 2021-06-21 KR KR1020227045221A patent/KR20230031837A/ko active Search and Examination
- 2021-06-21 MX MX2022016492A patent/MX2022016492A/es unknown
- 2021-06-21 IL IL297992A patent/IL297992A/en unknown
- 2021-06-21 CN CN202180044416.1A patent/CN115867560A/zh active Pending
- 2021-06-21 PE PE2022002971A patent/PE20230492A1/es unknown
- 2021-06-21 US US17/353,512 patent/US11787831B2/en active Active
- 2021-06-21 CA CA3177293A patent/CA3177293A1/en active Pending
- 2021-06-21 MA MA58991A patent/MA58991A1/fr unknown
- 2021-06-21 BR BR112022026056A patent/BR112022026056A2/pt unknown
- 2021-06-21 EP EP21737355.4A patent/EP4168421A1/en active Pending
- 2021-06-21 WO PCT/EP2021/066886 patent/WO2021259881A1/en active Application Filing
-
2022
- 2022-10-31 ZA ZA2022/11847A patent/ZA202211847B/en unknown
- 2022-12-20 CO CONC2022/0018487A patent/CO2022018487A2/es unknown
- 2022-12-20 CL CL2022003661A patent/CL2022003661A1/es unknown
-
2023
- 2023-09-28 US US18/477,379 patent/US20240132532A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4168421A1 (en) | 2023-04-26 |
IL297992A (en) | 2023-01-01 |
CA3177293A1 (en) | 2021-12-30 |
BR112022026056A2 (pt) | 2023-03-07 |
US20210403500A1 (en) | 2021-12-30 |
JP2023531009A (ja) | 2023-07-20 |
CO2022018487A2 (es) | 2023-03-07 |
MA58991A1 (fr) | 2023-03-31 |
CL2022003661A1 (es) | 2023-06-09 |
ZA202211847B (en) | 2024-02-28 |
WO2021259881A1 (en) | 2021-12-30 |
CN115867560A (zh) | 2023-03-28 |
PE20230492A1 (es) | 2023-03-23 |
MX2022016492A (es) | 2023-03-06 |
AU2021295081A1 (en) | 2022-12-08 |
US11787831B2 (en) | 2023-10-17 |
US20240132532A1 (en) | 2024-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11827931B2 (en) | Methods of preparing growing polynucleotides using nucleotides with 3′ AOM blocking group | |
KR20230031837A (ko) | 3' 아세탈 블로킹기를 갖는 뉴클레오시드 및 뉴클레오티드 | |
KR20230121556A (ko) | 긴 스토크스 이동 크로메노퀴놀린 염료 및 서열분석 응용에서의 용도 | |
JP2024516191A (ja) | ビス-ホウ素縮合複素環を含有する蛍光色素及び配列決定における使用 | |
US20230313292A1 (en) | Chromenoquinoline dyes and uses in sequencing | |
JP2024519372A (ja) | 合成によって配列決定するための組成物及び方法 | |
KR20230121555A (ko) | 알킬피리디늄 쿠마린 염료 및 서열분석 응용에서의 용도 | |
WO2023232829A1 (en) | Compositions and methods for nucleic acid sequencing | |
RU2818762C2 (ru) | Нуклеозиды и нуклеотиды с 3’-гидрокси блокирующими группами и их применение в способах секвенирования полинуклеотидов | |
US20240209015A1 (en) | Methods of sequencing using 3' blocked nucleotides | |
US20240182963A1 (en) | Methods of sequencing using 3' blocked nucleotides | |
US20240271206A1 (en) | Methods of sequencing using 3' allyl blocked nucleotides | |
WO2024137765A1 (en) | Transition-metal catalyst compositions and methods for sequencing by synthesis | |
NZ770894A (en) | Nucleosides and nucleotides with 3'-hydroxy blocking groups and their use in polynucleotide sequencing methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |