CN116761885A - 包含非天然核苷酸的多核苷酸的逆转录 - Google Patents
包含非天然核苷酸的多核苷酸的逆转录 Download PDFInfo
- Publication number
- CN116761885A CN116761885A CN202180079118.6A CN202180079118A CN116761885A CN 116761885 A CN116761885 A CN 116761885A CN 202180079118 A CN202180079118 A CN 202180079118A CN 116761885 A CN116761885 A CN 116761885A
- Authority
- CN
- China
- Prior art keywords
- natural
- rna
- nucleotide
- unnatural
- cdna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 88
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 88
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 88
- 125000003729 nucleotide group Chemical group 0.000 title claims description 251
- 239000002773 nucleotide Substances 0.000 title claims description 246
- 238000010839 reverse transcription Methods 0.000 title claims description 58
- 238000000034 method Methods 0.000 claims abstract description 181
- 239000002299 complementary DNA Substances 0.000 claims abstract description 98
- 108020004566 Transfer RNA Proteins 0.000 claims abstract description 82
- 108091028664 Ribonucleotide Proteins 0.000 claims abstract description 72
- 239000002336 ribonucleotide Substances 0.000 claims abstract description 72
- 125000002652 ribonucleotide group Chemical group 0.000 claims abstract description 72
- 102100034343 Integrase Human genes 0.000 claims abstract description 64
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims abstract description 62
- 108091008103 RNA aptamers Proteins 0.000 claims abstract description 52
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 48
- 230000002441 reversible effect Effects 0.000 claims abstract description 23
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 146
- 108091034117 Oligonucleotide Proteins 0.000 claims description 103
- 108020004635 Complementary DNA Proteins 0.000 claims description 77
- 230000035897 transcription Effects 0.000 claims description 73
- 238000013518 transcription Methods 0.000 claims description 73
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 46
- 108020004705 Codon Proteins 0.000 claims description 46
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 40
- 238000003556 assay Methods 0.000 claims description 30
- 229960002685 biotin Drugs 0.000 claims description 23
- 235000020958 biotin Nutrition 0.000 claims description 23
- 239000011616 biotin Substances 0.000 claims description 23
- 108020005098 Anticodon Proteins 0.000 claims description 21
- 238000000338 in vitro Methods 0.000 claims description 21
- 230000004544 DNA amplification Effects 0.000 claims description 20
- 230000000295 complement effect Effects 0.000 claims description 16
- 238000001727 in vivo Methods 0.000 claims description 14
- 239000005547 deoxyribonucleotide Substances 0.000 claims description 13
- 125000002637 deoxyribonucleotide group Chemical group 0.000 claims description 13
- 238000010348 incorporation Methods 0.000 claims description 12
- 241000713838 Avian myeloblastosis virus Species 0.000 claims description 11
- 241000894006 Bacteria Species 0.000 claims description 10
- 238000005406 washing Methods 0.000 claims description 10
- 108010090804 Streptavidin Proteins 0.000 claims description 8
- 229910052757 nitrogen Inorganic materials 0.000 claims description 8
- 241000713869 Moloney murine leukemia virus Species 0.000 claims description 7
- 230000003321 amplification Effects 0.000 claims description 6
- 238000001502 gel electrophoresis Methods 0.000 claims description 6
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 6
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 claims description 5
- 150000003839 salts Chemical class 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims description 4
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims description 4
- 238000006073 displacement reaction Methods 0.000 claims description 4
- 101000642823 Solanum tuberosum Granule-bound starch synthase 2, chloroplastic/amyloplastic Proteins 0.000 claims description 3
- 101000642832 Solanum tuberosum Soluble starch synthase 3, chloroplastic/amyloplastic Proteins 0.000 claims description 3
- 108020004414 DNA Proteins 0.000 description 128
- 102000039446 nucleic acids Human genes 0.000 description 103
- 108020004707 nucleic acids Proteins 0.000 description 103
- 150000007523 nucleic acids Chemical class 0.000 description 99
- 238000010804 cDNA synthesis Methods 0.000 description 72
- -1 nucleoside triphosphate Chemical class 0.000 description 63
- 235000000346 sugar Nutrition 0.000 description 57
- 230000004048 modification Effects 0.000 description 38
- 238000012986 modification Methods 0.000 description 38
- 239000000047 product Substances 0.000 description 38
- 239000002777 nucleoside Substances 0.000 description 30
- 238000006243 chemical reaction Methods 0.000 description 27
- 239000001226 triphosphate Substances 0.000 description 26
- 108090000623 proteins and genes Proteins 0.000 description 25
- 238000013519 translation Methods 0.000 description 25
- 235000011178 triphosphate Nutrition 0.000 description 25
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 24
- 230000014759 maintenance of location Effects 0.000 description 24
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 23
- 102000004169 proteins and genes Human genes 0.000 description 21
- 210000004027 cell Anatomy 0.000 description 19
- 125000003835 nucleoside group Chemical group 0.000 description 19
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 18
- 230000014509 gene expression Effects 0.000 description 18
- 235000018102 proteins Nutrition 0.000 description 18
- 108091036066 Three prime untranslated region Proteins 0.000 description 17
- 229940104302 cytosine Drugs 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 15
- 108091093037 Peptide nucleic acid Proteins 0.000 description 14
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 14
- 230000000694 effects Effects 0.000 description 14
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 14
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 13
- 125000000217 alkyl group Chemical group 0.000 description 13
- 102000053602 DNA Human genes 0.000 description 12
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 12
- 241000588724 Escherichia coli Species 0.000 description 11
- 229910019142 PO4 Inorganic materials 0.000 description 11
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 11
- 229960000643 adenine Drugs 0.000 description 11
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 11
- 235000021317 phosphate Nutrition 0.000 description 11
- 238000011160 research Methods 0.000 description 11
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 11
- 229930024421 Adenine Natural products 0.000 description 10
- 239000003153 chemical reaction reagent Substances 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 10
- 239000010452 phosphate Substances 0.000 description 10
- 229940035893 uracil Drugs 0.000 description 10
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 9
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 9
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 9
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 9
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- 229910052717 sulfur Inorganic materials 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 8
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 8
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 8
- 108091023037 Aptamer Proteins 0.000 description 8
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 8
- 239000003623 enhancer Substances 0.000 description 8
- 125000000623 heterocyclic group Chemical group 0.000 description 8
- 125000002264 triphosphate group Chemical group [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 239000011324 bead Substances 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 125000001424 substituent group Chemical group 0.000 description 7
- 150000008163 sugars Chemical class 0.000 description 7
- 239000011593 sulfur Substances 0.000 description 7
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 6
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 6
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 6
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 6
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 6
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 6
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 239000000178 monomer Substances 0.000 description 6
- 150000003833 nucleoside derivatives Chemical class 0.000 description 6
- 239000002096 quantum dot Substances 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 210000003705 ribosome Anatomy 0.000 description 6
- 108091005946 superfolder green fluorescent proteins Proteins 0.000 description 6
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 6
- UJBCLAXPPIDQEE-UHFFFAOYSA-N 5-prop-1-ynyl-1h-pyrimidine-2,4-dione Chemical compound CC#CC1=CNC(=O)NC1=O UJBCLAXPPIDQEE-UHFFFAOYSA-N 0.000 description 5
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 5
- 125000000824 D-ribofuranosyl group Chemical group [H]OC([H])([H])[C@@]1([H])OC([H])(*)[C@]([H])(O[H])[C@]1([H])O[H] 0.000 description 5
- 101000969630 Homo sapiens Monocarboxylate transporter 10 Proteins 0.000 description 5
- 102100021425 Monocarboxylate transporter 10 Human genes 0.000 description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 5
- 101710137500 T7 RNA polymerase Proteins 0.000 description 5
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 229930182470 glycoside Natural products 0.000 description 5
- 125000001475 halogen functional group Chemical group 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 239000005022 packaging material Substances 0.000 description 5
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 5
- 230000008488 polyadenylation Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 229940113082 thymine Drugs 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- UORVGPXVDQYIDP-UHFFFAOYSA-N trihydridoboron Substances B UORVGPXVDQYIDP-UHFFFAOYSA-N 0.000 description 5
- TZMSYXZUNZXBOL-UHFFFAOYSA-N 10H-phenoxazine Chemical compound C1=CC=C2NC3=CC=CC=C3OC2=C1 TZMSYXZUNZXBOL-UHFFFAOYSA-N 0.000 description 4
- ICSNLGPSRYBMBD-UHFFFAOYSA-N 2-aminopyridine Chemical compound NC1=CC=CC=N1 ICSNLGPSRYBMBD-UHFFFAOYSA-N 0.000 description 4
- ZLAQATDNGLKIEV-UHFFFAOYSA-N 5-methyl-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CC1=CNC(=S)NC1=O ZLAQATDNGLKIEV-UHFFFAOYSA-N 0.000 description 4
- 229960005508 8-azaguanine Drugs 0.000 description 4
- UJOBWOGCFQCDNV-UHFFFAOYSA-N 9H-carbazole Chemical compound C1=CC=C2C3=CC=CC=C3NC2=C1 UJOBWOGCFQCDNV-UHFFFAOYSA-N 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 4
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 239000012445 acidic reagent Substances 0.000 description 4
- 125000000304 alkynyl group Chemical group 0.000 description 4
- 150000001408 amides Chemical class 0.000 description 4
- 235000001014 amino acid Nutrition 0.000 description 4
- 150000001413 amino acids Chemical class 0.000 description 4
- 125000004429 atom Chemical group 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 125000004093 cyano group Chemical group *C#N 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 239000000539 dimer Substances 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 150000002338 glycosides Chemical class 0.000 description 4
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 4
- 239000010931 gold Substances 0.000 description 4
- 229910052737 gold Inorganic materials 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 125000005647 linker group Chemical group 0.000 description 4
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 4
- 229910052760 oxygen Inorganic materials 0.000 description 4
- 150000004713 phosphodiesters Chemical class 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 150000003212 purines Chemical group 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 230000005945 translocation Effects 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- QSHACTSJHMKXTE-UHFFFAOYSA-N 2-(2-aminopropyl)-7h-purin-6-amine Chemical compound CC(N)CC1=NC(N)=C2NC=NC2=N1 QSHACTSJHMKXTE-UHFFFAOYSA-N 0.000 description 3
- 108020003589 5' Untranslated Regions Proteins 0.000 description 3
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 3
- DCPSTSVLRXOYGS-UHFFFAOYSA-N 6-amino-1h-pyrimidine-2-thione Chemical compound NC1=CC=NC(S)=N1 DCPSTSVLRXOYGS-UHFFFAOYSA-N 0.000 description 3
- QNNARSZPGNJZIX-UHFFFAOYSA-N 6-amino-5-prop-1-ynyl-1h-pyrimidin-2-one Chemical class CC#CC1=CNC(=O)N=C1N QNNARSZPGNJZIX-UHFFFAOYSA-N 0.000 description 3
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 3
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 description 3
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 description 3
- 108091093088 Amplicon Proteins 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 3
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 3
- 241000723873 Tobacco mosaic virus Species 0.000 description 3
- 108700009124 Transcription Initiation Site Proteins 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 3
- 125000003342 alkenyl group Chemical group 0.000 description 3
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 239000011230 binding agent Substances 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 229910000085 borane Inorganic materials 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical group C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 3
- 239000005549 deoxyribonucleoside Substances 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 3
- 239000001177 diphosphate Substances 0.000 description 3
- 235000011180 diphosphates Nutrition 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 150000004712 monophosphates Chemical class 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 239000002342 ribonucleoside Substances 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 229940075420 xanthine Drugs 0.000 description 3
- RHUYHJGZWVXEHW-UHFFFAOYSA-N 1,1-Dimethyhydrazine Chemical compound CN(C)N RHUYHJGZWVXEHW-UHFFFAOYSA-N 0.000 description 2
- FYADHXFMURLYQI-UHFFFAOYSA-N 1,2,4-triazine Chemical class C1=CN=NC=N1 FYADHXFMURLYQI-UHFFFAOYSA-N 0.000 description 2
- RFLVMTUMFYRZCB-UHFFFAOYSA-N 1-methylguanine Chemical class O=C1N(C)C(N)=NC2=C1N=CN2 RFLVMTUMFYRZCB-UHFFFAOYSA-N 0.000 description 2
- VSNHCAURESNICA-NJFSPNSNSA-N 1-oxidanylurea Chemical compound N[14C](=O)NO VSNHCAURESNICA-NJFSPNSNSA-N 0.000 description 2
- WJFKNYWRSNBZNX-UHFFFAOYSA-N 10H-phenothiazine Chemical compound C1=CC=C2NC3=CC=CC=C3SC2=C1 WJFKNYWRSNBZNX-UHFFFAOYSA-N 0.000 description 2
- UHUHBFMZVCOEOV-UHFFFAOYSA-N 1h-imidazo[4,5-c]pyridin-4-amine Chemical compound NC1=NC=CC2=C1N=CN2 UHUHBFMZVCOEOV-UHFFFAOYSA-N 0.000 description 2
- SXUXMRMBWZCMEN-UHFFFAOYSA-N 2'-O-methyl uridine Natural products COC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 SXUXMRMBWZCMEN-UHFFFAOYSA-N 0.000 description 2
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 2
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 2
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- WDWFZSFRBRXSCG-UHFFFAOYSA-N 5-acetyl-6-amino-1h-pyrimidin-2-one Chemical compound CC(=O)C=1C=NC(=O)NC=1N WDWFZSFRBRXSCG-UHFFFAOYSA-N 0.000 description 2
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 2
- PNWOYKVCNDZOLS-UHFFFAOYSA-N 6-amino-5-chloro-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1Cl PNWOYKVCNDZOLS-UHFFFAOYSA-N 0.000 description 2
- HRYKDUPGBWLLHO-UHFFFAOYSA-N 8-azaadenine Chemical compound NC1=NC=NC2=NNN=C12 HRYKDUPGBWLLHO-UHFFFAOYSA-N 0.000 description 2
- LPXQRXLUHJKZIE-UHFFFAOYSA-N 8-azaguanine Chemical compound NC1=NC(O)=C2NN=NC2=N1 LPXQRXLUHJKZIE-UHFFFAOYSA-N 0.000 description 2
- FJNCXZZQNBKEJT-UHFFFAOYSA-N 8beta-hydroxymarrubiin Natural products O1C(=O)C2(C)CCCC3(C)C2C1CC(C)(O)C3(O)CCC=1C=COC=1 FJNCXZZQNBKEJT-UHFFFAOYSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical group N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 108010006654 Bleomycin Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 239000004593 Epoxy Substances 0.000 description 2
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical class C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 101710203526 Integrase Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241001127867 Memecylon malabaricum Species 0.000 description 2
- 241000205276 Methanosarcina Species 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- 108091036407 Polyadenylation Proteins 0.000 description 2
- 241000723762 Potato virus Y Species 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 108091030071 RNAI Proteins 0.000 description 2
- 108091027981 Response element Proteins 0.000 description 2
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 2
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 2
- 241000121220 Tricholoma matsutake Species 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 125000000129 anionic group Chemical group 0.000 description 2
- 239000008346 aqueous phase Substances 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- 229960001561 bleomycin Drugs 0.000 description 2
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 210000004671 cell-free system Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 125000000753 cycloalkyl group Chemical group 0.000 description 2
- DAEAPNUQQAICNR-RRKCRQDMSA-K dADP(3-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP([O-])(=O)OP([O-])([O-])=O)O1 DAEAPNUQQAICNR-RRKCRQDMSA-K 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- FTDHDKPUHBLBTL-SHYZEUOFSA-K dCDP(3-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 FTDHDKPUHBLBTL-SHYZEUOFSA-K 0.000 description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 2
- CIKGWCTVFSRMJU-KVQBGUIXSA-N dGDP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 CIKGWCTVFSRMJU-KVQBGUIXSA-N 0.000 description 2
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 2
- UJLXYODCHAELLY-XLPZGREQSA-N dTDP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 UJLXYODCHAELLY-XLPZGREQSA-N 0.000 description 2
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 2
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 2
- KHWCHTKSEGGWEX-UHFFFAOYSA-N deoxyadenylic acid Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(O)=O)O1 KHWCHTKSEGGWEX-UHFFFAOYSA-N 0.000 description 2
- LTFMZDNNPPEQNG-UHFFFAOYSA-N deoxyguanylic acid Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1CC(O)C(COP(O)(O)=O)O1 LTFMZDNNPPEQNG-UHFFFAOYSA-N 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 229960002949 fluorouracil Drugs 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 2
- 229910052736 halogen Inorganic materials 0.000 description 2
- 150000002367 halogens Chemical class 0.000 description 2
- 125000005842 heteroatom Chemical group 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 229950000688 phenothiazine Drugs 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- UBQKCCHYAOITMY-UHFFFAOYSA-N pyridin-2-ol Chemical compound OC1=CC=CC=N1 UBQKCCHYAOITMY-UHFFFAOYSA-N 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- 229910052711 selenium Inorganic materials 0.000 description 2
- 239000011669 selenium Substances 0.000 description 2
- 230000003584 silencer Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- CCEKAJIANROZEO-UHFFFAOYSA-N sulfluramid Chemical group CCNS(=O)(=O)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)F CCEKAJIANROZEO-UHFFFAOYSA-N 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- WYWHKKSPHMUBEB-UHFFFAOYSA-N tioguanine Chemical compound N1C(N)=NC(=S)C2=C1N=CN2 WYWHKKSPHMUBEB-UHFFFAOYSA-N 0.000 description 2
- 229960003087 tioguanine Drugs 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- FDKWRPBBCBCIGA-REOHCLBHSA-N (2r)-2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]C[C@H](N)C(O)=O FDKWRPBBCBCIGA-REOHCLBHSA-N 0.000 description 1
- YXNFFSXHFLOZEA-KIUQBJHFSA-N (3S,8S,9S,10R,13S,14S,17R)-N-hexyl-3,16-dihydroxy-10,13-dimethyl-17-[(2R)-6-methylheptan-2-yl]-1,2,3,4,7,8,9,11,12,14,15,17-dodecahydrocyclopenta[a]phenanthrene-16-carboxamide Chemical group C(CCCCC)NC(=O)C1([C@@H]([C@]2(CC[C@@H]3[C@]4(CC[C@@H](CC4=CC[C@H]3[C@@H]2C1)O)C)C)[C@H](C)CCCC(C)C)O YXNFFSXHFLOZEA-KIUQBJHFSA-N 0.000 description 1
- 125000000008 (C1-C10) alkyl group Chemical group 0.000 description 1
- DWANEFRJKWXRSG-UHFFFAOYSA-N 1,2-tetradecanediol Chemical group CCCCCCCCCCCCC(O)CO DWANEFRJKWXRSG-UHFFFAOYSA-N 0.000 description 1
- KNLNWXXWKDEEFW-JIOCBJNQSA-N 1-[(1r,4s,6r,7s)-7-hydroxy-4-(hydroxymethyl)-2,5-dioxabicyclo[2.2.1]heptan-6-yl]pyrimidine-2,4-dione Chemical compound N1([C@@H]2O[C@]3(CO[C@@]2([C@@H]3O)[H])CO)C=CC(=O)NC1=O KNLNWXXWKDEEFW-JIOCBJNQSA-N 0.000 description 1
- MXHRCPNRJAMMIM-ULQXZJNLSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidine-2,4-dione Chemical compound O=C1NC(=O)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 MXHRCPNRJAMMIM-ULQXZJNLSA-N 0.000 description 1
- VUFVGYBIFMCJPB-UHFFFAOYSA-N 1-iodopyrimidine-2,4-dione Chemical compound IN1C=CC(=O)NC1=O VUFVGYBIFMCJPB-UHFFFAOYSA-N 0.000 description 1
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- 108020004463 18S ribosomal RNA Proteins 0.000 description 1
- RFCQJGFZUQFYRF-UHFFFAOYSA-N 2'-O-Methylcytidine Natural products COC1C(O)C(CO)OC1N1C(=O)N=C(N)C=C1 RFCQJGFZUQFYRF-UHFFFAOYSA-N 0.000 description 1
- RFCQJGFZUQFYRF-ZOQUXTDFSA-N 2'-O-methylcytidine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=C(N)C=C1 RFCQJGFZUQFYRF-ZOQUXTDFSA-N 0.000 description 1
- SXUXMRMBWZCMEN-ZOQUXTDFSA-N 2'-O-methyluridine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 SXUXMRMBWZCMEN-ZOQUXTDFSA-N 0.000 description 1
- HLYBTPMYFWWNJN-UHFFFAOYSA-N 2-(2,4-dioxo-1h-pyrimidin-5-yl)-2-hydroxyacetic acid Chemical compound OC(=O)C(O)C1=CNC(=O)NC1=O HLYBTPMYFWWNJN-UHFFFAOYSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical compound NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- LLWPKTDSDUQBFY-UHFFFAOYSA-N 2-[6-(aminomethyl)-2,4-dioxo-1H-pyrimidin-5-yl]acetic acid Chemical compound C(=O)(O)CC=1C(NC(NC=1CN)=O)=O LLWPKTDSDUQBFY-UHFFFAOYSA-N 0.000 description 1
- GEJVQCKUQZXHFN-UHFFFAOYSA-N 2-[6-(aminomethyl)-4-oxo-2-sulfanylidene-1H-pyrimidin-5-yl]acetic acid Chemical compound C(=O)(O)CC=1C(NC(NC=1CN)=S)=O GEJVQCKUQZXHFN-UHFFFAOYSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- XMSMHKMPBNTBOD-UHFFFAOYSA-N 2-dimethylamino-6-hydroxypurine Chemical class N1C(N(C)C)=NC(=O)C2=C1N=CN2 XMSMHKMPBNTBOD-UHFFFAOYSA-N 0.000 description 1
- WKMPTBDYDNUJLF-UHFFFAOYSA-N 2-fluoroadenine Chemical compound NC1=NC(F)=NC2=C1N=CN2 WKMPTBDYDNUJLF-UHFFFAOYSA-N 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- USCCECGPGBGFOM-UHFFFAOYSA-N 2-propyl-7h-purin-6-amine Chemical compound CCCC1=NC(N)=C2NC=NC2=N1 USCCECGPGBGFOM-UHFFFAOYSA-N 0.000 description 1
- FPOVCZDHZSAAIX-UHFFFAOYSA-N 4-amino-5,6-dihydro-1h-pyrimidin-2-one Chemical compound NC1=NC(=O)NCC1 FPOVCZDHZSAAIX-UHFFFAOYSA-N 0.000 description 1
- MQJSSLBGAQJNER-UHFFFAOYSA-N 5-(methylaminomethyl)-1h-pyrimidine-2,4-dione Chemical compound CNCC1=CNC(=O)NC1=O MQJSSLBGAQJNER-UHFFFAOYSA-N 0.000 description 1
- WPYRHVXCOQLYLY-UHFFFAOYSA-N 5-[(methoxyamino)methyl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CONCC1=CNC(=S)NC1=O WPYRHVXCOQLYLY-UHFFFAOYSA-N 0.000 description 1
- MFEFTTYGMZOIKO-UHFFFAOYSA-N 5-azacytosine Chemical compound NC1=NC=NC(=O)N1 MFEFTTYGMZOIKO-UHFFFAOYSA-N 0.000 description 1
- ZFTBZKVVGZNMJR-UHFFFAOYSA-N 5-chlorouracil Chemical compound ClC1=CNC(=O)NC1=O ZFTBZKVVGZNMJR-UHFFFAOYSA-N 0.000 description 1
- KSNXJLQDQOIRIP-UHFFFAOYSA-N 5-iodouracil Chemical compound IC1=CNC(=O)NC1=O KSNXJLQDQOIRIP-UHFFFAOYSA-N 0.000 description 1
- KELXHQACBIUYSE-UHFFFAOYSA-N 5-methoxy-1h-pyrimidine-2,4-dione Chemical compound COC1=CNC(=O)NC1=O KELXHQACBIUYSE-UHFFFAOYSA-N 0.000 description 1
- GSPMCUUYNASDHM-UHFFFAOYSA-N 5-methyl-4-sulfanylidene-1h-pyrimidin-2-one Chemical compound CC1=CNC(=O)N=C1S GSPMCUUYNASDHM-UHFFFAOYSA-N 0.000 description 1
- KDOPAZIWBAHVJB-UHFFFAOYSA-N 5h-pyrrolo[3,2-d]pyrimidine Chemical compound C1=NC=C2NC=CC2=N1 KDOPAZIWBAHVJB-UHFFFAOYSA-N 0.000 description 1
- TVICROIWXBFQEL-UHFFFAOYSA-N 6-(ethylamino)-1h-pyrimidin-2-one Chemical compound CCNC1=CC=NC(=O)N1 TVICROIWXBFQEL-UHFFFAOYSA-N 0.000 description 1
- KXBCLNRMQPRVTP-UHFFFAOYSA-N 6-amino-1,5-dihydroimidazo[4,5-c]pyridin-4-one Chemical compound O=C1NC(N)=CC2=C1N=CN2 KXBCLNRMQPRVTP-UHFFFAOYSA-N 0.000 description 1
- OHILKUISCGPRMQ-UHFFFAOYSA-N 6-amino-5-(trifluoromethyl)-1h-pyrimidin-2-one Chemical compound NC1=NC(=O)NC=C1C(F)(F)F OHILKUISCGPRMQ-UHFFFAOYSA-N 0.000 description 1
- QFVKLKDEXOWFSL-UHFFFAOYSA-N 6-amino-5-bromo-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1Br QFVKLKDEXOWFSL-UHFFFAOYSA-N 0.000 description 1
- NLLCDONDZDHLCI-UHFFFAOYSA-N 6-amino-5-hydroxy-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1O NLLCDONDZDHLCI-UHFFFAOYSA-N 0.000 description 1
- UFVWJVAMULFOMC-UHFFFAOYSA-N 6-amino-5-iodo-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1I UFVWJVAMULFOMC-UHFFFAOYSA-N 0.000 description 1
- SPDBZGFVYQCVIU-UHFFFAOYSA-N 6-amino-5-nitro-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1[N+]([O-])=O SPDBZGFVYQCVIU-UHFFFAOYSA-N 0.000 description 1
- SHZGCJCMOBCMKK-UHFFFAOYSA-N 6-methyloxane-2,3,4,5-tetrol Chemical compound CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 1
- NJBMMMJOXRZENQ-UHFFFAOYSA-N 6H-pyrrolo[2,3-f]quinoline Chemical compound c1cc2ccc3[nH]cccc3c2n1 NJBMMMJOXRZENQ-UHFFFAOYSA-N 0.000 description 1
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 1
- RGKBRPAAQSHTED-UHFFFAOYSA-N 8-oxoadenine Chemical compound NC1=NC=NC2=C1NC(=O)N2 RGKBRPAAQSHTED-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241000724328 Alfalfa mosaic virus Species 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 241000180579 Arca Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- UHDGCWIWMRVCDJ-CCXZUQQUSA-N Cytarabine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-CCXZUQQUSA-N 0.000 description 1
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 108091007413 Extracellular RNA Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 241000243320 Hydrozoa Species 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- ZFOMKMMPBOQKMC-KXUCPTDWSA-N L-pyrrolysine Chemical compound C[C@@H]1CC=N[C@H]1C(=O)NCCCC[C@H]([NH3+])C([O-])=O ZFOMKMMPBOQKMC-KXUCPTDWSA-N 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000112987 Metagyndes martensii Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000205274 Methanosarcina mazei Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108091060545 Nonsense suppressor Proteins 0.000 description 1
- 241000692885 Nymphalis antiopa Species 0.000 description 1
- 229910003849 O-Si Inorganic materials 0.000 description 1
- TTZMPOZCBFTTPR-UHFFFAOYSA-N O=P1OCO1 Chemical class O=P1OCO1 TTZMPOZCBFTTPR-UHFFFAOYSA-N 0.000 description 1
- REYJJPSVUYRZGE-UHFFFAOYSA-N Octadecylamine Chemical compound CCCCCCCCCCCCCCCCCCN REYJJPSVUYRZGE-UHFFFAOYSA-N 0.000 description 1
- 229910003872 O—Si Inorganic materials 0.000 description 1
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 1
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 1
- 241000723997 Pea seed-borne mosaic virus Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101100273253 Rhizopus niveus RNAP gene Proteins 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 1
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- GNVMUORYQLCPJZ-UHFFFAOYSA-M Thiocarbamate Chemical compound NC([S-])=O GNVMUORYQLCPJZ-UHFFFAOYSA-M 0.000 description 1
- 102000002262 Thromboplastin Human genes 0.000 description 1
- 108010000499 Thromboplastin Proteins 0.000 description 1
- 241000723792 Tobacco etch virus Species 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 235000018936 Vitellaria paradoxa Nutrition 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- XVIYCJDWYLJQBG-UHFFFAOYSA-N acetic acid;adamantane Chemical compound CC(O)=O.C1C(C2)CC3CC1CC2C3 XVIYCJDWYLJQBG-UHFFFAOYSA-N 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 125000002877 alkyl aryl group Chemical group 0.000 description 1
- SRBFZHDQGSBBOR-STGXQOJASA-N alpha-D-lyxopyranose Chemical compound O[C@@H]1CO[C@H](O)[C@@H](O)[C@H]1O SRBFZHDQGSBBOR-STGXQOJASA-N 0.000 description 1
- 125000004103 aminoalkyl group Chemical group 0.000 description 1
- 125000005122 aminoalkylamino group Chemical group 0.000 description 1
- ZPMDWBAJBPEQIV-UHFFFAOYSA-N aminophosphonic acid trihydroxy(sulfanylidene)-lambda5-phosphane Chemical class NP(O)(O)=O.OP(O)(O)=S ZPMDWBAJBPEQIV-UHFFFAOYSA-N 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 125000003710 aryl alkyl group Chemical group 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000001488 beta-D-galactosyl group Chemical group C1([C@H](O)[C@@H](O)[C@@H](O)[C@H](O1)CO)* 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 1
- 229960003669 carbenicillin Drugs 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- OGEBRHQLRGFBNV-RZDIXWSQSA-N chembl2036808 Chemical compound C12=NC(NCCCC)=NC=C2C(C=2C=CC(F)=CC=2)=NN1C[C@H]1CC[C@H](N)CC1 OGEBRHQLRGFBNV-RZDIXWSQSA-N 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 235000019416 cholic acid Nutrition 0.000 description 1
- 239000002812 cholic acid derivative Substances 0.000 description 1
- 150000001842 cholic acids Chemical class 0.000 description 1
- 238000010959 commercial synthesis reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001687 destabilization Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- NKDDWNXOKDWJAK-UHFFFAOYSA-N dimethoxymethane Chemical compound COCOC NKDDWNXOKDWJAK-UHFFFAOYSA-N 0.000 description 1
- KPUWHANPEXNPJT-UHFFFAOYSA-N disiloxane Chemical class [SiH3]O[SiH3] KPUWHANPEXNPJT-UHFFFAOYSA-N 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007515 enzymatic degradation Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- CHNUOJQWGUIOLD-NFZZJPOKSA-N epalrestat Chemical compound C=1C=CC=CC=1\C=C(/C)\C=C1/SC(=S)N(CC(O)=O)C1=O CHNUOJQWGUIOLD-NFZZJPOKSA-N 0.000 description 1
- 210000004265 eukaryotic small ribosome subunit Anatomy 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- XRECTZIEBJDKEO-UHFFFAOYSA-N flucytosine Chemical compound NC1=NC(=O)NC=C1F XRECTZIEBJDKEO-UHFFFAOYSA-N 0.000 description 1
- 229960004413 flucytosine Drugs 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 125000003843 furanosyl group Chemical class 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 235000003869 genetically modified organism Nutrition 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 125000003827 glycol group Chemical group 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 125000004415 heterocyclylalkyl group Chemical group 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 230000036571 hydration Effects 0.000 description 1
- 238000006703 hydration reaction Methods 0.000 description 1
- 150000002431 hydrogen Chemical class 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 1
- 239000005457 ice water Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 150000005625 indol-2-ones Chemical class 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000138 intercalating agent Substances 0.000 description 1
- 238000009830 intercalation Methods 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- 210000003093 intracellular space Anatomy 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 150000002632 lipids Chemical group 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- MJGXOSYVWHETDC-UHFFFAOYSA-N methoxymethanethiol Chemical compound COCS MJGXOSYVWHETDC-UHFFFAOYSA-N 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 108010087904 neutravidin Proteins 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 125000001181 organosilyl group Chemical group [SiH3]* 0.000 description 1
- 125000001312 palmitoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 239000000123 paper Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- ONTNXMBMXUNDBF-UHFFFAOYSA-N pentatriacontane-17,18,19-triol Chemical compound CCCCCCCCCCCCCCCCC(O)C(O)C(O)CCCCCCCCCCCCCCCC ONTNXMBMXUNDBF-UHFFFAOYSA-N 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 230000003285 pharmacodynamic effect Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 150000003014 phosphoric acid esters Chemical class 0.000 description 1
- 125000004437 phosphorous atom Chemical group 0.000 description 1
- 150000003017 phosphorus Chemical class 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 229920000768 polyamine Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 125000003132 pyranosyl group Chemical class 0.000 description 1
- RXTQGIIIYVEHBN-UHFFFAOYSA-N pyrimido[4,5-b]indol-2-one Chemical compound C1=CC=CC2=NC3=NC(=O)N=CC3=C21 RXTQGIIIYVEHBN-UHFFFAOYSA-N 0.000 description 1
- SRBUGYKMBLUTIS-UHFFFAOYSA-N pyrrolo[2,3-d]pyrimidin-2-one Chemical compound O=C1N=CC2=CC=NC2=N1 SRBUGYKMBLUTIS-UHFFFAOYSA-N 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006894 reductive elimination reaction Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 125000006853 reporter group Chemical group 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 125000006413 ring segment Chemical group 0.000 description 1
- 150000003335 secondary amines Chemical class 0.000 description 1
- 229940055619 selenocysteine Drugs 0.000 description 1
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 1
- 235000016491 selenocysteine Nutrition 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- IIACRCGMVDHOTQ-UHFFFAOYSA-N sulfamic acid Chemical group NS(O)(=O)=O IIACRCGMVDHOTQ-UHFFFAOYSA-N 0.000 description 1
- 150000003456 sulfonamides Chemical group 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 150000003457 sulfones Chemical group 0.000 description 1
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 1
- 150000003462 sulfoxides Chemical class 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 150000003568 thioethers Chemical class 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 125000002948 undecyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1048—SELEX
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1276—RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/10—Nucleotidyl transfering
- C12Q2521/107—RNA dependent DNA polymerase,(i.e. reverse transcriptase)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/101—Modifications characterised by incorporating non-naturally occurring nucleotides, e.g. inosine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/155—Modifications characterised by incorporating/generating a new priming site
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/179—Modifications characterised by incorporating arbitrary or random nucleotide sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/185—Modifications characterised by incorporating bases where the precise position of the bases in the nucleic acid string is important
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/205—Aptamer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/131—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a member of a cognate binding pair, i.e. extends to antibodies, haptens, avidin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/179—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07049—RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本文公开了逆转录包含非天然核糖核苷酸的多核苷酸的方法,所述方法包括在存在包含非天然核碱基的非天然dNTP的情况下用逆转录酶逆转录所述多核苷酸,其中所述逆转录酶使其中掺入了所述非天然NTP的cDNA聚合。在一些实施方案中,所述多核苷酸以小于或等于约500nM的浓度存在,和/或所述多核苷酸是tRNA、mRNA、RNA适配体、或多种RNA适配体侯选物的成员。
Description
相关申请的交叉引用
本申请要求2020年10月23日提交的美国临时专利申请号63/104,785的权益,将其通过引用以其整体并入本文以用于所有目的。
关于联邦资助研究的声明
本发明是在由美国国立卫生研究院授予的授权号GM118178下在美国政府支持下完成的。政府拥有本发明中的某些权利。
序列表
[0001.1]本申请含有已经以ASCII格式电子提交并且通过引用以其整体特此并入的序列表。2021年10月22日创建的所述ASCII副本命名为36271-812_601_SL.txt并且大小为12,499字节。
背景技术和发明内容
61个有义密码子/20个氨基酸遗传密码在其发现后被认为在所有生物体中是不变的、保守的。然而,深入的表征揭示了出乎意料的可塑性,其中密码子分配改变,甚至在极少数情况下扩展到包含非经典氨基酸(ncAA)硒代半胱氨酸或吡咯赖氨酸。(Yuan,J.等人FEBSLett.2010,584,342–349;Hao,B.等人Science 2002,296,1462–1466;Kryukov,G.V.等人Science 2003,300,1439–1443.)所有这些改变都是由天然密码子的重新分配引起的,并且类似的策略构成了重要努力的基础,所述重要努力是通过利用终止密码子和重新编码的阻抑tRNA/氨酰基tRNA合成酶(aaRS)的正交对来扩展密码子以包含目的ncAA。(Xiao,H.等人Cold Spring Harb.Perspect.Biol.2016,8;Wang,L.等人Annu.Rev.Biophys.Biomol.Struct.2006,35,225–249.)这些重新分配策略的替代方案是经由开发非天然碱基对(UBP)来聚焦于创造新的密码子。(Malyshev,D.A.等人,Nature 2014,509,385–388;Zhang,Y.等人Nature 2017,551,644–647.)最值得注意的是,包括(d)NaM-(d)TPT3 UBP(图1)在内的若干种UBP已被用于创建基于大肠杆菌(E.coli)的半合成生物体(SSO),所述半合成生物体在其DNA中保留UBP,将它们转录至mRNA和tRNA中,并且当与用ncAA选择性地氨基酰化携带非天然反密码子的tRNA的aaRS一起提供时,利用它们翻译含有ncAA的蛋白质。
虽然(d)NaM-(d)TPT3 UBP能够产生非天然蛋白质,但掺入ncAA的效率取决于其序列背景,使得一些密码子比其他密码子更高效。通过检查序列背景,已经鉴定出许多密码子,所述密码子被有效地复制为DNA,然后被有效地转录为RNA并在核糖体上解码。(Fischer,E.C.等人Nat.Chem.Biol.2020,16,570–576.)由于对于在SSO的DNA中UBP的保留的测定是可用的,因此了解到几个效率较低的密码子的保真度降低是由较差的转录或较差的翻译引起的。然而,缺乏用于测量转录保真度的测定妨碍了对影响保真度的特定步骤的鉴定。此外,虽然清楚地知道不同的DNA聚合酶、T7 RNA聚合酶和大肠杆菌核糖体能够有效地识别UBP,但介导唯一其他常见的DNA/RNA转换的逆转录酶的能力尚未得到充分探索,并且唯一可用的数据表明它们可能无法有效地识别UBP。(Eggert等人,Towards ReverseTranscription with an Expanded Genetic Alphabet.Chembiochem2019,20,1642–1645.)因此,需要用于逆转录包含非天然核苷酸的多核苷酸的方法以及可以测定转录和逆转录的保真度的方法,后一种方法使得SSO ncAA掺入蛋白质中的保真度可以被理解为与转录和翻译的相对贡献有关。
此外,RNA寡核苷酸可以作为识别特定靶标(例如,用于抑制或检测靶标的目的)的适配体发挥作用。然而,从寡核苷酸文库(具有不同核苷酸序列的寡核苷酸的大型混合物)筛选和选择RNA适配体通常涉及将RNA转化为cDNA的逆转录步骤。因此,为了开发包含非天然核苷酸的RNA适配体,还需要逆转录包含非天然核酸的RNA的方法。
因此,提供了以下实施方案。实施方案1是一种逆转录包含非天然核糖核苷酸的多核苷酸的方法,所述方法包括在存在包含非天然核碱基的非天然dNTP的情况下用逆转录酶逆转录所述多核苷酸,
其中所述逆转录酶使cDNA聚合,所述非天然dNTP作为非天然核苷酸掺入所述cDNA中。
实施方案2是实施方案1所述的方法,其中:
所述多核苷酸以小于或等于约500nM的浓度存在。
实施方案2.1是前述实施方案中任一项所述的方法,其中所述逆转录酶是SuperScript III。
实施方案2.2是前述实施方案中任一项所述的方法,其中所述非天然dNTP不是dTPT3TP。
实施方案2.3是前述实施方案中任一项所述的方法,其中所述方法进一步包括使用识别所述非天然核苷酸的结合配偶体测量所述cDNA中的所述非天然核苷酸的量。
实施方案2.4是前述实施方案中任一项所述的方法,其中所述逆转录酶产生全长cDNA,并且至少25%的所述全长cDNA包含所述非天然核苷酸。
实施方案2.5是前述实施方案中任一项所述的方法,其中所述多核苷酸是tRNA、mRNA、RNA适配体、或多种RNA适配体侯选物的成员。
实施方案3是前述实施方案中任一项所述的方法,其中所述多核苷酸是RNA,任选地其中所述RNA是mRNA或tRNA。
实施方案4是实施方案1-3中任一项所述的方法,所述方法进一步包括测量所述cDNA中的所述非天然核苷酸的量。
实施方案5是一种测量非天然核苷酸的掺入的方法,所述方法包括:
a.在存在包含第一非天然核碱基的非天然NTP的情况下用RNA聚合酶转录包含非天然脱氧核糖核苷酸的多核苷酸以产生包含第一非天然核苷酸的RNA;
b.在存在包含第二非天然核碱基的非天然dNTP的情况下用逆转录酶逆转录所述RNA,其中所述逆转录酶使cDNA聚合,所述非天然NTP作为第二非天然核苷酸掺入所述cDNA中;以及
c.测量所述cDNA中的所述第二非天然核苷酸的量。
实施方案5.1是实施方案5所述的方法,所述方法是测量转录和逆转录的组合保真度的方法。
实施方案5.2是实施方案5所述的方法,所述方法是测量在转录和逆转录期间非天然核苷酸的保留的方法。
实施方案6是实施方案5-5.2中任一项所述的方法,其中所述转录步骤是在体内进行的。
实施方案7是前一项实施方案所述的方法,其中所述转录步骤是在原核生物或细菌中进行的。
实施方案8是前一项实施方案所述的方法,其中所述转录步骤是在大肠杆菌中进行的。
实施方案9是实施方案5所述的方法,其中所述转录步骤是在体外进行的。
实施方案10是实施方案5-9中任一项所述的方法,其中所述cDNA分子中的所述第二非天然核苷酸的量是相对于转录前所述多核苷酸中的所述非天然脱氧核糖核苷酸的量进行测量的。
实施方案11是实施方案5-10中任一项所述的方法,其中所述测量包括:
a.在转录前对所述多核苷酸进行生物素移位测定以测定转录前含有所述非天然核苷酸的多核苷酸的比例;以及
b.对所述cDNA进行生物素移位测定以测定含有所述非天然核苷酸的cDNA的比例。
实施方案12是实施方案4-10中任一项所述的方法,其中所述cDNA中的所述非天然核苷酸或所述第二非天然核苷酸的量是使用结合非天然核碱基的结合配偶体测量的。
实施方案13是实施方案4-10中任一项所述的方法,其中测量所述cDNA中的所述非天然核苷酸或所述第二非天然核苷酸的量包括凝胶移位测定或生物素移位测定。
实施方案14是前一项实施方案所述的方法,其中所述生物素移位测定包括:
a.在存在与所述cDNA中的所述非天然核苷酸配对的包含生物素化核碱基的非天然dNTP的情况下扩增所述cDNA;
b.将包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核苷酸的DNA扩增产物分离;以及
c.测量包含所述生物素化核苷酸的DNA扩增产物和不包含所述生物素化核苷酸的DNA扩增产物的量,或包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核苷酸的DNA扩增产物的比率,或含有所述非天然核苷酸的cDNA的比例。
实施方案15是前一项实施方案所述的方法,其中将包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核碱基的DNA扩增产物分离包括凝胶电泳,任选地其中所述凝胶电泳是聚丙烯酰胺凝胶电泳。
实施方案16是实施方案14-15中任一项所述的方法,其中将包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核苷酸的DNA扩增产物分离包括将所述扩增产物与链霉亲和素一起孵育。
实施方案17是前述实施方案中任一项所述的方法,其中所述RNA或多核苷酸在逆转录期间以小于或等于约1μM的浓度存在。
实施方案18是前述实施方案中任一项所述的方法,其中所述RNA或多核苷酸在逆转录期间以约1-10nM、约10-20nM、约20-30nM、约30-40nM、约40-50nM、约50-75nM、约75-100nM、约100-150nM、约150-200nM、约200-300nM、约300-400nM或约400-500nM范围内的浓度存在。
实施方案19是前述实施方案中任一项所述的方法,其中所述逆转录酶产生全长cDNA,并且其中至少25%的所述全长cDNA包含所述非天然核苷酸。
实施方案20是前一项实施方案所述的方法,其中至少50%、75%、80%、85%、90%、95%、97%、98%或99%的所述未截短的cDNA包含所述非天然核苷酸。
实施方案21是前述实施方案中任一项所述的方法,其中包含所述非天然核糖核苷酸的RNA或多核苷酸是mRNA。
实施方案22是实施方案20所述的方法,其中所述非天然核糖核苷酸(X或Y)位于所述mRNA的密码子的第一位置(X-N-N或Y-N-N)。
实施方案23是实施方案20所述的方法,其中所述非天然核糖核苷酸(X或Y)位于所述mRNA的密码子的中间位置(N-X-N或N-Y-N)。
实施方案24是实施方案20所述的方法,其中所述非天然核糖核苷酸(X或Y)位于所述mRNA的密码子的最后位置(N-N-X或N-N-Y)。
实施方案25是实施方案51-25中任一项所述的方法,其中所述mRNA中含有所述非天然核糖核苷酸的密码子是AXC、AYC、GXC、GYC、GXT、GYT、AXA、AXT、TXA或TXT。
实施方案26是实施方案1-20中任一项所述的方法,其中包含所述非天然核糖核苷酸的RNA或多核苷酸是tRNA。
实施方案27是实施方案26所述的方法,其中所述非天然核糖核苷酸(X或Y)位于所述tRNA的反密码子的第一位置(X-N-N或Y-N-N)。
实施方案28是实施方案26所述的方法,其中所述非天然核糖核苷酸(X或Y)位于所述tRNA的反密码子的中间位置(N-X-N或N-Y-N)。
实施方案29是实施方案26所述的方法,其中所述非天然核糖核苷酸(X或Y)位于所述tRNA的反密码子的最后位置(N-N-X或N-N-Y)。
实施方案30是实施方案26-29中任一项所述的方法,其中所述tRNA的反密码子是GYT、GXT、GYC、GXC、CYA、CXA、AYC或AXC。
实施方案31是实施方案1-30中任一项所述的方法,其中所述非天然核糖核苷酸是X,其中X包含作为所述非天然核糖核苷酸的核碱基(NaM)。
实施方案32是实施方案1-30中任一项所述的方法,其中所述非天然核糖核苷酸是Y,其中Y包含作为所述非天然核糖核苷酸的核碱基(TPT3)。
实施方案33是实施方案1-20或31-32中任一项所述的方法,其中所述RNA是RNA适配体。
实施方案34是一种筛选RNA适配体候选物的方法,所述方法包括:
a.将多种不同的RNA寡核苷酸与靶标一起孵育,其中所述RNA寡核苷酸包含至少一个非天然核苷酸;
b.对所述多种RNA寡核苷酸中与所述靶标结合的RNA寡核苷酸进行至少一轮选择;
c.分离与所述靶标结合的富集的RNA寡核苷酸,其中所述分离的富集的RNA寡核苷酸包含RNA适配体;以及
d.将所述RNA适配体中的一种或多种逆转录成cDNA,其中所述cDNA在与所述RNA适配体中的所述至少一个非天然核苷酸互补的位置处包含非天然脱氧核糖核苷酸,从而提供对应于所述RNA适配体的cDNA分子的文库。
实施方案35是前一项实施方案所述的方法,其中所述多种不同的RNA寡核苷酸包含随机化核苷酸区域。
实施方案36是前一项实施方案所述的方法,其中所述随机化核苷酸区域包含所述至少一个非天然核苷酸。
实施方案37是实施方案34-36中任一项所述的方法,其中所述RNA寡核苷酸包含条形码序列和/或引物结合序列。
实施方案38是实施方案34-37中任一项所述的方法,其中所述方法进一步包括对所述cDNA分子测序。
实施方案39是实施方案34-38中任一项所述的方法,其中进行至少一轮选择包括洗涤步骤以去除未结合或弱结合的RNA寡核苷酸。
实施方案40是实施方案34-39中任一项所述的方法,其中所述方法进一步包括使所述cDNA分子的序列突变以产生多个另外的序列。
实施方案41是前一项实施方案所述的方法,其中将所述多个另外的序列转录成RNA,并对与所述靶标结合的RNA适配体再进行至少一轮选择。
实施方案42是实施方案40-41中任一项所述的方法,其中使所述cDNA分子的序列突变包括易错PCR。
实施方案43是实施方案34-42中任一项所述的方法,其中所述方法进一步包括在另外一轮选择中增加与所述靶标结合的选择压力。
实施方案44是前一项实施方案所述的方法,其中增加选择压力包括在比前一轮更高的盐浓度下进行一个或多个洗涤步骤和/或在所述选择期间包括结合竞争物。
实施方案45是实施方案34-44中任一项所述的方法,所述方法进一步包括分析所述RNA适配体结合所述靶标的能力。
实施方案46是前一项实施方案所述的方法,其中分析所述RNA适配体结合所述靶标的能力包括测定Kd、kon或koff。
实施方案47是实施方案34-44中任一项所述的方法,所述方法进一步包括分析所述RNA适配体使所述靶标激动(agonize)的能力。
实施方案48是前一项实施方案所述的方法,其中分析所述RNA适配体使所述靶标激动的能力包括测定EC50值。
实施方案49是实施方案34-44中任一项所述的方法,所述方法进一步包括分析所述RNA适配体拮抗所述靶标的能力。
实施方案50是前一项实施方案所述的方法,其中分析所述RNA适配体拮抗所述靶标的能力包括测定Ki或IC50值。
实施方案51是前述实施方案中任一项所述的方法,其中至少一个非天然核苷酸包含:
实施方案52是前一项实施方案所述的方法,其中所述经历逆转录的多核苷酸中的至少一个非天然核苷酸包含:
实施方案53是实施方案51或52所述的方法,其中掺入cDNA中的至少一个非天然核苷酸包含:
并且任选地其中所述非天然核苷酸中的至少一个非天然核碱基不同于所述经历逆转录的多核苷酸中的至少一个非天然核碱基。
实施方案54是实施方案51-53中任一项所述的方法,其中所述至少一个非天然核苷酸包含:
实施方案55是实施方案51-53所述的方法,其中所述至少一个非天然核苷酸包含:
实施方案56是前述实施方案中任一项所述的方法,其中所述逆转录酶是禽成髓细胞瘤病毒(AMV)逆转录酶、莫洛尼氏鼠白血病病毒(MMLV)逆转录酶、Super Script II(SSII)逆转录酶、Super Script III(SS III)逆转录酶、Super Script IV(SS IV)逆转录酶或Volcano 2G(V2G)逆转录酶。
实施方案57是前述实施方案中任一项所述的方法,其中所述逆转录酶是SuperScript III。
实施方案58是前述实施方案中任一项所述的方法,其中所述非天然dNTP不是dTPT3TP。
实施方案59是前述实施方案中任一项所述的方法,其中所述逆转录发生在体外。
附图说明
本公开文本的不同方面在随附权利要求书中具体阐述。将通过参考陈述利用本公开文本原理的说明性实施方案的以下具体实施方式和附图获得对本公开文本的特征和优点的更好的理解,在所述附图中:
图1显示了dNAM与dTPT3之间以及NaM与TPT3之间的非天然碱基对。
图2显示了在不同逆转录(RT)反应条件下用于cDNA检测和cDNA的定性生物素移位的变性凝胶。
图3显示了使用SuperScript III获得的在RT反应中随RNA浓度而变的全长cDNA比率。
图4显示了用于测量非天然核苷酸保留的示例性转录-逆转录(T-RT)过程的示意图。
图5A-图5B显示了包含所指示密码子的序列在T-RT保留测定中的保真度水平。
图6显示了用于在不同密码子和反密码子情况下的cDNA检测的变性凝胶的图像。
图7A-图7B显示了来自包含所指示密码子的序列的体内翻译实验的mRNA的T-RT保留(其中先前报告的蛋白质移位值(如果有的话)显示在下方)。
图8A-图8B分别显示了在体内翻译实验中mRNA转录保真度对NaMTP浓度或TPT3TP浓度的依赖性。
具体实施方式
定义
除非另外定义,否则本文中使用的所有技术术语和科学术语具有与要求保护的主题所属领域的技术人员通常所理解的相同的含义。应理解,前述一般说明和以下具体实施方式只是示例性和解释性的,并且不限制要求保护的任何主题。在本申请中,除非另外明确陈述,否则单数的使用包括复数含义。必须指出,如在说明书和所附权利要求书中所用,单数形式“一个/一种(a)”、“一个/一种(an)”和“所述(the)”包括复数指示物,除非上下文另外清楚地规定。在本申请中,除非另外陈述,否则“或”的使用意指“和/或”。此外,术语“包括(including)”以及其他形式如“包括(include)”、“包括(includes)”和“包括(included)”的使用是非限制性的。
如本文所用,范围和数量可以表示为“约”特定值或范围。约也包括确切的量。因此,“约5μL”意指“约5μL”以及“5μL”。通常,术语“约”包括可预期在实验误差内的量。
如本文所用的术语化学结构的“类似物”是指与母体结构保持基本相似性但它可能不容易从母体结构合成得到的化学结构。在一些实施方案中,核苷酸类似物是非天然核苷酸。在一些实施方案中,核苷类似物是非天然核苷。容易从母体化学结构合成得到的相关化学结构称为“衍生物”。
核苷酸由核碱基、糖和至少一个磷酸组成。因此,核苷酸可以指三磷酸核苷即RNA和DNA聚合酶的底物、二磷酸核苷或组成DNA和RNA的单磷酸核苷。核苷酸包括天然存在的核苷酸或非天然核苷酸(即核苷酸类似物)。天然存在的核苷酸包括在天然存在的DNA或RNA中发现的核苷酸,包括天然存在的脱氧核糖核苷酸和核糖核苷酸。非天然核苷酸与天然核苷酸中的核碱基、糖和/或磷酸部分存在某种类型的差异。经修饰的核苷酸包含以下中的一种或多种的修饰:3'OH或5'OH基团、骨架、糖组分或核碱基,和/或非天然存在的接头分子的添加。非天然核苷酸包括DNA或RNA类似物(例如,含有核碱基类似物、糖类似物和/或非天然骨架等)
在一些实施方案中,核苷是包含核碱基部分和糖部分的化合物。核苷包括但不限于天然存在的核苷(对应于在DNA和RNA中发现的核苷酸)、经修饰的核苷和具有模拟核碱基和/或糖基团的核苷。核苷包括包含任何种类的取代基的核苷。核苷可以是通过核碱基与糖的还原基团之间的糖苷连接形成的糖苷化合物。
“核碱基”通常是核苷的杂环部分,并且可以是芳香族的或部分不饱和的。核碱基不包括核苷或核苷酸的糖组分(例如核糖、脱氧核糖或其类似物;也称为经修饰的糖的糖类似物的例子在本文其他地方描述)。核碱基可以是天然存在的,可以是修饰的,可以与天然核碱基没有相似性,和/或可以是合成的,例如通过有机合成而合成。在某些实施方案中,核碱基包含能够在使用或不使用氢键的情况下与另一核酸的核碱基相互作用的任何原子或原子组。在某些实施方案中,非天然核碱基不是源自天然核碱基。应注意的是,非天然核碱基不一定具有碱基特性;但是为了简单起见,它们称为核碱基。在一些实施方案中,当提及核碱基时,“(d)”指示核碱基可以附接至脱氧核糖或核糖。核碱基通常也被称为碱基。
在一些实施方案中,如本公开文本所述的非天然mRNA密码子和非天然tRNA反密码子可以按照它们的DNA编码序列来书写。例如,非天然tRNA反密码子可以书写为GYU或GYT。
如本文所用的术语,“多核苷酸”是指DNA、RNA、DNA样或RNA样聚合物(如肽核酸(PNA)、锁核酸(LNA)、硫代磷酸酯、非天然碱基等),其例子是本领域熟知的。多核苷酸可以在自动合成仪中合成,例如,使用亚磷酰胺化学或适于合成仪使用的其他化学途径。
“DNA”包括但不限于cDNA和基因组DNA。DNA可以通过共价或非共价方式附接至另一个生物分子(包括但不限于RNA或肽)。“RNA”包括编码RNA,例如信使RNA(mRNA)。在一些实施方案中,RNA是rRNA、RNAi、snoRNA、微小RNA、siRNA、snRNA、exRNA、piRNA、长ncRNA或其任何组合或杂合体。在一些实例中,RNA是核酶的组分。DNA和RNA可以呈任何形式,包括但不限于线性、环状、超螺旋、单链和双链。
“mRNA”是包含能够被核糖体翻译的ORF的RNA。
“tRNA”是能够携带天然氨基酸或ncAA并参与通过核糖体翻译mRNA的RNA。
肽核酸(PNA)是合成的DNA/RNA类似物,其中肽样骨架替代了DNA或RNA的糖-磷酸酯骨架。PNA寡聚物在结合互补DNA时显示出更高的结合强度和更高的特异性,其中PNA/DNA碱基错配与DNA/DNA双链体中的类似错配相比导致更不稳定化。这种结合强度和特异性也适用于PNA/RNA双链体。PNA不容易被核酸酶或蛋白酶识别,使得它们对酶降解具有抗性。PNA在宽pH范围内也是稳定的。还参见Nielsen PE,Egholm M,Berg RH,Buchardt O(1991年12月).“Sequence-selective recognition of DNA by strand displacement with athymine-substituted polyamide”,Science 254(5037):1497–500.doi:10.1126/science.1962210.PMID 1962210;以及Egholm M,Buchardt O,Christensen L,Behrens C,Freier SM,Driver DA,Berg RH,Kim SK,Nordén B,和Nielsen PE(1993),"PNAHybridizes to Complementary Oligonucleotides Obeying the Watson-CrickHydrogen Bonding Rules".Nature 365(6446):566–8.doi:10.1038/365566a0.PMID7692304
锁核酸(LNA)是修饰的RNA核苷酸,其中LNA核苷酸的核糖部分用连接2'氧和4'碳的额外桥进行修饰。所述桥将核糖“锁定”在3'-内(北)构象中,这通常在A型双链体中发现。只要希望,LNA核苷酸可以与寡核苷酸中的DNA或RNA残基混合。此类寡聚物可以化学合成并且是可商购的。锁核糖构象增强了核碱基堆积和骨架预组织。参见例如,Kaur,H;Arora,A;Wengel,J;Maiti,S(2006),"Thermodynamic,Counterion,and Hydration Effects forthe Incorporation of Locked Nucleic Acid Nucleotides into DNA Duplexes",Biochemistry 45(23):7347–55.doi:10.1021/bi060307w.PMID 16752924;Owczarzy R.;You Y.,Groth C.L.,Tataurov A.V.(2011),"Stability and mismatch discriminationof locked nucleic acid-DNA duplexes.",Biochem.50(43):9352–9367.doi:10.1021/bi200904e.PMC 3201676.PMID 21928795;Alexei A.Koshkin;Sanjay K.Singh,PoulNielsen,Vivek K.Rajwanshi,Ravindra Kumar,Michael Meldgaard,Carl Erik Olsen,Jesper Wengel(1998),"LNA(Locked Nucleic Acids):Synthesis of the adenine,cytosine,guanine,5-methylcytosine,thymine and uracil bicyclonucleosidemonomers,oligomerisation,and unprecedented nucleic acid recognition",Tetrahedron 54(14):3607–30.doi:10.1016/S0040-4020(98)00094-5;以及SatoshiObika;Daishu Nanbu,Yoshiyuki Hari,Ken-ichiro Morio,Yasuko In,ToshimasaIshida,Takeshi Imanishi(1997),"Synthesis of 2'-O,4'-C-methyleneuridine and-cytidine.Novel bicyclic nucleosides having a fixed C3'-endo sugar puckering",Tetrahedron Lett.38(50):8735–8.doi:10.1016/S0040-4039(97)10322-7。
“适配体”是指可以特异性结合(例如以高亲和力)靶标的寡核苷酸。适配体可以包括RNA,并且可以包含天然或非天然核苷酸。
如本文所用,“全长”意指多核苷酸(如cDNA)相对于模板化其合成的互补序列(模板多核苷酸)是未截短的。当模板多核苷酸包含非天然核苷酸,全长多核苷酸包含与模板多核苷酸中非天然核苷酸互补的位置中的核苷酸及其3'端的其他核苷酸。全长多核苷酸与截短的多核苷酸形成对照,所述截短的多核苷酸是通过在完成之前(例如,在与模板多核苷酸中的非天然核苷酸互补的位置处或附近)终止合成而产生的。
本文所用的章节标题仅用于组织目的,而不应解释为限制所描述的主题。
逆转录包含非天然核糖核苷酸的多核苷酸的方法
本文公开了逆转录包含非天然核糖核苷酸的多核苷酸的方法。在此类方法中,可以在存在包含非天然核碱基的非天然dNTP的情况下用逆转录酶逆转录多核苷酸。逆转录酶使掺入了非天然NTP(例如,在cDNA中的与在多核苷酸中非天然核糖核苷酸的位置互补的位置中)的cDNA聚合。
在一些实施方案中,所述多核苷酸以小于或等于约500nM的浓度存在。在一些实施方案中,所述RNA或多核苷酸在逆转录期间以约1-10nM、约10-20nM、约20-30nM、约30-40nM、约40-50nM、约50-75nM、约75-100nM、约100-150nM、约150-200nM、约200-300nM、约300-400nM或约400-500nM范围内的浓度存在。在一些实施方案中,所述浓度是为或低于约100nM,例如约5-100nM,如约10-100nM。在一些实施方案中,所述浓度是为或低于约50nM,例如约5-50nM,如约10-50nM。在一些实施方案中,所述浓度是为或低于约30nM,例如约5-30nM,如约10-30nM。如实施例中所述,使用比先前尝试逆转录包含非天然核苷酸的多核苷酸时更低的浓度可以改善逆转录反应的性能。
在所公开的方法中可以使用可商购的逆转录酶。在一些实施方案中,所述逆转录酶是禽成髓细胞瘤病毒(AMV)逆转录酶、莫洛尼氏鼠白血病病毒(MMLV)逆转录酶、SuperScript II(SS II)逆转录酶、Super Script III(SS III)逆转录酶、Super Script IV(SSIV)逆转录酶或Volcano 2G(V2G)逆转录酶。在一些实施方案中,所述逆转录酶是SuperScript III(例如,可从ThermoFisher Scientific获得,目录号18080093)。SuperScript III是基因工程化MMLV逆转录酶,其是通过引入若干个突变以降低RNA酶H活性、增加半衰期和提高热稳定性而产生。
包含非天然核糖核苷酸的多核苷酸可以是用于逆转录酶的任何合适的底物,例如RNA、RNA-DNA融合物或DNA。已知除了RNA外,逆转录酶还接受DNA或RNA-DNA杂合体作为底物。在一些实施方案中,包含非天然核糖核苷酸的多核苷酸是RNA。例如,所述RNA可以是mRNA。在另一个例子中,所述RNA可以是tRNA。在又一个例子中,所述RNA可以是RNA适配体或多种适配体候选物(通常称为“文库”)的成员,例如,其中多种适配体候选物在相同或不同的反应容器或室中经历逆转录。任何前述实施方案中的多核苷酸可以除非天然核苷酸之外还包含其他修饰;例如,可以存在这样的非天然核苷酸,其包含非天然核碱基并且在相同和/或其他核苷酸位置包含对核碱基或一个或多糖和/或磷酸的修饰。
在RNA是mRNA的情况下,所述非天然核糖核苷酸可以位于密码子中。所述非天然核苷酸可以出现在密码子的第一、第二或第三位置。示例性密码子是AXC、AYC、GXC、GYC、GXT、GYT、AXA、AXT、TXA或TXT,其中非天然核糖核苷酸可以用X或Y表示。在一些实施方案中,X包含作为非天然核糖核苷酸的核碱基(NaM;为了清楚起见,在此处和全文仅显示了非天然脱氧或核糖核苷酸/核苷的核碱基部分)和/或Y包含作为非天然核糖核苷酸的核碱基(TPT3)。
在RNA是tRNA的情况下,所述非天然核糖核苷酸可以位于tRNA的反密码子中。所述非天然核苷酸可以出现在反密码子的第一、第二或第三位置。示例性反密码子是GYT、GXT、GYC、GXC、CYA、CXA、AYC或AXC,其中非天然核糖核苷酸可以由X或Y表示。在一些实施方案中,X包含作为非天然核糖核苷酸的核碱基(NaM)和/或Y包含作为不天然核糖核苷酸的核碱基(TPT3)。
各种非天然核碱基是已知的,并且可以用作dNTP和/或非天然核糖核苷酸中的非天然核碱基。在一些实施方案中,所述非天然核碱基独立地选自:
在一些实施方案中,所述非天然dNTP不是dTPT3TP。
在一些实施方案中,所述非天然核碱基选自以下所示的那些,其中波浪线或R标识与糖(例如,脱氧核糖或核糖)的附接点:
在一些实施方案中,所述核碱基包含以下结构:
其中每个X独立地是碳或氮;R2是任选的并且当存在时独立地是氢、烷基、烯基、炔基;甲氧基、甲烷硫醇、甲烷硒基、卤素、氰基或叠氮基基团;其中每个Y独立地是硫、氧、硒或仲胺;其中每个E独立地是氧、硫或硒;并且其中波浪线指示与核糖基、脱氧核糖基或二脱氧核糖基部分或其类似物的键合点,其中所述核糖基、脱氧核糖基或二脱氧核糖基部分或其类似物呈游离形式、连接至单磷酸酯、二磷酸酯或三磷酸酯基团(任选地包含α-硫代三磷酸酯、β-硫代三磷酸酯或γ-硫代三磷酸酯基团),或被包括在RNA或DNA中或在RNA类似物或DNA类似物中。在一些实施方案中,R2是低级烷基(例如,C1-C6)、氢或卤素。在本文所述的核碱基的一些实施方案中,R2是氟。在本文所述的核碱基的一些实施方案中,X是碳。在本文所述的核碱基的一些实施方案中,E是硫。在本文所述的核碱基的一些实施方案中,Y是硫。在本文所述的核碱基的一些实施方案中,核碱基具有结构:在本文所述的核碱基的一些实施方案中,E是硫并且Y是硫。在本文所述的核碱基的一些实施方案中,波浪线指示与核糖基或脱氧核糖基部分键合的点。在本文所述的核碱基的一些实施方案中,波浪线指示与核糖基或脱氧核糖基部分键合的点,所述核糖基或脱氧核糖基部分与三磷酸酯基团连接。
在一些实施方案中,所述核碱基是核酸聚合物的组分。在一些实施方案中,所述核碱基是tRNA的组分。在一些实施方案中,所述核碱基是tRNA中的反密码子的组分。在一些实施方案中,所述核碱基是mRNA的组分。在一些实施方案中,所述核碱基是mRNA的密码子的组分。在一些实施方案中,所述核碱基是RNA或DNA的组分。在一些实施方案中,所述核碱基是DNA中的密码子的组分。在一些实施方案中,所述核碱基与另一个互补核碱基形成核碱基对。
非天然核碱基的另外的例子包括2-硫尿嘧啶,2'-脱氧尿嘧啶,4-硫尿嘧啶,尿嘧啶-5-基,次黄嘌呤-9-基(I),5-卤代尿嘧啶,5-丙炔基尿嘧啶,6-偶氮脲嘧啶,5-甲基氨基甲基尿嘧啶,5-甲氧基氨基甲基-2-硫尿嘧啶,假尿嘧啶,尿嘧啶-5-氧乙酸甲酯,尿嘧啶-5-氧乙酸,5-甲基-2-硫脲嘧啶,3-(3-氨基-3-N-2-羧丙基)尿嘧啶,5-甲基-2-硫尿嘧啶,4-硫尿嘧啶,5-甲基尿嘧啶,5'-甲氧基羧甲基尿嘧啶,5-甲氧基尿嘧啶,尿嘧啶-5-氧基乙酸,5-(羧基羟基甲基)尿嘧啶,5-羧甲基氨基甲基-2-硫尿嘧啶,5-羧甲基氨基甲基尿嘧啶,二氢尿嘧啶,5-羟甲基胞嘧啶,5-三氟甲基胞嘧啶,5-卤代胞嘧啶,5-丙炔基胞嘧啶,5-羟基胞嘧啶,环胞嘧啶,阿糖胞苷,5,6-二氢胞嘧啶,5-硝基胞嘧啶,6-偶氮胞嘧啶,氮杂胞嘧啶,N4-乙基胞嘧啶,3-甲基胞嘧啶,5-甲基胞嘧啶,4-乙酰基胞嘧啶,2-硫胞嘧啶,吩噁嗪胞苷([5,4-b][l,4]苯并噁嗪-2(3H)-酮),吩噻嗪胞苷(1H-嘧啶并[5,4-b][l,4]苯并噻嗪-2(3H)-酮),吩噁嗪胞苷(9-(2-氨基乙氧基)-H-嘧啶并[5,4-b][l,4]苯并噁嗪-2(3H)-酮),咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮),吡啶并吲哚胞苷(H-吡啶并[3',2':4,5]吡咯并[2,3-d]嘧啶-2-酮),2-氨基腺嘌呤,2-丙基腺嘌呤,2-氨基腺嘌呤,2-F-腺嘌呤,2-氨基丙基腺嘌呤,2-氨基-2'-脱氧腺苷,3-脱氮腺嘌呤,7-甲基腺嘌呤,7-脱氮腺嘌呤,8-氮杂腺嘌呤,8-卤代、8-氨基、8-硫醇、8-硫代烷基和8-羟基取代的腺嘌呤,N6-异戊烯基腺嘌呤,2-甲基腺嘌呤,2,6-二氨基嘌呤,2-甲基-N6-异戊烯基腺嘌呤,6-氮杂腺嘌呤,2-甲基鸟嘌呤,鸟嘌呤的2-丙基和烷基衍生物,3-脱氮鸟嘌呤,6-硫代鸟嘌呤,7-甲基鸟嘌呤,7-脱氮鸟氨酸,7-脱氮鸟苷,7-脱氮-8-氮杂鸟嘌呤,8-氮杂鸟氨酸,8-卤代、8-氨基、8-硫醇、8-硫代烷基和8-羟基取代的鸟嘌呤,1-甲基鸟嘌呤,2,2-二甲基鸟嘌呤,7-甲基鸟嘌呤,6-氮杂鸟嘌呤,次黄嘌呤,黄嘌呤,1-甲基肌苷,辫苷(queosine),β-D-半乳糖基辫苷,肌苷,β-D-甘露糖基辫苷,怀丁氧苷(wybutoxosine),羟基脲,(acp3)w,2-氨基吡啶或2-吡啶酮。
在一些实施方案中,所述非天然核碱基选自尿嘧啶-5-基、次黄嘌呤-9-基(I)、2-氨基腺嘌呤-9-基、5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基衍生物和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基衍生物和其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-卤代尿嘧啶和胞嘧啶、5-丙炔基尿嘧啶和胞嘧啶、6-偶氮基尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代、8-氨基、8-巯基、8-硫烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤、5-卤素(具体地,5-溴)、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤以及3-脱氮鸟嘌呤和3-脱氮腺嘌呤。某些非天然核酸,如5-取代的嘧啶、6-氮杂嘧啶和N-2取代的嘌呤、N-6取代的嘌呤、O-6取代的嘌呤、2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶、5-丙炔基胞嘧啶、5-甲基胞嘧啶、增加双链体形成的稳定性的那些、通用核酸、疏水核碱基、混杂核碱基、尺寸扩展的核碱基、氟化核碱基、5-取代的嘧啶、6-氮杂嘧啶以及N-2、N-6和O-6取代的嘌呤,包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶(5-me-C),5-羟甲基胞嘧啶,黄嘌呤,次黄嘌呤,2-氨基腺嘌呤,腺嘌呤和鸟嘌呤的6-甲基、其他烷基衍生物,腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物,2-硫尿嘧啶,2-硫胸腺嘧啶和2-硫胞嘧啶,5-卤代尿嘧啶,5-卤代胞嘧啶,5-丙炔基(-C≡C-CH3)尿嘧啶,5-丙炔基胞嘧啶,嘧啶核酸的其他炔基衍生物,6-偶氮基尿嘧啶,6-偶氮基胞嘧啶,6-偶氮基胸腺嘧啶,5-尿嘧啶(假尿嘧啶),4-硫尿嘧啶,8-卤代、8-氨基、8-硫醇、8-硫烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤,5-卤代(特别是5-溴)、5-三氟甲基、其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤,7-甲基腺嘌呤,2-F-腺嘌呤,2-氨基-腺嘌呤,8-氮杂鸟嘌呤,8-氮杂腺嘌呤,7-脱氮鸟嘌呤,7-脱氮腺嘌呤,3-脱氮鸟嘌呤,3-脱氮腺嘌呤,三环嘧啶,吩噁嗪胞苷([5,4-b][l,4]苯并噁嗪-2(3H)-酮),吩噻嗪胞苷(1H-嘧啶并[5,4-b][l,4]苯并噻嗪-2(3H)-酮),G-夹,吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并[5,4-b][l,4]苯并噁嗪-2(3H)-酮),咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮),吡啶并吲哚胞苷(H-吡啶并[3',2':4,5]吡咯并[2,3-d]嘧啶-2-酮),其中嘌呤或嘧啶核碱基被其他杂环替代的那些,7-脱氮-腺嘌呤,7-脱氮鸟嘌呤,2-氨基吡啶,2-吡啶酮,氮杂胞嘧啶,5-溴胞嘧啶,溴尿嘧啶,5-氯胞嘧啶,氯代胞嘧啶,环胞嘧啶,胞嘧啶阿拉伯糖苷,5-氟胞嘧啶,氟嘧啶,氟尿嘧啶,5,6-二氢胞嘧啶,5-碘胞嘧啶,羟基脲,碘尿嘧啶,5-硝基胞嘧啶,5-溴尿嘧啶,5-氯尿嘧啶,5-氟尿嘧啶和5-碘尿嘧啶,2-氨基-腺嘌呤,6-硫代-鸟嘌呤,2-硫代-胸腺嘧啶,4-硫代-胸腺嘧啶,5-丙炔基-尿嘧啶,4-硫代-尿嘧啶,N4-乙基胞嘧啶,7-脱氮鸟嘌呤,7-脱氮-8-氮杂鸟嘌呤,5-羟基胞嘧啶,2'-脱氧尿苷,2-氨基-2'-脱氧腺苷,以及描述于以下文献中的那些:美国专利号3,687,808;4,845,205;4,910,300;4,948,882;5,093,232;5,130,302;5,134,066;5,175,273;5,367,066;5,432,272;5,457,187;5,459,255;5,484,908;5,502,177;5,525,711;5,552,540;5,587,469;5,594,121;5,596,091;5,614,617;5,645,985;5,681,941;5,750,692;5,763,588;5,830,653和6,005,096;WO 99/62923;Kandimalla等人,(2001)Bioorg.Med.Chem.9:807-813;The ConciseEncyclopedia of Polymer Science and Engineering,Kroschwitz,J.I.编辑,JohnWiley&Sons,1990,858-859;Englisch等人,Angewandte Chemie,International Edition,1991,30,613;和Sanghvi,第15章,Antisense Research and Applications,Crooke和Lebleu编辑,CRC Press,1993,273-288。另外的核碱基修饰可以在例如以下文献中找到:美国专利号3,687,808;Englisch等人,Angewandte Chemie,International Edition,1991,30,613。
包含各种杂环核碱基和各种糖部分(和糖类似物)的非天然核酸是本领域中可获得的,并且在一些情况下,核酸包含除了天然存在的核酸的五种主要核碱基组分以外的一种或若干种杂环核碱基。例如,在一些情况下,所述杂环核碱基包括尿嘧啶-5-基、胞嘧啶-5-基、腺嘌呤-7-基、腺嘌呤-8-基、鸟嘌呤-7-基、鸟嘌呤-8-基、4-氨基吡咯并[2.3-d]嘧啶-5-基、2-氨基-4-氧代吡咯并[2,3-d]嘧啶5-基、2-氨基-4-氧代吡咯并[2.3-d]嘧啶-3-基,其中嘌呤经由9位置、嘧啶经由1位置、吡咯并嘧啶经由7位置且吡唑并嘧啶经由1位置附接至核酸的糖部分。
在一些实施方案中,核苷酸类似物还在磷酸酯部分被修饰。经修饰的磷酸酯部分包括但不限于在两个核苷酸之间的连接处被修饰的那些,并且含有例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯(包括3'-亚烷基膦酸酯)和手性膦酸酯、次膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯、硫羰氨基磷酸酯)、硫羰烷基膦酸酯、硫羰烷基磷酸三酯和硼烷磷酸酯。应理解,两个核苷酸之间的这些磷酸酯或修饰的磷酸酯连接是通过3'-5'连接或2'-5'连接,并且所述连接含有相反的极性,如3'-5'至5'-3'或2'-5'至5'-2'。还包括各种盐、混合盐和游离酸形式。许多美国专利传授了如何制备和使用含有经修饰的磷酸酯的核苷酸,并且包括但不限于3,687,808;4,469,863;4,476,301;5,023,243;5,177,196;5,188,897;5,264,423;5,276,019;5,278,302;5,286,717;5,321,131;5,399,676;5,405,939;5,453,496;5,455,233;5,466,677;5,476,925;5,519,126;5,536,821;5,541,306;5,550,111;5,563,253;5,571,799;5,587,361;和5,625,050。
在一些实施方案中,非天然核酸包括2',3'-二脱氧-2',3'-二脱氢-核苷(PCT/US2002/006460)、5'-取代的DNA和RNA衍生物(PCT/US2011/033961;Saha等人,J.OrgChem.,1995,60,788-789;Wang等人,Bioorganic&Medicinal Chemistry Letters,1999,9,885-890;以及Mikhailov等人,Nucleosides&Nucleotides,1991,10(1-3),339-343;Leonid等人,1995,14(3-5),901-905;以及Eppacher等人,Helvetica Chimica Acta,2004,87,3004-3020;PCT/JP2000/004720;PCT/JP2003/002342;PCT/JP2004/013216;PCT/JP2005/020435;PCT/JP2006/315479;PCT/JP2006/324484;PCT/JP2009/056718;PCT/JP2010/067560)或制成具有经修饰的核碱基的单磷酸酯的5'-取代的单体(Wang等人,NucleosidesNucleotides&Nucleic Acids,2004,23(1&2),317-337)。
在一些实施方案中,非天然核酸包括在糖环的5'位置和2'位置处的修饰(PCT/US94/02993),如5'-CH2-取代的2'-O-保护的核苷(Wu等人,Helvetica Chimica Acta,2000,83,1127-1143和Wu等人,Bioconjugate Chem.1999,10,921-924).在一些情况下,非天然核酸包括酰胺连接的核苷二聚体,其已经被制备用于掺入寡核苷酸中,其中二聚体中3'连接的核苷(5'至3')包含2'-OCH3和5'-(S)-CH3(Mesmaeker等人,Synlett,1997,1287-1290)。非天然核酸可以包括2'-取代的5'-CH2(或O)修饰的核苷(PCT/US92/01020)。非天然核酸可以包括5'-亚甲基膦酸酯DNA和RNA单体以及二聚体(Bohringer等人,Tet.Lett.,1993,34,2723-2726;Collingwood等人,Synlett,1995,7,703-705;以及Hutter等人,Helvetica Chimica Acta,2002,85,2777-2806)。非天然核酸可以包括具有2'-取代基的5'-膦酸酯单体(US2006/0074035)和其他修饰的5'-膦酸酯单体(WO1997/35869)。非天然核酸可以包括5'-修饰的亚甲基膦酸酯单体(EP614907和EP629633)。非天然核酸可以包括在5'和/或6'位置包含羟基基团的5'或6'-膦酸核糖核苷的类似物(Chen等人,Phosphorus,Sulfur and Silicon,2002,777,1783-1786;Jung等人,Bioorg.Med.Chem.,2000,8,2501-2509;Gallier等人,Eur.J.Org.Chem.,2007,925-933;以及Hampton等人,J.Med.Chem.,1976,19(8),1029-1033)。非天然核酸可以包括5'-膦酸酯脱氧核糖核苷单体和具有5'-磷酸酯基团的二聚体(Nawrot等人,Oligonucleotides,2006,16(1),68-82)。非天然核酸可以包含具有6'-膦酸酯基团的核苷,其中5'或/和6'位置未被取代或被硫代叔丁基基团(SC(CH3)3)(及其类似物)、亚甲基氨基(CH2NH2)(及其类似物)或氰基基团(CN)(及其类似物)取代(Fairhurst等人,Synlett,2001,4,467-472;Kappler等人,J.Med.Chem.,1986,29,1030-1038;Kappler等人,J.Med.Chem.,1982,25,1179-1184;Vrudhula等人,J.Med.Chem.,1987,30,888-894;Hampton等人,J.Med.Chem.,1976,19,1371-1377;Geze等人,J.Am.Chem.Soc,1983,105(26),7638-7640;以及Hampton等人,J.Am.Chem.Soc,1973,95(13),4404-4414)。
在一些实施方案中,非天然核酸还包括糖部分的修饰。在一些情况下,核酸含有其中糖基团已被修饰的一种或多种核苷。此类糖修饰的核苷可以赋予增强的核酸酶稳定性、增加的结合亲和力或一些其他有益的生物学特性。在某些实施方案中,核酸包含化学修饰的呋喃核糖环部分。化学修饰的呋喃核糖环的例子包括而不限于添加取代基(包括5'和/或2'取代基;两个环原子桥接形成双环核酸(BNA);用S、N(R)或C(R1)(R2)替代核糖基环氧原子(R=H、C1-C12烷基或保护基团);及其组合。化学修饰的糖的例子可以在WO 2008/101157、US2005/0130923和WO 2007/134181中发现。
在一些实例中,经修饰的核酸包含经修饰的糖或糖类似物。因此,除核糖和脱氧核糖之外,所述糖部分还可以是戊糖、脱氧戊糖、己糖、脱氧己糖、葡萄糖、阿拉伯糖、木糖、来苏糖或糖“类似物”环戊基。所述糖可以呈吡喃糖基或呋喃糖基形式。所述糖部分可以是核糖、脱氧核糖、阿拉伯糖或2'-O-烷基核糖的呋喃糖苷,并且所述糖可以以[α]或[β]异头构型附接至相应的杂环核碱基。糖修饰包括但不限于2'-烷氧基-RNA类似物、2'-氨基-RNA类似物、2'-氟-DNA和2'-烷氧基-或氨基-RNA/DNA嵌合体。例如,糖修饰可以包括2'-O-甲基-尿苷或2'-O-甲基-胞苷。糖修饰包括2'-O-烷基-取代的脱氧核糖核苷和2'-O-乙二醇样核糖核苷。这些糖或糖类似物以及其中此类糖或类似物附接至杂环核碱基(核酸碱基)的相应“核苷”的制备是已知的。还可以进行糖修饰并且将其与其他修饰组合。
糖部分的修饰包括核糖和脱氧核糖的天然修饰以及非天然修饰。糖修饰包括但不限于在2'位置处的以下修饰:OH;F;O-、S-或N-烷基;O-、S-或N-烯基;O-、S-或N-炔基;或O-烷基-O-烷基,其中烷基、烯基和炔基可以是经取代或未经取代的C1至C10烷基或C2至C10烯基和炔基。2'糖修饰还包括但不限于-O[(CH2)nO]m CH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)nONH2和-O(CH2)nON[(CH2)n CH3)]2,其中n和m是1至约10。
2'位置处的其他修饰包括但不限于:C1至C10低级烷基、取代的低级烷基、烷芳基、芳烷基、O-烷芳基、O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2 CH3、ONO2、NO2、N3、NH2、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、取代的甲硅烷基、RNA切割基团、报告基团、嵌入剂、用于改善寡核苷酸药代动力学特性的基团或用于改善寡核苷酸药效学特性的基团,以及具有类似特性的其他取代基。还可以在所述糖的其他位置(特别是在3'末端核苷酸或2'-5'连接的寡核苷酸中糖的3'位置和5'末端核苷酸的5'位置)处进行类似的修饰。修饰的糖还包括在桥环氧处含有修饰(如CH2和S)的那些糖。核苷酸糖类似物也可以具有糖模拟物,如环丁基部分代替戊呋喃糖基糖。许多美国专利传授了此类修饰的糖结构的制备,并且详述并描述了一系列的核碱基修饰,所述美国专利是如美国专利号4,981,957;5,118,800;5,319,080;5,359,044;5,393,878;5,446,137;5,466,786;5,514,785;5,519,134;5,567,811;5,576,427;5,591,722;5,597,909;5,610,300;5,627,053;5,639,873;5,646,265;5,658,873;5,670,633;4,845,205;5,130,302;5,134,066;5,175,273;5,367,066;5,432,272;5,457,187;5,459,255;5,484,908;5,502,177;5,525,711;5,552,540;5,587,469;5,594,121、5,596,091;5,614,617;5,681,941;和5,700,920,将其中的每一个均通过引用以其整体并入本文。
具有修饰的糖部分的核酸的例子包括而不限于包含5'-乙烯基、5'-甲基(R或S)、4'-S、2'-F、2'-OCH3和2'-O(CH2)2OCH3取代基的核酸。2'位置处的取代基还可以选自烯丙基、氨基、叠氮基、硫代、O-烯丙基、O-(C1-C1O烷基)、OCF3、O(CH2)2SCH3、O(CH2)2-O-N(Rm)(Rn)和O-CH2-C(=O)-N(Rm)(Rn),其中Rm和Rn各自独立地是H或者取代或未取代的C1-C10烷基。
在某些实施方案中,本文所述的核酸包括一种或多种双环核酸。在某些此类实施方案中,双环核酸包含在4'核糖基环原子与2'核糖基环原子之间的桥。在某些实施方案中,本文提供的核酸包括一种或多种双环核酸,其中所述桥包含4'至2'双环核酸。此类4'至2'二环核酸的例子包括但不限于以下式中的一种:4'-(CH2)-O-2'(LNA);4'-(CH2)-S-2';4'-(CH2)2-O-2'(ENA);4'-CH(CH3)-O-2'和4'-CH(CH2OCH3)-O-2'及其类似物(参见,美国专利号7,399,845);4'-C(CH3)(CH3)-O-2'及其类似物(参见WO 2009/006478、WO 2008/150729、US2004/0171570、美国专利号7,427,672;Chattopadhyaya等人,J.Org.Chem.,209,74,118-134;和WO 2008/154401)。还参见例如:Singh等人,Chem.Commun.,1998,4,455-456;Koshkin等人,Tetrahedron,1998,54,3607-3630;Wahlestedt等人,Proc.Natl.Acad.Sci.U.S.A.,2000,97,5633-5638;Kumar等人,Bioorg.Med.Chem.Lett.,1998,8,2219-2222;Singh等人,J.Org.Chem.,1998,63,10035-10039;Srivastava等人,J.Am.Chem.Soc.,2007,129(26)8362-8379;Elayadi等人,Curr.Opinion Invens.Drugs,2001,2,558-561;Braasch等人,Chem.Biol,2001,8,1-7;Oram等人,Curr.OpinionMol.Ther.,2001,3,239-243;美国专利号4,849,513;5,015,733;5,118,800;5,118,802;7,053,207;6,268,490;6,770,748;6,794,499;7,034,133;6,525,191;6,670,461;和7,399,845;国际公开号WO 2004/106356、WO 1994/14226、WO 2005/021570、WO 2007/090071和WO2007/134181;美国专利公开号US 2004/0171570、US 2007/0287831和US 2008/0039618;美国临时申请号60/989,574、61/026,995、61/026,998、61/056,564、61/086,231、61/097,787和61/099,844;以及国际申请号PCT/US2008/064591、PCT US2008/066154、PCT US2008/068922和PCT/DK98/00393。
在某些实施方案中,核酸包含连接的核酸。核酸可以使用任何核酸间连接而连接在一起。核酸间连接基团的两个主要类别是通过磷原子的存在或不存在来定义的。代表性的含磷的核酸间连接包括但不限于磷酸二酯、磷酸三酯、甲基膦酸酯、氨基磷酸酯和硫代磷酸酯(P=S)。代表性的不含磷的核酸间连接基团包括但不限于亚甲基甲基亚氨基(-CH2-N(CH3)-O-CH2-)、硫代二酯(-O-C(O)-S-)、硫代氨基甲酸酯(-O-C(O)(NH)-S-);硅氧烷(-O-Si(H)2-O-);和N,N*-二甲基肼(-CH2-N(CH3)-N(CH3))。在某些实施方案中,可以将具有手性原子的核酸间连接制备为外消旋混合物,作为单独的对映体,例如烷基膦酸酯和硫代磷酸酯。非天然核酸可以含有单个修饰。非天然核酸可以在所述部分之一内或不同部分之间含有多个修饰。
对核酸的骨架磷酸酯修饰包括但不限于甲基膦酸酯、硫代磷酸酯、氨基磷酸酯(桥连或非桥连)、磷酸三酯、二硫代磷酸酯、硫代磷酸酯和硼烷磷酸酯,并且可以以任何组合使用。还可以使用其他非磷酸酯连接。
在一些实施方案中,骨架修饰(例如,甲基膦酸酯、硫代磷酸酯、氨基磷酸酯和二硫代磷酸酯核苷酸间连接)可以赋予修饰的核酸免疫调节活性和/或增强其体内稳定性。
在一些情况下,磷衍生物(或经修饰的磷酸酯基团)附接至糖或糖类似物部分,并且可以是单磷酸酯、二磷酸酯、三磷酸酯、烷基膦酸酯、硫代磷酸酯、二硫代磷酸酯、氨基磷酸酯等。含有经修饰的磷酸键或非磷酸键的示例性多核苷酸可以在以下文献中找到:Peyrottes等人,1996,Nucleic Acids Res.24:1841-1848;Chaturvedi等人,1996,NucleicAcids Res.24:2318-2323;and Schultz等人,(1996)Nucleic Acids Res.24:2966-2973;Matteucci,1997,“Oligonucleotide Analogs:an Overview”in Oligonucleotides asTherapeutic Agents,(Chadwick and Cardew,ed.)John Wiley and Sons,New York,NY;Zon,1993,“Oligonucleoside Phosphorothioates”in Protocols for Oligonucleotidesand Analogs,Synthesis and Properties,Humana Press,第165-190页;Miller等人,1971,JACS 93:6657-6665;Jager等人,1988,Biochem.27:7247-7246;Nelson等人,1997,JOC 62:7278-7287;美国专利号5,453,496;以及Micklefield,2001,Curr.Med.Chem.8:1157-1179。
在一些情况下,骨架修饰包括用可替代部分如阴离子基团、中性基团或阳离子基团替代磷酸二酯连接。此类修饰的例子包括:阴离子核苷间连接;N3'至P5'氨基磷酸酯修饰;硼烷磷酸酯DNA;原寡核苷酸;中性核苷间连接,如甲基膦酸酯;酰胺连接的DNA;亚甲基(甲基亚氨基)连接;甲缩醛(formacetal)和硫代甲缩醛连接;含有磺酰基的骨架;吗啉代寡聚物;肽核酸(PNA);以及带正电荷的脱氧核糖核酸胍(DNG)寡聚物(Micklefield,2001,Current Medicinal Chemistry 8:1157-1179)。修饰的核酸可以包含嵌合或混合的骨架,所述嵌合的或混合的骨架包含一种或多种修饰(例如,磷酸酯连接的组合,如磷酸二酯和硫代磷酸酯连接的组合)。
磷酸酯的取代基包括,例如,短链烷基或环烷基核苷间连接、混合的杂原子和烷基或环烷基核苷间连接,或一个或多个短链杂原子或杂环核苷间连接。这些包括具有以下的那些:吗啉代连接(部分地由核苷的糖部分形成);硅氧烷骨架;硫化物、亚砜和砜骨架;甲酰乙酰基和硫代甲酰乙酰基骨架;亚甲基甲酰乙酰基和硫代甲酰乙酰基骨架;含烯烃的骨架;氨基磺酸酯骨架;亚甲基亚胺基和亚甲基肼基骨架;磺酸酯和磺酰胺骨架;酰胺骨架;以及具有混合N、O、S和CH2组成部分的其他骨架。许多美国专利公开了如何制备和使用这些类型的磷酸酯替代品,并且包括但不限于美国专利号5,034,506;5,166,315;5,185,444;5,214,134;5,216,141;5,235,033;5,264,562;5,264,564;5,405,938;5,434,257;5,466,677;5,470,967;5,489,677;5,541,307;5,561,225;5,596,086;5,602,240;5,610,289;5,602,240;5,608,046;5,610,289;5,618,704;5,623,070;5,663,312;5,633,360;5,677,437;和5,677,439。还应理解,在核苷酸取代物中,核苷酸的糖和磷酸酯部分二者都可以被替代,例如被酰胺型连接(氨乙基甘氨酸)(PNA)替代。美国专利号5,539,082;5,714,331;和5,719,262传授了如何制备和使用PNA分子,每个专利通过引用并入本文。还参见Nielsen等人,Science,1991,254,1497-1500。还可以将其他类型的分子(缀合物)与核苷酸或核苷酸类似物连接,以增强例如细胞摄取。缀合物可以与所述核苷酸或核苷酸类似物化学连接。此类缀合物包括但不限于脂质部分,如胆固醇部分(Letsinger等人,Proc.Natl.Acad.Sci.USA,1989,86,6553-6556)、胆酸(Manoharan等人,Bioorg.Med.Chem.Let.,1994,4,1053-1060)、硫醚(例如,己基-S-三苯甲基硫醇)(Manoharan等人,Ann.KY.Acad.Sci.,1992,660,306-309;Manoharan等人,Bioorg.Med.Chem.Let.,1993,3,2765-2770)、巯基胆固醇(Oberhauser等人,Nucl.Acids Res.,1992,20,533-538)、脂肪链(例如,十二烷二醇或十一烷基残基)(Saison-Behmoaras等人,EM5OJ,1991,10,1111-1118;Kabanov等人,FEBSLett.,1990,259,327-330;Svinarchuk等人,Biochimie,1993,75,49-54)、磷脂(例如,二-十六烷基-rac-甘油或l-二-O-十六烷基-rac-丙三基-S-H-膦酸三乙铵)(Manoharan等人,Tetrahedron Lett.,1995,36,3651-3654;Shea等人,Nucl.Acids Res.,1990,18,3777-3783)、聚胺或聚乙二醇链(Manoharan等人,Nucleosides&Nucleotides,1995,14,969-973)或金刚烷乙酸(Manoharan等人,Tetrahedron Lett.,1995,36,3651-3654)、棕榈基部分(Mishra等人,Biochem.Biophys.Acta,1995,1264,229-237)或硬脂胺或己基氨基-羰基-羟胆固醇部分(Crooke等人,J.Pharmacol.Exp.Ther.,1996,277,923-937)。许多美国专利传授了此类缀合物的制备,并且包括但不限于美国专利号4,828,979;4,948,882;5,218,105;5,525,465;5,541,313;5,545,730;5,552,538;5,578,717、5,580,731;5,580,731;5,591,584;5,109,124;5,118,802;5,138,045;5,414,077;5,486,603;5,512,439;5,578,718;5,608,046;4,587,044;4,605,735;4,667,025;4,762,779;4,789,737;4,824,941;4,835,263;4,876,335;4,904,582;4,958,013;5,082,830;5,112,963;5,214,136;5,082,830;5,112,963;5,214,136;5,245,022;5,254,469;5,258,506;5,262,536;5,272,250;5,292,873;5,317,098;5,371,241、5,391,723;5,416,203、5,451,463;5,510,475;5,512,667;5,514,785;5,565,552;5,567,810;5,574,142;5,585,481;5,587,371;5,595,726;5,597,696;5,599,923;5,599,928和5,688,941。
在一些实施方案中,包含非天然核糖核苷酸的多核苷酸(也称为核酸)来自任何来源或组合物,例如DNA、cDNA、gDNA(基因组DNA)、RNA、siRNA(短抑制RNA)、RNAi、tRNA、mRNA或rRNA(核糖体RNA),并且呈任何形式(例如,线性、环状、超螺旋、单链、双链等)。在一些实施方案中,核酸包含核苷酸、核苷或多核苷酸。在一些情况下,核酸包含天然核酸和非天然核酸。在一些情况下,核酸还包含非天然核酸,如DNA或RNA类似物(例如,含有核碱基类似物、糖类似物和/或非天然骨架等)。应理解,术语“核酸”并非是指或意指特定长度的多核苷酸链,因此多核苷酸和寡核苷酸也包括在定义内。核酸有时是载体、质粒、噬菌粒、自主复制序列(ARS)、着丝粒、人工染色体、酵母人工染色体(例如,YAC)或能够在宿主细胞中复制或被复制的其他核酸。在一些情况下,非天然核酸是核酸类似物。在另外的情况下,非天然核酸来自细胞外来源。在其他情况下,非天然核酸可用于本文所提供的生物体(例如基因修饰的生物体)的细胞内空间。在一些实施方案中,非天然核苷酸不是天然核苷酸。在一些实施方案中,不包含天然核碱基的核苷酸包含非天然核碱基。
在一些实施方案中,多核苷酸用作逆转录酶的底物,或由包含天然核苷酸以及至少一个非天然核苷酸的逆转录酶合成。示例性天然核苷酸包括而不限于ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP、GMP、dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMP和dGMP。示例性天然脱氧核糖核苷酸包括dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMP和dGMP。示例性天然核糖核苷酸包括ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP和GMP。可以理解,三磷酸形式的核苷酸是聚合的底物,并且在添加至新生的多核苷酸链时,核苷酸被转化为单磷酸形式的核苷酸。
一般而言,核苷酸类似物或非天然核苷酸包括含有对核碱基、糖或磷酸酯部分的某一类型修饰的核苷酸。在一些实施方案中,修饰包括化学修饰。在一些情况下,修饰发生在3'OH或5'OH基团处、在骨架处、在糖组分处或在核碱基处。在一方面,经修饰的核酸包括以下中的一种或多种的修饰:3'OH或5'OH基团、骨架、糖组分或核碱基,和/或非天然存在的接头分子的添加。在一方面,经修饰的骨架包括除了磷酸二酯骨架以外的骨架。在一方面,经修饰的糖包括除了脱氧核糖以外(在经修饰的DNA中)或除了核糖以外(经修饰的RNA)的糖。在一方面,经修饰的核碱基包括除了腺嘌呤、鸟嘌呤、胞嘧啶或胸腺嘧啶以外的核碱基(在修饰的DNA中)或除了腺嘌呤、鸟嘌呤、胞嘧啶或尿嘧啶以外的核碱基(在修饰的RNA中)。
在一些实施方案中,所述核酸包含至少一种经修饰的核碱基。在一些实例中,所述核酸包含2、3、4、5、6、7、8、9、10、15、20种或更多种经修饰的核碱基。在一些情况下,对核碱基部分的修饰包括A、C、G和T/U以及不同的嘌呤或嘧啶核碱基的天然修饰和合成修饰。在一些实施方案中,修饰是针对腺嘌呤、鸟嘌呤、胞嘧啶或胸腺嘧啶的修饰形式(在经修饰的DNA中)或腺嘌呤、鸟嘌呤、胞嘧啶或尿嘧啶的修饰形式(经修饰的RNA)。经修饰的核碱基可以是本文其他地方特别描述的任何经修饰的核碱基。
在一些实施方案中,所述逆转录酶产生全长cDNA。在一些实施方案中,所述逆转录酶产生cDNA,所述cDNA包含与在经历逆转录的多核苷酸中的非天然核糖核苷酸互补的位置中的核苷酸以及在与非天然核糖核苷酸互补的位置中的核苷酸的3'端的多个核苷酸(例如,至少2个、5个、10个或20个核苷酸),并且包括与正在经历逆转录的多核苷酸完全互补的cDNA。在一些实施方案中,cDNA包含与正在经历逆转录的多核苷酸的至少90%、95%、97%或99%一样多的核苷酸。在一些实施方案中,所述cDNA与正在经历逆转录的多核苷酸完全互补。在一些实施方案中,至少25%的cDNA包含非天然核碱基。在一些实施方案中,至少30%、40%、50%、60%、70%、80%、90%、95%、97%、98%或99%的cDNA包含非天然核碱基。
非天然碱基对
在一些实施方案中,非天然核苷酸在掺入(例如通过逆转录酶)期间和/或之后与另一非天然核苷酸形成碱基对(非天然碱基对;UBP)。在一些实施方案中,稳定整合的非天然核苷酸是可以与另一核苷酸(例如,天然或非天然核苷酸)形成碱基对的非天然核苷酸。在一些实施方案中,稳定整合的非天然核苷酸是可以与另一非天然核苷酸形成碱基对(非天然碱基对(UBP))的非天然核苷酸。例如,第一非天然核苷酸可以与第二非天然核苷酸形成碱基对。例如,可以在掺入核酸期间和/或之后进行碱基配对的一对非天然核苷三磷酸包括(d)5SICS的三磷酸酯((d)5SICSTP)和(d)NaM的三磷酸酯((d)NaMTP)。其他例子包括但不限于:(d)CNMO的三磷酸酯((d)CNMOTP)和(d)TPT3的三磷酸酯((d)TPT3TP)。此类非天然核苷酸可以具有核糖或脱氧核糖糖部分(由“(d)”指示)。例如,可以在掺入核酸时进行碱基配对的一对非天然核苷三磷酸包括(d)TAT1的三磷酸酯((d)TAT1TP)和(d)NaM的三磷酸酯((d)NaMTP)。例如,可以在掺入核酸中时进行碱基配对的一对非天然核苷三磷酸包括(d)CNMO的三磷酸酯((d)CNMOTP)和(d)TAT1的三磷酸酯((d)TAT1TP)。例如,可以在掺入核酸中时进行碱基配对的一对非天然核苷三磷酸包括(d)TPT3的三磷酸酯((d)TPT3TP)和(d)NaM的三磷酸酯((d)NaMTP)。在一些实施方案中,非天然核苷酸基本上不与天然核苷酸(A、T、G、C)形成碱基对。在一些实施方案中,稳定整合的非天然核苷酸可以与天然核苷酸形成碱基对。
在一些实施方案中,稳定整合的非天然(脱氧)核糖核苷酸是可以形成UBP,但是基本上不与天然(脱氧)核糖核苷酸中的每任一种形成碱基对的非天然(脱氧)核糖核苷酸。在一些实施方案中,稳定整合的非天然(脱氧)核糖核苷酸是可以形成UBP,但是基本上不与一种或多种天然核酸形成碱基对的非天然(脱氧)核糖核苷酸。例如,稳定整合的非天然核苷酸可能基本上不与A、T和C形成碱基对,但是可以与G形成碱基对。例如,稳定整合的非天然核苷酸可能基本上不与A、T和G形成碱基对,但是可以与C形成碱基对。例如,稳定整合的非天然核苷酸可能基本上不与C、G和A形成碱基对,但是可以与T形成碱基对。例如,稳定整合的非天然核苷酸可能基本上不与C、G和T形成碱基对,但是可以与A形成碱基对。例如,稳定整合的非天然核苷酸可能基本上不与A和T形成碱基对,但是可以与C和G形成碱基对。例如,稳定整合的非天然核苷酸可能基本上不与A和C形成碱基对,但是可以与T和G形成碱基对。例如,稳定整合的非天然核苷酸可能基本上不与A和G形成碱基对,但是可以与C和T形成碱基对。例如,稳定整合的非天然核苷酸可能基本上不与C和T形成碱基对,但是可以与A和G形成碱基对。例如,稳定整合的非天然核苷酸可能基本上不与C和G形成碱基对,但是可以与T和G形成碱基对。例如,稳定整合的非天然核苷酸可能基本上不与T和G形成碱基对,但是可以与A和G形成碱基对。例如,稳定整合的非天然核苷酸可能基本上不与G形成碱基对,但是可以与A、T和C形成碱基对。例如,稳定整合的非天然核苷酸可能基本上不与A形成碱基对,但是可以与G、T和C形成碱基对。例如,稳定整合的非天然核苷酸可能基本上不与T形成碱基对,但是可以与G、A和C形成碱基对。例如,稳定整合的非天然核苷酸可能基本上不与C形成碱基对,但是可以与G、T和A形成碱基对。
能够形成非天然DNA或RNA碱基对(UBP)的示例性非天然核苷酸包括但不限于(d)5SICS、(d)5SICS、(d)NaM、(d)NaM、(d)TPT3、(d)MTMO、(d)CNMO、(d)TAT1及其组合。在一些实施方案中,非天然核苷酸碱基对包括但不限于:
在一些实施方案中,如在RNA已经经历逆转录的情况下,形成UBP,其中非天然核碱基如上文所示或本文其他地方所述,并且糖之一是核糖或其修饰形式(但不是脱氧核糖)。
测量寡核苷酸中的非天然核苷酸含量
在一些实施方案中,本文公开的方法包括测量例如在cDNA中的非天然核苷酸的量。当cDNA由从DNA分子转录的RNA产生时,这种方法可以用于独立于翻译来确定转录期间非天然核苷酸保留的保真度的下限。在一些实施方案中,所述方法用于测量转录和逆转录的组合保真度。在一些实施方案中,所述方法用于测量非天然核苷酸在转录和逆转录期间的保留。
在一些实施方案中,测量步骤可以使用识别非天然核碱基的结合配偶体。在非天然核碱基包含生物素部分的情况下,结合配偶体可以是生物素结合剂(例如,链酶亲和素、亲和素、中性亲和素或抗生物素抗体)。在一些实施方案中,所述生物素结合剂与固体支持物(如珠粒)缔合(例如,结合,如共价结合)。在一些实施方案中,所述结合配偶体是链霉亲和素。结合配偶体的结合可以在凝胶移位测定或迁移率移位测定中进行评估,因为与结合配偶体结合的多核苷酸(理解为包含非天然核碱基)将展现出与未结合的多核苷酸(理解为缺乏非天然核碱基)不同的电泳迁移率。在通过逆转录酶掺入的核苷酸的非天然核碱基本身不包含生物素部分或结合配偶体的其他靶标的情况下,仍然可以使用结合配偶体测量非天然核碱基的量,例如如下。可以由cDNA产生互补分子或扩增子(例如,如对于在实施例中进行的生物素移位测定所述),其确实包含生物素化非天然核碱基,然后可以将其作为cDNA的替代物进行测定,并在计算中进行适当调整。在一些实施方案中,cDNA的扩增是通过PCR进行的。示例性生物素化非天然核碱基可以使用dMMO2bioTP(dNaMTP的生物素化类似物)和d5SICSTP(dTPT3TP的类似物,其在复制期间与dMMO2bio配对好于dTPT3TP自身)掺入互补分子或扩增子中。(Malyshev等人,A Semi-Synthetic Organism with an Expanded GeneticAlphabet.Nature 2014,509,385–388.)其中产生含有生物素化非天然核碱基的互补分子或扩增子的这种方法被认为包含在短语“使用识别非天然核苷酸的结合配偶体测量cDNA中的非天然核苷酸的量”等中。
在一些实施方案中,使用识别非天然核碱基的结合配偶体测量cDNA中的非天然核苷酸的量包括生物素移位测定。生物素移位测定包括任何这样的测定,其基于结合或不结合生物素结合剂(如链霉亲和素)的差异迁移率来区分生物素化与未生物素化产物。迁移率可以是例如电泳迁移率(例如,凝胶电泳迁移率或毛细管电泳迁移率)或色谱迁移率(例如,使用凝胶过滤、离子交换或疏水相互作用色谱法)。
当由从DNA分子转录的RNA产生cDNA时,转录可以在体外或体内进行。在一些实施方案中,转录在细菌或原核生物(如大肠杆菌)中进行。在一些实施方案中,转录RNA的DNA分子是ssDNA或dsDNA。
在一些实施方案中,所述方法包括计算转录-逆转录(T-RT)保真度(转录和逆转录步骤的总体保真度)。例如,T-RT保真度可以被测定为(a)含有非天然核苷酸的cDNA的比例与(b)转录前含有非天然核苷酸的DNA的比例的比率。在使用进一步合成步骤(如扩增)来制备生物素化DNA的情况下,可以通过因子来调节所述比率以补偿进一步合成步骤中的非天然碱基对损失。如实施例中所示,1.06是所述因子的示例性的值。
筛选RNA适配体侯选物的方法
本文还公开了筛选RNA适配体候选物的方法。在一些实施方案中,所述方法包括将多种不同的RNA寡核苷酸(“文库”)与靶标一起孵育,其中所述RNA寡核苷酸包含至少一个非天然核苷酸。在一些实施方案中,所述方法包括对所述多种RNA寡核苷酸中与所述靶标结合的RNA寡核苷酸进行至少一轮选择。在一些实施方案中,所述方法包括分离与所述靶标结合的富集的RNA寡核苷酸,其中所述分离的富集的RNA寡核苷酸包含RNA适配体。在一些实施方案中,所述方法包括将所述RNA适配体中的一种或多种逆转录成cDNA,其中所述cDNA在与所述RNA适配体中的所述非天然核碱基互补的位置处包含非天然脱氧核糖核苷酸,从而提供对应于所述RNA适配体的cDNA分子的文库。
在一些实施方案中,所述多种不同的RNA寡核苷酸包含随机化核苷酸区域。这可以通过以下方式来产生:例如,使用在核苷酸合成程序的某些周期中的核苷酸的混合池,或者在从DNA模板转录寡核苷酸之前进行诱变PCR。随机化核苷酸区域可以包含一个或多个随机化位置。在存在多个随机化位置的情况下,它们可以是连续的或被一个或多个非随机化核苷酸或非随机化核苷酸片段中断。在一些实施方案中,所述非天然核碱基在随机化区域内(例如,第一随机化位置的3'端和第二随机化位置的5'端)。在一些实施方案中,所述非天然核碱基在至少一个随机化位置的5个或10个核苷酸内。在一些实施方案中,所述非天然核碱基紧邻随机化位置,或紧邻两个随机化位置。
在一些实施方案中,所述RNA寡核苷酸包含条形码序列和/或引物结合序列。如实施例7所示,条形码序列可以用于识别非天然核碱基的位置,并且引物结合序列可以用于选择后活性序列的下游分析。
在一些实施方案中,对由RNA适配体产生的cDNA进行测序。在一些实施方案中,使由RNA适配体产生的cDNA突变以产生多个另外的序列,然后所述另外的序列可以被转录成RNA以进行至少一轮进一步的选择。可以例如通过易错PCR使cDNA突变。
在一些实施方案中,所述选择包括洗涤步骤以去除未结合或弱结合的RNA寡核苷酸。可以采用一系列洗涤步骤,其中随着方法的进行严格性增加,例如以提供更多的选择压力。
可以例如单独分析通过所述方法鉴定的RNA适配体结合、激动或拮抗靶标的能力。在一些实施方案中,分析所述RNA适配体结合所述靶标的能力包括测定Kd、kon或koff。在一些实施方案中,分析所述RNA适配体使所述靶标激动的能力包括测定EC50值。在一些实施方案中,分析所述RNA适配体拮抗所述靶标的能力包括测定Ki或IC50值。
多核苷酸的另外的特征
本文所描述的特征可以在可行的程度上与任何公开的实施方案相结合。在一些实施方案中,含有非天然核糖核苷酸的多核苷酸包含至少15个核苷酸。在一些实施方案中,多核苷酸包含至少20、25、30、35、40、50、60、70、80、90或100个核苷酸。在一些实施方案中,含有非天然核糖核苷酸的多核苷酸包含一个或多个ORF。ORF可以来自任何合适的来源,有时来自基因组DNA、mRNA、逆转录RNA或互补DNA(cDNA)或包含前述一种或多种的核酸文库,并且来自含有目的核酸序列、目的蛋白质或目的活性的任何生物体物种。可以从其获得ORF的生物体的非限制性例子包括例如细菌、酵母、真菌、人、昆虫、线虫、牛类、马类、犬类、猫类、大鼠或小鼠。在一些实施方案中,本文所述的核苷酸和/或核酸试剂或其他试剂是分离的或纯化的。可以通过已公布的体外方法创建包含非天然核苷酸的ORF。在一些情况下,核苷酸或核酸试剂包含非天然核碱基。
多核苷酸有时包含与ORF相邻的核苷酸序列,其与ORF结合翻译并编码氨基酸标签。编码标签的核苷酸序列位于核酸试剂中ORF的3'和/或5',由此编码由ORF编码的蛋白质或肽的C末端或N末端的标签。可以利用不消除体外转录和/或翻译的任何标签,并且可以由技术人员适当地选择。标签可以促进从培养物或发酵培养基分离和/或纯化所需ORF产物。在一些实例中,将核酸试剂文库与本文所述的方法和组合物一起使用。例如,文库中存在至少100、1000、2000、5000、10,000或多于50,000种独特多核苷酸的文库,其中每种多核苷酸包含至少一种非天然核碱基。
多核苷酸可以包含通常根据核酸的计划用途选择的某些元件,例如,调节元件。核酸试剂中可以包括或排除以下元件中的任一种。例如,多核苷酸可以包括以下核苷酸元件中的一种或多种或全部:一种或多种启动子元件、一个或多个5'非翻译区(5'UTR)、一个或多个可以插入靶核苷酸序列的区域(“插入元件”)、一种或多种靶核苷酸序列、一个或多个3'非翻译区(3'UTR)以及一种或多种选择元件。多核苷酸可以提供有一种或多种此类元件,并且可以在将核酸引入所需生物体中之前将其他元件插入核酸中。在一些实施方案中,所提供的核酸试剂包含启动子、5'UTR、可选的3'UTR和一种或多种插入元件,通过所述插入元件将靶核苷酸序列插入(即,克隆)至核酸试剂中。在某些实施方案中,所提供的核酸试剂包含启动子、一种或多种插入元件和可选的3'UTR,并且用可选的3'UTR插入5'UTR/靶核苷酸序列。所述元件可以按适合于在所选表达系统中表达(例如,在所选生物体中的表达,或者例如在无细胞系统中的表达)的任何顺序排列,并且在一些实施方案中,核酸试剂在5'至3'方向上包含以下元件:(1)启动子元件、5'UTR和一种或多种插入元件;(2)启动子元件、5'UTR和靶核苷酸序列;(3)启动子元件、5'UTR、一种或多种插入元件和3'UTR;以及(4)启动子元件、5'UTR、靶核苷酸序列和3'UTR。在一些实施方案中,可以优化UTR以改变或增加完全天然或含有非天然核苷酸的ORF的转录或翻译。
多核苷酸(例如,表达盒和/或表达载体)可以包括多种调节元件,包括启动子、增强子、翻译起始序列、转录终止序列和其他元件。“启动子”通常是一个或多个DNA序列,其在位于关于转录起始位点的相对固定位置时发挥作用。例如,启动子可以位于核苷酸三磷酸转运蛋白核酸区段的上游。“启动子”含有RNA聚合酶与转录因子的基础相互作用所需的核心元件,并且可以含有上游元件和反应元件。“增强子”通常是指DNA序列,其不在转录起始位点的固定距离处发挥作用,并且可以位于转录单元的5'或3”。此外,增强子可以在内含子内以及在编码序列本身内。它们的长度通常在10与300个核苷酸之间,并且它们可以以顺式形式起作用。增强子发挥作用以增加来自附近启动子的转录。增强子像启动子一样,通常也含有介导转录调节的反应元件。增强子通常决定表达的调节,并且可以用于改变或优化ORF(包括完全天然或含有非天然核苷酸的ORF)表达。
如上所述,多核苷酸还可以包含一个或多个5'UTR以及一个或多个3'UTR。例如,真核宿主细胞(例如,酵母、真菌、昆虫、植物、动物、人或有核细胞)和原核宿主细胞(例如,病毒、细菌)中使用的表达载体可以含有针对转录终止进行信号传导的序列,所述序列可能影响mRNA表达。这些区域可以被转录为编码组织因子蛋白的mRNA的非翻译部分中的多腺苷酸化区段。3'非翻译区还包括转录终止位点。在一些优选实施方案中,转录单元包含多腺苷酸化区域。这个区域的一个益处在于,它增加像mRNA一样处理并转运所转录单元的可能性。表达构建体中的多腺苷酸化信号的鉴定和使用是众所周知的。在一些优选实施方案中,同源多腺苷酸化信号可以用于转基因构建体中。
5'UTR可以包含对于其所源自的核苷酸序列为内源的一种或多种元件,并且有时包括一种或多种外源元件。5'UTR可以源自任何合适的核酸,如基因组DNA、质粒DNA、RNA或mRNA,例如,源自任何合适的生物体(例如,病毒、细菌、酵母、真菌、植物、昆虫或哺乳动物)。技术人员可以基于所选表达系统(例如,在所选生物体中的表达,或者例如在无细胞系统中的表达)选择用于5'UTR的适当元件。5'UTR有时包含技术人员已知的以下元件中的一种或多种:增强子序列(例如,转录或翻译)、转录起始位点、转录因子结合位点、翻译调节位点、翻译起始位点、翻译因子结合位点、辅助蛋白结合位点、反馈调节剂结合位点、普里布诺框、TATA框、-35元件、E盒(螺旋-环-螺旋结合元件)、核糖体结合位点、复制子、内部核糖体进入位点(IRES)、沉默子元件等。在一些实施方案中,可以分离启动子元件,使得适当的条件性调节所需的所有5'UTR元件都含于启动子元件片段中,或者启动子元件片段的功能性子序列内。
多核苷酸中的5'UTR可以包含翻译增强子核苷酸序列。翻译增强子核苷酸序列通常位于多核苷酸中的启动子与靶核苷酸序列之间。翻译增强子序列通常结合至核糖体,有时是18S rRNA结合核糖核苷酸序列(即,40S核糖体结合序列),并且有时是内部核糖体进入序列(IRES)。IRES通常形成具有精确放置的RNA三级结构的RNA支架,所述RNA三级结构经由多种特定分子间相互作用接触40S核糖体亚基。核糖体增强子序列的例子是已知的并且可以由技术人员鉴定(例如,Mignone等人,Nucleic Acids Research 33:D141-D146(2005);Paulous等人,Nucleic Acids Research 31:722-733(2003);Akbergenov等人,NucleicAcids Research 32:239-247(2004);Mignone等人,Genome Biology 3(3):reviews0004.1-0001.10(2002);Gallie,Nucleic Acids Research 30:3401-3411(2002);Shaloiko等人,DOI:10.1002/bit.20267;和Gallie等人,Nucleic Acids Research 15:3257-3273(1987))。
翻译增强子序列有时是真核序列,如Kozak共有序列或其他序列(例如,水螅体序列,GenBank登录号U07128)。翻译增强子序列有时是原核序列,如Shine-Dalgarno共有序列。在某些实施方案中,翻译增强子序列是病毒核苷酸序列。翻译增强子序列有时来自植物病毒的5'UTR,所述植物病毒如例如烟草花叶病毒(TMV)、苜蓿花叶病毒(AMV);烟草蚀纹病毒(ETV);马铃薯Y病毒(PVY);芜菁花叶(poty)病毒和豌豆种传花叶病毒。在某些实施方案中,在多核苷酸中包含来自TMV的长度约67个碱基的ω序列作为翻译增强子序列(例如,缺乏鸟苷核苷酸并且包括长度为25个核苷酸的聚(CAA)中心区域)。
3'UTR可以包含对于其所源自的核苷酸序列为内源的一种或多种元件,并且有时包括一种或多种外源元件。3'UTR可以源自任何合适的核酸,如基因组DNA、质粒DNA、RNA或mRNA,例如,源自任何合适的生物体(例如,病毒、细菌、酵母、真菌、植物、昆虫或哺乳动物)。技术人员可以基于所选表达系统(例如,在所选生物体中的表达)选择用于3'UTR的适当元件。3'UTR有时包含技术人员已知的以下元件中的一种或多种:转录调节位点、转录起始位点、转录终止位点、转录因子结合位点、翻译调节位点、翻译终止位点、翻译起始位点、翻译因子结合位点、核糖体结合位点、复制子、增强子元件、沉默子元件和聚腺苷尾。3'UTR通常包括聚腺苷尾并且有时不包括,并且如果存在聚腺苷尾,可以在其中添加或缺失一个或多个腺苷部分(例如,可以添加或减去约5、约10、约15、约20、约25、约30、约35、约40、约45或约50个腺苷部分)。
在一些实施方案中,使用5'UTR和/或3'UTR的修饰改变(例如,增加、添加、降低或基本上消除)启动子的活性。通过来自可操作地连接的包含修饰的5'或3'UTR的启动子元件的一个或多个目的核苷酸序列的转录的改变,启动子活性的改变又可以改变肽、多肽或蛋白质的活性(例如,酶活性)。例如,在某些实施方案中,微生物可以通过基因修饰来工程化以表达包含修饰的5'或3'UTR的多核苷酸,所述修饰的5'或3'UTR可以添加新型活性(例如,通常在宿主生物体中没有发现的活性),或者通过增加来自与目的核苷酸序列(例如,目的同源或异源核苷酸序列)可操作地连接的同源或异源启动子的转录来增加现有活性的表达。在一些实施方案中,在某些实施方案中,微生物可以通过基因修饰来工程化以表达包含经修饰的5'UTR或3'UTR的核酸试剂,所述经修饰的5'UTR或3'UTR可以通过降低或基本上消除来自与目的核苷酸序列可操作地连接的同源或异源启动子的转录来降低活性的表达。
试剂盒和制品
在某些实施方案中,本文公开了与本文所述的一种或多种方法一起使用的试剂盒和制品。此类试剂盒包括载体、包装或容器,其被分隔以容纳一个或多个容器如小瓶、管等,所述一个或多个容器中的每一个包含有待在本文所述的方法中使用的单独要素之一。合适的容器包括例如瓶、小瓶、注射器和试管。在一个实施方案中,容器由各种材料(如玻璃或塑料)形成。
在一些实施方案中,试剂盒包括合适的包装材料来容纳试剂盒的内容物。在一些情况下,包装材料是通过熟知的方法来构建的,优选地以提供无菌无污染的环境。本文所用的包装材料可以包括例如通常用于出售用于与核酸测序系统一起使用的商业试剂盒中的那些。示例性包装材料包括而不限于能够将本文所述的组分保持在固定界限内的玻璃、塑料、纸、箔等。
包装材料可以包括指示组分具体用途的标签。标签所指示的试剂盒的用途可以是对于试剂盒中存在的特定组分组合适当的本文所述的一种或多种方法。例如,标签可以指示,试剂盒用于合成多核苷酸的方法中,或者用于确定核酸序列的方法中。
试剂盒中还可以包括所包装试剂或组分的使用说明。所述说明典型地将包括描述反应参数的有形表达,所述反应参数如要混合的试剂盒组分和样品的相对量、试剂/样品混合物的维持时间段、温度、缓冲条件等。
将理解,并非特定反应所需的所有组分都必须存在于特定试剂盒中。而是可以从其他来源提供一种或多种另外的组分。与试剂盒一起提供的说明可以标识要提供的一种或多种另外的组分以及可以从哪里获得所述组分。
在一些实施方案中,提供了一种试剂盒,所述试剂盒用于将非天然核酸稳定掺入细胞核酸中,例如,使用本公开文本提供的用于制备基因工程化细胞的方法。在一个实施方案中,本文所述的试剂盒包括基因工程化细胞以及一种或多种非天然核酸。
在另外的实施方案中,本文所述的试剂盒提供细胞和含有用于引入所述细胞中以由此提供基因工程化细胞的异源基因的核酸分子,如包含本段之前描述的任何实施方案的核酸的表达载体。
实施例
体外和体内转录和逆转录实验的材料、方法和实验程序
在实施例1至5中,在适用的情况下使用以下实验程序。
材料。表4和表5提供了这项工作中使用的质粒和引物的完整列表。引物和天然寡核苷酸购自IDT(爱荷华科勒尔维尔)。通过Genewiz(加利福尼亚州圣地亚哥)进行测序。使用商业化小量制备试剂盒(D4013,Zymo Research;加利福尼亚州欧文)纯化质粒。使用商业化DNA纯化试剂盒(D4054,Zymo Research)纯化PCR产物,并且使用Infinite M200 Pro读板仪(TECAN)通过A260/A280吸收来定量。所有涉及RNA种类的实验都是用无RNA酶试剂、移液管吸头、试管和手套进行的,以避免污染。
商业上合成了dNaM、dTPT3、NAM、TPT3、d5SICS和dMMO2bio的核苷(WuXi AppTec;中国上海)并且使其三磷酸化(TriLink BioTechnologies LLC;加利福尼亚州圣地亚哥;和MyChem LLC;加利福尼亚州圣地亚哥)。合成所有非天然寡核苷酸,并将其通过BiosearchTechnologies(加利福尼亚州佩塔卢马)进行HPLC纯化。所有含有非天然碱基对的DNA样品均在-20℃下储存。所有RNA样品均在-80℃温度下储存。
表4.引物。表4按出现顺序分别公开了SEQ ID NO 1-12。
表5.寡核苷酸。表5按出现顺序分别公开了SEQ ID NO 13-34。
采用非天然碱基对的PCR反应。简言之,遵循制造商关于OneTaq的说明书(OneTaqDNA聚合酶,M0480L,New England Biolabs,(NEB)),其中添加各100nM dNaMTP和dTPT3TP。在所有情况下,将延伸步骤调整为4min。
EGFP和tRNA模板的构建。EGFP模板质粒pUCCS2_EGFP(NNN)和pUCCYBA_EGFP(NNN)通过使用EGFP序列背景的金门组装来制备。所有金门组装中使用的插入片段都是用合成的含dNaM的寡核苷酸和引物YZ73和YZ74产生的PCR产物(参见表6)。在金门组装后纯化质粒pUCCS2_EGFP(NNN)和pUCCYBA_EGFP(NNN),并且使用Qubit(ThermoFisher)对其进行定量。将EGFP模板质粒(2ng)用于模板产生PCR反应中,其中对于pUCCS2_EGFP(NNN),使用引物ED101和AZ38,并且对于pUCCYBA_EGFP(NNN),使用引物ED101和AZ87。将PCR产物进行DpnI消化,然后纯化以产生用于体外转录的EGFP模板。
表6.引物使用
用引物AZ01和AZ67通过直接PCR从合成的含有dNaM的寡核苷酸制备tRNA模板。对PCR产物进行纯化以产生用于体外转录的tRNA模板。
通过金门组装制备用于SSO体内翻译实验的pSyn_sfGFP(NNN)_mm(NNN)。在所有金门组装中使用的插入片段均是使用用于mRNA密码子插入片段的引物集YZ73/YZ74或用于tRNA反密码子插入片段的引物集YZ435/YZ436用合成的含有dNaM的寡核苷酸产生的PCR产物。在金门组装后纯化质粒pSyn_sfGFP(NNN)_mm(NNN),并且使用Qubit对其进行定量。
生物素移位测定。使用d5SICSTP和dMMO2bio-TP以及相应的引物集测定RNA种类的模板中非天然碱基对的保留。使用图像实验室(Bio-Rad)对条带强度进行定量。通过将每个样品的原始移位百分比除以当构建EGFP质粒时在金门组装中使用的合成的含dNaM寡核苷酸模板的原始移位百分比来将非天然碱基对保留归一化。生物素移位测定在以下文献中有更详细的讨论:Malyshev等人,A Semi-Synthetic Organism with an Expanded GeneticAlphabet.Nature 2014,509,385–388。
EGFP mRNA的体外转录。在相应地使用或不使用1.25mM非天然核糖核三磷酸的每个体外转录反应(HiScribe T7 ARCA,加尾,E2060S,New England Biolabs,(NEB))中使用模板(500-1000ng),然后纯化(D7010,Zymo Research)。通过Qubit对mRNA产物进行定量,然后在-80℃下以5μg等分试样在溶液中储存。
tRNA的体外转录。在相应地使用或不使用2mM非天然核糖核苷三磷酸的每个体外转录反应(T7 RNA聚合酶,E0251L,NEB)中使用模板(500-1000ng),然后纯化(D7010,Zymo)。通过Qubit对tRNA产物进行定量,然后进行重折叠(95℃持续1min,37℃持续1min,10℃持续2min)。所有tRNA均以1800ng等分试样在-80℃下储存。
逆转录。根据制造商对每种逆转录酶的说明书进行逆转录反应,并进行以下修改。在所有逆转录反应中,除非另有说明,否则每20μL反应使用1μg mRNA或20ng tRNA、0.5mMdNTP和0.2mM dNaMTP或dTPT3TP。对于SuperScript III(18080044,ThermoFisher),将反应在55℃下孵育45min,在70℃下灭活15min,然后进行RNA酶H(M0297S,新英格兰生物实验室,(NEB))和RNA酶A(R1253,ThermoFisher)消化。对于SuperScript IV(18090010,ThermoFisher),将反应在55℃下孵育20min,在80℃下灭活10min,然后进行RNA酶H、RNA酶A和蛋白酶K(P8107S,新英格兰生物实验室,(NEB))消化。对于AMV逆转录酶(M0277S,NewEngland Biolabs,(NEB)),将反应在42℃下孵育60min,在80℃下灭活5min,然后进行RNA酶H和RNA酶A消化。消化后,将10μL各反应混合物用RNA负载染料(B0363S,新英格兰生物实验室,(NEB))进行变性,并用8M尿素(CAS 57-13-6,Sigma-Aldrich)进行10%变性聚丙烯酰胺凝胶电泳以进行cDNA检测。使用商业化RNA纯化试剂盒(D7011,Zymo Research;加利福尼亚州尔湾)纯化另外的10μL反应混合物,并且使用Qubit对产物cDNA进行定量。
单链DNA分离。asDNA是从用于IVT反应的dsDNA模板用生物素化5'引物经由PCR扩增制备。根据制造商说明书使用DynabeadsTM MyOneTM链霉亲和素C1(65001,ThermoFisher),使产物生物素化dsDNA(bio-dsDNA)经受亲和单链分离方案。简言之,用WB缓冲液预洗涤珠粒(20μL)3次,然后将其与纯化的bio-dsDNA(20μL,约50ng/μL)混合。将混合物在轻轻摇动下在37℃下孵育2h。使用磁性支架将珠粒从缓冲液分离出来。然后用WB缓冲液洗涤珠粒3次,并用100μL 0.1M NaOH洗脱未生物素化的链(洗涤时间<30s)。然后使用柱纯化来纯化洗脱的未生物素化的asDNA。
SSO体内翻译。将在补充有50mM磷酸钾(CAS 7778-77-0,Sigma-Aldrich)、5μg/mL氯霉素(CAS 56-75-7,Sigma Aldrich)和100μg/mL羧苄青霉素(C1613,Sigma Aldrich)的2×YT(Y2377,Sigma Aldrich)(在本部分的下文中称为“培养基”)中的YZ3+pGEX-MbPylRSTetR细胞的2mL过夜培养物在相同的培养基中稀释至0.03的OD600,并生长至0.3至0.4的OD600。将培养物在冰水浴中在摇动下快速冷却5min,然后在3,200×g下沉淀10min。接下来用一个培养体积的预冷高压灭菌Milli-Q H2O洗涤细胞两次。然后将细胞重悬于另外冷却的H2O中,达到50-60的OD600。对于每个测试的样品,将50μL所得的电感受态细胞与0.5ng含有嵌入sfGFP和tRNAPyl基因中的UBP的金门组装的质粒组合,然后转移到预冷的电穿孔杯(0.2cm间距)。根据制造商关于细菌的说明书(25kV、2.5μF和200Ω电阻器)对细胞进行电穿孔(Gene Pulser II;Bio-Rad),然后立即用950μL预热培养基稀释。然后用预热的培养基将10μL的该稀释液稀释至50μL的最终体积,并补充150mM dNaMTP和10μM dTPT3TP。使转化在37℃下恢复1h。将恢复培养物接种在补充有50μg/mL博来霉素(R25001,ThermoFisher)、150μM dNaMTP、10μM dTPT3TP和2%w/v琼脂的固体培养基上,然后在37℃下生长过夜。
分离单个菌落,并将其用于接种补充有50μg/mL博来霉素的300μL液体培养基(在本部分的下文中称为“生长培养基”),并提供150μM dNaMTP和10μM dTPT3TP,然后使用带有590/20nm滤光片的Envision 2103多标记读板仪(Perkin Elmer)经由OD600监测细胞生长。在约0.7的OD600下收集细胞,然后对等分试样(100μL)进行小量制备。对分离的质粒进行生物素移位测定以测定UBP保留。然后,在补充有150μM dNaMTP和10μM dTPT3TP的300μL生长培养基中,将显示为保留UBP的菌落稀释回至约0.1-0.2的OD600。在0.4-0.6的OD600下,除非另有说明,否则用250μM NaMTP和30μM TPT3TP以及10mM的ncAA N6-(2-叠氮乙氧基)-羰基-L-赖氨酸(AzK)补充培养物。然后再培养20min,然后将IPTG(CAS 367-93-1,Sigma-Aldrich)添加至1mM的浓度,并生长1h以诱导T7 RNA聚合酶、tRNAPyl和PylRS的转录。每隔30min监测细胞的生长(OD600)和GFP荧光。然后用100ng/mL无水四环素(CAS 13803-65-1,Sigma-Aldrich)诱导sfGFP的表达。在另外生长3h后,收集细胞培养物并将其在冰上冷却。使用50μL的培养物进行质粒分离以测定UBP保留(生物素移位测定);使用剩余的250μL培养物进行总RNA提取以测量T-RT保留。
总RNA提取。在体内翻译实验之后,收集大肠杆菌培养物并将其以10,000rpm离心(离心机5415C,Eppendorf)30秒,并丢弃上清液。然后向每个样品中添加1mL TRIzol(15596026,ThermoFisher)。将混合物均质化,并在室温下培养5min。向每个样品中添加200μL氯仿(CAS 67-66-3,Sigma-Aldrich),将混合物涡旋以均质化,然后室温孵育3min以允许相分离。接下来,将样品在4℃下以12,000rpm离心15min,将无色水相收集到新管中,并向水相中添加500μL异丙醇(CAS 67-63-0,Sigma-Aldrich)。在室温下孵育10min后,将样品在4℃下以7,000rpm离心10min,并丢弃上清液。然后用1mL 75%乙醇洗涤样品2次。将管盖打开以使样品在室温下干燥30min,并将所得的总RNA用20μL不含RNA酶的水溶解。使用Qubit测量总RNA的浓度。
实施例1.依序体外转录(IVT)和逆转录
为了探索逆转录酶有效识别含有UBP的RNA的能力,用可商购的逆转录酶:SuperScript III、SuperScript IV和AMV逆转录酶进行了依序体外转录(IVT)和逆转录。对含有EGFP基因且dNaM或dTPT3位于编码密码子151的第二核苷酸的位置的DNA进行PCR扩增,并将其用作IVT反应的模板,所述IVT反应补充有相应非天然核糖核苷三磷酸,但在其他方面根据制造商说明书运行。将RNA纯化,然后用作RT反应的模板,所述RT反应在有或没有非天然脱氧核糖核苷三磷酸的情况下进行(此外,引物安装了3'延伸部以便于分析,参见下文)。1小时后,对RT反应的一半进行PAGE凝胶电泳以定性评估全长和截短的产物的存在,并对另一半进行纯化以随后表征非天然核苷酸的保留。
在AMV逆转录酶的情况下,含有NaM或TPT3的RNA模板在dTPT3TP或dNaMTP不存在时大部分仅产生截短的cDNA产物,并且在提供dTPT3TP或dNaMTP时大部分仅产生全长产物(图2)。相比之下,在SuperScript III或SuperScript IV的情况下,无论是否添加了非天然三磷酸,用任一模板均观察到全长cDNA产物(图2)。使用基本上如Malyshev等人,A Semi-Synthetic Organism with an Expanded Genetic Alphabet.Nature2014,509,385–388中所述进行的生物素移位测定来检测RT产物中非天然核苷酸的存在。在每种天然dNTP以及dMMO2bioTP(dNaMTP的生物素化类似物)和d5SICSTP(dTPT3TP的类似物,其在复制期间与dMMO2 bio配对好于dTPT3TP自身)存在的情况下,通过PCR扩增纯化的cDNA。使用退火至通过RT引物安装的序列的3'引物(参见上文)防止了原始IVT反应中剩余的任何DNA模板的扩增(图3)。然后将PCR产物与链霉亲和素一起孵育,并进行PAGE电泳,其中所得到的移位条带与未移位条带的比率指示含有非天然核苷酸的cDNA的百分比。正如预期的那样,当RT反应中不添加非天然三磷酸时,没有观察到移位产物。相反,当向RT反应中添加互补的非天然三磷酸时,观察到显著的移位,表明在所有三种逆转录酶的情况下,显著量的cDNA产物含有非天然核苷酸(图2)。
实施例2.tRNA模板浓度的影响的研究
使用通过来自在与反密码子的第二核苷酸对应的位置含有dNaM或dTPT3的合成寡核苷酸的PCR产物的IVT产生的tRNA模板来研究tRNA模板浓度对非天然核碱基的逆转录效率的影响。在最高tRNA浓度(25ng/μL)下,NaM或TPT3模板在存在其相应的非天然脱氧核糖三磷酸的情况下逆转录分别产生88%和44%全长产物。有趣的是,在较低的tRNA模板浓度下,全长产物的百分比增加。使用0.5μg/mL模板,使用NaM或TPT3模板逆转录分别产生97%和92%全长产物(图3、表1)。
表1.使用含有NaM或TPT3的RNA时SuperScript III RT反应全长cDNA产物比率的RNA浓度依赖性的原始数据。
实施例3.依序体外转录(IVT)和逆转录后UBP保留的测定
开发了一种测定以定量测量依序用T7 RNA聚合酶体外转录(IVT)和用以下可商购逆转录酶逆转录(RT)后的UBP保留:SuperScript III、SuperScript IV和AMV逆转录酶。为了仅关注在IVT和RT期间发生的非天然核苷酸损失(即,排除在IVT模板的PCR制备期间发生的任何损失),所述测定还分析了反义DNA模板(R(asDNA))的非天然核苷酸含量(图4)。组合T-RT保真度计算如下:
其中包括常数α=1.06以说明制备bio-dsDNA所需的另外的PCR步骤中UBP损失的贡献。由于T-RT保留对应于转录和逆转录期间的非天然核苷酸损失,因此它在T-RT反应的任一步骤中提供了非天然核苷酸保留的下限。
首先应用T-RT保真度测定来确定含有包括AXC、AYC、GXC、GYC、GXT或GYT(X=NaM并且Y=TPT3)的非天然第151个密码子的EGFP mRNA的IVT转录保真度的下限,所述密码子中的每一个已被用于在哺乳动物细胞中表达非天然蛋白质。值得注意的是,具有NaM或TPT3的所有序列产生全长cDNA作为主要产物,其中组合T-RT保留为90%至100%(图5A、图6)。至少在这种序列背景下,非天然碱基对在体外以合理的保真度进行转录(和逆转录)。
接下来,研究了具有反密码子GYT、GXT、GYC、GXC、CYA和CXA的马氏甲烷八叠球菌(M.mazei)tRNA的T-RT。每个tRNA基因,无论其是否含有NaM或TPT3,都再次产生全长cDNA作为主要产物,并且非天然核苷酸保留在90%至100%范围内(图5B、图6)。增加的tRNA结构并没有明显阻碍其体外转录和用非天然反密码子的逆转录。
先前报道,HEK293T细胞能够使用EGFP(GXC)mRNA和马氏甲烷八叠球菌tRNA(GYC)产生含有ncAA AzK的EGFP蛋白。(Zhou等人,Progress toward Eukaryotic SemisyntheticOrganisms:Translation of Unnatural Codons.J.Am.Chem.Soc.2019,141,20166–20170.)在这些先前的实验中,将HEK293T细胞与AzK一起提供,并且用分别含有非天然密码子和反密码子的mRNA和tRNA以及编码嵌合PylRS的DNA质粒转染,所述DNA质粒用AzK改变马氏甲烷八叠球菌tRNA。用于制备mRNA的DNA模板的80%含有非天然核苷酸,并且在体内表达的蛋白质的70%含有AzK。通过对EGFP(GXC)基因的最小转录保真度的上述分析,真核核糖体的翻译保真度估计为:
先前已在大肠杆菌SSO中鉴定出若干个非天然密码子,包括AXA、AXT、TXA和TXT,如在DNA复制期间很好地保留但只能低效产生具有ncAA的蛋白质。(Fischer等人,New Codonsfor Efficient Production of Unnatural Proteins in a SemisyntheticOrganism.Nat.Chem.Biol.2020,16,570–576.)这表明它们在SSO中没有被T7 RNAP很好地转录和/或它们在核糖体上没有被很好地解码。对单独含有每个密码子的DNA进行开发的体外T-RT测定。再次显示每个模板产生全长cDNA作为主要产物,其中非天然核苷酸保留为约90%(图5A)。这些数据证明转录是相对高效的,并表明这些密码子不能高效地参与翻译。
实施例4.在大肠杆菌SSO中体内转录的表征
使用实施例3中开发的T-RT保留测定表征从大肠杆菌SSO分离的RNA。用分别编码含有第151个密码子AXC、GXC或GXT的sfGFP基因和含有相应反密码子GYT、GYC或AYC的马氏甲烷八叠球菌tRNA基因的pSyn质粒转化ML2细胞。在每种情况下,SSO先前都显示出以高保真度产生非天然蛋白质(Fischer,E.C.等人,Nat.Chem.Biol.2020,16,570–576)。此处,如上所述分析asDNA中以及每个mRNA和tRNA内非天然核苷酸的保留。数据揭示,NaM密码子的转录在SSO中进行且几乎没有非天然核苷酸的损失。对于tRNA,TPT3反密码子的保留在85%至100%范围内(图7A-图7B、表2)。
表2.从SSO体内翻译实验提取的mRNA和tRNA的T-RT保留和标准偏差的原始数据。
(n=3)。
数据表明,含有NaM的mRNA的转录保真度较高,并且含有TPT3的tRNA的转录保真度略低,这不会导致ncAA掺入的保真度降低。
与上述检查的密码子形成对照,大肠杆菌SSO先前显示出不能使用TPT3密码子AYC、GYC或GYT(也在密码子151处)和使用含有相应非天然反密码子的马氏甲烷八叠球菌tRNA高效地产生sfGFP蛋白(Fischer,E.C.等人,Nat.Chem.Biol.2020,16,570–576)。此处,检查了相应mRNA和tRNA的SSO转录(图7A-图7B、表2)。数据揭示,产生含有每一个功能较弱的密码子/反密码子对的mRNA和tRNA的效率和保真度与先前分析的介导高水平ncAA掺入的对难以区分。这表明SSO中的AYC、GYC或GYT密码子的较差性能是由于大肠杆菌核糖体降低翻译效率所致。也就是说,在大肠杆菌SSO中,相比于转录,翻译通常对UBP序列背景更敏感。
除了没有很好地翻译的TPT3密码子外,一个NaM密码子GXA产生了具有一定程度受损的ncAA掺入保真度(50%-60%)的sfGFP,尽管其在DNA中的保留很高。当检查在携带该密码子/反密码子对的SSO中产生的RNA时,发现tRNA、尤其是mRNA都以略低的保真度产生,其在两种情况下都为约80%(图7A-图7B、表2)。考虑到天然mRNA的非线性贡献的可能性(由于更高效的翻译),该数据表明,与其他密码子相比,对SSO中GXA密码子的ncAA掺入保真度降低的显著贡献源于转录保真度降低。
实施例5.非天然核糖核苷酸三磷酸浓度对在SSO中转录的影响
进一步使用上述T-RT保真度测定探索转录保真度对非天然核糖核苷酸三磷酸浓度的依赖性。如上所述培养携带sfGFP(GXT)和马氏甲烷八叠球菌tRNA(AYC)的SSO,不同的是提供了不同量的NaMTP或TPT3TP。当TPT3TP的浓度在250mM下保持恒定并且NaMTP的浓度降低时,NaM在mRNA中的保留保持较高,直到浓度降至小于50μM(图8A-图8B、表3)。当NaMTP的浓度在250mM下保持恒定并且TPT3TP的浓度变化时,即使在检测的最低浓度(10μM)下,TPT3在tRNA中的保留也保持较高(图8A-图8B、表3)。因此,相比于NaMTP,SSO可以耐受更低浓度的TPT3TP。
表3.SSO体内翻译实验中T-RT保留对NaMTP或TPT3TP浓度的依赖性的原始数据。(n=3)。
实施例7.使用转录和逆转录实现RNA适配体选择的扩展
为了开发靶向目的蛋白的RNA适配体,首先通过IVT由DNA产生RNA文库,对其进行选择以使文库富集所需的RNA,通过RT转化回DNA以用于PCR扩增,然后通过IVT分析或转化回RNA,并进行另外轮次的选择。因此,为了开发包含非天然核苷酸的RNA适配体,含有非天然核酸的DNA必须高效地逆转录成包含非天然寡核苷酸的RNA。在本实施例中,将一系列具有非天然核苷酸的相关DNA寡核苷酸转化为具有相应非天然核苷酸的RNA,然后针对抑制效力对其进行选择。寡核苷酸的长度可以是约100个碱基。将初始DNA寡核苷酸中约40个核苷酸的区域随机化,并将单个dNaM掺入所述区域的多个(例如,3个)不同位置处,两侧侧接条形码序列(用于鉴定非天然核苷酸位置)和引物结合序列。由此产生了多个(例如,3个)相关的DNA文库。在包括dTPT3TP和dNaMTP的反应中对多个随机化寡核苷酸文库的等摩尔混合物进行PCR扩增。引发dTPT3核苷酸合成的引物包含经由二硫键或其他可裂解部分附接至其5'端的生物素标签,所述生物素标签是可商购并且常用的。扩增后,通过以下方式纯化dsDNA:与链霉亲和素包被的磁珠结合,对磁珠进行缓冲液洗涤步骤,然后用0.1mM NaOH洗涤以洗脱含有dNaM的ssDNA文库。含有dTPT3的ssDNA文库可以通过使用30mM三(2-羧乙基)膦(TCEP)(或任何其他合适的试剂)的还原裂解从珠粒释放。然后,任一ssDNA文库可以用作用于补充有适当的非天然核糖三磷酸(TPT3TP或NaMTP)的由T7 RNA聚合酶介导的IVT反应的模板。对DNA进行核降解并且纯化文库(例如,用旋转柱如Zymo-ssDNA/RNA纯化试剂盒)。
文库是折叠的。然后针对与目的蛋白的结合对得到的折叠文库进行选择。将文库与目的靶蛋白一起孵育,例如固定在高蛋白吸附ELISA板上,洗涤,然后通过用甲酰胺洗涤三次来洗脱。通过各种方法增加对于与目的蛋白结合的选择压力,包括在随后轮次的选择中逐渐提高洗涤缓冲液中的盐浓度或在结合缓冲液中添加酵母tRNA作为结合竞争物。在每轮选择之后,分离与目的蛋白结合的RNA,并洗脱RNA寡核苷酸。根据本文所述的方法将RNA寡核苷酸逆转录成cDNA。用dTPT3TP和dNaMTP以及相同的生物素化引物对cDNA进行PCR扩增,并根据需要进行另外轮次的选择,从而提供一组富集的适配体。
在上述步骤后的若干轮选择之后,将富集的单独RNA适配体逆转录成cDNA,进行PCR扩增,并测序(例如,其中用天然核苷酸代替非天然核苷酸进行测序,并且依赖条形码序列来鉴定非天然核苷酸位置)。研究了富集的RNA寡核苷酸之间的序列同源性,并选择了序列子集以用于进一步表征。然后合成并折叠所选择的RNA适配体。然后单独分析每种适配体结合靶蛋白的能力(或者如果靶蛋白是酶,则分析抑制其活性的能力)。适配体的抑制效力被定量为Kd或Ki值。任选地,最有前景的RNA寡核苷酸可以被逆转录成cDNA,并经由易错PCR进一步随机化其序列,以产生另外的文库以用于进一步轮次的选择。
***
虽然已经在此示出并描述了本公开的优选实施方案,但是对本领域的普通技术人员而言应该显而易见的是这样的实施方案仅以举例方式提供。在不偏离本公开文本的情况下,本领域技术人员现将想到许多变化、改变和替换。应当理解,在此描述的本公开的实施方案的不同替代方案可以用于实施本公开。以下权利要求旨在限定本公开的范围,并且在这些权利要求及其等同物的范围内的方法和结构涵盖在其中。
SEQUENCE LISTING
<110> 斯克利普斯研究所
新索思股份有限公司
<120> 包含非天然核苷酸的多核苷酸的逆转录
<130> 36271-812.601
<140>
<141>
<150> 63/104,785
<151> 2020-10-23
<160> 34
<170> PatentIn version 3.5
<210> 1
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 1
gacaaattaa tacgactcac tataggaaac ctgatcatgt agatcgaac 49
<210> 2
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 2
ccccaggctt tacactttat g 21
<210> 3
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<400> 3
tggcggaaac cccgggaatc taacccggct gaacggatt 39
<210> 4
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 4
ggaatctaac ccggctgaac 20
<210> 5
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 5
ggaatctaac ccggctgaac cctcgatgtt gtggcggatc 40
<210> 6
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 6
gattccattc ttttgtttgt ctgctggcgg aaaccccggg aatc 44
<210> 7
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 7
ggaatctaac ccggctgaac gattccattc ttttgtttgt ctgc 44
<210> 8
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 8
atgggtctca cacaaactcg agtacaactt taactcacac 40
<210> 9
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 9
atgggtctcg attccattct tttgtttgtc tgc 33
<210> 10
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 10
atgggtctcg aaacctgatc atgtagatcg aacgg 35
<210> 11
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 11
atgggtctca tctaacccgg ctgaacgg 28
<210> 12
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 12
taatacgact cactatagg 19
<210> 13
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 13
ctcgagtaca actttaactc acacaatgta tacatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 14
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 14
ctcgagtaca actttaactc acacaatgta gtaatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 15
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (32)..(32)
<223> unnatural ribonucleotide NaM
<400> 15
ctcgagtaca actttaactc acacaatgta ancatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 16
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (32)..(32)
<223> unnatural ribonucleotide TPT3
<400> 16
ctcgagtaca actttaactc acacaatgta ancatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 17
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (32)..(32)
<223> unnatural ribonucleotide NaM
<400> 17
ctcgagtaca actttaactc acacaatgta gncatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 18
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (32)..(32)
<223> unnatural ribonucleotide TPT3
<400> 18
ctcgagtaca actttaactc acacaatgta gncatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 19
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (32)..(32)
<223> unnatural ribonucleotide NaM
<400> 19
ctcgagtaca actttaactc acacaatgta gntatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 20
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (32)..(32)
<223> unnatural ribonucleotide TPT3
<400> 20
ctcgagtaca actttaactc acacaatgta gntatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 21
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (32)..(32)
<223> unnatural ribonucleotide NaM
<400> 21
ctcgagtaca actttaactc acacaatgta anaatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 22
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (32)..(32)
<223> unnatural ribonucleotide NaM
<400> 22
ctcgagtaca actttaactc acacaatgta antatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 23
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (32)..(32)
<223> unnatural ribonucleotide NaM
<400> 23
ctcgagtaca actttaactc acacaatgta tnaatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 24
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (32)..(32)
<223> unnatural ribonucleotide NaM
<400> 24
ctcgagtaca actttaactc acacaatgta tntatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 25
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (32)..(32)
<223> unnatural ribonucleotide NaM
<400> 25
ctcgagtaca actttaactc acacaatgta gnaatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 26
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 26
cctgatcatg tagatcgaac ggactgtaaa tccgttcagc cgggttagat tc 52
<210> 27
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 27
cctgatcatg tagatcgaac ggactctaaa tccgttcagc cgggttagat tc 52
<210> 28
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (27)..(27)
<223> unnatural ribonucleotide TPT3
<400> 28
cctgatcatg tagatcgaac ggactgntaa tccgttcagc cgggttagat tc 52
<210> 29
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (27)..(27)
<223> unnatural ribonucleotide NaM
<400> 29
cctgatcatg tagatcgaac ggactgntaa tccgttcagc cgggttagat tc 52
<210> 30
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (27)..(27)
<223> unnatural ribonucleotide TPT3
<400> 30
cctgatcatg tagatcgaac ggactgncaa tccgttcagc cgggttagat tc 52
<210> 31
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (27)..(27)
<223> unnatural ribonucleotide NaM
<400> 31
cctgatcatg tagatcgaac ggactgncaa tccgttcagc cgggttagat tc 52
<210> 32
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (27)..(27)
<223> unnatural ribonucleotide TPT3
<400> 32
cctgatcatg tagatcgaac ggactancaa tccgttcagc cgggttagat tc 52
<210> 33
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (27)..(27)
<223> unnatural ribonucleotide NaM
<400> 33
cctgatcatg tagatcgaac ggactancaa tccgttcagc cgggttagat tc 52
<210> 34
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (27)..(27)
<223> unnatural ribonucleotide TPT3
<400> 34
cctgatcatg tagatcgaac ggacttncaa tccgttcagc cgggttagat tc 52
Claims (59)
1.一种逆转录包含非天然核糖核苷酸的多核苷酸的方法,所述方法包括在存在包含非天然核碱基的非天然dNTP的情况下用逆转录酶逆转录所述多核苷酸,
其中所述逆转录酶使cDNA聚合,所述非天然dNTP作为非天然核苷酸掺入所述cDNA中。
2.根据权利要求1所述的方法,其中:
(a)所述多核苷酸以小于或等于约500nM的浓度存在;
(b)所述逆转录酶是SuperScript III;
(c)所述非天然dNTP不是dTPT3TP;
(d)所述方法进一步包括使用识别所述非天然核苷酸的结合配偶体测量所述cDNA中的所述非天然核苷酸的量;
(e)所述逆转录酶产生全长cDNA,并且至少25%的所述全长cDNA包含所述非天然核苷酸;和/或
(f)所述多核苷酸是tRNA、mRNA、RNA适配体、或多种RNA适配体侯选物的成员。
3.根据权利要求1或2所述的方法,其中所述多核苷酸是RNA,任选地其中所述RNA是mRNA或tRNA。
4.根据权利要求1-3中任一项所述的方法,所述方法进一步包括测量所述cDNA中的所述非天然核苷酸的量。
5.一种测量非天然核苷酸的掺入的方法,所述方法包括:
a.在存在包含第一非天然核碱基的非天然NTP的情况下用RNA聚合酶转录包含非天然脱氧核糖核苷酸的多核苷酸以产生包含第一非天然核苷酸的RNA;
b.在存在包含第二非天然核碱基的非天然dNTP的情况下用逆转录酶逆转录所述RNA,其中所述逆转录酶使cDNA聚合,所述非天然NTP作为第二非天然核苷酸掺入所述cDNA中;以及
c.测量所述cDNA中的所述第二非天然核苷酸的量。
6.根据权利要求5所述的方法,其中所述转录步骤是在体内进行的。
7.根据前一项权利要求所述的方法,其中所述转录步骤是在原核生物或细菌中进行的。
8.根据前一项权利要求所述的方法,其中所述转录步骤是在大肠杆菌(E.coli)中进行的。
9.根据权利要求5所述的方法,其中所述转录步骤是在体外进行的。
10.根据权利要求5-9中任一项所述的方法,其中所述cDNA分子中的所述第二非天然核苷酸的量是相对于转录前所述多核苷酸中的所述非天然脱氧核糖核苷酸的量进行测量的。
11.根据权利要求5-10中任一项所述的方法,其中所述测量包括:
a.在转录前对所述多核苷酸进行生物素移位测定以测定转录前含有所述非天然核苷酸的多核苷酸的比例;以及
b.对所述cDNA进行生物素移位测定以测定含有所述非天然核苷酸的cDNA的比例。
12.根据权利要求4-10中任一项所述的方法,其中所述cDNA中的所述非天然核苷酸或所述第二非天然核苷酸的量是使用结合非天然核碱基的结合配偶体测量的。
13.根据权利要求4-10中任一项所述的方法,其中测量所述cDNA中的所述非天然核苷酸或所述第二非天然核苷酸的量包括凝胶移位测定或生物素移位测定。
14.根据前一项权利要求所述的方法,其中所述生物素移位测定包括:
a.在存在与所述cDNA中的所述非天然核苷酸配对的包含生物素化核碱基的非天然dNTP的情况下扩增所述cDNA;
b.将包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核苷酸的DNA扩增产物分离;以及
c.测量包含所述生物素化核苷酸的DNA扩增产物和不包含所述生物素化核苷酸的DNA扩增产物的量,或包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核苷酸的DNA扩增产物的比率,或含有所述非天然核苷酸的cDNA的比例。
15.根据前一项权利要求所述的方法,其中将包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核碱基的DNA扩增产物分离包括凝胶电泳,任选地其中所述凝胶电泳是聚丙烯酰胺凝胶电泳。
16.根据权利要求14-15中任一项所述的方法,其中将包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核苷酸的DNA扩增产物分离包括将所述扩增产物与链霉亲和素一起孵育。
17.根据前述权利要求中任一项所述的方法,其中所述RNA或多核苷酸在逆转录期间以小于或等于约1μM的浓度存在。
18.根据前述权利要求中任一项所述的方法,其中所述RNA或多核苷酸在逆转录期间以约1-10nM、约10-20nM、约20-30nM、约30-40nM、约40-50nM、约50-75nM、约75-100nM、约100-150nM、约150-200nM、约200-300nM、约300-400nM或约400-500nM范围内的浓度存在。
19.根据前述权利要求中任一项所述的方法,其中所述逆转录酶产生全长cDNA,并且其中至少25%的所述全长cDNA包含所述非天然核苷酸。
20.根据前一项权利要求所述的方法,其中至少50%、75%、80%、85%、90%、95%、97%、98%或99%的所述未截短的cDNA包含所述非天然核苷酸。
21.根据前述权利要求中任一项所述的方法,其中包含所述非天然核糖核苷酸的RNA或多核苷酸是mRNA。
22.根据权利要求20所述的方法,其中所述非天然核糖核苷酸(X或Y)位于所述mRNA的密码子的第一位置(X-N-N或Y-N-N)。
23.根据权利要求20所述的方法,其中所述非天然核糖核苷酸(X或Y)位于所述mRNA的密码子的中间位置(N-X-N或N-Y-N)。
24.根据权利要求20所述的方法,其中所述非天然核糖核苷酸(X或Y)位于所述mRNA的密码子的最后位置(N-N-X或N-N-Y)。
25.根据权利要求1-24中任一项所述的方法,其中所述mRNA中含有所述非天然核糖核苷酸的密码子是AXC、AYC、GXC、GYC、GXT、GYT、AXA、AXT、TXA或TXT。
26.根据权利要求1-20中任一项所述的方法,其中包含所述非天然核糖核苷酸的RNA或多核苷酸是tRNA。
27.根据权利要求26所述的方法,其中所述非天然核糖核苷酸(X或Y)位于所述tRNA的反密码子的第一位置(X-N-N或Y-N-N)。
28.根据权利要求26所述的方法,其中所述非天然核糖核苷酸(X或Y)位于所述tRNA的反密码子的中间位置(N-X-N或N-Y-N)。
29.根据权利要求26所述的方法,其中所述非天然核糖核苷酸(X或Y)位于所述tRNA的反密码子的最后位置(N-N-X或N-N-Y)。
30.根据权利要求26-29中任一项所述的方法,其中所述tRNA的反密码子是GYT、GXT、GYC、GXC、CYA、CXA、AYC或AXC。
31.根据权利要求1-30中任一项所述的方法,其中所述非天然核糖核苷酸是X,其中X包含作为所述非天然核糖核苷酸的核碱基(NaM)。
32.根据权利要求1-30中任一项所述的方法,其中所述非天然核糖核苷酸是Y,其中Y包含作为所述非天然核糖核苷酸的核碱基(TPT3)。
33.根据权利要求1-20或31-32中任一项所述的方法,其中所述RNA是RNA适配体。
34.一种筛选RNA适配体候选物的方法,所述方法包括:
a.将多种不同的RNA寡核苷酸与靶标一起孵育,其中所述RNA寡核苷酸包含至少一个非天然核苷酸;
b.对所述多种RNA寡核苷酸中与所述靶标结合的RNA寡核苷酸进行至少一轮选择;
c.分离与所述靶标结合的富集的RNA寡核苷酸,其中所述分离的富集的RNA寡核苷酸包含RNA适配体;以及
d.将所述RNA适配体中的一种或多种逆转录成cDNA,其中所述cDNA在与所述RNA适配体中的所述至少一个非天然核苷酸互补的位置处包含非天然脱氧核糖核苷酸,从而提供对应于所述RNA适配体的cDNA分子的文库。
35.根据前一项权利要求所述的方法,其中所述多种不同的RNA寡核苷酸包含随机化核苷酸区域。
36.根据前一项权利要求所述的方法,其中所述随机化核苷酸区域包含所述至少一个非天然核苷酸。
37.根据权利要求34-36中任一项所述的方法,其中所述RNA寡核苷酸包含条形码序列和/或引物结合序列。
38.根据权利要求34-37中任一项所述的方法,其中所述方法进一步包括对所述cDNA分子进行测序。
39.根据权利要求34-38中任一项所述的方法,其中进行至少一轮选择包括洗涤步骤以去除未结合或弱结合的RNA寡核苷酸。
40.根据权利要求34-39中任一项所述的方法,其中所述方法进一步包括使所述cDNA分子的序列突变以产生多个另外的序列。
41.根据前一项权利要求所述的方法,其中将所述多个另外的序列转录成RNA,并对与所述靶标结合的RNA适配体再进行至少一轮选择。
42.根据权利要求40-41中任一项所述的方法,其中使所述cDNA分子的序列突变包括易错PCR。
43.根据权利要求34-42中任一项所述的方法,其中所述方法进一步包括在另外一轮选择中增加与所述靶标结合的选择压力。
44.根据前一项权利要求所述的方法,其中增加选择压力包括在比前一轮更高的盐浓度下进行一个或多个洗涤步骤和/或在所述选择期间包括结合竞争物。
45.根据权利要求34-44中任一项所述的方法,所述方法进一步包括分析所述RNA适配体结合所述靶标的能力。
46.根据前一项权利要求所述的方法,其中分析所述RNA适配体结合所述靶标的能力包括测定Kd、kon或koff。
47.根据权利要求34-44中任一项所述的方法,所述方法进一步包括分析所述RNA适配体使所述靶标激动的能力。
48.根据前一项权利要求所述的方法,其中分析所述RNA适配体使所述靶标激动的能力包括测定EC50值。
49.根据权利要求34-44中任一项所述的方法,所述方法进一步包括分析所述RNA适配体拮抗所述靶标的能力。
50.根据前一项权利要求所述的方法,其中分析所述RNA适配体拮抗所述靶标的能力包括测定Ki或IC50值。
51.根据前述权利要求中任一项所述的方法,其中至少一个非天然核苷酸包含:
52.根据前一项权利要求所述的方法,其中经历逆转录的多核苷酸中的至少一个非天然核苷酸包含:
53.根据权利要求51或52所述的方法,其中掺入cDNA中的至少一个非天然核苷酸包含:
并且任选地其中所述非天然核苷酸中的至少一个非天然核碱基不同于所述经历逆转录的多核苷酸中的至少一个非天然核碱基。
54.根据权利要求51-53中任一项所述的方法,其中所述至少一个非天然核苷酸包含:
55.根据权利要求51-53所述的方法,其中所述至少一个非天然核苷酸包含:
56.根据前述权利要求中任一项所述的方法,其中所述逆转录酶是禽成髓细胞瘤病毒(AMV)逆转录酶、莫洛尼氏鼠白血病病毒(MMLV)逆转录酶、Super Script II(SS II)逆转录酶、Super Script III(SS III)逆转录酶、Super Script IV(SS IV)逆转录酶或Volcano2G(V2G)逆转录酶。
57.根据前述权利要求中任一项所述的方法,其中所述逆转录酶是SuperScript III。
58.根据前述权利要求中任一项所述的方法,其中所述非天然dNTP不是dTPT3TP。
59.根据前述权利要求中任一项所述的方法,其中所述逆转录发生在体外。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063104785P | 2020-10-23 | 2020-10-23 | |
US63/104,785 | 2020-10-23 | ||
PCT/US2021/056334 WO2022087475A1 (en) | 2020-10-23 | 2021-10-22 | Reverse transcription of polynucleotides comprising unnatural nucleotides |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116761885A true CN116761885A (zh) | 2023-09-15 |
Family
ID=81289498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180079118.6A Pending CN116761885A (zh) | 2020-10-23 | 2021-10-22 | 包含非天然核苷酸的多核苷酸的逆转录 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20230392140A1 (zh) |
EP (1) | EP4232570A4 (zh) |
JP (1) | JP2023547615A (zh) |
KR (1) | KR20230088898A (zh) |
CN (1) | CN116761885A (zh) |
AU (1) | AU2021364920A1 (zh) |
CA (1) | CA3196205A1 (zh) |
IL (1) | IL302243A (zh) |
MX (1) | MX2023004690A (zh) |
TW (1) | TW202227100A (zh) |
WO (1) | WO2022087475A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PT3041854T (pt) | 2013-08-08 | 2020-03-05 | Scripps Research Inst | Um método para a identificação enzimática específica ao local de ácidos nucleicos in vitro pela incorporação de nucleótidos não-naturais |
WO2017106767A1 (en) | 2015-12-18 | 2017-06-22 | The Scripps Research Institute | Production of unnatural nucleotides using a crispr/cas9 system |
WO2017223528A1 (en) | 2016-06-24 | 2017-12-28 | The Scripps Research Institute | Novel nucleoside triphosphate transporter and uses thereof |
WO2019014267A1 (en) | 2017-07-11 | 2019-01-17 | Synthorx, Inc. | INCORPORATION OF NON-NATURAL NUCLEOTIDES AND ASSOCIATED METHODS |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6887707B2 (en) * | 1996-10-28 | 2005-05-03 | University Of Washington | Induction of viral mutation by incorporation of miscoding ribonucleoside analogs into viral RNA |
US20080242627A1 (en) * | 2000-08-02 | 2008-10-02 | University Of Southern California | Novel rna interference methods using dna-rna duplex constructs |
JP6140182B2 (ja) * | 2011-12-08 | 2017-05-31 | エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft | 改善された活性を有するdnaポリメラーゼ |
AU2013361323B2 (en) * | 2012-12-19 | 2018-09-06 | Caris Science, Inc. | Compositions and methods for aptamer screening |
CN106795554A (zh) * | 2014-05-19 | 2017-05-31 | 哥伦比亚大学董事会 | 使用核苷酸可逆终止子的离子传感器dna和rna合成测序 |
-
2021
- 2021-10-22 IL IL302243A patent/IL302243A/en unknown
- 2021-10-22 WO PCT/US2021/056334 patent/WO2022087475A1/en active Application Filing
- 2021-10-22 JP JP2023524597A patent/JP2023547615A/ja active Pending
- 2021-10-22 CN CN202180079118.6A patent/CN116761885A/zh active Pending
- 2021-10-22 MX MX2023004690A patent/MX2023004690A/es unknown
- 2021-10-22 EP EP21884025.4A patent/EP4232570A4/en active Pending
- 2021-10-22 KR KR1020237016545A patent/KR20230088898A/ko unknown
- 2021-10-22 TW TW110139349A patent/TW202227100A/zh unknown
- 2021-10-22 AU AU2021364920A patent/AU2021364920A1/en active Pending
- 2021-10-22 CA CA3196205A patent/CA3196205A1/en active Pending
-
2023
- 2023-04-21 US US18/304,993 patent/US20230392140A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4232570A4 (en) | 2024-10-16 |
US20230392140A1 (en) | 2023-12-07 |
KR20230088898A (ko) | 2023-06-20 |
IL302243A (en) | 2023-06-01 |
WO2022087475A1 (en) | 2022-04-28 |
TW202227100A (zh) | 2022-07-16 |
MX2023004690A (es) | 2023-05-09 |
CA3196205A1 (en) | 2022-04-28 |
AU2021364920A9 (en) | 2024-09-12 |
JP2023547615A (ja) | 2023-11-13 |
AU2021364920A1 (en) | 2023-06-22 |
EP4232570A1 (en) | 2023-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102649135B1 (ko) | 비천연 뉴클레오티드의 도입 및 그의 방법 | |
US20230392140A1 (en) | Reverse transcription of polynucleotides comprising unnatural nucleotides | |
US11879145B2 (en) | Reagents and methods for replication, transcription, and translation in semi-synthetic organisms | |
Ueda et al. | Phosphorothioate-containing RNAs show mRNA activity in the prokaryotic translation systems in vitro | |
CN107709555A (zh) | 用于Cas9介导的基因编辑的合成的单向导RNA | |
CA3153855A1 (en) | Compositions and methods for in vivo synthesis of unnatural polypeptides | |
CA3151762A1 (en) | Eukaryotic semi-synthetic organisms | |
Grosjean et al. | RNA‐modifying and RNA‐editing enzymes: Methods for their identification | |
JP2008507277A (ja) | 修飾核酸分子の配列決定 | |
Strzelecka et al. | Functional and LC-MS/MS analysis of in vitro transcribed mRNAs carrying phosphorothioate or boranophosphate moieties reveal polyA tail modifications that prevent deadenylation without compromising protein expression | |
Strzelecka et al. | A clinically-relevant polymorphism in the Na+/taurocholate cotransporting polypeptide (NTCP) occurs at a rheostat position | |
Meek | Pushing the Boundaries of Selex for the Generation of Aptamers with Unique Functionality | |
笠原勇矢 | Development of the convenient method for artificial nucleic acid aptamer preparations using CE-SELEX | |
Joardar | Guide RNA-dependent and independent tRNA modifications in Archaea | |
EA042937B1 (ru) | Включение неприродных нуклеотидов и способы с ними | |
Walker | A Study of the Structure of RNase Mrp Rna |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |