JP2022549931A - 真核生物の半合成生物 - Google Patents
真核生物の半合成生物 Download PDFInfo
- Publication number
- JP2022549931A JP2022549931A JP2022519674A JP2022519674A JP2022549931A JP 2022549931 A JP2022549931 A JP 2022549931A JP 2022519674 A JP2022519674 A JP 2022519674A JP 2022519674 A JP2022519674 A JP 2022519674A JP 2022549931 A JP2022549931 A JP 2022549931A
- Authority
- JP
- Japan
- Prior art keywords
- unnatural
- mrna
- base
- trna
- natural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 89
- 108020004566 Transfer RNA Proteins 0.000 claims description 458
- 229940024606 amino acid Drugs 0.000 claims description 311
- 235000001014 amino acid Nutrition 0.000 claims description 311
- 150000001413 amino acids Chemical class 0.000 claims description 302
- 108020004999 messenger RNA Proteins 0.000 claims description 299
- 108020004705 Codon Proteins 0.000 claims description 291
- 102000039446 nucleic acids Human genes 0.000 claims description 225
- 108020004707 nucleic acids Proteins 0.000 claims description 225
- 150000007523 nucleic acids Chemical class 0.000 claims description 224
- 125000000824 D-ribofuranosyl group Chemical group [H]OC([H])([H])[C@@]1([H])OC([H])(*)[C@]([H])(O[H])[C@]1([H])O[H] 0.000 claims description 179
- -1 2-((3-(benzyloxy)-3-oxopropyl)amino)ethyl Chemical group 0.000 claims description 138
- 108020005098 Anticodon Proteins 0.000 claims description 125
- 210000004027 cell Anatomy 0.000 claims description 116
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 93
- 239000004472 Lysine Substances 0.000 claims description 76
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 63
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 58
- 229920001184 polypeptide Polymers 0.000 claims description 55
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 44
- 230000004048 modification Effects 0.000 claims description 43
- 238000012986 modification Methods 0.000 claims description 43
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 claims description 42
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 claims description 42
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 claims description 40
- 230000014509 gene expression Effects 0.000 claims description 37
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical class NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims description 34
- 125000000217 alkyl group Chemical group 0.000 claims description 33
- 230000027455 binding Effects 0.000 claims description 31
- 108091034117 Oligonucleotide Proteins 0.000 claims description 26
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 22
- 241000205274 Methanosarcina mazei Species 0.000 claims description 22
- 229960004441 tyrosine Drugs 0.000 claims description 22
- 241000205276 Methanosarcina Species 0.000 claims description 19
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 claims description 19
- 241000203407 Methanocaldococcus jannaschii Species 0.000 claims description 18
- GAJBPZXIKZXTCG-VIFPVBQESA-N (2s)-2-amino-3-[4-(azidomethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(CN=[N+]=[N-])C=C1 GAJBPZXIKZXTCG-VIFPVBQESA-N 0.000 claims description 16
- JPTXVWCBMWCZEP-UHFFFAOYSA-N 2-amino-8-oxononanoic acid Chemical compound CC(=O)CCCCCC(N)C(O)=O JPTXVWCBMWCZEP-UHFFFAOYSA-N 0.000 claims description 15
- 241000699800 Cricetinae Species 0.000 claims description 15
- 210000005260 human cell Anatomy 0.000 claims description 15
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 14
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 claims description 14
- 125000003118 aryl group Chemical group 0.000 claims description 13
- 150000001540 azides Chemical class 0.000 claims description 13
- DUWWHGPELOTTOE-UHFFFAOYSA-N n-(5-chloro-2,4-dimethoxyphenyl)-3-oxobutanamide Chemical compound COC1=CC(OC)=C(NC(=O)CC(C)=O)C=C1Cl DUWWHGPELOTTOE-UHFFFAOYSA-N 0.000 claims description 13
- 235000019260 propionic acid Nutrition 0.000 claims description 13
- WTDRDQBEARUVNC-LURJTMIESA-N L-DOPA Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-LURJTMIESA-N 0.000 claims description 12
- 241000205275 Methanosarcina barkeri Species 0.000 claims description 12
- GEYBMYRBIABFTA-VIFPVBQESA-N O-methyl-L-tyrosine Chemical compound COC1=CC=C(C[C@H](N)C(O)=O)C=C1 GEYBMYRBIABFTA-VIFPVBQESA-N 0.000 claims description 12
- 125000000304 alkynyl group Chemical group 0.000 claims description 12
- JSXMFBNJRFXRCX-NSHDSACASA-N (2s)-2-amino-3-(4-prop-2-ynoxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OCC#C)C=C1 JSXMFBNJRFXRCX-NSHDSACASA-N 0.000 claims description 11
- CMUHFUGDYMFHEI-QMMMGPOBSA-N 4-amino-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-QMMMGPOBSA-N 0.000 claims description 11
- 150000001299 aldehydes Chemical class 0.000 claims description 11
- PEMUHKUIQHFMTH-QMMMGPOBSA-N (2s)-2-amino-3-(4-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Br)C=C1 PEMUHKUIQHFMTH-QMMMGPOBSA-N 0.000 claims description 10
- JZRBSTONIYRNRI-VIFPVBQESA-N 3-methylphenylalanine Chemical compound CC1=CC=CC(C[C@H](N)C(O)=O)=C1 JZRBSTONIYRNRI-VIFPVBQESA-N 0.000 claims description 10
- PZNQZSRPDOEBMS-QMMMGPOBSA-N 4-iodo-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(I)C=C1 PZNQZSRPDOEBMS-QMMMGPOBSA-N 0.000 claims description 10
- 125000003342 alkenyl group Chemical group 0.000 claims description 10
- 230000000295 complement effect Effects 0.000 claims description 10
- 125000004093 cyano group Chemical group *C#N 0.000 claims description 10
- 229910052739 hydrogen Inorganic materials 0.000 claims description 10
- 125000000468 ketone group Chemical group 0.000 claims description 10
- TVIDEEHSOPHZBR-AWEZNQCLSA-N para-(benzoyl)-phenylalanine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1C(=O)C1=CC=CC=C1 TVIDEEHSOPHZBR-AWEZNQCLSA-N 0.000 claims description 10
- 210000003705 ribosome Anatomy 0.000 claims description 10
- YYTDJPUFAVPHQA-VKHMYHEASA-N (2s)-2-amino-3-(2,3,4,5,6-pentafluorophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=C(F)C(F)=C(F)C(F)=C1F YYTDJPUFAVPHQA-VKHMYHEASA-N 0.000 claims description 9
- NEMHIKRLROONTL-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(4-azidophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N=[N+]=[N-])C=C1 NEMHIKRLROONTL-QMMMGPOBSA-N 0.000 claims description 9
- ZXSBHXZKWRIEIA-JTQLQIEISA-N (2s)-3-(4-acetylphenyl)-2-azaniumylpropanoate Chemical compound CC(=O)C1=CC=C(C[C@H](N)C(O)=O)C=C1 ZXSBHXZKWRIEIA-JTQLQIEISA-N 0.000 claims description 9
- IRZQDMYEJPNDEN-UHFFFAOYSA-N 3-phenyl-2-aminobutanoic acid Natural products OC(=O)C(N)C(C)C1=CC=CC=C1 IRZQDMYEJPNDEN-UHFFFAOYSA-N 0.000 claims description 9
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 claims description 9
- 241000205284 Methanosarcina acetivorans Species 0.000 claims description 9
- 229950006137 dexfosfoserine Drugs 0.000 claims description 9
- 238000000338 in vitro Methods 0.000 claims description 9
- DCWXELXMIBXGTH-QMMMGPOBSA-N phosphonotyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-QMMMGPOBSA-N 0.000 claims description 9
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 claims description 9
- 229940055619 selenocysteine Drugs 0.000 claims description 9
- 235000016491 selenocysteine Nutrition 0.000 claims description 9
- JPZXHKDZASGCLU-LBPRGKRZSA-N β-(2-naphthyl)-alanine Chemical compound C1=CC=CC2=CC(C[C@H](N)C(O)=O)=CC=C21 JPZXHKDZASGCLU-LBPRGKRZSA-N 0.000 claims description 9
- BJOQKIKXKGJLIJ-NSHDSACASA-N (2s)-2-amino-3-(4-prop-2-ynylphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(CC#C)C=C1 BJOQKIKXKGJLIJ-NSHDSACASA-N 0.000 claims description 8
- QYRPOQGYNAOMIK-UHFFFAOYSA-N 2-amino-8-oxooctanoic acid Chemical compound OC(=O)C(N)CCCCCC=O QYRPOQGYNAOMIK-UHFFFAOYSA-N 0.000 claims description 8
- 241000699802 Cricetulus griseus Species 0.000 claims description 8
- 241000282414 Homo sapiens Species 0.000 claims description 8
- WTDRDQBEARUVNC-UHFFFAOYSA-N L-Dopa Natural products OC(=O)C(N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-UHFFFAOYSA-N 0.000 claims description 8
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 claims description 8
- 239000001257 hydrogen Substances 0.000 claims description 8
- 210000001672 ovary Anatomy 0.000 claims description 8
- IBCKYXVMEMSMQM-JTQLQIEISA-N (2s)-3-(3-acetylphenyl)-2-aminopropanoic acid Chemical compound CC(=O)C1=CC=CC(C[C@H](N)C(O)=O)=C1 IBCKYXVMEMSMQM-JTQLQIEISA-N 0.000 claims description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 7
- 125000002355 alkine group Chemical group 0.000 claims description 7
- JFNLZVQOOSMTJK-KNVOCYPGSA-N norbornene Chemical compound C1[C@@H]2CC[C@H]1C=C2 JFNLZVQOOSMTJK-KNVOCYPGSA-N 0.000 claims description 7
- 241000124008 Mammalia Species 0.000 claims description 6
- 230000013595 glycosylation Effects 0.000 claims description 6
- 238000006206 glycosylation reaction Methods 0.000 claims description 6
- 229910052736 halogen Inorganic materials 0.000 claims description 6
- 150000002367 halogens Chemical class 0.000 claims description 6
- 210000004962 mammalian cell Anatomy 0.000 claims description 6
- 239000013592 cell lysate Substances 0.000 claims description 5
- 150000002431 hydrogen Chemical group 0.000 claims description 5
- MJGXOSYVWHETDC-UHFFFAOYSA-N methoxymethanethiol Chemical group COCS MJGXOSYVWHETDC-UHFFFAOYSA-N 0.000 claims description 5
- 125000000876 trifluoromethoxy group Chemical group FC(F)(F)O* 0.000 claims description 5
- 125000006374 C2-C10 alkenyl group Chemical group 0.000 claims description 4
- 229910004679 ONO2 Inorganic materials 0.000 claims description 4
- 125000002877 alkyl aryl group Chemical group 0.000 claims description 4
- 125000005122 aminoalkylamino group Chemical group 0.000 claims description 4
- 125000003710 aryl alkyl group Chemical group 0.000 claims description 4
- 229910052794 bromium Inorganic materials 0.000 claims description 4
- 229910052801 chlorine Inorganic materials 0.000 claims description 4
- 125000000592 heterocycloalkyl group Chemical group 0.000 claims description 4
- 125000001893 nitrooxy group Chemical group [O-][N+](=O)O* 0.000 claims description 4
- 125000001181 organosilyl group Chemical group [SiH3]* 0.000 claims description 4
- 230000003285 pharmacodynamic effect Effects 0.000 claims description 4
- 125000006853 reporter group Chemical group 0.000 claims description 4
- 229920002554 vinyl polymer Polymers 0.000 claims description 4
- 125000005865 C2-C10alkynyl group Chemical group 0.000 claims description 3
- 101100054666 Streptomyces halstedii sch3 gene Proteins 0.000 claims description 3
- 239000000138 intercalating agent Substances 0.000 claims description 3
- FDKWRPBBCBCIGA-REOHCLBHSA-N (2r)-2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]C[C@H](N)C(O)=O FDKWRPBBCBCIGA-REOHCLBHSA-N 0.000 claims 3
- 238000004113 cell culture Methods 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 abstract description 7
- 125000003729 nucleotide group Chemical group 0.000 description 99
- 239000002773 nucleotide Substances 0.000 description 97
- 108090000623 proteins and genes Proteins 0.000 description 86
- 102000004169 proteins and genes Human genes 0.000 description 63
- 235000018102 proteins Nutrition 0.000 description 59
- 102000003960 Ligases Human genes 0.000 description 57
- 108090000364 Ligases Proteins 0.000 description 57
- 108020004414 DNA Proteins 0.000 description 53
- 102000053602 DNA Human genes 0.000 description 53
- 235000000346 sugar Nutrition 0.000 description 51
- 230000014616 translation Effects 0.000 description 43
- 238000013519 translation Methods 0.000 description 42
- 108020003589 5' Untranslated Regions Proteins 0.000 description 34
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 32
- 244000005700 microbiome Species 0.000 description 30
- 238000013518 transcription Methods 0.000 description 29
- 108020005345 3' Untranslated Regions Proteins 0.000 description 28
- 244000286779 Hansenula anomala Species 0.000 description 28
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 27
- 239000002777 nucleoside Substances 0.000 description 27
- 230000035897 transcription Effects 0.000 description 27
- 239000003153 chemical reaction reagent Substances 0.000 description 26
- 230000000694 effects Effects 0.000 description 22
- 239000000047 product Substances 0.000 description 22
- 108700026244 Open Reading Frames Proteins 0.000 description 20
- 239000012445 acidic reagent Substances 0.000 description 20
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 20
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 19
- 125000003835 nucleoside group Chemical group 0.000 description 19
- 102000040430 polynucleotide Human genes 0.000 description 19
- 108091033319 polynucleotide Proteins 0.000 description 19
- 239000002157 polynucleotide Substances 0.000 description 19
- 239000002253 acid Substances 0.000 description 18
- 230000006870 function Effects 0.000 description 18
- 239000000126 substance Substances 0.000 description 18
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 18
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 16
- 235000018977 lysine Nutrition 0.000 description 16
- 230000015572 biosynthetic process Effects 0.000 description 15
- 238000001727 in vivo Methods 0.000 description 15
- 239000013598 vector Substances 0.000 description 15
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 14
- 230000001105 regulatory effect Effects 0.000 description 14
- 229940035893 uracil Drugs 0.000 description 14
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 13
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 13
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 13
- RPLCQQYRZLXMKL-ZETCQYMHSA-N (2s)-2-amino-6-(2-azidoethoxycarbonylamino)hexanoic acid Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)OCCN=[N+]=[N-] RPLCQQYRZLXMKL-ZETCQYMHSA-N 0.000 description 12
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 12
- ZLAQATDNGLKIEV-UHFFFAOYSA-N 5-methyl-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CC1=CNC(=S)NC1=O ZLAQATDNGLKIEV-UHFFFAOYSA-N 0.000 description 12
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 12
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 12
- 241000233866 Fungi Species 0.000 description 12
- 108091093037 Peptide nucleic acid Proteins 0.000 description 12
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 12
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 12
- 125000000623 heterocyclic group Chemical group 0.000 description 12
- 229910052757 nitrogen Inorganic materials 0.000 description 12
- 230000006798 recombination Effects 0.000 description 12
- 238000005215 recombination Methods 0.000 description 12
- 229930024421 Adenine Natural products 0.000 description 11
- 229960000643 adenine Drugs 0.000 description 11
- 150000002668 lysine derivatives Chemical class 0.000 description 11
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 10
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 10
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical group N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 10
- 229910019142 PO4 Inorganic materials 0.000 description 10
- 125000001475 halogen functional group Chemical group 0.000 description 10
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- 235000021317 phosphate Nutrition 0.000 description 10
- 239000000523 sample Substances 0.000 description 10
- 229910052717 sulfur Inorganic materials 0.000 description 10
- 229960005508 8-azaguanine Drugs 0.000 description 9
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 9
- 108091028664 Ribonucleotide Proteins 0.000 description 9
- DPOPAJRDYZGTIR-UHFFFAOYSA-N Tetrazine Chemical group C1=CN=NN=N1 DPOPAJRDYZGTIR-UHFFFAOYSA-N 0.000 description 9
- 229960003767 alanine Drugs 0.000 description 9
- 239000003795 chemical substances by application Substances 0.000 description 9
- 229940104302 cytosine Drugs 0.000 description 9
- 238000010348 incorporation Methods 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 230000010076 replication Effects 0.000 description 9
- 239000002336 ribonucleotide Substances 0.000 description 9
- 125000002652 ribonucleotide group Chemical group 0.000 description 9
- 229940113082 thymine Drugs 0.000 description 9
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 8
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 8
- 241000235015 Yarrowia lipolytica Species 0.000 description 8
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 8
- 125000004429 atom Chemical group 0.000 description 8
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 8
- 238000010367 cloning Methods 0.000 description 8
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 8
- 239000003623 enhancer Substances 0.000 description 8
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 8
- 239000013604 expression vector Substances 0.000 description 8
- 230000001965 increasing effect Effects 0.000 description 8
- 239000000178 monomer Substances 0.000 description 8
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 8
- 239000010452 phosphate Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000011160 research Methods 0.000 description 8
- 150000008163 sugars Chemical class 0.000 description 8
- WYWHKKSPHMUBEB-UHFFFAOYSA-N tioguanine Chemical compound N1C(N)=NC(=S)C2=C1N=CN2 WYWHKKSPHMUBEB-UHFFFAOYSA-N 0.000 description 8
- UJBCLAXPPIDQEE-UHFFFAOYSA-N 5-prop-1-ynyl-1h-pyrimidine-2,4-dione Chemical compound CC#CC1=CNC(=O)NC1=O UJBCLAXPPIDQEE-UHFFFAOYSA-N 0.000 description 7
- 102100025620 Cytochrome b-245 light chain Human genes 0.000 description 7
- 101000856723 Homo sapiens Cytochrome b-245 light chain Proteins 0.000 description 7
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 7
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 7
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 7
- 241000700605 Viruses Species 0.000 description 7
- 150000001576 beta-amino acids Chemical class 0.000 description 7
- 229910052799 carbon Inorganic materials 0.000 description 7
- 239000003814 drug Substances 0.000 description 7
- 238000005755 formation reaction Methods 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 150000002993 phenylalanine derivatives Chemical class 0.000 description 7
- 238000003752 polymerase chain reaction Methods 0.000 description 7
- 229910052711 selenium Inorganic materials 0.000 description 7
- 239000011669 selenium Substances 0.000 description 7
- 239000011593 sulfur Substances 0.000 description 7
- 230000003612 virological effect Effects 0.000 description 7
- RFLVMTUMFYRZCB-UHFFFAOYSA-N 1-methylguanine Chemical class O=C1N(C)C(N)=NC2=C1N=CN2 RFLVMTUMFYRZCB-UHFFFAOYSA-N 0.000 description 6
- ICSNLGPSRYBMBD-UHFFFAOYSA-N 2-aminopyridine Chemical compound NC1=CC=CC=N1 ICSNLGPSRYBMBD-UHFFFAOYSA-N 0.000 description 6
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 6
- QNNARSZPGNJZIX-UHFFFAOYSA-N 6-amino-5-prop-1-ynyl-1h-pyrimidin-2-one Chemical compound CC#CC1=CNC(=O)N=C1N QNNARSZPGNJZIX-UHFFFAOYSA-N 0.000 description 6
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 6
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 6
- 241000238631 Hexapoda Species 0.000 description 6
- ZKZBPNGNEQAJSX-REOHCLBHSA-N L-selenocysteine Chemical compound [SeH]C[C@H](N)C(O)=O ZKZBPNGNEQAJSX-REOHCLBHSA-N 0.000 description 6
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 6
- HYVABZIGRDEKCD-UHFFFAOYSA-N N(6)-dimethylallyladenine Chemical compound CC(C)=CCNC1=NC=NC2=C1N=CN2 HYVABZIGRDEKCD-UHFFFAOYSA-N 0.000 description 6
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N Propane Chemical compound CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 6
- 241000223252 Rhodotorula Species 0.000 description 6
- 238000012239 gene modification Methods 0.000 description 6
- 230000005017 genetic modification Effects 0.000 description 6
- 235000013617 genetically modified food Nutrition 0.000 description 6
- 230000002209 hydrophobic effect Effects 0.000 description 6
- 230000001404 mediated effect Effects 0.000 description 6
- 229910052698 phosphorus Inorganic materials 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 239000001226 triphosphate Substances 0.000 description 6
- 235000011178 triphosphate Nutrition 0.000 description 6
- UHUHBFMZVCOEOV-UHFFFAOYSA-N 1h-imidazo[4,5-c]pyridin-4-amine Chemical compound NC1=NC=CC2=C1N=CN2 UHUHBFMZVCOEOV-UHFFFAOYSA-N 0.000 description 5
- QSHACTSJHMKXTE-UHFFFAOYSA-N 2-(2-aminopropyl)-7h-purin-6-amine Chemical compound CC(N)CC1=NC(N)=C2NC=NC2=N1 QSHACTSJHMKXTE-UHFFFAOYSA-N 0.000 description 5
- KXBCLNRMQPRVTP-UHFFFAOYSA-N 6-amino-1,5-dihydroimidazo[4,5-c]pyridin-4-one Chemical compound O=C1NC(N)=CC2=C1N=CN2 KXBCLNRMQPRVTP-UHFFFAOYSA-N 0.000 description 5
- DCPSTSVLRXOYGS-UHFFFAOYSA-N 6-amino-1h-pyrimidine-2-thione Chemical compound NC1=CC=NC(S)=N1 DCPSTSVLRXOYGS-UHFFFAOYSA-N 0.000 description 5
- HRYKDUPGBWLLHO-UHFFFAOYSA-N 8-azaadenine Chemical compound NC1=NC=NC2=NNN=C12 HRYKDUPGBWLLHO-UHFFFAOYSA-N 0.000 description 5
- LPXQRXLUHJKZIE-UHFFFAOYSA-N 8-azaguanine Chemical compound NC1=NC(O)=C2NN=NC2=N1 LPXQRXLUHJKZIE-UHFFFAOYSA-N 0.000 description 5
- 239000004471 Glycine Substances 0.000 description 5
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 5
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 5
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 5
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 5
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 5
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 239000005090 green fluorescent protein Substances 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 125000005647 linker group Chemical group 0.000 description 5
- 150000003833 nucleoside derivatives Chemical class 0.000 description 5
- 229910052760 oxygen Inorganic materials 0.000 description 5
- 239000005022 packaging material Substances 0.000 description 5
- 229960005190 phenylalanine Drugs 0.000 description 5
- 229960002429 proline Drugs 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 125000001424 substituent group Chemical group 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 229960004799 tryptophan Drugs 0.000 description 5
- 229940075420 xanthine Drugs 0.000 description 5
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 4
- NOLHIMIFXOBLFF-KVQBGUIXSA-N (2r,3s,5r)-5-(2,6-diaminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-ol Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@H]1C[C@H](O)[C@@H](CO)O1 NOLHIMIFXOBLFF-KVQBGUIXSA-N 0.000 description 4
- UFSCXDAOCAIFOG-UHFFFAOYSA-N 1,10-dihydropyrimido[5,4-b][1,4]benzothiazin-2-one Chemical compound S1C2=CC=CC=C2N=C2C1=CNC(=O)N2 UFSCXDAOCAIFOG-UHFFFAOYSA-N 0.000 description 4
- MXHRCPNRJAMMIM-ULQXZJNLSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidine-2,4-dione Chemical compound O=C1NC(=O)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 MXHRCPNRJAMMIM-ULQXZJNLSA-N 0.000 description 4
- NOLHIMIFXOBLFF-UHFFFAOYSA-N 2-Amino-2'-deoxyadenosine Natural products C12=NC(N)=NC(N)=C2N=CN1C1CC(O)C(CO)O1 NOLHIMIFXOBLFF-UHFFFAOYSA-N 0.000 description 4
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 4
- WKMPTBDYDNUJLF-UHFFFAOYSA-N 2-fluoroadenine Chemical compound NC1=NC(F)=NC2=C1N=CN2 WKMPTBDYDNUJLF-UHFFFAOYSA-N 0.000 description 4
- PECYZEOJVXMISF-UHFFFAOYSA-N 3-aminoalanine Chemical compound [NH3+]CC(N)C([O-])=O PECYZEOJVXMISF-UHFFFAOYSA-N 0.000 description 4
- FPOVCZDHZSAAIX-UHFFFAOYSA-N 4-amino-5,6-dihydro-1h-pyrimidin-2-one Chemical compound NC1=NC(=O)NCC1 FPOVCZDHZSAAIX-UHFFFAOYSA-N 0.000 description 4
- MFEFTTYGMZOIKO-UHFFFAOYSA-N 5-azacytosine Chemical compound NC1=NC=NC(=O)N1 MFEFTTYGMZOIKO-UHFFFAOYSA-N 0.000 description 4
- GSPMCUUYNASDHM-UHFFFAOYSA-N 5-methyl-4-sulfanylidene-1h-pyrimidin-2-one Chemical compound CC1=CNC(=O)N=C1S GSPMCUUYNASDHM-UHFFFAOYSA-N 0.000 description 4
- TVICROIWXBFQEL-UHFFFAOYSA-N 6-(ethylamino)-1h-pyrimidin-2-one Chemical compound CCNC1=CC=NC(=O)N1 TVICROIWXBFQEL-UHFFFAOYSA-N 0.000 description 4
- NLLCDONDZDHLCI-UHFFFAOYSA-N 6-amino-5-hydroxy-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1O NLLCDONDZDHLCI-UHFFFAOYSA-N 0.000 description 4
- SPDBZGFVYQCVIU-UHFFFAOYSA-N 6-amino-5-nitro-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1[N+]([O-])=O SPDBZGFVYQCVIU-UHFFFAOYSA-N 0.000 description 4
- 241000222157 Candida viswanathii Species 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 108020004635 Complementary DNA Proteins 0.000 description 4
- UHDGCWIWMRVCDJ-CCXZUQQUSA-N Cytarabine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-CCXZUQQUSA-N 0.000 description 4
- 108020001738 DNA Glycosylase Proteins 0.000 description 4
- 102000028381 DNA glycosylase Human genes 0.000 description 4
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 4
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 4
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- 241001149698 Lipomyces Species 0.000 description 4
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 4
- 101000702488 Rattus norvegicus High affinity cationic amino acid transporter 1 Proteins 0.000 description 4
- 108010091086 Recombinases Proteins 0.000 description 4
- 102000018120 Recombinases Human genes 0.000 description 4
- 102000006601 Thymidine Kinase Human genes 0.000 description 4
- 108020004440 Thymidine kinase Proteins 0.000 description 4
- 108700009124 Transcription Initiation Site Proteins 0.000 description 4
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 4
- 150000001408 amides Chemical class 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 125000003277 amino group Chemical group 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 238000010804 cDNA synthesis Methods 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 210000004671 cell-free system Anatomy 0.000 description 4
- 239000007795 chemical reaction product Substances 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 108010082025 cyan fluorescent protein Proteins 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 239000000539 dimer Substances 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 238000000684 flow cytometry Methods 0.000 description 4
- 235000003869 genetically modified organism Nutrition 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 4
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 4
- 150000002576 ketones Chemical class 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical class CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 235000016709 nutrition Nutrition 0.000 description 4
- 229960003104 ornithine Drugs 0.000 description 4
- 229960001639 penicillamine Drugs 0.000 description 4
- 150000004713 phosphodiesters Chemical group 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 150000003212 purines Chemical group 0.000 description 4
- RXTQGIIIYVEHBN-UHFFFAOYSA-N pyrimido[4,5-b]indol-2-one Chemical compound C1=CC=CC2=NC3=NC(=O)N=CC3=C21 RXTQGIIIYVEHBN-UHFFFAOYSA-N 0.000 description 4
- SRBUGYKMBLUTIS-UHFFFAOYSA-N pyrrolo[2,3-d]pyrimidin-2-one Chemical compound O=C1N=CC2=CC=NC2=N1 SRBUGYKMBLUTIS-UHFFFAOYSA-N 0.000 description 4
- 108010054624 red fluorescent protein Proteins 0.000 description 4
- 229960003087 tioguanine Drugs 0.000 description 4
- 230000014621 translational initiation Effects 0.000 description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 4
- 239000013603 viral vector Substances 0.000 description 4
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 4
- POGSZHUEECCEAP-ZETCQYMHSA-N (2s)-2-amino-3-(3-amino-4-hydroxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(N)=C1 POGSZHUEECCEAP-ZETCQYMHSA-N 0.000 description 3
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 3
- VSNHCAURESNICA-NJFSPNSNSA-N 1-oxidanylurea Chemical compound N[14C](=O)NO VSNHCAURESNICA-NJFSPNSNSA-N 0.000 description 3
- HLYBTPMYFWWNJN-UHFFFAOYSA-N 2-(2,4-dioxo-1h-pyrimidin-5-yl)-2-hydroxyacetic acid Chemical compound OC(=O)C(O)C1=CNC(=O)NC1=O HLYBTPMYFWWNJN-UHFFFAOYSA-N 0.000 description 3
- SGAKLDIYNFXTCK-UHFFFAOYSA-N 2-[(2,4-dioxo-1h-pyrimidin-5-yl)methylamino]acetic acid Chemical compound OC(=O)CNCC1=CNC(=O)NC1=O SGAKLDIYNFXTCK-UHFFFAOYSA-N 0.000 description 3
- YSAJFXWTVFGPAX-UHFFFAOYSA-N 2-[(2,4-dioxo-1h-pyrimidin-5-yl)oxy]acetic acid Chemical compound OC(=O)COC1=CNC(=O)NC1=O YSAJFXWTVFGPAX-UHFFFAOYSA-N 0.000 description 3
- XMSMHKMPBNTBOD-UHFFFAOYSA-N 2-dimethylamino-6-hydroxypurine Chemical class N1C(N(C)C)=NC(=O)C2=C1N=CN2 XMSMHKMPBNTBOD-UHFFFAOYSA-N 0.000 description 3
- SMADWRYCYBUIKH-UHFFFAOYSA-N 2-methyl-7h-purin-6-amine Chemical compound CC1=NC(N)=C2NC=NC2=N1 SMADWRYCYBUIKH-UHFFFAOYSA-N 0.000 description 3
- USCCECGPGBGFOM-UHFFFAOYSA-N 2-propyl-7h-purin-6-amine Chemical compound CCCC1=NC(N)=C2NC=NC2=N1 USCCECGPGBGFOM-UHFFFAOYSA-N 0.000 description 3
- UQTZMGFTRHFAAM-ZETCQYMHSA-N 3-iodo-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(I)=C1 UQTZMGFTRHFAAM-ZETCQYMHSA-N 0.000 description 3
- KOLPWZCZXAMXKS-UHFFFAOYSA-N 3-methylcytosine Chemical compound CN1C(N)=CC=NC1=O KOLPWZCZXAMXKS-UHFFFAOYSA-N 0.000 description 3
- FBTSQILOGYXGMD-LURJTMIESA-N 3-nitro-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C([N+]([O-])=O)=C1 FBTSQILOGYXGMD-LURJTMIESA-N 0.000 description 3
- GJAKJCICANKRFD-UHFFFAOYSA-N 4-acetyl-4-amino-1,3-dihydropyrimidin-2-one Chemical compound CC(=O)C1(N)NC(=O)NC=C1 GJAKJCICANKRFD-UHFFFAOYSA-N 0.000 description 3
- MQJSSLBGAQJNER-UHFFFAOYSA-N 5-(methylaminomethyl)-1h-pyrimidine-2,4-dione Chemical compound CNCC1=CNC(=O)NC1=O MQJSSLBGAQJNER-UHFFFAOYSA-N 0.000 description 3
- WPYRHVXCOQLYLY-UHFFFAOYSA-N 5-[(methoxyamino)methyl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CONCC1=CNC(=S)NC1=O WPYRHVXCOQLYLY-UHFFFAOYSA-N 0.000 description 3
- VKLFQTYNHLDMDP-PNHWDRBUSA-N 5-carboxymethylaminomethyl-2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C(CNCC(O)=O)=C1 VKLFQTYNHLDMDP-PNHWDRBUSA-N 0.000 description 3
- KELXHQACBIUYSE-UHFFFAOYSA-N 5-methoxy-1h-pyrimidine-2,4-dione Chemical compound COC1=CNC(=O)NC1=O KELXHQACBIUYSE-UHFFFAOYSA-N 0.000 description 3
- OHILKUISCGPRMQ-UHFFFAOYSA-N 6-amino-5-(trifluoromethyl)-1h-pyrimidin-2-one Chemical compound NC1=NC(=O)NC=C1C(F)(F)F OHILKUISCGPRMQ-UHFFFAOYSA-N 0.000 description 3
- 101150067361 Aars1 gene Proteins 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 241000222178 Candida tropicalis Species 0.000 description 3
- 241001527609 Cryptococcus Species 0.000 description 3
- 241000235646 Cyberlindnera jadinii Species 0.000 description 3
- 241000235036 Debaryomyces hansenii Species 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- 101000969630 Homo sapiens Monocarboxylate transporter 10 Proteins 0.000 description 3
- 244000285963 Kluyveromyces fragilis Species 0.000 description 3
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 102100021425 Monocarboxylate transporter 10 Human genes 0.000 description 3
- SGSSKEDGVONRGC-UHFFFAOYSA-N N(2)-methylguanine Chemical compound O=C1NC(NC)=NC2=C1N=CN2 SGSSKEDGVONRGC-UHFFFAOYSA-N 0.000 description 3
- DNNFJIBQYSTIOK-UHFFFAOYSA-N NN1N=CN=C2N=CN=C12 Chemical compound NN1N=CN=C2N=CN=C12 DNNFJIBQYSTIOK-UHFFFAOYSA-N 0.000 description 3
- 241000235648 Pichia Species 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 241000723873 Tobacco mosaic virus Species 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 241000223230 Trichosporon Species 0.000 description 3
- 241000278923 Tropicoporus tropicalis Species 0.000 description 3
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 3
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 150000001294 alanine derivatives Chemical class 0.000 description 3
- 150000001336 alkenes Chemical class 0.000 description 3
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 229960003121 arginine Drugs 0.000 description 3
- 235000009697 arginine Nutrition 0.000 description 3
- 229960005261 aspartic acid Drugs 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- RWCCWEUUXYIKHB-UHFFFAOYSA-N benzophenone Chemical compound C=1C=CC=CC=1C(=O)C1=CC=CC=C1 RWCCWEUUXYIKHB-UHFFFAOYSA-N 0.000 description 3
- 239000012965 benzophenone Substances 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 102000005936 beta-Galactosidase Human genes 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 125000001314 canonical amino-acid group Chemical group 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 150000002148 esters Chemical class 0.000 description 3
- 229910052731 fluorine Inorganic materials 0.000 description 3
- 229960002989 glutamic acid Drugs 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- XMBWDFGMSWQBCA-UHFFFAOYSA-N hydrogen iodide Chemical compound I XMBWDFGMSWQBCA-UHFFFAOYSA-N 0.000 description 3
- 229960003136 leucine Drugs 0.000 description 3
- 150000004702 methyl esters Chemical class 0.000 description 3
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 3
- 150000004712 monophosphates Chemical class 0.000 description 3
- XJVXMWNLQRTRGH-UHFFFAOYSA-N n-(3-methylbut-3-enyl)-2-methylsulfanyl-7h-purin-6-amine Chemical compound CSC1=NC(NCCC(C)=C)=C2NC=NC2=N1 XJVXMWNLQRTRGH-UHFFFAOYSA-N 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 3
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 3
- 150000008298 phosphoramidates Chemical class 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 239000001294 propane Substances 0.000 description 3
- UBQKCCHYAOITMY-UHFFFAOYSA-N pyridin-2-ol Chemical compound OC1=CC=CC=N1 UBQKCCHYAOITMY-UHFFFAOYSA-N 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 229940124597 therapeutic agent Drugs 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 3
- 231100000331 toxic Toxicity 0.000 description 3
- 230000002588 toxic effect Effects 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 125000002023 trifluoromethyl group Chemical group FC(F)(F)* 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- 229960004295 valine Drugs 0.000 description 3
- 229910052727 yttrium Inorganic materials 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- FXTLFZWJXBBXGX-QMMMGPOBSA-N (2R)-2-anilino-3-selanylpropanoic acid Chemical compound OC(=O)[C@H](C[SeH])NC1=CC=CC=C1 FXTLFZWJXBBXGX-QMMMGPOBSA-N 0.000 description 2
- GAUUPDQWKHTCAX-SECBINFHSA-N (2r)-2-amino-3-(1-benzothiophen-3-yl)propanoic acid Chemical compound C1=CC=C2C(C[C@@H](N)C(O)=O)=CSC2=C1 GAUUPDQWKHTCAX-SECBINFHSA-N 0.000 description 2
- MRAUNPAHJZDYCK-SCSAIBSYSA-N (2r)-5-[[amino(nitramido)methylidene]amino]-2-azaniumylpentanoate Chemical compound OC(=O)[C@H](N)CCCN=C(N)N[N+]([O-])=O MRAUNPAHJZDYCK-SCSAIBSYSA-N 0.000 description 2
- NFIVJOSXJDORSP-QMMMGPOBSA-N (2s)-2-amino-3-(4-boronophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(B(O)O)C=C1 NFIVJOSXJDORSP-QMMMGPOBSA-N 0.000 description 2
- KEZRWUUMKVVUPT-BYPYZUCNSA-N (2s)-2-amino-3-(dimethylamino)propanoic acid Chemical compound CN(C)C[C@H](N)C(O)=O KEZRWUUMKVVUPT-BYPYZUCNSA-N 0.000 description 2
- ZXXFKVZFDGUTQW-UMJHXOGRSA-N (2s)-2-amino-6-[1-(6-nitro-1,3-benzodioxol-5-yl)ethoxycarbonylamino]hexanoic acid Chemical compound C1=C([N+]([O-])=O)C(C(OC(=O)NCCCC[C@H](N)C(O)=O)C)=CC2=C1OCO2 ZXXFKVZFDGUTQW-UMJHXOGRSA-N 0.000 description 2
- XABCFXXGZPWJQP-BYPYZUCNSA-N (S)-3-aminoadipic acid Chemical compound OC(=O)C[C@@H](N)CCC(O)=O XABCFXXGZPWJQP-BYPYZUCNSA-N 0.000 description 2
- CMUHFUGDYMFHEI-UHFFFAOYSA-N -2-Amino-3-94-aminophenyl)propanoic acid Natural products OC(=O)C(N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-UHFFFAOYSA-N 0.000 description 2
- FYADHXFMURLYQI-UHFFFAOYSA-N 1,2,4-triazine Chemical class C1=CN=NC=N1 FYADHXFMURLYQI-UHFFFAOYSA-N 0.000 description 2
- SXUXMRMBWZCMEN-UHFFFAOYSA-N 2'-O-methyl uridine Natural products COC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 SXUXMRMBWZCMEN-UHFFFAOYSA-N 0.000 description 2
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 2
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 2
- GMKMEZVLHJARHF-UHFFFAOYSA-N 2,6-diaminopimelic acid Chemical compound OC(=O)C(N)CCCC(N)C(O)=O GMKMEZVLHJARHF-UHFFFAOYSA-N 0.000 description 2
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 2
- NOIRDLRUNWIUMX-UHFFFAOYSA-N 2-amino-3,7-dihydropurin-6-one;6-amino-1h-pyrimidin-2-one Chemical compound NC=1C=CNC(=O)N=1.O=C1NC(N)=NC2=C1NC=N2 NOIRDLRUNWIUMX-UHFFFAOYSA-N 0.000 description 2
- OYIFNHCXNCRBQI-UHFFFAOYSA-N 2-aminoadipic acid Chemical compound OC(=O)C(N)CCCC(O)=O OYIFNHCXNCRBQI-UHFFFAOYSA-N 0.000 description 2
- JUQLUIFNNFIIKC-UHFFFAOYSA-N 2-aminopimelic acid Chemical compound OC(=O)C(N)CCCCC(O)=O JUQLUIFNNFIIKC-UHFFFAOYSA-N 0.000 description 2
- ZAYJDMWJYCTABM-UHFFFAOYSA-N 2-azaniumyl-3-hydroxy-4-methylpentanoate Chemical compound CC(C)C(O)C(N)C(O)=O ZAYJDMWJYCTABM-UHFFFAOYSA-N 0.000 description 2
- VVQIIIAZJXTLRE-UHFFFAOYSA-N 2-azaniumyl-6-[(2-methylpropan-2-yl)oxycarbonylamino]hexanoate Chemical compound CC(C)(C)OC(=O)NCCCCC(N)C(O)=O VVQIIIAZJXTLRE-UHFFFAOYSA-N 0.000 description 2
- JWYOAMOZLZXDER-UHFFFAOYSA-N 2-azaniumylcyclopentane-1-carboxylate Chemical compound NC1CCCC1C(O)=O JWYOAMOZLZXDER-UHFFFAOYSA-N 0.000 description 2
- GZLMFCWSEKVVGO-UHFFFAOYSA-N 3-azaniumyl-2-hydroxy-5-methylhexanoate Chemical compound CC(C)CC(N)C(O)C(O)=O GZLMFCWSEKVVGO-UHFFFAOYSA-N 0.000 description 2
- BRVIZBAZAJBTFY-UHFFFAOYSA-N 4,6-dimethyl-5-nitro-2-oxo-1h-pyridine-3-carbonitrile Chemical compound CC=1NC(=O)C(C#N)=C(C)C=1[N+]([O-])=O BRVIZBAZAJBTFY-UHFFFAOYSA-N 0.000 description 2
- DFVFTMTWCUHJBL-UHFFFAOYSA-N 4-azaniumyl-3-hydroxy-6-methylheptanoate Chemical compound CC(C)CC(N)C(O)CC(O)=O DFVFTMTWCUHJBL-UHFFFAOYSA-N 0.000 description 2
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 2
- KDOPAZIWBAHVJB-UHFFFAOYSA-N 5h-pyrrolo[3,2-d]pyrimidine Chemical compound C1=NC=C2NC=CC2=N1 KDOPAZIWBAHVJB-UHFFFAOYSA-N 0.000 description 2
- PNWOYKVCNDZOLS-UHFFFAOYSA-N 6-amino-5-chloro-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1Cl PNWOYKVCNDZOLS-UHFFFAOYSA-N 0.000 description 2
- FICLVQOYKYBXFN-VIFPVBQESA-N 6-chloro-L-tryptophan Chemical compound ClC1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 FICLVQOYKYBXFN-VIFPVBQESA-N 0.000 description 2
- 108020005176 AU Rich Elements Proteins 0.000 description 2
- 241000724328 Alfalfa mosaic virus Species 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000228230 Aspergillus parasiticus Species 0.000 description 2
- 241000222122 Candida albicans Species 0.000 description 2
- 241000144583 Candida dubliniensis Species 0.000 description 2
- 241000222173 Candida parapsilosis Species 0.000 description 2
- 108090000994 Catalytic RNA Proteins 0.000 description 2
- 102000053642 Catalytic RNA Human genes 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 241000172031 Cuphea hyssopifolia Species 0.000 description 2
- 241000219919 Cuphea lanceolata Species 0.000 description 2
- 241000223233 Cutaneotrichosporon cutaneum Species 0.000 description 2
- YPWSLBHSMIKTPR-UHFFFAOYSA-N Cystathionine Natural products OC(=O)C(N)CCSSCC(N)C(O)=O YPWSLBHSMIKTPR-UHFFFAOYSA-N 0.000 description 2
- 102000000311 Cytosine Deaminase Human genes 0.000 description 2
- 108010080611 Cytosine Deaminase Proteins 0.000 description 2
- OGNSCSPNOLGXSM-GSVOUGTGSA-N D-2,4-diaminobutyric acid Chemical compound NCC[C@@H](N)C(O)=O OGNSCSPNOLGXSM-GSVOUGTGSA-N 0.000 description 2
- ILRYLPWNYFXEMH-UHFFFAOYSA-N D-cystathionine Natural products OC(=O)C(N)CCSCC(N)C(O)=O ILRYLPWNYFXEMH-UHFFFAOYSA-N 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- XBPCUCUWBYBCDP-UHFFFAOYSA-N Dicyclohexylamine Chemical class C1CCCCC1NC1CCCCC1 XBPCUCUWBYBCDP-UHFFFAOYSA-N 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 108090000204 Dipeptidase 1 Proteins 0.000 description 2
- 241000222175 Diutina rugosa Species 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 2
- 102000007338 Fragile X Mental Retardation Protein Human genes 0.000 description 2
- 108010032606 Fragile X Mental Retardation Protein Proteins 0.000 description 2
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 2
- 241000941423 Grom virus Species 0.000 description 2
- ZRALSGWEFCBTJO-UHFFFAOYSA-N Guanidine Chemical compound NC(N)=N ZRALSGWEFCBTJO-UHFFFAOYSA-N 0.000 description 2
- 235000014683 Hansenula anomala Nutrition 0.000 description 2
- 208000009889 Herpes Simplex Diseases 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 238000009015 Human TaqMan MicroRNA Assay kit Methods 0.000 description 2
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- ILRYLPWNYFXEMH-WHFBIAKZSA-N L-cystathionine Chemical compound [O-]C(=O)[C@@H]([NH3+])CCSC[C@H]([NH3+])C([O-])=O ILRYLPWNYFXEMH-WHFBIAKZSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- MRAUNPAHJZDYCK-BYPYZUCNSA-N L-nitroarginine Chemical compound OC(=O)[C@@H](N)CCCNC(=N)N[N+]([O-])=O MRAUNPAHJZDYCK-BYPYZUCNSA-N 0.000 description 2
- ZFOMKMMPBOQKMC-KXUCPTDWSA-N L-pyrrolysine Chemical compound C[C@@H]1CC=N[C@H]1C(=O)NCCCC[C@H]([NH3+])C([O-])=O ZFOMKMMPBOQKMC-KXUCPTDWSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- 241001123676 Metschnikowia pulcherrima Species 0.000 description 2
- 241000235048 Meyerozyma guilliermondii Species 0.000 description 2
- 241000244206 Nematoda Species 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- IDGQXGPQOGUGIX-UHFFFAOYSA-N O-Benzyl-DL-serine Chemical compound OC(=O)C(N)COCC1=CC=CC=C1 IDGQXGPQOGUGIX-UHFFFAOYSA-N 0.000 description 2
- TTZMPOZCBFTTPR-UHFFFAOYSA-N O=P1OCO1 Chemical compound O=P1OCO1 TTZMPOZCBFTTPR-UHFFFAOYSA-N 0.000 description 2
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 241000235652 Pachysolen Species 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- 241000521553 Pichia fermentans Species 0.000 description 2
- 241000235645 Pichia kudriavzevii Species 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- 241000723762 Potato virus Y Species 0.000 description 2
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 2
- 108091030071 RNAI Proteins 0.000 description 2
- 108091027981 Response element Proteins 0.000 description 2
- 240000005384 Rhizopus oryzae Species 0.000 description 2
- 241000221523 Rhodotorula toruloides Species 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 241001123227 Saccharomyces pastorianus Species 0.000 description 2
- RJFAYQIBOAGBLC-BYPYZUCNSA-N Selenium-L-methionine Chemical compound C[Se]CC[C@H](N)C(O)=O RJFAYQIBOAGBLC-BYPYZUCNSA-N 0.000 description 2
- RJFAYQIBOAGBLC-UHFFFAOYSA-N Selenomethionine Natural products C[Se]CCC(N)C(O)=O RJFAYQIBOAGBLC-UHFFFAOYSA-N 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 108091036066 Three prime untranslated region Proteins 0.000 description 2
- 108010064978 Type II Site-Specific Deoxyribonucleases Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical group O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241000142807 [Candida] carpophila Species 0.000 description 2
- 241000222126 [Candida] glabrata Species 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 150000001345 alkine derivatives Chemical class 0.000 description 2
- 230000029936 alkylation Effects 0.000 description 2
- 238000005804 alkylation reaction Methods 0.000 description 2
- 235000008206 alpha-amino acids Nutrition 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 125000000129 anionic group Chemical group 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 150000001507 asparagine derivatives Chemical class 0.000 description 2
- 125000003236 benzoyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C(*)=O 0.000 description 2
- 125000001488 beta-D-galactosyl group Chemical group C1([C@H](O)[C@@H](O)[C@@H](O)[C@H](O1)CO)* 0.000 description 2
- 102000006635 beta-lactamase Human genes 0.000 description 2
- 229940095731 candida albicans Drugs 0.000 description 2
- 208000032343 candida glabrata infection Diseases 0.000 description 2
- 229940055022 candida parapsilosis Drugs 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 101150102092 ccdB gene Proteins 0.000 description 2
- 125000003636 chemical group Chemical group 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical group C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000007819 coupling partner Substances 0.000 description 2
- 125000000753 cycloalkyl group Chemical group 0.000 description 2
- XVOYSCVBGLVSOL-UHFFFAOYSA-N cysteic acid Chemical compound OC(=O)C(N)CS(O)(=O)=O XVOYSCVBGLVSOL-UHFFFAOYSA-N 0.000 description 2
- DAEAPNUQQAICNR-RRKCRQDMSA-K dADP(3-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP([O-])(=O)OP([O-])([O-])=O)O1 DAEAPNUQQAICNR-RRKCRQDMSA-K 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- FTDHDKPUHBLBTL-SHYZEUOFSA-K dCDP(3-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 FTDHDKPUHBLBTL-SHYZEUOFSA-K 0.000 description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 2
- CIKGWCTVFSRMJU-KVQBGUIXSA-N dGDP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 CIKGWCTVFSRMJU-KVQBGUIXSA-N 0.000 description 2
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 2
- UJLXYODCHAELLY-XLPZGREQSA-N dTDP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 UJLXYODCHAELLY-XLPZGREQSA-N 0.000 description 2
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 2
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 2
- KHWCHTKSEGGWEX-UHFFFAOYSA-N deoxyadenylic acid Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(O)=O)O1 KHWCHTKSEGGWEX-UHFFFAOYSA-N 0.000 description 2
- LTFMZDNNPPEQNG-UHFFFAOYSA-N deoxyguanylic acid Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1CC(O)C(COP(O)(O)=O)O1 LTFMZDNNPPEQNG-UHFFFAOYSA-N 0.000 description 2
- 239000005549 deoxyribonucleoside Substances 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 230000001627 detrimental effect Effects 0.000 description 2
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 2
- 239000001177 diphosphate Substances 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 2
- 125000004030 farnesyl group Chemical group [H]C([*])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 229960002949 fluorouracil Drugs 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 150000002308 glutamine derivatives Chemical class 0.000 description 2
- 229960002449 glycine Drugs 0.000 description 2
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 2
- QTDZOWFRBNTPQR-UHFFFAOYSA-N guvacine Chemical compound OC(=O)C1=CCCNC1 QTDZOWFRBNTPQR-UHFFFAOYSA-N 0.000 description 2
- 125000004475 heteroaralkyl group Chemical group 0.000 description 2
- 125000005842 heteroatom Chemical group 0.000 description 2
- QQHJDPROMQRDLA-UHFFFAOYSA-N hexadecanedioic acid Chemical compound OC(=O)CCCCCCCCCCCCCCC(O)=O QQHJDPROMQRDLA-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 229960002885 histidine Drugs 0.000 description 2
- 235000014304 histidine Nutrition 0.000 description 2
- ZTVZLYBCZNMWCF-UHFFFAOYSA-N homocystine Chemical compound [O-]C(=O)C([NH3+])CCSSCCC([NH3+])C([O-])=O ZTVZLYBCZNMWCF-UHFFFAOYSA-N 0.000 description 2
- 230000036571 hydration Effects 0.000 description 2
- 238000006703 hydration reaction Methods 0.000 description 2
- JJOJFIHJIRWASH-UHFFFAOYSA-N icosanedioic acid Chemical compound OC(=O)CCCCCCCCCCCCCCCCCCC(O)=O JJOJFIHJIRWASH-UHFFFAOYSA-N 0.000 description 2
- 150000002466 imines Chemical class 0.000 description 2
- 229910052738 indium Inorganic materials 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- BBJIPMIXTXKYLZ-UHFFFAOYSA-N isoglutamic acid Chemical compound OC(=O)CC(N)CC(O)=O BBJIPMIXTXKYLZ-UHFFFAOYSA-N 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 150000002741 methionine derivatives Chemical class 0.000 description 2
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- BNJOQKFENDDGSC-UHFFFAOYSA-N octadecanedioic acid Chemical compound OC(=O)CCCCCCCCCCCCCCCCC(O)=O BNJOQKFENDDGSC-UHFFFAOYSA-N 0.000 description 2
- 125000002971 oxazolyl group Chemical group 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 125000004430 oxygen atom Chemical group O* 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 125000006239 protecting group Chemical group 0.000 description 2
- 125000003373 pyrazinyl group Chemical group 0.000 description 2
- 125000003226 pyrazolyl group Chemical group 0.000 description 2
- 125000004076 pyridyl group Chemical group 0.000 description 2
- 108040001032 pyrrolysyl-tRNA synthetase activity proteins Proteins 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000002342 ribonucleoside Substances 0.000 description 2
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- CXMXRPHRNRROMY-UHFFFAOYSA-N sebacic acid Chemical compound OC(=O)CCCCCCCCC(O)=O CXMXRPHRNRROMY-UHFFFAOYSA-N 0.000 description 2
- 229960002718 selenomethionine Drugs 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 150000003354 serine derivatives Chemical class 0.000 description 2
- 230000003584 silencer Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000004960 subcellular localization Effects 0.000 description 2
- TYFQFVWCELRYAO-UHFFFAOYSA-N suberic acid Chemical compound OC(=O)CCCCCCC(O)=O TYFQFVWCELRYAO-UHFFFAOYSA-N 0.000 description 2
- 150000003457 sulfones Chemical group 0.000 description 2
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 2
- 150000003462 sulfoxides Chemical class 0.000 description 2
- 125000004434 sulfur atom Chemical group 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 125000005931 tert-butyloxycarbonyl group Chemical group [H]C([H])([H])C(OC(*)=O)(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- HQHCYKULIHKCEB-UHFFFAOYSA-N tetradecanedioic acid Chemical compound OC(=O)CCCCCCCCCCCCC(O)=O HQHCYKULIHKCEB-UHFFFAOYSA-N 0.000 description 2
- 125000000335 thiazolyl group Chemical group 0.000 description 2
- 125000001544 thienyl group Chemical group 0.000 description 2
- 231100000167 toxic agent Toxicity 0.000 description 2
- 239000003440 toxic substance Substances 0.000 description 2
- 125000001425 triazolyl group Chemical group 0.000 description 2
- 125000002264 triphosphate group Chemical group [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 2
- 229910052721 tungsten Inorganic materials 0.000 description 2
- 150000003667 tyrosine derivatives Chemical class 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 229910052720 vanadium Inorganic materials 0.000 description 2
- YSTPAHQEHQSRJD-VIFPVBQESA-N (+)-piperitone Chemical compound CC(C)[C@@H]1CCC(C)=CC1=O YSTPAHQEHQSRJD-VIFPVBQESA-N 0.000 description 1
- OGNSCSPNOLGXSM-UHFFFAOYSA-N (+/-)-DABA Natural products NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 1
- ZHSOTLOTTDYIIK-ZDUSSCGKSA-N (2S)-2-amino-3-[4-(4-hydroxyphenoxy)-3,5-diiodophenyl]propanoic acid Chemical compound IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C=C1 ZHSOTLOTTDYIIK-ZDUSSCGKSA-N 0.000 description 1
- QLDVOCPEKYLEOT-BOADVZGGSA-N (2S)-2-amino-6-(9-bicyclo[6.1.0]non-4-ynylmethoxycarbonylamino)hexanoic acid Chemical compound N[C@H](C(=O)O)CCCCNC(=O)OCC1C2CCC#CCCC12 QLDVOCPEKYLEOT-BOADVZGGSA-N 0.000 description 1
- WLJVBRIHIOMEPT-LURJTMIESA-N (2S)-2-amino-6-(oxaldehydoylamino)hexanoic acid Chemical compound C(C=O)(=O)NCCCC[C@H](N)C(=O)O WLJVBRIHIOMEPT-LURJTMIESA-N 0.000 description 1
- GKYFOPIIHODTJH-JTQLQIEISA-N (2S)-2-amino-6-(pent-4-ynoxycarbonylamino)hexanoic acid Chemical compound N[C@@H](CCCCNC(=O)OCCCC#C)C(O)=O GKYFOPIIHODTJH-JTQLQIEISA-N 0.000 description 1
- DVOOXRTYGGLORL-VKHMYHEASA-N (2r)-2-(methylamino)-3-sulfanylpropanoic acid Chemical compound CN[C@@H](CS)C(O)=O DVOOXRTYGGLORL-VKHMYHEASA-N 0.000 description 1
- DOCYTUNUHIGJTI-QMMMGPOBSA-N (2r)-2-[(2-nitrophenyl)methylamino]-3-sulfanylpropanoic acid Chemical compound OC(=O)[C@H](CS)NCC1=CC=CC=C1[N+]([O-])=O DOCYTUNUHIGJTI-QMMMGPOBSA-N 0.000 description 1
- GUDHMDVRURNAHL-SNVBAGLBSA-N (2r)-2-amino-2-(2,3-dihydro-1h-inden-2-yl)acetic acid Chemical compound C1=CC=C2CC([C@@H](N)C(O)=O)CC2=C1 GUDHMDVRURNAHL-SNVBAGLBSA-N 0.000 description 1
- JKFYKCYQEWQPTM-SSDOTTSWSA-N (2r)-2-amino-2-(4-fluorophenyl)acetic acid Chemical compound OC(=O)[C@H](N)C1=CC=C(F)C=C1 JKFYKCYQEWQPTM-SSDOTTSWSA-N 0.000 description 1
- CWAYDJFPMMUKOI-RXMQYKEDSA-N (2r)-2-amino-2-methylbutanedioic acid Chemical compound OC(=O)[C@@](N)(C)CC(O)=O CWAYDJFPMMUKOI-RXMQYKEDSA-N 0.000 description 1
- PRAWYXDDKCVZTL-MRVPVSSYSA-N (2r)-2-amino-3-(3,4-difluorophenyl)propanoic acid Chemical compound OC(=O)[C@H](N)CC1=CC=C(F)C(F)=C1 PRAWYXDDKCVZTL-MRVPVSSYSA-N 0.000 description 1
- VWHRYODZTDMVSS-MRVPVSSYSA-N (2r)-2-amino-3-(3-fluorophenyl)propanoic acid Chemical compound OC(=O)[C@H](N)CC1=CC=CC(F)=C1 VWHRYODZTDMVSS-MRVPVSSYSA-N 0.000 description 1
- BABTYIKKTLTNRX-MRVPVSSYSA-N (2r)-2-amino-3-(3-iodophenyl)propanoic acid Chemical compound OC(=O)[C@H](N)CC1=CC=CC(I)=C1 BABTYIKKTLTNRX-MRVPVSSYSA-N 0.000 description 1
- PEMUHKUIQHFMTH-MRVPVSSYSA-N (2r)-2-amino-3-(4-bromophenyl)propanoic acid Chemical compound OC(=O)[C@H](N)CC1=CC=C(Br)C=C1 PEMUHKUIQHFMTH-MRVPVSSYSA-N 0.000 description 1
- NIGWMJHCCYYCSF-MRVPVSSYSA-N (2r)-2-amino-3-(4-chlorophenyl)propanoic acid Chemical compound OC(=O)[C@H](N)CC1=CC=C(Cl)C=C1 NIGWMJHCCYYCSF-MRVPVSSYSA-N 0.000 description 1
- KWIPUXXIFQQMKN-SECBINFHSA-N (2r)-2-amino-3-(4-cyanophenyl)propanoic acid Chemical compound OC(=O)[C@H](N)CC1=CC=C(C#N)C=C1 KWIPUXXIFQQMKN-SECBINFHSA-N 0.000 description 1
- XWHHYOYVRVGJJY-MRVPVSSYSA-N (2r)-2-amino-3-(4-fluorophenyl)propanoic acid Chemical compound OC(=O)[C@H](N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-MRVPVSSYSA-N 0.000 description 1
- JULROCUWKLNBSN-IMJSIDKUSA-N (2r)-2-amino-3-[[(2r)-2-amino-2-carboxyethyl]diselanyl]propanoic acid Chemical compound OC(=O)[C@@H](N)C[Se][Se]C[C@H](N)C(O)=O JULROCUWKLNBSN-IMJSIDKUSA-N 0.000 description 1
- DFZVZEMNPGABKO-SSDOTTSWSA-N (2r)-2-amino-3-pyridin-3-ylpropanoic acid Chemical compound OC(=O)[C@H](N)CC1=CC=CN=C1 DFZVZEMNPGABKO-SSDOTTSWSA-N 0.000 description 1
- WXYKFHWSPNEGAD-HSZRJFAPSA-N (2r)-2-amino-5-[[(4-methylphenyl)-diphenylmethyl]amino]pentanoic acid Chemical compound C1=CC(C)=CC=C1C(NCCC[C@@H](N)C(O)=O)(C=1C=CC=CC=1)C1=CC=CC=C1 WXYKFHWSPNEGAD-HSZRJFAPSA-N 0.000 description 1
- YOFPFYYTUIARDI-ZCFIWIBFSA-N (2r)-2-aminooctanedioic acid Chemical compound OC(=O)[C@H](N)CCCCCC(O)=O YOFPFYYTUIARDI-ZCFIWIBFSA-N 0.000 description 1
- WAMWSIDTKSNDCU-SSDOTTSWSA-N (2r)-2-azaniumyl-2-cyclohexylacetate Chemical compound OC(=O)[C@H](N)C1CCCCC1 WAMWSIDTKSNDCU-SSDOTTSWSA-N 0.000 description 1
- HYOWVAAEQCNGLE-SNVBAGLBSA-N (2r)-2-azaniumyl-2-methyl-3-phenylpropanoate Chemical compound [O-]C(=O)[C@@]([NH3+])(C)CC1=CC=CC=C1 HYOWVAAEQCNGLE-SNVBAGLBSA-N 0.000 description 1
- QMBTZYHBJFPEJB-ZCFIWIBFSA-N (2r)-2-azaniumyl-2-methylpent-4-enoate Chemical compound OC(=O)[C@@](N)(C)CC=C QMBTZYHBJFPEJB-ZCFIWIBFSA-N 0.000 description 1
- NPDBDJFLKKQMCM-BYPYZUCNSA-N (2r)-2-azaniumyl-3,3-dimethylbutanoate Chemical compound CC(C)(C)[C@@H]([NH3+])C([O-])=O NPDBDJFLKKQMCM-BYPYZUCNSA-N 0.000 description 1
- JFVLNTLXEZDFHW-MRVPVSSYSA-N (2r)-2-azaniumyl-3-(2-bromophenyl)propanoate Chemical compound [O-]C(=O)[C@H]([NH3+])CC1=CC=CC=C1Br JFVLNTLXEZDFHW-MRVPVSSYSA-N 0.000 description 1
- CVZZNRXMDCOHBG-MRVPVSSYSA-N (2r)-2-azaniumyl-3-(2-chlorophenyl)propanoate Chemical compound [O-]C(=O)[C@H]([NH3+])CC1=CC=CC=C1Cl CVZZNRXMDCOHBG-MRVPVSSYSA-N 0.000 description 1
- OCDHPLVCNWBKJN-SECBINFHSA-N (2r)-2-azaniumyl-3-(2-cyanophenyl)propanoate Chemical compound OC(=O)[C@H](N)CC1=CC=CC=C1C#N OCDHPLVCNWBKJN-SECBINFHSA-N 0.000 description 1
- NHBKDLSKDKUGSB-SECBINFHSA-N (2r)-2-azaniumyl-3-(2-methylphenyl)propanoate Chemical compound CC1=CC=CC=C1C[C@@H]([NH3+])C([O-])=O NHBKDLSKDKUGSB-SECBINFHSA-N 0.000 description 1
- SDZGVFSSLGTJAJ-SSDOTTSWSA-N (2r)-2-azaniumyl-3-(2-nitrophenyl)propanoate Chemical compound [O-]C(=O)[C@H]([NH3+])CC1=CC=CC=C1[N+]([O-])=O SDZGVFSSLGTJAJ-SSDOTTSWSA-N 0.000 description 1
- SFKCVRLOYOHGFK-SSDOTTSWSA-N (2r)-2-azaniumyl-3-(3,4,5-trifluorophenyl)propanoate Chemical compound [O-]C(=O)[C@H]([NH3+])CC1=CC(F)=C(F)C(F)=C1 SFKCVRLOYOHGFK-SSDOTTSWSA-N 0.000 description 1
- NRCSJHVDTAAISV-MRVPVSSYSA-N (2r)-2-azaniumyl-3-(3,4-dichlorophenyl)propanoate Chemical compound [O-]C(=O)[C@H]([NH3+])CC1=CC=C(Cl)C(Cl)=C1 NRCSJHVDTAAISV-MRVPVSSYSA-N 0.000 description 1
- GDMOHOYNMWWBAU-MRVPVSSYSA-N (2r)-2-azaniumyl-3-(3-bromophenyl)propanoate Chemical compound [O-]C(=O)[C@H]([NH3+])CC1=CC=CC(Br)=C1 GDMOHOYNMWWBAU-MRVPVSSYSA-N 0.000 description 1
- JJDJLFDGCUYZMN-MRVPVSSYSA-N (2r)-2-azaniumyl-3-(3-chlorophenyl)propanoate Chemical compound OC(=O)[C@H](N)CC1=CC=CC(Cl)=C1 JJDJLFDGCUYZMN-MRVPVSSYSA-N 0.000 description 1
- ZHUOMTMPTNZOJE-SECBINFHSA-N (2r)-2-azaniumyl-3-(3-cyanophenyl)propanoate Chemical compound OC(=O)[C@H](N)CC1=CC=CC(C#N)=C1 ZHUOMTMPTNZOJE-SECBINFHSA-N 0.000 description 1
- JZRBSTONIYRNRI-SECBINFHSA-N (2r)-2-azaniumyl-3-(3-methylphenyl)propanoate Chemical compound CC1=CC=CC(C[C@@H]([NH3+])C([O-])=O)=C1 JZRBSTONIYRNRI-SECBINFHSA-N 0.000 description 1
- YTHDRUZHNYKZGF-MRVPVSSYSA-N (2r)-2-azaniumyl-3-(3-nitrophenyl)propanoate Chemical compound [O-]C(=O)[C@H]([NH3+])CC1=CC=CC([N+]([O-])=O)=C1 YTHDRUZHNYKZGF-MRVPVSSYSA-N 0.000 description 1
- TVIDEEHSOPHZBR-CQSZACIVSA-N (2r)-2-azaniumyl-3-(4-benzoylphenyl)propanoate Chemical compound C1=CC(C[C@@H](N)C(O)=O)=CC=C1C(=O)C1=CC=CC=C1 TVIDEEHSOPHZBR-CQSZACIVSA-N 0.000 description 1
- NYPYHUZRZVSYKL-SSDOTTSWSA-N (2r)-2-azaniumyl-3-(4-hydroxy-3,5-diiodophenyl)propanoate Chemical compound [O-]C(=O)[C@H]([NH3+])CC1=CC(I)=C(O)C(I)=C1 NYPYHUZRZVSYKL-SSDOTTSWSA-N 0.000 description 1
- IOABLDGLYOGEHY-MRVPVSSYSA-N (2r)-2-azaniumyl-3-[2-(trifluoromethyl)phenyl]propanoate Chemical compound [O-]C(=O)[C@H]([NH3+])CC1=CC=CC=C1C(F)(F)F IOABLDGLYOGEHY-MRVPVSSYSA-N 0.000 description 1
- BURBNIPKSRJAIQ-MRVPVSSYSA-N (2r)-2-azaniumyl-3-[3-(trifluoromethyl)phenyl]propanoate Chemical compound [O-]C(=O)[C@H]([NH3+])CC1=CC=CC(C(F)(F)F)=C1 BURBNIPKSRJAIQ-MRVPVSSYSA-N 0.000 description 1
- CRFFPDBJLGAGQL-MRVPVSSYSA-N (2r)-2-azaniumyl-3-[4-(trifluoromethyl)phenyl]propanoate Chemical compound [O-]C(=O)[C@H]([NH3+])CC1=CC=C(C(F)(F)F)C=C1 CRFFPDBJLGAGQL-MRVPVSSYSA-N 0.000 description 1
- ORQXBVXKBGUSBA-MRVPVSSYSA-N (2r)-2-azaniumyl-3-cyclohexylpropanoate Chemical compound OC(=O)[C@H](N)CC1CCCCC1 ORQXBVXKBGUSBA-MRVPVSSYSA-N 0.000 description 1
- OFYAYGJCPXRNBL-GFCCVEGCSA-N (2r)-2-azaniumyl-3-naphthalen-1-ylpropanoate Chemical compound C1=CC=C2C(C[C@@H]([NH3+])C([O-])=O)=CC=CC2=C1 OFYAYGJCPXRNBL-GFCCVEGCSA-N 0.000 description 1
- PDRJLZDUOULRHE-SSDOTTSWSA-N (2r)-2-azaniumyl-3-pyridin-2-ylpropanoate Chemical compound OC(=O)[C@H](N)CC1=CC=CC=N1 PDRJLZDUOULRHE-SSDOTTSWSA-N 0.000 description 1
- FQFVANSXYKWQOT-SSDOTTSWSA-N (2r)-2-azaniumyl-3-pyridin-4-ylpropanoate Chemical compound OC(=O)[C@H](N)CC1=CC=NC=C1 FQFVANSXYKWQOT-SSDOTTSWSA-N 0.000 description 1
- LPBSHGLDBQBSPI-RXMQYKEDSA-N (2r)-2-azaniumyl-4,4-dimethylpentanoate Chemical compound CC(C)(C)C[C@@H]([NH3+])C([O-])=O LPBSHGLDBQBSPI-RXMQYKEDSA-N 0.000 description 1
- WNNNWFKQCKFSDK-SCSAIBSYSA-N (2r)-2-azaniumylpent-4-enoate Chemical compound [O-]C(=O)[C@H]([NH3+])CC=C WNNNWFKQCKFSDK-SCSAIBSYSA-N 0.000 description 1
- LNDPCYHWPSQBCA-LURJTMIESA-N (2s)-2,5-diamino-2-methylpentanoic acid Chemical compound OC(=O)[C@](N)(C)CCCN LNDPCYHWPSQBCA-LURJTMIESA-N 0.000 description 1
- CRTOKRWMAPBEKF-AWEZNQCLSA-N (2s)-2-(benzylamino)-3-(4-hydroxy-2-nitrophenyl)propanoic acid Chemical compound C([C@@H](C(=O)O)NCC=1C=CC=CC=1)C1=CC=C(O)C=C1[N+]([O-])=O CRTOKRWMAPBEKF-AWEZNQCLSA-N 0.000 description 1
- UAYNVVPNQUUEEZ-SECBINFHSA-N (2s)-2-(benzylamino)-3-sulfanylpropanoic acid Chemical compound OC(=O)[C@@H](CS)NCC1=CC=CC=C1 UAYNVVPNQUUEEZ-SECBINFHSA-N 0.000 description 1
- LDQAVQLJHUEMEY-JTQLQIEISA-N (2s)-2-(ethylamino)-3-(4-hydroxyphenyl)propanoic acid Chemical compound CCN[C@H](C(O)=O)CC1=CC=C(O)C=C1 LDQAVQLJHUEMEY-JTQLQIEISA-N 0.000 description 1
- SRADVTGBACJUSV-BYPYZUCNSA-N (2s)-2-(methylideneamino)pentanedioic acid Chemical compound OC(=O)CC[C@H](N=C)C(O)=O SRADVTGBACJUSV-BYPYZUCNSA-N 0.000 description 1
- BRERHJJSDHDERR-RXMQYKEDSA-N (2s)-2-(tert-butylamino)-3-sulfanylpropanoic acid Chemical compound CC(C)(C)N[C@H](CS)C(O)=O BRERHJJSDHDERR-RXMQYKEDSA-N 0.000 description 1
- JKFYKCYQEWQPTM-ZETCQYMHSA-N (2s)-2-amino-2-(4-fluorophenyl)acetic acid Chemical compound OC(=O)[C@@H](N)C1=CC=C(F)C=C1 JKFYKCYQEWQPTM-ZETCQYMHSA-N 0.000 description 1
- QHSCIWIRXWFIGH-LURJTMIESA-N (2s)-2-amino-2-methylpentanedioic acid Chemical compound OC(=O)[C@](N)(C)CCC(O)=O QHSCIWIRXWFIGH-LURJTMIESA-N 0.000 description 1
- NPDBDJFLKKQMCM-SCSAIBSYSA-N (2s)-2-amino-3,3-dimethylbutanoic acid Chemical compound CC(C)(C)[C@H](N)C(O)=O NPDBDJFLKKQMCM-SCSAIBSYSA-N 0.000 description 1
- PECGVEGMRUZOML-AWEZNQCLSA-N (2s)-2-amino-3,3-diphenylpropanoic acid Chemical compound C=1C=CC=CC=1C([C@H](N)C(O)=O)C1=CC=CC=C1 PECGVEGMRUZOML-AWEZNQCLSA-N 0.000 description 1
- ZTTWHZHBPDYSQB-LBPRGKRZSA-N (2s)-2-amino-3-(1h-indol-3-yl)-2-methylpropanoic acid Chemical compound C1=CC=C2C(C[C@@](N)(C)C(O)=O)=CNC2=C1 ZTTWHZHBPDYSQB-LBPRGKRZSA-N 0.000 description 1
- JFVLNTLXEZDFHW-QMMMGPOBSA-N (2s)-2-amino-3-(2-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1Br JFVLNTLXEZDFHW-QMMMGPOBSA-N 0.000 description 1
- OCDHPLVCNWBKJN-VIFPVBQESA-N (2s)-2-amino-3-(2-cyanophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1C#N OCDHPLVCNWBKJN-VIFPVBQESA-N 0.000 description 1
- NHBKDLSKDKUGSB-VIFPVBQESA-N (2s)-2-amino-3-(2-methylphenyl)propanoic acid Chemical compound CC1=CC=CC=C1C[C@H](N)C(O)=O NHBKDLSKDKUGSB-VIFPVBQESA-N 0.000 description 1
- NRCSJHVDTAAISV-QMMMGPOBSA-N (2s)-2-amino-3-(3,4-dichlorophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Cl)C(Cl)=C1 NRCSJHVDTAAISV-QMMMGPOBSA-N 0.000 description 1
- PRAWYXDDKCVZTL-QMMMGPOBSA-N (2s)-2-amino-3-(3,4-difluorophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(F)C(F)=C1 PRAWYXDDKCVZTL-QMMMGPOBSA-N 0.000 description 1
- GDMOHOYNMWWBAU-QMMMGPOBSA-N (2s)-2-amino-3-(3-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(Br)=C1 GDMOHOYNMWWBAU-QMMMGPOBSA-N 0.000 description 1
- ZHUOMTMPTNZOJE-VIFPVBQESA-N (2s)-2-amino-3-(3-cyanophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(C#N)=C1 ZHUOMTMPTNZOJE-VIFPVBQESA-N 0.000 description 1
- BABTYIKKTLTNRX-QMMMGPOBSA-N (2s)-2-amino-3-(3-iodophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(I)=C1 BABTYIKKTLTNRX-QMMMGPOBSA-N 0.000 description 1
- KWIPUXXIFQQMKN-VIFPVBQESA-N (2s)-2-amino-3-(4-cyanophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(C#N)C=C1 KWIPUXXIFQQMKN-VIFPVBQESA-N 0.000 description 1
- FPJGLSZLQLNZIW-VIFPVBQESA-N (2s)-2-amino-3-(4-methyl-1h-indol-3-yl)propanoic acid Chemical compound CC1=CC=CC2=C1C(C[C@H](N)C(O)=O)=CN2 FPJGLSZLQLNZIW-VIFPVBQESA-N 0.000 description 1
- KZDNJQUJBMDHJW-VIFPVBQESA-N (2s)-2-amino-3-(5-bromo-1h-indol-3-yl)propanoic acid Chemical compound C1=C(Br)C=C2C(C[C@H](N)C(O)=O)=CNC2=C1 KZDNJQUJBMDHJW-VIFPVBQESA-N 0.000 description 1
- RLVWWNBRWFEDBB-NSHDSACASA-N (2s)-2-amino-3-(5-methoxy-2-methyl-1h-indol-3-yl)propanoic acid Chemical compound COC1=CC=C2NC(C)=C(C[C@H](N)C(O)=O)C2=C1 RLVWWNBRWFEDBB-NSHDSACASA-N 0.000 description 1
- IOABLDGLYOGEHY-QMMMGPOBSA-N (2s)-2-amino-3-[2-(trifluoromethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1C(F)(F)F IOABLDGLYOGEHY-QMMMGPOBSA-N 0.000 description 1
- BURBNIPKSRJAIQ-QMMMGPOBSA-N (2s)-2-amino-3-[3-(trifluoromethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(C(F)(F)F)=C1 BURBNIPKSRJAIQ-QMMMGPOBSA-N 0.000 description 1
- CRFFPDBJLGAGQL-QMMMGPOBSA-N (2s)-2-amino-3-[4-(trifluoromethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(C(F)(F)F)C=C1 CRFFPDBJLGAGQL-QMMMGPOBSA-N 0.000 description 1
- IRZQDMYEJPNDEN-NETXQHHPSA-N (2s)-2-amino-3-phenylbutanoic acid Chemical compound OC(=O)[C@@H](N)C(C)C1=CC=CC=C1 IRZQDMYEJPNDEN-NETXQHHPSA-N 0.000 description 1
- DFZVZEMNPGABKO-ZETCQYMHSA-N (2s)-2-amino-3-pyridin-3-ylpropanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CN=C1 DFZVZEMNPGABKO-ZETCQYMHSA-N 0.000 description 1
- LAXXPOJCFVMVAX-ZETCQYMHSA-N (2s)-2-amino-4-butylsulfanylbutanoic acid Chemical compound CCCCSCC[C@H](N)C(O)=O LAXXPOJCFVMVAX-ZETCQYMHSA-N 0.000 description 1
- WMQSFBUZDZBTKA-JAMMHHFISA-N (2s)-2-amino-6-(1,3-thiazolidine-4-carbonylamino)hexanoic acid Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)C1CSCN1 WMQSFBUZDZBTKA-JAMMHHFISA-N 0.000 description 1
- NUEFUNSNPPAJQL-SKQCGHHBSA-N (2s)-2-amino-6-(5-bicyclo[2.2.1]hept-2-enylmethoxycarbonylamino)hexanoic acid Chemical compound C1C2C(COC(=O)NCCCC[C@H](N)C(O)=O)CC1C=C2 NUEFUNSNPPAJQL-SKQCGHHBSA-N 0.000 description 1
- SKODBBYQVSLYEC-FYJQFVIDSA-N (2s)-2-amino-6-(5-bicyclo[2.2.1]hept-2-enyloxycarbonylamino)hexanoic acid Chemical compound C1C2C(OC(=O)NCCCC[C@H](N)C(O)=O)CC1C=C2 SKODBBYQVSLYEC-FYJQFVIDSA-N 0.000 description 1
- UNHWCUXOSTXJFO-VIFPVBQESA-N (2s)-2-amino-6-(but-3-ynoxycarbonylamino)hexanoic acid Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)OCCC#C UNHWCUXOSTXJFO-VIFPVBQESA-N 0.000 description 1
- FQFIGHYUHCWZRZ-JTQLQIEISA-N (2s)-2-amino-6-(cyclopentanecarbonylamino)hexanoic acid Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)C1CCCC1 FQFIGHYUHCWZRZ-JTQLQIEISA-N 0.000 description 1
- KRFMMSZGIQEBIJ-QMMMGPOBSA-N (2s)-2-amino-6-(prop-2-ynoxycarbonylamino)hexanoic acid Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)OCC#C KRFMMSZGIQEBIJ-QMMMGPOBSA-N 0.000 description 1
- YOFPFYYTUIARDI-LURJTMIESA-N (2s)-2-aminooctanedioic acid Chemical compound OC(=O)[C@@H](N)CCCCCC(O)=O YOFPFYYTUIARDI-LURJTMIESA-N 0.000 description 1
- WAMWSIDTKSNDCU-ZETCQYMHSA-N (2s)-2-azaniumyl-2-cyclohexylacetate Chemical compound OC(=O)[C@@H](N)C1CCCCC1 WAMWSIDTKSNDCU-ZETCQYMHSA-N 0.000 description 1
- SNLOIIPRZGMRAB-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(1h-pyrrolo[2,3-b]pyridin-3-yl)propanoate Chemical compound C1=CC=C2C(C[C@H]([NH3+])C([O-])=O)=CNC2=N1 SNLOIIPRZGMRAB-QMMMGPOBSA-N 0.000 description 1
- SDZGVFSSLGTJAJ-ZETCQYMHSA-N (2s)-2-azaniumyl-3-(2-nitrophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1[N+]([O-])=O SDZGVFSSLGTJAJ-ZETCQYMHSA-N 0.000 description 1
- SFKCVRLOYOHGFK-ZETCQYMHSA-N (2s)-2-azaniumyl-3-(3,4,5-trifluorophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC(F)=C(F)C(F)=C1 SFKCVRLOYOHGFK-ZETCQYMHSA-N 0.000 description 1
- VWTFNYVAFGYEKI-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(3,4-dimethoxyphenyl)propanoate Chemical compound COC1=CC=C(C[C@H](N)C(O)=O)C=C1OC VWTFNYVAFGYEKI-QMMMGPOBSA-N 0.000 description 1
- YTHDRUZHNYKZGF-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(3-nitrophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=CC([N+]([O-])=O)=C1 YTHDRUZHNYKZGF-QMMMGPOBSA-N 0.000 description 1
- DFGNDJBYANKHIO-INIZCTEOSA-N (2s)-2-azaniumyl-3-(5-phenylmethoxy-1h-indol-3-yl)propanoate Chemical compound C1=C2C(C[C@H]([NH3+])C([O-])=O)=CNC2=CC=C1OCC1=CC=CC=C1 DFGNDJBYANKHIO-INIZCTEOSA-N 0.000 description 1
- VMMOOBBCGTVDGP-VIFPVBQESA-N (2s)-2-azaniumyl-3-(7-bromo-1h-indol-3-yl)propanoate Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1Br VMMOOBBCGTVDGP-VIFPVBQESA-N 0.000 description 1
- KBOZNJNHBBROHM-JTQLQIEISA-N (2s)-2-azaniumyl-3-(7-methyl-1h-indol-3-yl)propanoate Chemical compound CC1=CC=CC2=C1NC=C2C[C@H]([NH3+])C([O-])=O KBOZNJNHBBROHM-JTQLQIEISA-N 0.000 description 1
- MWHVBFNZTDNYRK-HNNXBMFYSA-N (2s)-2-azaniumyl-3-(7-phenylmethoxy-1h-indol-3-yl)propanoate Chemical compound C1=CC=C2C(C[C@H]([NH3+])C([O-])=O)=CNC2=C1OCC1=CC=CC=C1 MWHVBFNZTDNYRK-HNNXBMFYSA-N 0.000 description 1
- MNHWYCRCODAGAH-ZETCQYMHSA-N (2s)-2-azaniumyl-3-(cyclopenten-1-yl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CCCC1 MNHWYCRCODAGAH-ZETCQYMHSA-N 0.000 description 1
- KDYAKYRBGLKMAK-ZETCQYMHSA-N (2s)-2-azaniumyl-3-cyclopentylpropanoate Chemical compound [O-]C(=O)[C@@H]([NH3+])CC1CCCC1 KDYAKYRBGLKMAK-ZETCQYMHSA-N 0.000 description 1
- FQFVANSXYKWQOT-ZETCQYMHSA-N (2s)-2-azaniumyl-3-pyridin-4-ylpropanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=NC=C1 FQFVANSXYKWQOT-ZETCQYMHSA-N 0.000 description 1
- VULSXQYFUHKBAN-NSHDSACASA-N (2s)-2-azaniumyl-5-(phenylmethoxycarbonylamino)pentanoate Chemical compound OC(=O)[C@@H](N)CCCNC(=O)OCC1=CC=CC=C1 VULSXQYFUHKBAN-NSHDSACASA-N 0.000 description 1
- ZIWHMENIDGOELV-BKLSDQPFSA-N (2s)-4-fluoropyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CC(F)CN1 ZIWHMENIDGOELV-BKLSDQPFSA-N 0.000 description 1
- ZIWHMENIDGOELV-DMTCNVIQSA-N (2s,4r)-4-fluoropyrrolidin-1-ium-2-carboxylate Chemical compound OC(=O)[C@@H]1C[C@@H](F)CN1 ZIWHMENIDGOELV-DMTCNVIQSA-N 0.000 description 1
- GLUJNGJDHCTUJY-RXMQYKEDSA-N (3R)-beta-leucine Chemical compound CC(C)[C@H]([NH3+])CC([O-])=O GLUJNGJDHCTUJY-RXMQYKEDSA-N 0.000 description 1
- DUVVFMLAHWNDJD-VIFPVBQESA-N (3S)-3-Amino-4-(1H-indol-3-yl)butanoic acid Chemical compound C1=CC=C2C(C[C@@H](CC(O)=O)N)=CNC2=C1 DUVVFMLAHWNDJD-VIFPVBQESA-N 0.000 description 1
- OFVBLKINTLPEGH-VIFPVBQESA-N (3S)-3-Amino-4-phenylbutanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=CC=C1 OFVBLKINTLPEGH-VIFPVBQESA-N 0.000 description 1
- BHQCQFFYRZLCQQ-UHFFFAOYSA-N (3alpha,5alpha,7alpha,12alpha)-3,7,12-trihydroxy-cholan-24-oic acid Natural products OC1CC2CC(O)CCC2(C)C2C1C1CCC(C(CCC(O)=O)C)C1(C)C(O)C2 BHQCQFFYRZLCQQ-UHFFFAOYSA-N 0.000 description 1
- FSNCEEGOMTYXKY-SNVBAGLBSA-N (3r)-2,3,4,9-tetrahydro-1h-pyrido[3,4-b]indole-3-carboxylic acid Chemical compound N1C2=CC=CC=C2C2=C1CN[C@@H](C(=O)O)C2 FSNCEEGOMTYXKY-SNVBAGLBSA-N 0.000 description 1
- FGCYUNZSPGBIGH-SECBINFHSA-N (3r)-3-amino-4-(1-benzothiophen-3-yl)butanoic acid Chemical compound C1=CC=C2C(C[C@H](CC(O)=O)N)=CSC2=C1 FGCYUNZSPGBIGH-SECBINFHSA-N 0.000 description 1
- TYJLKWUTGBOOBY-MRVPVSSYSA-N (3r)-3-amino-4-(2,4-dichlorophenyl)butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=C(Cl)C=C1Cl TYJLKWUTGBOOBY-MRVPVSSYSA-N 0.000 description 1
- URIOIHMVAXZFMB-MRVPVSSYSA-N (3r)-3-amino-4-(2-chlorophenyl)butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=CC=C1Cl URIOIHMVAXZFMB-MRVPVSSYSA-N 0.000 description 1
- VAIQDFORVKLNPH-SNVBAGLBSA-N (3r)-3-amino-4-(2-cyanophenyl)butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=CC=C1C#N VAIQDFORVKLNPH-SNVBAGLBSA-N 0.000 description 1
- PBGLTHUKEHCADU-SNVBAGLBSA-N (3r)-3-amino-4-(2-methylphenyl)butanoic acid Chemical compound CC1=CC=CC=C1C[C@@H](N)CC(O)=O PBGLTHUKEHCADU-SNVBAGLBSA-N 0.000 description 1
- MVUQWYZNNRALPX-SSDOTTSWSA-N (3r)-3-amino-4-(3,4-dichlorophenyl)butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=C(Cl)C(Cl)=C1 MVUQWYZNNRALPX-SSDOTTSWSA-N 0.000 description 1
- LYHJWUKHUZUWDC-SSDOTTSWSA-N (3r)-3-amino-4-(3,4-difluorophenyl)butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=C(F)C(F)=C1 LYHJWUKHUZUWDC-SSDOTTSWSA-N 0.000 description 1
- IWIJTZNQNXPKGN-SECBINFHSA-N (3r)-3-amino-4-(3-chlorophenyl)butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=CC(Cl)=C1 IWIJTZNQNXPKGN-SECBINFHSA-N 0.000 description 1
- CSBSIUBNUHRWDO-SNVBAGLBSA-N (3r)-3-amino-4-(3-cyanophenyl)butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=CC(C#N)=C1 CSBSIUBNUHRWDO-SNVBAGLBSA-N 0.000 description 1
- UVEHSQZQGJXLEV-SECBINFHSA-N (3r)-3-amino-4-(3-fluorophenyl)butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=CC(F)=C1 UVEHSQZQGJXLEV-SECBINFHSA-N 0.000 description 1
- SMOOMZALOMCYEF-SNVBAGLBSA-N (3r)-3-amino-4-(3-methylphenyl)butanoic acid Chemical compound CC1=CC=CC(C[C@@H](N)CC(O)=O)=C1 SMOOMZALOMCYEF-SNVBAGLBSA-N 0.000 description 1
- DAUFDZAPQZNOGC-SECBINFHSA-N (3r)-3-amino-4-(4-bromophenyl)butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=C(Br)C=C1 DAUFDZAPQZNOGC-SECBINFHSA-N 0.000 description 1
- LCYHDQUYYVDIPY-SECBINFHSA-N (3r)-3-amino-4-(4-chlorophenyl)butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=C(Cl)C=C1 LCYHDQUYYVDIPY-SECBINFHSA-N 0.000 description 1
- YXRYZOCXTPVLRS-SNVBAGLBSA-N (3r)-3-amino-4-(4-cyanophenyl)butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=C(C#N)C=C1 YXRYZOCXTPVLRS-SNVBAGLBSA-N 0.000 description 1
- MWAZHPYPJNEKID-SECBINFHSA-N (3r)-3-amino-4-(4-fluorophenyl)butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=C(F)C=C1 MWAZHPYPJNEKID-SECBINFHSA-N 0.000 description 1
- JZJBJZHUZJDMMU-SECBINFHSA-N (3r)-3-amino-4-(4-iodophenyl)butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=C(I)C=C1 JZJBJZHUZJDMMU-SECBINFHSA-N 0.000 description 1
- OCNPVFDANAYUCR-SNVBAGLBSA-N (3r)-3-amino-4-(4-methylphenyl)butanoic acid Chemical compound CC1=CC=C(C[C@@H](N)CC(O)=O)C=C1 OCNPVFDANAYUCR-SNVBAGLBSA-N 0.000 description 1
- VPYQIUMVXMMGSD-MRVPVSSYSA-N (3r)-3-amino-4-[2-(trifluoromethyl)phenyl]butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=CC=C1C(F)(F)F VPYQIUMVXMMGSD-MRVPVSSYSA-N 0.000 description 1
- UUVNRBNPVFBPTH-SECBINFHSA-N (3r)-3-amino-4-[3-(trifluoromethyl)phenyl]butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=CC(C(F)(F)F)=C1 UUVNRBNPVFBPTH-SECBINFHSA-N 0.000 description 1
- RCVBUWYXFGWFHR-SECBINFHSA-N (3r)-3-amino-4-[4-(trifluoromethyl)phenyl]butanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=C(C(F)(F)F)C=C1 RCVBUWYXFGWFHR-SECBINFHSA-N 0.000 description 1
- VEJIDCKYNSOIIN-GFCCVEGCSA-N (3r)-3-amino-4-naphthalen-1-ylbutanoic acid Chemical compound C1=CC=C2C(C[C@H](CC(O)=O)N)=CC=CC2=C1 VEJIDCKYNSOIIN-GFCCVEGCSA-N 0.000 description 1
- WSVMIVFELRCSPA-CYBMUJFWSA-N (3r)-3-amino-4-naphthalen-2-ylbutanoic acid Chemical compound C1=CC=CC2=CC(C[C@H](CC(O)=O)N)=CC=C21 WSVMIVFELRCSPA-CYBMUJFWSA-N 0.000 description 1
- OODABKPTGCZGHL-MRVPVSSYSA-N (3r)-3-amino-4-pyridin-3-ylbutanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=CN=C1 OODABKPTGCZGHL-MRVPVSSYSA-N 0.000 description 1
- HPMMXBBRJNNDBV-MRVPVSSYSA-N (3r)-3-amino-4-pyridin-4-ylbutanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=NC=C1 HPMMXBBRJNNDBV-MRVPVSSYSA-N 0.000 description 1
- AZWUDBISUBOQFK-SSDOTTSWSA-N (3r)-3-amino-4-thiophen-3-ylbutanoic acid Chemical compound OC(=O)C[C@H](N)CC=1C=CSC=1 AZWUDBISUBOQFK-SSDOTTSWSA-N 0.000 description 1
- UEMNCMYSSFWTCS-RXMQYKEDSA-N (3r)-3-aminohex-5-enoic acid Chemical compound C=CC[C@@H](N)CC(O)=O UEMNCMYSSFWTCS-RXMQYKEDSA-N 0.000 description 1
- DWFMCQGMVSIJBN-RXMQYKEDSA-N (3r)-3-aminohex-5-ynoic acid Chemical compound C#CC[C@@H](N)CC(O)=O DWFMCQGMVSIJBN-RXMQYKEDSA-N 0.000 description 1
- UHBYWPGGCSDKFX-GSVOUGTGSA-N (3r)-3-aminopropane-1,1,3-tricarboxylic acid Chemical compound OC(=O)[C@H](N)CC(C(O)=O)C(O)=O UHBYWPGGCSDKFX-GSVOUGTGSA-N 0.000 description 1
- SMTCEKUITUZDPM-MRVPVSSYSA-N (3r)-3-azaniumyl-4-(4-nitrophenyl)butanoate Chemical compound OC(=O)C[C@H](N)CC1=CC=C([N+]([O-])=O)C=C1 SMTCEKUITUZDPM-MRVPVSSYSA-N 0.000 description 1
- LRHQHHDPWZCVTR-LURJTMIESA-N (3r)-3-azaniumyl-4-thiophen-2-ylbutanoate Chemical compound OC(=O)C[C@@H](N)CC1=CC=CS1 LRHQHHDPWZCVTR-LURJTMIESA-N 0.000 description 1
- JHEDYGILOIBOTL-NTSWFWBYSA-N (3r,4s)-3-azaniumyl-4-methylhexanoate Chemical compound CC[C@H](C)[C@H]([NH3+])CC([O-])=O JHEDYGILOIBOTL-NTSWFWBYSA-N 0.000 description 1
- FSNCEEGOMTYXKY-JTQLQIEISA-N (3s)-2,3,4,9-tetrahydro-1h-pyrido[3,4-b]indole-3-carboxylic acid Chemical compound N1C2=CC=CC=C2C2=C1CN[C@H](C(=O)O)C2 FSNCEEGOMTYXKY-JTQLQIEISA-N 0.000 description 1
- TYJLKWUTGBOOBY-QMMMGPOBSA-N (3s)-3-amino-4-(2,4-dichlorophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=C(Cl)C=C1Cl TYJLKWUTGBOOBY-QMMMGPOBSA-N 0.000 description 1
- URIOIHMVAXZFMB-QMMMGPOBSA-N (3s)-3-amino-4-(2-chlorophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=CC=C1Cl URIOIHMVAXZFMB-QMMMGPOBSA-N 0.000 description 1
- VAIQDFORVKLNPH-JTQLQIEISA-N (3s)-3-amino-4-(2-cyanophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=CC=C1C#N VAIQDFORVKLNPH-JTQLQIEISA-N 0.000 description 1
- CTZJKXPNBFSWAK-QMMMGPOBSA-N (3s)-3-amino-4-(2-fluorophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=CC=C1F CTZJKXPNBFSWAK-QMMMGPOBSA-N 0.000 description 1
- PBGLTHUKEHCADU-JTQLQIEISA-N (3s)-3-amino-4-(2-methylphenyl)butanoic acid Chemical compound CC1=CC=CC=C1C[C@H](N)CC(O)=O PBGLTHUKEHCADU-JTQLQIEISA-N 0.000 description 1
- MVUQWYZNNRALPX-ZETCQYMHSA-N (3s)-3-amino-4-(3,4-dichlorophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=C(Cl)C(Cl)=C1 MVUQWYZNNRALPX-ZETCQYMHSA-N 0.000 description 1
- LYHJWUKHUZUWDC-ZETCQYMHSA-N (3s)-3-amino-4-(3,4-difluorophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=C(F)C(F)=C1 LYHJWUKHUZUWDC-ZETCQYMHSA-N 0.000 description 1
- IWIJTZNQNXPKGN-VIFPVBQESA-N (3s)-3-amino-4-(3-chlorophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=CC(Cl)=C1 IWIJTZNQNXPKGN-VIFPVBQESA-N 0.000 description 1
- CSBSIUBNUHRWDO-JTQLQIEISA-N (3s)-3-amino-4-(3-cyanophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=CC(C#N)=C1 CSBSIUBNUHRWDO-JTQLQIEISA-N 0.000 description 1
- UVEHSQZQGJXLEV-VIFPVBQESA-N (3s)-3-amino-4-(3-fluorophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=CC(F)=C1 UVEHSQZQGJXLEV-VIFPVBQESA-N 0.000 description 1
- SMOOMZALOMCYEF-JTQLQIEISA-N (3s)-3-amino-4-(3-methylphenyl)butanoic acid Chemical compound CC1=CC=CC(C[C@H](N)CC(O)=O)=C1 SMOOMZALOMCYEF-JTQLQIEISA-N 0.000 description 1
- DAUFDZAPQZNOGC-VIFPVBQESA-N (3s)-3-amino-4-(4-bromophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=C(Br)C=C1 DAUFDZAPQZNOGC-VIFPVBQESA-N 0.000 description 1
- LCYHDQUYYVDIPY-VIFPVBQESA-N (3s)-3-amino-4-(4-chlorophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=C(Cl)C=C1 LCYHDQUYYVDIPY-VIFPVBQESA-N 0.000 description 1
- YXRYZOCXTPVLRS-JTQLQIEISA-N (3s)-3-amino-4-(4-cyanophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=C(C#N)C=C1 YXRYZOCXTPVLRS-JTQLQIEISA-N 0.000 description 1
- MWAZHPYPJNEKID-VIFPVBQESA-N (3s)-3-amino-4-(4-fluorophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=C(F)C=C1 MWAZHPYPJNEKID-VIFPVBQESA-N 0.000 description 1
- JZJBJZHUZJDMMU-VIFPVBQESA-N (3s)-3-amino-4-(4-iodophenyl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=C(I)C=C1 JZJBJZHUZJDMMU-VIFPVBQESA-N 0.000 description 1
- OCNPVFDANAYUCR-JTQLQIEISA-N (3s)-3-amino-4-(4-methylphenyl)butanoic acid Chemical compound CC1=CC=C(C[C@H](N)CC(O)=O)C=C1 OCNPVFDANAYUCR-JTQLQIEISA-N 0.000 description 1
- ZIAIKPBTLUWDMG-LURJTMIESA-N (3s)-3-amino-4-(furan-2-yl)butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=CO1 ZIAIKPBTLUWDMG-LURJTMIESA-N 0.000 description 1
- VPYQIUMVXMMGSD-QMMMGPOBSA-N (3s)-3-amino-4-[2-(trifluoromethyl)phenyl]butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=CC=C1C(F)(F)F VPYQIUMVXMMGSD-QMMMGPOBSA-N 0.000 description 1
- UUVNRBNPVFBPTH-VIFPVBQESA-N (3s)-3-amino-4-[3-(trifluoromethyl)phenyl]butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=CC(C(F)(F)F)=C1 UUVNRBNPVFBPTH-VIFPVBQESA-N 0.000 description 1
- RCVBUWYXFGWFHR-VIFPVBQESA-N (3s)-3-amino-4-[4-(trifluoromethyl)phenyl]butanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=C(C(F)(F)F)C=C1 RCVBUWYXFGWFHR-VIFPVBQESA-N 0.000 description 1
- VEJIDCKYNSOIIN-LBPRGKRZSA-N (3s)-3-amino-4-naphthalen-1-ylbutanoic acid Chemical compound C1=CC=C2C(C[C@@H](CC(O)=O)N)=CC=CC2=C1 VEJIDCKYNSOIIN-LBPRGKRZSA-N 0.000 description 1
- WSVMIVFELRCSPA-ZDUSSCGKSA-N (3s)-3-amino-4-naphthalen-2-ylbutanoic acid Chemical compound C1=CC=CC2=CC(C[C@@H](CC(O)=O)N)=CC=C21 WSVMIVFELRCSPA-ZDUSSCGKSA-N 0.000 description 1
- OODABKPTGCZGHL-QMMMGPOBSA-N (3s)-3-amino-4-pyridin-3-ylbutanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=CN=C1 OODABKPTGCZGHL-QMMMGPOBSA-N 0.000 description 1
- HPMMXBBRJNNDBV-QMMMGPOBSA-N (3s)-3-amino-4-pyridin-4-ylbutanoic acid Chemical compound OC(=O)C[C@@H](N)CC1=CC=NC=C1 HPMMXBBRJNNDBV-QMMMGPOBSA-N 0.000 description 1
- LRHQHHDPWZCVTR-ZCFIWIBFSA-N (3s)-3-amino-4-thiophen-2-ylbutanoic acid Chemical compound OC(=O)C[C@H](N)CC1=CC=CS1 LRHQHHDPWZCVTR-ZCFIWIBFSA-N 0.000 description 1
- AZWUDBISUBOQFK-ZETCQYMHSA-N (3s)-3-amino-4-thiophen-3-ylbutanoic acid Chemical compound OC(=O)C[C@@H](N)CC=1C=CSC=1 AZWUDBISUBOQFK-ZETCQYMHSA-N 0.000 description 1
- CJJYCYZKUNRKFP-JTQLQIEISA-N (3s)-3-amino-5-phenylpentanoic acid Chemical compound OC(=O)C[C@@H](N)CCC1=CC=CC=C1 CJJYCYZKUNRKFP-JTQLQIEISA-N 0.000 description 1
- BYMYELCZQGMMKN-NSHDSACASA-N (3s)-3-amino-6-phenylhex-5-enoic acid Chemical compound OC(=O)C[C@@H](N)CC=CC1=CC=CC=C1 BYMYELCZQGMMKN-NSHDSACASA-N 0.000 description 1
- OQEBBZSWEGYTPG-VKHMYHEASA-N (3s)-3-aminobutanoic acid Chemical compound C[C@H](N)CC(O)=O OQEBBZSWEGYTPG-VKHMYHEASA-N 0.000 description 1
- UEMNCMYSSFWTCS-YFKPBYRVSA-N (3s)-3-aminohex-5-enoic acid Chemical compound C=CC[C@H](N)CC(O)=O UEMNCMYSSFWTCS-YFKPBYRVSA-N 0.000 description 1
- DWFMCQGMVSIJBN-YFKPBYRVSA-N (3s)-3-aminohex-5-ynoic acid Chemical compound C#CC[C@H](N)CC(O)=O DWFMCQGMVSIJBN-YFKPBYRVSA-N 0.000 description 1
- SMTCEKUITUZDPM-QMMMGPOBSA-N (3s)-3-azaniumyl-4-(4-nitrophenyl)butanoate Chemical compound OC(=O)C[C@@H](N)CC1=CC=C([N+]([O-])=O)C=C1 SMTCEKUITUZDPM-QMMMGPOBSA-N 0.000 description 1
- 125000004400 (C1-C12) alkyl group Chemical group 0.000 description 1
- UJOYFRCOTPUKAK-MRVPVSSYSA-N (R)-3-ammonio-3-phenylpropanoate Chemical compound OC(=O)C[C@@H](N)C1=CC=CC=C1 UJOYFRCOTPUKAK-MRVPVSSYSA-N 0.000 description 1
- VWTFNYVAFGYEKI-UHFFFAOYSA-N (S)-3,4-dimethoxyphenylalanine Natural products COC1=CC=C(CC(N)C(O)=O)C=C1OC VWTFNYVAFGYEKI-UHFFFAOYSA-N 0.000 description 1
- UJOYFRCOTPUKAK-QMMMGPOBSA-N (S)-3-ammonio-3-phenylpropanoate Chemical compound OC(=O)C[C@H](N)C1=CC=CC=C1 UJOYFRCOTPUKAK-QMMMGPOBSA-N 0.000 description 1
- XJLSEXAGTJCILF-YFKPBYRVSA-N (S)-nipecotic acid Chemical compound OC(=O)[C@H]1CCCNC1 XJLSEXAGTJCILF-YFKPBYRVSA-N 0.000 description 1
- BWKMGYQJPOAASG-UHFFFAOYSA-N 1,2,3,4-tetrahydroisoquinoline-3-carboxylic acid Chemical compound C1=CC=C2CNC(C(=O)O)CC2=C1 BWKMGYQJPOAASG-UHFFFAOYSA-N 0.000 description 1
- 238000011925 1,2-addition Methods 0.000 description 1
- WWJWZQKUDYKLTK-UHFFFAOYSA-N 1,n6-ethenoadenine Chemical compound C1=NC2=NC=N[C]2C2=NC=CN21 WWJWZQKUDYKLTK-UHFFFAOYSA-N 0.000 description 1
- KNLNWXXWKDEEFW-JIOCBJNQSA-N 1-[(1r,4s,6r,7s)-7-hydroxy-4-(hydroxymethyl)-2,5-dioxabicyclo[2.2.1]heptan-6-yl]pyrimidine-2,4-dione Chemical compound N1([C@@H]2O[C@]3(CO[C@@]2([C@@H]3O)[H])CO)C=CC(=O)NC1=O KNLNWXXWKDEEFW-JIOCBJNQSA-N 0.000 description 1
- VUFVGYBIFMCJPB-UHFFFAOYSA-N 1-iodopyrimidine-2,4-dione Chemical compound IN1C=CC(=O)NC1=O VUFVGYBIFMCJPB-UHFFFAOYSA-N 0.000 description 1
- ZADWXFSZEAPBJS-JTQLQIEISA-N 1-methyl-L-tryptophan Chemical compound C1=CC=C2N(C)C=C(C[C@H](N)C(O)=O)C2=C1 ZADWXFSZEAPBJS-JTQLQIEISA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- QFGCFKJIPBRJGM-UHFFFAOYSA-N 12-[(2-methylpropan-2-yl)oxy]-12-oxododecanoic acid Chemical compound CC(C)(C)OC(=O)CCCCCCCCCCC(O)=O QFGCFKJIPBRJGM-UHFFFAOYSA-N 0.000 description 1
- 108020004463 18S ribosomal RNA Proteins 0.000 description 1
- APXRHPDHORGIEB-UHFFFAOYSA-N 1H-pyrazolo[4,3-d]pyrimidine Chemical class N1=CN=C2C=NNC2=C1 APXRHPDHORGIEB-UHFFFAOYSA-N 0.000 description 1
- RFCQJGFZUQFYRF-UHFFFAOYSA-N 2'-O-Methylcytidine Natural products COC1C(O)C(CO)OC1N1C(=O)N=C(N)C=C1 RFCQJGFZUQFYRF-UHFFFAOYSA-N 0.000 description 1
- RFCQJGFZUQFYRF-ZOQUXTDFSA-N 2'-O-methylcytidine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=C(N)C=C1 RFCQJGFZUQFYRF-ZOQUXTDFSA-N 0.000 description 1
- SXUXMRMBWZCMEN-ZOQUXTDFSA-N 2'-O-methyluridine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 SXUXMRMBWZCMEN-ZOQUXTDFSA-N 0.000 description 1
- OMGHIGVFLOPEHJ-UHFFFAOYSA-N 2,5-dihydro-1h-pyrrol-1-ium-2-carboxylate Chemical compound OC(=O)C1NCC=C1 OMGHIGVFLOPEHJ-UHFFFAOYSA-N 0.000 description 1
- OVWDBMBPUMMLCA-UHFFFAOYSA-N 2-(1,3-thiazol-2-ylamino)acetic acid Chemical compound OC(=O)CNC1=NC=CS1 OVWDBMBPUMMLCA-UHFFFAOYSA-N 0.000 description 1
- AOTQGWFNFTVXNQ-UHFFFAOYSA-N 2-(1-adamantyl)acetic acid Chemical compound C1C(C2)CC3CC2CC1(CC(=O)O)C3 AOTQGWFNFTVXNQ-UHFFFAOYSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical compound NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- DRMOCHGNKTXIBF-UHFFFAOYSA-N 2-(2-methoxyanilino)acetic acid Chemical compound COC1=CC=CC=C1NCC(O)=O DRMOCHGNKTXIBF-UHFFFAOYSA-N 0.000 description 1
- DYPOHVRBXIPFIK-UHFFFAOYSA-N 2-(2-methylanilino)acetic acid Chemical compound CC1=CC=CC=C1NCC(O)=O DYPOHVRBXIPFIK-UHFFFAOYSA-N 0.000 description 1
- RNPIGVYXWNTGGB-UHFFFAOYSA-N 2-(benzylamino)-4-sulfanylbutanoic acid Chemical compound SCCC(C(=O)O)NCC1=CC=CC=C1 RNPIGVYXWNTGGB-UHFFFAOYSA-N 0.000 description 1
- UNQHGXLQKSZYQU-UHFFFAOYSA-N 2-(thiophen-2-ylamino)acetic acid Chemical compound OC(=O)CNC1=CC=CS1 UNQHGXLQKSZYQU-UHFFFAOYSA-N 0.000 description 1
- CVZZNRXMDCOHBG-QMMMGPOBSA-N 2-Chloro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1Cl CVZZNRXMDCOHBG-QMMMGPOBSA-N 0.000 description 1
- QYYIBCOJRFOBDJ-SNVBAGLBSA-N 2-[(3r)-1,2,3,4-tetrahydroisoquinolin-3-yl]acetic acid Chemical compound C1=CC=C2CN[C@@H](CC(=O)O)CC2=C1 QYYIBCOJRFOBDJ-SNVBAGLBSA-N 0.000 description 1
- QYYIBCOJRFOBDJ-JTQLQIEISA-N 2-[(3s)-1,2,3,4-tetrahydroisoquinolin-3-yl]acetic acid Chemical compound C1=CC=C2CN[C@H](CC(=O)O)CC2=C1 QYYIBCOJRFOBDJ-JTQLQIEISA-N 0.000 description 1
- INIGODASXCUILV-UHFFFAOYSA-N 2-amino-2-(2,4-dinitrophenyl)acetic acid Chemical compound OC(=O)C(N)C1=CC=C([N+]([O-])=O)C=C1[N+]([O-])=O INIGODASXCUILV-UHFFFAOYSA-N 0.000 description 1
- XYZVTJQQUFLMJY-UHFFFAOYSA-N 2-amino-2-methoxyacetic acid Chemical compound COC(N)C(O)=O XYZVTJQQUFLMJY-UHFFFAOYSA-N 0.000 description 1
- VHVGNTVUSQUXPS-UHFFFAOYSA-N 2-amino-3-hydroxy-3-phenylpropanoic acid Chemical compound OC(=O)C(N)C(O)C1=CC=CC=C1 VHVGNTVUSQUXPS-UHFFFAOYSA-N 0.000 description 1
- XHBSBNYEHDQRCP-UHFFFAOYSA-N 2-amino-3-methyl-3,7-dihydro-6H-purin-6-one Chemical compound O=C1NC(=N)N(C)C2=C1N=CN2 XHBSBNYEHDQRCP-UHFFFAOYSA-N 0.000 description 1
- SCZIJGBDOGSCKY-UHFFFAOYSA-N 2-amino-6-(cyclooct-2-yn-1-yloxycarbonylamino)hexanoic acid Chemical compound OC(=O)C(N)CCCCNC(=O)OC1CCCCCC#C1 SCZIJGBDOGSCKY-UHFFFAOYSA-N 0.000 description 1
- JYEVZNBYATWOFD-UHFFFAOYSA-N 2-amino-6-[(2-azidocyclopentyl)oxycarbonylamino]hexanoic acid Chemical compound NC(CCCCNC(=O)OC1CCCC1N=[N+]=[N-])C(O)=O JYEVZNBYATWOFD-UHFFFAOYSA-N 0.000 description 1
- WORDWOPJMYWZSB-UHFFFAOYSA-N 2-amino-6-[(2-nitrophenyl)methoxycarbonylamino]hexanoic acid Chemical compound OC(=O)C(N)CCCCNC(=O)OCC1=CC=CC=C1[N+]([O-])=O WORDWOPJMYWZSB-UHFFFAOYSA-N 0.000 description 1
- LJLCMMNKTZXLLX-YGPZHTELSA-N 2-amino-6-[[(2r)-oxolane-2-carbonyl]amino]hexanoic acid Chemical compound OC(=O)C(N)CCCCNC(=O)[C@H]1CCCO1 LJLCMMNKTZXLLX-YGPZHTELSA-N 0.000 description 1
- AKVBCGQVQXPRLD-UHFFFAOYSA-N 2-aminooctanoic acid Chemical compound CCCCCCC(N)C(O)=O AKVBCGQVQXPRLD-UHFFFAOYSA-N 0.000 description 1
- PDRJLZDUOULRHE-ZETCQYMHSA-N 2-aza-L-phenylalanine Natural products OC(=O)[C@@H](N)CC1=CC=CC=N1 PDRJLZDUOULRHE-ZETCQYMHSA-N 0.000 description 1
- CGNMJIBUVDGMIY-UHFFFAOYSA-N 2-azaniumyl-2-(2-fluorophenyl)acetate Chemical compound OC(=O)C(N)C1=CC=CC=C1F CGNMJIBUVDGMIY-UHFFFAOYSA-N 0.000 description 1
- XLMSKXASROPJNG-UHFFFAOYSA-N 2-azaniumyl-2-thiophen-2-ylacetate Chemical compound OC(=O)C(N)C1=CC=CS1 XLMSKXASROPJNG-UHFFFAOYSA-N 0.000 description 1
- FDKWRPBBCBCIGA-UHFFFAOYSA-N 2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]CC(N)C(O)=O FDKWRPBBCBCIGA-UHFFFAOYSA-N 0.000 description 1
- GWHQTNKPTXDNRM-UHFFFAOYSA-N 2-azaniumyl-3-(2,4-dichlorophenyl)propanoate Chemical compound OC(=O)C(N)CC1=CC=C(Cl)C=C1Cl GWHQTNKPTXDNRM-UHFFFAOYSA-N 0.000 description 1
- TYHSKOHNTPEOPS-UHFFFAOYSA-N 2-azaniumyl-3-(3-methoxyphenyl)-2-methylpropanoate Chemical compound COC1=CC=CC(CC(C)(N)C(O)=O)=C1 TYHSKOHNTPEOPS-UHFFFAOYSA-N 0.000 description 1
- LULHTUNPBBMNSJ-UHFFFAOYSA-N 2-azaniumyl-3-ethoxybutanoate Chemical compound CCOC(C)C(N)C(O)=O LULHTUNPBBMNSJ-UHFFFAOYSA-N 0.000 description 1
- AFGCRUGTZPDWSF-UHFFFAOYSA-N 2-azaniumyl-3-ethoxypropanoate Chemical compound CCOCC(N)C(O)=O AFGCRUGTZPDWSF-UHFFFAOYSA-N 0.000 description 1
- ZFUKCHCGMBNYHH-UHFFFAOYSA-N 2-azaniumyl-3-fluoro-3-methylbutanoate Chemical compound CC(C)(F)C(N)C(O)=O ZFUKCHCGMBNYHH-UHFFFAOYSA-N 0.000 description 1
- FYCWLJLGIAUCCL-UHFFFAOYSA-N 2-azaniumyl-3-methoxybutanoate Chemical compound COC(C)C(N)C(O)=O FYCWLJLGIAUCCL-UHFFFAOYSA-N 0.000 description 1
- MXHKOHWUQAULOV-UHFFFAOYSA-N 2-azaniumyl-4-cyclohexylbutanoate Chemical compound OC(=O)C(N)CCC1CCCCC1 MXHKOHWUQAULOV-UHFFFAOYSA-N 0.000 description 1
- ZHGGYCNHXLZKHG-UHFFFAOYSA-N 2-azaniumyl-6-(cyclopentyloxycarbonylamino)hexanoate Chemical compound OC(=O)C(N)CCCCNC(=O)OC1CCCC1 ZHGGYCNHXLZKHG-UHFFFAOYSA-N 0.000 description 1
- CKGCFBNYQJDIGS-UHFFFAOYSA-N 2-azaniumyl-6-(phenylmethoxycarbonylamino)hexanoate Chemical compound OC(=O)C(N)CCCCNC(=O)OCC1=CC=CC=C1 CKGCFBNYQJDIGS-UHFFFAOYSA-N 0.000 description 1
- XMTCOKGMBIHVBJ-UHFFFAOYSA-N 2-azaniumyl-6-[(4-nitrophenyl)methoxycarbonylamino]hexanoate Chemical compound OC(=O)C(N)CCCCNC(=O)OCC1=CC=C([N+]([O-])=O)C=C1 XMTCOKGMBIHVBJ-UHFFFAOYSA-N 0.000 description 1
- USQHEVWOPJDAAX-UHFFFAOYSA-N 2-azaniumylcyclohexane-1-carboxylate Chemical compound NC1CCCCC1C(O)=O USQHEVWOPJDAAX-UHFFFAOYSA-N 0.000 description 1
- NYCRCTMDYITATC-MRVPVSSYSA-N 2-fluoro-D-phenylalanine Chemical compound OC(=O)[C@H](N)CC1=CC=CC=C1F NYCRCTMDYITATC-MRVPVSSYSA-N 0.000 description 1
- NYCRCTMDYITATC-QMMMGPOBSA-N 2-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1F NYCRCTMDYITATC-QMMMGPOBSA-N 0.000 description 1
- WAVYAFBQOXCGSZ-UHFFFAOYSA-N 2-fluoropyrimidine Chemical compound FC1=NC=CC=N1 WAVYAFBQOXCGSZ-UHFFFAOYSA-N 0.000 description 1
- 125000000954 2-hydroxyethyl group Chemical group [H]C([*])([H])C([H])([H])O[H] 0.000 description 1
- CDUUKBXTEOFITR-BYPYZUCNSA-N 2-methyl-L-serine Chemical compound OC[C@@]([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-BYPYZUCNSA-N 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- IVHXFTPBEDNBIH-UHFFFAOYSA-N 2h-triazole;azide Chemical compound [N-]=[N+]=[N-].C1=CNN=N1 IVHXFTPBEDNBIH-UHFFFAOYSA-N 0.000 description 1
- NYPYHUZRZVSYKL-ZETCQYMHSA-N 3,5-diiodo-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC(I)=C(O)C(I)=C1 NYPYHUZRZVSYKL-ZETCQYMHSA-N 0.000 description 1
- JPZXHKDZASGCLU-GFCCVEGCSA-N 3-(2-Naphthyl)-D-Alanine Chemical compound C1=CC=CC2=CC(C[C@@H](N)C(O)=O)=CC=C21 JPZXHKDZASGCLU-GFCCVEGCSA-N 0.000 description 1
- PFDUUKDQEHURQC-ZETCQYMHSA-N 3-O-methyldopa Chemical compound COC1=CC(C[C@H](N)C(O)=O)=CC=C1O PFDUUKDQEHURQC-ZETCQYMHSA-N 0.000 description 1
- RLYAXKJHJUXZOT-UHFFFAOYSA-N 3-amino-3-(3-bromophenyl)propanoic acid Chemical compound OC(=O)CC(N)C1=CC=CC(Br)=C1 RLYAXKJHJUXZOT-UHFFFAOYSA-N 0.000 description 1
- NYTANCDDCQVQHG-UHFFFAOYSA-N 3-amino-3-(4-methoxyphenyl)propanoic acid Chemical compound COC1=CC=C(C(N)CC(O)=O)C=C1 NYTANCDDCQVQHG-UHFFFAOYSA-N 0.000 description 1
- GYAYLYLPTPXESE-UHFFFAOYSA-N 3-amino-3-thiophen-2-ylpropanoic acid Chemical compound OC(=O)CC(N)C1=CC=CS1 GYAYLYLPTPXESE-UHFFFAOYSA-N 0.000 description 1
- XABCFXXGZPWJQP-UHFFFAOYSA-N 3-aminoadipic acid Chemical compound OC(=O)CC(N)CCC(O)=O XABCFXXGZPWJQP-UHFFFAOYSA-N 0.000 description 1
- BXGDBHAMTMMNTO-UHFFFAOYSA-N 3-azaniumyl-3-(4-chlorophenyl)propanoate Chemical compound OC(=O)CC(N)C1=CC=C(Cl)C=C1 BXGDBHAMTMMNTO-UHFFFAOYSA-N 0.000 description 1
- ASBJGPTTYPEMLP-REOHCLBHSA-N 3-chloro-L-alanine Chemical compound ClC[C@H]([NH3+])C([O-])=O ASBJGPTTYPEMLP-REOHCLBHSA-N 0.000 description 1
- JJDJLFDGCUYZMN-QMMMGPOBSA-N 3-chloro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(Cl)=C1 JJDJLFDGCUYZMN-QMMMGPOBSA-N 0.000 description 1
- ACWBBAGYTKWBCD-ZETCQYMHSA-N 3-chloro-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(Cl)=C1 ACWBBAGYTKWBCD-ZETCQYMHSA-N 0.000 description 1
- BXRLWGXPSRYJDZ-VKHMYHEASA-N 3-cyano-L-alanine Chemical compound OC(=O)[C@@H](N)CC#N BXRLWGXPSRYJDZ-VKHMYHEASA-N 0.000 description 1
- VIIAUOZUUGXERI-ZETCQYMHSA-N 3-fluoro-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(F)=C1 VIIAUOZUUGXERI-ZETCQYMHSA-N 0.000 description 1
- ZPBYVFQJHWLTFB-UHFFFAOYSA-N 3-methyl-7H-purin-6-imine Chemical compound CN1C=NC(=N)C2=C1NC=N2 ZPBYVFQJHWLTFB-UHFFFAOYSA-N 0.000 description 1
- 108010034927 3-methyladenine-DNA glycosylase Proteins 0.000 description 1
- CMUHFUGDYMFHEI-MRVPVSSYSA-N 4-amino-D-phenylalanine Chemical compound OC(=O)[C@H](N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-MRVPVSSYSA-N 0.000 description 1
- NIGWMJHCCYYCSF-QMMMGPOBSA-N 4-chloro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Cl)C=C1 NIGWMJHCCYYCSF-QMMMGPOBSA-N 0.000 description 1
- XWHHYOYVRVGJJY-QMMMGPOBSA-N 4-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-QMMMGPOBSA-N 0.000 description 1
- PZNQZSRPDOEBMS-MRVPVSSYSA-N 4-iodo-D-phenylalanine Chemical compound OC(=O)[C@H](N)CC1=CC=C(I)C=C1 PZNQZSRPDOEBMS-MRVPVSSYSA-N 0.000 description 1
- XFGVJLGVINCWDP-UHFFFAOYSA-N 5,5,5-trifluoroleucine Chemical compound FC(F)(F)C(C)CC(N)C(O)=O XFGVJLGVINCWDP-UHFFFAOYSA-N 0.000 description 1
- 102000011848 5-Methyltetrahydrofolate-Homocysteine S-Methyltransferase Human genes 0.000 description 1
- 108010075604 5-Methyltetrahydrofolate-Homocysteine S-Methyltransferase Proteins 0.000 description 1
- ZFTBZKVVGZNMJR-UHFFFAOYSA-N 5-chlorouracil Chemical compound ClC1=CNC(=O)NC1=O ZFTBZKVVGZNMJR-UHFFFAOYSA-N 0.000 description 1
- JDBGXEHEIRGOBU-UHFFFAOYSA-N 5-hydroxymethyluracil Chemical compound OCC1=CNC(=O)NC1=O JDBGXEHEIRGOBU-UHFFFAOYSA-N 0.000 description 1
- KSNXJLQDQOIRIP-UHFFFAOYSA-N 5-iodouracil Chemical compound IC1=CNC(=O)NC1=O KSNXJLQDQOIRIP-UHFFFAOYSA-N 0.000 description 1
- KVNPSKDDJARYKK-JTQLQIEISA-N 5-methoxytryptophan Chemical compound COC1=CC=C2NC=C(C[C@H](N)C(O)=O)C2=C1 KVNPSKDDJARYKK-JTQLQIEISA-N 0.000 description 1
- HUNCSWANZMJLPM-UHFFFAOYSA-N 5-methyltryptophan Chemical compound CC1=CC=C2NC=C(CC(N)C(O)=O)C2=C1 HUNCSWANZMJLPM-UHFFFAOYSA-N 0.000 description 1
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 1
- QFVKLKDEXOWFSL-UHFFFAOYSA-N 6-amino-5-bromo-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1Br QFVKLKDEXOWFSL-UHFFFAOYSA-N 0.000 description 1
- UFVWJVAMULFOMC-UHFFFAOYSA-N 6-amino-5-iodo-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1I UFVWJVAMULFOMC-UHFFFAOYSA-N 0.000 description 1
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 1
- FICLVQOYKYBXFN-SECBINFHSA-N 6-chloro-D-tryptophan zwitterion Chemical compound ClC1=CC=C2C(C[C@@H](N)C(O)=O)=CNC2=C1 FICLVQOYKYBXFN-SECBINFHSA-N 0.000 description 1
- YLKRUSPZOTYMAT-YFKPBYRVSA-N 6-hydroxy-L-dopa Chemical compound OC(=O)[C@@H](N)CC1=CC(O)=C(O)C=C1O YLKRUSPZOTYMAT-YFKPBYRVSA-N 0.000 description 1
- SHZGCJCMOBCMKK-UHFFFAOYSA-N 6-methyloxane-2,3,4,5-tetrol Chemical compound CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 1
- CLGFIVUFZRGQRP-UHFFFAOYSA-N 7,8-dihydro-8-oxoguanine Chemical compound O=C1NC(N)=NC2=C1NC(=O)N2 CLGFIVUFZRGQRP-UHFFFAOYSA-N 0.000 description 1
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 1
- 208000035657 Abasia Diseases 0.000 description 1
- 241001114518 Acaulium acremonium Species 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 102100038740 Activator of RNA decay Human genes 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241000224489 Amoeba Species 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 241000400328 Arachniotus Species 0.000 description 1
- 241000945147 Arachniotus flavoluteus Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 102100023927 Asparagine synthetase [glutamine-hydrolyzing] Human genes 0.000 description 1
- 108010070255 Aspartate-ammonia ligase Proteins 0.000 description 1
- 241000228197 Aspergillus flavus Species 0.000 description 1
- 241001225321 Aspergillus fumigatus Species 0.000 description 1
- 241000351920 Aspergillus nidulans Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 241000223651 Aureobasidium Species 0.000 description 1
- 241000223678 Aureobasidium pullulans Species 0.000 description 1
- 241001465196 Auxarthron Species 0.000 description 1
- 241000183751 Auxarthron thaxteri Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000537222 Betabaculovirus Species 0.000 description 1
- 241000335423 Blastomyces Species 0.000 description 1
- 241000228405 Blastomyces dermatitidis Species 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- GRRGXEAFBPMUKG-NSHDSACASA-N C1=CC11CC(C1)COC(=O)NCCCC[C@H](N)C(=O)O Chemical compound C1=CC11CC(C1)COC(=O)NCCCC[C@H](N)C(=O)O GRRGXEAFBPMUKG-NSHDSACASA-N 0.000 description 1
- HIAVWJOQCVNAQC-UHFFFAOYSA-N C1=CC=CC2=CC(NCC(N)C(O)=O)=CC=C21 Chemical compound C1=CC=CC2=CC(NCC(N)C(O)=O)=CC=C21 HIAVWJOQCVNAQC-UHFFFAOYSA-N 0.000 description 1
- IZHPCCLNIDDVFG-QMMMGPOBSA-N CC=CC(=O)NCCCC[C@H](N)C(O)=O Chemical compound CC=CC(=O)NCCCC[C@H](N)C(O)=O IZHPCCLNIDDVFG-QMMMGPOBSA-N 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- WWZKQHOCKIZLMA-UHFFFAOYSA-N Caprylic acid Natural products CCCCCCCC(O)=O WWZKQHOCKIZLMA-UHFFFAOYSA-N 0.000 description 1
- KXDHJXZQYSOELW-UHFFFAOYSA-M Carbamate Chemical compound NC([O-])=O KXDHJXZQYSOELW-UHFFFAOYSA-M 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 239000004380 Cholic acid Substances 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 239000004971 Cross linker Substances 0.000 description 1
- 241001254196 Cuphea acinifolia Species 0.000 description 1
- 241001329158 Cuphea aequipetala Species 0.000 description 1
- 241001254197 Cuphea angustifolia Species 0.000 description 1
- 241001254179 Cuphea appendiculata Species 0.000 description 1
- 241001329154 Cuphea avigera Species 0.000 description 1
- 241001647357 Cuphea avigera var. pulcherrima Species 0.000 description 1
- 241001254181 Cuphea axilliflora Species 0.000 description 1
- 241001254183 Cuphea bahiensis Species 0.000 description 1
- 241001329153 Cuphea baillonis Species 0.000 description 1
- 241001459697 Cuphea brachypoda Species 0.000 description 1
- 244000057452 Cuphea bustamanta Species 0.000 description 1
- 241001329151 Cuphea calcarata Species 0.000 description 1
- 241001254186 Cuphea calophylla Species 0.000 description 1
- 241001254188 Cuphea calophylla subsp. mesostemon Species 0.000 description 1
- 240000001936 Cuphea carthagenensis Species 0.000 description 1
- 241001254192 Cuphea circaeoides Species 0.000 description 1
- 241001329148 Cuphea confertiflora Species 0.000 description 1
- 241001329147 Cuphea cordata Species 0.000 description 1
- 241001329146 Cuphea crassiflora Species 0.000 description 1
- 241001254194 Cuphea cyanea Species 0.000 description 1
- 241001254156 Cuphea decandra Species 0.000 description 1
- 241001254262 Cuphea denticulata Species 0.000 description 1
- 241001254264 Cuphea disperma Species 0.000 description 1
- 241001254266 Cuphea epilobiifolia Species 0.000 description 1
- 241001254268 Cuphea ericoides Species 0.000 description 1
- 241001254270 Cuphea flava Species 0.000 description 1
- 241001254272 Cuphea flavisetula Species 0.000 description 1
- 241001254274 Cuphea fuchsiifolia Species 0.000 description 1
- 241001254276 Cuphea gaumeri Species 0.000 description 1
- 241001254277 Cuphea glutinosa Species 0.000 description 1
- 241001254278 Cuphea heterophylla Species 0.000 description 1
- 240000006262 Cuphea hookeriana Species 0.000 description 1
- 241001254238 Cuphea hyssopoides Species 0.000 description 1
- 240000008492 Cuphea ignea Species 0.000 description 1
- 241001254244 Cuphea ingrata Species 0.000 description 1
- 241001329145 Cuphea jorullensis Species 0.000 description 1
- 241001329150 Cuphea linarioides Species 0.000 description 1
- 241001181924 Cuphea llavea Species 0.000 description 1
- 241001329149 Cuphea lophostoma Species 0.000 description 1
- 241001329140 Cuphea lutea Species 0.000 description 1
- 241001254246 Cuphea lutescens Species 0.000 description 1
- 241001254248 Cuphea melanium Species 0.000 description 1
- 241001254250 Cuphea melvilla Species 0.000 description 1
- 241001329144 Cuphea micrantha Species 0.000 description 1
- 244000193474 Cuphea micropetala Species 0.000 description 1
- 241001254254 Cuphea mimuloides Species 0.000 description 1
- 241001254255 Cuphea nitidula Species 0.000 description 1
- 241000167559 Cuphea palustris Species 0.000 description 1
- 241001254256 Cuphea parsonsia Species 0.000 description 1
- 241001254304 Cuphea pascuorum Species 0.000 description 1
- 241001329157 Cuphea paucipetala Species 0.000 description 1
- 240000000074 Cuphea procumbens Species 0.000 description 1
- 241001254309 Cuphea pseudosilene Species 0.000 description 1
- 241001254312 Cuphea pseudovaccinium Species 0.000 description 1
- 241001254315 Cuphea pulchra Species 0.000 description 1
- 241001254318 Cuphea racemosa Species 0.000 description 1
- 241001254321 Cuphea repens Species 0.000 description 1
- 241001329143 Cuphea salicifolia Species 0.000 description 1
- 241001254323 Cuphea salvadorensis Species 0.000 description 1
- 241001254325 Cuphea schumannii Species 0.000 description 1
- 241001254327 Cuphea sessiliflora Species 0.000 description 1
- 241001254944 Cuphea sessilifolia Species 0.000 description 1
- 241001329142 Cuphea setosa Species 0.000 description 1
- 241001254945 Cuphea spectabilis Species 0.000 description 1
- 241001254913 Cuphea spermacoce Species 0.000 description 1
- 241001254914 Cuphea splendida Species 0.000 description 1
- 241001254915 Cuphea splendida var. viridiflava Species 0.000 description 1
- 241001254916 Cuphea strigulosa Species 0.000 description 1
- 241001254918 Cuphea subuligera Species 0.000 description 1
- 241001254920 Cuphea teleandra Species 0.000 description 1
- 241001254922 Cuphea thymoides Species 0.000 description 1
- 241001329141 Cuphea tolucana Species 0.000 description 1
- 241001254924 Cuphea urens Species 0.000 description 1
- 241001255052 Cuphea utriculosa Species 0.000 description 1
- 241001329133 Cuphea viscosissima Species 0.000 description 1
- 241001255054 Cuphea watsoniana Species 0.000 description 1
- 241001495477 Cuphea wrightii Species 0.000 description 1
- WXOFKRKAHJQKLT-BQBZGAKWSA-N Cys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CS WXOFKRKAHJQKLT-BQBZGAKWSA-N 0.000 description 1
- OYIFNHCXNCRBQI-SCSAIBSYSA-N D-2-aminoadipic acid Chemical compound OC(=O)[C@H](N)CCCC(O)=O OYIFNHCXNCRBQI-SCSAIBSYSA-N 0.000 description 1
- SNDPXSYFESPGGJ-SCSAIBSYSA-N D-2-aminopentanoic acid Chemical compound CCC[C@@H](N)C(O)=O SNDPXSYFESPGGJ-SCSAIBSYSA-N 0.000 description 1
- LJCWONGJFPCTTL-SSDOTTSWSA-N D-4-hydroxyphenylglycine Chemical compound [O-]C(=O)[C@H]([NH3+])C1=CC=C(O)C=C1 LJCWONGJFPCTTL-SSDOTTSWSA-N 0.000 description 1
- AHLPHDHHMVZTML-SCSAIBSYSA-N D-Ornithine Chemical compound NCCC[C@@H](N)C(O)=O AHLPHDHHMVZTML-SCSAIBSYSA-N 0.000 description 1
- QWCKQJZIFLGMSD-GSVOUGTGSA-N D-alpha-aminobutyric acid Chemical compound CC[C@@H](N)C(O)=O QWCKQJZIFLGMSD-GSVOUGTGSA-N 0.000 description 1
- ZGUNAGUHMKGQNY-SSDOTTSWSA-N D-alpha-phenylglycine Chemical compound OC(=O)[C@H](N)C1=CC=CC=C1 ZGUNAGUHMKGQNY-SSDOTTSWSA-N 0.000 description 1
- XUIIKFGFIJCVMT-GFCCVEGCSA-N D-thyroxine Chemical compound IC1=CC(C[C@@H](N)C(O)=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-GFCCVEGCSA-N 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108091062167 DNA cytosine Proteins 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 108010060616 DNA-3-methyladenine glycosidase II Proteins 0.000 description 1
- 108010000577 DNA-Formamidopyrimidine Glycosylase Proteins 0.000 description 1
- 108010046855 DNA-deoxyinosine glycosidase Proteins 0.000 description 1
- 241000235035 Debaryomyces Species 0.000 description 1
- UQBOJOOOTLPNST-UHFFFAOYSA-N Dehydroalanine Chemical compound NC(=C)C(O)=O UQBOJOOOTLPNST-UHFFFAOYSA-N 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108091027757 Deoxyribozyme Proteins 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- YXHKONLOYHBTNS-UHFFFAOYSA-N Diazomethane Chemical group C=[N+]=[N-] YXHKONLOYHBTNS-UHFFFAOYSA-N 0.000 description 1
- 238000005698 Diels-Alder reaction Methods 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 101100232687 Drosophila melanogaster eIF4A gene Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 108700011215 E-Box Elements Proteins 0.000 description 1
- 108700034637 EC 3.2.-.- Proteins 0.000 description 1
- 101100001675 Emericella variicolor andJ gene Proteins 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 108091007413 Extracellular RNA Proteins 0.000 description 1
- RAJGXJBYWJERQL-AWEZNQCLSA-N FC(C1(C=C1)C1=CC=C(COC(=O)NCCCC[C@H](N)C(=O)O)C=C1)(F)F Chemical compound FC(C1(C=C1)C1=CC=C(COC(=O)NCCCC[C@H](N)C(=O)O)C=C1)(F)F RAJGXJBYWJERQL-AWEZNQCLSA-N 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108091081406 G-quadruplex Proteins 0.000 description 1
- 241001149475 Gaeumannomyces graminis Species 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical class C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 1
- 241000985936 Gymnoascus Species 0.000 description 1
- 241000332448 Gymnoascus dugwayensis Species 0.000 description 1
- 241000228402 Histoplasma Species 0.000 description 1
- 241000228404 Histoplasma capsulatum Species 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- 241000221930 Hypomyces chrysospermus Species 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 108010015268 Integration Host Factors Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- KRVDMABBKYMBHG-UHFFFAOYSA-N Isoguvacine Chemical compound OC(=O)C1=CCNCC1 KRVDMABBKYMBHG-UHFFFAOYSA-N 0.000 description 1
- 241000235644 Issatchenkia Species 0.000 description 1
- 229930194542 Keto Natural products 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- ZTVZLYBCZNMWCF-WDSKDSINSA-N L,L-homocystine zwitterion Chemical compound OC(=O)[C@@H](N)CCSSCC[C@H](N)C(O)=O ZTVZLYBCZNMWCF-WDSKDSINSA-N 0.000 description 1
- OGNSCSPNOLGXSM-VKHMYHEASA-N L-2,4-diaminobutyric acid Chemical compound NCC[C@H](N)C(O)=O OGNSCSPNOLGXSM-VKHMYHEASA-N 0.000 description 1
- PFDUUKDQEHURQC-UHFFFAOYSA-N L-3-methoxytyrosine Natural products COC1=CC(CC(N)C(O)=O)=CC=C1O PFDUUKDQEHURQC-UHFFFAOYSA-N 0.000 description 1
- OAORYCZPERQARS-VIFPVBQESA-N L-6'-bromotryptophan Chemical compound BrC1=CC=C2C(C[C@H]([NH3+])C([O-])=O)=CNC2=C1 OAORYCZPERQARS-VIFPVBQESA-N 0.000 description 1
- GZYFIMLSHBLMKF-REOHCLBHSA-N L-Albizziine Chemical compound OC(=O)[C@@H](N)CNC(N)=O GZYFIMLSHBLMKF-REOHCLBHSA-N 0.000 description 1
- 235000019766 L-Lysine Nutrition 0.000 description 1
- QWCKQJZIFLGMSD-VKHMYHEASA-N L-alpha-aminobutyric acid Chemical compound CC[C@H](N)C(O)=O QWCKQJZIFLGMSD-VKHMYHEASA-N 0.000 description 1
- ZGUNAGUHMKGQNY-ZETCQYMHSA-N L-alpha-phenylglycine zwitterion Chemical compound OC(=O)[C@@H](N)C1=CC=CC=C1 ZGUNAGUHMKGQNY-ZETCQYMHSA-N 0.000 description 1
- KJQFBVYMGADDTQ-CVSPRKDYSA-N L-buthionine-(S,R)-sulfoximine Chemical compound CCCCS(=N)(=O)CC[C@H](N)C(O)=O KJQFBVYMGADDTQ-CVSPRKDYSA-N 0.000 description 1
- RHGKLRLOHDJJDR-BYPYZUCNSA-N L-citrulline Chemical compound NC(=O)NCCC[C@H]([NH3+])C([O-])=O RHGKLRLOHDJJDR-BYPYZUCNSA-N 0.000 description 1
- GGLZPLKKBSSKCX-YFKPBYRVSA-N L-ethionine Chemical compound CCSCC[C@H](N)C(O)=O GGLZPLKKBSSKCX-YFKPBYRVSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- JTTHKOPSMAVJFE-VIFPVBQESA-N L-homophenylalanine Chemical compound OC(=O)[C@@H](N)CCC1=CC=CC=C1 JTTHKOPSMAVJFE-VIFPVBQESA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- DGYHPLMPMRKMPD-UHFFFAOYSA-N L-propargyl glycine Natural products OC(=O)C(N)CC#C DGYHPLMPMRKMPD-UHFFFAOYSA-N 0.000 description 1
- DGYHPLMPMRKMPD-BYPYZUCNSA-N L-propargylglycine Chemical compound OC(=O)[C@@H](N)CC#C DGYHPLMPMRKMPD-BYPYZUCNSA-N 0.000 description 1
- KKCIOUWDFWQUBT-AWEZNQCLSA-N L-thyronine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1OC1=CC=C(O)C=C1 KKCIOUWDFWQUBT-AWEZNQCLSA-N 0.000 description 1
- NHTGHBARYWONDQ-JTQLQIEISA-N L-α-methyl-Tyrosine Chemical compound OC(=O)[C@](N)(C)CC1=CC=C(O)C=C1 NHTGHBARYWONDQ-JTQLQIEISA-N 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 241000481961 Lachancea thermotolerans Species 0.000 description 1
- 241000235651 Lachancea waltii Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241001599018 Melanogaster Species 0.000 description 1
- 241000203353 Methanococcus Species 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 241001480037 Microsporum Species 0.000 description 1
- 102000005431 Molecular Chaperones Human genes 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 241000713869 Moloney murine leukemia virus Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101000878884 Mus musculus Flap endonuclease 1 Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241001310956 Myxotrichum Species 0.000 description 1
- 241001310960 Myxotrichum deflexum Species 0.000 description 1
- 241000529863 Myxozyma Species 0.000 description 1
- DTERQYGMUDWYAZ-ZETCQYMHSA-N N(6)-acetyl-L-lysine Chemical compound CC(=O)NCCCC[C@H]([NH3+])C([O-])=O DTERQYGMUDWYAZ-ZETCQYMHSA-N 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- ZRKWMRDKSOPRRS-UHFFFAOYSA-N N-Methyl-N-nitrosourea Chemical compound O=NN(C)C(N)=O ZRKWMRDKSOPRRS-UHFFFAOYSA-N 0.000 description 1
- AXDLCFOOGCNDST-UHFFFAOYSA-N N-methyl-DL-tyrosine Natural products CNC(C(O)=O)CC1=CC=C(O)C=C1 AXDLCFOOGCNDST-UHFFFAOYSA-N 0.000 description 1
- GDFAOVXKHJXLEI-VKHMYHEASA-N N-methyl-L-alanine Chemical compound C[NH2+][C@@H](C)C([O-])=O GDFAOVXKHJXLEI-VKHMYHEASA-N 0.000 description 1
- CHJJGSNFBQVOTG-UHFFFAOYSA-N N-methyl-guanidine Natural products CNC(N)=N CHJJGSNFBQVOTG-UHFFFAOYSA-N 0.000 description 1
- IOCAXDVRQIQSMI-MQWKRIRWSA-N NC(C(=O)NCCCC[C@H](N)C(=O)O)C#C Chemical compound NC(C(=O)NCCCC[C@H](N)C(=O)O)C#C IOCAXDVRQIQSMI-MQWKRIRWSA-N 0.000 description 1
- PNTSFAWSAGFWMO-UHFFFAOYSA-N NC(C(=O)O)CCCCNC(=O)OCC1=CC=C(C=C1)I Chemical compound NC(C(=O)O)CCCCNC(=O)OCC1=CC=C(C=C1)I PNTSFAWSAGFWMO-UHFFFAOYSA-N 0.000 description 1
- 241000033319 Naganishia diffluens Species 0.000 description 1
- 241000893976 Nannizzia gypsea Species 0.000 description 1
- RHGKLRLOHDJJDR-UHFFFAOYSA-N Ndelta-carbamoyl-DL-ornithine Natural products OC(=O)C(N)CCCNC(N)=O RHGKLRLOHDJJDR-UHFFFAOYSA-N 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 229920000305 Nylon 6,10 Polymers 0.000 description 1
- 229910003849 O-Si Inorganic materials 0.000 description 1
- LJLCMMNKTZXLLX-IENPIDJESA-N OC(=O)[C@@H](N)CCCCNC(=O)C1CCCO1 Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)C1CCCO1 LJLCMMNKTZXLLX-IENPIDJESA-N 0.000 description 1
- BNBHKQLOTUTYDB-YVNMAJEFSA-N OC(=O)[C@@H](N)CCCCNC(=O)C1OCCC1C#C Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)C1OCCC1C#C BNBHKQLOTUTYDB-YVNMAJEFSA-N 0.000 description 1
- VIIDDSZOUXRNDY-IUCAKERBSA-N OC(=O)[C@@H](N)CCCCNC(=O)[C@@H]1CCCN1 Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)[C@@H]1CCCN1 VIIDDSZOUXRNDY-IUCAKERBSA-N 0.000 description 1
- REYJJPSVUYRZGE-UHFFFAOYSA-N Octadecylamine Chemical compound CCCCCCCCCCCCCCCCCCN REYJJPSVUYRZGE-UHFFFAOYSA-N 0.000 description 1
- 241001310945 Oidiodendron Species 0.000 description 1
- 241001310949 Oidiodendron echinulatum Species 0.000 description 1
- 229910003872 O—Si Inorganic materials 0.000 description 1
- 101150071716 PCSK1 gene Proteins 0.000 description 1
- 241000222051 Papiliotrema laurentii Species 0.000 description 1
- 241000723997 Pea seed-borne mosaic virus Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 241000228150 Penicillium chrysogenum Species 0.000 description 1
- 241000364057 Peoria Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 102000005877 Peptide Initiation Factors Human genes 0.000 description 1
- 108010044843 Peptide Initiation Factors Proteins 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 241000531873 Pichia occidentalis Species 0.000 description 1
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 1
- 244000298647 Poinciana pulcherrima Species 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 239000004721 Polyphenylene oxide Substances 0.000 description 1
- 101710146427 Probable tyrosine-tRNA ligase, cytoplasmic Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- ODHCTXKNWHHXJC-GSVOUGTGSA-N Pyroglutamic acid Natural products OC(=O)[C@H]1CCC(=O)N1 ODHCTXKNWHHXJC-GSVOUGTGSA-N 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 241000235546 Rhizopus stolonifer Species 0.000 description 1
- 241001149408 Rhodotorula graminis Species 0.000 description 1
- GGLZPLKKBSSKCX-UHFFFAOYSA-N S-ethylhomocysteine Chemical compound CCSCCC(N)C(O)=O GGLZPLKKBSSKCX-UHFFFAOYSA-N 0.000 description 1
- 241000235072 Saccharomyces bayanus Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 1
- 241000235060 Scheffersomyces stipitis Species 0.000 description 1
- 241000233671 Schizochytrium Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 241000122799 Scopulariopsis Species 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 241001279813 Sepedonium Species 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- 238000003477 Sonogashira cross-coupling reaction Methods 0.000 description 1
- 241000256248 Spodoptera Species 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 description 1
- 238000006161 Suzuki-Miyaura coupling reaction Methods 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 241000233675 Thraustochytrium Species 0.000 description 1
- 102000002262 Thromboplastin Human genes 0.000 description 1
- 108010000499 Thromboplastin Proteins 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical compound IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 241000723792 Tobacco etch virus Species 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 108010075344 Tryptophan synthase Proteins 0.000 description 1
- 108010067022 Type III Site-Specific Deoxyribonucleases Proteins 0.000 description 1
- 102100025336 Tyrosine-tRNA ligase, mitochondrial Human genes 0.000 description 1
- 101710107268 Tyrosine-tRNA ligase, mitochondrial Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 229910052770 Uranium Inorganic materials 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- RLXCFCYWFYXTON-JTTSDREOSA-N [(3S,8S,9S,10R,13S,14S,17R)-3-hydroxy-10,13-dimethyl-17-[(2R)-6-methylheptan-2-yl]-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1H-cyclopenta[a]phenanthren-16-yl] N-hexylcarbamate Chemical group C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC(OC(=O)NCCCCCC)[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 RLXCFCYWFYXTON-JTTSDREOSA-N 0.000 description 1
- ODHCTXKNWHHXJC-UHFFFAOYSA-N acide pyroglutamique Natural products OC(=O)C1CCC(=O)N1 ODHCTXKNWHHXJC-UHFFFAOYSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 238000005865 alkene metathesis reaction Methods 0.000 description 1
- 125000003282 alkyl amino group Chemical group 0.000 description 1
- SRBFZHDQGSBBOR-STGXQOJASA-N alpha-D-lyxopyranose Chemical compound O[C@@H]1CO[C@H](O)[C@@H](O)[C@H]1O SRBFZHDQGSBBOR-STGXQOJASA-N 0.000 description 1
- 150000001370 alpha-amino acid derivatives Chemical class 0.000 description 1
- 150000001371 alpha-amino acids Chemical class 0.000 description 1
- 125000000266 alpha-aminoacyl group Chemical group 0.000 description 1
- HYOWVAAEQCNGLE-JTQLQIEISA-N alpha-methyl-L-phenylalanine Chemical compound OC(=O)[C@](N)(C)CC1=CC=CC=C1 HYOWVAAEQCNGLE-JTQLQIEISA-N 0.000 description 1
- ZYVMPHJZWXIFDQ-LURJTMIESA-N alpha-methylmethionine Chemical compound CSCC[C@](C)(N)C(O)=O ZYVMPHJZWXIFDQ-LURJTMIESA-N 0.000 description 1
- CDUUKBXTEOFITR-UHFFFAOYSA-N alpha-methylserine Natural products OCC([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-UHFFFAOYSA-N 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 229960002684 aminocaproic acid Drugs 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 125000000637 arginyl group Chemical class N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 150000001502 aryl halides Chemical class 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229940091771 aspergillus fumigatus Drugs 0.000 description 1
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- GONOPSZTUGRENK-UHFFFAOYSA-N benzyl(trichloro)silane Chemical compound Cl[Si](Cl)(Cl)CC1=CC=CC=C1 GONOPSZTUGRENK-UHFFFAOYSA-N 0.000 description 1
- WTOFYLAWDLQMBZ-LURJTMIESA-N beta(2-thienyl)alanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CS1 WTOFYLAWDLQMBZ-LURJTMIESA-N 0.000 description 1
- WTOFYLAWDLQMBZ-ZCFIWIBFSA-N beta-(2-thienyl)-D-alanine Chemical compound [O-]C(=O)[C@H]([NH3+])CC1=CC=CS1 WTOFYLAWDLQMBZ-ZCFIWIBFSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical compound NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 1
- BXRLWGXPSRYJDZ-UHFFFAOYSA-N beta-cyano-L-alanine Natural products OC(=O)C(N)CC#N BXRLWGXPSRYJDZ-UHFFFAOYSA-N 0.000 description 1
- XNBJHKABANTVCP-REOHCLBHSA-N beta-guanidino-L-alanine Chemical compound OC(=O)[C@@H](N)CN=C(N)N XNBJHKABANTVCP-REOHCLBHSA-N 0.000 description 1
- GLUJNGJDHCTUJY-UHFFFAOYSA-N beta-leucine Chemical compound CC(C)C(N)CC(O)=O GLUJNGJDHCTUJY-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 150000001615 biotins Chemical class 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- ZADPBFCGQRWHPN-UHFFFAOYSA-N boronic acid Chemical compound OBO ZADPBFCGQRWHPN-UHFFFAOYSA-N 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical group 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- BHQCQFFYRZLCQQ-OELDTZBJSA-N cholic acid Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)[C@@H](O)C1 BHQCQFFYRZLCQQ-OELDTZBJSA-N 0.000 description 1
- 235000019416 cholic acid Nutrition 0.000 description 1
- 229960002471 cholic acid Drugs 0.000 description 1
- PMMYEEVYMWASQN-IMJSIDKUSA-N cis-4-Hydroxy-L-proline Chemical compound O[C@@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-IMJSIDKUSA-N 0.000 description 1
- 229960002173 citrulline Drugs 0.000 description 1
- 235000013477 citrulline Nutrition 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000000298 cyclopropenyl group Chemical group [H]C1=C([H])C1([H])* 0.000 description 1
- 150000001944 cysteine derivatives Chemical class 0.000 description 1
- WRTKMPONLHLBBL-KVQBGUIXSA-N dXTP Chemical class O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(NC(=O)NC2=O)=C2N=C1 WRTKMPONLHLBBL-KVQBGUIXSA-N 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- KXGVEGMKQFWNSR-UHFFFAOYSA-N deoxycholic acid Natural products C1CC2CC(O)CCC2(C)C2C1C1CCC(C(CCC(O)=O)C)C1(C)C(O)C2 KXGVEGMKQFWNSR-UHFFFAOYSA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 150000001991 dicarboxylic acids Chemical class 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- SWSQBOPZIKWTGO-UHFFFAOYSA-N dimethylaminoamidine Natural products CN(C)C(N)=N SWSQBOPZIKWTGO-UHFFFAOYSA-N 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- GTZOYNFRVVHLDZ-UHFFFAOYSA-N dodecane-1,1-diol Chemical group CCCCCCCCCCCC(O)O GTZOYNFRVVHLDZ-UHFFFAOYSA-N 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007515 enzymatic degradation Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 125000001301 ethoxy group Chemical group [H]C([H])([H])C([H])([H])O* 0.000 description 1
- 210000004265 eukaryotic small ribosome subunit Anatomy 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 230000008622 extracellular signaling Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- XRECTZIEBJDKEO-UHFFFAOYSA-N flucytosine Chemical compound NC1=NC(=O)NC=C1F XRECTZIEBJDKEO-UHFFFAOYSA-N 0.000 description 1
- 229960004413 flucytosine Drugs 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- NKKLCOFTJVNYAQ-UHFFFAOYSA-N formamidopyrimidine Chemical compound O=CNC1=CN=CN=C1 NKKLCOFTJVNYAQ-UHFFFAOYSA-N 0.000 description 1
- 125000003843 furanosyl group Chemical group 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- YQGDEPYYFWUPGO-UHFFFAOYSA-N gamma-amino-beta-hydroxybutyric acid Chemical compound [NH3+]CC(O)CC([O-])=O YQGDEPYYFWUPGO-UHFFFAOYSA-N 0.000 description 1
- UHBYWPGGCSDKFX-VKHMYHEASA-N gamma-carboxy-L-glutamic acid Chemical compound OC(=O)[C@@H](N)CC(C(O)=O)C(O)=O UHBYWPGGCSDKFX-VKHMYHEASA-N 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 229940049906 glutamate Drugs 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 150000002306 glutamic acid derivatives Chemical class 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 102000005396 glutamine synthetase Human genes 0.000 description 1
- 108020002326 glutamine synthetase Proteins 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000003505 heat denaturation Methods 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 125000000487 histidyl group Chemical class [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- NBZBKCUXIYYUSX-UHFFFAOYSA-N iminodiacetic acid Chemical compound OC(=O)CNCC(O)=O NBZBKCUXIYYUSX-UHFFFAOYSA-N 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- 230000004068 intracellular signaling Effects 0.000 description 1
- 210000003093 intracellular space Anatomy 0.000 description 1
- 150000004694 iodide salts Chemical class 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 150000002519 isoleucine derivatives Chemical class 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 150000002614 leucines Chemical class 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 150000002632 lipids Chemical group 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 229960003646 lysine Drugs 0.000 description 1
- VWHRYODZTDMVSS-QMMMGPOBSA-N m-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(F)=C1 VWHRYODZTDMVSS-QMMMGPOBSA-N 0.000 description 1
- 108010007847 mRNA deadenylase Proteins 0.000 description 1
- 150000002678 macrocyclic compounds Chemical class 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 229960004452 methionine Drugs 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- DDCYYCUMAFYDDU-UHFFFAOYSA-N methyl thiohypochlorite Chemical compound CSCl DDCYYCUMAFYDDU-UHFFFAOYSA-N 0.000 description 1
- HPNSFSBZBAHARI-UHFFFAOYSA-N micophenolic acid Natural products OC1=C(CC=C(C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-UHFFFAOYSA-N 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- HPNSFSBZBAHARI-RUDMXATFSA-N mycophenolic acid Chemical compound OC1=C(C\C=C(/C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-RUDMXATFSA-N 0.000 description 1
- 229960000951 mycophenolic acid Drugs 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-N n-hexanoic acid Natural products CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 230000000508 neurotrophic effect Effects 0.000 description 1
- 150000002825 nitriles Chemical class 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 125000003518 norbornenyl group Chemical group C12(C=CC(CC1)C2)* 0.000 description 1
- 229940127073 nucleoside analogue Drugs 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 235000003715 nutritional status Nutrition 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229940037201 oris Drugs 0.000 description 1
- 239000012285 osmium tetroxide Substances 0.000 description 1
- 229910000489 osmium tetroxide Inorganic materials 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- PSWJVKKJYCAPTI-UHFFFAOYSA-N oxido-oxo-phosphonophosphanylphosphanium Chemical compound OP(O)(=O)PP(=O)=O PSWJVKKJYCAPTI-UHFFFAOYSA-N 0.000 description 1
- 125000000913 palmityl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 239000000123 paper Substances 0.000 description 1
- ONTNXMBMXUNDBF-UHFFFAOYSA-N pentatriacontane-17,18,19-triol Chemical compound CCCCCCCCCCCCCCCCC(O)C(O)C(O)CCCCCCCCCCCCCCCC ONTNXMBMXUNDBF-UHFFFAOYSA-N 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 125000004437 phosphorous atom Chemical group 0.000 description 1
- 150000003017 phosphorus Chemical class 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 229920000570 polyether Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 150000003147 proline derivatives Chemical class 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 125000002572 propoxy group Chemical group [*]OC([H])([H])C(C([H])([H])[H])([H])[H] 0.000 description 1
- WGYKZJWCGVVSQN-UHFFFAOYSA-N propylamine Chemical group CCCN WGYKZJWCGVVSQN-UHFFFAOYSA-N 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 125000003132 pyranosyl group Chemical group 0.000 description 1
- 238000003762 quantitative reverse transcription PCR Methods 0.000 description 1
- ZADWXFSZEAPBJS-UHFFFAOYSA-N racemic N-methyl tryptophan Natural products C1=CC=C2N(C)C=C(CC(N)C(O)=O)C2=C1 ZADWXFSZEAPBJS-UHFFFAOYSA-N 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 230000009712 regulation of translation Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 108090000589 ribonuclease E Proteins 0.000 description 1
- 125000006413 ring segment Chemical group 0.000 description 1
- 150000003335 secondary amines Chemical class 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- IIACRCGMVDHOTQ-UHFFFAOYSA-N sulfamic acid Chemical group NS(O)(=O)=O IIACRCGMVDHOTQ-UHFFFAOYSA-N 0.000 description 1
- 150000003456 sulfonamides Chemical group 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 125000004213 tert-butoxy group Chemical group [H]C([H])([H])C(O*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 150000003512 tertiary amines Chemical class 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- ULSZVNJBVJWEJE-UHFFFAOYSA-N thiazolidine-2-carboxylic acid Chemical compound OC(=O)C1NCCS1 ULSZVNJBVJWEJE-UHFFFAOYSA-N 0.000 description 1
- 150000003568 thioethers Chemical class 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 150000003587 threonine derivatives Chemical class 0.000 description 1
- 229940034208 thyroxine Drugs 0.000 description 1
- XUIIKFGFIJCVMT-UHFFFAOYSA-N thyroxine-binding globulin Natural products IC1=CC(CC([NH3+])C([O-])=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-UHFFFAOYSA-N 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 125000002088 tosyl group Chemical group [H]C1=C([H])C(=C([H])C([H])=C1C([H])([H])[H])S(*)(=O)=O 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 150000005691 triesters Chemical class 0.000 description 1
- ZMANZCXQSJIPKH-UHFFFAOYSA-O triethylammonium ion Chemical compound CC[NH+](CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-O 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 125000002948 undecyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 150000003679 valine derivatives Chemical class 0.000 description 1
- GUDHMDVRURNAHL-JTQLQIEISA-N α-amino-2-indanacetic acid Chemical compound C1=CC=C2CC([C@H](N)C(O)=O)CC2=C1 GUDHMDVRURNAHL-JTQLQIEISA-N 0.000 description 1
- ORQXBVXKBGUSBA-QMMMGPOBSA-N β-cyclohexyl-alanine Chemical compound OC(=O)[C@@H](N)CC1CCCCC1 ORQXBVXKBGUSBA-QMMMGPOBSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/33—Chemical structure of the base
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y601/00—Ligases forming carbon-oxygen bonds (6.1)
- C12Y601/01—Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Epidemiology (AREA)
- Cell Biology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
真核生物の半合成生物ならびにその使用および製造の方法が本明細書で提供される。
Description
関連出願に対する相互参照
本出願は、2019年9月30日に出願された米国仮出願第62/908,421号に対する優先権を主張する。
本出願は、2019年9月30日に出願された米国仮出願第62/908,421号に対する優先権を主張する。
配列表
本出願は、ASCIIフォーマットで電子的に提出された配列表を含み、その全体が参照によって本明細書に組み入れられる。前記ASCIIコピーは、2020年9月24日に作成され、36271-810_601_SL.txtという名称であり、19,000バイトのサイズである。
本出願は、ASCIIフォーマットで電子的に提出された配列表を含み、その全体が参照によって本明細書に組み入れられる。前記ASCIIコピーは、2020年9月24日に作成され、36271-810_601_SL.txtという名称であり、19,000バイトのサイズである。
連邦政府が後援する研究に関する陳述
本発明は、国立衛生研究所(NIH)によって与えられた助成金番号GM118178の米国政府の支援により行われた。米国政府は、本発明において一定の権利を有する。
本発明は、国立衛生研究所(NIH)によって与えられた助成金番号GM118178の米国政府の支援により行われた。米国政府は、本発明において一定の権利を有する。
細胞においてこれまでに産生されたどのタンパク質も、4文字の2塩基対遺伝子アルファベットでコード化されている。これは、一般に、タンパク質を構築できるアミノ酸を、標準の20種の、タンパク質の元となるアミノ酸に制限する。これにより生命の多様性が可能になったが、多くの潜在的な機能が利用できないため、所望の活性を提供するように選択されるものを含む非標準アミノ酸(ncAA)を含むように拡張すると、材料から治療薬に至るまでの適用のための改善された特性を有する新規タンパク質の作出が可能となる可能性がある。ncAAを組み込む取り組みは、主に終止コドン(UAG)または4文字のコドン(四つ組コドン)サプレッションによる遺伝子アルファベットの拡張に依存しているが、これらの場合、ncAAの組み込みはコドンの自然な機能と競合しなければならない。この制限を回避するために、天然の終止コドンまたは稀なコドンが排除されたゲノムを合成し、こうして、ncAAへの再割当のためにそれらを解放することに焦点を当てた取り組みがなされている。しかし、稀なコドンは、翻訳およびタンパク質フォールディングの調節において重要な役割を果たす可能性があり、またゲノム合成は、特に、大きな真核生物ゲノムを用いる場合には一般的な戦略としては非実用的である。
代替アプローチは、非天然塩基対(UBP)の使用に依存しており、これによって、原則的には、実用的観点から、事実上無制限な数の、天然機能によって全く邪魔されることのない新規の完全に新しいコドンの作出が可能となる。医薬品化学模倣物を追及することによって、大腸菌(E. coli)半合成生物(SSO)の基礎として使用されてきたdNaM-dTPT3に代表されるような(図1B)UBPのファミリーが開発された。大腸菌SSOは、そのゲノム中またはプラスミドにUBPを保存し、mRNAおよびtRNAに転写し、直交性シンテターゼによってncAAでチャージされたtRNAを用いて、ncAAを含有するタンパク質を翻訳する。大腸菌SSOは、現在新規治療薬を生成するために使用されているので、重要な実用的な適用を有する。
ncAAおよび生成することができる得られる非天然ポリペプチドの幅は、少なくとも幾分かは使用されるSSOで決定される。今日まで、dNAM-dTPT3などのUBPの使用は、真核生物のSSOまたは系では示されていなかった。真核細胞における本明細書において要約されるアプローチの概念実証は、より広い範囲のncAAおよび新規治療薬の生成などの重要な実用的適用にとって有用である得られる非天然ポリペプチドの生成を可能にするであろう。
いくつかの実施形態では、非天然コドンの翻訳を探索することによって生成された真核生物の半合成生物(SSO)が本明細書で提供される。非天然コドンを含有するmRNA、同族非天然コドンを含有するtRNAおよびtRNAに非標準アミノ酸(ncAA)でチャージするのに適当なシンテターゼをコードするDNAを用いる直接的な、一過性の、三重トランスフェクション後に、タンパク質産生が特性決定された。
本明細書で開示される態様は、(a)第1の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA)と(b)第2の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)とを含む真核細胞であって、第1のおよび第2の非天然塩基が、真核細胞において非天然塩基対(UBP)を形成し、細胞においてmRNAが翻訳されて、少なくとも1つの非天然アミノ酸を含むポリペプチドを生成することが可能である、真核細胞を提供する。いくつかの実施形態では、tRNAは、非天然アミノ酸でチャージされる。いくつかの実施形態では、真核細胞は、mRNAから翻訳されたポリペプチドをさらに含み、ポリペプチドは、少なくとも1つの非天然アミノ酸を含む。いくつかの実施形態では、真核細胞は、tRNAを使用してmRNAから少なくとも1つの非天然アミノ酸を含むポリペプチドを翻訳可能であるリボソームをさらに含む。
本明細書で開示される態様はまた、(a)第1の非天然塩基を含む第1の非天然リボヌクレオチド;(b)第2の非天然塩基を含む第2の非天然リボヌクレオチドを含む真核細胞であって、第1のおよび第2の非天然塩基は、真核細胞において非天然塩基対(UBP)を形成する非天然塩基対(UBP)を含む真核細胞を提供する。
いくつかの実施形態では、第1の非天然塩基または第2の非天然塩基は、(i)2-チオウラシル、2-チオ-チミン、2’-デオキシウリジン、4-チオ-ウラシル、4-チオ-チミン、ウラシル-5-イル、ヒポキサンチン-9-イル(I)、5-ハロウラシル、5-プロピニル-ウラシル、6-アゾ-チミン、6-アゾ-ウラシル、5-メチルアミノメチルウラシル、5-メトキシアミノメチル-2-チオウラシル、シュードウラシル、ウラシル-5-オキサ酢酸メチルエステル、ウラシル-5-オキサ酢酸、5-メチル-2-チオウラシル、3-(3-アミノ-3-N-2-カルボキシプロピル)ウラシル、5-メチル-2-チオウラシル、4-チオウラシル、5-メチルウラシル、5’-メトキシカルボキシメチルウラシル、5-メトキシウラシル、ウラシル-5-オキシ酢酸、5-(カルボキシヒドロキシルメチル)ウラシル、5-カルボキシメチルアミノメチル-2-チオウリジン、5-カルボキシメチルアミノメチルウラシルまたはジヒドロウラシル;(ii)5-ヒドロキシメチルシトシン、5-トリフルオロメチルシトシン、5-ハロシトシン、5-プロピニルシトシン、5-ヒドロキシシトシン、シクロシトシン、シトシンアラビノシド、5,6-ジヒドロシトシン、5-ニトロシトシン、6-アゾシトシン、アザシトシン、N4-エチルシトシン、3-メチルシトシン、5-メチルシトシン、4-アセチルシトシン、2-チオシトシン、フェノキサジンシチジン([5,4-b][1,4]ベンゾキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド[5,4-b][1,4]ベンゾチアジン-2(3H)-オン)、フェノキサジンシチジン(9-(2-アミノエトキシ)-H-ピリミド[5,4-b][1,4]ベンゾキサジン-2(3H)-オン)、カルバゾールシチジン(2H-ピリミド[4,5-b]インドール-2-オン)またはピリドインドールシチジン(H-ピリド[3’,2’:4,5]ピロロ[2,3-d]ピリミジン-2-オン);(iii)2-アミノアデニン、2-プロピルアデニン、2-アミノ-アデニン、2-F-アデニン、2-アミノ-プロピル-アデニン、2-アミノ-2’-デオキシアデノシン、3-デアザアデニン、7-メチルアデニン、7-デアザ-アデニン、8-アザアデニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシル置換アデニン、N6-イソペンテニルアデニン、2-メチルアデニン、2,6-ジアミノプリン、2-メチルチオ-N6-イソペンテニルアデニンまたは6-アザ-アデニン;(iv)2-メチルグアニン、グアニンの2-プロピルおよびアルキル誘導体、3-デアザグアニン、6-チオ-グアニン、7-メチルグアニン、7-デアザグアニン、7-デアザグアノシン、7-デアザ-8-アザグアニン、8-アザグアニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシル置換グアニン、1-メチルグアニン、2,2-ジメチルグアニン、7-メチルグアニンまたは6-アザ-グアニン;ならびに(v)ヒポキサンチン、キサンチン、1-メチルイノシン、キュエオシン、ベータ-D-ガラクトシルキュエオシン、イノシン、ベータ-D-マンノシルキュエオシン、ワイブトキソシン、ヒドロキシウレア、(acp3)w、2-アミノピリジンまたは2-ピリドンからなる群から選択される。いくつかの実施形態では、第1の非天然塩基および第2の非天然塩基は各々独立に、
からなる群から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基が
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基または第2の非天然塩基は、2’位における修飾:
OH、置換された低級アルキル、アルカリル、アラルキル、O-アルカリルまたはO-アラルキル、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-アルキル、S-アルキル、N-アルキル;
O-アルケニル、S-アルケニル、N-アルケニル;
O-アルキニル、S-アルキニル、N-アルキニル;
O-アルキル-O-アルキル、2’-F、2’-OCH3、2’-O(CH2)2OCH3、(ここで、アルキル、アルケニルおよびアルキニルは、置換もしくは無置換のC1~C10、アルキル、C2~C10アルケニル、C2~C10アルキニル、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2および-O(CH2)nON[(CH2)nCH3)]2であってもよく、nおよびmは、1~約10である);
および/または5’位における修飾:
5’-ビニル、5’-メチル(RまたはS);
4位における修飾:
4’-S、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態学的性質を改善するための基、もしくはオリゴヌクレオチドの薬力学的性質を改善するための基、およびそれらの任意の組み合わせ
からなる群から選択される修飾された糖部分を含む。
OH、置換された低級アルキル、アルカリル、アラルキル、O-アルカリルまたはO-アラルキル、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-アルキル、S-アルキル、N-アルキル;
O-アルケニル、S-アルケニル、N-アルケニル;
O-アルキニル、S-アルキニル、N-アルキニル;
O-アルキル-O-アルキル、2’-F、2’-OCH3、2’-O(CH2)2OCH3、(ここで、アルキル、アルケニルおよびアルキニルは、置換もしくは無置換のC1~C10、アルキル、C2~C10アルケニル、C2~C10アルキニル、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2および-O(CH2)nON[(CH2)nCH3)]2であってもよく、nおよびmは、1~約10である);
および/または5’位における修飾:
5’-ビニル、5’-メチル(RまたはS);
4位における修飾:
4’-S、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態学的性質を改善するための基、もしくはオリゴヌクレオチドの薬力学的性質を改善するための基、およびそれらの任意の組み合わせ
からなる群から選択される修飾された糖部分を含む。
いくつかの実施形態では、真核細胞は、(a)第1の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)と;(b)第2の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA)とをさらに含み、第1のおよび第2の非天然塩基は、真核細胞において非天然塩基対(UBP)を形成可能である。いくつかの実施形態では、真核細胞は、(a)第2の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)と;(b)第1の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA)とをさらに含み、第1のおよび第2の非天然塩基は、真核細胞において非天然塩基対(UBP)を形成可能である。いくつかの実施形態では、mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、第1の非天然塩基(X)は、mRNAのコドン中の第1の位置(X-N-N)に位置する。いくつかの実施形態では、mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置する。いくつかの実施形態では、mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、第1の非天然塩基(X)は、mRNAのコドン中の最後の位置(N-N-X)に位置する。いくつかの実施形態では、真核生物は、mRNAから翻訳されたポリペプチドをさらに含み、ポリペプチドは、少なくとも1つの非天然アミノ酸を含む。いくつかの実施形態では、少なくとも1つの非天然アミノ酸は、(a)リジンアナログである;(b)芳香族側鎖を含む;(c)アジド基を含む;(d)アルキン基を含む;または(e)アルデヒドもしくはケトン基を含む。いくつかの実施形態では、1つまたはそれ以上の非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)、N6-((プロパルギルエトキシ)-カルボニル)-L-リジン(PraK)、BCN-L-リジン、ノルボルネンリジン、TCO-リジン、メチルテトラジンリジン、アリルオキシカルボニルリジン、2-アミノ-8-オキソノナン酸、2-アミノ-8-オキソオクタン酸、p-アセチル-L-フェニルアラニン、p-アジドメチル-L-フェニルアラニン(pAMF)、p-ヨード-L-フェニルアラニン、m-アセチルフェニルアラニン、2-アミノ-8-オキソノナン酸、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、3-メチル-フェニルアラニン、L-ドパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、p-ブロモフェニルアラニン、p-アミノ-L-フェニルアラニン、イソプロピル-L-フェニルアラニン、O-アリルチロシン、O-メチル-L-チロシン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、ホスホノチロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ホスホセリン、ホスホノセリン、L-3-(2-ナフチル)アラニン、2-アミノ-3-((2-((3-(ベンジルオキシ)-3-オキソプロピル)アミノ)エチル)セラニル)プロパン酸、2-アミノ-3-(フェニルセラニル)プロパン酸、セレノシステイン、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジン、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンおよびN6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンからなる群から選択される。いくつかの実施形態では、少なくとも1つの非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)である。いくつかの実施形態では、少なくとも1つの非天然アミノ酸は、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジンである。いくつかの実施形態では、少なくとも1つの非天然アミノ酸は、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンである。いくつかの実施形態では、少なくとも1つの非天然アミノ酸は、N6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンである。いくつかの実施形態では、真核細胞は、ヒト細胞である。いくつかの実施形態では、ヒト細胞は、HEK293T細胞である。いくつかの実施形態では、細胞は、ハムスター細胞である。いくつかの実施形態では、ハムスター細胞は、チャイニーズハムスター卵巣(CHO)細胞である。いくつかの実施形態では、細胞は、単離および精製されている。いくつかの実施形態では、mRNAおよびtRNAは、真核細胞において分解するように安定化されている。
本明細書で開示される態様は、本明細書に記載される真核細胞を含む半合成生物を提供する。
本明細書で開示される態様は、本開示の複数の真核細胞を含む真核細胞株を提供する。
本明細書で開示される態様は、真核細胞において1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを産生する方法であって、(a)(i)第1の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA)および(ii)真核細胞において第2の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)を細胞中に導入する工程であって、第1のおよび第2の非天然塩基が、真核細胞において非天然塩基対(UBP)を形成する、工程と;(b)tRNAを使用してmRNAから1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを翻訳する工程とを含む方法を提供する。いくつかの実施形態では、tRNAは、非天然アミノ酸でチャージされる。
本明細書で開示される態様はまた、真核細胞において1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを産生する方法であって、(a)(i)第1の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA)と;(ii)第2の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)とを含む真核細胞であって、第1のおよび第2の非天然塩基は、真核細胞において非天然塩基対(UBP)を形成する、真核細胞を提供する工程と;(b)真核細胞に対して内因性であるリボソームによってtRNAを使用してmRNAから1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを翻訳する工程とを含む方法を提供する。いくつかの実施形態では、ポリペプチドは、真核生物のグリコシル化パターンを含む。グリコシル化パターンは、産生される細胞に対応し得る(例えば、細胞が哺乳動物である場合には哺乳動物グリコシル化パターンであり、細胞がヒトである場合にはヒトグリコシル化パターンである、など)。
本明細書で開示される態様はまた、真核細胞においてポリペプチドを産生する方法であって、ポリペプチドは、1つまたはそれ以上の非天然アミノ酸を含み、方法は、(a)真核細胞を提供する工程であって、真核細胞は、(i)第1の非天然塩基を含むコドンを含むmRNAと;(ii)第2の非天然塩基を含むアンチコドンを含むtRNAであって、第1のおよび第2の非天然塩基は相補的塩基対を形成する、tRNAと;(iii)tRNAを天然アミノ酸と比較して1つまたはそれ以上の非天然アミノ酸で優先的にアミノアシル化するtRNAシンテターゼとを含む、工程と;(b)1つまたはそれ以上の非天然アミノ酸を真核細胞に提供する工程であって、真核細胞が1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを産生する、工程とを含む方法を提供する。
本明細書で開示される態様はまた、真核細胞において1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを産生する方法であって、(a)(i)第1の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)と;(ii)第2の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA)とを含む真核細胞であって、第1のおよび第2の非天然塩基が、真核細胞において非天然塩基対(UBP)を形成する、真核生物を提供する工程と;(c)真核細胞に対して内因性であるリボソームによってtRNAを使用してmRNAから1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを翻訳する工程とを含む方法を提供する。
いくつかの実施形態では、mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、第1の非天然塩基(X)は、mRNAのコドン中の第1の位置(X-N-N)に位置する。いくつかの実施形態では、mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置する。いくつかの実施形態では、mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、第1の非天然塩基(X)は、mRNAのコドン中の最後の位置(N-N-X)に位置する。いくつかの実施形態では、第1の非天然塩基または第2の非天然塩基は、(a)2-チオウラシル、2-チオ-チミン、2’-デオキシウリジン、4-チオ-ウラシル、4-チオ-チミン、ウラシル-5-イル、ヒポキサンチン-9-イル(I)、5-ハロウラシル;5-プロピニル-ウラシル、6-アゾ-チミン、6-アゾ-ウラシル、5-メチルアミノメチルウラシル、5-メトキシアミノメチル-2-チオウラシル、シュードウラシル、ウラシル-5-オキサ酢酸メチルエステル、ウラシル-5-オキサ酢酸、5-メチル-2-チオウラシル、3-(3-アミノ-3-N-2-カルボキシプロピル)ウラシル、5-メチル-2-チオウラシル、4-チオウラシル、5-メチルウラシル、5’-メトキシカルボキシメチルウラシル、5-メトキシウラシル、ウラシル-5-オキシ酢酸、5-(カルボキシヒドロキシルメチル)ウラシル、5-カルボキシメチルアミノメチル-2-チオウリジン、5-カルボキシメチルアミノメチルウラシルまたはジヒドロウラシル;(b)5-ヒドロキシメチルシトシン、5-トリフルオロメチルシトシン、5-ハロシトシン、5-プロピニルシトシン、5-ヒドロキシシトシン、シクロシトシン、シトシンアラビノシド、5,6-ジヒドロシトシン、5-ニトロシトシン、6-アゾシトシン、アザシトシン、N4-エチルシトシン、3-メチルシトシン、5-メチルシトシン、4-アセチルシトシン、2-チオシトシン、フェノキサジンシチジン([5,4-b][1,4]ベンゾキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド[5,4-b][1,4]ベンゾチアジン-2(3H)-オン)、フェノキサジンシチジン(9-(2-アミノエトキシ)-H-ピリミド[5,4-b][1,4]ベンゾキサジン-2(3H)-オン)、カルバゾールシチジン(2H-ピリミド[4,5-b]インドール-2-オン)またはピリドインドールシチジン(H-ピリド[3’,2’:4,5]ピロロ[2,3-d]ピリミジン-2-オン);(c)2-アミノアデニン、2-プロピルアデニン、2-アミノ-アデニン、2-F-アデニン、2-アミノ-プロピル-アデニン、2-アミノ-2’-デオキシアデノシン、3-デアザアデニン、7-メチルアデニン、7-デアザ-アデニン、8-アザアデニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシル置換アデニン、N6-イソペンテニルアデニン、2-メチルアデニン、2,6-ジアミノプリン、2-メチルチオ-N6-イソペンテニルアデニンまたは6-アザ-アデニン;(d)2-メチルグアニン、グアニンの2-プロピルおよびアルキル誘導体、3-デアザグアニン、6-チオ-グアニン、7-メチルグアニン、7-デアザグアニン、7-デアザグアノシン、7-デアザ-8-アザグアニン、8-アザグアニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシル置換グアニン、1-メチルグアニン、2,2-ジメチルグアニン、7-メチルグアニンまたは6-アザ-グアニン;および(e)ヒポキサンチン、キサンチン、1-メチルイノシン、キュエオシン、ベータ-D-ガラクトシルキュエオシン、イノシン、ベータ-D-マンノシルキュエオシン、ワイブトキソシン、ヒドロキシウレア、(acp3)w、2-アミノピリジンまたは2-ピリドンからなる群から選択される。いくつかの実施形態では、第1の非天然塩基または第2の非天然塩基は、
からなる群から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基は、
であり、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基が
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基が
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基または第2の非天然塩基は、2’位における修飾:
OH、置換された低級アルキル、アルカリル、アラルキル、O-アルカリルまたはO-アラルキル、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-アルキル、S-アルキル、N-アルキル;
O-アルケニル、S-アルケニル、N-アルケニル;
O-アルキニル、S-アルキニル、N-アルキニル;
O-アルキル-O-アルキル、2’-F、2’-OCH3、2’-O(CH2)2OCH3、(ここで、アルキル、アルケニルおよびアルキニルは、置換もしくは無置換のC1~C10、アルキル、C2~C10アルケニル、C2~C10アルキニル、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2および-O(CH2)nON[(CH2)nCH3)]2であってもよく、nおよびmは、1~約10である);
および/または5’位における修飾:
5’-ビニル、5’-メチル(RまたはS);
4’位における修飾:
4’-S、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態学的性質を改善するための基、もしくはオリゴヌクレオチドの薬力学的性質を改善するための基、およびそれらの任意の組み合わせからなる群から選択される修飾された糖部分を含む。
OH、置換された低級アルキル、アルカリル、アラルキル、O-アルカリルまたはO-アラルキル、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-アルキル、S-アルキル、N-アルキル;
O-アルケニル、S-アルケニル、N-アルケニル;
O-アルキニル、S-アルキニル、N-アルキニル;
O-アルキル-O-アルキル、2’-F、2’-OCH3、2’-O(CH2)2OCH3、(ここで、アルキル、アルケニルおよびアルキニルは、置換もしくは無置換のC1~C10、アルキル、C2~C10アルケニル、C2~C10アルキニル、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2および-O(CH2)nON[(CH2)nCH3)]2であってもよく、nおよびmは、1~約10である);
および/または5’位における修飾:
5’-ビニル、5’-メチル(RまたはS);
4’位における修飾:
4’-S、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態学的性質を改善するための基、もしくはオリゴヌクレオチドの薬力学的性質を改善するための基、およびそれらの任意の組み合わせからなる群から選択される修飾された糖部分を含む。
いくつかの実施形態では、真核細胞は、ヒト細胞である。いくつかの実施形態では、ヒト細胞は、HEK293T細胞である。いくつかの実施形態では、細胞は、ハムスター細胞である。いくつかの実施形態では、ハムスター細胞は、チャイニーズハムスター卵巣(CHO)細胞である。いくつかの実施形態では、非天然アミノ酸は、(a)リジンアナログである;(b)芳香族側鎖を含む;(c)アジド基を含む;(d)アルキン基を含む;または(e)アルデヒドもしくはケトン基を含む。いくつかの実施形態では、非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)、N6-((プロパルギルエトキシ)-カルボニル)-L-リジン(PraK)、BCN-L-リジン、ノルボルネンリジン、TCO-リジン、メチルテトラジンリジン、アリルオキシカルボニルリジン、2-アミノ-8-オキソノナン酸、2-アミノ-8-オキソオクタン酸、p-アセチル-L-フェニルアラニン、p-アジドメチル-L-フェニルアラニン(pAMF)、p-ヨード-L-フェニルアラニン、m-アセチルフェニルアラニン、2-アミノ-8-オキソノナン酸、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、3-メチル-フェニルアラニン、L-ドパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、p-ブロモフェニルアラニン、p-アミノ-L-フェニルアラニン、イソプロピル-L-フェニルアラニン、O-アリルチロシン、O-メチル-L-チロシン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、ホスホノチロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ホスホセリン、ホスホノセリン、L-3-(2-ナフチル)アラニン、2-アミノ-3-((2-((3-(ベンジルオキシ)-3-オキソプロピル)アミノ)エチル)セラニル)プロパン酸、2-アミノ-3-(フェニルセラニル)プロパン酸、セレノシステイン、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジン、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンおよびN6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンからなる群から選択される。いくつかの実施形態では、非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)である。いくつかの実施形態では、1つまたはそれ以上の非天然アミノ酸は、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジンである。いくつかの実施形態では、1つまたはそれ以上の非天然アミノ酸は、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンである。いくつかの実施形態では、1つまたはそれ以上の非天然アミノ酸は、N6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンである。
本明細書で開示される態様は、真核細胞においてポリペプチドを産生する方法であって、ポリペプチドは1つまたはそれ以上の非天然アミノ酸を含み、方法は、(a)真核細胞を提供する工程であって、真核細胞は、(i)1つまたはそれ以上の非天然塩基を含むコドンを含むmRNAと;(ii)1つまたはそれ以上の非天然塩基を含むアンチコドンを含むtRNAであって、mRNA中のコドンを含む1つまたはそれ以上の非天然塩基およびtRNA中のアンチコドンを含む1つまたはそれ以上の非天然塩基が相補的塩基対を形成する、tRNAと、(iii)tRNAを天然アミノ酸と比較して1つまたはそれ以上の非天然アミノ酸で優先的にアミノアシル化するtRNAシンテターゼとを含む、工程と、(b)1つまたはそれ以上の非天然アミノ酸を真核細胞に提供する工程であって、真核細胞が1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを産生する、工程とを含む方法を提供する。いくつかの実施形態では、mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、第1の非天然塩基(X)は、mRNAのコドン中の第1の位置(X-N-N)に位置する。いくつかの実施形態では、mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置する。いくつかの実施形態では、mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、第1の非天然塩基(X)は、mRNAのコドン中の最後の位置(N-N-X)に位置する。いくつかの実施形態では、mRNA中のコドンを含む1つまたはそれ以上の非天然塩基は、式
または
のものであり、式中、R2は、水素、アルキル、アルケニル、アルキニル、メトキシ、メタンチオール、メタンセレノ、ハロゲン、シアノおよびアジドからなる群から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、第1の非天然塩基または第2の非天然塩基は、
本明細書で開示される態様は、非天然ポリペプチドの発現のための系であって、(a)少なくとも1つの非天然アミノ酸と;(b)非天然ポリペプチドをコードするmRNAであって、1つまたはそれ以上の第1の非天然塩基を含む少なくとも1つのコドンを含むmRNAと;(c)1つまたはそれ以上の第2の非天然塩基を含む少なくとも1つのアンチコドンを含むtRNAであって、1つまたはそれ以上の第1の非天然塩基および1つまたはそれ以上の第2の非天然塩基が、1つまたはそれ以上の相補的塩基対を形成する、tRNAと;(d)tRNAおよびtRNAシンテターゼを使用してmRNAを、非天然アミノ酸を含むポリペプチドに翻訳可能である真核生物のリボソームとを含む系を提供する。tRNAは、非天然アミノ酸でチャージされ、および/または系は、tRNAシンテターゼおよび/またはtRNAシンテターゼをコードする核酸配列を含む1つもしくはそれ以上の核酸構築物をさらに含む場合があり、tRNAシンテターゼは、tRNAを少なくとも1つの非天然アミノ酸で優先的にアミノアシル化する。系は、インビトロ(例えば、細胞溶解物のような細胞を含まないものまたは精製成分の、再構成された系)または真核細胞においてであり得る。いくつかの実施形態では、mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み、1つまたはそれ以上の第1の非天然塩基(X)は、mRNAの少なくとも1つのコドン中の第1の位置(X-N-N)に位置する。いくつかの実施形態では、mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み、1つまたはそれ以上の第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置する。いくつかの実施形態では、mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み、1つまたはそれ以上の第1の非天然塩基(X)は、mRNAの少なくとも1つのコドン中の最後の位置(N-N-X)に位置する。いくつかの実施形態では、1つまたはそれ以上の非天然塩基は、式
のものであり、式中、R2は、水素、アルキル、アルケニル、アルキニル、メトキシ、メタンチオール、メタンセレノ、ハロゲン、シアノおよびアジドらなる群から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基または1つまたはそれ以上の第2の非天然塩基は、
からなる群から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基が、
である場合に、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合に、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基が、
である場合に、1つまたはそれ以上の第2の非天然塩基は
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合に、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基が、
である場合に、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合に、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基が、
である場合に、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合に、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基が、
である場合に、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合に、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基が、
である場合に、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み、1つまたはそれ以上の第1の非天然塩基(X)は、mRNAのコドン中の第1の位置(X-N-N)に位置し、1つまたはそれ以上の第1の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み、1つまたはそれ以上の第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置し、1つまたはそれ以上の第1の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み、1つまたはそれ以上の第1の非天然塩基(X)は、mRNAのコドン中の最後の位置(N-N-X)に位置し、1つまたはそれ以上の第1の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第1の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、tRNAの少なくとも1つのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第2の非天然塩基(X)は、tRNAのアンチコドン中の第1の位置(X-N-N)に位置する。いくつかの実施形態では、1つまたはそれ以上の第2の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、tRNAの少なくとも1つのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第2の非天然塩基(X)は、tRNAのアンチコドン中の中央の位置(N-X-N)に位置する。いくつかの実施形態では、1つまたはそれ以上の第2の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、tRNAの少なくとも1つのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第2の非天然塩基(X)は、tRNAのアンチコドン中の最後の位置(N-N-X)に位置する。いくつかの実施形態では、1つまたはそれ以上の第2の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、少なくとも1つのコドンおよび少なくとも1つのアンチコドンは各々独立に、3つの連続した核酸塩基(N-N-N)を含み、少なくとも1つのコドンは、コドンの第1の位置(X-N-N)に位置する1つまたはそれ以上の第1の非天然塩基(X)を含み、tRNA中の少なくとも1つのアンチコドンは、アンチコドンの最後の位置(N-N-Y)に位置する1つまたはそれ以上の第2の非天然塩基(Y)を含む。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一であるか、または異なっている。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一である。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、異なっている。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
から選択され、tRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
であり、各場合において、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
である。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
である。いくつかの実施形態では、少なくとも1つのコドンおよび少なくとも1つのアンチコドンは各々独立に、3つの連続した核酸塩基(N-N-N)を含み、mRNA中の少なくとも1つのコドンは、少なくとも1つのコドンの中央の位置(N-X-N)に位置する1つまたはそれ以上の第1の非天然塩基(X)を含み、tRNA中の少なくとも1つのアンチコドンは、アンチコドンの中央の位置(N-Y-N)に位置する1つまたはそれ以上の第2の非天然塩基(Y)を含む。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一であるか、または異なっている。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一である。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、異なっている。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
から選択され、tRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
であり、各場合において、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
である。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
である。いくつかの実施形態では、少なくとも1つのコドンおよび少なくとも1つのアンチコドンは各々独立に、3つの連続した核酸塩基(N-N-N)を含み、mRNA中の少なくとも1つのコドンは、少なくとも1つのコドンの最後の位置(N-N-X)に位置する1つまたはそれ以上の第1の非天然塩基(X)を含み、tRNA中の少なくとも1つのアンチコドンは、アンチコドンの第1の位置(Y-N-N)に位置する1つまたはそれ以上の第2の非天然塩基(Y)を含む。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一であるか、または異なっている。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一である。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、異なっている。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも、
であり、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
から選択され、tRNAのアンチコドン中に位置するまたはそれ以上の第2の非天然塩基(Y)は、
であり、各場合において、波線は、リボシル部分への結合を示す。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
である。いくつかの実施形態では、mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
である。いくつかの実施形態では、mRNA中の少なくとも1つのコドンは、AXC、GXCまたはGXUから選択され、Xは、非天然塩基である。いくつかの実施形態では、mRNA中の少なくとも1つのコドンはAXCであり、Xは、非天然塩基である。いくつかの実施形態では、mRNA中の少なくとも1つのコドンはGXCであり、Xは、非天然塩基である。いくつかの実施形態では、mRNA中の少なくとも1つのコドンはGXUであり、Xは、非天然塩基である。いくつかの実施形態では、mRNA中の少なくとも1つのコドンは、AXC、GXCまたはGXUから選択され、tRNA中の少なくとも1つのアンチコドンは、GYU、GYCおよびAYCから選択され、Xは、1つまたはそれ以上の第1の非天然塩基であり、Yは、1つまたはそれ以上の第2の非天然塩基である。いくつかの実施形態では、XおよびYは、同一であるか、または異なっている。いくつかの実施形態では、XおよびYは、同一である。いくつかの実施形態では、XおよびYは、異なっている。いくつかの実施形態では、mRNA中の少なくとも1つのコドンはAXCであり、tRNA中の少なくとも1つのアンチコドンはGYUである。いくつかの実施形態では、XおよびYは、同一であるか、または異なっている。いくつかの実施形態では、XおよびYは、同一である。いくつかの実施形態では、XおよびYは、異なっている。いくつかの実施形態では、mRNA中の少なくとも1つのコドンはGXCであり、tRNA中の少なくとも1つのアンチコドンはGYCである。いくつかの実施形態では、XおよびYは、同一であるか、または異なっている。いくつかの実施形態では、XおよびYは、同一である。いくつかの実施形態では、XおよびYは、異なっている。いくつかの実施形態では、mRNA中の少なくとも1つのコドンはGXUであり、少なくとも1つのアンチコドンはAYCである。いくつかの実施形態では、XおよびYは、同一であるか、または異なっている。いくつかの実施形態では、XおよびYは、同一である。いくつかの実施形態では、XおよびYは、異なっている。いくつかの実施形態では、tRNAは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する。いくつかの実施形態では、tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する。いくつかの実施形態では、tRNAおよびtRNAシンテターゼは、メタノコックス・ヤンナスキイに由来する。いくつかの実施形態では、tRNAおよびtRNAシンテターゼは、メタノサルシナ・バルケリに由来する。いくつかの実施形態では、tRNAおよびtRNAシンテターゼは、メタノサルシナ・マゼイに由来する。いくつかの実施形態では、tRNAおよびtRNAシンテターゼは、メタノサルシナ・アセチボランスに由来する。いくつかの実施形態では、tRNAは、メタノコックス・ヤンナスキイに由来し、tRNAシンテターゼは、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する。いくつかの実施形態では、tRNAは、メタノサルシナ・バルケリに由来し、tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する。いくつかの実施形態では、tRNAは、メタノサルシナ・マゼイに由来し、tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリまたはメタノサルシナ・アセチボランスに由来する。いくつかの実施形態では、tRNAは、メタノサルシナ・アセチボランスに由来し、tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリまたはメタノサルシナ・マゼイに由来する。いくつかの実施形態では、tRNAは、メタノサルシナ・マゼイに由来し、tRNAシンテターゼは、メタノサルシナ・バルケリに由来する。いくつかの実施形態では、細胞は、ヒト細胞である。いくつかの実施形態では、ヒト細胞は、HEK293T細胞である。いくつかの実施形態では、細胞は、ハムスター細胞である。いくつかの実施形態では、ハムスター細胞は、チャイニーズハムスター卵巣(CHO)細胞である。いくつかの実施形態では、非天然アミノ酸は:(a)リジンアナログである;(b)芳香族側鎖を含む;(c)アジド基を含む;(d)アルキン基を含む;または(e)アルデヒドもしくはケトン基を含む。いくつかの実施形態では、非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)、N6-((プロパルギルエトキシ)-カルボニル)-L-リジン(PraK)、BCN-L-リジン、ノルボルネンリジン、TCO-リジン、メチルテトラジンリジン、アリルオキシカルボニルリジン、2-アミノ-8-オキソノナン酸、2-アミノ-8-オキソオクタン酸、p-アセチル-L-フェニルアラニン、p-アジドメチル-L-フェニルアラニン(pAMF)、p-ヨード-L-フェニルアラニン、m-アセチルフェニルアラニン、2-アミノ-8-オキソノナン酸、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、3-メチル-フェニルアラニン、L-ドパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、p-ブロモフェニルアラニン、p-アミノ-L-フェニルアラニン、イソプロピル-L-フェニルアラニン、O-アリルチロシン、O-メチル-L-チロシン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、ホスホノチロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ホスホセリン、ホスホノセリン、L-3-(2-ナフチル)アラニン、2-アミノ-3-((2-((3-(ベンジルオキシ)-3-オキソプロピル)アミノ)エチル)セラニル)プロパン酸、2-アミノ-3-(フェニルセラニル)プロパン酸、セレノシステイン、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジン、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンまたはN6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンからなる群から選択される。いくつかの実施形態では、非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)である。いくつかの実施形態では、少なくとも1つの非天然アミノ酸は、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジンである。いくつかの実施形態では、少なくとも1つの非天然アミノ酸は、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンである。いくつかの実施形態では、少なくとも1つの非天然アミノ酸は、N6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンである。いくつかの実施形態では、mRNAおよびtRNAは、真核細胞において分解するように安定化されている。いくつかの実施形態では、ポリペプチドは、真核細胞に対して内因性であるリボソームによってtRNAを使用してmRNAの翻訳によって産生される。
一実施形態では、真核細胞は、151位に非天然コドンを有する高感度緑色蛍光タンパク質(EGFP)(EGFP151(NXN)(式中、Nは、天然核酸塩基のうち1つを指し、Xは、NaMを指す)、同族非天然アンチコドンで再コードされたメタノサルシナ・マゼイtRNAPyl(tRNAPyl(NYN)(式中、Yは、TPT3を指す)および非天然tRNAPylにN6-(2-アジドエトキシ)-カルボニル-L-リジン(AzK)をチャージできるキメラメタノサルシナ・バルケリピロリシル-tRNAシンテターゼ(ChPylRS)をコードするmRNAを含む。
本発明の様々な態様は、添付の特許請求の範囲に具体的に記載されている。本発明の特徴および利点のより良い理解は、本発明の原理が利用される例示的な実施形態を説明する以下の詳細な説明、およびその添付の図面を参照することによって得られる。
特定の用語
別段の定義がない限り、本明細書で使用される全ての技術用語および科学用語は、特許請求される主題が属する当技術分野の技術者によって一般に理解されるのと同じ意味を有する。前述の一般的な説明および以下の詳細な説明は、例示的かつ説明的なものに過ぎず、請求された主題を限定するものではないことを理解されたい。本出願では、特に明記されていない限り、単数形の使用には複数形を含む。本明細書および添付の特許請求の範囲で使用されるように、単数形「a(不定冠詞)」、「an(不定冠詞)」および「the(定冠詞)」は、文脈が明らかに他のことを示さない限り、複数の指示対象を含むことに留意されたい。本出願において、「または」の使用は、特に明記しない限り、「および/または」を意味する。さらに、「含む(including)」という用語、ならびに「含む(include)」、「含む(includes)」、および「含まれる(included)」などの他の形式の使用は、限定的ではない。
別段の定義がない限り、本明細書で使用される全ての技術用語および科学用語は、特許請求される主題が属する当技術分野の技術者によって一般に理解されるのと同じ意味を有する。前述の一般的な説明および以下の詳細な説明は、例示的かつ説明的なものに過ぎず、請求された主題を限定するものではないことを理解されたい。本出願では、特に明記されていない限り、単数形の使用には複数形を含む。本明細書および添付の特許請求の範囲で使用されるように、単数形「a(不定冠詞)」、「an(不定冠詞)」および「the(定冠詞)」は、文脈が明らかに他のことを示さない限り、複数の指示対象を含むことに留意されたい。本出願において、「または」の使用は、特に明記しない限り、「および/または」を意味する。さらに、「含む(including)」という用語、ならびに「含む(include)」、「含む(includes)」、および「含まれる(included)」などの他の形式の使用は、限定的ではない。
本明細書で使用される場合、範囲および量は、特定の値または範囲の「約」として表されてもよい。約には正確な量も含まれる。したがって、「約5μL」とは「約5μL」、また「5μL」をも意味する。一般に、「約」という用語には、実験誤差の範囲内であると予想される量が含まれる。
本明細書で使用される、合成方法の文脈における「提供するのに適した条件下で」または「生成するのに十分な条件下で」などのようなフレーズは、反応産物の有用な量または収率を提供する、実験者が変化させる通常の技術の範囲内である、時間、温度、溶媒、反応物濃度などの反応条件を指す。所望の反応産物が唯一の反応産物である必要もなく、または出発物質が完全に消費される必要もないが、ただし、これは所望の反応産物が単離され得るか、さもなければさらに使用され得るという条件である。
「化学的に実現可能」とは、一般的に理解されている有機構造の規則に違反しない結合配置または化合物を意味する。例えば、特定の状況において、自然界には存在しない五価の炭素原子を含む特許請求の範囲の定義内の構造は、特許請求の範囲内にないことが理解される。本明細書に開示される構造は、それらの全ての実施形態では、「化学的に実現可能な」構造のみを含むことを意図し、例えば、可変の原子または基で示される構造において、化学的に実現可能ではない、任意の列挙された構造は、本明細書で開示されることも特許請求されることも意図されない。
化学構造の「アナログ」は、本明細書で使用される用語として、親構造から合成的に容易に導き出されない場合があるが、親構造との実質的な類似性を保持する化学構造を指す。いくつかの実施形態では、ヌクレオチドアナログは、非天然ヌクレオチドである。いくつかの実施形態では、ヌクレオシドアナログは、非天然ヌクレオシドである。親の化学構造から合成的に容易に導き出される関連する化学構造は、「誘導体」と呼ばれる。
したがって、ポリヌクレオチドは、この用語が本明細書において使用される場合、DNA、RNA、ペプチド核酸(PNA)、ロックド核酸(LNA)、ホスホロチオエート、非天然塩基などのようなDNA様またはRNA様ポリマーを指し、これらは、当技術分野で周知である。ポリヌクレオチドは、例えば、ホスホロアミダイト化学反応またはシンセサイザーの使用に適応した他の化学的アプローチを使用して、自動シンセサイザーで合成され得る。
DNAとして、限定するものではないが、cDNAおよびゲノムDNAが挙げられる。DNAは、共有または非共有手段によって、RNAおよびペプチドを含むがこれらに限定されない別の生体分子に付着される。RNAとしてはまた、コーディングRNA、例えば、メッセンジャーRNA(mRNA)も挙げられる。いくつかの実施形態では、RNAは、rRNA、RNAi、snoRNA、microRNA、siRNA、snRNA、exRNA、piRNA、長鎖ncRNAまたはそれらの任意の組み合わせもしくはハイブリッドである。場合によっては、RNAはリボザイムの構成成分である。DNAおよびRNAは、線状、環状、超らせん、一本鎖、および二本鎖を含むがこれらに限定されない任意の形態であり得る。
ペプチド核酸(PNA)は、合成DNA/RNAアナログであり、ペプチド様骨格がDNAまたはRNAの糖リン酸骨格に置き換わっている。PNAオリゴマーは、相補的DNAへの結合においてより高い結合強度およびより大きな特異性を示し、PNA/DNA塩基のミスマッチは、DNA/DNA二重鎖における同様のミスマッチよりも不安定である。この結合強度および特異性はまた、PNA/RNA二重鎖にも当てはまる。PNAは、ヌクレアーゼまたはプロテアーゼのいずれによっても容易に認識されないので、酵素分解に対して耐性になる。PNAはまた、広いpH範囲にわたって安定している。Nielsen PE、Egholm M、Berg RH、Buchardt O(1991年12月)「チミン置換ポリアミドを用いた鎖置換によるDNAの配列選択的認識(Sequence-selective recognition of DNA by strand displacement with a thymine-substituted polyamide)」、Science 254(5037):1497-500.doi:10.1126/science.1962210.PMID 1962210;ならびにEgholm M、Buchardt O、Christensen L、Behrens C、Freier SM、Driver DA、Berg RH、Kim SK、Norden B、およびNielsen PE(1993)、「PNAはワトソンクリック水素結合規則に従い相補的オリゴヌクレオチドにハイブリダイズする(PNA Hybridizes to Complementary Oligonucleotides Obeying the Watson-Crick Hydrogen Bonding Rules)」。Nature 365(6446):566-8。doi:10.1038/365566a0。PMID 7692304も参照のこと。
ロックド核酸(LNA)は、改変されたRNAヌクレオチドであり、LNAヌクレオチドのリボース部分は、2’酸素および4’炭素を接続する追加の架橋で修飾されている。この架橋は、3’-エンド(North)コンフォメーションでリボースを「ロック」し、これは、A型二重鎖でよく見られる。LNAヌクレオチドは、必要に応じてオリゴヌクレオチドのDNAまたはRNA残基と混合される。そのようなオリゴマーは化学的に合成されてもよく、市販されている。ロックされたリボースコンフォメーションは、塩基のスタッキングおよび骨格の事前組織化を強化する。例えば、Kaur、H;Arora,A;Wengel,J;Maiti、S(2006),「DNA二重鎖へのロックド核酸ヌクレオチドの取り込みのための熱力学的、対イオン、および水和効果(Thermodynamic,Counterion,and Hydration Effects for the Incorporation of Locked Nucleic Acid Nucleotides into DNA Duplexes)」、Biochemistry 45(23):7347-55.doi:10.1021/bi060307w.PMID 16752924;Owczarzy R.;You Y.、Groth C.L.、Tataurov A.V.(2011)、「ロックド核酸-DNA二重鎖の安定性およびミスマッチの識別(Stability and mismatch discrimination of locked nucleic acid-DNA duplexes)」、Biochem.50(43):9352-9367.doi:10.1021/bi200904e.PMC3201676.PMID21928795;Alexei A.Koshkin;Sanjay K.Singh、Poul Nielsen、Vivek K.Rajwanshi、Ravindra Kumar、Michael Meldgaard、Carl Erik Olsen、Jesper Wengel(1998)、「LNA(ロックド核酸):アデニン、シトシン、グアニン、5-メチルシトシン、チミンおよびウラシルビシクロヌクレオシドモノマーの合成、オリゴマー化、ならびに前例のない核酸認識(LNA(Locked Nucleic Acids):Synthesis of the adenine,cytosine,guanine,5-methylcytosine,thymine and uracil bicyclonucleoside monomers,oligomerisation,and unprecedented nucleic acid recognition)」、Tetrahedron 54(14):3607-30.doi:10.1016/S0040-4020(98)00094-5;ならびに、Satoshi Obika;Daishu Nanbu、Yoshiyuki Hari、Ken-ichiro Morio,Yasuko In、Toshimasa Ishida、Takeshi Imanishi(1997)、「2’-O,4’-C-メチレンウリジンおよび-シチジンの合成。固定されたC3’-エンド糖パッカリングを有する新規二環式ヌクレオシド(Synthesis of 2’-O,4’-C-methyleneuridine and -cytidine. Novel bicyclic nucleosides having a fixed C3’-endo sugar puckering)」、Tetrahedron Lett.38(50):8735-8.doi:10.1016/S0040-4039(97)10322-7を参照のこと。
分子ビーコンまたは分子ビーコンプローブは、均質な溶液中の特定の核酸配列の存在を検出し得るオリゴヌクレオチドハイブリダイゼーションプローブである。分子ビーコンは、内部でクエンチされたフルオロフォアを備えたヘアピン型の分子であり、標的の核酸配列に結合すると蛍光が回復する。例えば、Tyagi S、Kramer FR(1996)、「分子ビーコン:ハイブリダイゼーション時に蛍光を発するプローブ(Molecular beacons: probes that fluoresce upon hybridization)」、Nat Biotechnol.14(3):303-8.PMID 9630890;Tapp I、Malmberg L、Rennel E、Wik M、Syvanen AC(2000年4月)、「一塩基多型の均一スコアリング:5’-ヌクレアーゼTaqManアッセイおよび分子ビーコンプローブの比較(Homogeneous scoring of single-nucleotide polymorphisms: comparison of the 5’-nuclease TaqMan assay and Molecular Beacon probes)」、Biotechniques 28(4):732-8.PMID 10769752;ならびにAkimitsu Okamoto(2011)、「ECHOプローブ:実用的な核酸センシングのための蛍光制御の概念」(ECHO probes: a concept of fluorescence control for practical nucleic acid sensing)、Chem.Soc.Rev.40:5815-5828を参照のこと。
いくつかの実施形態では、核酸塩基は、一般に、ヌクレオシドの複素環式塩基部分である。核酸塩基は、天然に存在してもよく、修飾されてもよく、天然塩基との類似性を有さなくてもよく、および、例えば、有機合成によって合成されてもよい。特定の実施形態では、核酸塩基は、水素結合の使用の有無にかかわらず、別の核酸の塩基と相互作用し得る任意の原子または原子群を含む。特定の実施形態では、非天然核酸塩基は、天然核酸塩基に由来しない。非天然核酸塩基は必ずしも塩基性の特性を保有しているわけではないが、簡単にするために核酸塩基と呼ばれることに注意すべきである。いくつかの実施形態では、核酸塩基に言及する場合、「(d)」とは、核酸塩基がデオキシリボースまたはリボースに付着し得ることを示す。
いくつかの実施形態では、ヌクレオシドは、核酸塩基部分および糖部分を含む化合物である。ヌクレオシドとしては、限定するものではないが、天然に存在するヌクレオシド(DNAおよびRNAに見られる)、脱塩基ヌクレオシド、修飾ヌクレオシド、ならびに模倣塩基および/または糖基を有するヌクレオシドが挙げられる。ヌクレオシドとしては、任意の多様な置換基を含むヌクレオシドが挙げられる。ヌクレオシドは、核酸塩基と糖の還元基との間のグリコシド連結によって形成されるグリコシド化合物であり得る。
本明細書で使用されるセクション見出しは、組織的な目的のためだけであり、記載された主題を限定するものとして解釈されるべきではない。
真核細胞における非天然塩基対を含む方法、系および組成物
ある特定の実施形態において、真核細胞において拡張された遺伝子アルファベットを用いて核酸を生成するためのインビボの方法および組成物を本明細書において開示する(図1A~3B)。いくつかの例において、核酸は、非天然タンパク質をコードし、ここで、非天然タンパク質は、少なくとも1つの非天然アミノ酸を含む。いくつかの場合において、本明細書に記載のインビボの方法または組成物は、半合成生物を利用するか、または含む。いくつかの例において、方法は、少なくとも1つの非天然塩基対(UBP)を、1つまたはそれ以上の核酸に組み込む工程を含む。そのような塩基対は、2つのヌクレオシドの核酸塩基の間の対形成によって形成される。図1Bにおいて提供される例示的ワークフローでは、タンパク質102および各々相補的である非天然核酸塩基(X、Y)を含むtRNA103をコードするDNA101は、転写104されて、tRNA106およびmRNA107が生じる。tRNAを非天然アミノ酸105でチャージした後、mRNA107は、翻訳108されて、1つまたはそれ以上の非天然アミノ酸109を含むタンパク質110が生じる。本明細書に記載の方法および組成物は、いくつかの例において、高い忠実度および収率で、非天然アミノ酸の部位特異的組み込みを可能にする。拡張された遺伝子アルファベットを含む半合成生物、少なくとも1つの非天然アミノ酸残基を含むものを含むタンパク質産物を生成するための半合成生物を使用するための方法も本明細書に記載する。
ある特定の実施形態において、真核細胞において拡張された遺伝子アルファベットを用いて核酸を生成するためのインビボの方法および組成物を本明細書において開示する(図1A~3B)。いくつかの例において、核酸は、非天然タンパク質をコードし、ここで、非天然タンパク質は、少なくとも1つの非天然アミノ酸を含む。いくつかの場合において、本明細書に記載のインビボの方法または組成物は、半合成生物を利用するか、または含む。いくつかの例において、方法は、少なくとも1つの非天然塩基対(UBP)を、1つまたはそれ以上の核酸に組み込む工程を含む。そのような塩基対は、2つのヌクレオシドの核酸塩基の間の対形成によって形成される。図1Bにおいて提供される例示的ワークフローでは、タンパク質102および各々相補的である非天然核酸塩基(X、Y)を含むtRNA103をコードするDNA101は、転写104されて、tRNA106およびmRNA107が生じる。tRNAを非天然アミノ酸105でチャージした後、mRNA107は、翻訳108されて、1つまたはそれ以上の非天然アミノ酸109を含むタンパク質110が生じる。本明細書に記載の方法および組成物は、いくつかの例において、高い忠実度および収率で、非天然アミノ酸の部位特異的組み込みを可能にする。拡張された遺伝子アルファベットを含む半合成生物、少なくとも1つの非天然アミノ酸残基を含むものを含むタンパク質産物を生成するための半合成生物を使用するための方法も本明細書に記載する。
非天然核酸塩基の選択は、本明細書に記載の方法における1つまたはそれ以上の工程の最適化を可能にする。例えば、核酸塩基は、高効率の複製、転写および/または翻訳のために選択される。いくつかの例において、1つ以上の非天然核酸塩基対は、本明細書に記載の方法のために利用される。例えば、デオキシリボ部分を含む核酸塩基の第1のセットは、DNA複製のために使用され(例えば、第1の塩基対を形成するように構成する第1の核酸塩基および第2の核酸塩基)、核酸塩基の第2のセット(例えば、第3および第4の核酸塩基はリボースに結合し、第2の塩基対を形成するように構成されている第3の核酸塩基および第4の核酸塩基)は、転写/翻訳のために使用される。第1のセットの核酸塩基および第2のセットの核酸塩基の間の相補的な対形成は、いくつかの例において、第1のセットからの核酸塩基を含むDNAテンプレートからtRNAまたはタンパク質を生じさせるための遺伝子の転写を可能にする。第2のセットの核酸塩基の間の相補的な対形成(第2の塩基対)は、いくつかの例において、非天然核酸を含むtRNAおよびmRNAをマッチさせることによって、翻訳を可能にする。いくつかの場合において、第1のセット中の核酸塩基は、デオキシリボース部分に結合する。いくつかの場合において、第1のセット中の核酸塩基は、リボース部分に結合する。いくつかの例において、両方のセットの核酸塩基は、固有である。いくつかの例において、少なくとも1つの核酸塩基は、両方のセット中で同じである。いくつかの例において、第1の核酸塩基および第3の核酸塩基は、同じである。いくつかの実施形態において、第1の塩基対および第2の塩基対は、同じではない。いくつかの場合において、第1の塩基対、第2の塩基対および第3の塩基対は、同じではない。
真核生物の操作された生物
いくつかの実施形態では、本明細書に開示される方法およびプラスミドは、真核生物の操作された生物、例えば、非天然ヌクレオチドまたは非天然核酸塩基対(UBP)を組み込み、複製する生物を生じさせるためにさらに使用され、非天然アミノ酸残基を含有するタンパク質を翻訳するために使用されるmRNAおよびtRANを転写するために、非天然ヌクレオチドを含有する核酸を使用することもできる。いくつかの例では、生物は、半合成生物(SSO)である。いくつかの例では、SSOは、原核生物ではない。いくつかの例では、SSOは、哺乳動物である。いくつかの例では、哺乳動物SSOは、ヒトである。いくつかの例では、哺乳動物SSOは、ハムスターである。いくつかの例では、ヒトSSOは、HEK293T細胞に由来する。いくつかの例では、ヒトSSOは、チャイニーズハムスター卵巣(CHO)細胞に由来する。
いくつかの実施形態では、本明細書に開示される方法およびプラスミドは、真核生物の操作された生物、例えば、非天然ヌクレオチドまたは非天然核酸塩基対(UBP)を組み込み、複製する生物を生じさせるためにさらに使用され、非天然アミノ酸残基を含有するタンパク質を翻訳するために使用されるmRNAおよびtRANを転写するために、非天然ヌクレオチドを含有する核酸を使用することもできる。いくつかの例では、生物は、半合成生物(SSO)である。いくつかの例では、SSOは、原核生物ではない。いくつかの例では、SSOは、哺乳動物である。いくつかの例では、哺乳動物SSOは、ヒトである。いくつかの例では、哺乳動物SSOは、ハムスターである。いくつかの例では、ヒトSSOは、HEK293T細胞に由来する。いくつかの例では、ヒトSSOは、チャイニーズハムスター卵巣(CHO)細胞に由来する。
いくつかの例では、用いられる細胞は、異種タンパク質、例えば、tRNAシンテターゼをコードする発現カセットで遺伝的に形質転換される。いくつかの実施形態では、tRNAシンテターゼは、非天然塩基を含有するアンチコドンを含むtRNAを非天然アミノ酸で優先的にアミノアシル化する。いくつかの実施形態では、細胞は、非天然塩基を含有するアンチコドンを含むtRNAを非天然アミノ酸で優先的にアミノアシル化するtRNAシンテターゼを含む。
細胞は、真核細胞である場合があり、非天然の相互に塩基対形成するヌクレオチドの対は、TPT3とNaMまたはCNMOであり得る。
2つまたはそれ以上の非天然塩基対形成ヌクレオチドの使用を含む組成物および方法を本明細書に記載する。そのような塩基対形成ヌクレオチドは、いくつかの場合において、当技術分野において公知の標準的な核酸形質転換法(例えば、エレクトロポレーション、化学的形質転換または非天然ヌクレオチドを含む核酸を細胞中に導入できる他の方法)により、細胞に入る。いくつかの場合において、3つまたはそれ以上の非天然塩基対形成ヌクレオチドが使用される。いくつかの場合において、塩基対形成非天然ヌクレオチドは、mRNAおよび/またはtRNAのようなポリヌクレオチドの一部として細胞に入る。ポリヌクレオチド(RNA)の一部として細胞に入る1つまたはそれ以上の塩基対形成非天然ヌクレオチドは、それ自身がインビボで複製される必要はない。
いくつかの場合において、遺伝子操作された細胞は、細胞への核酸、例えば異種核酸の導入によって作製される。本明細書に記載の任意の細胞は、宿主細胞であり、発現ベクターを含むことができる。いくつかの実施形態では、細胞は、哺乳動物細胞である。いくつかの実施形態では、哺乳動物細胞は、ヒト細胞(例えば、HEK293T細胞)である。いくつかの実施形態では、哺乳動物細胞は、ハムスター細胞(例えば、CHO細胞)である。いくつかの実施形態では、細胞は、1つまたはそれ以上の異種ポリヌクレオチドを含む。核酸試薬は、さまざまな技法を使用して、微生物に導入することができる。さまざまな生物に異種核酸を導入するために使用される方法の非限定的な例としては、形質転換、トランスフェクション、形質導入、エレクトロポレーション、超音波媒介形質転換、コンジュゲーション、微粒子銃などが挙げられる。いくつかの例では、担体分子の付加(例えば、ビス-ベンゾイミダゾリル化合物、例えば、米国特許第5,595,899号を参照されたい)は、典型的には、従来の方法によって形質転換することが困難であると考えられる細胞におけるDNAの取り込みを増加させることができる。形質転換の従来の方法は、当業者には容易に利用可能であり、Maniatis,T.、E.F.FritschおよびJ.Sambrook(1982)Molecular Cloning:a Laboratory Manual;Cold Spring Harbor Laboratory、Cold Spring Harbor、N.Y.において見ることができる。
いくつかの例では、遺伝的形質転換は、限定されるものではないが、プラスミド、ウイルスベクター、ウイルス核酸、ファージ核酸、ファージ、コスミドおよび人工染色体における発現カセットの直接導入を使用して、または細胞中の遺伝子材料もしくはカチオン性リポソームのような担体の導入を介して、得られる。そのような方法は、当技術分野において利用可能であり、本明細書に記載の方法における使用のために容易に適合可能である。導入ベクターは、遺伝子を細胞に送達するために使用される任意のヌクレオチド構築物(例えばプラスミド)であり得るか、または遺伝子を送達する一般的戦略の一部として、例えば、組換えレトロウイルスもしくはアデノウイルスの一部としてであり得る(Ramら、Cancer Res.53巻:83~88頁、(1993))。ウイルスベクター、化学的トランスフェクタント、またはエレクトロポレーションおよびDNAの直接拡散のような物理機械的方法を含む、トランスフェクションのための適切な手段は、例えば、Wolff,J.A.ら、Science、247巻、1465~1468頁、(1990);および、Wolff,J.A.、Nature、352巻、815~818頁、(1991)に記載されている。
核酸分子
いくつかの実施形態において、核酸(例えば、本明細書において、目的の核酸分子とも称する)は、任意の起源または組成物由来、例えば、RNA、siRNA(短い阻害性RNA)、RNAi、tRNA、mRNAまたはrRNA(リボソームRNA)由来であり、例えば、任意の形態(例えば、線状、環状、高次コイル状、一本鎖、二本鎖など)である。いくつかの実施形態において、核酸は、ヌクレオチド、ヌクレオシドまたはポリヌクレオチドを含む。いくつかの場合において、核酸は、天然核酸および非天然核酸を含む。いくつかの場合において、核酸は、RNAアナログ(例えば、塩基アナログ、糖アナログおよび/または非ネイティブ骨格などを含有する)などの非天然核酸も含む。「核酸」という用語は、特定の長さのポリヌクレオチド鎖を指さないこと、またはそれを推測しないことが理解され、したがって、ポリヌクレオチドおよびオリゴヌクレオチドも、その定義内に含まれる。例示的な天然ヌクレオチドとしては、限定されないが、ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP、GMP、dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMPおよびdGMPが挙げられる。例示的な天然デオキシリボヌクレオチドとしては、dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMPおよびdGMPが挙げられる。例示的な天然リボヌクレオチドとしては、ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMPおよびGMPが挙げられる。天然RNAについて、ウラシル塩基は、ウリジンである。核酸は、ベクター、プラスミド、ファージミド、自己複製配列(ARS)、セントロメア、人工染色体、酵母人工染色体(例えば、YAC)、または宿主細胞中で複製可能であるか、もしくは宿主細胞中で複製される他の核酸である場合がある。いくつかの場合において、非天然核酸は、核酸アナログである。追加の場合において、非天然核酸は、細胞外起源由来である。他の場合において、非天然核酸は、本明細書に提供される生物、例えば、遺伝子改変生物の細胞内空間において利用可能である。いくつかの実施形態において、非天然ヌクレオチドは、天然ヌクレオチドではない。いくつかの実施形態において、天然塩基を含まないヌクレオチドは、非天然核酸塩基を含む。
いくつかの実施形態において、核酸(例えば、本明細書において、目的の核酸分子とも称する)は、任意の起源または組成物由来、例えば、RNA、siRNA(短い阻害性RNA)、RNAi、tRNA、mRNAまたはrRNA(リボソームRNA)由来であり、例えば、任意の形態(例えば、線状、環状、高次コイル状、一本鎖、二本鎖など)である。いくつかの実施形態において、核酸は、ヌクレオチド、ヌクレオシドまたはポリヌクレオチドを含む。いくつかの場合において、核酸は、天然核酸および非天然核酸を含む。いくつかの場合において、核酸は、RNAアナログ(例えば、塩基アナログ、糖アナログおよび/または非ネイティブ骨格などを含有する)などの非天然核酸も含む。「核酸」という用語は、特定の長さのポリヌクレオチド鎖を指さないこと、またはそれを推測しないことが理解され、したがって、ポリヌクレオチドおよびオリゴヌクレオチドも、その定義内に含まれる。例示的な天然ヌクレオチドとしては、限定されないが、ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP、GMP、dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMPおよびdGMPが挙げられる。例示的な天然デオキシリボヌクレオチドとしては、dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMPおよびdGMPが挙げられる。例示的な天然リボヌクレオチドとしては、ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMPおよびGMPが挙げられる。天然RNAについて、ウラシル塩基は、ウリジンである。核酸は、ベクター、プラスミド、ファージミド、自己複製配列(ARS)、セントロメア、人工染色体、酵母人工染色体(例えば、YAC)、または宿主細胞中で複製可能であるか、もしくは宿主細胞中で複製される他の核酸である場合がある。いくつかの場合において、非天然核酸は、核酸アナログである。追加の場合において、非天然核酸は、細胞外起源由来である。他の場合において、非天然核酸は、本明細書に提供される生物、例えば、遺伝子改変生物の細胞内空間において利用可能である。いくつかの実施形態において、非天然ヌクレオチドは、天然ヌクレオチドではない。いくつかの実施形態において、天然塩基を含まないヌクレオチドは、非天然核酸塩基を含む。
非天然核酸
ヌクレオチドアナログまたは非天然ヌクレオチドは、塩基、糖またはホスフェート部分のいずれかにいくつかの種類の修飾を含有するヌクレオチドを含む。いくつかの実施形態において、修飾は、化学的修飾を含む。いくつかの場合において、修飾は、3’OHもしくは5’OH基、主鎖、糖構成成分またはヌクレオチド塩基において起こる。いくつかの例において、修飾は、場合により、天然に存在しないリンカー分子および/または鎖間もしくは鎖内架橋を含む。一態様において、修飾された核酸は、3’OHもしくは5’OH基、主鎖、糖構成成分もしくはヌクレオチド塩基の1つまたはそれ以上の修飾、および/あるいは天然に存在しないリンカー分子の付加を含む。一態様において、修飾された主鎖は、ホスホジエステル主鎖以外の主鎖を含む。一態様において、修飾された糖は、デオキシリボース以外(修飾されたDNAにおいて)、またはリボース以外(修飾されたRNA)の糖を含む。一態様において、修飾された塩基は、アデニン、グアニン、シトシンもしくはチミン以外の塩基(修飾されたDNAにおいて)、またはアデニン、グアニン、シトシンもしくはウラシル以外の塩基(修飾されたRNAにおいて)を含む。
ヌクレオチドアナログまたは非天然ヌクレオチドは、塩基、糖またはホスフェート部分のいずれかにいくつかの種類の修飾を含有するヌクレオチドを含む。いくつかの実施形態において、修飾は、化学的修飾を含む。いくつかの場合において、修飾は、3’OHもしくは5’OH基、主鎖、糖構成成分またはヌクレオチド塩基において起こる。いくつかの例において、修飾は、場合により、天然に存在しないリンカー分子および/または鎖間もしくは鎖内架橋を含む。一態様において、修飾された核酸は、3’OHもしくは5’OH基、主鎖、糖構成成分もしくはヌクレオチド塩基の1つまたはそれ以上の修飾、および/あるいは天然に存在しないリンカー分子の付加を含む。一態様において、修飾された主鎖は、ホスホジエステル主鎖以外の主鎖を含む。一態様において、修飾された糖は、デオキシリボース以外(修飾されたDNAにおいて)、またはリボース以外(修飾されたRNA)の糖を含む。一態様において、修飾された塩基は、アデニン、グアニン、シトシンもしくはチミン以外の塩基(修飾されたDNAにおいて)、またはアデニン、グアニン、シトシンもしくはウラシル以外の塩基(修飾されたRNAにおいて)を含む。
いくつかの実施形態において、核酸は、少なくとも1つの修飾された塩基を含む。いくつかの例において、核酸は、2、3、4、5、6、7、8、9、10、15、20またはそれ以上の修飾された塩基を含む。いくつかの場合において、塩基部分への修飾は、A、C、G、およびT/Uの天然ならびに合成修飾だけでなく、異なるプリンまたはピリミジン塩基も含む。いくつかの実施形態において、修飾は、アデニン、グアニン、シトシンもしくはチミンの修飾された形態(修飾されたDNAにおいて)、またはアデニン、グアニン、シトシンもしくはウラシルの修飾された形態(修飾されたRNA)である。
非天然核酸の修飾された塩基としては、限定されるものではないが、ウラシル-5-イル、ヒポキサンチン-9-イル(I)、2-アミノアデニン-9-イル、5-メチルシトシン(5-me-C)、5-ヒドロキシメチルシトシン、キサンチン、ヒポキサンチン、2-アミノアデニン、アデニンおよびグアニンの6-メチルおよび他のアルキル誘導体、アデニンおよびグアニンの2-プロピルおよび他のアルキル誘導体、2-チオウラシル、2-チオチミンおよび2-チオシトシン、5-ハロウラシルおよびシトシン、5-プロピニルウラシルおよびシトシン、6-アゾウラシル、シトシンおよびチミン、5-ウラシル(シュードウラシル)、4-チオウラシル、8-ハロ、8-アミノ、8-チオール、8-チオアルキル、8-ヒドロキシルおよび他の8-置換アデニンおよびグアニン、5-ハロ、特に、5-ブロモ、5-トリフルオロメチルおよび他の5-置換ウラシルおよびシトシン、7-メチルグアニンおよび7-メチルアデニン、8-アザグアニンおよび8-アザアデニン、7-デアザグアニンおよび7-デアザアデニン、ならびに3-デアザグアニンおよび3-デアザアデニンが挙げられる。ある特定の非天然核酸、例えば、5-置換ピリミジン、6-アザピリミジンおよびN-2置換プリン、N-6置換プリン、O-6置換プリン、2-アミノプロピルアデニン、5-プロピニルウラシル、5-プロピニルシトシン、5-メチルシトシン、二本鎖形成の安定性を増加させるもの、ユニバーサル核酸、疎水性核酸、乱雑な核酸、サイズが拡大された核酸、フッ素化核酸、5-置換ピリミジン、6-アザピリミジン、ならびにN-2、N-6およびO-6置換プリンは、2-アミノプロピルアデニン、5-プロピニルウラシルおよび5-プロピニルシトシン、5-メチルシトシン(5-me-C)、5-ヒドロキシメチルシトシン、キサンチン、ヒポキサンチン、2-アミノアデニン、アデニンおよびグアニンの6-メチル、他のアルキル誘導体、アデニンおよびグアニンの2-プロピルおよび他のアルキル誘導体、2-チオウラシル、2-チオチミンおよび2-チオシトシン、5-ハロウラシル、5-ハロシトシン、5-プロピニル(-C≡C-CH3)ウラシル、5-プロピニルシトシン、ピリミジン核酸の他のアルキニル誘導体、6-アゾウラシル、6-アゾシトシン、6-アゾチミン、5-ウラシル(シュードウラシル)、4-チオウラシル、8-ハロ、8-アミノ、8-チオール、8-チオアルキル、8-ヒドロキシルおよび他の8-置換アデニンおよびグアニン、5-ハロ、特に、5-ブロモ、5-トリフルオロメチル、他の5-置換ウラシルおよびシトシン、7-メチルグアニン、7-メチルアデニン、2-F-アデニン、2-アミノ-アデニン、8-アザグアニン、8-アザアデニン、7-デアザグアニン、7-デアザアデニン、3-デアザグアニン、3-デアザアデニン、三環式ピリミジン、フェノキサジンシチジン([5,4-b][1,4]ベンゾオキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド[5,4-b][1,4]ベンゾチアジン-2(3H)-オン)、G-clamps、フェノキサジンシチジン(例えば、9-(2-アミノエトキシ)-H-ピリミド[5,4-b][1,4]ベンゾオキサジン-2(3H)-オン)、カルバゾールシチジン(2H-ピリミド[4,5-b]インドール-2-オン)、ピリドインドールシチジン(H-ピリド[3’,2’:4,5]ピロロ[2,3-d]ピリミジン-2-オン)、プリンまたはピリミジン塩基が他の複素環で置き換えられたもの、7-デアザ-アデニン、7-デアザグアノシン、2-アミノピリジン、2-ピリドン、アザシトシン、5-ブロモシトシン、ブロモウラシル、5-クロロシトシン、塩素化シトシン、シクロシトシン、シトシンアラビノシド、5-フルオロシトシン、フルオロピリミジン、フルオロウラシル、5,6-ジヒドロシトシン、5-ヨードシトシン、ヒドロキシウレア、ヨードウラシル、5-ニトロシトシン、5-ブロモウラシル、5-クロロウラシル、5-フルオロウラシルおよび5-ヨードウラシル、2-アミノ-アデニン、6-チオ-グアニン、2-チオ-チミン、4-チオ-チミン、5-プロピニル-ウラシル、4-チオ-ウラシル、N4-エチルシトシン、7-デアザグアニン、7-デアザ-8-アザグアニン、5-ヒドロキシシトシン、2’-デオキシウリジン、2-アミノ-2’-デオキシアデノシン、ならびに米国特許第3,687,808号;同第4,845,205号;同第4,910,300号;同第4,948,882号;同第5,093,232号;同第5,130,302号;同第5,134,066号;同第5,175,273号;同第5,367,066号;同第5,432,272号;同第5,457,187号;同第5,459,255号;同第5,484,908号;同第5,502,177号;同第5,525,711号;同第5,552,540号;同第5,587,469号;同第5,594,121号;同第5,596,091号;同第5,614,617号;同第5,645,985号;同第5,681,941号;同第5,750,692号;同第5,763,588号;同第5,830,653号および同第6,005,096号;国際公開第99/62923号;Kandimallaら、(2001)Bioorg.Med.Chem.9巻:807~813頁;The Concise Encyclopedia of Polymer Science and Engineering、Kroschwitz、J.I.編、John Wiley & Sons、1990、858~859頁;Englischら、Angewandte Chemie,International Edition、1991、30巻、613頁;およびSanghvi、第15章、Antisense Research and Applications、CrookeおよびLebleu編、CRC Press、1993、273~288頁に記載のものを含む。追加の塩基修飾は、例えば、米国特許第3,687,808号;Englischら、Angewandte Chemie,International Edition、1991、30巻、613頁に見ることができる。いくつかの例において、非天然核酸は、図2の核酸塩基を含む。いくつかの例において、非天然核酸は、図3Aの核酸塩基を含む。いくつかの例において、非天然核酸は、図3Bの核酸塩基を含む。
様々な複素環塩基および様々な糖部分(および糖アナログ)を含む非天然核酸は、当技術分野において利用可能であり、いくつかの場合において、核酸は、天然に存在する核酸の主要な5つの塩基構成成分以外の1つまたはいくつかの複素環塩基を含む。例えば、複素環塩基としては、いくつかの場合において、ウラシル-5-イル、シトシン-5-イル、アデニン-7-イル、アデニン-8-イル、グアニン-7-イル、グアニン-8-イル、4-アミノピロロ[2.3-d]ピリミジン-5-イル、2-アミノ-4-オキソピロロ[2、3-d]ピリミジン-5-イル、2-アミノ-4-オキソピロロ[2.3-d]ピリミジン-3-イル基が挙げられ、ここで、プリンは、9位を介して核酸の糖部分に、1位を介してピリミジンに、7位を介してピロロピリミジンに、および1位を介してピラゾロピリミジンに結合する。
いくつかの実施形態において、ヌクレオチドアナログはまた、ホスフェート部分において修飾される。修飾されたホスフェート部分としては、限定されるものではないが、2つのヌクレオチド間の連結における修飾を有するものが挙げられ、例えば、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アミノアルキルホスホトリエステル、3’-アルキレンホスホネートおよびキラルホスホネートを含むメチルおよび他のアルキルホスホネート、ホスフィネート、3’-アミノホスホルアミデートおよびアミノアルキルホスホルアミデートを含むホスホルアミデート、チオノホスホルアミデート、チオノアルキルホスホネート、チオノアルキルホスホトリエステルならびにボラノホスフェートを含む。2つのヌクレオチド間のこれらのホスフェートまたは修飾されたホスフェートの連結は、3’-5’連結または2’-5’連結によってであり、連結は、3’-5’から5’-3’または2’-5’から5’-2’などの逆の方向性を含むことが理解される。さまざまな塩、混合塩および遊離酸形態も含まれる。多数の米国特許が、修飾されたホスフェートを含有するヌクレオチドの作製方法および使用方法を教示しており、限定されるものではないが、第3,687,808号;第4,469,863号;第4,476,301号;第5,023,243号;第5,177,196号;第5,188,897号;第5,264,423号;第5,276,019号;第5,278,302号;第5,286,717号;第5,321,131号;第5,399,676号;第5,405,939号;第5,453,496号;第5,455,233号;第5,466,677号;第5,476,925号;第5,519,126号;第5,536,821号;第5,541,306号;第5,550,111号;第5,563,253号;第5,571,799号;第5,587,361号;および第5,625,050号が挙げられる。
いくつかの実施形態において、非天然核酸は、2’,3’-ジデオキシ-2’,3’-ジデヒドロ-ヌクレオシド(PCT/US2002/006460号)、5’-置換DNAおよびRNA誘導体(PCT/US2011/033961号;Sahaら、J.Org Chem.、1995、60巻、788~789頁;Wangら、Bioorganic & Medicinal Chemistry Letters、1999、9巻、885~890頁;およびMikhailovら、Nucleosides & Nucleotides、1991、10巻(1~3号)、339~343頁;Leonidら、1995、14巻(3~5号)、901~905頁;およびEppacherら、Helvetica Chimica Acta、2004、87巻、3004~3020頁;PCT/JP2000/004720号;PCT/JP2003/002342号;PCT/JP2004/013216号;PCT/JP2005/020435号;PCT/JP2006/315479号;PCT/JP2006/324484号;PCT/JP2009/056718号;PCT/JP2010/067560号)、または修飾された塩基を用いてモノホスフェートとして作製された5’-置換モノマー(Wangら、Nucleosides Nucleotides & Nucleic Acids、2004、23巻(1および2号)、317~337頁)を含む。
いくつかの実施形態において、非天然核酸は、糖の環の5’位および2’位における修飾(PCT/US94/02993号)、例えば、5’-CH2置換2’-O-保護ヌクレオシド(Wuら、Helvetica Chimica Acta、2000、83巻、1127~1143頁およびWuら、Bioconjugate Chem.1999、10巻、921~924)を含む。いくつかの場合において、非天然核酸は、オリゴヌクレオチドへの組み込みのために製造されたアミド連結ヌクレオシドダイマーを含み、ここで、ダイマー中の3’連結ヌクレオシド(5’から3’)は、2’-OCH3および5’-(S)-CH3(Mesmaekerら、Synlett、1997、1287~1290頁)を含む。非天然核酸は、2’-置換5’-CH2(またはO)修飾ヌクレオシド(PCT/US92/01020号)を含むことができる。非天然核酸は、5’-メチレンホスホネートDNAおよびRNAモノマーおよびダイマー(Bohringerら、Tet.Lett.、1993、34巻、2723~2726頁;Collingwoodら、Synlett、1995、7巻、703~705頁;およびHutterら、Helvetica Chimica Acta、2002、85巻、2777~2806頁)を含むことができる。非天然核酸は、2’-置換を有する5’-ホスホネートモノマー(米国特許出願公開第2006/0074035号)および他の修飾された5’-ホスホネートモノマー(国際公開第1997/35869号)を含むことができる。非天然核酸は、5’-修飾されたメチレンホスホネートモノマー(欧州特許出願公開第614907号および欧州特許出願公開第629633号)を含むことができる。非天然核酸は、5’および/もしくは6’位にヒドロキシル基を含む5’または6’-ホスホネートリボヌクレオシドのアナログ(Chenら、Phosphorus,Sulfur and Silicon、2002、777巻、1783~1786頁;Jungら、Bioorg.Med.Chem.、2000、8巻、2501~2509頁;Gallierら、Eur.J.Org.Chem.、2007、925~933頁;およびHamptonら、J.Med.Chem.、1976、19巻(8号)、1029~1033頁)を含むことができる。非天然核酸は、5’-ホスフェート基を有する5’-ホスホネートデオキシリボヌクレオシドモノマーおよびダイマー(Nawrotら、Oligonucleotides、2006、16巻(1号)、68~82頁)を含むことができる。非天然核酸は、6’-ホスホネート基を有するヌクレオシドを含むことができ、ここで、5’または/および6’位は、無置換、またはチオ-tert-ブチル基(SC(CH3)3)(およびそのアナログ);メチレンアミノ基(CH2NH2)(およびそのアナログ)またはシアノ基(CN)(およびそのアナログ)(Fairhurstら、Synlett、2001、4巻、467~472頁;Kapplerら、J.Med.Chem.、1986、29巻、1030~1038頁;Kapplerら、J.Med.Chem.、1982、25巻、1179~1184頁;Vrudhulaら、J.Med.Chem.、1987、30巻、888~894頁;Hamptonら、J.Med.Chem.、1976、19巻、1371~1377頁;Gezeら、J.Am.Chem.Soc、1983、105巻(26号)、7638~7640頁;およびHamptonら、J.Am.Chem.Soc、1973、95巻(13号)、4404~4414頁)で置換される。
いくつかの実施形態において、非天然核酸は、糖部分の修飾も含む。いくつかの場合において、核酸は、糖基が修飾された1つまたはそれ以上のヌクレオシドを含有する。そのような糖が修飾されたヌクレオシドは、増強されたヌクレアーゼ安定性、増加した結合親和性、またはいくつかの他の有利な生物学的性質が付与される場合がある。ある特定の実施形態において、核酸は、化学修飾されたリボフラノース環部分を含む。化学修飾されたリボフラノース環の例としては、限定されないが、置換基の付加(5’および/または2’置換基;二環式核酸(BNA)を形成する2つの環原子の架橋;リボシル環の酸素原子のS、N(R)もしくはC(R1)(R2)(R=H、C1~C12アルキルまたは保護基)による置き換え;ならびにそれらの組み合わせを含む)が挙げられる。化学修飾された糖の例は、国際公開第2008/101157号、米国特許出願公開第2005/0130923号および国際公開第2007/134181号に見ることができる。
いくつかの例において、修飾された核酸は、修飾された糖または糖アナログを含む。したがって、リボースおよびデオキシリボースに加えて、糖部分は、ペントース、デオキシペントース、ヘキソース、デオキシヘキソース、グルコース、アラビノース、キシロース、リキソース、または糖の「アナログ」のシクロペンチル基であることができる。糖は、ピラノシルまたはフラノシルの形態であることができる。糖部分は、リボース、デオキシリボース、アラビノースまたは2’-O-アルキルリボースのフラノシドであることができ、糖は、[アルファ]または[ベータ]アノマー配置のいずれかのそれぞれの複素環塩基に結合することができる。糖修飾としては、限定されるものではないが、2’-アルコキシ-RNAアナログ、2’-アミノ-RNAアナログ、2’-フルオロ-DNAおよび2’-アルコキシ-またはアミノ-RNA/DNAキメラが挙げられる。例えば、糖修飾としては、2’-O-メチル-ウリジンまたは2’-O-メチル-シチジンを挙げることができる。糖修飾としては、2’-O-アルキル置換デオキシリボヌクレオシドおよび2’-O-エチレングリコール様リボヌクレオシドが挙げられる。そのような糖または糖アナログが複素環塩基(核酸塩基)に結合する、これらの糖または糖アナログおよびそれぞれの「ヌクレオシド」の製造は、公知である。糖修飾はまた、他の修飾を用いて作製し、それと組み合わせることができる。
糖部分への修飾は、リボースおよびデオキシリボースの天然修飾、ならびに非天然修飾を含む。糖修飾としては、限定されるものではないが、以下の2位における修飾:OH;F;O-、S-もしくはN-アルキル;O-、S-もしくはN-アルケニル;O-、S-もしくはN-アルキニル;またはO-アルキル-O-アルキルが挙げられ、ここで、アルキル、アルケニルおよびアルキニルは、置換または無置換のC1~C10アルキルもしくはC2~C10アルケニルおよびアルキニルであってもよい。2’糖修飾としては、限定されるものではないが、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)nONH2および-O(CH2)nON[(CH2)nCH3)]2(式中、nおよびmは、1~約10である)も挙げられる。
2’位における他の修飾としては、限定されるものではないが、C1~C10低級アルキル、置換低級アルキル、アルカリル、アラルキル、O-アルカリル、O-アラルキル、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態学的性質を改善するための基、またはオリゴヌクレオチドの薬力学的性質を改善するための基、および類似の性質を有する他の置換基が挙げられる。類似の修飾はまた、糖の他の位置、特に、3’末端ヌクレオチドまたは2’-5’連結オリゴヌクレオチドにおける糖の3’位、および5’末端ヌクレオチドの5’位において行うことができる。修飾された糖は、CH2およびSなどの架橋している環の酸素において修飾を含有するものも含む。ヌクレオチドの糖アナログは、ペントフラノシル糖の代わりにシクロブチル部分などの糖ミメティックを有することもできる。米国特許第4,981,957号;同第5,118,800号;同第5,319,080号;同第5,359,044号;同第5,393,878号;同第5,446,137号;同第5,466,786号;同第5,514,785号;同第5,519,134号;同第5,567,811号;同第5,576,427号;同第5,591,722号;同第5,597,909号;同第5,610,300号;同第5,627,053号;同第5,639,873号;同第5,646,265号;同第5,658,873号;同第5,670,633号;同第4,845,205号;同第5,130,302号;同第5,134,066号;同第5,175,273号;同第5,367,066号;同第5,432,272号;同第5,457,187号;同第5,459,255号;同第5,484,908号;同第5,502,177号;同第5,525,711号;同第5,552,540号;同第5,587,469号;同第5,594,121号、同第5,596,091号;同第5,614,617号;同第5,681,941号;および同第5,700,920号などの、そのような修飾された糖構造の製造を教示し、塩基修飾の範囲を詳述および記載する多数の米国特許があり、それらのそれぞれは、その全体が参照によって本明細書に組み入れられる。
修飾された糖部分を有する核酸の例としては、限定されないが、5’-ビニル、5’-メチル(RまたはS)、4’-S、2’-F、2’-OCH3および2’-O(CH2)2OCH3置換基を含む核酸が挙げられる。2’位における置換基は、アリル、アミノ、アジド、チオ、O-アリル、O-(C1~C1Oアルキル)、OCF3、O(CH2)2SCH3、O(CH2)2-O-N(Rm)(Rn)およびO-CH2-C(=O)-N(Rm)(Rn)(式中、それぞれのRmおよびRnは、独立して、H、または置換もしくは無置換のC1~C10アルキルである)から選択することもできる。
ある特定の実施形態において、本明細書に記載の核酸は、1つまたはそれ以上の二環式核酸を含む。ある特定のそのような実施形態において、二環式核酸は、4’および2’リボシル環原子の間の架橋を含む。ある特定の実施形態において、本明細書に提供される核酸は、1つまたはそれ以上の二環式核酸を含み、ここで、架橋は、4’-2’二環式核酸を含む。そのような4’-2’二環式核酸の例としては、限定されるものではないが、式:4’-(CH2)-O-2’(LNA);4’-(CH2)-S-2’;4’-(CH2)2-O-2’(ENA);4’-CH(CH3)-O-2’および4’-CH(CH2OCH3)-O-2’、ならびにそれらのアナログ(米国特許第7,399,845号を参照されたい);4’-C(CH3)(CH3)-O-2’およびそのアナログ(国際公開第2009/006478号、国際公開第2008/150729号、米国特許出願公開第2004/0171570号、米国特許第7,427,672号、Chattopadhyayaら、J.Org.Chem.、209巻、74号、118~134頁および国際公開第2008/154401号を参照されたい)の1つが挙げられる。例えば、Singhら、Chem.Commun.、1998、4巻、455~456頁;Koshkinら、Tetrahedron、1998、54巻、3607~3630頁;Wahlestedtら、Proc.Natl.Acad.Sci.U.S.A.、2000、97巻、5633~5638頁;Kumarら、Bioorg.Med.Chem.Lett.、1998、8巻、2219~2222頁;Singhら、J.Org.Chem.、1998、63巻、10035~10039頁;Srivastavaら、J.Am.Chem.Soc.、2007、129巻(26号)8362~8379頁;Elayadiら、Curr.Opinion Invens.Drugs、2001、2巻、558~561頁;Braaschら、Chem.Biol、2001、8巻、1~7頁;Oramら、Curr.Opinion Mol.Ther.、2001、3巻、239~243頁;米国特許第4,849,513号:同第5,015,733号:同第5,118,800号:同第5,118,802号:同第7,053,207号:同第6,268,490号:同第6,770,748号:同第6,794,499号:同第7,034,133号:同第6,525,191号:同第6,670,461号:および同第7,399,845号;国際公開第2004/106356号、国際公開第1994/14226号、国際公開第2005/021570号、国際公開第2007/090071および国際公開第2007/134181号;米国特許出願公開第2004/0171570号、同第2007/0287831号および同第2008/0039618号;米国仮出願第60/989,574号、同第61/026,995号、同第61/026,998号、同第61/056,564号、同第61/086,231号、同第61/097,787号および同第61/099,844号;ならびに国際出願第PCT/US2008/064591号、同第PCT US2008/066154号、同第PCT US2008/068922号および同第PCT/DK98/00393号も参照されたい。
ある特定の実施形態において、核酸は、連結された核酸を含む。核酸は、任意の核酸間の連結を使用して、一緒に連結することができる。核酸間連結基の2つの主なクラスは、リン原子の存在または非存在によって定義される。代表的なリン含有核酸間連結としては、限定されるものではないが、ホスホジエステル、ホスホトリエステル、メチルホスホネート、ホスホルアミデートおよびホスホロチオエート(P=S)が挙げられる。代表的なリン不含有核酸間連結基としては、限定されるものではないが、メチレンメチルイミノ(-CH2-N(CH3)-O-CH2-)、チオジエステル(-O-C(O)-S-)、チオノカルバメート(-O-C(O)(NH)-S-);シロキサン(-O-Si(H)2-O-);およびN,N*-ジメチルヒドラジン(-CH2-N(CH3)-N(CH3))が挙げられる。ある特定の実施形態において、キラル原子を有する核酸間連結は、ラセミ混合物として、別々のエナンチオマー、例えば、アルキルホスホネートおよびホスホロチオエートとして、製造することができる。非天然核酸は、単一の修飾を含有することができる。非天然核酸は、1つの部分内に、または異なる部分の間に、複数の修飾を含有することができる。
核酸に対する主鎖のホスフェートの修飾としては、限定されるものではないが、メチルホスホネート、ホスホロチオエート、ホスホルアミデート(架橋または非架橋)、ホスホトリエステル、ホスホロジチオエート、ホスホジチオエートおよびボラノホスフェートが挙げられ、任意の組み合わせで使用することができる。他の非ホスフェート連結を使用することもできる。
いくつかの実施形態において、主鎖の修飾(例えば、メチルホスホネート、ホスホロチオエート、ホスホロアミデートおよびホスホロジチオエートのヌクレオチド間連結)は、修飾された核酸における免疫調節活性を付与することができ、および/またはインビボでのそれらの安定性を増強することができる。
いくつかの例において、リン誘導体(または修飾されたホスフェート基)は、糖または糖アナログ部分に結合し、モノホスフェート、ジホスフェート、トリホスフェート、アルキルホスホネート、ホスホロチオエート、ホスホロジチオエート、ホスホルアミデートなどであることができる。修飾されたホスフェート連結または非ホスフェート連結を含有する例示的なポリヌクレオチドは、Peyrottesら、1996、Nucleic Acids Res.24巻:1841~1848頁;Chaturvediら、1996、Nucleic Acids Res.24巻:2318~2323頁;およびSchultzら、(1996) Nucleic Acids Res.24巻:2966~2973頁;Matteucci、1997、「Oligonucleotide Analogs:an Overview」in Oligonucleotides as Therapeutic Agents、(ChadwickおよびCardew編)John Wiley and Sons、New York、NY;Zon、1993、「Oligonucleoside Phosphorothioates」in Protocols for Oligonucleotides and Analogs、Synthesis and Properties、Humana Press、165~190頁;Millerら、1971、JACS 93巻:6657~6665頁;Jagerら、1988、Biochem.27巻:7247~7246頁;Nelsonら、1997、JOC 62巻:7278~7287頁;米国特許第5,453,496号;ならびにMicklefield、2001、Curr.Med.Chem.8巻:1157~1179頁に見ることができる。
いくつかの場合において、主鎖の修飾は、アニオン性、中性またはカチオン性基などの代替部分でホスホジエステル連結を置き換えることを含む。そのような修飾の例としては、アニオン性ヌクレオシド間連結;N3’-P5’ホスホルアミデート修飾;ボラノホスフェートDNA;プロオリゴヌクレオチド;中性ヌクレオシド間連結、例えば、メチルホスホネート;アミド連結DNA;メチレン(メチルイミノ)連結;ホルムアセタールおよびチオホルムアセタール連結;スルホニル基を含有する主鎖;モルホリノオリゴ;ペプチド核酸(PNA);ならびに正に荷電したデオキシリボ核酸グアニジン(DNG)オリゴ(Micklefield、2001、Current Medicinal Chemistry 8巻:1157~1179頁)が挙げられる。修飾された核酸は、1つまたはそれ以上の修飾、例えば、ホスホジエステルおよびホスホロチオエート連結の組み合わせなどのホスフェート連結の組み合わせを含むキメラまたは混合主鎖を含むことができる。
ホスフェートについての代替物としては、例えば、短鎖アルキルまたはシクロアルキルのヌクレオシド間連結、混合ヘテロ原子およびアルキルもしくはシクロアルキルのヌクレオシド間連結、または1つもしくはそれ以上の短鎖ヘテロ原子または複素環のヌクレオシド間連結が挙げられる。これらとしては、モルホリノ連結を有するもの(一部分において、ヌクレオシドの糖部分から形成される);シロキサン主鎖;スルフィド、スルホキシドおよびスルホン主鎖;ホルムアセチルおよびチオホルムアセチル主鎖;メチレンホルムアセチルおよびチオホルムアセチル主鎖;アルケン含有主鎖;スルファメート主鎖;メチレンイミノおよびメチレンヒドラジノ主鎖;スルホネートおよびスルホンアミド主鎖;アミド主鎖;ならびに混合N、O、SおよびCH2構成部分を有する他のものが挙げられる。多数の米国特許が、これらの種類のホスフェート置き換えの作製方法および使用方法を開示しており、限定されるものではないが、米国特許第5,034,506号;同第5,166,315号;同第5,185,444号;同第5,214,134号;同第5,216,141号;同第5,235,033号;同第5,264,562号;同第5,264,564号;同第5,405,938号;同第5,434,257号;同第5,466,677号;同第5,470,967号;同第5,489,677号;同第5,541,307号;同第5,561,225号;同第5,596,086号;同第5,602,240号;同第5,610,289号;同第5,602,240号;同第5,608,046号;同第5,610,289号;同第5,618,704号;同第5,623,070号;同第5,663,312号;同第5,633,360号;同第5,677,437号;および同第5,677,439号が挙げられる。ヌクレオチド代替物において、ヌクレオチドの糖およびホスフェート部分の両方を、例えば、アミド型連結(アミノエチルグリシン)(PNA)によって置き換えることができることも理解される。米国特許第5,539,082号;同第5,714,331号;および同第5,719,262号は、PNA分子の作製方法および使用方法を教示しており、そのそれぞれは、参照によって本明細書に組み入れられる。Nielsenら、Science、1991、254巻、1497~1500頁も参照されたい。例えば、細胞の取り込みを増強するために、ヌクレオチドまたはヌクレオチドアナログに他の種類の分子を連結する(コンジュゲートする)ことも可能である。コンジュゲートは、ヌクレオチドまたはヌクレオチドアナログに化学的に連結することができる。そのようなコンジュゲートとしては、限定されるものではないが、脂質部分、例えば、コレステロール部分(Letsingerら、Proc.Natl.Acad.Sci.USA、1989、86巻、6553~6556頁)、コール酸(Manoharanら、Bioorg.Med.Chem.Let.、1994、4巻、1053~1060頁)、チオエーテル、例えば、ヘキシル-S-トリチルチオール(Manoharanら、Ann.KY.Acad.Sci.、1992、660巻、306~309頁;Manoharanら、Bioorg.Med.Chem.Let.、1993、3巻、2765~2770頁)、チオコレステロール(Oberhauserら、Nucl.Acids Res.、1992、20巻、533~538頁)、脂肪族鎖、例えば、ドデカンジオールもしくはウンデシル残基(Saison-Behmoarasら、EM5OJ、1991、10巻、1111~1118頁;Kabanovら、FEBS Lett.、1990、259巻、327~330頁;Svinarchukら、Biochimie、1993、75巻、49~54頁)、リン脂質、例えば、ジ-ヘキサデシル-rac-グリセロールもしくはトリエチルアンモニウムl-ジ-O-ヘキサデシル-rac-グリセロ-S-H-ホスホネート(Manoharanら、Tetrahedron Lett.、1995、36巻、3651~3654頁;Sheaら、Nucl.Acids Res.、1990、18巻、3777~3783頁)、ポリアミンもしくはポリエチレングリコール鎖(Manoharanら、Nucleosides & Nucleotides、1995、14巻、969~973頁)、またはアダマンタン酢酸(Manoharanら、Tetrahedron Lett.、1995、36巻、3651~3654頁)、パルミチル部分(Mishraら、Biochem.Biophys.Acta、1995、1264巻、229~237頁)、またはオクタデシルアミンもしくはヘキシルアミノ-カルボニル-オキシコレステロール部分(Crookeら、J.Pharmacol.Exp.Ther.、1996、277巻、923~937)が挙げられる。多数の米国特許が、そのようなコンジュゲートの製造を教示しており、限定されるものではないが、米国特許第4,828,979号;同第4,948,882号;同第5,218,105号;同第5,525,465号;同第5,541,313号;同第5,545,730号;同第5,552,538号;同第5,578,717号、同第5,580,731号;同第5,591,584号;同第5,109,124号;同第5,118,802号;同第5,138,045号;同第5,414,077号;同第5,486,603号;同第5,512,439号;同第5,578,718号;同第5,608,046号;同第4,587,044号;同第4,605,735号;同第4,667,025号;同第4,762,779号;同第4,789,737号;同第4,824,941号;同第4,835,263号;同第4,876,335号;同第4,904,582号;同第4,958,013号;同第5,082,830号;同第5,112,963号;同第5,214,136号;同第5,245,022号;同第5,254,469号;同第5,258,506号;同第5,262,536号;同第5,272,250号;同第5,292,873号;同第5,317,098号;同第5,371,241号、同第5,391,723号;同第5,416,203号、同第5,451,463号;同第5,510,475号;同第5,512,667号;同第5,514,785号;同第5,565,552号;同第5,567,810号;同第5,574,142号;同第5,585,481号;同第5,587,371号;同第5,595,726号;同第5,597,696号;同第5,599,923号;同第5,599,928号および同第5,688,941号が挙げられる。
非天然アミノ酸のタンパク質への複製、転写、翻訳および組み込みのための組成物ならびに方法において使用される核酸塩基を本明細書に記載する。いくつかの実施形態において、本明細書に記載の核酸塩基は、構造:
[式中、
それぞれのXは、独立して、炭素または窒素であり;
R2は、場合により、および存在する場合、独立して、水素、アルキル、アルケニル、アルキニル、メトキシ、メタンチオール、メタンセレノ、ハロゲン、シアノまたはアジド基であり;
それぞれのYは、独立して、硫黄、酸素、セレンまたは第二級アミンであり;
それぞれのEは、独立して、酸素、硫黄またはセレンであり;
波線は、リボシル、デオキシリボシルもしくはジデオキシリボシル部分、またはそれらのアナログとの結合点を示し、リボシル、デオキシリボシルもしくはジデオキシリボシル部分、またはそれらのアナログは、遊離形態であるか、場合によりα-チオトリホスフェート、β-チオトリホスフェートもしくはγ-チオトリホスフェート基を含むモノホスフェート、ジホスフェートまたはトリホスフェート基に接続されるか、あるいはRNAもしくはDNA中、またはRNAアナログもしくはDNAアナログ中に含まれる]
を含む。いくつかの実施形態において、R2は、低級アルキル(例えば、C1~C6)、水素またはハロゲンである。本明細書に記載の核酸塩基のいくつかの実施形態において、R2は、フルオロである。本明細書に記載の核酸塩基のいくつかの実施形態において、Xは、炭素である。本明細書に記載の核酸塩基のいくつかの実施形態において、Eは、硫黄である。本明細書に記載の核酸塩基のいくつかの実施形態において、Yは、硫黄である。本明細書に記載の核酸塩基のいくつかの実施形態において、核酸塩基は、構造:
を有する。本明細書に記載の核酸塩基のいくつかの実施形態において、Eは、硫黄であり、Yは、硫黄である。本明細書に記載の核酸塩基のいくつかの実施形態において、波線は、リボシルまたはデオキシリボシル部分との結合点を示す。本明細書に記載の核酸塩基のいくつかの実施形態において、波線は、トリホスフェート基に接続されるリボシルまたはデオキシリボシル部分との結合点を示す。本明細書に記載の核酸塩基のいくつかの実施形態において、核酸ポリマーの構成成分である。本明細書に記載の核酸塩基のいくつかの実施形態において、核酸塩基は、tRNAの構成成分である。本明細書に記載の核酸塩基のいくつかの実施形態において、核酸塩基は、tRNA中のアンチコドンの構成成分である。本明細書に記載の核酸塩基のいくつかの実施形態において、核酸塩基は、mRNAの構成成分である。本明細書に記載の核酸塩基のいくつかの実施形態において、核酸塩基は、mRNAのコドンの構成成分である。本明細書に記載の核酸塩基のいくつかの実施形態において、核酸塩基は、RNAまたはDNAの構成成分である。本明細書に記載の核酸塩基のいくつかの実施形態において、核酸塩基は、DNA中のコドンの構成成分である。本明細書に記載の核酸塩基のいくつかの実施形態において、核酸塩基は、別の相補的な核酸塩基との核酸塩基対を形成する。
それぞれのXは、独立して、炭素または窒素であり;
R2は、場合により、および存在する場合、独立して、水素、アルキル、アルケニル、アルキニル、メトキシ、メタンチオール、メタンセレノ、ハロゲン、シアノまたはアジド基であり;
それぞれのYは、独立して、硫黄、酸素、セレンまたは第二級アミンであり;
それぞれのEは、独立して、酸素、硫黄またはセレンであり;
波線は、リボシル、デオキシリボシルもしくはジデオキシリボシル部分、またはそれらのアナログとの結合点を示し、リボシル、デオキシリボシルもしくはジデオキシリボシル部分、またはそれらのアナログは、遊離形態であるか、場合によりα-チオトリホスフェート、β-チオトリホスフェートもしくはγ-チオトリホスフェート基を含むモノホスフェート、ジホスフェートまたはトリホスフェート基に接続されるか、あるいはRNAもしくはDNA中、またはRNAアナログもしくはDNAアナログ中に含まれる]
を含む。いくつかの実施形態において、R2は、低級アルキル(例えば、C1~C6)、水素またはハロゲンである。本明細書に記載の核酸塩基のいくつかの実施形態において、R2は、フルオロである。本明細書に記載の核酸塩基のいくつかの実施形態において、Xは、炭素である。本明細書に記載の核酸塩基のいくつかの実施形態において、Eは、硫黄である。本明細書に記載の核酸塩基のいくつかの実施形態において、Yは、硫黄である。本明細書に記載の核酸塩基のいくつかの実施形態において、核酸塩基は、構造:
非天然デオキシリボ核酸(DNA)は、いくつかの場合において、本明細書に記載される非天然塩基(例えば、d5SICS、dNaM、dTPT3、dMTMO、dCNMO、dTAT1)を含むメッセンジャーRNA(mRNA)に転写される。例示的mRNAコドンは、TTX、TGX、CGX、AGX、GAX、CAX、GXT、CXT、GXG、AXG、GXC、AXC、GXA、CXC、TXC、ATX、CTX、TTX、GTX、TAXまたはGGX(ここで、Xは、2’デオキシリボシル部分に付着している非天然塩基である)を含む3つの連続したデオキシリボヌクレオチド(NNN)を含む非天然DNAの例示的領域によってコードされる。例示的非天然DNAの転写に起因する例示的mRNAコドンは、それぞれUUX、UGX、CGX、AGX、GAX、CAX、GXU、CXU、GXG、AXG、GXC、AXC、GXA、CXC、UXC、AUX、CUX、UUX、GUX、UAXまたはGGX(ここで、Xは、リボシル部分に付着している非天然塩基である)を含む3つの連続したリボヌクレオチド(NNN)を含む。いくつかの実施形態では、非天然塩基は、コドン配列中の第1の位置(X-N-N)にある。いくつかの実施形態では、非天然塩基は、コドン配列中の第2の(または中央の)位置(N-X-N)にある。いくつかの実施形態では、非天然塩基は、コドン配列中の第3の(最後の)位置(N-N-X)にある。
本明細書に記載されるコドンを含むmRNAは、いくつかの場合において、細胞(例えば、真核細胞)においてインビボで翻訳される。本明細書に記載される非天然塩基を含むmRNAの翻訳は、本明細書に記載されるmRNAコドン配列の逆相補体であるアンチコドン配列を含むトランスファーRNA(tRNA)によって媒介される。いくつかの実施形態では、tRNAアンチコドンは、YAA、XAA、YCA、XCA、YCG、XCG、YCU、XCU、YUC、XUC、YUG、XUG、AYC、AYG、CYC、CYU、GYC、GYU、UYC、GYG、GYA、YAU、XAU、XAG、YAG、XAC、YAC、XUA、YUA、XCCまたはYCC(ここで、XおよびYは各々、非天然塩基を表し、XおよびYは、同一ではない)を含む非天然塩基を含む。いくつかの実施形態では、非天然塩基は、アンチコドン配列中の第1の位置(X/Y-N-N)にある。いくつかの実施形態では、非天然塩基は、アンチコドン配列中の第2の(または中央の)位置(N-X/Y-N)にある。いくつかの実施形態では、非天然塩基は、アンチコドン配列中の第3の(最後の)位置(N-N-X/Y)にある。
核酸塩基対形成性
いくつかの実施形態では、非天然ヌクレオチドは、例えば、翻訳の間に、別の非天然ヌクレオチドと塩基対(非天然塩基対;UBP)を形成する。例えば、第1の非天然核酸は、第2の非天然核酸と塩基対を形成することができる。例えば、翻訳の間に塩基対を形成することができる非天然ヌクレオシド三リン酸の1つの対として、(d)5SICSを含むヌクレオチドおよび(d)NaMを含むヌクレオチドが挙げられる。他の例として、限定するものではないが:(d)CNMOを含むヌクレオチドおよび(d)TPT3を含むヌクレオチドが挙げられる。そのような非天然ヌクレオチドは、リボースまたはデオキシリボース糖部分(「(d)」によって示される)を有することができる。例えば、核酸中に組み込まれた場合に塩基対を形成することができる非天然ヌクレオシド三リン酸の1つの対として、TAT1を含むヌクレオチドおよびNaMを含むヌクレオチドが挙げられる。いくつかの実施形態では、核酸中に組み込まれた場合に塩基対を形成することができる非天然ヌクレオシド三リン酸の1つの対として、dCNMOを含むヌクレオチドおよびTAT1を含むヌクレオチドが挙げられる。いくつかの実施形態では、核酸中に組み込まれた場合に塩基対を形成することができる非天然ヌクレオシド三リン酸の1つの対として、dTPT3を含むヌクレオチドおよびNaMを含むヌクレオチドが挙げられる。いくつかの実施形態では、非天然核酸は、天然核酸(A、T、G、C)と塩基対を実質的に形成しない。いくつかの実施形態では、非天然核酸は、天然核酸と塩基対を形成することができる。
いくつかの実施形態では、非天然ヌクレオチドは、例えば、翻訳の間に、別の非天然ヌクレオチドと塩基対(非天然塩基対;UBP)を形成する。例えば、第1の非天然核酸は、第2の非天然核酸と塩基対を形成することができる。例えば、翻訳の間に塩基対を形成することができる非天然ヌクレオシド三リン酸の1つの対として、(d)5SICSを含むヌクレオチドおよび(d)NaMを含むヌクレオチドが挙げられる。他の例として、限定するものではないが:(d)CNMOを含むヌクレオチドおよび(d)TPT3を含むヌクレオチドが挙げられる。そのような非天然ヌクレオチドは、リボースまたはデオキシリボース糖部分(「(d)」によって示される)を有することができる。例えば、核酸中に組み込まれた場合に塩基対を形成することができる非天然ヌクレオシド三リン酸の1つの対として、TAT1を含むヌクレオチドおよびNaMを含むヌクレオチドが挙げられる。いくつかの実施形態では、核酸中に組み込まれた場合に塩基対を形成することができる非天然ヌクレオシド三リン酸の1つの対として、dCNMOを含むヌクレオチドおよびTAT1を含むヌクレオチドが挙げられる。いくつかの実施形態では、核酸中に組み込まれた場合に塩基対を形成することができる非天然ヌクレオシド三リン酸の1つの対として、dTPT3を含むヌクレオチドおよびNaMを含むヌクレオチドが挙げられる。いくつかの実施形態では、非天然核酸は、天然核酸(A、T、G、C)と塩基対を実質的に形成しない。いくつかの実施形態では、非天然核酸は、天然核酸と塩基対を形成することができる。
いくつかの実施形態において、非天然(デオキシ)リボヌクレオチドは、UBPを形成することができる非天然(デオキシ)リボヌクレオチドであるが、実質的に、それぞれの天然(デオキシ)リボヌクレオチドのいずれかと塩基対を形成しない。いくつかの実施形態において、非天然(デオキシ)リボヌクレオチドは、UBPを形成することができる非天然(デオキシ)リボヌクレオチドであるが、実質的に、1つまたはそれ以上の天然核酸と塩基対を形成しない。例えば、非天然核酸は、実質的に、A、TおよびCと塩基対を形成することができないが、Gと塩基対を形成することができる。例えば、非天然核酸は、実質的に、A、TおよびGと塩基対を形成することができないが、Cと塩基対を形成することができる。例えば、非天然核酸は、実質的に、C、GおよびAと塩基対を形成することができないが、Tと塩基対を形成することができる。例えば、非天然核酸は、実質的に、C、GおよびTと塩基対を形成することができないが、Aと塩基対を形成することができる。例えば、非天然核酸は、実質的に、AおよびTと塩基対を形成することができないが、CおよびGと塩基対を形成することができる。例えば、非天然核酸は、実質的に、AおよびCと塩基対を形成することができないが、TおよびGと塩基対を形成することができる。例えば、非天然核酸は、実質的に、AおよびGと塩基対を形成することができないが、CおよびTと塩基対を形成することができる。例えば、非天然核酸は、実質的に、CおよびTと塩基対を形成することができないが、AおよびGと塩基対を形成することができる。例えば、非天然核酸は、実質的に、CおよびGと塩基対を形成することができないが、TおよびGと塩基対を形成することができる。例えば、非天然核酸は、実質的に、TおよびGと塩基対を形成することができないが、AおよびGと塩基対を形成することができる。例えば、非天然核酸は、実質的に、Gと塩基対を形成することができないが、A、TおよびCと塩基対を形成することができる。例えば、非天然核酸は、実質的に、Aと塩基対を形成することができないが、G、TおよびCと塩基対を形成することができる。例えば、非天然核酸は、実質的に、Tと塩基対を形成することができないが、G、AおよびCと塩基対を形成することができる。例えば、非天然核酸は、実質的に、Cと塩基対を形成することができないが、G、TおよびAと塩基対を形成することができる。
例示的、インビボ条件下で(例えば、tRNAとmRNAの間のようなRNAにおいて)非天然塩基対(UBP)を形成可能な非天然ヌクレオチドとして、限定するものではないが、5SICS、d5SICS、NaM、dNaM、dTPT3、dMTMO、dCNMO、TAT1およびそれらの組み合わせが挙げられる。いくつかの実施形態では、非天然ヌクレオチド塩基対として、限定するものではないが:
およびその対応するリボ(RNA)を含む。
非天然塩基対(UBP)は、mRNAのコドン配列とtRNAのアンチコドン配列の間に形成され、mRNAの非天然ポリペプチドへの翻訳を促進する。コドン-アンチコドンのUBPは、いくつかの例では、mRNAの5’から3’へ読まれる3つの連続した核酸(例えば、UUX)を含むコドン配列およびtRNAの5’から3’へ読まれる3つの連続した核酸(例えば、YAAまたはXAA)を含むアンチコドン配列を含む。いくつかの実施形態では、mRNAコドンがUUXである場合には、tRNAアンチコドンは、YAAまたはXAAである。いくつかの実施形態では、mRNAコドンがUGXである場合には、tRNAアンチコドンは、YCAまたはXCAである。いくつかの実施形態では、mRNAコドンがCGXである場合には、tRNAアンチコドンは、YCGまたはXCGである。いくつかの実施形態では、mRNAコドンがAGXである場合には、tRNAアンチコドンは、YCUまたはXCUである。いくつかの実施形態では、mRNAコドンがGAXである場合には、tRNAアンチコドンは、YUCまたはXUCである。いくつかの実施形態では、mRNAコドンがCAXである場合には、tRNAアンチコドンは、YUGまたはXUGである。いくつかの実施形態では、mRNAコドンがGXUである場合には、tRNAアンチコドンはAYCである。いくつかの実施形態では、mRNAコドンがCXUである場合には、tRNAアンチコドンはAYGである。いくつかの実施形態では、mRNAコドンがGXGである場合には、tRNAアンチコドンはCYCである。いくつかの実施形態では、mRNAコドンがAXGである場合には、tRNAアンチコドンはCYUである。いくつかの実施形態では、mRNAコドンがGXCである場合には、tRNAアンチコドンはGYCである。いくつかの実施形態では、mRNAコドンがAXCである場合には、tRNAアンチコドンはGYUである。いくつかの実施形態では、mRNAコドンがGXAである場合には、tRNAアンチコドンはUYCである。いくつかの実施形態では、mRNAコドンがCXCである場合には、tRNAアンチコドンはGYGである。いくつかの実施形態では、mRNAコドンがUXCである場合には、tRNAアンチコドンはGYAである。いくつかの実施形態では、mRNAコドンがAUXである場合にはtRNAアンチコドンは、YAUまたはXAUである。いくつかの実施形態では、mRNAコドンがCUXである場合には、tRNAアンチコドンは、XAGまたはYAGである。いくつかの実施形態では、mRNAコドンがUUXである場合には、tRNAアンチコドンは、XAAまたはYAAである。いくつかの実施形態では、mRNAコドンがGUXである場合には、tRNAアンチコドンは、XACまたはYACである。いくつかの実施形態では、mRNAコドンがUAXである場合には、tRNAアンチコドンは、XUAまたはYUAである。いくつかの実施形態では、mRNAコドンがGGXである場合には、tRNAアンチコドンは、XCCまたはYCCである。
天然および非天然アミノ酸
本明細書で使用される場合、アミノ酸残基とは、アミノ基およびカルボキシル基の両方を含む分子を指してもよい。適切なアミノ酸としては、限定するものではないが、天然に存在するアミノ酸のD異性体およびL異性体の両方、ならびに有機合成または任意の他の方法によって調製された天然には存在しないアミノ酸が挙げられる。本明細書で使用される用語アミノ酸としては、限定するものではないが、α-アミノ酸、天然アミノ酸、非天然アミノ酸、およびアミノ酸アナログが挙げられる。
本明細書で使用される場合、アミノ酸残基とは、アミノ基およびカルボキシル基の両方を含む分子を指してもよい。適切なアミノ酸としては、限定するものではないが、天然に存在するアミノ酸のD異性体およびL異性体の両方、ならびに有機合成または任意の他の方法によって調製された天然には存在しないアミノ酸が挙げられる。本明細書で使用される用語アミノ酸としては、限定するものではないが、α-アミノ酸、天然アミノ酸、非天然アミノ酸、およびアミノ酸アナログが挙げられる。
「β-アミノ酸」という用語は、β配置のアミノ基とカルボキシル基の両方を含む分子を指すことができる。
「天然に存在するアミノ酸」とは、自然界で合成されたペプチドに一般的に見出される20のアミノ酸のうちのいずれか1つを指し得、一文字の略語A、R、N、C、D、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y、およびVとして知られる。
次の表は、天然アミノ酸の特性の要約を示している。
「疎水性アミノ酸」としては、小さい疎水性アミノ酸および大きい疎水性アミノ酸が挙げられる。「小さい疎水性アミノ酸」とは、グリシン、アラニン、プロリン、およびそれらのアナログであってもよい。「大きい疎水性アミノ酸」とは、バリン、ロイシン、イソロイシン、フェニルアラニン、メチオニン、トリプトファン、およびそれらのアナログであってもよい。「極性アミノ酸」とは、セリン、トレオニン、アスパラギン、グルタミン、システイン、チロシン、およびそれらのアナログであってもよい。「荷電アミノ酸」は、リシン、アルギニン、ヒスチジン、アスパラギン酸、グルタメート、およびそれらのアナログであってもよい。
「アミノ酸アナログ」とは、アミノ酸に構造的に類似しており、ペプチド模倣大環状分子の形成においてアミノ酸の代わりになり得る分子であり得る。アミノ酸アナログとしては、限定するものではないが、βアミノ酸およびアミノ酸であって、アミノ基またはカルボキシ基が同様に反応性の基で置換されているもの(例えば、第一級アミンの第二級もしくは第三級アミンによる置換、またはカルボキシ基のエステルによる置換)が挙げられる。
「非標準アミノ酸(ncAA)」または「非天然アミノ酸」とは、自然界で合成されたペプチドに一般的に見られる20個のアミノ酸のうちの1つではないアミノ酸であり得、1文字の略語A、R、N、C、D、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y、およびVで知られている。ある場合には、非天然アミノ酸は、非標準アミノ酸のサブセットである。
アミノ酸アナログは、β-アミノ酸アナログを含み得る。β-アミノ酸アナログの例としては、限定するものではないが、以下が挙げられる:環状βアミノ酸アナログ;β-アラニン;(R)-β-フェニルアラニン;(R)-1,2,3,4-テトラヒドロ-イソキノリン-3-酢酸;(R)-3-アミノ-4-(1-ナフチル)-酪酸;(R)-3-アミノ-4-(2,4-ジクロロフェニル)酪酸;(R)-3-アミノ-4-(2-クロロフェニル)-酪酸;(R)-3-アミノ-4-(2-シアノフェニル)-酪酸;(R)-3-アミノ-4-(2-フルオロフェニル)-酪酸;(R)-3-アミノ-4-(2-フリル)-酪酸;(R)-3-アミノ-4-(2-メチルフェニル)-酪酸;(R)-3-アミノ-4-(2-ナフチル)-酪酸;(R)-3-アミノ-4-(2-チエニル)-酪酸;(R)-3-アミノ-4-(2-トリフルオロメチルフェニル)-酪酸;(R)-3-アミノ-4-(3,4-ジクロロフェニル)酪酸;(R)-3-アミノ-4-(3,4-ジフルオロフェニル)酪酸;(R)-3-アミノ-4-(3-ベンゾチエニル)-酪酸;(R)-3-アミノ-4-(3-クロロフェニル)-酪酸;(R)-3-アミノ-4-(3-シアノフェニル)-酪酸;(R)-3-アミノ-4-(3-フルオロフェニル)-酪酸;(R)-3-アミノ-4-(3-メチルフェニル)-酪酸;(R)-3-アミノ-4-(3-ピリジル)-酪酸;(R)-3-アミノ-4-(3-チエニル)-酪酸;(R)-3-アミノ-4-(3-トリフルオロメチルフェニル)-酪酸;(R)-3-アミノ-4-(4-ブロモフェニル)-酪酸;(R)-3-アミノ-4-(4-クロロフェニル)-酪酸;(R)-3-アミノ-4-(4-シアノフェニル)-酪酸;(R)-3-アミノ-4-(4-フルオロフェニル)-酪酸;(R)-3-アミノ-4-(4-ヨードフェニル)-酪酸;(R)-3-アミノ-4-(4-メチルフェニル)-酪酸;(R)-3-アミノ-4-(4-ニトロフェニル)-酪酸;(R)-3-アミノ-4-(4-ピリジル)-酪酸;(R)-3-アミノ-4-(4-トリフルオロメチルフェニル)-酪酸;(R)-3-アミノ-4-ペンタフルオロ-フェニル酪酸;(R)-3-アミノ-5-ヘキセン酸;(R)-3-アミノ-5-ヘキシン酸;(R)-3-アミノ-5-フェニルペンタン酸;(R)-3-アミノ-6-フェニル-5-ヘキセン酸;(S)-1,2,3,4-テトラヒドロ-イソキノリン-3-酢酸;(S)-3-アミノ-4-(1-ナフチル)-酪酸;(S)-3-アミノ-4-(2,4-ジクロロフェニル)酪酸;(S)-3-アミノ-4-(2-クロロフェニル)-酪酸;(S)-3-アミノ-4-(2-シアノフェニル)-酪酸;(S)-3-アミノ-4-(2-フルオロフェニル)-酪酸;(S)-3-アミノ-4-(2-フリル)-酪酸;(S)-3-アミノ-4-(2-メチルフェニル)-酪酸;(S)-3-アミノ-4-(2-ナフチル)-酪酸;(S)-3-アミノ-4-(2-チエニル)-酪酸;(S)-3-アミノ-4-(2-トリフルオロメチルフェニル)-酪酸;(S)-3-アミノ-4-(3,4-ジクロロフェニル)酪酸;(S)-3-アミノ-4-(3,4-ジフルオロフェニル)酪酸;(S)-3-アミノ-4-(3-ベンゾチエニル)-酪酸;(S)-3-アミノ-4-(3-クロロフェニル)-酪酸;(S)-3-アミノ-4-(3-シアノフェニル)-酪酸;(S)-3-アミノ-4-(3-フルオロフェニル)-酪酸;(S)-3-アミノ-4-(3-メチルフェニル)-酪酸;(S)-3-アミノ-4-(3-ピリジル)-酪酸;(S)-3-アミノ-4-(3-チエニル)-酪酸;(S)-3-アミノ-4-(3-トリフルオロメチルフェニル)-酪酸;(S)-3-アミノ-4-(4-ブロモフェニル)-酪酸;(S)-3-アミノ-4-(4-クロロフェニル)酪酸;(S)-3-アミノ-4-(4-シアノフェニル)-酪酸;(S)-3-アミノ-4-(4-フルオロフェニル)酪酸;(S)-3-アミノ-4-(4-ヨードフェニル)-酪酸;(S)-3-アミノ-4-(4-メチルフェニル)-酪酸;(S)-3-アミノ-4-(4-ニトロフェニル)-酪酸;(S)-3-アミノ-4-(4-ピリジル)-酪酸;(S)-3-アミノ-4-(4-トリフルオロメチルフェニル)-酪酸;(S)-3-アミノ-4-ペンタフルオロ-フェニル酪酸;(S)-3-アミノ-5-ヘキセン酸;(S)-3-アミノ-5-ヘキシン酸;(S)-3-アミノ-5-フェニルペンタン酸;(S)-3-アミノ-6-フェニル-5-ヘキセン酸;1,2,5,6-テトラヒドロピリジン-3-カルボン酸;1,2,5,6-テトラヒドロピリジン-4-カルボン酸;3-アミノ-3-(2-クロロフェニル)-プロピオン酸;3-アミノ-3-(2-チエニル)-プロピオン酸;3-アミノ-3-(3-ブロモフェニル)-プロピオン酸;3-アミノ-3-(4-クロロフェニル)-プロピオン酸;3-アミノ-3-(4-メトキシフェニル)-プロピオン酸;3-アミノ-4,4,4-トリフルオロ-酪酸;3-アミノアジピン酸;D-β-フェニルアラニン;β-ロイシン;L-β-ホモアラニン;L-β-ホモアスパラギン酸γ-ベンジルエステル;L-β-ホモグルタミン酸δ-ベンジルエステル;L-β-ホモイソロイシン;L-β-ホモロイシン;L-β-ホモメチオニン;L-β-ホモフェニルアラニン;L-β-ホモプロリン;L-β-ホモトリプトファン;L-β-ホモバリン;L-Nω-ベンジルオキシカルボニル-β-ホモリジン;Nω-L-β-ホモアルギニン;O-ベンジル-L-β-ホモヒドロキシプロリン;O-ベンジル-L-β-ホモセリン;O-ベンジル-L-β-ホモトレオニン;O-ベンジル-L-β-ホモチロシン;γ-トリチル-L-β-ホモアスパラギン;(R)-β-フェニルアラニン;L-β-ホモアスパラギン酸γ-t-ブチルエステル;L-β-ホモグルタミン酸δ-t-ブチルエステル;L-Nω-β-ホモリジン;Nδ-トリチル-L-β-ホモグルタミン;Nω-2,2,4,6,7-ペンタメチル-ジヒドロベンゾフラン-5-スルホニル-L-β-ホモアルギニン;O-t-ブチル-L-β-ホモヒドロキシ-プロリン;O-t-ブチル-L-β-ホモセリン;O-t-ブチル-L-β-ホモトレオニン;O-t-ブチル-L-β-ホモチロシン;2-アミノシクロペンタンカルボン酸;および2-アミノシクロヘキサンカルボン酸。
アミノ酸アナログとしては、アラニン、バリン、グリシンまたはロイシンのアナログが挙げられ得る。アラニン、バリン、グリシン、およびロイシンのアミノ酸アナログの例としては、限定するものではないが、以下が挙げられる:α-メトキシグリシン;α-アリル-L-アラニン;α-アミノイソ酪酸;α-メチル-ロイシン;β-(1-ナフチル)-D-アラニン;β-(1-ナフチル)-L-アラニン;β-(2-ナフチル)-D-アラニン;β-(2-ナフチル)-L-アラニン;β-(2-ピリジル)-D-アラニン;β-(2-ピリジル)-L-アラニン;β-(2-チエニル)-D-アラニン;β-(2-チエニル)-L-アラニン;β-(3-ベンゾチエニル)-D-アラニン;β-(3-ベンゾチエニル)-L-アラニン;β-(3-ピリジル)-D-アラニン;β-(3-ピリジル)-L-アラニン;β-(4-ピリジル)-D-アラニン;β-(4-ピリジル)-L-アラニン;β-クロロ-L-アラニン;β-シアノ-L-アラニン;β-シクロヘキシル-D-アラニン;β-シクロヘキシル-L-アラニン;β-シクロペンテン-1-イル-アラニン;β-シクロペンチル-アラニン;β-シクロプロピル-L-Ala-OH.ジシクロヘキシルアンモニウム塩;β-t-ブチル-D-アラニン;β-t-ブチル-L-アラニン;γ-アミノ酪酸;L-α,β-ジアミノプロピオン酸;2,4-ジニトロフェニルグリシン;2,5-ジヒドロ-D-フェニルグリシン;2-アミノ-4,4,4-トリフルオロ酪酸;2-フルオロ-フェニルグリシン;3-アミノ-4,4,4-トリフルオロ-酪酸;3-フルオロバリン;4,4,4-トリフルオロバリン;4,5-デヒドロ-L-leu-OH.ジシクロヘキシルアンモニウム塩;4-フルオロ-D-フェニルグリシン;4-フルオロ-L-フェニルグリシン;4-ヒドロキシ-D-フェニルグリシン;5,5,5-トリフルオロロイシン;6-アミノヘキサン酸;シクロペンチル-D-Gly-OH.ジシクロヘキシルアンモニウム塩;シクロペンチル-Gly-OH.ジシクロヘキシルアンモニウム塩;D-α,β-ジアミノプロピオン酸;D-α-アミノ酪酸;D-α-t-ブチルグリシン;D-(2-チエニル)グリシン;D-(3-チエニル)グリシン;D-2-アミノカプロン酸;D-2-インダニルグリシン;D-アリルグリシン-ジシクロヘキシルアンモニウム塩;D-シクロヘキシルグリシン;D-ノルバリン;D-フェニルグリシン;β-アミノ酪酸;β-アミノイソ酪酸;(2-ブロモフェニル)グリシン;(2-メトキシフェニル)グリシン;(2-メチルフェニル)グリシン;(2-チアゾイル)グリシン;(2-チエニル)グリシン;2-アミノ-3-(ジメチルアミノ)-プロピオン酸;L-α,β-ジアミノプロピオン酸;L-α-アミノ酪酸;L-α-t-ブチルグリシン;L-(3-チエニル)グリシン;L-2-アミノ-3-(ジメチルアミノ)-プロピオン酸;L-2-アミノカプロン酸ジシクロヘキシル-アンモニウム塩;L-2-インダニルグリシン;L-アリルグリシンジシクロヘキシルアンモニウム塩;L-シクロヘキシルグリシン;L-フェニルグリシン;L-プロパルギルグリシン;L-ノルバリン;N-α-アミノメチル-L-アラニン;D-α,γ-ジアミノ酪酸;L-α,γ-ジアミノ酪酸;β-シクロプロピル-L-アラニン;(N-β-(2,4-ジニトロフェニル))-L-α,β-ジアミノプロピオン酸;(N-β-1-(4,4-ジメチル-2,6-ジオキソシクロヘキサ-1-イリデン)エチル)-D-α,β-ジアミノプロピオン酸;(N-β-1-(4,4-ジメチル-2,6-ジオキソシクロヘキサ-1-イリデン)エチル)-L-α,β-ジアミノプロピオン酸;(N-β-4-メチルトリチル)-L-α,β-ジアミノプロピオン酸;(N-β-アリルオキシカルボニル)-L-α,β-ジアミノプロピオン酸;(N-γ-1-(4,4-ジメチル-2,6-ジオキソシクロヘキサ-1-イリデン)エチル)-D-α,γ-ジアミノ酪酸;(N-γ-1-(4,4-ジメチル-2,6-ジオキソシクロヘキサ-1-イリデン)エチル)-L-α,γ-ジアミノ酪酸;(N-γ-4-メチルトリチル)-D-α,γ-ジアミノ酪酸;(N-γ-4-メチルトリチル)-L-α,γ-ジアミノ酪酸;(N-γ-アリルオキシカルボニル)-L-α,γ-ジアミノ酪酸;D-α,γ-ジアミノ酪酸;4,5-デヒドロ-L-ロイシン;シクロペンチル-D-Gly-OH;シクロペンチル-Gly-OH;D-アリルグリシン;D-ホモシクロヘキシルアラニン;L-1-ピレニルアラニン;L-2-アミノカプロン酸;L-アリルグリシン;L-ホモシクロヘキシルアラニン;およびN-(2-ヒドロキシ-4-メトキシ-Bzl)-Gly-OH。
アミノ酸アナログとしては、アルギニンまたはリジンのアナログが挙げられ得る。アルギニンおよびリジンのアミノ酸アナログの例としては、限定するものではないが、以下が挙げられる:シトルリン;L-2-アミノ-3-グアニジノプロピオン酸;L-2-アミノ-3-ウレイドプロピオン酸;L-シトルリン;Lys(Me)2-OH;Lys(N3)-OH;Nδ-ベンジルオキシカルボニル-L-オルニチン;Nω-ニトロ-D-アルギニン;Nω-ニトロ-L-アルギニン;α-メチルオルニチン;2,6-ジアミノヘプタンジオン酸;L-オルニチン;(Nδ-1-(4,4-ジメチル-2,6-ジオキソ-シクロヘキサ-1-イリデン)エチル)-D-オルニチン;(Nδ-1-(4,4-ジメチル-2,6-ジオキソ-シクロヘキセン-1-イリデン)エチル)-L-オルニチン;(Nδ-4-メチルトリチル)-D-オルニチン;(Nδ-4-メチルトリチル)-L-オルニチン;D-オルニチン;L-オルニチン;Arg(Me)(Pbf)-OH;Arg(Me)2-OH(非対称);Arg(Me)2-OH(対称);Lys(ivDde)-OH;Lys(Me)2-OH.HCl;Lys(Me3)-OHクロリド;Nω-ニトロ-D-アルギニン;およびNω-ニトロ-L-アルギニン。
アミノ酸アナログとしては、アスパラギン酸またはグルタミン酸のアナログが挙げられ得る。アスパラギン酸およびグルタミン酸のアミノ酸アナログの例としては、限定するものではないが、以下が挙げられる:α-メチル-D-アスパラギン酸;α-メチル-グルタミン酸;α-メチル-L-アスパラギン酸;γ-メチレン-グルタミン酸;(N-γ-エチル)-L-グルタミン;[N-α-(4-アミノベンゾイル)]-L-グルタミン酸;2,6-ジアミノピメリン酸;L-α-アミノスベリン酸;D-2-アミノアジピン酸;D-α-アミノスベリン酸;α-アミノピメリン酸;イミノ二酢酸;L-2-アミノアジピン酸;スレオ-β-メチル-アスパラギン酸;γ-カルボキシ-D-グルタミン酸γ,γ-ジ-t-ブチルエステル;γ-カルボキシ-L-グルタミン酸γ,γ-ジ-t-ブチルエステル;Glu(OAll)-OH;L-Asu(OtBu)-OH;およびピログルタミン酸。
アミノ酸アナログは、システインおよびメチオニンのアナログを含み得る。システインおよびメチオニンのアミノ酸アナログの例としては、限定するものではないが:Cys(ファルネシル)-OH、Cys(ファルネシル)-OMe、α-メチル-メチオニン、Cys(2-ヒドロキシエチル)-OH、Cys(3-アミノプロピル)-OH、2-アミノ-4-(エチルチオ)酪酸、ブチオニン、ブチオニンスルホキシミン、エチオニン、メチオニンメチルスルホニウムクロリド、セレノメチオニン、システイン酸、[2-(4-ピリジル)エチル]-DL-ペニシラミン、[2-(4-ピリジル)エチル]-L-システイン、4-メトキシベンジル-D-ペニシラミン、4-メトキシベンジル-L-ペニシラミン、4-メチルベンジル-D-ペニシラミン、4-メチルベンジル-L-ペニシラミン、ベンジル-D-システイン、ベンジル-L-システイン、ベンジル-DL-ホモシステイン、カルバモイル-L-システイン、カルボキシエチル-L-システイン、カルボキシメチル-L-システイン、ジフェニルメチル-L-システイン、エチル-L-システイン、メチル-L-システイン、t-ブチル-D-システイン、トリチル-L-ホモシステイン、トリチル-D-ペニシラミン、シスタチオニン、ホモシスチン、L-ホモシスチン、(2-アミノエチル)-L-システイン、セレノ-L-シスチン、シスタチオニン、Cys(StBu)-OH、およびアセトアミドメチル-D-ペニシラミン、が挙げられる。
アミノ酸アナログとしては、フェニルアラニンおよびチロシンのアナログが挙げられ得る。フェニルアラニンおよびチロシンのアミノ酸アナログの例としては:β-メチル-フェニルアラニン、β-ヒドロキシフェニルアラニン、α-メチル-3-メトキシ-DL-フェニルアラニン、α-メチル-D-フェニルアラニン、α-メチル-L-フェニルアラニン、1,2,3,4-テトラヒドロイソキノリン-3-カルボン酸、2,4-ジクロロ-フェニルアラニン、2-(トリフルオロメチル)-D-フェニルアラニン、2-(トリフルオロメチル)-L-フェニルアラニン、2-ブロモ-D-フェニルアラニン、2-ブロモ-L-フェニルアラニン、2-クロロ-D-フェニルアラニン、2-クロロ-L-フェニルアラニン、2-シアノ-D-フェニルアラニン、2-シアノ-L-フェニルアラニン、2-フルオロ-D-フェニルアラニン、2-フルオロ-L-フェニルアラニン、2-メチル-D-フェニルアラニン、2-メチル-L-フェニルアラニン、2-ニトロ-D-フェニルアラニン、2-ニトロ-L-フェニルアラニン、2,4,5-トリヒドロキシ-フェニルアラニン、3,4,5-トリフルオロ-D-フェニルアラニン、3,4,5-トリフルオロ-L-フェニルアラニン、3,4-ジクロロ-D-フェニルアラニン、3,4-ジクロロ-L-フェニルアラニン、3,4-ジフルオロ-D-フェニルアラニン、3,4-ジフルオロ-L-フェニルアラニン、3,4-ジヒドロキシ-L-フェニルアラニン、3,4-ジメトキシ-L-フェニルアラニン、3,5,3’-トリヨード-L-チロニン、3,5-ジヨード-D-チロシン、3,5-ジヨード-L-チロシン、3,5-ジヨード-L-チロニン、3-(トリフルオロメチル)-D-フェニルアラニン、3-(トリフルオロメチル)-L-フェニルアラニン、3-アミノ-L-チロシン、3-ブロモ-D-フェニルアラニン、3-ブロモ-L-フェニルアラニン、3-クロロ-D-フェニルアラニン、3-クロロ-L-フェニルアラニン、3-クロロ-L-チロシン、3-シアノ-D-フェニルアラニン、3-シアノ-L-フェニルアラニン、3-フルオロ-D-フェニルアラニン、3-フルオロ-L-フェニルアラニン、3-フルオロ-チロシン、3-ヨード-D-フェニルアラニン、3-ヨード-L-フェニルアラニン、3-ヨード-L-チロシン、3-メトキシ-L-チロシン、3-メチル-D-フェニルアラニン、3-メチル-L-フェニルアラニン、3-ニトロ-D-フェニルアラニン、3-ニトロ-L-フェニルアラニン、3-ニトロ-L-チロシン、4-(トリフルオロメチル)-D-フェニルアラニン、4-(トリフルオロメチル)-L-フェニルアラニン、4-アミノ-D-フェニルアラニン、4-アミノ-L-フェニルアラニン、4-ベンゾイル-D-フェニルアラニン、4-ベンゾイル-L-フェニルアラニン、4-ビス(2-クロロエチル)アミノ-L-フェニルアラニン、4-ブロモ-D-フェニルアラニン、4-ブロモ-L-フェニルアラニン、4-クロロ-D-フェニルアラニン、4-クロロ-L-フェニルアラニン、4-シアノ-D-フェニルアラニン、4-シアノ-L-フェニルアラニン、4-フルオロ-D-フェニルアラニン、4-フルオロ-L-フェニルアラニン、4-ヨード-D-フェニルアラニン、4-ヨード-L-フェニルアラニン、ホモフェニルアラニン、チロキシン、3,3-ジフェニルアラニン、チロニン、エチル-チロシン、およびメチルチロシン、が挙げられる。
アミノ酸アナログとしては、プロリンのアナログが挙げられ得る。プロリンのアミノ酸アナログの例としては、限定するものではないが:3,4-デヒドロ-プロリン、4-フルオロ-プロリン、シス-4-ヒドロキシ-プロリン、チアゾリジン-2-カルボン酸、およびトランス-4-フルオロ-プロリン、が挙げられる。
アミノ酸アナログとしては、セリンおよびトレオニンのアナログが挙げられ得る。セリンおよびトレオニンのアミノ酸アナログの例としては、限定するものではないが:3-アミノ-2-ヒドロキシ-5-メチルヘキサン酸、2-アミノ-3-ヒドロキシ-4-メチルペンタン酸、2-アミノ-3-エトキシブタン酸、2-アミノ-3-メトキシブタン酸、4-アミノ-3-ヒドロキシ-6-メチルヘプタン酸、2-アミノ-3-ベンジルオキシプロピオン酸、2-アミノ-3-ベンジルオキシプロピオン酸、2-アミノ-3-エトキシプロピオン酸、4-アミノ-3-ヒドロキシブタン酸、およびα-メチルセリン、が挙げられる。
アミノ酸アナログとしては、トリプトファンのアナログが挙げられ得る。トリプトファンのアミノ酸アナログの例としては、限定するものではないが、以下が挙げられる:α-メチル-トリプトファン;β-(3-ベンゾチエニル)-D-アラニン;β-(3-ベンゾチエニル)-L-アラニン;1-メチル-トリプトファン;4-メチル-トリプトファン;5-ベンジルオキシ-トリプトファン;5-ブロモ-トリプトファン;5-クロロ-トリプトファン;5-フルオロ-トリプトファン;5-ヒドロキシトリプトファン;5-ヒドロキシ-L-トリプトファン;5-メトキシ-トリプトファン;5-メトキシ-L-トリプトファン;5-メチル-トリプトファン;6-ブロモ-トリプトファン;6-クロロ-D-トリプトファン;6-クロロ-トリプトファン;6-フルオロ-トリプトファン;6-メチル-トリプトファン;7-ベンジルオキシ-トリプトファン;7-ブロモ-トリプトファン;7-メチル-トリプトファン;D-1,2,3,4-テトラヒドロ-ノルハルマン-3-カルボン酸;6-メトキシ-1,2,3,4-テトラヒドロノルハルマン-1-カルボン酸;7-アザトリプトファン;L-1,2,3,4-テトラヒドロ-ノルハルマン-3-カルボン酸;5-メトキシ-2-メチル-トリプトファン;および6-クロロ-L-トリプトファン。
アミノ酸アナログはラセミ体であってもよい。場合によっては、アミノ酸アナログのD異性体が使用される。場合によっては、アミノ酸アナログのL異性体が用いられる。場合によっては、アミノ酸アナログは、RまたはS配置にあるキラル中心を含む。時には、β-アミノ酸アナログのアミノ基は、保護基、例えば、tert-ブチルオキシカルボニル(BOC基)、9-フルオレニルメチルオキシカルボニル(FMOC)、トシルなどで置換される。時には、β-アミノ酸アナログのカルボン酸官能基は、例えば、そのエステル誘導体として保護されている。場合によっては、アミノ酸アナログの塩が使用される。
いくつかの実施形態では、非天然アミノ酸は、Liu C.C.,Schultz、P.G.Annu.Rev.Biochem.2010,79,413に記載される非天然アミノ酸である。いくつかの実施形態では、非天然アミノ酸は、N6((2-アジドエトキシ)-カルボニル)-L-リジンを含む。
いくつかの実施形態では、本明細書に記載のアミノ酸残基(例えば、タンパク質内)は、コンジュゲート部分に結合する前に、非天然アミノ酸に変異される。場合によっては、非天然アミノ酸への変異は、免疫系の自己抗原応答を防止または最小化する。本明細書で使用される場合、「非天然アミノ酸」という用語は、タンパク質中に天然に存在する20個のアミノ酸以外のアミノ酸を指す。非天然アミノ酸の非限定的な例としては:p-アセチル-L-フェニルアラニン、p-ヨード-L-フェニルアラニン、p-メトキシフェニルアラニン、O-メチル-L-チロシン、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、L-3-(2-ナフチル)アラニン、3-メチル-フェニルアラニン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ドーパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、p-ボロノフェニルアラニン、O-プロパルギルチロシン、L-ホスホセリン、ホスホノセリン、ホスホノチロシン、p-ブロモフェニルアラニン、セレノシステイン、p-アミノ-L-フェニルアラニン、イソプロピル-L-フェニルアラニン、N6-((アジドエトキシ)-カルボニル)-L-リジン、AzK)、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジン、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジン、またはN6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジン、チロシンアミノ酸の非天然アナログ;グルタミンアミノ酸の非天然アナログ;フェニルアラニンアミノ酸の非天然アナログ;セリンアミノ酸の非天然アナログ;トレオニンアミノ酸の非天然アナログ;アルキル、アリール、アシル、アジド、シアノ、ハロ、ヒドラジン、ヒドラジド、ヒドロキシル、アルケニル、アルキニル、エーテル、チオール、スルホニル、セレノ、エステル、チオ酸、ホウ酸塩、ボロネート、ホスホ、ホスホノ、ホスフィン、複素環式、エノン、イミン、アルデヒド、ヒドロキシルアミン、ケト、もしくはアミノ置換アミノ酸、またはそれらの組み合わせ;光活性化可能な架橋剤を有するアミノ酸;スピン標識アミノ酸;蛍光アミノ酸;金属結合アミノ酸;金属含有アミノ酸;放射性アミノ酸;光ケージおよび/または光異性化可能なアミノ酸;アミノ酸を含むビオチンまたはビオチンアナログ;アミノ酸を含むケト;ポリエチレングリコールまたはポリエーテルを含むアミノ酸;重原子置換アミノ酸;化学的に切断可能なまたは光切断可能なアミノ酸;細長い側鎖を有するアミノ酸;毒性基を含むアミノ酸;糖置換アミノ酸;炭素結合糖含有アミノ酸;酸化還元活性アミノ酸;α-ヒドロキシ含有酸;アミノチオ酸;α,α二置換アミノ酸;β-アミノ酸;プロリンまたはヒスチジン以外の環状アミノ酸、およびフェニルアラニン、チロシンまたはトリプトファン以外の芳香族アミノ酸、が挙げられる。
いくつかの実施形態では、非天然アミノ酸は、選択的反応性基、または標的タンパク質もしくはポリペプチドの部位選択的標識のための反応性基を含む。場合によっては、化学反応は、双直交反応(例えば、生体適合性および選択的反応)である。場合によっては、化学反応は、Cu(I)触媒または「銅を含まない」アルキンアジドトリアゾール形成反応、Staudingerライゲーション、逆電子要求Diels-Alder(IEDDA)反応、「フォトクリック」化学、またはオレフィンメタセシスおよび鈴木-宮浦または薗頭クロスカップリングなどの金属媒介プロセスである。いくつかの実施形態では、非天然アミノ酸は、例えば、UVでの照射時に架橋する光反応性基を含む。いくつかの実施形態では、非天然アミノ酸は、光ケージアミノ酸を含む。場合によっては、非天然アミノ酸は、パラ置換、メタ置換、またはオルト置換アミノ酸誘導体である。
場合によっては、非天然アミノ酸は、p-アセチル-L-フェニルアラニン、p-アジドメチル-L-フェニルアラニン(pAMF)、p-ヨード-L-フェニルアラニン、O-メチル-L-チロシン、p-メトキシフェニルアラニン、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、L-3-(2-ナフチル)アラニン、3-メチル-フェニルアラニン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ドーパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、L-ホスホセリン、ホスホノセリン、ホスホノチロシン、p-ブロモフェニルアラニン、p-アミノ-L-フェニルアラニン、またはイソプロピル-L-フェニルアラニンを含む。
場合によっては、非天然アミノ酸は、3-アミノチロシン、3-ニトロチロシン、3,4-ジヒドロキシ-フェニルアラニン、または3-ヨードチロシンである。場合によっては、非天然アミノ酸は、フェニルセレノシステインである。場合によっては、非天然アミノ酸は、ベンゾフェノン、ケトン、ヨウ化物、メトキシ、アセチル、ベンゾイル、またはアジド(フェニルアラニン誘導体を含む)である。場合によっては、非天然アミノ酸は、ベンゾフェノン、ケトン、ヨウ化物、メトキシ、アセチル、ベンゾイル、またはアジド含有リジン誘導体である。場合によっては、非天然アミノ酸は、芳香族側鎖を含む。場合によっては、非天然アミノ酸は、芳香族側鎖を含まない。場合によっては、非天然アミノ酸は、アジド基を含む。場合によっては、非天然アミノ酸は、マイケルアクセプター基を含む。場合によっては、マイケル受容体基は、1,2-付加反応を介して共有結合を形成し得る不飽和部分を含む。場合によっては、マイケルアクセプター基は、電子不足のアルケンまたはアルキンを含む。場合によっては、マイケルアクセプター基としては、限定するものではないが、アルファ、ベータ不飽和:ケトン、アルデヒド、スルホキシド、スルホン、ニトリル、イミン、または芳香族が挙げられる。場合によっては、非天然アミノ酸は、デヒドロアラニンである。場合によっては、非天然アミノ酸は、アルデヒドまたはケトン基を含む。場合によっては、非天然アミノ酸は、アルデヒドまたはケトン基を含むリジン誘導体である。場合によっては、非天然アミノ酸は、ベータ、ガンマ、またはデルタ位置に1つまたはそれ以上のO、N、Se、またはS原子を含むリジン誘導体である。場合によっては、非天然アミノ酸は、ガンマ位置にO、N、Se、またはS原子を含むリジン誘導体である。場合によっては、非天然アミノ酸は、イプシロンN原子が酸素原子で置き換えられているリジン誘導体である。場合によっては、非天然アミノ酸は、天然には存在しない翻訳後修飾されたリジンであるリジン誘導体である。
場合によっては、非天然アミノ酸は、側鎖を含むアミノ酸であり、アルファ位置から6番目の原子は、カルボニル基を含む。場合によっては、非天然アミノ酸は側鎖を含むアミノ酸であり、アルファ位置から6番目の原子はカルボニル基を含み、アルファ位置から5番目の原子は窒素である。場合によっては、非天然アミノ酸は側鎖を含むアミノ酸であり、アルファ位置から7番目の原子は酸素原子である。
場合によっては、非天然アミノ酸は、セレンを含むセリン誘導体である。場合によっては、非天然アミノ酸はセレノセリン(2-アミノ-3-ヒドロセレノプロパン酸)である。場合によっては、非天然アミノ酸は、2-アミノ-3-((2-((3-(ベンジルオキシ)-3-オキソプロピル)アミノ)エチル)セラニル)プロパン酸である。場合によっては、非天然アミノ酸は、2-アミノ-3-(フェニルセラニル)プロパン酸である。場合によっては、非天然アミノ酸はセレンを含み、セレンの酸化は、アルケンを含む非天然アミノ酸の形成をもたらす。
場合によっては、非天然アミノ酸はシクロオクチニル基を含む。場合によっては、非天然アミノ酸はトランスシクロクテニル基を含む。場合によっては、非天然アミノ酸はノルボルネニル基を含む。場合によっては、非天然アミノ酸は、シクロプロペニル基を含む。場合によっては、非天然アミノ酸は、ジアジリン基を含む。場合によっては、非天然アミノ酸は、テトラジン基を含む。
場合によっては、非天然アミノ酸は、側鎖窒素がカルバミル化されているリジン誘導体である。場合によっては、非天然アミノ酸はリジン誘導体であり、側鎖窒素がアシル化されている。場合によっては、非天然アミノ酸は、2-アミノ-6-{[(tert-ブトキシ)カルボニル]アミノ}ヘキサン酸である。場合によっては、非天然アミノ酸は、2-アミノ-6-{[(tert-ブトキシ)カルボニル]アミノ}ヘキサン酸である。場合によっては、非天然アミノ酸は、N6-Boc-N6-メチルリジンである。場合によっては、非天然アミノ酸は、N6-アセチルリジンである。場合によっては、非天然アミノ酸は、ピロリシンである。場合によっては、非天然アミノ酸は、N6-トリフルオロアセチルリジンである。場合によっては、非天然アミノ酸は、2-アミノ-6-{[(ベンジルオキシ)カルボニル]アミノ}ヘキサン酸である。場合によっては、非天然アミノ酸は、2-アミノ-6-{[(p-ヨードベンジルオキシ)カルボニル]アミノ}ヘキサン酸である。場合によっては、非天然アミノ酸は、2-アミノ-6-{[(p-ニトロベンジルオキシ)カルボニル]アミノ}ヘキサン酸である。場合によっては、非天然アミノ酸は、N6-プロリルリジンである。場合によっては、非天然アミノ酸は、2-アミノ-6-{[(シクロペンチルオキシ)カルボニル]アミノ}ヘキサン酸である。場合によっては、非天然アミノ酸は、N6-(シクロペンタンカルボニル)リジンである。場合によっては、非天然アミノ酸は、N6-(テトラヒドロフラン-2-カルボニル)リジンである。場合によっては、非天然アミノ酸は、N6-(3-エチニルテトラヒドロフラン-2-カルボニル)リジンである。場合によっては、非天然アミノ酸は、N6-((プロパ-2-イン-1-イルオキシ)カルボニル)リジンである。場合によっては、非天然アミノ酸は、2-アミノ-6-{[(2-アジドシクロペンチルオキシ)カルボニル]アミノ}ヘキサン酸である。場合によっては、非天然アミノ酸は、N6-((2-アジドエトキシ)カルボニル)リジンである。場合によっては、非天然アミノ酸は、2-アミノ-6-{[(2-ニトロベンジルオキシ)カルボニル]アミノ}ヘキサン酸である。場合によっては、非天然アミノ酸は、2-アミノ-6-{[(2-シクロオクチニルオキシ)カルボニル]アミノ}ヘキサン酸である。場合によっては、非天然アミノ酸は、N6-(2-アミノブタ-3-イノイル)リジンである。場合によっては、非天然アミノ酸は、2-アミノ-6-((2-アミノブタ-3-イノイル)オキシ)ヘキサン酸である。場合によっては、非天然アミノ酸は、N6-(アリルオキシカルボニル)リジンである。場合によっては、非天然アミノ酸は、N6-(ブテニル-4-オキシカルボニル)リジンである。場合によっては、非天然アミノ酸は、N6-(ペンテニル-5-オキシカルボニル)リジンである。場合によっては、非天然アミノ酸は、N6-((ブタ-3-イン-1-イルオキシ)カルボニル)-リジンである。場合によっては、非天然アミノ酸は、N6-((ペンタ-4-イン-1-イルオキシ)カルボニル)-リジンである。場合によっては、非天然アミノ酸は、N6-(チアゾリジン-4-カルボニル)リジンである。場合によっては、非天然アミノ酸は、2-アミノ-8-オキソノナン酸である。場合によっては、非天然アミノ酸は、2-アミノ-8-オキソオクタン酸である。場合によっては、非天然アミノ酸は、N6-(2-オキソアセチル)リジンである。
場合によっては、非天然アミノ酸は、N6-プロピオニルリジンである。場合によっては、非天然アミノ酸は、N6-ブチリルリジンである。場合によっては、非天然アミノ酸は、N6-(ブタ-2-エノイル)リジンである。場合によっては、非天然アミノ酸は、N6-((ビシクロ[2.2.1]ヘプタ-5-エン-2-イルオキシ)カルボニル)リジンである。場合によっては、非天然アミノ酸は、N6-((スピロ[2.3]ヘキサ-1-エン-5-イルメトキシ)カルボニル)リジンである。場合によっては、非天然アミノ酸は、N6-(((4-(1-(トリフルオロメチル)シクロプロパ-2-エン-1-イル)ベンジル)オキシ)カルボニル)リジンである。場合によっては、非天然アミノ酸は、N6-((ビシクロ[2.2.1]ヘプタ-5-エン-2-イルメトキシ)カルボニル)リジンである。場合によっては、非天然アミノ酸は、システイニルリジンである。場合によっては、非天然アミノ酸は、N6-((1-(6-ニトロベンゾ[d][1,3]ジオキソール-5-イル)エトキシ)カルボニル)リジンである。場合によっては、非天然アミノ酸は、N6-((2-(3-メチル-3H-ジアジリン-3-イル)エトキシ)カルボニル)リジンである。場合によっては、非天然アミノ酸は、N6-((3-(3-メチル-3H-ジアジリン-3-イル)プロポキシ)カルボニル)リジンである。場合によっては、非天然アミノ酸は、N6-((メタニトロベニルオキシ)N6-メチルカルボニル)リジンである。場合によっては、非天然アミノ酸は、N6-((ビシクロ[6.1.0]ノン-4-イン-9-イルメトキシ)カルボニル)-リジンである。場合によっては、非天然アミノ酸は、N6-((シクロヘプタ-3-エン-1-イルオキシ)カルボニル)-L-リジンである。
いくつかの実施形態では、非天然アミノ酸は、非天然ヌクレオチドを含む非天然コドンによってタンパク質に組み込まれる。
場合によっては、タンパク質への非天然アミノ酸の取り込みは、直交する改変されたシンテターゼ/tRNAの対によって媒介される。そのような直交性対は、非天然tRNAに特定の非天然アミノ酸をチャージし得る天然または変異シンテターゼを含み、一方で、しばしばa)他の内因性アミノ酸または代替の非天然アミノ酸の非天然tRNAへのチャージおよびb)任意の他の(内因性を含む)tRNAのチャージを最小限にする。このような直交性の対は、内因性シンテターゼによって他の内因性アミノ酸がチャージされるのを避けながら、シンテターゼによってチャージされ得るtRNAを含む。いくつかの実施形態では、そのような対は、細菌、酵母、古細菌、またはヒト源などの様々な生物から同定される。いくつかの実施形態では、直交性シンテターゼ/tRNAの対は、単一の生物由来の構成成分を含む。いくつかの実施形態では、直交性シンテターゼ/tRNA対は、2つの異なる生物由来の構成成分を含む。いくつかの実施形態では、直交性シンテターゼ/tRNA対は、修飾の前に、異なるアミノ酸の翻訳を促進する構成成分を含む。いくつかの実施形態では、直交性シンテターゼは、改変されたアラニンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたアルギニンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたアスパラギンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたアスパラギン酸シンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたシステインシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたグルタミンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたグルタミン酸シンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたアラニングリシンである。いくつかの実施形態では、直交性シンテターゼは、改変されたヒスチジンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたロイシンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたイソロイシンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたリジンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたメチオニンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたフェニルアラニンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたプロリンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたセリンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたトレオニンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたトリプトファンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたチロシンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたバリンシンテターゼである。いくつかの実施形態では、直交性シンテターゼは、改変されたホスホセリンシンテターゼである。いくつかの実施形態では、直交性tRNAは、改変されたアラニンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたアルギニンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたアスパラギンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたアスパラギン酸tRNAである。いくつかの実施形態では、直交性tRNAは、改変されたシステインtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたグルタミンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたグルタミン酸tRNAである。いくつかの実施形態では、直交性tRNAは、改変されたアラニングリシンである。いくつかの実施形態では、直交性tRNAは、改変されたヒスチジンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたロイシンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたイソロイシンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたリジンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたメチオニンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたフェニルアラニンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたプロリンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたセリンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたトレオニンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたトリプトファンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたチロシンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたバリンtRNAである。いくつかの実施形態では、直交性tRNAは、改変されたホスホセリンtRNAである。
いくつかの実施形態では、非天然アミノ酸は、アミノアシル(aaRSまたはRS)-tRNAシンテターゼ-tRNA対によってタンパク質に組み込まれる。例示的なaaRS-tRNA対としては、限定するものではないが、Methanococcus jannaschii(Mj-Tyr)aaRS/tRNA対、E.coli TyrRS(Ec-Tyr)/B.stearothermophilus tRNACUA対、E.coli LeuRS(Ec-Leu)/B.stearothermophilus tRNACUA対、およびピロリシル-tRNA対が挙げられる。場合によっては、非天然アミノ酸は、Mj-TyrRS/tRNA対によってタンパク質に組み込まれる。Mj-TyrRS/tRNA対によって組み込まれ得る例示的な非天然アミノ酸(UAA)としては、限定するものではないが、パラ置換フェニルアラニン誘導体、例えば、p-アミノフェニルアラニンおよびp-メトイフェニルアラニン;メタ置換チロシン誘導体、例えば、3-アミノチロシン、3-ニトロチロシン、3,4-ジヒドロキシフェニルアラニン、および3-ヨードチロシン;フェニルセレノシステイン;p-ボロノフェニルアラニン;およびo-ニトロベンジルチロシンが挙げられる。
場合によっては、非天然アミノ酸は、Ec-Tyr/tRNACUAまたはEc-Leu/tRNACUA対によってタンパク質に組み込まれる。Ec-Tyr/tRNACUAまたはEc-Leu/tRNACUA対によって組み込まれ得る例示的なUAAとしては、限定するものではないが、ベンゾフェノン、ケトン、ヨウ化物、またはアジド置換を含むフェニルアラニン誘導体;O-プロパルギルチロシン;α-アミノカプリル酸、O-メチルチロシン、O-ニトロベンジルシステイン;および3-(ナフタレン-2-イルアミノ)-2-アミノ-プロパン酸が挙げられる。
場合によっては、非天然アミノ酸は、ピロリシル-tRNA対によってタンパク質に組み込まれる。場合によっては、PylRSは、メタン生成細菌などの古細菌種から得られる。場合によっては、PylRSは、Methanosarcina barkeri、Methanosarcina mazei、またはMethanosarcina acetivoransから取得される。ピロリシル-tRNA対によって組み込むことができる例示的なUAAとしては、限定するものではないが、アミドおよびカルバメート置換リジン、例えば、2-アミノ-6-((R)-テトラヒドロフラン-2-カルボキサミド)ヘキサン酸、N-ε-D-プロリル-L-リジン、およびN-ε-シクロペンチルオキシカルボニル-L-リジン;N-ε-アクリロイル-L-リジン;N-ε-[(1-(6-ニトロベンゾ[d][1,3]ジオキソール-5-イル)エトキシ)カルボニル]-L-リジン;およびN-ε-(1-メチルシクロプロ-2-エンカルボキサミド)リジンが挙げられる。
場合によっては、非天然アミノ酸は、米国特許第9,988,619号および米国特許第9,938,516号に開示されているシンテターゼによって本明細書に記載のタンパク質に組み込まれる。そのようなシンテターゼによって組み込むことができる例示的なUAAとしては、パラ-メチルアジド-L-フェニルアラニン、アラルキル、ヘテロシクリル、ヘテロアラルキル非天然アミノ酸などが挙げられる。いくつかの実施形態では、そのようなUAAは、ピリジル、ピラジニル、ピラゾリル、トリアゾリル、オキサゾリル、チアゾリル、チオフェニル、または他の複素環を含む。いくつかの実施形態におけるそのようなアミノ酸は、アジド、テトラジン、または水溶性部分などのカップリングパートナーにコンジュゲーションし得る他の化学基を含む。いくつかの実施形態では、そのようなシンテターゼは、インビボでタンパク質にUAAを組み込むために発現され、使用される。いくつかの実施形態では、そのようなシンテターゼは、細胞溶解物または精製された構成成分の、再構成された系のような無細胞翻訳系を使用して、UAAをタンパク質に組み込むために使用される。無細胞系において、または前もって別個の反応において、tRNAを非天然アミノ酸でチャージできる(その結果、チャージされたtRNAが、リボソーム、mRNAおよび他の構成成分を含む系に直接的に添加され、系にシンテターゼまたはシンテターゼをコードする構築物を添加する必要がない)。
インビトロ翻訳のための系は、例えば、Zeenkoら、RNA 14:593~602頁(2008);Spirin、Trends Biotechnol. 2004:538~545頁(2004);およびEndoら、Curr. Opin. Biotechnol. 17:373~380頁(2006)に記載されている。系は、細胞溶解物(例えば、抽出物)から製造できる、または精製された構成成分から再構成できる。系は、リボソーム、tRNAおよび本明細書に記載される他の構成成分に加えて、1つまたはそれ以上の翻訳開始因子;ATP;および1つまたはそれ以上の翻訳終結因子を含み得る。いくつかの実施形態では、系は、1つまたはそれ以上の分子シャペロンをさらに含み、これは翻訳の間および/または翻訳後に新生ポリペプチドのフォールディングを補助できる。
場合によっては、非天然アミノ酸は、天然に存在するシンテターゼによって本明細書に記載のタンパク質に組み込まれる。いくつかの実施形態では、非天然アミノ酸は、1つまたはそれ以上のアミノ酸に対して栄養要求性である生物によってタンパク質に組み込まれる。いくつかの実施形態では、栄養要求性アミノ酸に対応するシンテターゼは、対応するtRNAに非天然アミノ酸をチャージし得る。いくつかの実施形態では、非天然アミノ酸は、セレノシステインまたはその誘導体である。いくつかの実施形態では、非天然アミノ酸は、セレノメチオニンまたはその誘導体である。いくつかの実施形態では、非天然アミノ酸は、芳香族アミノ酸であり、芳香族アミノ酸は、ヨウ化物などのハロゲン化アリールを含む。実施形態では、非天然アミノ酸は、栄養要求性アミノ酸と構造的に類似している。
場合によっては、非天然アミノ酸は、図4Aに示される非天然アミノ酸を含む。
場合によっては、非天然アミノ酸は、リジンまたはフェニルアラニン誘導体またはアナログを含む。場合によっては、非天然アミノ酸は、リジン誘導体またはリジンアナログを含む。場合によっては、非天然アミノ酸は、ピロリシン(Pyl)を含む。場合によっては、非天然アミノ酸は、フェニルアラニン誘導体またはフェニルアラニンアナログを含む。場合によっては、非天然アミノ酸は、Wanらの「ピロリシル-tRNAシンテターゼ:通常の酵素であるが、優れた遺伝子コード拡張ツール(Pyrrolysyl-tRNA synthetase: an ordinary enzyme but an outstanding genetic code expansion tool)」,Biocheim Biophys Aceta 1844(6):1059-4070(2014)に記載されている非天然アミノ酸である。場合によっては、非天然アミノ酸は、図4Bおよび図4Cに示される非天然アミノ酸を含む。
いくつかの実施形態では、非天然アミノ酸は、図4D~図4Gに示される非天然アミノ酸を含む。(Dumasら、Chemical Science 2015,6,50-69の表1から採用)。
いくつかの実施形態では、本明細書に記載のタンパク質に組み込まれた非天然アミノ酸は、米国特許第9,840,493号;米国特許第9,682,934号;米国特許出願公開第2017/0260137号;米国特許第9,938,516号;または米国特許出願公開第2018/0086734号に開示されている。そのようなシンテターゼによって組み込まれ得る例示的なUAAとしては、パラ-メチルアジド-L-フェニルアラニン、アラルキル、ヘテロシクリル、およびヘテロアラルキル、ならびにリジン誘導体の非天然アミノ酸が挙げられる。いくつかの実施形態では、そのようなUAAは、ピリジル、ピラジニル、ピラゾリル、トリアゾリル、オキサゾリル、チアゾリル、チオフェニル、または他の複素環を含む。いくつかの実施形態におけるそのようなアミノ酸は、アジド、テトラジン、または水溶性部分などのカップリングパートナーに結合し得る他の化学基を含む。いくつかの実施形態では、UAAは、アルキルリンカーを介して芳香族部分に結合されたアジドを含む。いくつかの実施形態では、アルキルリンカーは、C1-C10リンカーである。いくつかの実施形態では、UAAは、アルキルリンカーを介して芳香族部分に結合されたテトラジンを含む。いくつかの実施形態では、UAAは、アミノ基を介して芳香族部分に結合されたテトラジンを含む。いくつかの実施形態では、UAAは、アルキルアミノ基を介して芳香族部分に結合されたテトラジンを含む。いくつかの実施形態では、UAAは、アルキル鎖を介してアミノ酸側鎖の末端窒素(例えば、リジン誘導体のN6、またはより短いアルキル側鎖を含む誘導体のN5、N4、もしくはN3)に結合したアジドを含む。いくつかの実施形態では、UAAは、アルキル鎖を介してアミノ酸側鎖の末端窒素に結合したテトラジンを含む。いくつかの実施形態では、UAAは、アルキルリンカーを介してアミドに結合されたアジドまたはテトラジンを含む。いくつかの実施形態では、UAAは、アジドまたはテトラジン含有カルバメートまたは3-アミノアラニン、セリン、リジン、またはそれらの誘導体のアミドである。いくつかの実施形態では、そのようなUAAは、インビボでタンパク質に組み込まれる。いくつかの実施形態では、そのようなUAAは、無細胞系のタンパク質に組み込まれる。
細胞型
いくつかの実施形態では、多くのタイプの細胞/微生物が、例えば、形質転換または遺伝子工学のために使用される。いくつかの実施形態では、細胞は、真核生物の細胞である。いくつかの場合では、細胞は、培養された動物、植物、またはヒトの細胞などの真核細胞である。追加の場合には、細胞は、植物、または動物などの生物に存在する。
いくつかの実施形態では、多くのタイプの細胞/微生物が、例えば、形質転換または遺伝子工学のために使用される。いくつかの実施形態では、細胞は、真核生物の細胞である。いくつかの場合では、細胞は、培養された動物、植物、またはヒトの細胞などの真核細胞である。追加の場合には、細胞は、植物、または動物などの生物に存在する。
いくつかの実施形態では、操作された微生物は、単細胞生物であり、しばしば分裂および増殖し得る。微生物は、以下の特徴のうちの1つまたはそれ以上を含み得る:好気性、嫌気性、糸状、非糸状、一倍体、二倍体、栄養要求性および/または非栄養要求性。特定の実施形態では、操作された微生物は、非原核生物の微生物である。いくつかの実施形態では、操作された微生物は、真核生物の微生物(例えば、酵母、真菌、アメーバ)である。いくつかの実施形態では、操作された微生物は真菌である。いくつかの実施形態では、操作された生物は酵母である。
任意の適切な酵母を、宿主微生物、操作された微生物、遺伝子改変生物、または異種もしくは改変ポリヌクレオチドの供給源として選択し得る。酵母としては、限定するものではないが、Yarrowia酵母(例えば、Y.lipolytica(以前はCandida lipolyticaとして分類されていた))、Candida酵母(例えば、C.revkaufi、C.viswanathii、C.pulcherrima、C.tropicalis、C.utilis)、Rhodotorula酵母(例えば、R.glutinus、R.graminis)、Rhodosporidium酵母(例えば、R.toruloides)、Saccharomyces酵母(例えば、S.cerevisiae、S.bayanus、S.pastorianus、S.carlsbergensis)、Cryptococcus酵母、Trichosporon酵母(例えば、T.pullans、T.cutaneum)、Pichia酵母(例えば、P.pastoris)、およびLipomyces酵母(例えば、L.starkeyii、L.lipoferus)。いくつかの実施形態では、適切な酵母は、Arachniotus、Aspergillus、Aureobasidium、Auxarthron、Blastomyces、Candida、Chrysosporuim、Chrysosporuim、Debaryomyces、Coccidiodes、Cryptococcus、Gymnoascus、Hansenula、Histoplasma、Issatchenkia、Kluyveromyces、Lipomyces、Lssatchenkia、Microsporum、Myxotrichum、Myxozyma、Oidiodendron、Pachysolen、Penicillium、Pichia、Rhodosporidium、Rhodotorula、Rhodotorula、Saccharomyces、Schizosaccharomyces、Scopulariopsis、Sepedonium、Trichosporon、またはYarrowiaの属の酵母である。いくつかの実施形態では、適切な酵母は、Arachniotus flavoluteus、Aspergillus flavus、Aspergillus fumigatus、Aspergillus niger、Aureobasidium pullulans、Auxarthron thaxteri、Blastomyces dermatitidis、Candida albicans、Candida dubliniensis、Candida famata、Candida glabrata、Candida guilliermondii、Candida kefyr、Candida krusei、Candida lambica、Candida lipolytica、Candida lustitaniae、Candida parapsilosis、Candida pulcherrima、Candida revkaufi、Candida rugosa、Candida tropicalis、Candida utilis、Candida viswanathii、Candida xestobii、Chrysosporuim keratinophilum、Coccidiodes immitis、Cryptococcus albidus var. diffluens、Cryptococcus laurentii、Cryptococcus neofomans、Debaryomyces hansenii、Gymnoascus dugwayensis、Hansenula anomala、Histoplasma capsulatum、Issatchenkia occidentalis、Isstachenkia orientalis、Kluyveromyces lactis、Kluyveromyces marxianus、Kluyveromyces thermotolerans、Kluyveromyces waltii、Lipomyces lipoferus、Lipomyces starkeyii、Microsporum gypseum、Myxotrichum deflexum、Oidiodendron echinulatum、Pachysolen tannophilis、Penicillium notatum、Pichia anomala、Pichia pastoris、Pichia stipitis、Rhodosporidium toruloides、Rhodotorula glutinus、Rhodotorula graminis、Saccharomyces cerevisiae、Saccharomyces kluyveri、Schizosaccharomyces pombe、Scopulariopsis acremonium、Sepedonium chrysospermum、Trichosporon cutaneum、Trichosporon pullans、Yarrowia lipolytica、またはYarrowia lipolytica(以前はCandida lipolyticaとして分類されていた)の種の酵母である。いくつかの実施形態では、酵母は、限定するものではないが、ATCC20362、ATCC8862、ATCC18944、ATCC20228、ATCC76982およびLGAM S(7)1株(Papanikolaou S.およびAggelis G.、Bioresor.Technol.82(1):43-9(2002))を含むY.lipolytica株である。特定の実施形態では、酵母は、カンジダ種(すなわち、カンジダ属)酵母である。任意の適切なカンジダ種を使用してもよく、および/または脂肪性ジカルボン酸(例えば、オクタン二酸、デカン二酸、ドデカン二酸、テトラデカン二酸、ヘキサデカン二酸、オクタデカン二酸、エイコサン二酸)の生成のために遺伝子改変してもよい。いくつかの実施形態では、適切なカンジダ種としては、限定するものではないが、Candida albicans、Candida dubliniensis、Candida famata、Candida glabrata、Candida guilliermondii、Candida kefyr、Candida krusei、Candida lambica、Candida lipolytica、Candida lustitaniae、Candida parapsilosis、Candida pulcherrima、Candida revkaufi、Candida rugosa、Candida tropicalis、Candida utilis、Candida viswanathii、Candida xestobii、および本明細書に記載の任意の他のカンジダ種酵母が挙げられる。カンジダ種の株の非限定的な例としては、限定するものではないが、sAA001(ATCC20336)、sAA002(ATCC20913)、sAA003(ATCC20962)、sAA496(米国特許出願公開第2012/0077252号)、sAA106(米国特許出願公開第2012/0077252号)、SU-2(ura3-/ura3-)、H5343(ベータ酸化ブロック;米国特許第5648247号)という株が挙げられる。カンジダ種由来の任意の適切な株酵母は、遺伝子組換えのための親株として利用され得る。
酵母の属、種、および菌株は、遺伝的内容が非常に密接に関連していることが多いため、区別、分類、および/または名前を付けるのが難しい場合がある。場合によっては、C.lipolyticaおよびY.lipolyticaの菌株を区別、分類、および/または命名することが困難であり得、場合によっては、同じ生物と見なされ得る。場合によっては、C.tropicalisおよびC.viswanathiiの様々な菌株を区別、分類、および/または命名することが難しい場合がある(例えば、Arieら、J.Gen.Appl.Microbiol.,46,257-262(2000)を参照のこと)。ATCCおよび他の商業的または学術的供給源から得られたいくつかのC.tropicalisおよびC.viswanathii株は、本明細書に記載の実施形態と同等かつ同等に適切であると見なされ得る。いくつかの実施形態では、C.tropicalisおよびC.viswanathiiのいくつかの親株は、名前のみが異なると見なされる。
任意の適切な真菌を、宿主微生物、操作された微生物、または異種ポリヌクレオチドの供給源として選択し得る。真菌の非限定的な例としては、限定するものではないが、アスペルギルス菌類(例えば、A.parasiticus、A.nidulans)、Thraustochytrium fungi、Schizochytrium fungiおよびRhizopus fungi(例えば、R.arrhizus、R.oryzae、R.nigricans)が挙げられる。いくつかの実施形態では、真菌類は、A.parasiticus株であり、これには限定するものではないが、ATCC24690株が挙げられ、および特定の実施形態では、真菌類は、A.nidulans株であり、これには、限定するものではないが、ATCC38163株が挙げられる。
非微生物由来の細胞は、宿主微生物、操作された微生物、または異種ポリヌクレオチドの供給源として利用され得る。そのような細胞の例としては、限定するものではないが、昆虫細胞(例えば、Drosophila(例えば、D.melanogaster)、Spodoptera(例えば、S.frugiperda Sf9またはSf21細胞)およびTrichoplusa(例えば、ハイ-ファイブ(High-Five)細胞);線虫細胞(例えば、C.elegans細胞);鳥類細胞;両生類細胞(例えば、Xenopus laevis細胞);爬虫類細胞;哺乳類細胞(例えば、NIH3T3、293、CHO、COS、VERO、C127、BHK、Per-C6、Bowes melanomaおよびHeLa細胞);ならびに植物細胞(例えば、Arabidopsis thaliana、Nicotania tabacum、Cuphea acinifolia、Cuphea aequipetala、Cuphea angustifolia、Cuphea appendiculata、Cuphea avigera、Cuphea avigera var. pulcherrima、Cuphea axilliflora、Cuphea bahiensis、Cuphea baillonis、Cuphea brachypoda、Cuphea bustamanta、Cuphea calcarata、Cuphea calophylla、Cuphea calophylla subsp. mesostemon、Cuphea carthagenensis、Cuphea circaeoides、Cuphea confertiflora、Cuphea cordata、Cuphea crassiflora、Cuphea cyanea、Cuphea decandra、Cuphea denticulata、Cuphea disperma、Cuphea epilobiifolia、Cuphea ericoides、Cuphea flava、Cuphea flavisetula、Cuphea fuchsiifolia、Cuphea gaumeri、Cuphea glutinosa、Cuphea heterophylla、Cuphea hookeriana、Cuphea hyssopifolia (Mexican-heather)、Cuphea hyssopoides、Cuphea ignea、Cuphea ingrata、Cuphea jorullensis、Cuphea lanceolata、Cuphea linarioides、Cuphea llavea、Cuphea lophostoma、Cuphea lutea、Cuphea lutescens、Cuphea melanium、Cuphea melvilla、Cuphea micrantha、Cuphea micropetala、Cuphea mimuloides、Cuphea nitidula、Cuphea palustris、Cuphea parsonsia、Cuphea pascuorum、Cuphea paucipetala、Cuphea procumbens、Cuphea pseudosilene、Cuphea pseudovaccinium、Cuphea pulchra、Cuphea racemosa、Cuphea repens、Cuphea salicifolia、Cuphea salvadorensis、Cuphea schumannii、Cuphea sessiliflora、Cuphea sessilifolia、Cuphea setosa、Cuphea spectabilis、Cuphea spermacoce、Cuphea splendida、Cuphea splendida var. viridiflava、Cuphea strigulosa、Cuphea subuligera、Cuphea teleandra、Cuphea thymoides、Cuphea tolucana、Cuphea urens、Cuphea utriculosa、Cuphea viscosissima、Cuphea watsoniana、Cuphea wrightii、Cuphea lanceolata)が挙げられる。
宿主生物または異種ポリヌクレオチドの供給源として使用される微生物または細胞は市販されている。本明細書に記載の微生物および細胞、ならびに他の適切な微生物および細胞は、例えば、Invitrogen Corporation(Carlsbad,CA)、アメリカンタイプカルチャーコレクション(American Type Culture Collection)(Manassas, Virginia)、および農業研究文化コレクション(Agricultural Research Culture Collection)(NRRL;Peoria,Illinois)から入手可能である。宿主微生物および操作された微生物は、任意の適切な形態で提供され得る。例えば、そのような微生物は、液体培養または固体培養(例えば、寒天ベースの培地)で提供され得、これは、初代培養物であってもよいし、または1回またはそれ以上継代されていてもよい(例えば、希釈および培養されていてもよい)。微生物はまた、凍結形態または乾燥形態(例えば、凍結乾燥)で提供されてもよい。微生物は、任意の適切な濃度で提供されてもよい。
核酸試薬およびツール
本明細書に記載の方法、細胞、または操作された微生物と共に使用するためのヌクレオチドおよび/または核酸試薬(またはポリヌクレオチド)は、非天然ヌクレオチドを伴うかまたは伴わない1つまたはそれ以上のORFを含む。ORFは、任意の適切な供給源、時にはゲノムDNA、mRNA、逆転写RNAまたは相補的DNA(cDNA)、または前述の1つまたはそれ以上を含む核酸ライブラリーに由来し得、そして目的の核酸配列、目的のタンパク質、または目的の活性を含む任意の生物種に由来する。ORFを得ることができる生物の非限定的な例としては、例えば、細菌、酵母、真菌、ヒト、昆虫、線虫、ウシ、ウマ、イヌ、ネコ、ラットまたはマウスが挙げられる。いくつかの実施形態では、本明細書に記載のヌクレオチドおよび/または核酸試薬または他の試薬は、単離または精製される。公開されているインビトロの方法により、非天然ヌクレオチドを含むORFを作製し得る。場合によっては、ヌクレオチドまたは核酸試薬は、非天然核酸塩基を含む。
本明細書に記載の方法、細胞、または操作された微生物と共に使用するためのヌクレオチドおよび/または核酸試薬(またはポリヌクレオチド)は、非天然ヌクレオチドを伴うかまたは伴わない1つまたはそれ以上のORFを含む。ORFは、任意の適切な供給源、時にはゲノムDNA、mRNA、逆転写RNAまたは相補的DNA(cDNA)、または前述の1つまたはそれ以上を含む核酸ライブラリーに由来し得、そして目的の核酸配列、目的のタンパク質、または目的の活性を含む任意の生物種に由来する。ORFを得ることができる生物の非限定的な例としては、例えば、細菌、酵母、真菌、ヒト、昆虫、線虫、ウシ、ウマ、イヌ、ネコ、ラットまたはマウスが挙げられる。いくつかの実施形態では、本明細書に記載のヌクレオチドおよび/または核酸試薬または他の試薬は、単離または精製される。公開されているインビトロの方法により、非天然ヌクレオチドを含むORFを作製し得る。場合によっては、ヌクレオチドまたは核酸試薬は、非天然核酸塩基を含む。
核酸試薬は、ORFと併せて翻訳され、アミノ酸タグをコードする、ORFに隣接するヌクレオチド配列を含む場合がある。タグをコードするヌクレオチド配列は、核酸試薬中のORFの3’および/または5’に位置し、それにより、ORFによってコードされるタンパク質またはペプチドのC末端またはN末端でタグをコードしている。インビトロでの転写および/または翻訳を無効にしない任意のタグを利用してもよく、技術者によって適切に選択されてもよい。タグは、培養または発酵培地からの所望のORF産物の単離および/または精製を容易にし得る。場合によっては、核酸試薬のライブラリーが、本明細書に記載の方法および組成物と共に使用される。例えば、少なくとも100、1000、2000、5000、10,000、または50,000超の固有のポリヌクレオチドのライブラリーが、ライブラリーに存在し、各ポリヌクレオチドは、少なくとも1つの非天然核酸塩基を含む。
非天然ヌクレオチドを含むかまたは含まない、核酸または核酸試薬は、特定のエレメント、例えば、核酸の使用目的に従ってしばしば選択される調節エレメントを含み得る。以下のエレメントのいずれかを核酸試薬に含めてもよいし、除外してもよい。例えば、核酸試薬は、以下のヌクレオチドエレメントの1つまたはそれ以上または全てを含み得る:1つまたはそれ以上のプロモーターエレメント、1つまたはそれ以上の5’非翻訳領域(5’UTR)、標的ヌクレオチド配列が挿入され得る1つまたはそれ以上の領域(「挿入エレメント」)、1つまたはそれ以上の標的ヌクレオチド配列、1つまたはそれ以上の3’非翻訳領域(3’UTR)、および1つまたはそれ以上の選択エレメント。核酸試薬は、そのようなエレメントの1つまたはそれ以上を提供されてもよく、核酸が所望の生物に導入される前に、他のエレメントを核酸に挿入してもよい。いくつかの実施形態では、提供される核酸試薬は、プロモーター、5’UTR、任意の3’UTR、および標的ヌクレオチド配列がヌクレオチド酸試薬に挿入される(すなわち、クローニングされる)挿入エレメントを含む。特定の実施形態では、提供される核酸試薬は、プロモーター、挿入エレメント、および任意の3’UTRを含み、そして5’UTR/標的ヌクレオチド配列は、任意の3’UTRと共に挿入される。エレメントは、選択された発現系での発現(例えば、選択された生物での発現、または例えば、無細胞系での発現)に適した任意の順序で配置されてもよく、いくつかの実施形態では、核酸試薬は、5’→3’の方向で以下のエレメントを含む:(1)プロモーターエレメント、5’UTR、および挿入エレメント;(2)プロモーターエレメント、5’UTR、および標的ヌクレオチド配列;(3)プロモーターエレメント、5’UTR、挿入エレメントおよび3’UTR;ならびに(4)プロモーターエレメント、5’UTR、標的ヌクレオチド配列および3’UTR。いくつかの実施形態では、UTRは、完全に天然であるか、または非天然ヌクレオチドを含む、ORFの転写または翻訳を変更または増大させるように最適化され得る。
本明細書に記載される核酸塩基を含む核酸(例えば、mRNA)は、いくつかの場合において、インビボ(例えば、真核細胞または真核生物のSSOにおいて)でmRNA安定性を増強する5’UTRおよび/または3’UTRを含む。いくつかの例では、5’または3’UTRまたは両方とも、インビボでmRNA分解または崩壊を低減するように操作される。本明細書で開示される真核生物系においてmRNA安定性を増強する5’および3’UTRの限定されない例として、CS2 3’および5’UTRがある。いくつかの実施形態では、mRNAは、それ以外は修飾されていない本明細書に記載される核酸塩基を含むmRNAと比較して、mRNAのポリ(A)テールの除去率を低減するように修飾される。いくつかの実施形態では、シス作用性AUリッチエレメント(ARE)は、mRNA崩壊を促進する細胞内および細胞外シグナル伝達から遮断される。いくつかの実施形態では、mRNAの非センス媒介性崩壊(NMD)を低減するために、mRNA中の未熟終止コドンがmRNAから除去される。
いくつかの場合において、5’および/または3’UTRは、ポリペプチドへのmRNAの翻訳を直接的または間接的に増大する。5’UTRまたは3’UTRが、ポリペプチドへのmRNAの翻訳に直接的に影響を及ぼす方法の限定されない例として、5’または3’シスエレメントに結合し、リボソームまたはエフェクタータンパク質(例えば、mRNAデアデニラーゼ、デキャッピング酵素)の補充をもたらすRNA結合性タンパク質の補充が挙げられる。5’UTRまたは3’UTRが、ポリペプチドへのmRNAの翻訳に間接的に影響を及ぼす方法の限定されない例は、5’または3’UTR領域へのRNA結合性タンパク質の結合を遮断または増強する5’および3’UTR二次構造の形成ならびにmRNA細胞内局在性を含む。
いくつかの実施形態では、5’UTRおよび/または3’UTRは、操作されていない核酸塩基を含有するmRNAの翻訳効率と比較して、インビトロまたはインビボでmRNAの翻訳効率を増大する。いくつかの実施形態では、翻訳効率は、スキャニングの際のリボソームによる選択AUG(開始コドン)のスキップを低減するようにmRNAを操作することによって増大される。いくつかの実施形態では、mRNAは、コザック配列またはその変形のような開始コドン認識を改善する配列エレメントを含む。いくつかの実施形態では、mRNAの5’UTRは、全体のグアニン-シトシン(GC)含量を低減するように操作される。
いくつかの実施形態では、5’UTR内のAUG開始コドンが関与するmRNAにおける二次構造の形成(例えば、RNA G-四重鎖構造、RG4)が低減され、それによってそのAUGからの翻訳の効率が増大する。いくつかの実施形態では、5’UTRは、操作されていないmRNAと比較して負のフォールディング自由エネルギー(ΔG)を有するように操作される。いくつかの実施形態では、ΔGは、最大で-40、-41、-42、-43、-44、-45、-46、-47、-48、-49、-50、-51、-52、-53、-54、-55、-56、-57、-58、-59または-60である。いくつかの実施形態では、mRNAは、翻訳効率を促進するように5’UTRまたは3’UTRで化学的に修飾される。いくつかの実施形態では、化学的修飾は、N6-メチルアデノシンである。インビトロ系(例えば、操作された真核細胞または半合成生物)では、eIF3BおよびeIF4Hと協力してRNA二次構造の巻き戻しを促進するeIF4F複合体のサブユニットであるeIF4Aの過剰発現が、mRNAの翻訳効率を増大する。いくつかの実施形態では、mRNAの二次構造形成を促進する安定化タンパク質(例えば、脆弱X精神遅滞タンパク質(FMRP))のノックアウトまたはノックダウンは、二次構造の形成を低減し、それによって、mRNAの翻訳効率を増大する。いくつかの実施形態では、mRNAの翻訳を促進するために、トランス作用剤(例えば、RNAの小分子、タンパク質)が、細胞(例えば、真核細胞)中に導入される。
いくつかの例では、5’UTRおよび/または3’UTRは、mRNAの細胞内局在性を促進し、それによって、インビボでmRNAの翻訳を促進する。いくつかの実施形態では、mRNAジップコードのような3’または5’UTRシス作用エレメントは、ジップコード結合性タンパク質(例えば、Staufen)によるmRNAジップコードの結合が抑制または増強されるように修飾され、それによって、mRNAの翻訳効率を増大する。
核酸試薬、例えば、発現カセットおよび/または発現ベクター(例えば、異種tRNAシンテターゼを発現するための)は、プロモーター、エンハンサー、翻訳開始配列、転写終結配列および他のエレメントを含むさまざまな調節エレメントを含み得る。「プロモーター」とは、一般に、転写開始部位に関して比較的固定された位置にあるときに機能するDNAの配列である。例えば、プロモーターは、ヌクレオシド三リン酸輸送体核酸セグメントの上流にあり得る。「プロモーター」は、RNAポリメラーゼおよび転写因子の基本的な相互作用に必要なコアエレメントを含み、かつ上流エレメントおよび応答エレメントを含んでもよい。「エンハンサー」とは、一般に、転写開始部位から固定でない距離で機能し、転写ユニットに対して5’または3’’のいずれかであり得るDNAの配列を指す。さらに、エンハンサーは、イントロン内およびコード配列自体内に存在してもよい。それらは通常長さが10~300の間であり、シスで機能する。エンハンサーは、近くのプロモーターからの転写を増大するように機能する。プロモーターと同様、エンハンサーも、転写の調節を媒介する応答エレメントを含む場合が多い。エンハンサーはしばしば発現の調節を決定し、完全に天然であるかまたは非天然ヌクレオチドを含むORFなどの、ORF発現を変更または最適化するために使用され得る。
上記のように、核酸試薬はまた、1つまたはそれ以上の5’UTR、および1つまたはそれ以上の3’UTRを含んでもよい。例えば、真核生物の宿主細胞(例えば、酵母、真菌、昆虫、植物、動物、ヒトまたは有核細胞)および原核生物の宿主細胞(例えば、ウイルス、細菌)で使用される発現ベクターは、mRNAの発現に影響を与え得る、転写の終了についてシグナル伝達する配列を含んでもよい。これらの領域は、組織因子タンパク質をコードするmRNAの非翻訳部分のポリアデニル化セグメントとして転写され得る。3’の非翻訳領域には、転写終結部位も含まれる。いくつかの好ましい実施形態では、転写ユニットは、ポリアデニル化領域を含む。この領域の利点の1つは、転写されたユニットがmRNAのように処理および輸送される可能性が高くなるということである。発現構築物におけるポリアデニル化シグナルの同定および使用は、十分に確立されている。いくつかの好ましい実施形態では、相同なポリアデニル化シグナルは、導入遺伝子構築物において使用され得る。
5’UTRは、それが由来するヌクレオチド配列に内因性の1つまたはそれ以上のエレメントを含み得、時には1つまたはそれ以上の外因性エレメントを含む。5’UTRは、ゲノムDNA、プラスミドDNA、RNAまたはmRNAなどの任意の適切な核酸から、例えば、任意の適切な生物(例えば、ウイルス、細菌、酵母、真菌、植物、昆虫または哺乳動物)から由来し得る。技術者は、選択された発現系(例えば、選択された生物での発現、または、例えば、無細胞系での発現)に基づいて、5’UTRにとって適切なエレメントを選択し得る。5’UTRは、技術者に公知の以下のエレメントの1つまたはそれ以上を含む場合がある:エンハンサー配列(例えば、転写または翻訳)、転写開始部位、転写因子結合部位、翻訳調節部位、翻訳開始部位、翻訳因子結合部位、アクセサリータンパク質結合部位、フィードバック調節剤結合部位、Pribnowボックス、TATAボックス、-35エレメント、E-box(ヘリックス-ループ-ヘリックス結合エレメント)、リボソーム結合部位、レプリコン、内部リボソーム侵入部位(IRES)、サイレンサーエレメントなど。いくつかの実施形態では、プロモーターエレメントは、適切な条件付き調節に必要な全ての5’UTRエレメントが、プロモーターエレメントフラグメント内に、またはプロモーターエレメントフラグメントの機能的部分配列内に含まれるように分離されてもよい。
核酸試薬中の5’UTRは、翻訳エンハンサーヌクレオチド配列を含んでもよい。翻訳エンハンサーヌクレオチド配列は、多くの場合、核酸試薬のプロモーターと標的ヌクレオチド配列の間に位置している。翻訳エンハンサー配列は、しばしばリボソームに結合し、18S rRNA結合リボヌクレオチド配列(すなわち、40Sリボソーム結合配列)である場合もあり、内部リボソーム侵入配列(IRES)である場合もある。IRESは一般に、多数の特定の分子間相互作用を介して40Sリボソームサブユニットと接触する正確に配置されたRNA三次構造を有するRNA足場を形成する。リボソームエンハンサー配列の例は公知であり、技術者によって同定され得る(例えば、Mignoneら、Nucleic Acids Research 33:D141-D146(2005);Paulousら、Nucleic Acids Research 31:722-733(2003);Akbergenovら、Nucleic Acids Research 32:239-247(2004);Mignoneら、Genome Biology 3(3):reviews0004.1-0001.10(2002);Gallie,Nucleic Acids Research 30:3401-3411(2002);Shaloikoら、DOI:10.1002/bit.20267;およびGallieら、Nucleic Acids Research 15:3257-3273(1987))。
翻訳エンハンサー配列は、コザックコンセンサス配列または他の配列(例えば、ヒドロ虫ポリプ配列、GenBankアクセッション番号U07128)などの真核生物配列である場合がある。翻訳エンハンサー配列は、シャイン・ダルガルノコンセンサス配列などの原核生物配列である場合がある。特定の実施形態では、翻訳エンハンサー配列は、ウイルスヌクレオチド配列である。翻訳エンハンサー配列は、例えば、タバコモザイクウイルス(TMV)、アルファルファモザイクウイルス(AMV);タバコエッチウイルス(ETV);ジャガイモウイルスY(PVY);カブモザイク(ポティ)ウイルスおよびエンドウ種子伝染モザイクウイルスなどの植物ウイルスの5’UTRに由来する場合がある。特定の実施形態では、TMVから約67塩基の長さのオメガ配列は、翻訳エンハンサー配列として核酸試薬に含まれる(例えば、グアノシンヌクレオチドを欠き、25ヌクレオチド長のポリ(CAA)中央領域を含む)。
3’UTRは、それが由来するヌクレオチド配列に内因性の1つまたはそれ以上のエレメントを含んでもよく、1つまたはそれ以上の外因性エレメントを含む場合もある。3’UTRは、ゲノムDNA、プラスミドDNA、RNAまたはmRNAなどの任意の適切な核酸から、例えば、任意の適切な生物(例えば、ウイルス、細菌、酵母、真菌、植物、昆虫または哺乳動物)から由来し得る。技術者は、選択された発現系に基づいて、3’UTRに適切なエレメントを選択し得る(例えば、選択された生物での発現など)。3’UTRは、技術者に公知の以下のエレメントの1つまたはそれ以上を含む場合がある:転写調節部位、転写開始部位、転写終結部位、転写因子結合部位、翻訳調節部位、翻訳終結部位、翻訳開始部位、翻訳因子結合部位、リボソーム結合部位、レプリコン、エンハンサーエレメント、サイレンサーエレメントおよびポリアデノシンテール。3’UTRにはポリアデノシンテールが含まれることが多く、含まれない場合もあり、ポリアデノシンテールが存在する場合は、1つまたはそれ以上のアデノシン部分が追加されても、またはそれから削除されてもよい(例えば、約5、約10、約15、約20、約25、約30、約35、約40、約45または約50のアデノシン部分を追加してもまたは削除してもよい)。
いくつかの実施形態では、5’UTRおよび/または3’UTRの改変を用いて、プロモーターの活性を変更する(例えば、増加、追加、減少、または実質的に排除する)。プロモーター活性の変更は、次いで、改変された5’または3’UTRを含む作動可能に連結されたプロモーターエレメントからの目的のヌクレオチド配列の転写の変化によって、ペプチド、ポリペプチド、またはタンパク質の活性(例えば、酵素活性)を変更し得る。例えば、微生物を、新規の活性(例えば、宿主生物には通常見られない活性)を加え得る、または特定の実施形態では、目的のヌクレオチド配列(例えば、目的の相同または異種ヌクレオチド配列)に作動可能に連結された同種または異種プロモーターからの転写を増大させることによって既存の活性の発現を増大し得る改変5’または3’UTRを含む核酸試薬を発現するように遺伝子改変によって操作してもよい。いくつかの実施形態では、微生物を、特定の実施形態では、目的のヌクレオチド配列に対して作動可能に連結された同種または異種プロモーターからの転写を減少または実質的に排除することによって、活性の発現を減少し得る改変5’または3’UTRを含む核酸試薬を発現するように遺伝子改変によって操作してもよい。
発現カセットまたは発現ベクターからのtRNAシンテターゼのような異種ポリペプチドの発現は、原核細胞または真核細胞において発現可能な任意のプロモーターによって制御される。プロモーターエレメントは通常、DNA合成および/またはRNA合成に必要である。プロモーターエレメントは、ある遺伝子に対応するRNAの合成の開始部位を提供することにより、特定の遺伝子の転写を促進し得るDNAの領域を含むことが多い。プロモーターは一般に、それらが調節する遺伝子の近くに位置し、遺伝子の上流(例えば、遺伝子の5’)に位置し、いくつかの実施形態では、遺伝子のセンス鎖と同じDNA鎖上にある。いくつかの実施形態では、プロモーターエレメントは、遺伝子または生物から単離されてもよく、ポリヌクレオチド配列と機能的に関連して挿入されて、変化されたおよび/または調節された発現を可能にし得る。核酸の発現に使用される非天然プロモーター(例えば、通常は所与の核酸配列に関連しないプロモーター)は、しばしば異種プロモーターと呼ばれる。特定の実施形態では、異種プロモーターおよび/または5’UTRは、本明細書に記載されるような所望の活性を有するポリペプチドをコードするポリヌクレオチドと機能的に関連して挿入され得る。プロモーターに関して本明細書で使用される「作動可能に連結された」および「機能的に関連して」という用語は、コード配列とプロモーターエレメントとの間の関係を指す。転写を介したコード配列からの発現がプロモーターエレメントによって調節または制御される場合、プロモーターは、コード配列と作動可能に連結されているか、または機能的に関連している。「作動可能に連結された」および「機能的に関連して」という用語は、プロモーターエレメントに関して本明細書で交換可能に使用される。
プロモーターはしばしばRNAポリメラーゼと相互作用する。ポリメラーゼは、既存の核酸試薬を使用して核酸の合成を触媒する酵素である。テンプレートがDNAテンプレートの場合、タンパク質が合成される前にRNA分子が転写される。本発明の方法での使用に適したポリメラーゼ活性を有する酵素としては、タンパク質を合成するために選択されたテンプレートを用いて、選択されたシステムで活性である任意のポリメラーゼが挙げられる。いくつかの実施形態では、本明細書においてプロモーターエレメントとも呼ばれるプロモーター(例えば、異種プロモーター)は、ヌクレオチド配列またはオープンリーディングフレーム(ORF)に作動可能に連結され得る。プロモーターエレメントからの転写は、プロモーターに作動可能に連結されたヌクレオチド配列またはORF配列に対応するRNAの合成を触媒し得、これは次いで、所望のペプチド、ポリペプチドまたはタンパク質の合成をもたらす。
プロモーターエレメントは、調節制御に対して応答性を示すことがある。プロモーターエレメントは、選択的薬剤によって調節され得る場合もある。すなわち、プロモーターエレメントからの転写は、環境、栄養、または内部条件またはシグナル(例えば、熱誘導性プロモーター、光調節プロモーター、フィードバック調節プロモーター、ホルモン影響性プロモーター、組織特異的プロモーター、酸素およびpH影響性プロモーター、選択的薬剤(例えば、カナマイシン)に応答するプロモーターなど)の変化に応じて、オン、オフ、アップレギュレーションまたはダウンレギュレーションされ得る場合がある。環境、栄養、または内部シグナルの影響を受けるプロモーターは、そのプロモーターまたはその近くに結合し、特定の条件下で標的配列の発現を増加または減少させるシグナル(直接または間接)の影響を受けることがよくある。本明細書に開示される全ての方法と同様に、天然または改変プロモーターの包含を使用して、完全天然ORF(例えば、aaRS)または非天然ヌクレオチド(例えば、mRNAまたはtRNA)を含むORFの発現を変更または最適化し得る。
本明細書に記載の実施形態で使用されるプロモーターエレメントからの転写に影響を与える選択的薬剤または調節剤の非限定的な例としては、限定するものではないが、以下が挙げられる:(1)他の方法では毒性化合物(例えば、抗生物質)に対して耐性を提供する産物をコードする核酸セグメント;(2)他の方法ではレシピエント細胞に欠けている産物(例えば、必須産物、tRNA遺伝子、栄養要求性マーカー)をコードする核酸セグメント;(3)遺伝子産物の活性を抑制する産物をコードする核酸セグメント;(4)容易に同定され得る産物をコードする核酸セグメント(例えば、抗生物質(例えば、β-ラクタマーゼ)、β-ガラクトシダーゼ、緑色蛍光タンパク質(GFP)、黄色蛍光タンパク質(YFP)、赤色蛍光タンパク質(RFP)、シアン蛍光タンパク質(CFP)、および細胞表面タンパク質などの表現型マーカー);(5)細胞の生存および/または機能に、他の方法では有害である産物に結合する核酸セグメント;(6)上記の1~5番に記載されている核酸セグメントのいずれかの活性を、他の方法では阻害する核酸セグメント(例えば、アンチセンスオリゴヌクレオチド);(7)基質を改変する産物(例えば、制限エンドヌクレアーゼ)に結合する核酸セグメント;(8)所望の分子(例えば、特定のタンパク質結合部位)を単離または同定するために使用され得る核酸セグメント;(9)他の方法では機能し得ない特定のヌクレオチド配列をコードする核酸セグメント(例えば、分子の亜集団のPCR増幅のために);(10)存在しない場合、特定の化合物に対する耐性または感受性を直接的または間接的に付与する核酸セグメント;(11)レシピエント細胞において、毒性であるか、または相対的に非毒性の化合物を毒性化合物(例えば、単純ヘルペスチミジンキナーゼ、シトシンデアミナーゼ)に変換する産物をコードする核酸セグメント;(12)それらを含む核酸分子の複製、分配または遺伝可能性を阻害する核酸セグメント;(13)条件付き複製機能、例えば、特定の宿主もしくは宿主細胞株における、または特定の環境条件下(例えば、温度、栄養条件など)での複製をコードする核酸セグメント;および/または(14)非天然ヌクレオチドを含む1つまたはそれ以上のmRNAまたはtRNAをコードする核酸。いくつかの実施形態では、調節剤または選択的薬剤を添加して、生物が供される既存の増殖条件を変更してもよい(例えば、液体培養での増殖、発酵槽での増殖、固体栄養プレートでの増殖など)。
いくつかの実施形態では、プロモーターエレメントの調節を使用して、ペプチド、ポリペプチド、またはタンパク質の活性(例えば、酵素活性など)を変更(例えば、増大、追加、減少、または実質的に排除)し得る。例えば、微生物を、新規の活性(例えば、宿主生物には通常見られない活性)を加え得る、または特定の実施形態では、目的のヌクレオチド配列(例えば、目的の相同または異種ヌクレオチド配列)に作動可能に連結された相同性プロモーターまたは異種プロモーターからの転写を増加させることによって既存の活性の発現を増大し得る核酸試薬を発現するように遺伝子改変によって操作してもよい。いくつかの実施形態では、微生物を、特定の実施形態では、目的のヌクレオチド配列に作動可能に連結された相同または異種プロモーターからの転写を減少または実質的に排除することによって活性の発現を減少し得る核酸試薬を発現するように遺伝子改変によって操作してもよい。
異種タンパク質、例えば、tRNA合成酵素をコードする核酸を、任意の適切な発現系に挿入してもよいし、または使用してもよい。いくつかの実施形態では、核酸試薬は、時には、宿主生物の染色体に安定して組み込まれるか、または核酸試薬は、特定の実施形態では、宿主染色体の一部の欠失であってもよい(例えば、遺伝子改変生物において、宿主ゲノムの変更は、遺伝子改変がある所望の生物を選択的または優先的に維持する能力を付与する)。そのような核酸試薬(例えば、変更されたゲノムが生物に選択可能な形質を与える核酸または遺伝子改変生物)は、所望のタンパク質または核酸分子の産生を誘導するそれらの能力について選択され得る。必要に応じて、核酸試薬は、コドンが(i)ネイティブ配列で指定されたものとは異なるtRNAを使用して、同じアミノ酸をコードするように、または(ii)従来とは異なるかまたは非天然アミノ酸(検出可能な標識アミノ酸を含む)を含む、通常とは異なるアミノ酸をコードするように変更してもよい。
組換え発現は、プラスミドなどのベクターの一部であり得る発現カセットを使用して有用に達成される。ベクターは、核酸に作動可能に連結されたプロモーターを含み得る。ベクターはまた、本明細書に記載されるように、転写および翻訳に必要な他のエレメントを含んでもよい。発現カセット、発現ベクター、およびカセットまたはベクター中の配列は、非天然ヌクレオチドが接触している細胞に対して異種であり得る。
tRNAシンテターゼのような異種タンパク質を保持する、コードするおよび/または発現するのに適しているさまざまな原核生物および真核生物の発現ベクターを生成できる。そのような発現ベクターとしては、例えば、pET、pET3d、pCR2.1、pBAD、pUC、および酵母ベクターが挙げられる。ベクターは、例えば、様々なインビボおよびインビトロの状況で使用し得る。使用され得る原核生物プロモーターの非限定的な例としては、SP6、T7、T5、tac、bla、trp、gal、lac、またはマルトースプロモーターが挙げられる。使用され得る真核生物プロモーターの非限定的な例としては、構成的プロモーター、例えば、CMV、SV40およびRSVプロモーターなどのウイルスプロモーター、ならびに調節可能なプロモーター、例えば、tetプロモーター、hsp70プロモーター、およびCREによって調節される合成プロモーターなどの誘導性または抑制性プロモーターが挙げられる。細菌発現用のベクターとしてはpGEX-5X-3が含まれ、真核生物発現用のベクターとしては、pCIneo-CMVが挙げられる。使用され得るウイルスベクターとしては、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、ヘルペスウイルス、ワクシニアウイルス、ポリオウイルス、AIDSウイルス、神経栄養ウイルス、シンドビスおよび他のウイルスに関連するものが挙げられる。これらのウイルスの特性を共有し、ベクターとしての使用に適した任意のウイルスファミリーも有用である。使用できるレトロウイルスベクターとしては、Verma,American Society for Microbiology,pp.229-232,Washington,(1985)に記載されているベクターが挙げられる。例えば、そのようなレトロウイルスベクターとしては、マウスマロニー白血病ウイルス、MMLV、および望ましい特性を発現する他のレトロウイルスが挙げられる。通常、ウイルスベクターには、非構造初期遺伝子、構造後期遺伝子、RNAポリメラーゼIII転写物、複製およびキャプシド形成に必要な逆末端リピート、ならびにウイルスゲノムの転写および複製を制御するプロモーターを含む。ベクターとして設計された場合、ウイルスは通常、1つまたはそれ以上の初期遺伝子が除去されており、除去されたウイルス核酸の代わりに遺伝子または遺伝子/プロモーターカセットがウイルスゲノムに挿入される。
クローニング
当技術分野で公知の任意の便利なクローニング戦略を利用して、ORFなどのエレメントを核酸試薬に組み込んでもよい。以下のような公知の方法を利用して、挿入エレメントとは独立してエレメントをテンプレートに挿入してもよい、例えば、(1)1つまたはそれ以上の既存の制限酵素部位でテンプレートを切断し、目的のエレメントをライゲーションすること、および(2)1つまたはそれ以上の適切な制限酵素部位を含むオリゴヌクレオチドプライマーをハイブリダイズし、ポリメラーゼ連鎖反応(本明細書でより詳細に記載される)によって増幅することによって、テンプレートに制限酵素部位を追加すること。他のクローニング戦略は、例えば、PCRのためのオリゴヌクレオチドプライマーハイブリダイゼーション部位、および本明細書に記載される他のものなど、核酸試薬に存在するかまたは挿入される1つまたはそれ以上の挿入部位を利用する。いくつかの実施形態では、クローニング戦略は、組換えなどの遺伝子操作と組み合わせてもよい(例えば、本明細書でさらに説明するように、改変される生物のゲノムへの目的の核酸配列を有する核酸試薬の組換え)。いくつかの実施形態では、クローニングされたORFは、目的の1つまたはそれ以上のORFを有する微生物を操作することによって、(直接的または間接的に)改変型のまたは野生型のポリメラーゼを生成し得、その微生物はポリメラーゼ活性の変化した活性を含む。
当技術分野で公知の任意の便利なクローニング戦略を利用して、ORFなどのエレメントを核酸試薬に組み込んでもよい。以下のような公知の方法を利用して、挿入エレメントとは独立してエレメントをテンプレートに挿入してもよい、例えば、(1)1つまたはそれ以上の既存の制限酵素部位でテンプレートを切断し、目的のエレメントをライゲーションすること、および(2)1つまたはそれ以上の適切な制限酵素部位を含むオリゴヌクレオチドプライマーをハイブリダイズし、ポリメラーゼ連鎖反応(本明細書でより詳細に記載される)によって増幅することによって、テンプレートに制限酵素部位を追加すること。他のクローニング戦略は、例えば、PCRのためのオリゴヌクレオチドプライマーハイブリダイゼーション部位、および本明細書に記載される他のものなど、核酸試薬に存在するかまたは挿入される1つまたはそれ以上の挿入部位を利用する。いくつかの実施形態では、クローニング戦略は、組換えなどの遺伝子操作と組み合わせてもよい(例えば、本明細書でさらに説明するように、改変される生物のゲノムへの目的の核酸配列を有する核酸試薬の組換え)。いくつかの実施形態では、クローニングされたORFは、目的の1つまたはそれ以上のORFを有する微生物を操作することによって、(直接的または間接的に)改変型のまたは野生型のポリメラーゼを生成し得、その微生物はポリメラーゼ活性の変化した活性を含む。
核酸を1つまたはそれ以上の特異的切断剤と接触させることにより、その核酸を特異的に切断し得る。特定の切断剤は、特定の部位で特定のヌクレオチド配列に従って特異的に切断することが多い。酵素特異的切断剤の例としては、限定するものではないが、エンドヌクレアーゼ(例えば、DNase(例えば、DNase I、II);RNase(例えば、RNase E、F、H、P);Cleavase(商標)酵素;TaqDNAポリメラーゼ;E.coli DNAポリメラーゼIおよび真核生物構造特異的エンドヌクレアーゼ;マウスFEN-1エンドヌクレアーゼ;I型、II型またはIII型制限エンドヌクレアーゼ、例えば、Acc I、Afl III、Alu I、Alw44 I、Apa I、Asn I、Ava I、Ava II、BamH I、Ban II、Bcl I、Bgl I.Bgl II、Bln I、BsaI、Bsm I、BsmBI、BssH II、BstE II、Cfo I、CIa I、Dde I、Dpn I、Dra I、EcIX I、EcoR I、EcoR I、EcoR II、EcoR V、Hae II、Hae II、Hind II、Hind III、Hpa I、Hpa II、Kpn I、Ksp I、Mlu I、MIuN I、Msp I、Nci I、Nco I、Nde I、Nde II、Nhe I、Not I、Nru I、Nsi I、Pst I、Pvu I、Pvu II、Rsa I、Sac I、Sal I、Sau3A I、Sca I、ScrF I、Sfi I、Sma I 、Spe I、Sph I、Ssp I、Stu I、Sty I、Swa I、Taq I、Xba I、Xho I);グリコシラーゼ(例えば、ウラシル-DNAグリコシラーゼ(UDG)、3-メチルアデニンDNAグリコシラーゼ、3-メチルアデニンDNAグリコシラーゼII、ピリミジン水和物-DNAグリコシラーゼ、FaPy-DNAグリコシラーゼ、チミンミスマッチ-DNAグリコシラーゼ、ヒポキサンチン-DNAグリコシラーゼ、5-ヒドロキシメチルウラシルDNAグリコシラーゼ(HmUDG)、5-ヒドロキシメチルシトシンDNAグリコシラーゼ、または1,N6-エテノ-アデニンDNAグリコシラーゼ);エキソヌクレアーゼ(例えば、エキソヌクレアーゼIII);リボザイム;およびDNAzymesが挙げられる。サンプル核酸は、化学薬品で処理されてもよいし、または修飾ヌクレオチドを使用して合成されてもよく、修飾核酸を切断してもよい。非限定的な例では、サンプル核酸は、(i)アルキルプリンDNAグリコシラーゼによって認識および切断される、N3-メチルアデニンおよびN3-メチルグアニンを含む、いくつかのアルキル化塩基を生成するメチルニトロソ尿素などのアルキル化剤;(ii)亜硫酸水素ナトリウムであって、これにより、DNAのシトシン残基が脱アミノ化され、ウラシルN-グリコシラーゼによって切断され得るウラシル残基が形成される、亜硫酸水素ナトリウム;ならびに(iii)グアニンをその酸化型である8-ヒドロキシグアニンに変換する化学薬品(これはホルムアミドピリミジンDNA N-グリコシラーゼによって切断され得る)、で処理され得る。化学的切断プロセスの例としては、限定するものではないが、アルキル化(例えば、ホスホロチオエート修飾核酸のアルキル化);P3’-N5’-ホスホロアミデート含有核酸の酸不安定性の切断;ならびに核酸の四酸化オスミウムおよびピペリジン処理が挙げられる。
いくつかの実施形態では、核酸試薬は、1つまたはそれ以上のリコンビナーゼ挿入部位を含む。リコンビナーゼ挿入部位は、組換えタンパク質による組み込み/組換え反応に関与する核酸分子上の認識配列である。例えば、Creリコンビナーゼの組換え部位は、loxPであり、これは、8塩基対のコア配列(例えば、Sauer,Curr.Opin.Biotech.5:521-527(1994))に隣接する2つの13塩基対の逆方向反復配列(リコンビナーゼ結合部位として機能)で構成される34塩基対の配列である。組換え部位の他の例としては、attB、attP、attL、およびattR配列、ならびに組換えタンパク質λIntによって、および補助タンパク質組み込み宿主因子(IHF)、FISおよび切除酵素(Xis)によって認識される、それらの変異体、フラグメント、バリアントおよび誘導体が挙げられる(例えば、米国特許第5,888,732号;同第6,143,557号;同第6,171,861号;同第6,270,969号;同第6,277,608号;および同第6,720,140号;米国特許出願公開第09/517,466号、および同第09/732,914号;米国特許出願公開第2002/0007051号;ならびにLandy,Curr.Opin.Biotech.3:699-707(1993))。
リコンビナーゼクローニング核酸の例は、ゲートウェイ(Gateway)(登録商標)システム(Invitrogen,California)にあり、これは、インビボまたはインビトロで所望の核酸分子をクローニングするための少なくとも1つの組換え部位を含む。いくつかの実施形態では、この系は、しばしばバクテリオファージラムダ系(例えば、att1およびatt2)に基づいて、少なくとも2つの異なる部位特異的組換え部位を含み、野生型(att0)部位から変異しているベクターを利用する。各変異部位は、同じタイプの同族のパートナーatt部位(すなわち、その結合パートナー組換え部位)に対して固有の特異性を有し(例えば、attB1とattP1、またはattL1とattR1)、他の変異型の組換え部位とも、または野生型att0部位とも交差反応しない。異なる部位特異性は、所望の分子の方向性のあるクローニングまたは連結を可能にし、したがって、クローニングされた分子の所望の配向を提供する。組換え部位に隣接する核酸フラグメントは、Gateway(登録商標)系を使用して、目的ベクター(Destination Vector)と呼ばれることもあるレシピエントプラスミド分子上のatt部位に隣接する選択可能なマーカー(例えば、ccdB)を置き換えることにより、クローニングおよびサブクローニングされる。次いで、ccdB感受性宿主株の形質転換およびレシピエント分子上のマーカーの陽性選択によって、所望のクローンが選択される。陰性選択(例えば、毒性遺伝子の使用)のための同様の戦略は、哺乳類および昆虫のチミジンキナーゼ(TK)のように他の生物で使用され得る。
核酸試薬は、1つまたはそれ以上の複製起点(ORI)エレメントを含むことがある。いくつかの実施形態では、テンプレートは、2つまたはそれ以上のORIを含み、1つは1つの生物(例えば、細菌)において効率的に機能し、別の生物は別の生物(例えば、酵母のような真核生物)において効率的に機能する。いくつかの実施形態では、ORIは、1つの種(例えば、S.cerevisiaeなど)において効率的に機能し得、そして別のORIは、異なる種(例えば、S.pombeなど)において効率的に機能し得る。核酸試薬はまた、1つまたはそれ以上の転写調節部位を含む場合もある。
核酸試薬、例えば、発現カセットまたはベクターは、マーカー産物をコードする核酸配列を含み得る。マーカー産物は、ある遺伝子が細胞に送達され、送達された後は発現されているか否かを判断するために使用される。マーカー遺伝子の例としては、β-ガラクトシダーゼおよび緑色蛍光タンパク質をコードする大腸菌lacZ遺伝子が挙げられる。いくつかの実施形態では、マーカーは、選択可能なマーカーであり得る。そのような選択可能なマーカーが宿主細胞に首尾よく移されるとき、その形質転換された宿主細胞は、選択圧下に置かれた場合に生き残り得る。選択的レジームには、広く使用されている2つの別個のカテゴリーがある。第1のカテゴリーは、細胞の代謝、および補充された培地から独立して増殖する能力を欠く変異細胞株の使用に基づいている。第2のカテゴリーは優性選択であり、これは任意の細胞型で使用される選択スキームを指し、変異細胞株の使用を必要としない。これらのスキームは通常、宿主細胞の増殖を阻止するために薬物を使用する。新規遺伝子を有するそれらの細胞は、薬剤耐性を運ぶタンパク質を発現し、選択を生き残る。そのような優勢な選択の例は、薬物ネオマイシン(Southernら、J.Molec.Appl.Genet.1:327(1982))、ミコフェノール酸(Mulliganら、Science 209:1422(1980))またはハイグロマイシン(Sugdenら、Mol.Cell.Biol.5:410~413(1985))を使用する。
核酸試薬は、1つまたはそれ以上の選択エレメント(例えば、核酸試薬の存在を選択するためのエレメントであり、選択的に調節され得るプロモーターエレメントの活性化のためではないエレメント)を含み得る。選択エレメントは、核酸試薬が細胞に含まれるか否かを決定するために公知のプロセスを使用して利用されることが多い。いくつかの実施形態では、核酸試薬は、2つまたはそれ以上の選択エレメントを含み、1つのエレメントは1つの生物において効率的に機能し、別のエレメントは別の生物において効率的に機能する。選択エレメントの例としては、限定するものではないが、以下が挙げられる:(1)他の方法では毒性のある化合物(例えば、抗生物質)に対する耐性を提供する産物をコードする核酸セグメント;(2)他の方法ではレシピエント細胞に欠けている産物(例えば、必須産物、tRNA遺伝子、栄養要求性マーカー)をコードする核酸セグメント;(3)遺伝子産物の活性を抑制する産物をコードする核酸セグメント;(4)容易に同定され得る産物をコードする核酸セグメント(例えば、抗生物質(例えば、β-ラクタマーゼ)、β-ガラクトシダーゼ、緑色蛍光タンパク質(GFP)、黄色蛍光タンパク質(YFP)、赤色蛍光タンパク質(RFP)、シアン蛍光タンパク質(CFP)、および細胞表面タンパク質などの表現型マーカー);(5)細胞の生存および/または機能に対して他の方法では有害な産物に結合する核酸セグメント;(6)上記の1~5番に記載されている核酸セグメント(例えば、アンチセンスオリゴヌクレオチド)のいずれかの活性を他の方法では阻害する核酸セグメント;(7)基質を修飾する産物(例えば、制限エンドヌクレアーゼ)に結合する核酸セグメント;(8)所望の分子(例えば、特定のタンパク質結合部位)を単離または同定するために使用され得る核酸セグメント;(9)他の方法では機能しない場合がある特定のヌクレオチド配列をコードする核酸セグメント(例えば、分子の亜集団のPCR増幅のために);(10)存在しない場合、特定の化合物に対する耐性または感受性を直接的または間接的に付与する核酸セグメント;(11)レシピエント細胞において、毒性であるか、または比較的非毒性の化合物を毒性化合物に変換する産物(例えば、単純ヘルペスチミジンキナーゼ、シトシンデアミナーゼ)をコードする核酸セグメント;(12)それらを含む核酸分子の複製、分配または遺伝可能性を阻害する核酸セグメント;ならびに/あるいは(13)条件付き複製機能、例えば、特定の宿主もしくは宿主細胞株における、または特定の環境条件下(例えば、温度、栄養状態など)での複製をコードする核酸セグメント。
核酸試薬は、インビボ転写および/または翻訳に有用な任意の形態であり得る。核酸は、スーパーコイルプラスミドなどのプラスミドである場合もあれば、酵母人工染色体(例えば、YAC)である場合もあり、線状核酸(例えば、PCRまたは制限消化によって産生される線状核酸)である場合もあり、一本鎖である場合もあり、時には二本鎖でもある。核酸試薬は、ポリメラーゼ連鎖反応(PCR)プロセスまたは転写媒介増幅プロセス(TMA)などの増幅プロセスによって調製される場合もある。TMAでは、2つの酵素が、等温反応で使用され、発光によって検出される増幅産物を生成する(例えば、Biochemistry 1996 Jun 25;35(25):8429-38)。標準的なPCRプロセスは公知であり(例えば、米国特許第4,683,202号;第4,683,195号;第4,965,188号;および第5,565,493号)、一般にサイクルで実施される。各サイクルとしては、熱変性(ここでハイブリッド核酸が解離する)、冷却(ここでプライマーオリゴヌクレオチドがハイブリダイズする);およびポリメラーゼ(すなわち、Taqポリメラーゼ)によるオリゴヌクレオチドの伸長が挙げられる。PCR循環プロセスの例は、サンプルを95℃で5分間処理すること;95℃で1分間、59℃で1分間、10秒間、72℃で1分30秒間という45サイクルを繰り返すこと;次いで、サンプルを72℃で5分間処理すること。複数のサイクルは、市販のサーマルサイクラーを使用して頻繁に行われる。PCR増幅産物は、低温で一時的に保存される場合もあり(例えば、4℃)、分析前に凍結される場合もある(例えば、-20℃)。
上記のものと類似のクローニング戦略を使用して、非天然ヌクレオチドを含むDNAを生成し得る。例えば、所望の位置に非天然ヌクレオチドを含むオリゴヌクレオチドは、標準的な固相合成を使用して合成され、HPLCによって精製される。次いで、オリゴヌクレオチドは、BsaI部位などのクローニング部位を使用したクローニング方法(Golden Gateアセンブリなど)を使用して(ただし、上記で説明した他のものを使用してもよい)、必要な配列コンテキスト(すなわち、UTRおよびコード配列)を含むプラスミドに挿入される。
キット/製造品
特定の実施形態では、本明細書に開示されるのは、本明細書に記載される1つまたはそれ以上の方法で使用するためのキットおよび製造品である。そのようなキットとしては、バイアル、チューブなどのような1つまたはそれ以上の容器を受け入れるように区画化された担体、パッケージ、または容器を含み、その容器のそれぞれは、本明細書に記載の方法で使用される別個のエレメントの1つを含んでいる。適切な容器としては、例えば、ボトル、バイアル、注射器、および試験管が挙げられる。一実施形態では、容器は、ガラスまたはプラスチックなどの様々な材料から形成される。
特定の実施形態では、本明細書に開示されるのは、本明細書に記載される1つまたはそれ以上の方法で使用するためのキットおよび製造品である。そのようなキットとしては、バイアル、チューブなどのような1つまたはそれ以上の容器を受け入れるように区画化された担体、パッケージ、または容器を含み、その容器のそれぞれは、本明細書に記載の方法で使用される別個のエレメントの1つを含んでいる。適切な容器としては、例えば、ボトル、バイアル、注射器、および試験管が挙げられる。一実施形態では、容器は、ガラスまたはプラスチックなどの様々な材料から形成される。
いくつかの実施形態では、キットは、キットの内容物を収容するための適切な包装材料を備える。場合によっては、包装材料は、好ましくは無菌で夾雑物のない環境を提供するために、周知の方法によって構築される。本明細書で使用される包装材料としては、例えば、核酸配列決定システムで使用するために販売されている市販のキットで慣習的に利用されているものが挙げられる。例示的な包装材料としては、限定するものではないが、本明細書に記載の構成成分を一定の範囲内に保持し得るガラス、プラスチック、紙、ホイルなどが挙げられる。
包装材料は、構成成分の特定の用途を示すラベルを備えてもよい。このラベルで示されているキットの使用は、そのキットに存在する構成成分の特定の組み合わせに適切な、本明細書に記載されている方法の1つまたはそれ以上であり得る。例えば、ラベルは、キットがポリヌクレオチドを合成する方法にとって、または核酸の配列を決定する方法にとって有用であることを示し得る。
パッケージングされた試薬または構成成分の使用説明書もキットに含まれてもよい。この説明書には通常、混合されるキット成分およびサンプルの相対量、試薬/サンプル混合物のメンテナンス期間、温度、緩衝液条件などの反応パラメーターを説明する具体的な表現が含まれる。
特定の反応に必要な全ての構成成分が特定のキットに存在する必要があるわけではないことが理解される。そうではなく、1つまたはそれ以上の追加の構成成分を他の供給源から提供され得る。キットに付属の説明書で、提供される追加の構成成分、及びそれらを入手できる場所が特定され得る。
いくつかの実施形態では、例えば、遺伝子操作された哺乳動物細胞(例えば、CHOまたはHEK293T細胞)を製造するための本発明によって提供される方法を使用して、細胞性核酸中に非天然核酸を安定に組み込むのに有用であるキットが提供される。一実施形態では、本明細書に記載のキットは、遺伝子操作された細胞および1つまたはそれ以上の非天然核酸を含む。
追加の実施形態では、本明細書に記載のキットは、細胞および細胞に導入するための異種遺伝子を含む核酸分子を提供し、それにより、この段落で説明されている上記の任意の実施形態の核酸を含む発現ベクターなどの遺伝子操作された細胞を提供する。
いくつかの実施形態では、本明細書に記載される細胞は、哺乳動物、例えば、ヒトのような多細胞生物であり得る生物に送達される。そのようなものとして、非天然アミノ酸を有するポリペプチドを含む真核細胞を、生物に導入できる。
番号を付けた実施形態
本開示は、以下の非限定的な番号を付けた実施形態を含む:
実施形態1。真核細胞において1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを産生する方法であって、
(a)(i)第1の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)と;
(ii)第2の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA)とを含む真核細胞であって、第1のおよび第2の非天然塩基は、真核細胞において非天然塩基対(UBP)を形成する、真核細胞を提供する工程と;
(b)真核細胞に対して内因性であるリボソームによってtRNAを使用してmRNAから1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを翻訳する工程と
を含む方法。
本開示は、以下の非限定的な番号を付けた実施形態を含む:
実施形態1。真核細胞において1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを産生する方法であって、
(a)(i)第1の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)と;
(ii)第2の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA)とを含む真核細胞であって、第1のおよび第2の非天然塩基は、真核細胞において非天然塩基対(UBP)を形成する、真核細胞を提供する工程と;
(b)真核細胞に対して内因性であるリボソームによってtRNAを使用してmRNAから1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを翻訳する工程と
を含む方法。
実施形態2。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の第1の位置(X-N-N)に位置する、実施形態1に記載の方法。
実施形態3。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置する、実施形態1に記載の方法。
実施形態4。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の最後の位置(N-N-X)に位置する、実施形態1に記載の方法。
実施形態5。第1の非天然塩基または第2の非天然塩基が、
(i)2-チオウラシル、2-チオ-チミン、2’-デオキシウリジン、4-チオ-ウラシル、4-チオ-チミン、ウラシル-5-イル、ヒポキサンチン-9-イル(I)、5-ハロウラシル;5-プロピニル-ウラシル、6-アゾ-チミン、6-アゾ-ウラシル、5-メチルアミノメチルウラシル、5-メトキシアミノメチル-2-チオウラシル、シュードウラシル、ウラシル-5-オキサ酢酸メチルエステル、ウラシル-5-オキサ酢酸、5-メチル-2-チオウラシル、3-(3-アミノ-3-N-2-カルボキシプロピル)ウラシル、5-メチル-2-チオウラシル、4-チオウラシル、5-メチルウラシル、5’-メトキシカルボキシメチルウラシル、5-メトキシウラシル、ウラシル-5-オキシ酢酸、5-(カルボキシヒドロキシルメチル)ウラシル、5-カルボキシメチルアミノメチル-2-チオウリジン、5-カルボキシメチルアミノメチルウラシルまたはジヒドロウラシル;
(ii)5-ヒドロキシメチルシトシン、5-トリフルオロメチルシトシン、5-ハロシトシン、5-プロピニルシトシン、5-ヒドロキシシトシン、シクロシトシン、シトシンアラビノシド、5,6-ジヒドロシトシン、5-ニトロシトシン、6-アゾシトシン、アザシトシン、N4-エチルシトシン、3-メチルシトシン、5-メチルシトシン、4-アセチルシトシン、2-チオシトシン、フェノキサジンシチジン([5,4-b][1,4]ベンゾオキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド[5,4-b][1,4]ベンゾチアジン-2(3H)-オン)、フェノキサジンシチジン(9-(2-アミノエトキシ)-H-ピリミド[5,4-b][1,4]ベンゾオキサジン-2(3H)-オン)、カルバゾールシチジン(2H-ピリミド[4,5-b]インドール-2-オン)またはピリドインドールシチジン(H-ピリド[3’,2’:4,5]ピロロ[2,3-d]ピリミジン-2-オン);
(iii)2-アミノアデニン、2-プロピルアデニン、2-アミノ-アデニン、2-F-アデニン、2-アミノ-プロピル-アデニン、2-アミノ-2’-デオキシアデノシン、3-デアザアデニン、7-メチルアデニン、7-デアザ-アデニン、8-アザアデニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシルで置換されたアデニン、N6-イソペンテニルアデニン、2-メチルアデニン、2,6-ジアミノプリン、2-メチルチオ-N6-イソペンテニルアデニンまたは6-アザ-アデニン;
(iv)2-メチルグアニン、グアニンの2-プロピルおよびアルキル誘導体、3-デアザグアニン、6-チオ-グアニン、7-メチルグアニン、7-デアザグアニン、7-デアザグアノシン、7-デアザ-8-アザグアニン、8-アザグアニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシルで置換されたグアニン、1-メチルグアニン、2,2-ジメチルグアニン、7-メチルグアニンまたは6-アザ-グアニン;ならびに
(v)ヒポキサンチン、キサンチン、1-メチルイノシン、キュエオシン、ベータ-D-ガラクトシルキュエオシン、イノシン、ベータ-D-マンノシルキュエオシン、ワイブトキソシン、ヒドロキシウレア、(acp3)w、2-アミノピリジンまたは2-ピリドン
からなる群から選択される実施形態1~4のいずれか1項に記載の方法。
(i)2-チオウラシル、2-チオ-チミン、2’-デオキシウリジン、4-チオ-ウラシル、4-チオ-チミン、ウラシル-5-イル、ヒポキサンチン-9-イル(I)、5-ハロウラシル;5-プロピニル-ウラシル、6-アゾ-チミン、6-アゾ-ウラシル、5-メチルアミノメチルウラシル、5-メトキシアミノメチル-2-チオウラシル、シュードウラシル、ウラシル-5-オキサ酢酸メチルエステル、ウラシル-5-オキサ酢酸、5-メチル-2-チオウラシル、3-(3-アミノ-3-N-2-カルボキシプロピル)ウラシル、5-メチル-2-チオウラシル、4-チオウラシル、5-メチルウラシル、5’-メトキシカルボキシメチルウラシル、5-メトキシウラシル、ウラシル-5-オキシ酢酸、5-(カルボキシヒドロキシルメチル)ウラシル、5-カルボキシメチルアミノメチル-2-チオウリジン、5-カルボキシメチルアミノメチルウラシルまたはジヒドロウラシル;
(ii)5-ヒドロキシメチルシトシン、5-トリフルオロメチルシトシン、5-ハロシトシン、5-プロピニルシトシン、5-ヒドロキシシトシン、シクロシトシン、シトシンアラビノシド、5,6-ジヒドロシトシン、5-ニトロシトシン、6-アゾシトシン、アザシトシン、N4-エチルシトシン、3-メチルシトシン、5-メチルシトシン、4-アセチルシトシン、2-チオシトシン、フェノキサジンシチジン([5,4-b][1,4]ベンゾオキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド[5,4-b][1,4]ベンゾチアジン-2(3H)-オン)、フェノキサジンシチジン(9-(2-アミノエトキシ)-H-ピリミド[5,4-b][1,4]ベンゾオキサジン-2(3H)-オン)、カルバゾールシチジン(2H-ピリミド[4,5-b]インドール-2-オン)またはピリドインドールシチジン(H-ピリド[3’,2’:4,5]ピロロ[2,3-d]ピリミジン-2-オン);
(iii)2-アミノアデニン、2-プロピルアデニン、2-アミノ-アデニン、2-F-アデニン、2-アミノ-プロピル-アデニン、2-アミノ-2’-デオキシアデノシン、3-デアザアデニン、7-メチルアデニン、7-デアザ-アデニン、8-アザアデニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシルで置換されたアデニン、N6-イソペンテニルアデニン、2-メチルアデニン、2,6-ジアミノプリン、2-メチルチオ-N6-イソペンテニルアデニンまたは6-アザ-アデニン;
(iv)2-メチルグアニン、グアニンの2-プロピルおよびアルキル誘導体、3-デアザグアニン、6-チオ-グアニン、7-メチルグアニン、7-デアザグアニン、7-デアザグアノシン、7-デアザ-8-アザグアニン、8-アザグアニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシルで置換されたグアニン、1-メチルグアニン、2,2-ジメチルグアニン、7-メチルグアニンまたは6-アザ-グアニン;ならびに
(v)ヒポキサンチン、キサンチン、1-メチルイノシン、キュエオシン、ベータ-D-ガラクトシルキュエオシン、イノシン、ベータ-D-マンノシルキュエオシン、ワイブトキソシン、ヒドロキシウレア、(acp3)w、2-アミノピリジンまたは2-ピリドン
からなる群から選択される実施形態1~4のいずれか1項に記載の方法。
実施形態7。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態6に記載の方法。
実施形態8。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す実施形態6に記載の方法。
実施形態9。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態6に記載の方法。
実施形態10。第1の非天然塩基が、
である場合に、第2の非天然塩基が、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態6に記載の方法。
実施形態11。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態6に記載の方法。
実施形態12。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態6に記載の方法。
実施形態13。第1の非天然塩基または第2の非天然塩基は、
2’位における修飾:
OH、置換された低級アルキル、アルカリル、アラルキル、O-アルカリルまたはO-アラルキル、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-アルキル、S-アルキル、N-アルキル;
O-アルケニル、S-アルケニル、N-アルケニル;
O-アルキニル、S-アルキニル、N-アルキニル;
O-アルキル-O-アルキル、2’-F、2’-OCH3、2’-O(CH2)2OCH3、(ここで、アルキル、アルケニルおよびアルキニルは、置換もしくは無置換のC1~C10、アルキル、C2~C10アルケニル、C2~C10アルキニル、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2および-O(CH2)nON[(CH2)nCH3)]2であってもよく、nおよびmは、1~約10である);
および/または5’位における修飾:
5’-ビニル、5’-メチル(RまたはS);
4位における修飾:
4’-S、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態学的性質を改善するための基またはオリゴヌクレオチドの薬力学的性質を改善するための基、およびそれらの任意の組み合わせからなる群から選択される修飾された糖部分を含む、実施形態1~12のいずれか1項に記載の方法。
2’位における修飾:
OH、置換された低級アルキル、アルカリル、アラルキル、O-アルカリルまたはO-アラルキル、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-アルキル、S-アルキル、N-アルキル;
O-アルケニル、S-アルケニル、N-アルケニル;
O-アルキニル、S-アルキニル、N-アルキニル;
O-アルキル-O-アルキル、2’-F、2’-OCH3、2’-O(CH2)2OCH3、(ここで、アルキル、アルケニルおよびアルキニルは、置換もしくは無置換のC1~C10、アルキル、C2~C10アルケニル、C2~C10アルキニル、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2および-O(CH2)nON[(CH2)nCH3)]2であってもよく、nおよびmは、1~約10である);
および/または5’位における修飾:
5’-ビニル、5’-メチル(RまたはS);
4位における修飾:
4’-S、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態学的性質を改善するための基またはオリゴヌクレオチドの薬力学的性質を改善するための基、およびそれらの任意の組み合わせからなる群から選択される修飾された糖部分を含む、実施形態1~12のいずれか1項に記載の方法。
実施形態14。方法は、ヒト細胞である、実施形態1~13のいずれか1項に記載の方法。
実施形態15。ヒト細胞は、HEK293T細胞である、実施形態14に記載の方法。
実施形態16。細胞は、ハムスター細胞である、実施形態1~13のいずれか1項に記載の方法。
実施形態17。ハムスター細胞は、チャイニーズハムスター卵巣(CHO)細胞である、実施形態16に記載の方法。
実施形態18。非天然アミノ酸は:
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、実施形態1~17のいずれか1項に記載の方法。
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、実施形態1~17のいずれか1項に記載の方法。
実施形態19。非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)、N6-((プロパルギルエトキシ)-カルボニル)-L-リジン(PraK)、BCN-L-リジン、ノルボルネンリジン、TCO-リジン、メチルテトラジンリジン、アリルオキシカルボニルリジン、2-アミノ-8-オキソノナン酸、2-アミノ-8-オキソオクタン酸、p-アセチル-L-フェニルアラニン、p-アジドメチル-L-フェニルアラニン(pAMF)、p-ヨード-L-フェニルアラニン、m-アセチルフェニルアラニン、2-アミノ-8-オキソノナン酸、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、3-メチル-フェニルアラニン、L-ドパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、p-ブロモフェニルアラニン、p-アミノ-L-フェニルアラニン、イソプロピル-L-フェニルアラニン、O-アリルチロシン、O-メチル-L-チロシン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、ホスホノチロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ホスホセリン、ホスホノセリン、L-3-(2-ナフチル)アラニン、2-アミノ-3-((2-((3-(ベンジルオキシ)-3-オキソプロピル)アミノ)エチル)セラニル)プロパン酸、2-アミノ-3-(フェニルセラニル)プロパン酸、セレノシステイン、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジン、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンまたはN6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンからなる群から選択される、実施形態1~17のいずれか1項に記載の方法。
実施形態20。非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)である、実施形態19に記載の方法。
実施形態21。真核細胞においてポリペプチドを産生する方法であって、ポリペプチドは、1つまたはそれ以上の非天然アミノ酸を含み、方法は:
(a)真核生物を提供する工程であって、真核生物は:
(i)1つまたはそれ以上の非天然塩基を含むコドンを含むmRNAと;
(ii)1つまたはそれ以上の非天然塩基を含むアンチコドンを含むtRNAであって、mRNA中のコドンを含む1つまたはそれ以上の非天然塩基およびtRNA中のアンチコドンを含む1つまたはそれ以上の非天然塩基は相補的塩基対を形成する、tRNAと;
(iii)tRNAを天然アミノ酸と比較して1つまたはそれ以上の非天然アミノ酸で優先的にアミノアシル化するtRNAシンテターゼと
を含む、工程と、
(b)1つまたはそれ以上の非天然アミノ酸を真核細胞に提供する工程であって、真核細胞は1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを産生する、工程とを含む方法。
(a)真核生物を提供する工程であって、真核生物は:
(i)1つまたはそれ以上の非天然塩基を含むコドンを含むmRNAと;
(ii)1つまたはそれ以上の非天然塩基を含むアンチコドンを含むtRNAであって、mRNA中のコドンを含む1つまたはそれ以上の非天然塩基およびtRNA中のアンチコドンを含む1つまたはそれ以上の非天然塩基は相補的塩基対を形成する、tRNAと;
(iii)tRNAを天然アミノ酸と比較して1つまたはそれ以上の非天然アミノ酸で優先的にアミノアシル化するtRNAシンテターゼと
を含む、工程と、
(b)1つまたはそれ以上の非天然アミノ酸を真核細胞に提供する工程であって、真核細胞は1つまたはそれ以上の非天然アミノ酸を含むポリペプチドを産生する、工程とを含む方法。
実施形態22。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)が、mRNAのコドン中の第1の位置(X-N-N)に位置する、実施形態21に記載の方法。
実施形態23。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)が、mRNAのコドン中の中央の位置(N-X-N)に位置する、実施形態21に記載の方法。
実施形態24.mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)が、mRNAのコドン中の最後の位置(N-N-X)に位置する、実施形態21に記載の方法。
実施形態25。mRNA中のコドンを含む1つまたはそれ以上の非天然塩基は、式
または
のものであり、式中、R2は、水素、アルキル、アルケニル、アルキニル、メトキシ、メタンチオール、メタンセレノ、ハロゲン、シアノおよびアジドからなる群から選択され、波線は、リボシル部分への結合を示す、実施形態21~24のいずれか1項に記載の方法。
実施形態27。第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態26に記載の方法。
実施形態28。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態26に記載の方法。
実施形態29。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態26に記載の方法。
実施形態30。第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態26に記載の方法。
実施形態31。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態26に記載の方法。
実施形態32。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態26に記載の方法。
実施形態38。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、非天然塩基(X)が、mRNAのコドン中の第1の位置(X-N-N)に位置し、非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態21に記載の方法。
実施形態42。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置し、非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態21に記載の方法。
実施形態46。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、非天然塩基(X)は、mRNAのコドン中の最後の位置(N-N-X)に位置し、非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態21に記載の方法。
実施形態50。tRNAのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、tRNAのアンチコドン中の第1の位置(X-N-N)に位置する、実施形態21に記載の方法。
実施形態55。tRNAのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、tRNAのアンチコドン中の中央の位置(N-X-N)に位置する、実施形態21に記載の方法。
実施形態60。tRNAのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、tRNAのアンチコドン中の最後の位置(N-N-X)に位置する、実施形態21に記載の方法。
実施形態65。コドンおよびアンチコドンは各々、3つの連続した核酸塩基(N-N-N)を含み、mRNA中のコドンは、コドンの第1の位置(X-N-N)に位置する第1の非天然塩基(X)を含み、tRNA中のアンチコドンは、アンチコドンの最後の位置(N-N-Y)に位置する第2の非天然塩基(Y)を含む、実施形態21に記載の方法。
実施形態66。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、同一であるかまたは異なっている、実施形態65に記載の方法。
実施形態67。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、同一である、実施形態66に記載の方法。
実施形態68。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、異なっている、実施形態66に記載の方法。
実施形態69。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態65~68のいずれか1項に記載の方法。
実施形態70。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態69に記載の方法。
実施形態71。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態70に記載の方法。
実施形態72。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態70に記載の方法。
実施形態73。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態70に記載の方法。
実施形態74。mRNAのコドン中に位置する第1の非天然塩基(X)は、
から選択され、tRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、
であり、各場合において波線は、リボシル部分への結合を示す、実施形態70に記載の方法。
実施形態77。コドンおよびアンチコドンは各々、3つの連続した核酸塩基(N-N-N)を含み、mRNA中のコドンは、コドンの中央の位置(N-X-N)に位置する第1の非天然塩基(X)を含み、tRNA中のアンチコドンは、アンチコドンの中央の位置(N-Y-N)に位置する第2の非天然塩基(Y)を含む、実施形態21に記載の方法。
実施形態78。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、同一であるか、または異なっている、実施形態77に記載の方法。
実施形態79。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、同一である、実施形態78に記載の方法。
実施形態80。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、異なっている、実施形態78に記載の方法。
実施形態81。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態77~79のいずれか1項に記載の方法。
実施形態82。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態81に記載の方法。
実施形態83。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態82に記載の方法。
実施形態84。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態82に記載の方法。
実施形態85。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態82に記載の方法。
実施形態86。mRNAのコドン中に位置する第1の非天然塩基(X)は、
から選択され、tRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、
であり、各場合において波線は、リボシル部分への結合を示す、実施形態82に記載の方法。
実施形態89。コドンおよびアンチコドンは各々、3つの連続した核酸塩基(N-N-N)を含み、mRNA中のコドンは、コドンの最後の位置(N-N-X)に位置する第1の非天然塩基(X)を含み、tRNA中のアンチコドンは、アンチコドンの第1の位置(Y-N-N)に位置する第2の非天然塩基(Y)を含む、実施形態21に記載の方法。
実施形態90。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、同一であるか、または異なっている、実施形態89に記載の方法。
実施形態91。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、同一である、実施形態89に記載の方法。
実施形態92。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、異なっている、実施形態89に記載の方法。
実施形態93。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態89~92のいずれか1項に記載の方法。
実施形態94。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態93に記載の方法。
実施形態95。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態94に記載の方法。
実施形態96。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態94に記載の方法。
実施形態97。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態94に記載の方法。
実施形態98。mRNAのコドン中に位置する第1の非天然塩基(X)は、
から選択され、tRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、
であり、各場合において波線は、リボシル部分への結合を示す、実施形態94に記載の方法。
実施形態101。mRNA中のコドンは、AXC、GXCまたはGXUから選択され、Xは、非天然塩基である、実施形態21、23、25~37、42~45、55~59および77~88のいずれか1項に記載の方法。
実施形態102。mRNA中のコドンはAXCであり、Xは非天然塩基である、実施形態101に記載の方法。
実施形態103。mRNA中のコドンはGXCであり、Xは非天然塩基である、実施形態101に記載の方法。
実施形態104。mRNA中のコドンはGXUであり、Xは非天然塩基である、実施形態101に記載の方法。
実施形態105。mRNA中のコドンは、AXC、GXCまたはGXUから選択され、tRNA中のアンチコドンは、GYU、GYCおよびAYCから選択され、Xは第1の非天然塩基であり、Yは第2の非天然塩基である、実施形態21、23、25~37、42~45、55~59および77~88のいずれか1項に記載の方法。
実施形態106。XおよびYは、同一であるか、または異なっている、実施形態105に記載の方法。
実施形態107。XおよびYは、同一である、実施形態106に記載の方法。
実施形態108。XおよびYは、異なっている、実施形態106に記載の方法。
実施形態109。mRNA中のコドンはAXCであり、tRNA中のアンチコドンはGYUである、実施形態105に記載の方法。
実施形態110。XおよびYは、同一であるか、または異なっている、実施形態109に記載の方法。
実施形態111。XおよびYは、同一である、実施形態109に記載の方法。
実施形態112。XおよびYは、異なっている、実施形態109に記載の方法。
実施形態113。mRNA中のコドンはGXCであり、tRNA中のアンチコドンはGYCである、実施形態106に記載の方法。
実施形態114。XおよびYは、同一であるか、または異なっている、実施形態113に記載の方法。
実施形態115。XおよびYは、同一である、実施形態113に記載の方法。
実施形態116。XおよびYは、異なっている、実施形態113に記載の方法。
実施形態117。mRNA中のコドンはGXUであり、アンチコドンはAYCである、実施形態106に記載の方法。
実施形態118。XおよびYは、同一であるか、または異なっている、実施形態117に記載の方法。
実施形態119。XおよびYは、同一である、実施形態117に記載の方法。
実施形態120。XおよびYは、異なっている、実施形態117に記載の方法。
実施形態121。tRNAは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、実施形態21~120のいずれか1項に記載の方法。
実施形態122。tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、実施形態21~120のいずれか1項に記載の方法。
実施形態123。tRNAおよびtRNAシンテターゼは、メタノコックス・ヤンナスキイに由来する、実施形態122に記載の方法。
実施形態124。tRNAおよびtRNAシンテターゼは、メタノサルシナ・バルケリに由来する、実施形態122に記載の方法。
実施形態125。tRNAおよびtRNAシンテターゼは、メタノサルシナ・マゼイに由来する、実施形態122に記載の方法。
実施形態126。tRNAおよびtRNAシンテターゼは、メタノサルシナ・アセチボランスに由来する、実施形態122に記載の方法。
実施形態127。tRNAは、メタノコックス・ヤンナスキイに由来し、tRNAシンテターゼは、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、実施形態21~120のいずれか1項に記載の方法。
実施形態128。tRNAは、メタノサルシナ・バルケリに由来し、tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、実施形態21~120のいずれか1項に記載の方法。
実施形態129。tRNAは、メタノサルシナ・マゼイに由来し、tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリまたはメタノサルシナ・アセチボランスに由来する、実施形態21~120のいずれか1項に記載の方法。
実施形態130。tRNAは、メタノサルシナ・アセチボランスに由来し、tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリまたはメタノサルシナ・マゼイに由来する、実施形態21~120のいずれか1項に記載の方法。
実施形態131。tRNAは、メタノサルシナ・マゼイに由来し、tRNAシンテターゼは、メタノサルシナ・バルケリに由来する、実施形態21~120のいずれか1項に記載の方法。
実施形態132。細胞は、ヒト細胞である、実施形態21~120のいずれか1項に記載の方法。
実施形態133。ヒト細胞は、HEK293T細胞である、実施形態132に記載の方法。
実施形態134。細胞は、ハムスター細胞である、実施形態21~120のいずれか1項に記載の方法。
実施形態135。ハムスター細胞は、チャイニーズハムスター卵巣(CHO)細胞である、実施形態134に記載の方法。
実施形態136。非天然アミノ酸は:
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、実施形態21~135のいずれか1項に記載の方法。
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、実施形態21~135のいずれか1項に記載の方法。
実施形態137。非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)、N6-((プロパルギルエトキシ)-カルボニル)-L-リジン(PraK)、BCN-L-リジン、ノルボルネンリジン、TCO-リジン、メチルテトラジンリジン、アリルオキシカルボニルリジン、2-アミノ-8-オキソノナン酸、2-アミノ-8-オキソオクタン酸、p-アセチル-L-フェニルアラニン、p-アジドメチル-L-フェニルアラニン(pAMF)、p-ヨード-L-フェニルアラニン、m-アセチルフェニルアラニン、2-アミノ-8-オキソノナン酸、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、3-メチル-フェニルアラニン、L-ドパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、p-ブロモフェニルアラニン、p-アミノ-L-フェニルアラニン、イソプロピル-L-フェニルアラニン、O-アリルチロシン、O-メチル-L-チロシン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、ホスホノチロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ホスホセリン、ホスホノセリン、L-3-(2-ナフチル)アラニン、2-アミノ-3-((2-((3-(ベンジルオキシ)-3-オキソプロピル)アミノ)エチル)セラニル)プロパン酸、2-アミノ-3-(フェニルセラニル)プロパン酸、セレノシステイン、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジン、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンまたはN6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンからなる群から選択される、実施形態21~135のいずれか1項に記載の方法。
実施形態138。非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)である、実施形態137に記載の方法。
実施形態139。真核細胞における非天然ポリペプチドの発現のための系であって:
(a)少なくとも1つの非天然アミノ酸;
(b)1つまたはそれ以上の第1の非天然塩基を含む少なくとも1つのコドンを含む、非天然ポリペプチドをコードするmRNA;
(c)1つまたはそれ以上の第2の非天然塩基を含む少なくとも1つのアンチコドンを含むtRNAであって、1つまたはそれ以上の第1の非天然塩基および1つまたはそれ以上の第2の非天然塩基は、1つまたはそれ以上の相補的塩基対を形成する、tRNA;
(d)tRNAを少なくとも1つの非天然アミノ酸で優先的にアミノアシル化するtRNAシンテターゼをコードする核酸配列を含む1つまたはそれ以上の核酸構築物;ならびに
(e)tRNAおよびtRNAシンテターゼを使用してmRNAを、非天然アミノ酸を含むポリペプチドに翻訳可能である真核細胞
を含む系。
(a)少なくとも1つの非天然アミノ酸;
(b)1つまたはそれ以上の第1の非天然塩基を含む少なくとも1つのコドンを含む、非天然ポリペプチドをコードするmRNA;
(c)1つまたはそれ以上の第2の非天然塩基を含む少なくとも1つのアンチコドンを含むtRNAであって、1つまたはそれ以上の第1の非天然塩基および1つまたはそれ以上の第2の非天然塩基は、1つまたはそれ以上の相補的塩基対を形成する、tRNA;
(d)tRNAを少なくとも1つの非天然アミノ酸で優先的にアミノアシル化するtRNAシンテターゼをコードする核酸配列を含む1つまたはそれ以上の核酸構築物;ならびに
(e)tRNAおよびtRNAシンテターゼを使用してmRNAを、非天然アミノ酸を含むポリペプチドに翻訳可能である真核細胞
を含む系。
実施形態140。mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第1の非天然塩基(X)は、mRNAの少なくとも1つのコドン中の第1の位置(X-N-N)に位置する、実施形態139に記載の系。
実施形態141。mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置する、実施形態139に記載の系。
実施形態142。mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第1の非天然塩基(X)は、mRNAの少なくとも1つのコドン中の最後の位置(N-N-X)に位置する、実施形態139に記載の系。
実施形態143。1つまたはそれ以上の非天然塩基は、式
のものであり、式中、R2は、水素、アルキル、アルケニル、アルキニル、メトキシ、メタンチオール、メタンセレノ、ハロゲン、シアノおよびアジドからなる群から選択され、波線は、リボシル部分への結合を示す、実施形態139~142のいずれか1項に記載の系。
実施形態144。1つまたはそれ以上の第1の非天然塩基または1つまたはそれ以上の第2の非天然塩基は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態139~142のいずれか1項に記載の系。
実施形態145。1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態144に記載の系。
実施形態146。1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態144に記載の系。
実施形態147。1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態144に記載の系。
実施形態148。1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態144に記載の系。
実施形態149。1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態144に記載の系。
実施形態150。1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態144に記載の系。
実施形態156。mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み、1つまたはそれ以上の第1の非天然塩基(X)は、mRNAのコドン中の第1の位置(X-N-N)に位置し、1つまたはそれ以上の第1の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態139に記載の系。
実施形態160。mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み、1つまたはそれ以上の第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置し、1つまたはそれ以上の第1の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態139に記載の系。
実施形態164。mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み、1つまたはそれ以上の第1の非天然塩基(X)は、mRNAのコドン中の最後の位置(N-N-X)に位置し、1つまたはそれ以上の第1の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態139に記載の系。
実施形態168。tRNAの少なくとも1つのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第2の非天然塩基(X)は、tRNAのアンチコドン中の第1の位置(X-N-N)に位置する、実施形態139に記載の系。
実施形態173。tRNAの少なくとも1つのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第2の非天然塩基(X)は、tRNAのアンチコドン中の中央の位置(N-X-N)に位置する、実施形態139に記載の系。
実施形態178。tRNAの少なくとも1つのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第2の非天然塩基(X)は、tRNAのアンチコドン中の最後の位置(N-N-X)に位置する、実施形態139に記載の系。
実施形態183。少なくとも1つのコドンおよび少なくとも1つのアンチコドンは各々独立に、3つの連続した核酸塩基(N-N-N)を含み、少なくとも1つのコドンは、コドンの第1の位置(X-N-N)に位置する1つまたはそれ以上の第1の非天然塩基(X)を含み、tRNA中の少なくとも1つのアンチコドンは、アンチコドンの最後の位置(N-N-Y)に位置する1つまたはそれ以上の第2の非天然塩基(Y)を含む、実施形態139に記載の系。
実施形態184。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一であるか、または異なっている、実施形態183に記載の系。
実施形態185。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一である、実施形態184に記載の系。
実施形態186。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、異なっている、実施形態184に記載の系。
実施形態187。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態183~186のいずれか1項に記載の系。
実施形態188。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態187に記載の系。
実施形態189。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態188に記載の系。
実施形態190。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態188に記載の系。
実施形態191。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態188に記載の系。
実施形態192。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
から選択され、tRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
であり、各場合において波線は、リボシル部分への結合を示す、実施形態188に記載の系。
実施形態195。少なくとも1つのコドンおよび少なくとも1つのアンチコドンは各々独立に、3つの連続した核酸塩基(N-N-N)を含み、mRNA中の少なくとも1つのコドンは、少なくとも1つのコドンの中央の位置(N-X-N)に位置する1つまたはそれ以上の第1の非天然塩基(X)を含み、tRNA中の少なくとも1つのアンチコドンは、アンチコドンの中央の位置(N-Y-N)に位置する1つまたはそれ以上の第2の非天然塩基(Y)を含む、実施形態139に記載の系。
実施形態196。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一であるか、または異なっている、実施形態195に記載の系。
実施形態197。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一である、実施形態195に記載の系。
実施形態198。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、異なっている、実施形態195に記載の系。
実施形態199。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態195~198のいずれか1項に記載の系。
実施形態200。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態199に記載の系。
実施形態201。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態200に記載の系。
実施形態202。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態200に記載の系。
実施形態203。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態200に記載の系。
実施形態204。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
から選択され、tRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
であり、各場合において波線は、リボシル部分への結合を示す、実施形態200に記載の系。
実施形態207。少なくとも1つのコドンおよび少なくとも1つのアンチコドンは各々独立に、3つの連続した核酸塩基(N-N-N)を含み、mRNA中の少なくとも1つのコドンは、少なくとも1つのコドンの最後の位置(N-N-X)に位置する1つまたはそれ以上の第1の非天然塩基(X)を含み、tRNA中の少なくとも1つのアンチコドンは、アンチコドンの第1の位置(Y-N-N)に位置する1つまたはそれ以上の第2の非天然塩基(Y)を含む、実施形態139に記載の系。
実施形態208。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一であるか、または異なっている、実施形態207に記載の系。
実施形態209。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一である、実施形態208に記載の系。
実施形態210。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、異なっている、実施形態208に記載の系。
実施形態211。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態207~210のいずれか1項に記載の系。
実施形態212。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態211に記載の系。
実施形態213。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態212に記載の系。
実施形態214。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態212に記載の系。
実施形態215。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態212に記載の系。
実施形態216。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
から選択され、tRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
であり、各場合において波線は、リボシル部分への結合を示す、実施形態212に記載の系。
実施形態219。mRNA中の少なくとも1つのコドンは、AXC、GXCまたはGXUから選択され、Xは、非天然塩基である、実施形態139~218のいずれか1項に記載の系。
実施形態220。mRNA中の少なくとも1つのコドンはAXCであり、Xは、非天然塩基である、実施形態219に記載の系。
実施形態221。mRNA中の少なくとも1つのコドンはGXCであり、Xは、非天然塩基である、実施形態219に記載の系。
実施形態222。mRNA中の少なくとも1つのコドンはGXUであり、Xは、非天然塩基である、実施形態219に記載の系。
実施形態223。mRNA中の少なくとも1つのコドンは、AXC、GXCまたはGXUから選択され、tRNA中の少なくとも1つのアンチコドンは、GYU、GYCおよびAYCから選択され、Xは、1つまたはそれ以上の第1の非天然塩基であり、Yは、1つまたはそれ以上の第2の非天然塩基である、実施形態139~218のいずれか1項に記載の系。
実施形態224。XおよびYは、同一であるか、または異なっている、実施形態223に記載の系。
実施形態225。XおよびYは、同一である、実施形態224に記載の系。
実施形態226。XおよびYは、異なっている、実施形態224に記載の系。
実施形態227。mRNA中の少なくとも1つのコドンは、AXCであり、tRNA中の少なくとも1つのアンチコドンは、GYUである、実施形態223に記載の系。
実施形態228。XおよびYは、同一であるか、または異なっている、実施形態227に記載の系。
実施形態229。XおよびYは、同一である、実施形態228に記載の系。
実施形態230。XおよびYは、異なっている、実施形態228に記載の系。
実施形態231。mRNA中の少なくとも1つのコドンは、GXCであり、tRNA中の少なくとも1つのアンチコドンは、GYCである、実施形態223に記載の系。
実施形態232。XおよびYは、同一であるか、または異なっている、実施形態231に記載の系。
実施形態233。XおよびYは、同一である、実施形態232に記載の系。
実施形態234。XおよびYは、異なっている、実施形態232に記載の系。
実施形態235。mRNA中の少なくとも1つのコドンは、GXUであり、少なくとも1つのアンチコドンは、AYCである、実施形態223に記載の系。
実施形態236。XおよびYは、同一であるか、または異なっている、実施形態235に記載の系。
実施形態237。XおよびYは、同一である、実施形態236に記載の系。
実施形態238。XおよびYは、異なっている、実施形態236に記載の系。
実施形態239。tRNAは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、実施形態139~238のいずれか1項に記載の系。
実施形態240。tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、実施形態139~238のいずれか1項に記載の系。
実施形態241。tRNAおよびtRNAシンテターゼは、メタノコックス・ヤンナスキイに由来する、実施形態240に記載の系。
実施形態242。tRNAおよびtRNAシンテターゼは、メタノサルシナ・バルケリに由来する、実施形態240に記載の系。
実施形態243。tRNAおよびtRNAシンテターゼは、メタノサルシナ・マゼイに由来する、実施形態240に記載の系。
実施形態244。tRNAおよびtRNAシンテターゼは、メタノサルシナ・アセチボランスに由来する、実施形態240に記載の系。
実施形態245。tRNAは、メタノコックス・ヤンナスキイに由来し、tRNAシンテターゼは、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、実施形態139~239のいずれか1項に記載の系。
実施形態246。tRNAは、メタノサルシナ・バルケリに由来し、tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、実施形態139~239のいずれか1項に記載の系。
実施形態247。tRNAは、メタノサルシナ・マゼイに由来し、tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリまたはメタノサルシナ・アセチボランスに由来する、実施形態139~239のいずれか1項に記載の系。
実施形態248。tRNAは、メタノサルシナ・アセチボランスに由来し、tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリまたはメタノサルシナ・マゼイに由来する、実施形態139~239のいずれか1項に記載の系。
実施形態249。tRNAは、メタノサルシナ・マゼイに由来し、tRNAシンテターゼは、メタノサルシナ・バルケリに由来する、実施形態139~239のいずれか1項に記載の系。
実施形態250。細胞は、ヒト細胞である、実施形態139~249のいずれか1項に記載の系。
実施形態251。ヒト細胞は、HEK293T細胞である、実施形態250に記載の系。
実施形態252。細胞は、ハムスター細胞である、実施形態139~239のいずれか1項に記載の系。
実施形態253。ハムスター細胞は、チャイニーズハムスター卵巣(CHO)細胞である、実施形態252に記載の系。
実施形態254。非天然アミノ酸は:
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、実施形態139~253のいずれか1項に記載の系。
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、実施形態139~253のいずれか1項に記載の系。
実施形態255。非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)、N6-((プロパルギルエトキシ)-カルボニル)-L-リジン(PraK)、BCN-L-リジン、ノルボルネンリジン、TCO-リジン、メチルテトラジンリジン、アリルオキシカルボニルリジン、2-アミノ-8-オキソノナン酸、2-アミノ-8-オキソオクタン酸、p-アセチル-L-フェニルアラニン、p-アジドメチル-L-フェニルアラニン(pAMF)、p-ヨード-L-フェニルアラニン、m-アセチルフェニルアラニン、2-アミノ-8-オキソノナン酸、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、3-メチル-フェニルアラニン、L-ドパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、p-ブロモフェニルアラニン、p-アミノ-L-フェニルアラニン、イソプロピル-L-フェニルアラニン、O-アリルチロシン、O-メチル-L-チロシン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、ホスホノチロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ホスホセリン、ホスホノセリン、L-3-(2-ナフチル)アラニン、2-アミノ-3-((2-((3-(ベンジルオキシ)-3-オキソプロピル)アミノ)エチル)セラニル)プロパン酸、2-アミノ-3-(フェニルセラニル)プロパン酸、セレノシステイン、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジン、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンまたはN6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンからなる群から選択される、実施形態139~253のいずれか1項に記載の系。
実施形態256。非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)である、実施形態255に記載の系。
実施形態257。mRNAおよびtRNAは、真核細胞において分解するように安定化されている、実施形態21~138のいずれか1項に記載の方法。
実施形態258。ポリペプチドは、真核細胞に対して内因性であるリボソームによってtRNAを使用してmRNAの翻訳によって産生される、実施形態21~138および257のいずれか1項に記載の方法。
実施形態259。mRNAおよびtRNAは、真核細胞において分解するように安定化されている、実施形態139~256のいずれか1項に記載の系。
実施形態260。ポリペプチドは、真核細胞に対して内因性であるリボソームによってtRNAを使用してmRNAの翻訳によって産生される、139~256および259のいずれか1項に記載の系。
実施形態261。(a)第1の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA)と;
(b)第2の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)とを含む真核細胞であって、第1のおよび第2の非天然塩基は、真核生物において非天然塩基対(UBP)を形成し、細胞においてmRNAが翻訳されて、少なくとも1つの非天然アミノ酸を含むポリペプチドを生成することが可能である、真核細胞。
(b)第2の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)とを含む真核細胞であって、第1のおよび第2の非天然塩基は、真核生物において非天然塩基対(UBP)を形成し、細胞においてmRNAが翻訳されて、少なくとも1つの非天然アミノ酸を含むポリペプチドを生成することが可能である、真核細胞。
実施形態262。tRNAは、非天然アミノ酸でチャージされる、実施形態261に記載の真核生物。
実施形態263。mRNAから翻訳されたポリペプチドをさらに含み、ポリペプチドは、非天然アミノ酸を含み、場合により、ポリペプチドは、真核生物のグリコシル化パターンを含む、実施形態261~262のいずれか1項に記載の真核生物。
実施形態264。tRNAシンテターゼをさらに含み、tRNAシンテターゼは、tRNAを非天然アミノ酸で優先的にアミノアシル化する、実施形態261~263のいずれか1項に記載の真核細胞。
実施形態265。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の第1の位置(X-N-N)に位置する、実施形態261~264のいずれか1項に記載の真核細胞。
実施形態266。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置する、実施形態261~265のいずれか1項に記載の真核細胞。
実施形態267。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の最後の位置(N-N-X)に位置する、実施形態261~266のいずれか1項に記載の真核細胞。
実施形態268。第1の非天然塩基または第2の非天然塩基は、
(i)2-チオウラシル、2-チオ-チミン、2’-デオキシウリジン、4-チオ-ウラシル、4-チオ-チミン、ウラシル-5-イル、ヒポキサンチン-9-イル(I)、5-ハロウラシル;5-プロピニル-ウラシル、6-アゾ-チミン、6-アゾ-ウラシル、5-メチルアミノメチルウラシル、5-メトキシアミノメチル-2-チオウラシル、シュードウラシル、ウラシル-5-オキサ酢酸メチルエステル、ウラシル-5-オキサ酢酸、5-メチル-2-チオウラシル、3-(3-アミノ-3-N-2-カルボキシプロピル)ウラシル、5-メチル-2-チオウラシル、4-チオウラシル、5-メチルウラシル、5’-メトキシカルボキシメチルウラシル、5-メトキシウラシル、ウラシル-5-オキシ酢酸、5-(カルボキシヒドロキシルメチル)ウラシル、5-カルボキシメチルアミノメチル-2-チオウリジン、5-カルボキシメチルアミノメチルウラシルまたはジヒドロウラシル;
(ii)5-ヒドロキシメチルシトシン、5-トリフルオロメチルシトシン、5-ハロシトシン、5-プロピニルシトシン、5-ヒドロキシシトシン、シクロシトシン、シトシンアラビノシド、5,6-ジヒドロシトシン、5-ニトロシトシン、6-アゾシトシン、アザシトシン、N4-エチルシトシン、3-メチルシトシン、5-メチルシトシン、4-アセチルシトシン、2-チオシトシン、フェノキサジンシチジン([5,4-b][1,4]ベンゾキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド[5,4-b][1,4]ベンゾチアジン-2(3H)-オン)、フェノキサジンシチジン(9-(2-アミノエトキシ)-H-ピリミド[5,4-b][1,4]ベンゾキサジン-2(3H)-オン)、カルバゾールシチジン(2H-ピリミド[4,5-b]インドール-2-オン)またはピリドインドールシチジン(H-ピリド[3’,2’:4,5]ピロロ[2,3-d]ピリミジン-2-オン);
(iii)2-アミノアデニン、2-プロピルアデニン、2-アミノ-アデニン、2-F-アデニン、2-アミノ-プロピル-アデニン、2-アミノ-2’-デオキシアデノシン、3-デアザアデニン、7-メチルアデニン、7-デアザ-アデニン、8-アザアデニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシル置換アデニン、N6-イソペンテニルアデニン、2-メチルアデニン、2,6-ジアミノプリン、2-メチルチオ-N6-イソペンテニルアデニンまたは6-アザ-アデニン;
(iv)2-メチルグアニン、グアニンの2-プロピルおよびアルキル誘導体、3-デアザグアニン、6-チオ-グアニン、7-メチルグアニン、7-デアザグアニン、7-デアザグアノシン、7-デアザ-8-アザグアニン、8-アザグアニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシル置換グアニン、1-メチルグアニン、2,2-ジメチルグアニン、7-メチルグアニンまたは6-アザ-グアニン;ならびに
(v)ヒポキサンチン、キサンチン、1-メチルイノシン、キュエオシン、ベータ-D-ガラクトシルキュエオシン、イノシン、ベータ-D-マンノシルキュエオシン、ワイブトキソシン、ヒドロキシウレア、(acp3)w、2-アミノピリジンまたは2-ピリドン
からなる群から選択される、実施形態261~267のいずれか1項に記載の真核細胞。
(i)2-チオウラシル、2-チオ-チミン、2’-デオキシウリジン、4-チオ-ウラシル、4-チオ-チミン、ウラシル-5-イル、ヒポキサンチン-9-イル(I)、5-ハロウラシル;5-プロピニル-ウラシル、6-アゾ-チミン、6-アゾ-ウラシル、5-メチルアミノメチルウラシル、5-メトキシアミノメチル-2-チオウラシル、シュードウラシル、ウラシル-5-オキサ酢酸メチルエステル、ウラシル-5-オキサ酢酸、5-メチル-2-チオウラシル、3-(3-アミノ-3-N-2-カルボキシプロピル)ウラシル、5-メチル-2-チオウラシル、4-チオウラシル、5-メチルウラシル、5’-メトキシカルボキシメチルウラシル、5-メトキシウラシル、ウラシル-5-オキシ酢酸、5-(カルボキシヒドロキシルメチル)ウラシル、5-カルボキシメチルアミノメチル-2-チオウリジン、5-カルボキシメチルアミノメチルウラシルまたはジヒドロウラシル;
(ii)5-ヒドロキシメチルシトシン、5-トリフルオロメチルシトシン、5-ハロシトシン、5-プロピニルシトシン、5-ヒドロキシシトシン、シクロシトシン、シトシンアラビノシド、5,6-ジヒドロシトシン、5-ニトロシトシン、6-アゾシトシン、アザシトシン、N4-エチルシトシン、3-メチルシトシン、5-メチルシトシン、4-アセチルシトシン、2-チオシトシン、フェノキサジンシチジン([5,4-b][1,4]ベンゾキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド[5,4-b][1,4]ベンゾチアジン-2(3H)-オン)、フェノキサジンシチジン(9-(2-アミノエトキシ)-H-ピリミド[5,4-b][1,4]ベンゾキサジン-2(3H)-オン)、カルバゾールシチジン(2H-ピリミド[4,5-b]インドール-2-オン)またはピリドインドールシチジン(H-ピリド[3’,2’:4,5]ピロロ[2,3-d]ピリミジン-2-オン);
(iii)2-アミノアデニン、2-プロピルアデニン、2-アミノ-アデニン、2-F-アデニン、2-アミノ-プロピル-アデニン、2-アミノ-2’-デオキシアデノシン、3-デアザアデニン、7-メチルアデニン、7-デアザ-アデニン、8-アザアデニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシル置換アデニン、N6-イソペンテニルアデニン、2-メチルアデニン、2,6-ジアミノプリン、2-メチルチオ-N6-イソペンテニルアデニンまたは6-アザ-アデニン;
(iv)2-メチルグアニン、グアニンの2-プロピルおよびアルキル誘導体、3-デアザグアニン、6-チオ-グアニン、7-メチルグアニン、7-デアザグアニン、7-デアザグアノシン、7-デアザ-8-アザグアニン、8-アザグアニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシル置換グアニン、1-メチルグアニン、2,2-ジメチルグアニン、7-メチルグアニンまたは6-アザ-グアニン;ならびに
(v)ヒポキサンチン、キサンチン、1-メチルイノシン、キュエオシン、ベータ-D-ガラクトシルキュエオシン、イノシン、ベータ-D-マンノシルキュエオシン、ワイブトキソシン、ヒドロキシウレア、(acp3)w、2-アミノピリジンまたは2-ピリドン
からなる群から選択される、実施形態261~267のいずれか1項に記載の真核細胞。
実施形態270。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態261~267のいずれか1項に記載の真核細胞。
実施形態271。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態261~267のいずれか1項に記載の真核細胞。
実施形態272。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態261~267のいずれか1項に記載の真核細胞。
実施形態273。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態261~267のいずれか1項に記載の真核細胞。
実施形態274。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態261~267のいずれか1項に記載の真核細胞。
実施形態275。第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合に、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態261~267のいずれか1項に記載の真核細胞。
実施形態276。第1の非天然塩基または第2の非天然塩基は、
2’位における修飾:
OH、置換された低級アルキル、アルカリル、アラルキル、O-アルカリルまたはO-アラルキル、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-アルキル、S-アルキル、N-アルキル;
O-アルケニル、S-アルケニル、N-アルケニル;
O-アルキニル、S-アルキニル、N-アルキニル;
O-アルキル-O-アルキル、2’-F、2’-OCH3、2’-O(CH2)2OCH3(ここで、アルキル、アルケニルおよびアルキニルは、置換もしくは無置換のC1~C10、アルキル、C2~C10アルケニル、C2~C10アルキニル、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2および-O(CH2)nON[(CH2)nCH3)]2であってもよく、nおよびmは、1~約10である);
および/または5’位における修飾:
5’-ビニル、5’-メチル(RまたはS);
4位における修飾:
4’-S、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態学的性質を改善するための基、もしくはオリゴヌクレオチドの薬力学的性質を改善するための基、およびそれらの任意の組み合わせ
からなる群から選択される修飾された糖部分を含む、実施形態261~275のいずれか1項に記載の真核細胞。
2’位における修飾:
OH、置換された低級アルキル、アルカリル、アラルキル、O-アルカリルまたはO-アラルキル、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-アルキル、S-アルキル、N-アルキル;
O-アルケニル、S-アルケニル、N-アルケニル;
O-アルキニル、S-アルキニル、N-アルキニル;
O-アルキル-O-アルキル、2’-F、2’-OCH3、2’-O(CH2)2OCH3(ここで、アルキル、アルケニルおよびアルキニルは、置換もしくは無置換のC1~C10、アルキル、C2~C10アルケニル、C2~C10アルキニル、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2および-O(CH2)nON[(CH2)nCH3)]2であってもよく、nおよびmは、1~約10である);
および/または5’位における修飾:
5’-ビニル、5’-メチル(RまたはS);
4位における修飾:
4’-S、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態学的性質を改善するための基、もしくはオリゴヌクレオチドの薬力学的性質を改善するための基、およびそれらの任意の組み合わせ
からなる群から選択される修飾された糖部分を含む、実施形態261~275のいずれか1項に記載の真核細胞。
実施形態277。少なくとも1つの非天然アミノ酸は:
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、実施形態263~276のいずれか1項に記載の真核細胞。
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、実施形態263~276のいずれか1項に記載の真核細胞。
実施形態278。少なくとも1つの非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)、N6-((プロパルギルエトキシ)-カルボニル)-L-リジン(PraK)、BCN-L-リジン、ノルボルネンリジン、TCO-リジン、メチルテトラジンリジン、アリルオキシカルボニルリジン、2-アミノ-8-オキソノナン酸、2-アミノ-8-オキソオクタン酸、p-アセチル-L-フェニルアラニン、p-アジドメチル-L-フェニルアラニン(pAMF)、p-ヨード-L-フェニルアラニン、m-アセチルフェニルアラニン、2-アミノ-8-オキソノナン酸、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、3-メチル-フェニルアラニン、L-ドパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、p-ブロモフェニルアラニン、p-アミノ-L-フェニルアラニン、イソプロピル-L-フェニルアラニン、O-アリルチロシン、O-メチル-L-チロシン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、ホスホノチロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ホスホセリン、ホスホノセリン、L-3-(2-ナフチル)アラニン、2-アミノ-3-((2-((3-(ベンジルオキシ)-3-オキソプロピル)アミノ)エチル)セラニル)プロパン酸、2-アミノ-3-(フェニルセラニル)プロパン酸、セレノシステイン、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジン、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンまたはN6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンからなる群から選択される、実施形態277に記載の真核細胞。
実施形態279。少なくとも1つの非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)である、実施形態278に記載の真核細胞。
実施形態280。真核細胞は、ヒト細胞である、実施形態261~279のいずれか1項に記載の真核細胞。
実施形態281。ヒト細胞は、HEK293T細胞である、実施形態280に記載の真核細胞。
実施形態282。細胞は、哺乳動物細胞であり、場合により、哺乳動物細胞は、ハムスター細胞である、実施形態261~279のいずれか1項に記載の真核細胞。
実施形態283。哺乳動物細胞は、チャイニーズハムスター卵巣(CHO)細胞である、実施形態282に記載の真核細胞。
実施形態284。細胞は、単離され、場合により、細胞が精製される、実施形態261~283のいずれか1項に記載の真核細胞。
実施形態285。mRNAから翻訳されたポリペプチドをさらに含み、ポリペプチドは、非天然アミノ酸および哺乳動物グリコシル化パターンを含む、実施形態261~284のいずれか1項に記載の真核細胞。
実施形態285.1。実施形態261~285のいずれか1項に記載の真核細胞を含む半合成生物。
実施形態286。実施形態261~285のいずれか1項に記載の複数の真核細胞を含む真核細胞培養物。
実施形態286.1。細胞を生物に送達する方法であって、生物を実施形態261~285のいずれか1項に記載の細胞と接触させる工程を含む方法。
実施形態286.2。生物は、哺乳動物であり、場合により、哺乳動物は、ヒトである、実施形態286.1に記載の方法。
実施形態287。真核細胞において少なくとも1つの非天然アミノ酸を含むポリペプチドを産生する方法であって:
(a)(i)第1の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA);および
(ii)真核細胞において第2の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)
を細胞中に導入する工程であって、第1のおよび第2の非天然塩基は、真核細胞において非天然塩基対(UBP)を形成可能である、工程と;
(b)tRNAを使用してmRNAから少なくとも1つの非天然アミノ酸を含むポリペプチドを翻訳する工程と
を含む方法。
(a)(i)第1の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA);および
(ii)真核細胞において第2の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)
を細胞中に導入する工程であって、第1のおよび第2の非天然塩基は、真核細胞において非天然塩基対(UBP)を形成可能である、工程と;
(b)tRNAを使用してmRNAから少なくとも1つの非天然アミノ酸を含むポリペプチドを翻訳する工程と
を含む方法。
実施形態288。tRNAが非天然アミノ酸でチャージされる、実施形態287に記載の方法。
実施形態289。真核細胞において少なくとも1つの非天然アミノ酸を含むポリペプチドを産生する方法であって:
(a)(i)第1の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA)と;
(ii)第2の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)と
を含む真核細胞であって、第1のおよび第2の非天然塩基は、真核細胞において非天然塩基対(UBP)を形成可能である真核細胞を提供する工程と;
(b)真核細胞に対して内因性であるリボソームによってtRNAを使用してmRNAから少なくとも1つの非天然アミノ酸を含むポリペプチドを翻訳する工程と
を含む方法。
(a)(i)第1の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA)と;
(ii)第2の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)と
を含む真核細胞であって、第1のおよび第2の非天然塩基は、真核細胞において非天然塩基対(UBP)を形成可能である真核細胞を提供する工程と;
(b)真核細胞に対して内因性であるリボソームによってtRNAを使用してmRNAから少なくとも1つの非天然アミノ酸を含むポリペプチドを翻訳する工程と
を含む方法。
実施形態290。真核細胞においてポリペプチドを産生する方法であって、ポリペプチドは、少なくとも1つの非天然アミノ酸を含み、方法は:
(a)(i)第1の非天然塩基を含むコドンを含むmRNAと;
(ii)第2の非天然塩基を含むアンチコドンを含むtRNAと
を含む真核細胞であって、第1のおよび第2の非天然塩基は、相補的塩基対を形成可能である、真核細胞を提供する工程;および
(b)tRNAを天然アミノ酸と比較して少なくとも1つの非天然アミノ酸で優先的にアミノアシル化するtRNAシンテターゼ;および
(c)1つまたはそれ以上の非天然アミノ酸を真核細胞に提供する工程であって、真核細胞は、少なくとも1つの非天然アミノ酸を含むポリペプチドを産生する工程
を含む方法。
(a)(i)第1の非天然塩基を含むコドンを含むmRNAと;
(ii)第2の非天然塩基を含むアンチコドンを含むtRNAと
を含む真核細胞であって、第1のおよび第2の非天然塩基は、相補的塩基対を形成可能である、真核細胞を提供する工程;および
(b)tRNAを天然アミノ酸と比較して少なくとも1つの非天然アミノ酸で優先的にアミノアシル化するtRNAシンテターゼ;および
(c)1つまたはそれ以上の非天然アミノ酸を真核細胞に提供する工程であって、真核細胞は、少なくとも1つの非天然アミノ酸を含むポリペプチドを産生する工程
を含む方法。
実施形態291。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の第1の位置(X-N-N)に位置する、実施形態287~290のいずれか1項に記載の方法。
実施形態292。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置する、実施形態287~290のいずれか1項に記載の方法。
実施形態293。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の最後の位置(N-N-X)に位置する、実施形態287~290のいずれか1項に記載の方法。
実施形態294。mRNA中のコドンを含む1つまたはそれ以上の非天然塩基は、式
または
のものであり、式中、R2は、水素、アルキル、アルケニル、アルキニル、メトキシ、メタンチオール、メタンセレノ、ハロゲン、シアノおよびアジドからなる群から選択され、波線は、リボシル部分への結合を示す、実施形態287~293のいずれか1項に記載の方法。
実施形態295。第1の非天然塩基または第2の非天然塩基は、
(i)2-チオウラシル、2-チオ-チミン、2’-デオキシウリジン、4-チオ-ウラシル、4-チオ-チミン、ウラシル-5-イル、ヒポキサンチン-9-イル(I)、5-ハロウラシル;5-プロピニル-ウラシル、6-アゾ-チミン、6-アゾ-ウラシル、5-メチルアミノメチルウラシル、5-メトキシアミノメチル-2-チオウラシル、シュードウラシル、ウラシル-5-オキサ酢酸メチルエステル、ウラシル-5-オキサ酢酸、5-メチル-2-チオウラシル、3-(3-アミノ-3-N-2-カルボキシプロピル)ウラシル、5-メチル-2-チオウラシル、4-チオウラシル、5-メチルウラシル、5’-メトキシカルボキシメチルウラシル、5-メトキシウラシル、ウラシル-5-オキシ酢酸、5-(カルボキシヒドロキシルメチル)ウラシル、5-カルボキシメチルアミノメチル-2-チオウリジン、5-カルボキシメチルアミノメチルウラシルまたはジヒドロウラシル;
(ii)5-ヒドロキシメチルシトシン、5-トリフルオロメチルシトシン、5-ハロシトシン、5-プロピニルシトシン、5-ヒドロキシシトシン、シクロシトシン、シトシンアラビノシド、5,6-ジヒドロシトシン、5-ニトロシトシン、6-アゾシトシン、アザシトシン、N4-エチルシトシン、3-メチルシトシン、5-メチルシトシン、4-アセチルシトシン、2-チオシトシン、フェノキサジンシチジン([5,4-b][1,4]ベンゾキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド[5,4-b][1,4]ベンゾチアジン-2(3H)-オン)、フェノキサジンシチジン(9-(2-アミノエトキシ)-H-ピリミド[5,4-b][1,4]ベンゾキサジン-2(3H)-オン)、カルバゾールシチジン(2H-ピリミド[4,5-b]インドール-2-オン)またはピリドインドールシチジン(H-ピリド[3’,2’:4,5]ピロロ[2,3-d]ピリミジン-2-オン);
(iii)2-アミノアデニン、2-プロピルアデニン、2-アミノ-アデニン、2-F-アデニン、2-アミノ-プロピル-アデニン、2-アミノ-2’-デオキシアデノシン、3-デアザアデニン、7-メチルアデニン、7-デアザ-アデニン、8-アザアデニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシル置換アデニン、N6-イソペンテニルアデニン、2-メチルアデニン、2,6-ジアミノプリン、2-メチルチオ-N6-イソペンテニルアデニンまたは6-アザ-アデニン;
(iv)2-メチルグアニン、グアニンの2-プロピルおよびアルキル誘導体、3-デアザグアニン、6-チオ-グアニン、7-メチルグアニン、7-デアザグアニン、7-デアザグアノシン、7-デアザ-8-アザグアニン、8-アザグアニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシル置換グアニン、1-メチルグアニン、2,2-ジメチルグアニン、7-メチルグアニンまたは6-アザ-グアニン;ならびに
(v)ヒポキサンチン、キサンチン、1-メチルイノシン、キュエオシン、ベータ-D-ガラクトシルキュエオシン、イノシン、ベータ-D-マンノシルキュエオシン、ワイブトキソシン、ヒドロキシウレア、(acp3)w、2-アミノピリジンまたは2-ピリドン
からなる群から選択される、実施形態287~293のいずれか1項に記載の方法。
(i)2-チオウラシル、2-チオ-チミン、2’-デオキシウリジン、4-チオ-ウラシル、4-チオ-チミン、ウラシル-5-イル、ヒポキサンチン-9-イル(I)、5-ハロウラシル;5-プロピニル-ウラシル、6-アゾ-チミン、6-アゾ-ウラシル、5-メチルアミノメチルウラシル、5-メトキシアミノメチル-2-チオウラシル、シュードウラシル、ウラシル-5-オキサ酢酸メチルエステル、ウラシル-5-オキサ酢酸、5-メチル-2-チオウラシル、3-(3-アミノ-3-N-2-カルボキシプロピル)ウラシル、5-メチル-2-チオウラシル、4-チオウラシル、5-メチルウラシル、5’-メトキシカルボキシメチルウラシル、5-メトキシウラシル、ウラシル-5-オキシ酢酸、5-(カルボキシヒドロキシルメチル)ウラシル、5-カルボキシメチルアミノメチル-2-チオウリジン、5-カルボキシメチルアミノメチルウラシルまたはジヒドロウラシル;
(ii)5-ヒドロキシメチルシトシン、5-トリフルオロメチルシトシン、5-ハロシトシン、5-プロピニルシトシン、5-ヒドロキシシトシン、シクロシトシン、シトシンアラビノシド、5,6-ジヒドロシトシン、5-ニトロシトシン、6-アゾシトシン、アザシトシン、N4-エチルシトシン、3-メチルシトシン、5-メチルシトシン、4-アセチルシトシン、2-チオシトシン、フェノキサジンシチジン([5,4-b][1,4]ベンゾキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド[5,4-b][1,4]ベンゾチアジン-2(3H)-オン)、フェノキサジンシチジン(9-(2-アミノエトキシ)-H-ピリミド[5,4-b][1,4]ベンゾキサジン-2(3H)-オン)、カルバゾールシチジン(2H-ピリミド[4,5-b]インドール-2-オン)またはピリドインドールシチジン(H-ピリド[3’,2’:4,5]ピロロ[2,3-d]ピリミジン-2-オン);
(iii)2-アミノアデニン、2-プロピルアデニン、2-アミノ-アデニン、2-F-アデニン、2-アミノ-プロピル-アデニン、2-アミノ-2’-デオキシアデノシン、3-デアザアデニン、7-メチルアデニン、7-デアザ-アデニン、8-アザアデニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシル置換アデニン、N6-イソペンテニルアデニン、2-メチルアデニン、2,6-ジアミノプリン、2-メチルチオ-N6-イソペンテニルアデニンまたは6-アザ-アデニン;
(iv)2-メチルグアニン、グアニンの2-プロピルおよびアルキル誘導体、3-デアザグアニン、6-チオ-グアニン、7-メチルグアニン、7-デアザグアニン、7-デアザグアノシン、7-デアザ-8-アザグアニン、8-アザグアニン、8-ハロ、8-アミノ、8-チオール、8-チオアルキルおよび8-ヒドロキシル置換グアニン、1-メチルグアニン、2,2-ジメチルグアニン、7-メチルグアニンまたは6-アザ-グアニン;ならびに
(v)ヒポキサンチン、キサンチン、1-メチルイノシン、キュエオシン、ベータ-D-ガラクトシルキュエオシン、イノシン、ベータ-D-マンノシルキュエオシン、ワイブトキソシン、ヒドロキシウレア、(acp3)w、2-アミノピリジンまたは2-ピリドン
からなる群から選択される、実施形態287~293のいずれか1項に記載の方法。
実施形態297。第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態296に記載の方法。
実施形態298。第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態296に記載の方法。
実施形態299。第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態296に記載の方法。
実施形態300。第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態296に記載の方法。
実施形態301。第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態296に記載の方法。
実施形態302。第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態296に記載の方法。
実施形態303。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、第1の非天然塩基(X)は、mRNAのコドン中の第1の位置(X-N-N)に位置し、非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態287~296のいずれか1項に記載の方法。
実施形態304。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置し、非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態287~296のいずれか1項に記載の方法。
実施形態305。mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み、第1の非天然塩基(X)は、mRNAのコドン中の最後の位置(N-N-X)に位置し、非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態287~296のいずれか1項に記載の方法。
実施形態306。tRNAのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;第2の非天然塩基(X)は、tRNAのアンチコドン中の第1の位置(X-N-N)に位置し、非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態287~296のいずれか1項に記載の方法。
実施形態307。tRNAのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;第2の非天然塩基(X)は、tRNAのアンチコドン中の中央の位置(N-X-N)に位置し、非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態287~296のいずれか1項に記載の方法。
実施形態308。tRNAのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;第2の非天然塩基(X)は、tRNAのアンチコドン中の最後の位置(N-N-X)に位置し、非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態287~296のいずれか1項に記載の方法。
実施形態309。コドンおよびアンチコドンは各々、3つの連続した核酸塩基(N-N-N)を含み、mRNA中のコドンの第1の非天然塩基(X)は、コドンの第1の位置(X-N-N)に位置し、tRNAのアンチコドンの第2の非天然塩基(Y)は、アンチコドンの最後の位置(N-N-Y)に位置する、実施形態287~296のいずれか1項に記載の方法。
実施形態310。コドンおよびアンチコドンは各々、3つの連続した核酸塩基(N-N-N)を含み、mRNA中のコドンは、コドンの中央の位置(N-X-N)に位置する第1の非天然塩基(X)を含み、tRNA中のアンチコドンは、アンチコドンの中央の位置(N-Y-N)に位置する第2の非天然塩基(Y)を含む、実施形態287~296のいずれか1項に記載の方法。
実施形態311。コドンおよびアンチコドンは各々、3つの連続した核酸塩基(N-N-N)を含み、mRNA中のコドンは、コドンの最後の位置(N-N-X)に位置する第1の非天然塩基(X)を含み、tRNA中のアンチコドンは、アンチコドンの第1の位置(Y-N-N)に位置する第2の非天然塩基(Y)を含む、実施形態287~296のいずれか1項に記載の方法。
実施形態312。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、同一であるか、または異なっている、実施形態309~311のいずれか1項に記載の方法。
実施形態313。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態309~312のいずれか1項に記載の方法。
実施形態314。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、
からなる群から選択、波線は、リボシル部分への結合を示す、実施形態313に記載の方法。
実施形態315。mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は両方とも
であり、波線は、リボシル部分への結合を示す、実施形態314に記載の方法。
実施形態316。mRNAのコドン中に位置する第1の非天然塩基(X)は、
から選択され、tRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、
であり、各場合において波線は、リボシル部分への結合を示す、実施形態314に記載の方法。
実施形態317。mRNA中のコドンが、AXC、GXCまたはGXUから選択され、Xは、第1の非天然塩基である、実施形態287~290、292、294~302、304、307および410のいずれか1項に記載の方法。
実施形態318。tRNA中のアンチコドンは、GYU、GYCおよびAYCから選択され、Yは、第2の非天然塩基である、実施形態317に記載の方法。
実施形態319。mRNA中のコドンは、AXCであり、tRNA中のアンチコドンは、GYUである、実施形態318に記載の方法。
実施形態320。mRNA中のコドンは、GXCであり、tRNA中のアンチコドンは、GYCである、実施形態318に記載の方法。
実施形態321。mRNA中のコドンは、GXUであり、アンチコドンは、AYCである、実施形態318に記載の方法。
実施形態322。第1の非天然塩基または第2の非天然塩基は、
2’位における修飾:
OH、置換された低級アルキル、アルカリル、アラルキル、O-アルカリルまたはO-アラルキル、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-アルキル、S-アルキル、N-アルキル;
O-アルケニル、S-アルケニル、N-アルケニル;
O-アルキニル、S-アルキニル、N-アルキニル;
O-アルキル-O-アルキル、2’-F、2’-OCH3、2’-O(CH2)2OCH3(ここで、アルキル、アルケニルおよびアルキニルは、置換もしくは無置換のC1~C10、アルキル、C2~C10アルケニル、C2~C10アルキニル、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2および-O(CH2)nON[(CH2)nCH3)]2であってもよく、nおよびmは、1~約10である);
および/または5’位における修飾:
5’-ビニル、5’-メチル(RまたはS);
4位における修飾:
4’-S、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態学的性質を改善するための基またはオリゴヌクレオチドの薬力学的性質を改善するための基、およびそれらの任意の組み合わせ
からなる群から選択される修飾された糖部分を含む、実施形態287~321のいずれか1項に記載の方法。
2’位における修飾:
OH、置換された低級アルキル、アルカリル、アラルキル、O-アルカリルまたはO-アラルキル、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-アルキル、S-アルキル、N-アルキル;
O-アルケニル、S-アルケニル、N-アルケニル;
O-アルキニル、S-アルキニル、N-アルキニル;
O-アルキル-O-アルキル、2’-F、2’-OCH3、2’-O(CH2)2OCH3(ここで、アルキル、アルケニルおよびアルキニルは、置換もしくは無置換のC1~C10、アルキル、C2~C10アルケニル、C2~C10アルキニル、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2および-O(CH2)nON[(CH2)nCH3)]2であってもよく、nおよびmは、1~約10である);
および/または5’位における修飾:
5’-ビニル、5’-メチル(RまたはS);
4位における修飾:
4’-S、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態学的性質を改善するための基またはオリゴヌクレオチドの薬力学的性質を改善するための基、およびそれらの任意の組み合わせ
からなる群から選択される修飾された糖部分を含む、実施形態287~321のいずれか1項に記載の方法。
実施形態323。少なくとも1つの非天然アミノ酸は:
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、実施形態287~322のいずれか1項に記載の方法。
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、実施形態287~322のいずれか1項に記載の方法。
実施形態324。少なくとも1つの非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)、N6-((プロパルギルエトキシ)-カルボニル)-L-リジン(PraK)、BCN-L-リジン、ノルボルネンリジン、TCO-リジン、メチルテトラジンリジン、アリルオキシカルボニルリジン、2-アミノ-8-オキソノナン酸、2-アミノ-8-オキソオクタン酸、p-アセチル-L-フェニルアラニン、p-アジドメチル-L-フェニルアラニン(pAMF)、p-ヨード-L-フェニルアラニン、m-アセチルフェニルアラニン、2-アミノ-8-オキソノナン酸、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、3-メチル-フェニルアラニン、L-ドパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、p-ブロモフェニルアラニン、p-アミノ-L-フェニルアラニン、イソプロピル-L-フェニルアラニン、O-アリルチロシン、O-メチル-L-チロシン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、ホスホノチロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ホスホセリン、ホスホノセリン、L-3-(2-ナフチル)アラニン、2-アミノ-3-((2-((3-(ベンジルオキシ)-3-オキソプロピル)アミノ)エチル)セラニル)プロパン酸、2-アミノ-3-(フェニルセラニル)プロパン酸、セレノシステイン、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジン、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンまたはN6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンからなる群から選択される、実施形態287~322のいずれか1項に記載の方法。
実施形態325。非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)である、実施形態324に記載の方法。
実施形態326。細胞は、ヒト細胞である、実施形態287~325のいずれか1項に記載の方法。
実施形態327。ヒト細胞は、HEK293T細胞である、実施形態326に記載の方法。
実施形態328。細胞は、ハムスター細胞である、実施形態287~325のいずれか1項に記載の方法。
実施形態329。ハムスター細胞は、チャイニーズハムスター卵巣(CHO)細胞である、実施形態328に記載の方法。
実施形態330。tRNAは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、実施形態287~329のいずれか1項に記載の方法。
実施形態331。細胞は、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来するtRNAシンテターゼを含む、実施形態287~330のいずれか1項に記載の方法。
実施形態332。非天然ポリペプチドの発現のための系であって、
(a)少なくとも1つの非天然アミノ酸;
(b)1つまたはそれ以上の第1の非天然塩基を含む少なくとも1つのコドンを含む、非天然ポリペプチドをコードするmRNA;
(c)1つまたはそれ以上の第2の非天然塩基を含む少なくとも1つのアンチコドンを含むtRNAであって、1つまたはそれ以上の第1の非天然塩基および1つまたはそれ以上の第2の非天然塩基は、1つまたはそれ以上の相補的塩基対を形成可能である、tRNA;
(d)tRNAおよびtRNAシンテターゼを使用してmRNAを、非天然アミノ酸を含むポリペプチドに翻訳可能である真核生物のリボソーム
を含み、
tRNAは、非天然アミノ酸でチャージされるか、または系はtRNAシンテターゼもしくはtRNAシンテターゼをコードする核酸配列を含む1つもしくはそれ以上の核酸構築物をさらに含み、tRNAシンテターゼは、tRNAを少なくとも1つの非天然アミノ酸で優先的にアミノアシル化する、系。
(a)少なくとも1つの非天然アミノ酸;
(b)1つまたはそれ以上の第1の非天然塩基を含む少なくとも1つのコドンを含む、非天然ポリペプチドをコードするmRNA;
(c)1つまたはそれ以上の第2の非天然塩基を含む少なくとも1つのアンチコドンを含むtRNAであって、1つまたはそれ以上の第1の非天然塩基および1つまたはそれ以上の第2の非天然塩基は、1つまたはそれ以上の相補的塩基対を形成可能である、tRNA;
(d)tRNAおよびtRNAシンテターゼを使用してmRNAを、非天然アミノ酸を含むポリペプチドに翻訳可能である真核生物のリボソーム
を含み、
tRNAは、非天然アミノ酸でチャージされるか、または系はtRNAシンテターゼもしくはtRNAシンテターゼをコードする核酸配列を含む1つもしくはそれ以上の核酸構築物をさらに含み、tRNAシンテターゼは、tRNAを少なくとも1つの非天然アミノ酸で優先的にアミノアシル化する、系。
実施形態333。mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第1の非天然塩基(X)は、mRNAの少なくとも1つのコドン中の第1の位置(X-N-N)に位置する、実施形態332に記載の系。
実施形態334。mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置する、実施形態332に記載の系。
実施形態335。mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第1の非天然塩基(X)は、mRNAの少なくとも1つのコドン中の最後の位置(N-N-X)に位置する、実施形態332に記載の系。
実施形態336。1つまたはそれ以上の非天然塩基は、式
のものであり、式中、R2は、水素、アルキル、アルケニル、アルキニル、メトキシ、メタンチオール、メタンセレノ、ハロゲン、シアノおよびアジドからなる群から選択され、波線は、リボシル部分への結合を示す、実施形態332~335のいずれか1項に記載の系。
実施形態337。1つまたはそれ以上の第1の非天然塩基または1つまたはそれ以上の第2の非天然塩基は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態332~335のいずれか1項に記載の系。
実施形態338。1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合は、第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態337に記載の系。
実施形態339。1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態337に記載の系。
実施形態340。1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態337に記載の系。
実施形態341。1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態337に記載の系。
実施形態342。1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
である、波線は、リボシル部分への結合を示す、実施形態337に記載の系。
実施形態343。1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、1つまたはそれ以上の第1の非天然塩基が、
である場合は、1つまたはそれ以上の第2の非天然塩基は、
であり、波線は、リボシル部分への結合を示す、実施形態337に記載の系。
実施形態346。mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み、1つまたはそれ以上の第1の非天然塩基(X)は、mRNAのコドン中の第1の位置(X-N-N)に位置し、1つまたはそれ以上の第1の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態332に記載の系。
実施形態347。mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み、1つまたはそれ以上の第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置し、1つまたはそれ以上の第1の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態332に記載の系。
実施形態348。mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み、1つまたはそれ以上の第1の非天然塩基(X)は、mRNAのコドン中の最後の位置(N-N-X)に位置し、1つまたはそれ以上の第1の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態332に記載の系。
実施形態349。tRNAの少なくとも1つのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第2の非天然塩基(X)は、tRNAのアンチコドン中の第1の位置(X-N-N)に位置し、1つまたはそれ以上の第2の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態332に記載の系。
実施形態350。tRNAの少なくとも1つのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第2の非天然塩基(X)は、tRNAのアンチコドン中の中央の位置(N-X-N)に位置し、1つまたはそれ以上の第2の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態332に記載の系。
実施形態351。tRNAの少なくとも1つのアンチコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第2の非天然塩基(X)は、tRNAのアンチコドン中の最後の位置(N-N-X)に位置し、1つまたはそれ以上の第2の非天然塩基は、
から選択され、波線は、リボシル部分への結合を示す、実施形態332に記載の系。
実施形態352。少なくとも1つのコドンおよび少なくとも1つのアンチコドンは各々独立に、3つの連続した核酸塩基(N-N-N)を含み、少なくとも1つのコドンは、コドンの第1の位置(X-N-N)に位置する1つまたはそれ以上の第1の非天然塩基(X)を含み、tRNA中の少なくとも1つのアンチコドンは、アンチコドンの最後の位置(N-N-Y)に位置する1つまたはそれ以上の第2の非天然塩基(Y)を含む、実施形態332に記載の系。
実施形態353。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一であるか、または異なっている、実施形態352に記載の系。
実施形態354。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態352~353のいずれか1項に記載の系。
実施形態355。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態354に記載の系。
実施形態356。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
から選択され、tRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
であり、各場合において波線は、リボシル部分への結合を示す、実施形態355に記載の系。
実施形態357。少なくとも1つのコドンおよび少なくとも1つのアンチコドンは各々独立に、3つの連続した核酸塩基(N-N-N)を含み、mRNA中の少なくとも1つのコドンは、少なくとも1つのコドンの中央の位置(N-X-N)に位置する1つまたはそれ以上の第1の非天然塩基(X)を含み、tRNA中の少なくとも1つのアンチコドンは、アンチコドンの中央の位置(N-Y-N)に位置する1つまたはそれ以上の第2の非天然塩基(Y)を含む、実施形態332に記載の系。
実施形態358。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一であるか、または異なっている、実施形態357に記載の系。
実施形態359。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態357~358のいずれか1項に記載の系。
実施形態360。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態359に記載の系。
実施形態361。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
から選択され、tRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
であり、各場合において波線は、リボシル部分への結合を示す、実施形態360に記載の系。
であり、各場合において波線は、リボシル部分への結合を示す、実施形態360に記載の系。
実施形態362。少なくとも1つのコドンおよび少なくとも1つのアンチコドンは各々独立に、3つの連続した核酸塩基(N-N-N)を含み、mRNA中の少なくとも1つのコドンは、少なくとも1つのコドンの最後の位置(N-N-X)に位置する1つまたはそれ以上の第1の非天然塩基(X)を含み、tRNA中の少なくとも1つのアンチコドンは、アンチコドンの第1の位置(Y-N-N)に位置する1つまたはそれ以上の第2の非天然塩基(Y)を含む、実施形態332に記載の系。
実施形態363。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一であるか、または異なっている、実施形態362に記載の系。
実施形態364。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態362~363のいずれか1項に記載の系。
実施形態365。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
からなる群から選択され、波線は、リボシル部分への結合を示す、実施形態364に記載の系。
実施形態366。mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)は、
から選択され、tRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、
であり、各場合において波線は、リボシル部分への結合を示す、実施形態365に記載の系。
実施形態367。mRNA中の少なくとも1つのコドンは、AXC、GXCまたはGXUから選択され、Xは、1つまたはそれ以上の第1の非天然塩基である、実施形態332~366のいずれか1項に記載の系。
実施形態368。tRNA中の少なくとも1つのアンチコドンは、GYU、GYCおよびAYCから選択され、Yは、1つまたはそれ以上の第2の非天然塩基である、実施形態367に記載の系。
実施形態369。mRNA中の少なくとも1つのコドンは、AXCであり、tRNA中の少なくとも1つのアンチコドンは、GYUである、実施形態368に記載の系。
実施形態370。mRNA中の少なくとも1つのコドンは、GXCであり、tRNA中の少なくとも1つのアンチコドンは、GYCである、実施形態368に記載の系。
実施形態371。mRNA中の少なくとも1つのコドンは、GXUであり、少なくとも1つのアンチコドンは、AYCである、実施形態368に記載の系。
実施形態372。tRNAは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、実施形態332~371のいずれか1項に記載の系。
実施形態373。tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、実施形態332~372のいずれか1項に記載の系。
実施形態374。真核細胞における、実施形態332~373のいずれか1項に記載の系。
実施形態374.1。ヒト細胞における、実施形態332~373のいずれか1項に記載の系。
実施形態375。ヒト細胞は、HEK293T細胞である、実施形態374.1に記載の系。
実施形態376。哺乳動物細胞における、実施形態332~373のいずれか1項に記載の系。
実施形態376.1。ハムスター細胞における、実施形態332~373のいずれか1項に記載の系。
実施形態377。ハムスター細胞は、チャイニーズハムスター卵巣(CHO)細胞である、実施形態376.1に記載の系。
実施形態377.1。mRNAおよびtRNAは、真核細胞において分解するように安定化されている、実施形態332~377のいずれか1項に記載の系。
実施形態377.2。ポリペプチドは、真核細胞に対して内因性であるリボソームによってtRNAを使用してmRNAの翻訳によって産生される、実施形態332~377.1のいずれか1項に記載の系。
実施形態377.3。インビトロまたは無細胞である、実施形態332~373のいずれか1項に記載の系。
実施形態378。非天然アミノ酸は:
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、実施形態332~377.3のいずれか1項に記載の系。
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、実施形態332~377.3のいずれか1項に記載の系。
実施形態379。非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)、N6-((プロパルギルエトキシ)-カルボニル)-L-リジン(PraK)、BCN-L-リジン、ノルボルネンリジン、TCO-リジン、メチルテトラジンリジン、アリルオキシカルボニルリジン、2-アミノ-8-オキソノナン酸、2-アミノ-8-オキソオクタン酸、p-アセチル-L-フェニルアラニン、p-アジドメチル-L-フェニルアラニン(pAMF)、p-ヨード-L-フェニルアラニン、m-アセチルフェニルアラニン、2-アミノ-8-オキソノナン酸、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、3-メチル-フェニルアラニン、L-ドパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、p-ブロモフェニルアラニン、p-アミノ-L-フェニルアラニン、イソプロピル-L-フェニルアラニン、O-アリルチロシン、O-メチル-L-チロシン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、ホスホノチロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ホスホセリン、ホスホノセリン、L-3-(2-ナフチル)アラニン、2-アミノ-3-((2-((3-(ベンジルオキシ)-3-オキソプロピル)アミノ)エチル)セラニル)プロパン酸、2-アミノ-3-(フェニルセラニル)プロパン酸、セレノシステイン、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジン、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンまたはN6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンからなる群から選択される、実施形態332~378のいずれか1項に記載の系。
実施形態380。非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)である、実施形態379に記載の系。
実施形態381。tRNAは、非天然アミノ酸でチャージされる、実施形態332~380のいずれか1項に記載の系。
実施形態382。mRNAおよびtRNAは、真核細胞において分解するように安定化されている、実施形態287~331のいずれか1項に記載の方法。
実施形態383。ポリペプチドは、真核細胞に対して内因性であるリボソームによってtRNAを使用してmRNAの翻訳によって産生される、実施形態287~331および382のいずれか1項に記載の方法。
これらの実施例は、例示のみを目的として提供されており、本明細書で提供される特許請求の範囲を限定するものではない。詳細な方法が、本明細書において最終実施例として提供される。
実施例1:HEK293T細胞における非天然コドンの翻訳
EGFP(AXC)151およびEGFP(GXC)151をコードするプラスミドを、mRNA安定性を増強するためにコード配列に隣接するCS2 3’および5’UTR配列を用いて構築した。大腸菌SSOにおいて十分にデコードされるとわかっているので、コドンAXCおよびGXCを選択した。所望のmRNAおよび同族tRNAは、T7 RNAポリメラーゼを使用するインビトロ転写反応によって生成された。ChPylRSを、内部リボソーム結合部位によって接続された、ChPylRSおよびmCherryマーカーの両方をコードするバイシストロニック配列を有するプラスミド(pcDNA3.1_C211_IRES_mCherry)に導入した。このプラスミドをHEK293T細胞に、50%コンフルエンスに達した時点でトランスフェクトした。細胞を24時間増殖させてChPylRSの発現を可能にし、次いで、培地にN6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)を添加し、細胞に、対照としてmRNAのみ、またはmRNAおよび対応する同族非天然tRNAをトランスフェクトした。さらに24時間後細胞を回収し、mCherryマーカーを発現する細胞におけるEGFP生成を、フローサイトメトリーによって定量化した。tRNAを有さない対照では、EGFP(AXC)151およびEGFP(GXC)151 mRNAでのトランスフェクションは、低いが検出可能なレベルのEGFPシグナルをもたらし、これは、恐らくは、その同族tRNAが存在しない場合の非天然コドンのリードスルーに起因していた。対照的に、非天然mRNAおよび同族非天然tRNAの両方をトランスフェクトされた細胞は、蛍光の増大を示した。EGFP(AXC)151を用いる場合は、増大は中程度であったが、EGFP(GXC)151を用いる場合は、より著しかった(図5A)。
EGFP(AXC)151およびEGFP(GXC)151をコードするプラスミドを、mRNA安定性を増強するためにコード配列に隣接するCS2 3’および5’UTR配列を用いて構築した。大腸菌SSOにおいて十分にデコードされるとわかっているので、コドンAXCおよびGXCを選択した。所望のmRNAおよび同族tRNAは、T7 RNAポリメラーゼを使用するインビトロ転写反応によって生成された。ChPylRSを、内部リボソーム結合部位によって接続された、ChPylRSおよびmCherryマーカーの両方をコードするバイシストロニック配列を有するプラスミド(pcDNA3.1_C211_IRES_mCherry)に導入した。このプラスミドをHEK293T細胞に、50%コンフルエンスに達した時点でトランスフェクトした。細胞を24時間増殖させてChPylRSの発現を可能にし、次いで、培地にN6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)を添加し、細胞に、対照としてmRNAのみ、またはmRNAおよび対応する同族非天然tRNAをトランスフェクトした。さらに24時間後細胞を回収し、mCherryマーカーを発現する細胞におけるEGFP生成を、フローサイトメトリーによって定量化した。tRNAを有さない対照では、EGFP(AXC)151およびEGFP(GXC)151 mRNAでのトランスフェクションは、低いが検出可能なレベルのEGFPシグナルをもたらし、これは、恐らくは、その同族tRNAが存在しない場合の非天然コドンのリードスルーに起因していた。対照的に、非天然mRNAおよび同族非天然tRNAの両方をトランスフェクトされた細胞は、蛍光の増大を示した。EGFP(AXC)151を用いる場合は、増大は中程度であったが、EGFP(GXC)151を用いる場合は、より著しかった(図5A)。
蛍光の相対的に大きなtRNA依存性増大に基づいて、EGFP(GXC)151構築物を用いて生成されたタンパク質を試験した。総細胞溶解物を、SDS-PAGEによって分析されるようにEGFPの電気泳動移動度をシフトするとわかっており、従って、ウエスタンブロッティングによってN6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)組み込みの忠実度の評価を可能にする、カルボキシ-テトラメチル-ローダミン(TAMRA)色素(DBCO-TAMRA)を付着する歪み促進型クリックケミストリーに供した。別個のEGFPシグナルが明らかであり(図5B)、シンテターゼプラスミド、EGFP(GXC)151 mRNAおよびtRNAPyl(GYC)をトランスフェクトされ、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)を補給した培地で増殖された細胞から製造された溶解物を用いた場合に、およそ70%のシフトを有していた。対照的に、同族非天然tRNAを伴わずにトランスフェクトされた細胞から製造された溶解物では、ほとんどないし全くシフトしないバンドが観察された。EGFPの低発現レベルは、さらなる特性決定を妨げたが、これらのデータは、同族非天然アンチコドンを有するtRNAを使用する非天然コドンのデコーディングによって、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)がEGFP中に組み込まれることを強く示唆した。
実施例2:CHO細胞における非天然コドンの翻訳
FRT/Flp組換え系を使用してChPylRSを安定に発現した異種CHO細胞株CHO-KS3を構築し、従って、トランスフェクションを単一RNA同時トランスフェクション工程に低減した。CHO-KS3細胞にEGFP(AXC)151、EGFP(GXC)151またはEGFP(GXC)151 mRNAおよび同族tRNAをトランスフェクトし、細胞が80%コンフルエンスに到達した時点で、増殖培地にN6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)を添加した。1日インキュベートした後、細胞を回収し、次いで、直接フローサイトメトリーに供して、EGFP蛍光を検出した。同族非天然tRNAが提供されない対照細胞は、同様に低いが検出可能なレベルのEGFPシグナルを示した。対照的に、同族非天然tRNAをトランスフェクトされた細胞は、有意に増大した蛍光を示し、EGFP(AXC)151は、最高の細胞あたりの蛍光シグナルをもたらし、EGFP(GXU)151は、最低をもたらしたが、すべての場合において蛍光は、HEK293T細胞を用いて観察されたものよりも高かった(図6A~6B)。
FRT/Flp組換え系を使用してChPylRSを安定に発現した異種CHO細胞株CHO-KS3を構築し、従って、トランスフェクションを単一RNA同時トランスフェクション工程に低減した。CHO-KS3細胞にEGFP(AXC)151、EGFP(GXC)151またはEGFP(GXC)151 mRNAおよび同族tRNAをトランスフェクトし、細胞が80%コンフルエンスに到達した時点で、増殖培地にN6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)を添加した。1日インキュベートした後、細胞を回収し、次いで、直接フローサイトメトリーに供して、EGFP蛍光を検出した。同族非天然tRNAが提供されない対照細胞は、同様に低いが検出可能なレベルのEGFPシグナルを示した。対照的に、同族非天然tRNAをトランスフェクトされた細胞は、有意に増大した蛍光を示し、EGFP(AXC)151は、最高の細胞あたりの蛍光シグナルをもたらし、EGFP(GXU)151は、最低をもたらしたが、すべての場合において蛍光は、HEK293T細胞を用いて観察されたものよりも高かった(図6A~6B)。
上記で調査されたNaMコドンは、大腸菌リボソームによって十分に翻訳されるために選択された。対照的に、大腸菌リボソームは、TPT3を含有するコドンを翻訳できないと思われる。原核生物および真核生物のリボソームの間の比較的な構造-活性関係性を生じさせるために、EGFP(AYC)151、EGFP(GYC)151およびEGFP(GYU)151ならびにその同族非天然tRNAであるtRNAPyl(GXU)、tRNAPyl(GXC)およびtRNAPyl(AXC)を作製し、CHO-KS3細胞にトランスフェクトするために使用した。大腸菌SSOとは対照的に、3つのTPT3コドンすべてが、CHO-KS3細胞がその同族tRNAを伴ってトランスフェクトされた場合に、tRNAを伴わずにトランスフェクトされた対照と比較して、蛍光の増大をもたらし、実際、EGFP(GYU)151は、類似のNaMコドン(GXU)を用いて観察されたものと類似の蛍光のレベルに達した(図6A~6B)。
CHO-KS3細胞においてより高いEGFP発現レベルをもって、本発明者らは、より定量的な特性決定のためにEGFP(AXC)151、EGFP(GXC)151、EGFP(GXU)151およびEGFP(GYC)151を選択した。EGFPを、タンデムC末端Strep-タグIIを使用して細胞溶解物からアフィニティー精製し、上記のような、DBCO-TAMRA色素を用いるクリックケミストリーに供した。次いで、精製EGFPをウエスタンブロッティングによって分析した。天然EGFP mRNAをトランスフェクトされた対照細胞から、優勢なバンドが観察され、より速く移動するより弱いバンドを伴っていた(図6B)。より速く移動するバンドは、部分的なStrepタグ分解に起因していた(示されていないデータ)。予測されたように、いずれのバンドもTAMRAシグナルを示さなかった。その同族tRNAを伴う各非天然mRNAのトランスフェクションでは、2つのバンドの同様のセットが観察されたが、両方ともシフトし、TAMRAシグナルを示した。これらの結果は、CHO細胞では、同族非天然アンチコドンとともにNaMまたはTPT3コドンのいずれかをデコードすることによって、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)がEGFP中に組み込まれるということを示唆した。
N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)の正しいエンコーディングを確認するために、液体クロマトグラフィー-タンデム質量分析(LC-MS/MS)を使用して、EGFP(GXC)151またはEGFP(GYC)151 mRNAのいずれかおよびその同族tRNAをトランスフェクトされたCHO-KS3細胞から精製されたタンパク質を分析した。上記のようにトランスフェクトされた細胞からEGFPを精製し、次いで、銅触媒されたクリックケミストリーに供して、3-ブチニルベンゼン部分をAzKに付着させて、MS分析を促進した。反応生成物をSDS-PAGEによって精製し、これまでのゲルシフトアッセイに基づいて、シフトしたおよびシフトしていない両方のEGFPバンドを含む25kDaから32kDaの間のバンドを切り出した。ゲル切片から回収したタンパク質をトリプシンで消化し、ナノ-LC-MS/MS分析に供した。EGFPアミノ酸部位151を含有するペプチド断片を、クリック反応生成物に対応する質量を用いて検出し、部位151でのN6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)の特異的組み込みを確認した。未修飾ペプチドは検出されず、定量的ではないが、この観察結果によって、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)の組み込みが確認され、少なくとも合理的な忠実度を有して起こることを示唆する。より完全な配列コンテキスト分析はまだ調査されていないが、これらのデータは、哺乳動物リボソームは、その大腸菌対応物とは異なり、NaMまたはTPT3のいずれかを含有する非天然コドンをデコードできることを実証する。
これまでに、大腸菌SSOも、コドンAGXを含む、第3の位置に非天然ヌクレオチドNaMを有するいくつかのコドンを翻訳できることがわかっている。しかし、第2の位置とは対照的に、デコーディングは、「ヘテロ対形成性」tRNAPyl(YCT)または「自己対形成性」tRNAPyl(XCT)のいずれかで生じた(図5)。第3の位置でのNaM-NaM自己対形成は、第3の位置での天然コドンのゆらぎ対形成と同様の方法で促進される。哺乳動物細胞における自己対形成性同族tRNAを用いるデコーディングを調査するために、次いで同一のmRNAコンテキストでAGXコドンを試験した。CHO-KS3細胞に、EGFP(AGX)151 mRNA単独をトランスフェクトした、またはtRNAPyl(YCT)またはtRNAPyl(XCT)とともに同時トランスフェクトした。第2の位置の非天然コドンと同様に、フローサイトメトリーは、いずれのtRNAも伴わずにトランスフェクトされた細胞を用いた場合に少量のリードスルーEGFP発現を示した。tRNAPyl(YCT)を用いる同時トランスフェクトは、蛍光の有意な増大をもたらし、一方で、自己対形成性tRNAであるtRNAPyl(XCT)伴う同時トランスフェクトは、蛍光のかなり大きな増大をもたらした(図6A)。次いで、本発明者らは、上記の同一タンパク質シフトアッセイを使用して、非天然コドンAGXから生成されたEGFPをさらに評価した。tRNAPyl(YCT)またはtRNAPyl(XCT)のいずれかと同時トランスフェクトされた細胞から精製されたタンパク質において、シフトしたバンドが検出された(図6B)。両場合において、2つのシフトしたバンドがやはり観察され、シフトしていないバンドは、ほとんどないし全く見えなかった。これらの結果は、少なくともAGXコドンを用いた場合、ヘテロ対形成または自己対形成のいずれかによるデコーディングが、少なくとも合理的に効率的であることを実証する。
TPT3コドンを用いた結果は、原核生物および真核生物のリボソームの間の明確な相違を実証する。これらのリボソーム、大腸菌リボソームがデコードできないと思われる第1の位置に非天然ヌクレオチドを有するコドンの翻訳をさらに比較するために、EGFP(XCC)151およびEGFP(YCC)151 mRNAを、インビトロで生成し、その同族非天然tRNA、それぞれtRNAPyl(GGY)またはtRNAPyl(GGX)を伴わずに、またはそれを伴ってCHO-KS3細胞中にトランスフェクトした。フローサイトメトリーを使用する分析によって、両場合においてtRNAが添加されなかった場合に少量のリードスルーが示され、EGFP(YCC)151は、EGFP(XCC)151よりも相対的に高いEGFPシグナルをもたらした。対応するtRNAが添加された場合には、EGFP(XCC)151を用いてEGFPシグナルの小さい増大が観察されたが、EGFP(YCC)151ではEGFPシグナルの有意な増大は観察されなかった(図6)。両場合において、EGFP収量は、ウエスタンブロット分析には低すぎた。これらのデータは、大腸菌リボソームと同様に、第1の位置の非天然コドンは、十分にデコードされないことを示唆する。これは、それによってリボソームがコドンの第1の位置でワトソン-クリック様構造を選択するI型Aマイナー相互作用による可能性が高い。
実施例3:CYBA UTRを有するmRNAとCS2 UTRを有するmRNAの間のタンパク質発現比
代替の5’および3’UTRの使用を調べた。CYBA 5’および3’UTRを組み合わせた使用は、ヒト細胞における半減期に影響を及ぼすことなく、タンパク質産生を増大すると報告されている。CS2 UTRをCYBA UTR(CYBA-EGFP(NX/YN)151)で置き換えられた上記で試験した9つの非天然コドンすべてを有するEGFP配列を構築した。CHO-KS3細胞に、これらの新規に構築されたmRNAで、同族非天然tRNAを伴わずに、またはそれを伴ってトランスフェクトした。次いで、細胞をフローサイトメトリーによって分析し、結果を、CS2 UTRを有するその対応物と比較した。フローサイトメトリーデータは、すべての場合において、CYBA UTRを有する場合に、そのCS2対応物を有する場合よりも少ないタンパク質が産生されたことを示した。CYBA-EGFP(GXC)151およびCYBA-EGFP(GYC)151をトランスフェクトされた細胞について、本発明者らはまた、上記のようにゲルシフトアッセイを使用して、非天然コドンデコーディング忠実度を評価した。観察されたシフトは、それぞれCS2 UTR対応物(EGFP(GXC)151およびEGFP(GYC)151)を用いた場合に観察されたものと同様であり(図7A~B)、これは、デコーディング忠実度は、隣接するUTRを変更することによって著しく影響を受けないということを実証した。
代替の5’および3’UTRの使用を調べた。CYBA 5’および3’UTRを組み合わせた使用は、ヒト細胞における半減期に影響を及ぼすことなく、タンパク質産生を増大すると報告されている。CS2 UTRをCYBA UTR(CYBA-EGFP(NX/YN)151)で置き換えられた上記で試験した9つの非天然コドンすべてを有するEGFP配列を構築した。CHO-KS3細胞に、これらの新規に構築されたmRNAで、同族非天然tRNAを伴わずに、またはそれを伴ってトランスフェクトした。次いで、細胞をフローサイトメトリーによって分析し、結果を、CS2 UTRを有するその対応物と比較した。フローサイトメトリーデータは、すべての場合において、CYBA UTRを有する場合に、そのCS2対応物を有する場合よりも少ないタンパク質が産生されたことを示した。CYBA-EGFP(GXC)151およびCYBA-EGFP(GYC)151をトランスフェクトされた細胞について、本発明者らはまた、上記のようにゲルシフトアッセイを使用して、非天然コドンデコーディング忠実度を評価した。観察されたシフトは、それぞれCS2 UTR対応物(EGFP(GXC)151およびEGFP(GYC)151)を用いた場合に観察されたものと同様であり(図7A~B)、これは、デコーディング忠実度は、隣接するUTRを変更することによって著しく影響を受けないということを実証した。
CYBA UTRを用いた場合に観察された発現のレベルの低減は、ヒト細胞の代わりのハムスター細胞の使用による可能性があるが、本発明者らはまた、全く予想外なことに、効果の規模が、異なる非天然コドンを用いた場合に著しく異なることも注目した。その同族非天然tRNAを伴ってトランスフェクトした場合に(AGXコドンとともに自己対形成性tRNAを使用した)、CYBA UTRととものXCC、YCC、GXUおよびGYUコドンは、そのCS2対応物の約60%である発現レベルを示し、CYBA UTRととものAXC、AYC、GXC、GYCおよびAGXコドンを用いた場合の発現レベルは、そのCS2対応物のわずか約30%であった(図7A~D)。アンバー構築物CYBA-EGFP(TAG)151および天然構築物CYBA-EGFP(TAC)151を対照として使用した。CYBA-EGFP(TAG)151およびCYBA-EGFP(TAC)151は、そのCS2 UTR対応物の約60%および約80%である発現レベルを示した。
この非天然コドン依存性UTR効果が、mRNA安定性の相違に起因している可能性があるか否かを調べるために、定量的PCRを伴う逆転写を使用してEGFP(UAC)151、EGFP(GXC)151、EGFP(GXU)151、CYBA-EGFP(UAC)151、CYBA-EGFP(GXC)151およびCYBA-EGFP(GXU)151について、トランスフェクションの8時間後のmRNAのレベルを、トランスフェクションの4時間後のものと比較した。これらの種々の構築物の間で分解において観察された相違は、上記の劇的な割合の相違を説明するものではなく(図6)、従って、他の因子が原因であるはずである。UTRが翻訳に影響を及ぼすと考えられる1つの方法は、リボソーム動員効率を調節することによってである。しかし、5’または3’UTRのいずれかからかなり離れている(この場合には、少なくとも350ntによって)コドンの翻訳に影響を及ぼすことができる方法を合理的に説明することは困難である。興味深いことに、複数のリボソーム亜集団が単細胞中に存在すると知られており、例えば、可変の翻訳伸長能によって区別することができる。恐らくは、原核生物および真核生物由来のリボソームが、異なる非天然コドンを異なってデコードするという本発明者らの観察結果と同様に、これは、天然コドンの翻訳とは異なり、原理上、リボソームが種々の非天然コドンを取り扱う方法に対してより著しい効果を有する可能性がある。この魅力的な可能性をそのままにしておくためにはさらなる実験が必要である。
本明細書で開示される結果は、非天然コドンが、HEK293TおよびCHO細胞の両方において少なくとも合理的な効率および忠実度でデコードされることを実証する。興味深いことに、真核生物のリボソームによる認識は、大腸菌リボソームによって媒介される認識との類似点および相違点の両方を示す。第1の位置のコドンXCCおよびYCCは、大腸菌またはCHO細胞のいずれかにおいて良好な効率でデコードできない;第2の位置のNaMコドンAXC、GXCおよびGXUは、大腸菌およびCHO細胞の両方において良好な効率でデコードできる;第2の位置のコドンTPT3コドンAYC、GYCおよびGYUは、大腸菌ではデコードできないが、興味深いことに、CHO細胞ではデコードでき;第3の位置のコドンAGXは、その同族ヘテロ対形成性tRNAならびにその非同族自己対形成性tRNAの両方によって大腸菌およびCHO細胞の両方でデコードできる。
実施例4:方法
実施例1~3において使用される材料および方法は以下のとおりである:
材料。実施例1~4で使用されるプラスミドおよびプライマーは、表1および2において見出すことができる。プライマーおよび天然オリゴヌクレオチドは、IDT(コーラルビル、アイオワ州)から購入した。シーケンシングは、Genewiz(サンディエゴ、カリフォルニア州)によって実施された。プラスミドは、市販のminiprepキット(製品番号D4013、Zymo Research;アーバイン、カリフォルニア州)を使用して精製した。PCR産物は、市販のDNA精製キット(D4054、Zymo Research)を使用して精製し、Infinite M200 Proプレートリーダー(TECAN)を使用して定量化した。RNA種が関与するすべての実験は、汚染を避けるためにRNase不含試薬、ペプチドチップ、チューブおよびグローブを用いて行った。dNaM、dTPT3、NAM、TPT3、d5SICSおよびdMMO2bioのヌクレオシドは、商業的に合成され(WuXi AppTec;上海、中国)、三リン酸化された(TriLink BioTechnologies LLC;サンディエゴ、カリフォルニア州およびMyChem LLC;サンディエゴ、カリフォルニア州)。すべての非天然オリゴヌクレオチドは、Biosearch Technologies(ペタルーマ、カリフォルニア州)によって合成され、HPLCによって精製された。
実施例1~3において使用される材料および方法は以下のとおりである:
材料。実施例1~4で使用されるプラスミドおよびプライマーは、表1および2において見出すことができる。プライマーおよび天然オリゴヌクレオチドは、IDT(コーラルビル、アイオワ州)から購入した。シーケンシングは、Genewiz(サンディエゴ、カリフォルニア州)によって実施された。プラスミドは、市販のminiprepキット(製品番号D4013、Zymo Research;アーバイン、カリフォルニア州)を使用して精製した。PCR産物は、市販のDNA精製キット(D4054、Zymo Research)を使用して精製し、Infinite M200 Proプレートリーダー(TECAN)を使用して定量化した。RNA種が関与するすべての実験は、汚染を避けるためにRNase不含試薬、ペプチドチップ、チューブおよびグローブを用いて行った。dNaM、dTPT3、NAM、TPT3、d5SICSおよびdMMO2bioのヌクレオシドは、商業的に合成され(WuXi AppTec;上海、中国)、三リン酸化された(TriLink BioTechnologies LLC;サンディエゴ、カリフォルニア州およびMyChem LLC;サンディエゴ、カリフォルニア州)。すべての非天然オリゴヌクレオチドは、Biosearch Technologies(ペタルーマ、カリフォルニア州)によって合成され、HPLCによって精製された。
シンテターゼプラスミドの構築。キメラシンテターゼChPylPS_C211配列を、Fischerら、Nat. Chem. Biol. 16:570-576 (2020)に記載されたpGEX_ChPylRSからクローニングした。pcDNA3.1_C211_IRES_mChは、一連の制限酵素を使用してpcDNA3.1ベクター中にChPylRS、IRESおよびmCherry配列を1つずつクローニングすることによって作製した。
EGFPおよびtRNAテンプレートの構築。EGFPテンプレートプラスミド、pUCCS2_EGFP(NNN)およびpUCCYBA_EGFP(NNN)は、これまでに記載されるようなGolden Gateアセンブリーによってであるが、sfGFPコンテキストの代わりにEGFP配列コンテキストを用いて作製した(Zhangら、Nature 551:644-647 (2017)を参照されたい)。すべてのGolden Gateアセンブリーにおいて使用される挿入部分は、合成されたdNaM含有オリゴヌクレオチドならびにプライマーYZ73およびYZ74を用いて生成されたPCR産物であった(表1を参照されたい)。Golden Gateアセンブリー後にプラスミドpUCCS2_EGFP(NNN)およびpUCCYBA_EGFP(NNN)を精製し、Qubit(ThermoFisher)を使用して定量化した。EGFPテンプレートプラスミド(2ng)を、pUCCS2_EGFP(NNN)についてはプライマーED101およびAZ38を用いて、ならびにpUCCYBA_EGFP(NNN)についてはプライマーED101およびAZ87を用いてテンプレート生成PCR反応において使用した。PCR産物を、DpnI消化に供し、次いで、精製してインビトロ転写のためのEGFPテンプレートを得た(以下を参照されたい)。tRNAテンプレートは、プライマーAZ01およびAZ67を用いて合成されたdNaM含有オリゴヌクレオチドから直接PCRによって作製した。PCR産物を精製して、インビトロ転写用のtRNAテンプレートを得た。
ビオチンシフトアッセイ。RNA種のテンプレート中の非天然塩基対の保持を、プライマーYZ73およびYZ7を用いd5SICSTPおよびdMMO2bio-TPを使用してこれまでの研究に記載されるようにアッセイした(Zhangら、Nature 551:644-647 (2017)を参照されたい)。画像は、Image Lab(BioRad)を使用して定量化した。非天然塩基対保持は、EGFPプラスミドを構築する場合にGolden Gateアセンブリーにおいて使用された合成されたdNaM含有オリゴヌクレオチドテンプレートの生シフトパーセンテージによって、各サンプルの生シフトパーセンテージを除することによって正規化した。
EGFP mRNAのインビトロ転写。各インビトロ転写反応(HiScribe T7 ARCA、テーリング有、E2060S、New England Biolabs、(NEB))において相応に1.25mMの非天然リボヌクレオ三リン酸を用いて、または用いずに、テンプレート(500~1000ng)を使用し、それに続いて精製した(D7010、Zymo Research)。mRNA産物をQubitによって定量化し、次いで、5μgのアリコートで-80℃で保存した。
tRNAのインビトロ転写。各インビトロ転写反応(T7 RNAポリメラーゼ、E0251L、NEB)において、相応に2mMの非天然リボヌクレオ三リン酸を用いて、または用いずに、テンプレート(500~1000ng)を使用し、それに続いて、精製した(D7010、Zymo)。tRNA産物をQubitによって定量化し、次いで、再フォールディング(95℃で1分間、37℃で1分間、10℃で2分間)に供した。すべてのtRNAを1800ngのアリコートで-80℃で保存した。
安定な細胞株の構築。シンテターゼ含有プラスミドpcDNA3.1_FRT_ HygroResist_C211_IRES_mCherryを、平滑末端ライゲーションクローニングによって、pcDNA3.1_C211_IRES_mCherry中のカナマイシン耐性カセット、KanRを、ハイグロマイシン耐性カセット、HygroResistと置き換えることによって作製した。CHO-KS3異種細胞株を、Flp-In(商標)T-REx(商標)システム(ThermoFisher)を製造業者の使用説明書に従って使用してChPylRS C211を安定に発現するように修飾した。元のFlip-inTM CHO-K1細胞を、10% FBS、1% PS DMEM/F12培養で回復させた。細胞にpOG44およびpcDNA3.1_C211_IRES_mCherry(対照)またはpcDNA3.1_FRT_HygroResist_C211_IRES_mCherryを同時トランスフェクトした。成功した組換え細胞を、対照群中のすべての細胞が死滅するまで100μg/mLのハイグロマイシンB(Sigma Aldrich)を用いて2週間選択した(4日に1回細胞培養培地を更新しながら)。次いで、pcDNA3.1_FRT_HygroResist_C211_IRES_mCherryをトランスフェクトされた細胞をトリプシン(25200056、Life Technology Invitrogen)消化(37℃で5分)によって剥離し、100μg/mLのハイグロマイシンBを含有する細胞培養培地を用いてさらに2ラウンドの間継代した。
細胞トランスフェクション。1mM AzKを含有する新鮮な細胞培養物を、これまでの培地を枯渇させた後、細胞培養プレートに添加した。RNAトランスフェクションのために、リポフェクタミン MessengerMax (ThermoFisher)を試薬マニュアルに従って使用して、細胞にRNA種をトランスフェクトした。各トランスフェクション実験のために、300ngのmRNAおよび900ngのtRNAを、0.75μLのリポフェクタミン試薬と各々混合し、細胞培養物(24ウェルの平底ポリスチレンマイクロウェルプレートのうちの1ウェル)に別個に添加した。DNAトランスフェクションのために、リポフェクタミン3000(LMRNA008、ThermoFisher)を試薬マニュアルに従って使用して、細胞にDNA種をトランスフェクトした。各トランスフェクション実験のために、500ngのDNAプラスミドを1.5μLのリポフェクタミン試薬と混合し、細胞培養物(24ウェルプレートのうちの1ウェル)に添加した。いくつかの場合において、12ウェルプレートで細胞にトランスフェクトし、トランスフェクション試薬およびRNAの容積を2倍にした。
フローサイトメトリー。細胞をトリプシン消化(37℃で5分)によって剥離し、次いで、1×ダルベッコのリン酸緩衝生理食塩水(DPBS)で洗浄した。次いで、細胞を収集し、選別バッファー(1% FBSを有する1×DPBS)で希釈し、次いで、LSR II分析用フローサイトメーターを使用してEGFPシグナルについてフローサイトメトリーによって分析した(BD;EGFPシグナルは、488nmレーザーおよび530/30フィルターを用いて検出した)。
全細胞溶解物調製。トランスフェクション実験から得た細胞を、トリプシン消化(37℃で5分)によって剥離し、続いて、DPBS洗浄した。次いで、細胞を収集し、HALTプロテアーゼ阻害剤(78430、Thermo Fisher)を補給したM-PER(78503、Thermo Fisher)を試薬マニュアルに従って使用して溶解した。溶解物を、遠心フィルター(Amicon Ultra-0.5mLの遠心フィルター、10kDa NMWL、UFC501024、Millipore)を使用する限外濾過に供して、組み込まれていないAzKを除去した。HALTを含有するDPBSで溶解物を洗浄した(3回)。最終洗浄工程で溶解物を20μLの容量に濃縮した。すべての限外濾過は、4℃、14,000rpmで10分間実施した(5415C、Eppendorf)。
EGFPのアフィニティー精製。トランスフェクション実験から収集した細胞を、HALTプロテアーゼ阻害剤を補給したM-PERを試薬マニュアルに従って使用して溶解した。Infinite M200 ProプレートリーダーおよびEGFP標準曲線を使用して溶解物サンプル中のEGFP濃度(蛍光a.u.)を決定した。200ngのEGFP相当物を含有する溶解物を、バッファーW(50mM HEPES pH8、150mM NaCl、1mM EDTA)で200μLに希釈し、10μLの磁性Strep-Tactinビーズ(MagStrep「3型」XTビーズ、製品番号2-4090-002、IBA Lifesciences;ゲッティンゲン、ドイツの5%(v/v)懸濁液)と混合した。精製は、試薬マニュアルに従い、延長した結合時間(4℃で2時間)を用いて実施した。EGFPはビーズから溶出されなかった。ビーズ-EGFPコンジュゲートを以下の実験において直接使用した。
EGFPでのクリック反応。クリック反応は、改変を加え、これまでの研究に記載されたように実施した(Zhangら、Nature 551:644-647 (2017)を参照されたい)。手短には、アフィニティー精製工程から得られたビーズ-EGFPコンジュゲートを、20μLのDPBSで希釈した。混合物を、25μMのTAMRA-DBCO(製品番号A131、Click Chemistry Tools;スコッツデール、アリゾナ州)とともに暗所、37℃で1時間インキュベートした。あるいは、アフィニティー精製工程から得られたビーズ-EGFPコンジュゲートを、20μLのDPBSで希釈した。混合物を、2mMのトリス(3-ヒドロキシプロピルトリアゾリルメチル)アミン(THPTA)(CAS 760952-88-3、Sigma-Aldrich)、1mMのCuSO4、15mMのアスコルビン酸ナトリウム(CAS 134-03-2、Sigma-Aldrich)および0.5mMの4-フェニル-1-ブチン(CAS 16520-62-0、Sigma-Aldrich)とともに暗所、37℃で1時間インキュベートした。20μLの限外濾過した細胞溶解物を、25μMのヨードアセトアミド(CAS 144-48-9、Sigma-Aldrich)とともに37℃で1時間インキュベートすること、それに続いて、得られた混合物を25μMのDBCO-TAMRAとともに暗所、37℃で1時間インキュベートすることによって、処理された全細胞溶解物のクリック反応を実施した。
ウエスタンブロットタンパク質シフトアッセイ。ウエスタンブロットタンパク質シフトアッセイは、いくつかの改変を加えて、これまでの研究2に記載されたように実施した。手短には、クリック反応混合物を、1×タンパク質ローディング色素(250mM Tris-HCl、30%(v/v)グリセロール、2%(w/v)SDS)中で95℃で15分間直接煮沸し、生成物を、SDS-PAGE(5%(w/v)アクリルアミド:ビス-アクリルアミド29:1(Fisher)、0.125M TrisHClおよび0.1% SDS、pH6.8(ProtoGelスタッキングバッファー、National Diagnostics)のスタッキングゲルを使用する);および15%(w/v)アクリルアミド:ビス-アクリルアミド29:1(Fisher)、0.375M Tris-HClおよび0.1% SDS、pH8.8(ProtoGel分離バッファー、National Diagnostics)の分離ゲル;タンパク質ラダー(色染色済みタンパク質標準、Broad Range、NEB)を有する1.5mmスペーサーMini-PROTEAN Short Plates(Bio-Rad))で分離した。ゲルを、SDS-PAGEバッファー(25mM Tris塩基、200mMグリシン、0.1%(w/v)SDS)中、60Vで30分間、次いで、135Vで約3時間流した。次いで、バンドを、20%(v/v)MeOH、50mM Tris塩基、400mMグリシン、0.0373%(w/v)SDSを含有するバッファーを用いてセミドライトランスファーによって、22Vで21分間、PVDFメンブレン(0.2μm、Bio-Rad)に移した。メンブレンをPBS-T(PBS pH7.4、0.01%(v/v)Tween-20)中、5%(w/v)の無脂肪乳を用いて室温で1~2時間ブロッキングし、それに続いて、ウサギ抗GFP抗体(製品番号G1544、ロット046M4871V、Sigma-Aldrich; PBS-Tで1:3000)とともに4℃で一晩インキュベートした。次いで、メンブレンをPBS-Tで5分間2回洗浄し、続いて、ヤギ抗ウサギAlexa Fluor 647がコンジュゲートされた抗体(製品番号A32733、ロット番号SD250298、Thermo Fisher Scientific;PBS-Tで1:20000)とともに室温で1時間インキュベートした。メンブレンを洗浄しPBS-Tで5分間3回洗浄し、50μm分解能;TAMRAのために400V PMTを用いて532nmレーザー励起および580/30nm発光フィルター;Alexa Fluor 647のために500V PMTを用いて622nmレーザー励起および670/30nm発光フィルターを使用するホスホイメージング(Typhoon 9410; Build S4 410 5.0.0409.0700、GE Healthcare Life Sciences)によって可視化した。画像をImageJを使用して疑似着色し、オーバーレイし、Image Lab(Bio-Rad)を使用してバンドを定量化した。
質量分析。4-フェニル-1-ブチンを用いてクリック反応させたビーズ-EGFPコンジュゲートを、1×タンパク質ローディング色素とともに95℃で15分間直接煮沸し、タンパク質ラダーを用いて本質的に上記のウエスタンブロットタンパク質シフトについてのとおりにSDS-PAGEに供した。ゲルを、SDS-PAGEバッファー中、60Vで30分間、次いで、135Vで約30分間流した。25kDaから32kDaの間のゲルバンドを切り出し、収集し、続いて、還元し(10mM DTT)、アルキル化(55mMヨードアセトアミド)し、トリプシンを使用して消化した。次いで、サンプルをこれまでに記載されたようにナノ-LC-MS/MSによって分析した(Powersら、J. Bacteriol. 193:340-348 (2011)を参照されたい)。手短には、先端で2kVで自家製ナノエレクトロスプレー供給源を使用するThermo Finnigan LTQ線状イオントラップ型質量分析計を用いて、データ依存性MS/MSデータを得た。動的除外リストの適用後、最も豊富なイオンで1つのMSスペクトラムに、4回のMS/MSスキャンを続けた。Xcaliburソフトウェアの使用によってタンデム質量スペクトルを抽出した。消化酵素トリプシンを想定して、提供されたEGFP配列を用いてMascot(バージョン2.1.04;Matrix Science、ロンドン、英国)を使用することによって、すべてのMS/MSサンプルを分析した。
インタクトなタンパク質の定量的高分解能質量分析。インタクトなタンパク質の質量分析を、これまでに記載されたように実施した(Feldmanら、J. Am. Chem. Soc. 141:10644-10653 (2019)を参照されたい)。精製されたEGFPタンパク質(5μg)を、水(質量分析等級)を用いて希釈し、限外濾過(Amicon Ultra-0.5mLの遠心フィルター、10kDa NMWL、UFC501024、Millipore)によって脱塩した。次いで、脱塩されたタンパク質(6μL、約250ng)を、Waters G2-XS TOFに接続されたWaters IClass LC中に注入した。フロー条件は、50:50の水:アセトニトリルおよび0.1%ギ酸の0.4mL/分とした。イオン化は、ESI+によってであり、m/z500からm/z2000の間でデータを収集した。ピークの主要部分にわたってスペクトル結合を実施し、Waters MaxEnt1を使用して結合スペクトルをデコンボリューションした。
mRNA Decayアッセイ。試験した各mRNAについて、CHO-KS1細胞の12ウェルプレートのうち2ウェルに、600ngのmRNAおよび1800ngの対応するtRNAをトランスフェクトし、続いて、1mM AzKを細胞培養物に添加した。4時間のインキュベーション後、両ウェルの細胞を、DPBSを用いて2回洗浄し、次いで、1ウェル中の細胞を、TRIzole試薬(15596026、Thermo Fisher;各ウェルについて使用された400μLのTRIzole)を使用して回収した。同時に、他のウェル中の細胞培養物(トランスフェクション試薬を含有する)を枯渇させ、新鮮細胞培地を添加した。さらに4時間(合計8時間)後、残存するウェルから得た細胞を、DPBSを用いて2回洗浄し、次いで、TRIzoleを使用して回収した。全RNA抽出キット(R1013、Zymo)を使用して両TRIzole溶液サンプルを精製した。各サンプルから得た全RNA(1000ng)を、RT-qPCRのテンプレートとしてプライマーAZ112およびAZ86(CS2 UTRおよびCYBA UTRの両方に適した)とともに使用し、それから得られたCq値を使用して、対応する全RNAサンプル中のmRNAの出発量を算出した。インビトロ転写から作製された精製された対応する天然mRNAを使用して、定量化参照のための標準曲線を構築した。mRNAが4時間(トランスフェクションプロセスの最後)~8時間に崩壊したパーセンテージを、4時間と8時間の間のmRNAの相違の量を、4時間でのmRNA量で除することによって算出した。
他の配列
IRES(配列番号33):
CATCTAGGGCGGCCAATTCCGCCCCTCTCCCTCCCCCCCCCCTAACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTATATGTGATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAAGCTTGCCAC
mCherry(配列番号34)
ATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAA
ChPylRS_C211(配列番号35)
ATGGATAAAAAACCGCTGGACGTTCTGATCTCCGCTACGGGTCTGTGGATGAGCCGCACGGGTACGCTGCATAAAATCAAGCACTATGAGATTTCTCGTTCTAAAATCTACATCGAAATGGCGTGTGGTGACCATCTGGTTGTGAACAACTCTCGTTCTTGTCGTCCGGCACGTGCATTCCGTTATCATAAATACCGTAAAACCTGCAAACGTTGTCGTGTTTCTGACGAAGATATCAACAACTTCCTGACCCGTTCTACCGAAGGCAAAACCTCTGTTAAAGTTAAAGTTGTTTCTGAACCGAAAGTGAAAAAAGCGATGCCGAAATCTGTTTCTCGTGCGCCGAAACCGCTGGAAAATCCGGTTTCTGCGAAAGCGTCTACCGACACCTCTCGTTCTGTTCCGTCTCCGGCGAAATCTACCCCGAACTCTCCGGTTCCGACCTCTGCAAGTGCCCCCGCACTTACGAAGAGCCAGACTGACAGGCTTGAAGTCCTGTTAAACCCAAAAGATGAGATTTCCCTGAATTCCGGCAAGCCTTTCAGGGAGCTTGAGTCCGAATTGCTCTCTCGCAGAAAAAAAGACCTGCAGCAGATCTACGCGGAAGAAAGGGAGAATTATCTGGGGAAACTCGAGCGTGAAATTACCAGGTTCTTTGTGGACAGGGGTTTTCTGGAAATAAAATCCCCGATCCTGATCCCTCTTGAGTATATCGAAAGGATGGGCATTGATAATGATACCGAACTTTCAAAACAGATCTTCAGGGTTGACAAGAACTTCTGCCTGAGACCCATGCTTGCTCCAAACCTTTACAACTACCTGCGCAAGCTTGACAGGGCCCTGCCTGATCCAATAAAAATTTTTGAAATAGGCCCATGCTACAGAAAAGAGTCCGACGGCAAAGAACACCTCGAAGAGTTTACCATGCTGAACTTCTGCCAGATGGGATCGGGATGCACACGGGAAAATCTTGAAAGCATAATTACGGACTTCCTGAACCACCTGGGAATTGATTTCAAGATCGTAGGCGATTCCTGCATGGTCTATGGGGATACCCTTGATGTAATGCACGGAGACCTGGAACTTTCCTCTGCAGTAGTCGGACCCATACCGCTTGACCGGGAATGGGGTATTGATAAACCCTGGATAGGGGCAGGTTTCGGACTCGAACGCCTTCTAAAGGTTAAACACGACTTTAAAAATATCAAGAGAGCTGCACGCTCGGAATCGTATTACAACGGCATCTCAACCAATCTGTAA
CS2 5’UTR(配列番号36):
GAATACAAGCTACTTGTTCTTTTTGCAGGATCCGCCACC
CS2 3’UTR(配列番号37):
AAGCTTAATTAGCTGAGCTTGGACTCCTAAGCATGCAAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGG
CYBA 5’UTR(配列番号38):
CGCGCCTAGCAGTGTCCCAGCCGGGTTCGTGTCGCC
CYBA 3’UTR(配列番号39):
CCTCGCCCCGGACCTGCCCTCCCGCCAGGTGCACCCACCTGCAATAAATGCAGCGAAGCCGGGA
EGFP(Golden Gateベクター)(2xStrepTagを有する)(配列番号40):
ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGAGACCCTCGAGAATATTCTCGAGGGTCTCGGAATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGAAGCTTTGGAGCCACCCGCAGTTCGAGAAAGGTGGAGGTTCCGGAGGTGGATCGGGAGGTTCGGCGTGGAGCCACCCGCAGTTCGAAAAATAA
FLP(配列番号41)
ATGCCACAATTTGATATATTATGTAAAACACCACCTAAGGTGCTTGTTCGTCAGTTTGTGGAAAGGTTTGAAAGACCTTCAGGTGAGAAAATAGCATTATGTGCTGCTGAACTAACCTATTTATGTTGGATGATTACACATAACGGAACAGCAATCAAGAGAGCCACATTCATGAGCTATAATACTATCATAAGCAATTCGCTGAGTTTGGATATTGTCAACAAGTCACTGCAGTTTAAATACAAGACGCAAAAAGCAACAATTCTGGAAGCCTCATTAAAGAAATTGATTCCTGCTTGGGAATTTACAATTATTCCTTACTATGGACAAAAACATCAATCTGATATCACTGATATTGTAAGTAGTTTGCAATTACAGTTCGAATCATCGGAAGAAGCAGATAAGGGAAATAGCCACAGTAAAAAAATGCTTAAAGCACTTCTAAGTGAGGGTGAAAGCATCTGGGAGATCACTGAGAAAATACTAAATTCGTTTGAGTATACTTCGAGATTTACAAAAACAAAAACTTTATACCAATTCCTCTTCCTAGCTACTTTCATCAATTGTGGAAGATTCAGCGATATTAAGAACGTTGATCCGAAATCATTTAAATTAGTCCAAAATAAGTATCTGGGAGTAATAATCCAGTGTTTAGTGACAGAGACAAAGACAAGCGTTAGTAGGCACATATACTTCTTTAGCGCAAGGGGTAGGATCGATCCACTTGTATATTTGGATGAATTTTTGAGGAATTCTGAACCAGTCCTAAAACGAGTAAATAGGACCGGCAATTCTTCAAGCAACAAGCAGGAATACCAATTATTAAAAGATAACTTAGTCAGATCGTACAACAAAGCTTTGAAGAAAAATGCGCCTTATTCAATCTTTGCTATAAAAAATGGCCCAAAATCTCACATTGGAAGACATTTGATGACCTCATTTCTTTCAATGAAGGGCCTAACGGAGTTGACTAATGTTGTGGGAAATTGGAGCGATAAGCGTGCTTCTGCCGTGGCCAGGACAACGTATACTCATCAGATAACAGCAATACCTGATCACTACTTCGCACTAGTTTCTCGGTACTATGCATATGATCCAATATCAAAGGAAATGATAGCATTGAAGGATGAGACTAATCCAATTGAGGAGTGGCAGCATATAGAACAGCTAAAGGGTAGTGCTGAAGGAAGCATACGATACCCCGCATGGAATGGGATAATATCACAGGAGGTACTAGACTACCTTTCATCCTACATAAATAGACGCATATAA
FRT(配列番号42)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGAAAGTATAGGAACTTC
IRES(配列番号33):
CATCTAGGGCGGCCAATTCCGCCCCTCTCCCTCCCCCCCCCCTAACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTATATGTGATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAAGCTTGCCAC
mCherry(配列番号34)
ATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAA
ChPylRS_C211(配列番号35)
ATGGATAAAAAACCGCTGGACGTTCTGATCTCCGCTACGGGTCTGTGGATGAGCCGCACGGGTACGCTGCATAAAATCAAGCACTATGAGATTTCTCGTTCTAAAATCTACATCGAAATGGCGTGTGGTGACCATCTGGTTGTGAACAACTCTCGTTCTTGTCGTCCGGCACGTGCATTCCGTTATCATAAATACCGTAAAACCTGCAAACGTTGTCGTGTTTCTGACGAAGATATCAACAACTTCCTGACCCGTTCTACCGAAGGCAAAACCTCTGTTAAAGTTAAAGTTGTTTCTGAACCGAAAGTGAAAAAAGCGATGCCGAAATCTGTTTCTCGTGCGCCGAAACCGCTGGAAAATCCGGTTTCTGCGAAAGCGTCTACCGACACCTCTCGTTCTGTTCCGTCTCCGGCGAAATCTACCCCGAACTCTCCGGTTCCGACCTCTGCAAGTGCCCCCGCACTTACGAAGAGCCAGACTGACAGGCTTGAAGTCCTGTTAAACCCAAAAGATGAGATTTCCCTGAATTCCGGCAAGCCTTTCAGGGAGCTTGAGTCCGAATTGCTCTCTCGCAGAAAAAAAGACCTGCAGCAGATCTACGCGGAAGAAAGGGAGAATTATCTGGGGAAACTCGAGCGTGAAATTACCAGGTTCTTTGTGGACAGGGGTTTTCTGGAAATAAAATCCCCGATCCTGATCCCTCTTGAGTATATCGAAAGGATGGGCATTGATAATGATACCGAACTTTCAAAACAGATCTTCAGGGTTGACAAGAACTTCTGCCTGAGACCCATGCTTGCTCCAAACCTTTACAACTACCTGCGCAAGCTTGACAGGGCCCTGCCTGATCCAATAAAAATTTTTGAAATAGGCCCATGCTACAGAAAAGAGTCCGACGGCAAAGAACACCTCGAAGAGTTTACCATGCTGAACTTCTGCCAGATGGGATCGGGATGCACACGGGAAAATCTTGAAAGCATAATTACGGACTTCCTGAACCACCTGGGAATTGATTTCAAGATCGTAGGCGATTCCTGCATGGTCTATGGGGATACCCTTGATGTAATGCACGGAGACCTGGAACTTTCCTCTGCAGTAGTCGGACCCATACCGCTTGACCGGGAATGGGGTATTGATAAACCCTGGATAGGGGCAGGTTTCGGACTCGAACGCCTTCTAAAGGTTAAACACGACTTTAAAAATATCAAGAGAGCTGCACGCTCGGAATCGTATTACAACGGCATCTCAACCAATCTGTAA
CS2 5’UTR(配列番号36):
GAATACAAGCTACTTGTTCTTTTTGCAGGATCCGCCACC
CS2 3’UTR(配列番号37):
AAGCTTAATTAGCTGAGCTTGGACTCCTAAGCATGCAAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGG
CYBA 5’UTR(配列番号38):
CGCGCCTAGCAGTGTCCCAGCCGGGTTCGTGTCGCC
CYBA 3’UTR(配列番号39):
CCTCGCCCCGGACCTGCCCTCCCGCCAGGTGCACCCACCTGCAATAAATGCAGCGAAGCCGGGA
EGFP(Golden Gateベクター)(2xStrepTagを有する)(配列番号40):
ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGAGACCCTCGAGAATATTCTCGAGGGTCTCGGAATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGAAGCTTTGGAGCCACCCGCAGTTCGAGAAAGGTGGAGGTTCCGGAGGTGGATCGGGAGGTTCGGCGTGGAGCCACCCGCAGTTCGAAAAATAA
FLP(配列番号41)
ATGCCACAATTTGATATATTATGTAAAACACCACCTAAGGTGCTTGTTCGTCAGTTTGTGGAAAGGTTTGAAAGACCTTCAGGTGAGAAAATAGCATTATGTGCTGCTGAACTAACCTATTTATGTTGGATGATTACACATAACGGAACAGCAATCAAGAGAGCCACATTCATGAGCTATAATACTATCATAAGCAATTCGCTGAGTTTGGATATTGTCAACAAGTCACTGCAGTTTAAATACAAGACGCAAAAAGCAACAATTCTGGAAGCCTCATTAAAGAAATTGATTCCTGCTTGGGAATTTACAATTATTCCTTACTATGGACAAAAACATCAATCTGATATCACTGATATTGTAAGTAGTTTGCAATTACAGTTCGAATCATCGGAAGAAGCAGATAAGGGAAATAGCCACAGTAAAAAAATGCTTAAAGCACTTCTAAGTGAGGGTGAAAGCATCTGGGAGATCACTGAGAAAATACTAAATTCGTTTGAGTATACTTCGAGATTTACAAAAACAAAAACTTTATACCAATTCCTCTTCCTAGCTACTTTCATCAATTGTGGAAGATTCAGCGATATTAAGAACGTTGATCCGAAATCATTTAAATTAGTCCAAAATAAGTATCTGGGAGTAATAATCCAGTGTTTAGTGACAGAGACAAAGACAAGCGTTAGTAGGCACATATACTTCTTTAGCGCAAGGGGTAGGATCGATCCACTTGTATATTTGGATGAATTTTTGAGGAATTCTGAACCAGTCCTAAAACGAGTAAATAGGACCGGCAATTCTTCAAGCAACAAGCAGGAATACCAATTATTAAAAGATAACTTAGTCAGATCGTACAACAAAGCTTTGAAGAAAAATGCGCCTTATTCAATCTTTGCTATAAAAAATGGCCCAAAATCTCACATTGGAAGACATTTGATGACCTCATTTCTTTCAATGAAGGGCCTAACGGAGTTGACTAATGTTGTGGGAAATTGGAGCGATAAGCGTGCTTCTGCCGTGGCCAGGACAACGTATACTCATCAGATAACAGCAATACCTGATCACTACTTCGCACTAGTTTCTCGGTACTATGCATATGATCCAATATCAAAGGAAATGATAGCATTGAAGGATGAGACTAATCCAATTGAGGAGTGGCAGCATATAGAACAGCTAAAGGGTAGTGCTGAAGGAAGCATACGATACCCCGCATGGAATGGGATAATATCACAGGAGGTACTAGACTACCTTTCATCCTACATAAATAGACGCATATAA
FRT(配列番号42)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGAAAGTATAGGAACTTC
本開示の好ましい実施形態を、本明細書において示し、記載してきたが、このような実施形態は単に例として提供されるということは当業者には明らかであろう。ここで、多数の変形、変更および置換は、本開示から逸脱することなく当業者には思い当たるであろう。本明細書に記載される開示の実施形態の種々の代替を、本開示の実施において使用できるということは、理解されなければならない。以下の特許請求の範囲が本発明の範囲を規定することならびにこれらの特許請求の範囲の範囲内の方法および構造ならびにその均等物は、それによって包含されることが意図される。
Claims (124)
- (a)第1の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA)と;
(b)第2の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)と
を含む真核細胞であって、
該第1のおよび該第2の非天然塩基は、真核細胞において非天然塩基対(UBP)を形成可能であり、細胞において該mRNAが翻訳されて、少なくとも1つの非天然アミノ酸を含むポリペプチドを生成することが可能である、前記真核細胞。 - tRNAが、非天然アミノ酸でチャージされる、請求項1に記載の真核細胞。
- mRNAから翻訳されたポリペプチドをさらに含み、該ポリペプチドは、非天然アミノ酸を含み、場合により、該ポリペプチドは、真核生物のグリコシル化パターンを含む、請求項1または2のいずれか1項に記載の真核細胞。
- tRNAシンテターゼをさらに含み、該tRNAシンテターゼは、tRNAを非天然アミノ酸で優先的にアミノアシル化する、請求項1~3のいずれか1項に記載の真核細胞。
- mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の第1の位置(X-N-N)に位置する、請求項1~4のいずれか1項に記載の真核細胞。
- mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置する、請求項1~5のいずれか1項に記載の真核細胞。
- mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の最後の位置(N-N-X)に位置する、請求項1~6のいずれか1項に記載の真核細胞。
- 少なくとも1つの非天然アミノ酸は:
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、請求項3~14のいずれか1項に記載の真核細胞。 - 少なくとも1つの非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)、N6-((プロパルギルエトキシ)-カルボニル)-L-リジン(PraK)、BCN-L-リジン、ノルボルネンリジン、TCO-リジン、メチルテトラジンリジン、アリルオキシカルボニルリジン、2-アミノ-8-オキソノナン酸、2-アミノ-8-オキソオクタン酸、p-アセチル-L-フェニルアラニン、p-アジドメチル-L-フェニルアラニン(pAMF)、p-ヨード-L-フェニルアラニン、m-アセチルフェニルアラニン、2-アミノ-8-オキソノナン酸、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、3-メチル-フェニルアラニン、L-ドパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、p-ブロモフェニルアラニン、p-アミノ-L-フェニルアラニン、イソプロピル-L-フェニルアラニン、O-アリルチロシン、O-メチル-L-チロシン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、ホスホノチロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ホスホセリン、ホスホノセリン、L-3-(2-ナフチル)アラニン、2-アミノ-3-((2-((3-(ベンジルオキシ)-3-オキソプロピル)アミノ)エチル)セラニル)プロパン酸、2-アミノ-3-(フェニルセラニル)プロパン酸、セレノシステイン、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジン、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンまたはN6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンからなる群から選択される、請求項15に記載の真核細胞。
- 少なくとも1つの非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)である、請求項16に記載の真核細胞。
- ヒト細胞である、請求項1~17のいずれか1項に記載の真核細胞。
- ヒト細胞は、HEK293T細胞である、請求項18に記載の真核細胞。
- 哺乳動物細胞であり、場合により、ハムスター細胞である、請求項1~18のいずれか1項に記載の真核細胞。
- 哺乳動物細胞は、チャイニーズハムスター卵巣(CHO)細胞である、請求項20に記載の真核細胞。
- mRNAから翻訳されたポリペプチドをさらに含み、該ポリペプチドは、非天然アミノ酸および哺乳動物グリコシル化パターンを含む、請求項18~21のいずれか1項に記載の真核細胞。
- 単離されている、請求項1~22のいずれか1項に記載の真核細胞。
- 請求項1~23のいずれか1項に記載の真核細胞を含む半合成生物。
- 請求項1~24のいずれか1項に記載の複数の真核細胞を含む真核細胞培養物。
- 細胞を生物に送達する方法であって、該生物を請求項1~23のいずれか1項に記載の細胞と接触させる工程を含む前記方法。
- 生物は、哺乳動物であり、場合により、該哺乳動物は、ヒトである、請求項26に記載の方法。
- 真核細胞において少なくとも1つの非天然アミノ酸を含むポリペプチドを産生する方法であって:
(a)(i)第1の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA);および
(ii)真核細胞において第2の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)
を、該細胞中に導入する工程であって:該第1のおよび該第2の非天然塩基は、真核細胞において非天然塩基対(UBP)を形成可能である、工程と;
(b)該tRNAを使用して該mRNAから少なくとも1つの非天然アミノ酸を含むポリペプチドを翻訳する工程と
を含む前記方法。 - tRNAは、非天然アミノ酸でチャージされる、請求項28に記載の方法。
- 真核細胞において少なくとも1つの非天然アミノ酸を含むポリペプチドを産生する方法であって:
(a)(i)第1の非天然塩基を含むコドンを有するメッセンジャーRNA(mRNA)と;
(ii)第2の非天然塩基を含むアンチコドンを有するトランスファーRNA(tRNA)と
を含む真核細胞であって、該第1のおよび該第2の非天然塩基は、真核細胞において非天然塩基対(UBP)を形成可能である、前記真核細胞を提供する工程;および
(b)該真核細胞にとって内因性であるリボソームによってtRNAを使用してmRNAから少なくとも1つの非天然アミノ酸を含むポリペプチドを翻訳する工程
を含む前記方法。 - 真核細胞においてポリペプチドを産生する方法であって、ポリペプチドは、少なくとも1つの非天然アミノ酸を含み、方法は:
(a)真核細胞を提供する工程であって、該真核細胞は:
(i)第1の非天然塩基を含むコドンを含むmRNAと;
(ii)第2の非天然塩基を含むアンチコドンを含むtRNAであって、該第1のおよび該第2の非天然塩基は、相補的塩基対を形成可能である、前記tRNAと;
(iii)tRNAを天然アミノ酸と比較して少なくとも1つの非天然アミノ酸を用いて優先的にアミノアシル化するtRNAシンテターゼと;
を含む、前記工程と、
(b)1つまたはそれ以上の非天然アミノ酸を真核細胞に提供する工程であって、該真核細胞が少なくとも1つの非天然アミノ酸を含むポリペプチドを産生する、前記工程とを含む前記方法。 - mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の第1の位置(X-N-N)に位置する、請求項26~31のいずれか1項に記載の方法。
- mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置する、請求項26~31のいずれか1項に記載の方法。
- mRNAのコドンは、3つの連続した核酸塩基(N-N-N)を含み;第1の非天然塩基(X)は、mRNAのコドン中の最後の位置(N-N-X)に位置する、請求項26~31のいずれか1項に記載の方法。
- コドンおよびアンチコドンは各々、3つの連続した核酸塩基(N-N-N)を含み、mRNA中のコドンの第1の非天然塩基(X)は、該コドンの第1の位置(X-N-N)に位置し、tRNAのアンチコドンの第2の非天然塩基(Y)は、該アンチコドンの最後の位置(N-N-Y)に位置する、請求項26~36のいずれか1項に記載の方法。
- コドンおよびアンチコドンは各々、3つの連続した核酸塩基(N-N-N)を含み、mRNA中のコドンは、該コドンの中央の位置(N-X-N)に位置する第1の非天然塩基(X)を含み、tRNA中のアンチコドンは、該アンチコドンの中央の位置(N-Y-N)に位置する第2の非天然塩基(Y)を含む、請求項26~36のいずれか1項に記載の方法。
- コドンおよびアンチコドンは各々、3つの連続した核酸塩基(N-N-N)を含み、mRNA中のコドンは、該コドンの最後の位置(N-N-X)に位置する第1の非天然塩基(X)を含み、tRNA中のアンチコドンは、該アンチコドンの第1の位置(Y-N-N)に位置する第2の非天然塩基(Y)を含む、請求項26~36のいずれか1項に記載の方法。
- mRNAのコドン中に位置する第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する第2の非天然塩基(Y)は、同一であるか、または異なっている、請求項48~50のいずれか1項に記載の方法。
- mRNA中のコドンは、AXC、GXCまたはGXUから選択され、Xは、第1の非天然塩基である、請求項26~29、31、33、35~41、43、46および49、のいずれか1項に記載の方法。
- tRNA中のアンチコドンは、GYU、GYCおよびAYCから選択され、Yは、第2の非天然塩基である、請求項56に記載の方法。
- mRNA中のコドンは、AXCであり、tRNA中のアンチコドンは、GYUである、請求項57に記載の方法。
- mRNA中のコドンは、GXCであり、tRNA中のアンチコドンは、GYCである、請求項57に記載の方法。
- mRNA中のコドンは、GXUであり、アンチコドンは、AYCである、請求項57に記載の方法。
- 第1の非天然塩基または第2の非天然塩基は、2’位における修飾:
OH、置換された低級アルキル、アルカリル、アラルキル、O-アルカリルもしくはO-アラルキル、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2Fもしくはそれらの組合せ;
O-アルキル、S-アルキル、N-アルキルもしくはそれらの組合せ;
O-アルケニル、S-アルケニル、N-アルケニルもしくはそれらの組合せ;
O-アルキニル、S-アルキニル、N-アルキニルもしくはそれらの組合せ;
O-アルキル-O-アルキル、2’-F、2’-OCH3、2’-O(CH2)2OCH3もしくはそれらの組合せ(ここで、アルキル、アルケニルおよびアルキニルは、置換もしくは無置換のC1~C10、アルキル、C2~C10アルケニル、C2~C10アルキニル、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2および-O(CH2)nON[(CH2)nCH3)]2であってもよく、nおよびmは、1~約10である);
5’-ビニル、5’-メチル(RもしくはS)もしくはそれらの組合せ
を含む5’位における修飾;
4’-S、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態学的性質を改善するための基もしくはオリゴヌクレオチドの薬力学的性質を改善するための基もしくはそれらの組合せ
を含む4’位における修飾;
またはそれらの組合せ
からなる群から選択される修飾された糖部分を含む、請求項26~60のいずれか1項に記載の方法。 - 少なくとも1つの非天然アミノ酸は:
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、請求項26~61のいずれか1項に記載の方法。 - 少なくとも1つの非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)、N6-((プロパルギルエトキシ)-カルボニル)-L-リジン(PraK)、BCN-L-リジン、ノルボルネンリジン、TCO-リジン、メチルテトラジンリジン、アリルオキシカルボニルリジン、2-アミノ-8-オキソノナン酸、2-アミノ-8-オキソオクタン酸、p-アセチル-L-フェニルアラニン、p-アジドメチル-L-フェニルアラニン(pAMF)、p-ヨード-L-フェニルアラニン、m-アセチルフェニルアラニン、2-アミノ-8-オキソノナン酸、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、3-メチル-フェニルアラニン、L-ドパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、p-ブロモフェニルアラニン、p-アミノ-L-フェニルアラニン、イソプロピル-L-フェニルアラニン、O-アリルチロシン、O-メチル-L-チロシン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、ホスホノチロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ホスホセリン、ホスホノセリン、L-3-(2-ナフチル)アラニン、2-アミノ-3-((2-((3-(ベンジルオキシ)-3-オキソプロピル)アミノ)エチル)セラニル)プロパン酸、2-アミノ-3-(フェニルセラニル)プロパン酸、セレノシステイン、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジン、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンおよびN6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンからなる群から選択される、請求項26~61のいずれか1項に記載の方法。
- 非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)である、請求項63に記載の方法。
- 細胞は、ヒト細胞である、請求項26~64のいずれか1項に記載の方法。
- ヒト細胞は、HEK293T細胞である、請求項65に記載の方法。
- 細胞は、ハムスター細胞である、請求項26~64のいずれか1項に記載の方法。
- ハムスター細胞は、チャイニーズハムスター卵巣(CHO)細胞である、請求項67に記載の方法。
- tRNAは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、請求項26~68のいずれか1項に記載の方法。
- 細胞は、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来するtRNAシンテターゼを含む、請求項26~69のいずれか1項に記載の方法。
- 非天然ポリペプチドの発現のための系であって:
(a)少なくとも1つの非天然アミノ酸;
(b)1つまたはそれ以上の第1の非天然塩基を含む少なくとも1つのコドンを含む、非天然ポリペプチドをコードするmRNA;
(c)1つまたはそれ以上の第2の非天然塩基を含む少なくとも1つのアンチコドンを含むtRNAであって、1つまたはそれ以上の第1の非天然塩基および1つまたはそれ以上の第2の非天然塩基は、1つまたはそれ以上の相補的塩基対を形成可能である、前記tRNA;ならびに
(d)tRNAおよびtRNAシンテターゼを使用してmRNAを、非天然アミノ酸を含むポリペプチドに翻訳可能な真核生物のリボソーム
を含み、
tRNAは、該非天然アミノ酸でチャージされるか、または該系はtRNAシンテターゼもしくはtRNAシンテターゼをコードする核酸配列を含む1つもしくはそれ以上の核酸構築物をさらに含み、該tRNAシンテターゼは、該tRNAを少なくとも1つの非天然アミノ酸で優先的にアミノアシル化する、前記系。 - mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第1の非天然塩基(X)は、mRNAの少なくとも1つのコドン中の第1の位置(X-N-N)に位置する、請求項71に記載の系。
- mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第1の非天然塩基(X)は、mRNAのコドン中の中央の位置(N-X-N)に位置する、請求項71に記載の系。
- mRNAの少なくとも1つのコドンは、3つの連続した核酸塩基(N-N-N)を含み;1つまたはそれ以上の第1の非天然塩基(X)は、mRNAの少なくとも1つのコドン中の最後の位置(N-N-X)に位置する、請求項71に記載の系。
- 少なくとも1つのコドンおよび少なくとも1つのアンチコドンは各々独立に、3つの連続した核酸塩基(N-N-N)を含み、該少なくとも1つのコドンは、コドンの第1の位置(X-N-N)に位置する1つまたはそれ以上の第1の非天然塩基(X)を含み、tRNA中の該少なくとも1つのアンチコドンは、アンチコドンの最後の位置(N-N-Y)に位置する1つまたはそれ以上の第2の非天然塩基(Y)を含む、請求項71に記載の系。
- mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一であるか、または異なっている、請求項91に記載の系。
- 少なくとも1つのコドンおよび少なくとも1つのアンチコドンは各々独立に、3つの連続した核酸塩基(N-N-N)を含み、mRNA中の少なくとも1つのコドンは、少なくとも1つのコドンの中央の位置(N-X-N)に位置する1つまたはそれ以上の第1の非天然塩基(X)を含み、tRNA中の少なくとも1つのアンチコドンは、アンチコドンの中央の位置(N-Y-N)に位置する1つまたはそれ以上の第2の非天然塩基(Y)を含む、請求項71に記載の系。
- mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一であるか、または異なっている、請求項96に記載の系。
- 少なくとも1つのコドンおよび少なくとも1つのアンチコドンは各々独立に、3つの連続した核酸塩基(N-N-N)を含み、mRNA中の該少なくとも1つのコドンは、少なくとも1つのコドンの最後の位置(N-N-X)に位置する1つまたはそれ以上の第1の非天然塩基(X)を含み、tRNA中の該少なくとも1つのアンチコドンは、アンチコドンの第1の位置(Y-N-N)に位置する1つまたはそれ以上の第2の非天然塩基(Y)を含む、請求項71に記載の系。
- mRNAのコドン中に位置する1つまたはそれ以上の第1の非天然塩基(X)およびtRNAのアンチコドン中に位置する1つまたはそれ以上の第2の非天然塩基(Y)は、同一であるか、または異なっている、請求項101に記載の系。
- mRNA中の少なくとも1つのコドンは、AXC、GXCまたはGXUから選択され、Xは、1つまたはそれ以上の第1の非天然塩基である、請求項71~105のいずれか1項に記載の系。
- tRNA中の少なくとも1つのアンチコドンは、GYU、GYCおよびAYCから選択され、Yは、1つまたはそれ以上の第2の非天然塩基である、請求項106に記載の系。
- mRNA中の少なくとも1つのコドンは、AXCであり、tRNA中の少なくとも1つのアンチコドンは、GYUである、請求項107に記載の系。
- mRNA中の少なくとも1つのコドンは、GXCであり、tRNA中の少なくとも1つのアンチコドンは、GYCである、請求項107に記載の系。
- mRNA中の少なくとも1つのコドンは、GXUであり、少なくとも1つのアンチコドンは、AYCである、請求項107に記載の系。
- tRNAは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、請求項71~110のいずれか1項に記載の系。
- tRNAシンテターゼは、メタノコックス・ヤンナスキイ、メタノサルシナ・バルケリ、メタノサルシナ・マゼイまたはメタノサルシナ・アセチボランスに由来する、請求項71~111のいずれか1項に記載の系。
- インビトロまたは無細胞である、請求項71~112のいずれか1項に記載の系。
- 細胞溶解物を含む、請求項71~113のいずれか1項に記載の系。
- 精製成分の、再構成された系である、請求項71~113のいずれか1項に記載の系。
- 真核細胞における、請求項71~112のいずれか1項に記載の系。
- 真核細胞は、ヒト細胞である、請求項116に記載の系。
- 真核細胞は、HEK293T細胞である、請求項116に記載の系。
- 真核細胞は、ハムスター細胞である、請求項116に記載の系。
- ハムスター細胞は、チャイニーズハムスター卵巣(CHO)細胞である、請求項119に記載の系。
- 非天然アミノ酸は:
リジンアナログである;
芳香族側鎖を含む;
アジド基を含む;
アルキン基を含む;または
アルデヒドもしくはケトン基を含む、請求項71~120のいずれか1項に記載の系。 - 非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)、N6-((プロパルギルエトキシ)-カルボニル)-L-リジン(PraK)、BCN-L-リジン、ノルボルネンリジン、TCO-リジン、メチルテトラジンリジン、アリルオキシカルボニルリジン、2-アミノ-8-オキソノナン酸、2-アミノ-8-オキソオクタン酸、p-アセチル-L-フェニルアラニン、p-アジドメチル-L-フェニルアラニン(pAMF)、p-ヨード-L-フェニルアラニン、m-アセチルフェニルアラニン、2-アミノ-8-オキソノナン酸、p-プロパルギルオキシフェニルアラニン、p-プロパルギル-フェニルアラニン、3-メチル-フェニルアラニン、L-ドパ、フッ素化フェニルアラニン、イソプロピル-L-フェニルアラニン、p-アジド-L-フェニルアラニン、p-アシル-L-フェニルアラニン、p-ベンゾイル-L-フェニルアラニン、p-ブロモフェニルアラニン、p-アミノ-L-フェニルアラニン、イソプロピル-L-フェニルアラニン、O-アリルチロシン、O-メチル-L-チロシン、O-4-アリル-L-チロシン、4-プロピル-L-チロシン、ホスホノチロシン、トリ-O-アセチル-GlcNAcp-セリン、L-ホスホセリン、ホスホノセリン、L-3-(2-ナフチル)アラニン、2-アミノ-3-((2-((3-(ベンジルオキシ)-3-オキソプロピル)アミノ)エチル)セラニル)プロパン酸、2-アミノ-3-(フェニルセラニル)プロパン酸、セレノシステイン、N6-(((2-アジドベンジル)オキシ)カルボニル)-L-リジン、N6-(((3-アジドベンジル)オキシ)カルボニル)-L-リジンおよびN6-(((4-アジドベンジル)オキシ)カルボニル)-L-リジンからなる群から選択される、請求項71~121のいずれか1項に記載の系。
- 非天然アミノ酸は、N6-((アジドエトキシ)-カルボニル)-L-リジン(AzK)である、請求項71~122のいずれか1項に記載の系。
- tRNAは、非天然アミノ酸でチャージされる、請求項71~123のいずれか1項に記載の系。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962908421P | 2019-09-30 | 2019-09-30 | |
US62/908,421 | 2019-09-30 | ||
PCT/US2020/053339 WO2021067313A1 (en) | 2019-09-30 | 2020-09-29 | Eukaryotic semi-synthetic organisms |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022549931A true JP2022549931A (ja) | 2022-11-29 |
JPWO2021067313A5 JPWO2021067313A5 (ja) | 2023-10-06 |
Family
ID=75336479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022519674A Pending JP2022549931A (ja) | 2019-09-30 | 2020-09-29 | 真核生物の半合成生物 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20220228148A1 (ja) |
EP (1) | EP4041247A4 (ja) |
JP (1) | JP2022549931A (ja) |
KR (1) | KR20220075231A (ja) |
CN (1) | CN114746099A (ja) |
AU (1) | AU2020357614A1 (ja) |
BR (1) | BR112022005330A2 (ja) |
CA (1) | CA3151762A1 (ja) |
IL (1) | IL291635A (ja) |
MX (1) | MX2022003825A (ja) |
TW (1) | TW202128994A (ja) |
WO (1) | WO2021067313A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
HUE048710T2 (hu) | 2013-08-08 | 2020-08-28 | Scripps Research Inst | Eljárás nukleinsavak in vitro helyspecifikus enzimes jelölésére nem-természetes nukleotidok beépítésével |
WO2017106767A1 (en) | 2015-12-18 | 2017-06-22 | The Scripps Research Institute | Production of unnatural nucleotides using a crispr/cas9 system |
DK3475295T3 (da) | 2016-06-24 | 2022-10-24 | Scripps Research Inst | Hidtil ukendt nukleosidtriphosphat-transportør og anvendelser deraf |
US20200131555A1 (en) | 2017-07-11 | 2020-04-30 | Synthorx, Inc. | Incorporation of unnatural nucleotides and methods thereof |
CN114207129A (zh) | 2019-06-14 | 2022-03-18 | 斯克利普斯研究所 | 用于在半合成生物体中复制、转录和翻译的试剂和方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180346901A1 (en) * | 2015-11-30 | 2018-12-06 | European Molecular Biology Laboratory | Means and methods for preparing engineered proteins by genetic code expansion in insect cells |
US20200131555A1 (en) * | 2017-07-11 | 2020-04-30 | Synthorx, Inc. | Incorporation of unnatural nucleotides and methods thereof |
EP3651774A4 (en) * | 2017-07-11 | 2021-07-07 | The Scripps Research Institute | INTEGRATION OF INNATURAL NUCLEOTIDES AND APPLICATION METHODS IN VIVO |
-
2020
- 2020-09-29 CN CN202080082837.9A patent/CN114746099A/zh active Pending
- 2020-09-29 KR KR1020227014157A patent/KR20220075231A/ko unknown
- 2020-09-29 EP EP20872617.4A patent/EP4041247A4/en active Pending
- 2020-09-29 JP JP2022519674A patent/JP2022549931A/ja active Pending
- 2020-09-29 MX MX2022003825A patent/MX2022003825A/es unknown
- 2020-09-29 TW TW109133880A patent/TW202128994A/zh unknown
- 2020-09-29 CA CA3151762A patent/CA3151762A1/en active Pending
- 2020-09-29 WO PCT/US2020/053339 patent/WO2021067313A1/en unknown
- 2020-09-29 BR BR112022005330A patent/BR112022005330A2/pt unknown
- 2020-09-29 AU AU2020357614A patent/AU2020357614A1/en active Pending
-
2022
- 2022-03-23 IL IL291635A patent/IL291635A/en unknown
- 2022-03-30 US US17/709,041 patent/US20220228148A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CA3151762A1 (en) | 2021-04-08 |
TW202128994A (zh) | 2021-08-01 |
US20220228148A1 (en) | 2022-07-21 |
EP4041247A4 (en) | 2024-03-06 |
IL291635A (en) | 2022-05-01 |
CN114746099A (zh) | 2022-07-12 |
AU2020357614A1 (en) | 2022-03-31 |
KR20220075231A (ko) | 2022-06-07 |
EP4041247A1 (en) | 2022-08-17 |
MX2022003825A (es) | 2022-05-11 |
BR112022005330A2 (pt) | 2022-08-23 |
WO2021067313A1 (en) | 2021-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240117363A1 (en) | Production of unnatural nucleotides using a crispr/cas9 system | |
US11879145B2 (en) | Reagents and methods for replication, transcription, and translation in semi-synthetic organisms | |
JP2022549931A (ja) | 真核生物の半合成生物 | |
US20220243244A1 (en) | Compositions and methods for in vivo synthesis of unnatural polypeptides | |
US20200010835A1 (en) | Incorporation of unnatural amino acids into proteins using base editing | |
US20200024597A1 (en) | Incorporation of unnatural nucleotides and methods thereof | |
JP7429642B2 (ja) | 非天然塩基対組成物および使用の方法 | |
US20230392140A1 (en) | Reverse transcription of polynucleotides comprising unnatural nucleotides | |
RU2799441C2 (ru) | Композиции на основе неприродных пар оснований и способы их применения |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230928 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240903 |