BRPI0711811A2 - aminoácidos de cumarina fluorescente geneticamente codificados - Google Patents
aminoácidos de cumarina fluorescente geneticamente codificados Download PDFInfo
- Publication number
- BRPI0711811A2 BRPI0711811A2 BRPI0711811-2A BRPI0711811A BRPI0711811A2 BR PI0711811 A2 BRPI0711811 A2 BR PI0711811A2 BR PI0711811 A BRPI0711811 A BR PI0711811A BR PI0711811 A2 BRPI0711811 A2 BR PI0711811A2
- Authority
- BR
- Brazil
- Prior art keywords
- trna
- amino acid
- unnatural amino
- translation system
- protein
- Prior art date
Links
- -1 coumarin amino acids Chemical class 0.000 title abstract description 32
- ZYGHJZDHTFUPRJ-UHFFFAOYSA-N benzo-alpha-pyrone Natural products C1=CC=C2OC(=O)C=CC2=C1 ZYGHJZDHTFUPRJ-UHFFFAOYSA-N 0.000 title abstract description 17
- 229960000956 coumarin Drugs 0.000 title abstract description 10
- 235000001671 coumarin Nutrition 0.000 title abstract description 10
- 150000001413 amino acids Chemical class 0.000 claims abstract description 399
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 238
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 212
- 238000000034 method Methods 0.000 claims abstract description 157
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 claims abstract description 71
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 claims abstract description 71
- 241000588724 Escherichia coli Species 0.000 claims abstract description 35
- QEQAKQQRJFWPOR-JTQLQIEISA-N (2s)-2-amino-4-(7-hydroxy-2-oxochromen-4-yl)butanoic acid Chemical compound C1=C(O)C=CC2=C1OC(=O)C=C2CC[C@H](N)C(O)=O QEQAKQQRJFWPOR-JTQLQIEISA-N 0.000 claims abstract description 29
- 238000004519 manufacturing process Methods 0.000 claims abstract description 24
- 241001112695 Clostridiales Species 0.000 claims abstract description 17
- 108020004705 Codon Proteins 0.000 claims description 205
- 108091033319 polynucleotide Proteins 0.000 claims description 127
- 102000040430 polynucleotide Human genes 0.000 claims description 127
- 239000002157 polynucleotide Substances 0.000 claims description 126
- 238000013519 translation Methods 0.000 claims description 114
- 150000007523 nucleic acids Chemical class 0.000 claims description 98
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 93
- 102000039446 nucleic acids Human genes 0.000 claims description 91
- 108020004707 nucleic acids Proteins 0.000 claims description 91
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 91
- 229920001184 polypeptide Polymers 0.000 claims description 90
- 239000000203 mixture Substances 0.000 claims description 53
- 238000010348 incorporation Methods 0.000 claims description 43
- 239000013598 vector Substances 0.000 claims description 28
- 125000000266 alpha-aminoacyl group Chemical group 0.000 claims description 23
- 230000004044 response Effects 0.000 claims description 23
- 108091060545 Nonsense suppressor Proteins 0.000 claims description 19
- 125000003729 nucleotide group Chemical group 0.000 claims description 15
- 241000203407 Methanocaldococcus jannaschii Species 0.000 claims description 14
- 239000002773 nucleotide Substances 0.000 claims description 14
- 101710146427 Probable tyrosine-tRNA ligase, cytoplasmic Proteins 0.000 claims description 13
- 101710107268 Tyrosine-tRNA ligase, mitochondrial Proteins 0.000 claims description 13
- 102000018378 Tyrosine-tRNA ligase Human genes 0.000 claims description 11
- 238000002741 site-directed mutagenesis Methods 0.000 claims description 9
- 239000013604 expression vector Substances 0.000 claims description 7
- 230000000689 aminoacylating effect Effects 0.000 claims description 4
- 102000003960 Ligases Human genes 0.000 abstract description 67
- 108090000364 Ligases Proteins 0.000 abstract description 67
- 235000001014 amino acid Nutrition 0.000 description 389
- 229940024606 amino acid Drugs 0.000 description 383
- 210000004027 cell Anatomy 0.000 description 194
- 235000018102 proteins Nutrition 0.000 description 190
- 230000014616 translation Effects 0.000 description 96
- 239000003550 marker Substances 0.000 description 53
- 238000001727 in vivo Methods 0.000 description 50
- GJWPWSOZYVBLGF-UHFFFAOYSA-N 2-(ethylamino)acetic acid;7-hydroxychromen-2-one Chemical compound CCNCC(O)=O.C1=CC(=O)OC2=CC(O)=CC=C21 GJWPWSOZYVBLGF-UHFFFAOYSA-N 0.000 description 45
- 230000002068 genetic effect Effects 0.000 description 43
- 108020004566 Transfer RNA Proteins 0.000 description 40
- 230000001629 suppression Effects 0.000 description 40
- 102000004190 Enzymes Human genes 0.000 description 33
- 108090000790 Enzymes Proteins 0.000 description 33
- 229940088598 enzyme Drugs 0.000 description 32
- 238000002703 mutagenesis Methods 0.000 description 32
- 231100000350 mutagenesis Toxicity 0.000 description 32
- 125000003275 alpha amino acid group Chemical group 0.000 description 31
- 239000000523 sample Substances 0.000 description 30
- 241000894006 Bacteria Species 0.000 description 29
- 108020004414 DNA Proteins 0.000 description 28
- 241000894007 species Species 0.000 description 28
- 238000009396 hybridization Methods 0.000 description 27
- 238000000338 in vitro Methods 0.000 description 27
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 26
- 230000000295 complement effect Effects 0.000 description 24
- 238000003786 synthesis reaction Methods 0.000 description 23
- 230000015572 biosynthetic process Effects 0.000 description 21
- 230000000694 effects Effects 0.000 description 21
- 108020005038 Terminator Codon Proteins 0.000 description 20
- 239000013612 plasmid Substances 0.000 description 20
- 230000035772 mutation Effects 0.000 description 19
- 230000008569 process Effects 0.000 description 18
- 102100030856 Myoglobin Human genes 0.000 description 17
- 108010062374 Myoglobin Proteins 0.000 description 17
- 230000014509 gene expression Effects 0.000 description 17
- 230000006870 function Effects 0.000 description 16
- 238000012360 testing method Methods 0.000 description 16
- 238000006467 substitution reaction Methods 0.000 description 15
- 239000000126 substance Substances 0.000 description 14
- 238000003556 assay Methods 0.000 description 13
- 239000004202 carbamide Substances 0.000 description 13
- 230000001965 increasing effect Effects 0.000 description 13
- 229960004441 tyrosine Drugs 0.000 description 13
- 235000002374 tyrosine Nutrition 0.000 description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 description 11
- 239000002609 medium Substances 0.000 description 11
- 239000000758 substrate Substances 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 230000006229 amino acid addition Effects 0.000 description 10
- 238000013459 approach Methods 0.000 description 10
- 239000003795 chemical substances by application Substances 0.000 description 10
- 230000001225 therapeutic effect Effects 0.000 description 10
- 241000203069 Archaea Species 0.000 description 9
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 9
- 241000700605 Viruses Species 0.000 description 9
- 229960005091 chloramphenicol Drugs 0.000 description 9
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 9
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 8
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 8
- 241000206602 Eukaryota Species 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 230000003115 biocidal effect Effects 0.000 description 8
- 230000001851 biosynthetic effect Effects 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 108020005098 Anticodon Proteins 0.000 description 7
- 108010016529 Bacillus amyloliquefaciens ribonuclease Proteins 0.000 description 7
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 7
- 238000007792 addition Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 101150066555 lacZ gene Proteins 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 238000012216 screening Methods 0.000 description 7
- 230000035945 sensitivity Effects 0.000 description 7
- 241000238631 Hexapoda Species 0.000 description 6
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 6
- 229960000723 ampicillin Drugs 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 229910052739 hydrogen Inorganic materials 0.000 description 6
- 239000001257 hydrogen Substances 0.000 description 6
- 238000010369 molecular cloning Methods 0.000 description 6
- 235000008729 phenylalanine Nutrition 0.000 description 6
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 6
- 231100000331 toxic Toxicity 0.000 description 6
- 230000002588 toxic effect Effects 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 5
- 241000233866 Fungi Species 0.000 description 5
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 5
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 5
- 108020004485 Nonsense Codon Proteins 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- 108010005774 beta-Galactosidase Proteins 0.000 description 5
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 230000002255 enzymatic effect Effects 0.000 description 5
- 210000003527 eukaryotic cell Anatomy 0.000 description 5
- 239000003262 industrial enzyme Substances 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000007899 nucleic acid hybridization Methods 0.000 description 5
- 238000002708 random mutagenesis Methods 0.000 description 5
- 102000005962 receptors Human genes 0.000 description 5
- 108020003175 receptors Proteins 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000005215 recombination Methods 0.000 description 5
- 239000002904 solvent Substances 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 150000003668 tyrosines Chemical class 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 244000105975 Antidesma platyphyllum Species 0.000 description 4
- 244000063299 Bacillus subtilis Species 0.000 description 4
- 235000014469 Bacillus subtilis Nutrition 0.000 description 4
- 241000195493 Cryptophyta Species 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 4
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 4
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 4
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 4
- AFVFQIVMOAPDHO-UHFFFAOYSA-N Methanesulfonic acid Chemical compound CS(O)(=O)=O AFVFQIVMOAPDHO-UHFFFAOYSA-N 0.000 description 4
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 4
- 241000205101 Sulfolobus Species 0.000 description 4
- 239000004098 Tetracycline Substances 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 238000010521 absorption reaction Methods 0.000 description 4
- 235000008206 alpha-amino acids Nutrition 0.000 description 4
- 239000003242 anti bacterial agent Substances 0.000 description 4
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 4
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 4
- 102000005936 beta-Galactosidase Human genes 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 229940126864 fibroblast growth factor Drugs 0.000 description 4
- 230000037433 frameshift Effects 0.000 description 4
- 150000002308 glutamine derivatives Chemical class 0.000 description 4
- 235000009424 haa Nutrition 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 239000013641 positive control Substances 0.000 description 4
- GHMLBKRAJCXXBS-UHFFFAOYSA-N resorcinol Chemical compound OC1=CC=CC(O)=C1 GHMLBKRAJCXXBS-UHFFFAOYSA-N 0.000 description 4
- 125000001424 substituent group Chemical group 0.000 description 4
- 229960002180 tetracycline Drugs 0.000 description 4
- 229930101283 tetracycline Natural products 0.000 description 4
- 235000019364 tetracycline Nutrition 0.000 description 4
- 150000003522 tetracyclines Chemical class 0.000 description 4
- 239000003053 toxin Substances 0.000 description 4
- 231100000765 toxin Toxicity 0.000 description 4
- 108700012359 toxins Proteins 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- ORHBXUUXSCNDEV-UHFFFAOYSA-N umbelliferone Chemical group C1=CC(=O)OC2=CC(O)=CC=C21 ORHBXUUXSCNDEV-UHFFFAOYSA-N 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 210000005253 yeast cell Anatomy 0.000 description 4
- CJIJXIFQYOPWTF-UHFFFAOYSA-N 7-hydroxycoumarin Natural products O1C(=O)C=CC2=CC(O)=CC=C21 CJIJXIFQYOPWTF-UHFFFAOYSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 241000283153 Cetacea Species 0.000 description 3
- WHUUTDBJXJRKMK-GSVOUGTGSA-N D-glutamic acid Chemical compound OC(=O)[C@H](N)CCC(O)=O WHUUTDBJXJRKMK-GSVOUGTGSA-N 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 3
- 102000003972 Fibroblast growth factor 7 Human genes 0.000 description 3
- 108090000385 Fibroblast growth factor 7 Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 241000205062 Halobacterium Species 0.000 description 3
- 101000611183 Homo sapiens Tumor necrosis factor Proteins 0.000 description 3
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 3
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 3
- 108010063738 Interleukins Proteins 0.000 description 3
- 102000015696 Interleukins Human genes 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 241000204641 Methanopyrus kandleri Species 0.000 description 3
- 108010021466 Mutant Proteins Proteins 0.000 description 3
- 102000008300 Mutant Proteins Human genes 0.000 description 3
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 3
- 102100040247 Tumor necrosis factor Human genes 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 238000000862 absorption spectrum Methods 0.000 description 3
- 150000001371 alpha-amino acids Chemical class 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 235000009697 arginine Nutrition 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000002983 circular dichroism Methods 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 125000000332 coumarinyl group Chemical group O1C(=O)C(=CC2=CC=CC=C12)* 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 3
- 229960002989 glutamic acid Drugs 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 238000003018 immunoassay Methods 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 230000002757 inflammatory effect Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000004949 mass spectrometry Methods 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 239000002853 nucleic acid probe Substances 0.000 description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 3
- 229960005190 phenylalanine Drugs 0.000 description 3
- 150000002994 phenylalanines Chemical class 0.000 description 3
- 229920000570 polyether Polymers 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 210000003705 ribosome Anatomy 0.000 description 3
- 102220058103 rs730881660 Human genes 0.000 description 3
- 102200021347 rs876659329 Human genes 0.000 description 3
- 239000012064 sodium phosphate buffer Substances 0.000 description 3
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 3
- VXSPZNAQGCYYFK-NRFANRHFSA-N 1-o-benzyl 7-o-ethyl (2s)-5-oxo-2-(phenylmethoxycarbonylamino)heptanedioate Chemical compound N([C@@H](CCC(=O)CC(=O)OCC)C(=O)OCC=1C=CC=CC=1)C(=O)OCC1=CC=CC=C1 VXSPZNAQGCYYFK-NRFANRHFSA-N 0.000 description 2
- 238000005160 1H NMR spectroscopy Methods 0.000 description 2
- UUPIEOQEZQQKJN-UHFFFAOYSA-N 2-(ethylamino)acetic acid;3-hydroxychromen-2-one Chemical compound CCNCC(O)=O.C1=CC=C2OC(=O)C(O)=CC2=C1 UUPIEOQEZQQKJN-UHFFFAOYSA-N 0.000 description 2
- FBTSQILOGYXGMD-LURJTMIESA-N 3-nitro-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C([N+]([O-])=O)=C1 FBTSQILOGYXGMD-LURJTMIESA-N 0.000 description 2
- CMUHFUGDYMFHEI-QMMMGPOBSA-N 4-amino-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-QMMMGPOBSA-N 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 108010029697 CD40 Ligand Proteins 0.000 description 2
- 102100032937 CD40 ligand Human genes 0.000 description 2
- 101100177112 Caenorhabditis elegans his-70 gene Proteins 0.000 description 2
- 102000007644 Colony-Stimulating Factors Human genes 0.000 description 2
- 108010071942 Colony-Stimulating Factors Proteins 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 102100034221 Growth-regulated alpha protein Human genes 0.000 description 2
- 241000204991 Haloferax Species 0.000 description 2
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 2
- 102100021866 Hepatocyte growth factor Human genes 0.000 description 2
- 101001069921 Homo sapiens Growth-regulated alpha protein Proteins 0.000 description 2
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 2
- 102000014429 Insulin-like growth factor Human genes 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- WTDRDQBEARUVNC-LURJTMIESA-N L-DOPA Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-LURJTMIESA-N 0.000 description 2
- WTDRDQBEARUVNC-UHFFFAOYSA-N L-Dopa Natural products OC(=O)C(N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-UHFFFAOYSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- ZFOMKMMPBOQKMC-KXUCPTDWSA-N L-pyrrolysine Chemical compound C[C@@H]1CC=N[C@H]1C(=O)NCCCC[C@H]([NH3+])C([O-])=O ZFOMKMMPBOQKMC-KXUCPTDWSA-N 0.000 description 2
- ZKZBPNGNEQAJSX-REOHCLBHSA-N L-selenocysteine Chemical compound [SeH]C[C@H](N)C(O)=O ZKZBPNGNEQAJSX-REOHCLBHSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 241000202974 Methanobacterium Species 0.000 description 2
- 241000203353 Methanococcus Species 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 239000004721 Polyphenylene oxide Substances 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 102000019197 Superoxide Dismutase Human genes 0.000 description 2
- 108010012715 Superoxide dismutase Proteins 0.000 description 2
- MUMGGOZAMZWBJJ-DYKIIFRCSA-N Testostosterone Chemical compound O=C1CC[C@]2(C)[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 MUMGGOZAMZWBJJ-DYKIIFRCSA-N 0.000 description 2
- 241000204667 Thermoplasma Species 0.000 description 2
- 241000589596 Thermus Species 0.000 description 2
- 241000589499 Thermus thermophilus Species 0.000 description 2
- HEDRZPFGACZZDS-MICDWDOJSA-N Trichloro(2H)methane Chemical compound [2H]C(Cl)(Cl)Cl HEDRZPFGACZZDS-MICDWDOJSA-N 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- 108060008683 Tumor Necrosis Factor Receptor Proteins 0.000 description 2
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 2
- 102100025336 Tyrosine-tRNA ligase, mitochondrial Human genes 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 125000000304 alkynyl group Chemical group 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 238000003149 assay kit Methods 0.000 description 2
- 230000001746 atrial effect Effects 0.000 description 2
- 238000003573 beta galactosidase reporter gene assay Methods 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- PFKFTWBEEFSNDU-UHFFFAOYSA-N carbonyldiimidazole Chemical compound C1=CN=CN1C(=O)N1C=CN=C1 PFKFTWBEEFSNDU-UHFFFAOYSA-N 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 210000002421 cell wall Anatomy 0.000 description 2
- 210000004671 cell-free system Anatomy 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 238000000119 electrospray ionisation mass spectrum Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 108091006047 fluorescent proteins Proteins 0.000 description 2
- 102000034287 fluorescent proteins Human genes 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 235000004554 glutamine Nutrition 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- 229930195733 hydrocarbon Natural products 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 229940047122 interleukins Drugs 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 125000000468 ketone group Chemical group 0.000 description 2
- 238000011005 laboratory method Methods 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 150000002632 lipids Chemical group 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 238000001819 mass spectrum Methods 0.000 description 2
- 238000012269 metabolic engineering Methods 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Chemical group 0.000 description 2
- 229940098779 methanesulfonic acid Drugs 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 238000001823 molecular biology technique Methods 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical class CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 description 2
- 210000000633 nuclear envelope Anatomy 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 231100000590 oncogenic Toxicity 0.000 description 2
- 230000002246 oncogenic effect Effects 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 2
- 150000003147 proline derivatives Chemical class 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 102220224455 rs750260438 Human genes 0.000 description 2
- 235000016491 selenocysteine Nutrition 0.000 description 2
- 229940055619 selenocysteine Drugs 0.000 description 2
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 108091006106 transcriptional activators Proteins 0.000 description 2
- 102000003298 tumor necrosis factor receptor Human genes 0.000 description 2
- 150000003667 tyrosine derivatives Chemical class 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 238000004804 winding Methods 0.000 description 2
- DNIAPMSPPWPWGF-VKHMYHEASA-N (+)-propylene glycol Chemical compound C[C@H](O)CO DNIAPMSPPWPWGF-VKHMYHEASA-N 0.000 description 1
- OGNSCSPNOLGXSM-UHFFFAOYSA-N (+/-)-DABA Natural products NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 1
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- RWLSBXBFZHDHHX-VIFPVBQESA-N (2s)-2-(naphthalen-2-ylamino)propanoic acid Chemical compound C1=CC=CC2=CC(N[C@@H](C)C(O)=O)=CC=C21 RWLSBXBFZHDHHX-VIFPVBQESA-N 0.000 description 1
- VFCYASLQFGXHTQ-VIFPVBQESA-N (2s)-2-[benzyl(nitro)amino]-3-hydroxypropanoic acid Chemical compound OC[C@@H](C(O)=O)N([N+]([O-])=O)CC1=CC=CC=C1 VFCYASLQFGXHTQ-VIFPVBQESA-N 0.000 description 1
- YYTDJPUFAVPHQA-VKHMYHEASA-N (2s)-2-amino-3-(2,3,4,5,6-pentafluorophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=C(F)C(F)=C(F)C(F)=C1F YYTDJPUFAVPHQA-VKHMYHEASA-N 0.000 description 1
- KQZQZOQFUQXPLW-YFKPBYRVSA-N (2s)-2-amino-3-(3,4,5-trihydroxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC(O)=C(O)C(O)=C1 KQZQZOQFUQXPLW-YFKPBYRVSA-N 0.000 description 1
- POGSZHUEECCEAP-ZETCQYMHSA-N (2s)-2-amino-3-(3-amino-4-hydroxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(N)=C1 POGSZHUEECCEAP-ZETCQYMHSA-N 0.000 description 1
- PEMUHKUIQHFMTH-QMMMGPOBSA-N (2s)-2-amino-3-(4-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Br)C=C1 PEMUHKUIQHFMTH-QMMMGPOBSA-N 0.000 description 1
- JSXMFBNJRFXRCX-NSHDSACASA-N (2s)-2-amino-3-(4-prop-2-ynoxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OCC#C)C=C1 JSXMFBNJRFXRCX-NSHDSACASA-N 0.000 description 1
- LJHYWUVYIKCPGU-VIFPVBQESA-N (2s)-2-amino-3-[4-(carboxymethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(CC(O)=O)C=C1 LJHYWUVYIKCPGU-VIFPVBQESA-N 0.000 description 1
- NEMHIKRLROONTL-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(4-azidophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N=[N+]=[N-])C=C1 NEMHIKRLROONTL-QMMMGPOBSA-N 0.000 description 1
- GTVVZTAFGPQSPC-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(4-nitrophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=C([N+]([O-])=O)C=C1 GTVVZTAFGPQSPC-QMMMGPOBSA-N 0.000 description 1
- ZXSBHXZKWRIEIA-JTQLQIEISA-N (2s)-3-(4-acetylphenyl)-2-azaniumylpropanoate Chemical compound CC(=O)C1=CC=C(C[C@H](N)C(O)=O)C=C1 ZXSBHXZKWRIEIA-JTQLQIEISA-N 0.000 description 1
- BNIFSVVAHBLNTN-XKKUQSFHSA-N (2s)-4-amino-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-1-[(2s)-4-amino-2-[[2-[[(2s)-2-[[(2s)-2-[[(2s)-1-[(2s)-6-amino-2-[[(2s)-2-[[(2s)-2-[[(2s,3r)-2-amino-3-hydroxybutanoyl]amino]-4-methylsulfanylbutanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]hexan Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N1[C@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O)CCC1 BNIFSVVAHBLNTN-XKKUQSFHSA-N 0.000 description 1
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 1
- 108010052418 (N-(2-((4-((2-((4-(9-acridinylamino)phenyl)amino)-2-oxoethyl)amino)-4-oxobutyl)amino)-1-(1H-imidazol-4-ylmethyl)-1-oxoethyl)-6-(((-2-aminoethyl)amino)methyl)-2-pyridinecarboxamidato) iron(1+) Proteins 0.000 description 1
- YPFDHNVEDLHUCE-UHFFFAOYSA-N 1,3-propanediol Substances OCCCO YPFDHNVEDLHUCE-UHFFFAOYSA-N 0.000 description 1
- 229940035437 1,3-propanediol Drugs 0.000 description 1
- RXMWXENJQAINCC-DMTCNVIQSA-N 2,5-didehydro-D-gluconic acid Chemical compound OCC(=O)[C@@H](O)[C@H](O)C(=O)C(O)=O RXMWXENJQAINCC-DMTCNVIQSA-N 0.000 description 1
- RXMWXENJQAINCC-UHFFFAOYSA-N 2,5-diketo-D-gluconic acid Natural products OCC(=O)C(O)C(O)C(=O)C(O)=O RXMWXENJQAINCC-UHFFFAOYSA-N 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- JZRBSTONIYRNRI-VIFPVBQESA-N 3-methylphenylalanine Chemical compound CC1=CC=CC(C[C@H](N)C(O)=O)=C1 JZRBSTONIYRNRI-VIFPVBQESA-N 0.000 description 1
- IRZQDMYEJPNDEN-UHFFFAOYSA-N 3-phenyl-2-aminobutanoic acid Natural products OC(=O)C(N)C(C)C1=CC=CC=C1 IRZQDMYEJPNDEN-UHFFFAOYSA-N 0.000 description 1
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 1
- PZNQZSRPDOEBMS-QMMMGPOBSA-N 4-iodo-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(I)C=C1 PZNQZSRPDOEBMS-QMMMGPOBSA-N 0.000 description 1
- GTVVZTAFGPQSPC-UHFFFAOYSA-N 4-nitrophenylalanine Chemical compound OC(=O)C(N)CC1=CC=C([N+]([O-])=O)C=C1 GTVVZTAFGPQSPC-UHFFFAOYSA-N 0.000 description 1
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 1
- PQSUYGKTWSAVDQ-UHFFFAOYSA-N Aldosterone Natural products C1CC2C3CCC(C(=O)CO)C3(C=O)CC(O)C2C2(C)C1=CC(=O)CC2 PQSUYGKTWSAVDQ-UHFFFAOYSA-N 0.000 description 1
- PQSUYGKTWSAVDQ-ZVIOFETBSA-N Aldosterone Chemical compound C([C@@]1([C@@H](C(=O)CO)CC[C@H]1[C@@H]1CC2)C=O)[C@H](O)[C@@H]1[C@]1(C)C2=CC(=O)CC1 PQSUYGKTWSAVDQ-ZVIOFETBSA-N 0.000 description 1
- 102100040121 Allograft inflammatory factor 1 Human genes 0.000 description 1
- 241000004176 Alphacoronavirus Species 0.000 description 1
- 108700023418 Amidases Proteins 0.000 description 1
- 102000004092 Amidohydrolases Human genes 0.000 description 1
- 108090000531 Amidohydrolases Proteins 0.000 description 1
- 102000006534 Amino Acid Isomerases Human genes 0.000 description 1
- 108010008830 Amino Acid Isomerases Proteins 0.000 description 1
- 102400000068 Angiostatin Human genes 0.000 description 1
- 108010079709 Angiostatins Proteins 0.000 description 1
- 102000007592 Apolipoproteins Human genes 0.000 description 1
- 108010071619 Apolipoproteins Proteins 0.000 description 1
- 108010083590 Apoproteins Proteins 0.000 description 1
- 102000006410 Apoproteins Human genes 0.000 description 1
- OZDNDGXASTWERN-CTNGQTDRSA-N Apovincamine Chemical compound C1=CC=C2C(CCN3CCC4)=C5[C@@H]3[C@]4(CC)C=C(C(=O)OC)N5C2=C1 OZDNDGXASTWERN-CTNGQTDRSA-N 0.000 description 1
- 101100275159 Arabidopsis thaliana COBL7 gene Proteins 0.000 description 1
- 101100180341 Arabidopsis thaliana IWS1 gene Proteins 0.000 description 1
- 241000205042 Archaeoglobus fulgidus Species 0.000 description 1
- 241000712891 Arenavirus Species 0.000 description 1
- 241000238421 Arthropoda Species 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 101800001288 Atrial natriuretic factor Proteins 0.000 description 1
- 102400001282 Atrial natriuretic peptide Human genes 0.000 description 1
- 101800001890 Atrial natriuretic peptide Proteins 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 102100023703 C-C motif chemokine 15 Human genes 0.000 description 1
- 101710155857 C-C motif chemokine 2 Proteins 0.000 description 1
- 102100032366 C-C motif chemokine 7 Human genes 0.000 description 1
- 102100036150 C-X-C motif chemokine 5 Human genes 0.000 description 1
- 102100036153 C-X-C motif chemokine 6 Human genes 0.000 description 1
- 101710085504 C-X-C motif chemokine 6 Proteins 0.000 description 1
- 102000001902 CC Chemokines Human genes 0.000 description 1
- 108010040471 CC Chemokines Proteins 0.000 description 1
- 108700012434 CCL3 Proteins 0.000 description 1
- DFVYOEWFOJYXQS-UHFFFAOYSA-N CC[K].OC(=O)CC(O)=O Chemical compound CC[K].OC(=O)CC(O)=O DFVYOEWFOJYXQS-UHFFFAOYSA-N 0.000 description 1
- 101150013553 CD40 gene Proteins 0.000 description 1
- 102100032912 CD44 antigen Human genes 0.000 description 1
- 108050006947 CXC Chemokine Proteins 0.000 description 1
- 102000019388 CXC chemokine Human genes 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 102000055006 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 102000000018 Chemokine CCL2 Human genes 0.000 description 1
- 102000000013 Chemokine CCL3 Human genes 0.000 description 1
- 108010055124 Chemokine CCL7 Proteins 0.000 description 1
- 102000000012 Chemokine CCL8 Human genes 0.000 description 1
- 108010055204 Chemokine CCL8 Proteins 0.000 description 1
- 241000223782 Ciliophora Species 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 102100023804 Coagulation factor VII Human genes 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 241000557626 Corvus corax Species 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 239000004971 Cross linker Substances 0.000 description 1
- PQMOXTJVIYEOQL-UHFFFAOYSA-N Cumarin Natural products CC(C)=CCC1=C(O)C(C(=O)C(C)CC)=C(O)C2=C1OC(=O)C=C2CCC PQMOXTJVIYEOQL-UHFFFAOYSA-N 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 1
- LEVWYRKDKASIDU-QWWZWVQMSA-N D-cystine Chemical compound OC(=O)[C@H](N)CSSC[C@@H](N)C(O)=O LEVWYRKDKASIDU-QWWZWVQMSA-N 0.000 description 1
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 description 1
- 229930195713 D-glutamate Natural products 0.000 description 1
- YAHZABJORDUQGO-NQXXGFSBSA-N D-ribulose 1,5-bisphosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)C(=O)COP(O)(O)=O YAHZABJORDUQGO-NQXXGFSBSA-N 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 101710141836 DNA-binding protein HU homolog Proteins 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 101100326341 Drosophila melanogaster brun gene Proteins 0.000 description 1
- 241000224431 Entamoeba Species 0.000 description 1
- 101710104662 Enterotoxin type C-3 Proteins 0.000 description 1
- 102400001368 Epidermal growth factor Human genes 0.000 description 1
- 101800003838 Epidermal growth factor Proteins 0.000 description 1
- 108020002908 Epoxide hydrolase Proteins 0.000 description 1
- 102000005486 Epoxide hydrolase Human genes 0.000 description 1
- 241001125671 Eretmochelys imbricata Species 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 102100031939 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 101001039702 Escherichia coli (strain K12) Methyl-accepting chemotaxis protein I Proteins 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 102100030844 Exocyst complex component 1 Human genes 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 108010023321 Factor VII Proteins 0.000 description 1
- 108010014173 Factor X Proteins 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 102100037362 Fibronectin Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 108090000331 Firefly luciferases Proteins 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 101150066002 GFP gene Proteins 0.000 description 1
- 102100040837 Galactoside alpha-(1,2)-fucosyltransferase 2 Human genes 0.000 description 1
- 101710115997 Gamma-tubulin complex component 2 Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241000224466 Giardia Species 0.000 description 1
- 102000004547 Glucosylceramidase Human genes 0.000 description 1
- 108010017544 Glucosylceramidase Proteins 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 102000006771 Gonadotropins Human genes 0.000 description 1
- 108010086677 Gonadotropins Proteins 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 241000204933 Haloferax volcanii Species 0.000 description 1
- 108090000031 Hedgehog Proteins Proteins 0.000 description 1
- 102000003693 Hedgehog Proteins Human genes 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 102000007625 Hirudins Human genes 0.000 description 1
- 108010007267 Hirudins Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000978376 Homo sapiens C-C motif chemokine 15 Proteins 0.000 description 1
- 101000947186 Homo sapiens C-X-C motif chemokine 5 Proteins 0.000 description 1
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 1
- 101000893710 Homo sapiens Galactoside alpha-(1,2)-fucosyltransferase 2 Proteins 0.000 description 1
- 101000582320 Homo sapiens Neurogenic differentiation factor 6 Proteins 0.000 description 1
- 101000973997 Homo sapiens Nucleosome assembly protein 1-like 4 Proteins 0.000 description 1
- 101000947178 Homo sapiens Platelet basic protein Proteins 0.000 description 1
- 101001091094 Homo sapiens Prorelaxin H1 Proteins 0.000 description 1
- 101000652229 Homo sapiens Suppressor of cytokine signaling 7 Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 241000598436 Human T-cell lymphotropic virus Species 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 101150000378 IML1 gene Proteins 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 235000000177 Indigofera tinctoria Nutrition 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 1
- 102000048143 Insulin-Like Growth Factor II Human genes 0.000 description 1
- 108090001117 Insulin-Like Growth Factor II Proteins 0.000 description 1
- 102100022339 Integrin alpha-L Human genes 0.000 description 1
- 108010008212 Integrin alpha4beta1 Proteins 0.000 description 1
- 108010064593 Intercellular Adhesion Molecule-1 Proteins 0.000 description 1
- 102100037877 Intercellular adhesion molecule 1 Human genes 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 108090001007 Interleukin-8 Proteins 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 229930194542 Keto Natural products 0.000 description 1
- 102100020880 Kit ligand Human genes 0.000 description 1
- 101710177504 Kit ligand Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108010001831 LDL receptors Proteins 0.000 description 1
- 102000010445 Lactoferrin Human genes 0.000 description 1
- 108010063045 Lactoferrin Proteins 0.000 description 1
- 241000222722 Leishmania <genus> Species 0.000 description 1
- 102000004058 Leukemia inhibitory factor Human genes 0.000 description 1
- 108090000581 Leukemia inhibitory factor Proteins 0.000 description 1
- 108010054320 Lignin peroxidase Proteins 0.000 description 1
- 101710155614 Ligninase A Proteins 0.000 description 1
- 101710155621 Ligninase B Proteins 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 108010064548 Lymphocyte Function-Associated Antigen-1 Proteins 0.000 description 1
- OFOBLEOULBTSOW-UHFFFAOYSA-L Malonate Chemical compound [O-]C(=O)CC([O-])=O OFOBLEOULBTSOW-UHFFFAOYSA-L 0.000 description 1
- 102100027754 Mast/stem cell growth factor receptor Kit Human genes 0.000 description 1
- FSOGIJPGPZWNGO-UHFFFAOYSA-N Meomammein Natural products CCC(C)C(=O)C1=C(O)C(CC=C(C)C)=C(O)C2=C1OC(=O)C=C2CCC FSOGIJPGPZWNGO-UHFFFAOYSA-N 0.000 description 1
- 241000205274 Methanosarcina mazei Species 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 1
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 1
- 101710174628 Modulating protein YmoA Proteins 0.000 description 1
- 241001430197 Mollicutes Species 0.000 description 1
- 231100000678 Mycotoxin Toxicity 0.000 description 1
- 101100301239 Myxococcus xanthus recA1 gene Proteins 0.000 description 1
- YPIGGYHFMKJNKV-UHFFFAOYSA-N N-ethylglycine Chemical compound CC[NH2+]CC([O-])=O YPIGGYHFMKJNKV-UHFFFAOYSA-N 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 102100030589 Neurogenic differentiation factor 6 Human genes 0.000 description 1
- 108010033272 Nitrilase Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- GEYBMYRBIABFTA-VIFPVBQESA-N O-methyl-L-tyrosine Chemical compound COC1=CC=C(C[C@H](N)C(O)=O)C=C1 GEYBMYRBIABFTA-VIFPVBQESA-N 0.000 description 1
- 102000004140 Oncostatin M Human genes 0.000 description 1
- 108090000630 Oncostatin M Proteins 0.000 description 1
- 101000879482 Oryza sativa subsp. japonica Sucrose synthase 2 Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 108090000417 Oxygenases Proteins 0.000 description 1
- 102000004020 Oxygenases Human genes 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 241000384537 Phacus Species 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 108010064851 Plant Proteins Proteins 0.000 description 1
- 231100000742 Plant toxin Toxicity 0.000 description 1
- 102100036154 Platelet basic protein Human genes 0.000 description 1
- 208000000474 Poliomyelitis Diseases 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 102100034945 Prorelaxin H1 Human genes 0.000 description 1
- 101710132457 Protein A1 Proteins 0.000 description 1
- 101710132570 Protein G1 Proteins 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 102000016971 Proto-Oncogene Proteins c-kit Human genes 0.000 description 1
- 108010014608 Proto-Oncogene Proteins c-kit Proteins 0.000 description 1
- 241000736843 Pyrobaculum aerophilum Species 0.000 description 1
- 241000522615 Pyrococcus horikoshii Species 0.000 description 1
- ASNFTDCKZKHJSW-REOHCLBHSA-N Quisqualic acid Chemical class OC(=O)[C@@H](N)CN1OC(=O)NC1=O ASNFTDCKZKHJSW-REOHCLBHSA-N 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 102000004879 Racemases and epimerases Human genes 0.000 description 1
- 108090001066 Racemases and epimerases Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000702263 Reovirus sp. Species 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 101150005224 SBH1 gene Proteins 0.000 description 1
- 101150081509 SLC16A10 gene Proteins 0.000 description 1
- 101100256357 Schizosaccharomyces pombe (strain 972 / ATCC 24843) seb1 gene Proteins 0.000 description 1
- 102100023781 Selenoprotein N Human genes 0.000 description 1
- 206010040070 Septic Shock Diseases 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 101710138331 Somatostatin-1 Proteins 0.000 description 1
- 101710128967 Somatotropin-1 Proteins 0.000 description 1
- 101000882403 Staphylococcus aureus Enterotoxin type C-2 Proteins 0.000 description 1
- 101001057112 Staphylococcus aureus Enterotoxin type D Proteins 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 102000005158 Subtilisins Human genes 0.000 description 1
- 108010056079 Subtilisins Proteins 0.000 description 1
- 241000160715 Sulfolobus tokodaii Species 0.000 description 1
- 102100030529 Suppressor of cytokine signaling 7 Human genes 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010046075 Thymosin Proteins 0.000 description 1
- 102000007501 Thymosin Human genes 0.000 description 1
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 1
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 1
- 206010044248 Toxic shock syndrome Diseases 0.000 description 1
- 231100000650 Toxic shock syndrome Toxicity 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 241000224526 Trichomonas Species 0.000 description 1
- 241000223104 Trypanosoma Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 1
- 206010054094 Tumour necrosis Diseases 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000700647 Variola virus Species 0.000 description 1
- 108010000134 Vascular Cell Adhesion Molecule-1 Proteins 0.000 description 1
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 102100023543 Vascular cell adhesion protein 1 Human genes 0.000 description 1
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 1
- ZVNYJIZDIRKMBF-UHFFFAOYSA-N Vesnarinone Chemical compound C1=C(OC)C(OC)=CC=C1C(=O)N1CCN(C=2C=C3CCC(=O)NC3=CC=2)CC1 ZVNYJIZDIRKMBF-UHFFFAOYSA-N 0.000 description 1
- 229930003268 Vitamin C Natural products 0.000 description 1
- 108700040099 Xylose isomerases Proteins 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 125000002339 acetoacetyl group Chemical group O=C([*])C([H])([H])C(=O)C([H])([H])[H] 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 230000004520 agglutination Effects 0.000 description 1
- 230000001476 alcoholic effect Effects 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 229960002478 aldosterone Drugs 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- 150000001370 alpha-amino acid derivatives Chemical class 0.000 description 1
- 102000005922 amidase Human genes 0.000 description 1
- 229940093740 amino acid and derivative Drugs 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 229940124277 aminobutyric acid Drugs 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 239000003430 antimalarial agent Substances 0.000 description 1
- 229940033495 antimalarials Drugs 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- OZDNDGXASTWERN-UHFFFAOYSA-N apovincamine Natural products C1=CC=C2C(CCN3CCC4)=C5C3C4(CC)C=C(C(=O)OC)N5C2=C1 OZDNDGXASTWERN-UHFFFAOYSA-N 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 230000011681 asexual reproduction Effects 0.000 description 1
- 238000013465 asexual reproduction Methods 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 125000003236 benzoyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C(*)=O 0.000 description 1
- WQZGKKKJIJFFOK-FPRJBGLDSA-N beta-D-galactose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-FPRJBGLDSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000011942 biocatalyst Substances 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- JCZLABDVDPYLRZ-AWEZNQCLSA-N biphenylalanine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1C1=CC=CC=C1 JCZLABDVDPYLRZ-AWEZNQCLSA-N 0.000 description 1
- ZADPBFCGQRWHPN-UHFFFAOYSA-N boronic acid Chemical compound OBO ZADPBFCGQRWHPN-UHFFFAOYSA-N 0.000 description 1
- 239000012267 brine Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- NSQLIUXCMFBZME-MPVJKSABSA-N carperitide Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 NSQLIUXCMFBZME-MPVJKSABSA-N 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000009134 cell regulation Effects 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 229910052729 chemical element Inorganic materials 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- WHTVZRBIWZFKQO-UHFFFAOYSA-N chloroquine Chemical compound ClC1=CC=C2C(NC(C)CCCN(CC)CC)=CC=NC2=C1 WHTVZRBIWZFKQO-UHFFFAOYSA-N 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 108010082242 corticosterone receptor Proteins 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 229960003067 cystine Drugs 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 108020001096 dihydrofolate reductase Proteins 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000002934 diuretic Substances 0.000 description 1
- 230000012361 double-strand break repair Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 241001492478 dsDNA viruses, no RNA stage Species 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 230000008519 endogenous mechanism Effects 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 231100000655 enterotoxin Toxicity 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 229940116977 epidermal growth factor Drugs 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 230000005281 excited state Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000002095 exotoxin Substances 0.000 description 1
- 231100000776 exotoxin Toxicity 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 229940012413 factor vii Drugs 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003818 flash chromatography Methods 0.000 description 1
- 238000002073 fluorescence micrograph Methods 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 238000002875 fluorescence polarization Methods 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 238000001215 fluorescent labelling Methods 0.000 description 1
- ZHNUHDYFZUAESO-UHFFFAOYSA-N formamide Substances NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 101150045500 galK gene Proteins 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000012248 genetic selection Methods 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 101150024902 glnS gene Proteins 0.000 description 1
- 102000045442 glycosyltransferase activity proteins Human genes 0.000 description 1
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 1
- 239000002622 gonadotropin Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- WQPDUTSPKFMPDP-OUMQNGNKSA-N hirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(OS(O)(=O)=O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N2)=O)CSSC1)C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)CSSC1)C(C)C)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 WQPDUTSPKFMPDP-OUMQNGNKSA-N 0.000 description 1
- 229940006607 hirudin Drugs 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 230000006658 host protein synthesis Effects 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 150000002466 imines Chemical class 0.000 description 1
- 150000007976 iminium ions Chemical class 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 229940097275 indigo Drugs 0.000 description 1
- COHYTHOBJLSHDF-UHFFFAOYSA-N indigo powder Natural products N1C2=CC=CC=C2C(=O)C1=C1C(=O)C2=CC=CC=C2N1 COHYTHOBJLSHDF-UHFFFAOYSA-N 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 229940047124 interferons Drugs 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- CSSYQJWUGATIHM-IKGCZBKSSA-N l-phenylalanyl-l-lysyl-l-cysteinyl-l-arginyl-l-arginyl-l-tryptophyl-l-glutaminyl-l-tryptophyl-l-arginyl-l-methionyl-l-lysyl-l-lysyl-l-leucylglycyl-l-alanyl-l-prolyl-l-seryl-l-isoleucyl-l-threonyl-l-cysteinyl-l-valyl-l-arginyl-l-arginyl-l-alanyl-l-phenylal Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CSSYQJWUGATIHM-IKGCZBKSSA-N 0.000 description 1
- 229940078795 lactoferrin Drugs 0.000 description 1
- 235000021242 lactoferrin Nutrition 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 239000006194 liquid suspension Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 125000005439 maleimidyl group Chemical class C1(C=CC(N1*)=O)=O 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 238000000329 molecular dynamics simulation Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 239000002636 mycotoxin Substances 0.000 description 1
- OHDXDNUPVVYWOV-UHFFFAOYSA-N n-methyl-1-(2-naphthalen-1-ylsulfanylphenyl)methanamine Chemical compound CNCC1=CC=CC=C1SC1=CC=CC2=CC=CC=C12 OHDXDNUPVVYWOV-UHFFFAOYSA-N 0.000 description 1
- 230000001452 natriuretic effect Effects 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 101150012154 nupG gene Proteins 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000002188 osteogenic effect Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- TVIDEEHSOPHZBR-AWEZNQCLSA-N para-(benzoyl)-phenylalanine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1C(=O)C1=CC=CC=C1 TVIDEEHSOPHZBR-AWEZNQCLSA-N 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 108010012038 peptide 78 Proteins 0.000 description 1
- 229940125863 peptide 78 Drugs 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 150000002993 phenylalanine derivatives Chemical class 0.000 description 1
- XHTJLMYQJHCUPE-UHFFFAOYSA-N phosphanylphosphonic acid Chemical compound OP(O)(P)=O XHTJLMYQJHCUPE-UHFFFAOYSA-N 0.000 description 1
- 239000008055 phosphate buffer solution Substances 0.000 description 1
- DTBNBXWJWCWCIK-UHFFFAOYSA-K phosphonatoenolpyruvate Chemical compound [O-]C(=O)C(=C)OP([O-])([O-])=O DTBNBXWJWCWCIK-UHFFFAOYSA-K 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 230000008635 plant growth Effects 0.000 description 1
- 239000003123 plant toxin Substances 0.000 description 1
- 230000001402 polyadenylating effect Effects 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920000166 polytrimethylene carbonate Polymers 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 235000013930 proline Nutrition 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000000425 proton nuclear magnetic resonance spectrum Methods 0.000 description 1
- 230000001698 pyrogenic effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000006862 quantum yield reaction Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 125000006853 reporter group Chemical group 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 201000005404 rubella Diseases 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 229930195734 saturated hydrocarbon Natural products 0.000 description 1
- 238000002804 saturated mutagenesis Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000000741 silica gel Substances 0.000 description 1
- 229910002027 silica gel Inorganic materials 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- HPALAKNZSZLMCH-UHFFFAOYSA-M sodium;chloride;hydrate Chemical compound O.[Na+].[Cl-] HPALAKNZSZLMCH-UHFFFAOYSA-M 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 125000003107 substituted aryl group Chemical group 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000006231 tRNA aminoacylation Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229960003604 testosterone Drugs 0.000 description 1
- CZDYPVPMEAXLPK-UHFFFAOYSA-N tetramethylsilane Chemical compound C[Si](C)(C)C CZDYPVPMEAXLPK-UHFFFAOYSA-N 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- LCJVIYPJPCBWKS-NXPQJCNCSA-N thymosin Chemical compound SC[C@@H](N)C(=O)N[C@H](CO)C(=O)N[C@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@H](C(C)C)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](C(C)C)C(=O)N[C@H](CO)C(=O)N[C@H](CO)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H]([C@@H](C)CC)C(=O)N[C@H]([C@H](C)O)C(=O)N[C@H](C(C)C)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](C(C)C)C(=O)N[C@H](C(C)C)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@H](CCC(O)=O)C(O)=O LCJVIYPJPCBWKS-NXPQJCNCSA-N 0.000 description 1
- 229960000187 tissue plasminogen activator Drugs 0.000 description 1
- 238000006257 total synthesis reaction Methods 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 238000002723 toxicity assay Methods 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- 238000009424 underpinning Methods 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229930195735 unsaturated hydrocarbon Natural products 0.000 description 1
- 229960005356 urokinase Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 235000019154 vitamin C Nutrition 0.000 description 1
- 239000011718 vitamin C Substances 0.000 description 1
- 238000005757 von Pechmann cycloaddition reaction Methods 0.000 description 1
- JPZXHKDZASGCLU-LBPRGKRZSA-N β-(2-naphthyl)-alanine Chemical compound C1=CC=CC2=CC(C[C@H](N)C(O)=O)=CC=C21 JPZXHKDZASGCLU-LBPRGKRZSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/305—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F)
- C07K14/31—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F) from Staphylococcus (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Crystallography & Structural Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
AMINOáCIDOS DE CUMARINA FLUORESCENTE GENETICAMENTE CODIFICADOS. A invenção refere-se a pares ortogonais de tRNAs e aminoacil-tRNA sintetases que possam incorporar o aminoácido não-natural de cumarina de L-(7-hidroxicoumarin-4-il) etilglicina a proteínas produzidas em céjula hospedeiras eubacterianas, como E. coli. A invenção proporciona, mas sem limitar-se a, por exempio, sintetases ortogonais inusitadas, métodos para identificação e fabricação de sintetases inusitadas, métodos para produção de proteínas contendo o aminoácido não-natural de L-(7-hidroxicoumarin-4-il) etilglicina e sistemas de transiação relacionados.
Description
"AMINOÁCIDOS DE CUMARINA FLUORESCENTE GENETICAMENTE CODIFICADOS"
Referência Remissiva aos Pedidos de Depósito Correlatos
Este pedido reivindica a prioridade e benefícios do:
Pedido Provisório Norte-Americano número de série 60/808.099, depositado em 23 de maio de 2006; e
Pedido Provisório Norte-Americano número de série 60/813.856, depositado em 14 de junho de 2006, as descrições de ambos estão aqui incorporadas em sua totalidade a título de referência para todos os propósitos.
Declaração em Relação aos Direitos Concedidos às Invenções Criadas sob Pesquisa e Desenvolvimento Subsidiados pelo Governo Federal
A presente invenção foi criada com o apoio governamental junto ao Departamento de Energia sob a Concessão No. ER46051. O governo tem certos direitos sob esta invenção.
Campo da Invenção
A invenção situa-se no campo da bioquímica de translação. A invenção refere-se a composições e métodos para produzir e utilizar tRNAs ortogonais, aminoacil-tRNA sintetases ortogonais, e pares das mesmas, que incorporam aminoácidos não-naturais em proteínas. A invenção se refere, também, a métodos de produzir proteínas em células que utilizam esses pares e proteínas produzidas pelos métodos. Fundamentos da Invenção
A fluorescência se tornou um dos sinais de detecção mais importantes em biotecnologia devido à sua alta sensibilidade e segurança de manipulação. Os processos como a transferência ressonante de energia de fluorescência (FRET) ou polarização de fluorescência tornam possível as análises em tempo real de eventos de aglutinação biomolecular, movimentos ou alterações conformacionais. A capacidade de modificar seletivamente proteínas com sondas fluorescentes tem facilitado consideravelmente tanto estudos in vitro como estudos in vivo de estruturas e funções protéicas (Hermanson (1996) em Bioconjugate Techniques, Academic Press: San Diego; e Tsien (1998) Annu. Rev. Biochem., 67:509-544).
Freqüentemente, a metodologia fluorescente atual para estudar proteínas in vivo depende de construções de fusão com grandes proteínas fluorescentes, tais como, proteínas verde-fluorescentes (GFP). Muito embora esta sonda tenha se provado útil em estudos de expressão protéica, localização e interações bimoleculares, seu tamanho grande pode resultar em perturbações estruturais significativas. As fusões de GFP também são limitadas a terminações C- ou N- da proteína alvo, e são relativamente insensitivas ao seu ambiente (Tsien (1998) Annu. Rev. Biochem., 67:509-44). A GFP também requer muitas transcrições para alcançar um sinal adequado, e querer um tempo de latência para seu enrolamento e maturação de fluoróforo.
Podem-se utilizar, também, métodos químicos para modificar seletivamente as proteínas com uma variedade de pequenos fluoróforos sintéticos que minimizam a perturbação estrutural (Hermanson, in Bioconjugate Techniques, Academic Press: San Diego (1996); Martin et al, Nat. Biotech., 23:1308-1314 (2005); Keppler et al, Nat. Biotech., 21:86-89 (2003); Lin et al, J. Am. Chem. ScL, 128:4542-3 (2006)). No entanto, essas técnicas são, genericamente, limitadas a resíduos acessíveis por superfície exclusivamente reativa em proteínas isoladas (por exemplo, a modificação de cistina com derivados de maleimida; consulte Hermanson em Bioconjugate Techniques (1996) Academic Press: San Diego), exibem baixa regiosseletividade, são citotóxicas ou necessitam da introdução de motivos de ligação de proteína ao corante.
Os métodos de marcação biossintética que utilizam tRNAs quimicamente misacilados (Mendel et al., Annu. Rev. Biophys. Biomol. Struct. (1995) 24:435-462; Hohsaka et al, FEBS Lett. (2004) 560:173-177) têm sido demonstrados em caráter experimental, porém, fornecem rendimentos limitados de proteína e são realizados, tipicamente, apenas in vitro.
A incorporação de aminoácidos fluorescentes geneticamente codificados em sítios definidos diretamente em proteínas em organismos vivos superaria muitas das limitações no que diz respeito à marcação de fluorescência de proteínas (Wang and Schultz, Angew. Chem. Int. Ed. (2005) 44:34- 66; Wang et al, Annu. Rev. Biophys. Biomol Struct., (2006) 35:225-249). A incorporação sítio-específica de aminoácidos fluorescentes introduziria o mínimo de perturbação à proteína hospedeira e permitiria a medição de transferência ressonante de energia de fluorescência (FRET) com muito mais precisão (Truong and Ikura, Curr. Opin. Struct. Bio. 2001, 11:573-578). Além disso, o uso de um aminoácido fluorescente permitiria a sondagem do ambiente local de cada posição de aminoácido, e localizaria os resíduos que mediam a interação com outros componentes celulares variando-se a posição do aminoácido fluorescente na proteína. Isso seria, também, bastante útil para estudar o enrolamento de proteínas (Lakowicz, Principies of Fluorescence Spectroscopy Ed. 2; Kluwer Academic/Plenum Publishers: Nova York, 1999), especialmente em um sistema unimolecular (Lipman et al, Science (2003) 301:1233-1235), porque uma molécula protéica contém, normalmente, mais de um resíduo de triptófano, e a marcação química específica de proteínas com sondas fluorescentes é problemática.
A técnica querer novas estratégias para incorporação de aminoácidos não-naturais fluorescentes em proteínas com a intenção de estudar a estrutura e função protéica. Tem-se desenvolvido uma metodologia geral para a incorporação sítio-específica in vivo de aminoácidos não-naturais diversificados em proteínas tanto em organismos procarióticos como eucarióticos. Esses métodos dependem componentes de translação protéica ortogonal que reconhecem um códon seletor adequado para inserir um aminoácido não- natural desejado em uma posição definida durante a translação polipeptídica in vivo. Esses métodos utilizam um tRNA ortogonal (O-tRNA) que reconhece um códon seletor, e onde um aminoacil-tRNA sintetase ortogonal específico correspondente (uma O-RS) carrega o O- tRNA com o aminoácido não-natural. Esses componentes não reagem cruzadamente contra nenhum dos tRNAs endógenos, RSs1 aminoácidos ou códons no organismo hospedeiro (isto é, ele deve ser ortogonal). O uso desses pares de tRNA-RS ortogonais tornou possível codificar geneticamente um grande número de aminoácidos não-naturais estruturalmente diversificados.
A prática de utilização de sistemas de translação ortogonal, que são adequados para produção de proteínas que compreendam um ou mais aminoácidos não-naturais, é genericamente conhecida na técnica, assim como os métodos gerais para produção de sistemas de translação ortogonal. Por exemplo, consulte as Publicações Internacionais Números WO 2002/086075, intitulada "METHODS AND COMPOSITION FOR THE PRODUCTION OF ORTHOGONAL tRNA-AMINOACYL- tRNA SYNTHETASE PAIRS;" WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" WO 2005/019415, depositada em 7 de julho de 2004; WO 2005/007870, depositada em 7 de julho de 2004; WO 2005/007624, depositada em 7 de julho de 2004 e WO 2006/110182, depositada em 27 de outubro de 2005, intitulada "ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS." Cada um desses pedidos encontra-se aqui incorporado em sua totalidade a título de referência. Para uma discussão adicional de sistemas de translação ortogonal que incorporam aminoácidos não-naturais, métodos para sua produção e uso, consulte, também, Wang and Schultz, "Expanding the Genetic Code," Chem. Commun. (Comb.) 1:1-11 (2002); Wang and Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed., 44(l):34-66 (2005); Xie and Schultz, "An Expanding Genetic Code," Métodos 36(3):227-238 (2005); Xie and Schultz, "Adding Amino Acids to the Genetic Repertoire," Curr. Opinion in Chemical Biology 9(6):548-554 (2005); Wang et al., "Expanding the Genetic Code," Annu. Rev. Biophys. Biomol. Struct., 35:225-249 (2006); and Xie and Schultz, "A chemical tool kit for proteins - an expanded genetic code," Nat. Rev. Mol. Cell Biol, 7(10):775-782 (2006), sendo que os conteúdos destes estão aqui incorporados em sua totalidade a título de referência.
Há uma necessidade na técnica em desenvolver componentes de translação ortogonal que incorporem aminoácidos não-naturais fluorescentes em proteínas, onde os aminoácidos não-naturais fluorescentes podem ser incorporados em posições definidas. A invenção aqui descrita representa essas e outras necessidades, conforme se tornará aparente mediante a revisão da descrição a seguir.
Sumário da Invenção
A invenção proporciona composições e métodos para incorporação de aminoácido não-natural de cumarina de L-(7-hidroxicoumarin-4-il) etilglicina em uma cadeia polipeptídica em desenvolvimento em resposta a um códon seletor, por exemplo, um códon de parada âmbar, in vivo (por exemplo, em uma célula hospedeira). Essas composições incluem pares de tRNAs ortogonais (O-tRNAs) e aminoacil-tRNA sintetases ortogonais (O-RSs) que não interagem com o mecanismo de translação da célula hospedeira. Isto é, o O-tRNA não é carregado (ou não carregado até um nível significativo) com um aminoácido (natural ou não- natural) por um aminoacil-tRNA sintetase de célula hospedeira endógena. De maneira semelhante, as O-RSs proporcionadas pela invenção não carregam nenhum tRNA endógeno com um aminoácido (natural ou não-natural) até um nível significativo ou detectável. Essas composições inusitadas permitem a produção de grandes quantidades de proteínas dotadas de L-(7-hidroxicumarin-4-il) etilglicina transacionalmente incorporada. Essas proteínas fluorescentes marcadas encontram uma ampla gama de usos.
Em alguns aspectos, a invenção proporciona sistemas de translação. Esses sistemas compreendem uma primeira aminoacil-tRNA sintetase ortogonal (O-RS), um primeiro tRNA ortogonal (O-tRNA), e um primeiro aminoácido não-natural que seja L-(7- hidroxicumarin-4-il) etilglicina, onde a primeira O-RS aminoacila, de preferência, o primeiro O-tRNA com o primeiro aminoácido não-natural.
Os sistemas de translação podem utilizar componentes derivados a partir de uma variedade de fontes. Em uma modalidade, a primeira O-RS é derivada a partir de uma aminoacil-tRNA sintetase de Methanococcus jannaschii, por exemplo, uma tirosil-tRNA sintetase de Methanococcus jannaschii do tipo selvagem. A O-RS usada no sistema pode compreender a seqüência aminoacídica apresentadas na SEQ ID NO: 4, e as variantes conservativas desta seqüência. Em algumas modalidades, o O-tRNA é um tRNA supressor âmbar. Em algumas modalidades, o O-tRNA compreende ou é codificado por SEQ ID NO: 1.
Em alguns aspectos, o sistema da invenção compreende, ainda, um ácido nucléico que codifica uma proteína de interesse, onde o ácido nucléico tem ao menos um códon seletor que é reconhecido pelo O-tRNA.
Em alguns aspectos, o sistema de translação incorpora um segundo par ortogonal (ou seja, uma segunda O-RS e um segundo O-tRNA) que utiliza um segundo aminoácido não-natural, de tal modo que o sistema fique agora disponível para incorporar ao menos dois aminoácidos não-naturais diferentes em diferentes sítios selecionados em um polipeptídeo. Neste sistema de duas partes, a segunda O-RS aminoacila, de preferência, o segundo O-tRNA com um segundo aminoácido não-natural que seja diferente do primeiro aminoácido não-natural, e o segundo O-tRNA reconhece um códon seletor que seja diferente do códon seletor reconhecido pelo primeiro O-tRNA.
Em algumas modalidades, o sistema de translação reside em uma célula hospedeira (e inclui a célula hospedeira). A célula hospedeira usada não é particularmente limitada, enquanto a O-RS e o O-tRNA retiverem sua ortogonalidade em seu ambiente de célula hospedeira. A célula hospedeira pode ser uma célula eubacteriana, como a E. coli. A célula hospedeira pode compreender um ou mais polinucleotídeos que codificam componentes do sistema de translação, incluindo a O-RS ou O-tRNA. Em algumas modalidades, o polinucleotídeo que codifica a O-RS compreende uma seqüência nucleotídica de SEQ ID NO: 5.
A invenção proporciona, também, métodos para produção de proteínas dotadas de um ou mais aminoácidos não-naturais em posições selecionadas. Esses métodos utilizam os sistemas de translação descritos anteriormente. Em geral, esses métodos iniciam com a etapa de proporcionar um sistema de translação que compreende: (i) um primeiro aminoácido não-natural que consiste em um aminoácido de cumarina L-(7-hidroxicumarin-4- il) etilglicina; (ii) um primeiro aminoacil-tRNA sintetase ortogonal (O-RS); (iii) um primeiro tRNA ortogonal (O-tRNA), sendo que a O-RS aminoacila, de preferência, o O-tRNA com o aminoácido não-natural; e, (iv) um ácido nucléico que codifica a proteína, sendo que o ácido nucléico compreende ao menos um códon seletor que é reconhecido pelo primeiro O-tRNA. Então, o método incorpora o aminoácido não-natural na posição selecionada na proteína durante a translação da proteína em resposta ao códon seletor, produzindo, assim, a proteína que compreende o aminoácido não-natural na posição selecionada.
Esses métodos podem ser amplamente aplicados através do uso de uma variedade de reagentes e etapas. Em algumas modalidades, proporciona-se um polinucleotídeo que codifica a O-RS. Em algumas modalidades, proporciona-se uma O-RS derivada a partir de um aminoacil-tRNA sintetase de Methanococcus jannaschii, por exemplo, pode-se proporcionar uma tirosil-tRNA sintetase de Methanococcus jannaschii do tipo selvagem. Em algumas modalidades, a etapa de fornecimento inclui proporcionar uma O-RS que compreende uma seqüência aminoacídica de SEQ ID NO: 4, e as variantes conservativas desta.
Em algumas modalidades desses métodos, o fornecimento de uma etapa de sistema de translação compreende a mutação de um bolso de ligação aminoacídico de uma aminoacil-tRNA sintetase do tipo selvagem por mutagênese sítio-direcionada, e selecionar uma O-RS resultante que aminoacila, de preferência, o O-tRNA com o aminoácido não- natural. A etapa de seleção pode compreender selecionar positiva e negativamente para a O-RS a partir de um lago de moléculas de aminoacil-tRNA sintetase resultantes seguindo a mutagênese sítio-direcionada. Em algumas modalidades, a etapa de fornecimento fornece um polinucleotídeo que codifica o O-tRNA, por exemplo, um O-tRNA que seja um tRNA supressor âmbar, ou um O-tRNA que compreenda ou seja codificado por um polinucleotídeo de SEQ ID NO: 1. Nesses métodos, a etapa de fornecimento pode fornecer, também, um ácido nucléico que compreenda um códon seletor âmbar que seja utilizado pelo sistema de translação.
Esses métodos podem, também, ser modificados de modo a incorporar mais de um aminoácido não-natural em uma proteína. Nesses métodos, emprega-se um segundo sistema de translação em conjunto com o primeiro sistema de translação, sendo que o segundo sistema tem especificidades diferentes de aminoácido e códon seletor. Por exemplo, a etapa de fornecimento pode incluir proporcionar uma segunda O-RS e um segundo O-tRNA, sendo que a segunda O-RS aminoacila, de preferência, o segundo O- tRNA com um segundo aminoácido não-natural que seja diferente do primeiro aminoácido não-natural, e o segundo O-tRNA reconhece um códon seletor no ácido nucléico que seja diferente do códon seletor reconhecido pelo primeiro O-tRNA.
Os métodos para produção de uma proteína com um aminoácido não-natural podem, também, ser administrados no contexto de uma célula hospedeira. Nesses casos, proporciona-se uma célula hospedeira, sendo que a célula hospedeira compreende o aminoácido não-natural, a O-RS, o O-tRNA e o ácido nucléico com ao menos um códon seletor que codifica a proteína, e onde a cultura da célula hospedeira resulta na incorporação do aminoácido não-natural. Em algumas modalidades, a etapa de fornecimento compreende proporcionar uma célula hospedeira eubacteriana (por exemplo, E. coli). Em algumas modalidades, a etapa de fornecimento inclui proporcionar uma célula hospedeira que contenha um polinucleotídeo que codifique a O-RS. Por exemplo, o polinucleotídeo que codifica a O-RS pode compreender uma seqüência nucleotídica de SEQ ID NO: 5. Em algumas modalidades, a etapa de fornecimento de um sistema de translação é realizada mediante o fornecimento de um extrato celular.
A invenção proporciona, também, uma variedade de composições, incluindo ácidos nucléicos e proteínas. A natureza da composição não é particularmente limitada, a não ser a composição que compreende o ácido nucléico ou proteína específica. As composições da invenção podem compreender qualquer número de componentes adicionais de qualquer natureza.
Por exemplo, a invenção proporciona composições que compreendem polipeptídeos de O-RS1 sendo que os polipeptídeos compreendem a seqüência aminoacídica de SEQ ID NO: 4, ou uma variante conservativa da mesma, onde a variante conservativa aminoacila um tRNA ortogonal (O-tRNA) cognato com um aminoácido não- natural com uma eficiência que seja ao menos 50% da eficiência observada para um sistema de translação que compreende o O-tRNA, o aminoácido não-natural e uma aminoacil-tRNA sintetase que compreende a seqüência aminoacídica de SEQ ID NO: 4. A invenção proporciona, também, polinucleotídeos que codificam qualquer um dos polipeptídeos anteriores. Em algumas modalidades, esses polinucleotídeos podem compreender uma seqüência nucleotídica de SEQ ID NO: 5. Em algumas modalidades, os polipeptídeos encontram-se em uma célula.
A invenção proporciona, também, composições polinucleotídicas que compreendem uma seqüência nucleotídica de SEQ ID NO: 5. Em algumas modalidades, a invenção proporciona vetores que compreendem os polinucleotídeos, por exemplo, vetores de expressão. Em algumas modalidades, a invenção proporciona células que compreendem um vetor descrito anteriormente.
Definições
Antes de descrever a invenção em detalhes, deve-se compreender que esta invenção não se limita a sistemas biológicos particulares, que podem, naturalmente, variar. Deve-se compreender, também, que a terminologia aqui usada é destinada ao propósito de descrever apenas modalidades particulares, e não se destina a ser limitante. Conforme o uso em questão no relatório descritivo e nas reivindicações em anexo, as formas singulares "um", "uma", "o" e "a" incluem referentes plurais exceto onde claramente indicado em contrário. Portanto, por exemplo, a referência a uma "célula" inclui combinações de duas ou mais células; a referência a "um polinucleotídeo" inclui, como uma importância prática, muitas cópias deste polinucleotídeo.
Exceto onde definido no presente documento e mais adiante no restante do relatório descritivo, todas as técnicas e termos científicos apresentam o mesmo significado conforme comumente compreendido por um indivíduo versado na técnica a qual a invenção pertence.
Ortoqonal: Conforme o uso em questão, o termo "ortogonal" refere-se a uma molécula (por exemplo, um tRNA ortogonal (O-tRNA) e/ou uma aminoacil-tRNA sintetase ortogonal (O-RS)) que funcione com componentes endógenos de uma célula com eficiência reduzida quando comparada a uma molécula correspondente que seja endógena à célula ou sistema de translação, ou que fracasse em funcionar com componentes endógenos da célula. No contexto de tRNAs e aminoacil-tRNA sintetases, o termo ortogonal se refere a uma incapacidade ou eficiência reduzida, por exemplo, menor que 20 % de eficiência, menor que 10 % de eficiência, menor que 5 % de eficiência ou menor que 1% de eficiência, de um tRNA ortogonal para funcionar com um tRNA sintetase endógena comparado a um tRNA endógeno para funcionar com a tRNA sintetase endógena, ou de uma aminoacil-tRNA sintetase ortogonal para funcionar com um tRNA endógeno comparado a uma tRNA sintetase endógena para funcionar com o tRNA endógeno. A molécula ortogonal carece de uma molécula complementar endógena funcionalmente normal na célula. Por exemplo, um tRNA ortogonal em uma célula é aminoacilado por qualquer RS endógeno da célula com eficiência reduzida ou até mesmo igual a zero, quando comparada à aminoacilação de um tRNA endógeno pelo RS endógeno. Em outro exemplo, um RS ortogonal aminoacila qualquer tRNA endógeno de uma célula de interesse com eficiência reduzida ou até mesmo igual a zero, quando comparada à aminoacilação do tRNA endógeno por um RS endógeno. Pode-se introduzir uma segunda molécula ortogonal na célula que funcione junto à primeira molécula ortogonal. Por exemplo, um par de tRNA/RS ortogonal inclui componentes complementar introduzidos que funcionam juntos na célula com uma eficiência (por exemplo, 45 % de eficiência, 50% de eficiência, 60% de eficiência, 70% de eficiência, 75% de eficiência, 80% de eficiência, 90% de eficiência, 95% de eficiência ou 99% de eficiência ou mais eficiência) quando comparados a um componentes de controle, por exemplo, um par de tRNA/RS endógeno correspondente, ou um par ortogonal ativo (por exemplo, um par de tirosil tRNA/RS ortogonal).
Tirosil-tRNA ortogonal: Conforme o uso em questão, um tirosil-tRNA ortogonal (tirosil-O-tRNA) é um tRNA que é ortogonal a um sistema de translação de interesse, onde o tRNA é: (1) idêntico ou substancialmente similar a um tirosil-tRNA de ocorrência natural, (2) derivado a partir de um tirosil-tRNA de ocorrência natural por mutagênese natural ou artificial, (3) derivado por qualquer processo que leve uma seqüência de uma seqüência de tirosil-tRNA do tipo selvagem ou mutante de (1) ou (2) em consideração, (4) homólogo a um tirosil-tRNA do tipo selvagem ou mutante; (5) homólogo a qualquer exemplo de tRNA que seja designado como um substrato para uma tirosil-tRNA sintetase na FIGURA 9, ou (6) uma variante conservativa de qualquer exemplo de tRNA que seja designado como um substrato para uma tirosil-tRNA sintetase na FIGURA 9. O tirosil-tRNA pode existir carregado com um aminoácido, ou em um estado descarregado. Deve-se compreender, também, que um "tirosil-O-tRNA" é, opcionalmente, carregado (aminoacilado) por uma sintetase cognata com um aminoácido que não seja tirosina, respectivamente, por exemplo, com um aminoácido não-natural. De fato, avaliar-se-á que um tirosil-O-tRNA da invenção é vantajosamente usado para inserir essencialmente qualquer aminoácido, seja natural ou não-natural, em um polipeptídeo em desenvolvimento, durante a translação, em resposta a um códon seletor.
Sintetase aminoacídica de tirosil ortogonal: Conforme o uso em questão, uma sintetase aminoacídica de tirosil ortogonal (tirosil-O-RS) é uma enzima que aminoacila, de preferência, o tirosil-O-tRNA com um aminoácido em um sistema de translação de interesse. O aminoácido que o tirosil-O-RS carrega no tirosil-O-tRNA pode ser qualquer aminoácido, seja natural, não-natural ou artificial, e não é limitado no presente documento. A sintetase é opcionalmente igual ou homóloga a uma sintetase aminoacídica de tirosil de ocorrência natural, ou igual ou homóloga a uma sintetase designada como uma O-RS na FIGURA 9. Por exemplo, a O-RS pode ser uma variante conservativa de um tirosil-O-RS da FIGURA 9, e/ou pode ser ao menos 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% ou mais idêntica em seqüência a uma O-RS da FIGURA 9.
Cognato: O termo "cognato" refere-se a componentes que funciona junto, ou têm algum aspecto de especificidade entre si, por exemplo, a um tRNA ortogonal e uma aminoacil-tRNA sintetase ortogonal. Os componentes podem, também, ser denominados como sendo complementares.
Aminoacila. de preferência,: Conforme o uso em questão com referência a sistemas de translação ortogonal, uma O-RS "aminoacila, de preferência," um O-tRNA cognato quando a O-RS carrega o O-tRNA com um aminoácido com mais eficiência do que carrega qualquer tRNA endógeno em um sistema de expressão. O seja, quando o O-tRNA e qualquer tRNA endógeno dado estiverem presentes em um sistema de translação em razões molares aproximadamente iguais, a O-RS carregará o O-tRNA com mais freqüência do que ela carregará o tRNA endógeno. De preferência, a razão relativa entre o O-tRNA carregado pela O-RS e o tRNA endógeno carregado pela O-RS é alta, resultando preferencialmente na O-RS carregando exclusivamente o O-tRNA, ou quase exclusivamente, quando o O-tRNA e o tRNA endógeno estiverem presentes em concentrações molares iguais no sistema de translação. A razão relativa entre o O-tRNA e o tRNA endógeno que é carregado pela O-RS, quando o O-tRNA e a O-RS estiverem presentes em concentrações molares iguais, é maior que 1:1 ,de preferência, ao menos cerca de 2:1 , com mais preferência, 5:1, com mais preferência ainda, 10:1, com mais preferência ainda, 20:1, com mais preferência ainda, 50:1, com mais preferência ainda, 75:1, com mais preferência ainda, 95:1,98:1,99:1, 100:1,500:1, 1.000:1,5.000:1 ou maior.
O O-RS "aminoacila, de preferência, um O-tRNA com um aminoácido não-natural" quando (a) a O-RS aminoacila, de preferência, o O-tRNA comparado a um tRNA endógeno, e (b) onde esta aminoacilação for específica para o aminoácido não-naturaí, conforme comparado à aminoacilação do O-tRNA pela O-RS com qualquer aminoácido natural. Ou seja, quando os aminoácidos não-naturais e naturais estiverem presentes em quantidades molares iguais em um sistema de translação que compreende a O-RS e o O-tRNA, a O-RS carregará o O-tRNA com o aminoácido não-natural com mais freqüência do que com o aminoácido natural. De preferência, a razão relativa entre o O-tRNA carregado com o aminoácido não-natural e o O-tRNA carregado com o aminoácido natural é alta. Com mais preferência, a O-RS carrega exclusivamente o O-tRNA, ou quase exclusivamente, com o aminoácido não-natural. A razão relativa entre o carregamento do O-tRNA com o aminoácido não-natural e o carregamento do O-tRNA com o aminoácido natural, quando tanto aminoácidos natural como não-naturais estiverem presentes no sistema de translação em concentrações molares iguais, é maior do que 1:1, de preferência ao menos cerca de 2:1, com mais preferência, 5:1, com mais preferência ainda, 10:1, com mais preferência ainda, 20: 1, com mais preferência ainda, 50:1, com mais preferência ainda, 75:1, com mais preferência ainda, 95: 1. 98:1, 99:1, 100:1, 500:1, 1.000:1, 5.000:1 ou maior.
Códon seletor: O termo "códon seletor" refere-se a códons reconhecidos pelo O- tRNA no processo de translação e não-reconhecidos por um tRNA endógeno. A alça do anticódon O-tRNA reconhece o códon seletor no mRNA e incorpora seu aminoácido, por exemplo, um aminoácido não-natural, neste sítio no polipeptídeo. Os códons seletores podem incluir, por exemplo, códons sem-sentido, como, códons de parada, por exemplo, códons âmbar, ocre e opala; quatro ou mais códons de base; códons raros; códons derivados a partir de pares de base naturais ou não-naturais e/ou similares.
tRNA supressor: Um tRNA supressor é um tRNA que altera a leitura de um RNA mensageiro (mRNA) em um dado sistema de translação, permitindo-se, tipicamente, a incorporação de um aminoácido em resposta a um códon de parada (isto é, "transleitura") durante a translação de um polipeptídeo. Em alguns aspectos, um códon seletor da invenção consiste em um códon supressor, por exemplo, um códon de parada (por exemplo, um códon âmbar, ocre ou opala), um códon de quatro bases, um códon raro, etc.
Atividade de supressão: Conforme o uso em questão, o termo "atividade de supressão" refere-se, em geral, à capacidade de um tRNA (por exemplo, um tRNA supressor) em permitir uma transleitura translacional de um códon (por exemplo, um códon seletor que seja um códon âmbar ou um códon de 4 ou mais bases) que, por outro lado, resultaria na terminação de translação ou translação incorreta (por exemplo, deslocação do quadro de leitura). A atividade de supressão de um tRNA supressor pode ser expressa como uma porcentagem de atividade de transleitura translacional observada comparada a um segundo tRNA supressor, ou comparada a um sistema de controle, por exemplo, um sistema de controle desprovido de uma O-RS.
A presente invenção proporciona vários métodos através dos quais a atividade de supressão pode ser quantificada. A supressão percentual de um O-tRNA particular e O-RS contra um códon seletor (por exemplo, um códon âmbar) de interesse se refere à porcentagem de atividade de um dado marcador de teste expresso (por exemplo, LacZ), que inclui um códon seletor, em um ácido nucléico que codifica o marcador de teste expresso, em um sistema de translação de interesse, onde o sistema de translação de interesse inclui uma O-RS e um O-tRNA, comparado a uma construção positiva de controle, onde o controle positivo é desprovido de O-tRNA, e O-RS e o códon seletor. Portanto, por exemplo, se uma construção marcadora de controle positivo ativo desprovida de um códon seletor tiver uma atividade observada de X em um dado sistema de translação, em unidades relevantes ao ensaio do marcador em questão, então, a supressão percentual de uma construção de teste que compreende o códon seletor é a porcentagem de X que a construção de marcador de teste exibe sob essencialmente as mesmas condições ambientais em que o marcador de controle positivo foi expresso, exceto pelo fato de que a construção de marcador de teste é expressa em um sistema de translação que inclui, também, o O-tRNA e a O-RS. Tipicamente, o sistema de translação que expressa o marcador de teste inclui, também, um aminoácido que é reconhecido pela O-RS e O-tRNA. Opcionalmente, a medição de supressão percentual pode ser redefinida através da comparação do marcador de teste a uma construção de marcador de controle "antecedente" ou "negativo", que inclui o mesmo códon seletor do marcador de teste, porém, em um sistema que não inclua o O-tRNA, a O- RS e/ou aminoácido relevante reconhecido pelo O-tRNA e/ou pela O-RS. Este controle negativo é útil em normalizar medições de supressão percentual responsáveis por efeitos de sinal antecedente a partir do marcador no sistema de translação de interesse.
Pode-se determinar a eficiência de supressão através de uma série de ensaios conhecidos na técnica. Por exemplo, pode-se utilizar um ensaio de gene repórter β- galactosidase, por exemplo, introduz-se um plasmídeo lacZ derivado (onde a construção tem um códon seletor η na seqüência de ácido nucléico lacZ) nas células a partir de um organismo adequado (por exemplo, um organismo em que os componentes ortogonais possam ser usados) junto a um plasmídeo que compreende um O-tRNA da invenção. Pode- se introduzir, também, uma sintetase cognata (como um polipeptídeo ou como um polinucleotídeo que codificam a sintetase cognata quando expressa). As células são cultivadas em um meio até que uma densidade desejada seja obtida, por exemplo, até um OD60O de cerca de 0,5, e realizam-se ensaios de β-galactosidase, por exemplo, utilizando-se o Kit de Ensaio de β-Galactosidase BetaFluor™ (Novagen). A supressão percentual pode ser calculada como a porcentagem da atividade para uma amostra relativa a um controle comparável, por exemplo, o valor observado a partir da construção de lacZ derivada, onde a construção tem um códon com sentido correspondente em posição desejada ao invés de um códon seletor.
Sistema de translação: O termo "sistema de translação" refere-se aos componentes que incorporam um aminoácido em uma cadeia polipeptídica em desenvolvimento (proteína). Os componentes de um sistema de translação podem incluir, por exemplo, ribossomos, tRNAs, sintetases, mRNA e similares. O O-tRNA e/ou as O-RSs da invenção podem ser adicionados ou ser parte de um sistema de translação in vitro ou in vivo, por exemplo, em uma célula não-eucariótica, por exemplo, uma bactéria (como, E. coli), ou em uma célula eucariótica, por exemplo, uma célula de levedura, uma célula de mamífero, uma célula vegetal, uma célula de alga, uma célula de fungo, uma célula de inseto e/ou similares.
Aminoácido não-natural: Conforme o uso em questão, o termo "aminoácido não- natural" refere-se a qualquer aminoácido, aminoácido modificado e/ou aminoácido análogo, que não seja um dos 20 aminoácidos comuns de ocorrência natural, selenocisteína nem pirrolisina. Por exemplo, o aminoácido não-natural L-(7-hidroxicumarin-4-il) etilglicina (também escrito como 7-hidroxicumarina-etilglicina; consulte a FIGURA 1, estrutura 1) encontra uso junto à invenção.
Derivado a partir: Conforme o uso em questão, o termo "derivado a partir" refere-se a um componente que é isolado a partir de, ou produzido utilizando-se, uma molécula ou organismo específico, ou informações da molécula ou organismo específico. Por exemplo, um polipeptídeo que seja derivado a partir de um segundo polipeptídeo pode incluir uma seqüência aminoacídica que seja idêntica ou substancialmente similar à seqüência aminoacídica do segundo polipeptídeo. No caso de polipeptídeos, as espécies derivadas podem ser obtidas, por exemplo, através de mutagênese de ocorrência natural, mutagênese direcionada artificial ou mutagênese aleatória artificial. A mutagênese usada para derivar polipeptídeos pode ser intencionalmente direcionada ou intencionalmente aleatória, ou uma mistura de cada. A mutagênese de um polipeptídeo para criar um polipeptídeo diferente derivado a partir do primeiro pode ser um evento aleatório (por exemplo, causador por infidelidade de polimerase) e a identificação do polipeptídeo derivado pode ser feita por métodos de varredura apropriados, por exemplo, conforme aqui discutido. A mutagênese de um polipeptídeo envolve, tipicamente, a manipulação do polinucleotídeo que codifica o polipeptídeo.
Seleção positiva ou marcador de varredura: Conforme o uso em questão, o termo "seleção positiva ou marcador de varredura" refere-se a um marcador que, quando presente, por exemplo, expresso, ativado ou algo do gênero, resulta na identificação de uma célula, que compreende o traço, por exemplo, uma célula com o marcador de seleção positiva, a partir daquelas sem o traço.
Seleção negativa ou marcador de varredura: Conforme o uso em questão, o termo "seleção negativa ou marcador de varredura" refere-se a um marcador que, quando presente, por exemplo, expresso, ativado, ou algo do gênero, permite a identificação de uma célula que não compreende uma propriedade ou traço selecionado (por exemplo, conforme comparado a uma célula que não possua a propriedade ou traço)
Repórter: Conforme o uso em questão, o termo "repórter" refere-se a um componente que pode ser usado para identificar e/ou selecionar componentes alvo de um sistema de interesse. Por exemplo, um repórter pode incluir uma proteína, por exemplo, uma enzima, que confira resistência ou sensibilidade antibiótica (por exemplo, /?-lactamase, cloranfenicol acetiltransferase (CAT), e similares), um marcador de varredura fluorescente (por exemplo, proteína verde fluorescente (por exemplo, (GFP), YFP, EGFP, RFP, etc.), um marcador Iuminescente (por exemplo, uma proteína Iuciferase proveniente do vaga-lume), um marcador de varredura baseado em afinidade, ou genes marcadores selecionáveis positivos ou negativos, tais como IacZ1 /?-gal/lacZ (/?-galactosidase), ADH (desidrogenase alcoólica), his3, ura3, Ieu2, Iys2, ou similares.
Eucariota: Conforme o uso em questão, o termo "eucariota" refere-se a organismos pertencentes ao reino Eukarya. Os eucariotas são, em geral, distinguíveis dos procariotas por sua organização tipicamente multicelular (porém, não exclusivamente multicelular, por exemplo, levedura), a presença de uma membrana nuclear e outras organelas com membrana, material genética linear (isto é, cromossomos lineares), a ausência de óperons, a presença de íntrons, mRNA de terminação mensageira e poli-A, e outras características bioquímicas, como uma estrutura ribossômica diferenciada. Os organismos eucarióticos incluem, por exemplo, animais (por exemplo, mamíferos, insetos, répteis, aves, etc.), ciliados, vegetais (por exemplo, monocotiledôneas, dicotiledôneas, algas, etc.), fungos, leveduras, flagelados, microsporídios, protistas, etc.
Procariota: Conforme o uso em questão, o termo "procariota" refere-se a organismos pertencentes ao reino Monera (também denominado como Procarya). Os organismos procarióticos são genericamente distinguíveis dos eucariontes por sua organização unicelular, reprodução assexuada por germinação ou ramificação, pela ausência de uma membrana nuclear ou outras organelas dotadas de membrana, por um cromossomo circular, pela presença de óperons, ausência de íntrons, mRNA de terminação mensageira e poli-A, e por outras características bioquímicas, como uma estrutura ribossômica diferenciada. O reino Prokarya inclui os sub-reinos Eubacteria e Archaea (algumas vezes denominados como "Archaebacteria"). As cianobactérias (as algas verde- azuladas) e micoplasmas são, algumas vezes, fornecidas em classificações separadas sob o reino Monera.
Bactéria: Conforme o uso em questão, os termos "bactéria" e "eubactéria" referem- se a organismos procarióticos que são distinguíveis do Archaea. De maneira similar, Archaea se refere aos procariotas que são distinguíveis das eubactérias. As eubactérias e Archaea podem ser distinguíveis por uma série de critérios morfológicos e bioquímicos. Por exemplo, diferenças em seqüências de RNA ribossômico, estrutura de RNA polimerase, a presença ou ausência de íntrons, sensibilidade antibiótica, a presença ou ausência de peptidoglicanos em paredes celulares e outros componentes de parede celular, estruturas ramificadas versus não-ramificadas de lipídeos de membrana, e a presença/ausência de histonas e proteínas tipo histona são usados para atribuir um organismo aos reinos Eubactéria ou Archaea.
Exemplos de Eubactérias incluem Escherichia coli, Thermus thermophilics, Bacillus subtilis e Bacillus stearothermophilus. Exemplos de Archaeabactérias incluem Methanococcus jannasehii (Mj), Methanosareina mazei (Mm), Methanobaeterium thermoautotrophieum (Mt), Methanoeoceus maripaludis, Methanopyrus kandleri, Halobacterium, como as espécies Haloferax volcanii e Halobacterium NRC-I1 Archaeoglobus fulgidus (Af), Pyrococcus furiosus (Pf)1 Pyrococcus horikoshii (Ph), Pyrobaeulum aerophilum, Pyroeoeeus abyssi, Sulfolobus solfatarieus (Ss), Sulfolobus tokodaii, Aeuropyrum pernix (Ap), Thermoplasma aeidophilum e Thermoplasma voleanium.
Variante conservativa: Conforme o uso em questão, o termo "variante conservativa," no contexto de um componente de translação, refere-se a um componente de translação, por exemplo, um O-tRNA de variante conservativa ou uma O-RS de variante conservativa, que realiza funcionalmente de maneira similar a um componente de base que a variante conservativa é similar, por exemplo, um O-tRNA ou O-RS1 dotados de variações na seqüência comparados a um O-tRNA ou O-RS de referência. Por exemplo, uma O-RS, ou uma variante conservativa da mesma O-RS1 aminoacilará um O-tRNA cognato com um aminoácido não-natural, por exemplo, um aminoácido não-natural L-(7-hidroxicumarin-4-il) etilglicina. Neste exemplo, a O-RS e sua variante conservativa não têm as mesmas seqüências aminoacídicas. A variante conservativa pode ter, por exemplo, uma, duas, três, quatro, cinco ou mais variações na seqüência, enquanto a variante conservativa ainda permanece complementar (por exemplo, funciona junto) ao O-tRNA ou O-RS cognato correspondente.
Em algumas modalidades, uma O-RS de variante conservativa compreende uma ou mais substituições aminoacídicas conservativas comparadas à O-RS da qual ela é derivada. Em algumas modalidades, uma O-RS de variante conservativa compreende uma ou mais substituições aminoacídicas conservativas comparadas à O-RS da qual ela é derivada, e, além disso, retém uma atividade biológica de O-RS; por exemplo, uma O-RS de variante conservativa que retém ao menos 10% da atividade biológica da molécula controladora de O-RS a partir da qual ela foi derivada, ou, alternativamente, ao menos 20%, ao menos 30%, ou ao menos 40%. Em algumas modalidades preferenciais, a O-RS de variante conservativa retém ao menos 50% da atividade biológica da molécula controladora de O-RS a partir da qual ela foi variada. As substituições aminoacídicas conservativas de uma O-RS de variante conservativa podem ocorrer em qualquer domínio da O-RS, incluindo o bolso de ligação aminoacídico.
Agente de seleção ou varredura: Conforme o uso em questão, o termo "agente de seleção ou varredura" refere-se a um agente que, quando presente, permite uma seleção/varredura de certos componentes a partir de uma população. Por exemplo, um agente de seleção ou varredura pode ser, mas não se limita a, por exemplo, um nutriente, um antibiótico, um comprimento de onda de luz, um anticorpo, um polinucleotídeo expressado, ou similares. O agente de seleção pode ser variado, por exemplo, por concentração, intensidade, etc. Em resposta a: Conforme o uso em questão, o termo "em resposta a" refere-se ao processo em que um O-tRNA da invenção reconhece um códon seletor e media a incorporação do aminoácido não-natural, que é acoplado ao tRNA, na cadeia polipeptídica em desenvolvimento.
Codificar: Conforme o uso em questão, o termo "codificar" refere-se a qualquer processo pelo qual a informação em uma macromolécula polimérica ou cadeia de seqüência é usada para direcionar a produção de uma segunda molécula ou cadeia de seqüência que seja diferente da primeira molécula ou cadeia de seqüência. Conforme o uso em questão, o termo é amplamente usado, e pode ter uma variedade de aplicações. Em alguns aspectos, o termo "codificar" descreve o processo de replicação semiconservativa de DNA, onde uma fita de uma molécula de DNA de fita dupla é usada como um padrão para codificar uma fita gêmea complementar recentemente sintetizada por uma polimerase de DNA dependente de DNA.
Em outro aspecto, o termo "codificar" refere-se a qualquer processo pelo qual a informação em uma molécula é usada para direcionar a produção de uma segunda molécula que tenha uma natureza química diferente da primeira molécula. Por exemplo, uma molécula de DNA pode codificar uma molécula de RNA (por exemplo, pelo processo de transcrição que incorpora uma enzima de polimerase de RNA dependente de DNA). Da mesma forma, uma molécula de RNA pode codificar um polipeptídeo, de acordo com o processo de translação. Quando usado para descrever o processo de translação, o termo "codificar" também se estende ao códon terceto que codifica um aminoácido. Em alguns aspectos,uma molécula de RNA pode codificar uma molécula de DNA, por exemplo, pelo processo de transcrição reversa que incorpora uma polimerase de DNA dependente de RNA. Em outro aspecto, uma molécula de DNA pode codificar um polipeptídeo, onde se compreende que "codificar", conforme usado neste caso, incorpora tanto os processos de transcrição como os processos de translação.
Breve Descrição das Figuras
A FIGURA 1 proporciona um diagrama esquemático da síntese química L-(7- hidroxicumarin-4-il) etilglicina (estrutura 1).
A FIGURA 2 proporciona espectros de absorção e emissão de L-(7-hidroxicumarin- 4-il) etilglicina. Ambos os espectros foram gravados em pH igual a 7,4, tampão de fosfato de sódio de 100 mM. Neste pH, a L-(7-hidroxicumarin-4-il) etilglicina está presente tanto sob a forma de fenol como de fenolato (em uma razão de aproximadamente 2:1). A forma de fenolato tem um coeficiente de extinção de 17000 a 360 nM e um rendimento quântico de 0,63.
A FIGURA 3 proporciona a estrutura de mioglobina de esperma de baleia (código pdb 105M). Os grupos R- de resíduos Ser4 e His37 são indicados. A FIGURA 4 proporciona os resultados de uma análise de dicroísmo circular de desenrolamento induzido por uréia de formas do tipo selvagem e mutantes de holomioglobina. As formas mutantes analisadas foram ou holomioglobinas mutantes Ser4 —> 7-hidroxicumarina-etilglicina ou His37 —► 7-hidroxicumarina-etilglicina. O desenrolamento foi monitorado tanto por intensidade CD como fluorescente de 7-hidroxicumarina-etilglicina. Ambos os experimentos foram realizados em uma solução tampão de fosfato de sódio de 100 mM, pH 7,4, com várias concentrações de uréia conforme indicado. Na presença de 5 M de uréia, ambos os mutantes de mioglobina mostram um aumento de 30% no sinal de fluorescência comparado a 0 M de uréia. A "fração enrolada" é calculada normalizando-se o sinal de fluorescência ou a elipticidade molar em 5 M de uréia até o estado completamente desenrolado.
A FIGURA 5 proporciona foto-gráficos da análise SDS-PAGE de expressão de mioglobina mutante TAG4 (indicada pela seta preta). O painel central mostra a resolução por SDS-PAGE pintada em azul de coomassie de proteínas acumuladas na presença e ausência de 1 mM de L-(7-hidroxicumarin-4-il) etilglicina. O painel direito mostra uma imagem de fluorescência de mioglonina do tipo selvagem e TAG4 mutante seguindo a resolução por SDS-PAGE. O painel esquerdo mostra os marcadores de massa molecular pintados.
A FIGURA 6 proporciona um espectro de ESI-MS da mioglobina mutante TAG4. A inserção mostra o espectro desconvulcionado. Massa esperada: 18512 Da; Encontrado: 18511 Da.
A FIGURA 7 proporciona um espectro de absorção de aminoácido de cumarina L- (7-hidroxicumarin-4-il) etilglicina de 60 μΜ em uma solução tampão de fosfato de sódio de 100 mM.
A FIGURA 8 proporciona um modelo estrutural do sítio ativo de MyTyrRS (CouRS- D8) mutante. O modelo foi gerado utilizando-se a estrutura de MyTyrRS do tipo selvagem (código pdb 1J1U). O substrato de tirosina foi substituídos por L-(7-hidroxicumarin-4-il) etilglicina, e as seguintes mutações foram indicadas: Tyr32Glu, Leu65His, Ala67Gly, His70Gly, Phel08Tyr, Glnl09His, Aspl58Gly e Leul62Gly. A estrutura foi otimizada por minimização de energia pelo software InsightlI® (Accelrys Software, Inc. ®, San Diego, CA, EUA).
A FIGURA 9 proporciona várias seqüências nucleotídicas e aminoacídicas.
Descrição Detalhada da Invenção
O presente relatório descritivo proporciona pares de tRNA ortogonal/aminoacil- tRNA sintetase que permitem a introdução seletiva in vivo do aminoácido fluorescente L-(7- hidroxicumarin-4-il) etilglicina (consulte a FIGURA 1, estrutura 1) em proteínas na E. coli em resposta a um códon seletor, por exemplo, o códon de parada âmbar TAG. A invenção proporciona polipeptídeos inusitados de aminoacil-tRNA sintetase ortogonal (O-RS) que carregam, de maneira específica, um tRNA ortogonal (O-tRNA) cognato com o aminoácido não-natural L-(7- hidroxicumarin-4-il) etilglicina.
A porção de 7-hidroxicumarina foi inicialmente investigada devido a seu alto rendimento quântico de fluorescência, deslocamento de Stoke relativamente grande (consulte a FIGURA 2), pequeno tamanho, sensibilidade ao pH (consulte a FIGURA 7) e polaridade de solvente (Zinsli, J. Photochem (1974) 3:55-69).
Em alguns aspectos, de modo a demonstrar (porém, sem limitar-se a) a presente invenção, a descrição no presente documento demonstra que a porção de aminoácido não- natural pode ser incorporada em uma proteína modelo (consulte os EXEMPLOS 4 e 5). Não se pretende que a incorporação do aminoácido não-natural seja limitada a qualquer proteína particular. A partir da presente descrição, ficará claro que a incorporação do aminoácido não-natural fluorescente em uma proteína particular de interesse é vantajosa para uma ampla variedade de propósitos.
A presente revelação descreve a evolução de pares inusitados de tRNA ortogonal/aminoacil-tRNA sintetase que funcionam em eubactérias para incorporar especificamente em sítio um aminoácido não-natural fluorescente (por exemplo, o aminoácido não-natural L-(7- hidroxicumarin-4-il) etilglicina proporcionado na FIGURA 1, estrutura 1) em resposta aos códons seletores. Resumidamente, identificamos que mutantes inusitados da tirosil-tRNA sintetase de Methanococcus janaschii que carregam seletivamente um tRNA supressor com o aminoácido não-natural em células hospedeiras de E. coli.
Esses pares de tRNA-sintetase desenvolvidos podem ser usados para incorporar especificamente em sítio o aminoácido não-natural fluorescente em uma proteína. A incorporação do aminoácido não-natural na proteína pode ser programada de modo a ocorrer em qualquer posição desejada modificando-se por engenharia genética o polinucleotídeo que codifica a proteína de interesse para conter um códon seletor que sinaliza a incorporação do aminoácido não-natural.
A invenção aqui descrita proporciona pares ortogonais para codificação e incorporação genética de um aminoácido não-natural L-(7-hidroxicumarin-4-il) etilglicina em proteínas em uma eubactéria, por exemplo, uma célula E. coli, onde os componentes ortogonais não reagem cruzadamente com componentes endógenos E. coli do mecanismo translacional da célula hospedeira, porém, reconhecem o aminoácido não-natural desejado e o incorpora nas proteínas em resposta a um códon seletor (por exemplo, um códon sem- sentido âmbar, TAG). Os componentes ortogonais proporcionados pela invenção incluem aminoacil-tRNA sintetases ortogonais derivadas a partir de tirosil tRNA-sintetase de Methanococcus jannaschii, e o supressor âmbar tirosil íRNACua mutante, que funciona como um par ortogonal em uma célula hospedeira eubacteriana.
A presente invenção proporciona composições e métodos para identificar e produzir pares adicionais de tRNA ortogonal-amínoacil-tRNA sintetase, por exemplo, pares de O- tRNA/O-RS que podem ser usados para incorporar o aminoácido não-natural L-(7- hidroxicumarin-4-il) etil glicina em uma proteína. Um par de O-tRNA/O-RS da invenção é capaz de mediar a incorporação do 7-hidroxicumarina-etilglicina em uma proteína que seja codificada por um polinucleotídeo, onde o polinucleotídeo compreende um códon seletor que é reconhecido pelo O-tRNA. A alça de anticódon do O-tRNA reconhece o códon seletor em um mRNA e incorpora o aminoácido não-natural neste sítio no polipeptídeo. Em geral, uma aminoacil-tRNA sintetase ortogonal da invenção aminoacila, de preferência, (ou carrega) seu O-tRNA apenas com um aminoácido não-natural específico.
Tecnologia de tRNA ortoqonal/aminoacil-tRNA sintetase
Uma compreensão das composições e métodos inusitados da presente invenção requer uma compreensão das atividades associadas aos pares de tRNA ortogonal e aminoacil-tRNA sintetase ortogonal. Com a finalidade de adicionar aminoácidos não-naturais adicionais ao código genético, necessita-se de novos pares ortogonais que compreendam uma aminoacil-tRNA sintetase e um tRNA adequado que possam funcionar, de maneira eficaz, no mecanismo translacional hospedeiro, porém, que sejam "ortogonais" ao sistema de translação em debate, significando que ele funciona independentemente das sintetases e tRNAs endógenos ao sistema de translação. As características desejadas do par ortogonal incluem o tRNA que decodifica ou reconhece apenas um códon específico, por exemplo, um códon seletor, que não seja decodificado por nenhum tRNA endógeno, e aminoacil-tRNA sintetases que aminoacilam (ou "carregam"), de preferência, seu tRNA cognato apenas com um aminoácido não-natural específico. O O-tRNA também não é tipicamente aminoacilado (ou deficientemente aminoacilado, isto é, carregado) por sintetases endógenas. Por exemplo, em um sistema hospedeiro de E coli, um par ortogonal incluirá uma aminoacil- tRNA sintetase que não reaja cruzadamente com nenhum dos tRNAs endógenos, por exemplo, destes, existem 40 em E coli, e um tRNA ortogonal que não seja aminoacilado por qualquer uma das sintetases endógenas, por exemplo, destes, existem 21 em E coli.
Os princípios gerais de sistemas de translação ortogonais que são adequados para produzir proteínas que compreendem um ou mais aminoácidos não-naturais são conhecidos na técnica, assim como os métodos gerais para produção de sistemas de translação ortogonais. Por exemplo, consulte as Publicações Internacionais Números WO 2002/086075, intitulada "METHODS AND COMPOSITION FOR THE PRODUCTION OF tRNA ORTHOGONAL-AMINOACYL-tRNA SYNTHETASE PAIRS;" WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" WO 2005/019415, depositada em 7 de julho de 2004; WO 2005/007870, depositada em 7 de julho de 2004; WO 2005/007624, depositada em 7 de julho de 2004; WO 2006/110182, depositada em 27 de outubro de 2005, intitulada "ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS," e o Pedido de Utilidade U.S. com número de série 11/715.672, intitulado "SYSTEMS FOR THE EXPRESSION OF ORTHOGONAL TRANSLATION COMPONENTS IN EUBACTERIAL HOST CELLS," depositado em 7 de março de 2007. Cada um desses pedidos está aqui incorporado em sua totalidade a título de referência. Para discussão de sistemas de translação ortogonais que incorporam aminoácidos não-naturais, e métodos para sua produção e uso, consulte, também, Wang and Schultz, "Expanding the Genetic Code," Chem. Commun. (Comb.) 1:1- 11 (2002); Wang and Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed., 44(l):34-66 (2005); Xie and Schultz, "An Expanding Genetic Code," Métodos 36(3):227-238 (2005); Xie and Schultz, "Adding Amino Acids to the Genetic Repertoire," Curr. Opinion in Chemical Biology 9(6):548-554 (2005); Wang et al., "Expanding the Genetic Code," Annu. Rev. Biophys. Biomol. Struct., 35:225-249 (2006); e Xie and Schultz, "A chemical toolkit for proteins - an expanded genetic code," Nat. Rev. Mol. Cell Biol, 7(10):775-782 (2006), os conteúdos destes estão aqui incorporados em sua totalidade a título de referência.
Sistemas de Translação Ortoqonal
Os sistemas de translação ortogonais compreendem, em geral, células (que podem ser células procariotas, como E. coli) que incluem um tRNA ortogonal (O-tRNA), uma aminoacil-tRNA sintetase ortogonal (O-RS) e um aminoácido não-natural, onde a O-RS aminoacila o O-tRNA com o aminoácido não-natural. Um par ortogonal da invenção pode incluir um O-tRNA, por exemplo, um tRNA supressor, um tRNA de deslocação do quadro de leitura, ou similares, e um O-RS cognato. Os sistemas ortogonais da invenção podem compreender, tipicamente, pares de O-tRNA/O-RS, seja no contexto de uma célula hospedeira seja sem a célula hospedeira. Além dos sistemas de múltiplos componentes, a invenção proporciona, também, componentes individuais inusitados, por exemplo, polipeptídeos inusitados de aminoacil-tRNA sintetase ortogonal (por exemplo, SEQ ID NO: 4), e os polinucleotídeos que codificam esses polipeptídeos (por exemplo, SEQ ID NO: 5).
Em geral, quando um par ortogonal reconhecer um códon seletor e carregar um aminoácido em resposta ao códon seletor, o par ortogonal é conhecido por "suprimir" o códon seletor. Ou seja, um códon seletor que não seja reconhecido pelo mecanismo endógeno do sistema de translação (por exemplo, das células) não é normalmente carregado, o que resulta em produção de bloqueio de um polipeptídeo que, de outro modo, seria transladado a partir do ácido nucléico. Em um sistema de par ortogonal, o O-RS aminoacila o O-tRNA com um aminoácido não-natural específico. O O-tRNA carregado reconhece o códon seletor e suprime o bloqueio translacional causado pelo códon seletor.
Em alguns aspectos, um O-tRNA da invenção reconhece um códon seletor e inclui ao menos, por exemplo, uma eficiência de supressão de cerca de 45%, 50%, 60%, 75%, 80% ou 90% ou superior na presença de uma sintetase cognata em resposta a um códon seletor comparada à eficiência de supressão de um O-tRNA que compreende, ou codificado por, uma seqüência polinucleotídica conforme apresentado na listagem de seqüência do presente documento.
Em algumas modalidades, a eficiência de supressão da O-RS e do O-tRNA juntos é, por exemplo, cerca de 5, 10, 15, 20 ou 25 vezes ou superior que a eficiência de supressão do O-tRNA isento de O-RS. Em alguns aspectos, a eficiência de supressão da O- RS e do O-tRNA juntos é, por exemplo, de ao menos cerca de 35%, 40%, 45%, 50%, 60%, 75%, 80%, ou 90% ou maior da eficiência de supressão de um par de sintetase ortogonal conforme apresentado nas listagens de seqüência do presente documento.
A célula hospedeira usa o par de O-tRNA/O-RS para incorporar o aminoácido não- natural em uma cadeia polipeptídica em desenvolvimento, por exemplo, através de um ácido nucléico que compreende um polinucleotídeo que codifique um polipeptídeo de interesse, onde o polinucleotídeo compreende um códon seletor que seja reconhecido pelo O-tRNA. Em determinados aspectos preferenciais, a célula pode incluir um ou mais pares adicionais de O-tRNA/O-RS, onde o O-tRNA adicional é carregado pela O-RS adicional com um aminoácido não-natural diferente. Por exemplo, um dos O-tRNAs pode reconhecer um códon de quatro bases e o outro O-tRNA pode reconhecer um códon de parada. De maneira alternativa, múltiplos códons de parada diferentes ou múltiplos códons de quatro bases diferentes podem ser usados no mesmo ácido nucléico codificador.
Conforme notado, em algumas modalidades, existem múltiplos pares de O-tRNA/O- RS em uma célula ou em outro sistema de translação, o que permite a incorporação de mais de um aminoácido não-natural em um polipeptídeo. Por exemplo, a célula pode incluir, ainda, um par adicional diferente de O-tRNA/O-RS e um segundo aminoácido não-natural, onde este O-tRNA adicional reconhece um segundo códon seletor e esta O-RS adicional aminoacila, de preferência, o O-tRNA com o segundo aminoácido não-natural. Por exemplo, uma célula que inclua um par de O-tRNA/O-RS (onde o O-tRNA reconhece, por exemplo, um códon seletor âmbar) pode compreender, ainda, um segundo par ortogonal, onde o segundo O-tRNA reconhece um códon seletor diferente, por exemplo, um códon opala, um códon de quatro bases, ou similares. De maneira desejável, os diferentes pares ortogonais são derivados a partir de diferentes fontes, o que pode facilitar o reconhecimento de diferentes códons seletores. Em determinadas modalidades, os sistemas compreende uma célula, como uma célula E. coli, que inclui um tRNA ortogonal (O-tRNA), uma aminoacil-tRNA sintetase ortogonal (O-RS)1 um aminoácido não-natural e um ácido nucléico que compreende um polinucleotídeo que codifique um polipeptídeo de interesse, onde o polinucleotídeo compreende o códon seletor que é reconhecido pelo O-tRNA. O sistema de translação pode ser, também, um sistema isento de células, por exemplo, qualquer um entre uma variedade de sistemas de transcrição/translação "in vitro" comercialmente disponíveis em combinação com um par de O-tRNA/O-RS e um aminoácido não-natural conforme descrito no presente documento.
O O-tRNA e/ou a O-RS podem ocorrer naturalmente ou podem, por exemplo, ser derivados por mutação de um tRNA e/ou RS de ocorrência natural, por exemplo, gerando-se bibliotecas de tRNAs e/ou bibliotecas de RSs, a partir de uma variedade de organismos e/ou utilizando-se uma variedade de estratégias de mutação disponíveis. Por exemplo, uma estratégia para produção de um par de tRNA ortogonal/aminoacil-tRNA sintetase envolve a importação de um par de tRNA heterólogo (à célula hospedeira)/sintetase, por exemplo, a partir de uma fonte que não seja a célula hospedeira, ou múltiplas fontes, na célula hospedeira. As propriedades do candidato de sintetase heteróloga incluem, por exemplo, que ele não carregue nenhum tRNA de célula hospedeira, e as propriedades do candidato de tRNA heterólogo incluem, por exemplo, que ele não seja amionoacilado por nenhuma sintetase de célula hospedeira. Além disso, o tRNA heterólogo é ortogonal a todas as sintetases de hospedeira. Uma segunda estratégia para geração de um par ortogonal envolve a geração de bibliotecas de mutantes a partir da qual se varre/seleciona um O-tRNA ou O-RS. Essas estratégias também podem ser combinadas.
tRNA ortogonal (O-tRNA)
Um tRNA ortogonal (O-tRNA) da invenção media, de maneira desejável, a incorporação de um aminoácido não-natural em uma proteína que seja codificada por um polinucleotídeo que por sua vez compreenda um códon seletor que seja reconhecido pelo O-tRNA, por exemplo, in vivo ou in vitro. Em determinadas modalidades, um O-tRNA da invenção inclui ao menos, por exemplo, cerca de 45%, 50%, 60%, 75%, 80% ou 90% ou superior de eficiência de supressão na presença de uma sintetase cognata em resposta a um códon seletor quando comparado a um O-tRNA que compreende, ou codificado, por uma seqüência polinucleotídica conforme apresentado nas seqüências de O-tRNA na listagem de seqüências do presente documento.
A eficiência de supressão pode ser determinada por uma série de ensaios conhecidos na técnica. Por exemplo, um ensaio de gene repórter de /3-galactosidase pode ser usado, por exemplo, um plasmídeo de lacZ derivado (onde a construção tem um códon seletor η na seqüência de ácido nucléico lacZ) é introduzido nas células a partir de um organismo adequado (por exemplo, um organismo em que os componentes ortogonais possam ser usados) junto a um plasmídeo que compreende um O-tRNA da invenção. Pode- se introduzir, também, uma sintetase cognata (como um polipeptídeo ou como um polinucleotídeo que codificam a sintetase cognata quando expressa). As células são cultivadas em um meio até que uma densidade desejada seja obtida, por exemplo, até um OD600 de cerca de 0,5, e realizam-se ensaios de β-galactosidase, por exemplo, utilizando-se o Kit de Ensaio de β-Galactosidase BetaFluor™ (Novagen). A supressão percentual pode ser calculada como a porcentagem da atividade para uma amostra relativa a um controle comparável, por exemplo, o valor observado a partir da construção de lacZ derivada, onde a construção tem um códon com sentido correspondente em posição desejada ao invés de um códon seletor.
Exemplos de O-tRNAs da invenção são apresentados na listagem de seqüência, por exemplo, consulte a FIGURA 9 e a SEQ ID NO: 1. A descrição do presente documento proporciona, também, o projeto de espécies de O-tRNA equivalentes adicionais. Em uma molécula de RNA, como um mRNA O-RS, ou molécula de O-tRNA, a timina (T) é substituída por uracila (U) relativa a uma determinada seqüência (ou vice-versa para DNA codificador), ou complemento da mesma. As modificações adicionais às bases também podem estar presentes para gerar moléculas funcionalmente equivalentes em grandes medidas.
A invenção abrange, também, as variações conservativas de O-tRNAs correspondentes aos O-tRNAs particulares do presente documento. Por exemplo, as variações conservativas de O-tRNA incluem as moléculas que funcionam como os O-tRNAs particulares, por exemplo, conforme consta na listagem de seqüência do presente documento e que mantêm a estrutura do tRNA em formato de L em virtude de uma auto- complementaridade apropriada, porém, não têm uma seqüência idêntica a elas, por exemplo, na listagem de seqüência ou FIGURA 9, e, de maneira desejável, são outras que não as moléculas de tRNA do tipo selvagem.
A composição que compreende um O-tRNA pode incluir, ainda, uma aminoacil- tRNA sintetase ortogonal (O-RS), onde a O-RS aminoacila, de preferência, o O-tRNA com um aminoácido não-natural. Em determinadas modalidades, uma composição que inclui um O-tRNA pode incluir, ainda, um sistema de translação (por exemplo, in vitro ou in vivo). Um ácido nucléico que compreende um polinucleotídeo que codifica um polipeptídeo de interesse, onde o polinucleotídeo compreende um códon seletor que seja reconhecido pelo O-tRNA, ou uma combinação de um ou mais desses também pode estar presente na célula.
Os métodos de produção de um tRNA ortogonal (O-tRNA) também consistem em uma característica da invenção. Um O-tRNA produzido pelo método também consiste em uma característica da invenção. Em determinadas modalidades da invenção, os O-tRNAs podem ser produzidos gerando-se uma biblioteca de mutantes. A biblioteca de tRNAs mutantes pode ser gerada utilizando-se várias técnicas de mutagênese conhecidas na técnica. Por exemplo, os tRNAs mutantes podem ser gerados por mutações sítio- específicas, mutações em pontos aleatórios, recombinação homóloga, embaralhamento de DNA ou outros métodos recursivos de mutagênese, construção quimérica ou qualquer combinação destes, por exemplo, do O-tRNA da SEQ ID NO: 1.
Podem-se introduzir mutações adicionais em posição(ões) específica(s), por exemplo, em posição(ões) não-conservativa(s), ou em uma posição conservativa, em posição(ões) aleatória(s), ou uma combinação de ambas em uma alça ou região desejada de um tRNA, por exemplo, uma alça de anticódon, a haste aceptora, braço ou alça D, alça variável, braço ou alça TPC, outras regiões da molécula de tRNA, ou uma combinação destas. Tipicamente, as mutações em um tRNA incluem a mutação da alça de anticódon de cada membro da biblioteca de tRNAs mutantes de modo a permitir o reconhecimento de um códon seletor. O método pode incluir, ainda, adicionar seqüências adicionais ao O-tRNA. Tipicamente, um O-tRNA possui um aperfeiçoamento de ortogonalidade para um organismo desejado comparado ao material de partida, por exemplo, a pluralidade de seqüências de tRNA, enquanto preserva sua afinidade voltada a uma RS desejada.
Os métodos incluem, opcionalmente, analisar a similaridade (e/ou homologia inferida) de seqüências de tRNAs e/ou aminoacil-tRNA sintetases de modo a determinar os candidatos em potencial para um O-tRNA, O-RS e/ou pares dos mesmos, que aparentam ser ortogonais para um organismo específico. Podem-se utilizar programas computacionais conhecidos na técnica e aqui descritos para a análise, por exemplo, programas BLAST e PILEUP podem ser usados. Em um exemplo, para escolher os componentes translacionais ortogonais em potencial destinados ao uso em E. coli, escolhe-se uma sintetase e/ou um tRNA que não exibam uma similaridade próxima de seqüência aos organismos eubacterianos.
Tipicamente, um O-tRNA é obtido submetendo-se, por exemplo, à seleção negativa, uma população de células de uma primeira espécie, em que as células compreendem um membro da pluralidade de O-tRNAs em potencial. A seleção negativa elimina as células que compreendem um membro da biblioteca de O-tRNAs em potencial que é aminoacilada por uma aminoacil-tRNA sintetase (RS) que por sua vez é endógena à célula. Isso fornece um lago de tRNAs que são ortogonais à célula da primeira espécie.
Em determinadas modalidades, na seleção negativa, códon(s) seletor(es) é(são) introduzido(s) em um polinucleotídeo que codifica um marcador de seleção negativa, por exemplo, uma enzima que confira resistência antibiótica, por exemplo, yff-lactamase, uma enzima que confira um produto detectável, por exemplo, /?-galactosidase, cloranfenicol acetil transferase (CAT), por exemplo, um produto tóxico, tal como barnase, em uma posição não- essencial (por exemplo, ainda produzindo uma barnase funcional), etc. A varredura/seleção é opcionalmente realizada cultivando-se a população de células na presença de um agente seletivo (por exemplo, um antibiótico, como a ampicillina). Em uma modalidade, a concentração do agente de seleção é variada.
Por exemplo, para medir a atividade de tRNAs supressores, utiliza-se um sistema de seleção que seja baseado na supressão in vivo do códon seletor, por exemplo, mutações sem sentido (por exemplo, de parada) ou deslocação de quadro de leitura introduzidas em um polinucleotídeo que codifique um marcador de seleção negativa, por exemplo, um gene para /Hactamase (bla). Por exemplo, constroem-se variantes de polinucleotídeo, por exemplo, variantes de bla, com um códon seletor em uma determinada posição (por exemplo, A184). As células, por exemplo, bactérias, são transformadas com esses polinucleotídeos. No caso de um tRNA ortogonal, que pode ser eficazmente carregado por sintetases E. coli endógenas, a resistência antibiótica, por exemplo, a resistência à ampicillina, deveria ser cerca de ou menor que para uma bactéria transformada sem plasmídeos. Se o tRNA não for ortogonal, ou se uma sintetase heteróloga capaz de carregar o tRNA for co-expressa no sistema, um nível maior de resistência a antibióticos, por exemplo, ampicillina, será observado. As células, por exemplo, bactérias, escolhidas são as incapazes de crescer em placas de Agar LB com concentrações antibióticas quase iguais às células transformadas sem plasmídeos.
No caso de um produto tóxico (por exemplo, ribonuclease ou barnase), quando um membro da pluralidade de tRNAs em potencial for aminoacilado por um hospedeiro endógeno, por exemplo, Escherichia coli sintetases (isto é, não é ortogonal ao hospedeiro, por exemplo, Escherichia coli sintetases), o códon seletor é suprimido e o produto tóxico de polinucleotídeo produzido leva à morte celular. As células que se abrigam em tRNAs ortogonais ou tRNAs não-funcionais sobrevivem.
Em uma modalidade, o lago de tRNAs que são ortogonais a um organismo desejado são, então submetidas a uma seleção positiva em que um códon seletor é colocado em um marcador de seleção positiva, por exemplo, codificado por um gene resistente a drogas, como um gene de /Mactamase. A seleção positiva é realizada em uma célula que compreende um polinucleotídeo que codifica ou compreende um membro do lago de tRNAs que sejam ortogonais à célula, um polinucleotídeo que codifica um marcador de seleção positiva e um polinucleotídeo que codifica um RS cognato. Em determinadas modalidades, a segunda população de células compreende células que não foram eliminadas pela seleção negativa. Os polinucleotídeos são expressos em uma célula e a mesma é cultivada na presença de um agente de seleção, por exemplo, ampicillina. Os tRNAs são, então, selecionados por sua capacidade em serem aminoacilados pela sintetase cognata co-expressa e inserir um aminoácido em resposta a este códon seletor. Tipicamente, essas células mostram um aprimoramento em eficiência de supressão comparada às células que se abrigam em tRNA(s) não-funcionais, ou tRNAs que não possam ser reconhecidos, de maneira eficaz, pela sintetase de interesse. A célula que se abriga em tRNAs ou tRNAs não-funcionais que não são eficazmente reconhecidos pela sintetase de interesse, são sensíveis a antibióticos. Portanto, os tRNAs que: (i) não sejam substratos para hospedeiros endógenos, por exemplo, Escherichia coli. sintetases; (ii) possam ser aminoacilados pela sintetase de interesse; e (iii) sejam funcionais em translação, sobrevivem a ambas as seleções.
Conseqüentemente, o mesmo marcador pode ser um marcador positivo ou negativo, dependendo do contexto no qual ele é varrido. Ou seja, o marcador é um marcador positivo se ele for varrido, porém, um marcador negativo se varrido novamente.
O rigor da seleção, por exemplo, da seleção positiva, da seleção negativa ou de ambas, nos métodos descritos acima, inclui, opcionalmente, a variação do rigor de seleção. Por exemplo, pelo fato de a barnase ser uma proteína extremamente tóxica, o rigor da seleção negativa pode ser controlado introduzindo-se diferentes números de códons seletores no gene de barnase e/ou utilizando-se um promoter induzível. Em outro exemplo, a concentração do agente de seleção ou varredura é variada (por exemplo, concentração de ampicillina). Em alguns aspectos da invenção, o rigor é variado pelo fato de a atividade desejada poder ser baixa durante ciclos anteriores. Portanto, quanto menos critérios de seleção rigorosos forem aplicados em ciclos anteriores, mais critérios rigorosos são aplicados em ciclos posteriores de seleção. Em determinadas modalidades, a seleção negativa, a seleção positiva ou ambas podem ser repetidas múltiplas vezes. Podem-se utilizar múltiplos marcadores de seleção negativa diferentes, marcadores de seleção positiva ou ambos. Em determinadas modalidades, o marcador de seleção positiva e o marcador de seleção negativa podem ser iguais.
Outros tipos de seleções/varreduras podem ser usados na invenção com o intuito de produzir componentes translacionais ortogonais, por exemplo, um O-tRNA, uma O-RS e um par de O-tRNA/O-RS que carregam um aminoácido não-natural em resposta a um códon seletor. Por exemplo, o marcador de seleção negativa, o marcador de seleção positiva ou tanto o marcador de seleção positiva como o marcador de seleção negativa podem incluir um marcador que exiba fluorescência ou catalise uma reação Iuminescente na presença de um reagente adequado. Em outra modalidade, um produto do marcador é detectado por classificação celular ativada por fluorescência (FACS) ou por luminescência. Opcionalmente, o marcador inclui uma afinidade baseada em marcador de varredura. Consulte, também, Francisco et al., (1993) "Production and fluorescence-activated cell sorting of Escherichia coli expressing a functional antibody fragment on the externai surface," Proc Natl Acad Sd USA. 90:10444-10448. Podem-se encontrar métodos adicionais para produção de um tRNA recombinante ortogonal, por exemplo, nas Publicações Internacionais WO 2002/086075, intitulada "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS;" WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" e WO 2005/019415, depositada em 7 de julho de 2004. Consulte, também, Forster et al., (2003) "Programming peptidomimetic synthetases by translating genetic codes designed de novo," PNAS 100(ll):6353-6357; e, Feng et al, (2003), "Expanding tRNA recognition of a tRNA synthetase by a single amino acid change," PNAS 100(10):5676-5681.
Aminoacil-tRNA sintetase ortogonal (O-RS)
Uma O-RS da invenção aminoacila, de preferência, um O-tRNA com um aminoácido não-natural, in vitro ou in vivo. Uma O-RS da invenção pode ser proporcionada ao sistema de translação, por exemplo, uma célula, por um polipeptídeo que inclua uma O- RS e/ou por um polinucleotídeo que codifique uma O-RS ou uma porção da mesma. Por exemplo, uma O-RS exemplar compreende uma seqüência aminoacídica conforme apresentado na SEQ ID NO: 4, ou uma variação conservativa da mesma. Em outro exemplo, uma O-RS, ou uma porção da mesma, é codificada por uma seqüência polinucleotídica que codifica um aminoácido que compreende uma seqüência na listagem de seqüência ou nos exemplos do presente documento, ou uma seqüência polinucleotídica complementar da mesma. Consulte, por exemplo, o polinucleotídeo da SEQ ID NO: 5.
Os métodos para identificação de uma aminoacil-tRNA sintetase ortogonal (O-RS), por exemplo, uma O-RS, para uso com um O-tRNA, também são uma característica da invenção. Por exemplo, um método inclui submeter à seleção, por exemplo, seleção positiva, uma população de células de uma primeira espécie, em que as células compreendem individualmente: 1) um membro de uma pluralidade de aminoacil-tRNA sintetases (RSs), (por exemplo, a pluralidade de RSs pode incluir RSS mutantes, RSs derivadas de uma espécie que não seja a primeira espécie ou tanto as RSs mutantes como as RSs derivadas de uma espécie que não seja a primeira espécie); 2) o tRNA ortogonal (O- tRNA) (por exemplo, a partir de uma ou mais espécies); e 3) um polinucleotídeo que codifica um marcador de seleção (por exemplo, positiva) e compreende ao menos um códon seletor. As células são selecionadas ou varridas para as que apresentam um aprimoramento em eficiência de supressão comparadas às células isentas ou com uma quantidade reduzida do membro da pluralidade de RSs. A eficiência de supressão pode ser medida por técnicas conhecidas na técnica e conforme aqui descrito. As células dotadas de um aprimoramento em eficiência de supressão compreendem uma RS ativa que aminoacila o O-tRNA. Um nível de aminoacilação (in vitro ou in vivo) pela RS ativa de um primeiro conjunto de tRNAs das primeiras espécies é comparado ao nível de aminoacilação (in vitro ou in vivo) pela RS ativa de um segundo conjunto de tRNAs da segunda espécie. O nível de aminoacilação pode ser determinado por uma substancia detectável (por exemplo, um aminoácido não-natural marcado). A RS ativa que aminoacila com mais eficiência o segundo conjunto de tRNAs comparado ao primeiro conjunto de tRNAs é tipicamente selecionada, proporcionando, assim, uma aminoacil-tRNA sintetase ortogonal eficiente (otimizada) para uso com o O- tRNA. Uma O-RS, identificada pelo método, também consiste em uma característica da invenção.
Pode-se utilizar uma série de ensaios para determinar a aminoacilação. Esses ensaios podem ser realizados in vitro ou in vivo. Por exemplo, os ensaios de aminoacilação in vitro são descritos, por exemplo, em Hoben and Soil (1985,) Methods Enzymol. 113:55-59. A aminoacilação também pode ser determinada utilizando-se um gene repórter junto aos componentes de translação ortogonal e detectando-se o gene repórter em uma célula que expressa um polinucleotídeo compreendendo ao menos um códon seletor que codifique uma proteína. Consulte, também, WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" e WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE."
A O-RS identificada pode ser adicionalmente manipulada com a finalidade de alterar a especificidade de substrato da sintetase, de tal modo que apenas um aminoácido não-natural desejado, porém nenhum dos 20 aminoácidos comuns, seja carregado ao O- tRNA. Os métodos para gerar uma aminoacil-tRNA sintetase ortogonal com uma especificidade de substrato para um aminoácido não-natural incluem a mutação da sintetase, por exemplo, no sítio ativo na sintetase, no sítio de mecanismo de edição na sintetase, em diferentes sítios combinando-se diferentes domínios de sintetases, ou similares, e aplicando-se um processo de seleção. Utiliza-se uma estratégia, que é baseada na combinação de uma seleção positiva seguida por uma seleção negativa. Na seleção positiva, a supressão do códon seletor introduzido em posição(ões) não-essencial(is) de um marcador positivo permite que as células sobrevivam sob uma pressão de seleção positiva. Tanto na presença de aminoácidos naturais como na presença de aminoácidos não- naturais, os sobreviventes codificam as sintetases ativas que carregam o tRNA supressor ortogonal com um aminoácido natural ou aminoácido não-natural. Na seleção negativa, a supressão de um códon seletor introduzido em posição(ões) não-essencial(is) de um marcador negativo remove as sintetases com especificidades de aminoácido natural. Os sobreviventes da seleção negativa e da seleção positiva codificam as sintetases que aminoacilam (carregam) o tRNA supressor ortogonal apenas com aminoácidos não-naturais. Essas sintetases podem, então, ser submetida à outra mutagênese, por exemplo, embaralhamento de DNA ou outros métodos recursivos de mutagênese. Pode-se gerar uma biblioteca de O-RSs mutantes através do uso de várias técnicas de mutagênese conhecidas na técnica. Por exemplo, as RSs mutantes podem ser geradas por mutações sítio-específicas, mutações em pontos aleatórios, recombinação homóloga, embaralhamento de DNA ou outros métodos recursivos de mutagênese, construção quimérica ou qualquer combinação dos mesmos. Por exemplo, uma biblioteca de RSs mutantes pode ser produzida a partir de duas ou mais outras, por exemplo, "sub-bibliotecas" menores e menos diversas. As bibliotecas quiméricas de RSs também estão inclusas na invenção. Deve-se notar que as bibliotecas de tRNA sintetases de vários organismos (por exemplo, microorganismo, como eubactérias ou archaebactérias) como as bibliotecas que compreendem diversidade natural (consulte, por exemplo, a Patente U.S. No. 6.238.884 por Short et al.\ a Patente U.S. No. 5.756.316 por Schallenberger et al.\ a Patente U.S. No. 5.783.431 por Petersen et al.\ a Patente U.S. No. 5.824.485 por Thompson et al.\ a Patente U.S. No. 5.958.672 por Short et al), são opcionalmente construídas e varridas para pares ortogonais.
Uma vez que as sintetases forem submetidas à estratégia de seleção positiva e negativa/varredura, essas sintetases podem, então, ser submetidas a uma mutagênese adicional. Por exemplo, um ácido nucléico que codifica a O-RS pode ser isolado; um conjunto de polinucleotídeos que codifica as O-RSs mutantes (por exemplo, por mutagênese aleatória, mutagênese sítio-específica, recombinação ou qualquer combinação dos mesmos) pode ser gerado a partir do ácido nucléico; e, essas etapas individuais ou uma combinação dessas etapas pode ser repetida até que uma O-RS mutante seja obtida que aminoacila, de preferência, o O-tRNA com o aminoácido não-natural. Em alguns aspectos da invenção, as etapas são realizadas múltiplas vezes, por exemplo, ao menos duas vezes.
Podem-se utilizar, também, níveis adicionais de rigor de seleção/varredura nos métodos da invenção, com a finalidade de produzir O-tRNA, O-RS1 ou pares dos mesmos. O rigor de seleção ou varredura pode ser variado em uma ou mais etapas do método para produzir uma O-RS. Este pode incluir, por exemplo, a variação da quantidade de agente de seleção/varredura que é utilizada, etc. Pode-se realizar, também ciclos adicionais de seleções positivas e/ou negativas. A seleção ou varredura podem compreender, também, uma alteração na permeabilidade de aminoácidos, uma alteração na eficiência de translação, uma alteração na fidelidade translacional, etc. Tipicamente, a uma ou mais alterações são baseadas em uma mutação em um ou mais genes em um organismo no qual um par de tRNA ortogonal-tRNA sintetase é usado para produzir proteínas.
Os detalhes gerais adicionais para produção de O-RS, e alterar a especificidade do substrato da sintetase podem ser encontrados na Publicação Interna Número WO 2002/086075, intitulada "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SINTHETASE PAIRS; " e WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE." Consulte, também, Wang and Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed., 44(1):34-66 (2005), sendo que os conteúdos destas estão aqui incorporados em sua totalidade a título de referência.
FONTE E ORGANISMOS HOSPEDEIROS
Os componentes translacionais ortogonais (O-tRNA e O-RS) da invenção podem ser derivados a partir de qualquer organismo (ou uma combinação de organismos) para uso em um sistema de translação hospedeiro a partir de quaisquer outras espécies, com a condição de que os componentes de O-tRNA/O-RS e o sistema hospedeiro trabalhem de maneira ortogonal. Isto não consiste em uma condição que o O-tRNA e a O-RS a partir de um par ortogonal seja derivado a partir do mesmo organismo. Em alguns aspectos, os componentes ortogonais são derivados a partir de genes Archaea (isto é, archaebactérias) para uso em um sistema hospedeiro eubacteriano.
Por exemplo, o O-tRNA ortogonal pode ser derivado a partir de um organismo Archae, por exemplo, uma archaebactéria, tal como Methanococcus jannaschii, Methanobacterium thermoautotrophieum, Halobacterium1 tal como Haloferax voleanii and Halobaeterium speeies NRC-I, Archaeoglobus fulgidus, Pyroeoecus furiosus, Pyroeoceus horikoshii, Aeuropyrum pernix, Methanoeoeeus maripaludis, Methanopyrus kandleri, Methanosareina mazei (Mm), Pyrobaeulum aerophilum, Pyroeoceus abyssi, Sulfolobus solfatarieus (Ss), Sulfolobus tokodaii, Thermoplasma aeidophilum, Thermoplasma voleanium, ou similares, ou uma eubaetéria, como Escherichia coli, Thermus thermophilics, Bacillus subtilis, Bacillus stearothermphilus, ou similares, enquanto a O-RS ortogonal pode ser derivada a partir de um organismo ou combinação de organismos, por exemplo, uma archaebactéria, tal como Methanoeoeeus jannaschii, Methanobacterium thermoautotrophieum, Halobacterium, tal como Haloferax voleanii e Halobacterium espécie NRC-1, Archaeoglobus fulgidus, Pyroeoceus furiosus, Pyroeoceus horikoshii, Aeuropyrum pernix, Methanoeoeeus maripaludis, Methanopyrus kandleri, Methanosarcina mazei, Pyrobaculum aerophilum, Pyroeoceus abyssi, Sulfolobus solfatarieus, Sulfolobus tokodaii, Thermoplasma aeidophilum, Thermoplasma voleanium, ou similares, ou uma eubaetéria, tal como Escherichia coli, Thermus thermophilus, Bacillus subtilis, Bacillus stearothermphilus, ou similares. Em uma modalidade, as fontes eucarióticas, por exemplo, vegetais, algas, protistas, fungos, leveduras, animais (por exemplo, mamíferos, insetos, artrópodes, etc.), ou similares, também podem ser usadas como fontes de O-tRNAs e O-RSs.
Os componentes individuais de um par de O-tRNA/O-RS podem ser derivados a partir do mesmo organismo ou a partir de organismos diferentes. Em uma modalidade, o par de O-tRNA/O-RS devida a partir do mesmo organismo. Alternativamente, o O-tRNA e a O- RS do par de O-tRNA/O-RS derivam a partir de organismos diferentes. O O-tRNA, a O-RS ou o par de O-tRNA/O-RS podem ser selecionados ou varridos in vivo ou in vitro e/ou usados em uma célula, por exemplo, uma célula eubacteriana, com a finalidade de produzir um polipeptídeo com um aminoácido não-natural. A célula eubacteriana usada não se limita, por exemplo, a Escherichia coli, Thermus thermophilus, Bacillus subtilis, Bacillus stearothermophilus, ou similares. As composições de células eubacterianas que compreendem componentes translacionais da invenção também consistem em uma característica da invenção.
Consulte, também, a Publicação Internacional Número WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE," depositada em 16 de abril de 2004, para varredura de O-tRNA e/ou O-RS em uma espécie para uso em outras espécies.
Muito embora os sistemas de translação ortogonais (por exemplo, que compreendem uma O-RS, um O-tRNA e um aminoácido não-natural) possam utilizar células hospedeiras cultivadas para produzir proteínas dotadas de aminoácidos não-naturais, não se pretende que um sistema de translação ortogonal da invenção necessite de uma célula hospedeira viável intacta. Por exemplo, um sistema de translação ortogonal pode utilizar um sistema isento de células na presença de um extrato celular. De fato, o uso de sistemas de transcrição in wíro/translação isentos de células para a produção de proteínas consiste em uma técnica bem estabelecida. A adaptação desses sistemas in vitro para produzir proteínas com aminoácidos não-naturais, que utilizam componentes de sistema de translação ortogonal aqui descrito, encontra-se no escopo da invenção.
CÓDONS SELETORES
Os códons seletores da invenção expandem a estrutura genética de códons do mecanismo biossintético de proteínas. Por exemplo, um códon seletor inclui, por exemplo, um único códon de três bases, um códon sem sentido, como um códon de parada, por exemplo, um códon âmbar (UAG), ou um códon opala (UGA), um códon não-natural, ao menos um códon de quatro bases, um códon raro, ou similares. Uma série de códons seletores pode ser introduzida em um gene desejado, por exemplo, um ou mais, dois ou mais, mais de três, etc. Utilizando-se diferentes códons seletores, múltiplos pares de mtRNA ortogonal/sintetase podem ser usados, permitindo uma incorporação sítio-específica simultânea de múltiplos aminoácidos não-naturais, por exemplo, incluindo um aminoácido não-natural, que utiliza diferentes códons seletores
Em uma modalidade, os métodos envolvem o uso de um códon seletor que seja um códon de parada para a incorporação de um aminoácido não-natural in vivo em uma célula. Por exemplo, produz-se um O-tRNA que reconheça o códon de parada e seja amionacilado por uma O-RS com um aminoácido não-natural. Este O-tRNA não é reconhecido pelas aminoacil-tRNA sintetases de hospedeiro de ocorrência natural. Pode-se utilizar a mutagênese sítio-direcionada convencional para introduzir o códon de parada no sítio de interesse em um polinucleotídeo que codifica um polipeptídeo de interesse. Consulte, por exemplo, Sayers et al. (1988), "5\3' Exonuclease in phosphorothioate-based oligonucleotide- directed mutagenesis," Nucleic Acids Res, 791-802. Quando a O-RS1 o O-tRNA e o ácido nucléico que codifica um polipeptídeo de interesse forem combinados, por exemplo, in vivo, o aminoácido não-natural é incorporado em resposta ao códon de parada de modo a fornecer um polipeptídeo contendo o aminoácido não-natural na posição específica. Em uma modalidade da invenção, o códon de parada usado como um códon seletor é um códon âmbar, UAG, e/ou um códon opala, UGA. Em um exemplo, um código genético, em que o UAG e UGA são utilizados como um códon seletor, pode codificar 22 aminoácidos enquanto preserva o códon sem sentido ocre, UAA, que é o sinal de terminação mais abundante.
A incorporação de aminoácidos não-naturais in vivo pode ser realizada sem perturbação significativa da célula hospedeira. Por exemplo, em células não-eucarióticas, como Escherichia coii, pelo fato de a eficiência de supressão para o códon UAG depender da competição entre o O-tRNA, por exemplo, o tRNA supressor âmbar, e o fator de liberação 1 (RFI) (que se liga ao códon UAG e inicia a liberação do peptídeo em desenvolvimento do ribossomo), a eficiência de supressão pode ser modulada, por exemplo, aumentando-se o nível de expressão de O-tRNA, por exemplo, o tRNA supressor, ou utilizando-se uma cepa deficiente RFI. Em células eucarióticas, pelo fato de a eficiência de supressão para o códon UAG depender da competição entre o O-tRNA, por exemplo, o tRNA supressor âmbar, e um fato de liberação eucariótico (por exemplo, eRF) (que se liga a um códon de parada e inicia a liberação do peptídeo em desenvolvimento do ribossomo), a eficiência de supressão pode ser modulada, por exemplo, aumentando-se o nível de expressão de O-tRNA, por exemplo, o tRNA supressor. Além disso, podem-se apresentar, também, compostos adicionais, por exemplo, agentes de redução, como ditiotreitol (DTT).
Os aminoácidos não-naturais também podem ser codificados com códons raros. Por exemplo, quando a concentração de arginina em uma reação de síntese de proteínas in vitro for reduzida, o códon de arginina raro, AGG, se provou eficaz para inserção de Ala por um tRNA sintético acilado com alanina. Consulte, por exemplo, Ma et al. (1993), Biochemistry 32:7939. Neste caso, o tRNA sintético compete com o tRNAArg de ocorrência natural, que existe como uma espécie secundária em Escherichia coli. Além disso, alguns organismos não usam todos os códons de terceto. Um códon AGA não-atribuído em Micrococcus Iuteus foi utilizado para inserção de aminoácidos em um extrato de transcrição/translação in vitro. Consulte, por exemplo, Kowal and Oliver (1997), Nucl. Acid. Res., 25:4685. Os componentes da invenção podem ser gerados para que utilizem esses códons raros in vivo.
Os códons seletores podem compreender, também, códons estendidos, códons de quatro ou mais bases, como, códons de quatro, cinco, seis ou mais bases. Os exemplos de códons de quatro bases incluem, por exemplo, AGGA, CUAG, UAGA, CCCU1 e similares. Exemplos de códons de cinco bases incluem, por exemplo, AGGAC, CCCCU, CGCUC, CUAGA, CUACU, UAGGC e similares. Os métodos da invenção incluem códons estendidos baseados em supressão de deslocação de quadro de leitura. Os códons de quatro ou mais bases podem inserir, por exemplo, um ou múltiplos aminoácidos não-naturais, na mesma proteína. Em outras modalidades, as alças de anticódon podem decodificar, por exemplo, ao menos um códon de quatro bases, ao menos um códon de cinco bases, ou ao menos um códon de seis bases ou mais. Visto que existem 256 códons de quatro bases possíveis, múltiplos aminoácidos não-naturais podem ser codificados na mesma célula utilizando-se um códon de quatro ou mais bases. Consulte, também, Anderson et al, (2002) "Exploring the Limits of Codon and Anticodon Size," Chemistry and Biology, 9:237-244; e, Magliery, (2001) "Expanding the Genetic Code: Selection of Efficient Suppressors of Four-base Codons and Identification of "Shifty" Four-base Codons with a Library Approach in Escherichia coli," J. Mol Biol, 307:755-769.
Por exemplo, os códons de quatro bases têm sido usados para incorporar aminoácidos não-naturais em proteínas utilizando-se métodos biossintéticos in vitro. Consulte, por exemplo, Ma et al., (1993) Biochemistry1 32:7939; and Hohsaka et al, (1999) J. Am. Chem. Soe, 121:34. Utilizaram-se CGGG e AGGU para incorporar simultaneamente 2- naftilalanina e um derivado de NBD de Iisina em estreptavidina in vitro com dois tRNAs supressores de deslocação de quadro de leitura quimicamente acilados. Consulte, por exemplo, Hohsaka et al, (1999) 7. Am. Chem. Soe, 121:12194. Em um estudo in vivo, Moore et al. examinou a capacidade de derivados de tRNALeu com anticódons de NCUA em suprimir códons de UAGN (N pode ser U1 A, G ou C), e descobriu que o UAGA quádruplo pode ser decodificado por um tRNALeu com um anticódon de UCUA com uma eficiência de 13 a 26% com pequena decodificação no quadro O ou -1. Consulte Moore et al, (2000) /. Mol Biol, 298:195. Em uma modalidade, os códons estendidos baseados em códons raros ou códons sem sentido podem ser usados na invenção, podendo reduzir a transleitura sem sentido e a supressão de deslocação de leitura de quadro em outros sítios indesejados. Utilizaram-se códons de quatro bases como códons seletores em uma variedade de sistemas ortogonais. Consulte, por exemplo, WO 2005/019415; WO 2005/007870 e WO 2005/07624. Consulte, também, Wang and Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed., 44(l):34-66 (2005), o conteúdo deste encontra-se aqui incorporado em sua totalidade a título de referência. Embora os exemplos abaixo utilizem um códon seletor âmbar, podem-se utilizar, também códons de quatro ou mais bases, modifieando-se os exemplos de modo a incluir O-tRNAs de quatro bases e sintetases modificadas de modo a incluir mutações similares às descritas anteriormente para várias O- RSs de aminoácido não-natural. Para um determinado sistema, um códon seletor pode incluir, também, um dos códons naturais de três bases, onde o sistema endógeno não utiliza (ou usa raramente) o códon de base natural. Por exemplo, isto inclui um sistema que é isento de um tRNA que reconhece o códon natural de três bases, e/ou um sistema em que o códon de três bases é um códon raro.
Os códons seletores incluem, opcionalmente, pares de base não-natural. Esses pares de base não-natural expandem, ainda, o alfabeto genético existente. Um par de base extra aumenta o número de códons de terceto de 64 para 125. As propriedades de terceiros pares de base incluem pareamento de base estável e seletivo, incorporação enzimática eficaz em DNA com alta fidelidade por uma polimerase, e a eficiência continuou a extensão primária após a síntese do par de base não-natural inicial. As descrições dos pares de base não-natural que podem ser adaptados para métodos e composições incluem, por exemplo, Hirao et al, (2002) "An unnatural base pair for incorporating amino acid analogues into protein," Nature Biotechnology, 20:177-182. Consulte, também, Wu et al, (2002) J. Am. Chem. Soe. 124:14626-14630. Outras publicações relevantes são listadas abaixo.
Para uso in vivo, o nucleosídio não-natural tem uma membrana permeável e é fosforilado de modo a formar o trifosfato correspondente. Além disso, a informação genética crescente é estável e não destruída por enzimas celulares. As tentativas anteriores realizadas por Benner e outros se aproveitaram de padrões de ligação de hidrogênio que são diferentes dos padrões em pares canônicos de Watson-Crick, o exemplo mais digno de atenção é o par de iso-C:iso-G. Consulte, por exemplo, Switzer et al, (1989) J. Am. Chem. Soe, 111:8322; e Piccirilli et al, (1990) Nature, 343:33; Kool (2000) Curr. Opin. Chem. Bioll 4:602. Em geral, essas bases se desemparelham até certo grau com bases naturais e não podem ser enzimaticamente replicadas. Kool e parceiros demonstraram que as interações de empacotamento hidrofóbico entre as bases podem substituir a ligação de hidrogênio de modo a induzir a formação do par de base. Consulte, Kool (2000) Curr. Opin. Chem. Biol, 4:602; e Guckian and Kool, (1998) Angew. Chem. Int. Ed. Ingl, 36, 2825. Em uma tentativa em desenvolver um par de base não-natural que satisfaça todas as exigências anteriores, Schultz, Romesberg e parceiros sintetizaram e estudaram sistematicamente uma série de bases hidrofóbicas não-naturais. Descobriu-se que um auto-par de PICS:PICS é mais estável do que os pares de base natural, e podem ser eficazmente incorporados ao DNA por fragmento de Klenow de polimerase de DNA de Escherichia coli I (KF). Consulte, por exemplo, McMinn et al, (1999) J. Am. Chem. Soc1 121:11586; e Ogawa et al, (2000) J. Am. Chem. Soc1 122:3274. Um auto-par de 3MN:3MN pode ser sintetizado por KF com eficiência e seletividade suficiente para função biológica. Consulte, por exemplo, Ogawa et al, (2000) J. Am. Chem. Soe, 122:8803. No entanto, ambas as bases atuam como um terminador de cadeia para replicação adicional. Desenvolveu-se, recentemente, uma polimerase de DNA mutante que pode ser usada para replicar o auto-par de PICS. Além disso, um auto-par de 7AI pode ser replicado. Consulte, por exemplo, Tae et al, (2001) /. Am. Chem. Soe, 123:7439. Um par de metalobase inusitado, Dipic:Py, também foi desenvolvido, formando um par adequado mediante a ligação Cu(II). Consulte Meggers et al, (2000) /. Am. Chem.
Soe, 122:10714. Pelo fato de os códons estendidos e os códons não-naturais serem intrinsecamente ortogonais aos códons naturais, os métodos da invenção podem se aproveitar desta propriedade para gerar tRNA ortogonais para eles.
Pode-se utilizar, também, um sistema de contorno translacional para incorporar um aminoácido não-natural em um polipeptídeo desejado. Em um sistema de contorno translacional, uma grande seqüência é inserida em um gene, porém, não é transladado em proteína. A seqüência contém uma estrutura que serve como uma sugestão para induzir o ribossomo para saltar sobre a seqüência e resume a translação a jusante da inserção.
AMINOÁCIDOS NÃO-NATURAIS
Conforme o uso em questão, um aminoácido não-natural refere-se a qualquer aminoácido, aminoácido modificado, ou aminoácido análogo que não seja selenocisteina e/ou pirrolisina e os seguintes vinte alfa-aminoácidos geneticamente codificados: alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutâmico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptofano, tirosina, valina. A estrutura genética de um alfa-aminoácido é ilustrada pela Fórmula I:
<formula>formula see original document page 35</formula>
Tipicamente, um aminoácido não-natural consiste em qualquer estrutura tendo a Fórmula I, sendo que o grupo R é qualquer substituinte que não seja o usado nos vinte aminoácidos naturais. Consulte, por exemplo, Biochemistry por L. Stryer, 3a ed. 1988, Freeman and Company, Nova York, EUA para estruturas dos vinte aminoácidos naturais. Nota-se que os aminoácidos não-naturais da invenção podem ser compostos de ocorrência natural que não sejam os vinte alfa-aminoácidos anteriores.
Devido ao fato de os aminoácidos não-naturais da invenção serem tipicamente diferentes dos aminoácidos naturais na cadeia lateral, os aminoácidos não-naturais formam ligações de amida com outros aminoácidos, por exemplo, naturais ou não-naturais, da mesma maneira em que eles são formados em proteínas de ocorrência natural. No entanto, os aminoácidos não-naturais têm grupos de cadeia lateral que os distinguem dos aminoácidos naturais.
O aminoácido de interesse particular do presente documento é o aminoácido de cumarina não-natural L-(7-hidroxicumarin-4-il) etilglicina (também escrito como 7- hidroxicumarina-etilglicina; consulte a FIGURA 1, estrutura 1). Além do aminoácido não- natural7-hidroxicumarina-etilglicina, outros aminoácidos não-naturais podem ser simultaneamente incorporados a um polipeptídeo de interesse, por exemplo, utilizando-se um segundo par de O-RS/O-tRNA adequado com conjunto com um par ortogonal proporcionado pela presente invenção. Muitos desses aminoácidos não-naturais adicionais e pares ortogonais adequados são conhecidos. Consulte a presente descrição e as referências aqui citadas. Por exemplo, consulte Wang and Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed., 44(l):34-66 (2005); Xie and Schultz, "An Expanding Genetic Code," Métodos 36(3):227-238 (2005); Xie and Schultz, "Adding Amino Acids to the Genetic Repertoire," Curr. Opinion in Chemical Biology 9(6):548~554 (2005); e Wang et al., "Expanding the Genetic Code," Ahnu. Rev. Biophys. Biomol. Struct., 35:225-249 (2006); sendo que os conteúdos destes encontram-se aqui incorporados em sua totalidade a título de referência.
Muito embora o aminoácido de cumarina não-natural L-(7-hidroxicumarin-4-il) etilglicina (mostrado na FIGURA 1, estrutura 1) seja de interesse primário nos exemplos aqui descritos, não se pretende que a invenção seja estritamente limitada a esta estrutura. De fato, pode-se produzir, prontamente, uma variedade de análogos estruturalmente relacionados e facilmente derivados que retenha a característica principal de fluorescência, e também sejam especificamente reconhecidos pelas aminoacil-tRNA sintetases da invenção (por exemplo, a O-RS da SEQ ID NO: 4). Pretende-se que esses análogos fluorescentes relacionados estejam no escopo da invenção.
Em outros aminoácidos não-naturais, por exemplo, R na Fórmula I compreende opcionalmente um alquil-, aril-, acil-, hidrazina, ciano-, halo-, hidrazida, alquenil, éter, borato, boronato, fosfo, fosfono, fosfina, enona, imina, éster, hidroxilamina, amina, e similares, ou qualquer combinação destes. Outros aminoácidos não-naturais de interesse incluem, mas não se limitam a, aminoácidos que compreendem um reticulador fotoativável, aminoácidos marcadores de spin, aminoácidos fluorescentes, aminoácidos de ligação metálica, aminoácidos contendo metal, aminoácidos radioativos, aminoácidos com grupos funcionais inusitados, aminoácidos que interagem covalente ou não-covalentemente com outras moléculas, aminoácidos foto-engaiolados e/ou fotoisomerizável, aminoácidos contendo biotina ou biotina análoga, aminoácidos contendo ceto, aminoácidos glicosilados, uma porção de sacarídeo ligada à cadeia lateral aminoacídica, aminoácidos que compreendem polietileno glicol ou poliéter, aminoácidos substituídos por átomo pesado, aminoácidos quimicamente clivável ou foto-clivável, aminoácidos com uma cadeia lateral alongada comparada aos aminoácidos naturais (por exemplo, poliéteres ou hidrocarbonetos de cadeia longa, por exemplo, maior que cerca de 5, maior que cerca de 10 carbonos, etc.), aminoácidos contendo açúcar ligado por carbono, aminoácidos contendo amino tioácidos e aminoácidos contendo uma ou mais porções tóxicas. Em outro aspecto, a invencao proporciona aminoacidos nao-naturais tendo a estrutura geral ilustrada pela Formula IV abaixo:
<formula>formula see original document page 37</formula>
Um aminoácido não-natural tendo esta estrutura é tipicamente qualquer estrutura onde R1 é um substituinte usado em um dos vinte aminoácidos naturais (por exemplo, tirosina ou fenilalanina) e R2 é um substituinte. Portanto, este tipo de aminoácido não-natural pode ser observado como um derivado de aminoácido natural.
Além dos aminoácidos não-naturais que contém a cadeia lateral de cumarina, como mostrado na FIGURA 1, estrutura 1, os aminoácidos não-naturais também podem opcionalmente compreender estruturas de cadeia principal modificada, por exemplo, conforme ilustrado pelas estruturas das Fórmulas II e III:
<formula>formula see original document page 37</formula>
onde Z compreende, tipicamente, OH1 NH2, SH1 NH-R', ou S-R'; XeY, que podem ser iguais ou diferentes, compreendem ,tipicamente, S ou O, e R e R', que são opcionalmente iguais ou diferentes, são tipicamente selecionados da mesma lista de constituintes para o grupo R descrito anteriormente para os aminoácidos não-naturais tendo a Fórmula I bem como hidrogênio. Por exemplo, os aminoácidos não-naturais da invenção compreendem, opcionalmente, substituições no grupo amino ou carboxila conforme ilustrado pelas Fórmulas II e III. Os aminoácidos não-naturais deste tipo incluem, mas não se limitam a, ácidos σ-hidróxi, σ-tioácidos σ-aminotiocarboxilatos, por exemplo, com cadeias laterais correspondentes aos vinte aminoácidos naturais ou cadeias laterais não-naturais. Além disso, as substituições no σ-carbono incluem, opcionalmente, aminoácidos L, D, ou a-a- dissubstituídos, como D-glutamato, D-alanina, D-metil-O-tirosina, ácido aminobutírico, e similares. Outras alternativas estruturais incluem aminoácidos cíclicos, como análogos de prolina, bem como, análogos de prolina de anel com 3,4,6,7,8 e 9 membros, aminoácidos β e γ, como B-alanina substituída e ácido γ-amino butírico. Em alguns aspectos, a invenção utiliza aminoácidos não-naturais na configuração L. No entanto, não se pretende que a invenção seja limitada ao uso de aminoácidos não- naturais de configuração L. Contempla-se que os D-enantiômeros destes aminoácidos não- naturais também encontram uso na invenção.
Os aminoácidos não-naturais que encontram uso na invenção não são estritamente limitados ao aminoácido de cumarina não-natural L-(7-hidroxicumarin-4-il) etilglicina. Um indivíduo versado na técnica reconhecerá que uma ampla variedade de análogos não- naturais de aminoácidos de ocorrência natural é facilmente derivada. Por exemplo, mas sem limitar-se a, os não-naturais derivados a partir de tirosina são prontamente produzidos. Os análogos de tirosina incluem, por exemplo, tirosinas para-substituídas, tirosinas orto- substituídas e tirozinas meta-substituídas, sendo que a tirosina substituída compreende um grupo alquinila, um grupo acetila, um grupo benzoíla, um grupo amino, uma hidrazina, uma hidroxiamina, um grupo tiol, um grupo carbóxi, um grupo isopropila, um grupo metila, um hidrocarboneto C6 a C2o de cadeia linear ou ramificada, um hidrocarboneto saturado ou insaturado, um grupo 0-metila, um grupo poliéter, um grupo nitro, ou similares. Além disso, contemplam-se, também, múltiplos anéis de arila substituída. Os análogos de glutamina da invenção incluem, mas não se limitam a, derivados de σ-hidróxi, derivados γ-substituídos, derivados cíclicos e derivados de glutamina substituídos de amina. Exemplos de análogos de fenilalanina incluem, mas não se limitam a, fenilalaninas para-substituídas, fenilalaninas orto-substituídas e fenilalaninas meta-substituídas, sendo que o substituinte compreende um grupo alquinila, um grupo hidróxi, um grupo metóxi, um grupo metila, um grupo alila, um aldeído, um nitro, um grupo tiol, ou grupo ceto, ou similares. Exemplos específicos de aminoácidos não-naturais incluem, mas não se limitam a, p-etiltiocarbonil-L-fenilalanina, p- (3- oxobutanoil)-L-fenilalanina, 1,5-dansil-alanina, aminoácido 7-amino-cumarina, aminoácido 7-hidróxi-cumarina, nitrobenzil-serina, 0-(2-nitrobenzil)-L-tirosina, p- carboximetil-L-fenilalanina, p-ciano-L-fenil alanina, m-ciano-L-fenilalanina, bifenilalanina, 3- amino-L-tirosina, bipiridil alanina, p-(2-amino-l-hidroxietil)-L- fenilalanina, p- isopropiltiocarbonil-L-fenilalanina, 3-nitro-L-tirosina e p-nitro-L-fenilalanina. Também, uma p- propargiloxifenilalanina, uma 3,4-diidróxi-L-fenialanina (DHP), uma 3, 4, 6-triidroxi-L- fenilalanina, uma 3,4,5-triidroxi-L-fenilalanina, 4-nitro- fenilalanina, uma p-acetil-L- fenilalanina, O-metil-L-tirosina, uma L-3-(2-naftil)alanina, uma 3-metil-fenilalanina, uma 0-4- alil-L-tirosina, uma 4-propil-L-tirosina, uma 3-nitro-tirosina, uma 3-tiol-tirosina, um tri-O-acetil- GlcNAc/?-serina, uma L-Dopa, uma fenilalanina fluorada, uma isopropil-L-fenilalanina, uma p-azido-L-fenilalanina, uma p-acil-L-fenilalanina, uma p-benzoil-L-fenilalanina, uma L- fosfoserina, uma fosfonoserina, uma fosfonotirosina, uma p-iodo-fenilalanina, uma p- bromofenilalanina, uma p-amino-L-fenilalanina e uma isopropil-L-fenilalanina, e similares. As estruturas de uma variedade de aminoácidos não-naturais são descritas nas referências aqui citadas. Consulte, também, as Publicações Internacionais WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" e WO 2006/110182, depositada em 27 de outubro de 2005, intitulada "ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS."
Síntese Química de Aminoácidos não-naturais
Muitos dos aminoácidos não-naturais proporcionados anteriormente encontram-se comercialmente disponíveis, por exemplo, junto à Sigma (EUA) ou Aldrich (Milwaukee, Wl, EUA). Os que não se encontram comercialmente disponíveis são opcionalmente sintetizados conforme proporcionado em várias publicações ou utilizando-se métodos padrão conhecidos aos versados na técnica. Para técnicas de síntese orgânica, consulte, por exemplo, Organic Chemistry por Fessendon and Fessendon, (1982, Segunda Edição, Willard Grant Press, Boston, Mass., EUA); Advanced Organic Chemistry por March (terceira edição, 1985, Wiley and Sons, Nova York, EUA); e Advanced Organic Chemistry por Carey and Sundberg (Terceira Edição, Partes AeB, 1990, Plenum Press, Nova York, EUA). As publicações adicionais que descrevem a síntese de aminoácidos não-naturais incluem, por exemplo, a WO 2002/085923 intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS," Matsoukas et al, (1995) J. Med. Chem., 38:4660-4669; King and Kidd (1949) "A New Synthesis of Glutamine and of γ-Dipeptides of Glutamic Acid from Phthilated Intermediates," J. Chem. Soe, 3315-3319; Friedman and Chatterrji (1959) "Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents," J. Am. Chem. Soe. 81:3750-3752; Craig et al (1988) "Absolute Configuration of the Enantiomers of 7-Chloro-4 [[4-(diethylamino)-l-methylbutyl]amino]quinoline (ChIoroquine)," J. Org. Chem. 53:1167-1170; Azoulay et al., (1991) "Glutamine analogues as Potential Antimalarials," Eur. J. Med. Chem. 26:201-205; Koskinen and Rapoport, (1989) "Synthesis of 4-Substituted Prolines as Conformation ally Constrained Amino Acid Analogues," J. Org. Chem. 54:1859-1866; Christie and Rapoport (1985) "Synthesis of Optieally Pure Pipecolates from L-Asparagine. Application to the Total Synthesis of (+)-Apovincamine through Amino Acid Decarbonilation and Iminium Ion Cyclization," J. Org. Chem. 1989:1859-1866; Barton et al, (1987) "Synthesis of Novel σ-Amino-Acids and Derivatives Using Radical Chemistry: Synthesis of L- and D- a- Amino-Adipic Acids1 L-o-aminopimelic Acid and Appropriate Unsaturated Derivatives," Tetrahedron Lett. 43:4297-4308; e, Subasinghe et al, (1992) "Quisqualic acid analogues: synthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site," J. Med. Chem. 35:4602-7. Consulte, também, a Publicação Internacional WO 2004/058946, intitulada "PROTEIN ARRAYS," depositada em 22 de dezembro de 2003.
Absorção Celular de Aminoácidos Não-Naturais A absorção de aminoácido não-natural por uma célula é uma questão que é tipicamente considerada quando se projeta e seleciona aminoácidos não-naturais, por exemplo, para incorporação em uma proteína. Por exemplo, a densidade de alta carga de a- aminoácidos sugere que esses compostos improvavelmente penetrem nas células. Os aminoácidos naturais são recolhidos na célula através de uma coleção de sistemas de transporte baseados em proteínas exibindo, muitas vezes, graus variáveis de especificidade aminoacídica. Pode-se realizar uma rápida separação avaliando-se quais aminoácidos não- naturais, se existentes, são recolhidos pelas células. Consulte, por exemplo, os ensaios para determinação de toxidade, por exemplo, na Publicação Internacional WO 2004/058946, intitulada "PROTEIN ARRAYS," depositada em 22 de dezembro de 2003; e Liu and Schultz (1999) "Progress toward the evolution of an organism with an expanded genetic code," PNAS 96:4780-4785. Muito embora a absorção seja facilmente analisada por diversos ensaios, uma alternativa para projetar aminoácidos não-naturais, que sejam influenciáveis à absorção celular, consiste em proporcionar trajetórias biossintéticas com a finalidade de criar aminoácidos in vivo.
Biossíntese de Aminoácidos Não-Naturais
Já existem muitas trajetórias biossintéticas em células para a produção de aminoácidos e outros compostos. Embora um método biossintético para um aminoácido não-natural particular possa não existir na natureza, por exemplo, em uma célula, a invenção proporciona esses métodos. Por exemplo, as trajetórias biossintéticas para aminoácidos não-naturais são, opcionalmente, geradas na célula hospedeira mediante a adição de novas enzimas ou modificando-se as trajetórias existentes da célula hospedeira. As novas enzimas adicionais são, opcionalmente, enzimas de ocorrência natural ou enzimas artificialmente desenvolvidas. Por exemplo, a biossíntese de p-aminofenilalanina (conforme apresentado em um exemplo na WO 2002/085923) depende da adição de uma combinação de enzimas conhecidas a partir de outros organismos. Os genes para essas enzimas podem ser introduzidos em uma célula transformando-se a célula com um plasmídeo que compreenda os genes. Os genes, quando expressos na célula, proporcionam uma trajetória enzimática para sintetizar o composto desejado. Exemplos dos tipos de enzimas, que são opcionalmente adicionadas, são proporcionados nos exemplos abaixo. As seqüências enzimáticas adicionais são encontradas, por exemplo, nos banco de dados Genbank. As enzimas artificialmente desenvolvidas também são opcionalmente adicionadas em uma célula da mesma maneira. Desta forma, o mecanismo celular e as fontes de uma célula são manipulados de modo a produzir aminoácidos não-naturais.
De fato, pode-se utilizar uma variedade de métodos para produção de enzimas inusitadas destinadas ao uso em trajetórias biossintéticas, ou destinadas à avaliação de trajetórias existentes, para a produção de aminoácidos não-naturais, in vitro ou in vivo. Muitos métodos disponíveis e outros componentes de trajetória biossintética podem ser aplicados à presente invenção com a finalidade de produzir aminoácidos não-naturais (ou, de fato, desenvolver sintetases para que tenham novas especificidades de substratos ou outras atividades de interesse). Por exemplo, o embaralhamento de DNA é opcionalmente usado para desenvolver enzimas inusitadas e/ou trajetórias dessas enzimas para a produção de aminoácidos não-naturais (ou produção de novas sintetases), in vitro ou in vivo. Consulte, por exemplo, Stemmer (1994), "Rapid evolution of a protein in vitro by DNA shuffling," Nature 370(4):389-391; e, Stemmer, (1994) "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution," Proc. Natl. Acad. ScL USA., 91:10747-10751. Uma abordagem relacionada embaralha famílias de genes relacionados (por exemplo, homólogos) para desenvolver rapidamente as enzimas com características desejadas. Um exemplo desses métodos de "embaralhamento de gene familiar" é encontrado em Crameri et al. (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature, 391(6664): 288-291. Podem-se gerar, também, novas enzimas (sejam componentes de trajetórias biossintéticas ou sintetases) através do uso de um procedimento de recombinação de DNA conhecido como "truncamento incrementai para a criação de enzimas híbridas" ("TTCHY"), por exemplo, conforme descrito em Ostermeier et al. (1999) "A combinatorial approach to hybrid enzymes independent of DNA homology" Nature Biotech 17:1205. Esta abordagem pode, também, ser usada para gerar uma biblioteca ou outras variantes de trajetória que possam servir como substratos para um ou mais métodos de recombinação in vitro ou in vivo. Consulte, também, Ostermeier et al. (1999) "Combinatorial Protein Engineering by Incrementai Truncation," Proc. Natl. Acad. Sei. USA, 96: 3562-67, e Ostermeier et al. (1999), "Incrementai Truncation as a Strategy in the Engineering of Novel Biocatalysts," Biological and Medicinal Chemistry, 7: 2139-44. Outra abordagem usa mutagênese de conjunto exponencial para produzir bibliotecas ou outras variantes de trajetória que, por exemplo, sejam selecionadas por uma capacidade em catalisar uma reação biossintética relevante para produzir um aminoácido não-natural (ou uma nova sintetase). Nesta abordagem, pequenos grupos de resíduos em uma seqüência de interesse são dispostos aleatoriamente em paralelo de modo a identificar, em cada posição modificada, os aminoácidos que conduzem às proteínas funcionais. Exemplos desses procedimentos, que podem ser adaptados à presente invenção, com a finalidade de produzir novas enzimas para produção de aminoácidos não-naturais (ou novas sintetases) são encontrados em Delegrave and Youvan (1993) Biotechnology Research 11:1548-1552. Ainda em outra abordagem, pode-se utilizar mutagênese aleatória ou semi-alheatória que utiliza oligonucleotídeos dopados ou degenerados para modificar geneticamente a enzima e/ou o componente de trajetória, por exemplo, utilizando-se os métodos gerais de mutagênese, por exemplo, de Arkin and Youvan (1992) "Optimizing nucleotide mixtures to encode specific subsets of amino acids for semi-random mutagenesis" Biotechnology 10:297-300; or Reidhaar-Olson et al. (1991) "Random mutagenesis of protein sequences using oligonucleotide cassettes" Methods Enzymol. 208:564-86. Pode-se utilizar ainda outra abordagem, geralmente, denominada como mutagênese "não-estocástica", que utiliza mutagênese de reunião de polinucleotídeos e mutagênese sítio-saturada, para produzir enzimas e/ou componentes de trajetória, que podem, então, ser classificados por uma capacidade de realizar uma ou mais sintetases ou funções de trajetória biossintética (por exemplo, para a produção de aminoácidos não- naturais in vivo). Consulte, por exemplo, Short "NON-STOCHASTIC GENERATION OF GENETIC VACCINES AND ENZYMES" WO 00/46344.
Uma alternativa a esses métodos mutacionais envolve a recombinação de todos os genomas de organismos e a seleção de progênie resultante para funções de trajetória particulares (geralmente denominada como "embaralhamento genômico completo"). Esta abordagem pode ser aplicada à presente invenção, por exemplo, por recombinação e seleção genômica de um organismo (por exemplo, uma E. coli ou outra célula) por uma capacidade em produzir um aminoácido não-natural (ou intermediário do mesmo). Por exemplo, os métodos ensinados nas seguintes publicações podem ser aplicados ao projeto de trajetória para a avaliação de trajetórias existentes e/ou novas em células com a finalidade de produzir aminoácidos não-naturais in vivo: Patnaik et al. (2002) "Genome shuffling of Iactobacillus for improved acid tolerance" Nature Biotechnology, 20(7): 707-712; and Zhang et al. (2002) "Genome shuffling leads to rapid phenotypic improvement in bactéria" Nature, 7 de fevereiro, 415(6872): 644-646.
Outras técnicas para modificar geneticamente organismos e trajetórias metabólicas, por exemplo, para a produção de compostos desejados também se encontram disponíveis e podem ser aplicadas à produção de aminoácidos não-naturais. Exemplos de publicações que ensinam as abordagens de modificação por engenharia genética de trajetórias incluem: Nakamura and White (2003) "Metabolic engineering for the microbial production of 1,3 propanediol" Curr. Opin. Biotechnol. 14(5):454-9; Berry et al. (2002) "Application of Metabolic Engineering to improve both the production and use of Biotech índigo" /. Industrial Microbiology and Biotechnology 28:127-133; Banta et al. (2002) "Optimizing an artificial metabolic pathway: Engineering the cofactor specificity of Corynebacterium 2,5-diketo-D- gluconic acid reductase for use in vitamin C biosynthesis" Biochemistry1 41(20), 6226-36; Selivonova et al. (2001) "Rapid Evolution of Novel Traits in Microorganisms" Applied and Environmental Microbiology, 67:3645, e muitos outros.
Independentemente do método usado, tipicamente, o aminoácido não-natural produzido por uma trajetória biossintética modificada por engenharia genética da invenção é produzido em uma concentração suficiente para biossíntese protéica eficaz, por exemplo, uma magnitude celular natural, porém, não até um grau para afetar significativamente a concentração de outros aminoácidos celulares ou esgotar as fontes celulares. As concentrações típicas produzidas in vivo desta maneira consistem em cerca de 10 a cerca de 0,05 mM. Visto que uma célula é modificada por engenharia genética com o intuito de produzir enzimas desejadas para uma trajetória específica e um aminoácido não-natural é gerado, as seleções in vivo são opcionalmente usadas para otimizar adicionalmente a produção do aminoácido não-natural tanto para síntese de proteína ribossômica como para o crescimento celular.
Componentes Ortoqonais para Incorporação de Aminoácidos Não-Naturais
A invenção proporciona composições e métodos para produção de componentes ortogonais que incorporem o aminoácido não-natural L-(7-hidroxicumarin-4-il) etilglicina (consulte a FIGURA 1, estrutura 1) em uma cadeia polipeptídica em desenvolvimento em resposta a um códon seletor, por exemplo, um códon de parada âmbar, um códon sem sentido, um códon com quatro ou mais bases, etc., por exemplo, in vivo. Por exemplo, a invenção proporciona tRNAs ortogonais (O-tRNAs), aminoacil-tRNA sintetases ortogonais (O-RSs) e pares dos mesmos. Esses pares podem ser usados para incorporar um an aminoácido não-natural em cadeias polipeptídicas em desenvolvimento.
Uma composição da invenção inclui uma aminoacil-tRNA sintetase ortogonal (O- RS), onde a O-RS aminoacila, de preferência, um O-tRNA com 7-hidroxicumarina-etilglicina. Em determinadas modalidades, a O-RS compreende uma seqüência aminoacídica que compreende a SEQ ID NO: 4, e variações conservativas desta. Em determinadas modalidades da invenção, a O-RS aminoacila, de preferência, o O-tRNA por qualquer tRNA endógeno com um aminoácido não-natural particular, onde a O-RS tem uma tendenciosidade para o O-tRNA, e onde a razão entre o O-tRNA carregado com o aminoácido não-natural e o tRNA endógeno carregado com o mesmo aminoácido não- natural é maior que 1:1, e, com mais preferência, onde a O-RS carrega o O-tRNA exclusivamente ou quase exclusivamente
Uma composição que inclua uma O-RS pode incluir opcionalmente, ainda, um tRNA ortogonal (O-tRNA), onde o O-tRNA reconhece um códon seletor. Tipicamente, um O-tRNA da invenção inclui ao menos cerca de, por exemplo, uma eficiência de supressão de 45%, 50%, 60%, 75%, 80%, 90% ou superior na presença de uma sintetase cognata em resposta a um códon seletor comparada à eficiência de supressão de um O-tRNA que compreende ou é codificada por uma seqüência polinucleotídica conforme apresentado nas listagens de seqüência (por exemplo, SEQ ID NO: 1) e nos exemplos do presente documento. Em uma modalidade, a eficiência de supressão da O-RS e do O-tRNA juntos é, por exemplo, de 5, 10, 15, 20, 25 vezes ou superior que a eficiência de supressão do O-tRNA na ausência de uma O-RS. Em alguns aspectos, a eficiência de supressão da O-RS e do O-tRNA juntos é de ao menos 45% da eficiência de supressão de um par de tirosil-tRNA sintetase ortogonal derivado a partir de Methanococcus jannaschii.
Uma composição que inclua um O-tRNA pode incluir, opcionalmente, uma célula (por exemplo, uma célula eubacteriana, como uma célula E coli e similares, ou uma célula eucariótica, como uma célula de levedura), e/ou um sistema de translação.
Proporciona-se, também, uma célula (por exemplo, uma célula eubacteriana ou uma célula de levedura) que compreenda um sistema de translação pela invenção, onde o sistema de translação inclui um tRNA ortogonal (O-tRNA); uma aminoacil-tRNA sintetase ortogonal (O-RS); e, um aminoácido não-natural 7-hidroxicumarina-etilglicina. Tipicamente, a O-RS aminoacila, de preferência, o O-tRNA por qualquer tRNA endógeno com o aminoácido não-natural, onde a O-RS tem uma tendenciosidade para o O-tRNA, e onde a razão entre o O-tRNA carregado com o aminoácido não-natural e o tRNA endógeno carregado com o aminoácido não-natural é maior que 1:1, e, com mais preferência, onde a O-RS carrega o O- tRNA exclusivamente ou quase exclusivamente. O O-tRNA reconhece o primeiro códon seletor, e a O-RS aminoacila, de preferência, o O-tRNA com um aminoácido não-natural. Em uma modalidade, o O-tRNA compreende ou é codificado por uma seqüência polinucleotídica conforme apresentado na SEQ ID NO: 1, ou uma seqüência polinucleotídica complementar da mesma. Em uma modalidade, a O-RS compreende uma seqüência aminoacídica conforme apresentado na SEQ ID NO: 4, e variações conservativas da mesma.
Uma célula da invenção pode, opcionalmente, compreende um par de O-tRNA/O- RS adicional diferente e um segundo aminoácido não-natural, por exemplo, onde este O- tRNA reconhece um segundo códon seletor e esta O-RS aminoacila, de preferência, o O- tRNA correspondente com o segundo aminoácido não-natural, onde o segundo aminoácido é diferente do primeiro aminoácido não-natural. Opcionalmente, uma célula da invenção inclui um ácido nucléico que compreende um polinucleotídeo que por sua vez codifica um polipeptídeo de interesse, onde o polinucleotídeo compreende um códon seletor que é reconhecido pelo O-tRNA.
Em determinadas modalidades, uma célula da invenção consiste em uma célula eubacteriana (como, E coli), que inclui um tRNA ortogonal (O-tRNA), uma aminoacil-tRNA sintetase ortogonal (O-RS), um aminoácido não-natural e um ácido nucléico que compreende um polinucleotídeo que por sua vez codifica um polipeptídeo de interesse, onde o polinucleotídeo compreende o códon seletor que é reconhecido pelo O-tRNA. Em determinadas modalidades da invenção, a O-RS aminoacila, de preferência, o O-tRNA com o aminoácido não-natural com uma eficiência que seja maior que a eficiência com a qual a O-RS aminoacila qualquer tRNA endógeno. Em determinadas modalidades da invenção, um O-tRNA da invenção compreende ou é codificado por uma seqüência polinucleotídica conforme apresentado nas listagens de seqüência (por exemplo, SEQ ID NO: 1) ou nos exemplos do presente documento, ou uma seqüência polinucleotídica complementar desta. Em determinadas modalidades da invenção, uma O-RS compreende uma seqüência aminoacídica conforme apresentado nas listagens de seqüência, ou uma variação conservativa desta. Em uma modalidade, a O-RS ou uma porção dela é codificada por uma seqüência polinucleotídica que por sua vez codifica um aminoácido conforme apresentado nas listagens de seqüência ou nos exemplos do presente documento, ou uma seqüência polinucleotídica complementar desta.
O O-tRNA e/ou a O-RS da invenção podem ser derivados a partir de uma variedade de organismos (por exemplo, organismos eucarióticos e/ou não-eucarióticos).
Os polinucleotídeos consistem, também, em uma característica da invenção. Um polinucleotídeo da invenção (por exemplo, SEQ ID NO: 5) inclui um polinucleotídeo an artificial (por exemplo, fabricado, e de ocorrência não-natural) que compreende uma seqüência nucleotídica que por sua vez codifica um polipeptídeo conforme apresentado nas listagens de seqüência do presente documento, e/ou é complementar à seqüência polinucleotídica. Um polinucleotídeo da invenção pode incluir, também, um ácido nucléico que se hibridiza a um polinucleotídeo descrito anteriormente, sob condições altamente rigorosas, por substancialmente todo o comprimento do ácido nucléico. Um polinucleotídeo da invenção inclui, ainda, um polinucleotídeo que, por exemplo, é ao menos 75%, ao menos 80%, ao menos 90%, ao menos 95%, ao menos 98% ou mais idêntico ao polinucleotídeo de um tRNA de ocorrência natural ou ácido nucléico codificador correspondente (porém, um polinucleotídeo da invenção que não seja de um tRNA de ocorrência natural nem de um ácido nucléico codificador correspondente), onde o tRNA reconhece um códon seletor, por exemplo, um códon de quatro bases. Os polinucleotídeos artificiais são, por exemplo, ao menos 80%, ao menos 90%, ao menos 95%, ao menos 98% ou mais idênticos a qualquer um dos anteriores e/ou um polinucleotídeo que compreenda uma variação conservativa de qualquer um dos anteriores, também se encontram inclusos nos polinucleotídeos da invenção.
Os vetores que compreende um polinucleotídeo da invenção também consistem em uma característica da invenção. Por exemplo, um vetor da invenção pode incluir um plasmídeo, um cosmídeo, um fago, um vírus, um vetor de expressão e/ou algo do gênero. Uma célula que compreende um vetor da invenção também consiste em uma característica da invenção.
Os métodos de produção de componentes de um par de O-tRNA/O-RS também consistem em características da invenção. Os componentes produzidos por esses métodos também consistem em uma característica da invenção. Por exemplo, os métodos de produção de ao menos um tRNA que seja ortogonal a uma célula (OtRNA) inclui a geração de uma biblioteca de tRNAs mutantes; sofrendo mutação de uma alça de anticódon de cada membro da biblioteca de tRNAs mutantes de modo a permitir o reconhecimento de um códon seletor, proporcionando, assim uma biblioteca de O-tRNAs em potencial, e submetendo-se à seleção negativa de uma primeira população de células de uma primeira espécie, onde as células compreendem um membro da biblioteca de O-tRNAs em potencial. A seleção negativa elimina as células que compreendem um membro da biblioteca de O- tRNAs em potencial que é aminoacilado por uma aminoacil-tRNA sintetase (RS) que é endógena à célula. Isso proporciona um lago de tRNAs que são ortogonais à célula da primeira espécie, proporcionando, assim, ao menos um O-tRNA. Proporciona-se, também, um O-tRNA produzido pelos métodos da invenção.
Em determinadas modalidades, os métodos compreende, ainda, submeter a uma seleção positiva uma segunda população de células da primeira espécie, onde as células compreendem um membro do lago de tRNAs que são ortogonais à célula da primeira espécie, uma aminoacil-tRNA sintetase cognata, e um marcador de seleção positiva. Mediante o uso da seleção positiva, as células são selecionadas e classificas para as células que compreendem um membro do lado de tRNAs que é aminoacilado pela aminoacil-tRNA sintetase cognata e que mostra uma resposta desejada na presença do marcador de seleção positiva, proporcionando, assim, um O-tRNA. Em determinadas modalidades, a segunda população de células compreende células que não foram eliminadas pela seleção negativa.
Proporcionam-se, também, métodos para identificar uma aminoacil-tRNA sintetase ortogonal que carrega um O-tRNA com um aminoácido não-natural. Por exemplo, os métodos incluem submeter uma população de células de uma primeira espécie a uma seleção, onde cada uma das células compreende: 1) um membro da pluralidade de aminoacil-tRNA sintetases (RSs), (por exemplo, a pluralidade de RSs pode incluir RSS mutantes, sendo que as RSs derivam a partir de uma espécie que não seja uma primeira espécie ou tanto as RSs mutantes como as RSs derivam a partir de uma espécie que não seja uma primeira espécie); 2) o tRNA ortogonal (O-tRNA) (por exemplo, a partir de uma ou mais espécies); e 3) um polinucleotídeo que codifica um marcador de seleção positiva e compreende ao menos um códon seletor.
As células (por exemplo , uma célula hospedeira) são selecionadas ou classificadas para aquelas que mostram um aperfeiçoamento na eficiência de supressão comparadas às células isentas ou que têm uma quantidade reduzida do membro da pluralidade de RSs. Essas células selecionadas/classificadas compreendem uma RS ativa que aminoacila o O- tRNA. Uma aminoacil-tRNA sintetase ortogonal identificada pelo também consiste em uma característica da invenção. Os métodos de produção de uma proteína em uma célula (por exemplo, em uma célula eubacteriana, como a célula E. coli ou similares, ou em uma célula de levedura) que têm o aminoácido não-natural em uma posição selecionada também consistem em uma característica da invenção. Por exemplo, um método inclui o desenvolvimento, em um meio apropriado, de uma célula, onde a célula compreende um ácido nucléico que por sua vez compreende ao menos um códon seletor e codifica uma proteína, fornecendo o aminoácido não-natural, e incorporando o aminoácido não-natural na posição específica na proteína durante a translação do ácido nucléico com o ao menos um códon seletor, produzindo, assim, a proteína. A célula compreende, ainda: um tRNA ortogonal (O-tRNA) que funciona na célula e reconhece o códon seletor; e, uma aminoacil-tRNA sintetase ortogonal (O- RS) que aminoacila, de preferência, o O-tRNA com o aminoácido não-natural. Uma proteína produzida por este método também consiste em uma característica da invenção.
A invenção proporciona, também, composições que incluem proteínas, onde as proteínas compreendem 7-hidroxicumarina-etilglicina. Em determinadas modalidades, a proteína compreende uma seqüência aminoacídica que seja ao menos 75% idêntica à seqüência aminoacídica de uma proteína conhecida, por exemplo, uma proteína terapêutica, uma proteína diagnostica, uma enzima industrial, ou uma porção destas. Opcionalmente, a composição compreende um veículo farmaceuticamente aceitável.
SEQÜÊNCIAS E VARIANTES ÁCIDO NUCLÉICAS E POLIPEPTÍDICAS
Conforme descrito no presente documento, a invenção proporciona seqüências polinucleotídicas que codificam, por exemplo, O-tRNAs e O-RSs, e seqüências aminoacídicas de polipeptídeo, por exemplo, O-RSs, e, por exemplo, composições, sistemas e métodos que compreendem as ditas seqüências polinucleotídicas ou polipeptídicas. Exemplos das ditas seqüências, por exemplo, seqüências aminoacídicas e nucleotídicas de O-tRNA e O-RS são descritos no presente documento (consulte a FIGURA 9, por exemplo, SEQ ID NOs: 4 e 5). No entanto, um indivíduo versado na técnica avaliará que a invenção não se limita a essas seqüências aqui descritas, por exemplo, nos Exemplos e na listagem de seqüência. Um indivíduo versado na técnica avaliará que a invenção proporciona, também, muitas seqüências relacionadas com as funções aqui descritas, por exemplo, polinucleotídeos e polipeptídeos que codificam variantes conservativas de uma O-RS descrita no presente documento.
A construção e análise das espécies de sintetase ortogonal (O-RS) que são capazes de aminoacilar um O-tRNA com um aminoácido não-natural 7-hidroxicumarina- etilglicina são descritas nos Exemplos 3 a 5. Esses Exemplos descrevem a construção e análise das espécies de O-RS que não são capazes de incorporar o aminoácido não-natural 7-hidroxicumarina-etilglicina. A invenção proporciona polipeptídeos (O-RSs) e polinucleotídeos, por exemplo, O- tRNA, polinucleotídeos que codificam O-RSs ou porções dos mesmos, oligonucleotídeos usados para isolar os clones de aminoacil-tRNA sintetase, etc. Os polinucleotídeos da invenção incluem os que codificam as proteínas ou polipeptídeos de interesse da invenção com um ou mais códons seletores. Além disso, os polinucleotídeos da invenção incluem, por exemplo, um polinucleotídeo que compreende uma seqüência nucleotídica conforme apresentado na SEQ ID NO: 5, e um polinucleotídeo que seja complementar ou que codifique uma seqüência polinucleotídica deste. Um polinucleotídeo da invenção inclui, também, qualquer polinucleotídeo que codifique uma seqüência aminoacídica de O-RS que compreende SEQ ID NO: 4. De maneira semelhante, um ácido nucléico artificial que se hibridiza a um polinucleotídeo indicado anteriormente sob condições altamente rigorosas por substancialmente todo o comprimento do ácido nucléico (e seja diferente de um polinucleotídeo de ocorrência natural) consiste em um polinucleotídeo da invenção. Em uma modalidade, uma composição inclui um polipeptídeo da invenção e um excipiente (por exemplo, tampão, água, excipiente farmaceuticamente aceitável, etc.) A invenção proporciona, também, um anticorpo ou anti-soro especificamente imunorreativo com um polipeptídeo da invenção. Um polinucleotídeo artificial consiste em um polinucleotídeo fabricado e não tem ocorrência natural.
Um polinucleotídeo da invenção inclui, também, um polinucleotídeo artificial que seja, por exemplo, ao menos 75%, ao menos 80%, ao menos 90%, ao menos 95%, ao menos 98% ou mais idêntico ao polinucleotídeo de um tRNA de ocorrência natural, (porém, que não seja um tRNA de ocorrência natural). Um polinucleotídeo inclui, também, um polinucleotídeo artificial que seja, por exemplo, ao menos 75%, ao menos 80%, ao menos 90%, ao menos 95%, ao menos 98% ou mais idêntico (porém não 100% idêntico) ao polinucleotídeo de um tRNA de ocorrência natural.
Em determinadas modalidades, um vetor (por exemplo, um plasmídeo, um cosmídeo, um fago, um vírus, etc.) compreende um polinucleotídeo da invenção. Em uma modalidade, o vetor é um vetor de expressão. Em outra modalidade, o vetor de expressão inclui um promotor ligado, de modo operacional, a um ou mais polinucleotídeos da invenção. Em outra modalidade, uma célula compreende um vetor que inclui um polinucleotídeo da invenção.
Um indivíduo versado na técnica avaliará, também, que muitas variantes das seqüências descritas se encontram inclusas na invenção. Por exemplo, as variações conservativas das seqüências descritas que rendem uma seqüência de funcionalidade idêntica se encontram inclusas na invenção. As variantes das seqüências polinucleotídicas de ácido nucléico, em que as variantes se hibridizam a ao menos uma seqüência descrita, são consideradas inclusas na invenção. As subseqüências exclusivas das seqüências aqui descritas, conforme determinado, por exemplo, através de técnicas de comparação de seqüência padrão, também se encontram inclusas na invenção.
Variações Conservativas
Devido à degeneração do código genético, as "substituições silenciosas" (isto é, substituições em uma seqüência de ácido nucléico que não resulta em uma alteração em um polipeptídeo codificado) consistem em uma característica implícita de toda seqüência de ácido nucléico que codifica uma seqüência aminoacídica. De maneira semelhante, as "substituições aminoacídicas conservativas," onde um ou um número limitados de aminoácidos em uma seqüência aminoacídica são substituídos por diferentes aminoácidos com propriedades altamente semelhantes, são, também, prontamente identificas como sendo altamente semelhantes a uma construção descrita. Essas variações conservativas de cada seqüência descrita consistem em uma característica da presente invenção.
As "variações conservativas" de uma seqüência de ácido nucléico particular referem-se aos ácidos nucléicos que codificam seqüência aminoacídicas idênticas ou essencialmente idênticas, ou, em que o ácido nucléico não codifica uma seqüência aminoacídica; em seqüências essencialmente idênticas. Um indivíduo versado na técnica reconhecerá que substituições, apagamentos ou adições individuais que alteram, adicionam ou apagam um único aminoácido ou uma pequena porcentagem dos aminoácidos (tipicamente menor que 5%, mais tipicamente menor que 4%, 2% ou 1%) em uma seqüência codificada consistem em "variações conservativamente modificadas" onde as alterações resultam no apagamento de um aminoácido, adição de um aminoácido, ou substituição de um aminoácido por um aminoácido quimicamente similar. Portanto, as "variações conservativas" de uma seqüência polipeptídica listada da presente invenção incluem substituições de uma pequena porcentagem, tipicamente menor que 5%, mais tipicamente menor que 2% ou 1%, dos aminoácidos da seqüência polipeptídica, por um aminoácido do mesmo grupo de substituição conservativa. Finalmente, a adição de seqüências que não alteram a atividade codificada de uma molécula de ácido nucléico, tal como a adição de uma seqüência não-funcional, consiste em uma variação conservativa do ácido nucléico básico.
As tabelas de substituição conservativa que proporcionam aminoácidos funcionalmente similares são bem conhecidas na técnica, onde um resíduo de aminoácido é substituído por outro resíduo de aminoácido com propriedades químicas semelhantes (por exemplo, cadeias laterais aromáticas ou cadeias laterais positivamente carregadas), e, portanto, não alteram substancialmente as propriedades funcionais da molécula de polipeptídeo. A seguir, apresentam-se grupos exemplares que contêm aminoácidos naturais com propriedades químicas semelhantes, onde as substituições em um grupo consistem em uma "substituição conservativa". Substituições Conservativas Aminoacídicas
<table>table see original document page 50</column></row><table>
Hibridizaoão de Ácido Nucléico
Pode-se utilizar a hibridização comparativa para identificar os ácidos nucléicos da invenção, incluindo variações conservativas de ácidos nucléicos da invenção, e este método de hibridização comparativa consiste em um método preferencial para distinguir os ácidos nucléicos da invenção. Além disso, os ácidos nucléicos alvos que se hibridizam em um ácido nucléico representado por SEQ ID NO: 5, sob condições rigorosamente altas, ultra- altas e ultra-ultra altas consistem em uma característica da invenção. Exemplos desses ácidos nucléicos incluem os com uma ou algumas substituições de ácido nucléico silenciosas ou conservativas comparadas a uma dada seqüência de ácido nucléico.
Um ácido nucléico de teste é conhecido por se hibridizar especificamente em um ácido nucléico de sonda quando ele hibridizar ao menos 50% tanto à sonda como ao alvo complementar perfeitamente adaptado, isto é, com uma razão sinal para ruído igual ao menos à metade tão alta quanto a hibridização da sonda ao alvo sob condições em que a sonda perfeitamente adaptada se liga ao alvo complementar perfeitamente adaptado com uma razão de sinal para ruído que seja ao menos cerca de 5x- 10x tão alta quanto a observada para hibridização de qualquer um dos ácidos nucléicos alvos não-adaptados.
Os ácido nucléicos "se hibridizam" quando eles se associam em solução. Os ácidos nucléicos se hibridizam devido a uma variedade de forças físico-químicas bem caracterizadas, como ligação de hidrogênio, exclusão de solvente, empilhamento de base e similares. Uma diretriz extensiva à hibridização de ácidos nucléicos é encontrada em Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes, Parte I, capítulo 2, "Overview of principies of hybridization and the strategy of nucleic acid probe assays," (Elsevier, Nova York, EUA), bem como em Current Protocols in Molecular Biology, Ausubel et at, eds., Current Protocols, um empreendimento comum entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., (suplementado ao longo de 2006); Hames and Higgins (1995) Gene Probes 1, IRL Press at Oxford University Press, Oxford, Inglaterra, and Hames and Higgins (1995) Gene Probes 2, IRL Press at Oxford University Press, Oxford, Inglaterra, fornecem detalhes na síntese, rotulagem, detecção e quantificação de DNA e RNA, incluindo oligonucleotídeos. Um exemplo de condições rigorosas de hibridização para uma hibridização de ácidos nucléicos complementares que tem mais de 100 resíduos complementares em um filtro em uma técnica Southern ou Northern blot consiste em 50% de formalina com 1 mg de heparina a 42°C, sendo que a hibridização é realizada de um dia para o outro. Um exemplo de condições rigorosas de lavagem consiste em uma lavagem de 0,2x SSC a 65°C durante 15 minutos (consulte, Sambrook et al., Molecular Cloning - A Laboratory Manual (3a Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor1 Nova York, EUA, 2001, para uma descrição de tampão SSC). Geralmente, uma lavagem de alto rigor é antecedida por uma lavagem de baixo rigor com a finalidade de remover o sinal de sonda de fundo. Um exemplo de lavagem de baixo rigor é 2x SSC a 40°C durante 15 minutos. Em geral, uma razão de sinal para ruído de 5x (ou maior) que a observada para uma sonda não- relacionada no ensaio de hibridização particular indica a detecção de uma hibridização específica.
As "condições rigorosas de lavagem de hibridização" no contexto de experimentos de hibridização de ácido nucléico, como hibridizações por Southern e Northern blot dependem da seqüência, e são diferentes sob diferentes parâmetros ambientais. Uma diretriz extensiva à hibridização de ácidos nucléicos é encontrada em Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes, Parte I, Capítulo 2, "Overview of principies of hybridization and the strategy of nucleic acid probe assays," (Elsevier, Nova York, EUA); e Hames and Higgins (1995) Gene Probes 1, IRL Press at Oxford University Press, Oxford, Inglaterra, e Hames and Higgins (1995) Gene Probes 2, IRL Press at Oxford University Press, Oxford, Inglaterra. As condições rigorosas de hibridização e lavagem podem facilmente ser determinadas de maneira empírica para qualquer ácido nucléico de teste. Por exemplo, na determinação de condições rigorosas de hibridização e lavagem, as condições de hibridização e lavagem são gradualmente aumentadas (por exemplo, aumentando-se a temperatura, diminuindo-se a concentração salina, aumentando-se a concentração detergente e/ou aumentando-se a concentração de solventes orgânicos, como formalina na hibridização ou lavagem), até que um conjunto selecionado de critérios seja satisfeito. Por exemplo, em condições altamente rigorosas de hibridização e lavagem, as condições de hibridização e lavagem são gradualmente aumentadas até que uma sonda se ligue a um alvo complementar perfeitamente adaptado com uma razão de sinal para ruído que seja de ao menos 5x tão alta quanto a observada para hibridização de uma sonda a um alvo não-adaptado.
As condições "muito rigorosas" são selecionadas de modo que sejam iguais ao ponto de fusão térmica (Tm) para uma sonda particular. O Tm é a temperatura (sob resistência e pH iônicos definidos) em que 50% da seqüência de teste se hibridiza em uma sonda perfeitamente adaptada. Por propósitos da presente invenção, em geral, as condições "altamente rigorosas" de hibridização e lavagem são selecionadas de modo que seja cerca de 5°C menor que o Tm para a seqüência específica em uma resistência e pH iônicos definidos.
As condições de hibridização e lavagem "ultra alta rigorosas" são aquelas em que o rigor das condições de hibridização e lavagem são aumentadas até que a razão de sinal para ruído para ligação da sonda ao ácido nucléico alvo complementar perfeitamente adaptado seja ao menos 10x maior que as condições observadas para qualquer um dos ácidos nucléicos alvo não-adaptados. Um ácido nucléico alvo que se hibridiza em uma sonda sob essas condições, com uma razão de sinal para ruído de ao menos /4 do ácido nucléico alvo complementar perfeitamente adaptado conhecida por se ligar à sonda sob condições ultra alta rigorosas.
De maneira semelhante, podem-se determinar até mesmo níveis maiores de rigor aumentando-se gradualmente as condições de hibridização e/ou lavagem do ensaio de hibridização relevante. Por exemplo, aqueles em que o rigor das condições de hibridização e lavagem são aumentadas até que a razão de sinal para ruído para ligação da sonda ao ácido nucléico alvo complementar perfeitamente adaptado seja ao menos 10x, 20X, 50X, 100X, ou 500X ou superior às condições observadas para hibridização de qualquer um dos ácidos nucléicos alvo não-adaptados. Um ácido nucléico alvo que se hibridiza em uma sonda sob essas condições, com uma razão de sinal para ruído de ao menos /4 do ácido nucléico alvo complementar perfeitamente adaptado conhecido por se ligar à sonda sob condições ultra-ultra-alta rigorosas.
Os ácidos nucléicos que não se hibridizam entre si sob condições rigorosas ainda são substancialmente idênticos se os polipeptídeos que eles codificam forem substancialmente idênticos. Isso ocorre, por exemplo, quando uma cópia de um ácido nucléico for criada utilizando-se a máxima degeneração de códon permitida pelo código genético.
Subseqüências Exclusivas
Em alguns aspectos, a invenção proporciona um ácido nucléico que compreende uma subseqüência exclusiva em um ácido nucléico selecionado a partir de seqüências de O-tRNAs e O-RSs aqui descritos. A subseqüência exclusiva é exclusiva quando comparada a um ácido nucléico correspondente a qualquer seqüência de ácido nucléico de O-tRNA ou O-RS conhecida. O alinhamento pode ser realizado utilizando-se, por exemplo, um conjunto BLAST para parâmetros predeterminados. Qualquer subseqüência exclusiva é útil, por exemplo, como uma sonda para identificar os ácidos nucléicos da invenção ou ácidos nucléicos relacionados.
De maneira semelhante, a invenção inclui um polipeptídeo que compreende uma subseqüência exclusiva em um polipeptídeo selecionado a partir de seqüências de O-RSs aqui descritas. No presente documento, a subseqüência exclusiva é exclusiva quando comparada a um polipeptídeo correspondente a qualquer seqüência polipeptídica conhecida.
A invenção proporciona, também, ácidos nucléicos alvos que se hibridizam sob condições rigorosas em um oligonucleotídeo de codificação exclusivo que codifica uma subseqüência exclusiva em um polipeptídeo selecionado partir de seqüências de O-RSs1 sendo que a subseqüência exclusiva é exclusiva quando comparada a um polipeptídeo correspondente a qualquer um dos polipeptídeos de controle (por exemplo, seqüências parentais a partir das quais as sintetases da invenção foram derivadas, por exemplo, por mutação). As seqüências exclusivas são determinadas conforme descrito anteriormente.
Comparação. Identidade e Homoloqia Seqüencial
Os termos "idêntico" ou "identidade percentual", no contexto de duas ou mais seqüências de ácido nucléico ou polipeptídicas, se referem a duas ou mais seqüências ou subseqüências que sejam iguais ou que tenham uma porcentagem específica de resíduos de aminoácidos ou nucleotídeos que sejam iguais, quando comparados e alinhados por máxima correspondência, conforme medido utilizando-se um dos algoritmos de comparação seqüencial descritos anteriormente (ou outros algoritmos disponíveis a indivíduos versados) ou por inspeção visual.
A frase "substancialmente idêntico", no contexto de dois ácidos nucléicos ou polipeptídeos (por exemplo, DNAs que codificam um O-tRNA ou O-RS1 ou a seqüência aminoacídica de uma O-RS) se refere a duas ou mais seqüências ou subseqüências que tenham ao menos cerca de 60%, cerca de 80%, cerca de 90 a 95%, cerca de 98%, cerca de 99% ou mais de identidade de resíduo de nuclèotídeo ou aminoácido, quando comparadas e alinhadas por máxima correspondência, conforme medido utilizando-se um algoritmo de comparação seqüencial ou por inspeção visual. Essas seqüências "substancialmente idênticas" são tipicamente consideradas como sendo "homólogas", sem referência à ancestralidade real. De preferência, o termo "identidade substancial" existe em uma região das seqüências que tenha ao menos cerca de 50 resíduos em comprimento, com mais preferência, em uma região que tenha menos cerca de 100 resíduos, e com a máxima preferência, as seqüências são substancialmente idênticas em uma região que tenha ao menos cerca de 150 resíduos, ou por todo o comprimento das suas seqüências a serem comparadas.
As proteínas e/ou seqüências protéicas são "homólogas" quando elas são derivadas, natural ou artificialmente, a partir de uma proteína ou seqüência protéica ancestral comum. De maneira semelhante, os ácidos nucléicos e/ou seqüências de ácido nucléico são homólogos quando eles são derivados, natural ou artificialmente, a partir de um ácido nucléico ou seqüência de ácido nucléico ancestral comum. Por exemplo, qualquer ácido nucléico de ocorrência natural pode ser modificado por qualquer método de mutagênese conhecido por incluir um ou mais códons seletores. Quando expresso, este ácido nucléico mutagenizado codifica um polipeptídeo que compreende um ou mais aminoácidos não-naturais. O processo de mutação pode, naturalmente, alterar adicionalmente um ou mais códons padrão, alterando, assim, um ou mais aminoácidos padrão também na proteína mutante resultante. A homologia é, em geral, deduzida a partir de similaridade seqüencial entre dois ou mais ácidos nucléicos ou proteínas (ou seqüências dos mesmos). A porcentagem precisa de similaridade entre as seqüências que é útil em estabelecer uma homologia varia em relação ao ácido nucléico e à proteína em questão, porém, apenas 25% de similaridade seqüencial é rotineiramente usada para estabelecer homologia. Podem-se utilizar, também, níveis maiores de similaridade seqüencial, por exemplo, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, ou 99% ou mais para estabelecer uma homologia. Os métodos para determinação porcentagens de similaridade seqüencial (por exemplo, BLASTP e BLASTN que utilizam parâmetros predeterminados) são descritos no presente documento e se encontram genericamente disponíveis.
Para determinação de comparação e homologia seqüencial, tipicamente, uma seqüência atua como uma seqüência de referência à qual as seqüências de teste são comparadas. Mediante o uso de um algoritmo de comparação seqüencial, as seqüências de teste e referência são lançadas em um computador, coordenadas subseqüenciais são designadas, se necessário, e os parâmetros de programa de algoritmo seqüencial são designados. Então, o algoritmo de comparação seqüencial calcula a identidade seqüencial percentual para a(s) seqüência(s) de teste relativa(s) à seqüência de referência, com base nos parâmetros de programa designados.
O alinhamento otimizado de seqüências para comparação pode ser conduzido, por exemplo, pelo algoritmo de homologia local de Smith e Waterman, Adv. Appl. Math. 2:482 (1981), pelo algoritmo de alinhamento de homologia de Needleman e Wunsch, J. Mol. Biol. 48:443 (1970), pela pesquisa por método de similaridade de Pearson e Lipman, Proc. Nat'1. Acad. ScL USA 85:2444 (1988), por implementações computadorizadas desses algoritmos (GAP, BESTFIT, FASTA, e TFASTA no Pacote de Software de Genéticas de Wisconsin, Genetics Computer Group, 575 Science Dr., Madison1 Wl, EUA), ou por inspeção visual (consulte, em geral, Current Protocols in Molecular Biology, Ausubel et al., eds., Current Protocols, um empreendimento conjunto entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., suplementado ao longo de 2006).
Um exemplo de um algoritmo que é adequando para determinação de identidade seqüencial percentual e similaridade seqüencial é o algoritmo BLAST, que se encontra descrito em Altschul et al., J. Mol. Biol. 215:403-410 (1990). O software para realizar análises BLAST encontra-se publicamente disponível pelo Centro Nacional para Informações Biotecnológicas (consulte o site da Internet do NCBI). Este algoritmo envolve, primeiramente, a identificação de pares seqüenciais de alta classificação (HSPs) identificando-se pequenas palavras de comprimento W na seqüência de consulta, que se adapta ou satisfaz alguma classificação T de limite positivamente calculada quando alinhada a uma palavra de comprimento igual em uma seqüência de banco de dados. T é denominada como o limite de classificação de palavra vizinha Altschul et al (1990), J. Mol. Biol. 215:403-410. Essas palavras coincidentes de vizinhança inicial agem como origem para iniciar pesquisas para encontrar os HSPs mais longo que as contém. As palavras coincidentes são, então, estendidas em ambas as direções ao longo de cada seqüência até o ponto em que a classificação de alinhamento cumulativo possa ser aumentada. As classificações cumulativas são calculadas utilizando-se, para seqüências nucleotídicas, os parâmetros M (classificação de recompensa para um par de resíduos compatíveis; sempre > 0) e N (classificação de penalidade para resíduos não-compatíveis; sempre < 0). Para seqüências aminoacídicas, utiliza-se uma matriz de classificação para calcular a classificação cumulativa. A extensão das palavras coincidentes em cada direção é pausada quando: a classificação de alinhamento cumulativo diminui em relação à quantidade X a partir de seu máximo valor obtido; a classificação cumulativa tende a zero ou abaixo, devido ao acúmulo de um ou mais alinhamentos de resíduo com classificação negativa; ou se alcança o fim da seqüência. Os parâmetros do algoritmo BLAST W, T e X determinam a sensibilidade e velocidade do alinhamento. O programa BLASTN (para seqüências nucleotídicas) utiliza como parâmetros originais um comprimento de palavra (W) de 11, uma esperança (E) de 10, um limite de 100, M = 5, N = -4, e uma comparação de ambas as cepas. Para seqüências aminoacídicas, o programa BLASTP utiliza como parâmetros originais um comprimento de palavras (W) de 3, uma esperança (E) de 10, e a matriz de classificação BLOSUM62 (Consulte Henikoff and Henikoff (1989) Proc. Natl. Acad. Sei. USA 89:10915).
Além de calcular a identidade seqüencial percentual, o algoritmo BLAST também realiza uma análise estatística da similaridade entre as duas seqüências (consulte, por exemplo, Karlin and Altschul, Proc. Nat'l. Acad. ScL USA 90:5873-5787 (1993)). Uma medição de similaridade proporcionada pelo algoritmo BLAST é a probabilidade de menor soma (P(N))1 que proporciona uma indicação da probabilidade pela qual uma compatibilidade entre as duas seqüências nucleotídicas ou aminoacídicas ocorreriam ao acaso. Por exemplo, um ácido nucléico é considerado similar a uma seqüência de referência se a probabilidade menor soma em uma comparação do ácido nucléico de teste ao ácido nucléico de referência for menor que cerca de 0,1, com mais preferência, menor que cerca de 0,01, e, com a máxima preferência, menor que cerca de 0,001.
Mutaqênese e Outras Técnicas de Biologia Molecular Os polinucleotídeos e polipeptídeos da invenção e usados na invenção podem ser manipulados através do uso de técnicas biológicas moleculares. Os textos gerais que descrevem técnicas biológicas moleculares incluem Berger and Kimmel, "Guide to Molecular Cloning Techniques," Metods in Enzymology, volume 152, Academic Press, Inc., San Diego, CA, EUA; Sambrook et al., Molecular Cloning - A Laboratory Manual (3rd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova York, EUA, 2001 e Current Protocols in Molecular Biology, Ausubel et ah, eds., Current Protocols, um empreendimento conjunto entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., (suplementado ao longo de 2006). Esses textos descrevem mutagênese, o uso de vetores, promotores e muitos outros tópicos relevantes relacionados, por exemplo, à geração de genes que incluem códons seletores para produção de proteínas que incluem aminoácidos não-naturais, tRNA ortogonais, sintetases ortogonais, e pares destes.
Vários tipos de mutagênese são usados na invenção, por exemplo, para modificar moléculas de tRNA, produzir bibliotecas de tRNAs, produzir bibliotecas de sintetases, inserir códons seletores que codificam aminoácidos não-naturais em uma proteína ou polipeptídeo de interesse. Eles incluem, mas não se limitam a, mutagênese sítio-direcionada, mutagênese em pontos aleatórios, recombinação homóloga, embaralhamento de DNA ou outros métodos recursivos de mutagênese, construção quimérica, mutagênese que utiliza modelos contendo uracila, mutagênese oligonucleotídeo-direcionada, mutagênese de DNA fosforotioato-modificada, mutagênese que utiliza DNA dúplex interrompido ou similares, ou qualquer combinação dos mesmos. Os métodos adequados adicionais incluem o reparo de incompatibilidade pontual, mutagênese que utiliza cepas hospedeiras deficientes para reparo, seleção por restrição e purificação por restrição, mutagênese por eliminação, mutagênese por síntese genética total, reparo de quebra de fitas duplas, e similares. Por exemplo, a mutagênese que envolve construções quiméricas também está inclusa na presente invenção. Em uma modalidade, a mutagênese pode ser guiada por informações conhecidas da molécula de ocorrência natural, molécula alterada ou molécula de ocorrência natural modificada, por exemplo, seqüências, comparações seqüenciais, propriedades físicas, estrutura cristalina ou similares.
As células hospedeiras são modificadas por engenharia genética (por exemplo, transformadas, transduzidas ou transfectadas) com os polinucleotídeos da invenção ou construções que incluem um polinucleotídeo da invenção, por exemplo, um vetor da invenção, que pode ser, por exemplo, um vetor de clonagem ou um vetor de expressão. Por exemplo, as regiões de codificação para o tRNA ortogonal, tRNA ortogonal sintetase e proteína a ser derivatizada são ligadas, de modo operacional, aos elementos de controle de expressão genética que são funcionais na célula hospedeira desejada. Os vetores típicos contêm terminadores de transcrição e translação, seqüências de iniciação de transcrição e translação, e promotores úteis da expressão do ácido nucléico alvo particular. Os vetores compreendem, opcionalmente, cassetes de expressão genética que contêm ao menos uma seqüência terminadora independente, seqüências que permitem a replicação do cassete em eucariontes, ou procariontes, ou ambos (por exemplo, vetores de transferência) e marcadores de seleção tanto para sistemas procarióticos como eucarióticos. Os vetores são adequados para replicação e/ou integração em procariontes, eucariontes, ou, de preferência, ambos. Consulte Giliman and Smith, Gene 8:81 (1979); Roberts, et al., Nature, 328:731 (1987); Schneider et al, Protein Expr. Purif. 6435: 10 (1995); Berger and Kimmel, "Guide to Molecular Cloning Techniques," Metods in Enzymology, volume 152, Academic Press, Inc., San Diego, CA, EUA; Sambrook et al, Molecular Cloning - A Laboratory Manual (3a Ed.), Vol. 1-3, Cold Spring Harbor Laboratory1 Cold Spring Harbor, Nova York, EUA, 2001; e Current Protocols in Molecular Biology, Ausubel et al, eds., Current Protocols, um empreendimento conjunto entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., (suplementado ao longo de 2006). O vetor pode estar, por exemplo, sob a forma de um plasmídeo, uma bactéria, um vírus, um polinucleotídeo indefeso, ou um polinucleotídeo conjugado. Os vetores são introduzidos nas células e/ou microorganismos por métodos padrão que incluem eletroporação (From et al., Proc. Natl. Acad. ScL USA 82:5824 (1985), infecção por vetores virais, penetração balística de alta velocidade por pequenas partículas com o ácido nucléico dentro da matriz de pequenas contas ou partículas, ou sobre a superfície (Klein et al., (1987) Nature 327, 70-73), e/ou similares.
Desenvolveu-se um sistema plasmídico único altamente eficaz e versátil para incorporação sítio-específica de aminoácidos não-naturais em proteínas em resposta ao códon de parada âmbar (UAG) em E. coli. No novo sistema, o par de tRNAtyr(CUA) supressor de M. jannaschii e tirosil-tRNA sintetase é codificado em um único plasmídeo, que é compatível com a maioria dos vetores de expressão de E. coli. O operon monocistrônico de tRNA sob controle do promotor e terminador de proK foi construído para estrutura secundária otimizada e processamento de tRNA. A introdução de uma forma modificada do promotor glnS para a sintetase resultou em um aumento significativo tanto na eficiência de supressão como na fidelidade. Aumentos na eficiência de supressão também foram obtidos por múltiplas cópias de gene de tRNA bem como por uma mutação específica (D286R) na sintetase (Kobayashi et al. (2003), "Structural basis for tRNA orthogonal specificities of tyrosil-tRNA synthetases for genetic code expansion," Nat. Struct. Biol, 10(6):425-432). A generalidade do sistema otimizado também foi demonstrada por incorporação altamente eficaz e precisa de diversos aminoácidos não-naturais diferentes, cujas utilidades exclusivas no estudo de função e estrutura protéica foram previamente provadas.
Proporciona-se um catálogo de bactérias e bacteriófagos úteis para clonagem, por exemplo, pela ATCC, por exemplo, The ATCC Catalogue of Bactéria and Bacteriophage (1996) Gherna et al. (eds) publicado pela ATCC. Os procedimentos básicos adicionais para seqüenciamento, clonagem e outros aspectos de biologia molecular e sustentando considerações teóricas também são encontrados em Sambrook et al., Molecular Cloning - A Laboratory Manual (3rd Ed.), Vol. 1- 3, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova York, EUA, 2001; Current Protocols in Molecular Biology, Ausubel et al., eds., Current Protocols, um empreendimento conjunto entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., (suplementado ao longo de 2006); e em Watson et al. (1992) Recombinant DNA Segunda Edição, Scientific American Books, NY, EUA. Além disso, essencialmente quaisquer ácidos nucléicos (e virtualmente qualquer ácido nucléico rotulado, seja padrão ou não) podem ser personalizados ou padrão encomendados a partir de uma variedade de fontes comerciais, como Midland Certified Reagent Company (Midland, TX1 EUA), The Great American Gene Company (Ramona, CA, EUA), ExpressGen Inc. (Chicago, IL1 EUA), Operon Technologies Inc. (Alameda, CA, EUA) e muitos outros.
As células hospedeiras modificadas por engenharia genética podem ser cultivadas em um meio de nutrientes convencional conforme adequado para essas atividades como, por exemplo, etapas de triagem, promotores de ativação ou transformadores de seleção. Essas células podem, opcionalmente, ser cultivadas em organismos transgênicos. Outras referências úteis, por exemplo, para um isolamento e cultura celular (por exemplo, para isolamento subseqüente de ácidos nucléicos) incluem Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, Terceira Edição, Wiley-Liss, Nova York, EUA, e as referências dele citadas; Payne et at. (1992) Plant Cell and Tissue Culture in Liquid Systems, John Wiley & Sons, Inc. Nova York, NY, EUA; Gamborg and Phillips (eds) (1995) Plant Cell1 Tissue and Organ Culture; Fundamental Metods, Springer Lab Manual, Springer- Verlag (Berlin Heidelberg Nova York, EUA) e Atlas and Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, FL, EUA.
PROTEÍNAS E POLIPEPTÍDEOS DE INTERESSE
Os métodos de produção de uma proteína em uma célula com um aminoácido não- natural em uma posição específica também consistem em uma característica da invenção. Por exemplo, um método inclui o desenvolvimento, em um meio adequado, da célula, onde a célula compreende um ácido nucléico que por sua vez compreende ao menos um códon seletor e codifica uma proteína; e, proporciona o aminoácido não-natural; onde a célula compreende, ainda: um tRNA ortogonal (O-tRNA) que funciona na célula e reconhece o códon seletor; e, uma aminoacil-tRNA sintetase ortogonal (O-RS) que aminoacila, de preferência, o O-tRNA com o aminoácido não-natural. Uma proteína produzida por este método também consiste em uma característica da invenção.
Em determinadas modalidades, a O-RS compreende um viés para a aminoacilação do O-tRNA cognato por qualquer tRNA endógeno em um sistema de expressão. A razão relativa entre o O-tRNA e o tRNA endógeno que é carregado pela O-RS, quando o O-tRNA e a O-RS estiverem presentes em concentrações molares iguais, é maior que 1:1, de preferência, ao menos cerca de 2:1, com mais preferência, 5:1, ainda com mais preferência, 10:1, ainda com mais preferência, 20:1, ainda com mais preferência, 50:1, ainda com mais preferência, 75:1, ainda com mais preferência, 95:1, 98:1, 99:1, 100:1, 500:1, 1.000:1, 5,000:1 ou maior.
A invenção proporciona, também, composições que incluem proteínas, onde as proteínas compreendem um aminoácido não-natural. Em determinadas modalidades, a proteína compreende uma seqüência aminoacídica que seja ao menos 75% idêntica a seqüência de uma proteína terapêutica, uma proteína diagnostica, uma enzima industrial ou uma porção destas.
As composições da invenção e as composições feitas pelos métodos da invenção se encontram, opcionalmente, em uma célula. Os pares de O-tRNA/O-RS ou componentes individuais podem, então, ser usados em um mecanismo de translação do sistema hospedeiro, o que resulta em um aminoácido não-natural sendo incorporado em uma proteína. As Publicações Internacionais Números WO 2004/094593, depositada em 16 de abril de 2004, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE," e WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS," descrevem este processo, e estão aqui incorporadas a título de referência. Por exemplo, quando um par de O-tRNA/O-RS é introduzido em um hospedeiro, por exemplo, uma célula Escherichia coli, os pares levam à incorporação in vivo de um aminoácido não-natural, como 7-hidroxicumarina-etilglicina em uma proteína em resposta a um códon seletor. O aminoácido não-natural que é adicionada ao sistema pode ser um aminoácido sintético, como o derivado de uma fenilalanina ou tirosina, que pode ser exogenicamente adicionado ao meio em desenvolvimento. Opcionalmente, as composições da presente invenção podem estar em um sistema de translação in vitro, ou em um sistema in vivo.
Uma célula da invenção proporciona a capacidade de sintetizar proteínas que compreendem aminoácidos não-naturais em grandes quantidades úteis. Em alguns aspectos, a composição inclui, opcionalmente, por exemplo, ao menos 10 microgramas, ao menos 50 microgramas, ao menos 75 microgramas, ao menos 100 microgramas, ao menos 200 microgramas, ao menos 250 microgramas, ao menos 500 microgramas, ao menos 1 miligrama, ao menos 10 miligramas ou mais da proteína que compreende um aminoácido não-natural, ou uma quantidade que possa ser obtida por métodos de produção de proteína in vivo (detalhes sobre a produção e purificação de proteínas recombinantes são proporcionados no presente documento). Em outro aspecto, a proteína está, opcionalmente, presente na composição em uma concentração, por exemplo, de ao menos 10 microgramas de proteína por litro, ao menos 50 microgramas de proteína por litro, ao menos 75 microgramas de proteína por litro, ao menos 100 microgramas de proteína por litro, ao menos 200 microgramas de proteína por litro, ao menos 250 microgramas de proteína por litro, ao menos 500 microgramas de proteína por litro, ao menos 1 miligrama de proteína por litro, ou ao menos 10 miligramas de proteína por litro ou mais, em, por exemplo, um Iisato celular, um tampão, um tampão farmacêutico, ou outra suspensão de liquido (por exemplo, em um volume, por exemplo, qualquer de cerca de 1 nL a cerca de 100 L). A produção de grandes quantidades (por exemplo, maiores que as tipicamente possíveis por outros métodos, por exemplo, translação in vitro) de uma proteína e, uma célula que incluem ao menos um aminoácido não-natural consiste em uma característica da invenção.
A incorporação de um aminoácido não-natural pode ser realizada, por exemplo, por alterações de adaptação na estrutura e/ou função protéica, por exemplo, para alterar o tamanho, acidez, nucleofilicidade, ligação de hidrogênio, hidrofobicidade, acessibilidade de sítios alvo de protease, alvo a uma porção (por exemplo, para uma matriz de proteínas), incorporação de rótulos ou grupos reativos, etc. As proteínas que incluem um aminoácido não-natural podem ter propriedades catalíticas ou físicas aprimoradas ou até mesmo totalmente novas. Por exemplo, as propriedades a seguir são opcionalmente modificadas por inclusão de um aminoácido não-natural em uma proteína: toxicidade, biodistribuição, propriedades estruturais, propriedades espectroscópicas, propriedades químicas e/ou fotoquímicas, capacidade catalítica, meia-vida (por exemplo, meia-vida de soro), capacidade para reagir com outras moléculas, por exemplo, covalente ou não-covalentemente, e similares. As composições que incluem proteínas que por sua vez incluem ao menos um aminoácido não-natural são úteis, por exemplo, para terapêutica inusitada, diagnósticos, enzimas catalíticas, enzimas industriais, proteínas de ligação (por exemplo, anticorpos), e, por exemplo, o estudo de estrutura e função protéica. Consulte, por exemplo, Dougherty, (2000) Unnatural Amino acids as Probes of Protein Structure and Function, Current Opinion in Chemical Biology, 4:645-652.
Em alguns aspectos da invenção, uma composição inclui ao menos uma proteína com ao menos um, por exemplo, ao menos dois, ao menos três, ao menos quatro, ao menos cinco, ao menos seis, ao menos sete, ao menos oito, ao menos nove, ou ao menos dez ou mais aminoácidos não-naturais. Os aminoácidos não-naturais podem ser iguais ou diferentes, por exemplo, podem existir 1, 2, 3, 4, 5, 6, 7, 8, 9, ou 10 ou mais sítios diferentes na proteína que compreendam 1, 2, 3, 4, 5, 6, 7, 8, 9, ou 10 ou mais aminoácidos não- naturais diferentes. Em outro aspecto, uma composição inclui uma proteína com ao menos um, porém menor que todos, aminoácido particular presente na proteína consiste em um aminoácido não-natural. Para uma determinada proteína com mais de um aminoácido não- natural, os aminoácidos não-naturais podem ser idênticos ou diferentes (por exemplo, a proteína pode incluir dois ou mais tipos diferentes de aminoácidos não-naturais, ou podem incluir dois do mesmo aminoácido não-natural). Para uma determinada proteína com mais de dois aminoácidos não-naturais, os aminoácidos não-naturais podem ser iguais, diferentes ou uma combinação de um aminoácido não-natural múltiplo do mesmo tipo com ao menos um aminoácido não-natural diferente.
Essencialmente, qualquer proteína (ou porção da mesma) que inclua um aminoácido não-natural (e qualquer ácido nucléico de codificação correspondente, por exemplo, que inclua um ou mais códons seletores) pode ser produzida através do uso de composições e métodos do presente documento. Não se realizou nenhuma tentativa para identificar as centenas de milhares de proteínas conhecidas, qualquer uma dessas pode ser modificada de modo a incluir um ou mais aminoácidos não-naturais, por exemplo, alterando- se quaisquer métodos de mutação disponíveis de modo a incluírem um ou mais códons seletores adequados em um sistema de translação relevante. Os repositórios de seqüencias comuns para proteínas conhecidas incluem GenBank EMBL, DDBJ e o NCBI. Outros repositórios podem ser facilmente identificados pesquisando-se na Internet.
Tipicamente, as proteínas são, por exemplo, ao menos 60%, ao menos 70%, ao menos 75%, ao menos 80%, ao menos 90%, ao menos 95%, or ao menos 99% ou mais idênticas a qualquer proteína disponível (por exemplo, uma proteína terapêutica, uma proteína diagnostica, uma enzima industrial, ou porções destas, e similares), e elas compreendem um ou mais aminoácidos não-naturais. Exemplos de proteínas terapêuticas, diagnosticas e outras que podem ser modificadas de modo a compreender um ou mais aminoácidos não-naturais podem ser encontrados, mas não se limitam a, nas Publicações Internacionais WO 2004/094593, depositada em 16 de abril de 2004, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" e WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS." Exemplos de proteínas terapêuticas, diagnosticas e outras que podem ser modificadas de modo a compreender um ou mais aminoácidos não-naturais incluem, mas não se limitam a, por exemplo, alfa-1 antitripsina, Angiostatina, fator Antiemolítico, anticorpos (outros detalhes de anticorpos são encontrados mais adiante), Apolipoproteína, Apoproteína, fator natriurético atrial, polipeptídeo natriurético atrial, peptídeos atriais, quemoquinas C-X-C (por exemplo, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-I, PF4, MIG), Calcitonina, quemoquinas CC (por exemplo, proteína quimiotáxica de monócito 1, proteína quimiotáxica de monócito 2, proteína quimiotáxica de monócito 3, proteína inflamatória monócito alfa 1, proteína inflamatória monócito beta 1, RANTES1 1309, R83915, R91733, HCCI, T58847, D31065, T64262), Iigante CD40, Iigante kit-C, colágeno, fator estimulante de colônia (CSF), fator complementar 5a, inibidor complementar, receptor complementar 1, citoquinas, (por exemplo, peptídeo de ativação neutrófilo epitelial 78, GROa/MGSA, GRO0, GROy, MIP-1 a, MIP- 1 δ, MCP-I), fator de crescimento epidérmico (EGF), Eritropoietina ("EPO"), toxinas esfoliantes A e B, fator IX, fator VII, fator VHI, fator X, fator de crescimento de fibroblasto (FGF), Fibrinogênio, Fibronectina, G-CSF, GM-CSF, Glucocerebrosidase, Gonadotropina, fatores de crescimento, proteínas Hedgehog (por exemplo, Sônicas, Indianas, Desérticas), Hemoglobina, fator de crescimento hepatócito (HGF), Hirudina, Albumina Sérica Humana, Insulina, fator de crescimento tipo Insulina (IGF), interferonas (por exemplo, IFN-α, EFN-β, IFN-y), interleucinas (por exemplo, TL-I, TL-2, IL-3, IL-4, IL-5, TL-6, TL-I, IL-8, IL-9, IL-IO, IL- II, IL-12, etc.), fator de crescimento de queratinocita (KGF)1 Lactoferrina, fator inibitório de leucemia, Luciferase, Neurturina1 fator inibitório de neutrófilo (NIF), oncostatina M, proteína osteogênica, hormônio de paratireóide, PD-ECSF, PDGF, hormônios peptídicos (por exemplo, hormônio de crescimento humano), Pleiotropina1 Proteína A1 Proteína G1 exotoxinas pirogênicas, A1 B1 e C1 Relaxina1 Renina, SCF, receptor complementar solúvel I, solúvel I- CAM 1, receptores de interleucina solúveis (IL-I, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15), receptor TNF solúvel, Somatomedina1 Somatostatina1 Somatotropina1 Estreptoquinase1 Superantigenos1 isto é, enterotoxinas estafilocócicas (SEA1 SEB1 SECI1 SEC2, SEC3, SED, SEE), superóxido dismutase (SOD), toxina da síndrome do choque tóxico (TSST-I), Timosina alfa 1, ativador de plasminogênio tecidual, fator de necrose tumoral (TNF beta), receptor de fator de necrose tumoral (TNFR), fator-alfa de necrose tumoral (TNF alfa), fator de crescimento endotelial vascular (VEGEF), Uroquinase e muitos outros.
Uma classe de proteínas, que pode ser constituída através do uso de composições e métodos para incorporação in vivo de aminoácidos não-naturais aqui descritos, inclui moduladores transcricionais ou uma porção destes. Exemplos de moduladores transcricionais incluem proteínas moduladoras de genes e transcricionais que modulam o crescimento, diferenciação, regulação celular ou algo do gênero. Os moduladores transcricionais são encontrados em procariontes, vírus e eucariontes, inclusive fungos, vegetais, leveduras, insetos e animais, incluindo mamíferos, proporcionando uma ampla gama de alvos terapêuticos. Avaliar-se-á que os ativadores de expressão e transcricionais regulam a transcrição através de muitos mecanismos, por exemplo, ligando-se a receptores, estimulando-se uma cascata de transdução de sinal, regulando-se a expressão de fatores de transcrição, ligando-se a promotores e acentuadores, ligando-se a proteínas que se ligam aos promotores e acentuadores, desenrolando-se o DNA, retirada de íntros do pré-mRNA, poliadenilando-se o RNA e degradando-se o RNA.
Uma classe de proteínas da invenção (por exemplo, com um ou mais aminoácidos não-naturais) inclui proteínas biologicamente ativas, como citocinas, moléculas inflamatórias, fatores de crescimento, seus receptores e produtos oncogênicos, por exemplo, interleucinas (por exemplo, JL-I, TL-2, TL-8, etc.), interferons, FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-σ, TGF-0, EGF, KGF, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1, ICAM-l/LFA-1 e hialurina/CD44; moléculas de transdução de sinal e produtos oncogênicos correspondentes, por exemplo, Mos1 Ras, Raf e Met; e ativadores e supressores transcricionais, por exemplo, p53, Tat1 Fos, Myc1 Jun, Myb, Rei, e receptores de hormônio esteróide, como os de estrogênio, progesterona, testosterona, aldosterona e Iigante receptor de LDL e corticosterona.
As enzimas (por exemplo, enzimas industriais) ou porções destas com ao menos um aminoácido não-natural também são proporcionadas pela invenção. Exemplos de enzimas incluem, mas não se limitam a, por exemplo, amidases, racemases de aminoácido, acilases, dehalogenases, dioxigenases, diarilpropano peroxidases, epimerases, epóxido hidrolases, esterases, isomerases, quinases, glucose isomerases, glicosidases, glicosil transferases, haloperoxidases, monooxigenases (por exemplo, p450s), lipases, Iignina peroxidases, nitriia hidratases, nitrilases, proteases, fosfatases, subtilisinas, transaminase e nucleases.
Muitas dessas proteínas são comercialmente disponíveis (consulte, por exemplo, o catálogo Sigma BioSciences 2002 e lista de preços), e as seqüências protéicas e genes correspondentes e, tipicamente, muitas variantes destas, são bem conhecidas (consulte, por exemplo, Genbank). Qualquer uma dessas pode ser modificada pela inserção de um ou mais aminoácidos não-naturais de acordo com a invenção, por exemplo, com a finalidade de alterar a proteína em relação a um ou mais propriedades terapêutica, diagnosticas ou enzimáticas de interesse. Exemplos de propriedades terapeuticamente relevantes incluem meia vida de soro, estabilidade, imunogenicidade, atividade terapêutica, detectabilidade (por exemplo, pela inclusão de grupos repórteres (por exemplo, rótulos ou sítios de ligação de rótulo) nos aminoácidos não-naturais), redução de LD50 ou outros efeitos colaterais, capacidade em entrar no corpo através do trato gástrico (por exemplo, disponibilidade oral), ou similares. Exemplos de propriedades diagnosticas incluem vida útil, estabilidade, atividade diagnostica, detectabilidade, ou similares. Exemplos de propriedades enzimáticas incluem vida útil, estabilidade, atividade enzimática, capacidade de produção ou similares.
Uma variedade de outras proteínas também pode ser modificada de modo a incluir um ou mais aminoácidos não-naturais através do uso de composições e métodos da invenção. Por exemplo, a invenção pode incluir a substituição de um ou mais aminoácidos naturais em uma ou mais proteínas de vacina por um aminoácido não-natural, por exemplo, nas proteínas a partir de fungos infecciosos, por exemplo, Aspergillus, espécie Candida; bactérias, particularmente E. coli, que satisfaz um modelo para bactérias patogênicas, bem como bactérias medicamente importantes, como Staphilococci (por exemplo, aureus), ou Streptococci (por exemplo, pneumoniae); protozoários, como esporozoários (por exemplo, Plasmodia), rizópodes (por exemplo, Entamoeba) e flagelados (Trypanosoma, Leishmania, Trichomonas, Giardia, etc.); vírus, vírus de RNA ( + ) (exemplos incluem Poxvírus, por exemplo, varíola; Picornavírus, por exemplo pólio; Togavírus, por exemplo, rubéola; Flavivírus, por exemplo, HCV; e Coronavírus), vírus de RNA (-) (por exemplo, Rabdovírus, por exemplo, VSV; Paramixovírus, por exemplo, RSV; Ortomixovírus, por exemplo, influenza; Buniavírus; e Arenavírus), vírus de dsDNA (Reovírus, por exemplo), vírus de RNA para DNA, isto é, Retrovírus, por exemplo, HTV e HTLV, e certos vírus de DNA para RNA, como Hepatite B.
As proteínas agriculturalmente relacionadas, como proteínas resistentes a insetos (por exemplo, as proteínas Cry), enzimas de produção de amido e lipídeo, toxinas vegetais e inseto-toxinas, proteínas resistentes a toxinas, proteínas de desintoxicação de Micotoxina, enzimas de crescimento vegetal (por exemplo, Ribulose 1,5-Bisfosfato Carboxilase/Oxigenase, "RUBISCO"), Iipoxigenase (LOX) e fosfoenolpiruvato (PEP) carboxilase também consistem em alvos adequados para modificação de aminoácidos não- naturais.
Em determinadas modalidades, a proteína ou polipeptídeo de interesse (ou porção dos mesmos) nos métodos e/ou composições da invenção são codificados por um ácido nucléico. Tipicamente, o ácido nucléico compreende ao menos um códon seletor, ao menos dois códons seletores, ao menos três códons seletores, ao menos quatro códons seletores, ao menos cinco códons seletores, ao menos seis códons seletores, ao menos sete códons seletores, ao menos oito códons seletores, ao menos nove códons seletores, dez ou mais códons seletores.
Os genes par codificação de proteínas ou polipeptídeos de interesse podem ser mutagenizados utilizando-se métodos bem conhecidos na técnica e aqui descritos sob "Mutagenesis and Other Molecular Biology Techniques" de modo a incluir, por exemplo, um ou mais códons seletores para a incorporação de um aminoácido não-natural. Por exemplo, um ácido nucléico para uma proteína de interesse é mutagenizado de modo a incluir um ou mais códons seletores, permitindo a inserção dos um ou mais aminoácidos não-naturais. A invenção inclui qualquer variante, por exemplo, mutante, versões de qualquer proteína, por exemplo, incluindo ao menos um aminoácido não-natural. De maneira semelhante, a invenção inclui, também, ácidos nucléicos correspondentes, isto é, qualquer ácido nucléico com um ou mais códons seletores que codifiquem um ou mais aminoácido não-natural.
Para constituir uma proteína que inclua um aminoácido não-natural, um indivíduo pode usar células hospedeiras e organismos que sejam adaptados para a incorporação in vivo do aminoácido não-natural através de partes de tRNA ortogonal/RS. As células hospedeiras são modificadas por engenharia genética (por exemplo, transformadas, transduzidas ou transfectadas) com um ou mais vetores que expressem o tRNA ortogonal, a tRNA ortogonal sintetase, e um vetor que codifique a proteína a ser derivatizada. Cada um desses componentes pode estar no mesmo vetor, ou cada um pode estar em um vetor separado, ou dois componentes podem estar em um vetor e o terceiro componente em um segundo vetor. O vetor pode estar, por exemplo, sob a forma de um plasmídeo, uma bateria, um vírus, um polinucleotídeo indefeso, ou um polinucleotídeo conjugado.
Definição de Polipeptídeos por Imunorreatividade
Devido ao fato de os polipeptídeos da invenção proporcionarem uma variedade de novas seqüências polipeptídicas (por exemplo, polipeptídeos que compreendem aminoácidos não-naturais no caso de proteínas sintetizadas nos sistemas de translação da presente invenção, ou, por exemplo, no caso de sintetases inusitadas, seqüências inusitadas de aminoácidos padrão), os polipeptídeos proporcionam, também, novas características estruturais que podem ser reconhecidas, por exemplo, em ensaios imunológicos. A geração de anti-soros, que liga, de forma específica, os polipeptídeos da invenção, bem como os polipeptídeos que são ligados por esses anti-soros, consistem em uma característica da invenção. O termo "anticorpo," conforme o uso em questão, inclui, mas não se limita a, um polipeptídeo substancialmente codificado por um genes de imunoglobulina ou genes de imunoglobulina, ou fragmentos dos mesmos que ligam e reconhecem, de maneira específica, um analito (antígeno). Exemplos incluem anticorpos policlonais, monoclonais, quiméricos e de cadeia única, e similares. Os fragmentos de imunoglobulinas, que incluem fragmentos Fab e fragmentos produzidos por uma biblioteca de expressão, que inclui exibição de fago, também se encontram inclusos no termo "anticorpo" conforme o uso em questão. Consulte, por exemplo, Paul, Fundamental Immunology, 4a Ed., 1999, Raven Press, Nova York, EUA, para estrutura e terminologia de anticorpos.
Com a finalidade de produzir anti-soro para uso em um imunoensaio, um ou mais polipeptídeos imunogênicos são produzidos e purificados conforme descrito no presente documento. Por exemplo, a proteína recombinante pode ser produzida em uma icélula recombinante. Uma cepa natural de camundongos (usada neste ensaio porque os resultados são mais reproduzíveis devido à identidade genética virtual do camundongo) é imunizada com a(proteína(s) imunogênica(s) em combinação com um adjuvante padrão, como adjuvante de Freund, e um protocolo de imunização de ratos padrão (consulte, por exemplo, Harlow and Lane (1988) Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, Nova York, EUA, para uma descrição padrão de geração de anticorpos, formatos de imunoensaio e condições que podem ser usadas para determinar imunorreatividade específica. Detalhes adicionais sobre proteínas, anticorpos, anti-soros, etc. podem ser encontrados nas Publicações Internacionais Números WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNNATURAL AMINO ACIDS;" WO 2004/035605, intitulada "GLYCOPROTEIN SYNTHESIS;" e WO 2004/058946, intitulada "PROTEIN ARRA YS."
USO DE O-tRNA E O-RS E PARES DE O-tRNA/O-RS
As composições da invenção e as composições constituídas pelos métodos da invenção encontram-se, opcionalmente, em uma célula. Os pares de O-tRNA/O-RS ou componentes individuais da invenção podem, então, ser usados em um mecanismo de translação do sistema hospedeiro, o que resulta em um aminoácido não-natural que é incorporado em uma proteína. A Publicação Internacional Número WO 2002/085923 por Schultz, et at, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS," descreve este processo e se encontra aqui incorporada a título de referência. Por exemplo, quando um par de O-tRNA/O-RS for introduzido em um hospedeiro, por exemplo, Escherichia coli ou levedura, o par conduz à incorporação in vivo de um aminoácido não- natural, que pode ser adicionado, de maneira exógena, ao meio de crescimento, em uma proteína, por exemplo, uma proteína de teste de mioglobina ou uma proteína terapêutica, em resposta a um códon seletor, por exemplo, um códon sem sentido âmbar. Opcionalmente, as composições da invenção podem estar em um sistema de translação in vitro, ou em um sistema celular in vivo. As proteínas com o aminoácido não-natural podem ser usadas em uma ampla gama de aplicações. Por exemplo, a porção não-natural incorporada em uma proteína pode servir como um alvo para uma ampla gama de modificações, por exemplo, reticulação com outras proteínas, com pequenas moléculas, como rótulos ou corantes e/ou biomoléculas. Com essas modificações, a incorporação do aminoácido não-natural pode resultar em proteínas terapêuticas aperfeiçoadas e podem ser usadas para alterar ou aperfeiçoar a função catalítica das enzimas. Em alguns aspectos, a incorporação e subseqüente modificação de um aminoácido não-natural em uma proteína pode facilitar os estudos sobre a estrutura protéica, interações com outras proteínas, e algo do gênero.
KITS
Os kits também consistem em uma característica da invenção. Por exemplo, proporciona-se um kit para produzir uma proteína que compreende ao menos um aminoácido não-natural em uma célula, onde o kit inclui ao menos um recipiente contendo uma seqüência polinucleotídica que codifica um O-tRNA, e/ou um O-tRNA, e/ou uma seqüência polinucleotídica que codifica uma O-RS, e/ou uma O-RS. Em uma modalidade, o kit inclui, ainda, o aminoácido não-natural 7-hidroxicumarina-etilglicina. Em outra modalidade, o kit compreende, ainda, materiais instrucionais para produção de proteína e/ou uma célula hospedeira.
EXEMPLOS Os exemplos a seguir são propostos para ilustrar, mas não para limitar a invenção reivindicada. Os versados na técnica reconhecerão uma variedade de parâmetros não- críticos que podem ser alterados sem divergir do escopo da invenção reivindicada. Compreende-se que os exemplos e modalidades aqui descritas servem apenas para propósitos ilustrativos e que várias modificações ou alterações considerando-se estes propósitos serão sugeridas aos versados na técnica e devem estar inclusos no espírito e escopo do presente pedido e escopo das reivindicações em anexo.
EXEMPLO 1
Metodologias Gerais
Todos os elementos químicos foram obtidos a partir de fontes comerciais e usados sem purificação adicional. Os espectros de 1H NMR foram gravados em um espectrômetro multinuclear Bruker AMX-400 (Bruker BioSpin GmbH, Rheinstetten/Karlsruhe, Alemanha) com trocas químicas informadas em relação ao tetrametilsilano. Os espectros de massa de proteínas foram adquiridos junto ao Scripps Center for Mass Spectrometry (La Jolla, CA, EUA).
PLASMÍDEOS E LINHAS CELULARES
O plasmídeo pBK-lib5 codifica uma biblioteca de mutantes de tirosil tRNA sintetase de M. jannaschii (M/TyrRS) em que os resíduos Tyr32, Leu65, Phel08, Glnl09, Aspl58 e Leu 162 são randomizados; além disso, o His70 sofreu mutação em Gly, e o Ala67 sofreu mutação em Ala ou Gly. O plasmídeo pREP(2)/YC codifica o MytRNAcuATyr, o gene de cloranfenicol acetiltransferase (CAT) com um códon de TAG no resíduo 112, o gene de GFP sob controle do promotor T7, ama polimerase T7 RNA mutante com um códon de TAG em resíduos 1 e 107, e um marcador Tetr. O plasmídeo pLWJ17B3 codifica o MytRNACuATyr sob o controle do promotor Ipp e do terminador rrnC, o gene de barnase (com três códons âmbar nos resíduos 2, 44 e 65) sob controle do promotor ara, e de um marcador Ampr. O plasmídeo pBAD/JYAMB-4TAG-Myo codifica o gene mutante de mioglobina de esperma de baleia com um promotor arabinose e um terminador rrnB, o MjtRNATyrCUA com um promotor Ipp e o terminador rrnC, e um marcador de resistência de tetraciclina. A cepa E. coli GeneHog®-Fis, F" mcrk A(mrr-hsdRMS-mcrBC) 80LacZΔM15 ΔlacX74 recA1 e/7dA1 araD139 A(ara-leu)7697 gaIU galK ArpsL(StrR) nupG, fis::Tn7 (DHFR) foi utilizada para estudos que expressaram proteínas contendo o aminoácido não-natural L-(7-hidroxicumarin- 4-il) etilglicina.
EXEMPLO 2
Síntese do Aminoácido Não-Natural L-(7-Hidroxicumarin-4-il) Etilglicina
O aminoácido não-natural de cumarina L-(7-hidroxicumarin-4-il) etilglicina (também escrito como 7-hidroxicumarina-etilglicina; consulte a FIGURA 1, estrutura 1) foi sintetizado convertendo-se, primeiramente, o ácido Ν-α-Cbz-L-glutâmico α-benzil éster em β-ceto éster de cadeia lateral, que foi, então, reagido com resorcinol em ácido metanossulfônico (reação de von Pechmann; Brun et al., Angew. Chem., Int. Ed., (2004) 43:3432-3436) para produzir o aminoácido L-(7-hidroxicumarin-4-il) etilglicina. Essas etapas são descritas em detalhes mais adiante.
ETAPA 1 - Síntese de Malonato de Etil Maqnésio
Adicionou-se a uma solução aquosa agitada de 1,5 M de cloreto de magnésio e 3 M de malonato de etil potássio cinco volumes de isopropanol. Após filtração, o malonato de etil magnésio foi seco a vácuo.
ETAPA 2 - Síntese do ácido (2S)-2-benziloxicarbonilamino-5-oxo-heptanodióico 1- benzil éster 7-etil éster (FIGURA 1. estrutura 3)
Dissolveu-se Z-Glu-Obzl (um Ν-α-Cbz-L-ácido glutâmico σ-benzil éster) (5g, 13,46 mmol) em 50 ml de THF seco à temperatura ambiente. Adicionou-se lentamente N,N'- carbonil diimidazola (1,1 eq) e a mistura foi, então, agitada durante 2 horas à temperatura ambiente. Adicionou-se malonato de etil magnésio (0,55 eq), e a mistura foi agitada à temperatura ambiente de um dia para o outro. O produto foi extraído com éter, e lavado com NaHCO3 a 10%, água e salmoura. O resíduo contendo 3 foi purificado por cromatografia instantânea em sílica gel (acetato de etila: hexanos 50:50) e concentrado em um evaporador giratório de modo a produzir um sólido branco em rendimento de 40%. 1H-NMR (400 MHz1 CDCI3): δ 1,26 (t, J = 7,2, 3H), 1,9 a 2,01 (m, 1H), 2,1 a 2,28 (m, 1H), 2,5 a 2,7 (m, 2H), 3,37 (s, 2H), 4,18 (q, J = 7,2, 2H), 4,41 (s, 1H), 5,11 (s, 2H), 5,18 (s, 2H), 5,44 (d, J = 8, 1H), 7,25 a 7,41 (m, 10H), LC-MS (ESI) calculado para C24H2NO7 (M+ H+) 442,18, observado 442,0.
ETAPA 3 - Síntese de L-(7-hidroxicoumarin-4-il) etilglicina (FIGURA 1. estrutura 1) Adicionou-se lentamente o ácido (2S)-2 Benziloxicarbonilamino-5-oxo- heptanodióico 1-benzil éster 7-etil éster da etapa anterior (2,35g, 5 mmol) a resorcinol (3g, 25 mmol) em ácido metanossulfônico (20 ml) e agitado durante duas horas à temperatura ambiente. Adicionaram-se, então, cinco volumes de éter à mistura e foi resfriada até -30°C. O precipitado foi lavado com éter frio, dissolvido em água, filtrado e liofilizado. Purificou-se a L-(7-hidroxicumarin-4-il) etilglicina por HPLC de fase reversa de modo a produzir um sólido marrom em rendimento de 50% (coluna YMC AA12S052503WT, taxa de vazão 12 ml/min, de 10% a 90% de CH3CN, 0,1% de TFA (p/v) em água, durante o curso de 12 min). 1H-NMR (DMSO): δ 2,06 (s, 2H), 2,70 a 2,90 (m, 2H), 3,82 a 4,0 (m, 1H), 6,06 (s, 1H), 6,75 (dd, J= 8,8, 2,4, 1H), 6,82 (d, J = 2,4, 1H), 7,62 (d, J = 8,8, 1H), 8,17 (s, 3H), LC-MS (ESI) calculado para Ci3H14NO5 (M+ H+) 264,08 Da, observado 264,0 Da.
EXEMPLO 3
Seleção Genética de Sintetase Mutante Específica para 7-Hidroxicumarina- Etilglicina Para incorporar seletivamente a 7-hidroxicumarina-etilglicina em sítios definidos em proteínas em E. coli, desenvolveu-se um par de tirosil tRNA supressor âmbar de Methanococcus jannaschii mutante (MytRNATyrCuA) / tirosil-tRNA sintetase (MyTyrRS) que especifica exclusivamente a 7-hidroxicumarina-etilglicina em resposta ao códon seletor de TAG.
CONSTRUÇÃO DA BIBLIOTECA
Com a finalidade de acomodar uma grande cadeia lateral de cumarina do aminoácido não-natural 7-hidroxicumarina-etilglicina, gerou-se uma biblioteca /WyTyrRS pBK- lib5, onde a tirosil-tRNA sintetase de Methanococcus jannaschii do tipo selvagem (FIGURA 9; SEQ ID NOs: 2 e 3) His70 passou por mutação para Gly1 e Ala67 foi fixada em Ala ou Gly de modo a aumentar o tamanho do sítio ativo. Randomizaram-se seis resíduos, Tyr-32, Leu- 65, Phe-108, Gln-109, Asp-158 e Leu-162, em posição próxima para ligar a tirosina (Kobayashi et al, Nat. Struct. Biol., (2003) 10:425-432; Zhang et al, Protein ScL, (2005) 14:1340-1349). A biblioteca pBK-lib5 consistiu em 2x109 TyrRS clones independentes e foi construída utilizando-se métodos padrão de PCR.
SELEÇÕES POSITIVAS/NEGATIVAS
Subseqüentemente, esta biblioteca foi submetida a seleções tanto positivas como negativas. Na seleção positiva, a sobrevivência da célula depende da supressão de um códon âmbar introduzido em um sítio permissivo no gene de cloranfenicol acetil transferase (CAT) quando as células co-transformadas com pBK-lib e MytRNATyrCuA forem cultivadas na presença de um 1 mM de aminoácido não-natural (UAA) e cloranfenicol (Xie and Schultz, Metods (2005) 36:227-238). Os clones positivamente selecionados são, então, transformados em células contendo MytRNATyrCuA e um gene que codifica a proteína de barnase tóxica com três mutações âmbar introduzidas em sítios permissivos. Essas células são cultivadas na ausência de UAA para remover quaisquer clones que utilizem aminoácidos endógenos (seleção negativa). Essas seleções positivas e negativas são descritas em maiores detalhes abaixo.
Seleção Positiva - Utilizou-se a DHIOB E. coli que hospeda o plasmídeo pREP(2)/YC como a cepa hospedeira para a seleção positiva. As células foram transformadas com a biblioteca pBK-lib5, recuperadas em SOC durante 1 hora, lavadas duas vezes com meio mínimo de glicerol com Ieucina (GMML) antes de ser colocada sobre placas de GMML-ágar suplementadas com canamicina, cloranfenicol, tetraciclina e 7- hidroxicumarina-etilglicina em 50//g/mL, 60 ywg/mL, 15/yg/mL e 1 mM respectivamente. As placas foram incubadas a 37°C durante 60 horas e as células sobreviventes foram removidos e o DNA de plasmídeo foi extraído e purificado por electroforese gel.
Seleção Negativa - O DNA pBK-lib5 foi, então, transformado em células eletro- competente que hospedam o plasmídeo pLWJ17B3 de seleção negativa, recuperado durante 1 hora em SOC e, então, colocado sobre placas de LB-ágar contendo arabinose a 0,2%, 50 μg/mL de ampicillina e 50 μg/mL de canamicina. As placas foram, então, incubadas a 37°C durante 8 a 12 horas, e o DNA pBK-lib5 dos clones sobreviventes foram extraídos conforme descrito anteriormente.
A biblioteca foi, então, conduzida através de uma rodada subseqüente de seleção positiva, seguida por uma seleção negativa e uma rodada final de seleção positiva (com cloranfenicol em 70 μg/mL). Neste estágio, 96 clones individuais foram selecionados e suspensos em 50 μL de GMML em uma placa com 96 poços, e identificados por réplicas em dois conjuntos de placas GMML. Um conjunto de placas de GMML-ágar foi suplementado com tetraciclina (15 μg/mL), canamicina (50 μg/mL) e cloranfenicol em concentrações de 60, 80, 100 e 120 μg/mL com 1 mM de 7-hidroxicumarina-etilglicina. O outro conjunto de placas foi idêntico, mas, não continha 7-hidroxicumarina-etilglicina, e as concentrações de cloranfenicol usadas foram de 0, 20, 40 e 60 μg/mL. Após 60 horas de incubação a 37°C, descobriu-se que um clone sobreviveu em 100 μg/mL de cloranfenicol na presença de 1 mM de 7-hidroxicumarina-etilglicina, mas apenas em 20 μg/mL de cloranfenicol na ausência de 7-hidroxicumarina-etilglicina. Portanto, após as três rodadas de seleção positiva e duas rodadas de seleção negativa, esta biblioteca gerou um único clone que se desenvolve em 100 μg/mL de cloranfenicol na presença de 7-hidroxicumarina-etilglicina, mas apenas em 20 μg/mL de cloranfenicol na ausência de 7-hidroxicumarina-etilglicina.
Este clone, denominado CouRS-D8, foi seqüenciado e descobriu-se que ele contém as seguintes oito mutações: Tyr32Glu, Leu65His, Ala67Gly, His70Gly, Phel08Tyr, GlnlO9His, Aspl58Gly e Leul62Gly (consulte a FIGURA 9 e a SEQ ID NOs: 4 e 5). A seqüência polipeptídica de sintetase mutante proporcionada na SEQ ID NO: 4 na FIGURA 9 indica as posições mutantes em negrito. A proteína de sintetase mutante é adicionalmente resumida na tabela abaixo.
<table>table see original document page 70</column></row><table>
Quatro resíduos sofreram mutação para glicina, provavelmente para criar espaço suficiente para acomodar o resíduo de 7-hidroxicumarina-etilglicina. A Tyr32 e a Aspl58, em que a ligação de hidrogênio se liga à tirosina na enzima do tipo selvagem, também sofrem mutação, em consonância com a perda de atividade em relação à tirosina (Kobayashi et at, Nat. Struct. Biol., (2003) 10:425-432; Zhang et al, Protein ScL, (2005) 14:1340-1349). A FIGURA 8 mostra um modelo estrutural previsto do sítio ativo de MjTyrRS (CouRS-D8) mutante. O modelo foi gerado utilizando-se a estrutura MjTyrRS do tipo selvagem (código pdb 1J1U). O substrato de tirosina foi substituído por L-(7- hidroxicumarina-4-il) etilglicina, e as seguintes mutações são apresentadas: Tyr32Glu, Leu65His, Ala67Gly, His70Gly, Phel08Tyr, GlnlO9His, Aspl58Gly e Leul62Gly. A estrutura foi, então, otimizada por minimização de energia pelo software Insightll® (Accelrys Software, Inc.®, San Diego, CA, EUA).
EXEMPLO 4
Expressão e Caracterização de uma Proteína de Modelo de Mioqlobina Mutante Contendo 7- Hidroxicumarina-Etilqlicina
Para determinar a eficiência e fidelidade de incorporação de 7-hidroxicumarina- etilglicina em proteínas, um códon seletor âmbar foi substituído na posição 4 (Ser-4) ou na posição 37 (His-37) em mioglobina de esperma de baleia (consulte a FIGURA 3) que contém um marcador de C-terminal His6. A expressão protéica foi realizada na presença da sintetase selecionada de CouRS-D8 e MjtRNATyrCUA em E coli desenvolvida em meio mínimo ou em meio suplementado com 1 mM de 7-hidroxicumarina-etilglicina. Como um controle negativo, a expressão protéica também foi realizada na ausência de 7- hidroxicumarina-etilglicina. Descreve-se esta produção e análise protéica em maiores detalhes abaixo.
PRODUÇÃO DE PROTEÍNA MUTANTE
Os plasmídeos pBAD/JYAMB-4TAG-Myo ou pB AD/JYAMB-37TAG-Myo foram independentemente co-transformados com vetor pBK que expressa CouRS-D8 em células GeneHogO-Fis E coli. As células foram amplificadas em meio 2YT (5 mL) suplementado com canamicina (50 [mu]g/mL) e tetraciclina (15 [mu]g/mL). Utilizou-se a cultura iniciadora (1 mL) para inocular 100 mL de GMML líquido ou 2YT suplementado com antibióticos adequados e 1 mM de 7-hidroxicumarina-etilglicina. As células foram, então, cultivadas a 37°C em um OD6oo de 0,5 e a expressão protéica foi induzida pela adição de arabinose a 0,2%. Após outras 4 a 12 horas, as células foram colhidas por centrifugação. Os mutantes de mioglobina TAG4 e TAG37 foram purificados por cromatografia de afinidade Ni-NTA sob condições naturais. As amostras foram, então, dessalinizadas. O rendimento das mioglobinas mutantes TAG4 e TAG37 no meio foi de 2 mg/L. A título de comparação, o rendimento de mioglobina do tipo selvagem sob condições similares foi de 5 mg/L.
ANÁLISE ESPECTROMÉTRICA DE MASSA PROTÉICA
Submeteu-se a proteína de mioglobina mutante TAG4 purificada à análise espectrométrica de massa ESI. As análises espectrométricas de massa ESI da mioglobina mutante forneceram uma massa média observada Mavg de 18511 Da, em acordo próximo com a massa calculada Mavg de 18512 Da (consulte a FIGURA 6). Visto que não foram encontradas espécies correspondentes à incorporação de aminoácido natural no espectro de massa ESI quando se utiliza um limite de convolução de 5%, uma pureza de incorporação mínima de 95% para 7-hidroxicumarina-etilglicina foi obtida a partir da razão de sinal para ruído do espectro de massa protéica. O limite de detecção é ajustado de tal modo que possa apenas detectar uma espécie se sua abundancia for maior que 5% do pico principal. Visto que apenas o pico principal é observado, a proteína mutante tem uma pureza > 95%.
ANÁLISE PROTÉICA POR RESOLUÇÃO EM SDS-PAGE
A análise da proteína purificada por SDS-PAGE apresentou que a proteína completa foi expressa apenas na presença de 7-hidroxicumarina-etilglicina (consulte a FIGURA 5). Além disso, a proteína de mioglobina mutante TAG4 que incorpora a 7- hidroxicumarina-etilglicina geneticamente codificada se mostra como uma tira fluorescente após a resolução em SDS-PAGE, onde a proteína de mioglobina do tipo selvagem desprovida de 7-hidroxicumarina-etilglicina geneticamente codificada não exibiu fluorescência. A formação de imagem de fluorescência utilizou um digitalizador de fluorescência STORM® (Molecular Dynamics/GE® Healthcare Life Sciences, Piscataway, NJ1 EUA).
EXEMPLO 5
Uso de uma 7-Hidroxicumarina-Etilglicina Geneticamente Codificada como uma Sonda para Configuração de Proteína
Para demonstrar um dos usos em potencial da 7-hidroxicumarina-etilglicina, utilizou-se este aminoácido como uma sonda da desnaturação dependente de uréia da holomioglobina. Pelo fato de a fluorescência de cumarina ser sensível à polaridade de solvente, sua intensidade de fluorescência deveria se correlacionar com o desenrolamento local da proteína em posição próxima à 7-hidroxicumarina-etilglicina. A estrutura de mioglobina consiste em oito espirais (A a H), conectadas por pequenos laços e voltas (Delli Castelli et al, Protein ScL, (2002) 11:2273-2276). O Ser4 na espiral A e His37 na espiral C (consulte a FIGURA 3; ambos os resíduos são amplamente expostos ao solvente e não interagem significativamente com outros resíduos próximos) foram independentemente modificados ao TAG de códon seletor, resultando em uma incorporação geneticamente programada in vivo de 7-hidroxicumarina-etilglicina na presença do par específico de O- tRNA ortogonal /O-RS.
Conforme indicado na FIGURA 4, as curvas de desenrolamento induzidas por uréia do tipo selvagem, as holomioglobinas Ser4 —► 7-hidroxicumarina-etilglicina e His37 —► 7- 35 hidroxicumarina-etilglicina conforme monitoradas por dicroísmo circular são virtualmente idênticas, sugerindo que a introdução de 7-hidroxicumarina-etilglicina na espiral A ou na espiral C não perturbe significativamente a estabilidade protéica. Em uma concentração de uréia de 2 M1 a intensidade de fluorescência de 7-hidroxicumarina-etilglicina na posição 4 em holomioglobina aumenta 30% (e permanece neste nível de 2 M a 5 M de uréia), sugerindo que esta região da proteína seja desordenada (Zhang et al, Protein ScL1 (2005) 14:1340-1349). Por outro lado, a mioglobina mutante com 7-hidroxicumarina-etilglicina no resíduo 37 mostra uma pequena alteração em sua intensidade de fluorescência em 2 M de uréia, porém, se submete a um aumento de fluorescência similar em 3 M de uréia. Em consonância com este resultado, um estudo por NMR anterior mostrou que quando a concentração de uréia for maior que 2,2 M, as espirais AeB são amplamente desorganizadas, conforme mostrado pelo desaparecimento de NOEs de faixa curta e média nesta região, enquanto que as espirais C, D e F se desenrolam depois, quando a concentração de uréia for maior que 3,0 M (Delli Castelli et al., Protein ScL, (2002) 11:2273- 2276). Portanto, parece que o aminoácido 7-hidroxicumarina-etilglicina consiste em uma sonda sítio-específica de alterações conformacionais protéicas, ao contrário do dicroísmo circular que relata alterações globais ponderadas por toda a estrutura.
A sensibilidade de 7-hidroxicumarina-etil glicina ao pH também foi testada, conforme mostrado na FIGURA 7. O espectro de absorção de 60 //M de aminoácido de cumarinil 7-hidroxicumarina-etilglicina foi medido em 100 nnM de solução tampão de fosfato de sódio. A absorbância de 360 nM aumentou enquanto o pH aumentou. Calculou-se um pKa de 7,8 a partir dessas medições.
A sensibilidade de 7-hidroxicumarina-etilglicina ao pH (consulte a FIGURA 7) e a polaridade de solvente (Zinsli, J. Photochem (1974) 3:55-69) a tornariam uma sonda útil para muitos estudos biológicos, tanto in vitro como in vivo (Brun et al, Angew. Chem., Int. Ed, (2004) 43:3432-3436). Por exemplo, pode-se utilizar o aminoácido 7-hidroxicumarina- etilglicina para monitorar as interações bimoleculares ou alterações conformacionais nas proteínas, ou a topologia de proteínas ligadas à membrana. Além disso, pelo fato de a 7- hidroxicumarina-etilglicina ter um pKa de 7,8, que pode ser sistematicamente alterado por substituição do anel de cumarina (Sun et al., Bioorg. Med. Chem. Lett., (1998) 8:3107-3110), ela pode ser uma sonda útil de pH organelar, e processos celulares dependentes de pH. Além disso, em seu estado excitado, a 7-hidroxicumarina é tanto um fotoácido forte (Cohen and Huppert, Phys. Chem. A (2001) 105:7157-7164) como pode facilitar o estudo de processos de transferência de prótons em proteínas.
Muito embora a invenção anterior tenha sido descrita em alguns detalhes por propósitos de clareza e compreensão, ficará claro aos versados na técnica a partir de uma leitura desta descrição que várias alterações na forma e detalhes podem ser feitas sem que se divirja do verdadeiro escopo da invenção. Todas as publicações, patentes, e pedidos de patente, e/ou outros documentos citados neste pedido estão incorporados em sua totalidade a título de referência para todos os propósitos com a mesma abrangência como se cada publicação, patente, pedido de patente, e/ou outros documentos individuais fossem individualmente indicados a serem incorporados a título de referência para todos os propósitos.
Claims (40)
1. Sistema de translação, CARACTERIZADO pelo fato de que compreende: (a) um primeiro aminoácido não-natural que seja um aminoácido não-natural de L- (7-hidroxicoumarin-4-il) etilglicina; (b) uma primeira aminoacil-tRNA sintetase ortogonal (O-RS); e (c) um primeiro tRNA ortogonal (O-tRNA); sendo que a dita primeira O-RS aminoa- cila, de preferência, o dito primeiro O-tRNA com o dito primeiro aminoácido não-natural.
2. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato de que a dita primeira O-RS é derivada a partir de uma aminoacil-tRNA sintetase de Methanococcus jannaschii.
3. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato de que a dita primeira O-RS é derivada a partir de uma tirosil-tRNA sintetase de Me- thanococcus jannaschii do tipo selvagem.
4. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato de que a dita primeira O-RS compreende uma seqüência aminoacídica apresentada na SEQ. ID NO: 4, e variantes conservativas da mesma.
5. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato de que o dito primeiro O-tRNA é um tRNA supressor âmbar.
6. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato que o dito primeiro O-tRNA compreende, ou é codificado por uma, seqüência polinu- cleotídica apresentada na SEQ ID NO: 1.
7. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato que compreende, ainda, um ácido nucléico que codifica uma proteína de interesse, sendo que o dito ácido nucléico compreende ao menos um códon seletor, sendo que o có- don seletor é reconhecido pelo dito O-tRNA.
8. Sistema de translação, de acordo com a reivindicação 7, CARACTERIZADO pe- lo fato que compreende, ainda, uma segunda O-RS e um segundo O-tRNA, sendo que se- gunda O-RS aminoacila, de preferência, o segundo O-tRNA com um segundo aminoácido não-natural que seja diferente do primeiro aminoácido não-natural, e sendo que o segundo O-tRNA reconhece um códon seletor que seja diferente do códon seletor reconhecido pelo primeiro O-tRNA.
9. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato que o dito sistema compreende uma célula hospedeira que por sua vez compreende o dito primeiro aminoácido não-natural, a dita primeira O-RS e o dito primeiro O-tRNA.
10. Sistema de translação, de acordo com a reivindicação 9, CARACTERIZADO pelo fato que a célula hospedeira é uma célula eubacteriana.
11. Sistema de translação, de acordo com a reivindicação 10, CARACTERIZADO pelo fato que a dita célula eubacteriana é uma célula de E. coli.
12. Sistema de translação, de acordo com a reivindicação 9, CARACTERIZADO pelo fato que a dita célula hospedeira compreende um polinucleotídeo que codifica a dita primeira O-RS.
13. Sistema de translação, de acordo com a reivindicação 12, CARACTERIZADO pelo fato que o dito polinucleotídeo compreende uma seqüência nucleotídica apresentada na SEQ ID NO: 5.
14. Sistema de translação, de acordo com a reivindicação 9, CARACTERIZADO pelo fato que a dita célula hospedeira compreende um polinucleotídeo que codifica o dito primeiro O-tRNA.
15. Método para produção de uma proteína em um sistema de translação que com- preende um aminoácido não-natural em uma posição selecionada, CARACTERIZADO pelo fato que o método compreende: (a) proporcionar um sistema de translação que compreende: (i) um primeiro aminoácido não-natural que seja um aminoácido não-natural de L- (7-hidroxicoumarin-4-il) etilglicina; (ii) uma primeira aminoacil-tRNA sintetase ortogonal (O-RS); (iii) um primeiro tRNA ortogonal (O-tRNA), sendo que a dita primeira O-RS aminoa- cila, de preferência, o dito primeiro O-tRNA com o dito aminoácido não-natural; e, (iv) um ácido nucléico que codifica a dita proteína, sendo que o dito ácido nucléico compreende ao menos um códon seletor que seja reconhecido pelo dito primeiro O-tRNA; e, (b) incorporar o dito aminoácido não-natural na dita posição selecionada à dita pro- teína durante a translação da dita proteína em resposta ao dito códon seletor, produzindo, assim, a dita proteína que compreende o dito aminoácido não-natural na posição seleciona- da.
16. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar um polinucleotí- deo que codifica a dita O-RS.
17. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar uma O-RS deri- vada de uma aminoacil-tRNA sintetase Methanococcus jannaschii.
18. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar uma O-RS deri- vada de uma tirosil-tRNA sintetase Methanococcus jannaschii do tipo selvagem.
19. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar uma O-RS com- preendendo uma seqüência aminoacídica apresentada na SEQ ID NO: 4, e variantes con- servativas da mesma.
20. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende modificar um bolso de ligação aminoacídico de uma aminoacil-tRNA sintetase do tipo selvagem por mutagênese sítio- direcionada, e selecionar uma O-RS resultante que aminoacile, de preferência, o dito O- tRNA com o dito aminoácido não-natural.
21. Método, de acordo com a reivindicação 20, CARACTERIZADO pelo fato de que a dita etapa de seleção compreende selecionar positiva e negativamente para dita O-RS a partir de um lago que compreende uma pluralidade de moléculas de aminoacil-tRNA sinteta- se resultantes seguindo a mutagênese sítio-direcionada.
22. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar um polinucleotí- deo que codifique o dito O-tRNA.
23. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar um O-tRNA que seja um tRNA supressor âmbar.
24. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar um O-tRNA que compreenda, ou seja codificado por, uma seqüência polinucleotídica apresentada na SEQ ID NO: 1.
25. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar um ácido nucléi- co que compreenda um códon seletor âmbar.
26. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que a dita proteína compreende, ainda, um segundo aminoácido não-natural que seja diferente do primeiro aminoácido não-natural, sendo que o dito sistema de translação compreende, ainda, uma segunda O-RS e um segundo O-tRNA, sendo que a segunda O-RS aminoacila, de preferência, o segundo O-tRNA com um segundo aminoácido não-natural que seja dife- rente do primeiro aminoácido não-natural, sendo que o segundo O-tRNA reconhece um có- don seletor no ácido nucléico que seja diferente do códon seletor reconhecido pelo primeiro O-tRNA.
27. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar uma célula hos- pedeira, sendo que a dita célula hospedeira compreende o dito primeiro aminoácido não- natural, a dita primeira O-RS, o dito primeiro O-tRNA e o dito ácido nucléico, sendo que a dita etapa de incorporação compreende cultivar a dita célula hospedeira.
28. Método, de acordo com a reivindicação 27, CARACTERIZADO pelo fato de que o dito proporciona uma célula hospedeira que compreende proporcionar uma célula hospe- deira eubacteriana.
29. Método, de acordo com a reivindicação 28, CARACTERIZADO pelo fato de que o dito proporciona uma célula hospedeira eubacteriana que compreende proporcionar uma célula hospedeira de E. coli.
30. Método, de acordo com a reivindicação 27, CARACTERIZADO pelo fato de que o dito proporciona uma célula hospedeira que compreende proporcionar uma célula hospe- deira que compreende um polinucleotídeo que codifique a dita O-RS.
31. Método, de acordo com a reivindicação 30, CARACTERIZADO pelo fato de que o dito proporciona uma célula hospedeira compreendendo um polinucleotídeo que codifica a dita O-RS1 sendo que a etapa compreende proporcionar uma célula hospedeira compreen- dendo um polinucleotídeo que por sua vez compreende uma seqüência nucleotídica apre- sentada na SEQ ID NO: 5.
32. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar um extrato celu- lar.
33. Composição, CARACTERIZADA pelo fato de que compreende um polipeptídeo que por sua vez compreende uma seqüência aminoacídica apresentada na SEQ ID NO: 4, ou uma variante conservativa da mesma, sendo que o polipeptídeo de variante conservativa aminoacila um tRNA ortogonal (O-tRNA) cognato com um aminoácido não-natural em uma eficácia que seja de ao menos 50% da eficácia observada para um sistema de translação que compreende o dito O-tRNA, o dito aminoácido não-natural e uma aminoacil-tRNA sinte- tase que compreende a seqüência aminoacídica da SEQ ID NO: 4.
34. Polinucleotídeo, CARACTERIZADO pelo fato de que codifica o polipeptídeo de acordo com a reivindicação 33.
35. Polinucleotídeo, de acordo com a reivindicação 34, CARACTERIZADO pelo fa- to de que o dito polinucleotídeo compreende a seqüência nucleotídica da SEQ ID NO: 5.
36. Composição, de acordo com a reivindicação 33, CARACTERIZADA pelo fato de que a dita composição consiste em uma célula que compreende o polipeptídeo.
37. Composição, CARACTERIZADA pelo fato de que compreende um polinucleotí- deo que por sua vez compreende uma seqüência nucleotídica apresentada na SEQ ID NO: -5.
38. Vetor, CARACTERIZADO pelo fato de que compreende um polinucleotídeo de acordo com a reivindicação 37.
39. Vetor de expressão, CARACTERIZADO pelo fato de que compreende um poli- nucleotídeo de acordo com a reivindicação 37.
40. Célula compreendendo um vetor, sendo que o vetor é CARACTERIZADO pelo fato de que compreende um polinucleotídeo de acordo com a reivindicação 37.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US80809906P | 2006-05-23 | 2006-05-23 | |
US60/808.099 | 2006-05-23 | ||
US81385606P | 2006-06-14 | 2006-06-14 | |
US60/813.856 | 2006-06-14 | ||
PCT/US2007/012361 WO2007139870A1 (en) | 2006-05-23 | 2007-05-21 | Genetically encoded fluorescent coumarin amino acids |
Publications (1)
Publication Number | Publication Date |
---|---|
BRPI0711811A2 true BRPI0711811A2 (pt) | 2011-12-06 |
Family
ID=38778978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0711811-2A BRPI0711811A2 (pt) | 2006-05-23 | 2007-05-21 | aminoácidos de cumarina fluorescente geneticamente codificados |
Country Status (11)
Country | Link |
---|---|
US (3) | US7807411B2 (pt) |
EP (1) | EP2018429A4 (pt) |
JP (1) | JP2009538136A (pt) |
KR (1) | KR20090024706A (pt) |
AU (1) | AU2007267950B2 (pt) |
BR (1) | BRPI0711811A2 (pt) |
CA (1) | CA2652894A1 (pt) |
IL (1) | IL195250A0 (pt) |
MX (1) | MX2008014776A (pt) |
RU (1) | RU2473690C2 (pt) |
WO (1) | WO2007139870A1 (pt) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL158418A0 (en) * | 2001-04-19 | 2004-05-12 | Scripps Research Inst | In vivo incorporation of unnatural amino acids |
ATE445709T1 (de) * | 2002-10-16 | 2009-10-15 | Scripps Research Inst | Glycoproteinsynthese |
ATE542894T1 (de) | 2003-04-17 | 2012-02-15 | Scripps Research Inst | Ausweitung des eukaryotischen genetischen codes |
DE602004027770D1 (de) | 2003-07-07 | 2010-07-29 | Scripps Research Inst | Zusammensetzungen aus orthogonalen Lysyl-TRNA- und Aminoacyl-TRNA-Synthetasepaaren und deren Verwendung |
EP2271662A4 (en) | 2008-03-21 | 2012-03-21 | Univ California | HIGH SENSITIVITY FLUORESCENT ENERGY TRANSFER ASSAY USING FLUORESCENT AMINO ACIDS AND FLUORESCENT PROTEINS |
US20130078660A1 (en) * | 2010-03-23 | 2013-03-28 | Salk Institute For Biological Studies | Methods and compositions for detecting protein modifications |
FR2972114B1 (fr) | 2011-03-01 | 2013-03-15 | Univ Grenoble 1 | Un nouveau leurre moleculaire procoagulant pour le traitement des hemophiles a ou b avec ou sans inhibiteur |
CN105541962B (zh) * | 2015-12-19 | 2021-04-02 | 深圳市贝沃德克生物技术研究院有限公司 | 基于7-羟基香豆素的定点荧光标记方法 |
CN105524167A (zh) * | 2016-01-30 | 2016-04-27 | 深圳市贝沃德克生物技术研究院有限公司 | 抗乙肝e抗原的绿色荧光抗体的制备方法 |
CN111304234A (zh) * | 2020-02-27 | 2020-06-19 | 江南大学 | 一种适用于枯草芽孢杆菌的非天然氨基酸利用工具 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5998593A (en) | 1998-03-10 | 1999-12-07 | Abbott Laboratories | Fluorescent enzyme substrates |
IL158418A0 (en) | 2001-04-19 | 2004-05-12 | Scripps Research Inst | In vivo incorporation of unnatural amino acids |
DE60327369D1 (de) | 2002-10-16 | 2009-06-04 | Scripps Research Inst | Stellenspezifischer einbau von ketoaminosäuren in proteine |
ATE445709T1 (de) | 2002-10-16 | 2009-10-15 | Scripps Research Inst | Glycoproteinsynthese |
CA2508939A1 (en) | 2002-12-22 | 2004-07-15 | The Scripps Research Institute | Protein arrays |
ATE542894T1 (de) | 2003-04-17 | 2012-02-15 | Scripps Research Inst | Ausweitung des eukaryotischen genetischen codes |
CA2527877A1 (en) * | 2003-06-18 | 2005-01-13 | The Scripps Research Institute | Unnatural reactive amino acid genetic code additions |
DE602004027770D1 (de) | 2003-07-07 | 2010-07-29 | Scripps Research Inst | Zusammensetzungen aus orthogonalen Lysyl-TRNA- und Aminoacyl-TRNA-Synthetasepaaren und deren Verwendung |
US20060160175A1 (en) | 2003-07-07 | 2006-07-20 | The Scripps Research Institute | Compositions of orthogonal leucyl-trna and aminoacyl-trna synthetase pairs and uses thereof |
US7527943B2 (en) * | 2003-07-07 | 2009-05-05 | The Scripps Research Institute | Compositions of orthogonal glutamyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof |
EP1687401B1 (en) * | 2003-10-14 | 2012-11-21 | The Scripps Research Institute | Site-specific incorporation of redox active amino acids into proteins |
CA2549830A1 (en) | 2003-12-18 | 2006-01-05 | The Scripps Research Institute | Selective incorporation of 5-hyroxytryptophan into proteins in mammalian cells |
EP1774018A2 (en) | 2004-05-25 | 2007-04-18 | The Scripps Research Institute | Site specific incorporation of heavy atom-containing unnatural amino acids into proteins for crystal structure determination |
US20060134746A1 (en) * | 2004-09-21 | 2006-06-22 | The Scripps Research Institute | Adding photoregulated amino acids to the genetic code |
JP2008513039A (ja) | 2004-09-21 | 2008-05-01 | ザ スクリップス リサーチ インスティテュート | 真正細菌の蛋白質へのアルキニルアミノ酸のインビボ組込み |
JP2008513806A (ja) * | 2004-09-22 | 2008-05-01 | ザ スクリップス リサーチ インスティテュート | Nmr試験のための蛋白質の部位特異的標識 |
US7378263B2 (en) | 2004-10-20 | 2008-05-27 | The Scripps Research Institute | In vivo site-specific incorporation of N-acetyl-galactosamine amino acids in eubacteria |
MX2007004892A (es) | 2004-10-27 | 2007-08-16 | Scripps Research Inst | Componentes de traduccion ortogonales para la incorporacion in vivo de aminoacidos no naturales. |
CA2624290A1 (en) * | 2005-10-12 | 2007-04-26 | Scripps Research Institute | Selective posttranslational modification of phage-displayed polypeptides |
MX2008011470A (es) | 2006-03-09 | 2008-09-24 | Scripps Research Inst | Sistemas para la expresion de componentes de traduccion ortogonales en celulas huesped eubacterianas. |
US8217145B2 (en) * | 2006-03-16 | 2012-07-10 | The Scrips Research Institute | Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine |
-
2007
- 2007-05-21 CA CA002652894A patent/CA2652894A1/en not_active Abandoned
- 2007-05-21 MX MX2008014776A patent/MX2008014776A/es active IP Right Grant
- 2007-05-21 KR KR1020087030491A patent/KR20090024706A/ko not_active Application Discontinuation
- 2007-05-21 US US11/805,247 patent/US7807411B2/en not_active Expired - Fee Related
- 2007-05-21 AU AU2007267950A patent/AU2007267950B2/en not_active Ceased
- 2007-05-21 US US12/227,383 patent/US8192952B2/en not_active Expired - Fee Related
- 2007-05-21 BR BRPI0711811-2A patent/BRPI0711811A2/pt not_active IP Right Cessation
- 2007-05-21 WO PCT/US2007/012361 patent/WO2007139870A1/en active Application Filing
- 2007-05-21 JP JP2009512140A patent/JP2009538136A/ja active Pending
- 2007-05-21 EP EP07777256A patent/EP2018429A4/en not_active Withdrawn
- 2007-05-21 RU RU2008145487/10A patent/RU2473690C2/ru not_active IP Right Cessation
-
2008
- 2008-11-12 IL IL195250A patent/IL195250A0/en unknown
-
2012
- 2012-04-30 US US13/460,174 patent/US20120329162A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP2018429A4 (en) | 2010-07-14 |
JP2009538136A (ja) | 2009-11-05 |
AU2007267950B2 (en) | 2012-08-16 |
EP2018429A1 (en) | 2009-01-28 |
US20090298119A1 (en) | 2009-12-03 |
US20120329162A1 (en) | 2012-12-27 |
IL195250A0 (en) | 2011-08-01 |
KR20090024706A (ko) | 2009-03-09 |
US7807411B2 (en) | 2010-10-05 |
US20080044886A1 (en) | 2008-02-21 |
RU2008145487A (ru) | 2010-06-27 |
WO2007139870A1 (en) | 2007-12-06 |
AU2007267950A1 (en) | 2007-12-06 |
MX2008014776A (es) | 2008-11-28 |
US8192952B2 (en) | 2012-06-05 |
RU2473690C2 (ru) | 2013-01-27 |
CA2652894A1 (en) | 2007-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8394605B2 (en) | Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine | |
ES2301099T3 (es) | Composiciones de parejas ortogonales lisil-arnt y aminoacil-arnt sintetasa y usos de las mismas. | |
ES2666693T3 (es) | Incorporación in vivo de alquinil aminoácidos a proteínas en eubacterias | |
ES2432391T3 (es) | Sistema para la expresión de componentes de traducción ortogonales en células huésped eubacterianas | |
BRPI0718389A2 (pt) | incorporação genética de aminoácidos antinaturais em proteìnas em células de mamìferos | |
US7807411B2 (en) | Genetically encoded fluorescent coumarin amino acids | |
WO2006110182A2 (en) | Orthogonal translation components for the in vivo incorporation of unnatural amino acids | |
ES2348487T3 (es) | Composiciones de parejas aminoacil-trna sintetasa y trna-lisil ortogonales y usos de las mismas. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B08F | Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette] |
Free format text: REFERENTE 6A. ANUIDADE(S). |
|
B08K | Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette] |
Free format text: REFERENTE AO DESPACHO 8.6 PUBLICADO NA RPI 2226 DE 03/09/2013. |