BRPI0709603A2 - expressão de proteìnas geneticamente programada contendo o aminoácido não natural fenilselenocisteìna - Google Patents
expressão de proteìnas geneticamente programada contendo o aminoácido não natural fenilselenocisteìna Download PDFInfo
- Publication number
- BRPI0709603A2 BRPI0709603A2 BRPI0709603-8A BRPI0709603A BRPI0709603A2 BR PI0709603 A2 BRPI0709603 A2 BR PI0709603A2 BR PI0709603 A BRPI0709603 A BR PI0709603A BR PI0709603 A2 BRPI0709603 A2 BR PI0709603A2
- Authority
- BR
- Brazil
- Prior art keywords
- trna
- amino acid
- protein
- unnatural amino
- phenylselenocysteine
- Prior art date
Links
- 150000001413 amino acids Chemical class 0.000 title claims abstract description 404
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 262
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 241
- FXTLFZWJXBBXGX-QMMMGPOBSA-N (2R)-2-anilino-3-selanylpropanoic acid Chemical compound OC(=O)[C@H](C[SeH])NC1=CC=CC=C1 FXTLFZWJXBBXGX-QMMMGPOBSA-N 0.000 title claims abstract description 96
- 230000014509 gene expression Effects 0.000 title abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 177
- 238000013519 translation Methods 0.000 claims abstract description 131
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 112
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 112
- 239000002157 polynucleotide Substances 0.000 claims abstract description 112
- 102000003960 Ligases Human genes 0.000 claims abstract description 77
- 108090000364 Ligases Proteins 0.000 claims abstract description 77
- -1 PHENYLSELENOCYSTEINE AMINO ACID Chemical class 0.000 claims abstract description 36
- 241000588724 Escherichia coli Species 0.000 claims abstract description 30
- 125000000266 alpha-aminoacyl group Chemical group 0.000 claims abstract description 26
- 150000002632 lipids Chemical class 0.000 claims abstract description 24
- 235000001014 amino acid Nutrition 0.000 claims description 408
- 235000018102 proteins Nutrition 0.000 claims description 224
- 108020004705 Codon Proteins 0.000 claims description 204
- 150000007523 nucleic acids Chemical class 0.000 claims description 115
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 109
- 102000039446 nucleic acids Human genes 0.000 claims description 107
- 108020004707 nucleic acids Proteins 0.000 claims description 107
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 106
- 229920001184 polypeptide Polymers 0.000 claims description 104
- 239000000203 mixture Substances 0.000 claims description 53
- 238000006243 chemical reaction Methods 0.000 claims description 38
- 238000004519 manufacturing process Methods 0.000 claims description 31
- 238000002703 mutagenesis Methods 0.000 claims description 29
- 231100000350 mutagenesis Toxicity 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 26
- 230000004044 response Effects 0.000 claims description 25
- UQBOJOOOTLPNST-UHFFFAOYSA-N Dehydroalanine Chemical compound NC(=C)C(O)=O UQBOJOOOTLPNST-UHFFFAOYSA-N 0.000 claims description 22
- 239000002773 nucleotide Substances 0.000 claims description 18
- 125000003729 nucleotide group Chemical group 0.000 claims description 18
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 claims description 16
- CFISTOPZXSTQOS-SFHVURJKSA-N (2r)-2-amino-3-hexadecylsulfanylpropanoic acid Chemical compound CCCCCCCCCCCCCCCCSC[C@H](N)C(O)=O CFISTOPZXSTQOS-SFHVURJKSA-N 0.000 claims description 13
- 241001112695 Clostridiales Species 0.000 claims description 12
- 238000007248 oxidative elimination reaction Methods 0.000 claims description 10
- 108091060545 Nonsense suppressor Proteins 0.000 claims description 7
- 239000013604 expression vector Substances 0.000 claims description 7
- 238000002741 site-directed mutagenesis Methods 0.000 claims description 6
- YYHOQQKJSHXDEN-KRWDZBQOSA-N N-palmitoyl-L-cysteine Chemical compound CCCCCCCCCCCCCCCC(=O)N[C@@H](CS)C(O)=O YYHOQQKJSHXDEN-KRWDZBQOSA-N 0.000 claims description 5
- SYSLNQMKLROGCL-BCYUYYMPSA-N S-[(2E,6E)-farnesyl]-L-cysteine zwitterion Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CSC[C@H](N)C(O)=O SYSLNQMKLROGCL-BCYUYYMPSA-N 0.000 claims description 5
- 238000006845 Michael addition reaction Methods 0.000 claims description 4
- KPUXJBYSYFEKKB-UHFFFAOYSA-N hexadecanethioic s-acid Chemical compound CCCCCCCCCCCCCCCC(S)=O KPUXJBYSYFEKKB-UHFFFAOYSA-N 0.000 claims description 4
- 239000000061 acid fraction Substances 0.000 claims description 2
- LSDPWZHWYPCBBB-UHFFFAOYSA-N Methanethiol Chemical compound SC LSDPWZHWYPCBBB-UHFFFAOYSA-N 0.000 claims 1
- 238000012258 culturing Methods 0.000 claims 1
- 125000003473 lipid group Chemical group 0.000 claims 1
- 230000004048 modification Effects 0.000 abstract description 25
- 238000012986 modification Methods 0.000 abstract description 25
- 102000035118 modified proteins Human genes 0.000 abstract description 2
- 108091005573 modified proteins Proteins 0.000 abstract description 2
- 229940024606 amino acid Drugs 0.000 description 382
- 210000004027 cell Anatomy 0.000 description 183
- 108020004566 Transfer RNA Proteins 0.000 description 141
- 230000014616 translation Effects 0.000 description 105
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 description 56
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 description 56
- 239000003550 marker Substances 0.000 description 47
- 238000001727 in vivo Methods 0.000 description 44
- 230000002068 genetic effect Effects 0.000 description 41
- 238000010348 incorporation Methods 0.000 description 40
- 230000001629 suppression Effects 0.000 description 36
- 102000004190 Enzymes Human genes 0.000 description 34
- 108090000790 Enzymes Proteins 0.000 description 34
- 125000003275 alpha amino acid group Chemical group 0.000 description 33
- 229940088598 enzyme Drugs 0.000 description 33
- 241000894007 species Species 0.000 description 31
- 108020004414 DNA Proteins 0.000 description 29
- 238000009396 hybridization Methods 0.000 description 28
- 241000894006 Bacteria Species 0.000 description 27
- 238000000338 in vitro Methods 0.000 description 25
- 230000015572 biosynthetic process Effects 0.000 description 23
- 239000000523 sample Substances 0.000 description 23
- 230000000295 complement effect Effects 0.000 description 21
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 20
- 108020005038 Terminator Codon Proteins 0.000 description 20
- 230000006870 function Effects 0.000 description 20
- 238000003786 synthesis reaction Methods 0.000 description 20
- 230000000694 effects Effects 0.000 description 19
- 239000000126 substance Substances 0.000 description 18
- 230000035772 mutation Effects 0.000 description 17
- 238000006467 substitution reaction Methods 0.000 description 17
- 238000003556 assay Methods 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 15
- 238000012360 testing method Methods 0.000 description 15
- 230000001225 therapeutic effect Effects 0.000 description 14
- 230000001965 increasing effect Effects 0.000 description 13
- 239000013612 plasmid Substances 0.000 description 13
- 230000006229 amino acid addition Effects 0.000 description 12
- 238000009739 binding Methods 0.000 description 12
- 230000037361 pathway Effects 0.000 description 12
- 239000002253 acid Substances 0.000 description 11
- 241000203069 Archaea Species 0.000 description 10
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- 238000013459 approach Methods 0.000 description 10
- 239000003795 chemical substances by application Substances 0.000 description 10
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 9
- 241000203407 Methanocaldococcus jannaschii Species 0.000 description 9
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 9
- 241000700605 Viruses Species 0.000 description 9
- 230000003115 biocidal effect Effects 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 241000206602 Eukaryota Species 0.000 description 8
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 8
- 102000002265 Human Growth Hormone Human genes 0.000 description 8
- 108010000521 Human Growth Hormone Proteins 0.000 description 8
- 239000000854 Human Growth Hormone Substances 0.000 description 8
- 101710146427 Probable tyrosine-tRNA ligase, cytoplasmic Proteins 0.000 description 8
- 101710107268 Tyrosine-tRNA ligase, mitochondrial Proteins 0.000 description 8
- 108010062796 arginyllysine Proteins 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 8
- 108010054155 lysyllysine Proteins 0.000 description 8
- 239000012528 membrane Substances 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- 239000000758 substrate Substances 0.000 description 8
- 241000196324 Embryophyta Species 0.000 description 7
- 102000018378 Tyrosine-tRNA ligase Human genes 0.000 description 7
- 238000007792 addition Methods 0.000 description 7
- 230000004071 biological effect Effects 0.000 description 7
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 7
- 230000021615 conjugation Effects 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 238000006011 modification reaction Methods 0.000 description 7
- 235000008729 phenylalanine Nutrition 0.000 description 7
- 230000004481 post-translational protein modification Effects 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 235000002374 tyrosine Nutrition 0.000 description 7
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 6
- 241000238631 Hexapoda Species 0.000 description 6
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 6
- 108020004485 Nonsense Codon Proteins 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 230000012010 growth Effects 0.000 description 6
- 230000029226 lipidation Effects 0.000 description 6
- 238000010369 molecular cloning Methods 0.000 description 6
- 230000009145 protein modification Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 231100000331 toxic Toxicity 0.000 description 6
- 230000002588 toxic effect Effects 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 108010016529 Bacillus amyloliquefaciens ribonuclease Proteins 0.000 description 5
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 5
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 5
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 5
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 5
- 241000204667 Thermoplasma Species 0.000 description 5
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 5
- 229960000723 ampicillin Drugs 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 102000005936 beta-Galactosidase Human genes 0.000 description 5
- 108010005774 beta-Galactosidase Proteins 0.000 description 5
- 230000001851 biosynthetic effect Effects 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 210000003527 eukaryotic cell Anatomy 0.000 description 5
- UHBYWPGGCSDKFX-VKHMYHEASA-N gamma-carboxy-L-glutamic acid Chemical compound OC(=O)[C@@H](N)CC(C(O)=O)C(O)=O UHBYWPGGCSDKFX-VKHMYHEASA-N 0.000 description 5
- 239000005090 green fluorescent protein Substances 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 239000001257 hydrogen Substances 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 239000003262 industrial enzyme Substances 0.000 description 5
- 230000000269 nucleophilic effect Effects 0.000 description 5
- 238000012552 review Methods 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 5
- 108020005098 Anticodon Proteins 0.000 description 4
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 4
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 4
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 4
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 4
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 4
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 4
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 4
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 4
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 4
- PCPOYRCAHPJXII-UWVGGRQHSA-N Gly-Lys-Met Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PCPOYRCAHPJXII-UWVGGRQHSA-N 0.000 description 4
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 4
- ABCCKUZDWMERKT-AVGNSLFASA-N His-Pro-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O ABCCKUZDWMERKT-AVGNSLFASA-N 0.000 description 4
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 4
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 4
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 4
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 4
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 4
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 4
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 4
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 4
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 4
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 4
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 4
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 4
- 239000004472 Lysine Substances 0.000 description 4
- GODBLDDYHFTUAH-CIUDSAMLSA-N Met-Asp-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O GODBLDDYHFTUAH-CIUDSAMLSA-N 0.000 description 4
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 4
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- 108091005461 Nucleic proteins Proteins 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 4
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 4
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 4
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 4
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 4
- GHUNBABNQPIETG-MELADBBJSA-N Tyr-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O GHUNBABNQPIETG-MELADBBJSA-N 0.000 description 4
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 150000007513 acids Chemical class 0.000 description 4
- 235000008206 alpha-amino acids Nutrition 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 239000003242 anti bacterial agent Substances 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000037433 frameshift Effects 0.000 description 4
- 239000003102 growth factor Substances 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 238000007899 nucleic acid hybridization Methods 0.000 description 4
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 239000013641 positive control Substances 0.000 description 4
- 238000002708 random mutagenesis Methods 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 125000001424 substituent group Chemical group 0.000 description 4
- 108010061238 threonyl-glycine Proteins 0.000 description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 4
- 150000003668 tyrosines Chemical class 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 210000005253 yeast cell Anatomy 0.000 description 4
- CJWPDADGDASKGI-YFVJMOTDSA-N (2e,6e)-3,7,11-trimethyldodeca-2,6,10-triene-1-thiol Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CS CJWPDADGDASKGI-YFVJMOTDSA-N 0.000 description 3
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 3
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 3
- 241000193830 Bacillus <bacterium> Species 0.000 description 3
- 244000063299 Bacillus subtilis Species 0.000 description 3
- 235000014469 Bacillus subtilis Nutrition 0.000 description 3
- 241000195493 Cryptophyta Species 0.000 description 3
- WHUUTDBJXJRKMK-GSVOUGTGSA-N D-glutamic acid Chemical compound OC(=O)[C@H](N)CCC(O)=O WHUUTDBJXJRKMK-GSVOUGTGSA-N 0.000 description 3
- 108090000385 Fibroblast growth factor 7 Proteins 0.000 description 3
- 102000003972 Fibroblast growth factor 7 Human genes 0.000 description 3
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 3
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- RNAYRCNHRYEBTH-IHRRRGAJSA-N His-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RNAYRCNHRYEBTH-IHRRRGAJSA-N 0.000 description 3
- 102000008100 Human Serum Albumin Human genes 0.000 description 3
- 108091006905 Human Serum Albumin Proteins 0.000 description 3
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 3
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 241000204641 Methanopyrus kandleri Species 0.000 description 3
- 102100030856 Myoglobin Human genes 0.000 description 3
- 108010062374 Myoglobin Proteins 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 102000035195 Peptidases Human genes 0.000 description 3
- XXAOSEUPEMQJOF-KKUMJFAQSA-N Phe-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XXAOSEUPEMQJOF-KKUMJFAQSA-N 0.000 description 3
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 241000205101 Sulfolobus Species 0.000 description 3
- 108060008683 Tumor Necrosis Factor Receptor Proteins 0.000 description 3
- 102100040247 Tumor necrosis factor Human genes 0.000 description 3
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 3
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 3
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 3
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 3
- 150000001371 alpha-amino acids Chemical class 0.000 description 3
- 150000001408 amides Chemical class 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 235000009697 arginine Nutrition 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 3
- 238000007429 general method Methods 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 235000004554 glutamine Nutrition 0.000 description 3
- 150000002308 glutamine derivatives Chemical class 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 238000003018 immunoassay Methods 0.000 description 3
- 230000002757 inflammatory effect Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 150000002994 phenylalanines Chemical class 0.000 description 3
- 229920000570 polyether Polymers 0.000 description 3
- 235000013930 proline Nutrition 0.000 description 3
- 230000004850 protein–protein interaction Effects 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 210000003705 ribosome Anatomy 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 230000004083 survival effect Effects 0.000 description 3
- 125000003396 thiol group Chemical group [H]S* 0.000 description 3
- 231100000765 toxin Toxicity 0.000 description 3
- 239000003053 toxin Substances 0.000 description 3
- 108700012359 toxins Proteins 0.000 description 3
- 102000003298 tumor necrosis factor receptor Human genes 0.000 description 3
- 238000011179 visual inspection Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- PFLVUZBNZZOUSS-QMMMGPOBSA-N (2r)-2-amino-3-phenylselanylpropanoic acid Chemical compound OC(=O)[C@@H](N)C[Se]C1=CC=CC=C1 PFLVUZBNZZOUSS-QMMMGPOBSA-N 0.000 description 2
- FDKWRPBBCBCIGA-REOHCLBHSA-N (2r)-2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]C[C@H](N)C(O)=O FDKWRPBBCBCIGA-REOHCLBHSA-N 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 244000105975 Antidesma platyphyllum Species 0.000 description 2
- 241000238421 Arthropoda Species 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 102100021943 C-C motif chemokine 2 Human genes 0.000 description 2
- 101710155857 C-C motif chemokine 2 Proteins 0.000 description 2
- 108010029697 CD40 Ligand Proteins 0.000 description 2
- 102100032937 CD40 ligand Human genes 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 102000007644 Colony-Stimulating Factors Human genes 0.000 description 2
- 108010071942 Colony-Stimulating Factors Proteins 0.000 description 2
- 241000192700 Cyanobacteria Species 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 2
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 2
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 2
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- 102100034221 Growth-regulated alpha protein Human genes 0.000 description 2
- 241000204991 Haloferax Species 0.000 description 2
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 2
- 102100021866 Hepatocyte growth factor Human genes 0.000 description 2
- 102000007625 Hirudins Human genes 0.000 description 2
- 108010007267 Hirudins Proteins 0.000 description 2
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 101001069921 Homo sapiens Growth-regulated alpha protein Proteins 0.000 description 2
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 2
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 2
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 102100037850 Interferon gamma Human genes 0.000 description 2
- 108010074328 Interferon-gamma Proteins 0.000 description 2
- 108010050904 Interferons Proteins 0.000 description 2
- 102000014150 Interferons Human genes 0.000 description 2
- 108010002352 Interleukin-1 Proteins 0.000 description 2
- 108010002350 Interleukin-2 Proteins 0.000 description 2
- 108010063738 Interleukins Proteins 0.000 description 2
- 102000015696 Interleukins Human genes 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- YWJQHDDBFAXNIR-MXAVVETBSA-N Lys-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N YWJQHDDBFAXNIR-MXAVVETBSA-N 0.000 description 2
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 2
- OFOBLEOULBTSOW-UHFFFAOYSA-L Malonate Chemical compound [O-]C(=O)CC([O-])=O OFOBLEOULBTSOW-UHFFFAOYSA-L 0.000 description 2
- DJDFBVNNDAUPRW-GUBZILKMSA-N Met-Glu-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O DJDFBVNNDAUPRW-GUBZILKMSA-N 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 239000004721 Polyphenylene oxide Substances 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 230000006819 RNA synthesis Effects 0.000 description 2
- 101150023114 RNA1 gene Proteins 0.000 description 2
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 2
- 241000160715 Sulfolobus tokodaii Species 0.000 description 2
- OUUQCZGPVNCOIJ-UHFFFAOYSA-M Superoxide Chemical compound [O-][O] OUUQCZGPVNCOIJ-UHFFFAOYSA-M 0.000 description 2
- MUMGGOZAMZWBJJ-DYKIIFRCSA-N Testostosterone Chemical compound O=C1CC[C@]2(C)[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 MUMGGOZAMZWBJJ-DYKIIFRCSA-N 0.000 description 2
- 241000589499 Thermus thermophilus Species 0.000 description 2
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 125000000304 alkynyl group Chemical group 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 238000003149 assay kit Methods 0.000 description 2
- 230000001746 atrial effect Effects 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 210000002421 cell wall Anatomy 0.000 description 2
- 230000005754 cellular signaling Effects 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- WHTVZRBIWZFKQO-UHFFFAOYSA-N chloroquine Chemical compound ClC1=CC=C2C(NC(C)CCCN(CC)CC)=CC=NC2=C1 WHTVZRBIWZFKQO-UHFFFAOYSA-N 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000037029 cross reaction Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 235000009424 haa Nutrition 0.000 description 2
- 125000001475 halogen functional group Chemical group 0.000 description 2
- WQPDUTSPKFMPDP-OUMQNGNKSA-N hirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(OS(O)(=O)=O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N2)=O)CSSC1)C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)CSSC1)C(C)C)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 WQPDUTSPKFMPDP-OUMQNGNKSA-N 0.000 description 2
- 229940006607 hirudin Drugs 0.000 description 2
- 229930195733 hydrocarbon Natural products 0.000 description 2
- 150000002430 hydrocarbons Chemical class 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 229940047124 interferons Drugs 0.000 description 2
- 229940047122 interleukins Drugs 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 125000000468 ketone group Chemical group 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 210000005060 membrane bound organelle Anatomy 0.000 description 2
- 238000012269 metabolic engineering Methods 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 238000001823 molecular biology technique Methods 0.000 description 2
- 239000003471 mutagenic agent Substances 0.000 description 2
- 231100000707 mutagenic chemical Toxicity 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 102000016914 ras Proteins Human genes 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 102200021347 rs876659329 Human genes 0.000 description 2
- 229910052711 selenium Inorganic materials 0.000 description 2
- 239000011669 selenium Substances 0.000 description 2
- 235000016491 selenocysteine Nutrition 0.000 description 2
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 2
- 229940055619 selenocysteine Drugs 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 238000007086 side reaction Methods 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000006257 total synthesis reaction Methods 0.000 description 2
- 108091006106 transcriptional activators Proteins 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- DNIAPMSPPWPWGF-VKHMYHEASA-N (+)-propylene glycol Chemical compound C[C@H](O)CO DNIAPMSPPWPWGF-VKHMYHEASA-N 0.000 description 1
- OGNSCSPNOLGXSM-UHFFFAOYSA-N (+/-)-DABA Natural products NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 1
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- RWLSBXBFZHDHHX-VIFPVBQESA-N (2s)-2-(naphthalen-2-ylamino)propanoic acid Chemical compound C1=CC=CC2=CC(N[C@@H](C)C(O)=O)=CC=C21 RWLSBXBFZHDHHX-VIFPVBQESA-N 0.000 description 1
- VFCYASLQFGXHTQ-VIFPVBQESA-N (2s)-2-[benzyl(nitro)amino]-3-hydroxypropanoic acid Chemical compound OC[C@@H](C(O)=O)N([N+]([O-])=O)CC1=CC=CC=C1 VFCYASLQFGXHTQ-VIFPVBQESA-N 0.000 description 1
- YYTDJPUFAVPHQA-VKHMYHEASA-N (2s)-2-amino-3-(2,3,4,5,6-pentafluorophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=C(F)C(F)=C(F)C(F)=C1F YYTDJPUFAVPHQA-VKHMYHEASA-N 0.000 description 1
- PEMUHKUIQHFMTH-QMMMGPOBSA-N (2s)-2-amino-3-(4-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Br)C=C1 PEMUHKUIQHFMTH-QMMMGPOBSA-N 0.000 description 1
- JSXMFBNJRFXRCX-NSHDSACASA-N (2s)-2-amino-3-(4-prop-2-ynoxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OCC#C)C=C1 JSXMFBNJRFXRCX-NSHDSACASA-N 0.000 description 1
- BNIFSVVAHBLNTN-XKKUQSFHSA-N (2s)-4-amino-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-1-[(2s)-4-amino-2-[[2-[[(2s)-2-[[(2s)-2-[[(2s)-1-[(2s)-6-amino-2-[[(2s)-2-[[(2s)-2-[[(2s,3r)-2-amino-3-hydroxybutanoyl]amino]-4-methylsulfanylbutanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]hexan Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N1[C@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O)CCC1 BNIFSVVAHBLNTN-XKKUQSFHSA-N 0.000 description 1
- 108010052418 (N-(2-((4-((2-((4-(9-acridinylamino)phenyl)amino)-2-oxoethyl)amino)-4-oxobutyl)amino)-1-(1H-imidazol-4-ylmethyl)-1-oxoethyl)-6-(((-2-aminoethyl)amino)methyl)-2-pyridinecarboxamidato) iron(1+) Proteins 0.000 description 1
- WHTVZRBIWZFKQO-AWEZNQCLSA-N (S)-chloroquine Chemical compound ClC1=CC=C2C(N[C@@H](C)CCCN(CC)CC)=CC=NC2=C1 WHTVZRBIWZFKQO-AWEZNQCLSA-N 0.000 description 1
- 230000006269 (delayed) early viral mRNA transcription Effects 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- YPFDHNVEDLHUCE-UHFFFAOYSA-N 1,3-propanediol Substances OCCCO YPFDHNVEDLHUCE-UHFFFAOYSA-N 0.000 description 1
- 229940035437 1,3-propanediol Drugs 0.000 description 1
- RXMWXENJQAINCC-DMTCNVIQSA-N 2,5-didehydro-D-gluconic acid Chemical compound OCC(=O)[C@@H](O)[C@H](O)C(=O)C(O)=O RXMWXENJQAINCC-DMTCNVIQSA-N 0.000 description 1
- RXMWXENJQAINCC-UHFFFAOYSA-N 2,5-diketo-D-gluconic acid Natural products OCC(=O)C(O)C(O)C(=O)C(O)=O RXMWXENJQAINCC-UHFFFAOYSA-N 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- JZRBSTONIYRNRI-VIFPVBQESA-N 3-methylphenylalanine Chemical compound CC1=CC=CC(C[C@H](N)C(O)=O)=C1 JZRBSTONIYRNRI-VIFPVBQESA-N 0.000 description 1
- FBTSQILOGYXGMD-LURJTMIESA-N 3-nitro-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C([N+]([O-])=O)=C1 FBTSQILOGYXGMD-LURJTMIESA-N 0.000 description 1
- IRZQDMYEJPNDEN-UHFFFAOYSA-N 3-phenyl-2-aminobutanoic acid Natural products OC(=O)C(N)C(C)C1=CC=CC=C1 IRZQDMYEJPNDEN-UHFFFAOYSA-N 0.000 description 1
- CMUHFUGDYMFHEI-QMMMGPOBSA-N 4-amino-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-QMMMGPOBSA-N 0.000 description 1
- PZNQZSRPDOEBMS-QMMMGPOBSA-N 4-iodo-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(I)C=C1 PZNQZSRPDOEBMS-QMMMGPOBSA-N 0.000 description 1
- GTVVZTAFGPQSPC-UHFFFAOYSA-N 4-nitrophenylalanine Chemical compound OC(=O)C(N)CC1=CC=C([N+]([O-])=O)C=C1 GTVVZTAFGPQSPC-UHFFFAOYSA-N 0.000 description 1
- CJIJXIFQYOPWTF-UHFFFAOYSA-N 7-hydroxycoumarin Natural products O1C(=O)C=CC2=CC(O)=CC=C21 CJIJXIFQYOPWTF-UHFFFAOYSA-N 0.000 description 1
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 1
- 101150067361 Aars1 gene Proteins 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 1
- PQSUYGKTWSAVDQ-ZVIOFETBSA-N Aldosterone Chemical compound C([C@@]1([C@@H](C(=O)CO)CC[C@H]1[C@@H]1CC2)C=O)[C@H](O)[C@@H]1[C@]1(C)C2=CC(=O)CC1 PQSUYGKTWSAVDQ-ZVIOFETBSA-N 0.000 description 1
- PQSUYGKTWSAVDQ-UHFFFAOYSA-N Aldosterone Natural products C1CC2C3CCC(C(=O)CO)C3(C=O)CC(O)C2C2(C)C1=CC(=O)CC2 PQSUYGKTWSAVDQ-UHFFFAOYSA-N 0.000 description 1
- 108700023418 Amidases Proteins 0.000 description 1
- 102000004092 Amidohydrolases Human genes 0.000 description 1
- 108090000531 Amidohydrolases Proteins 0.000 description 1
- 102000006534 Amino Acid Isomerases Human genes 0.000 description 1
- 108010008830 Amino Acid Isomerases Proteins 0.000 description 1
- 102400000068 Angiostatin Human genes 0.000 description 1
- 108010079709 Angiostatins Proteins 0.000 description 1
- 102000007592 Apolipoproteins Human genes 0.000 description 1
- 108010071619 Apolipoproteins Proteins 0.000 description 1
- 108010083590 Apoproteins Proteins 0.000 description 1
- 102000006410 Apoproteins Human genes 0.000 description 1
- OZDNDGXASTWERN-CTNGQTDRSA-N Apovincamine Chemical compound C1=CC=C2C(CCN3CCC4)=C5[C@@H]3[C@]4(CC)C=C(C(=O)OC)N5C2=C1 OZDNDGXASTWERN-CTNGQTDRSA-N 0.000 description 1
- 101000716807 Arabidopsis thaliana Protein SCO1 homolog 1, mitochondrial Proteins 0.000 description 1
- 241000712891 Arenavirus Species 0.000 description 1
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 1
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- OEDJQRXNDRUGEU-SRVKXCTJSA-N Asp-Leu-His Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O OEDJQRXNDRUGEU-SRVKXCTJSA-N 0.000 description 1
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 101800001288 Atrial natriuretic factor Proteins 0.000 description 1
- 102400001282 Atrial natriuretic peptide Human genes 0.000 description 1
- 101800001890 Atrial natriuretic peptide Proteins 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 102100032367 C-C motif chemokine 5 Human genes 0.000 description 1
- 102100032366 C-C motif chemokine 7 Human genes 0.000 description 1
- 102100034871 C-C motif chemokine 8 Human genes 0.000 description 1
- 102100025248 C-X-C motif chemokine 10 Human genes 0.000 description 1
- 101710098275 C-X-C motif chemokine 10 Proteins 0.000 description 1
- 102100036150 C-X-C motif chemokine 5 Human genes 0.000 description 1
- 102100036153 C-X-C motif chemokine 6 Human genes 0.000 description 1
- 101710085504 C-X-C motif chemokine 6 Proteins 0.000 description 1
- 102100036170 C-X-C motif chemokine 9 Human genes 0.000 description 1
- 101710085500 C-X-C motif chemokine 9 Proteins 0.000 description 1
- 102000001902 CC Chemokines Human genes 0.000 description 1
- 108010040471 CC Chemokines Proteins 0.000 description 1
- 101150013553 CD40 gene Proteins 0.000 description 1
- 102100032912 CD44 antigen Human genes 0.000 description 1
- 108050006947 CXC Chemokine Proteins 0.000 description 1
- 102000019388 CXC chemokine Human genes 0.000 description 1
- 102000055006 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010055166 Chemokine CCL5 Proteins 0.000 description 1
- 108010055124 Chemokine CCL7 Proteins 0.000 description 1
- 108010055204 Chemokine CCL8 Proteins 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 102100023804 Coagulation factor VII Human genes 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 102000016917 Complement C1 Human genes 0.000 description 1
- 108010028774 Complement C1 Proteins 0.000 description 1
- 108010078546 Complement C5a Proteins 0.000 description 1
- 229940124073 Complement inhibitor Drugs 0.000 description 1
- OMFXVFTZEKFJBZ-UHFFFAOYSA-N Corticosterone Natural products O=C1CCC2(C)C3C(O)CC(C)(C(CC4)C(=O)CO)C4C3CCC2=C1 OMFXVFTZEKFJBZ-UHFFFAOYSA-N 0.000 description 1
- 241000557626 Corvus corax Species 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 239000004971 Cross linker Substances 0.000 description 1
- VBIIZCXWOZDIHS-ACZMJKKPSA-N Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CS VBIIZCXWOZDIHS-ACZMJKKPSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 1
- 229930195713 D-glutamate Natural products 0.000 description 1
- ZAQJHHRNXZUBTE-NQXXGFSBSA-N D-ribulose Chemical compound OC[C@@H](O)[C@@H](O)C(=O)CO ZAQJHHRNXZUBTE-NQXXGFSBSA-N 0.000 description 1
- ZAQJHHRNXZUBTE-UHFFFAOYSA-N D-threo-2-Pentulose Natural products OCC(O)C(O)C(=O)CO ZAQJHHRNXZUBTE-UHFFFAOYSA-N 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241000224431 Entamoeba Species 0.000 description 1
- 101710104662 Enterotoxin type C-3 Proteins 0.000 description 1
- 108020002908 Epoxide hydrolase Proteins 0.000 description 1
- 102000005486 Epoxide hydrolase Human genes 0.000 description 1
- 241001125671 Eretmochelys imbricata Species 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 102100031939 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 101900234631 Escherichia coli DNA polymerase I Proteins 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 102100030844 Exocyst complex component 1 Human genes 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 108010023321 Factor VII Proteins 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 108010014173 Factor X Proteins 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 1
- 102000003971 Fibroblast Growth Factor 1 Human genes 0.000 description 1
- 108090000368 Fibroblast growth factor 8 Proteins 0.000 description 1
- 102100037362 Fibronectin Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 108010058643 Fungal Proteins Proteins 0.000 description 1
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 1
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 1
- 102100040837 Galactoside alpha-(1,2)-fucosyltransferase 2 Human genes 0.000 description 1
- 101710115997 Gamma-tubulin complex component 2 Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241000224466 Giardia Species 0.000 description 1
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 1
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 1
- 102000004547 Glucosylceramidase Human genes 0.000 description 1
- 108010017544 Glucosylceramidase Proteins 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- YNIMVVJTPWCUJH-KBPBESRZSA-N Gly-His-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YNIMVVJTPWCUJH-KBPBESRZSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- YYXJFBMCOUSYSF-RYUDHWBXSA-N Gly-Phe-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYXJFBMCOUSYSF-RYUDHWBXSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 102000006771 Gonadotropins Human genes 0.000 description 1
- 108010086677 Gonadotropins Proteins 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 1
- 102000018997 Growth Hormone Human genes 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 108090000031 Hedgehog Proteins Proteins 0.000 description 1
- 102000003693 Hedgehog Proteins Human genes 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000947186 Homo sapiens C-X-C motif chemokine 5 Proteins 0.000 description 1
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 1
- 101000893710 Homo sapiens Galactoside alpha-(1,2)-fucosyltransferase 2 Proteins 0.000 description 1
- 101000582320 Homo sapiens Neurogenic differentiation factor 6 Proteins 0.000 description 1
- 101000973997 Homo sapiens Nucleosome assembly protein 1-like 4 Proteins 0.000 description 1
- 101000947178 Homo sapiens Platelet basic protein Proteins 0.000 description 1
- 101000582950 Homo sapiens Platelet factor 4 Proteins 0.000 description 1
- 101000602164 Homo sapiens Platelet-derived growth factor subunit A Proteins 0.000 description 1
- 101001091094 Homo sapiens Prorelaxin H1 Proteins 0.000 description 1
- 101001076715 Homo sapiens RNA-binding protein 39 Proteins 0.000 description 1
- 101000652229 Homo sapiens Suppressor of cytokine signaling 7 Proteins 0.000 description 1
- 241000598436 Human T-cell lymphotropic virus Species 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 101150000378 IML1 gene Proteins 0.000 description 1
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 1
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 1
- IMRKCLXPYOIHIF-ZPFDUUQYSA-N Ile-Met-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IMRKCLXPYOIHIF-ZPFDUUQYSA-N 0.000 description 1
- NSPNUMNLZNOPAQ-SJWGOKEGSA-N Ile-Tyr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N NSPNUMNLZNOPAQ-SJWGOKEGSA-N 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 235000000177 Indigofera tinctoria Nutrition 0.000 description 1
- 102100022339 Integrin alpha-L Human genes 0.000 description 1
- 108010008212 Integrin alpha4beta1 Proteins 0.000 description 1
- 108010064593 Intercellular Adhesion Molecule-1 Proteins 0.000 description 1
- 102100037877 Intercellular adhesion molecule 1 Human genes 0.000 description 1
- 108090000174 Interleukin-10 Proteins 0.000 description 1
- 108090000177 Interleukin-11 Proteins 0.000 description 1
- 108010065805 Interleukin-12 Proteins 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 108090001007 Interleukin-8 Proteins 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 229930194542 Keto Natural products 0.000 description 1
- WTDRDQBEARUVNC-LURJTMIESA-N L-DOPA Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-LURJTMIESA-N 0.000 description 1
- WTDRDQBEARUVNC-UHFFFAOYSA-N L-Dopa Natural products OC(=O)C(N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- ZFOMKMMPBOQKMC-KXUCPTDWSA-N L-pyrrolysine Chemical compound C[C@@H]1CC=N[C@H]1C(=O)NCCCC[C@H]([NH3+])C([O-])=O ZFOMKMMPBOQKMC-KXUCPTDWSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108010001831 LDL receptors Proteins 0.000 description 1
- 102000010445 Lactoferrin Human genes 0.000 description 1
- 108010063045 Lactoferrin Proteins 0.000 description 1
- 241000222722 Leishmania <genus> Species 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000004058 Leukemia inhibitory factor Human genes 0.000 description 1
- 108090000581 Leukemia inhibitory factor Proteins 0.000 description 1
- 108010054320 Lignin peroxidase Proteins 0.000 description 1
- 101710155614 Ligninase A Proteins 0.000 description 1
- 101710155621 Ligninase B Proteins 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 108010064548 Lymphocyte Function-Associated Antigen-1 Proteins 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- PHWSCIFNNLLUFJ-NHCYSSNCSA-N Met-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N PHWSCIFNNLLUFJ-NHCYSSNCSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 1
- PBOUVYGPDSARIS-IUCAKERBSA-N Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C PBOUVYGPDSARIS-IUCAKERBSA-N 0.000 description 1
- 241000203353 Methanococcus Species 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 241000243190 Microsporidia Species 0.000 description 1
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 1
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 231100000678 Mycotoxin Toxicity 0.000 description 1
- XYUBQWNJDIAEES-UHFFFAOYSA-N NC(CSc1ccccc1)C(O)=O Chemical compound NC(CSc1ccccc1)C(O)=O XYUBQWNJDIAEES-UHFFFAOYSA-N 0.000 description 1
- 102100030589 Neurogenic differentiation factor 6 Human genes 0.000 description 1
- 108010015406 Neurturin Proteins 0.000 description 1
- 102000001839 Neurturin Human genes 0.000 description 1
- 108010033272 Nitrilase Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 102000004140 Oncostatin M Human genes 0.000 description 1
- 108090000630 Oncostatin M Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 108090000417 Oxygenases Proteins 0.000 description 1
- 102000004020 Oxygenases Human genes 0.000 description 1
- 102000003982 Parathyroid hormone Human genes 0.000 description 1
- 108090000445 Parathyroid hormone Proteins 0.000 description 1
- 208000007542 Paresis Diseases 0.000 description 1
- SXJGROGVINAYSH-AVGNSLFASA-N Phe-Gln-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SXJGROGVINAYSH-AVGNSLFASA-N 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 108010064851 Plant Proteins Proteins 0.000 description 1
- 102100036154 Platelet basic protein Human genes 0.000 description 1
- 102100030304 Platelet factor 4 Human genes 0.000 description 1
- 102100037596 Platelet-derived growth factor subunit A Human genes 0.000 description 1
- 208000000474 Poliomyelitis Diseases 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- CFVRJNZJQHDQPP-CYDGBPFRSA-N Pro-Ile-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 CFVRJNZJQHDQPP-CYDGBPFRSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 1
- 102100034945 Prorelaxin H1 Human genes 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 102000016971 Proto-Oncogene Proteins c-kit Human genes 0.000 description 1
- 108010014608 Proto-Oncogene Proteins c-kit Proteins 0.000 description 1
- 208000003251 Pruritus Diseases 0.000 description 1
- ASNFTDCKZKHJSW-REOHCLBHSA-N Quisqualic acid Chemical class OC(=O)[C@@H](N)CN1OC(=O)NC1=O ASNFTDCKZKHJSW-REOHCLBHSA-N 0.000 description 1
- 101150040459 RAS gene Proteins 0.000 description 1
- 101150076031 RAS1 gene Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 102000004879 Racemases and epimerases Human genes 0.000 description 1
- 108090001066 Racemases and epimerases Proteins 0.000 description 1
- 101150045048 Ras85D gene Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 101710175698 Renin-1 Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 102100023361 SAP domain-containing ribonucleoprotein Human genes 0.000 description 1
- 101710194492 SET-binding protein Proteins 0.000 description 1
- 241000791876 Selene Species 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108010056088 Somatostatin Proteins 0.000 description 1
- 102000005157 Somatostatin Human genes 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000295644 Staphylococcaceae Species 0.000 description 1
- 101000882406 Staphylococcus aureus Enterotoxin type C-1 Proteins 0.000 description 1
- 101000882403 Staphylococcus aureus Enterotoxin type C-2 Proteins 0.000 description 1
- 101001057112 Staphylococcus aureus Enterotoxin type D Proteins 0.000 description 1
- 101000794214 Staphylococcus aureus Toxic shock syndrome toxin-1 Proteins 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 108010023197 Streptokinase Proteins 0.000 description 1
- 102100021669 Stromal cell-derived factor 1 Human genes 0.000 description 1
- 101710088580 Stromal cell-derived factor 1 Proteins 0.000 description 1
- 102000005158 Subtilisins Human genes 0.000 description 1
- 108010056079 Subtilisins Proteins 0.000 description 1
- 102100030529 Suppressor of cytokine signaling 7 Human genes 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010046075 Thymosin Proteins 0.000 description 1
- 102000007501 Thymosin Human genes 0.000 description 1
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 1
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- NXJZCPKZIKTYLX-XEGUGMAKSA-N Trp-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NXJZCPKZIKTYLX-XEGUGMAKSA-N 0.000 description 1
- ORQGVWIUHICVKE-KCTSRDHCSA-N Trp-His-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O ORQGVWIUHICVKE-KCTSRDHCSA-N 0.000 description 1
- XLVRTKPAIXJYOH-HOCLYGCPSA-N Trp-His-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)NCC(=O)O)N XLVRTKPAIXJYOH-HOCLYGCPSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 1
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 1
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- SOEGLGLDSUHWTI-STECZYCISA-N Tyr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 SOEGLGLDSUHWTI-STECZYCISA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- 102100025336 Tyrosine-tRNA ligase, mitochondrial Human genes 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- FBVUOEYVGNMRMD-NAKRPEOUSA-N Val-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N FBVUOEYVGNMRMD-NAKRPEOUSA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- BZWUSZGQOILYEU-STECZYCISA-N Val-Ile-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BZWUSZGQOILYEU-STECZYCISA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 108010000134 Vascular Cell Adhesion Molecule-1 Proteins 0.000 description 1
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 102100023543 Vascular cell adhesion protein 1 Human genes 0.000 description 1
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 1
- ZVNYJIZDIRKMBF-UHFFFAOYSA-N Vesnarinone Chemical compound C1=C(OC)C(OC)=CC=C1C(=O)N1CCN(C=2C=C3CCC(=O)NC3=CC=2)CC1 ZVNYJIZDIRKMBF-UHFFFAOYSA-N 0.000 description 1
- 108700040099 Xylose isomerases Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 125000002339 acetoacetyl group Chemical group O=C([*])C([H])([H])C(=O)C([H])([H])[H] 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000007259 addition reaction Methods 0.000 description 1
- 235000011037 adipic acid Nutrition 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 229960002478 aldosterone Drugs 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- 150000001370 alpha-amino acid derivatives Chemical class 0.000 description 1
- 102000005922 amidase Human genes 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 229940093740 amino acid and derivative Drugs 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 230000000689 aminoacylating effect Effects 0.000 description 1
- 229940124277 aminobutyric acid Drugs 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 239000003430 antimalarial agent Substances 0.000 description 1
- 229940033495 antimalarials Drugs 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- OZDNDGXASTWERN-UHFFFAOYSA-N apovincamine Natural products C1=CC=C2C(CCN3CCC4)=C5C3C4(CC)C=C(C(=O)OC)N5C2=C1 OZDNDGXASTWERN-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000011681 asexual reproduction Effects 0.000 description 1
- 238000013465 asexual reproduction Methods 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 125000003236 benzoyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C(*)=O 0.000 description 1
- 235000021028 berry Nutrition 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000011942 biocatalyst Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- LWISPDYGRSGXME-YDHLFZDLSA-N biotin peg2 amine Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)NCCOCCOCCN)SC[C@@H]21 LWISPDYGRSGXME-YDHLFZDLSA-N 0.000 description 1
- 150000001615 biotins Chemical class 0.000 description 1
- JCZLABDVDPYLRZ-AWEZNQCLSA-N biphenylalanine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1C1=CC=CC=C1 JCZLABDVDPYLRZ-AWEZNQCLSA-N 0.000 description 1
- 238000004061 bleaching Methods 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- ZADPBFCGQRWHPN-UHFFFAOYSA-N boronic acid Chemical compound OBO ZADPBFCGQRWHPN-UHFFFAOYSA-N 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 150000001719 carbohydrate derivatives Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- NSQLIUXCMFBZME-MPVJKSABSA-N carperitide Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 NSQLIUXCMFBZME-MPVJKSABSA-N 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000009134 cell regulation Effects 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 229960003677 chloroquine Drugs 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 239000004074 complement inhibitor Substances 0.000 description 1
- 102000006834 complement receptors Human genes 0.000 description 1
- 108010047295 complement receptors Proteins 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- OMFXVFTZEKFJBZ-HJTSIMOOSA-N corticosterone Chemical compound O=C1CC[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@H](CC4)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 OMFXVFTZEKFJBZ-HJTSIMOOSA-N 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000003431 cross linking reagent Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 230000006324 decarbonylation Effects 0.000 description 1
- 238000006606 decarbonylation reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000002934 diuretic Substances 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000007350 electrophilic reaction Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 231100000655 enterotoxin Toxicity 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 230000009483 enzymatic pathway Effects 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000002095 exotoxin Substances 0.000 description 1
- 231100000776 exotoxin Toxicity 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 229940012413 factor vii Drugs 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 229940012426 factor x Drugs 0.000 description 1
- 125000004030 farnesyl group Chemical group [H]C([*])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 230000004992 fission Effects 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000012248 genetic selection Methods 0.000 description 1
- 101150024902 glnS gene Proteins 0.000 description 1
- 102000045442 glycosyltransferase activity proteins Human genes 0.000 description 1
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 1
- 239000002622 gonadotropin Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 238000004896 high resolution mass spectrometry Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 150000002466 imines Chemical class 0.000 description 1
- 150000007976 iminium ions Chemical class 0.000 description 1
- 230000006303 immediate early viral mRNA transcription Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 229940097275 indigo Drugs 0.000 description 1
- COHYTHOBJLSHDF-UHFFFAOYSA-N indigo powder Natural products N1C2=CC=CC=C2C(=O)C1=C1C(=O)C2=CC=CC=C2N1 COHYTHOBJLSHDF-UHFFFAOYSA-N 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 102000002467 interleukin receptors Human genes 0.000 description 1
- 108010093036 interleukin receptors Proteins 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- CSSYQJWUGATIHM-IKGCZBKSSA-N l-phenylalanyl-l-lysyl-l-cysteinyl-l-arginyl-l-arginyl-l-tryptophyl-l-glutaminyl-l-tryptophyl-l-arginyl-l-methionyl-l-lysyl-l-lysyl-l-leucylglycyl-l-alanyl-l-prolyl-l-seryl-l-isoleucyl-l-threonyl-l-cysteinyl-l-valyl-l-arginyl-l-arginyl-l-alanyl-l-phenylal Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CSSYQJWUGATIHM-IKGCZBKSSA-N 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 229940078795 lactoferrin Drugs 0.000 description 1
- 235000021242 lactoferrin Nutrition 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 239000006194 liquid suspension Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 239000002636 mycotoxin Substances 0.000 description 1
- 125000001419 myristoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000001452 natriuretic effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011330 nucleic acid test Methods 0.000 description 1
- 238000007344 nucleophilic reaction Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 125000001312 palmitoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000026792 palmitoylation Effects 0.000 description 1
- 208000012318 pareses Diseases 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 108010012038 peptide 78 Proteins 0.000 description 1
- 229940125863 peptide 78 Drugs 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- PGGIUFXBCVMCAO-UHFFFAOYSA-N phenyl hydrogen selenate Chemical compound O[Se](=O)(=O)OC1=CC=CC=C1 PGGIUFXBCVMCAO-UHFFFAOYSA-N 0.000 description 1
- DTBNBXWJWCWCIK-UHFFFAOYSA-K phosphonatoenolpyruvate Chemical compound [O-]C(=O)C(=C)OP([O-])([O-])=O DTBNBXWJWCWCIK-UHFFFAOYSA-K 0.000 description 1
- VQHUWZGVPUQSFH-UHFFFAOYSA-N phosphonophosphanylphosphonic acid Chemical compound P(=O)(O)(O)PP(=O)(O)O VQHUWZGVPUQSFH-UHFFFAOYSA-N 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000008635 plant growth Effects 0.000 description 1
- 102000005162 pleiotrophin Human genes 0.000 description 1
- 230000001402 polyadenylating effect Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920000166 polytrimethylene carbonate Polymers 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 238000003498 protein array Methods 0.000 description 1
- 230000013498 protein farnesylation Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000026447 protein localization Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000009163 protein therapy Methods 0.000 description 1
- 230000001698 pyrogenic effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 108010014186 ras Proteins Proteins 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000032537 response to toxin Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 201000005404 rubella Diseases 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 229930195734 saturated hydrocarbon Natural products 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 150000003962 selenoxides Chemical class 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 229960000553 somatostatin Drugs 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000000707 stereoselective effect Effects 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 229960005202 streptokinase Drugs 0.000 description 1
- 125000003107 substituted aryl group Chemical group 0.000 description 1
- 125000002653 sulfanylmethyl group Chemical group [H]SC([H])([H])[*] 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 229960003604 testosterone Drugs 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- LCJVIYPJPCBWKS-NXPQJCNCSA-N thymosin Chemical compound SC[C@@H](N)C(=O)N[C@H](CO)C(=O)N[C@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@H](C(C)C)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](C(C)C)C(=O)N[C@H](CO)C(=O)N[C@H](CO)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H]([C@@H](C)CC)C(=O)N[C@H]([C@H](C)O)C(=O)N[C@H](C(C)C)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](C(C)C)C(=O)N[C@H](C(C)C)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@H](CCC(O)=O)C(O)=O LCJVIYPJPCBWKS-NXPQJCNCSA-N 0.000 description 1
- 229960000187 tissue plasminogen activator Drugs 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 238000002723 toxicity assay Methods 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 150000003667 tyrosine derivatives Chemical class 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229930195735 unsaturated hydrocarbon Natural products 0.000 description 1
- 229960005356 urokinase Drugs 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- JPZXHKDZASGCLU-LBPRGKRZSA-N β-(2-naphthyl)-alanine Chemical compound C1=CC=CC2=CC(C[C@H](N)C(O)=O)=CC=C21 JPZXHKDZASGCLU-LBPRGKRZSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/104—Aminoacyltransferases (2.3.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/06—Preparation of peptides or proteins produced by the hydrolysis of a peptide bond, e.g. hydrolysate products
Abstract
EXPRESSãO DE PROTEìNAS GENETICAMENTE PROGRAMADA CONTENDO O AMINOáCIDO NãO NATURAL FENILSELENOCISTEìNA. A invenção diz respeito a pares ortogonais de RNAts e RNAt aminoacil sintetase que podem incorporar o aminoácido não natural fenilselenocisteina em proteínas produzidas em células hospedeiras eubactenanas, tal como E. coli. A invenção fornece, por exemplo, mas sem limitações, RNAt ortogonal aminoacil sintetase inédito, polinucleotídeos que codificam os sistemas de moléculas de sintetase inéditos, fenilselenocisteina e tradução. A invenção fornece adicionalmente métodos para produzir proteínas modificadas (por exemplo, proteínas lipidadas) por meio de modificação programada do resíduo de fenilselenocisteina em uma proteína.
Description
"EXPRESSÃO DE PROTEÍNAS GENETICAMENTE PROGRAMADA CONTENDOO AMINOÁCIDO NÃO NATURAL FENILSELENOCISTEÍNA"
REFERÊNCIA CRUZADA AO PEDIDO RELACIONADOEste pedido reivindica prioridade e benefício de:
Pedido de patente provisório dos Estados Unidos 60/783.272, depositado em 16 demarço de 2006, e pedido de patente provisório dos Estados Unidos 60/861.456, depositadoem 28 de novembro de 2006, cujos conteúdos estão ambos aqui incorporados nas suasíntegras pela referência com todos os propósitos.
DECLARAÇÃO DE DIREITOS A INVENÇÕES FEITAS COM PESQUISA E
DESENVOLVIMENTO PATROCINADO PELO GOVERNO FEDERAL
Esta invenção foi feita com suporte do governo do Instituto Nacional de Saúde comconcessão No. GM62159. O governo pode ter certos direitos nesta invenção.
CAMPO DA INVENÇÃO
A invenção é no campo de tradução bioquímica. A invenção diz respeito acomposições e métodos para preparar e usar RNAts ortogonais, aminoacil-RNAt sintetaseortogonal, e seus pares, que incorporam aminoácidos não naturais nas proteínas. Ainvenção também diz respeito a métodos de produzir proteínas nas células usando taispares e proteínas feitas pelos métodos.
ANTECEDENTES DA INVENÇÃO
O estudo de estrutura e função da proteína tem historicamente sido baseado naspropriedades e químicas de reações que são disponíveis usando os grupos reativos deaminoácidos de ocorrência natural. Infelizmente, diversos organismos conhecidos, debactéria até humanos, codificam os mesmos vinte aminoácidos comuns. Estes 20aminoácidos compreendem um número surpreendentemente limitado de grupos funcionais:bases de nitrogênio, ácidos carboxílicos e amidas, álcoois, e um grupo tiol. Esta seleçãolimitada de grupos R tem restringido o estudo da estrutura e função da proteína, onde osestudos são confinados pelas propriedades químicas dos aminoácidos de ocorrêncianatural. Por exemplo, o número limitado de grupos R reativos de ocorrência natural temlimitado a capacidade de fazer as modificações de proteína altamente visadas para aexclusão do outrosaminoácidos em uma proteína.
Reações de ligação quimiosseletivas envolvendo proteínas são extremamenteimportantes com uma variedade de propósitos, incluindo, mas sem limitações, estudo dainteração proteína-proteína e sinalização celular, e geração de terapêuticas de proteínainéditas. Reações de modificação de proteína mais seletivas atualmente usadas natecnologia envolvem formação de ligação covalente entre parceiros de reação nucleofílica eeletrofílica que visam resíduos nucleofílicos de ocorrência natural nas cadeias laterais deaminoácidos da proteína, por exemplo, a reação de cadeias laterais de σ-halo cetonas comhistidina ou cisteína. A seletividade nestes casos é determinada pelo número eacessibilidade dos resíduos de nucleofílicos na proteína. Infelizmente, proteínas deocorrência natural freqüentemente contêm sítios de reação ou múltiplos alvos de reação malposicionados (por exemplo, inacessíveis) (por exemplo, resíduos de lisina, histidina e cisteína), resultando em pouca seletividade nas reações de modificação, tornando amodificação da proteína altamente alvejada pelos reagentes nucleofílicos/eletrofílicos difícil.Além disso, os sítios de modificação são tipicamente limitados às cadeias laterais de lisina,histidina ou cisteína nucleofílicas de ocorrência natural. Modificação em outros sítios é difícilou impossível.
O que é necessário na tecnologia são novas estratégias para incorporação deaminoácidos não naturais nas proteínas com o propósito de modificar e estudar estrutura efunção da proteína, onde os aminoácidos não naturais têm químicas de reação inéditas ououtras propriedades, por exemplo, propriedades biológicas não encontradas nosaminoácidos de ocorrência natural. Existe uma necessidade considerável na tecnologia de criação de novas estratégias para reações de modificação de proteína que modificam asproteínas de uma maneira altamente seletiva e, além disso, modificam proteínas emcondições fisiológicas. O que é necessário na tecnologia são novos métodos para produzirmodificações de proteína, onde as modificações são altamente específicas, por exemplo,modificações onde nenhum dos aminoácidos de ocorrência natural passa por reações cruzadas ou reações laterais. Químicas inéditas para estratégias da modificação da proteínaaltamente específicas encontram uma ampla variedade de aplicações no estudo daestrutura e função da proteína e na produção de proteínas terapêuticas.
LIPIDACÂO DA PROTEÍNA
A lipidação da proteína é uma modificação pós-translacional chave que está envolvida na localização da proteína, no devido tráfego de proteína intracelular própria einterações proteína-proteína. A lipidação de proteínas é freqüentemente exigida para adevida atividade biológica. Esta característica é crítica para o desenvolvimento de algumasproteínas terapêuticas. Lipidação é também crítica em estudos de interações proteína-proteína e sinalização celular. Infelizmente, a ligação quimiosseletiva in vitro para produzir proteínas Iipidadas usando a forma não Iipidada nativa da proteína é extremamente difícil, eé de um modo geral limitada a modificação de resíduos de cisteína expostos a superfícieexclusiva.
As atividades biológicas de muitas proteínas celulares exigem associação com amembrana celular, que depende da modificação pós-tradução de cisteína por resíduos de lipídios tais como frações de farnesila, miristoíla e palmitoíla (Chemomordik and Kozlov(2003), Annual Review of Chemystres 72:175-207). Por exemplo, muitos receptoresacoplados de proteína G são palmitoilados, proteínas Ras são tanto famesiladas quantopalmitoiladas (Chernomordik and Kozlov (2003), Annual Review of Chemystres 72:175-207).Embora farnesilação de proteína seja uma modificação estável e irreversível, a palmitoilaçãoé reversível, resultando na regulação dinâmica de função de proteína, e alvejamentoespecífico das membranas celulares (Rocks et ai (2005), Science 307(5716): 1746-1752).
Além disso, ácido γ-carboxiglutâmico é uma modificação essencial que é importante paraadesão da membrana dependente de cálcio na cascata de coagulação (Davie et al. (1991),Chemystres 30(43): 10363-10370).
SISTEMAS DE TRADUÇÃO ORTOGONAL
Uma estratégia para superar as limitações de um código genético limitado éexpandir o código genético e adicionar aminoácidos que têm novas propriedades reativas aorepertório biológico. Uma metodologia geral foi desenvolvida para incorporação sítio-específico in vivo de diversos aminoácidos não naturais nas proteínas, tanto em organismosprocarióticos quanto eucarióticos. Estes métodos baseiam-se em componentes de traduçãode proteína ortogonal que reconhecem um códon seletor adequado para inserir umaminoácido não natural desejado em uma posição definida durante a tradução depolipeptídeo in vivo. Estes métodos utilizam um RNAt ortogonal (O-RNAt) que reconhece umcódon seletor, e onde um aminoacil-RNAt sintetase ortogonal específico correspondente(um O-RS) carrega o O-RNAt com o aminoácido não natural. Estes componentes nãosofrem reação cruzada com nenhum dos aminoácidos ou códons RNAts, RSs, endógenosno organismo hospedeiro (isto é, eles devem ser ortogonais). O uso de tais pares de RNAt-RS ortogonal tornou possível codificar geneticamente um grande número de aminoácidosnão naturais estruturalmente diferentes.
A prática de usar sistemas de tradução ortogonal que são adequados para prepararproteínas que compreendem um ou mais aminoácidos não naturais é de um modo geralconhecida na tecnologia, bem como os métodos gerais para produzir sistemas de traduçãoortogonal. Por exemplo, ver International Publication Numbers WO 2002/086075, intitulado"METHODS AND COMPOSITION FOR THE PRODUTION OF ORTOGONAL RNAt-AMINOACYL-RNAt SYNTHETASE PAIRS"; WO 2002/085923, intitulado "IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS"; WO 2004/094593, intitulado"EXPANDING THE EUKARYOTIC GENETIC CODE"; WO 2005/019415, depositado em 7de julho de 2004; WO 2005/007870, depositado em 7 de julho de 2004; WO 2005/007624,depositado em 7 de julho de 2004 e WO 2006/110182, depositado em 27 de outubro de2005, intitulado "ORTOGONAL TRANSLATION COMPONENTS FOR THE VIVOINCORPORATION OF UNNATURAL AMINO ACIDS". Cada um desses pedidos está aquiincorporado pela referência na sua íntegra. Para discussão adicional de sistemas detradução ortogonal que incorporam aminoácidos não naturais, e métodos para sua produçãoe uso, Ver também, Wang and Schultz1 "Expanding the Genetic Code," Chem. Commun.(Camb.) 1:1-11 (2002); Wang and Schultz "Expanding the Genetic Code", AngewandteChemie Int. Ed., 44(1):34-66 (2005); Xie e Sehultz, "A Expanding Genetic Code", Methods36(3):227-238 (2005); Xie and Sehultz, "Adding Amino acids to the Repertorie Genetic", Curr.Opinion in Chemical Biology 9(6):548-554 (2005); Wang et ai, "Expanding the GeneticCode", Annu. Rev. Biophys. Biomoi Struct., 35:225-249 (2006); and Xie and Sehultz, "AChemical Toolkit for Proteins - A Expanded Genetic Code," Nat. Rev. Mol. Cell Biol.,7(10):775-782 (2006).
Existe uma necessidade na tecnologia do desenvolvimento de componentes detradução ortogonal que incorporam aminoácidos não naturais nas proteínas, onde osaminoácidos não naturais podem ser incorporados em uma posição definida, e onde osaminoácidos não naturais têm propriedades químicas inéditas que permitem que oaminoácido sirva como um alvo para modificação específica (por exemplo, lipidação) para aexclusão de reações cruzadas ou reações laterais com outros sítios nas proteínas. Ainvenção preenche estas e outras necessidades, que ficarão aparentes mediante a revisão da revelação seguinte.
SUMÁRIO DA INVENÇÃO
A invenção fornece composições e métodos para incorporar o aminoácido nãonatural fenilselenocisteína em uma cadeia do polipeptídeo em crescimento em resposta aum códon seletor, por exemplo, um códon de parada âmbar, in vivo (por exemplo, em umacélula hospedeira). Estas composições incluem pares de RNAts-ortogonais (O-RNAts) eaminoacil-RNAt sintetases ortogonais (O-RSs) que não interagem com o maquinário detradução da célula hospedeira. Ou seja, o O-RNAt não é carregado (ou não carregado emum nível significativo) com um aminoácido (natural ou não natural) por um aminoacil-RNAtsintetase da célula hospedeira endógena. Similarmente, o O-RSs fornecido pela invençãonão carrega nenhum RNAt endógeno com um aminoácido (natural ou não natural) em umnível significativo ou, em alguns casos, detectável. Estas composições inéditas permitem aprodução de grandes quantidades de proteínas tendo aminoácidos não naturaistransacionalmente incorporados. As propriedades químicas do aminoácido não naturalfenilselenocisteína também permitem que a modificação alvejada daquele resíduo produza conjugações desejadas, por exemplo, mas sem limitações, conjugações de lipídio. Taispolipeptídeos especificamente modificados podem encontrar uso como produtosterapêuticos e em pesquisa biomédica.
Em alguns aspectos, a invenção fornece sistemas de tradução. Estes sistemascompreendem um primeiro aminoacil-RNAt sintetase ortogonal (O-RS), um primeiro RNAtortogonal (O-RNAt) e um primeiro aminoácido não natural que é fenilselenocisteína, onde oprimeiro O-RS preferencialmente aminoacila o primeiro O-RNAt com o primeiro aminoácidonão natural fenilselenocisteína. Em alguns aspectos, o O-RS preferencialmente aminoacila oO-RNAt com a dita fenilselenocisteína com uma eficiência que é pelo menos 50 % daeficiência observada para um sistema de tradução compreendendo esse mesmo O-RNAt1 afenilselenocisteína e um aminoacil-RNAt sintetase que compreende a seqüência deaminoácidos de SEQ ID NO: 4, 6 ou 8.
Os sistemas de tradução podem usar componentes derivados de uma variedade defontes. Em uma modalidade, o O-RS usado no sistema pode compreender a seqüência deaminoácidos de SEQ ID NOS: 4, 6 ou 8, e variantes conservativas desta seqüência. Emalgumas modalidades, o O-RNAt é um supressor âmbar. Em algumas modalidades, o O-RNAt compreende ou é codificado pela SEQ ID NO: 1.
Em alguns aspectos, o sistema de tradução compreende adicionalmente um ácidonucléico que codifica uma proteína de interesse, onde o ácido nucléico tem pelo menos umcódon seletor que é reconhecido pelo O-RNAt.
Em alguns aspectos, o sistema de tradução incorpora um segundo par ortogonal(ou seja, um segundo O-RS e um segundo O-RNAt) que utiliza um segundo aminoácido nãonatural, de maneira que o sistema é agora capaz de incorporar pelo menos doisaminoácidos não naturais diferentes em sítios diferentes selecionados em um polipeptídeo.Neste sistema duplo, o segundo O-RS preferencialmente aminoacila o segundo O-RNAtcom um segundo aminoácido não natural que é diferente do primeiro aminoácido nãonatural, e o segundo O-RNAt reconhece um códon seletor que é diferente do códon seletor reconhecido pelo primeiro O-RNAt.
Em algumas modalidades, o sistema de tradução reside em uma célula hospedeira(e inclui a célula hospedeira). A célula hospedeira usada particularmente não é limitada,desde que o O-RS e O-RNAt retenham sua ortogonalidade em seu ambiente da célulahospedeira. A célula hospedeira pode ser uma célula eubacteriana, tal como E. coli. A célula hospedeira pode compreender um ou mais polinucleotídeos que codificam componentes dosistema de tradução, incluindo o O-RS ou O-RNAt. Em algumas modalidades, opolinucleotídeo que codifica o O-RS compreende uma seqüência de nucleotídeos de SEQID NO:5,7 ou 9.
A invenção também fornece métodos para produzir proteínas com um ou mais aminoácidos não naturais em posições selecionadas. Estes métodos utilizam os sistemas detradução descritos anteriormente. De um modo geral, estes métodos começam com a etapade fornecer um sistema de tradução que compreende:
(i) um primeiro aminoácido não natural que é fenilselenocisteína;
(ii) um primeiro aminoacil-RNAt sintetase ortogonal (O-RS);
(iii) um primeiro RNAt ortogonal (O-RNAt), em que o O-RS preferencialmente o O-RNAt aminoacila com o aminoácido não natural; e,
(iv) um ácido nucléico que codifica a proteína, onde o ácido nucléico compreendepelo menos um códon seletor (opcionalmente um códon âmbar) que é reconhecido peloprimeiro O-RNAt. O método então incorpora o aminoácido não natural na posiçãoselecionada na proteína durante a tradução da proteína em resposta ao códon seletor,produzindo dessa maneira a proteína compreendendo o aminoácido não natural na posição selecionada. Em alguns aspectos destes métodos, o O-RS preferencialmente aminoacila oO-RNAt com a fenilselenocisteína com uma eficiência que é pelo menos 50 % da eficiênciaobservada para um sistema de tradução compreendendo esse mesmo O-RNAt, afenilselenocisteína, e um aminoacil-RNAt sintetase compreendendo a seqüência deaminoácidos de SEQ ID NO: 4, 6 ou 8. Em alguns aspectos, o sistema de tradução inclui umácido nucléico que codifica o O-RS.
Estes métodos podem ser amplamente aplicados usando uma variedade dereagentes. Em algumas modalidades, um polinucleotídeo que codifica o O-RS é fornecido.Em algumas modalidades, o O-RS compreende uma seqüência de aminoácidos de SEQ IDNO: 4, 6 ou 8, ou variantes conservativas destes. Opcionalmente, o sistema de tradução usado nos métodos inclui um ácido nucléico que codifica o O-RS1 por exemplo, um ácidonucléico de SEQ ID NO: 5, 7 ou 9.
Em algumas modalidades destes métodos, a provisão de uma etapa do sistema detradução compreende mutar uma bolsa de ligação de aminoácido de um aminoacil RNAtsintetase tipo selvagem por mutagênese de sítio dirigido, e selecionar um O-RS resultante que preferencialmente aminoacila o O-RNAt com o aminoácido não natural. A etapa deseleção pode compreender selecionar positiva ou negativamente o O-RS de umagrupamento de moléculas de aminoacil-RNAt sintetase resultantes depois da mutagênesede sítio dirigido. Em algumas modalidades, a etapa de prover fornece um polinucleotídeoque codifica o O-RNAt1 por exemplo, um O-RNAt que é um supressor âmbar de RNAt, ouum O-RNAt que compreende ou é codificado por um polinucleotídeo de SEQ ID NO: 1.Nestes métodos, a etapa de fornecimento pode também fornecer um ácido nucléicocompreendendo um códon seletor de âmbar que é utilizado pelo sistema de tradução.
Estes métodos podem também ser modificados para incorporar mais que umaminoácido não natural em uma proteína. Nestes métodos, é empregado um segundosistema de ORTOGONAL TRANSLATION em conjunto com o primeiro sistema de tradução,onde o segundo sistema tem diferentes especificidades de aminoácido e códon seletor. Porexemplo, a etapa de fornecimento pode incluir fornecer um segundo O-RS e um segundo O-RNAt, onde o segundo O-RS preferencialmente aminoacila o segundo O-RNAt com umsegundo aminoácido não natural que é diferente do primeiro aminoácido não natural, e onde o segundo O-RNAt reconhece um códon seletor no ácido nucléico que é diferente do códonseletor reconhecido pelo primeiro O-RNAt.
Os métodos para produzir uma proteína com um aminoácido não natural podem7também ser conduzidos no contexto de uma célula hospedeira. Nestes casos, é fornecidauma célula hospedeira, onde a célula hospedeira compreende o aminoácido não natural, oO-RS1 o O-RNAt e o ácido nucléico com pelo menos um códon seletor que codifica aproteína, e onde cultivar a célula hospedeira resulta na incorporação do aminoácido nãonatural. Em algumas modalidades, a etapa de fornecimento compreende fornecer umacélula eubacteriana hospedeira (por exemplo, E. coli). Em algumas modalidades, a etapa defornecimento inclui fornecer uma célula hospedeira contendo um polinucleotídeo quecodifica o O-RS. Por exemplo, o polinucleotídeo que codifica o O-RS pode compreenderuma seqüência de nucleotídeos de SEQ ID NO: 5, 7 ou 9.
Em algumas variações destes métodos, os procedimentos incluem adicionalmentemodificação da fenilselenocisteína após sua incorporação em um polipeptídeo. Por exemplo,a fenilselenocisteína pode reagir em certas condições que resultam na conversão paradeidroalanina na posição selecionada. Esta reação pode ser por eliminação oxidativa. Areação pode ser realizada expondo a fenilselenocisteína ao peróxido de hidrogênio.
A invenção também fornece métodos para produzir proteínas lipidadas, onde olipídio é conjugado em uma posição designada selecionada. Estes métodos utilizam ossistemas de tradução descritos anteriormente. De um modo geral, estes métodos começamcom a etapa de fornecer um sistema de tradução que compreende:
(i) um aminoácido não natural fenilselenocisteína;
(ii) um aminoacil-RNAt sintetase ortogonal (O-RS);
(iii) um RNAt ortogonal (O-RNAt), onde o O-RS preferencialmente aminoacila o O-RNAt com a fenilselenocisteína; e,
(iv) um ácido nucléico que codifica a proteína, onde o ácido nucléico compreendepelo menos um códon seletor (opcionalmente um códon âmbar) que é reconhecido pelo O-
RNAt. O método então incorpora a fenilselenocisteína na posição selecionada na proteínadurante a tradução da proteína em resposta ao códon seletor. Essa fenilselenocisteínareage em seguida para produzir deidroalanina na posição selecionada, que, por sua vez,reage com um lipídio para produzir uma fração de aminoácido lipidado, produzindo dessamaneira uma proteína com um lipídio na posição selecionada na proteína.
Em alguns aspectos destes métodos, a reação da fenilselenocisteína é poreliminação oxidativa ou exposição a peróxido de hidrogênio. Em alguns aspectos, o lipídioconjugado que reagiu com a deidroalanina pode ser ácido tiopalmítico, farnesilmercaptanoou 1-hexadecanetiol. Os aminoácidos Iipidados assim formados são palmitoilcisteína,farnesilcísteína e S-hexadecilcisteína. A modificação da deidroalanina é tipicamente por umareação de adição de Michael.
A invenção também fornece métodos para produzir uma proteína tendo um resíduode deidroalanina em uma posição selecionada. Estes métodos utilizam os sistemas detradução descritos anteriormente. De um modo geral, estes métodos começam com a etapade fornecer um sistema de tradução que compreende:
(i) um aminoácido não natural fenilselenocisteína
(ii) um aminoacil-RNAt sintetase ortogonal (O-RS);
(iii) um RNAt ortogonal (O-RNAt)1 onde o O-RS preferencialmente aminoacila o O-RNAt com a fenilselenocisteína; e,
(iv) um ácido nucléico que codifica a proteína, onde o ácido nucléico compreendepelo menos um códon seletor (opcionalmente um códon âmbar) que é reconhecido pelo O-RNAt. O método então incorpora a fenilselenocisteína na posição selecionada na proteínadurante a tradução da proteína em resposta ao códon seletor. Essa fenilselenocisteínareage em seguida para produzir deidroalanina na posição selecionada. Em alguns aspectosdestes métodos, a reação da fenilselenocisteína é por eliminação oxidativa ou exposição aoperóxido de hidrogênio.
A invenção também fornece uma variedade de composições, incluindo ácidosnucléicos e proteínas. A natureza da composição não é particularmente limitada, desde quea composição compreenda o ácido nucléico ou proteína especificados. As composições dainvenção podem compreender qualquer número de componentes adicionais de qualquernatureza.
Por exemplo, a invenção fornece composições que compreendem polipeptídeos, onde os polipeptídeos compreendem a seqüência de aminoácidos de SEQ ID NO: 4, 6 ou 8,ou uma variante conservativa deste. Em alguns aspectos, o polipeptídeo da varianteconservativa aminoacila um RNAt ortogonal cognato (O-RNAt) com um aminoácido nãonatural com uma eficiência que é pelo menos 50 % da eficiência observada para um sistemade tradução que compreende o O-RNAt1 o aminoácido não natural, e uma sintetaseaminoacil-RNAt compreendendo a seqüência de aminoácidos de SEQ ID NO: 4, 6, 8 ou 10.A invenção também fornece polinucleotídeos que codificam qualquer desses polipeptídeosanteriores. Em algumas modalidades, estes polinucleotídeos podem compreender umaseqüência de nucleotídeos de SEQ ID NO: 5, 7 ou 9. Em algumas modalidades, ospolipeptídeos estão em uma célula.
A invenção também fornece composições de polinucleotídeo que compreendemuma seqüência de nucleotídeos de SEQ ID NO: 5, 7 ou 9. Em algumas modalidades, ainvenção fornece vetores que compreendem os polinucleotídeos, por exemplo, vetores deexpressão. Em algumas modalidades, a invenção fornece células que compreendem umvetor descrito anteriormente.
DEFINIÇÕES
Antes de descrever a invenção em detalhes, deve-se entender que esta invençãonão está limitada a sistemas biológicos particulares, que podem, é claro, variar. Deve-setambém entender que a terminologia aqui usada tem o propósito de descrever apenasmodalidades particulares, e não deve ser limitante. Conforme usado nesta especificação enas reivindicações anexas, as formas singulares "um", "uma", "o" e "a" incluem referentesplurais, a menos que o conteúdo determine claramente de outra forma. Assim, por exemplo,referência a "uma célula" inclui combinações de duas ou mais células; referência a "umpolinucleotídeo" inclui, como uma questão prática, muitas cópias de que polinucleotídeo.
A menos que aqui definido e a seguir no resto da especificação, todos termostécnicos e científicos aqui usados têm o mesmo significado normalmente entendido pelosversados na tecnologia a qual a invenção diz respeito.
Ortoqonal: Da maneira aqui usada, o termo "ortogonal" refere-se a uma molécula(por exemplo, um RNAt ortogonal (O-RNAt) e/ou um aminoacil-RNAt sintetase ortogonal (O-RS)) que funciona com componentes endógenos de uma célula com baixa eficiência,comparada a uma molécula correspondente que é endógena para a célula ou sistema detradução, ou que não pode funcionar com componentes endógenos da célula. No contextode RNAts e aminoacil-RNAt sintetase, ortogonal refere-se a uma incapacidade ou baixaeficiência, por exemplo, menos que 20 % de eficiência, menos que 10 % de eficiência,menos que 5 % de eficiência, ou menos que 1% de eficiência, de um RNAt ortogonalfuncionar com um RNAt sintetase endógeno, comparado a de um RNAt endógeno funcionarcom o RNAt sintetase endógeno, ou de um aminoacil-RNAt sintetase ortogonal funcionarcom um RNAt endógeno, comparado a de um RNAt sintetase endógeno de funcionar com oendógeno RNAt. A molécula falta uma molécula complementar ortogonal endógenafuncionalmente normal na célula. Por exemplo, um RNAt ortogonal em uma célula éaminoacilado por qualquer RS endógeno da célula com eficiência baixa, ou mesmo zero,quando comparado a aminoacilação de um RNAt endógeno pelo RS endógeno. Em umoutro exemplo, um RS ortogonal aminoacila qualquer RNAt endógeno de uma célula deinteresse com eficiência baixa, ou mesmo zero, comparado a aminoacilação do RNAtendógeno por um RS endógeno. A segunda molécula ortogonal pode ser introduzida nacélula que funciona com a primeira molécula ortogonal. Por exemplo, um par de RNAtortogonal/RS inclui componentes complementares introduzidos que funcionam juntos nacélula com uma eficiência (por exemplo, 45 % de eficiência, 50 % de eficiência, 60 % deeficiência, 70 % de eficiência, 75 % de eficiência, 80 % de eficiência, 90 % de eficiência, 95% de eficiência, ou 99 % ou mais eficiência), comparado aquela de um controle, porexemplo, um par de RNAt/RS endógeno correspondente, ou um par ortogonal ativo (porexemplo, um par de tirosil RNAt ortogonal/RS).
TirosiI-RNAt Ortoqonal: Da maneira aqui usada, um tirosil-RNAt ortogonal (tirosil-O-RNAt) é um RNAt que é ortogonal para um sistema de tradução de interesse, onde o RNAté:(1) idêntico ou substancialmente similar a um tirosil-RNAt de ocorrência natural,
(2) derivado de um tirosil-RNAt de ocorrência natural por mutagênese natural ouartificial,
(3) derivado por qualquer processo que leva uma seqüência de um tipo selvagem ou seqüência de tirosil-RNAt mutante de (1) ou (2) em consideração, (4) homóloga a umtirosil-RNAt tipo selvagem ou mutante; (5) homóloga a qualquer exemplo RNAt que édesignado como um substrato para um tirosil-RNAt sintetase na figura 2, ou (6) uma varianteconservativa de qualquer exemplo RNAt que é designado como um substrato para umtirosil-RNAt sintetase na figura 2. O tirosil-RNAt pode existir carregado com um aminoácido ou em um estado descarregado. Deve-se também entender que um "tirosil-O-RNAt"opcionalmente é carregado (aminoacilado) por uma sintetase cognata com um aminoácido anão ser tirosina, respectivamente, por exemplo, com um aminoácido não natural.Realmente, percebe-se que um tirosil-O-RNAt da invenção é vantajosamente usado parainserir essencialmente qualquer aminoácido, quer natural ou não natural, em um polipeptídeo em crescimento, durante a tradução, em resposta a um códon seletor.
Aminoácido tirosil sintetase ortoqonal: Da maneira aqui usada, um aminoácidotirosil sintetase ortogonal (tirosil-O-RS) é uma enzima que preferencialmente aminoacila otirosil-O-RNAt com um aminoácido em um sistema de tradução de interesse. O aminoácidoque o tirosil-O-RS carrega no tirosil-O-RNAt pode ser qualquer aminoácido, quer natural,não natural ou artificial, e não está aqui limitado. A sintetase é opcionalmente a mesma ouhomóloga a uma sintetase de aminoácido tirosil de ocorrência natural, ou a mesma ouhomóloga a uma sintetase designada como um O-RS na figura 2. Por exemplo, o O-RSpode ser uma variante conservativa de um tirosil-O-RS da figura 2, e/ou pode ser pelomenos 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 98 %, 99 % ou mais idêntica em seqüência a um O-RS da figura 2.
Coqnato: O termo "Cognato" refere-se a componentes que funcionam juntos, outêm algum aspecto de especificidade um com o outro, por exemplo, um RNAt ortogonal eum aminoacil-RNAt ortogonal sintetase. Os componentes podem também ser referidoscomo complementares.
Preferencialmente aminoacila: Da maneira aqui usada em referência aos sistemasde tradução ortogonal, um O-RS "preferencialmente aminoacila" um O-RNAt cognatoquando o O-RS carrega o O-RNAt com um aminoácido mais eficientemente do que elecarrega qualquer RNAt endógeno em um sistema de expressão. Ou seja, quando o O-RNAte qualquer dado RNAt endógeno estão presentes em um sistema de tradução em razões molares aproximadamente iguais, o O-RS carregará o O-RNAt mais freqüentemente do queele carregará o RNAt endógeno. Preferivelmente, a razão relativa do O-RNAt carregado peloO-RS com o RNAt endógeno carregado pelo O-RS é alta, preferivelmente resultando no O-RS carregando o O-RNAt exclusivamente, ou quase exclusivamente, quando o O-RNAt eRNAt endógeno estão presentes em concentrações molares iguais no sistema de tradução.A razão relativa entre O-RNAt e RNAt endógeno que é carregado pelo O-RS1 quando o O-RNAt e O-RS estão presentes em concentrações molares iguais, é maior que 1:1, preferivelmente pelo menos cerca de 2:1, mais preferivelmente 5:1, ainda maispreferivelmente 10:1, acima de tudo mais preferivelmente 20:1, ainda mais preferivelmente50:1, acima de tudo mais preferivelmente 75:1, ainda mais preferivelmente 95:1, 98:1, 99:1,100:1, 500:1, 1.000:1, 5.000:1 ou mais.
O O-RS "preferencialmente aminoacila um O-RNAt com um aminoácido nãonatural" quando (a) o O-RS preferencialmente aminoacila o O-RNAt comparado a um RNAtendógeno, e (b) onde essa aminoacilação é específica para o aminoácido não natural,comparado a aminoacilação do O-RNAt pelo O-RS com qualquer aminoácido natural. Ouseja, quando os aminoácidos não naturais e naturais estão presentes em quantidadesmolares iguais em um sistema de tradução compreendendo o O-RS e O-RNAt, o O-RS carregará o O-RNAt com o aminoácido não natural mais freqüentemente do que com oácido natural. Preferivelmente, a razão relativa do O-RNAt carregado com o aminoácido nãonatural para O-RNAt carregado com o aminoácido natural é alta. Mais preferivelmente, O-RS carrega o O-RNAt exclusivamente, ou quase exclusivamente, com o aminoácido nãonatural. A razão relativa entre o carregamento do O-RNAt com o aminoácido não natural ecarregamento do O-RNAt com o aminoácido natural, quando ambos os aminoácidosnaturais e não naturais estão presentes no sistema de tradução em concentrações molaresiguais, é maior que 1:1, preferivelmente pelo menos cerca de 2:1, mais preferivelmente 5:1,ainda mais preferivelmente 10:1, acima de tudo mais preferivelmente 20:1, ainda maispreferivelmente 50:1, acima de tudo mais preferivelmente 75:1, ainda mais preferivelmente 95:1, 98:1, 99:1, 100:1, 500:1, 1,000:1, 5,000:1 ou mais.
Códon seletor: O termo "códon seletor" refere-se a códons reconhecidos pelo O-RNAt no processo de tradução e não reconhecidos por um RNAt endógeno. O laçoanticódon de O-RNAt reconhece o códon seletor no mRNA e incorpora seu aminoácido, porexemplo, um aminoácido não natural, neste sítio no polipeptídeo. Códons seletores podem incluir, por exemplo, códons não sentido, tais como, códons de parada, por exemplo, códonsâmbar, ocre e opala; códons de quatro ou mais bases; códons raros; códons derivados depares de base natural ou não natural e/ou similares.
RNAt supressor: Um RNAt supressor é um RNAt que altera a leitura de um RNAmensageiro (RNAm) em um dado sistema de tradução, tipicamente permitindo aincorporação de um aminoácido em resposta a um códon de parada (isto é, "leitura total")durante a tradução de um polipeptídeo. Em alguns aspectos, um códon seletor da invençãoé um códon supressor, por exemplo, um códon de parada (por exemplo, um códon âmbar,ocre ou opala), um códon de quatro bases, um códon raro, etc.
Atividade de supressão: Da maneira aqui usada, o termo "atividade de supressão"refere-se em geral à capacidade de um RNAt (por exemplo, um supressor RNAt) permitirleitura de um códon translacional (por exemplo, um códon seletor que é um códon âmbar ou um códon de 4 bases ou mais) que possa resultar de outra forma na terminação de traduçãoou não tradução (por exemplo, deslocamento de quadro). Atividade de supressão de umsupressor RNAt pode ser expressa como uma porcentagem de atividade de leituratranslacional observada, comparada a um segundo supressor RNAt, ou comparada a umsistema de controle, por exemplo, um sistema de controle faltando um O-RS.
A presente invenção fornece vários métodos pelos quais a atividade de supressãopode ser quantificada. A supressão percentual de um O-RNAt e O-RS particular em funçãode um códon seletor (por exemplo, um códon âmbar) de interesse refere-se à porcentagemde atividade de um dado marcador de teste expresso (por exemplo, LacZ), que inclui umcódon seletor, em um ácido nucléico que codifica o marcador de teste expresso, em um sistema de tradução de interesse, onde o sistema de tradução de interesse inclui um O-RS eum O-RNAt, comparado a uma construção de controle positivo, onde o controle positivo faltao O-RNAt, o O-RS e o códon seletor. Assim, por exemplo, se uma construção do marcadorde controle positivo ativo que falta um códon seletor tem uma atividade observada de X emum dado sistema de tradução, em unidades relevantes ao ensaio do marcador em questão, então a supressão da porcentagem de uma construção de teste compreendendo o códonseletor é a porcentagem de X que o marcador de construção de teste apresenta nasmesmas condições essencialmente ambientais que o marcador de controle positivo foiexpresso, exceto que o marcador de construção de teste é expresso em um sistema detradução que também inclui o O-RNAt e o O-RS. Tipicamente, o sistema de tradução que expressa o marcador de teste também inclui um aminoácido que é reconhecido pelo O-RS eO-RNAt. Opcionalmente, as medições de supressão percentual podem ser refinadas porcomparação do marcador de teste com uma construção de marcador de controle "de fundo"ou "negativa", que inclui o mesmo códon seletor como o marcador de teste, mas em umsistema que não inclui o O-RNAt, O-RS e/ou aminoácido relevante reconhecido pelo O-RNAt e/ou O-RS. Este controle negativo é usado na normalização das medições desupressão percentual para levar em conta os efeitos de sinal de fundo do marcador nosistema de tradução de interesse.
A eficiência de supressão pode ser determinada por qualquer dos diversos ensaiosconhecidos na tecnologia. Por exemplo, um ensaio reportador de fgalactosidase pode serusado, por exemplo, um plasmídeo IacZ derivatizado (onde a construção tem um códonseletor na seqüência de ácido nucléico IacZ) é introduzido nas células a partir de umorganismo apropriado (por exemplo, um organismo onde os componentes ortogonais podemser usados) junto com o plasmídeo compreendendo um O-RNAt da invenção. Uma sintetasecognata pode também ser introduzida (tanto como um polipeptídeo quanto como umpolinucleotídeo que codifica uma sintetase cognata quando expressa). As células crescemem meio a uma densidade desejada, por exemplo, com um OD600 de cerca de 0,5, e ensaiosB-galactosidase são realizados, por exemplo, usando o conjunto de ensaio /J-GalactosidaseBetaflúor™ (Novagen). A supressão percentual pode ser calculada como a porcentagem deatividade para uma amostra com relação a um controle comparável, por exemplo, o valorobservado da construção IacZ derivatizada, onde a construção tem um códon sentidocorrespondente na posição desejada em vez de um códon seletor.
Sistema de tradução: O termo "sistema de tradução" refere-se aos componentesque incorporaram um aminoácido em uma cadeia do polipeptídeo em crescimento(proteína). Componentes de um sistema de tradução podem incluir, por exemplo,ribossomos, RNAts1 sintetase, mRNA e similares. O O-RNAt e/ou o O-RSs^ da invençãopodem ser adicionados ou ser parte de um sistema de tradução in vitro ou in vivo, por exemplo, em uma célula não eucariótica, por exemplo, uma bactéria (tal como E. coli), ouem uma célula eucariótica, por exemplo, uma célula de levedura, uma célula de mamífero,uma célula de planta, uma célula de alga, uma célula de fungo, uma célula de inseto e/ousimilares.
Aminoácido não natural: Da maneira aqui usada, o termo "aminoácido não natural"refere-se a qualquer aminoácido, aminoácido modificado e/ouanálogo de aminoácido, quenão é um dos 20 aminoácidos de ocorrência natural comuns. Por exemplo, o aminoácidonão natural fenilselenocisteína (Ver figura 1, estrutura 1) encontra uso com a invenção.
Derivados de: Da maneira aqui usada, o termo "derivados de" refere-se a umcomponente que é isolado feito usando uma molécula ou organismo especificado, ouinformação da molécula ou organismo especificado. Por exemplo, um polipeptídeo que éderivado de um segundo polipeptídeo pode incluir uma seqüência de aminoácidos que éidêntica ou substancialmente similar à seqüência de aminoácidos do segundo polipeptídeo.No caso de polipeptídeos, as espécies derivadas podem ser obtidas, por exemplo, pormutagênese de ocorrência natural, mutagênese artificial dirigida ou mutagênese artificialaleatória. A mutagênese usada para derivar polipeptídeos pode ser intencionalmente dirigidaou intencionalmente aleatória, ou um mistura de cada. A mutagênese de um polipeptídeopara criar um polipeptídeo diferente derivado do primeiro pode ser um evento aleatório (porexemplo, causado por infidelidade de polimerase) e a identificação do polipeptídeo derivadopode ser feita por métodos de classificação apropriados, por exemplo, da maneira aquidiscutida. Mutagênese de um polipeptídeo tipicamente implica na manipulação dopolinucleotídeo que codifica o polipeptídeo.
Marcador de seleção ou classificação positiva: Da maneira aqui usada, o termo"marcador de seleção ou classificação positiva" refere-se a um marcador que, quandopresente, por exemplo, expresso, ativado ou similares, resulta na identificação de umacélula, que compreende o trato, por exemplo, uma célula com o marcador de seleçãopositiva, daquelas sem o traço.
Marcador de seleção ou classificação negativa: Da maneira aqui usada, o termo"marcador de seleção ou classificação negativa" refere-se a um marcador que, quandopresente, por exemplo, expresso, ativado, ou similares, permite a identificação de umacélula que não compreende uma propriedade ou traço selecionados (por exemplo,comparado a uma célula que não possui a propriedade ou trato).
Reportador: Da maneira aqui usada, o termo "reportador" refere-se a umcomponente que pode ser usado para identificar e/ou selecionar componentes alvos de umsistema de interesse. Por exemplo, um reportador pode incluir uma proteína, por exemplo,uma enzima, que confere resistência ou sensibilidade a antibiótico (por exemplo, D-lactamase, cloranfenicol acetiltransferase (CAT), e similares), um marcador de classificaçãofluorescente (por exemplo, proteína fluorescente verde (por exemplo, (GFP), YFP, EGFP,RFP, etc.), um marcador Iuminescente (por exemplo, uma proteína da Iuciferase devagalume), uma afinidade baseada no marcador de classificação, ou genes marcadoresselecionáveis positivos ou negativos tais como IacZ, yff-gal/lacZ (/?-galactosidase), ADH(álcool deidrogenase), his3, ura3, Ieu2, Iis2, ou similares.
Eucarioto: Da maneira aqui usada, o termo "eucarioto" refere-se a organismospertencentes ao reino Eucarya. Eucariotos são de um modo geral distinguíveis deprocariotos por sua organização tipicamente multicelular (mas não exclusivamentemulticelular, por exemplo, levedura), a presença de um núcleo ligado na membrana e outrosorganelos ligados na membrana, material genético linear (isto é, cromossomos lineares), aausência de operons, a presença de introns, capeamento da mensagem e poli-A mRNA, eoutras características bioquímicas, tais como uma estrutura ribossomal distinguível.Organismos eucarióticos incluem, por exemplo, animais (por exemplo, mamíferos, insetos,répteis, pássaros, etc.), ciliatos, plantas (por exemplo, monocots, dicots, algas, etc.), fungo,levedura, flagelados, microsporidia, protista, etc.
Procarioto: Da maneira aqui usada, o termo "procarioto" refere-se a organismospertencentes ao reino Monera (também denominado Procarya). Organismos procarióticossão de um modo geral distinguíveis dos eucariotos por sua organização unicelular,reprodução assexuda por brotamento ou fissão, a falta de um núcleo ligado a membrana ououtros organelos ligados na membrana, um cromossomo circular, a presença de operons, aausência de introns, capeamento da mensagem e poli-A mRNA, e outras característicasbioquímicas, tal como uma estrutura ribossomal distinguível. Os Procarias incluem sub-reinos Eubactéria e Archaea (algumas vezes denominadas "Archaebacteria"). Cianobactéria(as algas azuis esverdeadas) e micoplasma são algumas vezes dados classificaçõesseparadas no Reino Monera.
Bactéria: Da maneira aqui usada, os termos "bactéria" e "eubactéria" referem-se aorganismos procarióticos que são distinguíveis da Archaea. Similarmente, Archaea refere-sea procariotos que são distinguíveis da eubactéria. Eubactéria e Archaea podem serdistinguidas por um número de critério morfológico e bioquímico. Por exemplo, diferençasnas seqüências de RNA ribossomais, estrutura polimerase RNA1 a presença ou ausência deintrons, sensibilidade a antibiótico, a presença ou ausência da parede celularpeptidoglicanos e outros componentes da parede celular, as estruturas ramificadas versusnão ramificadas de lipídios da membrana, e a presença/ausência de histonas e proteínastipo histona são usadas para projetar um organismo para Eubactéria ou Archaea.
Exemplos de Eubactérias incluem Escherichia coli, Thermus thermophilus, Bacillussubtilis e Baciilus stearothermophilus. Exemplo de Archaea incluem Methanococcusjannasehii (Mj)1 Methanosareina mazei (Mm), Methanobaeterium thermoautotrophieum (Mt),Methanoeoeeus maripaludis, Methanopyrus kandleri, Halobaeterium tais como Haloferaxvoleanii e Halobaeterium species NRC-I, Archaeoglobus fulgidus (AD, Pyroeoeeus furiosus(PD, Pyroeoeeus horikoshii (Ph), Pyrobaeulum aerophilum, Pyroeoeeus abyssi, Sulfolobussolfatarieus (Ss), Sulfolobus tokodaii, Aeuropyrum pernix (Ap), Thermoplasma aeidophilum eThermoplasma voleanium.
Variante conservativa: Da maneira aqui usada, o termo "variante conservativa", nocontexto de um componente de tradução, refere-se a um componente de tradução, porexemplo, uma variante conservativa O-RNAt ou uma variante conservativa O-RS, quedesempenha funcionalidade similar a um componente de base que a variante conservativa ésimilar, por exemplo, a um O-RNAt ou O-RS1 tendo variações na seqüência comparada a uma referência O-RNAt ou O-RS. Por exemplo, um O-RS1 ou uma variante conservativa deO-RS, aminoacilará um O-RNAt cognato com um aminoácido não naturalfenilselenocisteína. Neste exemplo, o O-RS e a variante conservativa O-RS não tem asmesmas seqüências de aminoácidos. A variante conservativa pode ter, por exemplo, umavariação, duas variações, três variações, quatro variações, ou cinco ou mais variações na seqüência, desde que a variante conservativa seja ainda complementar ao (por exemplo,função) cognato correspondente O-RNAt ou O-RS.
Em algumas modalidades, uma variante conservativa O-RS compreende um oumais substituições de aminoácido conservativas comparada ao O-RS do qual ele foiderivado. Em algumas modalidades, uma variante conservativa O-RS compreende uma oumais substituições de aminoácido conservativas comparada ao O-RS da qual ele foiderivado e, além disso, retém atividade biológica de O-RS; por exemplo, uma varianteconservativa O-RS que retém pelo menos 10 % da atividade biológica da molécula O-RS paida qual ela foi derivada ou, alternativamente, pelo menos 20 %, pelo menos 30 %, ou pelomenos 40 %. Em algumas modalidades preferidas, a variante conservativa O-RS retém pelomenos 50 % da atividade biológica da molécula O-RS pai da qual ela foi derivada. Assubstituições de aminoácido conservativas de uma variante conservativa O-RS pode ocorrer em qualquer domínio do O-RS, incluindo a bolsa de ligação de aminoácido.
Agente de seleção ou classificação: Da maneira aqui usada, o termo "agente deseleção ou classificação" refere-se a um agente que, quando presente, permiteseleção/classificação de certos componentes de uma população. Por exemplo, um agentede seleção ou classificação pode ser, mas sem limitações, por exemplo, um nutriente, um antibiótico, um comprimento de onda da luz, um anticorpo, um polinucleotídeo expresso, ousimilares. O agente de seleção pode ser variado, por exemplo, por concentração,intensidade, etc.
Em resposta a: Da maneira aqui usada, o termo "em resposta a" refere-se aoprocesso em que um O-RNAt da invenção reconhece um códon seletor e media aincorporação do aminoácido não natural, que é acoplado ao RNAt, na cadeia dopolipeptídeo em crescimento.
Codificar: Da maneira aqui usada, o termo "codificar" refere-se a qualquer processopelo qual a informação em uma macromolécula polimérica ou cadeia de seqüência é usadapara direcionar a produção de uma segunda molécula ou cadeia de seqüência que é diferente da primeira molécula ou cadeia de seqüência. Da maneira aqui usada, o termo éusado de forma geral, e pode ter uma variedade de aplicações. Em alguns aspectos, otermo "codificar" descreve o processo de replicação de DNA semiconservativo, onde umafita de uma molécula de DNA de fita dupla é usada como um molde para codificar uma fitairmã complementar sintetizada por um DNA polimerase DNA-dependente.
Em um outro aspecto, o termo "codificar" refere-se a qualquer processo pelo qual ainformação em uma molécula é usada para direcionar a produção de uma segunda moléculaque tem uma natureza química diferente da primeira molécula. Por exemplo, uma moléculade DNA pode codificar uma molécula de RNA (por exemplo, incorporar pelo processo detranscrição uma enzima de RNA polimerase DNA-dependente). Também, uma molécula deRNA pode codificar um polipeptídeo, como no processo de tradução. Quando usado paradescrever o processo de tradução, o termo "codificar" também estende-se ao códon tripleteque codifica um aminoácido. Em alguns aspectos, uma molécula de RNA pode codificaruma molécula de DNA, por exemplo, pelo processo de transcrição reversa que incorpora umDNA polimerase RNA-dependente. Em um outro aspecto, uma molécula de DNA pode codificar um polipeptídeo, onde entende-se que "codifica" na forma usada nesse casoincorpora tanto os processos de transcrição quanto de tradução.
DESCRIÇÃO RESUMIDA DAS FIGURASA figura 1 fornece as estruturas químicas do aminoácido não naturalfenilselenocisteína (estrutura 1) bem como estruturas que podem ser derivadas defenilselenocisteína. Estas estruturas incluem deidroalanina (2), palmitoilcisteína (3),famesilcisteína (4), S-hexadecilcisteína (5) e ácido gama-carboxiglutâmico (6).
A figura 2 fornece vários nucleotídeo e seqüências de aminoácidos que encontramuso com a invenção.
DESCRIÇÃO DETALHADA DA INVENÇÃO
A invenção fornece soluções para as limitações inerentes ao usa de um sistema detradução confinado pelos 20 aminoácidos de ocorrência natural. As soluções incluemcomposições e métodos relacionados a incorporação bio-sintética de sítio-específicoprogramada e o aminoácido não natural fenilselenocisteína (figura 1, estrutura 1) nasproteínas usando sistemas de tradução ortogonal. A incorporação de fenilselenocisteína naproteína pode ser programada para ocorrer em qualquer posição desejada pela engenhariado polinucleotídeo que codifica a proteína de interesse para conter um códon seletor quesinaliza a incorporação do aminoácido não natural na cadeia do polipeptídeo emcrescimento.
A invenção fornece composições inéditas incluindo novos aminoacil-RNAt sintetase(O-RS) que têm a capacidade de carregar um Cognato supressor O-RNAt adequado (porexemplo, o O-RNAt de SEQ ID NO: 1) com fenilselenocisteína. Estes O-RS são novosmutantes do Methanococcus jannaschii tirosil-RNAt sintetase que carregam seletivamente oO-RNAt com o aminoácido não natural fenilselenocisteína em células hospedeirasbacterianas. Mais preferivelmente, os componentes ortogonais não apresentam reaçãocruzada com componentes hospedeiros endógenos do maquinário translacional da célulahospedeira (por exemplo, uma célula E. coli).
O O-RS da invenção pode incluir o O-RS de SEQ ID NOS: 4, 6 ou 8. A invençãotambém fornece polinucleotídeos que codificam estes polipeptídeos. O presente revelaçãotambém descreve o metodologia para evolução dos pares de O-RNAtIO-RS inéditos quefuncionam na eubactéria para incorporar especificamente no sítio um aminoácido nãonatural fenilselenocisteína em resposta a códons seletores.
A invenção também fornece métodos para a incorporação genética e sítio-específico altamente eficiente de fenilselenocisteína (figura 1, estrutura 1) nas proteínas(preferivelmente in vivo) em resposta a um códon seletor (por exemplo, o códon não sentidoâmbar, TAG). Estes métodos e composições inéditos podem ser usados, por exemplo, emum sistema hospedeiro bacteriano.
Em alguns casos, o aminoácido não natural fenilselenocisteína pode em seguidaser de modo específico e regio-seletivamente modificados após sua incorporação em umpolipeptídeo, da maneira descrita na presente revelação. Em virtude da reação química dogrupo fenilseleno, proteínas nas quais o aminoácido não natural é incorporado podem sermodificadas com seletividade extremamente alta. Em alguns casos, grupo reativo deaminoácido não natural fenilselenocisteína tem a vantagem de ser completamente alienadoaos sistemas in vivo, melhorando dessa maneira a seletividade da reação. Em algunsaspectos, as reações de modificação podem ser conduzidas usando condições de reaçãorelativamente brandas que permitem reações de conjugação tanto in vitro quanto in vivoenvolvendo proteínas, e preservando disponibilidade da célula hospedeira e/ou atividadebiológica da proteína.
Em alguns aspectos, a fração de fenilselenocisteína incorporada é modificada, cujo produto modificado é em seguida um a um novamente modificado, por exemplo, por umareação de conjugação.
A natureza do material que é ultimamente conjugado na posição selecionada naproteína (correspondente ao códon seletor no quadro de leitura que codifica a proteína) nãoé particularmente limitada, e pode ser qualquer entidade desejada, por exemplo, lipídios, corantes, fluorforos, agentes de reticulação, derivados de sacarídeo, polímeros (porexemplo, derivados de polietileno glicol), fotoreticuladores, compostos citotóxicos,marcadores de afinidade, derivados de biotina, resinas, microesferas, uma segunda proteínaou polipeptídeo (ou mais), polinucleotídeo(s) (por exemplo, DNA, RNA, etc.), quelantes demetais, cofatores, ácidos graxos, carboidratos, e similares.
Em alguns aspectos, para demonstrar (mas não limitar) a presente invenção, arevelação descreve aqui a fração de aminoácido não natural fenilselenocisteína incorporadaem uma proteína modelo, por exemplo, mioglobina, hormônio do crescimento humano eGFP. Não se pretende que a incorporação do aminoácido não natural fenilselenocisteínaseja limitada a qualquer particular proteína. Deve ficar claro que a incorporação deaminoácido não natural fenilselenocisteína em qualquer proteína de interesse desejadapode ser realizada usando as diretrizes da presente revelação. A geração de proteínas quecompreendem um ou mais aminoácidos não naturais fenilselenocisteína (tanto sozinhasquanto em combinação com outros aminoácidos não naturais diferentes) é vantajosa comuma variedade de propósitos, por exemplo, para o uso em proteínas terapêuticas e compropósitos de pesquisa.
MODIFICAÇÃO DE FENILSELENOCISTEÍNA
Em alguns aspectos, a invenção fornece métodos para a modificação do resíduo deaminoácido fenilselenocisteína após sua incorporação em um polipeptídeo. Umamodificação como essa, por exemplo, clivagem oxidativa, pode converter beneficamente oresíduo de aminoácido fenilselenocisteína no aminoácido de deidroalanina a,/?-insaturado(Ver figura 1, estrutura 2). Este aminoácido de deidroalanina não natural é também reativo epode ser subseqüentemente modificado.19Não pretende-se que a invenção seja limitada a nenhum mecanismo particular (porexemplo, eliminação oxidativa) ou condições de reação específicas (por exemplo, exposiçãoao peróxido de hidrogênio) para a conversão de fenilselenocisteína em deidroalanina.Versados na tecnologia reconhecerão uma variedade de mecanismos e condições dereação alternativos adequados que encontram igual uso com a invenção para a conversãode um resíduo de fenilselenocisteína em deidroalanina.
MODIFICAÇÃO DE DEIDROALANINA
Em alguns aspectos, a invenção fornece métodos para modificação adicional de umresíduo de aminoácido de deidroalanina não natural em um polipeptídeo. O resíduo dedeidroalanina é reativo e pode ser alvejado em reações de modificação altamenteespecíficas. Estes métodos são especialmente usados na formação de lipídio conjugadopara produzir proteínas lipidadas.
Da maneira aqui descrita, reações de adição de Michael de deidroalanina doaminoácido não natural resultam em proteínas com modificações pós-translacionais sítio-específico programadas. Por exemplo, reação de deidroalanina com um tio-lipídio podegerar uma proteína lipidada. Por exemplo, reação com ácido tiopalmítico resulta empalmitoilcisteína (Ver figura 1, estrutura 3), reação com farnesilmercaptano produzfarnesilcisteína (Ver figura 1, estrutura 4), e reação com malonato produz ácido γ-carboxiglutâmico (Ver figura 1, estrutura 6). Além disso, reação com 1-hexadecanetiolresulta em S-hexadecilcisteína (Ver figura 1, estrutura 5).
Embora a presente especificação forneça estes exemplos, não se pretende que ainvenção seja limitada a qualquer mecanismo particular (por exemplo, um caminho adiçãode Michael) ou reagentes específicos (tio-lipídios) na modificação (conjugação) dedeidroalanina. Versados na tecnologia percebem uma variedade de mecanismosalternativos, condições de reação e reagentes adequados que encontram igual uso com ainvenção para a modificação do resíduo de deidroalanina. Certamente, modificação doresíduo de deidroalanina não é limitada a conjugação de lipídio, e este mecanismo deconjugação pode ser usado para conjugar qualquer fração desejada com o polipeptídeo nosítio de deidroalanina.
TECNOLOGIA DE RNAt/AMINOACIL-RNAt SlNTETASE ORTOGONALUm entendimento das composições inéditas e métodos da presente invenção exigeum entendimento das atividades associadas com pares de RNAt ortogonal e aminoacil-RNAtsintetase ortogonal. A fim de adicionar mais aminoácidos não naturais ao código genético,são necessários novos pares ortogonais compreendendo um aminoacil-RNAt sintetase e umRNAt adequado que possam funcionar eficientemente no maquinário translacionalhospedeiro, mas que sejam "ortogonais" ao sistema de tradução em questão, significandoque eles funcionam independentemente da sintetase e RNAts endógenos ao sistema detradução. Características desejadas do par ortogonal incluem RNAt que codifica oureconhece apenas um códon específico, por exemplo, um códon seletor, que não édecodificado por nenhum RNAt endógeno, e aminoacil-RNAt sintetase quepreferencialmente aminoacila (ou "carrega") seu cognato RNAt com apenas um aminoácido não natural específico. O O-RNAt também não é tipicamente aminoacilado (ou é fracamenteaminoacilado, isto é, carregado) por sintetase endógena. Por exemplo, em um sistemahospedeiro E. coli, um par ortogonal incluirá um aminoacil-RNAt sintetase que não reage deforma cruzada com nenhum um RNAt endógeno, por exemplo, que existem 40 em E. coli, eum RNAt ortogonal que não é aminoacilado por nenhuma das sintetases endógenas, por exemplo, das quais existem 21 em E. coli.
Os princípios gerais de sistemas de tradução ortogonal que são adequados parapreparar proteínas que compreendem um ou mais aminoácidos não naturais são conhecidosna tecnologia, tais como: os métodos gerais para produzir sistemas de tradução ortogonal.Por exemplo, ver International Publication Numbers WO 2002/086075, intitulado "METHODSAND COMPOSITION FOR THE PRODUTION OF ORTOGONAL AMINOACIL-RNAt RNAt-SYNTHETASE PAIRS", WO 2002/085923, intitulado "IN VIVO INCORPORATION OFUN NATURAL AMINO ACIDS", WO 2004/094593, intitulado "EXPANDING THEEUKARYOTIC GENETIC CODE", WO 2005/019415, depositado em 7 de Julho de 2004;WO 2005/007870, depositado em 7 de Julho de 2004; WO 2005/007624, depositado em 7 de Julho de 2004; e WO 2006/110182, depositado em 27 de outubro de 2005, intitulado"COMPONENTS OF TRANSLATION ORTOGONAL FOR THE IN VIVO INCORPORATIONOF UNNATURAL AMINO ACIDS". Cada uma dessas publicações está aqui incorporadapela referência na sua íntegra. Para discussão de sistemas de tradução ortogonal queincorporam aminoácidos não naturais, e métodos para sua produção e uso, Ver também, Wang and Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed., 44(1):34-66(2005), Xie and Schultz, "A Expanding Genetic Code", Methods 36(3):227-238 (2005); Xieand Schultz, "Adding Amino acids to the Genetic Repertoire", Curr. Opinion in ChemicalBiology 9(6):548-554 (2005); Wang et ai, "Expanding the Genetic Code", Annu. Rev.Biophys. Biomoi Struct., 35:225-249 (2006); and Ryu and Schultz, Efficient Incorporation of Unnatural Amino Acids in" Proteins Escherichia coli", Nat. Methods (4):263-265 (2006), cujosconteúdos estão cada qual incorporados pela referência na sua íntegra.
SISTEMAS DE TRADUÇÃO ORTOGONAL
Sistemas de tradução ortogonal de um modo geral compreendem células (quepodem ser células procarióticas tal como E. coli) que incluem um RNAt ortogonal (O-RNAt),um aminoacil RNAt sintetase ortogonal (O-RS), e um aminoácido não natural, onde o O-RSaminoacila o O-RNAt com o aminoácido não natural. Um par ortogonal da invenção podeincluir um O-RNAt, por exemplo, um supressor RNAt, um deslocamento de quadro RNAt, ousimilares, e um Cognato 0-RS. Os sistemas ortogonais da invenção podem tipicamentecompreender pares O-RNAt/O-RS, tanto no contexto de uma célula hospedeira quanto sema célula hospedeira. Além dos sistemas multicomponentes, a invenção também fornececomponentes individuais inédito, por exemplo, polipeptídeos aminoacil-RNAt sintetaseortogonal inéditos (por exemplo, SEQ ID NO: 4, 6 ou 8), e os polinucleotídeos que codificamaqueles polipeptídeos (por exemplo, SEQ ID NO: 5, 7 ou 9).
Em geral, quando um par ortogonal reconhece um códon seletor e carrega umaminoácido em resposta ao códon seletor, diz-se que o par ortogonal "suprime" o códonseletor. Ou seja, um códon seletor que não é reconhecido pelo sistema de tradução (porexemplo, as células) maquinário endógeno não é ordinariamente carregado, que resulta embloqueio da produção de um polipeptídeo que de outra forma será traduzido do ácidonucléico. Em um par ortogonal sistema, o O-RS aminoacila o O-RNAt com um aminoácidonão natural específico. O O-RNAt carregado reconhece o códon seletor e suprime obloqueio translacional causado pelo códon seletor.
Em alguns aspectos, um O-RNAt da invenção reconhece um códon seletor e incluipelo menos cerca de, por exemplo, 45 %, a 50 %, a 60 %, a 75 %, a 80 %, ou a 90 % oumais eficiência de supressão na presença de uma sintetase cognata em resposta a umcódon seletor, comparada à eficiência de supressão de um O-RNAt que compreende oucodifica uma seqüência de polinucleotídeo apresentada nas listagens de seqüência aqui.
Em algumas modalidades, a eficiência de supressão do O-RS e o O-RNAt juntos écerca de, por exemplo, 5 vezes, 10 vezes, 15 vezes, 20 vezes, ou 25 vezes ou mais que aeficiência de supressão do O-RNAt que falta no O-RS. Em alguns aspectos, a eficiência desupressão do O-RS e o O-RNAt juntos é pelo menos cerca de, por exemplo, 35 %, 40 %, 45%, 50 %, 60 %, 75 %, 80 %, ou 90 % ou mais da eficiência de supressão de um parsintetase ortogonal como apresentado nas listagens de seqüência aqui.
A célula hospedeira usa o par O-RNAt/O-RS para incorporar o aminoácido nãonatural em uma cadeia do polipeptídeo em crescimento, por exemplo, por meio de um ácidonucléico que compreende um polinucleotídeo que codifica um polipeptídeo de interesse,onde o polinucleotídeo compreende um códon seletor que é reconhecido pelo O-RNAt. Emcertos aspectos preferidos, a célula pode incluir um ou mais pares de O-RNAt/ O-RSadicionais, onde o O-RNAt adicional é carregado pelo O-RS adicional com um aminoácidonão natural diferente. Por exemplo, um dos O-RNAts podem reconhecer um códon dequatro bases e o outro O-RNAt pode reconhecer um códon de parada. Alternativamente,múltiplos códons de parada diferentes ou múltiplos códons de quatro bases diferentespodem ser usados no mesmo ácido nucléico de codificação.
Conforme notado, em algumas modalidades, existem múltiplos pares de O-A/O-RSem uma célula ou outro sistema de tradução que permitem a incorporação de mais que umaminoácido não natural em um polipeptídeo. Por exemplo, a célula pode incluiadicionalmenter um par de O-RNAt/O-R diferente adicional e um segundo aminoácido nãonatural, onde este O-RNAt adicional reconhece um segundo códon seletor e este O-RSadicional preferencialmente aminoacila o O-RNAt com o segundo aminoácido não natural.
Por exemplo, uma célula que inclui um par de O-RNAt/O-R (onde o O-RNAt reconhece, porexemplo, um códon seletor fr âmbar), pode compreender adicionalmente um segundo parortogonal, onde o segundo O-RNAt reconhece um códon seletor diferente, por exemplo, umcódon opala, um códon de quatro bases, ou similares. Desejavelmente, os pares ortogonaisdiferentes são derivados de diferentes fontes, que podem facilitar reconhecimento dediferentes códons seletores.
Em certas modalidades, os sistemas compreendem uma célula tal como uma célulaE. coli que inclui um RNAt ortogonal (O-RNAt), um aminoacil- RNAt sintetase ortogonal(O-RS), um aminoácido não natural e um ácido nucléico que compreende umpolinucleotídeo que codifica um polipeptídeo de interesse, onde o polinucleotídeo compreende o códon seletor que é reconhecido pelo O-RNAt. O sistema de tradução podetambém ser um sistema sem célula, por exemplo, qualquer um de uma variedade desistemas de transcrição/tradução "in vitro" comercialmente disponíveis em combinação comum par de O-RNAt/O-R e um aminoácido não natural da maneira aqui descrita.
O O-RNAt e/ou o O-RS podem ser de ocorrência natural ou podem ser, por exemplo, derivados por mutação de um RNAt e/ou RS de ocorrência natural, por exemplo,gerando bibliotecas de RNAts e/ou bibliotecas de RSs, a partir de qualquer uma de umavariedade de organismos e/ou usando qualquer uma de uma variedade de estratégias demutação disponível. Por exemplo, uma estratégia para produzir um par de RNAtortogonal/aminoacil-RNAt sintetase envolve importar um par de RNAt/ sintetase heterólogo(para a célula hospedeira), por exemplo, de uma fonte a não ser a célula hospedeira, oumúltiplas fontes, na célula hospedeira. As propriedades do candidato a sintetase heterólogaincluem, por exemplo, que ele não carrega nenhuma célula hospedeira RNAt, e aspropriedades do candidato a RNAt heterólogo incluem, por exemplo, que eles não sãoaminoacilado por nenhuma célula hospedeira sintetase. Além disso, o RNAt heterólogo é ortogonal a todas células hospedeiras sintetase. A segunda estratégia para gerar um parortogonal envolve gerar bibliotecas mutantes das quais se classifica e/ou seleciona um O-RNAt ou O-RS. Estas estratégias podem também ser combinadas.
RNAt ORTOGONAL (O-RNAt)
Um RNAt ortogonal (O-RNAt) da invenção desejavelmente media a incorporação deum aminoácido não natural em uma proteína que é codificada por um polinucleotídeo quecompreende um códon seletor que é reconhecido pelo O-RNAt, por exemplo, in vivo ou invitro. Em certas modalidades, um O-RNAt da invenção inclui pelo menos cerca de, porexemplo, um 45 %, a 50 %, a 60 %, a 75 %, a 80 %, ou a 90 % ou mais eficiência desupressão na presença de uma sintetase cognata em resposta a um códon seletorcomparado a um O-RNAt compreendendo ou codificado por uma seqüência depolinucleotídeos tal como apresentada nas seqüências O-RNAt nas listagens de seqüênciaaqui.
A eficiência de supressão pode ser determinada por qualquer dos diversos ensaiosconhecidos na tecnologia. Por exemplo, um ensaio reportador /?-galactosidase pode serusado, por exemplo, um plasmídeo IacZ derivatizado (onde a construção tem um códonseletor na seqüência de ácido nucléico IacZ) é introduzida nas células de um organismoapropriado (por exemplo, um organismo onde os componentes ortogonais podem serusados) junto com plasmídeo que compreende um O-RNAt da invenção. Uma sintetasecognata pode também ser introduzida (tanto como um polipeptídeo quanto como umpolinucleotídeo que codifica uma sintetase cognata quando expressa). As células crescemem meio até uma densidade desejada, por exemplo, até um OD6oo de cerca de 0,5, eensaios de /?-galactosidase são realizados, por exemplo, usando o estojo de ensaio BetaFluor™ /ff-Galactosidase (Novagen). Supressão percentual pode ser calculada como aporcentagem de atividade para uma amostra com relação a um controle comparável, porexemplo, o valor observado da construção IacZ derivatizada, onde a construção tem umcódon sentido correspondente na posição desejada em vez de um códon seletor.
Exemplos de O-RNAts da invenção são apresentados nas listagens de seqüênciaaqui, por exemplo, ver figura 2 e SEQ ID NO: 1. A revelação também fornece aquiorientação para o projeto de espécies O-RNAt equivalentes adicionais. Em uma molécula deRNA, tais como uma molécula O-RS mRNA, ou O-t RNA, timina (T) é substituída comuracila (U) com relação a uma dada seqüência (ou vice-versa para um DNA codificado), ou complemento destes. Modificações adicionais para as bases podem também estarpresentes para gerar moléculas equivalentes funcionalmente em grande medida.
A invenção também engloba variações conservativas de O-RNAts correspondentesaos O-RNAts particulares aqui. Por exemplo, variações conservativas de O-RNAt incluemaquelas moléculas que funcionam como os O-RNAts particulares, por exemplo, como naslistagens de seqüência aqui e que mantém a estrutura RNAt em forma de L em virtude daauto-complementaridade apropriada, mas que não tem uma seqüência idêntica a esta, porexemplo, na seqüência listada ou figura 2 e, desejavelmente, são moléculas sem ser asmoléculas de RNAt tipo selvagem.
A composição compreendendo um O-RNAt pode incluir adicionalmente umaminoacil-RNAt sintetase ortogonal (O-RS), onde o O-RS preferencialmente aminoacila o O-RNAt com um aminoácido não natural. Em certas modalidades, uma composição incluindoum O-RNAt pode inclui adicionalmenter um sistema de tradução (por exemplo, in vitro ou invivo). Um ácido nucléico que compreende um polinucleotídeo que codifica um polipeptídeode interesse, onde o polinucleotídeo compreende um códon seletor que é reconhecido peloO-RNAt1 ou uma combinação de um ou mais desses pode também estar presente na célula.
Métodos de produzir um RNAt ortogonal (O-RNAt) são também um recurso dainvenção. Um O-RNAt produzido pelo método é também uma recurso da invenção. Emcertas modalidades da invenção, os O-RNAts podem ser produzidos gerando uma bibliotecade mutantes. A biblioteca de RNAts mutantes pode ser gerada usando várias técnicas demutagênese conhecidas na tecnologia. Por exemplo, os RNAts mutantes podem sergerados pelas mutações de sítio-específico, mutações de ponto aleatório, recombinaçãohomóloga, embaralhamento de DNA ou outros métodos de mutagênese recursivos,construções quiméricas ou qualquer combinação destes, por exemplo, do O-RNAt de SEQID NO: 1.
Mutações adicionais podem ser introduzidas em posição(s) específica(s), porexemplo, em posição(s) não conservativa(s), ou em uma posição conservativa, em uma(s)posição(s) aleatória(s), ou uma combinação de ambos em um laço ou região desejada deum RNAt, por exemplo, um alça anticódon, o braço aceptor, braço ou alça D, alça variável,braço ou alça TPC, outras regiões da molécula de tRNA, ou uma combinação destes.Tipicamente, mutações em um RNAt incluem mutação do laço anticódon de cada membroda biblioteca de mutantes RNAts para permitir o reconhecimento de um códon seletor. Ométodo pode inclui adicionalmenter adicionar mais seqüências ao O-RNAt. Tipicamente, umO-RNAt possui uma melhoria de ortogonalidade para um organismo desejado comparado aomaterial de partida, por exemplo, a pluralidade de seqüências de RNAt, preservando aindasua afinidade no sentido de um RS desejado.
Os métodos opcionalmente incluem analisar a similaridade (e/ou homologiainferida) de seqüências de RNAts e/ou aminoacil-RNAt sintetase para determinar candidatospotenciais para um O-RNAt, O-RS e/ou seus pares, que parecem ser ortogonais a umorganismo específico. Programas computadorizados conhecidos na tecnologia e aquidescritos podem ser usados para a análise, por exemplo, programas BLAST e deempilhamento podem ser usados. Em um exemplo, para escolher componentestranslacionais ortogonais potenciais para o uso em E. coli, é escolhida uma sintetase e/ouum RNAt que não apresenta similaridade de seqüência próxima com os organismoseubacterianos.
Tipicamente, um O-RNAt é obtido submetendo, por exemplo, a seleção negativauma população de células de uma primeira espécie, onde as células compreendem ummembro da pluralidade de O-RNAts potenciais. A seleção negativa elimina células quecompreendem um membro de bibliotecas de O-RNAts potenciais que é aminoacilado por umaminoacil-RNAt sintetase (RS) que é endógeno à célula. Isto fornece um agrupamento deRNAts que são ortogonais à célula da primeira espécie.
Em certas modalidades, na seleção negativa, um(s) códon(s) seletor(s) é(são)introduzido(s) em um polinucleotídeo que codifica um marcador de seleção negativa, porexemplo, uma enzima que confere resistência a antibiótico, por exemplo, /Mactamase, umaenzima que confere um produto detectável, por exemplo, /?-galactosidase, cloranfenicolacetiltransferase (CAT), por exemplo, um produto tóxico, tal como barnase, em uma posiçãonão essencial (por exemplo, produzindo ainda um barnase funcional), etc.Classificação/seleção é opcionalmente feita crescendo a população de células na presençade um agente seletivo (por exemplo, um antibiótico, tal como ampicilina). Em uma modalidade, a concentração do agente de seleção é variada.
Por exemplo, para medir a atividade de RNAts supressores, é usado um sistema deseleção que é baseado na supressão in vivo de códon seletor, por exemplo, mutações nãosentido (por exemplo, parada) ou deslocamento de quadro introduzidas em umpolinucleotídeo que codifica um marcador de seleção negativa, por exemplo, um gene para /ff-lactamase (bla). Por exemplo, variantes de polinucleotídeo, por exemplo, variantes bla,com um códon seletor em uma certa posição (por exemplo, A184), são construídos. Células,por exemplo, bactérias, são transformadas com estes polinucleotídeos. No caso de umRNAt ortogonal, que não pode ser eficientemente carregado por sintetase de E. coliendógena, a resistência a antibiótico, por exemplo, resistência a ampicilina, deve ser aproximadamente igual ou menor que aquela para uma bactérias transformadas semplasmídeo. Se o RNAt não é ortogonal, ou se um sintetase heteróloga capaz de carregar oRNAt é co-expresso no sistema, um maior nível de antibiótico, por exemplo, resistência aampicilina, é observado. Células, por exemplo, bactérias, são escolhidas que são incapazesde crescer em placas ágar LB com concentrações de antibiótico aproximadamente iguais às das células transformadas sem plasmídeos.
No caso de um produto tóxico (por exemplo, ribonuclease ou barnase), quando ummembro da pluralidade de RNAts potenciais é aminoacilado pelo hospedeiro endógeno, porexemplo, sintetase de Escherichia coli (isto é, ele não é ortogonal ao hospedeiro, porexemplo, Escherichia coil sintetase), o códon seletor é suprido e o produto polinucleotídeo tóxico produzido leva à morte celular, células que abrigam RNAt ortogonais ou RNAts nãofuncionais sobrevivem.
Em uma modalidade, o agrupamento de RNAts que são ortogonais a um organismodesejado é em seguida submetido a uma seleção positiva na qual um códon seletor écolocado em um marcador de seleção positiva, por exemplo, codificado por um gene de resistência a medicamento, um gene jff-lactamase como esse. A seleção positiva é realizadaem uma célula compreendendo um polinucleotídeo que codifica ou que compreende ummembro de agrupamentos de RNAts que são ortogonais a célula, um polinucleotídeo quecodifica um marcador de seleção positiva, e um polinucleotídeo que codifica um RS cognato.Em certas modalidades, a segunda população de células compreende células que nãoforam eliminadas pela seleção negativa. Os polinucleotídeos são expressos na célula e acélula cresce na presença de um agente de seleção, por exemplo, ampicilina. RNAts são emseguida selecionados por sua capacidade de ser aminoacilado pela sintetase cognata co-expressa e de inserir um aminoácido em resposta a este códon seletor. Tipicamente, estascélulas mostram uma melhoria na eficiência de supressão, comparadas às células queabrigam RNAt(s), ou RNAts não funcionais que podem não ser eficientemente reconhecidospela sintetase de interesse. Uma célula que abrigam o RNAts ou RNAts não funcionais quenão são eficientemente reconhecidos pela sintetase de interesse, são sensíveis aoantibiótico. Portanto, RNAts que: (i) não são substratos para hospedeiro endógeno, porexemplo, Escherichia coli, sintetase; (ii) podem ser aminoacilados pela sintetase deinteresse; e (iii) são funcionais em tradução, sobrevivem a ambas seleções.
Conseqüentemente, o mesmo marcador pode ser tanto um marcador positivo quanto negativo, dependendo do contexto no qual ele é classificado. Isto é, o marcador éum marcador positivo se ele for classificado, mas um marcador negativo se desclassificado.
O rigor da seleção, por exemplo, a seleção positiva, a seleção negativa, ou tanto aseleção positiva quanto negativa, nos métodos supradescritos opcionalmente inclui variar origor da seleção. Por exemplo, em virtude da barnase ser uma proteína extremamentetóxica, o rigor da seleção negativa pode ser controlado introduzindo diferentes números decódons seletores no gene barnase e/ou usando um promotor indutível. Em um outroexemplo, a concentração do agente de seleção ou classificação é variada (por exemplo,concentração de ampicilina). Em alguns aspectos da invenção, o rigor varia em virtude de aatividade desejada poder ser baixa durante as etapas iniciais. Assim, critérios de seleçãomenos rigorosos são aplicados em etapas iniciais e critérios mais rigorosos são aplicadosem etapas finais de seleção. Em certas modalidades, a seleção negativa, a seleção positiva,ou tanto a seleção negativa quanto a positiva podem ser repetidas múltiplas vezes. Múltiplosdiferentes marcadores de seleção negativa, marcadores de seleção positiva, ou tantoseleção negativa quanto marcadores positivos podem ser usados. Em certas modalidades, omarcador de seleção positiva e negativa pode ser o mesmo.
Outros tipos de seleções/classificação podem ser usados na invenção para produzircomponentes translacionais ortogonais, por exemplo, um O-RNAt1 um O-RS, e um par de O-RNAt/O-R que carrega um aminoácido não natural em resposta a um códon seletor. Porexemplo, o marcador de seleção negativa, o marcador de seleção positiva, ou tanto os marcadores de positiva quanto negativa podem incluir um marcador que fluoresce oucatalisa um reação Iuminescente na presença de um reagente adequado. Em uma outramodalidade, um produto do marcador é detectado por avaliação da emissão defluorescência das células (FACS) ou por luminescência. Opcionalmente, o marcador incluiuma afinidade baseada no marcador de classificação. Ver também, Francisco, J. A., et ai,(1993) Prodution and fluorescence-activated cell sorting of Escherichia coli expressing afuncional antibody fragment on the externai surface. Proc Natl Acad Sci USA. 90:10444-8.
Métodos adicionais para produzir um RNAt ortogonal recombinante podem serencontrados, por exemplo, nas publicações de pedido de patente internacionais WO2002/086075, intitulado "METHODS AND COMPOSITIONS FOR THE PRODUTUION OFORTOGONAL RNAt SYNTHETASE AMINOACYL-RNAt PAIRS", WO 2004/094593,intitulado "EXPANDING THE EUKARYOTIC GENETIC CODE GENETIC" e WO2005/019415, depositado em 7 de julho de 2004. Ver também Forster et ai, (2003)Programming peptidomimetic sintetase by translating genetic codes designed de novo PNAS100(11 ):6353-6357, e, Feng et ai, (2003), Expanding RNAt recognition of a RNAt sintetasefor the single amino acid change, PNAS 100(10): 5676-5681.
AMINOACIL-RNAt SINTETASE ORTOGONAL (O-RS)
Um O-RS da invenção preferencialmente aminoacila um O-RNAt com umaminoácido não natural, in vitro ou in vivo. Um O-RS da invenção pode ser fornecido aosistema de tradução, por exemplo, uma célula, por um polipeptídeo que inclui um O-RS e/oupor um polinucleotídeo que codifica um O-RS ou uma porção destes. Por exemplo, umexemplo O-RS compreende uma seqüência de aminoácidos apresentada em SEQ ID NO: 4,6 ou 8, ou um variação conservativa destes. Em um outro exemplo, um O-RS1 ou umaporção deste, é codificado por uma seqüência de polinucleotídeos que codifica umaminoácido que compreende a seqüência na lista ou exemplos de seqüência aqui, ou umaseqüência de polinucleotídeos complementar desta. Ver, por exemplo, o polinucleotídeo deSEQ ID NO: 5, 7 ou 9.
Métodos para identificar um aminoacil-RNAt sintetase ortogonal (O-RS), porexemplo, um O-RS, para uso com um O-RNAt, são também um recurso da invenção. Porexemplo, um método inclui submeter à seleção, por exemplo, seleção positiva, umapopulação de células de uma primeira espécie, onde as células individualmentecompreendem: 1) um membro de pluralidade de aminoacil-RNAt sintetase (RSs), (porexemplo, a pluralidade de RSs pode incluir RSs mutante e RSs derivados de uma espécie anão ser a primeira espécie, ou tanto RSs mutantes quanto RSs derivados de uma espécie anão ser a primeira espécie); 2) o RNAt ortogonal (O-RNAt) (por exemplo, de uma ou maisespécies); e 3) um polinucleotídeo que codifica um marcador de seleção (por exemplo,positivo) e compreende pelo menos um códon seletor. Células são selecionadas ouclassificadas em relação àquelas que apresentam uma melhoria na eficiência de supressão,comparadas com células não têm, ou que têm uma quantidade reduzida do membro dapluralidade de RSs. A eficiência de supressão pode ser medida por técnicas conhecidas natecnologia e da maneira aqui descrita. Células tendo uma melhoria na eficiência desupressão compreendem um RS ativo que aminoacila o O-RNAt. Um nível de aminoacilação(in vitro ou in vivo) pelo RS ativo de um primeiro conjunto de RNAts da primeira espécie écomparado com o nível de aminoacilação (in vitro ou in vivo) pelo RS ativo de um segundoconjunto de RNAts da segunda espécie. O nível de aminoacilação pode ser determinado poruma substância detectável (por exemplo, um aminoácido marcado não natural). O RS ativoque aminoacila mais eficientemente o segundo conjunto de RNAts comparado ao primeiroconjunto de RNAts é tipicamente selecionado, fornecendo dessa maneira um aminoacil-RNAt sintetase ortogonal eficiente (otimizada) para uso com o O-RNAt. Um O-RS1 identificado pelo método, é também uma recurso da invenção.
Qualquer dos diversos ensaios pode ser usado para determinar aminoacilação.Estes ensaios podem ser realizados in vitro ou in vivo. Por exemplo, ensaios deaminoacilação in vitro são descritos, por exemplo, em Hoben and Soil (1985) MethodsEnzvmol. 113:55-59. Aminoacilação pode também ser determinada usando um reportadorjunto com componentes de tradução ortogonal e detectando o reportador em uma célula queexpressa um polinucleotídeo compreendendo pelo menos um códon seletor que codificauma proteína. Ver também, WO 2002/085923, intitulado "IN VIVO INCORPORATION OFUNNATURAL AMINO ACIDS", e WO 2004/094593, intitulado "EXPANDING THEEUKARYOTIC GENETIC CODE".
O O-RS identificado pode ser manipulado adicionalmente para alterar aespecificidade do substrato da sintetase, de maneira que apenas um aminoácido não naturaldesejado, mas não qualquer dos 20 aminoácidos comuns, seja carregado no O-RNAt.Métodos para gerar um aminoacil-RNAt sintetase ortogonal com uma especificidade desubstrato para um aminoácido não natural incluem na mutação da sintetase, por exemplo,no sítio ativo na sintetase, no sítio de mecanismo de edição na sintetase, nos diferentessítios combinando diferentes domínios de sintetase, ou similares, e na aplicação de umprocesso de seleção. Uma estratégia é usada, que é baseada na combinação de umaseleção positiva seguida por uma seleção negativa. Na seleção positiva, supressão docódon seletor introduzido em uma posição não essencial(s) de um marcador positivo permiteque a células sobreviva sob pressão de seleção positiva. Na presença tanto de aminoácidosnaturais quanto não naturais, sobreviventes assim codificam sintetase ativa carregando osupressor RNAt ortogonal tanto com um aminoácido natural quanto não natural. Na seleçãonegativa, supressão de um códon seletor introduzida em uma posição não essencial(s) deum marcador negativo remove especificidades de sintetase com aminoácido natural.Sobreviventes da seleção negativa e positiva codificam sintetase que aminoacila (carrega) oortogonal supressor RNAt seleção apenas com aminoácidos não naturais. Esta sintetasepode em seguida ser submetida a mutagênese adicional, por exemplo, embaralhamento deDNA ou outros métodos de mutagênese recursivos.
Uma biblioteca de O-RSs mutantes pode ser gerada usando várias técnicas demutagênese conhecidas na tecnologia. Por exemplo, os RSs mutantes podem ser geradospor mutações de sítio-específico, mutações de ponto aleatório, recombinação homóloga, embaralhamento de DNA ou outros métodos de mutagênese recursiva, construçõesquiméricas ou qualquer combinação destes. Por exemplo, uma biblioteca de RSs mutantespode ser produzida, por exemplo, de duas ou mais outras "sub-bibliotecas" menores, menosdiversas. Bibliotecas quiméricas de RSs estão também incluídas na invenção. Deve-se notarque bibliotecas de RNAt sintetase de vários organismos (por exemplo, microorganismos tais como eubactéria ou archaebacteria) tal como bibliotecas que compreendem diversidadenatural (Ver, por exemplo, patente U.S. No. 6.238.884 de Short et al, patente U.S. No.5.756.316 de Schallenberger et al; patente U.S. No. 5.783.431 de Petersen et al, patenteU.S. No. 5.824.485 de Thompson et al, patente U.S. No. 5.958.672 de Short et al), sãoopcionalmente construídas e classificadas pelos pares ortogonais.
Uma vez que a sintetase é submetida a estratégia de seleção/classificação positivae negativa, esta sintetase pode em seguida ser submetida a mutagênese adicional. Porexemplo, um ácido nucléico que codifica o O-RS pode ser isolado; um conjunto depolinucleotídeos que codifica O-RSs mutado (por exemplo, por mutagênese aleatória,mutagênese de sítio-específico, recombinação ou qualquer combinação destes) pode sergerado do ácido nucléico; e estas etapas individuais ou uma combinação destas etapas,podem ser repetidas até que um O-RS mutado seja obtido, que preferencialmenteaminoacila o O-RNAt com o aminoácido não natural. Em alguns aspectos da invenção, asetapas são realizadas múltiplas vezes, por exemplo, pelo menos duas vezes.
Níveis adicionais de rigor de seleção/classificação podem também ser usados nos métodos da invenção, para produzir O-RNAt1 O-RS, ou seus pares. O rigor de seleção ouclassificação pode variar em uma ou ambas etapas do método para produzir um O-RS. Istopode incluir, por exemplo, variar a quantidade de agente de seleção/classificação que éusada, etc. Etapas adicionais de seleções positivas e/ou negativas podem também serrealizadas. Seleção ou classificação pode também compreender uma ou mais de uma mudança na permeabilidade do aminoácido, uma mudança na eficiência de tradução, umamudança na fidelidade translacional, etc. Tipicamente, uma ou mais mudança é baseada emuma mutação em um ou mais gene em um organismo no qual um par de RNAt ortogonal-RNAt sintetase é usado para produzir proteína.
Detalhes gerais adicionais para produzir O-RS e alterar a especificidade do substrato da sintetase podem ser encontrados em Publicação internacional WO2002/086075, intitulado "METHODS AND COMPOSITIONS FOR THE PRODUTION OFORTOGONAL RNAt SINTETASE AMINOACIL-RNAt PARES", e WO 2004/094593, intitulado"EXPANDING THE EUKARYOTIC GENETIC CODE". Ver também, Wang and Schultz"Expanding the genetic Code", Angewandte Chemie Int. Ed., 44(1):34-66 (2005), cujosconteúdos estão aqui incorporados pela referência nas suas íntegras.
ORGANISMOS FONTES E HOSPEDEIROS
Os componentes translacionais ortogonais (O-RNAt e O-RS) da invenção podemser derivados de qualquer organismo (ou uma combinação de organismos) para uso em umsistema hospedeiro de tradução de qualquer outra espécie, com a condição de que oscomponentes O-RNAt/O-RS e o sistema hospedeiro funcionem de uma maneira ortogonal.Não é uma exigência que o O-RNAt e o O-RS de um par ortogonal sejam derivados do mesmo organismo. Em alguns aspectos, os componentes ortogonais são derivados degenes Archaea (isto é, archaebacteria) para uso em um sistema hospedeiro eubacteriano.
Por exemplo, o O-RNAt ortogonal pode ser derivado de um organismo Archae, porexemplo, um archaebacterium, tais como Methanococcus jannaschii, Methanobacteriumthermoautotrophieum, Halobaeterium tais como Haloferax voleanii e Halobaeterium espécieNRC-1, Archaeoglobus fulgidus, Pyroeoceus furiosus, Pyroeoeeus horikoshii, Aeuropyrumpernix, Methanoeoeeus maripaludis, Methanopyrus kandleri, Methanosareina mazei (Mm),Pyrobaeulum aerophilum, Pyroeoeeus abyssi, Sulfolobus solfatarieus (Ss), Sulfolobustokodaii, Thermoplasma aeidophilum, Thermoplasma voleanium, ou similares, ou umeubactéria, tais como Eseheriehia eoli, Thermus thermophilus, Bacillus subtilis, Bacillusstearothermphilus, ou similares, Enquanto o O-RS ortogonal pode ser derivado de umorganismo ou combinação de organismos, por exemplo, um archaebacterium, tais comoMethanoeoeeus jannaschii, Methanobaeterium thermoautotrophieum, Halobaeterium taiscomo Haloferax voleanii e Halobaeterium espécie NRC-1, Archaeoglobus fulgidus,Pyroeoeeus furiosus, Pyroeoeeus horikoshii, Aeuropyrum perniz, Methanoeoeeusmaripaludis, Methanopyrus kandleri, Methanosareina mazei, Pyrobaeulum aerophilum,Pyroeoeeus abyssi, Sulfolobus solfatarieus, Sulfolobus tokodaii, Thermoplasma aeidophilum,Thermoplasma voleanium, ou similares, ou uma eubactéria, tais como Eseheriehia eoli,Thermus thermophilus, Bacillus subtilis, Bacillus stearothermphilus, ou similares. Em umamodalidade, fontes eucarióticas, por exemplo, plantas, algas, protista, fungo, levedura,animais (por exemplo, mamíferos, insetos, arthropods, etc.), ou similares, podem tambémser usadas como fontes de O-RNAts e O-RSs.
Os componentes individuais de um par de O-RNAt/O-R podem ser derivados domesmo organismo ou de organismos diferentes. Em uma modalidade, o par de O-RNAt/O-Ré do mesmo organismo. Alternativamente, o O-RNAt e o O-RS do par de O-RNAt/O-R são de organismos diferentes.
O O-RNAt, O-RS ou o par O-RNAt/O-R podem ser selecionados ou classificados invivo ou in vitro e/ou usados em uma célula, por exemplo, uma célula eubacteriana, paraproduzir um polipeptídeo com um aminoácido não natural. Uma célula eubacteriana usadanão é limitada, por exemplo, Escherichia coli, Thermus thermophilus, Bacillus subtilis,Bacillus stearothermphilus, ou similares. Composições de células eubacterianas quecompreende componentes translacionais da invenção são também um recurso da invenção.
Ver também, publicação de pedido de patente internacional 2004/094593, intitulado"EXPANDING THE EUKARYOTIC GENETIC CODE", depositado em 16 de abril de 2004,para classificar O-RNAt e/ou O-RS em uma espécie para uso em uma outra espécie.
Embora sistemas de tradução ortogonal (por exemplo, compreendendo um O-RS,um O-RNAt e um aminoácido não natural) possam utilizar células hospedeiras cultivadaspara produzir proteínas tendo aminoácidos não naturais, não pretende-se que um sistemade ORTOGONAL TRANSLATION da invenção exija uma célula hospedeira intacta viável.Por exemplo, um sistema de ORTOGONAL TRANSLATION pode utilizar um sistema semcélula na presença de um extrato da célula. Realmente, o uso de transcrição/sistemas semcélula in vitro, de tradução para produção de proteína é uma técnica bem estabelecida. Aadaptação destes sistemas in vitro para produzir proteínas tendo aminoácidos não naturaisusando sistema de componente de translações ortogonais aqui descritos está bem noescopo da invenção.
CÓDONS SELETORES
Códons seletores da invenção expandem a estrutura do códon genético domaquinário bio-sintético da proteína. Por exemplo, um códon seletor inclui, por exemplo, umcódon de três bases exclusive, um códon não sentido, tal como um códon de parada, porexemplo, um códon âmbar (UAG), ou um códon opala (UGA), um códon não natural, pelomenos um códon de quatro bases, um códon raro, ou similares. Inúmeros códons seletorespodem ser introduzidos em um gene desejado, por exemplo, um ou mais, dois ou mais, mais que três, etc. Usando códons seletores diferentes, múltiplos pares RNAt ortogonal/sintetasepodem ser usado que permitem a incorporação sítio-específico simultânea de múltiplosaminoácidos não naturais por exemplo, incluindo pelo menos um aminoácido não natural,usando estes diferentes códons seletores.
Em uma modalidade, os métodos envolvem o uso de um códon seletor que é umcódon de parada para a incorporação de um aminoácido não natural in vivo em uma célula.Por exemplo, um O-RNAt é produzido que reconhece o códon de parada e é aminoaciladopor um O-RS com um aminoácido não natural. Este O-RNAt não é reconhecido pelaaminoacil-RNAt sintetase do hospedeiro de ocorrência natural. Mutagênese de sítio dirigidoconvencional pode ser usado para introduzir o códon de parada no sítio de interesse em um polinucleotídeo que codifica um polipeptídeo de interesse. Ver, por exemplo, Sayers, J.R., etal. (1988), 5',3' Exonuclease in phosphorotioate-based oligonucleotídeo-directedmutagenesise. Nucleic Acids Res. 791-802. Quando o O-RS, O-RNAt e o ácido nucléico quecodifica um polipeptídeo de interesse são combinados, por exemplo, in vivo, o aminoácidonão natural é incorporado em resposta ao códon de parada para dar um polipeptídeocontendo o aminoácido não natural na posição especificada. Em uma modalidade dainvenção, o códon de parada usado como um códon seletor é um códon âmbar, UAG, e/ouum códon opala, UGA. Em um exemplo, um código genético no qual UAG e UGA sãoambos usados como um códon seletor pode codificar 22 aminoácidos preservando ainda ocódon não sentido ocre, UAA, que é o sinal de terminação mais abundante.
A incorporação de aminoácidos não naturais in vivo pode ser feita sem perturbaçãosignificativa da célula hospedeira. Por exemplo, em células não eucarióticas, tal como Escherichia coli, em virtude da eficiência de supressão para o códon UAG depender dacompetição entre o O-RNAt, por exemplo, o supressor âmbar de RNAt, e do fator 1 deliberação (RF1) (que se liga ao códon UAG e inicia a liberação do peptídeo de crescimentodo ribossomo), a eficiência de supressão pode ser modulada, por exemplo, tantoaumentando o nível de expressão de O-RNAt1 por exemplo, o supressor RNAt, quantousando uma cepa deficiente em RF1. Em células eucarióticas, em virtude da eficiência desupressão com o códon UAG depender da competição entre o O-RNAt, por exemplo, osupressor âmbar de RNAt, e um fator de liberação eucariótica (por exemplo, eRF) (que ligaa um códon de parada e inicia a liberação do peptídeo de crescimento do ribossomo), aeficiência de supressão pode ser modulada, por exemplo, aumentando a nível de expressão de O-RNAt, por exemplo, o supressor RNAt. Além disso, compostos adicionais podemtambém estar presentes, por exemplo, agentes de redução tal como ditiotretiol (DTT).
Aminoácidos não naturais podem também ser codificados com códons raros. Porexemplo, quando a concentração de arginina em uma reação de síntese de proteína in vitroé reduzido, o códon de arginina raro, AGG, demonstrou ser eficiente para inserção de Ala por um RNAt sintético acilado com alanina. Ver, por exemplo, Ma et ai, Biochemistry.32:7939 (1993). Neste caso, o RNAt sintético compete com o RNAt*'9 de ocorrência natural,que existe como uma espécie secundária em Escherichia coli. Além disso, algunsorganismos não usam todos os códons triplete. Um códon AGA não projetado emMicrococcus Iuteus foi utilizado para inserção de aminoácidos em um extrato transcrição/tradução in vitro. Ver, por exemplo, Kowal e OIiVer1 Nucl. Ácido. Res., 25:4685(1997). Componentes da invenção podem ser gerados para usar esses códons raros in vivo.
Códons seletores podem também compreender códons estendidos, por exemplo,códons de quatro ou mais bases, tais como, códons de quatro, cinco, seis ou mais bases.Exemplos de códons de quatro bases incluem, por exemplo, AGGA, CUAG, UAGA, CCCU,e similares. Exemplos de códons de cinco bases incluem, por exemplo, AGGAC, CCCCU,CCCUC, CUAGA, CUACU, UAGGC e similares. Métodos da invenção incluem usar códonsestendidos baseado na supressão de deslocamento de quadro. Códons de quatro ou maisbases podem inserir, por exemplo, um ou múltiplos aminoácidos não naturais, na mesmaproteína. Em outras modalidades, as alças anticódon podem decodificar, por exemplo, pelomenos um códon de quatro bases, pelo menos um códon de cinco bases, ou pelo menosum códon de seis bases ou mais. Subseqüentemente, existem 256 códons de quatro basespossíveis, múltiplos aminoácidos não naturais podem ser codificados na mesma célulausando um códon de quatro ou mais bases. Ver também, Anderson et al., (2002) Exploringthe Limits of Codon and Anticodon Size, Chemistrv and Bioloqy, 9:237-244, e Magliery,(2001) Expanding the genetic Code: Seiection of Efficient Suppressors ofFour-base Codonsand Identifition of "Shifty" Four-base Codons whiht a Library Approach in Eseheriehia eoli, J.Mol. Biol. 307: 755-769.
Por exemplo, códons de quatro bases têm sido usados para incorporar aminoácidosnão naturais nas proteínas usando métodos bio-sintéticos in vitro. Ver, por exemplo, Ma etal., (1993) Biochemistrv. 32:7939; e Hohsaka et al., (1999) J. Am. Chem. Soc.. 121:34.CGGG e AGGU foram usados para incorporar simultaneamente 2-naftilalanina e um NBDderivado de Iisina em estreptavidina in vitro com dois supressores RNAts de deslocamentode quadro quimicamente adiados. Ver, por exemplo, Hohsaka et al., (1999) J. Am. Chem.Soc.. 121:12194. Em um estudo in vivo, Moore et al. examinou a capacidade de RNAtleuderivados com anticódons UCUA suprir códons UAGN (N pode ser U, A, G, ou C), edescobriu que o UAGA quadruplete pode ser decodificado por um RNAtleu com um anticódon UCUA com uma eficiência de 13 a 26 % com pequena decodificação no quadro 0ou -1. Ver Moore et al., (2000) J. Mol. Biol.. 298:195. Em uma modalidade, códonsestendidos baseados nos códons raros ou códons não sentido podem ser usados nainvenção, que podem reduzir leitura de sentido incorreto e supressão de deslocamento dequadro em outros sítios indesejados. Códons de quatro base têm sido usados como códonsseletores em uma variedade de sistemas ortogonais. Ver, por exemplo, WO 2005/019415;WO 2005/007870 and WO 2005/07624. Ver também, Wang and Schultz "Expanding thegenetic Code," Angewandte Chemie Int. Ed., 44(1):34-66 (2005), cujos conteúdos estão aquiincorporados nas suas íntegras pela referência. Embora os exemplos a seguir utilizem umcódon seletor fr âmbar, códons de quatro ou mais bases podem ser igualmente usados,modificando os exemplos aqui para incluir O-RNAts de quatro bases e sintetase modificadospara incluir mutações similares àquelas descritas anteriormente para vários O-RSs deaminoácido não natural:
Para um dado sistema, um códon seletor pode também incluir um dos códons detrês bases naturais, onde o sistema endógeno não usa (ou raramente usa) o códon de base natural. Por exemplo, isto inclui um sistema que falta um RNAt que reconhece o códon detrês bases natural e/ou um sistema onde o códon de três bases é um códon raro.
Códons seletores opcionalmente incluem pares de base não naturais. Estes paresde base não naturais expandem adicionalmente o alfabeto genético existente. Um par debase extra aumenta o número de códons triplete de 64 para 125. Propriedades dos terceirospares de base incluem pareamento de base estável e seletivo, incorporação enzimáticaeficiente no DNA com alta fidelidade por um polimerase, e a extensão do iniciador continuoueficiente depois da síntese do par de base não natural nascente. Descrições de pares debase não naturais que podem ser adaptadas para métodos e composições incluem, porexemplo, Hirao, et ai, (2002) Na unnatural base pair for incorporating amino acid analoguesinto protein, Nature Biotechnoloav. 20:177-182. Ver também Wu, Y., et ai, (2002) J. Am.Chem. Soe. 124:14626-14630. Outras publicações relevantes são listadas a seguir.
Para uso in vivo, o nucleosídeo não natural é permeável a membrana e éfosforilado para formar o trifosfato correspondente. Além disso, a maior informação genéticaé estável e não destruída pelas enzimas celulares. Esforços anteriores de Benner e outrostiram vantagem de padrões de ligação de hidrogênio que são diferentes daqueles em parescanônicos de Watson-Crick1 o mais notável exemplo de que é o par iso-C:iso-G. Ver, porexemplo, Switzer et al., (1989) J. Am. Chem. Soc.. 111:8322; and Piccirilli et ai, (1990)Nature. 343:33; Kool, (2000) Curr. Qpin. Chem. Biol.. 4:602. Essas bases em geral faltamaté um certo ponto de emparelhamento com bases naturais e não podem serenzimaticamente replicadas. Kool e colaboradores demonstram que interações eempacotamento hidrofóbico entre bases podem substituir ligação de hidrogênio paraconduzir a formação de par de base. Ver Kool, (2000) Curr. Qpin. Chem. Biol.. 4:602; andGuckian and Kool, (1998) Anqew. Chem. Int. Ed. Enql.. 36, 2825. Em um esforço paradesenvolver um par de base não natural satisfazendo todas as exigências anteriores,Schultz1 Romesberg e colaboradores têm sistematicamente sintetizado e estudado umasérie de bases hidrofóbicas não naturais. Um auto-par PICS:PICS deve ser mais estável doque pares de base naturais, e podem ser eficientemente incorporados no DNA porfragmento Klenow de Escherichia coli DNA polimerase I (KF). Ver, por exemplo, McMinn etai, (1999) J. Am. Chem. Soc.. 121:11586 e Ogawa et ai, (2000) J. Am. Chem. Soc..122:3274. Um auto-par 3MN:3MN pode ser sintetizado por KF com eficiência e seletividadesuficiente para função biológica. Ver, por exemplo, Ogawa et ai, (2000) J. Am. Chem. Soc..122:8803. Portanto, ambas bases agem como um terminador de cadeia para replicaçãoadicional. Foi recentemente desenvolvido um DNA polimerase mutante que pode ser usadopara replicar o auto-par PICS. Além disso, um auto-par 7AI pode ser replicado. Ver, porexemplo, Tae et ai, (2001) J. Am. Chem. Soc.. 123:7439. Tem também sido desenvolvidoum par de metalobase inédito, Dipic:Py, que forma um par estável mediante ligação Cu(II).Ver Meggers et ai, (2000) J. Am. Chem. Soc.. 122:10714. Em virtude de códons estendidose códons não naturais serem intrinsecamente ortogonais aos códons naturais, os métodosda invenção podem tirar vantagem desta propriedade para gerar RNAt ortogonais para eles.Um sistema de desvio translacional pode também ser usado para incorporar umaminoácido não natural em um polipeptídeo desejado. Em um sistema de desviotranslacional, uma grande seqüência é inserida em um gene, mas não é traduzida naproteína. A seqüência contém uma estrutura que serve como uma indicação para induzir o ribossomo a saltar a seqüência e retomar a tradução à jusante da inserção.
AMINOÁCIDOS NÃO NATURAIS
Da maneira aqui usada, um aminoácido não natural refere-se a qualqueraminoácido, aminoácido modificado, ou aminoácido análogo a não ser selenocisteína e/oupirrolisina e os vinte seguintes alfa-aminoácidos geneticamente codificados: alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutâmico, glicina, histidina,isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptofano,tirosina, valina. A estrutura genérica de um alfa-aminoácido é ilustrada pela Fórmula I:
Um aminoácido não natural é tipicamente qualquer estrutura tendo a Fórmula I emque o grupo R é qualquer substituinte a não ser um usado nos vinte aminoácidos naturais. Ver, por exemplo, Biochemistry por L. Stryer, P ed. 1988, Freeman and Company1 NewYork, para as estruturas dos vinte aminoácidos naturais. Note que os aminoácidos nãonaturais da invenção podem ser compostos de ocorrência natural sem ser os vinte alfa-aminoácidos anteriores.
Em virtude de os aminoácidos não naturais da invenção tipicamente diferirem dos aminoácidos naturais na cadeia lateral, os aminoácidos não naturais formam amida ligadacom outros aminoácidos, por exemplo, natural ou não natural, da mesma maneira da qualeles são formados em proteínas de ocorrência natural. Portanto, os aminoácidos nãonaturais têm grupos de cadeia lateral que os distingue dos aminoácidos naturais.
O aminoácido não natural fenilselenocisteína é de particular interesse aqui (Ver figura 1, estrutura 1). Além do aminoácido não natural fenilselenocisteína, outrosaminoácidos não naturais podem ser simultaneamente incorporados em um polipeptídeo deinteresse, por exemplo, usando um segundo par O-RS/O-RNAt apropriado em conjunto comum par ortogonal fornecido pela presente invenção. Muitos desses aminoácidos não naturaisadicionais e pares ortogonais adequados são conhecidos. Ver a presente revelação e asreferências aqui citadas. Por exemplo, ver Wang and Schultz "Expanding o Genetic Code",Angewandte Chemie Int. Ed., 44(1):34-66 (2005), Xie and Schultz, "A Expanding GeneticCode", Methods 36(3):227-238 (2005), Xie e Schultz1 "Adding Amino acids to the GeneticRepertoire", Curr. Opinion in Chemical Bioiogy 9(6):548-554 (2005) e Wang et ai,"Expanding the Genetic Code", Annu. Rev. Biophys. Biomol. Struct., 35:225-249 (2006);cujos conteúdos estão cada qual incorporados pela referência nas suas íntegras.
Embora o aminoácido não natural fenilselenocisteína mostrado na figura 1,estrutura 1, seja de interesse primário nos exemplos aqui descritos, não pretende-se que ainvenção seja estritamente limitada àquela estrutura. Realmente, uma variedade deanálogos estruturalmente relacionados facilmente derivados pode ser imediatamenteproduzida que retêm a característica principal da fenilselenocisteína mostrada na figura 1,estrutura 1, e também são especificamente reconhecidos pelo aminoacil-RNAt sintetase dainvenção (por exemplo, o O-RS de SEQ ID NOS: 4, 6 e 8). Pretende-se que estesaminoácidos análogos relacionados estejam no escopo da invenção.
Em outros aminoácidos não naturais, por exemplo, R na Fórmula I opcionalmentecompreende um alquil-, aril-, acil-, hidrazina, ciano-, halo-, hidrazida, alquenila, éter, borato,boronato, fosfo, fosfono, fosfina, enona, imina, éster, hidroxilamina, amina, e similares, ouqualquer combinação destes. Outros aminoácidos não naturais de interesse incluem, massem limitações, aminoácidos que compreendem um reticuladorfotoativável, aminoácido commarcador de spin, aminoácidos fluorescentes, aminoácidos de ligação de metal,aminoácidos contendo metal, aminoácidos radioativos, aminoácidos com grupos funcionaisinéditos, aminoácidos que interagem covalente ou não covalentemente com outrasmoléculas, aminoácidos fotoativados e/ou fotoisomerizáveis, biotina ou biotina-análogacontendo aminoácidos, ceto contendo aminoácidos, aminoácidos glicosilados, uma fraçãode sacarídeo anexada à cadeia lateral de aminoácido, aminoácidos compreendendopolietileno glicol ou poliéter, aminoácidos substituídos com átomo pesado, aminoácidos quimicamente cliváveis ou fotocliváveis, aminoácidos com uma cadeia lateral alongadacomparada com os ácidos naturais (por exemplo, poliéteres ou hidrocarbonetos de cadeialonga, por exemplo, maior que cerca de 5, maior que cerca de 10 carbonos, etc.),aminoácidos contendo açúcar ligados a carbono, amino tioácido contendo aminoácidos, eaminoácidos contendo uma ou mais frações tóxicas.
Em um outro aspecto, a invenção fornece aminoácidos não naturais tendo aestrutura geral ilustrada pela Fórmula IV a seguir:
<formula>formula see original document page 37</formula>Um aminoácido não natural tendo esta estrutura é tipicamente qualquer estruturaonde Ri é um substituinte usado em um dos vinte ácidos naturais (por exemplo, tirosina oufenilalanina) e R2 é um substituinte. Assim, este tipo de aminoácido não natural pode servisto como um aminoácido natural derivado.
Além dos aminoácidos não naturais que contêm a estrutura fenilselenocisteínamostrado na figura 1, estrutura 1, aminoácidos não naturais podem também compreenderopcionalmente estruturas da espinha dorsal modificadas, por exemplo, da maneira ilustradapelas estruturas das Fórmulas Il e III:
em que Z tipicamente compreende OH, NH2, SH, NH-R', ou S-R'; XeY, que podem ser os mesmos ou diferentes, tipicamente compreendem S ou O, e R e R', que sãoopcionalmente os mesmos ou diferentes, são tipicamente selecionados da mesma lista deconstituintes para o grupo R descrito anteriormente para os aminoácidos não naturais tendoFórmula I bem como hidrogênio. Por exemplo, aminoácidos não naturais da invenção,opcionalmente compreendem substituições no grupo amino ou carboxila da maneira ilustrada pelas Fórmulas Il e III. Aminoácidos não naturais deste tipo incluem, mas semlimitações, ácidos σ-hidróxi, σ-tioáciodo σ-aminotiocarboxilatos, por exemplo, com cadeiaslaterais correspondentes às cadeias laterais de vinte aminoácidos naturais ou não naturaiscomuns. Além disso, substituições no σ-carbono opcionalmente incluem L, D, ou a- a-aminoácidos di-substituídos tais como D-glutamato, D-alanina, D-metil-O-tirosina, ácidoaminobutírico, e similares. Outras alternativas estruturais incluem aminoácidos cíclicos, talcomo prolina análoga bem como prolina análoga de anel de 3, 4, 6, 7, 8 e 9 membros,aminoácidos e y tais como yff-alanina e ácido γ-amino butírico substituídos.
Em alguns aspectos, a invenção utiliza aminoácidos não naturais na configuraçãoL. Portanto, não pretende-se que a invenção seja limitada ao uso de aminoácidos nãonaturais de configuração L. Observou-se que o enantiômeros D destes aminoácidos nãonaturais também encontram uso na invenção.
Os aminoácidos não naturais que encontram uso na invenção não estão estritamente limitados ao aminoácido não natural fenilselenocisteína mostrado na figura 1,estrutura 1. Versados na tecnologia reconhecerão que uma ampla variedade de análogosnão naturais de aminoácidos de ocorrência natural é facilmente derivada. Por exemplo, massem limitações, derivados não naturais de tirosina são facilmente produzidos. Análogos detirosina incluem, por exemplo, tirosinas para-substituídas, tirosinas orto-substituídas, e tirosinas meta-substituídas, em que a tirosina substituída compreende um grupo alquinila,grupo acetila, um grupo benzoíla, um grupo amino, uma hidrazina, uma hidroxiamina, umgrupo tiol, um grupo carbóxi, um grupo isopropila, um grupo metila, uma cadeia ramificadaOg - C20 ou hidrocarboneto ramificado, um hidrocarboneto saturado ou insaturado, um grupo0-metila, um grupo poliéter, um grupo nitro, ou similares. Além disso, anéis arila multiplamente substituídos são também observados. Análogos glutamina da invençãoincluem, mas sem limitações, derivados de σ-hidróxi, derivados de y-substituído, derivadoscíclicos, e derivados de glutamina substituído por amida. Exemplos de análogos defenilalanina incluem, mas sem limitações, fenilalaninas para-substituídas, fenilalaninas orto-substituído, e fenilalaninas meta-substituído, em que o substituinte compreende um grupoalquinila, um grupo hidróxi, um grupo metóxi, um grupo metila, um grupo alila, um aldeído,um nitro, um grupo tiol, ou grupo ceto, ou similares. Exemplos específicos de aminoácidosnão naturais incluem, mas sem limitações, fenilselenocisteína, sulfotirosina, p-etiltiocarbonil-1-fenilalanina, p-(3-oxobutanoil)-1-fenilalanina, 1,5-dansil-alanina, aminoácido de 7-amino-cumarina, aminoácido de 7-hidróxi-cumarina, nitrobenzil-serina, 0-(2-nitrobenzil)-1-tirosina,p-carboximetil-1-fenilalanina, p-ciano-1-fenilalanina, m-ciano-1-fenilalanina, bifenilalanina, 3-amino-1 -tirosina, bipiridil alanina, p-(2-amino-1-hidroxietil)-1-fenilalanina, p-isopropiltiocarbonil-1-fenilalanina, 3-nitro-1-tirosina e p-nitro-1-fenilalanina. Também, um p-propargiloxifenilalanina, um 3,4-driidróxi-1-fenilalanina (DHP), um 3, 4, 6-triidróxi-1-fenilalanina, um 3,4,5-triidróxi-1-fenilalanina, 4-nitro-fenilalanina, ap-acetil-1-fenilalanina, O- metil-1-tirosina, um L-3-(2-naftil)alanina, um 3-metil-fenilalanina, um 0-4-alil-1-tirosina, um 4-propil-1-tirosina, um 3-nitro-tirosina, um 3-tiol-tirosina, um tri-0-acetil-GlcNAc/?-serina, um L-Dopa, um fenilalanina fluorado, um isopropil-1-fenilalanina, um p-azido-1-fenilalanina, um p-acil-1-fenilalanina, um p-benzoil-1-fenilalanina, um L-fosfoserina, um fosfonoserina, umfosfonotirosina, um p-iodo-fenilalanina, um p-bromofenilalanina, um p-amino-1 -fenilalanina, e um isopropil-1-fenilalanina, e similares. As estruturas de uma variedade de aminoácidos nãonaturais são reveladas nas referências aqui citadas. Ver também, pedidos de patenteinternacionais publicados WO 2004/094593, intitulado "EXPANDING THE EUKARYOTICAGENETIC CODE," e WO 2006/110182, intitulado" ORTOGONAL TRANSLATIONCOMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS",depositado em 27 de outubro de 2005.
SÍNTESE QUÍMICA DE AMINOÁCIDOS NÃO NATURAIS
Muitos dos aminoácidos não naturais fornecidos anteriormente estãocomercialmente disponíveis, por exemplo, pela Sigma (USA) ou Aldrich (Milwaukee, Wl1USA). Aqueles que não estão comercialmente disponíveis são opcionalmente sintetizados,fornecidos em várias publicações ou usando métodos padrões conhecidos pelos versadosna tecnologia. Para técnicas de síntese orgânica, Ver, por exemplo, Orqanic Chemistrv de Fessendon e Fessendon, (1982, Second Edition, Willard Grant Press, Boston Mass.);Advanced Oraanic Chemistrv by March (Third Edition, 1985, Wiley and Sons, New York); eAdvanced Orqanic Chemistrv by Carey and Sundberg (Third Edition, Parts AeB, 1990,Plenum Press, New York). Publicações adicionais descrevendo a síntese de aminoácidosnão naturais incluem, por exemplo, WO 2002/085923 intitulado "In vivo incorporation of Unnatural Amino Acids", Matsoukas et ai, (1995) J. Med. Chem.. 38, 4660-4669; King andKidd (1949) A New Synthesis of Glutamine and the y-Dipeptides of Glutamic Acid fromPhthylated Intermediates. J. Chem. Soc.. 3315-3319; Friedman and Chatterrji (1959)Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents. J. /\m.Chem. Soe. 81, 3750-3752; Craig et W. (1988) Absolute Configuration ofthe Enantiomeos of 7-Chloro-4 [[4-(diethylamino)-1-metilbutyl]amino]quinoline (Cloroquine). J. Orq. Chem. 53,1167-1170; Azoulay et al. (1991) Analogs glutamine as Potential Antimalarials,. Eur. J. Med.Chem. 26, 201-5; Koskinen, e Rapoport (1989) Synthesis of 4-Substituted Prolines asConformationally Constrained Amino Acid Analogs. J. Orq. Chem. 54, 1859-1866; Christie eRapoport (1985) Synthesis of Optically Pure Pipecolates from L-Asparagine. Application to the Total Synthesis of (+)-Apovincamine through Amino Acid Decarbonylation and IminiumIon Cyclization. J. Ora. Chem. 1989:1859-1866; Barton et al., (1987) Synthesis of Novel a-Amino-Acids and Derivatives Using RadicaI Chemistry: Synthesis of L- and D-aAmino-AdipicAcids, L-aaminopimelic Acid and Apropriado Unsaturad Derivatives. Tetrahedron Lett.43:4297-4308; and Subasinghe et ai, (1992) Quisqualic Acid analogs: synthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site. J. Med. Chem. 35:4602-7. Ver também, International Publication WO2004/058946, intitulado "PROTEIN ARRAYS", depositado em 22 de dezembro de 2003.
Captação celular de aminoácidos não naturais
Captação de aminoácido não natural por uma célula é uma questão que étipicamente considerado quando se projeta e seleciona aminoácidos não naturais, porexemplo, para incorporação em uma proteína. Por exemplo, a densidade de carga alta de a-aminoácidos sugere que estes compostos são improvavelmente permeáveis para a célula.Ácido naturais são captados na célula por meio de uma coleção de sistemas de transportebaseados em proteína exibindo freqüentemente variação de graus de especificidade deaminoácido. Pode ser feita uma classificação rápida, que avalia quais aminoácidos nãonaturais, se houver, são captados pelas células. Ver, por exemplo, os ensaios de toxicidade,por exemplo, em International Publication WO 2004/058946, intitulado "PROTEIN ARRAYS",depositado em 22 de dezembro de 2003, e Liu and Schultz (1999) Progress toward theevolution of the organism whith expanded Genetic Code. PNAS 96:4780-4785. Embora acaptação seja facilmente analisada com vários ensaios, uma alternativa para projetaraminoácidos não naturais que são amenos a caminhos de capação celular, é fornecercaminhos bio-sintéticos para criar aminoácidos in vivo.
Bio-síntese de Aminoácidos não naturais
Muitos caminhos bio-sintéticos já existem em células para a produção deaminoácidos e outros compostos. Embora um método bio-sintético para um aminoácido nãonatural particular não possa existir na natureza, por exemplo, em uma célula, a invenção fornece tais métodos. Por exemplo, caminhos bio-sintéticos para aminoácidos não naturaissão opcionalmente gerados em célula hospedeira adicionando novas enzimas oumodificando caminhos de célula hospedeira existentes. Novas enzimas adicionais sãoopcionalmente enzimas de ocorrência natural ou artificialmente enzimas desenvolvidas. Porexemplo, a bio-síntese de p-aminofenilalanina (apresentado em um exemplo em WO2002/085923) conta com a adição de uma combinação de enzimas conhecidas de outrosorganismos. Os genes para estas enzimas podem ser introduzidos em uma célulatransformando a célula com um plasmídeo compreendendo os genes. Os genes, quandoexpressos na célula, fornecem um caminho enzimático para sintetizar o composto desejado.Exemplos dos tipos de enzimas que são opcionalmente adicionados são fornecidos nos exemplos a seguir. Seqüências de enzimas adicionais são encontradas, por exemplo, emGenbank. Enzimas desenvolvidas artificialmente são também opcionalmente adicionadasem uma célula da mesma maneira. Desta maneira, o maquinário celular e recursos de umacélula são manipulados para produzir aminoácidos não naturais.
Realmente, qualquer um de uma variedade de métodos pode ser usado para produzir enzimas inéditas para uso em caminhos bio-sintéticos, ou para evolução decaminhos existentes, para a produção de aminoácidos não naturais, in vitro ou in vivo.Muitos métodos disponíveis de desenvolver enzimas e outros componentes de caminho bio-sintético podem ser aplicados à presente invenção para produzir aminoácidos não naturais(ou, realmente, para desenvolver sintetase para ter novas especificidades de substrato ou outras atividades de interesse). Por exemplo, embaralhamento de DNA é opcionalmenteusado para desenvolver enzimas inéditas e/ou caminhos de tais enzimas para a produçãode aminoácidos não naturais in vitro ou in vivo (ou produção de nova sintetase). Ver, porexemplo, Stemmer (1994), Rapid evolution of a proteína in vitro by DNA shuffling, Nature370(4):389-391; and Stemmer, (1994), DNA shuffling by random fragmentation andreassembly: In vitro recombination for molecular evolution, Proc. Natl. Acad. Sei. USA..91:10747-10751. Uma abordagem relacionada embaralha famílias de genes relacionados(por exemplo, homóloga) que desenvolvem facilmente enzimas com característicasdesejadas. Um exemplo de tais métodos "embaralhamento de gene de família" é encontradoem Crameri et at. (1998) "DNA shuffling of a family of genes from diverse speciesaccelerates directed evolution" Nature. 391(6664): 288-291. Novas enzimas (quercomponentes por caminho bio-sintético quer sintetase) podem também ser geradas usandoum procedimento de recombinação de DNA conhecido como "truncação incrementai para acriação de enzimas híbridas" ("ITCHY"), por exemplo, da maneira descrita em Ostermeier etat. (1999) "A combinatorial approach to hybrid enzymes independent of DNA homology"Nature Biotech 17:1205. Esta abordagem pode também ser usada para gerar uma bibliotecade enzima ou outras variantes de caminhos que podem servir como substratos para um ou mais métodos de recombinação in vitro ou in vivo. Ver, também, Ostermeier et ai (1999)"Combinatorial Protein Engineering by Incrementai Truncation", Proc. Natl. Acad. Sei. USA.96: 3562-67, and Ostermeier et at. (1999), "Incrementai Truncation as a Estrategy in theEngineering of Novel Biocatalysts", Bioloqical and Medicinal Chemistry1 7: 2139-44. Umaoutra abordagem usa mutagênese de montagem exponencial para produzir bibliotecas deenzima ou outras variantes de caminho que são, por exemplo, selecionadas pelacapacidade de catalisar uma reação bio-sintética relevante para produzir um aminoácidonão natural (ou uma sintetase inédita). Nesta abordagem, pequenos grupos de resíduos emuma seqüência de interesse são randomizados em paralelo para identificar, em cadaposição alterada, aminoácidos que levam às proteínas funcionais. Exemplos de tais procedimentos, que podem ser adaptados para a presente invenção para produzir novasenzimas para a produção de aminoácidos não naturais (ou sintetase inédita) sãoencontrados em Delegrave and Youvan (1993) Biotechnoloqy Research 11:1548-1552.Ainda em uma outra abordagem, mutagênese aleatória ou semi-aleatória usandooligonucleotídeos dopados ou degenerados para enzima e/ou engenharia de componentede caminho pode ser usado, por exemplo, usando os métodos gerais de mutagênese porexemplo, de Arkin and Youvan (1992) "Optimizing nucleotide mixtures to encode specificsubsets of amino acids for semi-random mutagenesis" Biotechnoloqy 10:297-300; ouReidhaar-Olson et ai (1991) "Random mutagenesis of protein sequences usingoligonucleotide cassettes" Methods Enzvmol. 208:564-86. Ainda em uma outra abordagem, freqüentemente denominada mutagênese "não estocásticas", que usa mutagênese de ré-montagens de polinucleotídeo e saturação do sítio pode ser usada para produzir enzimase/ou componentes de caminho, que pode em seguida ser classificado pela capacidade derealizar uma ou mais funções de sintetase ou de caminho bio-sintético (por exemplo, para aprodução de aminoácidos não naturais in vivo). Ver, por exemplo, Short "NON-STOCHASTIC GENERATION OF GENETIC VACCINES AND ENZYMS" WO 00/46344.
Uma alternativa para tais métodos mutacionais envolve recombinar todos osgenomas de organismos e selecionar progênie resultante para funções de caminhoparticular (freqüentemente referido como "embaralhamento de genoma completo"). Estaabordagem pode ser aplicada à presente invenção, por exemplo, por recombinação eseleção genômica de um organismo (por exemplo, um E. coli ou outra célula) pelacapacidade de produzir um aminoácido não natural (ou intermediário deste). Por exemplo,métodos preceituados nas publicações seguintes podem ser aplicados para projetarcaminho para a evolução de caminhos existentes e/ou novos em células para produziraminoácidos não naturais in vivo: Patnaik et ai (2002) "Genome shuffling of Iactobacillus forimproved acid tolerance" Nature Biotechnology 20(7):707-712, e Zhang et ai (2002)"Genome shuffling Leads to Rapid Phenotypic Improvement in Bactéria" Nature415(6872):644-646.
Outras técnicas para engenharia de organismo e caminho metabólico, por exemplo,para a produção de compostos desejados estão também disponíveis e podem também seraplicados à produção de aminoácidos não naturais. Exemplos de publicações quepreceituam abordagens de engenharia de caminho usadas incluem: Nakamura and White(2003) "Metabolic engineering for the microbial prodution of 1,3 propanediol" Curr. Opin.Biotechnol. 14(5):454-9; Berry et at. (2002) "Application of Metabolic Engineering to improveboth the prodution and use of Biotech índigo" J. Industrial Microbioloqy and Biotechnoloqy28:127-133; Banta et ai. (2002) "Optimizing a artificial metabolic pathway: Engineering ocofactor especificity of Corynebacterium 2,5-diketo-D-gluconic acid reductase for use invitamin C biosynthesis Biochemistrv. 41(20), 6226-36; Selivonova et al. (2001) "RapidEvolution of Novel Traits in Microorganisms" Applied and Environmental Microbioloqy.67:3645, e muitos outros.
Independente do método usado, tipicamente, o aminoácido não natural produzidocom um caminho bio-sintético de engenharia da invenção é produzido em umaconcentração suficiente para bio-síntese de proteína eficiente, por exemplo, uma quantidadecelular natural, mas não ao ponto de afetar significativamente a concentração de outrosaminoácidos celulares ou exaurir os recursos celulares. Concentrações típicas produzidos invivo desta maneira são cerca de 10 mM a cerca de 0,05 mM. Uma vez que uma célula éprojetada por engenharia para produzir enzimas desejadas para um caminho específico eum aminoácido não natural é gerado, seleções in vivo são opcionalmente usadas paraotimizar ainda mais a produção do aminoácido não natural tanto para síntese de proteínaribossomal quanto crescimento celular.Componentes ortoqonais para Incorporar Aminoácidos não naturaisUma invenção fornece composições e métodos para produzir componentesortogonais para incorporar o aminoácido não natural fenilselenocisteína (Ver figura 1,estrutura 1) em uma cadeia do polipeptídeo em crescimento em resposta a um códonseletor, por exemplo, um códon de parada âmbar, um códon não sentido, um códon dequatro ou mais bases, etc., por exemplo, in vivo. Por exemplo, a invenção fornece ortogonal-RNAts (O-RNAts)1 aminoacil-RNAt sintetase ortogonal (O-RSs) e seus pares. Estes parespodem ser usados para incorporar um aminoácido não natural nas cadeias do polipeptídeoem crescimento.
Uma composição da invenção inclui um aminoacil-RNAt sintetase ortogonal (O-RS)1onde o O-RS preferencialmente aminoacila um O-RNAt com fenilselenocisteína. Em certasmodalidades, o O-RS compreende uma seqüência de aminoácidos compreendendo SEQ IDNO: 4, 6 ou 8, e variações conservativas destas. Em certas modalidades da invenção, o O-RS preferencialmente aminoacila o O-RNAt sobre qualquer RNAt endógeno com umaminoácido não natural particular, onde o O-RS tem uma predisposição para o O-RNAt1 eonde a razão de O-RNAt carregado com um aminoácido não natural para o RNAt endógenocarregado com o mesmo aminoácido não natural é maior que 1:1, e mais preferivelmenteonde o O-RS carrega o O-RNAt exclusivamente ou quase exclusivamente.
Uma composição que inclui um O-RS por opcionalmente incluir adicionalmente um RNAt ortogonal (O-RNAt)1 onde o O-RNAt reconhece um códon seletor. Tipicamente, um O-RNAt da invenção inclui eficiência de supressão de pelo menos cerca de, por exemplo, 45%, 50 %, 60 %, 75 %, 80 % ou 90 % ou mais na presença de uma sintetase cognata emresposta a um códon seletor comparado à eficiência de supressão de um O-RNAt quecompreende ou é codificado por uma seqüência de polinucleotídeo apresentada naseqüência listada e exemplos aqui (por exemplo, SEQ ID NO: 1). Em uma modalidade, aeficiência de supressão do O-RS e do O-RNAt juntos, por exemplo, é 5 vezes, 10 vezes, 15vezes, 20 vezes, 25 vezes ou mais, maior do que a eficiência de supressão do O-RNAt naausência de um O-RS. Em alguns aspectos, a eficiência de supressão do O-RS e do O-RNAt juntos é pelo menos 45 % da eficiência de supressão de um par de tirosil-RNAt ortogonal sintetase derivado de Methanococcus jannaschii.
Uma composição que inclui um O-RNAt pode opcionalmente incluir uma célula (porexemplo, uma célula eubacteriana, tal como uma célula E. coli e similares, ou uma célulaeucariótica tal como uma célula de levedura), e/ou um sistema de tradução.
Uma célula (por exemplo, uma célula eubacteriana ou uma célula de levedura) que compreende um sistema de tradução é também fornecida pela invenção, onde o sistema detradução inclui um RNAt (O-RNAt) ortogonal; um aminoacil-RNAt sintetase ortogonal (O-RS); e, um aminoácido não natural fenilselenocisteína. Tipicamente, o O-RSpreferencialmente aminoacila o O-RNAt sobre qualquer RNAt endógeno com o aminoácidonão natural, onde o O-RS tem uma predisposição for o O-RNAt1 e onde a razão de O-RNAtcarregado com o aminoácido não natural para o RNAt endógeno carregado com oaminoácido não natural é maior que 1:1, e mais preferivelmente onde o O-RS carrega o O- RNAt exclusivamente ou quase exclusivamente. O O-RNAt reconhece o primeiro códonseletor, e o O-RS preferencialmente aminoacila o O-RNAt com um aminoácido não natural.Em uma modalidade, o O-RNAt compreende ou é codificado por uma seqüência depolinucleotídeo apresentada em SEQ ID NO: 1, ou uma seqüência de polinucleotídeocomplementar destas. Em uma modalidade, o O-RS compreende uma seqüência deaminoácidos apresentada em SEQ ID NO: 4, 6, 8 ou 10, e variações conservativas destas.
Uma célula da invenção pode compreender opcionalmente mais um par de O-RNAt/O-R diferente adicional e um segundo aminoácido não natural, por exemplo, onde esteO-RNAt reconhece um segundo códon seletor e este O-RS preferencialmente aminoacila oO-RNAt correspondente com o segundo aminoácido não natural, onde o segundoamino ácido é diferente from o primeiro aminoácido não natural. Opcionalmente, uma célula dainvenção inclui um ácido nucléico que compreende um polinucleotídeo que codifica umpolipeptídeo de interesse, onde o polinucleotídeo compreende um códon seletor que éreconhecido pelo O-RNAt.
Em certas modalidades, uma célula da invenção é uma célula eubacteriana (taiscomo E. coli), que inclui um -RNAt ortogonal (O-RNAt), um aminoacil-RNAt sintetaseortogonal (O-RS), um aminoácido não natural, e um ácido nucléico que compreende umpolinucleotídeo que codifica um polipeptídeo de interesse, onde o polinucleotídeocompreende o códon seletor que é reconhecido pelo O-RNAt. Em certas modalidades dainvenção, o O-RS preferencialmente aminoacila o O-RNAt com o aminoácido não naturalcom uma eficiência que é maior que a eficiência com a qual o O-RS aminoacila qualquerRNAt endógeno.
Em certas modalidades da invenção, um O-RNAt da invenção compreende ou écodificado por uma seqüência de polinucleotídeo apresentada na listas de seqüência ouexemplos aqui (por exemplo, SEQ ID NO: 1), ou uma seqüência de polinucleotídeo complementar desta. Em certas modalidades da invenção, um O-RS compreende umaseqüência de aminoácidos apresentada nas listas de seqüência, ou uma variaçãoconservativa destas. Em uma modalidade, o O-RS ou uma porção deste é codificado poruma seqüência de polinucleotídeo que codifica um aminoácido apresentado nas listas deseqüência ou exemplos aqui, ou uma seqüência de polinucleotídeo complementar destas.
O O-RNAt e/ou o O-RS da invenção podem ser derivados de qualquer uma de umavariedade de organismos (por exemplo, organismos eucariótico e/ou não eucariótico).
Polinucleotídeos são também um recurso da invenção. Um polinucleotídeo dainvenção (por exemplo, SEQ ID NO: 5, 7 ou 9) inclui um polinucleotídeo artificial (porexemplo, feito pelo homem, e ocorrência não natural) que compreende uma seqüência denucleotídeos que codifica um polipeptídeo apresentado na listagens de seqüência aqui, e/oué complementar a seqüência de polinucleotídeo. Um polinucleotídeo da invenção podetambém incluir um ácido nucléico que hibridiza com um polinucleotídeo descritoanteriormente, em condições altamente rigorosas substancialmente por todo o comprimentodo ácido nucléico. Um polinucleotídeo da invenção também inclui um polinucleotídeo que é,por exemplo, pelo menos 75 %, pelo menos 80 %, pelo menos 90 %, pelo menos 95 %, pelomenos 98 % ou mais idêntico àquele de um RNAt de ocorrência natural ou ácido nucléico de codificação correspondente (mas um polinucleotídeo da invenção é sem ser um RNAt deocorrência natural ou ácido nucléico de codificação correspondente), onde o RNAtreconhece um códon seletor, por exemplo, um códon de quatro bases. Polinucleotídeosartificiais que são, por exemplo, pelo menos 80 %, pelo menos 90 %, pelo menos 95 %, pelomenos 98 % ou mais idêntico a qualquer dos anteriores e/ou um polinucleotídeo que compreende uma variação conservativa de qualquer da anterior, estão também incluídas empolinucleotídeos da invenção.
Vetores que compreendem um polinucleotídeo da invenção são também umarecurso da invenção. Por exemplo, um vetor da invenção pode incluir um plasmídeo, umcosmídeo, um fago, um vírus, um vetor de expressão, e/ou similares. Uma célula quecompreende um vetor da invenção é também um recurso da invenção.
Métodos de produzir componentes de um par de O-RNAt/O-R são também recursosda invenção. Componentes produzidos por estes métodos são também um recurso dainvenção. Por exemplo, métodos de produzir pelo menos um RNAt que é ortogonal a umacélula (O-RNAt) incluem gerar uma biblioteca de RNAts mutantes; mutar um laço anticódon de cada membro da biblioteca de RNAts mutantes para permitir o reconhecimento de umcódon seletor, fornecendo dessa maneira uma biblioteca de O-RNAts potencial, e submetera seleção negativa uma primeira população de células de uma primeira espécie, onde ascélulas compreendem um membro de biblioteca de O-RNAts potencial. A seleção negativaelimina as células que compreendem um membro de biblioteca de O-RNAts potencial que é aminoacilado por um aminoacil-RNAt sintetase (RS) que é endógena à célula. Isto forneceum agrupamento de RNAts que são ortogonais às célula da primeira espécie, fornecendodessa maneira pelo menos um O-RNAt. É também fornecido um O-RNAt produzido pelosmétodos da invenção.
Em certas modalidades, os métodos compreendem adicionalmente submeter aseleção positiva uma segunda população de células da primeira espécie, onde as célulascompreendem um membro de agrupamento de RNAts que são ortogonais às célula daprimeira espécie, um aminoacil-RNAt sintetase cognato, e um marcador de seleção positiva.Usando a seleção positiva, células são selecionadas ou classificadas por aquelas célulasque compreendem um membro de agrupamento de RNAts que é aminoacilado peloaminoacil-RNAt sintetase cognato e que mostra uma resposta desejada na presença domarcador de seleção positiva, fornecendo dessa maneira um O-RNAt. Em certasmodalidades, a segunda população de células compreende células que não forameliminadas pela seleção negativa.
Métodos para identificar um aminoacil-RNAt sintetase ortogonal que carrega um O-RNAt com um aminoácido não natural são também fornecidos. Por exemplo, métodosincluem submeter uma população de células de uma primeira espécie a uma seleção, onde cada uma das células compreende: 1) um membro da pluralidade de aminoacil-RNAtsintetase (RSs), (por exemplo, a pluralidade de RSs pode incluir RSs mutante e, RSsderivados de uma espécie sem ser uma primeira espécie ou tanto RSs mutante quanto RSsderivados de uma espécie sem ser uma primeira espécie); 2) o RNAt ortogonal (O-RNAt)(por exemplo, de uma ou mais espécie); e 3) um polinucleotídeo que codifica um marcador de seleção positiva e compreende pelo menos um códon seletor.
Células (por exemplo, uma célula hospedeira) são selecionadas ou classificadaspor aquelas que apresentam uma melhoria na eficiência de supressão comparadas àscélulas que não tem, ou têm uma quantidade reduzida de membros da pluralidade de RSs.Estas células selecionadas/classificadas compreendem um RS ativo que aminoacila o O- RNAt. Um aminoacil-RNAt sintetase ortogonal identificado pelo método é também umrecurso da invenção.
Métodos de produzir uma proteína em uma célula (por exemplo, em uma célulaeubacteriana tal como um célula E. coli ou similares, ou em uma célula de levedura) tendo oaminoácido não natural em uma posição selecionada são também um recurso da invenção.Por exemplo, um método inclui crescer uma célula em um meio apropriado onde a célulacompreende um ácido nucléico que compreende pelo menos um códon seletor e codificauma proteína, fornecer o aminoácido não natural, e incorporar o aminoácido não natural naposição especificada na proteína durante a tradução do ácido nucléico com o pelo menosum códon seletor, produzindo dessa maneira a proteína. Uma célula compreende adicionalmente: um RNAt ortogonal (O-RNAt) que funciona na célula e reconhece o códonseletor; e, um aminoacil-RNAt sintetase ortogonal (O-RS) que preferencialmente aminoacilao O-RNAt com o aminoácido não natural. Uma proteína produzida por este método étambém um recurso da invenção.
A invenção também fornece composições que incluem proteínas, onde as proteínas compreendem fenilselenocisteína. Em certas modalidades, a proteína compreende umaseqüência de aminoácidos que é pelo menos 75 % idêntico àquela de uma proteínaconhecida, por exemplo, hormônio do crescimento humano, uma proteína terapêutica, umaproteína de diagnóstico, uma enzima industrial, ou porção destes. Opcionalmente, acomposição compreende um veículo farmaceuticamente aceitável.
ÁCIDO NUCLÉICO E SEQÜÊNCIAS DE POLIPEPTÍDEO E VARIANTES
Da maneira aqui descrita, a invenção fornece seqüências de polinucleotídeo quecodificam, por exemplo, O-RNAts e O-RSs1 eseqüências de aminoácido de polipeptídeo, porexemplo, O-RSs, e, por exemplo, composições, sistemas e métodos que compreendem odito polinucleotídeo ou seqüências de polipeptídeo. Exemplos das ditas seqüências, porexemplo, O-RNAt e aminoácido de O-RS e seqüência de nucleotídeos são revelados aqui(Ver figura 2). Portanto, versados na tecnologia perceberão que a invenção não estálimitada àquelas seqüências especificamente aqui recitadas, por exemplo, nos Exemplos elistagem de seqüência. Versados na tecnologia perceberão que a invenção também fornecemuitas seqüências relacionadas com as funções aqui descritas, por exemplo,polinucleotídeos e polipeptídeos que codificam variantes conservativas de um O-RS aquirevelado.
As construções e análise de espécie de sintetase ortogonal (O-RS) que sãocapazes de aminoacilar um O-RNAt cognato com fenilselenocisteína são descritos noExemplo 1. Este exemplo descreve as construções e análise da espécie O-RS que sãocapazes de incorporar o aminoácido não natural fenilselenocisteína.
A invenção fornece polipeptídeos (O-RSs) e polinucleotídeos, por exemplo,polinucleotídeos O-RNAt, que codificam O-RSs ou porções destes, oligonucleotídeosusados para isolar clones de aminoacil-RNAt sintetase, etc. Polinucleotídeos da invençãoincluem aqueles que codificam proteínas ou polipeptídeos de interesse da invenção com umou mais códons seletores. Além disso, polinucleotídeos da invenção incluem, por exemplo,um polinucleotídeo compreendendo uma seqüência de nucleotídeos apresentada em SEQID NO: 5, 7 ou 9, e um polinucleotídeo que é complementar ou que codifica uma seqüênciade polinucleotídeo destes. Um polinucleotídeo da invenção também inclui qualquerpolinucleotídeo que codifica uma seqüência de aminoácidos O-RS compreendendo SEQ IDNO: 4, 6 ou 8. Similarmente, um ácido nucléico artificial que hibridiza para umpolinucleotídeo indicado anteriormente em condições altamente rigorosas substancialmentepor todo o comprimento do ácido nucléico (e é um sem ser um polinucleotídeo de ocorrêncianatural) é um polinucleotídeo da invenção. Em uma modalidade, uma composição inclui umpolipeptídeo da invenção e um excipiente (por exemplo, tampão, água, excipientefarmaceuticamente aceitável, etc.). A invenção também fornece um anticorpo ou anti-soroespecificamente imuno-reativo com um polipeptídeo da invenção. Um polinucleotídeoartificial é um polinucleotídeo que é feito pelo homem, e não é de ocorrência natural.
Um polinucleotídeo da invenção também inclui um polinucleotídeo artificial que é,por exemplo, pelo menos 75 %, pelo menos 80 %, pelo menos 90 %, pelo menos 95 %, pelomenos 98 % ou mais idêntico àquele de um RNAt de ocorrência natural (mas é um RNAtsem ser de ocorrência natural). Um polinucleotídeo também inclui um polinucleotídeoartificial que é, por exemplo, pelo menos 75 %, pelo menos 80 %, pelo menos 90 %, pelomenos 95 %, pelo menos 98 % ou mais idêntico (mas não 100 % idêntico) àquele de umRNAt de ocorrência natural.
Em certas modalidades, um vetor (por exemplo, um plasmídeo, um cosmídeo, umfago, um vírus, etc.) compreende um polinucleotídeo da invenção. Em uma modalidade, ovetor é um vetor de expressão. Em uma outra modalidade, o vetor de expressão inclui umpromotor operável ligado a um ou mais dos polinucleotídeos da invenção. Em uma outramodalidade, uma célula compreende um vetor que inclui um polinucleotídeo da invenção.
Versados na tecnologia também percebem que muitas variantes das seqüênciasreveladas são incluídas na invenção. Por exemplo, variações conservativas das seqüênciasreveladas que rendem uma seqüência funcionalmente idêntica são incluídas na invenção.Variantes da seqüência de ácido nucléico de polinucleotídeos, em que as varianteshibridizam com pelo menos uma seqüência revelada, são consideradas incluídas nainvenção. Subseqüências exclusivas das seqüências aqui reveladas, determinadas, porexemplo, por técnicas de comparação de seqüência padrão, estão também incluídas nainvenção.
Variações Conservativas
Por causa da degeneração do código genético, "substituições silenciosas" (isto é,substituições em uma seqüência de ácido nucléico que não resultam em uma alteração emum polipeptídeo codificado) são um recurso implícito de cada seqüência de ácido nucléicoque codifica uma seqüência de aminoácido. Similarmente, "substituições de aminoácidoconservativas", onde um ou um número limitado de aminoácidos em uma seqüência deaminoácidos é substituído com aminoácidos diferentes com propriedades altamentesimilares, é também imediatamente identificado como altamente similar a uma construçãorevelada. Tais variações conservativas de cada seqüência revelada são um recurso dapresente invenção.
"Variações conservativas" de uma seqüência de ácido nucléico particular referem-se àqueles ácidos nucléicos que codificam seqüências de aminoácido idênticas ouessencialmente idênticas, ou, onde o ácido nucléico não codifica uma seqüência deaminoácido, com seqüências essencialmente idênticas. Versados na tecnologiareconhecerão que substituições individuais, deleções ou adições que alteram, adicionam oudeletam um aminoácido simples ou uma pequena porcentagem de aminoácidos (tipicamentemenos que 5 %, mais tipicamente menos que 4 %, 2 % ou 1 %) em uma seqüênciacodificada são "variações conservativamente modificadas" onde a alterações resultam nadeleção de um aminoácido, adição de um aminoácido, ou substituição de um aminoácidocom um aminoácido quimicamente similar. Assim, "variações conservativas" de umaseqüência de polipeptídeo listada da presente invenção incluem substituições de umapequena porcentagem, tipicamente menos que 5 %, mais tipicamente menos que 2 % ou 1%, dosaminoácidos da seqüência de polipeptídeo, com um aminoácido do mesmo grupo de substituição conservativa. Finalmente, a adição de seqüências que não alteram a atividadecodificada de uma molécula de ácido nucléico, tal como a adição de uma seqüência nãofuncional, é uma variação conservativa do ácido nucléico básico.
Tabelas de substituição conservativa fornecendo aminoácidos funcionalmentesimilares são bem conhecidas na tecnologia, onde um resíduo de aminoácido é substituído por um outro resíduo de aminoácido tendo propriedades químicas similares (por exemplo,cadeias laterais aromáticas ou cadeias laterais positivamente carregadas), e portanto nãomuda substancialmente as propriedades funcionais da molécula de polipeptídeo. Osseguintes grupos de exemplo apresentados que contêm aminoácidos naturais depropriedades químicas similares, onde substituições dentro de um grupo é uma "substituição conservativa".
Substituições de aminoácido conservativas
<table>table see original document page 50</column></row><table>
HIBRIDIZACÃO DE ÁCIDO NUCLÉICO.
Hibridização comparativa pode ser usada para identificar ácidos nucléicos dainvenção, incluindo variações conservativas de ácidos nucléicos da invenção, e este método de hibridização comparativa é um método preferido de ácidos nucléicos distinguíveis dainvenção. Além disso, ácidos nucléicos alvos que hibridizam com um ácido nucléicorepresentado pela SEQ ID NO: 5, 7, 9 ou 11, em condições de alto, ultra alto e ultra ultra altorigor são um recurso da invenção. Exemplos de tais ácidos nucléicos incluem aqueles comuma ou umas poucas substituições de ácido nucléico silenciosas ou conservativas,comparadas a uma dada seqüência de ácido nucléico.
Acredita-se que um ácido nucléico teste hibridiza especificamente com um ácidonucléico sonda quando ele hibridiza pelo menos 50 %, bem como a sonda para o alvocomplementar perfeitamente pareado, isto é, com uma razão sinal para ruído alta de pelomenos a metade da hibridização da sonda para o alvo em condições nas quais a sondaperfeitamente pareada se liga ao alvo complementar perfeitamente pareado com uma razãosinal para ruído que é pelo menos cerca de 5x - 10x tão alta quanto aquela observada parahibridização com qualquer dos ácidos nucléicos alvos não pareados.
Ácidos nucléicos "hibridizam" quando eles associam, tipicamente em solução.Ácidos nucléicos hibridizam em virtude de uma variedade de forças físico-químicas bemcaracterizadas, tais como ligação de hidrogênio, exclusão de solvente, empilhamento debase e similares. Um guia abrangente para a hibridização de ácidos nucléicos é encontradoem Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology—Hibridization whith Acid nucieic Probes, Part I, Chapter 2, "Overview of Principies ofHibridization and the Estrategy of Acid nucieic Probes Assays," (Elsevier, New York), bemcomo em Current Protocols in Molecular Biology, Ausubel et ai, eds., Current Protocols, ajoint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc.,(suplementado em 2004); and Hames and Higgins (1995), Gene Probes 1 and Gene Probes2, ambos de IRL Press at Oxford University Press, Oxford, England, fornecem detalhes nassínteses, marcação, detecção e quantificação de DNA e RNA, incluindo oligonucleotídeos.
Um exemplo de condições de hibridização rigorosa para hibridização de ácidosnucléicos complementares que têm mais do que 100 resíduos complementares em um filtroem um Southern ou northern blot é 50 % formalina com 1 mg de heparina a 42 0C1 com ahibridização sendo realizada por toda a noite. Um exemplo de condições de lavagemrigorosa é uma lavagem 0,2 χ SSCat 65 0C por 15 minutos (Ver, Sambrook et al. para umadescrição de tampão SSC; Sambrook et ai, Molecular Cloning - A Laboratory Manual (3rdEd.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor1 New York, 2001).Freqüentemente a lavagem de alta rigorosidade é precedida por uma lavagem de baixarigorosidade para remover sinal de sonda de fundo. Um exemplo de lavagem de baixarigorosidade é 2 χ SSC a 40 cC por 15 minutos. Em geral, uma razão sinal para ruído de 5 χ(ou maior) do que aquela observada por uma sonda não relacionada na ensaio dehibridização particular indica detecção de uma hibridização específica.
"Condições de lavagem de hibridização rigorosa" no contexto de hibridização deÁcido nucléico experimentam tais como hibridizações Southern e northern são dependentesde seqüência, e são diferente em parâmetros ambientais diferentes. Um guia abrangentepara a hibridização de ácidos nucléicos é encontrado em Tijssen (1993) LaboratoryTechniques in Biochemistry and Molecular Biology—Hibridization whith Acid nucieic Probes,Part I1 Chapter 2, "Overview of Príncipes of Hibridization and the Estrategy of Acid nucleicProbe Assay," (Elsevier, New York); e em Hames and Higgins (1995), Gene Probes 1 eGene Probes 2, ambos de IRL Press at Oxford University Press, Oxford, England.Condições de hibridização e lavagem rigorosa podem facilmente ser determinadas empiricamente por qualquer ácido nucléico teste. Por exemplo, na determinação decondições de hibridização e lavagem rigorosa, as condições de hibridização e lavagem sãogradualmente aumentadas (por exemplo, aumentando a temperatura, diminuindo aconcentração de sal, aumentando concentração de detergente e/ou aumentando aconcentração de solventes orgânicos tal como formalina na hibridização ou lavagem), até que um conjunto selecionado de critérios seja alcançado. Por exemplo, em condições dehibridização e lavagem altamente rigorosas, as condições de hibridização e lavagem sãogradualmente aumentadas até que uma sonda se ligue a um alvo perfeitamentecomplementar pareado com uma razão sinal para ruído que é pelo menos 5x maior que aobservada para hibridização da sonda com um alvo não pareado.
Condições "muito rigorosas" são selecionadas iguais ao ponto de fusão (Tm) poruma sonda particular. A Tm é a temperatura (em concentração iônica e pH definidos) na qual50 % da seqüência teste hibridiza com uma sonda perfeitamente pareada. Com ospropósitos da presente invenção, de um modo geral, condições de hibridização e lavagem"altamente rigorosas" são selecionadas em cerca de 5 cC menor que a Tm para a seqüênciaespecífica a uma concentração iônica e pH definidos.
"Condições de ultra alta rigorosidade" de hibridização e lavagem são aquelas nasquais a rigorosidade das condições de hibridização e lavagem são aumentadas até que arazão sinal para ruído para ligação da sonda para o ácido nucléico alvo perfeitamentecomplementar pareado é pelo menos 10 χ maior do a observada para hibridização com qualquer dos ácidos nucléicos alvos não pareados. Um ácido nucléico alvo que hibridizacom uma sonda em tais condições, com uma razão sinal para ruído de pelo menos /4 quedo ácido nucléico alvo complementar perfeitamente pareado se liga à sonda em condiçõesde ultra-alta rigorosidade.
Similarmente, níveis de rigorosidade ainda maiores podem ser determinadosaumentando gradualmente as condições de hibridização e/ou lavagem do ensaio dehibridização relevante. Por exemplo, aqueles nos quais a rigorosidade das condições dehibridização e lavagem são aumentadas até que a razão sinal para ruído para ligação dasonda com o ácido nucléico alvo complementar perfeitamente pareado é pelo menos 10 x,20 X, 50 X, 100 X, ou 500 X ou mais maior que a observada para hibridização com qualquer dos ácidos nucléicos alvos não pareados. Um ácido nucléico alvo que hibridiza com umasonda em tais condições, com uma razão sinal para ruído de pelo menos 1/2 que do ácidonucléico alvo complementar perfeitamente pareado se liga a sonda em condições de ultra-ultra-alta rigorosidade.
Ácidos nucléicos que não hibridizam uns com os outros em condições rigorosas sãoainda substancialmente idênticas se os polipeptídeos com o qual eles codificam foremsubstancialmente idênticos. Isto ocorre, por exemplo, quando uma cópia de um ácido nucléico é criada usando a degeneração de códon máxima permitida pelo código genético.
Subseqüências Exclusivas
Em alguns aspectos, a invenção fornece um ácido nucléico que compreende umasubseqüência exclusiva em um ácido nucléico selecionado das seqüências de O-RNAts eO-RSs aqui reveladas. A subseqüência exclusiva é exclusiva comparada a um ácido nucléico correspondente a qualquer seqüência de ácido nucléico O-RNAt ou O-RSconhecida. O alinhamento pode ser realizado usando, por exemplo, o BLAST ajustado nosparâmetros padrões. Qualquer subseqüência exclusiva é usada, por exemplo, como umasonda para identificar os ácidos nucléicos da invenção ou ácidos nucléicos relacionados.
Similarmente, a invenção inclui um polipeptídeo que compreende uma subseqüência exclusiva em um polipeptídeo selecionado das seqüências de O-RSs aquireveladas. Aqui, a subseqüência exclusiva é exclusiva comparada a um polipeptídeocorrespondente a qualquer seqüência de polipeptídeo conhecida.
A invenção também fornece ácidos nucléicos alvos que hibridizam em condiçõesrigorosas com um oligonucleotídeo de codificação exclusiva que codifica uma subseqüência exclusiva em um polipeptídeo selecionado das seqüências do O-RSs nas quais asubseqüência exclusiva é exclusiva, comparada a um polipeptídeo correspondente aqualquer dos polipeptídeos controle (por exemplo, seqüências parentais das quais sintetaseda invenção foi derivada, por exemplo, por mutação). Seqüências exclusivas sãodeterminadas conforme notado anteriormente.
Comparação de seqüência, identidade e homoloqiaOs termos "idêntico" ou "porcentagem de identidade" no contexto de duas ou maisseqüências de ácidos nucléicos ou polipeptídeos refere-se a duas ou mais seqüências ousubseqüências que são as mesmas ou têm uma porcentagem especificada de resíduo deaminoácidos ou nucleotídeos que são os mesmos, quando comparados e alinhados paracorrespondência máxima, medidos usando um dos algoritmos de comparação de seqüênciadescritos a seguir (ou outros algoritmos disponíveis pelos versados na tecnologia), ou porinspeção visual.
A frase "substancialmente idêntico", no contexto de dois ácidos nucléicos oupolipeptídeos (por exemplo, DNAs que codificam um O-RNAt ou O-RS, ou a seqüência de aminoácidos de um O-RS) refere-se a duas ou mais seqüências ou subseqüências que têmpelo menos cerca de 60 %, cerca de 80 %, cerca de 90-95 %, cerca de 98 %, cerca de 99 %ou mais identidade de nucleotídeo ou resíduo de aminoácido, quando comparadas ealinhadas para correspondência máxima, medidas usando um algoritmo de comparação deseqüência ou por inspeção visual. Tais seqüências "substancialmente idênticas" sãotipicamente consideradas "homólogas," sem referência a origem real. Preferivelmente1 a"identidade substancial" existe em uma região das seqüências que é pelo menos cerca de50 resíduos em comprimento, mais preferivelmente em uma região de pelo menos cerca de100 resíduos, e mais preferivelmente, as seqüências são substancialmente idênticas empelo menos cerca de 150 resíduos, ou no comprimento total das duas seqüênciascomparadas.
Seqüências de proteínas e/ou proteína são "homólogas" quando elas sãoderivadas, naturalmente ou artificialmente, de uma seqüência de proteína ou proteínaancestral comum. Similarmente, ácidos nucléicos e/ou seqüência de ácidos nucléicos sãohomólogas quando elas são derivadas, naturalmente ou artificialmente, de um ácidonucléico ou seqüência de ácido nucléico ancestral comum. Por exemplo, qualquer ácidonucléico de ocorrência natural pode ser modificado por qualquer método de mutagênesedisponível para incluir um ou mais códon seletor. Quando expresso, este ácido nucléicomutagenizado codifica um polipeptídeo que compreende um ou mais aminoácidos nãonaturais. O processo de mutação pode, é claro, adicionalmente alterar um ou mais códonspadrões, carregando igualmente dessa maneira um ou mais aminoácidos padrões naproteína mutante resultante. Homologia é de um modo geral inferido da similaridade deseqüência entre dois ou mais ácidos nucléicos ou proteínas (ou seqüências destes). Aporcentagem precisa de similaridade entre seqüências que é usada no estabelecimento dahomologia varia com o ácido nucléico e proteína em questão, mas apenas 25 % desimilaridade de seqüência são rotineiramente usados para estabelecer a homologia. Níveisde similaridade de seqüência maiores, por exemplo, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %,90 %, 95 %, ou 99 % ou mais, podem também ser usados para estabelecer a homologia.Métodos para determinar as porcentagens de similaridade de seqüência (por exemplo,BLASTP e BLASTN usando parâmetros padrões) são aqui descritos e estão de um modogeral disponíveis.
Para comparação de seqüência e determinação da homologia, uma seqüência age tipicamente como uma seqüência de referência na qual seqüências teste são comparadas.Durante o uso de um algoritmo de comparação de seqüência, teste e seqüência dereferências são alimentados em um computador, subseqüências coordenadas sãodesignadas, se necessário, e parâmetros do programa de algoritmo de seqüência sãodesignados. O algoritmo de comparação de seqüência em seguida calcula a porcentagemde identidade de seqüência para a(s) seqüência(s) teste(s) com relação a seqüência dereferência, baseado nos parâmetros de programa designados.
Alinhamento de seqüências ideal para comparação pode ser conduzido, porexemplo, pelo algoritmo de homologia local de Smith and Waterman1 Adv. Appl. Math. 2:482(1981), pelo algoritmo de alinhamento de homologia de Needleman and Wunsch, J. Mol.Biol. 48:443 (1970), pela pesquisa para método de similaridade de Pearson e Lipman, Proc.Nat'l. Acad. Sei. USA 85:2444 (1988), pelas implementações computadorizadas destes algoritmos (GAP, BESTFIT, FASTA, e TFASTA em Wisconsin Genetics Software Package,Genetics Computer Group, 575 Science Dr., Madison, Wl), ou por inspeção visual (Ver deum modo geral Current Protocols In Molecular Biology, Ausubel et ai, eds., CurrentProtocols, a joint venture da Greene Publishing Associates, Inc. and John Wiley & Sons,Inc., (suplementado em 2004).
Um exemplo de um algoritmo que é adequado para determinar a porcentagem deidentidade de seqüência e similaridade de seqüência é o algoritmo BLAST, que é descritoem Altschul et ai, J. Mol. Biol., 215:403-410 (1990). O software para realizar análise BLASTé publicamente disponível pela National Center for Biotechnology Information (Ver oendereço de rede NCBI). Este algoritmo envolve primeiro identificar pares de seqüência dealta pontuação (HSPs) identificando palavras pequenas de comprimento W na seqüênciaconsulta, que tanto pareia quanto satisfaz alguns pontuações limites de valor positivo Tquando alinhados com um palavra do mesmo comprimento em uma seqüência da base dedados. T é referido como o limite de pontuações de palavra vizinha (Altschul et al., (1990) J.Mol. Biol., 215:403-410). Estas colisões de palavra vizinha inicial agem como sementes parainiciar pesquisas para encontrar conteúdos de HSPs maiores contendo-as. As colisões depalavra são em seguida estendidas em ambas direções ao longo de cada seqüência até queas pontuações de alinhamento cumulativo possam ser aumentadas. As pontuaçõescumulativas são calculadas usando, para seqüência de nucleotídeos, os parâmetros M(pontuações para trás para um par de resíduos pareados; sempre > 0) e N (pontuações depenalidade para resíduos não pareados; sempre < 0). Para seqüências de aminoácidos,uma matriz de pontuação é usada para calcular as pontuações cumulativas. A extensão dascolisões de palavra em cada direção pára quando: as pontuações de alinhamentocumulativas caem em uma quantidade X de seu valor máximo obtido; a pontuaçãocumulativa vai de zero ou menos, em virtude do acúmulo de um ou mais alinhamentos deresíduo de pontuação negativa; ou a extremidade de qualquer seqüência é atingida. Osparâmetros e algoritmo BLAST W, T1 e X determinam a sensibilidade e velocidade doalinhamento. O programa BLASTN (para seqüência de nucleotídeos) usa como padrões umcomprimento de palavra (W) de 11, uma expectativa (E) de 10, um corte de 100, M=5, N=-4,e uma comparação de ambas fitas. Para seqüências de aminoácido, o programa BLASTPusa como padrões um comprimento de palavra (W) de 3, um expectativa (E) de 10, e amatriz de pontuação BLOSUM62 (Ver Henikoff and Henikoff (1989) Proc. Natl. Acad. Sei.USA 89:10915).Além de calcular a porcentagem de identidade de seqüência, o algoritmo BLASTtambém realiza uma análise estatística da similaridade entre duas seqüências (Ver, porexemplo, Karlin and Altschul, Proc. Nat'l. Acad. Sei. USA 90:5873-5787 (1993)). Umamedida de similaridade fornecida pelo algoritmo BLAST é a probabilidade da soma mínima(P(N))1 que fornece uma indicação da probabilidade pela qual um pareamento entre duasseqüências de nucleotídeo ou aminoácido ocorreria por chance. Por exemplo, um ácidonucléico é considerado similar a uma seqüência de referência se a probabilidade da somamínima em uma comparação do ácido nucléico teste com a ácido nucléico de referência formenos que cerca de 0,1, mais preferivelmente menos que cerca de 0,01, e mais preferivelmente menos que cerca de 0,001.
Mutaqênese e Outras Técnicas de Biologia Molecular
Polinucleotídeo e polipeptídeos da invenção usados na invenção podem sermanipulados usando técnicas biológicas moleculares. Textos gerais que descrevem técnicasbiológicas moleculares incluem Berger and Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology, volume 152 (1987), Academic Press, Inc., San Diego, CA;Sambrook et ai, Molecular Cloning - A Laboratory Manual (3rd Ed.), Vol. 1-3, Cold SpringHarbor Laboratory, Cold Spring Harbor, New York, 2001 and Current Protocols In MolecularBiology, Ausubel et al., eds., Current Protocols, uma joint venture da Greene PublishingAssociates, Inc. and John Wiley & Sons, Inc., (suplementado em 2004)). Estes textos descrevem mutagênese, o uso de vetores, promotores e muitos outros tópicos relevantesrelacionados por exemplo a geração de genes que incluem códons seletores para produçãode proteínas que incluem aminoácidos não naturais, RNAts ortogonais, sintetase ortogonal,e seus pares.
Vários tipos de mutagênese são usados na invenção, por exemplo, para mutar moléculas de RNAts, para produzir bibliotecas de RNAts, para produzir bibliotecas desintetase, para inserir códons seletores que codificam aminoácidos não naturais em umaproteína ou polipeptídeo de interesse. Eles incluem, mas sem limitações, sítio-dirigido,mutagênese de ponto aleatório, recombinação homóloga, embaralhamento de DNA ououtros métodos de mutagênese recursivos, construções quiméricas, mutagênese usando uracila contendo gabaritos, mutagênese direcionado a oligonucleotídeo, mutagênese deDNA modificado por fosforotioato, mutagênese usando DNA duplo aberto ou similares, ouqualquer combinação destes. Métodos adequados adicionais incluem reparo não pareadodo ponto, mutagênese usando cepas hospedeiras deficientes de reparo, restrição-seleção erestrição-purificação, mutagênese de deleção, mutagênese por síntese de gene total, reparo de ruptura da fita dupla, e similares. Mutagênese, por exemplo, envolvendo construçõesquiméricas, é também incluída na presente invenção. Em uma modalidade, mutagênesepode ser guiada por informação conhecida da molécula de ocorrência natural ou moléculade ocorrência natural alterada ou mutada, por exemplo, seqüência, comparações deseqüências, propriedades físicas, estrutura cristalina ou similares.
Células hospedeiras são geneticamente projetadas por engenharia (por exemplo,transformadas, convertidas ou transfectadas) com os polinucleotídeos da invenção ou construções que incluem um polinucleotídeo da invenção, por exemplo, um vetor dainvenção, que pode ser, por exemplo, um vetor de clonagem ou um vetor de expressão. Porexemplo, as regiões que codificam o RNAt ortogonal, o RNAt sintetase ortogonal, e aproteína a ser derivatizada são operáveis ligados aos elementos de controle de expressãode gene que são funcionais na célula hospedeira desejada. Vetores típicos contêm terminadores de transcrição e tradução, seqüências de iniciação de transcrição e tradução,e promotores usados para regulação da expressão do ácido nucléico alvo particular. Osvetores opcionalmente compreendem cassetes de expressão genérica contendo pelo menosuma seqüência terminadora independente, replicação permitindo seqüências do cassete emeucariotos, ou procariotos, ou ambos (por exemplo, vetores de transferência) e marcador de seleções tanto para sistemas procarióticos quanto eucarióticos. Vetores são adequadospara replicação e/ou integração em procariotos, eucariotos, ou preferível mente em ambos.Ver GiIIman and Smith, Gene 8:81 (1979); Roberts et ai, Nature. 328:731 (1987); Schneideret ai, Protein Expr. Puff. 6435:10 (1995); Current Protocols In Molecular Biology, Ausubel etai, Eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. ans John Wiley & Sons, Inc., (suplementado em 2004); Sambrook et ai, Molecular Cloning - ALaboratory Manual (3rd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor,New York, 2001; e Berger and Kimmel, Guide to Molecular Cloning Technics, Methods inEnzymology, volume 152 (1987), Academic Press, Inc., San Diego, CA. O vetor pode ser,por exemplo, na forma de um plasmídeo, uma bactéria, um vírus, um polinucleotídeo descoberto, ou um polinucleotídeo conjugado. Os vetores são introduzidos nas células e/oumicroorganismos por métodos padrões incluindo eletroporação (Fromm et al., Proc. Natl.Acad. Sei. USA 82, 5824 (1985), infection by viral vectors, high velocity ballistic penetrationby small particles whith the acid nucleic either within the matrix of small beads or particles, oron the surface (Klein et ai, Nature 327, 70-73 (1987)), e/ou similares.
Um sistema de plasmídeo simples altamente eficiente e versátil foi desenvolvidopara incorporação de sítio-específico de aminoácidos não naturais nas proteínas emresposta ao códon de parada âmbar (UAG) em E. coli. No sistema inédito, o par desupressor M. jannaschii RNAttyr(CUA) e tirosil-RNAt sintetase são codificados em umplasmídeo simples, que é compatível com a maioria dos vetores de expressão E. coli.Operon RNAt monocistrônico sob o controle de promotor e terminador proK foi construídopor processamento de estrutura secundária e RNAt ideal. Introdução de uma forma mutadade promotor glnS para a sintetase resultou em um aumento significativo tanto na eficiênciade supressão quanto fidelidade. Aumento na eficiência de supressão foi também obtido pormúltiplas cópias de gene RNAt, bem como por uma mutação específica (D286R) em umasintetase (Kobayashi et al., "Structural basis for RNAt ortogonal especificities of tirosil-,RNAsynthetases for genetic code expansion," Nat. Struct. Biol., 10(6):425-432 [2003]). Ageneralidade do sistema otimizado foi também demonstrado por incorporação altamenteeficiente e precisa de diversos aminoácidos não naturais diferentes, cujas utilidadesexclusivas no estudo da estrutura e função de proteína foram previamente demonstradas.
Um catálogo de Bactérias e Bacteriófagos usados para clonagem é fornecido, porexemplo, pelo ATCC, por exemplo, The ATCC Catalogue of Bactéria and Bacteriophage(1996) Gherna et al. (eds) publicado pelo ATCC. Procedimentos básicos adicionais paraseqüenciamento, clonagem e outros aspectos de biologia molecular e consideraçõesteóricas fundamentais são também encontrados em Sambrook et al., Molecular Cloning - ALaboratory Manual (3rd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor,New York, 2001; Current Protocols In Molecular Biology, Ausubel et al., eds., CurrentProtocols, uma joint venture da Greene Publishing Associates, Inc. and John Wiley & Sons,Inc., (suplementado em 2004); e em Watson et al. (1992) Recombinant DNA Second EditionScientific American Books, NY. Além disso, essencialmente qualquer ácido nucléico (equalquer ácido nucléico virtualmente marcado, quer padrão ou não ou padrão) pode serordenado de forma customizada ou padrão a partir de qualquer uma de uma variedade defontes comerciais, tal como o Midland Certified Reagent Company (Midland, TX), The GreatAmerican Gene Company (Ramona, CA), ExpressGen Inc. (Chicago, IL), OperonTechnologies Inc. (Alameda, CA) e muitos outros.
As células hospedeiras projetadas por engenharia podem ser cultivadas em meionutriente convencional modificado da maneira apropriada para tais atividades, por exemplo,como classificar etapas, ativar promotores ou selecionar transformantes. Estas célulaspodem opcionalmente ser cultivadas em organismos transgênicos. Outras referênciasusadas, por exemplo, para isolamento e cultura de célula (por exemplo, para isolamento deácido nucléico subseqüente) incluem Freshney (1994) Culture of Animal Cells. a Manual ofBasic Technique. third edition, Wiley- Liss, New York e as referências aqui citadas; Payne etal. (1992) Cell of plant and Tissue Culture in Liguid Sistems John Wiley & Sons, Inc. NewYork, NY; Gamborg and Phillips (eds) (1995) Cell of plant. Tissue and Organ Culture:Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg New York) eAtlas and Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, BocaRaton, FL.
PROTEÍNAS E POLIPEPTÍDEOS DE INTERESSE
Métodos de produzir uma proteína em uma célula com um aminoácido não naturalem um posição especificada são também um recurso da invenção. Por exemplo, um métodoinclui crescer, em um meio apropriado, a célula, onde a célula compreende um ácidonucléico que compreende pelo menos um códon seletor e codifica uma proteína; e fornecero aminoácido não natural, onde a célula compreende adicionalmente: um RNAt ortogonal(O-RNAt) que funciona na célula e reconhece o códon seletor; e, um aminoacil-RNAt sintetase ortogonal (O-RS) que preferencialmente aminoacila o O-RNAt com o aminoácidonão natural. Uma proteína produzida por este método é também um recurso da invenção.
Em certas modalidades, o O-RS compreende uma predisposição para aaminoacilação do O-RNAt cognato em qualquer RNAt endógeno em um sistema deexpressão. Uma razão relativa entre O-RNAt e RNAt endógeno que é carregado pelo O-RS1quando o O-RNAt e O-RS estão presentes em concentrações molares iguais, é maior que1:1, preferivelmente pelo menos cerca de 2:1, mais preferivelmente 5:1, ainda maispreferivelmente 10:1, acima de tudo mais preferivelmente 20:1, ainda mais preferivelmente50:1, acima de tudo mais preferivelmente 75:1, ainda mais preferivelmente 95:1, 98:1, 99:1,100:1, 500:1, 1,000:1, 5,000:1 ou maior.
A invenção também fornece composições que incluem proteínas, onde as proteínascompreendem um aminoácido não natural. Em certas modalidades, a proteína compreendeuma seqüência de aminoácidos que é pelo menos 75 % idêntica àquela de uma proteínaterapêutica, uma proteína de diagnóstico, uma enzima industrial, ou porção destas.
As composições da invenção e composições feitas pelos métodos da invençãoopcionalmente são em uma célula. Os pares de O-RNAt/O-RS ou componentes individuaisda invenção podem em seguida ser usados em um maquinário de tradução do sistemahospedeiro, que resulta em um aminoácido não natural sendo incorporado em uma proteína.Publicação Internacional 2004/094593, depositado em 16 de abril de 2004, intitulado"EXPANDING THE EUCARYOTIC GENETIC CODE", e WO 2002/085923, intitulado "INVIVO INCORPORATION OF UNNNATURAL AMINO ACIDS," descrevem este processo, eestão incorporados aqui pela referência. Por exemplo, quando um par de O-RNAt/O-R éintroduzido em um hospedeiro, por exemplo, uma célula Escherichia coli, o par leva aincorporação in vivo de um aminoácido não natural tal como fenilselenocisteína em umaproteína em resposta a um códon seletor. O aminoácido não natural que é adicionado ao sistema pode ser um aminoácido sintético, tal como um derivado de um fenilalanina outirosina, que pode ser exogenamente adicionado ao meio e crescimento. Opcionalmente, ascomposições da presente invenção podem ser em um sistema de tradução in vitro, ou emum sistema(s) in vivo.
Uma célula da invenção fornece a capacidade de sintetizar proteínas quecompreendem aminoácidos não naturais usados em grandes quantidades. Em algunsaspectos, a composição opcionalmente inclui, por exemplo, pelo menos 10 microgramas,pelo menos 50 microgramas, pelo menos 75 microgramas, pelo menos 100 microgramas,pelo menos 200 microgramas, pelo menos 250 microgramas, pelo menos 500 microgramas,pelo menos 1 miligrama, pelo menos 10 miligramas ou mais da proteína que compreendeum aminoácido não natural, ou uma quantidade que pode ser obtida com métodos deprodução de proteína in vivo (detalhes na produção e purificação da proteína recombinantesão fornecidos aqui). Em um outro aspecto, a proteína está opcionalmente presente nacomposição a uma concentração de, por exemplo, .pelo menos 10 microgramas de proteínapor litro, pelo menos 50 microgramas de proteína por litro, pelo menos 75 microgramas deproteína por litro, pelo menos 100 microgramas de proteína por litro, pelo menos 200microgramas de proteína por litro, pelo menos 250 microgramas de proteína por litro, pelo menos 500 microgramas de proteína por litro, pelo menos 1 miligrama de proteína por litro,ou pelo menos 10 miligramas de proteína por litro ou mais, por exemplo, em um Iisado decelular, um tampão, um tampão farmacêutico, ou outras suspensões líquidas (por exemplo,em um volume, por exemplo, de qualquer valor a partir de cerca de 1 nL a cerca de 100 L).A produção de grandes quantidades (por exemplo, maior que aquela tipicamente possívelcom outros métodos, por exemplo, tradução in vitro) de uma proteína em uma célulaincluindo pelo menos um aminoácido não natural é um recurso da invenção.
A incorporação de um aminoácido não natural pode ser feita, por exemplo, paraadequar mudanças em estrutura e/ou função da proteína, por exemplo, mudar o tamanho,acidez, nucleofilicidade, ligação de hidrogênio, hidrofobicidade, acessibilidade de sítios alvos de protease, alvejar uma fração (por exemplo, para um arranjo de proteína), incorporação demarcadores ou grupos reativos, etc. Proteínas que incluem um aminoácido não naturalpodem propriedades físicas ou catalíticas melhores ou ainda totalmente novas. Porexemplo, as propriedades seguintes são opcionalmente modificadas pela inclusão de umaminoácido não natural em uma proteína: toxicidade, biodistribuição, propriedadesestruturais, propriedades espectroscópicas, propriedades químicas e/ou fotoquímicas,capacidade catalítica, meia-vida (por exemplo, meia-vida do soro), capacidade de reagircom outras moléculas, por exemplo, covalente ou não covalentemente, e similares. Ascomposições incluindo proteínas que incluem pelo menos um aminoácido não natural sãousadas, por exemplo, para novas terapêuticas, diagnósticos, enzimas catalíticas, enzimasindustriais, proteínas de ligação (por exemplo, anticorpos), e por exemplo, o estudo deestrutura e função da proteína. Ver, por exemplo, Dougherty, (2000) Unnnaturals AminoAcids as Probes of Protein Estruture and Funtion, Current Opinion in Chemical Bioloqy.4:645-652.
Em alguns aspectos da invenção, uma composição inclui pelo menos uma proteína com pelo menos um, por exemplo, pelo menos dois, pelo menos três, pelo menos quatro,pelo menos cinco, pelo menos seis, pelo menos sete, pelo menos oito, pelo menos nove, oupelo menos dez ou mais aminoácidos não naturais. Os aminoácidos não naturais podem seros mesmos ou diferente, por exemplo, pode haver 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 ou maisdiferentes sítios na proteína que compreendem 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 ou maisaminoácidos não naturais diferentes. Em um outro aspecto, uma composição inclui umaproteína com pelo menos um, mas não todos, de um aminoácido particular presente naproteína é um aminoácido não natural. Para uma dada proteína com mais que umaminoácidos não naturais, os aminoácidos não naturais podem ser idênticos ou diferentes(por exemplo, a proteína pode incluir dois ou mais diferente tipos de aminoácidos nãonaturais, ou pode incluir dois do mesmo aminoácido não natural). Para uma dada proteínacom mais que dois aminoácidos não naturais, os aminoácidos não naturais podem ser osmesmos, diferentes, ou um combinação de um aminoácido não natural múltiplo do mesmotipo com pelo menos um aminoácido não natural diferente.
Essencialmente qualquer proteína (ou porção desta) que inclui um aminoácido nãonatural (e qualquer ácido nucléico de codificação correspondente, por exemplo, que incluium ou mais códons seletores) pode ser produzida usando as composições e métodos aqui.Nenhuma tentativa é feita para identificar as centenas de milhares de proteínas conhecidas,qualquer das quais pode ser modificada para incluir um ou mais aminoácidos não naturais,por exemplo, qualquer método de mutação adequando disponível para incluir um ou maiscódons seletores apropriados em um sistema de tradução relevante. Repositórios deseqüência comuns para proteínas conhecidas incluem GenBank EMBL, DDBJ e o NCBI.Outros repositórios podem facilmente ser identificados pesquisando na Internet.
Tipicamente, a proteínas são, por exemplo, pelo menos 60 %, pelo menos 70 %,pelo menos 75 %, pelo menos 80 %, pelo menos 90 %, pelo menos 95 %, ou pelo menos 99% ou mais idênticas a qualquer proteína disponível (por exemplo, uma proteína terapêutica,uma proteína de diagnóstico, uma enzima industrial, ou porção destas, e similares), e elascompreendem um ou mais aminoácidos não naturais. Exemplos de proteínas terapêuticas,de diagnóstico e outras proteínas que podem ser modificadas para compreender um oumais aminoácidos não naturais podem ser encontrados, mas sem limitações, emPublicações Internacionais 2004/094593, depositado em 16 de abril de 2004, intitulado"EXPANDING THE EUCARYOTIC GENETIC CODE", e WO 2002/085923, intitulado "INVIVO INCORPORATION OF UNNATURAL AMINO ACIDS". Exemplos de proteínasterapêuticas, de diagnóstico, e outras proteínas que podem ser modificados paracompreender um ou mais aminoácidos não naturais incluem, mas sem limitações, porexemplo, hirudina, hormônio do crescimento humano, RAS, alfa-1 antitripsina, Angiostatina,fator Antiemolítico, anticorpos (mais detalhes nos anticorpos são encontrados a seguir),Apolipoproteína, Apoproteína, fator Atrial natriurético, polipeptídeo natriurético Atrial,peptídeos Atriais, C-X-C quimiocinas (por exemplo, T39765, NAP-2, ENA-78, Gro-a, Gro-b,Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG), Calcitonina, quimiocinas CC (por exemplo,proteína quimioatrativa do monócito-1, proteína quimioatrativa do monócito-2, Proteínaquimioatrativa do monócito-3, Proteína inflamatória do monócito-1 alfa, proteína inflamatóriado monócito-1 beta, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262),Iigante CD40, Ligante C-kit, Colágeno, fator estimulante de Colônia (CSF), fator do Complemento 5a, inibidor do Complemento, receptor do Complemento 1, citocinas, (porexemplo, Peptídeo-78 de ativação do Neutrófilo epitelial, GROa/MGSA, GRO0, GROy, MIP-1a, MIP-1Ó, MCP-1), Fator de crescimento epidérmico (EGF), Eritropoietina ("EPO"),Toxinas esfoliantes A e B, Fator IX, Fator VII, Fator VIII, Fator X, Fator do crescimentoFibroblasto (FGF)1 Fibrinogênio, Fibronectina, G-CSF, GM-CSF, Glucocerebrosidase,Gonadotropina, fatores do crescimento, proteínas Hedgehog (por exemplo, Sonic, Indian,Desert), Hemoglobina, Fator do crescimento Hepatócito (HGF), hirudina, Albumina séricahumana, Insulina, Fator do crescimento tipo Insulina (IGF), interferons (por exemplo, IFN-σ,IFN-/?, IFN-y), interleucinas (por exemplo, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, etc.), Fator do crescimento Queratinócito (KGF), Lactoferrina, fator inibitório de leucemia, Luciferase, Neurturina, fator inibitório de Neutrófilo (NIP)1 oncostatina M,proteína Osteogênica, Hormônio do paratireóide, PD-ECSF, PDGF1 hormônios do peptídeo(por exemplo, Hormônio do crescimento humano), Pleiotropino, Proteína A, Proteína G,exotoxinas Pirogênicas A, B1 e C1 Relaxina1 Renina1 SCF, receptor I do complementoSolúvel, I-CAM 1 Solúvel, receptores de interleucina Solúvel (IL-1, 2, 3, 4, 5, 6, 7, 9, 10, 11,12, 13, 14, 15), receptor de TNF Solúvel, Somatomedina, Somatostatina, Somatotropina,Estreptoquinase, Superantigenos1 isto é, enterotoxinas Estafilococais (SEA1 SEB, SEC1,SEC2, SEC3, SED, VER), superóxido de dismutase (SOD), toxina síndrome do choquetóxico (TSST-1), timosina alfa 1, ativador plasminogênio do Tecido, fator beta de necrosetumoral (TNF beta), receptor do fator de necrose tumoral (TNFR)1 fator-alfa de necrosetumoral (TNF alfa), Fator do crescimento endotelial vascular (VEGEF), uroquinase e muitosoutros.
Uma classe de proteínas que pode ser feita usando as composições e métodospara incorporação de aminoácidos não naturais iri vivo aqui descritos inclui moduladorestranscricionais ou uma porção destes. Exemplo de moduladores transcricionais inclui genese proteínas moduladoras transcricionais que modulam o crescimento, diferenciação eregulação celular, ou similares. Moduladores transcricionais são encontrados emprocariotos, vírus e eucariotos, incluindo fungo, plantas, levedura, insetos e animais,incluindo mamíferos, fornecendo uma ampla faixa de alvos terapêuticos. Percebe-se queativadores de expressão e transcricionais regulam transcrição por muitos mecanismos, por exemplo, ligando a receptores, estimulando uma cascata de transdução de sinal, regulandoexpressão de fatores de transcrição, ligando a promotores e melhoradores, ligando aproteínas que se ligam a promotores e melhoradores, desdobrando DNA, unindo pre-mRNA,poliadenilando RNA1 e degradando RNA.
Uma classe de proteínas da invenção (por exemplo, proteínas com um ou maisaminoácidos não naturais) inclui proteínas biologicamente ativas tais como citocinas,moléculas inflamatórias, fatores do crescimento, seus receptores, e produtos do oncogene,por exemplo, interleucinas (por exemplo, IL-1, IL-2, IL-8, etc.), interferons, FGF, IGF-I1IGF-II,FGF1 PDGF, TNF, TGF-σ, TGF-0, EGF, KGF, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1,ICAM-1/LFA-1, e hialurina/CD44; moléculas de transdução de sinal e produtos do oncogenecorrespondentes, por exemplo, Mos, Ras1 Raf, e Met; e ativadores e supressorestranscricionais, por exemplo, p53, Tat, Fos, Myc1 Jun, Myb, Rei, e receptores do hormônioesteróide tal como aquele para estrogênio, progesterona, testosterona, aldosterona, oIigante do receptor de LDL e corticosterona.
Enzimas (por exemplo, enzimas industriais) ou porções destas com pelo menos umaminoácido não natural são também fornecidas pela invenção. Exemplos de enzimasincluem, mas sem limitações, por exemplo, amidases, racemases de aminoácido, acilases,dealogenases, dioxigenases, diarilpropano peroxidases, epimerases, epóxido hidrolases,esterases, isomerases, quinases, glicose isomerases, glicosidases, glicosil transferases,haloperoxidases, monooxigenases (por exemplo, p450s), lipases, Iignina peroxidases, nitrilahidratases, nitrilases, proteases, fosfatases, subtilisinas, transaminase, e nucleases.
Muitas destas proteínas estão comercialmente disponíveis (Ver, por exemplo,Sigma BioSciences), e as seqüências de proteína e genes correspondentes, e tipicamente,muitos variantes destes, são bem conhecidas (Ver, por exemplo, Genbank). Qualquer delaspode ser modificada pela inserção de um ou mais aminoácidos não naturais de acordo coma invenção, por exemplo, para alterar a proteína com relação a uma ou mais propriedadesterapêutica, de diagnóstico ou enzimática de interesse. Exemplos de propriedadesterapeuticamente relevantes incluem meia-vida sérica, meia-vida em prateleira, estabilidade,imunogenicidade, atividade terapêutica, detectabilidade (por exemplo, pela inclusão degrupos reportadores (por exemplo, marcadores ou sítios de ligação de marcador) nosaminoácidos não naturais), redução de LD50 ou outros efeitos colaterais, capacidade deentrar no corpo através do trato gástrico (por exemplo, disponibilidade oral), ou similares.
Exemplos de propriedades de diagnóstico incluem meia-vida em prateleira, estabilidade,atividade de diagnóstico, detectabilidade ou similares. Exemplos de propriedadesenzimáticas relevantes incluem meia-vida em prateleira, estabilidade, atividade enzimática,capacidade de produção, ou similares.
Uma variedade de outras proteínas pode também ser modificada para incluir um oumais aminoácidos não naturais usando composições e métodos da invenção. Por exemplo,a invenção pode incluir substituir um ou mais aminoácidos naturais em uma ou maisproteínas de vacina com um aminoácido não natural, por exemplo, em proteínas de fungosinfecciosos, por exemplo, Aspergillus, espécie de Candida; bactéria, particularmente E. coli,que serve de modelo para bactéria patogênica, bem como bactéria medicamente importantetais como Staphylococci (por exemplo, aureus), ou Streptococci Cpor exemplo, pneumoniae);protozoário tal como esporozoário (por exemplo, Plasmodia), rhizopods Cpor exemplo,Entamoeba) e flagelados (Trypanosome, Leishmania, Triehomonas, Giardia, etc.); vírus taiscomo vírus RNA (+) (exemplos incluem Poxvírus por exemplo, vaeeinia; Picornavírus, porexemplo, polio; Togavírus, por exemplo, rubella; Flavivírus, por exemplo, HCV; eCoronavírus), vírus RNA (-) (por exemplo, Rabdovírus, por exemplo, VSV; Paramixovírus,por exemplo, RSV; Ortomixovírus, por exemplo, influenza; Buniavírus; e Arenavírus), vírusdsDNA (Reowírus, por exemplo), vírus RNA a DNA, isto é, Retrovírus, por exemplo, HIV eHTLV, e certos vírus DNA a RNA tais como Hepatite B.
Proteínas agriculturalmente relacionados tais como proteínas de resistência ainseto (por exemplo, o Cri proteínas), enzimas de produção de amido e lipídio, toxinas deplanta e inseto, proteínas de resistência a toxina, proteínas de desintoxicação de Micotoxina,enzimas de crescimento de planta (por exemplo, Ribulose 1,5-bisfosfatoCarboxilase/Oxigenase, "RUBISCO"), Iipoxigenase (LOX), e Fosfoenolpiruvato (PEP)carboxilase são também alvos adequados para modificação de aminoácido não natural.
Em certas modalidades, a proteína ou polipeptídeo de interesse (ou porção destes)nos métodos e/ou composições da invenção é codificada por um ácido nucléico.Tipicamente, o ácido nucléico compreende pelo menos um códon seletor, pelo menos doiscódons seletores, pelo menos três códons seletores, pelo menos quatro códons seletores,pelo menos cinco códons seletores, pelo menos seis códons seletores, pelo menos setecódons seletores, pelo menos oito códons seletores, pelo menos nove códons seletores, dezou mais códons seletores.
Genes que codificam proteínas ou polipeptídeos de interesse podem sermutagenisados usando métodos bem conhecidos pelos versados na tecnologia e aquidescritos em "Mutagenesis and Other Molecular Biology Techniques" para incluir, porexemplo, um ou mais códons seletores para a incorporação de um aminoácido não natural.Por exemplo, um ácido nucléico para uma proteína de interesse é mutagenisado para incluir um ou mais códons seletores, fornecendo a inserção de um ou mais aminoácidos nãonaturais. A invenção inclui qualquer variante deste, por exemplo, mutante, versões dequalquer proteína, por exemplo, incluindo pelo menos um aminoácido não natural.Similarmente, a invenção também inclui ácidos nucléicos correspondentes, isto é, qualquerácido nucléico com um ou mais códons seletores que codificam um ou mais aminoácidosnão naturais.
Para preparar uma proteína que inclui um aminoácido não natural, pode-se usarcélulas hospedeiras e organismos que são adaptados para a incorporação in vivo doaminoácido não natural por meio de pares RNAt/RS ortogonais. Células hospedeiras sãogeneticamente projetadas por engenharia (por exemplo, transformadas, convertidas outransfectadas) com um ou mais vetores que expressam o RNAt ortogonal, o RNAt ortogonalsintetase, e um vetor que codifica a proteína a ser derivatizada. Cada um dessescomponentes pode estar no mesmo vetor, ou cada um pode estar em um vetor separado, oudois componentes podem estar em um vetor e o terceiro componente em um segundo vetor.O vetor pode ser, por exemplo, na forma de um plasmídeo, uma bactéria, um vírus, umpolinucleotídeo nu, ou um polinucleotídeo conjugado.
Definição de Polipeptídeos por Imunoreatividade
Em virtude de os polipeptídeos da invenção fornecerem uma variedade de novasseqüências de polipeptídeo (por exemplo, polipeptídeos que compreendem aminoácidosnão naturais no caso de proteínas sintetizadas nos sistemas de tradução aqui, ou, porexemplo, no caso das sintetases inéditas, seqüências inéditas de aminoácidos padrões), ospolipeptídeos também fornecem novos recursos estruturais que podem ser reconhecidos,por exemplo, em ensaios imunológicos. A geração de anti-soro, que liga especificamente ospolipeptídeos da invenção, bem como os polipeptídeos que são ligados por anti-soro comoesse, são um recurso da invenção. O termo "anticorpo", da maneira aqui usada, inclui, massem limitações, um polipeptídeo substancialmente codificado por um gene deimunoglobulina ou genes de imunoglobulina, ou fragmentos destes que ligamespecificamente e reconhecem um analito (antígeno). Exemplos incluem anticorpos decadeia policlonal, monoclonal, quimérica e simples, e similares. Fragmentos deimunoglobulinas, incluindo fragmentos Fab e fragmentos produzidos por uma biblioteca deexpressão, incluindo exibição de fago, são também incluídos no termo "anticorpo" damaneira aqui usada. Ver, por exemplo, Paul, Fundamental Immunoloqy. 4th Ed., 1999,Raven Press, New York, para estrutura e terminologia de anticorpo.
A fim de produzir anti-soro para uso em um imunoensaio, um ou mais dospolipeptídeos imunogênicos são produzidos e purificados da maneira aqui descrita. Porexemplo, proteína recombinante pode ser produzida em uma célula recombinante. Umacepa natural de camundongos (usada neste ensaio em virtude de os resultados serem maisreprodutíveis em virtude da identidade genética virtual dos camundongos) é imunizada coma(s) proteína(s) imunogênica(s) em combinação com um adjuvante padrão, tal comoadjuvante de Freund, e um protocolo de imunização de camundongo padrão (Ver, porexemplo, Harlow and Lane (1988) Antibodies. A Laboratorv Manual. Cold Spring HarborPublications, New York, para uma descrição padrão de geração de anticorpo, formatos econdições de imunoensaio que podem ser usados para determinar imunoreatividadeespecífica. Detalhes adicionais em proteínas, anticorpos, anti-soro, etc. podem serencontrados em International Publication Numbers WO 2004/094593, intitulado"EXPANDING THE EUCARYOTIC GENETIC CODE;" WO 2002/085923, intitulado "IN VIVOINCORPORATION OF UNNATURAL AMINO CIDS", WO 2004/035605, intitulado"GLYCOPROTEIN SYNTHESIS", e WO 2004/058946, intitulado "PROTEIN ARRAYS."
USE DE PARES O-RNA E O-RS E O-RNAt/O-RS
As composições da invenção e composições feitas pelos métodos da invençãoestão opcionalmente em uma célula. Os pares de O-RNAt/O-RS ou componentes individuaisda invenção podem em seguida ser usados em um maquinário de tradução do sistemahospedeiro, o que faz com que um aminoácido não natural seja incorporado em umaproteína. International Publication Number WO 2002/085923 by Schultz, et ai, intitulado "INVIVO INCORPORATION OF UNNATURAL AMINO CIDS", descreve este processo e estáincorporado aqui pela referência. Por exemplo, quando um par de O-RNAt/O-RS éintroduzido em um hospedeiro, por exemplo, Escherichia coil ou levedura, o par leva àincorporação in vivo de um aminoácido não natural, que pode ser exogenamente adicionadoao meio de crescimento, em uma proteína, por exemplo, uma proteína teste de mioglobinaou uma proteína terapêutica, em resposta a um códon seletor, por exemplo, um códon nãosentido âmbar. Opcionalmente, as composições da invenção podem ser em um sistema detradução in vitro, ou em um(s) sistema(s) celular(s) in vivo. Proteínas com o aminoácido nãonatural podem ser usadas em qualquer de uma ampla faixa de aplicação. Por exemplo, afração não natural incorporada em uma proteína pode servir como um alvo para qualquer deuma ampla faixa de modificações, por exemplo, reticulando com outras proteínas, compequenas moléculas tais como marcadores ou corantes e/ou biomoléculas. Com estasmodificações, a incorporação do aminoácido não natural pode resultar em melhoresproteínas terapêuticas e pode ser usada para alterar ou melhorar a função catalítica deenzimas. Em alguns aspectos, a incorporação e modificação subseqüente de umaminoácido não natural em uma proteína pode facilitar estudos na estrutura da proteína,interações com outras proteínas, e similares.
ESTOJOS
Estojos são também um recurso da invenção. Por exemplo, é fornecido um estojopara produzir uma proteína que compreende pelo menos um aminoácido não natural em uma célula, onde o estojo inclui pelo menos um recipiente contendo uma seqüência depolinucleotídeos que codifica um O-RNAt, e/ou um O-RNAt, e/ou uma seqüência depolinucleotídeos que codifica um O-RS, e/ou um O-RS. Em uma modalidade, o estojo incluiadicionalmente o aminoácido não natural fenilselenocisteína. Em uma outra modalidade, oestojo compreende adicionalmente materiais instrucionais para produzir a proteína e/ou umacélula hospedeira.
EXEMPLOS
Os exemplos seguintes são oferecidos para ilustrar, mas não para limitar, ainvenção reivindicada. Versados ná tecnologia reconhecerão uma variedade de parâmetrosnão críticos que podem ser alterados sem fugir do escopo da invenção reivindicada.Entende-se que os exemplos e modalidades aqui descritos têm propósitos apenasilustrativos e que várias modificações ou mudanças à luz desta serão sugeridos pelosversados na tecnologia e que deverão estar incluído no espírito e propósito deste pedido eescopo das reivindicações anexas.
EXEMPLO
Seleção genética de Sintetases Mutantes Específicas para Fenilselenocisteína
QUÍMICA REATIVA DE FENILSELENOCISTEÍNA
Selênio é um elemento essencial tanto em síntese orgânica quanto biologia.
Demonstrou-se que uma fração de fenilseleno pode ser oxidada em condições brandas, e aeliminação espontânea de syn do selenóxido resulta na formação de olefina. Esta estratégiatem sido usada extensivamente em síntese total.
A incorporação de um aminoácido não natural contendo selênio em proteínas criaráum alvo atrativo para modificação pós-translacional altamente seletiva de proteínas, porexemplo, para produzir proteínas seletivamente lipidadas. Um aminoácido seleno nãonatural como esse é fenilselenocisteína (CAS Registry Number 71128-82-0), sinonimamentedenominada fenilselenida ou Se-Fenil-L-selenocisteína. Esta estrutura é fornecida na figura1, estrutura 1. Este aminoácido não natural pode ser obtido, por exemplo, da Sigma®-Aldrich® Co., Inc., número de catálogo 50827.
Clivagem oxidativa de um resíduo de aminoácido fenilselenocisteína resulta noaminoácido deidroalanina σ,β-insaturado (Ver figura 1, estrutura 2). Deidroalanina éencontrada em inúmeros peptídeos de ocorrência natural (Chatterjee et al. (2005), ChemicalReviews 105(2):633-683). Deidropeptídeos contendo resíduos de cisteína não protegidossofrem adição de conjugado estereosseletivo intramolecular para produzir Iantioninascíclicas (Chatterjee et al. (2005), Chemical Reviews 105(2):633-683). Lantioninas sãoestruturas que são encontradas em !antibióticos, uma classe de antibióticos modificadospós-translacionalmente (Chatterjee et al. (2005), ChemicaIReviews 105(2):633-683).
Reações de adição de Michael do aminoácido não natural deidroalanina (Ver figura1, estrutura 2) podem resultar em proteínas com modificações pós-translacionais, porexemplo, por reação com um tio-lipídio para gerar uma proteína lipidada. Maisespecificamente, reação com ácido tiopalmítico resulta em palmitoilcisteína (Ver figura 1,estrutura 3), reação com farnesilmercaptano disponibiliza farnesilcisteína (Ver figura 1,estrutura 4), e reação com malonato produz ácido γ-carboxiglutâmico (Ver figura 1, estrutura6). Além disso, reação com 1-hexadecanetiol resulta em S-hexadecilcisteína (Ver figura 1,estrutura 5). Embora S-hexadecilcisteína não seja uma modificação pós-translacional nativa,a presença deste resíduo em proteína pode ter propriedades desejadas; por exemplo, elapode resultar em ligação de albumina sérica humana, e maior estabilidade in vivo daproteína.
A lipidação de polipeptídeos por modificação alvejada de resíduos defenilselenocisteína pode ter propriedades desejadas, tais como localização de membrana, melhor estabilidade in vivo (isto é, maior meia-vida) e solubilidade de lipídio. Além disso, asformas Iipidadas de algumas proteínas são as formas biologicamente ativas.
PRODUÇÃO DE PROTEÍNAS QUE COMPREENDE FENILSELENOCISTEÍNA
Metodologias que permitem a adição sistemática de aminoácidos não naturais aoscódigos genéticos de E coli, levedura e célula mamíferas foram descritas anteriormente. Tais métodos são baseados na evolução de um supressor RNAt não sentido um paraminoacil-RNAt sintetase (RS) que tem a propriedade de ortogonalidade, definida como acapacidade de incorporar seletivamente um dado aminoácido em resposta a um códonexclusivo sem passar por reação cruzada com RNAts do hospedeiro endógeno, aminoacil-RNAt sintetase, ou aminoácidos.
Uma presente invenção fornece composições e métodos para a geração depolipeptídeos in vivo contendo o aminoácido não natural fenilselenocisteína pela criação dereagentes ortogonais que permitem a incorporação translacional geneticamente programadadeste aminoácido não natural diretamente em uma cadeia do polipeptídeos em crescimento.Além disso, o uso destes sistemas ortogonais permite a produção de grandes quantidades de polipeptídeos contendo o aminoácido não natural (isto é, quantidades muito grandes dospolipeptídeos que seria possível usando outros métodos de síntese). Polipeptídeos quecompreendem fenilselenocisteína podem ser usados em reações de modificação alvejadas,por exemplo, mas sem limitações, a geração de polipeptídeos artificialmente Iipidados deacordo com as instruções da presente especificação. Tais proteínas modificadas encontram uma variedade de usos, incluindo, mas sem limitações, melhores agentes terapêuticos.
Para gerar um par de RNAt ortogonal/aaRS que insere exclusivamentefenilselenocisteína (figura 1, estrutura 1), uma biblioteca de mutantes de sítio ativo doMethanococcus jannaschii tirosil-RNAt sintetase (M)TyrRS), que especificamente carregaum supressor não sentido M. jannaschii projetado por engenharia (MjRNAtTyrcuA) não reconhecido pela E. coli sintetase, foi usado. Uma biblioteca de pBK-lib5 sintetase, damaneira descrita em Wang et ai. (2006), Annual Review of Biophysics and BiomolecularStruture 35:225-249, foi usada na classificação e submetida a uma série de seleçõespositiva e negativa. A sobrevivência na seleção positiva foi contingente mediante asupressão de uma mutação âmbar no gene cloranfenicol acetiltransferase (CAT) na presença de fenilselenocisteína; a sobrevivência na seleção negativa foi contingentemediante supressão inadequada de mutações âmbar em um gene que codifica a proteínabarnase tóxica na ausência de fenilselenocisteína. Clones sobrevivem tanto através deetapas positiva quanto negativa de seleção apenas se eles incorporarem exclusivamentefenilselenocisteína em resposta ao códon âmbar.
Após estas seleções, foram identificados candidatos a clone que permitiram que ascélulas abrigassem o gene CAT com um códon seletor de mutação âmbar em um sítiopermissivo para sobreviver na presença de cloranfenicol apenas na presença defenilselenocisteína. Na ausência de fenilselenocisteína, as mesmas células não crescem napresença de cloranfenicol, consistente com incorporação de fenilselenocisteína eficientecom pouca ou nenhuma sobrevivência de fundo da incorporação de aminoácidosendógenos.
Seqüenciamento dos clones sintetase mutante candidatos revelaram três diferentesintetase isoladas, cada uma das quais é capaz de funcionar em um sistema deORTOGONAL TRANSLATION
Clone 1 (PhSeRS-SD): Y32W, L65E, H70G, D158Q, L162SClone 2 (PhSeRS-K4): Y32W, L65H, H70G, F108N, Q109S, D158S, L162EClone 3 (PhSeRS-K5): Y32W, L65H, A67G, H70G, F108K, Q109S, D158E, L162E
Estes clones são sumarizados mais detalhadamente na tabela a seguir.
Seqüências de aminoácidos tirosil-RNAt sintetase de Methanococcus jannaschiiTipo selvagem e Mutantes
32 65 67 70 108 109 158 162 SEQID NO:Tipo selvagem r Leu Ala His Phe Gln Asp Leu 2Clone 1 Mutante (SD) Trp Glu Ala Gly Phe Gln Gln Ser 4Clone 2 Mutante (K4) Trp His Ala Gly Asn Ser Ser Glu 6Clone 3 Mutante (KS) Trp His Gly Gly Lys Ser Glu Glu 8
Das três sintetases mutantes isoladas, a sintetase do clone 2 (PhSeRSK4) teve amais alta atividade e especificidade. O nucleotídeo e seqüências de aminoácidos completosde cada um desses clones e a espécie tipo selvagem correspondente são fornecidos nafigura 2.
VALIDAÇÃO DA SINTETASE ORTOGONAL
Usando a sintetase mutante aqui descrita, uma proteína modelo mioglobinacontendo um códon seletor fr âmbar na posição 4 (TAG4) foi expressa com 1,5-2 mg/L de rendimento sem nenhuma expressão de fundo na ausência de fenilselenocisteína. Estaproteína modelo contendo fenilselenocisteína foi adicionalmente submetida a modificaçãopós-translacional para produzir ácido γ-carboxiglutâmico (figura 1 estrutura 6), que foiconfirmado usando espectrometria de massa de alta resolução.
Duas proteínas modelos adicionais compreendendo fenilselenocisteína foram também expressas com 3-5 mg/L de rendimento usando o sistema de produção de sintetasemutante e ortogonal in vivo aqui descrito. Hormônio do crescimento humano (hGH) foiproduzido contendo fenilselenocisteína. Após a produção da forma de fenilselenocisteína, aproteína foi submetida a modificação para produzir hGH que contém S-hexadecilcisteína. Aspropriedades de ligação da albumina sérica humana e a meia-vida in vivo do hGHmodificado em camundongos estão atualmente sendo testadas.
Os reagentes ortogonais aqui descritos foram também usados para produzirproteína fluorescente verde (GFP) contendo fenilselenocisteína. Essa forma da proteína foitambém subseqüentemente modificada para formar, alternativamente, S-hexadecilcisteína,farnesilcisteína e palmitoilcisteína de GFP. As propriedades de alvejando da membranadessas formas Iipidadas de GFP estão atualmente sendo testadas.
Assim, a presente invenção fornece composições e métodos para a produção deproteínas geneticamente programadas contendo o aminoácido não naturalfenilselenocisteína (Ver figura 1, estrutura 1). A subseqüente eliminação oxidativa porperóxido de hidrogênio produz deidroalanina (Ver figura 1, estrutura 2) na posição desejada.Esta fração de deidroalanina pode em seguida ser alvejada em várias reações secundáriasde modificação.
Embora a invenção apresentada tenha sido descrita com algum detalhe compropósitos de clareza e entendimento, fica claro aos versados na tecnologia, a partir daleitura dessa revelação, que várias mudanças nesta revelação na forma e detalhes podemser feitas sem fugir do espírito e escopo da invenção. Todas as publicações, patentes,pedidos de patente, e/ou outros documentos citados neste pedido estão incorporados pelareferência na sua íntegra com todos os propósitos, como se cada publicação, patente,pedido de patente individual e/ou outro documento estivessem individualmente indicadospara ser incorporados pela referência com todos os propósitos.LISTAGEM DE SEQÜÊNCIA<110> The Scripps Research InstituteWANG, JIANGYUNSCHULTZ, PETER G
<120> "EXPRESSÃO DE PROTEÍNAS GENETICAMENTE PROGRAMADA
CONTENDO O AMINOÁCIDO NÃO NATURAL FENILSELENOCISTEÍNA"
<130> 54-001820US
<140> US 11/724,039<141> 2007-03-13
<160> 9
<170> Patentln version 3.4
<210> 1
<211> 77
<212> RNA
<213> Artificial
<220>
<223> nonsense suppressor tyrosyl-tRNA CUA derived from Methanococcusjannaschii
<400> 1
ccggcgguag uucagcaggg cagaacggcg gacucuaaau ccgcauggcg cugguucaaa 60uccggcccgc cggacca 77
<210> 2<211> 306<212> PRT
<213> Methanococcus jannaschii<400> 2
Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile ser15 10 15
Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Tyr20 25 30
Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln35 40 45
Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile50 55 60
Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp65 70 75 80
Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met85 90 95
Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys100 105 110Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys
115 120 125
Arg Ala Arg Arg ser Met Glu Leu lie Ala Arg Glu Asp Glu Asn Pro130 135 140
Lys vai Ala Glu Val Ile Tyr Pro Ile Met Gln vai Asn Asp Ile His145 150 155 160
Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile165 170 175
His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys vai vai cys He His180 185 190
Asn Pro vai Leu Thr Gly Leu Asp Gly Glu Gly Lys Met ser ser Ser195 200 205
Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala210 215 220
Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val vai Glu Gly Asn Pro225 230 235 240
Ile Met Glu lie Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys245 250 255
Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu260 265 270
Leu Glu ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys275 280 285
Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys290 295 300
Arg Leu305
<210> 3
<211> 918
<212> DNA
<213> Methanococcus jannaschii
<400> 3
atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60
agagaggttt taaaaaaaga tgaaaaatct gcttacatag gttttgaacc aagtggtaaa 120
atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180
gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240
gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300aaatatgttt atggaagtga attccagctt gataaggatt atacactgaa tgtctataga 360ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgatattcat 480tatttaggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900ccaattagaa agagatta 918
<210> 4
<211> 306
<212> PRT
<213> Artificial
<220>
<223> Phenylselenocysteine anrinoacyl tRNA synthetase<400> 4
Met Asp Glu Phe GTu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile ser1 5 10 15
Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Trp20 25 30
Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln35 40 45
Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile50 55 60
Glu Leu Ala Asp Leu Gly Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp65 70 75 80
Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys vai Phe Glu Ala Met85 90 95
Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys100 105 110
Asp Tyr Thr Leu Asn vai Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys115 120 125
Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro130 135 140Lys Val Ala Glu Val Ile Tyr Pro lie Met Gln Val Asn Gln Ile His145 150 155 160
Tyr Ser Gly Val Asp vai Ala vai Gly Gly Met Glu Gln Arg Lys Ile165 170 175
His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val vai cys Ile His180 185 190
Asn Pro vai Leu Thr Gly Leu Asp Gly Glu Gly Lys Met ser ser ser195 200 205
Lys Gly Asn Phe lie Ala Val Asp Asp Ser Pro Glu Glu lie Arg Ala210 215 220
Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly vai Val Glu Gly Asn Pro225 230 235 240
Ile Met Glu lie Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys245 250 255
Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu260 265 270
Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys275 280 285
Asn Ala vai Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys290 295 300
Arg Leu305
<210> 5
<211> 921
<212> DNA
<213> Artificial
<220>
<223> Phenylselenocysteine aminoacyl tRNA synthetase
<400> 5
atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60agagaggttt taaaaaaaga tgaaaaatct gcttggatag gttttgaacc aagtggtaaa 120atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180gatataatta tagagttggc tgatttaggg gcctatttaa accagaaagg agagttggat 240gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300aaatatgttt atggaagtga attccagctt gataaggatt atacactgaa tgtctataga 360ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tcaaattcat 480tatagtggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900ccaattagaa agagattata a 921
<210> 6
<211> 306
<212> PRT
<213> Artificial
<220>
<223> Phenylselenocysteine aminoacyl tRNA synthetase<400> 6
Met Asp Glu Phe Glu Met Xle Lys Arg Asn Thr ser Glu Ile Ile ser15 10 15
Glu Glu Glu Leu Arg Glu vai Leu Lys Lys Asp Glu Lys ser Ala Trp20 25 30
lie Gly Phe Glu Pro ser Gly Lys Ile His Leu Gly His Tyr Leu Gln35 40 45
Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile50 55 60
His Leu Ala Asp Leu Gly Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp65 70 75 80
Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys vai Phe Glu Ala Met85 90 95
Gly Leu Lys Ala Lys Tyr vai Tyr Gly ser Glu Asn ser Leu Asp Lys100 105 110
Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys115 120 125
Arg Ala Arg Arg ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro130 135 140
Lys vai Ala Glu Val Ile Tyr Pro Ile Met Gln vai Asn ser Ile His145 150 155 160Tyr Glu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile165 170 175
His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His180 185 190
Asn Pro vai Leu Thr Gly Leu Asp Gly Glu Gly Lys Met ser ser ser195 200 205
Lys Gly Asn Phe lie Ala Val Asp Asp ser Pro Glu Glu Ile Arg Ala210 215 220
Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro225 230 235 240
Ile Met Glu lie Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys245 250 255
Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu260 265 270
Leu Glu ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys275 280 285
Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys290 295 300
Arg Leu305
<210> 7<211> 921<212> DNA<213> Artificial
<220>
<223> Phenylselenocysteine aminoacyl tRNA synthetase<400> 7
atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60
agagaggttt taaaaaaaga tgaaaaatct gcttggatag gttttgaacc aagtggtaaa 120
atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180
gatataatta tacatttggc tgatttaggc gcctatttaa accagaaagg agagttggat 240
gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300
aaatatgttt atggaagtga aaattctctt gataaggatt atacactgaa tgtctataga 360
ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420
gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa ttctattcat 480
tatgagggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600
ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660
gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720
ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780
tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840
gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900
ccaattagaa agagattata a 921
<210> 8
<211> 306
<212> PRT
<213> Artificial
<220>
<223> Phenylselenocysteine aminoacyl tRNA synthetase<400> 8
Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr ser Glu Ile Ile Ser15 10 15
Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys ser Ala Trp20 25 30
lie Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln35 40 45
Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile50 55 60
His Leu Gly Asp Leu Gly Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp65 70 75 80
Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met85 90 95
Gly Leu Lys Ala Lys Tyr Val Tyr Gly ser Glu Lys Ser Leu Asp Lys100 105 110
Asp Tyr Thr Leu Asn vai Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys115 120 125
Arg Ala Arg Arg ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro130 135 140
Lys Val Ala Glu vai Ile Tyr Pro Ile Met Gln Val Asn Glu Ile His145 150 155 160
Tyr Glu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys lie165 170 175His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His180 185 190
Asn Pro vai Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser195 200 205
Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala210 215 220
Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro225 230 235 240
Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys245 250 255
Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu260 265 270
Leu Glu ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys275 280 285
Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys290 295 300
Arg Leu305
<210> 9 <211> 921 <212> DNA <213> Artificial <220> <223> Phenylselenocysteine aminoacyl tRNA synthetase <400> 9 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60agagaggttt taaaaaaaga tgaaaaatct gcttggatag gttttgaacc aagtggtaaa 120atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180gatataatta tacatttggg tgatttaggc gcctatttaa accagaaagg agagttggat 240gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300aaatatgttt atggaagtga aaagtctctt gataaggatt atacactgaa tgtctataga 360ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgagattcat 480tatgagggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720
ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780
tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840
gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900
ccaattagaa agagattata a 921
Claims (51)
1. Sistema de tradução, CARACTERIZADO pelo fato de que compreende:um primeiro aminoácido não natural que é fenilselenocisteína;um primeiro RNAt ortogonal aminoacil sintetase (O-RS); eum primeiro RNAt ortogonal (O-RNAt);em que o dito primeiro O-RS preferencialmente aminoacila o dito primeiro O-RNAtcom a dita fenilselenocisteína.
2. Sistema de tradução, de acordo com a reivindicação 1, CARACTERIZADO pelofato de que o dito primeiro O-RS preferencialmente aminoacila o dito primeiro O-RNAt coma dita fenilselenocisteína com uma eficiência que é pelo menos 50 % da eficiência obser-vada para um sistema de tradução que compreende o dito O-RNAt, a dita fenilselenociste-ína, e uma RNAt aminoacil sintetase que compreende a seqüência de aminoácido de SEQID NO: 4, 6 ou 8.
3. Sistema de tradução, de acordo com a reivindicação 1, CARACTERIZADO pelofato de que o dito primeiro O-RS compreende uma seqüência de aminoácido selecionadado grupo que consiste em seqüências de aminoácido apresentadas em SEQ ID NOS: 4, 6,-8, e variantes conservadoras destes.
4. Sistema de tradução, de acordo com a reivindicação 1, CARACTERIZADO pelofato de que o dito primeiro O-RNAt é um RNAt supressor âmbar.
5. Sistema de tradução, de acordo com a reivindicação 1, CARACTERIZADO pelofato de que o dito primeiro O-RNAt compreende ou é codificado por uma seqüência depolinucleotídeo apresentada em SEQ ID NO: 1.
6. Sistema de tradução, de acordo com a reivindicação 1, CARACTERIZADO pelofato de que compreende adicionalmente um ácido nucléico que codifica uma proteína deinteresse, o dito ácido nucléico que compreende pelo menos um códon seletor, em que odito códon seletor é reconhecido pelo dito primeiro O-RNAt.
7. Sistema de tradução, de acordo com a reivindicação 6, CARACTERIZADO pelofato de que compreende adicionalmente um segundo O-RS e um segundo O-RNAt, emque o segundo O-RS preferencialmente aminoacila o segundo O-RNAt com um segundoaminoácido não natural que é diferente do primeiro aminoácido não natural, e em que osegundo O-RNAt reconhece um códon seletor que é diferente do códon seletor reconheci-do pelo primeiro O-RNAt.
8. Sistema de tradução, de acordo com a reivindicação 1, CARACTERIZADO pelofato de que o dito sistema compreende uma célula hospedeira que compreende o dito pri-meiro aminoácido não natural, o dito primeiro O-RS e o dito primeiro O-RNAt.
9. Sistema de tradução, de acordo còm a reivindicação 8, CARACTERIZADO pelofato de que a dita célula hospedeira é uma célula eubacteriana.
10. Sistema de tradução, de acordo com a reivindicação 9, CARACTERIZADOpelo fato de que a dita célula eubacteriana é uma célula E. coli.
11. Sistema de tradução, de acordo com a reivindicação 8, CARACTERIZADO pelofato de que a dita célula hospedeira compreende um polinucleotídeo que codifica o dito pri-meiro O-RS.
12. Sistema de tradução, de acordo com a reivindicação 11, CARACTERIZADOpelo fato de que o dito polinucleotídeo compreende uma seqüência de nucleotídeo apresen-tada em SEQ ID NO: 5, 7 ou 9.
13. Sistema de tradução, de acordo com a reivindicação 8, CARACTERIZADO pelofato de que a dita célula hospedeira compreende um polinucleotídeo que codifica o dito pri-meiro O-RNAt.
14. Método para produzir em um sistema de tradução uma proteína que compreen-de um aminoácido não natural em uma posição selecionada, CARACTERIZADO pelo fatode que o método compreende:(a) fornecer um sistema de tradução que compreende:um primeiro aminoácido não natural que é fenilselenocisteína;uma primeiro RNAt ortogonal aminoacil sintetase (O-RS);um primeiro RNAt ortogonal (O-RNAt), em que o dito primeiro O-RS preferencial-mente aminoacila o dito primeiro O-RNAt com a dita fenilselenocisteína; e,um ácido nucléico que codifica a dita proteína, em que o dito ácido nucléico com-preende pelo menos um códon seletor que é reconhecido pelo dito primeiro O-RNAt; e, (b) incorporar o dito aminoácido não natural na dita posição selecionada na ditaproteína durante a tradução da dita proteína em resposta ao dito códon seletor, produzindodessa maneira a dita proteína que compreende o dito aminoácido não natural na posiçãoselecionada.
15. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato de queo dito primeiro O-RS preferencialmente aminoacila o dito primeiro O-RNAt com a dita fenil-selenocisteína com uma eficiência que é pelo menos 50 % da eficiência observada paraum sistema de tradução que compreende o dito O-RNAt, a dita fenilselenocisteína, e umRNAt aminoacil sintetase que compreende a seqüência de aminoácido de SEQ ID NO: 4, 6ou 8
16. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito sistema de tradução compreende um polinucleotídeo que codifica o dito O-RS.
17. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer um O-RS quecompreende uma seqüência de aminoácido selecionada do grupo que consiste nas seqüên-cias de aminoácido apresentadas em SEQ ID NOS: 4, 6, 8, e variantes conservadorasdestes.
18. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um primeiro RNAt ortogonal aminoacil sintetase compreendemutar um aminoácido ligando a cavidade de um RNAt aminoacil sintetase tipo selvagempor mutagênese direcionada ao sítio, e selecionar um O-RS resultante que preferencial-mente aminoacila o dito O-RNAt com o dito aminoácido não natural, fornecendo dessamaneira o dito primeiro RNAt ortogonal aminoacil sintetase.
19. Método, de acordo com a reivindicação 18, CARACTERIZADO pelo fato deque a dita etapa de seleção compreende selecionar positivamente e selecionar negativ-mente para o dito O-RS de um pool que compreende uma pluralidade de moléculas deRNAt aminoacil sintetase mutantes produzidas depois do dito said mutagênese direciona-do ao sítio.
20. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer um polinucleotí-deo que codifica o dito O-RNAt.
21. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer um O-RNAt queé um RNAt supressor âmbar.
22. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer um ácido nucléi-co que codifica ou compreende o dito O-RNAt1 em que o dito ácido nucléicõ compreendeuma seqüência de polinucleotídeo apresentada em SEQ ID NO: 1.
23. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer um ácido nucléi-co que codifica o dito O-RS, emque o dito ácido nucléicõ compreende uma seqüência depolinucleotídeo apresentada em SEQ ID NO: 5, 7 ou 9.
24. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer um ácido nucléi-cõ que compreende um códon seletor de âmbar.
25. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque a dita proteína compreende adicionalmente um segundo aminoácido não natural que édiferente do dito primeiro aminoácido não natural, e em que o dito sistema de traduçãocompreende adicionalmente um segundo O-RS e um segundo O-RNAt, em que o segundoO-RS preferencialmente aminoacila o segundo O-RNAt com um segundo aminoácido nãonatural que é diferente do primeiro aminoácido não natural, e em que o segundo O-RNAtreconhece um códon seletor no ácido nucléicõ que é diferente do códon seletor reconhecidopelo primeiro O-RNAt.
26. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer uma célula hos-pedeira, em que a dita célula hospedeira compreende o dito primeiro aminoácido não natu-ral, o dito primeiro O-RS, o dito primeiro O-RNAt e o dito ácido nucléico, e em que a ditaetapa de incorporação compreende cultivar a dita célula hospedeira.
27. Método, de acordo com a reivindicação 26, CARACTERIZADO pelo fato deque a dita célula hospedeira é uma célula eubacteriana hospedeira.
28. Método, de acordo com a reivindicação 27, CARACTERIZADO pelo fato deque a dita célula eubacteriana hospedeira é uma célula hospedeira E. coli.
29. Método, de acordo com a reivindicação 26, CARACTERIZADO pelo fato deque a dita célula hospedeira compreende um ácido nucléico que codifica o dito O-RS.
30. Método, de acordo com a reivindicação 29, CARACTERIZADO pelo fato deque o dito ácido nucléico que codifica o dito O-RS compreende uma seqüência de nucleo-tídeo apresentada em SEQ ID NO: 5, 7 ou 9.
31. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito método compreende adicionalmente etapa (c) reagir a dita fenilselenocisteínana dita posição selecionada na dita proteína para produzir uma proteína que compreendedeidroalanina na dita posição selecionada.
32. Método, de acordo com a reivindicação 31, CARACTERIZADO pelo fato deque a dita reação é por eliminação oxidativa.
33. Método, de acordo com a reivindicação 31, CARACTERIZADO pelo fato deque a dita reação compreende expor a dita fenilselenocisteína ao peróxido de hidrogênio.
34. Método, para produzir em um sistema de tradução uma proteína que compre-ende uma fração de lipídio em uma posição selecionada, CARACTERIZADO pelo fato deque o método compreende:(a) fornecer um sistema de tradução que compreende:um aminoácido não natural de fenilselenocisteína;um RNAt ortogonal aminoacil sintetase (O-RS);um RNAt ortogonal (O-RNAt), em que o dito O-RS preferencialmente aminoacila odito O-RNAt com a dita fenilselenocisteína; e,um ácido nucléico que codifica a dita proteína, em que o dito ácido nucléico com-preende um códon seletor na dita posição selecionada que é reconhecido pelo dito O-RNAt;(b) incorporar fenilselenocisteína na dita posição selecionada na dita proteína du-rante tradução da dita proteína em resposta ao dito códon seletor;(c) reagir a dita fenilselenocisteína na posição selecionada na dita proteína paraproduzir uma proteína que compreende deidroalanina na posição selecionada; e,(d) reagir a dita deidroalanina na posição selecionada na dita proteína com umafração de lipídio para produzir uma proteína que compreende um lipídeo na fração do áci-do na posição selecionada na proteína.
35. Método, de acordo com a reivindicação 34, CARACTERIZADO pelo fato de que a dita reação da dita fenilselenocisteína na posição selecionada na dita proteína é poreliminação oxidativa.
36. Método, de acordo com a reivindicação 34, CARACTERIZADO pelo fato deque a dita reação da dita fenilselenocisteína na posição selecionada na dita proteína com-preende expor a dita fenilselenocisteína ao peróxido de hidrogênio.
37. Método, de acordo com a reivindicação 34, CARACTERIZADO pelo fato deque a dita fração de lipídio é selecionada do grupo que consiste em ácido tiopalmítico,famesilmercaptano e 1-hexadecanetiol.
38. Método, de acordo com a reivindicação 34, CARACTERIZADO pelo fato deque a dita fração de aminoácido Iipidado é selecionada do grupo que consiste em palmi- toilcisteína, farnesilcisteína e S-hexadecilcisteína.
39. Método, de acordo com a reivindicação 34, CARACTERIZADO pelo fato deque a dita reação da dita deidroalanina na posição selecionada na dita proteína é por umareação de adição de Michael.
40. Método para produzir em um sistema de tradução uma proteína que compre- ende um aminoácido de deidroalanina não natural em uma posição selecionada,CARACTERIZADO pelo fato de que o método compreende:(a) fornecer um sistema de tradução que compreende:um aminoácido não natural de fenilselenocisteína;um RNAt ortogonal aminoacil sintetase (O-RS);um RNAt ortogonal (O-RNAt), em que o dito O-RS preferencialmente aminoacila odito O-RNAt com a dita fenilselenocisteína; e,um ácido nucléico que codifica a dita proteína, em que o dito ácido nucléico com-preende um códon seletor na dita posição selecionada que é reconhecido pelo dito O-(b) incorporar o dita aminoácido não natural de fenilselenocisteína na dita posiçãoselecionada na dita proteína durante a tradução d a dita proteína em resposta ao dito códonseletor,(c) reagir a dita fenilselenocisteína na posição selecionada na dita proteína, pro-duzindo dessa maneira a dita proteína que compreende o dito aminoácido de deidroalaninanão natural na posição selecionada.
41. Método, de acordo com a reivindicação 40, CARACTERIZADO pelo fato deque a dita reação da dita fenilselenocisteína na posição selecionada na dita proteína é poreliminação oxidativa.
42. Método, de acordo com a reivindicação 40, CARACTERIZADO pelo fato deque a dita reação da dita fenilselenocisteína na posição selecionada na dita proteína com-preende expor a dita fenilselenocisteína ao peróxido de hidrogênio.
43. Composição, CARACTERIZADA pelo fato de que compreende um polipeptí-deo que compreende umseqüência de amino ácido selecionada do grupo que consiste nasseqüências de aminoácido apresentadas em SEQ ID NOS: 4, 6, 8, e variantes conservado-ras destes.
44. Composição, de acordo com a reivindicação 43, CARACTERIZADA pelo fatode que o dito polipeptídeo da variante conservadora aminoacila um RNAt ortogonal cogna-te (O-RNAt) com um aminoácido não natural com uma eficiência que é pelo menos 50 %da eficiência observada para um sistema de tradução que compreende o dito O-RNAt, o ditoaminoácido não natural, e um RNAt aminoacil sintetase que compreende a seqüência deaminoácido de SEQ ID NO: 4, 6 ou 8.
45. Composição, de acordo com a reivindicação 43, CARACTERIZADA pelo fatode que a dita composição compreende uma célula que compreende o polipeptídeo.
46. Polinucleotídeo, CARACTERIZADO pelo fato de que codifica o polipeptídeo,de acordo com a reivindicação 43.
47. Polinucleotídeo, de acordo com a reivindicação 46, CARACTERIZADO pelofato de que o dito polinucleotídeo compreende a seqüência de nucleotídeo de SEQ ID NO:-5, 7 ou 9.
48. Vetor, CARACTERIZADO pelo fato de que compreende um polinucleotídeo deacordo com a reivindicação 46.
49. Vetor de expressão, CARACTERIZADO pelo fato de que compreende um po-linucleotídeo de acordo com a reivindicação 46.
50. Célula, CARACTERIZADA pelo fato de que compreende um vetor, o vetorque compreende um polinucleotídeo de acordo com a reivindicação 46.
51. Composição, CARACTERIZADA pelo fato de que compreende um polinucleo-tídeo que compreende uma seqüência de nucleotídeo apresentadas em SEQ ID NO: 5, 7ou 9.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US78327206P | 2006-03-16 | 2006-03-16 | |
US60/783.272 | 2006-03-16 | ||
US86145606P | 2006-11-28 | 2006-11-28 | |
US60/861.456 | 2006-11-28 | ||
PCT/US2007/006382 WO2007109035A2 (en) | 2006-03-16 | 2007-03-13 | Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine |
Publications (1)
Publication Number | Publication Date |
---|---|
BRPI0709603A2 true BRPI0709603A2 (pt) | 2011-07-19 |
Family
ID=38522926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0709603-8A BRPI0709603A2 (pt) | 2006-03-16 | 2007-03-13 | expressão de proteìnas geneticamente programada contendo o aminoácido não natural fenilselenocisteìna |
Country Status (12)
Country | Link |
---|---|
US (3) | US7790847B2 (pt) |
EP (1) | EP1994165B1 (pt) |
JP (1) | JP5249194B2 (pt) |
KR (1) | KR20080113226A (pt) |
CN (1) | CN101405401B (pt) |
AU (1) | AU2007227592B2 (pt) |
BR (1) | BRPI0709603A2 (pt) |
CA (1) | CA2638772A1 (pt) |
IL (1) | IL193722A0 (pt) |
MX (1) | MX2008011669A (pt) |
RU (1) | RU2464315C2 (pt) |
WO (1) | WO2007109035A2 (pt) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MXPA03009563A (es) * | 2001-04-19 | 2004-12-06 | Scripps Research Inst | Incorporacion in vivo de aminoacidos no naturales. |
KR20050073559A (ko) * | 2002-10-16 | 2005-07-14 | 더 스크립스 리서치 인스티튜트 | 당단백질 합성 |
ATE542894T1 (de) | 2003-04-17 | 2012-02-15 | Scripps Research Inst | Ausweitung des eukaryotischen genetischen codes |
ATE386133T1 (de) | 2003-07-07 | 2008-03-15 | Scripps Research Inst | Zusammensetzungen der orthogonalen lysyl-trna und aminoacyl-trna synthetase paaren und ihre verwendungen |
AU2005330514B2 (en) | 2004-10-27 | 2011-05-12 | The Scripps Research Institute | Orthogonal translation components for the in vivo incorporation of unnatural amino acids |
EP1991680B1 (en) * | 2006-03-09 | 2013-08-21 | The Scripps Research Institute | System for the expression of orthogonal translation components in eubacterial host cells |
JP5249194B2 (ja) | 2006-03-16 | 2013-07-31 | ザ スクリプス リサーチ インスティチュート | 非天然アミノ酸フェニルセレノシステインを含有するタンパク質の遺伝的にプログラムされた発現 |
RU2473690C2 (ru) * | 2006-05-23 | 2013-01-27 | Зе Скрипс Ресеч Инститьют | Генетически кодируемые флюоресцентные кумариновые аминокислоты |
PT2052083E (pt) | 2006-09-21 | 2014-04-10 | Scripps Research Inst | Expressão geneticamente programada de proteínas seletivamente sulfatadas em eubactérias |
EP2069481A4 (en) | 2006-10-18 | 2010-01-06 | Scripps Research Inst | GENETIC ASSEMBLY OF UNNATURAL AMINO ACIDS IN PROTEINS IN MAMMALIAN CELLS |
MX2010004464A (es) * | 2007-10-25 | 2010-06-07 | Scripps Research Inst | Incorporacion genetica de 3-aminotirosina a reductasas. |
EP2220218A4 (en) * | 2007-11-02 | 2010-12-08 | Scripps Research Inst | BORONIC AMINO ACID GENETICALLY CODED |
BRPI0819092A2 (pt) * | 2007-11-02 | 2014-10-14 | Scripps Research Inst | Evolução direcionada usando proteínas que compreendem aminoácidos não naturais. |
WO2009075847A2 (en) * | 2007-12-11 | 2009-06-18 | The Scripps Research Institute | In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris |
US8592199B2 (en) | 2007-12-28 | 2013-11-26 | David H. Ardell | Genetic encryption |
JP5563990B2 (ja) | 2008-01-03 | 2014-07-30 | ヴェレニウム コーポレイション | トランスフェラーゼおよびオキシドレダクターゼ、それらをコードする核酸並びにそれらを製造および使用する方法 |
AU2009210677A1 (en) * | 2008-02-08 | 2009-08-13 | The Scripps Research Institute | Breaking immunological tolerance with a genetically encoded unnatural amino acid |
US20090197339A1 (en) * | 2008-12-10 | 2009-08-06 | The Scripps Research Institute | In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris |
WO2010068278A2 (en) | 2008-12-10 | 2010-06-17 | The Scripps Research Institute | Production of carrier-peptide conjugates using chemically reactive unnatural amino acids |
US8658394B2 (en) * | 2011-02-02 | 2014-02-25 | Waterstone Pharmaceuticals | Methods, cells and systems for incorporating non-canonical amino acids into proteins |
CN103215235B (zh) * | 2012-01-18 | 2014-11-05 | 中国科学院生物物理研究所 | 3-咪唑基酪氨酸翻译系统及其应用 |
CN103571804B (zh) * | 2012-08-10 | 2015-08-12 | 中国科学院生物物理研究所 | 3-吡唑基酪氨酸翻译系统及其应用 |
DK2906592T3 (en) * | 2012-10-12 | 2018-12-10 | Sutro Biopharma Inc | Proteolytic inactivation of selected proteins in bacterial extracts for enhanced expression |
CN103820410B (zh) * | 2012-11-16 | 2016-03-30 | 中国科学院生物物理研究所 | 3-甲硫酪氨酸翻译系统及其应用 |
CN104004723B (zh) * | 2013-02-22 | 2016-08-17 | 中国科学院生物物理研究所 | 3,5-二氟代酪氨酸翻译系统及其应用 |
CN106047846B (zh) * | 2013-03-22 | 2020-02-04 | 中国科学院生物物理研究所 | 8-羟基喹啉丙氨酸翻译系统及其应用 |
AU2014318579A1 (en) | 2013-09-13 | 2016-04-14 | The California Institute For Biomedical Research | Modified therapeutic agents and compositions thereof |
US10039809B2 (en) | 2013-12-18 | 2018-08-07 | The California Institute For Biomedical Research | Modified therapeutic agents, stapled peptide lipid conjugates, and compositions thereof |
JP7312552B2 (ja) * | 2016-05-16 | 2023-07-21 | ザ ボード オブ リージェンツ オブ ザ ユニバーシティー オブ テキサス システム | ナノ粒子としてのtRNA送達用組成物およびその使用方法 |
CN114644581A (zh) * | 2021-01-04 | 2022-06-21 | 北京惠大生物科技有限公司 | 含芳基硫酚或芳基硒酚经修饰的氨基酸、重组蛋白及其生物合成方法及应用 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1994001131A1 (en) * | 1992-07-13 | 1994-01-20 | Eukarion, Inc. | Transvascular and intracellular delivery of lipidized proteins |
MXPA03009563A (es) | 2001-04-19 | 2004-12-06 | Scripps Research Inst | Incorporacion in vivo de aminoacidos no naturales. |
KR20050073559A (ko) | 2002-10-16 | 2005-07-14 | 더 스크립스 리서치 인스티튜트 | 당단백질 합성 |
US7432092B2 (en) * | 2002-10-16 | 2008-10-07 | The Scripps Research Institute | Site specific incorporation of keto amino acids into proteins |
AU2003300389B2 (en) | 2002-12-22 | 2009-10-08 | The Scripps Research Institute | Protein arrays |
ATE542894T1 (de) * | 2003-04-17 | 2012-02-15 | Scripps Research Inst | Ausweitung des eukaryotischen genetischen codes |
EP2410331B1 (en) | 2003-06-18 | 2015-09-23 | The Scripps Research Institute | Aminoacyl-tRNA synthetase for aminoacylation tRNA with unnatural amino acids |
ATE386133T1 (de) | 2003-07-07 | 2008-03-15 | Scripps Research Inst | Zusammensetzungen der orthogonalen lysyl-trna und aminoacyl-trna synthetase paaren und ihre verwendungen |
US7527943B2 (en) | 2003-07-07 | 2009-05-05 | The Scripps Research Institute | Compositions of orthogonal glutamyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof |
US20060160175A1 (en) | 2003-07-07 | 2006-07-20 | The Scripps Research Institute | Compositions of orthogonal leucyl-trna and aminoacyl-trna synthetase pairs and uses thereof |
EP1687401B1 (en) * | 2003-10-14 | 2012-11-21 | The Scripps Research Institute | Site-specific incorporation of redox active amino acids into proteins |
EP1725251A4 (en) * | 2003-12-18 | 2009-07-01 | Scripps Research Inst | SELECTIVE INCORPORATION OF 5-HYDROXYTRYPTOPHANE IN PROTEINS IN MAMMALIAN CELLS |
US20050287639A1 (en) | 2004-05-17 | 2005-12-29 | California Institute Of Technology | Methods of incorporating amino acid analogs into proteins |
JP2008500050A (ja) | 2004-05-25 | 2008-01-10 | ザ スクリップス リサーチ インスティテュート | 結晶構造決定のための重原子含有非天然アミノ酸の部位特異的蛋白質組込み |
US20060134746A1 (en) | 2004-09-21 | 2006-06-22 | The Scripps Research Institute | Adding photoregulated amino acids to the genetic code |
EP2770053B1 (en) | 2004-09-21 | 2018-02-21 | The Scripps Research Institute | In vivo incorporation of alkynyl amino acids into proteins in eubacteria |
WO2006036779A2 (en) | 2004-09-22 | 2006-04-06 | The Scripps Research Institute | Site-specific labeling of proteins for nmr studies |
JP2008516637A (ja) | 2004-10-20 | 2008-05-22 | ザ スクリップス リサーチ インスティテュート | 真正細菌へのn−アセチルガラクトサミンアミノ酸のインビボ部位特異的組込み |
AU2005330514B2 (en) | 2004-10-27 | 2011-05-12 | The Scripps Research Institute | Orthogonal translation components for the in vivo incorporation of unnatural amino acids |
EP1934343A4 (en) | 2005-10-12 | 2009-09-16 | Scripps Research Inst | SELECTIVE MODIFICATION POST-TRANSLATION OF POLYPEPTIDES EXPRESSED ON THE SURFACE OF PHAGES |
EP1991680B1 (en) | 2006-03-09 | 2013-08-21 | The Scripps Research Institute | System for the expression of orthogonal translation components in eubacterial host cells |
JP5249194B2 (ja) | 2006-03-16 | 2013-07-31 | ザ スクリプス リサーチ インスティチュート | 非天然アミノ酸フェニルセレノシステインを含有するタンパク質の遺伝的にプログラムされた発現 |
-
2007
- 2007-03-13 JP JP2009500449A patent/JP5249194B2/ja not_active Expired - Fee Related
- 2007-03-13 AU AU2007227592A patent/AU2007227592B2/en not_active Ceased
- 2007-03-13 EP EP07753037.6A patent/EP1994165B1/en not_active Not-in-force
- 2007-03-13 BR BRPI0709603-8A patent/BRPI0709603A2/pt not_active Application Discontinuation
- 2007-03-13 RU RU2008135114/10A patent/RU2464315C2/ru not_active IP Right Cessation
- 2007-03-13 WO PCT/US2007/006382 patent/WO2007109035A2/en active Application Filing
- 2007-03-13 CA CA002638772A patent/CA2638772A1/en not_active Abandoned
- 2007-03-13 US US11/724,039 patent/US7790847B2/en active Active
- 2007-03-13 US US12/225,261 patent/US8217145B2/en active Active
- 2007-03-13 KR KR1020087024575A patent/KR20080113226A/ko not_active Application Discontinuation
- 2007-03-13 MX MX2008011669A patent/MX2008011669A/es active IP Right Grant
- 2007-03-13 CN CN2007800092529A patent/CN101405401B/zh not_active Expired - Fee Related
-
2008
- 2008-08-27 IL IL193722A patent/IL193722A0/en unknown
-
2012
- 2012-06-08 US US13/492,240 patent/US8394605B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20120282668A1 (en) | 2012-11-08 |
US8394605B2 (en) | 2013-03-12 |
AU2007227592A1 (en) | 2007-09-27 |
US20090209000A1 (en) | 2009-08-20 |
CN101405401B (zh) | 2013-03-27 |
US8217145B2 (en) | 2012-07-10 |
EP1994165B1 (en) | 2014-11-05 |
JP5249194B2 (ja) | 2013-07-31 |
KR20080113226A (ko) | 2008-12-29 |
JP2009529877A (ja) | 2009-08-27 |
IL193722A0 (en) | 2011-08-01 |
EP1994165A2 (en) | 2008-11-26 |
WO2007109035A3 (en) | 2008-10-16 |
AU2007227592B2 (en) | 2011-11-24 |
RU2008135114A (ru) | 2010-04-27 |
CN101405401A (zh) | 2009-04-08 |
US7790847B2 (en) | 2010-09-07 |
RU2464315C2 (ru) | 2012-10-20 |
WO2007109035A2 (en) | 2007-09-27 |
EP1994165A4 (en) | 2012-11-07 |
CA2638772A1 (en) | 2007-09-27 |
MX2008011669A (es) | 2008-09-22 |
US20070238152A1 (en) | 2007-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5249194B2 (ja) | 非天然アミノ酸フェニルセレノシステインを含有するタンパク質の遺伝的にプログラムされた発現 | |
JP5192150B2 (ja) | 直交リシルtRNAとアミノアシルtRNAシンテターゼの対の組成物及びその使用 | |
AU2005286722B2 (en) | In vivo incorporation of alkynyl amino acids into proteins in eubacteria | |
US8114654B2 (en) | Site-specific incorporation of redox active amino acids into proteins | |
AU2007267950B2 (en) | Genetically encoded fluorescent coumarin amino acids |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B11E | Dismissal acc. art. 34 of ipl - requirements for examination incomplete | ||
B11T | Dismissal of application maintained [chapter 11.20 patent gazette] |