ES2456331T3 - Expresión genéticamente programada de proteínas sulfatadas selectivamente en eubacterias - Google Patents
Expresión genéticamente programada de proteínas sulfatadas selectivamente en eubacterias Download PDFInfo
- Publication number
- ES2456331T3 ES2456331T3 ES07861356.9T ES07861356T ES2456331T3 ES 2456331 T3 ES2456331 T3 ES 2456331T3 ES 07861356 T ES07861356 T ES 07861356T ES 2456331 T3 ES2456331 T3 ES 2456331T3
- Authority
- ES
- Spain
- Prior art keywords
- trna
- amino acid
- protein
- unnatural amino
- aminoacyl
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241000894006 Bacteria Species 0.000 title claims description 42
- 230000014509 gene expression Effects 0.000 title description 38
- 108091005994 sulfated proteins Proteins 0.000 title description 12
- 235000001014 amino acid Nutrition 0.000 claims abstract description 403
- 150000001413 amino acids Chemical class 0.000 claims abstract description 401
- 238000013519 translation Methods 0.000 claims abstract description 129
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims abstract description 23
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims abstract description 19
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims abstract description 14
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims abstract description 14
- 125000000266 alpha-aminoacyl group Chemical group 0.000 claims abstract description 13
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims abstract description 10
- 239000004472 Lysine Substances 0.000 claims abstract description 10
- 239000004471 Glycine Substances 0.000 claims abstract description 9
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims abstract description 9
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims abstract description 9
- 239000004473 Threonine Substances 0.000 claims abstract description 9
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims abstract description 9
- 235000018417 cysteine Nutrition 0.000 claims abstract description 9
- 235000013922 glutamic acid Nutrition 0.000 claims abstract description 9
- 239000004220 glutamic acid Substances 0.000 claims abstract description 9
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims abstract description 8
- 108090000623 proteins and genes Proteins 0.000 claims description 250
- 102000004169 proteins and genes Human genes 0.000 claims description 219
- 235000018102 proteins Nutrition 0.000 claims description 213
- 108020004705 Codon Proteins 0.000 claims description 200
- 238000000034 method Methods 0.000 claims description 155
- 108091033319 polynucleotide Proteins 0.000 claims description 128
- 102000040430 polynucleotide Human genes 0.000 claims description 128
- 239000002157 polynucleotide Substances 0.000 claims description 127
- 150000007523 nucleic acids Chemical class 0.000 claims description 106
- 102000039446 nucleic acids Human genes 0.000 claims description 99
- 108020004707 nucleic acids Proteins 0.000 claims description 99
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 97
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 95
- 229920001184 polypeptide Polymers 0.000 claims description 91
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 claims description 86
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 claims description 86
- 102000003960 Ligases Human genes 0.000 claims description 74
- 108090000364 Ligases Proteins 0.000 claims description 74
- 238000010348 incorporation Methods 0.000 claims description 59
- 241000588724 Escherichia coli Species 0.000 claims description 52
- 239000000203 mixture Substances 0.000 claims description 52
- 238000004519 manufacturing process Methods 0.000 claims description 40
- CIQHWLTYGMYQQR-QMMMGPOBSA-N O(4')-sulfo-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OS(O)(=O)=O)C=C1 CIQHWLTYGMYQQR-QMMMGPOBSA-N 0.000 claims description 34
- 239000013598 vector Substances 0.000 claims description 32
- 230000004044 response Effects 0.000 claims description 28
- 241000203407 Methanocaldococcus jannaschii Species 0.000 claims description 23
- 125000003729 nucleotide group Chemical group 0.000 claims description 22
- 108091060545 Nonsense suppressor Proteins 0.000 claims description 21
- 239000002773 nucleotide Substances 0.000 claims description 20
- 101710146427 Probable tyrosine-tRNA ligase, cytoplasmic Proteins 0.000 claims description 18
- 102000018378 Tyrosine-tRNA ligase Human genes 0.000 claims description 18
- 101710107268 Tyrosine-tRNA ligase, mitochondrial Proteins 0.000 claims description 18
- 238000002741 site-directed mutagenesis Methods 0.000 claims description 10
- 241001112695 Clostridiales Species 0.000 claims description 8
- 238000012258 culturing Methods 0.000 claims description 4
- 241000203353 Methanococcus Species 0.000 claims description 3
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 claims 2
- 229940024606 amino acid Drugs 0.000 description 379
- 210000004027 cell Anatomy 0.000 description 210
- 108020004566 Transfer RNA Proteins 0.000 description 163
- 230000014616 translation Effects 0.000 description 110
- 239000003550 marker Substances 0.000 description 49
- 230000002068 genetic effect Effects 0.000 description 47
- 238000001727 in vivo Methods 0.000 description 44
- 230000001629 suppression Effects 0.000 description 43
- WQPDUTSPKFMPDP-OUMQNGNKSA-N hirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(OS(O)(=O)=O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N2)=O)CSSC1)C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)CSSC1)C(C)C)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 WQPDUTSPKFMPDP-OUMQNGNKSA-N 0.000 description 38
- 108010007267 Hirudins Proteins 0.000 description 37
- 102000004190 Enzymes Human genes 0.000 description 36
- 108090000790 Enzymes Proteins 0.000 description 36
- 102000007625 Hirudins Human genes 0.000 description 36
- 108020005038 Terminator Codon Proteins 0.000 description 36
- 229940088598 enzyme Drugs 0.000 description 35
- 238000002703 mutagenesis Methods 0.000 description 34
- 231100000350 mutagenesis Toxicity 0.000 description 34
- 241000894007 species Species 0.000 description 34
- 125000003275 alpha amino acid group Chemical group 0.000 description 33
- 229940006607 hirudin Drugs 0.000 description 33
- 238000009396 hybridization Methods 0.000 description 31
- 239000000523 sample Substances 0.000 description 26
- 230000015572 biosynthetic process Effects 0.000 description 25
- 230000000694 effects Effects 0.000 description 25
- 229960004441 tyrosine Drugs 0.000 description 25
- 235000002374 tyrosine Nutrition 0.000 description 25
- 238000000338 in vitro Methods 0.000 description 24
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 22
- 230000000295 complement effect Effects 0.000 description 22
- -1 keto amino Chemical class 0.000 description 22
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 22
- 108020004414 DNA Proteins 0.000 description 20
- 238000003786 synthesis reaction Methods 0.000 description 20
- 108090000190 Thrombin Proteins 0.000 description 19
- 230000006870 function Effects 0.000 description 19
- 230000035772 mutation Effects 0.000 description 19
- 238000003556 assay Methods 0.000 description 18
- 239000013612 plasmid Substances 0.000 description 18
- 238000006467 substitution reaction Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 15
- 238000012360 testing method Methods 0.000 description 15
- 229960004072 thrombin Drugs 0.000 description 15
- 238000004422 calculation algorithm Methods 0.000 description 14
- 230000005764 inhibitory process Effects 0.000 description 14
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 14
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 14
- 238000005406 washing Methods 0.000 description 14
- 239000000126 substance Substances 0.000 description 13
- 230000001225 therapeutic effect Effects 0.000 description 13
- 230000006229 amino acid addition Effects 0.000 description 12
- 238000010276 construction Methods 0.000 description 12
- 230000001965 increasing effect Effects 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 12
- 239000000758 substrate Substances 0.000 description 12
- 238000005670 sulfation reaction Methods 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 11
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 10
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- 239000003795 chemical substances by application Substances 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- 241000203069 Archaea Species 0.000 description 9
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 9
- 241000700605 Viruses Species 0.000 description 9
- 108010005774 beta-Galactosidase Proteins 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 108020005098 Anticodon Proteins 0.000 description 8
- 102100026189 Beta-galactosidase Human genes 0.000 description 8
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 8
- 241000206602 Eukaryota Species 0.000 description 8
- 239000003146 anticoagulant agent Substances 0.000 description 8
- 229940127219 anticoagulant drug Drugs 0.000 description 8
- 101150066555 lacZ gene Proteins 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 230000019635 sulfation Effects 0.000 description 8
- 230000006107 tyrosine sulfation Effects 0.000 description 8
- 108010016529 Bacillus amyloliquefaciens ribonuclease Proteins 0.000 description 7
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 7
- 230000003115 biocidal effect Effects 0.000 description 7
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 7
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 7
- 229960005091 chloramphenicol Drugs 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 239000003112 inhibitor Substances 0.000 description 7
- 239000012528 membrane Substances 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- 231100000331 toxic Toxicity 0.000 description 7
- 230000002588 toxic effect Effects 0.000 description 7
- WHUUTDBJXJRKMK-GSVOUGTGSA-N D-glutamic acid Chemical compound OC(=O)[C@H](N)CCC(O)=O WHUUTDBJXJRKMK-GSVOUGTGSA-N 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 6
- 241000205062 Halobacterium Species 0.000 description 6
- 241000238631 Hexapoda Species 0.000 description 6
- 108020004485 Nonsense Codon Proteins 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 6
- 229960000723 ampicillin Drugs 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 229910052739 hydrogen Inorganic materials 0.000 description 6
- 239000001257 hydrogen Substances 0.000 description 6
- 238000011068 loading method Methods 0.000 description 6
- 235000008729 phenylalanine Nutrition 0.000 description 6
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 6
- 230000004481 post-translational protein modification Effects 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 230000036964 tight binding Effects 0.000 description 6
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 5
- 230000001851 biosynthetic effect Effects 0.000 description 5
- 238000012512 characterization method Methods 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 210000003527 eukaryotic cell Anatomy 0.000 description 5
- 230000001976 improved effect Effects 0.000 description 5
- 239000003262 industrial enzyme Substances 0.000 description 5
- FIBJDTSHOUXTKV-BRHMIFOHSA-N lepirudin Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](Cc1c[nH]cn1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@@H]1CSSC[C@@H]2NC(=O)[C@@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CSSC[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)CNC2=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CSSC[C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](Cc2ccc(O)cc2)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)[C@@H](C)O)[C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1)C(C)C)C(C)C)[C@@H](C)O)[C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O FIBJDTSHOUXTKV-BRHMIFOHSA-N 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 230000010363 phase shift Effects 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 238000002708 random mutagenesis Methods 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 229960003766 thrombin (human) Drugs 0.000 description 5
- 239000003868 thrombin inhibitor Substances 0.000 description 5
- 230000013819 transposition, DNA-mediated Effects 0.000 description 5
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 4
- 244000105975 Antidesma platyphyllum Species 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 4
- 244000063299 Bacillus subtilis Species 0.000 description 4
- 235000014469 Bacillus subtilis Nutrition 0.000 description 4
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 108090000204 Dipeptidase 1 Proteins 0.000 description 4
- 241000186394 Eubacterium Species 0.000 description 4
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 4
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 4
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 4
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 4
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 4
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 4
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 235000004279 alanine Nutrition 0.000 description 4
- 235000008206 alpha-amino acids Nutrition 0.000 description 4
- 238000005349 anion exchange Methods 0.000 description 4
- 239000003242 anti bacterial agent Substances 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 235000009697 arginine Nutrition 0.000 description 4
- 125000003118 aryl group Chemical group 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 230000008827 biological function Effects 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 229940126864 fibroblast growth factor Drugs 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 150000002308 glutamine derivatives Chemical class 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 235000009424 haa Nutrition 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 239000003446 ligand Substances 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 239000002853 nucleic acid probe Substances 0.000 description 4
- 229960005190 phenylalanine Drugs 0.000 description 4
- 239000013641 positive control Substances 0.000 description 4
- 235000013930 proline Nutrition 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 125000001424 substituent group Chemical group 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 210000005253 yeast cell Anatomy 0.000 description 4
- XLEYFDVVXLMULC-UHFFFAOYSA-N 2',4',6'-trihydroxyacetophenone Chemical compound CC(=O)C1=C(O)C=C(O)C=C1O XLEYFDVVXLMULC-UHFFFAOYSA-N 0.000 description 3
- 241000193830 Bacillus <bacterium> Species 0.000 description 3
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 3
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 3
- 102100021943 C-C motif chemokine 2 Human genes 0.000 description 3
- 101710155857 C-C motif chemokine 2 Proteins 0.000 description 3
- 108010083060 CX 397 Proteins 0.000 description 3
- 102000019034 Chemokines Human genes 0.000 description 3
- 108010012236 Chemokines Proteins 0.000 description 3
- 241000195493 Cryptophyta Species 0.000 description 3
- 108090000385 Fibroblast growth factor 7 Proteins 0.000 description 3
- 102000003972 Fibroblast growth factor 7 Human genes 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 101000611183 Homo sapiens Tumor necrosis factor Proteins 0.000 description 3
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 241001529871 Methanococcus maripaludis Species 0.000 description 3
- 241000204641 Methanopyrus kandleri Species 0.000 description 3
- 241000205274 Methanosarcina mazei Species 0.000 description 3
- 241001302042 Methanothermobacter thermautotrophicus Species 0.000 description 3
- 241000736843 Pyrobaculum aerophilum Species 0.000 description 3
- 241001148023 Pyrococcus abyssi Species 0.000 description 3
- 102000013275 Somatomedins Human genes 0.000 description 3
- 102100021669 Stromal cell-derived factor 1 Human genes 0.000 description 3
- 241000205091 Sulfolobus solfataricus Species 0.000 description 3
- 108090001033 Sulfotransferases Proteins 0.000 description 3
- 102000004896 Sulfotransferases Human genes 0.000 description 3
- 229940122388 Thrombin inhibitor Drugs 0.000 description 3
- 108060008683 Tumor Necrosis Factor Receptor Proteins 0.000 description 3
- 102100040247 Tumor necrosis factor Human genes 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 239000012190 activator Substances 0.000 description 3
- 150000001371 alpha-amino acids Chemical class 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 102000006635 beta-lactamase Human genes 0.000 description 3
- 238000006664 bond formation reaction Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 3
- 238000007429 general method Methods 0.000 description 3
- 239000003102 growth factor Substances 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000002757 inflammatory effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 238000001819 mass spectrum Methods 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 238000001823 molecular biology technique Methods 0.000 description 3
- UPSFMJHZUCSEHU-JYGUBCOQSA-N n-[(2s,3r,4r,5s,6r)-2-[(2r,3s,4r,5r,6s)-5-acetamido-4-hydroxy-2-(hydroxymethyl)-6-(4-methyl-2-oxochromen-7-yl)oxyoxan-3-yl]oxy-4,5-dihydroxy-6-(hydroxymethyl)oxan-3-yl]acetamide Chemical compound CC(=O)N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@H]1[C@H](O)[C@@H](NC(C)=O)[C@H](OC=2C=C3OC(=O)C=C(C)C3=CC=2)O[C@@H]1CO UPSFMJHZUCSEHU-JYGUBCOQSA-N 0.000 description 3
- 238000007899 nucleic acid hybridization Methods 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 3
- 150000002994 phenylalanines Chemical class 0.000 description 3
- 229920000570 polyether Polymers 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 210000003705 ribosome Anatomy 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000010183 spectrum analysis Methods 0.000 description 3
- 239000004575 stone Substances 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 231100000765 toxin Toxicity 0.000 description 3
- 239000003053 toxin Substances 0.000 description 3
- 108700012359 toxins Proteins 0.000 description 3
- 102000003298 tumor necrosis factor receptor Human genes 0.000 description 3
- 238000011179 visual inspection Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- ZXSBHXZKWRIEIA-JTQLQIEISA-N (2s)-3-(4-acetylphenyl)-2-azaniumylpropanoate Chemical compound CC(=O)C1=CC=C(C[C@H](N)C(O)=O)C=C1 ZXSBHXZKWRIEIA-JTQLQIEISA-N 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- FBTSQILOGYXGMD-LURJTMIESA-N 3-nitro-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C([N+]([O-])=O)=C1 FBTSQILOGYXGMD-LURJTMIESA-N 0.000 description 2
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 2
- CMUHFUGDYMFHEI-QMMMGPOBSA-N 4-amino-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-QMMMGPOBSA-N 0.000 description 2
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 2
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 2
- 102000055025 Adenosine deaminases Human genes 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 241000205042 Archaeoglobus fulgidus Species 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 2
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 2
- 101150013553 CD40 gene Proteins 0.000 description 2
- 108090000835 CX3C Chemokine Receptor 1 Proteins 0.000 description 2
- 102100039196 CX3C chemokine receptor 1 Human genes 0.000 description 2
- 108010008951 Chemokine CXCL12 Proteins 0.000 description 2
- 102000006573 Chemokine CXCL12 Human genes 0.000 description 2
- 101800001982 Cholecystokinin Proteins 0.000 description 2
- 102400000883 Cholecystokinin-33 Human genes 0.000 description 2
- 101800001100 Cholecystokinin-33 Proteins 0.000 description 2
- YOOVTUPUBVHMPG-UHFFFAOYSA-N Coformycin Natural products OC1C(O)C(CO)OC1N1C(NC=NCC2O)=C2N=C1 YOOVTUPUBVHMPG-UHFFFAOYSA-N 0.000 description 2
- 241000192700 Cyanobacteria Species 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 229940123900 Direct thrombin inhibitor Drugs 0.000 description 2
- 101100377506 Drosophila melanogaster 14-3-3zeta gene Proteins 0.000 description 2
- 102000003886 Glycoproteins Human genes 0.000 description 2
- 108090000288 Glycoproteins Proteins 0.000 description 2
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 2
- 241000204933 Haloferax volcanii Species 0.000 description 2
- 101000617130 Homo sapiens Stromal cell-derived factor 1 Proteins 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- 101000668058 Infectious salmon anemia virus (isolate Atlantic salmon/Norway/810/9/99) RNA-directed RNA polymerase catalytic subunit Proteins 0.000 description 2
- 108010050904 Interferons Proteins 0.000 description 2
- 102000014150 Interferons Human genes 0.000 description 2
- 108010002352 Interleukin-1 Proteins 0.000 description 2
- 108010002350 Interleukin-2 Proteins 0.000 description 2
- 108090001007 Interleukin-8 Proteins 0.000 description 2
- 108010063738 Interleukins Proteins 0.000 description 2
- 102000015696 Interleukins Human genes 0.000 description 2
- 102100020880 Kit ligand Human genes 0.000 description 2
- 101710177504 Kit ligand Proteins 0.000 description 2
- WTDRDQBEARUVNC-LURJTMIESA-N L-DOPA Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-LURJTMIESA-N 0.000 description 2
- WTDRDQBEARUVNC-UHFFFAOYSA-N L-Dopa Natural products OC(=O)C(N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-UHFFFAOYSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- ZFOMKMMPBOQKMC-KXUCPTDWSA-N L-pyrrolysine Chemical compound C[C@@H]1CC=N[C@H]1C(=O)NCCCC[C@H]([NH3+])C([O-])=O ZFOMKMMPBOQKMC-KXUCPTDWSA-N 0.000 description 2
- ZKZBPNGNEQAJSX-REOHCLBHSA-N L-selenocysteine Chemical compound [SeH]C[C@H](N)C(O)=O ZKZBPNGNEQAJSX-REOHCLBHSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 102000003820 Lipoxygenases Human genes 0.000 description 2
- 108090000128 Lipoxygenases Proteins 0.000 description 2
- 239000006142 Luria-Bertani Agar Substances 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 102100034925 P-selectin glycoprotein ligand 1 Human genes 0.000 description 2
- 101710137390 P-selectin glycoprotein ligand 1 Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 239000004721 Polyphenylene oxide Substances 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 241000205156 Pyrococcus furiosus Species 0.000 description 2
- 241000522615 Pyrococcus horikoshii Species 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- 241000160715 Sulfolobus tokodaii Species 0.000 description 2
- 102000019197 Superoxide Dismutase Human genes 0.000 description 2
- 108010012715 Superoxide dismutase Proteins 0.000 description 2
- MUMGGOZAMZWBJJ-DYKIIFRCSA-N Testostosterone Chemical compound O=C1CC[C@]2(C)[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 MUMGGOZAMZWBJJ-DYKIIFRCSA-N 0.000 description 2
- HATRDXDCPOXQJX-UHFFFAOYSA-N Thapsigargin Natural products CCCCCCCC(=O)OC1C(OC(O)C(=C/C)C)C(=C2C3OC(=O)C(C)(O)C3(O)C(CC(C)(OC(=O)C)C12)OC(=O)CCC)C HATRDXDCPOXQJX-UHFFFAOYSA-N 0.000 description 2
- 241000204673 Thermoplasma acidophilum Species 0.000 description 2
- 241000489996 Thermoplasma volcanium Species 0.000 description 2
- 241000589499 Thermus thermophilus Species 0.000 description 2
- 101000712605 Theromyzon tessulatum Theromin Proteins 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 125000000304 alkynyl group Chemical group 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 125000000129 anionic group Chemical group 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 101150024767 arnT gene Proteins 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 238000003149 assay kit Methods 0.000 description 2
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical class NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 2
- 239000003114 blood coagulation factor Substances 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- 210000002421 cell wall Anatomy 0.000 description 2
- WHTVZRBIWZFKQO-UHFFFAOYSA-N chloroquine Chemical compound ClC1=CC=C2C(NC(C)CCCN(CC)CC)=CC=NC2=C1 WHTVZRBIWZFKQO-UHFFFAOYSA-N 0.000 description 2
- QFLBZJPOIZFFJQ-UHFFFAOYSA-N cholecystokinin 33 Chemical compound C=1NC2=CC=CC=C2C=1CC(C(=O)NC(CCSC)C(=O)NC(CC(O)=O)C(=O)NC(CC=1C=CC=CC=1)C(N)=O)NC(=O)CNC(=O)C(CCSC)NC(=O)C(C=1C=CC(OS(O)(=O)=O)=CC=1)NC(=O)C(CC(O)=O)NC(=O)C(CCCNC(N)=N)NC(=O)C(CC(O)=O)NC(=O)C(CO)NC(=O)C(C(C)CC)NC(=O)C(CCCNC(N)=N)NC(=O)C(NC(=O)C(CO)NC(=O)C1N(CCC1)C(=O)C(CC(O)=O)NC(=O)C(CC(C)C)NC(=O)C(CC(N)=O)NC(=O)C(CCC(N)=O)NC(=O)C(CC(C)C)NC(=O)C(CC(N)=O)NC(=O)C(CCCCN)NC(=O)C(NC(=O)C(NC(=O)C(CO)NC(=O)C(CCSC)NC(=O)C(CCCNC(N)=N)NC(=O)CNC(=O)C(CO)NC(=O)C1N(CCC1)C(=O)C(C)NC(=O)C(N)CCCCN)C(C)CC)C(C)C)CC1=CNC=N1 QFLBZJPOIZFFJQ-UHFFFAOYSA-N 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- YOOVTUPUBVHMPG-LODYRLCVSA-O coformycin(1+) Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C([NH+]=CNC[C@H]2O)=C2N=C1 YOOVTUPUBVHMPG-LODYRLCVSA-O 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 102000006834 complement receptors Human genes 0.000 description 2
- 108010047295 complement receptors Proteins 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 241001493065 dsRNA viruses Species 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000007824 enzymatic assay Methods 0.000 description 2
- 101150024902 glnS gene Proteins 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 235000004554 glutamine Nutrition 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 229930195733 hydrocarbon Natural products 0.000 description 2
- 150000002430 hydrocarbons Chemical class 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 229940047124 interferons Drugs 0.000 description 2
- 229940047122 interleukins Drugs 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 125000000468 ketone group Chemical group 0.000 description 2
- 238000011005 laboratory method Methods 0.000 description 2
- 229960004408 lepirudin Drugs 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012269 metabolic engineering Methods 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 230000003472 neutralizing effect Effects 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 231100000590 oncogenic Toxicity 0.000 description 2
- 230000002246 oncogenic effect Effects 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000035699 permeability Effects 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 2
- 150000003148 prolines Chemical class 0.000 description 2
- 230000004224 protection Effects 0.000 description 2
- 230000004850 protein–protein interaction Effects 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 229940055619 selenocysteine Drugs 0.000 description 2
- 235000016491 selenocysteine Nutrition 0.000 description 2
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 150000003385 sodium Chemical class 0.000 description 2
- 210000002536 stromal cell Anatomy 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 238000006257 total synthesis reaction Methods 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- OGNSCSPNOLGXSM-UHFFFAOYSA-N (+/-)-DABA Chemical class NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 1
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- UNJYREYSCKYEQJ-QZIVUABBSA-N (2S)-2-amino-3-hydroxypropanoic acid (2S,3S)-2-amino-3-methylpentanoic acid (2S)-pyrrolidine-2-carboxylic acid Chemical compound OC[C@H](N)C(O)=O.OC(=O)[C@@H]1CCCN1.CC[C@H](C)[C@H](N)C(O)=O UNJYREYSCKYEQJ-QZIVUABBSA-N 0.000 description 1
- RWLSBXBFZHDHHX-VIFPVBQESA-N (2s)-2-(naphthalen-2-ylamino)propanoic acid Chemical compound C1=CC=CC2=CC(N[C@@H](C)C(O)=O)=CC=C21 RWLSBXBFZHDHHX-VIFPVBQESA-N 0.000 description 1
- VFCYASLQFGXHTQ-VIFPVBQESA-N (2s)-2-[benzyl(nitro)amino]-3-hydroxypropanoic acid Chemical compound OC[C@@H](C(O)=O)N([N+]([O-])=O)CC1=CC=CC=C1 VFCYASLQFGXHTQ-VIFPVBQESA-N 0.000 description 1
- YYTDJPUFAVPHQA-VKHMYHEASA-N (2s)-2-amino-3-(2,3,4,5,6-pentafluorophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=C(F)C(F)=C(F)C(F)=C1F YYTDJPUFAVPHQA-VKHMYHEASA-N 0.000 description 1
- KQZQZOQFUQXPLW-YFKPBYRVSA-N (2s)-2-amino-3-(3,4,5-trihydroxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC(O)=C(O)C(O)=C1 KQZQZOQFUQXPLW-YFKPBYRVSA-N 0.000 description 1
- POGSZHUEECCEAP-ZETCQYMHSA-N (2s)-2-amino-3-(3-amino-4-hydroxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(N)=C1 POGSZHUEECCEAP-ZETCQYMHSA-N 0.000 description 1
- LJHYWUVYIKCPGU-VIFPVBQESA-N (2s)-2-amino-3-[4-(carboxymethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(CC(O)=O)C=C1 LJHYWUVYIKCPGU-VIFPVBQESA-N 0.000 description 1
- NLFOHNAFILVHGM-AWEZNQCLSA-N (2s)-2-amino-3-[4-[(2-nitrophenyl)methoxy]phenyl]propanoic acid Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1OCC1=CC=CC=C1[N+]([O-])=O NLFOHNAFILVHGM-AWEZNQCLSA-N 0.000 description 1
- PSLCKQYQNVNTQI-BHFSHLQUSA-N (2s)-2-aminobutanedioic acid;(2s)-2-aminopentanedioic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O.OC(=O)[C@@H](N)CCC(O)=O PSLCKQYQNVNTQI-BHFSHLQUSA-N 0.000 description 1
- NEMHIKRLROONTL-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(4-azidophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N=[N+]=[N-])C=C1 NEMHIKRLROONTL-QMMMGPOBSA-N 0.000 description 1
- GTVVZTAFGPQSPC-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(4-nitrophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=C([N+]([O-])=O)C=C1 GTVVZTAFGPQSPC-QMMMGPOBSA-N 0.000 description 1
- BNIFSVVAHBLNTN-XKKUQSFHSA-N (2s)-4-amino-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-1-[(2s)-4-amino-2-[[2-[[(2s)-2-[[(2s)-2-[[(2s)-1-[(2s)-6-amino-2-[[(2s)-2-[[(2s)-2-[[(2s,3r)-2-amino-3-hydroxybutanoyl]amino]-4-methylsulfanylbutanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]hexan Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N1[C@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O)CCC1 BNIFSVVAHBLNTN-XKKUQSFHSA-N 0.000 description 1
- 108010052418 (N-(2-((4-((2-((4-(9-acridinylamino)phenyl)amino)-2-oxoethyl)amino)-4-oxobutyl)amino)-1-(1H-imidazol-4-ylmethyl)-1-oxoethyl)-6-(((-2-aminoethyl)amino)methyl)-2-pyridinecarboxamidato) iron(1+) Proteins 0.000 description 1
- WHTVZRBIWZFKQO-AWEZNQCLSA-N (S)-chloroquine Chemical compound ClC1=CC=C2C(N[C@@H](C)CCCN(CC)CC)=CC=NC2=C1 WHTVZRBIWZFKQO-AWEZNQCLSA-N 0.000 description 1
- RXMWXENJQAINCC-DMTCNVIQSA-N 2,5-didehydro-D-gluconic acid Chemical compound OCC(=O)[C@@H](O)[C@H](O)C(=O)C(O)=O RXMWXENJQAINCC-DMTCNVIQSA-N 0.000 description 1
- RXMWXENJQAINCC-UHFFFAOYSA-N 2,5-diketo-D-gluconic acid Natural products OCC(=O)C(O)C(O)C(=O)C(O)=O RXMWXENJQAINCC-UHFFFAOYSA-N 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- JZRBSTONIYRNRI-VIFPVBQESA-N 3-methylphenylalanine Chemical compound CC1=CC=CC(C[C@H](N)C(O)=O)=C1 JZRBSTONIYRNRI-VIFPVBQESA-N 0.000 description 1
- IRZQDMYEJPNDEN-UHFFFAOYSA-N 3-phenyl-2-aminobutanoic acid Natural products OC(=O)C(N)C(C)C1=CC=CC=C1 IRZQDMYEJPNDEN-UHFFFAOYSA-N 0.000 description 1
- PZNQZSRPDOEBMS-QMMMGPOBSA-N 4-iodo-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(I)C=C1 PZNQZSRPDOEBMS-QMMMGPOBSA-N 0.000 description 1
- GTVVZTAFGPQSPC-UHFFFAOYSA-N 4-nitrophenylalanine Chemical compound OC(=O)C(N)CC1=CC=C([N+]([O-])=O)C=C1 GTVVZTAFGPQSPC-UHFFFAOYSA-N 0.000 description 1
- LDCYZAJDBXYCGN-VIFPVBQESA-N 5-hydroxy-L-tryptophan Chemical compound C1=C(O)C=C2C(C[C@H](N)C(O)=O)=CNC2=C1 LDCYZAJDBXYCGN-VIFPVBQESA-N 0.000 description 1
- 229940000681 5-hydroxytryptophan Drugs 0.000 description 1
- RRHXPUCIXLAHIY-UHFFFAOYSA-N 7-aminochromen-2-one Chemical compound C1=CC(=O)OC2=CC(N)=CC=C21 RRHXPUCIXLAHIY-UHFFFAOYSA-N 0.000 description 1
- CJIJXIFQYOPWTF-UHFFFAOYSA-N 7-hydroxycoumarin Natural products O1C(=O)C=CC2=CC(O)=CC=C21 CJIJXIFQYOPWTF-UHFFFAOYSA-N 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- PQSUYGKTWSAVDQ-UHFFFAOYSA-N Aldosterone Natural products C1CC2C3CCC(C(=O)CO)C3(C=O)CC(O)C2C2(C)C1=CC(=O)CC2 PQSUYGKTWSAVDQ-UHFFFAOYSA-N 0.000 description 1
- PQSUYGKTWSAVDQ-ZVIOFETBSA-N Aldosterone Chemical compound C([C@@]1([C@@H](C(=O)CO)CC[C@H]1[C@@H]1CC2)C=O)[C@H](O)[C@@H]1[C@]1(C)C2=CC(=O)CC1 PQSUYGKTWSAVDQ-ZVIOFETBSA-N 0.000 description 1
- 241000004176 Alphacoronavirus Species 0.000 description 1
- 108700023418 Amidases Proteins 0.000 description 1
- 102000004092 Amidohydrolases Human genes 0.000 description 1
- 108090000531 Amidohydrolases Proteins 0.000 description 1
- 102000006534 Amino Acid Isomerases Human genes 0.000 description 1
- 108010008830 Amino Acid Isomerases Proteins 0.000 description 1
- 102400000068 Angiostatin Human genes 0.000 description 1
- 108010079709 Angiostatins Proteins 0.000 description 1
- 102000007592 Apolipoproteins Human genes 0.000 description 1
- 108010071619 Apolipoproteins Proteins 0.000 description 1
- 108010083590 Apoproteins Proteins 0.000 description 1
- 102000006410 Apoproteins Human genes 0.000 description 1
- OZDNDGXASTWERN-CTNGQTDRSA-N Apovincamine Chemical compound C1=CC=C2C(CCN3CCC4)=C5[C@@H]3[C@]4(CC)C=C(C(=O)OC)N5C2=C1 OZDNDGXASTWERN-CTNGQTDRSA-N 0.000 description 1
- 101000716807 Arabidopsis thaliana Protein SCO1 homolog 1, mitochondrial Proteins 0.000 description 1
- 241000205046 Archaeoglobus Species 0.000 description 1
- 241000712891 Arenavirus Species 0.000 description 1
- 241000238421 Arthropoda Species 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 101800001288 Atrial natriuretic factor Proteins 0.000 description 1
- 102400001282 Atrial natriuretic peptide Human genes 0.000 description 1
- 101800001890 Atrial natriuretic peptide Proteins 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 102100031151 C-C chemokine receptor type 2 Human genes 0.000 description 1
- 101710149815 C-C chemokine receptor type 2 Proteins 0.000 description 1
- 102100032367 C-C motif chemokine 5 Human genes 0.000 description 1
- 102100032366 C-C motif chemokine 7 Human genes 0.000 description 1
- 102100025248 C-X-C motif chemokine 10 Human genes 0.000 description 1
- 101710098275 C-X-C motif chemokine 10 Proteins 0.000 description 1
- 102100039398 C-X-C motif chemokine 2 Human genes 0.000 description 1
- 102100036150 C-X-C motif chemokine 5 Human genes 0.000 description 1
- 102100036153 C-X-C motif chemokine 6 Human genes 0.000 description 1
- 101710085504 C-X-C motif chemokine 6 Proteins 0.000 description 1
- 102100036170 C-X-C motif chemokine 9 Human genes 0.000 description 1
- 101710085500 C-X-C motif chemokine 9 Proteins 0.000 description 1
- 102000001902 CC Chemokines Human genes 0.000 description 1
- 108010040471 CC Chemokines Proteins 0.000 description 1
- 108700012434 CCL3 Proteins 0.000 description 1
- 102000004497 CCR2 Receptors Human genes 0.000 description 1
- 108010017312 CCR2 Receptors Proteins 0.000 description 1
- 108010029697 CD40 Ligand Proteins 0.000 description 1
- 102100032937 CD40 ligand Human genes 0.000 description 1
- 102100032912 CD44 antigen Human genes 0.000 description 1
- 108050006947 CXC Chemokine Proteins 0.000 description 1
- 102000019388 CXC chemokine Human genes 0.000 description 1
- 102400000113 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 102000000013 Chemokine CCL3 Human genes 0.000 description 1
- 108010055166 Chemokine CCL5 Proteins 0.000 description 1
- 108010055124 Chemokine CCL7 Proteins 0.000 description 1
- 102000000012 Chemokine CCL8 Human genes 0.000 description 1
- 108010055204 Chemokine CCL8 Proteins 0.000 description 1
- 108010078239 Chemokine CX3CL1 Proteins 0.000 description 1
- 108010014419 Chemokine CXCL1 Proteins 0.000 description 1
- 102000016950 Chemokine CXCL1 Human genes 0.000 description 1
- 102000009410 Chemokine receptor Human genes 0.000 description 1
- 108050000299 Chemokine receptor Proteins 0.000 description 1
- 241000223782 Ciliophora Species 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 102100023804 Coagulation factor VII Human genes 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 108010071942 Colony-Stimulating Factors Proteins 0.000 description 1
- 229940124073 Complement inhibitor Drugs 0.000 description 1
- OMFXVFTZEKFJBZ-UHFFFAOYSA-N Corticosterone Natural products O=C1CCC2(C)C3C(O)CC(C)(C(CC4)C(=O)CO)C4C3CCC2=C1 OMFXVFTZEKFJBZ-UHFFFAOYSA-N 0.000 description 1
- 241000557626 Corvus corax Species 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 1
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 description 1
- 229930195713 D-glutamate Natural products 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 101710141836 DNA-binding protein HU homolog Proteins 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 108010024212 E-Selectin Proteins 0.000 description 1
- 102100023471 E-selectin Human genes 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000224431 Entamoeba Species 0.000 description 1
- 101710104662 Enterotoxin type C-3 Proteins 0.000 description 1
- 102400001368 Epidermal growth factor Human genes 0.000 description 1
- 101800003838 Epidermal growth factor Proteins 0.000 description 1
- 108020002908 Epoxide hydrolase Proteins 0.000 description 1
- 102000005486 Epoxide hydrolase Human genes 0.000 description 1
- 241001125671 Eretmochelys imbricata Species 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 102100031939 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 101900234631 Escherichia coli DNA polymerase I Proteins 0.000 description 1
- 241001302160 Escherichia coli str. K-12 substr. DH10B Species 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 102100030844 Exocyst complex component 1 Human genes 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 108010023321 Factor VII Proteins 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 108090000368 Fibroblast growth factor 8 Proteins 0.000 description 1
- 102100037362 Fibronectin Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 108090000331 Firefly luciferases Proteins 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 102000013818 Fractalkine Human genes 0.000 description 1
- 108010058643 Fungal Proteins Proteins 0.000 description 1
- 102100040837 Galactoside alpha-(1,2)-fucosyltransferase 2 Human genes 0.000 description 1
- 101710115997 Gamma-tubulin complex component 2 Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 241000224466 Giardia Species 0.000 description 1
- VHLZDSUANXBJHW-QWRGUYRKSA-N Gln-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHLZDSUANXBJHW-QWRGUYRKSA-N 0.000 description 1
- 102000004366 Glucosidases Human genes 0.000 description 1
- 108010056771 Glucosidases Proteins 0.000 description 1
- 102000004547 Glucosylceramidase Human genes 0.000 description 1
- 108010017544 Glucosylceramidase Proteins 0.000 description 1
- 102000000340 Glucosyltransferases Human genes 0.000 description 1
- 108010055629 Glucosyltransferases Proteins 0.000 description 1
- 102000006771 Gonadotropins Human genes 0.000 description 1
- 108010086677 Gonadotropins Proteins 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 102100034221 Growth-regulated alpha protein Human genes 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 108090000031 Hedgehog Proteins Proteins 0.000 description 1
- 102000003693 Hedgehog Proteins Human genes 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 241000545744 Hirudinea Species 0.000 description 1
- 241000237902 Hirudo medicinalis Species 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000889128 Homo sapiens C-X-C motif chemokine 2 Proteins 0.000 description 1
- 101000947186 Homo sapiens C-X-C motif chemokine 5 Proteins 0.000 description 1
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 1
- 101000893710 Homo sapiens Galactoside alpha-(1,2)-fucosyltransferase 2 Proteins 0.000 description 1
- 101001069921 Homo sapiens Growth-regulated alpha protein Proteins 0.000 description 1
- 101000582320 Homo sapiens Neurogenic differentiation factor 6 Proteins 0.000 description 1
- 101000973997 Homo sapiens Nucleosome assembly protein 1-like 4 Proteins 0.000 description 1
- 101000947178 Homo sapiens Platelet basic protein Proteins 0.000 description 1
- 101000582950 Homo sapiens Platelet factor 4 Proteins 0.000 description 1
- 101001076715 Homo sapiens RNA-binding protein 39 Proteins 0.000 description 1
- 101000652229 Homo sapiens Suppressor of cytokine signaling 7 Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 206010053317 Hydrophobia Diseases 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 235000000177 Indigofera tinctoria Nutrition 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 1
- 102000048143 Insulin-Like Growth Factor II Human genes 0.000 description 1
- 108090001117 Insulin-Like Growth Factor II Proteins 0.000 description 1
- 102100022339 Integrin alpha-L Human genes 0.000 description 1
- 108010064593 Intercellular Adhesion Molecule-1 Proteins 0.000 description 1
- 102100037877 Intercellular adhesion molecule 1 Human genes 0.000 description 1
- 102100026720 Interferon beta Human genes 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 108090000174 Interleukin-10 Proteins 0.000 description 1
- 108090000177 Interleukin-11 Proteins 0.000 description 1
- 108010065805 Interleukin-12 Proteins 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 229930194542 Keto Natural products 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- 108010001831 LDL receptors Proteins 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 108010063045 Lactoferrin Proteins 0.000 description 1
- 102000010445 Lactoferrin Human genes 0.000 description 1
- 241000222722 Leishmania <genus> Species 0.000 description 1
- 108010054320 Lignin peroxidase Proteins 0.000 description 1
- 101710155614 Ligninase A Proteins 0.000 description 1
- 101710155621 Ligninase B Proteins 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 108010064548 Lymphocyte Function-Associated Antigen-1 Proteins 0.000 description 1
- 102100027754 Mast/stem cell growth factor receptor Kit Human genes 0.000 description 1
- 241001074903 Methanobacteria Species 0.000 description 1
- 241000191938 Micrococcus luteus Species 0.000 description 1
- 241000243190 Microsporidia Species 0.000 description 1
- 101710174628 Modulating protein YmoA Proteins 0.000 description 1
- 241001430197 Mollicutes Species 0.000 description 1
- 108090000143 Mouse Proteins Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 231100000678 Mycotoxin Toxicity 0.000 description 1
- 102100030856 Myoglobin Human genes 0.000 description 1
- 108010062374 Myoglobin Proteins 0.000 description 1
- CBQJSKKFNMDLON-JTQLQIEISA-N N-acetyl-L-phenylalanine Chemical compound CC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CBQJSKKFNMDLON-JTQLQIEISA-N 0.000 description 1
- 102100030589 Neurogenic differentiation factor 6 Human genes 0.000 description 1
- 102220592584 Neuroserpin_L162K_mutation Human genes 0.000 description 1
- 108010015406 Neurturin Proteins 0.000 description 1
- 102000001839 Neurturin Human genes 0.000 description 1
- 108010033272 Nitrilase Proteins 0.000 description 1
- 108010024026 Nitrile hydratase Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- GEYBMYRBIABFTA-VIFPVBQESA-N O-methyl-L-tyrosine Chemical compound COC1=CC=C(C[C@H](N)C(O)=O)C=C1 GEYBMYRBIABFTA-VIFPVBQESA-N 0.000 description 1
- 102000004140 Oncostatin M Human genes 0.000 description 1
- 108090000630 Oncostatin M Proteins 0.000 description 1
- 241000713112 Orthobunyavirus Species 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 108090000417 Oxygenases Proteins 0.000 description 1
- 102000004020 Oxygenases Human genes 0.000 description 1
- 108090000445 Parathyroid hormone Proteins 0.000 description 1
- 102000003982 Parathyroid hormone Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 108010001014 Plasminogen Activators Proteins 0.000 description 1
- 102000001938 Plasminogen Activators Human genes 0.000 description 1
- 102000023159 Platelet Glycoprotein GPIb-IX Complex Human genes 0.000 description 1
- 108010045766 Platelet Glycoprotein GPIb-IX Complex Proteins 0.000 description 1
- 102100036154 Platelet basic protein Human genes 0.000 description 1
- 102100030304 Platelet factor 4 Human genes 0.000 description 1
- 208000000474 Poliomyelitis Diseases 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 102000016971 Proto-Oncogene Proteins c-kit Human genes 0.000 description 1
- 108010014608 Proto-Oncogene Proteins c-kit Proteins 0.000 description 1
- 208000003251 Pruritus Diseases 0.000 description 1
- 241000205160 Pyrococcus Species 0.000 description 1
- ASNFTDCKZKHJSW-REOHCLBHSA-N Quisqualic acid Chemical class OC(=O)[C@@H](N)CN1OC(=O)NC1=O ASNFTDCKZKHJSW-REOHCLBHSA-N 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 206010037742 Rabies Diseases 0.000 description 1
- 102000004879 Racemases and epimerases Human genes 0.000 description 1
- 108090001066 Racemases and epimerases Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000003743 Relaxin Human genes 0.000 description 1
- 108090000103 Relaxin Proteins 0.000 description 1
- 108090000783 Renin Proteins 0.000 description 1
- 102100028255 Renin Human genes 0.000 description 1
- 241000702263 Reovirus sp. Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 102100023361 SAP domain-containing ribonucleoprotein Human genes 0.000 description 1
- 101710194492 SET-binding protein Proteins 0.000 description 1
- 206010040070 Septic Shock Diseases 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108010056088 Somatostatin Proteins 0.000 description 1
- 102000005157 Somatostatin Human genes 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000295644 Staphylococcaceae Species 0.000 description 1
- 101000882406 Staphylococcus aureus Enterotoxin type C-1 Proteins 0.000 description 1
- 101000882403 Staphylococcus aureus Enterotoxin type C-2 Proteins 0.000 description 1
- 101001057112 Staphylococcus aureus Enterotoxin type D Proteins 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 108010023197 Streptokinase Proteins 0.000 description 1
- 101710088580 Stromal cell-derived factor 1 Proteins 0.000 description 1
- 108010056079 Subtilisins Proteins 0.000 description 1
- 102000005158 Subtilisins Human genes 0.000 description 1
- 239000012505 Superdex™ Substances 0.000 description 1
- 102100030529 Suppressor of cytokine signaling 7 Human genes 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241000204667 Thermoplasma Species 0.000 description 1
- 241000589596 Thermus Species 0.000 description 1
- 108010078233 Thymalfasin Proteins 0.000 description 1
- 102400000800 Thymosin alpha-1 Human genes 0.000 description 1
- 206010044248 Toxic shock syndrome Diseases 0.000 description 1
- 231100000650 Toxic shock syndrome Toxicity 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 1
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 1
- 102400001320 Transforming growth factor alpha Human genes 0.000 description 1
- 101800004564 Transforming growth factor alpha Proteins 0.000 description 1
- 241000224526 Trichomonas Species 0.000 description 1
- 241000223104 Trypanosoma Species 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- 206010054094 Tumour necrosis Diseases 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- 108010000134 Vascular Cell Adhesion Molecule-1 Proteins 0.000 description 1
- 102100023543 Vascular cell adhesion protein 1 Human genes 0.000 description 1
- ZVNYJIZDIRKMBF-UHFFFAOYSA-N Vesnarinone Chemical compound C1=C(OC)C(OC)=CC=C1C(=O)N1CCN(C=2C=C3CCC(=O)NC3=CC=2)CC1 ZVNYJIZDIRKMBF-UHFFFAOYSA-N 0.000 description 1
- 229930003268 Vitamin C Natural products 0.000 description 1
- 108700040099 Xylose isomerases Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 125000002339 acetoacetyl group Chemical group O=C([*])C([H])([H])C(=O)C([H])([H])[H] 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 229960002478 aldosterone Drugs 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- 229940061720 alpha hydroxy acid Drugs 0.000 description 1
- 150000001280 alpha hydroxy acids Chemical class 0.000 description 1
- 150000001370 alpha-amino acid derivatives Chemical class 0.000 description 1
- 102000005922 amidase Human genes 0.000 description 1
- 150000001408 amides Chemical group 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 229940093740 amino acid and derivative Drugs 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 230000000689 aminoacylating effect Effects 0.000 description 1
- 229940124277 aminobutyric acid Drugs 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000002587 anti-hemolytic effect Effects 0.000 description 1
- 108010082685 antiarrhythmic peptide Proteins 0.000 description 1
- 239000003430 antimalarial agent Substances 0.000 description 1
- 229940033495 antimalarials Drugs 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- OZDNDGXASTWERN-UHFFFAOYSA-N apovincamine Natural products C1=CC=C2C(CCN3CCC4)=C5C3C4(CC)C=C(C(=O)OC)N5C2=C1 OZDNDGXASTWERN-UHFFFAOYSA-N 0.000 description 1
- 230000011681 asexual reproduction Effects 0.000 description 1
- 238000013465 asexual reproduction Methods 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 230000001746 atrial effect Effects 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 125000003236 benzoyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C(*)=O 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-FPRJBGLDSA-N beta-D-galactose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-FPRJBGLDSA-N 0.000 description 1
- 229940000635 beta-alanine Drugs 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000011942 biocatalyst Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 150000001615 biotins Chemical class 0.000 description 1
- JCZLABDVDPYLRZ-AWEZNQCLSA-N biphenylalanine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1C1=CC=CC=C1 JCZLABDVDPYLRZ-AWEZNQCLSA-N 0.000 description 1
- 125000005340 bisphosphate group Chemical group 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- ZADPBFCGQRWHPN-UHFFFAOYSA-N boronic acid Chemical compound OBO ZADPBFCGQRWHPN-UHFFFAOYSA-N 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- 150000001720 carbohydrates Chemical group 0.000 description 1
- 230000002612 cardiopulmonary effect Effects 0.000 description 1
- NSQLIUXCMFBZME-MPVJKSABSA-N carperitide Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 NSQLIUXCMFBZME-MPVJKSABSA-N 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000009134 cell regulation Effects 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 229960003677 chloroquine Drugs 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 230000006957 competitive inhibition Effects 0.000 description 1
- 239000004074 complement inhibitor Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- OMFXVFTZEKFJBZ-HJTSIMOOSA-N corticosterone Chemical compound O=C1CC[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@H](CC4)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 OMFXVFTZEKFJBZ-HJTSIMOOSA-N 0.000 description 1
- GLNDAGDHSLMOKX-UHFFFAOYSA-N coumarin 120 Chemical compound C1=C(N)C=CC2=C1OC(=O)C=C2C GLNDAGDHSLMOKX-UHFFFAOYSA-N 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000003431 cross linking reagent Substances 0.000 description 1
- 125000004093 cyano group Chemical group *C#N 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000006324 decarbonylation Effects 0.000 description 1
- 238000006606 decarbonylation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000002934 diuretic Substances 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 210000003989 endothelium vascular Anatomy 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 231100000655 enterotoxin Toxicity 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 229940116977 epidermal growth factor Drugs 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 102000015694 estrogen receptors Human genes 0.000 description 1
- 108010038795 estrogen receptors Proteins 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000002095 exotoxin Substances 0.000 description 1
- 231100000776 exotoxin Toxicity 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 229940012413 factor vii Drugs 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 230000004992 fission Effects 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- ZHNUHDYFZUAESO-UHFFFAOYSA-N formamide Substances NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000012248 genetic selection Methods 0.000 description 1
- 239000002622 gonadotropin Substances 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 230000006658 host protein synthesis Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 150000002466 imines Chemical class 0.000 description 1
- 150000007976 iminium ions Chemical class 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000010324 immunological assay Methods 0.000 description 1
- 229940097275 indigo Drugs 0.000 description 1
- COHYTHOBJLSHDF-UHFFFAOYSA-N indigo powder Natural products N1C2=CC=CC=C2C(=O)C1=C1C(=O)C2=CC=CC=C2N1 COHYTHOBJLSHDF-UHFFFAOYSA-N 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 102000002467 interleukin receptors Human genes 0.000 description 1
- 108010093036 interleukin receptors Proteins 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- CSSYQJWUGATIHM-IKGCZBKSSA-N l-phenylalanyl-l-lysyl-l-cysteinyl-l-arginyl-l-arginyl-l-tryptophyl-l-glutaminyl-l-tryptophyl-l-arginyl-l-methionyl-l-lysyl-l-lysyl-l-leucylglycyl-l-alanyl-l-prolyl-l-seryl-l-isoleucyl-l-threonyl-l-cysteinyl-l-valyl-l-arginyl-l-arginyl-l-alanyl-l-phenylal Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CSSYQJWUGATIHM-IKGCZBKSSA-N 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 229940078795 lactoferrin Drugs 0.000 description 1
- 235000021242 lactoferrin Nutrition 0.000 description 1
- 108010002230 lepirudin Proteins 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 239000006194 liquid suspension Substances 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 101150109301 lys2 gene Proteins 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 239000002636 mycotoxin Substances 0.000 description 1
- OHDXDNUPVVYWOV-UHFFFAOYSA-N n-methyl-1-(2-naphthalen-1-ylsulfanylphenyl)methanamine Chemical compound CNCC1=CC=CC=C1SC1=CC=CC2=CC=CC=C12 OHDXDNUPVVYWOV-UHFFFAOYSA-N 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 230000001452 natriuretic effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000002188 osteogenic effect Effects 0.000 description 1
- PSWJVKKJYCAPTI-UHFFFAOYSA-N oxido-oxo-phosphonophosphanylphosphanium Chemical compound OP(O)(=O)PP(=O)=O PSWJVKKJYCAPTI-UHFFFAOYSA-N 0.000 description 1
- LDCYZAJDBXYCGN-UHFFFAOYSA-N oxitriptan Natural products C1=C(O)C=C2C(CC(N)C(O)=O)=CNC2=C1 LDCYZAJDBXYCGN-UHFFFAOYSA-N 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- TVIDEEHSOPHZBR-AWEZNQCLSA-N para-(benzoyl)-phenylalanine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1C(=O)C1=CC=CC=C1 TVIDEEHSOPHZBR-AWEZNQCLSA-N 0.000 description 1
- 239000000199 parathyroid hormone Substances 0.000 description 1
- 229960001319 parathyroid hormone Drugs 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000011049 pearl Substances 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 108010012038 peptide 78 Proteins 0.000 description 1
- 229940125863 peptide 78 Drugs 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 150000002993 phenylalanine derivatives Chemical class 0.000 description 1
- DTBNBXWJWCWCIK-UHFFFAOYSA-K phosphonatoenolpyruvate Chemical compound [O-]C(=O)C(=C)OP([O-])([O-])=O DTBNBXWJWCWCIK-UHFFFAOYSA-K 0.000 description 1
- DCWXELXMIBXGTH-QMMMGPOBSA-N phosphonotyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-QMMMGPOBSA-N 0.000 description 1
- 230000003711 photoprotective effect Effects 0.000 description 1
- 230000008635 plant growth Effects 0.000 description 1
- 229940127126 plasminogen activator Drugs 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 102000005162 pleiotrophin Human genes 0.000 description 1
- 230000001402 polyadenylating effect Effects 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229940057847 polyethylene glycol 600 Drugs 0.000 description 1
- 229940093429 polyethylene glycol 6000 Drugs 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 229940002612 prodrug Drugs 0.000 description 1
- 239000000651 prodrug Substances 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- ULWHHBHJGPPBCO-UHFFFAOYSA-N propane-1,1-diol Chemical compound CCC(O)O ULWHHBHJGPPBCO-UHFFFAOYSA-N 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000001698 pyrogenic effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 150000003254 radicals Chemical class 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 229940030915 refludan Drugs 0.000 description 1
- 230000015909 regulation of biological process Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000032537 response to toxin Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 102200110977 rs28931569 Human genes 0.000 description 1
- 201000005404 rubella Diseases 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229930195734 saturated hydrocarbon Natural products 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 229960000553 somatostatin Drugs 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 229960005202 streptokinase Drugs 0.000 description 1
- CCEKAJIANROZEO-UHFFFAOYSA-N sulfluramid Chemical group CCNS(=O)(=O)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)F CCEKAJIANROZEO-UHFFFAOYSA-N 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 231100000617 superantigen Toxicity 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 210000004233 talus Anatomy 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- JEOIUGLPMJAHBL-HWBMXIPRSA-N tert-butyl n-[(2s)-1-[(2s)-2-[[(2s)-5-(diaminomethylideneamino)-2-[(4-methyl-2-oxochromen-7-yl)amino]pentanoyl]carbamoyl]pyrrolidin-1-yl]-3-methyl-1-oxobutan-2-yl]carbamate Chemical compound CC(C)(C)OC(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@H]1C(=O)NC(=O)[C@H](CCCN=C(N)N)NC1=CC=C(C(C)=CC(=O)O2)C2=C1 JEOIUGLPMJAHBL-HWBMXIPRSA-N 0.000 description 1
- 229960003604 testosterone Drugs 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- NZVYCXVTEHPMHE-ZSUJOUNUSA-N thymalfasin Chemical compound CC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NZVYCXVTEHPMHE-ZSUJOUNUSA-N 0.000 description 1
- 229960004231 thymalfasin Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000820 toxicity test Toxicity 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 239000003656 tris buffered saline Substances 0.000 description 1
- ORHBXUUXSCNDEV-UHFFFAOYSA-N umbelliferone Chemical compound C1=CC(=O)OC2=CC(O)=CC=C21 ORHBXUUXSCNDEV-UHFFFAOYSA-N 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229960005356 urokinase Drugs 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 235000019154 vitamin C Nutrition 0.000 description 1
- 239000011718 vitamin C Substances 0.000 description 1
- JPZXHKDZASGCLU-LBPRGKRZSA-N β-(2-naphthyl)-alanine Chemical compound C1=CC=CC2=CC(C[C@H](N)C(O)=O)=CC=C21 JPZXHKDZASGCLU-LBPRGKRZSA-N 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/81—Protease inhibitors
- C07K14/815—Protease inhibitors from leeches, e.g. hirudin, eglin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Gastroenterology & Hepatology (AREA)
- Tropical Medicine & Parasitology (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Un sistema de traducción que comprende: (a) un primer aminoácido no natural que es la sulfotirosina tal como se representa en la Figura 1; (b) una primera aminoacil ARNt sintetasa ortogonal (O-RS) en donde la O-RS comprende una secuencia de aminoácidos que es una variante conservativa de la SEC ID Nº: 2, la cual variante conservativa tiene una identidad de al menos el 90 % con la SEC ID Nº: 2 y comprende: una leucina en una posición correspondiente a Tyr32; una prolina en una posición correspondiente a Leu65; una glicina en una posición correspondiente a Asp158 y una lisina en una posición correspondiente a Leu162, y; opcionalmente comprende un ácido glutámico en una posición correspondiente a Gln155 y/o una treonina o una cisteína en una posición correspondiente a Ile159, y; (c) un primer ARNt ortogonal (O-ARNt); en el que dicha primera O-RS aminoacila dicho primer O-ARNt con dicha sulfotirosina.
Description
Expresión genéticamente programada de proteínas sulfatadas selectivamente en eubacterias
La invención pertenece al campo de la bioquímica de la traducción. La invención se refiere a composiciones y métodos para fabricar y utilizar ARNt ortogonales, aminoacil-ARNt sintetasas ortogonales, y pares de los mismos, que incorporan aminoácidos no naturales en proteínas. La invención también se refiere a métodos para producir proteínas en células utilizando dichos pares y proteínas fabricados por los métodos.
La sulfatación de la tirosina es una modificación postraduccional común en proteínas segregadas y unidas a
15 membranas (Kehoe y Bertozzi, “Tyrosine sulfation: a modulator of extracellular protein-protein interactions,” Chem Biol 7: R57-61 (2000)). Aunque estamos solo comenzando a comprender el grado de su función biológica, la sulfotirosina ya se ha identificado en diversos paradigmas de interacción proteína-proteína. Por ejemplo, la sulfatación de la tirosina desempeña una función determinante en la unión de quimiocinas a los receptores de quimiocinas CCR2 (Preobrazhensky et al., “Monocyte chemotactic protein-1 receptor CCR2B is a glycoprotein that has tyrosine sulfation in a conserved extracellular N-terminal region” J Immunol 165: 5295-5303 (2000)), CCR5 (Farzan et al., “Tyrosine sulfation of the amino terminus of CCR5 facilitates HIV-1 entry” Cell 96: 667-676 (1999)), CXCR4 (Farzan et al., “The role of post-translational modifications of the CXCR4 amino terminus in stromal-derived factor 1 alpha association and HIV-1 entry,” J Biol Chem 277: 29484-29489 (2002); Veldkamp et al., “Recognition of a CXCR4 sulfotyrosine by the chemokine stromal cell-derived factorlalpha (SDF-1alpha/CXCL12),” J Mol Biol 359:
25 1400-1409 (2006)) y CX3CR1 (Fong et al., “CX3CR1 tyrosine sulfation enhances fractalkine-induced cell adhesion,” J Biol Chem 277: 19418-19423 (2002)). De manera similar, leucocitos rodantes bajo tensión cortante hidrodinámica requieren sulfatación de PSGL-1 para la correcta unión y adhesión (Somers et al., “Insights into the molecular basis of leukocyte tethering and rolling revealed by structures of P- and E-selectin bound to SLe(X) and PSGL-1,” Cell 103: 467-479 (2000)). La sulfatación de la tirosina está también implicada en la cascada de coagulación, habiéndose identificado en diversos factores de coagulación así como en inhibidores de trombina naturales tales como la hirudina, un anticoagulante segregado por sanguijuelas (Dong et al., “Tyrosine sulfation of the glycoprotein Ib-IX complex: identification of sulfated residues and effect on ligand binding,” Biochemistry 33: 13946-13953 (1994); Bagdy et al., “Hirudin,” Methods Enzymol 45: 669-678 (1976)). Además, recientemente se descubrió que la sulfatación de la tirosina en una región bucle variable de anticuerpo era responsable de la actividad neutralizante de
35 un subconjunto de anticuerpos del VHI-1 inducidos por CD4, demostrando de este modo la capacidad de la sulfotirosina para aumentar la afinidad antígeno anticuerpo (Choe et al., “Tyrosine sulfation of human antibodies contributes to recognition of the CCR5 binding region of HIV-1 gp120,” Cell 114: 161-170 (2003); Xiang et al., “Functional mimicry of a human immunodeficiency virus type 1 coreceptor by a neutralizing monoclonal antibody,” J Virol 79: 6068-6077 (2005)).
Un obstáculo principal para la determinación de las funciones de la sulfatación en más de las 60 proteínas conocidas y más de las 2100 proteínas predichas que contienen sulfotirosina (según un estudio de secuencias de proteínas de ratón) es la capacidad de sintetizar selectivamente proteínas sulfatadas (Moore, “The biology and enzymology of protein tyrosine O-sulfation,” J Biol Chem 278: 24243-24246 (2003)). Los métodos actuales se basan en la síntesis
45 de péptidos convencional o en sulfatación enzimática in vitro (Veldkamp et al., “Recognition of a CXCR4 sulfotyrosine by the chemokine stromal cell-derived factor-lalpha (SDF-1alpha/CXCL12),” J Mol Biol 359: 1400-1409 (2006); Kirano et al., “Total synthesis of porcine cholecystokinin-33 (CCK-33),” J. Chem. Soc., Chem. Com-mun., 323-325 (1987); Muramatsu et al., “Enzymic O-sulfation of tyrosine residues in hirudins by sulfotransferase from Eubacterium A-44,” Eur J Biochem 223: 243-248 (1994); Young y Kiessling, “A strategy for the synthesis of sulfated peptides,” Angew Chem Int Ed Engl 41: 3449-3451 (2002)); sin embargo, ambos carecen de generalidades: el primero está limitado por restricciones de longitud y la tendencia hacia la desulfatación de sulfotirosina en condiciones ácidas; el último está limitado por la disponibilidad de sulfotransferasas accesorias y sus restricciones de secuencias de reconocimiento asociadas.
55 La incorporación directa de un aminoácido no natural de sulfotirosina codificado genéticamente en sitios definidos en proteínas directamente en organismos vivos superaría las limitaciones descritas anteriormente. La incorporación directa de sulfotirosina facilitaría enormemente el estudio de acontecimientos de sulfatación en la regulación de procesos biológicos y también permitiría la creación de bibliotecas de anticuerpos y péptidos sulfatados de diversidad significativa. Adicionalmente, la capacidad para producir una forma sulfatada en la proteína hirudina tiene aplicación clínica inmediata para su uso como un anticoagulante mejorado (mejorado con respecto a la forma no sulfatada). Lo que se necesita en la técnica son nuevas estrategias para incorporar en proteínas el aminoácido no natural sulfotirosina.
Se ha desarrollado una metodología general para la incorporación in vivo específica de sitio de diversos
65 aminoácidos no naturales en proteínas, en organismos tanto eucariotas como procariotas. Estos métodos se basan en componentes de traducción de proteínas ortogonales que reconocen un codón selector adecuado para insertar un aminoácido no natural deseado en una posición definida durante la traducción de polipéptidos in vivo. Estos métodos utilizan un ARNt ortogonal (O-ARNt) que reconoce un codón selector, y en el que una aminoacil-ARNt sintetasa ortogonal (una O-RS) especifica correspondiente carga el O-ARNt con el aminoácido no natural. Estos componentes no reaccionan en cruzado con ninguno de los ARNt, RSs, aminoácidos o codones endógenos en el
5 organismo hospedador (es decir, debe ser ortogonal). El uso de dichos pares ARNt-RS ortogonales ha hecho que sea posible codificar genéticamente una gran cantidad de aminoácidos no naturales estructuralmente diversos.
La práctica de utilizar sistemas de traducción ortogonal que son adecuados para la fabricación de proteínas que comprende uno o más aminoácidos no naturales es generalmente conocida en la técnica, como lo son los métodos 10 generales para producir sistemas de traducción ortogonal. Por ejemplo, véanse los Números de Publicación Internacional WO 2002/086075, titulada “METHODS AND COMPOSITION FOR THE PRODUCTION OF ORTHOGONAL tRNA-AMINOACYL-tRNA SYNTHETASE PAIRS”; WO 2002/085923, titulada “IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS”; WO 2004/094593, titulada “EXPANDING THE EUKARYOTIC GENETIC CODE”; WO 2005/019415, presentada el 7 de julio de 2004; WO 2005/007870, presentada el 7 de julio 15 del 2004; WO 2005/007624, presentada el 7 de julio de 2004 y WO 2006/110182, presentado el 27 de octubre de 2005, titulada “ORTHOGONAL TRANSLATION COMPONENTS FOR THE VIVO INCORPORATION OF UNNATURAL AMINO ACIDS”. Para un análisis adicional de sistemas de traducción ortogonal que incorporan aminoácidos no naturales, y métodos para su producción y uso, véase también, Wang y Schultz, “Expanding the Genetic Code,” Chem. Commun. (Camb.) 1: 1-11 (2002); Wang y Schultz “Expanding the Genetic Code,” 20 Angewandte Chemie Int. Ed., 44(1): 34-66 (2005); Xie y Schultz, “An Expanding Genetic Code,” Methods 36(3): 227238 (2005); Xie y Schultz, “Adding Amino Acids to the Genetic Repertoire,” Curr. Opinion in Chemical Biology 9(6): 548-554 (2005); Wang et al., “Expanding the Genetic Code,” Annu. Rev. Biophys. Biomol. Struct., 35: 225-249 (2006; epub 13 de junio de 2006); y Xie y Schultz, “A chemical toolkit for proteins -an expanded genetic code,” Nat. Rev. Mol. Cell Biol., 7(10): 775-782 (2006; publicación electrónica 23 de agosto de 2006). El documento WO 2004/035743
25 describe pares de ARNt/aminoacil ARNt sintetasa ortogonales que incorporan ceto aminoácidos en proteínas.
Existe necesidad en la técnica de desarrollar componentes de traducción ortogonal que incorporen el aminoácido no natural sulfotirosina en proteínas, en el que el aminoácido no natural puede incorporarse en cualquier posición definida. La invención descrita en el presente documento cumple estas y otras necesidades, como se apreciará
30 después de la revisión de la siguiente divulgación.
Aunque la sulfatación de la tirosina es una modificación postraduccional generalizada en eucariotas multicelulares
35 (Moore, “The biology and enzymology of protein tyrosine O-sulfation,” J Biol Chem 278: 24243-24246 (2003)), sus funciones biológicas siguen sin conocerse en gran medida. Esto se debe en parte a las dificultades asociadas con la síntesis de proteínas sulfatadas selectivamente. La invención proporciona la incorporación selectiva de sulfotirosina en proteínas en bacterias por codificación genética del aminoácido modificado en respuesta al codón sin sentido ámbar, TAG. Además, se demuestra que la sulfo-hirudina, previamente inaccesible a través de métodos
40 recombinantes, puede expresarse directamente en E. coli utilizando esta estrategia. Como se describe en el presente documento, análisis cinéticos muestran una mejora en afinidad mayor de 10 veces frente a la trombina humana por sulfohirudina sobre la desulfohirudina, una observación que ofrece ventajas clínicas para la sulfohirudina en su uso como un anticoagulante (Di Nisio et al., “Direct thrombin inhibitors,” N Engl J Med 353: 10281040 (2005)). Esta estrategia general para la biosíntesis de proteínas sulfatadas facilita el estudio y la aplicación
45 adicional de la modificación postraduccional emergente, la sulfatación de la tirosina.
La invención proporciona composiciones y métodos, como se define en las reivindicaciones, para la incorporación in vivo (por ejemplo, en una célula hospedadora) del aminoácido no natural sulfotirosina en una cadena polipeptídica en crecimiento en respuesta a un codón selector, por ejemplo, un codón de terminación ámbar. Estas composiciones 50 incluyen pares de ARNt ortogonales (O-ARNt) y aminoacil-ARNt sintetasas ortogonales (O-RSs) que no interaccionan con la maquinaria de traducción de la célula hospedadora. Es decir, el O-ARNt no está cargado (o no está cargado a un nivel significativo) con un aminoácido (natural o no natural) por una aminoacil-ARNt sintetasa de la célula hospedadora endógena. De manera similar, la O-RSs proporcionada por la invención no carga ningún ARNt endógeno con un aminoácido (natural o no natural) a un nivel significativo o detectable. Estas nuevas composiciones
55 permiten la producción de grandes cantidades de proteínas que tienen sulfotirosina incorporada traduccionalmente.
En un primer aspecto, la invención proporciona sistemas de traducción como se define en las reivindicaciones. Los sistemas de traducción comprenden: (a) un primer aminoácido no natural que es la sulfotirosona como se representa en la Figura 1; (b) una primera aminoacil ARNt sintetasa ortogonal (O-RS) que comprende una secuencia de 60 aminoácidos que es una variante conservativa de SEC ID Nº: 2, cuya variante conservativa es el menos el 90 % idéntica a la SEC ID Nº: 2 y comprende: una leucina en una posición correspondiente a Tyr32; una prolina en una posición correspondiente a Leu65; una glicina en una posición correspondiente a Asp158, y una lisina a una posición correspondiente a Leu162, y; opcionalmente comprende un ácido glutámico en una posición correspondiente a Gln155, y/o una treonina o una cisteína en una posición correspondiente a Ile159, y; (c) un primer ARNt ortogonal
65 (O-ARNt); en el que la primera O-RS aminoacila el primer O-ARNt con la sulfotirosina.
En determinadas realizaciones, la primera O-RS deriva de una aminoacil-ARNt sintetasa de Methanococcus jannaschii, y/o deriva de una tirosil ARNt sintetasa de Methanococcus jannaschii de tipo silvestre y/o comprende una secuencia de aminoácidos expuesta en las SEC ID Nos: 4, 6, 8 o 10. El primer O-ARNt puede ser un ARNt supresor de ámbar y/o puede comprender o estar codificado por una secuencia de polinucleótidos expuesta en la SEC ID Nº:
5 1.
En determinadas realizaciones, el sistema de traducción comprende adicionalmente un ácido nucleico que codifica una proteína de interés. El ácido nucleico comprende al menos un codón selector que reconoce el primer O-ARNt. El sistema de traducción puede comprender adicionalmente una segunda O-RS y un segundo O-ARNt, en el que la segunda O-RS aminoacila el segundo O-ARNt con un segundo aminoácido no natural que es diferente del primer aminoácido no natural, y en el que el segundo O-ARNt reconoce un codón selector que es diferente del codón selector reconocido por el primer O-ARNt.
En determinadas realizaciones, el sistema de traducción comprende una célula hospedadora que comprende el
15 primer aminoácido no natural, la primera O-RS y el primer O-ARNt. La célula hospedadora puede ser una célula de eubacteria, tal como una célula de E. coli. La célula hospedadora puede comprender un polinucleótido que codifica la primera O-RS y/o un polinucleótido que codifica el primer O-ARNt. El polinucleótido que codifica la primera O-RS puede comprender una secuencia de nucleótidos expuesta en las SEC ID Nos: 5, 7, 9 u 11.
En un segundo aspecto, la invención proporciona métodos para producir, en un sistema de traducción, una proteína que comprende un aminoácido no natural en una posición seleccionada como se define en las reivindicaciones. El método comprende: (a) proporcionar un sistema de traducción que comprende: (i) un primer aminoácido no natural que es la sulfotirosina como se representa en la Fig. 1; (ii) una primera O-RS que comprende la secuencia de aminoácidos que es una variante conservativa de la SEC ID Nº: 2, cuya variante conservativa es al menos el 90 %
25 idéntica a la SEC ID Nº: 2 y comprende: una leucina en una posición correspondiente a Tyr32; una prolina en una posición correspondiente a Leu65; una glicina en una posición correspondiente a Asp158, y una lisina en una posición correspondiente a Leu162, y; opcionalmente comprende un ácido glutámico en una posición correspondiente a Gln155, y/o una treonina o una cisteína en una posición correspondiente a Ile159; (iii) un primer O-ARNt, en el que la primera O-RS aminoacila el primer O-ARNt con la sulfotirosina; y, (iv) un ácido nucleico que codifica la proteína, en el que el ácido nucleico comprende al menos un codón selector reconocido por el primer O-ARNt, y; (b) incorporar el aminoácido no natural en la posición seleccionada en la proteína durante la traducción de la proteína en respuesta al codón selector, produciendo de este modo la proteína que comprende el aminoácido no natural en la posición seleccionada.
35 En determinadas realizaciones de los métodos, la proteína que comprende un aminoácido no natural es la sulfohirudina.
En determinadas realizaciones de los métodos, el proporcionar un sistema de traducción puede comprender: (A) proporcionar un polinucleótido que codifique la O-RS o (B) proporcionar una O-RS derivada de una aminoacil-ARNt sintetasa de Methanococcus jannaschii, o ; (C) proporcionar una O-RS derivada de una tirosil-ARNt sintetasa de Methanococcus jannaschii de tipo silvestre, o; (D) proporcionar una O-RS que comprenda una secuencia de aminoácidos expuesta en las SEC ID Nos: 4, 6, 8 o 10, o; (E) mutar un bolsillo de unión de aminoácidos de una aminoacil-ARNt sintetasa de tipo silvestre por mutagénesis de sitio dirigido y seleccionar una O-RS resultante que aminoacile dicho O-ARNt con dicho aminoácido no natural, en el que la etapa de selección comprende seleccionar 45 positivamente y seleccionar negativamente la O-RS a partir de un conjunto que comprenda una pluralidad de moléculas de aminoacil-ARNt sintetasa resultantes después de la mutagénesis de sitio dirigido, o; (F) proporcionar un polinucleótido que codifique dicho O-ARNt, o; (G) proporcionar un O-ARNt que es un ARNt supresor de ámbar, o,
(H) proporcionar un O-ARNt que comprenda o esté codificado por una secuencia de polinucleótidos expuesta en la SEC ID Nº: 1, o; (I) proporcionar un ácido nucleico que comprenda un codón selector ámbar, o; (J) proporcionar una célula hospedadora que comprenda el primer aminoácido no natural, la primera O-RS, el primer O-ARNt y el ácido nucleico, y la etapa de incorporación comprende cultivar la célula hospedadora, o; (K) proporcionar un extracto celular.
En determinadas realizaciones de (J), el proporcionar una célula hospedadora comprende proporcionar una célula
55 hospedadora de eubacteria, que puede ser una célula hospedadora de E. coli, o proporcionar una célula hospedadora que comprenda un polinucleótido que codifique la O-RS, que puede comprender una secuencia de nucleótidos expuesta en las SEC ID Nos: 5, 7, 9 u 11.
En determinadas realizaciones de los métodos, la proteína comprende un segundo aminoácido no natural que es diferente del primer aminoácido no natural, y el sistema de traducción comprende adicionalmente una segunda O-RS y un segundo O-ARNt. La segunda O-RS aminoacila el segundo O-ARNt con un segundo aminoácido no natural que es diferente del primer aminoácido no natural, y el segundo O-ARNt reconoce un codón selector en el ácido nucleico que es diferente del codón selector reconocido por el primer O-ARNt.
65 En un tercer aspecto, la invención proporciona composiciones que comprende un polipéptido, que comprende una secuencia de aminoácidos que es una variante conservativa de la SEC ID Nº: 2, cuya variante conservativa es al menos el 90 % idéntica a la SEC ID Nº:2, y comprende: una leucina en una posición correspondiente a Tyr32; una prolina en una posición correspondiente a Leu65; una glicina en una posición correspondiente a Asp158 y una lisina en una posición correspondiente a Leu162, y; opcionalmente comprende un ácido glutámico en una posición correspondiente a Gln155, y/o una treonina o una cisteína en una posición correspondiente a Ile159; cuyo
5 polipéptido aminoacila un O-ARNt con sulfotirosina como de representa en la Fig. 1.
En determinadas realizaciones de las composiciones, el polipéptido comprende la secuencia de aminoácidos de las SEC ID Nos: 4, 6, 8 o 10. En determinadas realizaciones, las composiciones comprenden una célula que comprende el polipéptido.
10 En un aspecto relacionado, la invención proporciona polinucleótidos que codifican los polipéptidos de las composiciones. En determinadas realizaciones, los polinucleótidos comprenden la secuencia de nucleótidos las SEC ID Nos: 5, 7, 9 u 11.
15 En un aspecto adicional relacionado, la invención proporciona vectores que comprenden el polinucleótido que codifica el polipéptido de las composiciones.
En un aspecto adicional relacionado, la invención proporciona células que comprenden los vectores.
20 En algunos aspectos, el sistema de traducción incorpora un segundo par ortogonal (es decir, una segunda O-RS y un segundo O-ARNt) que utiliza un segundo aminoácido no natural, de tal manera que el sistema puede ahora incorporar al menos dos aminoácidos no naturales en diferentes en sitios seleccionados en un polipéptido. En este sistema doble, la segunda O-RS aminoacila preferentemente el segundo O-ARNt con un segundo aminoácido no natural que es diferente del primer aminoácido no natural, y el segundo O-ARNt reconoce un codón selector que es
25 diferente del codón selector reconocido por el primer O-ARNt.
En algunas realizaciones, el sistema de traducción reside en una célula hospedadora (e incluye la célula hospedadora). La célula hospedadora utilizada no está particularmente limitada, siempre que la O-RS y el O-ARNt conserven su ortogonalidad en su medio celular hospedador. La célula hospedadora puede ser una célula de
30 eubacteria, tal como E. coli. La célula hospedadora puede comprender uno o más polinucleótidos que codifican componentes del sistema de traducción, incluyendo la O-RS o el O-ARNt. En algunas realizaciones, el polinucleótido que codifica la O-RS comprende una secuencia de nucleótidos de las SEC ID Nos: 5, 7, 9 u 11.
La invención también proporciona métodos para producir proteínas que tienen uno o más aminoácidos no naturales
35 en posiciones seleccionadas. Estos métodos utilizan los sistemas de traducción descritos anteriormente. Generalmente, estos métodos comienzan con la etapa de proporcionar un sistema de traducción que comprende: (i) un primer aminoácido no natural que es el aminoácido no natural sulfotirosina; (ii) una primera aminoacil-ARNt sintetasa ortogonal (O-RS); (iii) un primer ARNt ortogonal (O-ARNt), en el que la O-RS aminoacila preferentemente el O-ARNt con el aminoácido no natural; y, (iv) un ácido nucleico que codifica la proteína, en el que el ácido nucleico
40 comprende al menos un codón selector reconocido por el primer O-ARNt. Por tanto el método incorpora el aminoácido no natural en la posición seleccionada en la proteína durante la traducción de la proteína en respuesta al codón selector, produciendo de este modo la proteína que comprende el aminoácido no natural en la posición seleccionada. En algunos aspectos de estos métodos, la O-RS aminoacila preferentemente el O-ARNt con la sulfotirosina con una eficacia que es al menos el 50 % de la eficacia observada para un sistema de traducción que
45 comprende el mismo O-ARNt, la sulfotirosina, y una aminoacil-ARNt sintetasa que comprende la secuencia de aminoácidos de las SEC ID Nos: 4, 6, 8 o 10. En algunos aspectos, los métodos se usan para producir la forma sulfatada de la hirudina.
Estos métodos pueden aplicarse ampliamente utilizando diversos reactivos y etapas. En algunas realizaciones, se
50 proporciona un polinucleótido que codifica la O-RS. En algunas realizaciones, se proporciona una O-RS derivada de una aminoacil-ARNt sintetasa de Methanococcus jannaschii, por ejemplo, puede proporcionarse una tirosil ARNt sintetasa de Methanococcus jannaschii de tipo silvestre. En algunas realizaciones, la etapa de proporcionar incluye proporcionar una O-RS que comprenda una secuencia de aminoácidos de las SEC ID Nos: 4, 6, 8 o 10, y variantes conservativas de las mismas.
55 En algunas realizaciones de estos métodos, el proporcionar una etapa del sistema de traducción comprende mutar un bolsillo de unión de aminoácido de una aminoacil-ARNt sintetasa de tipo silvestre mediante mutagénesis de sitio dirigido, y seleccionar una O-RS resultante que aminoacile preferentemente el O-ARNt con el aminoácido no natural. La etapa de selección puede comprender seleccionar de manera positiva y negativa la O-RS de un conjunto de
60 moléculas de aminoacil-ARNt sintetasa resultante después de la mutagénesis de sitio dirigido. En algunas realizaciones, la etapa de proporcionar suministra un polinucleótido que codifica el O-ARNt, por ejemplo, un O-ARNt que es un ARNt supresor ámbar, o un O-ARNt que comprende, o está codificado por, un polinucleótido de la SEC ID Nº: 1. En estos métodos, la etapa de proporcionar también puede suministrar un ácido nucleico que comprende un codón selector ámbar que es utilizado por el sistema de traducción.
65 Estos métodos también pueden modificarse para incorporar más de un aminoácido no natural en una proteína. En estos métodos, junto con el primer sistema de traducción se emplea un segundo sistema de traducción ortogonal, en el que el segundo sistema tiene diferentes especificidades de codones selectores y aminoácidos. Por ejemplo, la etapa de proporcionar pueden incluir proporcionar una segunda O-RS y un segundo O-ARNt, en la que la segunda
5 O-RS aminoacila preferentemente el segundo O-ARNt con un segundo aminoácido no natural que es diferente del primer aminoácido no natural, y en la que el segundo O-ARNt reconoce un codón selector en el ácido nucleico que es diferente del codón selector reconocido por el primer O-ARNt.
Los métodos para producir una proteína con un aminoácido no natural también pueden realizarse en el contexto de una célula hospedadora. En estos casos, se proporciona una célula hospedadora, en la que la célula hospedadora comprende el aminoácido no natural, la O-RS, el O-ARNt y el ácido nucleico con al menos un codón selector que codifica la proteína, y en la que el cultivo de la célula hospedadora da como resultado la incorporación del aminoácido no natural. En algunas realizaciones, la etapa de proporcionar comprende proporcionar una célula hospedadora de eubacteria (por ejemplo, E. coli). En algunas realizaciones, la etapa de proporcionar incluye
15 proporcionar una célula hospedadora que contiene un polinucleótido que codifica la O-RS. Por ejemplo, el polinucleótido que codifica la O-RS puede comprender un nucleótido.
Antes de describir la invención con detalle, debe entenderse que la presente invención no se limita a sistemas biológicos particulares que, por supuesto, pueden variar. También debe entenderse que la terminología utilizada en el presente documento tiene la única finalidad de describir realizaciones particulares y no pretende ser limitante. Como se usa en esta memoria descriptiva y en las reivindicaciones adjuntas, las formas en singular “un”, "una", “el” y “la” incluyen los plurales, a menos que el contexto indique claramente lo contrario. Por tanto, la referencia, por
25 ejemplo, a "una célula" incluye combinaciones de dos o más células; la referencia a "un polinucleótido" incluye, como cuestión práctica, muchas copias de ese polinucleótido.
A menos que se defina en el presente documento y más adelante en el resto de la memoria descriptiva, todos los términos científicos y técnicos utilizados en el presente documento tienen el mismo significado que el normalmente entendido por un experto habitual en la técnica a la cual pertenece la invención.
Ortogonal: como se usa en el presente documento, el término “ortogonal” se refiere a una molécula (por ejemplo, un ARNt ortogonal (O-ARNt) y/o una aminoacil-ARNt sintetasa ortogonal (O-RS)) que funciona con componentes endógenos de una célula con menor eficacia en comparación con una molécula correspondiente que es endógena a 35 la célula o al sistema de traducción, o que fracasa al funcionar con componentes endógenos de la célula. En el contexto de los ARNt y las aminoacil-ARNt sintetasas, ortogonal se refiere a la incapacidad o menor eficacia, por ejemplo, una eficacia reducida de un 20 %, menor de un 10 %, menor de un 5 %, o menor de un 1 %, de un ARNt ortogonal para funcionar con una ARNt sintetasa endógena en comparación con la capacidad de un ARNt endógeno para funcionar con la ARNt sintetasa endógena, o de una aminoacil ARNt sintetasa ortogonal para funcionar con un ARNt endógeno en comparación con la capacidad de una ARNt sintetasa endógena para funcionar con el ARNt endógeno. La molécula ortogonal carece de una molécula complementaria endógena funcionalmente normal en la célula. Por ejemplo, un ARNt ortogonal en una célula se aminoacila mediante cualquier RS endógena de la célula con una eficacia reducida o incluso nula en comparación con la aminoacilación de un ARNt endógeno por la RS endógena. En otro ejemplo, una RS ortogonal aminoacila cualquier ARNt endógeno en una célula de interés con una
45 eficacia reducida o incluso nula, en comparación con la aminoacilación del ARNt endógeno mediante una RS endógena. En la célula puede introducirse una segunda molécula ortogonal que funcione con la primera molécula ortogonal. Por ejemplo, un par de ARNt/RS ortogonal incluye componentes complementarios introducidos que funcionan juntos en la célula con una eficacia (por ejemplo, una eficacia del 45 %, 50 %, 60 %, 70 %, 75 %, 80 %, 90 %, 95 % o 99 % o mayor) en comparación con la de un control, por ejemplo, un par endógeno de ARNt/RS correspondiente, o un par ortogonal activo (por ejemplo, un par de tirosil ARNt/RS ortogonal).
Tirosil-ARNt ortogonal: como se usa en el presente documento, un tirosil-ARNt ortogonal (tirosil-O-ARNt) es un ARNt que es ortogonal a un sistema de traducción de interés, en el que el ARNt es: (1) idéntico o sustancialmente similar a un tirosil ARNt de origen natural, (2) derivado de un tirosil ARNt de origen natural por mutagénesis natural o artificial, 55 (3) derivado por cualquier proceso que tiene en cuenta una secuencia de tirosil-ARNt de tipo silvestre o mutante de
(1) o (2), (4) homologo a un tirosil-ARNt de tipo silvestre o natural; (5) homólogo a cualquier ARNt de ejemplo que está diseñado como un sustrato para una tirosil ARNt sintetasa en la FIG. 7 o (6) una variante conservativa de cualquier ARNt de ejemplo que está diseñado como un sustrato para una tirosil-ARNt sintetasa en la FIG. 7. El tirosil-ARNt puede existir cargado con un aminoácido, o en un estado no cargado. También debe entenderse que un “tirosil-O-ARNt” está opcionalmente cargado (aminoacilado) por una sintetasa afín con un aminoácido distinto de tirosina, respectivamente, por ejemplo, con un aminoácido no natural. De hecho, se apreciará que un tirosil-O-ARNt de la presente descripción se usa ventajosamente para insertar esencialmente cualquier aminoácido, tanto si es natural como no natural, en el polipéptido en crecimiento, durante la traducción, en respuesta a un codón selector.
65 Tirosil aminoácido sintetasa ortogonal: como se usa en el presente documento, una tirosil aminoácido sintetasa ortogonal (tirosil-O-RS) es una enzima que aminoacila preferentemente tirosil-O-ARNt con un aminoácido en un sistema de traducción de interés. El aminoácido que la tirosil-O-RS carga sobre tirosil-O-ARNt puede ser cualquier aminoácido, tanto si es natural como no natural o artificial y en el presente documento no está limitado. La sintetasa es opcionalmente la misma que u homóloga a una tirosil aminoácido sintetasa de origen natural, o la misma u homóloga a una sintetasa diseñada como O-RS en la FIG. 7. Por ejemplo, la O-RS puede ser una variante
5 conservativa de una tirosil-O-RS de la FIG. 7, y/o puede tener una identidad de al menos 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 98 %, 99 % o más con una O-RS de la FIG. 7.
Afín: el término “afín” se refiere a componentes que funcionan juntos, o que tienen algún aspecto de especificidad entre sí, es decir, un ARNt ortogonal y una aminoacil-ARNt sintetasa ortogonal. Los componentes también pueden denominarse complementarios.
Aminoacila preferentemente: como se usa en el presente documento en referencia a sistemas de traducción ortogonal, una O-RS “aminoacila preferentemente” un O-ARNt afín cuando la O-RS carga un O-ARNt con un aminoácido de forma más eficaz de lo que carga cualquier ARNt endógeno en un sistema de expresión. Es decir,
15 cuando el O-ARNt y cualquier ARNt endógeno determinado están presente en un sistema de traducción aproximadamente en las mismas proporciones molares, la O-RS cargará el O-ARNt más frecuentemente de lo que lo cargará el ARNt endógeno. Preferentemente, la proporción relativa del O-ARNt cargado por la O-RS con respecto al endógeno ARNt cargado por la O-RS es alta, dando como resultado preferentemente la O-RS que carga el O-ARNt exclusivamente, o casi exclusivamente, cuando el O-ARNt y un ARNt endógeno están presentes en las mismas concentraciones molares en el sistema de traducción. La proporción relativa entre el O-ARNt y el ARNt endógeno que está cargado por la O-RS, cuando el O-ARNt y la O-RS están presentes a las mismas concentraciones molares, es mayor de 1:1, preferentemente al menos aproximadamente 2:1, más preferentemente 5:1, aún más preferentemente 10:1, incluso más preferentemente 20:1, aún más preferentemente 50:1, aún más preferentemente 75:1, aún más preferentemente 95: 1, 98:1, 99:1, 100:1, 500:1, 1,000:1, 5,000:1 o mayor.
25 La O-RS “aminoacila preferentemente un O-ARNt con un aminoácido natural” cuando (a) la O-RS aminoacila preferentemente el O-ARNt en comparación con un ARNt endógeno y (b) cuando la aminoacilación es específica para el aminoácido no natural, en comparación con la aminoacilación del O-ARNt por la O-RS con un aminoácido natural. Es decir, cuando los aminoácidos no naturales y naturales están presentes en las mismas cantidades molares en un sistema de traducción que comprende la O-RS y un O-ARNt, la O-RS cargará el O-ARNt con el aminoácido no natural más frecuentemente que con el aminoácido natural. Preferentemente, la proporción relativa de O-ARNt cargado con el aminoácido no natural con respecto al O-ARNt cargado con el aminoácido natural es alta. Más preferentemente, la O-RS carga el O-ARNt exclusivamente, o casi exclusivamente, con el aminoácido no natural. La proporción relativa entre la carga del O-ARNt con el aminoácido no natural y la carga del O-ARNt con el
35 aminoácido natural, cuando ambos aminoácidos, natural y no natural, están presentes en el sistema de traducción en las mismas concentraciones molares, es mayor que 1:1, preferentemente al menos aproximadamente 2:1, más preferentemente 5:1, aún más preferentemente 10:1, aún más preferentemente 20:1, aún más preferentemente 50:1, aún más preferentemente 75:1, aún más preferentemente 95: 1, 98:1, 99:1, 100:1, 500:1, 1,000:1, 5,000:1 o más alta.
Codón selector: la expresión “codón selector” se refiere a codones reconocidos por el O-ARNt en el proceso de traducción y no reconocido por un ARNt endógeno. El bucle anticodón de O-ARNt reconoce el codón selector en el ARNm e incorpora su aminoácido, por ejemplo, un aminoácido no natural, en este sitio en el polipéptido. Los codones selectores pueden incluir, por ejemplo, codones sin sentido, tales como, codones de terminación, por
45 ejemplo, codones ámbar, ocre y ópalo; codones de cuatro o más bases, codones raros; codones derivados de pares de bases naturales o no naturales y/o similares.
ARNt supresor: un ARNt supresor es un ARNt que altera la lectura de un ARN mensajero (ARNm) en un sistema de traducción determinado, normalmente permitiendo la incorporación de un aminoácido en respuesta a un codón de terminación (es decir, “lectura completa”) durante la traducción de un polipéptido. En algunos aspectos, un codón selector de la invención es un codón supresor, por ejemplo, un codón de terminación (por ejemplo, un codón ámbar, ocre u ópalo), un codón de cuatro bases, un codón raro, etc.
Actividad de supresión: como se usa en el presente documento, la expresión “actividad de supresión” se refiere, en
55 general, a la capacidad de un ARNt (por ejemplo, un ARNt supresor) de permitir la lectura completa de traducción de un codón (por ejemplo, un codón selector que es un codón ámbar o un codón de cuatro o más bases) que de otra manera daría como resultado la terminación de la traducción o la traducción errónea (por ejemplo un desplazamiento de fase de lectura). La actividad de supresión de un ARNt supresor puede expresarse como un porcentaje de la actividad de lectura completa de traducción observada en comparación con un segundo ARNt supresor o en comparación con un sistema de control, por ejemplo, un sistema de control que carece de una O-RS.
La presente descripción proporciona diversos métodos mediante los cuales la actividad de supresión puede cuantificarse. El porcentaje de supresión de un O-ARNt particular y una O-RS contra un codón selector (por ejemplo, un codón ámbar) de interés se refiere al porcentaje de actividad de un marcador de ensayo expresado 65 determinado (por ejemplo, LacZ), que incluye un codón selector, en un ácido nucleico que codifica el marcador de ensayo expresado, en un sistema de traducción de interés, en el que el sistema de traducción de interés incluye una
O-RS y un O-ARNt, en comparación con una construcción de control positivo, en el que el control positivo carece del O-ARNt, e la O-RS y del codón selector. Por tanto, por ejemplo, si una construcción de marcador de control positivo activo que carece de un codón de selector tiene una actividad observada de X en un sistema de traducción determinado, en unidades pertinentes al ensayo de marcador en cuestión, entonces el porcentaje de supresión de
5 una construcción de ensayo que comprende el codón selector es el porcentaje de X que muestra la construcción de marcador de ensayo esencialmente en las mismas condiciones que el medio natural en las que se expresaba el marcador de control positivo, excepto porque la construcción de marcador de ensayo se expresa en un sistema de traducción que también incluye el O-ARNt y la O-RS. Normalmente, el sistema de traducción que expresa el marcador de ensayo también incluye un aminoácido que es reconocido por la O-RS y el O-ARNt. Opcionalmente, la medición del porcentaje de supresión puede refinarse por comparación del marcador de ensayo con una construcción de marcador de control de “fondo” o “negativo”, que incluye el mismo codón selector que el marcador de ensayo, pero en un sistema que no incluye el O-ARNt, la O-RS y/o el aminoácido pertinente reconocido por el O-ARNt y/o la O-RS. Este control negativo es útil para normalizar las mediciones del porcentaje de supresión para tener en cuenta los efectos de señal de fondo del marcador en el sistema de traducción de interés.
15 La eficacia de supresión puede determinarse mediante cualquiera de diversos ensayos conocidos en la técnica. Por ejemplo, puede utilizarse un ensayo indicador de β-galactosidasa, por ejemplo, un plásmido lacZ derivatizado (en el que la construcción tiene un codón selector en la secuencia de ácido nucleico lacZ) se introduce en células de un organismo apropiado (por ejemplo, un organismo en el que pueden utilizarse componentes ortogonales) junto con el plásmido que comprende un O-ARNt de la invención. También puede introducirse una sintetasa afín (bien como un polipéptido o como un polinucleótido que codifica la sintetasa afín cuando se expresa). Las células se cultivan en medio hasta una densidad deseada, por ejemplo, hasta una DO600 de aproximadamente 0,5, y se realizan ensayos de β-galactosidasa, utilizando, por ejemplo, el Kit de Ensayo de β-galactosidasa BetaFluor™ (Novagen). El porcentaje de supresión puede calcularse como el porcentaje de actividad para una muestra con respecto a un
25 control comparable, por ejemplo, el valor observado para la construcción lacZ derivatizada, en la que la construcción tiene un codón en sentido correspondiente en una posición deseada en vez de un codón selector.
Sistema de traducción: la expresión “sistema de traducción” se refiere a componentes que incorporan un aminoácido en una cadena polipeptídica en crecimiento (proteína). Los componentes de un sistema de traducción pueden incluir, por ejemplo, ribosomas, ARNt, sintetasas, ARNm y similares. El O-ARNt y/o las O-RS de la invención pueden añadirse o formar parte de un sistema de traducción in vitro o in vivo, por ejemplo, en una célula no eucariota, por ejemplo, una bacteria (tal como E. coli) o en una célula eucariota, por ejemplo, una célula de levadura, una célula de mamífero, una célula vegetal, una célula de alga, una célula de hongo, una célula de insecto y/o similares.
35 Aminoácido no natural: como se usa en el presente documento, la expresión “aminoácido no natural” se refiere a cualquier aminoácido, aminoácido modificado y/o análogo de aminoácido, que no es uno de los 20 aminoácidos de origen natural comunes o los aminoácidos naturales raros selenocisteína o pirrolisina. Por ejemplo, el aminoácido no natural sulfotirosina; véase la FIG. 1) encuentra uso con la invención.
Derivado de: como se usa en el presente documento, la expresión “derivado de” se refiere a un componente que se aísla o se fabrica utilizando una molécula u organismo especificado, o información de la molécula o el organismo especificado. Por ejemplo, un polipéptido que deriva de un segundo polipéptido puede incluir una secuencia de aminoácidos que es idéntica o sustancialmente similar a la secuencia de aminoácidos del segundo polipéptido. En el caso de polipéptidos, las especies derivadas pueden obtenerse, por ejemplo, por mutagénesis de origen natural,
45 mutagénesis de sitio dirigido artificial o mutagénesis al azar artificial. La mutagénesis usada para derivar polipéptidos puede ser intencionalmente dirigida o intencionalmente al azar, o una mezcla de cada una. La mutagénesis de un polipéptido para crear un polipéptido diferente derivado del primero puede ser un acontecimiento al azar (por ejemplo, producido por infidelidad de polimerasa) y la identificación del polipéptido derivado puede realizarse mediante métodos de exploración apropiados, por ejemplo, como se analiza en el presente documento. La mutagénesis de un polipéptido normalmente conlleva la manipulación del polinucleótido que codifica el polipéptido.
Marcador de selección o identificación positiva: como se usa en el presente documento, la expresión “marcador de selección o identificación positiva” se refiere a un marcador que, cuando está presente, por ejemplo, expresado, activado o similar, da como resultado la identificación de una célula que comprende el rasgo, por ejemplo, una célula
55 con el marcador de selección positiva, entre aquellas que no tiene el rasgo.
Marcador de selección o identificación negativa: como se usa en el presente documento, la expresión “marcador de selección o identificación negativa” se refiere a un marcador que, cuando está presente, por ejemplo expresado activado o similar, permite la identificación de una célula que no comprende una propiedad o un rasgo seleccionado (por ejemplo, en comparación con una célula que posee la propiedad o el rasgo).
Indicador: como se usa en el presente documento, el término “indicador” se refiere a un componente que puede utilizarse para identificar y/o seleccionar componentes diana de un sistema de interés. Por ejemplo, un indicador puede incluir una proteína, por ejemplo, una enzima, que confiere resistencia o sensibilidad a antibióticos (por 65 ejemplo, β-lactamasa, cloranfenicol acetiltransferasa (CAT) y similar), un marcador de identificación fluorescente (por ejemplo, proteína fluorescente verde (por ejemplo, (GFP), YFP, EGFP, RFP, etc.), un marcador luminiscente (por
ejemplo una proteína de luciferasa de luciérnaga), un marcador de identificación basado en afinidad, o genes marcadores de selección positiva o negativa, tales como lacZ, β-gal/lacZ β-galactosidasa), ADH (alcohol deshidrogenasa), his3, ura3, leu2, lys2 o similares.
5 Eucariota: como se usa en el presente documento el término “eucariota” se refiere a organismos que pertenecen al Reino Eucarya. Los eucariotas se diferencian generalmente de los procariotas por su organización normalmente multicelular (pero no exclusivamente multicelular, por ejemplo, levaduras), la presencia de un núcleo delimitado por una membrana y otros orgánulos delimitados por una membrana, materiales genéticos lineales (por ejemplo, cromosomas lineales), la ausencia de operones, la presencia de intrones, ARNm con protección de mensaje y poli-A y otras características bioquímicas, tal como una estructura ribosomal diferenciable. Los organismos eucariotas incluyen, por ejemplo, animales (por ejemplo, mamíferos, insectos, reptiles, aves, etc.), ciliados, plantas (por ejemplo, monocotiledóneas, dicotiledóneas, algas, etc.), hongos, levaduras, flagelados, microsporidios, protistas, etc.
Procariota: como se usa en el presente documento, el término “procariota” se refiere a organismos que pertenecen
15 al Reino Monera (también denominado Procarya). Los organismos procariotas se diferencian generalmente de los eucariotas por su organización unicelular, reproducción asexual por gemación o fisión, la ausencia de un núcleo delimitado por una membrana u otros orgánulos delimitados por una membrana, un cromosoma circular, la presencia de operones, la ausencia de intrones, protección de mensaje y poli-A ARNm y otras características bioquímicas tales como una estructura ribosomal diferenciable. Los Procariota incluyen los subreinos Eubacteria y Archaea (a veces denominados “Arqueobacterias”). Las cianobacterias (algas verde azuladas) y los micoplasmas a veces se presentan en distintas clasificaciones en el Reino Monera.
Bacterias: como se usa en el presente documento, los términos “bacterias” y “eubacterias” se refieren a organismos procariotas que son diferenciables de los Archaea. De manera similar, Archaea se refiere a procariotas que son
25 diferenciables de eubacterias. Las Eubacterias y Archaea pueden diferenciarse por diversos criterios morfológicos y bioquímicos. Por ejemplo, las diferencias en las secuencias de ARN ribosomal, estructura de la ARN polimerasa, la presencia o ausencia de intrones, sensibilidad a antibióticos, la presencia o ausencia de peptidoglucanos en la pared celular y otros componentes de pared celular, las estructuras ramificadas frente a no ramificadas de los lípidos de membrana y la presencia/ausencia de histonas y proteínas similares a histonas se usan para asignar a un organismo en Eubacterias o en Archaea.
Como ejemplos de Eubacterias se incluyen Escherichia coli, Thermus thermophilus, Bacillus subtilis y Bacillus stearothermophilus. Ejemplos de Arcaea incluyen Methanococcus jannaschii (Mj), Methanosarcina mazei (Mm), Methanobacterium thermoautotrophicum (Mt), Methanococcus maripaludis, Methanopyrus kandleri, Halobacterium
35 tal como Haloferax volcanii y especies de Halobacterium NRC-1, Archaeoglobus fulgidus (Af), Pyrococcus furiosus (Pf), Pyrococcus horikoshii (Ph), Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss), Sulfolobus tokodaii, Aeuropyrum pernix (Ap), Thermoplasma acidophilum y Thermoplasma volcanium.
Variante conservativa: como se usa en el presente documento, la expresión “variante conservativa” en el contexto de un componente de traducción, se refiere a un componente de traducción, por ejemplo, un O-ARNt variante conservativo o una O-RS variante conservativa que funcionalmente se comporta de manera similar a un componente base al cual es similar la variante conservativa, por ejemplo, un O-ARNt o una O-RS, que tiene variaciones en la secuencia en comparación con un O-ARNt o una O-RS de referencia. Por ejemplo, una O-RS, o una variante conservativa de esta O-RS, aminoacilará un O-ARNt afín con un aminoácido natural, por ejemplo, sulfotirosina. En
45 este ejemplo, la O-RS y la O-RS variante conservativa no tienen las mismas secuencias de aminoácidos. La variante conservativa puede tener, por ejemplo, una variación, dos variaciones, tres variaciones, cuatro variaciones o cinco o más variaciones en la secuencia, siempre que la variante conservativa sea complementaria (por ejemplo funcione con) al O-ARNt o a la O-RS afín correspondiente.
En algunas realizaciones, una O-RS variante conservativa comprende una o más sustituciones de aminoácidos conservativas en comparación con la O-RS de la que deriva. En algunas realizaciones, una O-RS variante conservativa comprende una o más sustituciones de aminoácidos conservativas en comparación con la O-RS de la que deriva, y adicionalmente conserva actividad biológica O-RS; por ejemplo, una O-RS variante conservativa que conserva al menos el 10 % de la actividad biológica de la molécula O-RS parental de la que deriva, o como
55 alternativa, al menos el 20 %, al menos el 30 % o al menos el 40 %. En algunas realizaciones preferidas, la O-RS variante conservativa conserva al menos el 50 % de la actividad biológica de la molécula O-RS parental de la que deriva. Las sustituciones de aminoácidos conservativas de una O-RS variante conservativa pueden producirse en cualquier dominio de la O-RS, incluyendo el bolsillo de unión de aminoácidos.
Agente de selección o identificación: como se usa en el presente documento, la expresión “agente de selección o identificación” se refiere a un agente que, cuando está presente, permite la selección/identificación de determinados componentes de una población. Por ejemplo, un agente de selección o identificación puede ser, pero sin limitación, por ejemplo, un nutriente, un antibiótico, una longitud de onda de luz, un anticuerpo, un polinucleótido expresado o similar. El agente de selección se puede variar, por ejemplo, por concentración, intensidad, etc.
65 En respuesta a: como se usa en el presente documento, la expresión “en respuesta a” se refiere al proceso en el que un O-ARNt de la invención reconoce un codón selector y media la incorporación del aminoácido no natural, que está acoplado al ARNt, en la cadena polipeptídica en crecimiento.
5 Codifica: como se usa en el presente documento, el término “codifica” se refiere a cualquier proceso mediante el cual la información en una macromolécula polimérica o cadena de secuencia se usa para dirigir la producción de una segunda molécula o cadena de secuencia que es diferente de la primera molécula o cadena de secuencia. Como se usa en el presente documento, el término se usa ampliamente, y puede tener diversas aplicaciones. En algunos aspectos, el término “codifica” describe el proceso de replicación de ADN semi-conservativa, donde una cadena de una molécula de ADN bicatenaria se usa como un molde para codificar una cadena hermana complementaria recién sintetizada por una ADN polimerasa dependiente de ADN.
En otro aspecto, el término “codificar” se refiere a cualquier proceso mediante el cual la información en una molécula se usa para dirigir la producción de una segunda molécula que tiene una naturaleza química diferente de la primera
15 molécula. Por ejemplo, una molécula de ADN puede codificar una molécula de ARN (por ejemplo, mediante el proceso de transcripción incorporando una enzima ARN polimerasa dependiente de ADN). Además, una molécula de ARN puede codificar un polipéptido, como en el proceso de traducción. Cuando se usa para describir el proceso de traducción, el término “codificar” también se extiende al codón triplete que codifica un aminoácido. En algunos aspectos, una molécula de ARN puede codificar una molécula de ADN, por ejemplo, mediante el proceso de transcripción inversa incorporando una ADN polimerasa dependiente de ARN. En otro aspecto, una molécula de ADN puede codificar un polipéptido, donde se entiende que “codificar”, como se usa en este caso, incorpora los procesos tanto de traducción como los de transcripción.
25 La FIG. 1 proporciona la estructura química del aminoácido no natural sulfotirosina.
La FIG. 2 muestra un gel PAGE desnaturalizante teñido con azul de Coomassie que ilustra la migración de la desulfohirudina y de la sulfohirudina. El tamaño de la hirudina no puede juzgarse por patrones de peso molecular debido a la carga atípica de la hirudina.
Las FIGS. 3A y 3B proporcionan gráficas representativas de la inhibición de trombina con sus curvas de progreso ajustadas respectivas superpuestas en los puntos de datos no procesados. Se realizaron ensayos enzimáticos con sustrato fluorogénico 50 μM, α-trombina humana 40 pM e hirudina expresada 100 pM en un
35 tampón de solución salina Tris-HCl complementado con polietilenglicol 600 y HSA. La FIG. 3A muestra gráficas de intensidad de fluorescencia a lo largo del tiempo sin inhibición (control), con inhibición por desulfohirudina y con inhibición por sulfohirudina. La FIG. 3B muestra ampliación de gráficas de desulfohirudina y sulfohirudina para comparación.
Las FIGS. 4A y 4B ilustran la expresión dependiente de sulfotirosina del dominio Z. La FIG. 4A proporciona un gel PAGE desnaturalizante teñido con azul de Coomassie del lisado celular purificado con Ni-NTA (ácido níquel nitritilotriacético) de células que expresan el dominio Z con un codón ámbar en la posición 7. La expresión solo con medio complementado con sulfotirosina produce el dominio Z de longitud completa. La FIG. 4B proporciona un espectro MALDI-TOF en modo lineal de iones positivos (generado utilizando una matriz THAP) del lisado
45 celular purificado con Ni-NTA (concentrado y dializado frente a agua) que muestra un pico correspondiente al dominio Z de longitud completa que contiene una sola sulfotirosina y que carece de metionina. También se observa un pico correspondiente a la pérdida de sulfato resultante de las condiciones del análisis espectral de masas.
Las FIGS. 5A, 5B y 5C muestran diversos espectros MALDI-TOF. La FIG. 5A muestra un espectro MALDI-TOF en modo lineal de iones positivos (generado utilizando una matriz THAP) de la sulfohirudina pura que muestra tanto el pico de sulfohirudina intacto [M+H] (7059 Da) como el pico correspondiente a la pérdida de sulfato durante el análisis espectral de masas (6979 Da). Obsérvese que los picos pequeños a la derecha de los principales son aductos de sodio. Se producen a intervalos adicionales de 22 Da. La FIG. 5B muestra un
55 espectro MALDI-TOF (generado utilizando una matriz sinapínica) que documenta la pureza de la muestra. Para aumentar la detección de posibles impurezas, se utilizó una matriz sinapínica más rigurosa, que dio como resultado la predominancia del pico [M+H-80]. El pico a 13964 Da puede atribuirse a la dimerización de la sulfohirudina. No se observaron otras impurezas. La FIG. 5C muestra una ampliación de la región relevante que muestra la presencia del pico tanto de la sulfohirudina intacta y como de [M+H-80]. La sulfohirudina intacta es el pico menor debido al uso de la matriz sinapínica más rigurosa. Los picos pequeños a la derecha de los principales son aductos de sodio.
Las FIGS. 6A y 6B muestran diversos espectros MALDI-TOF. La FIGURA 6A muestra un espectro MALDI-TOF (generado utilizando una matriz sinapínica) de medios de expresión de la sulfohirudina no purificada 65 correspondientes a la expresión en ausencia de sulfotirosina. Solo se encontró el pico de la hirudina truncada; no se observó proteína de longitud completa. La FIG. 6B muestra un espectro MALDI-TOF (generado utilizando una
matriz sinapínica) de medios de expresión de sulfohirudina no purificada correspondientes a la expresión en presencia de sulfotirosina demostrando la proporción de picos de la sulfohirudina truncada con respecto a la de longitud completa. Debido a las condiciones más rigurosas necesarias para una buena detección de las mezclas de muestras brutas, solo se observó claramente la forma ionizada de la sulfohirudina.
5
La FIG. 7 proporciona secuencias de nucleótidos y de aminoácidos.
Aunque la sulfatación de la tirosina es una modificación postraduccional generalizada en eucariotas multicelulares (Moore, “The biology and enzymology of protein tyrosine O-sulfation,” J Biol Chem 278: 24243-24246 (2003)), sus funciones biológicas siguen sin conocerse en gran medida. Esto se debe en parte a las dificultades asociadas con la síntesis de proteínas sulfatadas selectivamente. La invención proporciona la incorporación selectiva de sulfotirosina en proteínas en bacterias por codificación genética del aminoácido modificado en respuesta al codón sin sentido
15 ámbar, TAG. Además, se demuestra que la sulfohirudina, previamente inaccesible a través de métodos recombinantes, puede expresarse directamente en E. coli utilizando esta estrategia. Como se describe en el presente documento, análisis cinéticos muestran una mejora en afinidad mayor de 10 veces frente a la trombina humana por sulfohirudina sobre la desulfohirudina, una observación que ofrece ventajas clínicas para la sulfohirudina en su uso como un anticoagulante (Di Nisio et al., “Direct thrombin inhibitors,” N Engl J Med 353: 10281040 (2005)). Esta estrategia general para la biosíntesis de proteínas sulfatadas facilita el estudio y la aplicación adicional de la modificación postraduccional emergente, la sulfatación de la tirosina.
Como un método general para la sulfatación específica de sitio de proteínas, la presente descripción describe el desarrollo de un par ARNt/aminoacil-ARNt sintetasa (aaRS) ortogonal que permite la incorporación eficaz y selectiva
25 de sulfotirosina en proteínas eucariotas tales como E. coli en respuesta al codón sin sentido ámbar. Utilizando este único par ARNt/aaRS supresor, la forma sulfatada nativa de la hirudina se expresa directamente y se muestra que tiene una afinidad de 10 veces mayor por la trombina humana que por la desulfohirudina, de acuerdo con publicaciones de bibliografía anterior (Stone y Hofsteenge, “Kinetics of the inhibition of thrombin by hirudin,” Biochemistry 25: 4622-4628 (1986)).
La presente memoria descriptiva proporciona pares ARNt/aminoacil-ARNt sintetasa ortogonales que permiten la introducción selectiva in vivo de la sulfotirosina (véase la FIG. 1) en proteínas en E. coli en respuesta a un codón selector, por ejemplo, el codón de terminación ámbar TAG. La invención proporciona nuevos polipéptidos aminoacil-ARNt sintetasa (O-RS) ortogonales, que cargan específicamente un ARNt ortogonal (O-ARNt) afín con el
35 aminoácido no natural sulfotirosina.
En algunos aspectos, para demostrar (pero no limitar) la presente invención, la descripción del presente documento demuestra que el resto de aminoácido no natural puede incorporarse en diversas proteínas modelo. No se pretende limitar la incorporación del aminoácido no natural a ninguna proteína particular. A partir de la presente descripción, será obvio que la incorporación del aminoácido no natural sulfotirosina en proteínas de interés particular es ventajosa para una amplia diversidad de finalidades.
La presente descripción describe el desarrollo de nuevos pares ARNt/aminoacil-ARNt sintetasa ortogonales que funcionan en eubacterias para incorporar específicamente en el sitio un aminoácido no natural de sulfotirosina
45 (proporcionado en la FIG. 1) en respuesta a codones selectores. En resumen, la invención proporciona nuevos mutantes de tirosil-ARNt sintetasa de Methanococcus janaschii como se define en las reivindicaciones, que cargan selectivamente un ARNt supresor con el aminoácido no natural sulfotirosina en células hospedadoras E. coli.
Estos pares de ARNt-sintetasa desarrollados pueden utilizarse para incorporar específicamente en el sitio el aminoácido no natural sulfotirosina en una proteína. La incorporación del aminoácido no natural en la proteína puede programarse para que se produzca en cualquier posición deseada por modificación con ingeniería genética del polinucleótido que codifica la proteína de interés para contener un codón selector que señalice la incorporación del aminoácido no natural.
55 La invención descrita en el presente documento proporciona pares ortogonales para la codificación e incorporación genética del aminoácido no natural sulfotirosina en proteínas en una eubacteria, por ejemplo, una célula de E. coli, en la que los componentes ortogonales no reaccionan en cruzado con componentes de E. coli endógenos de la maquinaria traduccional de la célula hospedadora, pero reconocen el aminoácido no natural deseado y lo incorporan en proteínas en respuesta a un codón selector (por ejemplo, un codón sin sentido ámbar, TAG). Los componentes ortogonales proporcionados por la invención incluyen aminoacil-ARNt sintetasas ortogonales derivadas de ARNtsintetasa de Methanococcus janaschii y el supresor ámbar tirosil ARNtCUA, mutante que funciona como un par ortogonal en una célula hospedadora de eubacteria.
La invención proporciona composiciones de y métodos, como se define en las reivindicaciones, para identificar y
65 producir pares adicionales de ARNt-aminoacil-ARNt sintetasa ortogonales, por ejemplo pares O-ARNt/O-RS que pueden utilizarse para incorporar sulfotirosina en proteínas. Un par O-ARNt/O-RS de la invención puede mediar la incorporación de la sulfotirosina en una proteína que está codificada por un polinucleótido, en el que el polinucleótido comprende un codón selector que es reconocido por el O-ARNt. El bucle anticodón del O-ARNt reconoce el codón selector en un ARNm e incorpora el aminoácido no natural en este sitio en el polipéptido. Generalmente, una aminoacil-ARNt sintetasa ortogonal de la invención aminoacila (o carga) preferentemente su O-ARNt solo con un
5 aminoácido no natural específico.
TECNOLOGÍA ARNt/AMINOACIL-ARNt SINTETASA ORTOGONAL
Un entendimiento de las nuevas composiciones y métodos de la presente invención requiere un entendimiento de
10 las actividades asociadas con pares de ARNt ortogonal y aminoacil-ARNt sintetasa ortogonal. Para añadir aminoácidos no naturales adicionales al código genético, se requieren nuevos pares ortogonales que comprendan una aminoacil-ARNt sintetasa y un ARNt adecuado que puedan funcionar eficazmente en la maquinaria traduccional del hospedador, pero que sean “ortogonales” para el sistema de traducción en cuestión, lo que significa que funcionan independientemente de las sintetasas y de los ARNt endógenos al sistema traduccional. Características
15 deseadas del par ortogonal incluyen ARNt que descodifica o reconoce solo un codón específico, por ejemplo, un codón selector, que no está descodificado por ningún ARNt endógeno, y aminoacil-ARNt sintetasas que aminoacilan (o “cargan”) preferentemente su ARNt afín solo con un aminoácido específico no natural. Además el O-ARNt no está normalmente aminoacilado (o está mal aminoacilado, es decir, cargado) por sintetasas endógenas. Por ejemplo, en un sistema hospedador de E. coli, un par ortogonal incluirá una aminoacil-ARNt sintetasa que no reacciona en
20 cruzado con ninguno de los ARNt endógenos, por ejemplo, en el que hay 40 en E. coli, y un ARNt ortogonal que no está aminoacilado por ningunas de las sintetasas endógenas, por ejemplo, de las que hay 21 en E. coli.
Los principios generales de los sistemas de traducción ortogonal que son adecuados para fabricar proteínas que comprendan uno o más aminoácidos naturales son conocidos en la técnica, así como en los métodos generales 25 para la producción de sistemas de traducción ortogonal. Por ejemplo, véanse los Números de Publicación Internacionales WO 2002/086075, titulado “METHODS AND COMPOSI-TION FOR THE PRODUCTION OF ORTHOGONAL tRNA-AMINOACYL-tRNA SYNTHETASE PAIRS”; WO 2002/085923, titulado “IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS”; WO 2004/094593, titulado “EXPANDING THE EUKARYOTIC GENETIC CODE”; WO 2005/019415, presentado el 7 de julio de 2004; WO 2005/007870, presentado el 7 de julio de 30 2004; WO 2005/007624, presentado el 7 de julio de 2004; WO 2006/110182, presentado el 27 de octubre de 2005, titulado “ORTHOGONAL TRANSLATION COMPONENTS FOR THE VIVO INCORPORATION OF UNNATURAL AMINO AIDS” y WO 2007/103490, presentado el 7 de marzo de 2007, titulado “SYSTEMS FOR THE EXPRESSION OF ORTHOGONAL TRANSLATION COMPONENTS IN EUBACTERIAL HOST CELLS”. Para un debate sobre los sistemas de traducción ortogonal que incorporan aminoácidos no naturales y métodos para su producción y uso,
35 véase también Wang y Schultz “Expanding the Genetic Code,” Angewandte Chemie Int. Ed., 44(1): 34-66 (2005), Xie y Schultz, “An Expanding Genetic Code,” Methods 36(3): 227-238 (2005); Xie y Schultz, “Adding Amino Acids to the Genetic Repertoire,” Curr. Opinion in Chemical Biology 9(6): 548-554 (2005); y Wang et al., “Expanding the Genetic Code,” Annu. Rev. Biophys. Biomol. Struct., 35: 225-249 (2006).
40 Sistemas de traducción ortogonal
Los sistemas de traducción ortogonal generalmente comprenden células (que pueden ser células procariotas tales como E. coli) que incluyen un ARNt ortogonal (O-ARNt), una aminoacil ARNt sintetasa ortogonal (O-RS), y un aminoácido no natural, en el que la O-RS aminoacila el O-ARNt con el aminoácido no natural. Un par ortogonal de la 45 invención puede incluir un O-ARNt, por ejemplo, un ARNt supresor, un ARNt de desplazamiento de fase de lectura,
o similar, o una O-RS afín. Los sistemas ortogonales de la invención definidos en las reivindicaciones comprenden normalmente pares de O-ARNt/O-RS, en el contexto de una célula hospedadora o sin la célula hospedadora. Además de sistemas multicomponentes, la invención también proporciona nuevos componentes individuales, por ejemplo, nuevos polipéptidos aminoacil-ARNt sintetasa ortogonales (por ejemplo, SEC ID Nos: 4, 6, 8 o 10), y los
50 polinucleótidos que codifican estos polipéptidos (por ejemplo, SEC ID Nos: 5, 7, 9 u 11).
En general, cuando un par ortogonal reconoce un codón selector y carga un aminoácido en respuesta al codón selector, se dice que el par ortogonal “suprime” el codón selector. Es decir, un codón selector que no está reconocido por la maquinaria endógena (por ejemplo, de la célula) del sistema de traducción, no está habitualmente
55 cargado, lo que produce el bloqueo de la producción de un polipéptido que, de otra manera, se transcribiría a partir del ácido nucleico. En un sistema de pares ortogonales, la O-RS aminoacila el O-ARNt con un aminoácido no natural específico. El O-ARNt cargado reconoce el codón selector y suprime el bloqueo traduccional producido por el codón selector.
60 En algunos aspectos, un O-ARNt de la invención reconoce un codón selector y puede incluir una eficacia de supresión de al menos aproximadamente, por ejemplo, 45 %, 50 %, 60 %, 75 %, 80 % o 90 % o más en presencia de una sintetasa afín en respuesta a un codón selector en comparación con la eficacia de supresión de un O-ARNt que comprende o está codificado por una secuencia de polinucleótidos como se indica en la lista de secuencias del presente documento.
65 En algunas realizaciones, la eficacia de supresión de la O-RS y del O-ARNt en su conjunto puede ser aproximadamente, por ejemplo, 5 veces, 10 veces, 15 veces, 20 veces o 25 veces o más elevada que la eficacia de supresión del O-ARNt que carece de la O-RS. En algunos aspectos, la eficacia de supresión de la O-RS y del O-ARNt en su conjunto puede ser al menos aproximadamente, por ejemplo, 35 %, 40 %, 45 %, 50 %, 60 %, 75 %, 80
5 % o 90 % o más de la eficacia de supresión de un par sintetasa ortogonal como se indica en la lista de secuencias en el presente documento.
La célula hospedadora utiliza el par O-ARNt/O-RS que incorpora el aminoácido no natural en una cadena polipeptídica en crecimiento, por ejemplo, mediante un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en el que el polinucleótido comprende un codón selector que es reconocido por el O-ARNt. En determinados aspectos preferidos, la célula puede incluir uno o más pares O-ARNt/O-RS adicionales, en el que el O-ARNt adicional se carga mediante la O-RS adicional con un aminoácido no natural diferente. Por ejemplo, uno de los ARNt puede reconocer un codón de cuatro bases y el otro O-ARNt puede reconocer un codón de terminación. Como alternativa, en el mismo ácido nucleico codificante pueden utilizarse codones de terminación diferentes
15 múltiples o codones de cuatro bases diferentes múltiples.
Como se observa, en algunas realizaciones, existen pares O-ARNt/O-RS múltiples en una célula u otro sistema de traducción, que permiten la incorporación de más de un aminoácido no natural en un polipéptido. Por ejemplo, la célula puede incluir adicionalmente un par O-ARNt/O-RS diferente adicional y un segundo aminoácido no natural, en el que este O-ARNt reconoce un segundo codón selector y esta O-RS adicional aminoacila preferentemente el O-ARNt con el segundo aminoácido no natural. Por ejemplo, una célula que incluya un par O-ARNt/O-RS (en el que el O-ARNt reconoce, por ejemplo, un codón selector ámbar), puede comprender adicionalmente un segundo par ortogonal, en el que segundo O-ARNt reconoce un codón selector diferente, por ejemplo, un codón ópalo, un codón de cuatro bases o similar. Deseablemente, los pares ortogonales diferentes derivan de diferentes fuentes, que
25 pueden facilitar el reconocimiento de diferentes codones selectores.
En determinadas realizaciones, los sistemas comprenden una célula, tal como una célula E. coli que incluye un ARNt ortogonal (O-ARNt), una aminoacil-ARNt sintetasa ortogonal (O-RS), un aminoácido no natural y un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en el que polinucleótido comprende el codón selector que está reconocido por el O-ARNt. El sistema de traducción también puede ser un sistema acelular, por ejemplo, cualquiera de diversos sistemas de transcripción/traducción "in vitro" disponibles en el comercio en combinación con un par O-ARNt/O-RS y un aminoácido no natural como se describe en el presente documento.
35 El O-ARNt y/o la O-RS pueden ser de origen natural o pueden derivar, por ejemplo, por mutación de un ARNt y/o una RS de origen natural, por ejemplo, generando bibliotecas de ARNt y/o bibliotecas de RS, a partir de cualquiera de diversos organismos y/o utilizando cualquiera de diversas estrategias de mutación disponibles. Por ejemplo, una estrategia para producir un par ARNt/aminoacil-ARNt sintetasa ortogonal implica importar un par ARNt/sintetasa (a la célula hospedadora) heterólogo a partir de, por ejemplo, una fuente distinta de la célula hospedadora, o múltiples fuentes, en la célula hospedadora. Las propiedades de la candidata sintetasa heteróloga incluyen, por ejemplo, que no carga ningún ARNt en la célula hospedadora, y las propiedades del candidato ARNt heterólogo incluyen, por ejemplo, que no está aminoacilado por ninguna sintetasa de la célula hospedadora. Además, el ARNt heterólogo es ortogonal con respecto a todas las sintetasas de la célula hospedadora. Una segunda estrategia para generar un par ortogonal implica generar bibliotecas mutantes a partir de las cuales se identifique y/o se seleccione un O-ARNt o
45 una O-RS. Estas estrategias también pueden combinarse.
ARNt ortogonal (O-ARNt)
Un ARNt ortogonal (O-ARNt) de la invención media deseablemente la incorporación de un aminoácido no natural en una proteína que está codificada por un polinucleótido que comprende un codón selector que es reconocido por el O-ARNt, por ejemplo, in vivo o in vitro. En determinadas realizaciones, un O-ARNt de la invención puede incluir una eficacia de supresión de al menos aproximadamente, por ejemplo, un 45 %, un 50 %, un 60 %, un 75 %, un 80 % o un 90 % o más en presencia de una sintetasa afín en respuesta a un codón selector en comparación con un O-ARNt que comprende o está codificado por una secuencia de polinucleótidos como se indica en las secuencias de O-ARNt
55 en la lista de secuencias del presente documento.
La eficacia de supresión puede determinarse por cualquiera de diversos ensayos conocidos en la técnica. Por ejemplo, puede utilizarse un ensayo indicador con β-galactosidasa, por ejemplo, un plásmido lacZ derivatizado (en el que la construcción tiene un codón selector en la secuencia de ácidos nucleicos de lacZ) se introduce en células de un organismo apropiado (por ejemplo, un organismo en el que pueden utilizarse los componentes ortogonales) junto con plásmido que comprende un O-ARNt de la invención. También puede introducirse una sintetasa afín (como un polipéptido o un polinucleótido que codifica la sintetasa afín cuando se expresa). Las células se cultivan en medios a una densidad deseada, por ejemplo, a una DO600 de aproximadamente 0,5, y se realizan ensayos con βgalactosidasa, por ejemplo, utilizando el Kit de Ensayo β-Galactosidasa BetaFluor™(Novagen). El porcentaje de 65 supresión puede calcularse como el porcentaje de actividad para una muestra con respecto a un control comparable, por ejemplo, el valor observado a partir de la construcción lacZ derivatizada, en el que la construcción tiene un
codón sentido correspondiente en la posición deseada en lugar de un codón selector.
En la lista de secuencias del presente documento, por ejemplo, véase la FIG. 7 y la SEC ID Nº: 1 se indican ejemplos de O-ARNt de la invención. La descripción del presente documento también proporciona orientaciones
5 para el diseño de especies de O-ARNt adicionales equivalentes. En una molécula de ARN, tal como un ARNm de O-RS, o molécula de O-ARNt, la Timina (T) se reemplaza con Uracilo (U) con respecto a una secuencia determinada (o viceversa para un ADN codificante), o su complemento. También pueden estar presentes modificaciones adicionales para las bases para generar moléculas en gran parte funcionalmente equivalentes.
La invención también incluye variaciones conservativas de O-ARNt correspondientes a O-ARNt particulares del presente documento. Por ejemplo, variaciones conservativas de O-ARNt incluyen aquellas moléculas que funcionan como los O-ARNt particulares, por ejemplo, como en la lista de secuencias del presente documento y que conservan la estructura en forma de L del ARNt debido a auto-complementariedad apropiada, pero que no tienen una secuencia idéntica a las de, por ejemplo, la lista de secuencias de la FIG. 7, y deseablemente, son distintas de las
15 moléculas de ARNt de tipo silvestre.
La composición comprende un O-ARNt que adicionalmente incluye una aminoacil-ARNt sintetasa ortogonal (O-RS) como se define en las reivindicaciones, en la que la O-RS aminoacila preferentemente el O-ARNt con un aminoácido no natural. En determinadas realizaciones, una composición que incluye un O-ARNt puede incluir adicionalmente un sistema de traducción (por ejemplo, in vitro o in vivo). En la célula también puede haber un ácido nucleico que comprenda un polinucleótido que codifique un polipéptido de interés, en el que el polinucleótido comprenda un codón selector reconocido por el O-ARNt, o una combinación de uno o más de estos.
Son también un aspecto de la presente invención métodos de producción de un ARNt ortogonal (O-ARNt). Un O
25 ARNt producido por el método se utiliza en las composiciones y métodos de la invención. En determinadas realizaciones de la presente descripción, los O-ARNt pueden producirse generando una biblioteca de mutantes. La biblioteca de ARNt mutantes puede generarse utilizando diversas técnicas de mutagénesis conocidas en el campo. Por ejemplo, los ARNt mutantes pueden generarse por mutaciones específicas de sitio, mutaciones puntuales aleatorias, recombinación homóloga, transposición de ADN u otros métodos de mutagénesis recursiva, construcción quimérica o cualquier combinación de los mismos, por ejemplo, del O-ARNt de la SEC ID Nº: 1.
Pueden introducirse mutaciones adicionales en una posición (o posiciones) específicas, por ejemplo, en una posición (o posiciones) no conservativa, o en una posición conservativa, en una posición (o posiciones) al azar, o una combinación de tanto en un bucle deseado como región de un ARNt, por ejemplo, un bucle anticodón, el tallo
35 aceptor, brazo o bucle D, bucle variable, brazo o bucle TPC, otras regiones de la molécula de ARNt, o una combinación de los mismos. Normalmente, las mutaciones en un ARNt incluyen mutar el bucle anticodón de cada miembro de la biblioteca de ARNt mutantes para permitir el reconocimiento de un codón selector. El método puede incluir añadir adicionalmente secuencias adicionales al O-ARNt. Normalmente, un O-ARNt posee una mejora de ortogonalidad para un organismo deseado en comparación con el material de partida, por ejemplo, la pluralidad de secuencias de ARNt, conservando al mismo tiempo su afinidad hacia una RS deseada.
Los métodos incluyen analizar opcionalmente la similitud (y/u homología deducida) de secuencia de los ARNt y/o aminoacil-ARNt sintetasas para determinar posibles candidatos para un O-ARNt, O-RS y/o pares de los mismos, que parecen ser ortogonales para un organismo específico. Programas informáticos conocidos en la técnica y descritos
45 en el presente documento pueden utilizarse para el análisis, por ejemplo, BLAST y pueden utilizarse programas de compilación. En un ejemplo, para seleccionar posibles componentes de traducción ortogonal para su uso en E. coli, se selecciona una sintetasa y/o un ARNt que no muestre similitud de secuencia próxima a organismos eubacterianos.
Normalmente, un O-ARNt se obtiene sometiendo a, por ejemplo, selección negativa, una población de células de una primera especie, en la que las células comprenden un miembro de la pluralidad de posibles O-ARNt. La selección negativa elimina células que comprenden un miembro de la biblioteca de posibles O-ARNt que es aminoacilado por una aminoacil-ARNt sintetasa (RS) que es endógena a la célula. Esto proporciona un conjunto de ARNt que son ortogonales a la célula de la primera especie.
55 En determinadas realizaciones, en la selección negativa, se introduce uno o varios codones selectores en un polinucleótido que codifica un marcador de selección negativa, por ejemplo, una enzima que confiere resistencia a antibióticos, por ejemplo, β-lactamasa, una enzima que confiere un producto detectable, por ejemplo, βgalactosidasa, cloranfenicol acetiltransferasa (CAT), por ejemplo, un producto tóxico, tal como barnasa, en una posición no esencial (por ejemplo, que todavía produce una barnasa funcional), etc. La detección/selección se realiza opcionalmente cultivando la población de células en presencia de un agente selectivo (por ejemplo, un antibiótico, tal como ampicilina). En una realización, se modifica la concentración del agente de selección.
Por ejemplo, para medir la actividad de ARNt supresores, se utiliza un sistema de selección que se basa en la
65 supresión in vivo de codón selector, por ejemplo, mutaciones sin sentido (por ejemplo, de detección) o de desplazamiento de fase introducidas en un polinucleótido que codifica un marcador de selección negativa, por ejemplo, un gen para β-lactamasa (bla). Por ejemplo, se construyen variantes de polinucleótido, por ejemplo variantes de bla, con un codón selector en una determinada posición (por ejemplo, A184). Las células, por ejemplo, bacterias, se transforman con estos polinucleótidos. En el caso de un ARNt ortogonal, que no puede cargarse eficazmente por sintetasas de E. coli endógenas, la resistencia a antibióticos, por ejemplo, resistencia a ampicilina,
5 debe ser aproximadamente o inferior a aquella para la que una bacteria se transformó sin plásmido. Si el ARNt no es ortogonal, o si una sintetasa heteróloga capaz de cargar el ARNt se coexpresa en el sistema, se observa un mayor nivel de antibiótico, por ejemplo, resistencia a ampicilina. Se seleccionan células, por ejemplo, bacterias, que no pueden cultivarse en placas de LB agar con concentraciones de antibiótico aproximadamente iguales a células transformadas sin plásmidos.
En el caso de un producto tóxico (por ejemplo, ribonucleasa o barnasa), cuando un miembro de la pluralidad de ARNt posibles es aminoacilado por un hospedador endógeno, por ejemplo, sintetasas de Escherichia coli (es decir, no es ortogonal al hospedador, por ejemplo, sintetasas de Escherichia coli) el codón selector se suprime y el producto polinucleotídico tóxico producido conduce a la muerte celular. Las células que alojan ARNt ortogonales o
15 ARNt no funcionales sobreviven.
En una realización, el conjunto de ARNt que son ortogonales a un organismo deseado se someten después a una selección positiva en la que un codón selector se coloca en un marcador de selección positiva, por ejemplo, codificado por un gen de resistencia a fármacos, tal como un gen de β-lactamasa. La selección positiva se realiza en una célula que comprende un polinucleótido que codifica o que comprende un miembro del conjunto de ARNt que son ortogonales a la célula, un polinucleótido que codifica un marcador de selección positiva y un polinucleótido que codifica una RS afín. En determinadas realizaciones, la segunda población de células comprende células que no se eliminaron por selección negativa. Los polinucleótidos se expresan en la célula y la célula se cultiva en presencia de un agente de selección, por ejemplo, ampicilina. Después los ARNt se seleccionan por su capacidad para
25 aminoacilarse por la sintetasa afín coexpresada y para insertar un aminoácido en respuesta a este codón selector. Normalmente, estas células muestran una potenciación en cuanto a la eficacia de supresión en comparación con células que alojan ARNt no funcional(es), o ARNt que no pueden ser reconocidos eficazmente por la sintetasa de interés. Las células que alojan los ARNt no funcionales o ARNt que no son reconocidos eficazmente por la sintetasa de interés, son sensibles al antibiótico. Por lo tanto los ARNt que: (i) no son sustratos para sintetasas endógenas del hospedador, por ejemplo, de Escherichia coli; (ii) pueden ser aminoacilados por la sintetasa de interés; y (iii) son funcionales en la traducción, sobreviven a ambas selecciones.
Por consiguiente, el mismo marcador puede ser un marcador positivo o negativo, dependiendo del contexto en el que se explore. Es decir, el mismo marcador es un marcador positivo si se explora para, pero es un marcador
35 negativo si se explora contra.
La rigurosidad de la selección, por ejemplo, la selección positiva, la selección negativa o tanto la selección positiva como la negativa, en los métodos descritos anteriormente, incluye opcionalmente modificar la rigurosidad de la selección. Por ejemplo, dado que la barnasa es una proteína extremadamente tóxica, la rigurosidad de la selección negativa puede controlarse introduciendo diferentes números de codones selectores en el gen barnasa y/o utilizando un promotor inducible. En otro ejemplo, se modifica la concentración del agente de selección o identificación (por ejemplo, concentración de ampicilina). En algunos aspectos, la rigurosidad se modifica debido a que la actividad deseada puede ser baja durante las primeras rondas. Por tanto, se aplican criterios de selección menos rigurosos en las primeras rondas y se aplican criterios más rigurosos en rondas de selección posteriores. En determinadas
45 realizaciones, la selección negativa, la selección positiva o tanto la selección positiva como la negativa pueden repetirse múltiples veces. Se pueden utilizar múltiples marcadores diferentes de selección negativa, marcadores de selección positiva o tanto marcadores de selección positiva como negativa. En determinadas realizaciones, el marcador de selección positiva y negativa puede ser el mismo.
En los métodos de la invención pueden utilizarse otros tipos de selección/identificación para producir componentes de traducción ortogonales, por ejemplo, un O-ARNt, una O-RS y un par O-ARNt/O-RS que carga un aminoácido no natural en respuesta a un codón selector. Por ejemplo, el marcador de selección negativa, el marcador de selección positiva o tanto el marcador de selección positiva como negativa pueden incluir un marcador que produce fluorescencia o cataliza una reacción luminiscente en presencia de un reactivo adecuado. En otra realización, puede
55 detectarse un producto del marcador mediante separación de células activadas por fluorescencia (FACS) o por luminiscencia. Opcionalmente, el marcador incluye un marcador de identificación basado en afinidad. Véase también Francisco, J. A., et al., (1993) Production and fluorescence-activated cell sorting of Escherichia coli expressing a functional antibody fragment on the external surface. Proc Natl Acad Sci U S A. 90: 10444-8.
Métodos adicionales para producir un ARNt ortogonal recombinante pueden encontrarse, por ejemplo, en las Publicaciones de Solicitud Internacional WO 2002/086075, titulada “METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOG-ONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS”; WO 2004/094593, titulada “EXPANDING THE EUKARYOTIC GENETIC CODE” y WO 2005/019415, presentada el 7 de julio de 7, 2004. Véase también Forster et al., (2003) Programming peptidomimetic synthetases by translating genetic codes designed de
65 novo PNAS 100(11): 6353-6357; y, Feng et al., (2003), Expanding tRNA recognition of a tRNA synthetase by a single amino acid change, PNAS 100(10): 5676-5681.
Aminoacil-ARNt sintetasa ortogonal (O-RS)
Una O-RS de la invención se define en las reivindicaciones y aminoacila preferentemente un O-ARNt con un aminoácido no natural, in vitro o in vivo. Una O-RS de la invención puede proporcionarse al sistema de traducción, 5 por ejemplo, una célula, mediante un polipéptido que incluye una O-RS y/o un polinucleótido que codifica una O-RS
o una parte de la misma. Por ejemplo, una O-RS ilustrativa comprende una secuencia de aminoácidos como se expone en las SEC ID Nos: 4, 6, 8 o 10 o una variación conservativa de la misma. En otro ejemplo, una O-RS, o una parte de la misma, está codificada por una secuencia de polinucleótidos que codifica una secuencia que comprende aminoácidos en la lista de secuencias o los ejemplos del presente documento, o una secuencia de polinucleótidos
10 complementaria de la misma. Véase, por ejemplo, el polinucleótido de las SEC ID Nos: 5, 7, 9 u 11.
Los métodos como se define en las reivindicaciones pueden comprender identificar una aminoacil-ARNt sintetasa ortogonal (O-RS), por ejemplo, una O-RS, para su uso con un O-ARNt. Por ejemplo, un método incluye someter a selección, por ejemplo, selección positiva, una población de células de una primera especie, en el que las células 15 comprenden individualmente: 1) un miembro de una pluralidad de aminoacil-ARNt sintetasas (RS) (por ejemplo, la pluralidad de RS puede incluir RS mutantes, RS derivadas de una especie distinta de la primera especie o tanto RS mutantes como RS derivadas de una especie distinta de la primera especie); 2) el ARNt ortogonal (O-ARNt) (por ejemplo de una o más especies); y 3) un polinucleótido que codifica un marcador de selección (por ejemplo, positiva) y comprende al menos un codón selector. Se seleccionan o identifican las células que muestran un aumento en la 20 eficacia de supresión en comparación con células que carecen de o con una cantidad reducida del miembro de la pluralidad de RS. La eficacia de supresión puede medirse por técnicas conocidas en el campo y descritas en el presente documento. Las células que tienen un aumento en la eficacia de supresión comprenden una RS activa que aminoacila el O-ARNt. Un nivel de aminoacilación (in vitro o in vivo) por la RS activa de un primer conjunto de ARNt de la primera especie se compara con el nivel de aminoacilación (in vitro o in vivo) por la RS activa de un segundo
25 conjunto de ARNt de la segunda especie. El nivel de aminoacilación puede determinarse mediante una sustancia detectable (por ejemplo, un aminoácido no natural marcado). Normalmente se selecciona la RS activa que aminoacila eficazmente el segundo conjunto de ARNt en comparación con el primer conjunto de ARNt, proporcionando de este modo una aminoacil ARNt sintetasa ortogonal eficaz (optimizada) para su uso con el O-ARNt. Una O-RS, identificada por el método, también es una característica de la invención.
30 Para determinar la aminoacilación pueden utilizarse cualquiera de diversos ensayos. Estos ensayos pueden realizarse in vitro o in vivo. Por ejemplo, se describen ensayos de aminoacilación in vitro, por ejemplo, en Hoben y Soll (1985) Methods Enzymol. 113: 55-59. La aminoacilación también puede determinarse utilizando un indicador junto con los componentes de traducción ortogonales y detectando el indicador en una célula que exprese un
35 polinucleótido que comprende al menos un codón selector que codifica una proteína. Véase también, el documento WO 2002/085923, titulado “IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS”; y el documento WO 2004/094593, titulado “EXPANDING THE EUKARYOTIC GENETIC CODE”.
La O-RS identificada puede manipularse adicionalmente para alterar la especificidad de sustrato de la sintetasa, de
40 tal manera que solo se carga un aminoácido no natural deseado, pero ninguno de los 20 aminoácidos comunes, en el O-ARNt. Los métodos para generar un aminoacil-ARNt sintetasa ortogonal con una especificidad de sustrato para un aminoácido natural incluyen mutar la sintetasa, por ejemplo, en el sitio activo en la sintetasa, en el sitio del mecanismo de edición en la sintetasa, en diferentes sitios combinando diferentes dominios de sintetasas, o similares, y aplicar un proceso de selección. Se usa una estrategia que se basa en la combinación de una selección
45 positiva seguida de una selección negativa. En la selección positiva, la supresión del codón selector introducido en una o más o posiciones no esenciales de un marcador positivo permite a las células sobrevivir bajo presión de selección positiva. En presencia de aminoácidos tanto naturales como no naturales, los supervivientes codifican así sintetasas activas que cargan el ARNt supresor ortogonal con un aminoácido natural o no natural. En la selección negativa, la supresión de un codón selector introducido en una posición o más posiciones no esenciales de un
50 marcador negativo elimina las sintetasas con especificidades de aminoácidos naturales. Los supervivientes de la selección negativa y positiva codifican sintetasas que aminoacilan (cargan) el ARNt supresor ortogonal solo con aminoácidos no natural. Después, estas sintetasas pueden someterse a mutagénesis adicional, por ejemplo, transposición de ADN u otros métodos de mutagénesis recursiva.
55 Puede generarse una biblioteca de O-RS mutantes utilizando diversas técnicas de mutagénesis conocidas en la materia. Por ejemplo, pueden generarse RS mutantes mediante mutaciones con especificidad de sitio, mutaciones puntuales aleatorias, recombinación homóloga, transposición de ADN u otros métodos de mutagénesis recursiva, construcción quimérica o cualquier combinación de los mismos. Por ejemplo, puede producirse una biblioteca de RS mutantes a partir de dos o más, por ejemplo, “sub-bibliotecas” diferentes, más pequeñas, menos diversas. También
60 se describen bibliotecas quiméricas de RS. Debe señalarse que las bibliotecas de ARNt sintetasas de diversos organismos (por ejemplo, microorganismos, tales como eubacterias o arqueobacterias) tales como bibliotecas que comprenden diversidad natural (véase, por ejemplo, la Patente de Estados Unidos Nº 6.238.884 de Short et al.; la Patente de Estados Unidos Nº 5.756.316 de Schallenberger et al.; la Patente de Estados Unidos Nº 5.783.431 de Petersen et al.; la Patente de Estados Unidos Nº 5.824.485 de Thompson et al.; la Patente de Estados Unidos Nº
65 5.958.672 de Short et al.) se construyen y se exploran opcionalmente para pares ortogonales.
Una vez que las sintetasas se han sometido a la estrategia de selección/identificación positiva y negativa, estas sintetasas pueden someterse después a mutagénesis adicionales. Por ejemplo, un ácido nucleico que codifica la O-RS puede aislarse; un conjunto de polinucleótidos que codifican las O-RS mutadas (por ejemplo, por mutagénesis al azar, mutagénesis específica de sitio, recombinación o cualquier combinación de las mismas) puede generarse a
5 partir del ácido nucleico; y estas etapas individuales o una combinación de estas etapas puede repetirse hasta que se obtenga una O-RS mutada que aminoacila preferentemente el O-ARNt con el aminoácido no natural. En algunos aspectos de la invención, las etapas pueden realizarse múltiples veces, por ejemplo, al menos dos veces.
En los método se la invención también pueden utilizarse niveles adicionales de rigurosidad de selección/identificación para producir O-ARNt, O-RS, o pares de los mismos. La rigurosidad de la selección o identificación puede variar en una o en las dos etapas del método para producir una O-RS. Esto podría incluir, por ejemplo, variar la cantidad del agente de selección/identificación que se usa, etc. También pueden utilizarse rondas adicionales de selecciones positivas y/o negativas. La selección o identificación también puede comprender uno o más de un cambio en la permeabilidad de aminoácidos, un cambio en la eficacia de traducción, un cambio en la
15 fidelidad de traducción, etc. Normalmente, dichos uno o más cambios se basan en una mutación en uno o más genes en un organismo en el que se utiliza un par de ARNt-ARNt sintetasa ortogonal para producir una proteína.
Detalles generales adicionales para la producción de O-RS y la modificación de la especificidad de la sintetasa por el sustrato pueden encontrarse en la Publicación Interna Número WO 2002/086075, titulada “METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS”; y en el documento WO 2004/094593, titulado “EXPANDING THE EUKARYOTIC GENETIC CODE”. Véase también Wang y Schultz “Expanding the Genetic Code,” Ange-wandte Chemie Int. Ed., 44(1): 34-66 (2005).
ORGANISMOS FUENTE Y HOSPEDADORES
25 Los componentes de traducción ortogonal (O-ARNt y O-RS) de la invención definidos en las reivindicaciones pueden derivar de cualquier organismo (o una combinación de organismos) para su uso en un sistema de traducción hospedador de cualquier otra especie, con la advertencia de que los componentes O-ARNt/O-RS y el sistema del hospedador actúan de una manera ortogonal. No es necesario que el O-ARNt y la O-RS de un par ortogonal deriven del mismo organismo. En algunas aspectos, los componentes ortogonales derivan de genes Archaea (es decir, arqueobacterias) para su uso en un sistema hospedador eubacteriano.
Por ejemplo, el O-ARNt ortogonal puede derivar de un organismo Archae, por ejemplo una arqueobacteria, tal como Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii y 35 especies de Halobacterium NRC-1, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, Methanococcus maripaludis, Methanopyrus kandleri, Methanosarcina mazei (Mm), Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss), Sulfolobus tokodaii, Thermoplasma acidophilum, Thermoplasma volcanium, o similar, o una eubacteria, tal como Escherichia coli, Thermus therinophilus, Bacillus subtilis, Bacillus stearothermphilus, o similares, mientras que la O-RS ortogonal puede derivar de un organismo o combinación de organismos, por ejemplo, una arqueobacteria, tal como Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii y especies de Halobacterium NRC-1, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, Methanococcus maripaludis, Methanopyrus kandleri, Methanosarcina mazei, Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus, Sulfolobus tokodaii, Thermoplasma acidophilum, Thermoplasma volcanium, o similar, o una 45 eubacteria, tal como Escherichia coli, Thermus themiophilus, Bacillus subtilis, Bacillus stearothemiphilus, o similar. En una realización, también pueden utilizarse fuentes eucariotas, por ejemplo, plantas, algas, protistas, hongos, levaduras, animales (por ejemplo, mamíferos, insectos, artrópodos, etc.), o similar, como fuentes de O-ARNt y O-RS.
Los componentes individuales de un par O-ARNt/O-RS pueden derivar del mismo organismo o de organismos diferentes. En una realización, el par O-ARNt/O-RS deriva del mismo organismo. Como alternativa, el O-ARNt y la O-RS del par O-ARNt/O-RS son de organismos diferentes.
El O-ARNt, la O-RS o el par O-ARNt/O-RS puede seleccionarse o identificarse in vivo o in vitro y/o utilizarse en una célula, por ejemplo, una célula de eubacteria, para producir un polipéptido con un aminoácido natural. La célula de
55 eubacteria utilizada no está limitada, por ejemplo, Escherichia coli, Thermus thermophilus, Bacillus subtilis, Bacillus stearothermphilus, o similar. Las composiciones de células de eubacterias que comprenden componentes de traducción de la invención son también una característica de la invención.
Véase también la Publicación de Solicitud Internacional Número WO 2004/094593, titulada “EXPANDING THE EUKARYOTIC GENETIC CODE”, presentada el 16 de abril de 2004, para identificar O-ARNt y/o O-RS en una especie para su uso en otra especie.
Aunque los sistemas de traducción ortogonal (por ejemplo, que comprenden una O-RS, un O-ARNt y un aminoácido no natural) pueden utilizar células hospedadoras cultivadas para producir proteínas que tengan aminoácidos no 65 naturales, no se pretende que un sistema de traducción ortogonal de la invención requiera una célula hospedadora viable, intacta. Por ejemplo, un sistema de traducción ortogonal puede utilizar un sistema celular en presencia de un
extracto celular. De hecho, el uso de sistemas acelulares de transcripción/traducción in vitro para la producción de proteínas es una técnica bien establecida. La adaptación de estos sistemas in vitro para producir proteínas que tienen aminoácidos no naturales utilizando componentes de sistemas de traducción ortogonal descritos en el presente documento se encuentra bien dentro del ámbito de la invención.
5
CODONES SELECTORES
Los codones selectores de la invención expanden la fase de lectura del codón genético de la maquinaria biosintética de proteínas. Por ejemplo, un codón selector incluye, por ejemplo, un único codón de tres bases, un codón sin 10 sentido, tal como un codón de terminación, por ejemplo, un codón ámbar (UAG), o un codón ópalo (UGA), un codón no natural, al menos un codón de cuatro bases, un codón raro, o similar. Pueden introducirse diversos codones selectores en un gen deseado, por ejemplo, uno o más, dos o más, más de tres, etc. Utilizando diferentes codones selectores, pueden utilizarse múltiples pares ortogonales de ARNt sintetasa para permitir la incorporación con especificidad de sitio simultánea de múltiples aminoácidos no naturales, por ejemplo, incluyendo al menos un
15 aminoácido no natural, utilizando estos codones selectores diferentes.
En una realización, los métodos pueden implicar el uso de un codón selector que es un codón de terminación para la incorporación de un aminoácido no natural in vivo en una célula. Por ejemplo, se produce un O-ARNt que reconoce el codón de terminación y es aminoacilado por una O-RS con un aminoácido no natural. Este O-ARNt no es 20 reconocido por las aminoacil-ARNt sintetasas del hospedador de origen natural. También puede utilizarse mutagénesis de sitio dirigido convencional para introducir el codón de terminación en el sitio de interés en un polinucleótido que codifica un polinucleótido de interés. Véase, por ejemplo, Sayers et al. (1988), 5’, 3’ Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis. Nucleic Acids Res, 791-802. Cuando la O-RS, O-ARNt y el ácido nucleico que codifica un polipéptido de interés se combinan, por ejemplo, in vivo, el aminoácido no
25 natural se incorpora en respuesta al codón de terminación para dar un polipéptido que contiene el aminoácido no natural en la posición especificada. En una realización de la invención, el codón de terminación utilizado como un codón selector es un codón ámbar, UAG, y/o puede ser un codón ópalo, UGA. En un ejemplo, un código genético en el que se utiliza tanto UAG como UGA como un codón selector puede codificar 22 aminoácidos conservando al mismo tiempo el codón sin sentido ocre UAA, que es la señal de terminación más abundante.
30 La incorporación de aminoácidos no naturales in vivo puede realizarse sin perturbación significativa de la célula hospedadora. Por ejemplo, en células no eucariotas, tales como Escherichia coli, como la eficacia de supresión para el codón UAG depende de la competitividad entre el O-ARNt, por ejemplo, el ARNt supresor ámbar, y el factor de liberación 1 (RF1) (que se une al codón UAG e inicia la liberación del péptido de crecimiento del ribosoma), la
35 eficacia de supresión puede modularse, por ejemplo, aumentando el nivel de expresión de O-ARNt, por ejemplo, el ARNt supresor, o utilizando una cepa deficiente en RF1. En células eucariotas, dado que la eficacia de supresión de un codón UAG depende de la competitividad entre el O-ARNt, por ejemplo, el ARNt supresor ámbar, y el factor de liberación eucariota (por ejemplo, eRF) (que se une a un codón de terminación e inicia la liberación del péptido de crecimiento del ribosoma), la eficacia de supresión puede modularse, por ejemplo, aumentando el nivel de expresión
40 de O-ARNt, por ejemplo, el ARNt supresor. Además, también pueden estar presentes compuestos adicionales, por ejemplo, agentes reductores tales como ditiotreitiol (DTT).
Los aminoácidos no naturales también pueden codificarse por codones raros. Por ejemplo, cuando la concentración de arginina en una región de síntesis de proteínas in vitro se reduce, el codón arginina raro AGG, se ha demostrado 45 que es eficaz para la inserción de Ala mediante un ARNt sintético acilado con alanina. Véase, por ejemplo, Ma et al., Biochemistry, 32: 7939 (1993). En este caso, el ARNt sintético compite con el ARNtArg de origen natural, que existe como una especie minoritaria en Escherichia coli. Además, algunos organismos no utilizan todos los codones de triplete. Se ha utilizado un codón AGA no asignado en Micrococcus luteus para la inserción de aminoácidos en un extracto de transcripción/traducción in vitro. Véase, por ejemplo Kowal y Oliver, Nucl. Acid. Res., 25: 4685 (1997).
50 Pueden generarse componentes de la invención para utilizar estos codones raros in vivo.
Los codones selectores también pueden comprender codones extendidos, por ejemplo, codones de cuatro o más bases, tales como, codones de cuatro, cinco, seis o más bases. Los ejemplos de codones de cuatro bases incluyen, por ejemplo, AGGA, CUAG, UAGA, CCCU, y similares. Los ejemplos de codones de cinco bases incluyen, por 55 ejemplo, AGGAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC y similares. Los métodos de la invención pueden incluir utilizar codones extendidos basados en supresión del desplazamiento de fase de lectura. Pueden insertarse codones de cuatro o más bases, por ejemplo, uno o múltiples aminoácidos no naturales, en la misma proteína. En otras realizaciones, los bucles anticodón pueden descodificar, por ejemplo, al menos un codón de cuatro bases, al menos un codón de cinco bases o al menos un codón de seis bases o más. Dado que hay 256 codones de cuatro
60 bases posibles, pueden codificarse múltiples aminoácidos no naturales en la misma célula utilizando un codón de cuatro o más bases. Véase también, Anderson et al., (2002) “Exploring the Limits of Codon and Anticodon Size,” Chemistry and Biology 9: 237-244; y, Magliery, (2001) “Expanding the Genetic Code: Selection of Efficient Suppressors of Four-base Codons and Identification of “Shifty” Four-base Codons with a Library Approach in Escherichia coli,” J. Mol. Biol., 307: 755-769.
Por ejemplo, se han utilizado codones de cuatro bases para incorporar aminoácidos no naturales en proteínas utilizando métodos biosintéticos in vitro. Véase, por ejemplo, Ma et al., (1993) Biochemistry 32: 7939; y Hohsaka et al., (1999) J. Am. Chem. Soc., 121:34. Se utilizaron CGGG y AGGU para incorporar simultáneamente 2-naftilalanina y un derivado de NBD de lisina en estreptavidina in vitro con dos ARNt supresores de desplazamiento de fase de 5 lectura químicamente acilados. Véase, por ejemplo, Hohsaka et al., (1999) J. Am. Chem. Soc., 121: 12194. En un estudio in vivo, Moore et al. examinaron la capacidad de los derivados de ARNtLeu con anticodones NCUA para suprimir codones UAGN (N puede ser U, A, G o C), y observaron que el cuadruplete UAGA podía ser descodificado por un ARNtLeu con un anticodón UCUA con una eficacia del 13 al 26 % con poca descodificación en la fase 0 o -1. Véase Moore et al., (2000) J. Mol. Biol., 298: 195. En una realización, en la invención pueden utilizarse codones extendidos basados en codones raros o codones sin sentido, que pueden reducir la lectura completa sin sentido y la supresión de desplazamiento de fase de lectura en otros sitios no deseados. En diversos sistemas ortogonales se han utilizado codones de cuatro bases. Véanse, por ejemplo, los documentos WO 2005/019415; WO 2005/007870 y WO 2005/07624. Véase también, Wang y Schultz “Expanding the Genetic Code,” Angewandte Chemie Int. Ed., 44(1): 34-66 (2005). Aunque los siguientes ejemplos utilizan un codón selector ámbar, también pueden utilizarse
15 codones de cuatro o más bases, modificando los ejemplos del presente documento para incluir O-ARNt de cuatro bases y sintetasas modificadas para incluir mutaciones similares a las previamente descritas para diversas O-RS de aminoácidos no naturales.
Para un sistema determinado, un codón selector también puede incluir uno de los codones de tres bases naturales, donde el que el sistema endógeno no utiliza (o raramente utiliza) el codón de bases naturales. Por ejemplo, esto incluye un sistema que carece de un ARNt que reconoce el codón de tres bases natural, y/o un sistema en el que el codón de tres bases es un codón raro.
Los codones selectores incluyen opcionalmente pares de bases no naturales. Estos pares de bases no naturales
25 expanden adicionalmente el alfabeto genético existente. Un par de bases adicional aumenta el número de codones de triplete de 64 a 125. Las propiedades de pares de tres bases incluyen un emparejamiento de bases estable y selectivo, una incorporación enzimática eficaz en ADN con alta fidelidad mediante una polimerasa, y la extensión por cebadores continuada eficaz después de la síntesis del par de bases no natural que se genera. Las descripciones de pares de bases no naturales que pueden adaptarse para métodos y composiciones incluyen, por ejemplo, Hirao, et al., (2002) “An unnatural base pair for incorporating amino acid analogues into protein,” Nature Biotechnology 20: 177-182. Véase también Wu et al., (2002) J. Am. Chem. Soc., 124: 14626-14630. Más adelante se indican otras publicaciones relacionadas.
Para el uso in vivo, el nucleósido no natural es permeable a la membrana y se fosforila para formar el trifosfato
35 correspondiente. Además, la información genética aumentada es estable y las enzimas celulares no la destruyen. Esfuerzos previos realizados por Benner y otros aprovecharon patrones de formación de enlaces de hidrógeno que son diferentes de los presentes en pares de Watson-Crick canónicos, de los cuales el ejemplo más destacado es el par iso-C:iso-G. Véase, por ejemplo, Switzer et al., (1989) J. Am. Chem. Soc., 111: 8322; y Piccirilli et al., (1990) Nature 343: 33; Kool, (2000) Curr. Opin. Chem. Biol., 4: 602. Estas bases en general se aparean de forma errónea hasta cierto grado con bases naturales y no pueden replicarse enzimáticamente. Kool y colaboradores demostraron que las interacciones de empaquetamiento hidrófobas entre bases pueden sustituir a las uniones por enlaces de hidrógeno para dirigir la formación de pares de bases. Véase Kool, (2000) Curr. Opin. Chem. Biol., 4: 602; y Guckian y Kool, (1998) Angew. Chem. Int. Ed. Engl., 36, 2825. En un esfuerzo por desarrollar un par de bases no natural que satisfaga todos los requisitos anteriores, Schultz, Romesberg y colaboradores sintetizaron y estudiaron
45 sistemáticamente una serie de bases hidrófobas no naturales. Se observó que un autopar PICS:PICS es más estable que pares de bases naturales, y puede incorporarse eficazmente en el ADN mediante el fragmento Klenow (FK) de la ADN polimerasa I de Escherichia coli. Véase, por ejemplo McMinn et al., (1999) J. Am. Chem. Soc., 121: 11586; y Ogawa et al., (2000) J. Am. Chem. Soc., 122: 3274. El FK puede sintetizar un autopar 3MN:3MN con suficiente eficacia y selectividad para la función biológica. Véase, por ejemplo, Ogawa et al., (2000) J. Am. Chem. Soc., 122: 8803. Sin embargo, ambas bases actúan como un terminador de cadena para la replicación posterior. Recientemente se ha desarrollado una ADN polimerasa mutante que puede utilizarse para replicar el autopar PICS. Además, puede replicarse un autopar 7AI. Véase, por ejemplo Tae et al., (2001) J. Am. Chem. Soc., 123: 7439. También se ha desarrollado un nuevo par de metalobases, Dipic:Py, que forma un par estable después de unirse a Cu(II). Véase Meggers et al., (2000) J. Am. Chem. Soc., 122: 10714. Dado que los codones extendidos y los
55 codones no naturales son intrínsecamente ortogonales a codones naturales, los métodos de la invención pueden utilizar ventajosamente esta propiedad para generar ARNt ortogonales para los mismos.
También puede utilizarse un sistema de derivación traduccional para incorporar un aminoácido no natural en un polipéptido no deseado. En un sistema de derivación traduccional, una secuencia grande se inserta en un gen pero no se traduce en una proteína. La secuencia contiene una estructura que sirve como clave para inducir el salto del ribosoma sobre la secuencia y reanudar la traducción cadena abajo de la inserción.
AMINOÁCIDOS NO NATURALES
65 Como se usa en el presente documento, un aminoácido no natural se refiere a cualquier aminoácido, aminoácido modificado o análogo de aminoácido diferente de selenocisteína y/o pirrolisina y los siguientes veinte alfa aminoácidos codificados genéticamente: alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutámico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptófano, tirosina, valina. La estructura genérica de un alfa-aminoácido se ilustra en la Fórmula I:
Un aminoácido no natural es normalmente cualquier estructura que tenga la Fórmula I, en la que el grupo R es cualquier sustituyente diferente de los usados en los veinte aminoácidos naturales. Véase, por ejemplo, Biochemistry by L. Stryer, 3ª ed. 1988, Freeman y Company, Nueva York, para las estructuras de los veinte aminoácidos
10 naturales. Obsérvese que los aminoácidos no naturales de la invención pueden ser compuestos de origen natural diferentes de los veinte alfa aminoácidos anteriores.
Dado que los aminoácidos no naturales de la presente descripción difieren normalmente de los aminoácidos naturales en la cadena lateral, los aminoácidos no naturales forman enlaces amida con otros aminoácidos, por 15 ejemplo, naturales o no naturales, del mismo modo en el que se forman en proteínas de origen natural. Sin embargo, los aminoácidos no naturales tienen grupos de cadena lateral que se diferencian de los aminoácidos naturales.
Es de particular interés en el presente documento el aminoácido no natural sulfotirosina (véase la FIG. 1). Además del aminoácido no natural sulfotirosina, pueden incorporarse simultáneamente otros aminoácidos no naturales en un 20 polipéptido de interés, por ejemplo, utilizando, un segundo par O-RS/O-ARNt apropiado junto con un par ortogonal proporcionado por la presente invención. Se conocen muchos de dichos aminoácidos no naturales adicionales y pares ortogonales adecuados. Véase, la presente descripción y las referencias citadas en su interior. Por ejemplo, véase Wang y Schultz “Expanding the Genetic Code,” Angewandte Chemie Int. Ed., 44(1): 34-66 (2005); Xie y Schultz, “An Expanding Genetic Code,” Methods 36(3): 227-238 (2005); Xie y Schultz, “Adding Amino Acids to the
25 Genetic Repertoire,” Curr. Opinion in Chemical Biology 9(6): 548-554 (2005); y Wang et al., “Expanding the Genetic Code,” Annu. Rev. Biophys. Biomol. Struct., 35: 225-249 (2006).
En otros aminoácidos no naturales, por ejemplo, el grupo R en la Fórmula I comprende opcionalmente un alquilo, arilo, acilo, hidracina, ciano, halo, hidracida, alquenilo, éter, borato, boronato, fosfo, fosfono, fosfina, enona, imina, 30 éster, hidroxilamina, amina y similares o cualquier combinación de los mismos. Otros aminoácidos no naturales de interés incluyen, pero sin limitación, aminoácidos que comprenden un agente de entrecruzamiento fotoactivable, aminoácidos marcados por espín, aminoácidos fluorescentes, aminoácidos de unión a metal, aminoácidos que contienen metal, aminoácidos radiactivos, aminoácidos con nuevos grupos funcionales, aminoácidos que interaccionan de forma covalente o no covalente con otras moléculas, aminoácidos con grupos fotoprotectores y/o 35 fotoisomerizables, aminoácidos que contienen biotina o análogos de biotina, aminoácidos que contienen ceto, aminoácidos glucosilados, un resto de sacárido unido a la cadena lateral del aminoácido, aminoácidos que comprenden polietienglicol o poliéter, aminoácidos sustituidos con átomos pesados, aminoácidos químicamente escindibles o fotoescindibles, aminoácidos con una cadena lateral alargada en comparación con aminoácidos naturales (por ejemplo, poliéteres o hidrocarburos de cadena larga, por ejemplo, de más de aproximadamente 5, de
40 más de aproximadamente 10 carbonos, etc.), aminoácidos que contienen azúcar unido a carbono, aminoácidos que contienen aminotioácido, y aminoácidos que contienen uno o más residuos tóxicos.
En otro aspecto, la presente descripción proporciona aminoácidos no naturales que tienen la estructura general ilustrada por la Fórmula IV siguiente: 45
Un aminoácido no natural que tiene esta estructura es normalmente cualquier estructura en la que R1 es un sustituyente utilizado en uno de los veinte aminoácidos naturales (por ejemplo, tirosina o fenilalanina) y R2 es un 50 sustituyente. Por tanto, este tipo de aminoácido no natural puede considerarse como un derivado de aminoácido natural.
Además de aminoácidos no naturales que contienen la estructura sulfotirosina mostrada en la FIG. 1, un aminoácido no natural también puede comprender opcionalmente estructuras de cadena principal modificadas, por ejemplo, como se ilustra mediante las estructuras de las Fórmula II y III:
en las que Z comprende normalmente OH, NH2, SH, NH-R’, o S-R’; X e Y, que pueden ser iguales o diferentes, comprenden normalmente S u O, y R y R’, que son opcionalmente iguales o diferentes, se seleccionan normalmente de la misma lista de constituyentes para el grupo R descrito anteriormente para los aminoácidos no naturales que 10 tienen la Fórmula I, así como hidrógeno. Por ejemplo, los aminoácidos no naturales de la presente descripción comprenden opcionalmente sustituciones en el grupo amino o carboxilo, como se ilustra mediante las Fórmula II y
III. Los aminoácidos no naturales de este tipo incluyen, pero sin limitación, α-hidroxiácidos, α-tioácidos, αaminotiocarboxilatos, por ejemplo, con cadenas laterales correspondientes a los veinte aminoácidos naturales comunes o cadenas laterales no naturales. Además, las sustituciones en el carbono α incluyen opcionalmente
15 aminoácidos L, D o α-α disustituidos tales como D-glutamato, D-alanina, D-metil-O-tirosina, ácido aminobutírico y similares. Otras alternativas estructurales incluyen aminoácidos cíclicos, tales como análogos de prolina así como análogos de prolina con anillo de 3,4,6,7,8 y 9 miembros, β y γ aminoácidos tales como β-alanina sustituida y ácido γ-aminobutírico.
20 En algunos aspectos, la invención utiliza aminoácidos no naturales en la configuración L. Sin embargo, no se pretende que la invención se limite al uso de aminoácidos no naturales en la configuración L. Se contempla que en la invención también se utilicen los enantiómeros D de estos aminoácidos no naturales.
Un experto en la técnica reconocerá que puede obtenerse fácilmente una amplia diversidad de análogos no
25 naturales de aminoácidos de origen natural. Por ejemplo, pero sin limitación, se producen fácilmente derivados no naturales de la tirosina. Los análogos de tirosina incluyen, por ejemplo, tirosinas para-sustituidas, tirosinas ortosustituidas y tirosinas meta-sustituidas, en las que la tirosina sustituida comprende un grupo alquinilo, un grupo acetilo, grupo benzoilo, un grupo amino, una hidrazina, una hidroxiamina, un grupo tiol, un grupo carboxi, un grupo isopropilo, un grupo metilo, un hidrocarburo de una cadena lineal C6-C20 o ramificada, un hidrocarburo saturado o
30 insaturado, un grupo O-metilo, un grupo poliéter, un grupo nitro, o similar. Además, también se contemplan anillos de arilo múltiples sustituidos. Los análogos de glutamina de la presente descripción incluyen, sin limitación, derivados αhidroxi, derivados γ sustituidos, derivados cíclicos y derivados de glutamina sustituidos con amida. Ejemplos de análogos de fenilalanina incluyen, pero sin limitación, fenilalaninas para-sustituidas, fenilalaninas orto-sustituidas, y fenilalaninas meta-sustituidas, en las que el sustituyente comprende un grupo alquinilo, un grupo hidroxi, un grupo
35 metoxi, un grupo metilo, un grupo alilo, un aldehído, un nitro, un grupo tiol, un grupo ceto o similar. Ejemplos específicos de aminoácidos naturales no incluyen, pero sin limitación, sulfotirosina, p-etiltiocarbonil-L-fenilalanina, p(3-oxobutanoil)-L-fenilalanina, 1,5-dansilalanina, aminoácido 7-amino-coumarina, aminoácido 7-hidroxi-coumarina, nitrobencil-serina, O-(2-nitrobencil)-L-tirosina, p-carboximetil-L-fenilalanina, p-ciano-L-fenilalanina, m-ciano-Lfenilalanina, bifenilalanina, 3-amino-L-tirosina, bipiridil alanina, p-(2-amino-1-hidroxietil)-L-fenilalanina, p
40 isopropiltiocarbonil-L-fenilalanina, 3-nitro-L-tirosina y p-nitro-L-fenilalanina. También una p-propargiloxifenilalanina, una 3,4-dihidroxi-L-fenialanina (DHP), una 3, 4, 6-trihidroxi-L-fenilalanina, una 3,4,5-tri-hidroxi-L-fenilalanina, 4-nitrofenilalanina, una p-acetil-L-fenilalanina, O-metil-L-tirosina, una L-3-(2-naftil) alanina, una 3-metilfenilalanina, una O-4alil-L-tirosina, una 4-propil-L-tirosina, una 3-nitro-tirosina, una 3-tiol-tirosina, una tri-O-acetil-GlcNAcβ-serina, un L-Dopa, una fenilalanina fluorada, una isopropil-L-fenilalanina, una p-azido-L-fenilalanina, una p-acil-L-fenilalanina, una
45 p-benzoil-L-fenilalanina, una L-fosfoserina, una fosfonoserina, una fosfonotirosina, una p-yodo-fenilalanina, una pbromofenilalanina, una p-amino-L-fenilalanina y una isopropil-L-fenilalanina y similares. Las estructuras de diversos aminoácidos no naturales se describen en las referencias citadas en el presente documento. Véase también, el documento WO 2006/110182, presentado el 27 de octubre de 2005, titulado “ORTHOGONAL TRANSLATION COMPONENTS FOR THE VIVO INCORPORATION OF UNNATURAL AMINO ACIDS”.
5 Síntesis química de aminoácidos no naturales
Muchos de los aminoácidos no naturales proporcionados anteriormente se encuentran disponibles en el comercio, por ejemplo de Sigma (Estados Unidos) o Aldrich (Milwaukee, WI, Estados Unidos). Los que no se encuentran disponibles en el comercio se sintetizan opcionalmente según se proporciona en diversas publicaciones o utilizando métodos convencionales conocidos por los expertos en la materia. Para técnicas de síntesis orgánica, véase, por ejemplo, Organic Chemistry by Fessendon y Fessendon, (1982, Segunda Edición, Willard Grant Press, Boston Mass.); Advanced Organic Chemistry by March (Tercera Edición, 1985, Wiley y Sons, Nueva York); y Advanced Organic Chemistry by Carey y Sundberg (tercera edición, partes A y B, 1990, Plenum Press, Nueva York). Publicaciones adicionales que describen la síntesis de aminoácidos no naturales incluyen, por ejemplo, el 15 documento WO 2002/085923 titulado “In vivo incorporation of Unnatural Amino Acids;” Matsoukas et al., (1995) J. Med. Chem., 38, 4660-4669; King y Kidd (1949) “A New Synthesis of Glutamine and of γ-Dipeptides of Glutamic Acid from Phthylated Intermediates,” J. Chem. Soc., 3315-3319; Friedman y Chatterrji (1959) Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents. J. Am. Chem. Soc. 81, 3750-3752; Craig et al., (1988) Absolute Configuration of the Enantiomers of 7-Chloro-4 [[4-(diethylamino)-1-methylbutyl]amino]quinoline (Chloroquine). J. Org. Chem. 53, 1167-1170; Azoulay, M., Vilmont, M. y Frappier, F. (1991) Glutamine analogues as Potential Antimalarials,. Eur. J. Med. Chem. 26, 201-5; Koskinen, A.M.P. & Rapoport, H. (1989) Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues. J. Org. Chem. 54, 1859-1866; Christie,
B. D. y Rapoport, H. (1985) Synthesis of Optically Pure Pipecolates from L-Asparagine. Application to the Total Synthesis of (+)-Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization. J. Org. Chem.
25 1989: 1859-1866; Barton et al., (1987) Synthesis of Novel a-Amino-Acids and Derivatives Using Radical Chemistry: Synthesis of L- and D-a-Amino-Adipic Acids, L-a-aminopimelic Acid and Appropriate Unsaturated Derivatives. Tetrahedron Lett. 43: 4297-4308; y, Subasinghe et al., (1992) Quisqualic acid analogues: synthesis of betaheterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site. J. Med. Chem.
35: 4602-7. Véase también, la Publicación Internacional WO 2004/058946, titulada “PROTEIN ARRAYS”, presentada el 22 de diciembre del 2003.
Captación celular de aminoácidos no naturales
La captación de aminoácidos no naturales por una célula es una cuestión que se considera normalmente cuando se
35 diseñan y seleccionan aminoácidos no naturales, por ejemplo, para la incorporación en una proteína. Por ejemplo, la gran densidad de carga de α aminoácidos sugiere que estos compuestos probablemente no sean permeables a la célula. La célula capta los aminoácidos naturales mediante una colección de sistemas de transporte basados en proteínas que a menudo presentan grados de especificidad variables de aminoácidos. Puede realizarse una exploración rápida que evalúa qué aminoácidos no naturales, si hay alguno, se captan por las células. Véase, por ejemplo, ensayos de toxicidad, por ejemplo, en la Publicación Internacional WO 2004/058946, titulada “PROTEIN ARRAYS,” presentada el 22 de diciembre de 2003; y Liu y Schultz (1999) Progress toward the evolution of an organism with an expanded genetic code. PNAS 96: 4780-4785. Aunque la captación se analiza de manera sencilla con diversos ensayos, una alternativa para diseñar aminoácidos no naturales que son susceptibles a rutas de captación celular es proporcionar rutas biosintéticas para crear aminoácidos in vivo.
45 Biosíntesis de aminoácidos no naturales
Ya existen muchas rutas biosintéticas en las células para la producción de aminoácidos y otros compuestos. Aunque un método biosintético para un aminoácido no natural particular puede no existir en la naturaleza, por ejemplo, en una célula, la presente descripción proporciona dichos métodos. Por ejemplo, opcionalmente pueden generarse rutas biosintéticas para aminoácidos no naturales en células hospedadoras añadiendo nuevas enzimas o modificando rutas existentes de la célula hospedadora. Las nuevas enzimas adicionales son opcionalmente enzimas de origen natural o enzimas desarrolladas artificialmente. Por ejemplo, la biosíntesis de p-aminofenilalanina (como se presenta en un ejemplo del documento WO 2002/085923) se basa en la adición de una combinación de enzimas
55 conocidas procedente de otros organismos. Los genes para estas enzimas pueden introducirse en una célula transformando la célula con un plásmido que comprenda los genes. Cuando los genes se expresan en la célula, proporcionan una ruta enzimática para sintetizar el compuesto deseado. En los ejemplos que se presentan más adelante se proporcionan ejemplos de los tipos de enzimas que se añaden opcionalmente. Se encuentra secuencias de enzimas adicionales, por ejemplo, en el Genbank. También se añaden opcionalmente enzimas desarrolladas artificialmente a una célula del mismo modo. De esta manera, la maquinaria celular y los recursos de una célula se manipulan para producir aminoácidos no naturales.
De hecho, puede utilizarse cualquiera de diversos métodos para producir nuevas enzimas para su uso en rutas biosintéticas, o para el desarrollo de rutas existentes, para la producción de aminoácidos no naturales in vitro o in 65 vivo. Para producir aminoácidos no naturales (o, de hecho, para desarrollar sintetasas que tengan nuevas especificidades de sustrato u otras actividades de interés) pueden aplicarse muchos métodos disponibles para desarrollar enzimas y otros componentes de ruta biosintética. Por ejemplo, la transposición de ADN se utiliza opcionalmente para desarrollar nuevas enzimas y/o rutas de dichas enzimas para la producción de aminoácidos no naturales (o para la producción de nuevas sintetasas), in vitro o in vivo. Véase, por ejemplo, Stemmer (1994), Rapid evolution of a protein in vitro by DNA shuffling, Nature 370(4): 389-391; y, Stemmer, (1994), DNA shuffling by 5 random fragmentation and reassembly: In vitro recombination for molecular evolution, Proc. Natl. Acad. Sci. USA.,
91: 10747-10751. Una estrategia relacionada combina familias de genes relacionados (por ejemplo, homólogos) para desarrollar rápidamente enzimas con características deseadas. Un ejemplo de dichos métodos “de combinación de genes de familias” se encuentra en Crameri et al. (1998) “DNA shuffling of a family of genes from diverse species accelerates directed evolution” Nature, 391(6664): 288-291. También pueden generarse nuevas 10 enzimas (componentes de rutas biosintéticas o sintetasas) utilizando un procedimiento de recombinación de ADN conocido como “truncamiento incremental para la creación de enzimas híbridas” (“ITCHY”), por ejemplo, como se describe en Ostermeier et al. (1999) “A combinatorial approach to hybrid enzymes independent of DNA homology” Nature Biotech 17: 1205. Esta estrategia también puede utilizarse para generar una biblioteca de enzimas u otras variantes de ruta que pueden servir como sustratos para uno o más métodos de recombinación in vitro o in vivo: 15 Véase también, Ostermeier et al. (1999) “Combinatorial Protein Engineering by Incremental Truncation,” Proc. Natl. Acad. Sci. Estados Unidos, 96: 3562-67, y Ostermeier et al. (1999), “Incremental Truncation as a Strategy in the Engineering of Novel Biocatalysts,” Biological and Medicinal Chemistry, 7: 2139-44. Otra estrategia usa mutagénesis de conjunto exponencial para producir bibliotecas de enzimas u otras variantes de ruta que se seleccionan, por ejemplo, por la capacidad de catalizar una reacción biosintética pertinente para la producción de un aminoácido no 20 natural (o una nueva sintetasa). En esta estrategia se distribuyen al azar pequeños grupos de restos en una secuencia de interés en paralelo para identificar, en cada posición alterada, aminoácidos que conducen a proteínas funcionales. Pueden encontrarse ejemplos de dichos procedimientos, que pueden adaptarse a la presente invención para producir nuevas enzimas para la producción de aminoácidos no naturales (o nuevas sintetasas), en Delegrave y Youvan (1993) Biotechnology Research 11: 1548-1552. En otra estrategia más, se puede utilizar mutagénesis 25 aleatoria o semi-aleatoria utilizando oligonucleótidos dopados o generados para la producción por ingeniería genética de enzimas y/o componentes de ruta, por ejemplo, utilizando los métodos de mutagénesis generales de, por ejemplo, Arkin y Youvan (1992) “Optimizing nucleotide mixtures to encode specific subsets of amino acids for semi-random mutagenesis” Biotechnology 10: 297-300; o Reidhaar-Olson et al. (1991) “Random mutagenesis of protein sequences using oligonucleotide cassettes” Methods Enzymol. 208: 564-86. Otra estrategia más,
30 denominada a menudo mutagénesis “no estocástica”, que usa el reensamblaje de polinucleótidos y mutagénesis de saturación de sitio, puede utilizarse para producir enzimas y/o componentes de ruta que después se pueden explorar con respecto a una capacidad para realizar una o más funciones de sintetasa o de ruta biosintética (por ejemplo para la producción de aminoácidos no naturales in vivo). Véase, por ejemplo, Short “NON-STOCHASTIC GENERATION OF GENETIC VACCINES AND ENZYMES” documento WO 00/46344.
35 Una alternativa a dichos métodos mutacionales implica recombinar genomas enteros de organismos y seleccionar la progenie resultante para funciones de ruta particulares (lo cual se denomina a menudo “combinación de genoma completo”). Esta estrategia puede aplicarse a la presente invención, por ejemplo, mediante recombinación genómica y selección de un organismo (por ejemplo, una célula E. coli u otra célula) con respecto a la capacidad de producir
40 un aminoácido no natural (o intermedio del mismo). Por ejemplo, pueden aplicarse los métodos descritos en las siguientes publicaciones para el diseño de rutas para el desarrollo de rutas existentes y/o nuevas en células para producir aminoácidos no naturales in vivo: Patnaik et al. (2002) “Genome shuffling of lactobacillus for improved acid tolerance” Nature Biotechnology, 20(7): 707-712; y Zhang et al. (2002) “Genome shuffling leads to rapid phenotypic improvement in bacteria” Nature, 7 de febrero, 415(6872): 644-646.
45 También se dispone de otras técnicas para la producción por ingeniería genética de organismos y rutas metabólicas, por ejemplo, para la producción de compuestos deseados, y también puede aplicarse para la producción de aminoácidos no naturales. Los ejemplos de publicaciones que describen estrategias de producción por ingeniería genética de rutas incluyen: Nakamura y White (2003) “Metabolic engineering for the microbial production of 1,3
50 propanediol” Curr. Opin. Biotechnol. 14(5): 454-9; Berry et al. (2002) “Application of Metabolic Engineering to improve both the production and use of Biotech Indigo” J. Industrial Microbiology and Biotechnology 28: 127-133; Banta et al. (2002) “Optimizing an artificial metabolic pathway: Engineering the cofactor specificity of Corynebacterium 2,5-diketo-D-gluconic acid reductase for use in vitamin C biosynthesis” Biochemistry, 41(20), 6226-36; Selivonova et al. (2001) “Rapid Evolution of Novel Traits in Microorganisms” Applied and Environmental Microbiology,
55 67: 3645, y muchas otras.
Independientemente del método utilizado, normalmente el aminoácido no natural producido con una ruta biosintética creada por ingeniería genética de la invención, se produce a una concentración suficiente para la biosíntesis eficaz de proteínas, por ejemplo, una cantidad celular natural, pero no hasta tal grado como para afectar de forma
60 significativa a la concentración de otros aminoácidos celulares o hasta agotar los recursos celulares. Las concentraciones típicas producidas por este método in vivo son de aproximadamente 10 mM a aproximadamente 0,05 mM. Una vez que se produce una célula por ingeniería genética para producir enzimas deseadas para una ruta específica y se genera un aminoácido no natural, se utilizan opcionalmente selecciones in vivo para optimizar adicionalmente la producción de aminoácido no natural tanto para la síntesis de proteínas ribosómicas como para el
65 crecimiento celular.
Componentes ortogonales para incorporar aminoácidos no naturales
La invención proporciona composiciones y métodos como se define en las reivindicaciones para producir componentes ortogonales para incorporar el aminoácido no natural sulfotirosina (véase la FIG. 1) en una cadena
5 polipeptídica en crecimiento en respuesta a un codón selector, por ejemplo, un codón de terminación ámbar, un codón antisentido, un codón de cuatro o más bases, etc., por ejemplo, in vivo. Por ejemplo, la invención proporciona ARNt ortogonales (O-ARNt), aminoacil-ARNt sintetasas ortogonales (O-RS) y pares de los mismos. Estos pares pueden utilizarse para incorporar un aminoácido no natural en cadenas polipeptídicas en crecimiento.
Una composición de la invención incluye una aminoacil ARNt sintetasa ortogonal (O-RS), en la que la O-RS aminoacila preferentemente un O-ARNt con una sulfotirosina. En determinadas realizaciones, la O-RS comprende una secuencia de aminoácidos que comprende las SEC ID Nos: 4, 6, 8 o 10, y variaciones conservativas de la misma. En determinadas realizaciones de la invención, la O-RS aminoacila preferentemente el O-ARNt sobre cualquier ARNt endógeno con un aminoácido no natural particular, en el que la O-RS tiene una predilección por el O
15 ARNt, y en el que la proporción del O-ARNt cargado con un aminoácido no natural con respecto al ARNt endógeno cargado con el mismo aminoácido no natural es mayor de 1:1, y más preferentemente en el que la O-RS carga el O-ARNt exclusivamente o casi exclusivamente.
Una composición que incluye una O-RS puede incluir opcionalmente de forma adicional un ARNt ortogonal (O-ARNt), en el que el O-ARNt reconoce un codón selector. Normalmente, un O-ARNt de la invención puede incluir al menos aproximadamente, por ejemplo, un 45 %, un 50 %, un 60 %, un 75 %, un 80 % o un 90 % o más de eficacia de supresión en presencia de una sintetasa afín en respuesta a un codón selector en comparación con el O-ARNt que comprende o está codificado por una secuencia polinucleotídica como se indica en la lista de secuencias y los ejemplos del presente documento. En una realización, la eficacia de supresión de la O-RS y el O-ARNt
25 conjuntamente es, por ejemplo, 5 veces, 10 veces, 15 veces, 20 veces o 25 veces o más veces mayor que la eficacia de supresión del O-ARNt que carece de la O-RS. En algunos aspectos, la eficacia de supresión de la O-RS y del O-ARNt conjuntamente es al menos un 45 % de la eficacia de supresión de un par ortogonal de tirosil ARNt sintetasa derivado de Methanococcus jannaschii.
Una composición que incluye un O-ARNt puede incluir opcionalmente una célula (por ejemplo, una célula de eubacteria, tal como una célula E. coli y similar, o una célula eucariota tal como una célula de levadura) y/o un sistema de traducción.
La invención también proporciona una célula (por ejemplo una célula de eubacteria o una célula de levadura) que
35 comprende un sistema de traducción, como se define en las reivindicaciones, donde el sistema de traducción incluye un ARNt ortogonal (O-ARNt); una aminoacil-ARNt sintetasa ortogonal (O-RS); y un aminoácido no natural sulfotirosina. Normalmente, la O-RS aminoacila preferentemente el O-ARNt sobre cualquier ARNt endógeno con el aminoácido no natural, en el que la O-RS tiene una predilección por el O-ARNt, y en el que la proporción del O-ARNt cargado con el aminoácido no natural con respecto al ARNt endógeno cargado con el aminoácido no natural es mayor de 1:1, y más preferentemente en el que la O-RS carga el O-ARNt exclusivamente o casi exclusivamente. El O-ARNt reconoce el primer codón selector, y la O-RS aminoacila preferentemente el O-ARNt con un aminoácido no natural. En una realización, el O-ARNt comprende o está codificado por una secuencia de polinucleótidos como se indica en la SEC ID Nº: 1, o una secuencia de polinucleótidos complementaria de la misma. En una realización, la O-RS comprende una secuencia de aminoácidos como se indica en las SEC ID Nos: 4, 6, 8 o 10, y variaciones
45 conservativas de la misma.
Una célula de la invención también puede comprender opcionalmente un par de O-ARNt/O-RS diferente adicional y un segundo aminoácido no natural, por ejemplo, donde este O-ARNt reconoce un segundo codón selector y esta O-RS aminoacila preferentemente el O-ARNt correspondiente con el segundo aminoácido no natural, donde el segundo aminoácido es diferente del primer aminoácido no natural. Opcionalmente, una célula de la invención incluye un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, donde el polinucleótido comprende un codón selector que es reconocido por el O-ARNt.
En determinadas realizaciones, una célula de la invención es una célula de eubacteria (tal como E. coli), que incluye
55 un ARNt ortogonal (O-ARNt), una aminoacil-ARNt sintetasa ortogonal (O-RS), un aminoácido no natural, y un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, donde el polinucleótido comprende el codón selector que es reconocido por el O-ARNt. En determinadas realizaciones de la invención, la O-RS aminoacila preferentemente el O-ARNt con el aminoácido no natural con una eficacia que es mayor que la eficacia con la que la O-RS aminoacila cualquier ARNt endógeno.
En determinadas realizaciones de la invención, un O-ARNt de la invención comprende o está codificado por una secuencia de polinucleótidos como se indica en las listas de secuencias (por ejemplo SEC ID Nº: 1) o en los ejemplos del presente documento, o una secuencia de polinucleótidos complementaria de la misma. En determinadas realizaciones de la invención, una O-RS comprende una secuencia de aminoácidos como se indica en 65 la lista de secuencias, o una variación conservativa de la misma. En una realización, la O-RS, o una parte de la misma, está codificada por una secuencia de polinucleótidos que codifica un aminoácido como se indica en la lista
de secuencias o en los ejemplos en el presente documento, o una secuencia de polinucleótidos complementaria de la misma.
El O-ARNt y/o la O-RS de la invención pueden derivar de cualquiera de diversos organismos (por ejemplo, 5 organismos eucariotas y/o no eucariotas).
Como se define en las reivindicaciones, los polinucleótidos son también una característica de la invención. Un polinucleótido de la invención (por ejemplo SEC ID Nos: 5, 7, 9 u 11) incluye un polinucleótido artificial (por ejemplo, fabricado por el hombre y no de origen natural) que comprende una secuencia de nucleótidos que codifica un polipéptido como se indica en la lista de secuencias en el presente documento y/o es complementario a esa secuencia de polinucleótidos. Un polinucleótido de la invención también puede incluir un ácido nucleico que hibrida con un polinucleótido descrito anteriormente, en condiciones de alta rigurosidad, a lo largo de sustancialmente toda la longitud del ácido nucleico. Un polinucleótido de la invención también incluye un polinucleótido que tiene una identidad de, por ejemplo, al menos 75 %, al menos 80 %, al menos 90 %, al menos 95 %, al menos 98 % o más
15 con el de un ARNt de origen natural o un ácido nucleico codificante correspondiente (pero un polinucleótido de la invención es diferente de un ARNt de origen natural o ácido nucleico codificante correspondiente) donde el ARNt reconoce un codón selector, por ejemplo, un codón de cuatro bases. También se incluyen en los polinucleótidos de la invención polinucleótidos artificiales que tienen una identidad de al menos 80 %, al menos 90 %, al menos 95 %, al menos 98 % o más con cualquiera de los anteriores y/o un polinucleótido que comprende una variación conservativa de cualquiera de los anteriores.
También son una característica de la invención vectores que comprenden un polinucleótido de la invención, como se define en las reivindicaciones. Por ejemplo, un vector de la invención puede incluir un plásmido, un cósmido, un fago, un virus, un vector de expresión y/o similar. También es una característica de la invención una célula que
25 comprende un vector de la invención.
También son características de la invención métodos para producir componentes de un par de O-ARNt/O-RS. Los componentes producidos mediante esos métodos son también una característica de la invención. Por ejemplo, los métodos para producir al menos un ARNt que es ortogonal a una célula (O-ARNt) incluyen generar una biblioteca de ARNt mutantes, mutar un bucle anticodón de cada miembro de la biblioteca de ARNt mutantes para permitir el reconocimiento de un codón selector, proporcionando de este modo una biblioteca de O-ARNt potenciales, y someter a selección negativa una primer población de células de una primera especie, donde las células comprenden un miembro de la biblioteca de ARNt potenciales. La selección negativa elimina las células que comprenden un miembro de la biblioteca de O-ARNt potenciales que se aminoacila por una aminoacil-ARNt
35 sintetasa (RS) que es endógena a la célula. Esto proporciona un conjunto de ARNt que son ortogonales a la célula de la primera especie, proporcionando de este modo al menos un O-ARNt. También se proporciona un O-ARNt producido mediante los métodos de la invención.
En determinadas realizaciones los métodos comprenden adicionalmente someter a selección positiva una segunda población de células de la primera especie, donde las células comprenden un miembro del conjunto de ARNt que son ortogonales a la célula de la primera especie, una aminoacil-ARNt sintetasa afín, y un marcador de selección positivo. Utilizando la selección positiva se seleccionan o se identifican las células que comprende un miembro del conjunto de ARNt que está aminoacilado por la aminoacil-ARNt sintetasa afín y que muestra una respuesta deseada en presencia del marcador de selección positiva, proporcionando de esta manera un O-ARNt. En determinadas
45 realizaciones, la segunda población de células comprende células que no se han eliminado por la selección negativa.
También se proporcionan métodos para identificar una aminoacil-ARNt sintetasa ortogonal que carga un aminoácido natural. Por ejemplo, los métodos incluyen someter a selección una población de células de una primera especie, donde cada una de las células comprende: 1) un miembro de una pluralidad de aminoacil-ARNt sintetasas (RS), (por ejemplo, la pluralidad de RS puede incluir RS mutantes, RS derivadas de una especie distinta de una primera especie o tanto RS mutantes o como RS procedentes de una especie diferente de una primera especie); 2) el ARNt ortogonal (O-ARNt) (por ejemplo, de una o más especies); y 3) un polinucleótido que codifica un marcador de selección positiva y que comprende al menos un codón selector.
55 Se seleccionan o identifican las células (por ejemplo una célula hospedadora) que muestran una potenciación en la eficacia de supresión en comparación con células que carecen o que tienen una cantidad reducida del miembro de la pluralidad de RS. Estas células seleccionadas/identificadas comprenden una RS activa que aminoacila el O-ARNt. También es una característica de la invención una aminoacil-ARNt sintetasa ortogonal identificada por el método de la invención.
También son una característica de la invención métodos para producir una proteína en una célula (por ejemplo, en una célula de eurobacteria, tal como una célula de E. coli, o similar, o en una célula de levadura) que tiene el aminoácido no natural en una posición seleccionada. Por ejemplo, un método incluye dejar crecer, en un medio 65 apropiado, una célula, donde la célula comprende un ácido nucleico que comprende al menos un codón selector y codifica una proteína, proporcionar el aminoácido no natural, e incorporar el aminoácido no natural en la posición
especificada en la proteína durante la traducción del ácido nucleico con dicho al menos un codón selector, produciendo de este modo la proteína. La célula comprende adicionalmente: un ARNt ortogonal (O-ARNt) que funciona en la célula y que reconoce el codón selector; y, una aminoacil-ARNt sintetasa ortogonal (O-RS) que aminoacila preferentemente el O-ARNt con el aminoácido no natural. Una proteína producida mediante este método
5 también es una característica de la invención. De particular interés son métodos para producir la forma sulfatada de hirudina, que se utiliza un anticoagulante.
La invención también proporciona composiciones que incluyen proteínas, donde las proteínas comprenden sulfotirosina. En determinadas realizaciones, la proteína puede comprender una secuencia de aminoácidos que tiene
10 una identidad de al menos un 75 % con la de una proteína conocida, por ejemplo, hirudina, una proteína terapéutica, una proteína de diagnóstico, una enzima industrial o una parte de la misma. Opcionalmente, la composición comprende un vehículo farmacéuticamente aceptable.
SECUENCIAS DE ÁCIDOS NUCLEICOS Y DE POLIPÉPTIDOS Y VARIANTES
15 Como se describe en el presente documento, la invención proporciona secuencias de polinucleótidos como se define en las reivindicaciones que codifican, por ejemplo, los ARNt y las O-RS y secuencias de aminoácidos de polipéptidos, por ejemplo, O-RS y, por ejemplo, composiciones, sistemas y métodos que comprenden dichas secuencias de polinucleótidos o polipéptidos. En el presente documento se describen ejemplos de dichas
20 secuencias, por ejemplo, O-ARNt y O-RS y secuencias de aminoácidos y nucleótidos (véase la FIG. 7, por ejemplo, SEC ID Nos: 1 y 4-11). Sin embargo, un experto en la técnica apreciará que la invención no se limita a estas secuencias descritas en el presente documento, por ejemplo, en los Ejemplos y en la lista de secuencias. Un experto apreciará que la invención también proporciona muchas secuencias relacionadas con las funciones descritas en el presente documento, por ejemplo, polinucleótidos y polipéptidos que codifican variantes conservativas de una O-RS
25 descrita en este documento.
La construcción y el análisis de especies de sintetasa ortogonales (O-RS) que son capaces de aminoacilar un O-ARNt con una sulfotirosina se describen en el Ejemplo 1. Este Ejemplo describe la construcción y análisis de las especies de O-RS que son capaces de incorporar el aminoácido no natural sulfotirosina.
30 La invención proporciona polipéptidos (O-RS) y polinucleótidos, por ejemplo, O-ARNt, polinucleótidos que codifican O-RS o partes de las mismas, oligonucleótidos utilizados para aislar clones de aminoacil-ARNt sintetasas, etc. Los polinucleótidos de la invención incluyen aquellos que codifican proteínas o polipéptidos de interés de la invención con uno o más codones selectores. Además, los polinucleótidos de la invención incluyen, por ejemplo, un
35 polinucleótido que comprende una secuencia de nucleótidos como se indica en las SEC ID Nos: 5, 7, 9 u 11, y un polinucleótido que es complementario a, o que codifica, una secuencia polinucleotídica del mismo. Un polinucleótido de la invención también incluye cualquier polinucleótido que codifique una secuencia de aminoácidos O-RS que comprende las SEC ID Nos: 4, 6, 8 o 10. De manera similar, un ácido nucleico artificial que hibrida con un polinucleótido indicado anteriormente en condiciones de alta rigurosidad a lo largo de sustancialmente toda la
40 longitud de un ácido nucleico (y es distinto de un polinucleótido de origen natural) es un polinucleótido de la invención. En una realización, una composición incluye un polipéptido de la invención y un excipiente (por ejemplo, tampón, agua, excipiente farmacéuticamente aceptable, etc.). La invención también proporciona un anticuerpo o antisueros específicamente inmunoreactivos con un polipéptido de la invención. Un polinucleótido artificial es un polinucleótido que está fabricado por el hombre y que no es de origen natural.
45 Un polinucleótido de la invención también incluye un polinucleótido artificial que tiene una identidad de, por ejemplo, al menos un 75 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o mayor con un ARNt de origen natural (pero es diferente de un ARNt de origen natural) o cualquier ARNt o ácido nucleico codificante del mismo en una lista o ejemplo del presente documento. Un polinucleótido también incluye un
50 polinucleótido artificial que tiene una identidad de, por ejemplo, al menos 75 %, al menos 80 %, al menos 90 %, al menos 95 %, al menos 98 % o mayor (pero no 100 % de identidad) con la de un ARNt de origen natural.
En determinadas realizaciones, un vector (por ejemplo, un plásmido, un cósmido, un fago, un virus, etc.) comprende un polinucleótido de la invención. En una realización, el vector de expresión puede ser un vector de expresión. En
55 otra realización el vector de expresión puede incluir un promotor unido operativamente a uno o más polinucleótidos de la invención. En otra realización, una célula comprende un vector que incluye un polinucleótido de la invención.
Un experto en la técnica también apreciará que en la invención están incluidas muchas variantes de las secuencias descritas. Por ejemplo, en la invención están incluidas variaciones conservativas de las secuencias descritas que
60 proporcionan una secuencia funcionalmente similar. Se considera que en la invención están incluidas variantes de las secuencias polinucleotídicas de ácido nucleico, en las que las variantes hibridan con al menos una secuencia descrita y reconocen un codón selector. En la invención también se incluyen sub-secuencias únicas de las secuencias descritas en el presente documento como se determina, por ejemplo, mediante técnicas de comparación de secuencias convencionales.
65 Variaciones conservativas
Debido a la degeneración del código genético, las “sustituciones silenciosas” (es decir, sustituciones en una secuencia de ácido nucleico que no dan como resultado una alteración en un polipéptido codificado) son una
5 característica implícita de todas las secuencias de ácido nucleico que codifican un aminoácido. De forma similar, en las “sustituciones de aminoácidos conservativas”, uno o unos pocos aminoácidos de una secuencia de aminoácidos se han sustituido por aminoácidos diferentes con propiedades muy similares, también se identifican de forma sencilla como muy similares a una construcción descrita. Dichas variaciones conservativas de cada secuencia descrita son una característica de la presente invención.
10 Las “variaciones conservativas” de una secuencia de ácido nucleico particular se refieren a aquellos ácidos nucleicos que codifican secuencias de aminoácidos idénticas o esencialmente idénticas o, cuando el ácido nucleico no codifica una secuencia de aminoácidos, a secuencias esencialmente distintas. Un experto reconocerá que las sustituciones, deleciones o adiciones individuales que alteran, añaden o eliminan un solo aminoácido o un pequeño
15 porcentaje de aminoácidos (normalmente menos del 5 %, más normalmente menos del 4 %, 2 % o 1 %) en una secuencia codificada son “variaciones modificadas de forma conservativa”, donde las alteraciones producen la deleción de un aminoácido, la adición de un aminoácido o la sustitución de un aminoácido con un aminoácido químicamente similar. Por tanto, las “variaciones conservativas” de una secuencia polipeptídica enumerada en la presente invención incluyen sustituciones de un pequeño porcentaje, normalmente menos del 5 %, más
20 normalmente menos del 2 % o del 1 %, de los aminoácidos de la secuencia polipeptídica, con un aminoácido del mismo grupo de sustitución conservativa. Finalmente, la adición de secuencias que no alteran la actividad codificada de la molécula de ácido nucleico, tal como la adición de una secuencia no funcional, es una variación conservativa del ácido nucleico básico.
25 En la técnica se conocen bien tablas de sustitución conservativa que proporcionan aminoácidos funcionalmente similares, donde un resto de aminoácido se sustituye por otro resto de aminoácido que tiene propiedades químicas similares (por ejemplo, cadenas laterales aromáticas o cadenas laterales cargadas positivamente) y, por lo tanto, no cambia sustancialmente las propiedades funcionales de la molécula polipeptídica. A continuación se indican grupos ilustrativos que contienen aminoácidos naturales con propiedades químicas similares, donde la sustitución dentro de
30 un grupo es una “sustitución conservativa”.
Sustituciones de aminoácidos conservativas
- Cadenas Laterales No Polares y/o Alifáticas
- Cadenas Laterales Polares, No Cargadas Cadenas Laterales Aromáticas Cadenas Laterales Cargadas Positivamente Cargadas Laterales Cargadas Negativamente
- Glicina Alanina Valina Leucina Isoleucina Prolina
- Serina Treonina Cisteína Metionina Asparagina Glutamina Fenilalanina Tirosina Triptófano Lisina Arginina Histidina Aspartato Glutamato
35 Hibridación de ácidos nucleicos
Para identificar ácidos nucleicos de la invención puede utilizarse hibridación comparativa, incluyendo variaciones conservativas de ácidos nucleicos de la invención, y este método de hibridación comparativo es un método preferido para diferenciar ácidos nucleicos de la invención. Además son una característica de la invención los ácidos nucleicos
40 diana que hibridan con un ácido nucleico representado por las SEC ID Nos: 5, 7, 9 u 11, en condiciones de rigurosidad alta, ultra-alta y ultra ultra-alta. Los ejemplos de dichos ácidos nucleicos incluyen aquellos con una o unas pocas sustituciones de ácido nucleico conservativas o silenciosas en comparación con una secuencia de ácido nucleico dada.
45 Se dice que un ácido nucleico de ensayo hibrida específicamente con un ácido nucleico sonda cuando hibrida al menos el 50 % de bien con la sonda como con la diana complementaria perfectamente emparejada, es decir, con una relación entre señal e interferencia de al menos la mitad de alta que la hibridación de la sonda con la diana en condiciones en las que la sonda perfectamente emparejada se une a la diana complementaria perfectamente coincidente con una relación entre señal interferencia que es al menos de aproximadamente 5 veces a 10 veces tan
50 alta como la observada para la hibridación con cualquiera de los ácidos nucleicos diana no emparejados.
Los ácidos nucleicos “hibridan” cuando se asocian, normalmente en solución. Los ácidos nucleicos hibridan debido a diversas fuerzas físicoquímicas bien caracterizadas, tales como formación de enlaces de hidrógeno, exclusión de disolvente, apilamiento de bases y similares. Una amplia guía para la hibridación de ácidos nucleicos se encuentra en Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes, Parte I, Capítulo 2, “Overview of principles of hybridization and the strategy of nucleic acid probe assays,” (Elsevier, Nueva York), así como en Current Protocols in Molecular Biology, Ausubel et al., eds., Current Protocols, una sociedad conjunta entre Greene Publishing Associates, Inc. y John Wiley y Sons, Inc., (adscrita a lo largo del
5 2006); Hames y Higgins (1995) Gene Probes 1 IRL Press at Oxford University Press, Oxford, England; y Hames y Higgins (1995) Gene Probes 2 IRL Press at Oxford University Press, Oxford, England, proporcionan detalles sobre la síntesis, marcaje, detección y cuantificación de ADN y ARN, incluyendo oligonucleótidos.
Un ejemplo de condiciones de hibridación rigurosas para la hibridación de ácidos nucleicos complementarios que
10 tienen más de 100 restos complementarios en un filtro en una transferencia de Southern o Northern es formalina al 50 % con 1 mg de heparina a 42 ºC, realizándose la hibridación durante la noche. Un ejemplo de condiciones de lavado rigurosas es un lavado con SSC 0,2x a 65 ºC durante 15 minutos (para una descripción de tampón SSC véase, Sambrook et al., Molecular Cloning - A Laboratory Manual (3ª Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nueva York, 2001). A menudo, el lavado de alta rigurosidad está precedido por un lavado de
15 baja rigurosidad para eliminar la señal de fondo de la sonda. Un ejemplo del lavado de baja rigurosidad es SSC 2x a 40 ºC durante 15 minutos. En general, una relación entre señal e interferencia 5 veces mayor (o superior) que la observada para una sonda no relacionada en el ensayo de hibridación particular indica detección de una hibridación específica.
20 Las “condiciones rigurosas de lavado de hibridación” en el contexto de los experimentos de hibridación de ácidos nucleicos tales como hibridaciones de Southern y Northern son dependientes de la secuencia y son diferentes con diferentes parámetros ambientales. Se encuentra una guía extensa sobre la hibridación de ácidos nucleicos en Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes, Parte I, Capítulo 2, “Overview of principles of hybridization and the strategy of nucleic acid probe assays,”
25 (Elsevier, Nueva York); Hames y Higgins (1995) Gene Probes 1 IRL Press at Oxford University Press, Oxford, England; y Hames y Higgins (1995) Gene Probes 2 IRL Press at Oxford University Press, Oxford, England. Las condiciones de hibridación y lavado rigurosas pueden determinarse de forma sencilla empíricamente para cualquier ácido nucleico de ensayo. Por ejemplo, para determinar condiciones de hibridación y lavado rigurosas, las condiciones de hibridación y lavado se aumentan gradualmente (por ejemplo, aumentando la temperatura,
30 disminuyendo la concentración de sal, aumentado la concentración de detergente y/o aumentando la concentración de disolventes orgánicos tales como formalina en la hibridación o el lavado), hasta que se cumpla un conjunto de criterios seleccionado. Por ejemplo, en condiciones de hibridación y lavado de alta rigurosidad, las condiciones de hibridación y lavado se aumentan gradualmente hasta que una sonda se une a una diana complementaria perfectamente emparejada con una relación entre señal e interferencia que es al menos 5 veces la observada para
35 la hibridación de la sonda con una diana no emparejada.
Se seleccionan condiciones “muy rigurosas” para que sean iguales al punto de fusión térmico (Tm) de una sonda particular. La Tm es la temperatura (con fuerza iónica y pH definidos) a la que el 50 % de la secuencia de ensayo hibrida con una sonda perfectamente emparejada. Para los propósitos de la presente invención, generalmente se
40 seleccionan las condiciones de hibridación y lavado “altamente rigurosas” para que sean aproximadamente 5 ºC menores que la Tm para la secuencia específica a una fuerza iónica y pH definidos.
Las condiciones de hibridación y lavado de “rigurosidad ultra alta” son aquellas en las que la rigurosidad de las condiciones de hibridación y lavado se aumentan hasta que la relación entre señal e interferencia para unir la sonda
45 al ácido nucleico diana complementario perfectamente emparejado sea al menos 10 veces mayor que la observada para la hibridación con cualquiera de los ácidos nucleicos diana no emparejados. Se dice que un ácido nucleico diana que hibrida con una sonda en tales condiciones, con una relación entre señal o interferencia de al menos la mitad de la del ácido nucleico diana complementario perfectamente emparejado, se une a la sonda en condiciones de rigurosidad ultra-alta.
50 De forma similar, se pueden determinar niveles de rigurosidad incluso mayores aumentando gradualmente las condiciones de hibridación y/o lavado del ensayo de hibridación pertinente. Por ejemplo, aquellos en los que la rigurosidad de las condiciones de hibridación y lavado se aumentan hasta que la relación entre señal e interferencia para la unión de la sonda al ácido nucleico diana complementario perfectamente emparejado sea al menos 10
55 veces, 20 veces, 50 veces, 100 veces, 500 veces o más veces la observada para la hibridación con cualquiera de los ácidos nucleicos diana no emparejados. Se dice que un ácido nucleico diana que hibrida con una sonda en tales condiciones, con una relación entre señal e interferencia de al menos la mitad de la del ácido nucleico diana complementario perfectamente emparejado, se une a la sonda en condiciones de rigurosidad ultra ultra- alta.
60 Los ácidos nucleicos que no hibridan entre sí en condiciones rigurosas todavía son sustancialmente idénticos si los polipéptidos que codifican son sustancialmente idénticos. Esto sucede, por ejemplo, cuando se crea una copia de un ácido nucleico utilizando la máxima degeneración de codón permitida por el código genético.
Subsecuencias únicas
En algunos aspectos, la presente descripción proporciona un ácido nucleico que comprende una subsecuencia única en un ácido nucleico seleccionado de las secuencias de O-ARNt y O-RS descritas en el presente documento. La
5 subsecuencia única es única en comparación con un ácido nucleico correspondiente a cualquier secuencia de ácido nucleico de O-ARNt u O-RS conocida previamente. Se puede realizar el alineamiento utilizando, por ejemplo, un ajuste BLAST para parámetros por defecto. Cualquier subsecuencia única es útil, por ejemplo, como una sonda para identificar los ácidos nucleicos de la invención.
10 De manera similar, la presente invención incluye un polipéptido que comprende una subsecuencia única en un polipéptido seleccionado de las secuencias de las O-RS descritas en el presente documento. En este caso, la subsecuencia única es única en comparación con un polipéptido correspondiente a cualquier secuencia de RS conocida previamente.
15 La invención también proporciona ácidos nucleicos diana que hibridan en condiciones rigurosas con un único oligonucleótido codificante que codifica una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RS donde la subsecuencia única es única en comparación con un polipéptido correspondiente a cualquiera de los polipéptidos de control (por ejemplo, secuencias parentales de las que se obtuvieron las sintetasas de la invención, por ejemplo mediante mutación). Las secuencias únicas se determinan como se ha señalado
20 anteriormente.
Comparación, identidad y homología de secuencia
Las expresiones “idéntico” o “porcentaje de identidad”, en el contexto de dos o más ácidos nucleicos o secuencias
25 polipeptídicas, se refieren a dos o más secuencias o subsecuencias que son iguales o que tienen un porcentaje especificado de restos de aminoácidos o nucleótidos que son iguales cuando se comparan y alinean para la máxima correspondencia, como se mide utilizando uno de dos algoritmos de comparación de secuencia que se describen a continuación (u otros algoritmos disponibles para los expertos en la materia) o mediante inspección visual.
30 La expresión “sustancialmente idéntico”, en el contexto de dos ácidos nucleicos o polipéptidos (por ejemplo, ADN que codifican un O-ARNt o una O-RS, o la secuencia de aminoácidos de una O-RS), se refiere a dos o más secuencias o subsecuencias que tienen una identidad de restos de aminoácidos o nucleótidos de al menos aproximadamente 60 %, aproximadamente 80 %, aproximadamente 90-95 %, aproximadamente 98 %, aproximadamente 99 % o más, cuando se comparan y se alinean para la máxima correspondencia, como se mide
35 utilizando un algoritmo de comparación de secuencias o mediante inspección visual. Dichas secuencias “sustancialmente idénticas” se consideran normalmente “homólogas”, sin referencia a la ascendencia real. Preferentemente, la “identidad sustancial” existe a lo largo de una región de las secuencias que tiene una longitud de al menos aproximadamente 50 restos, más preferentemente a lo largo de una región de al menos aproximadamente 100 restos, y mucho más preferentemente, las secuencias son sustancialmente idénticas a lo largo de al menos
40 aproximadamente 150 restos, o a lo largo de la longitud completa de las dos secuencias a comparar.
Las proteínas y/o secuencias de proteínas son “homólogas” cuando derivan, de forma natural o de forma artificial, de una proteína o secuencia de proteína ancestral común. De forma similar, los ácidos nucleicos y/o las secuencias de ácidos nucleicos son homólogas cuando derivan, de forma natural o de forma artificial, de un ácido nucleico o una 45 secuencia de ácidos nucleicos ancestral común. Por ejemplo, cualquier ácido nucleico de origen natural puede modificarse mediante cualquier método de mutagénesis disponible para incluir uno o más codones selectores. Cuando se expresa, este ácido nucleico mutado codifica un polipéptido que comprende uno o más aminoácidos no naturales. El proceso de mutación puede, por supuesto, alterar adicionalmente uno o más codones convencionales, cambiando también de esta manera uno o más aminoácidos convencionales en la proteína mutante resultante. La 50 homología generalmente se deduce a partir de la similitud de secuencia entre dos o más ácidos nucleicos o proteínas (o secuencias de los mismos). El porcentaje exacto de similitud entre secuencias que es útil para establecer la homología varía con el ácido nucleico y la proteína en cuestión, pero de manera rutinaria, se usa únicamente un 25 % de similitud de secuencia para establecer la homología. También pueden utilizarse niveles más altos de similitud de secuencia, por ejemplo, un 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 % o 99 % o más,
55 para establecer la homología. En el presente documento se describen métodos para determinar porcentajes de similitud (por ejemplo BLASTP y BLASTN utilizando parámetros por defecto) y están generalmente disponibles.
Para la comparación de secuencias y determinación de homología, normalmente una secuencia actúa como una secuencia de referencia con la que se comparan las secuencias de ensayo. Cuando se usa un algoritmo de
60 comparación de secuencias, se introducen las secuencias de ensayo y de referencia en un ordenador, se diseñan las coordenadas de subsecuencia, si es necesario, y se diseñan parámetros de programa de algoritmo de secuencia. Después, el algoritmo de comparación de secuencias calcula el porcentaje de identidad de secuencia para la secuencia (o secuencias) de ensayo con respecto a las secuencias de referencia basándose en los parámetros de programas diseñados.
65 Se puede realizar un alineamiento óptimo de secuencias para la comparación, por ejemplo, mediante el algoritmo de homología local de Smith y Waterman, Adv. Appl. Math 2: 482 (1981), mediante el algoritmo de alineamiento de homología de Needleman y Wunsch, J. Mol. Biol., 48: 443 (1970), mediante el método de búsqueda de similitud de Pearson y Lipman, Proc. Natl. Acad. Sci. USA 85: 2444 (1988), mediante aplicaciones informáticas de estos
5 algoritmos (GAP, BESTFIT, FASTA y TFASTA en el Paquete de Software de Wisconsin Genetics, Genetics Computer Group, 575 Science Dr., Madison, WI), o mediante inspección visual (véase en general Current Protocols in Molecular Biology, Ausubel et al., eds., Current Protocols, una sociedad conjunta entre Greene Publishing Associates, Inc. y John Wiley y Sons, Inc., adscrita a lo largo del 2006).
Un ejemplo de un algoritmo que es adecuado para determinar el porcentaje de identidad de secuencia y similitud de secuencia es el algoritmo BLAST, que se describe en Altschul et al., J. Mol. Biol., 215: 403-410 (1990). El software para realizar análisis BLAST está disponible públicamente por el National Center for Biotechnology Information. Este algoritmo implica identificar en primer lugar pares de secuencias con alta puntuación (HSP, High Scoring Sequence Pairs) identificando palabras cortas de longitud W en la secuencia problema, que se ajustan o satisfacen alguna 15 puntuación umbral T valorada positivamente cuando se alinean con una palabra de la misma longitud en una secuencia de bases de datos. Se denomina T al umbral de puntuación de la palabra vecina (Altschul et al., J. Mol. Biol., 215: 403-410 (1990). Estos aciertos de palabra vecina iniciales actúan como semillas para iniciar búsquedas para encontrar los HSP más largos que los contengan. Después, los aciertos de palabras se extienden en ambas direcciones a lo largo de cada secuencia hasta que se pueda aumentar la puntuación de alineamiento acumulativa. Las puntuaciones acumulativas se calculan utilizando, para secuencias de nucleótidos, los parámetros M (puntuación de recompensa para un par de restos coincidentes; siempre > 0) y N (puntuación de penalización para restos no coincidentes; siempre < 0). Para secuencias de aminoácidos se utiliza una matriz de puntuación para calcular la puntuación acumulativa. La extensión de los aciertos de palabra en cada dirección se detiene cuando: la puntuación del alineamiento acumulativa cae en la cantidad X desde su valor máximo conseguido; la puntuación
25 acumulativa tiende a cero o a un valor inferior, debido a la acumulación de uno o más alineamientos de restos de puntuación negativa; o se alcanza el extremo de cualquier secuencia. Los parámetros W, T y X del algoritmo BLAST determinan la sensibilidad y velocidad del alineamiento. El programa BLASTN (para secuencias de nucleótidos) utiliza por defecto una longitud de palabra (W) de 11, una esperanza (E) de 10, un límite de 100, M=5, N=-4 y una comparación de las dos cadenas. Para secuencias de aminoácidos, el programa BLASTP utiliza por defecto una longitud de palabra (W) de 3, una esperanza (E) de 10 y la matriz de puntuación BLOSUM62 (véase Henikoff y Henikoff (1989) Proc. Natl. Acad. Sci. USA 89: 10915).
Además de calcular el porcentaje de identidad de secuencia, el algoritmo BLAST realiza un análisis estadístico de la similitud entre dos secuencias, (véase, por ejemplo, Karlin y Altschul, Proc. Nat’l. Acad. Sci. USA 90: 5873-5787
35 (1993)). Una medición de la similitud proporcionada por el algoritmo BLAST es la probabilidad de suma más pequeña (P(N)), que proporciona una indicación de la probabilidad con la que ocurriría por casualidad una coincidencia entre dos secuencias de nucleótidos o aminoácidos. Por ejemplo, se considera que un ácido nucleico es similar a una secuencia de referencia sin la probabilidad de suma más pequeña en una comparación del ácido nucleico de ensayo con el ácido nucleico de referencia es menor de aproximadamente 0,1, más preferentemente menos de aproximadamente 0,01 y mucho más preferentemente menor de aproximadamente 0,001.
Mutagénesis y otras técnicas de biología molecular
Los polinucleótidos y polipéptidos de la invención y utilizados en la misma pueden manipularse utilizando técnicas de
45 biología molecular. Los textos generales que describen técnicas de biología molecular incluyen Berger y Kimmel, “Guide to Molecular Cloning Techniques,” Methods in Enzymology, volume 152 Academic Press, Inc., San Diego, CA; Sambrook et al., Molecular Cloning - A Laboratory Manual (3ªed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nueva York, 2001, y Current Protocols en Molecular Biology, Ausubel et al., eds., Current Protocols, una sociedad conjunta entre Greene Publishing Associates, Inc. y John Wiley y Sons, Inc., (adscrita a lo largo del 2003) (Ausubel). Estos textos describen mutagénesis, el uso de vectores, promotores y muchos otros aspectos pertinentes relacionados, por ejemplo, con la generación de genes que incluyen codones selectores para la producción de proteínas que incluyen aminoácidos no naturales, ARNt ortogonales, sintetasas ortogonales y pares de los mismos.
55 En la invención se utilizan diversos tipos de mutagénesis, por ejemplo, para mutar moléculas de ARNt, para producir bibliotecas de ARNt, para producir bibliotecas de sintetasas, o para insertar codones selectores que codifican un aminoácido no natural en una proteína o un polipéptido de interés. Estos incluyen, pero sin limitación, mutagénesis puntual aleatoria dirigida, recombinación homóloga, transposición de ADN u otros métodos de mutagénesis recursiva, construcción quimérica, mutagénesis utilizando moldes que contienen uracilo, mutagénesis de sitio dirigido por oligonucleótido, mutagénesis de ADN modificado por fósforotioato, mutagénesis utilizando ADN dúplex discontinuo o similares o cualquier combinación de los mismos. Otros métodos adecuados incluyen reparación puntual de emparejamiento erróneo, mutagénesis utilizando cepas de hospedador deficientes en reparación, selección por restricción y purificación por restricción, mutagénesis por deleción, mutagénesis por síntesis génica total, reparación de roturas de cadena doble o similar. También se incluye en la presente invención, por ejemplo, la
65 mutagénesis que implica construcciones quiméricas. En una realización, la mutagénesis puede dirigirse por una información conocida de la molécula de origen natural o de la molécula natural alterada o mutada, por ejemplo, por información de la secuencia, de comparaciones de secuencias, de propiedades físicas, de la estructura cristalina o similar.
Las células hospedadoras se crean por ingeniería genética (por ejemplo, se transforman, transducen o transfectan)
5 con los polinucleótidos de la invención o con construcciones que incluyen un polinucleótido de la invención, por ejemplo, un vector de la invención, que puede ser, por ejemplo, un vector de clonación o un vector de expresión. Por ejemplo, las regiones codificantes para el ARNt ortogonal, la ARNt sintetasa ortogonal y la proteína que se tiene que derivatizar están unidas operativamente a elementos de control de la expresión génica que son funcionales en la célula hospedadora deseada. Los vectores típicos contienen terminadores de la transcripción y traducción, secuencias de inicio de la transcripción y traducción y promotores útiles para la regulación de la expresión del ácido nucleico diana particular. Los vectores comprenden opcionalmente casetes de expresión genéricos que contienen al menos una secuencia terminadora independiente, secuencias que permiten la replicación del casete en eucariotas o procariotas o en ambos (por ejemplo, vectores lanzadera) y marcadores de selección tanto para sistemas procariotas como para sistemas eucariotas. Los vectores son adecuados para replicación y/o integración en
15 procariotas, eucariotas o, preferentemente, en ambos. Véase Giliman y Smith, Gene 8: 81 (1979); Roberts, et al., Nature, 328: 731 (1987); Schneider et al., Protein Expr. Purif., 6435: 10 (1995); Berger y Kimmel, “Guide to Molecular Cloning Techniques,” Methods in Enzymology, volume 152 Academic Press, Inc., San Diego, CA; Sambrook et al., Molecular Cloning - A Laboratory Manual (3ª ed.), vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nueva York, 2001, and Current Protocols in Molecular Biology, Ausubel et al., eds., Current Protocols, una sociedad conjunta entre Greene Publishing Associates, Inc. y John Wiley y Sons, Inc., (adscrita a lo largo del 2006). El vector puede estar, por ejemplo, en forma de un plásmido, una bacteria, un virus, un polinucleótido desnudo o un polinucleótido conjugado. Los vectores se introducen en células y/o microorganismos por métodos convencionales incluyendo electroporación (From et al., Proc. Natl. Acad. Sci. USA 82, 5824 (1985), infección por vectores virales, penetración balística a gran velocidad con partículas pequeñas con el ácido nucleico en el interior de la matriz de
25 pequeñas perlas o partículas o sobre la superficie (Klein et al., Nature 327, 70-73 (1987)), y/o similares.
Para la incorporación específica de sitio de aminoácidos naturales en proteínas sin respuesta al codón de terminación ámbar (UAG) en E. coli, se desarrolló un sistema de un solo plásmido versátil y altamente eficaz. En el nuevo sistema, el par ARNtyr(CUA) y tirosil-ARNt sintetasa supresor de M. jannaschii se codifica en un solo plásmido, que es compatible con la mayoría de los vectores de expresión de E. coli. Se construyó un operón de ARNt monocistrónico bajo el control del promotor proK y el terminador para una estructura secundaria óptima y procesamiento de ARNt. La introducción de una forma mutada del promotor glnS para la sintetasa dio como resultado un aumento significativo de la eficacia de supresión y fidelidad. También se obtuvieron aumentos en la eficacia de supresión por copias múltiples de gen de ARNt así como por mutación específica (D286R) en la sintetasa
35 (Kobayashi et al., “Structural basis for orthogonal tRNA specificities of tyrosyl-tRNA synthetases for genetic code expansion,” Nat. Struct. Biol., 10(6): 425-432 [2003]). La generalidad del sistema optimizado también se demostró mediante una incorporación altamente eficaz y exacta de diversos aminoácidos no naturales diferentes, cuyas utilidades exclusivas en el estudio de la función y estructura de las proteínas se aprobaron previamente.
La ATCC proporciona un catálogo de Bacterias y Bacteriófagos útiles para la clonación, por ejemplo, el Catálogo de la ATCC de Bacterias y Bacteriófagos (1996) Ghema et al. (eds) publicado por la ATCC. También se encuentran procedimientos básicos adicionales para la secuenciación, la clonación y otros aspectos de biología molecular y consideraciones teóricas fundamentales en Sambrook et al., Molecular Cloning - A Laboratory Manual (3ª ed.), vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nueva York, 2001; Current Protocols in Molecular Biology,
45 Ausubel et al., eds., Current Protocols, una sociedad conjunta entre Greene Publishing Associates, Inc. y John Wiley y Sons, Inc., (adscrita a lo largo del 2006), y en Watson et al. (1992) Recombinant DNA, Segunda Ed., Scientific American Books, NY. Además, esencialmente cualquier ácido nucleico (y prácticamente cualquier ácido nucleico marcado, convencional o no convencional) puede encargarse a petición del cliente o de forma convencional en cualquiera de diversas fuentes comerciales, tal como la Midland Certified Reagent Company, The Great American Gene Company (Ramona, CA), ExpressGen Inc. (Chicago, IL), Operon Technologies Inc. (Alameda, CA) y muchas otras.
Las células hospedadoras creadas por ingeniería genética se pueden cultivar en medios nutrientes convencionales modificados de forma apropiada para actividades tales como, por ejemplo, etapas de identificación, activación de
55 promotores o selección de transformantes. Estas células pueden cultivarse opcionalmente en organismos transgénicos. Otras referencias útiles, por ejemplo, para el aislamiento y cultivo de células (por ejemplo, para el aislamiento posterior de ácidos nucleicos) incluyen Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, tercera edición, Wiley Liss, Nueva York y las referencias citadas en este documento; Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley y Sons, Inc. Nueva York, NY; Gamborg y Phillips (eds) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg Nueva York) y Atlas y Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, FL.
PROTEÍNAS Y POLIPÉPTIDOS DE INTERÉS
65 Como se define en las reivindicaciones también constituyen una característica de la invención los métodos para producir una proteína en una célula con un aminoácido no natural en una posición específica. Por ejemplo, un método incluye cultivar, en un medio apropiado, la célula, en el que la célula comprende un ácido nucleico que comprende al menos un codón selector y codifica una proteína; y, proporcionar el aminoácido no natural; en el que la célula comprende adicionalmente; un ARNt ortogonal (O-ARNt) que funciona en la célula y conoce el codón
5 selector; y, una aminoacil-ARNt sintetasa ortogonal (O-RS) que aminoacila preferentemente el O-ARNt con el aminoácido no natural. Es también una característica de la invención una proteína producida por este método.
En determinadas realizaciones, la O-RS comprende una predilección por la aminoacilación del O-ARNt afín sobre cualquier ARNt endógeno en un sistema de expresión. La proporción relativa entre O-ARNt y el ARNt endógeno que está cargado por la O-RS, cuando el O-ARNt y la O-RS están presentes a concentraciones equimolares, puede ser mayor de 1:1, preferentemente al menos aproximadamente de 2:1, más preferentemente de 5:1, aún más preferentemente de 10:1, aún más preferentemente de 20:1, aún más preferentemente de 50:1, aún más preferentemente de 75:1, aún más preferentemente de 95:1, 98:1, 99:1, 100:1, 500:1, 1.000:1, 5.000:1 o una proporción mayor.
15 La invención también proporciona composiciones que incluyen proteínas, en la que las proteínas comprenden un aminoácido no natural. En determinadas realizaciones, la proteína puede comprender una secuencia de aminoácidos que tiene una identidad de al menos 75 % con la de una proteína terapéutica, una proteína de diagnóstico, una enzima industrial o una parte de las mismas.
Las composiciones de la invención y las composiciones fabricadas mediante los métodos de la invención están presentes opcionalmente en una célula. Los pares O-ARNt/O-RS o los componentes individuales de la invención pueden por tanto utilizarse en una maquinaria de traducción de un sistema hospedador, lo que da como resultado la incorporación un aminoácido no natural en una proteína. Los Números de Publicación Internacional WO
25 2004/094593, presentada el 16 de abril de 2004, titulada “EXPANDING THE EUKARYOTIC GENETIC CODE”, y WO 2002/085923, titulada “IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS”, describen este proceso. Por ejemplo, cuando un par O-ARNt/O-RS se introduce en un hospedador, por ejemplo, una célula de Escherichia coli, el par conduce a la incorporación in vivo de un aminoácido no natural, tal como sulfotirosina, en una proteína en respuesta a un codón selector. El aminoácido no natural que se añade al sistema puede ser un aminoácido sintético, tal como un derivado de una fenilalanina o tirosina, que puede añadirse exógenamente al medio de cultivo. Opcionalmente, las composiciones de la presente invención pueden estar en un sistema de traducción in vitro o en un sistema (o sistemas) in vivo.
Una célula de la invención proporciona la capacidad de sintetizar proteínas que comprenden aminoácidos no
35 naturales en grandes cantidades útiles. En algunos aspectos, la composición incluye opcionalmente, por ejemplo, al menos 10 microgramos, al menos 50 microgramos, al menos 75 microgramos, al menos 100 microgramos, al menos 200 microgramos, al menos 250 microgramos, al menos 500 microgramos, al menos 1 miligramo, al menos 10 miligramos o más de la proteína que comprende un aminoácido no natural o una cantidad que puede conseguirse con los métodos de producción de proteína in vivo (en el presente documento se proporcionan detalles de la producción y purificación de proteínas recombinantes). En otro aspecto, la proteína está opcionalmente presente en la composición a una concentración de, por ejemplo, al menos 10 microgramos de proteína por litro, al menos 50 microgramos de proteína por litro, al menos 75 microgramos de proteína por litro, al menos 100 microgramos de proteína por litro, al menos 200 microgramos de proteína por litro, al menos 250 microgramos de proteína por litro, al menos 500 microgramos de proteína por litro, al menos 1 miligramo de proteína por litro, o al menos 10 miligramos
45 de proteína por litro o más, por ejemplo, en un lisado celular, un tampón, un tampón farmacéutico u otra suspensión líquida (por ejemplo, en un volumen de, por ejemplo, cualquiera de aproximadamente 1 nl a aproximadamente 100 l). Una característica de la presente descripción es la producción de grandes cantidades (por ejemplo, superiores a las normalmente posibles con otros métodos, por ejemplo, traducción in vitro) de una proteína en una célula que incluye al menos un aminoácido no natural.
La incorporación de un aminoácido no natural puede realizarse, por ejemplo, para ajustar cambios en la estructura y/o función de la proteína, por ejemplo, para cambiar el tamaño, la acidez, la nucleofilia, la formación de enlaces de hidrógeno, la hidrofobia, la accesibilidad de sitios diana de proteasa, el direccionamiento a un resto (por ejemplo, para una matriz de proteínas), la incorporación de marcadores o grupos reactivos, etc. Las proteínas que incluyen un
55 aminoácido no natural pueden tener propiedades catalítica o físicas mejoradas o incluso completamente nuevas. Por ejemplo, mediante la inclusión de un aminoácido no natural en una proteína se modifican opcionalmente las siguientes propiedades: toxicidad, biodistribución, propiedades estructurales, propiedades espectroscópicas, propiedades químicas y/o fotoquímicas, capacidad catalítica, semivida (por ejemplo, semivida en suero), capacidad de reaccionar con otras moléculas, por ejemplo, de forma covalente o no covalente y similares. Las composiciones que incluyen proteínas que incluyen al menos un aminoácido no natural son útiles para, por ejemplo, nuevas enzimas terapéuticas, de diagnóstico, catalíticas, industriales, proteínas de unión (por ejemplo, anticuerpos), y por ejemplo, para el estudio de la estructura y función de las proteínas. Véase, por ejemplo, Dougherty, (2000) Unnatural Amino Acids as Probes of Protein Structure and Function, Current Opinion in Chemical Biology, 4: 645-652.
65 En algunos aspectos de la presente descripción, una composición incluye al menos una proteína con al menos una, por ejemplo, al menos dos, al menos tres, al menos cuatro, al menos cinco, al menos seis, al menos siete, al menos
ocho, al menos nueve o al menos diez o más aminoácidos no naturales. Los aminoácidos no naturales pueden ser iguales o diferentes, por ejemplo, puede haber 1, 2, 3, 4, 5, 6, 7, 8, 9, o 10 o más sitios diferentes en la proteína que comprenden 1, 2, 3, 4, 5, 6, 7, 8, 9, o 10 o más aminoácidos no naturales diferentes. En otro aspecto, una composición incluye una proteína en la que al menos uno, pero no todos, los aminoácidos particulares presentes en 5 la proteína es un aminoácido no natural. Para una proteína determinada con más de un aminoácido no natural, los aminoácidos no naturales pueden ser idénticos o diferentes (por ejemplo, la proteína puede incluir dos o más tipos diferentes de aminoácidos no naturales, o puede incluir dos de los mismos aminoácidos no naturales). Para una proteína determinada con más de dos aminoácidos no naturales, los aminoácidos no naturales pueden ser iguales, diferentes o una combinación de un aminoácido no natural múltiple del mismo tipo con al menos un aminoácido no
10 natural diferente.
Utilizando las composiciones y los métodos del presente documento puede producirse esencialmente cualquier proteína (o parte de la misma) que incluya un aminoácido no natural (y cualquier ácido nucleico codificante correspondiente, que incluya, por ejemplo, uno o más codones selectores). No se ha intentado identificar los cientos
15 de miles de proteínas conocidas que pueden modificarse para incluir uno o más aminoácidos no naturales, por ejemplo, adaptando cualquiera de los métodos de mutación disponibles para incluir uno o más codones selectores apropiados en un sistema de traducción pertinente. Los archivos depositarios de secuencias comunes para proteínas conocidas incluyen el GenBank EMBL, el DDBJ y el NCBI. Buscando en internet pueden identificarse fácilmente otros archivos depositarios.
20 Normalmente, las proteínas tienen una identidad de, por ejemplo, al menos 60 %, al menos 70 %, al menos 75 %, al menos 80 %, al menos 90 %, al menos 95 % o al menos 99 % o más con cualquiera de las proteínas disponibles (por ejemplo, una proteína terapéutica, una proteína de diagnóstico, una enzima industrial o una parte de la misma, y similares), y comprenden uno o más aminoácidos no naturales. Ejemplos de proteínas terapéuticas, de diagnóstico y
25 otras proteínas que pueden modificarse para que comprendan uno o más aminoácidos no naturales pueden encontrarse, pero sin limitación, en las Publicaciones Internacionales WO 2004/094593, presentada el 16 de abril de 2004, titulada “EXPANDING THE EUKARYOTIC GENETIC CODE”; y WO 2002/085923, titulada “IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS”. Ejemplos de proteínas terapéuticas, de diagnóstico y otras proteínas que pueden modificarse para que comprendan uno o más aminoácidos naturales incluyen, pero sin
30 limitación, por ejemplo, hirudina, alfa-1 antitripsina, angiostatina, factor antihemolítico, anticuerpos (más detalles sobre anticuerpos se encuentran más adelante), apolipoproteína, apoproteína, factor natriurético auricular, polipéptido natriurético auricular, péptidos auriculares, quimiocinas C-X-C (por ejemplo, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG), calcitonina, quimiocinas CC (por ejemplo, proteína-1 quimioatrayente de monocitos, proteína-2 quimioatrayente de monocitos, proteína-3 quimioatrayente de monocitos,
35 proteína-1 alfa inflamatoria de monocitos, proteína-1 beta inflamatoria de monocitos, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262), ligando CD40, Ligando C-kit, colágeno, factor estimulante de colonias (CSF), factor 5a de Complemento, inhibidor del complemento, receptor 1 del complemento, citocinas, (por ejemplo, péptido 78 activador de neutrófilos epiteliales, GROα/MGSA, GROβ, GROγ, MIP-1α, MIP-18, MCP-1), Factor de Crecimiento Epidérmico (EGF), Eritropoyetina (“EPO”), toxinas exfoliantes A y B, Factor IX, Factor VII, Factor VIII,
40 Factor X, Factor de Crecimiento de Fibroblastos (FGF), Fibrinógeno, Fibronectina, G-CSF, GM-CSF, glucocerebrosidasa, gonadotropina, factores de crecimiento, proteínas erizo (por ejemplo, Sonic, Indian, Desert), hemoglobina, Factor de Crecimiento de Hepatocitos (HGF), hirudina, albúmina de suero humano, insulina, factor de crecimiento similar a insulina (IGF), interferones (por ejemplo, IFN-α, IFN-β, IFN-γ), interleucinas (por ejemplo IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, etc.), factor de crecimiento de queratinocitos (KGF),
45 lactoferrina, factor inhibidor de leucemia, luciferasa, neurturina, factor inhibidor de neutrófilos (NIF), oncostatina M, proteína osteogénica, hormona paratiroidea, PD-ECSF, PDGF, hormonas peptídicas (por ejemplo, Hormona de Crecimiento Humano), pleiotropina, Proteína A, Proteína G, exotoxinas Pirogénicas A, B y C, relaxina, renina, SCF, receptor I de complemento Soluble, I-CAM 1 Soluble, receptores solubles de interleucina (IL-1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15), receptor soluble de TNF, somatomedina, somatostatina, somatotropina, estreptoquinasa,
50 superantígenos, es decir, enterotoxinas de estafilococos (SEA, SEB, SEC1, SEC2, SEC3, SED, SEE), superóxido dismutasa (SOD), toxina de síndrome de choque tóxico (TSST-1), timosina alfa 1, activador de plasminógeno tisular, factor beta de necrosis tumoral (TNF beta), receptor del factor de necrosis tumoral (TNFR), factor alfa de necrosis tumoral (TNF alfa), Factor de Crecimiento del Endotelio Vascular (VEGEF), uroquinasa y muchas otras.
55 Una clase de proteínas que puede prepararse utilizando las composiciones y los métodos para la incorporación in vivo de aminoácidos no naturales descritos en el presente documento incluyen moduladores transcripcionales o una parte de los mismos. Los ejemplos de moduladores transcripcionales incluyen genes y proteínas moduladoras transcripcionales que modulan el crecimiento, la diferenciación, la regulación celular o similar. Los modulares transcripcionales se encuentran en procariotas, virus y eucariotas que incluyen hongos, vegetales, levaduras,
60 insectos y animales incluyendo mamíferos, proporcionando una amplia serie de dianas terapéuticas. Se apreciará que los activadores de la expresión y de la transcripción regulan la transcripción mediante muchos mecanismos, por ejemplo, uniéndose a receptores, estimulando una cascada de transducción de señales, regulando la expresión de factores de transcripción, uniéndose a promotores y potenciadores, uniéndose a proteínas que se unen a promotores y potenciadores, desenrollando el ADN, por corte y empalme del pre-ARNm, poliadenilando el ARN y
65 degradando el ARN.
Una clase de proteínas de la presente descripción (por ejemplo, proteínas con uno o más aminoácidos no naturales) incluyen proteínas biológicamente activas tales como hirudina, citocinas, moléculas inflamatorias, factores de crecimiento, sus receptores, y productos oncogénicos, por ejemplo, interleucinas (por ejemplo IL-1, IL-2, IL-8, etc.), interferones, FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-α, TGF-β, EGF, KGF, SCF/c-Kit, CD40L/CD40, VLA
5 4/VCAM-1, ICAM-1/LFA-1, e hialurina/CD44; moléculas de transducción de señales y productos oncogénicos correspondientes, por ejemplo, Mos, Ras, Raf y Met; y activadores y supresores de la transcripción, por ejemplo, p53, Tat, Fos, Myc, Jun, Myb, Rel y receptores de hormonas esteroideas tales como los receptores de estrógeno, progesterona, testosterona, aldosterona, el ligando del receptor de LDL y corticosterona.
La descripción también proporciona enzimas (por ejemplo enzimas industriales) o partes de las mismas con al menos un aminoácido no natural. Los ejemplos de enzimas incluyen, pero sin limitación, por ejemplo, amidasas, aminoácido racemasas, acilasas, deshalogenasas, dioxigenasas, diarilpropano peroxidasas, epimerasas, epóxido hidrolasas, esterasas, isomerasas, quinasas, glucosa isomerasas, glucosidasas, glucosil transferasas, haloperoxidasas, monooxigenasas (por ejemplo p450s), lipasas, lignina peroxidasas, nitrilo hidratasas, nitrilasas,
15 proteasas, fosfatasas, subtilisinas, transaminasas y nucleasas.
Muchas de estas proteínas están disponibles en el mercado (Véase, por ejemplo, el catálogo y la lista de precios de Sigma BioSciences 2002) y las secuencias de proteínas y genes correspondientes y, normalmente, muchas variantes de las mismas, son muy conocidas (véase, por ejemplo, Genbank). Cualquiera de ellas pueden modificarse mediante la inserción de uno o más aminoácidos no naturales de acuerdo con la invención, por ejemplo, para alterar la proteína con respecto a una o más propiedades terapéuticas, de diagnóstico o enzimáticas de interés. Los ejemplos de propiedades terapéuticamente pertinentes incluyen semivida en suero, semivida de conservación, estabilidad, inmunogenicidad, actividad terapéutica, detectabilidad (por ejemplo, mediante la inclusión de grupos indicadores (por ejemplo, marcadores o sitios de unión a marcadores) en los aminoácidos no naturales), reducción
25 de DL50 u otros efectos secundarios, capacidad de entrar en el organismo a través del tracto gástrico (por ejemplo, disponibilidad oral) o similares. Los ejemplos de las propiedades de diagnóstico incluyen semivida de conservación, estabilidad, actividad enzimática, capacidad de producción o similares.
Utilizando las composiciones y los métodos de la invención también puede modificarse diversas proteínas diferentes para incluir uno o más aminoácidos no naturales. Por ejemplo, la invención puede incluir sustituir uno o más aminoácidos naturales en una o más proteínas de vacuna con un aminoácido no natural, por ejemplo, en proteínas de hongos infecciosos, por ejemplo Aspergillus, especies de Candida; bacterias, particularmente E. coli, que sirve como modelo de bacterias patógenas, así como bacterias médicamente importantes tales como Staphylococci (por ejemplo aureus), o Streptococci (por ejemplo pneumoniae); protozoos tales como esporozoos (por ejemplo
35 Plasmodia), rizópodos (por ejemplo Entamoeba) y flagelados (Trypanosoma, Leishmania, Trichomonas, Giardia, etc.); virus tales como virus de ARN (+) (los ejemplos incluyen Poxvirus, por ejemplo, vaccinia; Picornavirus, por ejemplo, polio; Togavirus, por ejemplo, rubeola; Flavivirus, por ejemplo, VHC; y Coronavirus), virus de ARN (-) (por ejemplo, Rabdovirus, por ejemplo, VSV; Paramixovirus, por ejemplo, VSR; Ortomixovirus, por ejemplo, gripe; Bunyavirus; y Arenavirus), virus de ADNbc (por ejemplo, Reovirus), virus de ARN a ADN, es decir, Retrovirus, por ejemplo, VIH y VLTV y determinados virus de ADN a ARN tales como el virus de la Hepatitis B.
Las proteínas relacionadas con la agricultura, tales como las proteínas de resistencia a insectos (por ejemplo las proteínas Cry), enzimas de producción de almidón y lípidos, toxinas de plantas e insectos, proteínas de resistencia a toxinas, proteínas desintoxicantes de micotoxina, enzimas de crecimiento de plantas (por ejemplo, Ribulosa 1,5
45 Bifosfato Carboxilasa/Oxigenasa, “RUBISCO”), lipooxigenasa (LOX) y Fosfoenolpiruvato (PEP) carboxilasa son también dianas apropiadas para la modificación con aminoácidos no naturales.
En determinadas realizaciones, la proteína o el polipéptido de interés (o partes de los mismos) en los métodos y/o composiciones de la invención están codificados por un ácido nucleico. Normalmente, el ácido nucleico comprende al menos un codón selector, y puede comprender al menos dos codones selectores, al menos tres codones selectores, al menos cuatro codones selectores, al menos cinco codones selectores, al menos seis codones selectores, al menos siete codones selectores, al menos ocho codones selectores, al menos nueve codones selectores, diez o más codones selectores.
55 Los genes que codifican proteínas o polipéptidos de interés pueden mutagenizarse utilizando métodos bien conocidos por los expertos en la técnica y descritos en el presente documento en “mutagenesis y otras técnicas de biología molecular” para incluir, por ejemplo, uno o más codones selectores para la incorporación de un aminoácido no natural. Por ejemplo, se mutageniza un ácido nucleico para una proteína de interés para incluir uno o más codones selectores, proporcionando la inserción de uno o más aminoácidos no naturales. La invención incluye cualquiera de dichas variantes, por ejemplo, mutantes, versiones de cualquier proteína, por ejemplo, que incluye al menos un aminoácido no natural. De forma similar, la invención también incluye ácidos nucleicos correspondientes, es decir, cualquier ácido nucleico con uno o más codones selectores que codifique uno o más aminoácidos no naturales.
65 Para fabricar una proteína que incluya un aminoácido no natural, pueden utilizarse células y organismos hospedadores que estén adaptados para la incorporación in vivo del ácido nucleico no natural mediante pares ARNt/RS ortogonales. Las células hospedadoras se modifican por ingeniería genética (por ejemplo, se transforman, transducen o transfectan) con uno o más vectores que expresan el ARNt ortogonal, la ARNt sintetasa ortogonal y un vector que codifica la proteína que va a derivatizarse. Cada uno de estos componentes pueden estar en el mismo vector o cada uno de ellos puede estar en un vector distinto, o los dos componentes pueden estar en un vector y el
5 tercer componente en un segundo vector. El vector puede estar, por ejemplo, en forma de plásmido, bacteria, virus, polinucleótido desnudo o polinucleótido conjugado.
Definición de polipéptidos por inmunoreactividad
10 Como los polipéptidos de la invención proporcionan diversas secuencias polipeptídicas nuevas (por ejemplo, polipéptidos que comprenden aminoácidos no naturales en el caso de proteínas sintetizadas en los sistemas de traducción del presente documento o, por ejemplo, en el caso de nuevas sintetasas, nuevas secuencias de aminoácidos convencionales), los polipéptidos también proporcionan nuevas características estructurales que pueden reconocerse, por ejemplo, en ensayos inmunológicos. La generación de antisueros, que se unen
15 específicamente a los polipéptidos de la invención, así como los polipéptidos que se unen por dichos antisueros, constituye una característica de la invención. El término “anticuerpo”, como se utiliza en el presente documento, incluye, pero sin limitación, un polipéptido codificado sustancialmente por uno o más genes de inmunoglobulina, o fragmentos de los mismos que se unen específicamente y reconocen un analito (antígeno). Los ejemplos incluyen anticuerpos policlonales, monoclonales, quiméricos, monocatenarios y similares. Los fragmentos de
20 inmunoglobulinas, incluyendo fragmentos Fab y fragmentos producidos mediante una biblioteca de expresión, incluyendo presentación en fagos, también están incluidos en el término “anticuerpo” como se usa en el presente documento. Véase, por ejemplo, Paul, Fundamental Immunology, 4ª ed., 1999, Raven Press, Nueva York, para estructura y terminología de anticuerpos.
25 Con el fin de producir los antisueros para su uso en un inmunoensayo, se producen uno o más polipéptidos inmunogénicos y se purifican según se describe en el presente documento. Por ejemplo, la proteína recombinante puede producirse en una célula recombinante. Una cepa endogámica de ratón (utilizada en este ensayo ya que los resultados son más reproducibles debido a la identidad genética implícita de los ratones), se inmuniza con la proteína (o proteínas) inmunogénica en combinación con un adyuvante convencional, tal como adyuvante de
30 Freund, y un protocolo de inmunización de ratón convencional (véase, por ejemplo, Harlow y Lane (1988) Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, Nueva York, para una descripción convencional de generación de anticuerpos, formatos de inmunoensayo y condiciones que pueden utilizarse para determinar la inmunorreactividad específica). Pueden encontrarse detalles adicionales sobre proteínas, anticuerpos, antisueros, etc. en las Publicaciones Internacionales Números WO 2004/094593, titulada “EXPANDING THE EUKARYOTIC
35 GENETIC CODE”; WO 2002/085923, titulada “IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS”; WO 2004/035605, titulada “GLYCOPROTEIN SYNTHESIS”; y WO 2004/058946, titulada “PROTEIN ARRAYS”.
USO DE O-ARNt Y O-RS Y PARES O-ARNt/O-RS
40 Las composiciones de la invención y las composiciones preparadas mediante los métodos de la invención como se define en las reivindicaciones están opcionalmente en una célula. Los pares O-ARNt/O-RS o componentes individuales de la invención que pueden utilizarse después en una maquinaria de traducción de un sistema hospedador, dando como resultado la incorporación de un aminoácido no natural en una proteína. La Publicación Internacional Número WO 2002/085923 de Schultz, et al., titulada “IN VIVO INCORPORATION OF UNNATURAL
45 AMINO ACID”, describe este proceso. Por ejemplo, cuando se introduce un par O-ARNt/O-RS en un hospedador, por ejemplo, Escherichia coli, el par conduce a la incorporación in vivo de un aminoácido no natural, que puede añadirse de forma exógena al medio de cultivo, en una proteína, por ejemplo, una proteína de ensayo de mioglobina
o una proteína terapéutica, en respuesta a un codón selector, por ejemplo, un codón sin sentido ámbar. Opcionalmente, las composiciones de la invención pueden estar en un sistema de traducción in vitro, o en uno o 50 más sistemas in vivo. Se pueden utilizar proteínas con el aminoácido no natural en cualquiera de una gran diversidad de aplicaciones. Por ejemplo, el resto no natural incorporado en la proteína puede servir como una diana para cualquiera de una gran variedad de modificaciones, por ejemplo, entrecruzamientos con otras proteínas, con moléculas pequeñas tales como marcadores o colorantes y/o biomoléculas. Con estas modificaciones, la incorporación del aminoácido no natural puede dar como resultado proteínas terapéuticas mejoradas y pueden
55 utilizarse para alterar o mejorar la función catalítica de enzimas. En algunos aspectos, la incorporación y posterior modificación de un aminoácido no natural en una proteína puede facilitar estudios sobre la estructura de las proteínas, interacciones con otras proteínas y similares.
60 Los siguientes ejemplos se ofrecen para ilustrar, pero no para limitar, la invención que se reivindica.
EJEMPLO 1
65 Selección genética de sintetasas mutantes específicas de sulfotirosina
Las metodologías que permiten la adición sistemática de aminoácidos no naturales a los códigos genéticos de células de E. coli (Wang et al., “Expanding the genetic code of Escherichia coli”, Science 292: 498-500 (2001)), levadura (Chin et al., “An expanded eukaryotic genetic code”, Science 301: 964-967 (2003)) y de mamífero (Zhang et al., “Selective incorporation of 5-hydroxytryptophan into proteins in mammalian cells”, Proc Natl Acad Sci USA 101:
5 8882-8887 (2004)) se han descrito anteriormente. Dichos métodos se basan en el desarrollo de un par ARNt/aaRS supresor antisentido que tiene la propiedad de la ortogonalidad, definida como la capacidad de incorporar selectivamente un aminoácido determinado en respuesta a un único codón sin reaccionar en cruzado con los ARNt, las aminoacil-ARNt sintetasas o los aminoácidos engógenos del hospedador.
10 Para generar un par ARNt/aaRS ortogonal que inserta únicamente sulfotirosina (FIG. 1), se utilizó una biblioteca de mutantes de sitio activo de la tirosil-ARNt sintetasa de Methanococcus jannaschii (MjTyrRS), que carga específicamente un supresor sinsentido de M. jannaschii (MjARNtTyrCUA) modificado por ingeniería genética no reconocido por sintetasas de E. coli (Wang et al., “Expanding the genetic code of Escherichia coli”, Science 292: 498-500 (2001)). Esta biblioteca, cuyo diseño y generación se describe en cualquier parte (Bose et al., “The
15 incorporation of a photoisomerizable amino acid into proteins in E. coli”, J Am Chem Soc 128: 388-389 (2006)), se sometió a una serie de selecciones positivas y negativas (3 positivas y 2 negativas). La supervivencia en la selección positiva depende de la supresión de una mutación ámbar en el gen cloranfenicol acetiltransferasa (CAT) en presencia de sulfotirosina 2 mM; la supervivencia en la selección negativa depende de la supresión inadecuada de tres mutaciones ámbar en un gen que codifica la proteína barnasa tóxica en ausencia de sulfotirosina (Wang et al.,
20 “Expanding the genetic code of Escherichia coli”, Science 292: 498-500 (2001)). Los clones sobreviven a través de rondas de selección tanto positiva como negativa solo si estos incorporan únicamente sulfotirosina en respuesta al codón ámbar.
Después de estas selecciones, se identificaron numerosos clones que permitían a las células, que albergaban el gen
25 CAT con una mutación ámbar en el sitio permisivo 112, sobrevivir en cloranfenicol 130 μg/ml en presencia de sulfotirosina 2 mM. En ausencia de sulfotirosina, las mismas células no crecieron en cloranfenicol 20 μg/ml, coherente con la incorporación eficiente de sulfotirosina con poco a ningún fondo de incorporación de aminoácidos endógenos. La secuenciación de los clones sintetasa mutante candidatos (denominados STyrRS) reveló cuatro clones sintetasa diferentes, cada uno de los cuales cumplía los criterios de un sistema de traducción ortogonal. El
30 clon 1 fue predominantemente (Tyr32Leu, Leu65Pro, Asp158Gly, Ile159Cys, Leu162Lys). En la FIG. 7 se proporcionan las secuencias de nucleótidos y de aminoácidos de cada uno de estos clones y las especies de tipo silvestre.
- Aminoácido de Mjtirosil-ARNt sintetasa (y codón correspondiente)
- 32
- 65 155 158 159 162 SEC ID Nº:
- tipo silvestre
- Tyr (TAC) Leu (TTG) Gln (CAG) Asp (GAT) Ile (ATT) Leu (TTA) 2 (3)
- Clon 1
- Leu (CTG) Pro (CCT) Gln (CAG) Gly (GGT) Cys (TGT) Lys (AAG) 4 (5)
- Clon 2
- Leu (CTG) Pro (CCG) Gln (CAG) Gly (GGT) Thr (ACT) Lys (AAG) 6 (7)
- Clon 3
- Leu (CTG) Pro (CCT) Glu (GAG) Gly (GGT) Cys (TGT) Lys (AAG) 8 (9)
- Clon 4
- Leu (CTG) Pro (CCG) Gln (CAG) Gly (GGT) Ile (ATT) Lys (AAG) 10 (11)
35 Es posible asignar funciones posibles de estas mutaciones, particularmente Lys162, que probablemente forma una interacción de puente salino con la sulfotirosina SO3-. Leu32 y Gly158 pueden alojar el grupo SO3-más grande y eliminar la afinidad de la tirosina endógena (Tyr32 y Asp158 están implicadas en la formación de enlaces de hidrógeno con el grupo fenólico de la tirosina en la enzima de tipo silvestre). El reemplazo de Asp158 aniónico por Gly posiblemente obvia interacciones electroestáticas desfavorables con la sulfotirosina. Sin embargo, para realizar
40 o utilizar la invención, no se requiere un entendimiento del mecanismo o funciones de las diversas posiciones sustituidas.
METODOLOGÍA DETALLADA PARA LA SELECCIÓN DE SULFOTIROSINA AMINOACIL ARNt SINTETASA
45 Para seleccionar la STyrRS, se utilizó una biblioteca de sitio activo de MjTyrRS contenida en el vector pBK (pBK-lib) (Bose et al., “The incorporation of a photoisomerizable amino acid into proteins in E. coli”, J Am Chem Soc 128: 388389 (2006)). Células DH10B que incluían pRep, un plásmido de selección positiva que contenía un MjARNtTyrCUA modificado por ingeniería genética, un gen de cloranfenicol acetiltransferasa con un codón ámbar introducido en la posición 112 (un sitio permisivo) y un marcador de resistencia a tetraciclina, se transformaron con pBK-lib y se sembraron en placas de agar con GMML complementado con sulfotirosina 2 mM (Senn Chemicals) y cloranfenicol 68 μg/ml. Después de 72 horas a 37 ºC, las placas rasparon y se extrajeron los vectores pBK-lib.
5 Esta colección de plásmidos de biblioteca se utilizó después para transformar células DH10B que contenían pNeg, un plásmido de selección negativa, que contenía un MjARNtTyrCUA modificado por ingeniería genética, un gen de barnasa tóxico con tres codones ámbar introducidos, y un marcador de resistencia a cloranfenicol. Las células se sembraron en placas de LB agar que no contenía sulfotirosina y se cultivaron a 37 ºC durante 12 horas después de las cuales los vectores pBK-lib se extrajeron de las células supervivientes. Este ciclo de selección positiva y negativa se repitió una vez, y los vectores pBK-lib seleccionados se transformaron posteriormente en células DH10B que contenían pRep y se replicaron sembrando en placas de agar con GMML con y sin sulfotirosina. Las células que crecieron en placas que contenían cloranfenicol 130 μg/ml en presencia de sulfotirosina pero que no crecieron en placas que contenían cloranfenicol 20 μg/ml en ausencia de sulfotirosina se consideraron buenos aciertos.
15 Estos aciertos se clasificaron y la ortogonalidad de sus sintetasas correspondientes se confirmó expresando la proteína de dominio Z que contenía un codón ámbar en la posición 7 en presencia y en ausencia de sulfotirosina. Las sintetasas ortogonales fueron aquellas que permitieron la expresión del dominio Z de longitud completa solo o en presencia de sulfotirosina. Se utilizó MALDI-TOF para confirmar que la sulfotirosina se incorporaba realmente en el dominio Z de longitud completa.
EJEMPLO 2
Expresión y caracterización de una proteína modelo mutante que contiene sulfotirosina
25 Para verificar la incorporación única de la sulfotirosina por la sintetasa STyrRS seleccionada, un mutante ámbar (resto 7) de una proteína de dominio Z marcada con His6 en el extremo C, se expresó en E. coli que incluía plásmidos para el dominio Z mutante ámbar, MjARNtTyrCUA y STyrRS (clon 1). El análisis de electroforesis en gel de poliacrilamida (PAGE) después de purificación con Ni-NTA mostró una fuerte banda para el dominio Z solo cuando la proteína se expresaba en medios que contenían sulfotirosina 2 mM - no se observó banda en ausencia de sulfotirosina, lo que confirmaba la dependencia de la supresión ámbar en la sulfotirosina (FIG. 4A).
Para una caracterización adicional, se realizó análisis MALDI-TOF en el domino Z mutante purificado. Debe indicarse que los análisis MALDI-TOF y ESI de proteínas de tirosina sulfatadas dan como resultado la pérdida
35 parcial de sulfato, cuyo grado depende la rigurosidad de las condiciones (22, 23). Por lo tanto, se utilizaron condiciones suaves en modo ión positivo con una matriz a pH moderado (2,4,6-trihidroxi-acetofenona), en las que apareció un pico predominante [M+H] de 7876 Da (Mteórico = 7877,5 Da) correspondiente al dominio Z que contenía una sola sulfotirosina y que carecía de metionina. También se observó un pico pequeño (<10 %) [M+H] de 7798 Da (Mteórico = 7797,5 Da) que es el resultado de la pérdida de sulfato durante el MALDI-TOF, saliendo de la tirosina (FIG. 4B). Aunque por si solos estos datos de espectrometría de masas no descartan la incorporación de tirosina del fondo mediante STyrRS, puede hacerse basándose en el análisis en gel PAGE. Por tanto la STyrRS incorpora únicamente sulfotirosina, lo que permite la expresión recombinante de proteínas sulfatadas en bacterias.
EJEMPLO 3
Se examinó si este sistema ortogonal para la producción de proteínas sulfatadas podría utilizarse para generar una proteína nativa selectivamente sulfatada normalmente biosintetizada solo en organismos superiores. Para ello, se seleccionó la proteína hirudina, que está sulfatada en la posición 63 de tirosina. La hirudina, segregada por la sanguijuela medicinal Hirudo medicinalis, es el inhibidor natural más fuerte de la trombina, y su forma recombinante se administra clínicamente como un anticoagulante. Sin embargo, la expresión recombinante de la hirudina en E. coli y levadura utilizada para la producción comercial del fármaco produce la forma no sulfatada (desulfohirudina) debido a la ausencia de sulfotransferasas necesarias en estos organismos (Markwardt, “Hirudin as alternative anticoagulant
55 -a historical review,” Semin Thromb Hemost 28, 405-414 (2002)). Aunque a pesar de que la desulfohirudina sea un inhibidor eficaz de trombina, su afinidad por la trombina humana es al menos un orden de magnitud inferior que el de la sulfohirudina, que tiene una Ki de aproximadamente 20 fM (Braun et al., “Use of site-directed mutagenesis to investigate the basis for the specificity of hirudin,” Biochemistry 27, 6517-6522 (1988)).
Para expresar la sulfohirudina, se clonó el gen STyrRS (clon 1) en la estructura vectorial pSup que contenía seis copias de MjARNTyrCUA con promotores optimizados (Ryu y Schultz, “Efficient incorporation of unnatural amino acids into proteins in Escherichia coli,” Nat Methods 3: 263-265 (2006)). El gen de hirudina con un codón ámbar en la posición 63 y una secuencia señal periplásmica gIII se sintetizó y se insertó en el vector pBAD. Después de la cotransformación de células E. coli DH10B con ambos plásmidos, se realizó la expresión en un matraz agitador en
65 medio mínimo líquido con glicerol (GMML) complementado con sulfotirosina 10 mM. Dado que la hirudina es pequeña, la dirección dentro del periplasma da como resultado la secreción de modo eficaz; por lo tanto, la sulfohirudina se purificó directamente del medio concentrado por FPLC utilizando una columna de intercambio aniónico Q Sepharose seguido de cromatografía de exclusión por tamaño para producir un rendimiento de 5 mg/l. Para comparar, la desulfohirudina con la tirosina codificada en la posición 63 se expresó de manera similar y se purificó con un rendimiento de 12 mg/l.
5 METODOLOGÍA DETALLADA PARA LA CLONACIÓN, EXPRESIÓN Y PURIFICACIÓN DE SULFOHIRUDINA Y DESULFOHIRUDINA
El gen correspondiente a [Leu1, Thr2]-63-desulfohirudina (comercialmente conocido como Lepirudina (Refludan®)) fusionado con una secuencia señal periplásmica gIII para la secreción se sintetizó por BlueHeron® con Optimización de Expresión. Este gen se insertó en el vector pBAD (Invitrogen) para producir pBAD-Hirudin bajo el control del promotor araBAD. Se utilizó mutagénesis de sitio dirigido Quickchange (Stratagene) para introducir TAG en la posición 63 del gen Lepirudina para producir pBAD-HirudinTAG para la expresión de sulfohirudina.
15 El gen correspondiente a la STirRS seleccionada (clon 1) se insertó en el vector pSup entre los sitios PstI y NdeI bajo el control del promotor glnS para producir pSup-STyrRS. El pSup-STyrRS también contenía seis copias de MjARNTyrCUA modificado por ingeniería genética bajo el control del promotor proK.
Células DH10B electrocompetentes cotransformadas con pSup-STyrRS y pBAD-HirudinTAG se cultivaron en medio GMML con ampicilina 50 μg/ml, 20 μg/ml de cloranfenicol y sulfotirosina 10 mM a 37 ºC. Cuando las células alcanzaron una DO600 de 0,6, se añadió L-arabinosa a una concentración final de 0,2 % para inducir la expresión de proteínas. Las células se cultivaron durante 24 horas más a 37 ºC. Las células se sedimentaron y los medios se concentraron utilizando un dispositivo agitador celular.
25 Los medios concentrados se dializaron frente a agua y se aplicaron a una columna de intercambio aniónico (HiLoad 26/10 Q Sepharose, GE Healthcare) previamente equilibrada con Tris-HCl 50 mM, EDTA 1 mM y β-mercaptoetanol 10 mM, pH 7,4. Las proteínas se eluyeron con un gradiente lineal de NaCl de 0,025 a 1 M. Se analizaron las fracciones pico por PAGE. Las fracciones procedentes de un pico principal que eluyeron a NaCl 0,3 M se agruparon entre sí, se concentraron, se dializaron frente a agua y se aplicaron a filtración en gel (Superdex 200 10/300 GL, GE Healthcare). Las proteínas se eluyeron con solución salina tamponada con Tris (Tris-HCl 25 mM, NaCl 125 mM y KCl 2 mM, pH 7,6). La concentración final de sulfohirudina se determinó por titulación frente a α-trombina humana 1 nM (Diapharma) utilizando 50 μM de sustrato fluorogénico de trombina Boc-Asp(OBzl)-Pro-Arg-MCA (Peptides International, Inc.) para medir la actividad trombina. Esto supone una inhibición estequiométrica de 1:1 de trombina por hirudina, que es válida a las concentraciones utilizadas tal y como estipula la cinética de unión estrecha
35 (Szedlacsek y Duggleby, “Kinetics of slow and tight-binding inhibitors,” Methods Enzymol 249: 144-180 (1995)). Para expresar, purificar y cuantificar [Leu1, Thr2]-63-desulfohirudina se utilizaron procedimientos similares.
EJEMPLO 4 DE REFERENCIA
Las hirudinas resultantes descritas en el ejemplo anterior se caracterizaron por análisis PAGE y cada una de ellas se presentó como una sola banda. La sulfohirudina podría diferenciarse de la desulfohirudina ya que la primera migra más lejos que la última para ofrecer un desplazamiento en gel (FIG. 2). El análisis MALDI-TOF mostró las masas
45 correctas [M+H] tanto de la sulfohirudina (7059 Da; Mteórico = 7059,5 Da) como de la desulfohirudina (6979 Da; Mteórico = 6979,5 Da) con dos picos en el caso de la sulfohirudina por la pérdida de sulfato dando como resultado una señal secundaria [M+H-80] (véase la FIG. 5).
Para verificar adicionalmente que este segundo pico resultaba exclusivamente del análisis espectral de masas, se realizaron dos experimentos. En primer lugar, se aprovechó el hecho de que la elución de la sulfohirudina de la columna de intercambio aniónico se produce a una fuerza iónica mayor del 10 % en comparación con la elución de la desulfohirudina en las mismas condiciones de gradiente, lo que permitiría la separación completa de las dos hirudinas si hubieran estado presentes de manera simultánea. (Esto se confirmó añadiendo sulfohirudina con desulfohirudina). Dado que no se observó ningún pico de desulfohirudina en la purificación por intercambio aniónico
55 de la sulfohirudina, determinado por la ausencia de un pico de desulfohirudina en los espectros de masas de las correspondientes fracciones eluidas, se llegó a la conclusión de que cuando se expresaba la sulfohirudina no se producía desulfohirudina.
En segundo lugar, se realizó una expresión de control en la que no se añadió sulfotirosina. Un análisis MALDI-TOF posterior de los medios concentrados en bruto que contenían una mezcla de todas las proteína segregadas mostró solo un pico [M+H] de 6578 Da correspondiente a la proteína truncada resultante de un comportamiento alternativo de TAG como un codón de terminación (Mteórico = 6575 Da); no se observó ningún pico correspondiente a la proteína de longitud completa (véase la FIG. 6A). Esto difiere de la expresión en presencia de sulfotirosina en la que en los espectros de masas se encuentran picos de proteína tanto truncada como de longitud completa a aproximadamente 65 las mismas intensidades (véase FIG. 6B), lo que sugiere una estricta dependencia de supresión ámbar sobre la presencia de sulfotirosina. A partir de estos dos experimentos, se llega a la conclusión de que la señal [M+H-80] en
el MALDI-TOF de la sulfohirudina es exclusivamente atribuible a la escisión de SO3- durante la espectrometría de masas, lo que confirma que STyrRS carga su ARNt afín exclusivamente con sulfotirosina sin aminoacilación observable de tirosina
5 Cabe señalar que las intensidades similares de los picos de la proteína truncada y de longitud completa en los espectros de masas de los medios de expresión de la sulfohirudina en bruto combinado con el hecho de que la expresión de la desulfohirudina produce aproximadamente el doble de proteínas que la expresión de la sulfohirudina en las mismas condiciones sugiere la supresión de aproximadamente la mitad de los acontecimientos de traducción durante la expresión de la sulfohirudina. Puede por tanto deducirse que la doble supresión en nuestro sistema producirá aproximadamente el 75 % de proteína truncada y el 25 % de longitud completa, suponiendo la ausencia de efectos en el contexto de supresión ámbar. Se contempla que la presencia de la proteína truncada se debe a una baja permeabilidad de la sulfotirosina aniónica en células E. coli, dando como resultado una población disminuida de MjARNtTyrCUA cargada con aminoácido. De hecho, la expresión de hirudina utilizando el mismo sistema, pero con la p-acetil fenilalanina altamente permeable y su correspondiente sintetasa mutante, produce la incorporación de p
15 acetil fenilalanina con proteína truncada indetectable (datos no mostrados). Una estrategia profármaco para administrar sulfotirosina puede por lo tanto eliminar la presencia de proteína truncada y aumentar el rendimiento.
EJEMPLO 5 DE REFERENCIA
Para caracterizar la eficacia de la sulfohirudina expresada como un anticoagulante, se determinó la cinética de la inhibición de trombina utilizando un ensayo enzimático fluorogénico basado en el método de curva de progreso sencillo previamente descrito en la bibliografía (Cha, “Tight-binding inhibitors--III. A new approach for the
25 determination of competition between tight-binding inhibitors and substrates--inhibition of adenosine deaminase by coformycin,” Biochem Pharmacol 25: 2695-2702 (1976); Komatsu et al., “CX-397, a novel recombinant hirudin analog having a hybrid sequence of hirudin variants-1 and -3,” Biochem Biophys Res Commun 196: 773-779 (1993)). En este ensayo, se mezclaron 100 pM de sulfohirudina o desulfohirudina con sustrato fluorogénico 50 μM al que se añadió α-trombina humana para iniciar la reacción. La escisión de sustrato fluorogénico por trombina, cuya actividad inhibe a diferentes grados la sulfohirudina y la desulfohirudina, da como resultado una gráfica de intensidad de fluorescencia a lo largo del tiempo (FIG. 3).
Las concentraciones exactas de la hirudina y sulfohirudina se determinaron por titulación frente a trombina en un intervalo de concentración en el que podía suponerse una unión de 1:1. Como resultado de la cinética de unión 35 estrecha apropiada para la hirudina (Stone y Hofsteenge, “Kinetics of the inhibition of thrombin by hirudin,” Biochemistry 25: 4622-4628 (1986)), estos datos experimentales se ajustaron a la ecuación 1, produciendo valores de Ki, kon y koff después del tratamiento de las constantes extraídas. Este análisis ofreció valores Ki para la sulfohirudina y desulfohirudina de 26 fM y 307 fM respectivamente, de acuerdo con las publicaciones bibliográficas
M-1
(17). Como se esperaba, el valor de kon para la sulfohirudina (0,95 x 108s-1) fue mayor que el de la desulfohirudina (0,38 x 108 M-1 s-1), mientras que el valor de koff para la sulfohirudina fue menor (0,22 x 10-5 s-1) que el de la desulfohirudina (1,18 x 10-5 s-1). En la siguiente tabla se muestra un promedio de estas constantes cinéticas de la inhibición de trombina derivadas de un ajuste de curvas de progreso no lineal a lo largo de al menos 3 lecturas con desviaciones típicas.
- Ki
- kon x 10-8 (M-1 s -1) koff x 105 (s-1)
- Sulfohirudina
- 26 ± 9,8 0,95 ± 0,56 0,22 ± 0,06
- Desulfohirudina
- 307 ± 72 0,38 ± 0,07 1,18 ± 0,45
45 La ventaja de la mayor afinidad de la sulfohirudina sobre la desulfohirudina debe ser especialmente pronunciada en el intervalo de concentración de la trombina débilmente unida por sus Ki respectivas (Szedlacsek y Duggleby, “Kinetics of slow and tight-binding inhibitors,” Methods Enzymol 249: 144-180 (1995)). Por lo tanto es interesante que la concentración basal fisiológica del estado de equilibrio estacionario de la trombina humana activa se encuentre dentro de este intervalo (Velan y Chandler, “Effects of surgical trauma and cardiopulmonary bypass on active thrombin concentrations and the rate of thrombin inhibition in vivo,” Pathophysiol Haemost Thromb 33: 144156 (2003)), lo que sugiere un posible impulso evolutivo para la sulfatación en la hirudina de sanguijuela nativa. Esta observación debe servir como una orientación para posibles aplicaciones terapéuticas para la desulfohirudina codificada genéticamente (descrita en el presente documento) sobre la forma recombinante no sulfatada
55 predominante.
La incorporación cotraduccional de la sulfotirosina en proteínas debe hacer posible la expresión eficaz de muchas proteínas más selectivamente sulfatadas en E. coli incluyendo anticuerpos, motivos de receptores de quimiocina y factores de coagulación, facilitando de esta manera estudios estructurales-funcionales así como la aplicación terapéutica práctica de proteínas sulfatadas. Además, esta estrategia in vivo puede aplicarse a la construcción de bibliotecas de anticuerpos sulfatados y presentación de fagos de proteínas sulfatadas, caminos prometedores inaccesibles mediante métodos disponibles de síntesis peptídica, ligamiento químico nativo y ligamiento de proteínas expresadas. Como alternativa, debe ser posible ampliar esta estrategia a la expresión directa de proteínas tirosina sulfatadas en organismos eucariotas.
METODOLOGÍA DETALLADA DE LA CARACTERIZACIÓN CINÉTICA DE ESPECIES DE HIRUDINA
EXPRESADAS
La liberación de 7-amino-4-metilcoumarina de Boc-Asp(OBzl)-Pro-Arg-MCA 50 μM como resultado de la actividad de
10 la trombina se controló midiendo la intensidad de fluorescencia (longitud de onda de excitación = 365 nm; longitud de onda de emisión = 450 nm) con un lector de placa fluorescente (Molecular Devices SpectraMax Gemini). La reacción enzimática se realizó por triplicado y se repitió tres veces en placas de 96 pocillos a 37 ºC en tampón Tris-HCl 50 mM, pH 7,8, que contenía Polietilenglicol 6000 al 0,1 % (Fluka), NaCl 100 mM, y HSA 250 μg/ml (Calbiochem). La constante de Michaelis del sustrato en estas condiciones es 11,6 μM (Komatsu et al., “CX-397, a novel recombinant
15 hirudin analog having a hybrid sequence of hirudin variants-1 and -3,” Biochem Biophys Res Commun 196: 773-779 (1993)).
Los parámetros cinéticos de la inhibición de trombina por la sulfohirudina y desulfohirudina expresada se extrajo de ajuste no lineal de curvas de progreso obtenido a 40 pM de α-trombina y 100 pM de sulfohirudina o desulfohirudina 20 utilizando el método de curva de progreso sencillo, como se ha descrito previamente (Komatsu et al., “CX-397, a novel recombinant hirudin analog having a hybrid sequence of hirudin variants-1 and -3,” Biochem Biophys Res Commun 196: 773-779 (1993)). De acuerdo con el mecanismo de inhibición competitiva de unión estrecha, lenta de las hirudinas, la formación de productos puede describirse mediante la ecuación 1 (Stone y Hofsteenge, “Kinetics of the inhibition of thrombin by hirudin,” Biochemistry 25: 4622-4628 (1986); Cha, “Tight-binding inhibitors--III. A new
25 approach for the determination of competition between tight-binding inhibitors and substrates--inhibition of adenosine deaminase by coformycin,” Biochem Pharmacol 25: 2695-2702 (1976)):
en la que P es la cantidad de producto formado en el tiempo t y vo y vs son las velocidades inicial y de estado de 30 equilibrio estacionario de la reacción. En la ecuación 1, vs, γ y λ pueden describirse mediante las siguientes expresiones:
en las que
y
Utilizando estas ecuaciones, se determinaron los valores de Ki y kon. El valor de koff es el producto de kon y Ki. Los 45 ajustes de regresión no lineal se calcularon utilizando el programa GraphPad Prism.
Claims (18)
- REIVINDICACIONES1. Un sistema de traducción que comprende:5 (a) un primer aminoácido no natural que es la sulfotirosina tal como se representa en la Figura 1;
- (b)
- una primera aminoacil ARNt sintetasa ortogonal (O-RS) en donde la O-RS comprende una secuencia de aminoácidos que es una variante conservativa de la SEC ID Nº: 2, la cual variante conservativa tiene una identidad de al menos el 90 % con la SEC ID Nº: 2 y comprende: una leucina en una posición correspondiente a Tyr32; una prolina en una posición correspondiente a Leu65; una glicina en una posición correspondiente a Asp158 y una lisina en una posición correspondiente a Leu162, y; opcionalmente comprende un ácido glutámico en una posición correspondiente a Gln155 y/o una treonina o una cisteína en una posición correspondiente a Ile159, y;
- (c)
- un primer ARNt ortogonal (O-ARNt); en el que dicha primera O-RS aminoacila dicho primer O-ARNt con dicha
sulfotirosina. 15 - 2. El sistema de traducción de la reivindicación 1, en el que:
- (i)
- dicha primera O-RS deriva de una aminoacil-ARNt sintetasa de Methanococcus jannaschii; y/o,
- (ii)
- dicha primera O-RS deriva de una tirosil ARNt sintetasa de Methanococcus jannaschii de tipo silvestre; y/o
(iii) dicha primera O-RS comprende una secuencia de aminoácidos expuesta en las SEC ID Nos: 4, 6, 8 o 10; y/o,- (iv)
- dicho primer O-ARNt es un ARNt supresor de ámbar; y/o
- (v)
- dicho primer O-ARNt comprende o está codificado por una secuencia de polinucleótidos expuesta en la SEC
ID Nº: 1. 25 -
- 3.
- El sistema de traducción de la reivindicación 1, que adicionalmente comprende un ácido nucleico que codifica una proteína de interés, comprendiendo dicho ácido nucleico al menos un codón selector, en el que dicho codón selector es reconocido por dicho primer O-ARNt.
-
- 4.
- El sistema de traducción de la reivindicación 3, que adicionalmente comprende una segunda O-RS y un segundo O-ARNt, en el que la segunda O-RS aminoacila el segundo O-ARNt con un segundo aminoácido no natural que es diferente del primer aminoácido no natural, y en el que el segundo O-ARNt reconoce un codón selector que es diferente del codón selector reconocido por el primer O-ARNt.
35 5. El sistema de traducción de la reivindicación 1, en el que dicho sistema comprende una célula hospedadora que comprende dicho primer aminoácido no natural, dicha primera O-RS y dicho primer O-ARNt. -
- 6.
- El sistema de traducción de la reivindicación 5, en el que dicha célula hospedadora es una célula de eubacteria, tal como una célula de E. coli.
-
- 7.
- El sistema de traducción de la reivindicación 5, en el que dicha célula hospedadora comprende un polinucleótido que codifica dicha primera O-RS y/o un polinucleótido que codifica dicho primer O-ARNt.
- 8. El sistema de traducción de la reivindicación 7, en el que dicho primer polinucleótido comprende una secuencia de 45 nucleótidos expuesta en las SEC ID Nos: 5, 7, 9 u 11.
- 9. Un método para producir, en un sistema de traducción, una proteína que comprende un aminoácido no natural en una posición seleccionada, comprendiendo el método:(a) proporcionar un sistema de traducción que comprende:
- (i)
- un primer aminoácido no natural que es la sulfotirosina tal como se representa en la Figura 1;
- (ii)
- una primera aminoacil ARNt sintetasa ortogonal (O-RS) en la que la O-RS comprende una secuencia de aminoácidos que es una variante conservativa de la SEC ID Nº: 2, la cual dicha variante conservativa tiene
55 una identidad de al menos el 90 % con la SEC ID Nº: 2 y comprende: una leucina en una posición correspondiente a Tyr32; una prolina en una posición correspondiente a Leu65; una glicina en una posición correspondiente a Asp158, y una lisina en una posición correspondiente a Leu162, y; opcionalmente comprende un ácido glutámico en una posición correspondiente a Gln155, y/o una treonina o una cisteína en una posición correspondiente a Ile159;(iii) un primer ARNt ortogonal (O-ARNt), en el que dicha primera O-RS aminoacila dicho primer O-ARNt con dicha sulfotirosina; y(iv) un ácido nucleico que codifica dicha proteína, en donde dicho ácido nucleico comprende al menos un codón selector que es reconocido por dicho primer O-ARNt; e65 (b) incorporar dicho aminoácido natural en dicha posición seleccionada en dicha proteína durante la traducción de dicha proteína en respuesta a dicho codón selector, produciendo de este modo dicha proteína que comprende dicho aminoácido no natural en la posición seleccionada. - 10. El método de la reivindicación 9, en el que dicha proteína que comprende un aminoácido no natural es lasulfohirudina. 5
- 11. El método de la reivindicación 9, en el que:(A) dicha disposición de un sistema de traducción comprende proporcionar un polinucleótido que codifica dicha O-RS; o10 (B) dicha disposición de un sistema de traducción comprende proporcionar una O-RS derivada de una aminoacil-ARNt sintetasa de Methanococcus jannaschii; o,(C) dicha disposición de un sistema de traducción comprende proporcionar una O-RS derivada de una tirosil-ARNt sintetasa de Methanococcus jannaschii de tipo silvestre; o,(D) dicha disposición de un sistema de traducción comprende proporcionar una O-RS que comprende una 15 secuencia de aminoácidos expuesta en las SEC ID Nos: 4, 6, 8 o 10; o,(E) dicha disposición de un sistema de traducción comprende mutar un bolsillo de unión de aminoácidos de una aminoacil-ARNt sintetasa de tipo silvestre por mutagénesis de sitio dirigido y seleccionar una O-RS resultante que aminoacila dicho O-ARNt con dicho aminoácido no natural, en donde dicha etapa de selección comprende realizar una selección positiva y una selección negativa de dicha O-RS a partir de un conjunto que comprende20 una pluralidad de moléculas de aminoacil-ARNt sintetasa resultantes después de la mutagénesis de sitio dirigido; o,(F) dicha disposición de un sistema de traducción comprende proporcionar un polinucleótido que codifica dicho O-ARNt; o,(G) dicha disposición de un sistema de traducción comprende proporcionar un O-ARNt que es un ARNt supresor 25 ámbar; o,
- (H)
- dicha disposición de un sistema de traducción comprende proporcionar un O-ARNt que comprende o está codificado por una secuencia de polinucleótidos expuesta en la SEC ID Nº: 1; o,
- (I)
- dicha disposición de un sistema de traducción comprende proporcionar un ácido nucleico que comprende un codón selector ámbar; o
30 (J) dicha disposición de un sistema de traducción comprende proporcionar una célula hospedadora, en donde dicha célula hospedadora comprende dicho primer aminoácido no natural, dicha primera O-RS, dicho primer O-ARNt y dicho ácido nucleico, y en el que dicha etapa de incorporación comprende cultivar dicha célula hospedadora; o,(K) dicha disposición de un sistema de traducción comprende proporcionar un extracto celular. 35 - 12. El método de la reivindicación 11 (J), en el que:(i) dicha disposición de una célula hospedadora comprende proporcionar una célula hospedadora de eubacteria; o40 (ii) dicha disposición de una célula hospedadora de eubacteria comprende proporcionar una célula hospedadora de E. coli; o,(iii) dicha disposición de una célula hospedadora comprende proporcionar una célula hospedadora que comprende un polinucleótido que codifica dicha O-RS; o,(iv) dicha disposición de una célula hospedadora que comprende un polinucleótido que codifica dicha O-RS45 comprende proporcionar una célula hospedadora que comprende un polinucleótido que comprende una secuencia de nucleótidos expuesta en las SEC ID Nos: 5, 7, 9 u 11.
- 13. El método de la reivindicación 9, en el que adicionalmente dicha proteína comprende un segundo aminoácido no natural que es diferente de dicho primer aminoácido no natural, y en el que dicho sistema de traducción comprende50 adicionalmente una segunda O-RS y un segundo O-ARNt, en donde la segunda O-RS aminoacila el segundo O-ARNt con un segundo aminoácido no natural que es diferente del primer aminoácido no natural, y en el que el segundo O-ARNt reconoce un codón selector en el ácido nucleico que es diferente del codón selector reconocido por el primer O-ARNt.55 14. Una composición que comprende un polipéptido que comprende una secuencia de aminoácidos que es una variante conservativa de la SEC ID Nº: 2, la cual dicha variante conservativa tiene una identidad de al menos el 90 % con la SEC ID Nº: 2 y comprende: una leucina en una posición correspondiente a Tyr32; una prolina en una posición correspondiente a Leu65; una glicina en una posición correspondiente a Asp158, y una lisina en una posición correspondiente a Leu162, y;60 opcionalmente comprende un ácido glutámico en una posición correspondiente a Gln155 y/o una treonina o una cisteína en una posición correspondiente a Ile159, y; el cual polipéptido aminoacila un O-ARNt con sulfotirosina tal como se representa en la Figura 1.
- 15. La composición de la reivindicación 14, en la que el polipéptido comprende la secuencia de aminoácidos de las 65 SEC ID Nos: 4, 6, 8 o 10.
-
- 16.
- Un polinucleótido que codifica el polipéptido de las reivindicaciones 14 o 15.
-
- 17.
- El polinucleótido de la reivindicación 16, en donde dicho polinucleótido comprende la secuencia de nucleótidos
de las SEC ID Nº: 5, 7, 9 u 11. 5 - 18. La composición de las reivindicaciones 14 o 15, en donde dicha composición comprende una célula que comprende el polipéptido.
- 19. Un vector que comprende el polinucleótido de acuerdo con la reivindicación 16. 10
- 20. Una célula que comprende un vector, comprendiendo el vector el polinucleótido de la reivindicación 16.Secuencias de nucleótidos y aminoácidos
- SEC ID Nº:
- Descripción SECUENCIA
- 1
- tirosil- ARNtCUA supresor de Methanococcus jannaschii tcc MjARNt-Tyr(CUA) o
- 2
- Secuencia de aminoácidos de la tirosil-ARNt sintetasa (MjTyrRS) de Methanococcus jannaschii de tipo silvestre
- 3
- Secuencia de nucleótidos de la tirosil-ARNt sintetasa (MjTyrRS) de Methanococcus jannaschii de tipo silvestre
- 4
- CLON 1 Secuencia de aminoácidos de la sulfotirosina aminoacil-ARNt sintetasa (derivada de la tirosil ARNt-sintetasa de Methanococcus jannaschiide de tipo silvestre)
Fig. 7- SEC ID Nº:
- Descripción SECUENCIA
- 5
- CLON 1 Secuencia de nucleótidos de la sulfotirosina aminoacil-ARNt sintetasa
- 6
- CLON 2 Secuencia de aminoácidos de la sulfotirosina aminoacil-ARNt sintetasa (derivada de la tirosil ARNt-sintetasa de Methanococcus jannaschii de tipo silvestre)
- 7
- CLON 2 Secuencia de nucleótidos de la sulfotirosina aminoacil-ARNt sintetasa
- 8
- CLON 3 Secuencia de aminoácidos de la sulfotirosina aminoacil-ARNt sintetasa (derivada de la tirosil ARNt-sintetasa de Methanococcus jannaschii de tipo silvestre)
Fig. 7 (Cont.)- SEC ID Nº:
- Descripción SECUENCIA
- 9
- CLON 3 Secuencia de nucleótidos de la sulfotirosina aminoacil-ARNt sintetasa
- 10
- CLON 4 Secuencia de aminoácidos de la sulfotirosina aminoacil-ARNt sintetasa (derivada de la tirosil ARNt-sintetasa de Methanococcus jannaschii tipo silvestre)
- 11
- CLON 4 Secuencia de nucleótidos de la sulfotirosina aminoacil-ARNt sintetasa
Fig. 7 (Cont.)
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US84651906P | 2006-09-21 | 2006-09-21 | |
| US846519P | 2006-09-21 | ||
| US85521006P | 2006-10-28 | 2006-10-28 | |
| US855210P | 2006-10-28 | ||
| PCT/US2007/020459 WO2008036392A2 (en) | 2006-09-21 | 2007-09-20 | Genetically programmed expression of selectively sulfated proteins in eubacteria |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2456331T3 true ES2456331T3 (es) | 2014-04-22 |
Family
ID=39201110
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES07861356.9T Active ES2456331T3 (es) | 2006-09-21 | 2007-09-20 | Expresión genéticamente programada de proteínas sulfatadas selectivamente en eubacterias |
Country Status (15)
| Country | Link |
|---|---|
| US (3) | US8114627B2 (es) |
| EP (1) | EP2052083B1 (es) |
| JP (1) | JP5385143B2 (es) |
| KR (1) | KR20090074765A (es) |
| CN (1) | CN101516901B (es) |
| AU (1) | AU2007297610A1 (es) |
| BR (1) | BRPI0716963A2 (es) |
| CA (1) | CA2663052A1 (es) |
| ES (1) | ES2456331T3 (es) |
| IL (1) | IL197531A0 (es) |
| MX (1) | MX2009002987A (es) |
| PL (1) | PL2052083T3 (es) |
| PT (1) | PT2052083E (es) |
| RU (1) | RU2009110152A (es) |
| WO (1) | WO2008036392A2 (es) |
Families Citing this family (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DK2322631T3 (en) * | 2001-04-19 | 2015-01-12 | Scripps Research Inst | Methods and compositions for the production of orthogonal tRNA-aminoacyl-tRNA syntetasepar |
| CA2500653A1 (en) * | 2002-10-16 | 2004-04-29 | The Scripps Research Institute | Glycoprotein synthesis |
| KR101171397B1 (ko) | 2003-04-17 | 2012-08-07 | 더 스크립스 리서치 인스티튜트 | 진핵 유전자 코드의 확장 |
| ES2301099T3 (es) * | 2003-07-07 | 2008-06-16 | The Scripps Research Institute | Composiciones de parejas ortogonales lisil-arnt y aminoacil-arnt sintetasa y usos de las mismas. |
| CA2704494A1 (en) * | 2007-11-02 | 2009-05-14 | The Scripps Research Institute | Directed evolution using proteins comprising unnatural amino acids |
| US8658394B2 (en) * | 2011-02-02 | 2014-02-25 | Waterstone Pharmaceuticals | Methods, cells and systems for incorporating non-canonical amino acids into proteins |
| CN102888387B (zh) * | 2011-07-21 | 2015-03-18 | 中国科学院生物物理研究所 | 3-氯代酪氨酸翻译系统及其应用 |
| CN103571804B (zh) * | 2012-08-10 | 2015-08-12 | 中国科学院生物物理研究所 | 3-吡唑基酪氨酸翻译系统及其应用 |
| WO2015120287A2 (en) | 2014-02-06 | 2015-08-13 | Yale University | Compositions and methods of use thereof for making polypeptides with many instances of nonstandard amino acids |
| WO2016073079A2 (en) | 2014-09-26 | 2016-05-12 | Yale University | Compositions and methods for biocontainment of microorganisms |
| CN110117580B (zh) * | 2018-02-05 | 2021-12-14 | 中国科学院生物物理研究所 | 硒代酪氨酸翻译系统及其应用 |
| IL280198B2 (en) * | 2018-07-18 | 2026-01-01 | Regenxbio Inc | Treatment of mucopolysaccharidosis I with fully glycosylated human iduronidase-alpha-L (idus) |
| CN113785058B (zh) * | 2019-03-04 | 2024-12-24 | 得克萨斯A&M大学系统 | 制作和利用琥珀专性的噬菌体展示文库的方法 |
| US11149280B2 (en) | 2019-10-29 | 2021-10-19 | Yale University | Engineering organisms resistant to viruses and horizontally transferred genetic elements |
| CN111304234A (zh) * | 2020-02-27 | 2020-06-19 | 江南大学 | 一种适用于枯草芽孢杆菌的非天然氨基酸利用工具 |
| CN113789335B (zh) * | 2021-11-16 | 2022-03-15 | 江苏省中国科学院植物研究所 | 一种水蛭酪氨酸磺酸转移酶基因及其应用 |
| CN118389493B (zh) * | 2024-05-10 | 2025-04-11 | 北京大学 | 一种定点修饰的工程化tRNA及其应用 |
Family Cites Families (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6204016B1 (en) * | 1998-01-29 | 2001-03-20 | The Board Of Regents Of The University Of Oklahoma | Tyrosylprotein sulfotransferases and methods of use thereof |
| DK2322631T3 (en) * | 2001-04-19 | 2015-01-12 | Scripps Research Inst | Methods and compositions for the production of orthogonal tRNA-aminoacyl-tRNA syntetasepar |
| CA2500653A1 (en) * | 2002-10-16 | 2004-04-29 | The Scripps Research Institute | Glycoprotein synthesis |
| US7432092B2 (en) * | 2002-10-16 | 2008-10-07 | The Scripps Research Institute | Site specific incorporation of keto amino acids into proteins |
| EP1583816A4 (en) * | 2002-12-22 | 2007-06-13 | Scripps Research Inst | PROTEIN ARRAYS |
| KR101171397B1 (ko) * | 2003-04-17 | 2012-08-07 | 더 스크립스 리서치 인스티튜트 | 진핵 유전자 코드의 확장 |
| CA2527877A1 (en) * | 2003-06-18 | 2005-01-13 | The Scripps Research Institute | Unnatural reactive amino acid genetic code additions |
| ES2301099T3 (es) * | 2003-07-07 | 2008-06-16 | The Scripps Research Institute | Composiciones de parejas ortogonales lisil-arnt y aminoacil-arnt sintetasa y usos de las mismas. |
| WO2005007870A2 (en) * | 2003-07-07 | 2005-01-27 | The Scripps Research Institute | COMPOSITIONS OF ORTHOGONAL LEUCYL-tRNA AND AMINOACYL-tRNA SYNTHETASE PAIRS AND USES THEREOF |
| EP1658366A4 (en) * | 2003-07-07 | 2006-08-09 | Scripps Research Inst | COMPOSITIONS OF ORTHOGONAL GLUTAMYL-TRNA AND AMINOACYL-TRNA-SYNTHETASEPAARES AND THEIR USES |
| DK1687401T3 (da) * | 2003-10-14 | 2013-02-04 | Scripps Research Inst | Sted-spicifik inkorporing af redoxaktive aminosyrer i protiener |
| EP1725251A4 (en) * | 2003-12-18 | 2009-07-01 | Scripps Research Inst | SELECTIVE PROCESSING OF 5-HYDROXYTRYPTOPHANE IN PROTEINS IN MAMMALIAN CELLS |
| MXPA06013586A (es) * | 2004-05-25 | 2007-11-09 | Scripss Res Inst | Incorporacion especifica del sitio de aminoacidos no naturales que contienen atomos pesados en proteinas para la determinacion de la estructura cristalina. |
| US20090181858A1 (en) * | 2004-09-21 | 2009-07-16 | The Scripps Research Institute | Adding photoregulated amino acids to the genetic code |
| ES2666693T3 (es) * | 2004-09-21 | 2018-05-07 | The Scripps Research Institute | Incorporación in vivo de alquinil aminoácidos a proteínas en eubacterias |
| WO2006036779A2 (en) * | 2004-09-22 | 2006-04-06 | The Scripps Research Institute | Site-specific labeling of proteins for nmr studies |
| WO2006045116A2 (en) * | 2004-10-20 | 2006-04-27 | The Scripps Research Institute | In vivo site-specific incorporation of n-acetyl-galactosamine amino acids in eubacteria |
| WO2006110182A2 (en) | 2004-10-27 | 2006-10-19 | The Scripps Research Institute | Orthogonal translation components for the in vivo incorporation of unnatural amino acids |
| US8367588B2 (en) * | 2005-10-12 | 2013-02-05 | The Scripps Research Institute | Selective posttranslational modification of phage-displayed polypeptides |
| ES2432391T3 (es) | 2006-03-09 | 2013-12-03 | The Scripps Research Institute | Sistema para la expresión de componentes de traducción ortogonales en células huésped eubacterianas |
| BRPI0709603A2 (pt) * | 2006-03-16 | 2011-07-19 | Scripps Research Inst | expressão de proteìnas geneticamente programada contendo o aminoácido não natural fenilselenocisteìna |
-
2007
- 2007-09-20 EP EP07861356.9A patent/EP2052083B1/en not_active Not-in-force
- 2007-09-20 AU AU2007297610A patent/AU2007297610A1/en not_active Abandoned
- 2007-09-20 PL PL07861356T patent/PL2052083T3/pl unknown
- 2007-09-20 KR KR1020097007574A patent/KR20090074765A/ko not_active Ceased
- 2007-09-20 RU RU2009110152/10A patent/RU2009110152A/ru not_active Application Discontinuation
- 2007-09-20 BR BRPI0716963-9A patent/BRPI0716963A2/pt not_active IP Right Cessation
- 2007-09-20 WO PCT/US2007/020459 patent/WO2008036392A2/en not_active Ceased
- 2007-09-20 PT PT78613569T patent/PT2052083E/pt unknown
- 2007-09-20 CN CN200780035189.6A patent/CN101516901B/zh not_active Expired - Fee Related
- 2007-09-20 ES ES07861356.9T patent/ES2456331T3/es active Active
- 2007-09-20 MX MX2009002987A patent/MX2009002987A/es not_active Application Discontinuation
- 2007-09-20 US US11/903,499 patent/US8114627B2/en active Active
- 2007-09-20 CA CA002663052A patent/CA2663052A1/en not_active Abandoned
- 2007-09-20 US US12/311,169 patent/US8114652B2/en active Active
- 2007-09-20 JP JP2009529249A patent/JP5385143B2/ja not_active Expired - Fee Related
-
2009
- 2009-03-11 IL IL197531A patent/IL197531A0/en unknown
-
2011
- 2011-12-14 US US13/326,143 patent/US8361770B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| US20090286279A1 (en) | 2009-11-19 |
| PT2052083E (pt) | 2014-04-10 |
| WO2008036392A2 (en) | 2008-03-27 |
| EP2052083A4 (en) | 2010-03-24 |
| WO2008036392A9 (en) | 2008-05-22 |
| PL2052083T3 (pl) | 2014-06-30 |
| MX2009002987A (es) | 2009-04-28 |
| US8361770B2 (en) | 2013-01-29 |
| AU2007297610A1 (en) | 2008-03-27 |
| US20080113407A1 (en) | 2008-05-15 |
| JP5385143B2 (ja) | 2014-01-08 |
| US8114627B2 (en) | 2012-02-14 |
| JP2010504096A (ja) | 2010-02-12 |
| RU2009110152A (ru) | 2010-10-27 |
| IL197531A0 (en) | 2009-12-24 |
| EP2052083A2 (en) | 2009-04-29 |
| US20120184018A1 (en) | 2012-07-19 |
| CN101516901B (zh) | 2014-01-08 |
| BRPI0716963A2 (pt) | 2013-11-05 |
| EP2052083B1 (en) | 2014-01-08 |
| WO2008036392A3 (en) | 2008-12-31 |
| CA2663052A1 (en) | 2008-03-27 |
| CN101516901A (zh) | 2009-08-26 |
| US8114652B2 (en) | 2012-02-14 |
| KR20090074765A (ko) | 2009-07-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2456331T3 (es) | Expresión genéticamente programada de proteínas sulfatadas selectivamente en eubacterias | |
| ES2301099T3 (es) | Composiciones de parejas ortogonales lisil-arnt y aminoacil-arnt sintetasa y usos de las mismas. | |
| ES2432391T3 (es) | Sistema para la expresión de componentes de traducción ortogonales en células huésped eubacterianas | |
| US8394605B2 (en) | Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine | |
| ES2396712T3 (es) | Incorporación específica para sitio de aminoácidos activos por rédox en proteínas | |
| ES2519444T3 (es) | Incorporación in vivo de alquinil aminoácidos a proteínas en eubacterias | |
| US7807411B2 (en) | Genetically encoded fluorescent coumarin amino acids | |
| ES2348487T3 (es) | Composiciones de parejas aminoacil-trna sintetasa y trna-lisil ortogonales y usos de las mismas. |