ES2333422T3 - Sintesis de glicoproteinas. - Google Patents
Sintesis de glicoproteinas. Download PDFInfo
- Publication number
- ES2333422T3 ES2333422T3 ES03777634T ES03777634T ES2333422T3 ES 2333422 T3 ES2333422 T3 ES 2333422T3 ES 03777634 T ES03777634 T ES 03777634T ES 03777634 T ES03777634 T ES 03777634T ES 2333422 T3 ES2333422 T3 ES 2333422T3
- Authority
- ES
- Spain
- Prior art keywords
- residue
- amino acid
- trna
- protein
- unnatural amino
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 45
- 238000003786 synthesis reaction Methods 0.000 title claims description 42
- 150000001413 amino acids Chemical class 0.000 claims abstract description 423
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 315
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 262
- 238000000034 method Methods 0.000 claims abstract description 180
- 102000003886 Glycoproteins Human genes 0.000 claims abstract description 77
- 108090000288 Glycoproteins Proteins 0.000 claims abstract description 77
- 150000001720 carbohydrates Chemical group 0.000 claims abstract description 59
- 235000000346 sugar Nutrition 0.000 claims abstract description 49
- 238000001727 in vivo Methods 0.000 claims abstract description 38
- 229940024606 amino acid Drugs 0.000 claims description 428
- 108020004705 Codon Proteins 0.000 claims description 165
- 210000004027 cell Anatomy 0.000 claims description 154
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 144
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 132
- 229920001184 polypeptide Polymers 0.000 claims description 123
- 108090000364 Ligases Proteins 0.000 claims description 98
- 102000003960 Ligases Human genes 0.000 claims description 96
- 108091033319 polynucleotide Proteins 0.000 claims description 89
- 102000040430 polynucleotide Human genes 0.000 claims description 89
- 239000002157 polynucleotide Substances 0.000 claims description 88
- 150000007523 nucleic acids Chemical class 0.000 claims description 73
- 102000039446 nucleic acids Human genes 0.000 claims description 68
- 108020004707 nucleic acids Proteins 0.000 claims description 68
- -1 threonine amino acid Chemical class 0.000 claims description 64
- 102000051366 Glycosyltransferases Human genes 0.000 claims description 49
- 108700023372 Glycosyltransferases Proteins 0.000 claims description 49
- 238000010348 incorporation Methods 0.000 claims description 47
- 229960001153 serine Drugs 0.000 claims description 46
- 238000013519 translation Methods 0.000 claims description 42
- 125000000468 ketone group Chemical group 0.000 claims description 38
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 claims description 32
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 claims description 32
- 238000006243 chemical reaction Methods 0.000 claims description 31
- 239000013598 vector Substances 0.000 claims description 29
- 239000004473 Threonine Substances 0.000 claims description 28
- 229960002898 threonine Drugs 0.000 claims description 28
- 239000000203 mixture Substances 0.000 claims description 27
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 claims description 25
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 claims description 25
- 230000000269 nucleophilic effect Effects 0.000 claims description 25
- 230000000694 effects Effects 0.000 claims description 24
- 150000001299 aldehydes Chemical group 0.000 claims description 23
- 239000000047 product Substances 0.000 claims description 23
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical group CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 claims description 22
- 239000002253 acid Substances 0.000 claims description 22
- 238000009739 binding Methods 0.000 claims description 21
- 239000003153 chemical reaction reagent Substances 0.000 claims description 18
- 108060003306 Galactosyltransferase Proteins 0.000 claims description 17
- 102000030902 Galactosyltransferase Human genes 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 17
- 230000000295 complement effect Effects 0.000 claims description 16
- 229930194542 Keto Natural products 0.000 claims description 15
- 150000002482 oligosaccharides Polymers 0.000 claims description 14
- 125000000266 alpha-aminoacyl group Chemical group 0.000 claims description 13
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 claims description 12
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 claims description 11
- 239000007795 chemical reaction product Substances 0.000 claims description 11
- 102000004357 Transferases Human genes 0.000 claims description 10
- 108090000992 Transferases Proteins 0.000 claims description 10
- 150000004676 glycans Polymers 0.000 claims description 10
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 claims description 9
- 150000001408 amides Chemical class 0.000 claims description 9
- 150000007857 hydrazones Chemical class 0.000 claims description 9
- 108091070501 miRNA Proteins 0.000 claims description 9
- 230000002829 reductive effect Effects 0.000 claims description 9
- 102000003838 Sialyltransferases Human genes 0.000 claims description 8
- 108090000141 Sialyltransferases Proteins 0.000 claims description 8
- LFTYTUAZOPRMMI-CFRASDGPSA-N UDP-N-acetyl-alpha-D-glucosamine Chemical group O1[C@H](CO)[C@@H](O)[C@H](O)[C@@H](NC(=O)C)[C@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-CFRASDGPSA-N 0.000 claims description 8
- LFTYTUAZOPRMMI-UHFFFAOYSA-N UNPD164450 Natural products O1C(CO)C(O)C(O)C(NC(=O)C)C1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-UHFFFAOYSA-N 0.000 claims description 8
- XEVRDFDBXJMZFG-UHFFFAOYSA-N carbonyl dihydrazine Chemical compound NNC(=O)NN XEVRDFDBXJMZFG-UHFFFAOYSA-N 0.000 claims description 8
- 125000003729 nucleotide group Chemical group 0.000 claims description 8
- DUIOPKIIICUYRZ-UHFFFAOYSA-N semicarbazide Chemical compound NNC(N)=O DUIOPKIIICUYRZ-UHFFFAOYSA-N 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 8
- 241000238631 Hexapoda Species 0.000 claims description 7
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 7
- 230000001580 bacterial effect Effects 0.000 claims description 7
- 239000002773 nucleotide Substances 0.000 claims description 7
- 238000000746 purification Methods 0.000 claims description 7
- MVMSCBBUIHUTGJ-UHFFFAOYSA-N 10108-97-1 Natural products C1=2NC(N)=NC(=O)C=2N=CN1C(C(C1O)O)OC1COP(O)(=O)OP(O)(=O)OC1OC(CO)C(O)C(O)C1O MVMSCBBUIHUTGJ-UHFFFAOYSA-N 0.000 claims description 6
- MVMSCBBUIHUTGJ-GDJBGNAASA-N GDP-alpha-D-mannose Chemical compound C([C@H]1O[C@H]([C@@H]([C@@H]1O)O)N1C=2N=C(NC(=O)C=2N=C1)N)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@@H]1O MVMSCBBUIHUTGJ-GDJBGNAASA-N 0.000 claims description 6
- 102100023315 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Human genes 0.000 claims description 6
- 108010056664 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyltransferase Proteins 0.000 claims description 6
- 239000013604 expression vector Substances 0.000 claims description 6
- 108010089072 Dolichyl-diphosphooligosaccharide-protein glycotransferase Proteins 0.000 claims description 5
- 108010019236 Fucosyltransferases Proteins 0.000 claims description 5
- 102000006471 Fucosyltransferases Human genes 0.000 claims description 5
- 108010055629 Glucosyltransferases Proteins 0.000 claims description 5
- 102000000340 Glucosyltransferases Human genes 0.000 claims description 5
- 108010092364 Glucuronosyltransferase Proteins 0.000 claims description 5
- 102000016354 Glucuronosyltransferase Human genes 0.000 claims description 5
- 108010087568 Mannosyltransferases Proteins 0.000 claims description 5
- 102000006722 Mannosyltransferases Human genes 0.000 claims description 5
- 108010046220 N-Acetylgalactosaminyltransferases Proteins 0.000 claims description 5
- 102000007524 N-Acetylgalactosaminyltransferases Human genes 0.000 claims description 5
- 125000000217 alkyl group Chemical group 0.000 claims description 5
- 229940097043 glucuronic acid Drugs 0.000 claims description 5
- 150000002923 oximes Chemical class 0.000 claims description 5
- 101001009270 Pasteurella multocida N-acetylgalactosaminyl-proteoglycan 3-beta-glucuronosyltransferase Proteins 0.000 claims description 4
- LJTFFORYSFGNCT-UHFFFAOYSA-N Thiocarbohydrazide Chemical compound NNC(=S)NN LJTFFORYSFGNCT-UHFFFAOYSA-N 0.000 claims description 4
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 4
- BRWIZMBXBAOCCF-UHFFFAOYSA-N hydrazinecarbothioamide Chemical compound NNC(N)=S BRWIZMBXBAOCCF-UHFFFAOYSA-N 0.000 claims description 4
- 150000007659 semicarbazones Chemical class 0.000 claims description 4
- SRVJKTDHMYAMHA-WUXMJOGZSA-N thioacetazone Chemical compound CC(=O)NC1=CC=C(\C=N\NC(N)=S)C=C1 SRVJKTDHMYAMHA-WUXMJOGZSA-N 0.000 claims description 4
- 241000233866 Fungi Species 0.000 claims description 3
- 108010046068 N-Acetyllactosamine Synthase Proteins 0.000 claims description 3
- 239000013592 cell lysate Substances 0.000 claims description 3
- 210000005253 yeast cell Anatomy 0.000 claims description 3
- 101710098620 Alpha-1,2-fucosyltransferase Proteins 0.000 claims description 2
- 108010001671 galactoside 3-fucosyltransferase Proteins 0.000 claims description 2
- 210000004962 mammalian cell Anatomy 0.000 claims description 2
- 150000004804 polysaccharides Polymers 0.000 claims 4
- HSCJRCZFDFQWRP-ABVWGUQPSA-N UDP-alpha-D-galactose Chemical group O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-ABVWGUQPSA-N 0.000 claims 2
- 108010083651 3-galactosyl-N-acetylglucosaminide 4-alpha-L-fucosyltransferase Proteins 0.000 claims 1
- 239000006166 lysate Substances 0.000 claims 1
- 238000000338 in vitro Methods 0.000 abstract description 26
- 150000008163 sugars Chemical class 0.000 abstract description 13
- 235000001014 amino acid Nutrition 0.000 description 396
- 235000018102 proteins Nutrition 0.000 description 241
- 108020004566 Transfer RNA Proteins 0.000 description 123
- 125000000837 carbohydrate group Chemical group 0.000 description 118
- 241000588724 Escherichia coli Species 0.000 description 54
- 230000014616 translation Effects 0.000 description 40
- ZXSBHXZKWRIEIA-JTQLQIEISA-N (2s)-3-(4-acetylphenyl)-2-azaniumylpropanoate Chemical compound CC(=O)C1=CC=C(C[C@H](N)C(O)=O)C=C1 ZXSBHXZKWRIEIA-JTQLQIEISA-N 0.000 description 36
- 101710146427 Probable tyrosine-tRNA ligase, cytoplasmic Proteins 0.000 description 34
- 101710107268 Tyrosine-tRNA ligase, mitochondrial Proteins 0.000 description 34
- 239000013612 plasmid Substances 0.000 description 32
- 238000009396 hybridization Methods 0.000 description 31
- 102000018378 Tyrosine-tRNA ligase Human genes 0.000 description 30
- 108020005038 Terminator Codon Proteins 0.000 description 29
- 102000004190 Enzymes Human genes 0.000 description 28
- 108090000790 Enzymes Proteins 0.000 description 28
- 229940088598 enzyme Drugs 0.000 description 28
- 230000002163 immunogen Effects 0.000 description 28
- 238000012360 testing method Methods 0.000 description 28
- 230000014509 gene expression Effects 0.000 description 26
- 239000000523 sample Substances 0.000 description 26
- 241000894006 Bacteria Species 0.000 description 25
- 150000001875 compounds Chemical class 0.000 description 24
- 239000003550 marker Substances 0.000 description 24
- 108020004414 DNA Proteins 0.000 description 22
- 125000003275 alpha amino acid group Chemical group 0.000 description 22
- 229960005091 chloramphenicol Drugs 0.000 description 22
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 22
- 238000002703 mutagenesis Methods 0.000 description 21
- 231100000350 mutagenesis Toxicity 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 20
- 230000002068 genetic effect Effects 0.000 description 20
- 238000004128 high performance liquid chromatography Methods 0.000 description 17
- 230000035772 mutation Effects 0.000 description 17
- 239000011541 reaction mixture Substances 0.000 description 17
- 238000007792 addition Methods 0.000 description 16
- 238000006206 glycosylation reaction Methods 0.000 description 16
- 238000006467 substitution reaction Methods 0.000 description 16
- 241000196324 Embryophyta Species 0.000 description 15
- 241000203407 Methanocaldococcus jannaschii Species 0.000 description 15
- 230000001965 increasing effect Effects 0.000 description 15
- 238000004519 manufacturing process Methods 0.000 description 15
- 239000002609 medium Substances 0.000 description 15
- 239000000243 solution Substances 0.000 description 15
- 239000000758 substrate Substances 0.000 description 15
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 14
- 230000013595 glycosylation Effects 0.000 description 14
- 238000000926 separation method Methods 0.000 description 14
- 239000000126 substance Substances 0.000 description 14
- 231100000331 toxic Toxicity 0.000 description 14
- 230000002588 toxic effect Effects 0.000 description 14
- 235000002374 tyrosine Nutrition 0.000 description 14
- 108010016529 Bacillus amyloliquefaciens ribonuclease Proteins 0.000 description 13
- 229960004441 tyrosine Drugs 0.000 description 13
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 12
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 12
- 108091060545 Nonsense suppressor Proteins 0.000 description 12
- 230000008859 change Effects 0.000 description 12
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 12
- 238000006722 reduction reaction Methods 0.000 description 12
- 238000005406 washing Methods 0.000 description 12
- 108020005098 Anticodon Proteins 0.000 description 11
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 11
- 239000000872 buffer Substances 0.000 description 11
- 238000004949 mass spectrometry Methods 0.000 description 11
- 238000002360 preparation method Methods 0.000 description 11
- 230000009467 reduction Effects 0.000 description 11
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 11
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 11
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 11
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 10
- PCLIMKBDDGJMGD-UHFFFAOYSA-N N-bromosuccinimide Chemical compound BrN1C(=O)CCC1=O PCLIMKBDDGJMGD-UHFFFAOYSA-N 0.000 description 10
- USAZACJQJDHAJH-KDEXOMDGSA-N [[(2r,3s,4r,5s)-5-(2,4-dioxo-1h-pyrimidin-6-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2r,3r,4s,5r,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl] hydrogen phosphate Chemical group O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](C=2NC(=O)NC(=O)C=2)O1 USAZACJQJDHAJH-KDEXOMDGSA-N 0.000 description 10
- 238000003018 immunoassay Methods 0.000 description 10
- 239000012528 membrane Substances 0.000 description 10
- 230000009257 reactivity Effects 0.000 description 10
- 239000007787 solid Substances 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 9
- 241000206602 Eukaryota Species 0.000 description 9
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 9
- 229930182830 galactose Natural products 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 229920001542 oligosaccharide Polymers 0.000 description 9
- 235000008729 phenylalanine Nutrition 0.000 description 9
- 230000009145 protein modification Effects 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- HKAVADYDPYUPRD-UHFFFAOYSA-N 1h-pyrazine-2-thione Chemical compound SC1=CN=CC=N1 HKAVADYDPYUPRD-UHFFFAOYSA-N 0.000 description 8
- WHUUTDBJXJRKMK-GSVOUGTGSA-N D-glutamic acid Chemical compound OC(=O)[C@H](N)CCC(O)=O WHUUTDBJXJRKMK-GSVOUGTGSA-N 0.000 description 8
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 8
- 239000000370 acceptor Substances 0.000 description 8
- 230000003115 biocidal effect Effects 0.000 description 8
- 239000003795 chemical substances by application Substances 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 230000002255 enzymatic effect Effects 0.000 description 8
- 125000000404 glutamine group Chemical class N[C@@H](CCC(N)=O)C(=O)* 0.000 description 8
- 238000002372 labelling Methods 0.000 description 8
- 229930182817 methionine Natural products 0.000 description 8
- 229960005190 phenylalanine Drugs 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000001629 suppression Effects 0.000 description 8
- 230000001225 therapeutic effect Effects 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 7
- 244000105975 Antidesma platyphyllum Species 0.000 description 7
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 7
- 108010016626 Dipeptides Proteins 0.000 description 7
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 7
- 239000004472 Lysine Substances 0.000 description 7
- 241000700605 Viruses Species 0.000 description 7
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 7
- 229960000723 ampicillin Drugs 0.000 description 7
- 230000001851 biosynthetic effect Effects 0.000 description 7
- 238000005859 coupling reaction Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 235000009424 haa Nutrition 0.000 description 7
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 7
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 7
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 7
- 231100000419 toxicity Toxicity 0.000 description 7
- 230000001988 toxicity Effects 0.000 description 7
- 230000032258 transport Effects 0.000 description 7
- IBCKYXVMEMSMQM-JTQLQIEISA-N (2s)-3-(3-acetylphenyl)-2-aminopropanoic acid Chemical compound CC(=O)C1=CC=CC(C[C@H](N)C(O)=O)=C1 IBCKYXVMEMSMQM-JTQLQIEISA-N 0.000 description 6
- 238000005160 1H NMR spectroscopy Methods 0.000 description 6
- 229940126062 Compound A Drugs 0.000 description 6
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 6
- 239000007995 HEPES buffer Substances 0.000 description 6
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 6
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 6
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 6
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 6
- 238000001042 affinity chromatography Methods 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 239000011616 biotin Substances 0.000 description 6
- 229960002685 biotin Drugs 0.000 description 6
- 235000020958 biotin Nutrition 0.000 description 6
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 6
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 6
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 125000000524 functional group Chemical group 0.000 description 6
- 235000013922 glutamic acid Nutrition 0.000 description 6
- 239000004220 glutamic acid Substances 0.000 description 6
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 6
- 235000004554 glutamine Nutrition 0.000 description 6
- 239000001257 hydrogen Substances 0.000 description 6
- 229910052739 hydrogen Inorganic materials 0.000 description 6
- 150000002500 ions Chemical class 0.000 description 6
- 229930027917 kanamycin Natural products 0.000 description 6
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 6
- 229960000318 kanamycin Drugs 0.000 description 6
- 229930182823 kanamycin A Natural products 0.000 description 6
- 150000002576 ketones Chemical class 0.000 description 6
- 229940060155 neuac Drugs 0.000 description 6
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Substances N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- 210000000056 organ Anatomy 0.000 description 6
- 238000005215 recombination Methods 0.000 description 6
- 230000006798 recombination Effects 0.000 description 6
- 239000002904 solvent Substances 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 5
- 108090000204 Dipeptidase 1 Proteins 0.000 description 5
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 5
- 102000002068 Glycopeptides Human genes 0.000 description 5
- 108010015899 Glycopeptides Proteins 0.000 description 5
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 5
- 108090001090 Lectins Proteins 0.000 description 5
- 102000004856 Lectins Human genes 0.000 description 5
- 108010021466 Mutant Proteins Proteins 0.000 description 5
- 102000008300 Mutant Proteins Human genes 0.000 description 5
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 5
- 102000035195 Peptidases Human genes 0.000 description 5
- 108091005804 Peptidases Proteins 0.000 description 5
- 108091032917 Transfer-messenger RNA Proteins 0.000 description 5
- 239000012298 atmosphere Substances 0.000 description 5
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 5
- 235000014633 carbohydrates Nutrition 0.000 description 5
- 230000003197 catalytic effect Effects 0.000 description 5
- 230000010261 cell growth Effects 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 239000002523 lectin Substances 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 5
- 239000002853 nucleic acid probe Substances 0.000 description 5
- 230000037361 pathway Effects 0.000 description 5
- 230000004481 post-translational protein modification Effects 0.000 description 5
- 102000005962 receptors Human genes 0.000 description 5
- 108020003175 receptors Proteins 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 210000002966 serum Anatomy 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 125000001424 substituent group Chemical group 0.000 description 5
- 239000003053 toxin Substances 0.000 description 5
- 231100000765 toxin Toxicity 0.000 description 5
- 108700012359 toxins Proteins 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- DTQVDTLACAAQTR-UHFFFAOYSA-N trifluoroacetic acid Substances OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 5
- 241001515965 unidentified phage Species 0.000 description 5
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 4
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 4
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 4
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 4
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 4
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 4
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 4
- 241000205062 Halobacterium Species 0.000 description 4
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 4
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 4
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 4
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 4
- 229910021380 Manganese Chloride Inorganic materials 0.000 description 4
- GLFNIEUTAYBVOC-UHFFFAOYSA-L Manganese chloride Chemical compound Cl[Mn]Cl GLFNIEUTAYBVOC-UHFFFAOYSA-L 0.000 description 4
- SQVRNKJHWKZAKO-LUWBGTNYSA-N N-acetylneuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)CC(O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-LUWBGTNYSA-N 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 108020004511 Recombinant DNA Proteins 0.000 description 4
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 4
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 102100025336 Tyrosine-tRNA ligase, mitochondrial Human genes 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 4
- 150000001412 amines Chemical class 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 235000009697 arginine Nutrition 0.000 description 4
- 125000003118 aryl group Chemical group 0.000 description 4
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 230000000052 comparative effect Effects 0.000 description 4
- 230000009260 cross reactivity Effects 0.000 description 4
- 239000013078 crystal Substances 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 108020001096 dihydrofolate reductase Proteins 0.000 description 4
- 239000003480 eluent Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 150000002148 esters Chemical class 0.000 description 4
- 229940126864 fibroblast growth factor Drugs 0.000 description 4
- 238000002189 fluorescence spectrum Methods 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 230000002209 hydrophobic effect Effects 0.000 description 4
- 150000002443 hydroxylamines Chemical class 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000011005 laboratory method Methods 0.000 description 4
- 239000011565 manganese chloride Substances 0.000 description 4
- 235000002867 manganese chloride Nutrition 0.000 description 4
- 235000013336 milk Nutrition 0.000 description 4
- 239000008267 milk Substances 0.000 description 4
- 210000004080 milk Anatomy 0.000 description 4
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical class CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 238000007899 nucleic acid hybridization Methods 0.000 description 4
- 239000002953 phosphate buffered saline Substances 0.000 description 4
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 4
- 239000000843 powder Substances 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 125000001500 prolyl group Chemical class [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 4
- 238000004007 reversed phase HPLC Methods 0.000 description 4
- 229910052709 silver Inorganic materials 0.000 description 4
- 239000004332 silver Substances 0.000 description 4
- 238000002741 site-directed mutagenesis Methods 0.000 description 4
- 239000007790 solid phase Substances 0.000 description 4
- 239000007858 starting material Substances 0.000 description 4
- 150000003573 thiols Chemical class 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 238000012800 visualization Methods 0.000 description 4
- DQJCDTNMLBYVAY-ZXXIYAEKSA-N (2S,5R,10R,13R)-16-{[(2R,3S,4R,5R)-3-{[(2S,3R,4R,5S,6R)-3-acetamido-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy}-5-(ethylamino)-6-hydroxy-2-(hydroxymethyl)oxan-4-yl]oxy}-5-(4-aminobutyl)-10-carbamoyl-2,13-dimethyl-4,7,12,15-tetraoxo-3,6,11,14-tetraazaheptadecan-1-oic acid Chemical compound NCCCC[C@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CC[C@H](C(N)=O)NC(=O)[C@@H](C)NC(=O)C(C)O[C@@H]1[C@@H](NCC)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O)[C@@H](CO)O1 DQJCDTNMLBYVAY-ZXXIYAEKSA-N 0.000 description 3
- XTXGLOBWOMUGQB-VIFPVBQESA-N (2s)-2-azaniumyl-3-(3-methoxyphenyl)propanoate Chemical compound COC1=CC=CC(C[C@H](N)C(O)=O)=C1 XTXGLOBWOMUGQB-VIFPVBQESA-N 0.000 description 3
- 238000001644 13C nuclear magnetic resonance spectroscopy Methods 0.000 description 3
- CMUHFUGDYMFHEI-QMMMGPOBSA-N 4-amino-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-QMMMGPOBSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 241000203069 Archaea Species 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 3
- 101710196859 Dipeptide-binding protein Proteins 0.000 description 3
- 102100031939 Erythropoietin Human genes 0.000 description 3
- 241001302160 Escherichia coli str. K-12 substr. DH10B Species 0.000 description 3
- 102000003972 Fibroblast growth factor 7 Human genes 0.000 description 3
- 108090000385 Fibroblast growth factor 7 Proteins 0.000 description 3
- 102100024977 Glutamine-tRNA ligase Human genes 0.000 description 3
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 3
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- 102100034221 Growth-regulated alpha protein Human genes 0.000 description 3
- 101000611183 Homo sapiens Tumor necrosis factor Proteins 0.000 description 3
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 3
- JZKXXXDKRQWDET-QMMMGPOBSA-N L-m-tyrosine Chemical class OC(=O)[C@@H](N)CC1=CC=CC(O)=C1 JZKXXXDKRQWDET-QMMMGPOBSA-N 0.000 description 3
- ZFOMKMMPBOQKMC-KXUCPTDWSA-N L-pyrrolysine Chemical compound C[C@@H]1CC=N[C@H]1C(=O)NCCCC[C@H]([NH3+])C([O-])=O ZFOMKMMPBOQKMC-KXUCPTDWSA-N 0.000 description 3
- 108700005090 Lethal Genes Proteins 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- OVRNDRQMDRJTHS-KEWYIRBNSA-N N-acetyl-D-galactosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-KEWYIRBNSA-N 0.000 description 3
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 3
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 3
- 108020004485 Nonsense Codon Proteins 0.000 description 3
- 108010079246 OMPA outer membrane proteins Proteins 0.000 description 3
- 102000013275 Somatomedins Human genes 0.000 description 3
- 239000004098 Tetracycline Substances 0.000 description 3
- 108060008683 Tumor Necrosis Factor Receptor Proteins 0.000 description 3
- 102100040247 Tumor necrosis factor Human genes 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 230000009056 active transport Effects 0.000 description 3
- 235000008206 alpha-amino acids Nutrition 0.000 description 3
- 230000006229 amino acid addition Effects 0.000 description 3
- 229940093740 amino acid and derivative Drugs 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 125000002344 aminooxy group Chemical group [H]N([H])O[*] 0.000 description 3
- 150000008064 anhydrides Chemical class 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- AGEZXYOZHKGVCM-UHFFFAOYSA-N benzyl bromide Chemical class BrCC1=CC=CC=C1 AGEZXYOZHKGVCM-UHFFFAOYSA-N 0.000 description 3
- 102000006635 beta-lactamase Human genes 0.000 description 3
- 150000001719 carbohydrate derivatives Chemical class 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 101150055766 cat gene Proteins 0.000 description 3
- 230000000723 chemosensory effect Effects 0.000 description 3
- 230000035605 chemotaxis Effects 0.000 description 3
- WHTVZRBIWZFKQO-UHFFFAOYSA-N chloroquine Chemical compound ClC1=CC=C2C(NC(C)CCCN(CC)CC)=CC=NC2=C1 WHTVZRBIWZFKQO-UHFFFAOYSA-N 0.000 description 3
- 229940125782 compound 2 Drugs 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 150000002016 disaccharides Chemical class 0.000 description 3
- 241001493065 dsRNA viruses Species 0.000 description 3
- 238000010828 elution Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 238000007429 general method Methods 0.000 description 3
- 108010051239 glutaminyl-tRNA synthetase Proteins 0.000 description 3
- 239000005090 green fluorescent protein Substances 0.000 description 3
- 239000003102 growth factor Substances 0.000 description 3
- 230000007062 hydrolysis Effects 0.000 description 3
- 238000006460 hydrolysis reaction Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 238000001819 mass spectrum Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000004060 metabolic process Effects 0.000 description 3
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 3
- 238000007069 methylation reaction Methods 0.000 description 3
- 230000002906 microbiologic effect Effects 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 150000002772 monosaccharides Chemical class 0.000 description 3
- 229950006780 n-acetylglucosamine Drugs 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- CERZMXAJYMMUDR-UHFFFAOYSA-N neuraminic acid Natural products NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO CERZMXAJYMMUDR-UHFFFAOYSA-N 0.000 description 3
- 231100000252 nontoxic Toxicity 0.000 description 3
- 230000003000 nontoxic effect Effects 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- 239000008363 phosphate buffer Substances 0.000 description 3
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 3
- 235000013930 proline Nutrition 0.000 description 3
- 238000004445 quantitative analysis Methods 0.000 description 3
- 238000010992 reflux Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 125000005629 sialic acid group Chemical class 0.000 description 3
- 108010004034 stable plasma protein solution Proteins 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000004083 survival effect Effects 0.000 description 3
- 229930101283 tetracycline Natural products 0.000 description 3
- 229960002180 tetracycline Drugs 0.000 description 3
- 235000019364 tetracycline Nutrition 0.000 description 3
- 150000003522 tetracyclines Chemical class 0.000 description 3
- 238000004809 thin layer chromatography Methods 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 3
- 102000003298 tumor necrosis factor receptor Human genes 0.000 description 3
- 238000011179 visual inspection Methods 0.000 description 3
- 239000002699 waste material Substances 0.000 description 3
- OZAIFHULBGXAKX-UHFFFAOYSA-N 2,2'-azo-bis-isobutyronitrile Substances N#CC(C)(C)N=NC(C)(C)C#N OZAIFHULBGXAKX-UHFFFAOYSA-N 0.000 description 2
- BRARRAHGNDUELT-UHFFFAOYSA-N 3-hydroxypicolinic acid Chemical compound OC(=O)C1=NC=CC=C1O BRARRAHGNDUELT-UHFFFAOYSA-N 0.000 description 2
- XZKIHKMTEMTJQX-UHFFFAOYSA-N 4-Nitrophenyl Phosphate Chemical compound OP(O)(=O)OC1=CC=C([N+]([O-])=O)C=C1 XZKIHKMTEMTJQX-UHFFFAOYSA-N 0.000 description 2
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- OZDNDGXASTWERN-CTNGQTDRSA-N Apovincamine Chemical compound C1=CC=C2C(CCN3CCC4)=C5[C@@H]3[C@]4(CC)C=C(C(=O)OC)N5C2=C1 OZDNDGXASTWERN-CTNGQTDRSA-N 0.000 description 2
- 241000205042 Archaeoglobus fulgidus Species 0.000 description 2
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 101000942694 Bos taurus Clusterin Proteins 0.000 description 2
- 102100021943 C-C motif chemokine 2 Human genes 0.000 description 2
- 101710155857 C-C motif chemokine 2 Proteins 0.000 description 2
- 108010029697 CD40 Ligand Proteins 0.000 description 2
- 102100032937 CD40 ligand Human genes 0.000 description 2
- TXCIAUNLDRJGJZ-UHFFFAOYSA-N CMP-N-acetyl neuraminic acid Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-UHFFFAOYSA-N 0.000 description 2
- TXCIAUNLDRJGJZ-BILDWYJOSA-N CMP-N-acetyl-beta-neuraminic acid Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@]1(C(O)=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-BILDWYJOSA-N 0.000 description 2
- 101100228196 Caenorhabditis elegans gly-4 gene Proteins 0.000 description 2
- 101100177112 Caenorhabditis elegans his-70 gene Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 241000557626 Corvus corax Species 0.000 description 2
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 2
- OKKJLVBELUTLKV-MZCSYVLQSA-N Deuterated methanol Chemical compound [2H]OC([2H])([2H])[2H] OKKJLVBELUTLKV-MZCSYVLQSA-N 0.000 description 2
- 101710126486 Envelope glycoprotein D Proteins 0.000 description 2
- 101710126496 Envelope glycoprotein I Proteins 0.000 description 2
- 241001125671 Eretmochelys imbricata Species 0.000 description 2
- 108090000371 Esterases Proteins 0.000 description 2
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 2
- 238000004252 FT/ICR mass spectrometry Methods 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 241000219726 Griffonia simplicifolia Species 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 241000204933 Haloferax volcanii Species 0.000 description 2
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 2
- 102100021866 Hepatocyte growth factor Human genes 0.000 description 2
- NLDMNSXOCDLTTB-UHFFFAOYSA-N Heterophylliin A Natural products O1C2COC(=O)C3=CC(O)=C(O)C(O)=C3C3=C(O)C(O)=C(O)C=C3C(=O)OC2C(OC(=O)C=2C=C(O)C(O)=C(O)C=2)C(O)C1OC(=O)C1=CC(O)=C(O)C(O)=C1 NLDMNSXOCDLTTB-UHFFFAOYSA-N 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- 101000668058 Infectious salmon anemia virus (isolate Atlantic salmon/Norway/810/9/99) RNA-directed RNA polymerase catalytic subunit Proteins 0.000 description 2
- 108010050904 Interferons Proteins 0.000 description 2
- 102000014150 Interferons Human genes 0.000 description 2
- 108010002352 Interleukin-1 Proteins 0.000 description 2
- 108010002350 Interleukin-2 Proteins 0.000 description 2
- 108090001007 Interleukin-8 Proteins 0.000 description 2
- 108010063738 Interleukins Proteins 0.000 description 2
- 102000015696 Interleukins Human genes 0.000 description 2
- CLRLHXKNIYJWAW-UHFFFAOYSA-N KDN Natural products OCC(O)C(O)C1OC(O)(C(O)=O)CC(O)C1O CLRLHXKNIYJWAW-UHFFFAOYSA-N 0.000 description 2
- 102100020880 Kit ligand Human genes 0.000 description 2
- WTDRDQBEARUVNC-LURJTMIESA-N L-DOPA Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-LURJTMIESA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ZKZBPNGNEQAJSX-REOHCLBHSA-N L-selenocysteine Chemical compound [SeH]C[C@H](N)C(O)=O ZKZBPNGNEQAJSX-REOHCLBHSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 102000003820 Lipoxygenases Human genes 0.000 description 2
- 108090000128 Lipoxygenases Proteins 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241001529871 Methanococcus maripaludis Species 0.000 description 2
- 241000204641 Methanopyrus kandleri Species 0.000 description 2
- 241000205274 Methanosarcina mazei Species 0.000 description 2
- 241001302042 Methanothermobacter thermautotrophicus Species 0.000 description 2
- 101710151805 Mitochondrial intermediate peptidase 1 Proteins 0.000 description 2
- SQVRNKJHWKZAKO-PFQGKNLYSA-N N-acetyl-beta-neuraminic acid Chemical group CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-PFQGKNLYSA-N 0.000 description 2
- FDJKUWYYUZCUJX-UHFFFAOYSA-N N-glycolyl-beta-neuraminic acid Natural products OCC(O)C(O)C1OC(O)(C(O)=O)CC(O)C1NC(=O)CO FDJKUWYYUZCUJX-UHFFFAOYSA-N 0.000 description 2
- FDJKUWYYUZCUJX-KVNVFURPSA-N N-glycolylneuraminic acid Chemical group OC[C@H](O)[C@H](O)[C@@H]1O[C@](O)(C(O)=O)C[C@H](O)[C@H]1NC(=O)CO FDJKUWYYUZCUJX-KVNVFURPSA-N 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- GEYBMYRBIABFTA-VIFPVBQESA-N O-methyl-L-tyrosine Chemical compound COC1=CC=C(C[C@H](N)C(O)=O)C=C1 GEYBMYRBIABFTA-VIFPVBQESA-N 0.000 description 2
- OFBQJSOFQDEBGM-UHFFFAOYSA-N Pentane Chemical compound CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 241000736843 Pyrobaculum aerophilum Species 0.000 description 2
- 241000205156 Pyrococcus furiosus Species 0.000 description 2
- 241000522615 Pyrococcus horikoshii Species 0.000 description 2
- ASNFTDCKZKHJSW-REOHCLBHSA-N Quisqualic acid Chemical class OC(=O)[C@@H](N)CN1OC(=O)NC1=O ASNFTDCKZKHJSW-REOHCLBHSA-N 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 241000205091 Sulfolobus solfataricus Species 0.000 description 2
- 241000160715 Sulfolobus tokodaii Species 0.000 description 2
- 102000019197 Superoxide Dismutase Human genes 0.000 description 2
- 108010012715 Superoxide dismutase Proteins 0.000 description 2
- MUMGGOZAMZWBJJ-DYKIIFRCSA-N Testostosterone Chemical compound O=C1CC[C@]2(C)[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 MUMGGOZAMZWBJJ-DYKIIFRCSA-N 0.000 description 2
- 241000204673 Thermoplasma acidophilum Species 0.000 description 2
- 241000489996 Thermoplasma volcanium Species 0.000 description 2
- HEDRZPFGACZZDS-MICDWDOJSA-N Trichloro(2H)methane Chemical compound [2H]C(Cl)(Cl)Cl HEDRZPFGACZZDS-MICDWDOJSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000007259 addition reaction Methods 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 125000003172 aldehyde group Chemical group 0.000 description 2
- 125000003342 alkenyl group Chemical group 0.000 description 2
- 230000029936 alkylation Effects 0.000 description 2
- 238000005804 alkylation reaction Methods 0.000 description 2
- 125000000304 alkynyl group Chemical group 0.000 description 2
- 150000001371 alpha-amino acids Chemical class 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- OZDNDGXASTWERN-UHFFFAOYSA-N apovincamine Natural products C1=CC=C2C(CCN3CCC4)=C5C3C4(CC)C=C(C(=O)OC)N5C2=C1 OZDNDGXASTWERN-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 238000007630 basic procedure Methods 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical group NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 239000012267 brine Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005251 capillar electrophoresis Methods 0.000 description 2
- 238000012511 carbohydrate analysis Methods 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000030833 cell death Effects 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 230000009134 cell regulation Effects 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 102000006834 complement receptors Human genes 0.000 description 2
- 108010047295 complement receptors Proteins 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010511 deprotection reaction Methods 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- 238000000502 dialysis Methods 0.000 description 2
- 125000004177 diethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 2
- 239000001177 diphosphate Substances 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 238000002523 gelfiltration Methods 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000003262 industrial enzyme Substances 0.000 description 2
- 210000002074 inflammatory monocyte Anatomy 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 229940047124 interferons Drugs 0.000 description 2
- 229940047122 interleukins Drugs 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 2
- 235000019341 magnesium sulphate Nutrition 0.000 description 2
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000005497 microtitration Methods 0.000 description 2
- 239000003068 molecular probe Substances 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 239000012044 organic layer Substances 0.000 description 2
- 239000003960 organic solvent Substances 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 108010082406 peptide permease Proteins 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- XAMUDJHXFNRLCY-UHFFFAOYSA-N phenthoate Chemical compound CCOC(=O)C(SP(=S)(OC)OC)C1=CC=CC=C1 XAMUDJHXFNRLCY-UHFFFAOYSA-N 0.000 description 2
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 2
- 150000002994 phenylalanines Chemical class 0.000 description 2
- DTBNBXWJWCWCIK-UHFFFAOYSA-K phosphonatoenolpyruvate Chemical compound [O-]C(=O)C(=C)OP([O-])([O-])=O DTBNBXWJWCWCIK-UHFFFAOYSA-K 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 229920000570 polyether Polymers 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- 230000004853 protein function Effects 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- 238000007634 remodeling Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000007363 ring formation reaction Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 229940055619 selenocysteine Drugs 0.000 description 2
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 2
- 235000016491 selenocysteine Nutrition 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 239000007974 sodium acetate buffer Substances 0.000 description 2
- 235000017557 sodium bicarbonate Nutrition 0.000 description 2
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- HPALAKNZSZLMCH-UHFFFAOYSA-M sodium;chloride;hydrate Chemical compound O.[Na+].[Cl-] HPALAKNZSZLMCH-UHFFFAOYSA-M 0.000 description 2
- 108010068698 spleen exonuclease Proteins 0.000 description 2
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- VZGDMQKNWNREIO-UHFFFAOYSA-N tetrachloromethane Chemical compound ClC(Cl)(Cl)Cl VZGDMQKNWNREIO-UHFFFAOYSA-N 0.000 description 2
- 150000007970 thio esters Chemical group 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000006257 total synthesis reaction Methods 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- WTFXTQVDAKGDEY-UHFFFAOYSA-N (-)-chorismic acid Natural products OC1C=CC(C(O)=O)=CC1OC(=C)C(O)=O WTFXTQVDAKGDEY-UHFFFAOYSA-N 0.000 description 1
- ZJIFDEVVTPEXDL-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) hydrogen carbonate Chemical compound OC(=O)ON1C(=O)CCC1=O ZJIFDEVVTPEXDL-UHFFFAOYSA-N 0.000 description 1
- FQRURPFZTFUXEZ-MRVPVSSYSA-N (2s)-2,3,3,3-tetrafluoro-2-(n-fluoroanilino)propanoic acid Chemical compound OC(=O)[C@](F)(C(F)(F)F)N(F)C1=CC=CC=C1 FQRURPFZTFUXEZ-MRVPVSSYSA-N 0.000 description 1
- RWLSBXBFZHDHHX-VIFPVBQESA-N (2s)-2-(naphthalen-2-ylamino)propanoic acid Chemical compound C1=CC=CC2=CC(N[C@@H](C)C(O)=O)=CC=C21 RWLSBXBFZHDHHX-VIFPVBQESA-N 0.000 description 1
- YYTDJPUFAVPHQA-VKHMYHEASA-N (2s)-2-amino-3-(2,3,4,5,6-pentafluorophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=C(F)C(F)=C(F)C(F)=C1F YYTDJPUFAVPHQA-VKHMYHEASA-N 0.000 description 1
- PEMUHKUIQHFMTH-QMMMGPOBSA-N (2s)-2-amino-3-(4-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Br)C=C1 PEMUHKUIQHFMTH-QMMMGPOBSA-N 0.000 description 1
- NEMHIKRLROONTL-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(4-azidophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N=[N+]=[N-])C=C1 NEMHIKRLROONTL-QMMMGPOBSA-N 0.000 description 1
- BNIFSVVAHBLNTN-XKKUQSFHSA-N (2s)-4-amino-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-1-[(2s)-4-amino-2-[[2-[[(2s)-2-[[(2s)-2-[[(2s)-1-[(2s)-6-amino-2-[[(2s)-2-[[(2s)-2-[[(2s,3r)-2-amino-3-hydroxybutanoyl]amino]-4-methylsulfanylbutanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]hexan Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N1[C@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O)CCC1 BNIFSVVAHBLNTN-XKKUQSFHSA-N 0.000 description 1
- 108010052418 (N-(2-((4-((2-((4-(9-acridinylamino)phenyl)amino)-2-oxoethyl)amino)-4-oxobutyl)amino)-1-(1H-imidazol-4-ylmethyl)-1-oxoethyl)-6-(((-2-aminoethyl)amino)methyl)-2-pyridinecarboxamidato) iron(1+) Proteins 0.000 description 1
- WHTVZRBIWZFKQO-AWEZNQCLSA-N (S)-chloroquine Chemical compound ClC1=CC=C2C(N[C@@H](C)CCCN(CC)CC)=CC=NC2=C1 WHTVZRBIWZFKQO-AWEZNQCLSA-N 0.000 description 1
- RYHBNJHYFVUHQT-UHFFFAOYSA-N 1,4-Dioxane Chemical compound C1COCCO1 RYHBNJHYFVUHQT-UHFFFAOYSA-N 0.000 description 1
- YUDSXCHAAXYRGX-UHFFFAOYSA-N 1-(trifluoromethyl)diaziridine Chemical compound FC(F)(F)N1CN1 YUDSXCHAAXYRGX-UHFFFAOYSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- GVJXGCIPWAVXJP-UHFFFAOYSA-N 2,5-dioxo-1-oxoniopyrrolidine-3-sulfonate Chemical compound ON1C(=O)CC(S(O)(=O)=O)C1=O GVJXGCIPWAVXJP-UHFFFAOYSA-N 0.000 description 1
- JFTHBDBUVHRREF-UHFFFAOYSA-N 2-acetamidopropanedioic acid Chemical compound CC(=O)NC(C(O)=O)C(O)=O JFTHBDBUVHRREF-UHFFFAOYSA-N 0.000 description 1
- DJQYYYCQOZMCRC-UHFFFAOYSA-N 2-aminopropane-1,3-dithiol Chemical group SCC(N)CS DJQYYYCQOZMCRC-UHFFFAOYSA-N 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- 125000000981 3-amino-3-oxopropyl group Chemical group [H]C([*])([H])C([H])([H])C(=O)N([H])[H] 0.000 description 1
- JZRBSTONIYRNRI-VIFPVBQESA-N 3-methylphenylalanine Chemical compound CC1=CC=CC(C[C@H](N)C(O)=O)=C1 JZRBSTONIYRNRI-VIFPVBQESA-N 0.000 description 1
- IRZQDMYEJPNDEN-UHFFFAOYSA-N 3-phenyl-2-aminobutanoic acid Natural products OC(=O)C(N)C(C)C1=CC=CC=C1 IRZQDMYEJPNDEN-UHFFFAOYSA-N 0.000 description 1
- PZNQZSRPDOEBMS-QMMMGPOBSA-N 4-iodo-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(I)C=C1 PZNQZSRPDOEBMS-QMMMGPOBSA-N 0.000 description 1
- HYQXNCDBSALQLB-UHFFFAOYSA-N 9-bromo-9-phenylfluorene Chemical compound C12=CC=CC=C2C2=CC=CC=C2C1(Br)C1=CC=CC=C1 HYQXNCDBSALQLB-UHFFFAOYSA-N 0.000 description 1
- OZAIFHULBGXAKX-VAWYXSNFSA-N AIBN Substances N#CC(C)(C)\N=N\C(C)(C)C#N OZAIFHULBGXAKX-VAWYXSNFSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- PQSUYGKTWSAVDQ-ZVIOFETBSA-N Aldosterone Chemical compound C([C@@]1([C@@H](C(=O)CO)CC[C@H]1[C@@H]1CC2)C=O)[C@H](O)[C@@H]1[C@]1(C)C2=CC(=O)CC1 PQSUYGKTWSAVDQ-ZVIOFETBSA-N 0.000 description 1
- PQSUYGKTWSAVDQ-UHFFFAOYSA-N Aldosterone Natural products C1CC2C3CCC(C(=O)CO)C3(C=O)CC(O)C2C2(C)C1=CC(=O)CC2 PQSUYGKTWSAVDQ-UHFFFAOYSA-N 0.000 description 1
- 241000004176 Alphacoronavirus Species 0.000 description 1
- 108700023418 Amidases Proteins 0.000 description 1
- 102000004092 Amidohydrolases Human genes 0.000 description 1
- 108090000531 Amidohydrolases Proteins 0.000 description 1
- 102000006534 Amino Acid Isomerases Human genes 0.000 description 1
- 108010008830 Amino Acid Isomerases Proteins 0.000 description 1
- 108050005273 Amino acid transporters Proteins 0.000 description 1
- 102000034263 Amino acid transporters Human genes 0.000 description 1
- 102400000068 Angiostatin Human genes 0.000 description 1
- 108010079709 Angiostatins Proteins 0.000 description 1
- 102100034613 Annexin A2 Human genes 0.000 description 1
- 108090000668 Annexin A2 Proteins 0.000 description 1
- 102000007592 Apolipoproteins Human genes 0.000 description 1
- 108010071619 Apolipoproteins Proteins 0.000 description 1
- 108010083590 Apoproteins Proteins 0.000 description 1
- 102000006410 Apoproteins Human genes 0.000 description 1
- 101000716807 Arabidopsis thaliana Protein SCO1 homolog 1, mitochondrial Proteins 0.000 description 1
- 241000712891 Arenavirus Species 0.000 description 1
- 102100030907 Aryl hydrocarbon receptor nuclear translocator Human genes 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 101800001288 Atrial natriuretic factor Proteins 0.000 description 1
- 102400001282 Atrial natriuretic peptide Human genes 0.000 description 1
- 101800001890 Atrial natriuretic peptide Proteins 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- NOWKCMXCCJGMRR-UHFFFAOYSA-N Aziridine Chemical compound C1CN1 NOWKCMXCCJGMRR-UHFFFAOYSA-N 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 102100032367 C-C motif chemokine 5 Human genes 0.000 description 1
- 102100032366 C-C motif chemokine 7 Human genes 0.000 description 1
- 102100025248 C-X-C motif chemokine 10 Human genes 0.000 description 1
- 101710098275 C-X-C motif chemokine 10 Proteins 0.000 description 1
- 102100036150 C-X-C motif chemokine 5 Human genes 0.000 description 1
- 102100036153 C-X-C motif chemokine 6 Human genes 0.000 description 1
- 101710085504 C-X-C motif chemokine 6 Proteins 0.000 description 1
- 102100036170 C-X-C motif chemokine 9 Human genes 0.000 description 1
- 101710085500 C-X-C motif chemokine 9 Proteins 0.000 description 1
- 101150013553 CD40 gene Proteins 0.000 description 1
- 102100032912 CD44 antigen Human genes 0.000 description 1
- 108050006947 CXC Chemokine Proteins 0.000 description 1
- 102000019388 CXC chemokine Human genes 0.000 description 1
- 101000690445 Caenorhabditis elegans Aryl hydrocarbon receptor nuclear translocator homolog Proteins 0.000 description 1
- 101100392772 Caenorhabditis elegans gln-2 gene Proteins 0.000 description 1
- 101100289894 Caenorhabditis elegans lys-7 gene Proteins 0.000 description 1
- 102000055006 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 102000011068 Cdc42 Human genes 0.000 description 1
- 108050001278 Cdc42 Proteins 0.000 description 1
- 229910052684 Cerium Inorganic materials 0.000 description 1
- 108010055166 Chemokine CCL5 Proteins 0.000 description 1
- 108010055124 Chemokine CCL7 Proteins 0.000 description 1
- 102000000012 Chemokine CCL8 Human genes 0.000 description 1
- 108010055204 Chemokine CCL8 Proteins 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 102100023804 Coagulation factor VII Human genes 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 229940124073 Complement inhibitor Drugs 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 1
- 229930195713 D-glutamate Natural products 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- YAHZABJORDUQGO-NQXXGFSBSA-N D-ribulose 1,5-bisphosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)C(=O)COP(O)(O)=O YAHZABJORDUQGO-NQXXGFSBSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 101100134740 Drosophila melanogaster Oct-TyrR gene Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241000224431 Entamoeba Species 0.000 description 1
- 101710104662 Enterotoxin type C-3 Proteins 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 108020002908 Epoxide hydrolase Proteins 0.000 description 1
- 102000005486 Epoxide hydrolase Human genes 0.000 description 1
- 239000004593 Epoxy Substances 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 101900234631 Escherichia coli DNA polymerase I Proteins 0.000 description 1
- 241000701988 Escherichia virus T5 Species 0.000 description 1
- PIICEJLVQHRZGT-UHFFFAOYSA-N Ethylenediamine Chemical compound NCCN PIICEJLVQHRZGT-UHFFFAOYSA-N 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 102100030844 Exocyst complex component 1 Human genes 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 108010023321 Factor VII Proteins 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 108010014173 Factor X Proteins 0.000 description 1
- 102100027286 Fanconi anemia group C protein Human genes 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 102100037362 Fibronectin Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 108010058643 Fungal Proteins Proteins 0.000 description 1
- 102100040837 Galactoside alpha-(1,2)-fucosyltransferase 2 Human genes 0.000 description 1
- 101710115997 Gamma-tubulin complex component 2 Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241000224466 Giardia Species 0.000 description 1
- 102000004547 Glucosylceramidase Human genes 0.000 description 1
- 108010017544 Glucosylceramidase Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102000006771 Gonadotropins Human genes 0.000 description 1
- 108010086677 Gonadotropins Proteins 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 108090000031 Hedgehog Proteins Proteins 0.000 description 1
- 102000003693 Hedgehog Proteins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 102000007625 Hirudins Human genes 0.000 description 1
- 108010007267 Hirudins Proteins 0.000 description 1
- 101000793115 Homo sapiens Aryl hydrocarbon receptor nuclear translocator Proteins 0.000 description 1
- 101000947186 Homo sapiens C-X-C motif chemokine 5 Proteins 0.000 description 1
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 1
- 101000893710 Homo sapiens Galactoside alpha-(1,2)-fucosyltransferase 2 Proteins 0.000 description 1
- 101001069921 Homo sapiens Growth-regulated alpha protein Proteins 0.000 description 1
- 101000582320 Homo sapiens Neurogenic differentiation factor 6 Proteins 0.000 description 1
- 101000973997 Homo sapiens Nucleosome assembly protein 1-like 4 Proteins 0.000 description 1
- 101000947178 Homo sapiens Platelet basic protein Proteins 0.000 description 1
- 101000582950 Homo sapiens Platelet factor 4 Proteins 0.000 description 1
- 101001076715 Homo sapiens RNA-binding protein 39 Proteins 0.000 description 1
- 101000652229 Homo sapiens Suppressor of cytokine signaling 7 Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 241000598436 Human T-cell lymphotropic virus Species 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108010058683 Immobilized Proteins Proteins 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 1
- 102000048143 Insulin-Like Growth Factor II Human genes 0.000 description 1
- 108090001117 Insulin-Like Growth Factor II Proteins 0.000 description 1
- 102100022339 Integrin alpha-L Human genes 0.000 description 1
- 108010008212 Integrin alpha4beta1 Proteins 0.000 description 1
- 108010064593 Intercellular Adhesion Molecule-1 Proteins 0.000 description 1
- 102100037877 Intercellular adhesion molecule 1 Human genes 0.000 description 1
- 108090000174 Interleukin-10 Proteins 0.000 description 1
- 108090000177 Interleukin-11 Proteins 0.000 description 1
- 108010065805 Interleukin-12 Proteins 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 102100024319 Intestinal-type alkaline phosphatase Human genes 0.000 description 1
- 101710184243 Intestinal-type alkaline phosphatase Proteins 0.000 description 1
- 229910021578 Iron(III) chloride Inorganic materials 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 101710177504 Kit ligand Proteins 0.000 description 1
- WTDRDQBEARUVNC-UHFFFAOYSA-N L-Dopa Natural products OC(=O)C(N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- 108010001831 LDL receptors Proteins 0.000 description 1
- 108010063045 Lactoferrin Proteins 0.000 description 1
- 102000010445 Lactoferrin Human genes 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000222722 Leishmania <genus> Species 0.000 description 1
- 108010054320 Lignin peroxidase Proteins 0.000 description 1
- 101710155614 Ligninase A Proteins 0.000 description 1
- 101710155621 Ligninase B Proteins 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 108010064548 Lymphocyte Function-Associated Antigen-1 Proteins 0.000 description 1
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 1
- 102100027754 Mast/stem cell growth factor receptor Kit Human genes 0.000 description 1
- NPPQSCRMBWNHMW-UHFFFAOYSA-N Meprobamate Chemical compound NC(=O)OCC(C)(CCC)COC(N)=O NPPQSCRMBWNHMW-UHFFFAOYSA-N 0.000 description 1
- 238000006845 Michael addition reaction Methods 0.000 description 1
- 241000191938 Micrococcus luteus Species 0.000 description 1
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 1
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 1
- 101710154541 Modulator protein Proteins 0.000 description 1
- 231100000678 Mycotoxin Toxicity 0.000 description 1
- 108090000470 N-Acetylglucosamine Receptors Proteins 0.000 description 1
- 108010093077 N-Acetylglucosaminyltransferases Proteins 0.000 description 1
- 102000002493 N-Acetylglucosaminyltransferases Human genes 0.000 description 1
- NQTADLQHYWFPDB-UHFFFAOYSA-N N-Hydroxysuccinimide Chemical compound ON1C(=O)CCC1=O NQTADLQHYWFPDB-UHFFFAOYSA-N 0.000 description 1
- 125000003047 N-acetyl group Chemical group 0.000 description 1
- OVRNDRQMDRJTHS-ZTVVOAFPSA-N N-acetyl-D-mannosamine Chemical compound CC(=O)N[C@@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-ZTVVOAFPSA-N 0.000 description 1
- FDJKUWYYUZCUJX-AJKRCSPLSA-N N-glycoloyl-beta-neuraminic acid Chemical compound OC[C@@H](O)[C@@H](O)[C@@H]1O[C@](O)(C(O)=O)C[C@H](O)[C@H]1NC(=O)CO FDJKUWYYUZCUJX-AJKRCSPLSA-N 0.000 description 1
- SUHQNCLNRUAGOO-UHFFFAOYSA-N N-glycoloyl-neuraminic acid Natural products OCC(O)C(O)C(O)C(NC(=O)CO)C(O)CC(=O)C(O)=O SUHQNCLNRUAGOO-UHFFFAOYSA-N 0.000 description 1
- 102100030589 Neurogenic differentiation factor 6 Human genes 0.000 description 1
- 102000001839 Neurturin Human genes 0.000 description 1
- 108010015406 Neurturin Proteins 0.000 description 1
- 108010033272 Nitrilase Proteins 0.000 description 1
- 108010024026 Nitrile hydratase Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- BXEFQPCKQSTMKA-UHFFFAOYSA-N OC(=O)C=[N+]=[N-] Chemical compound OC(=O)C=[N+]=[N-] BXEFQPCKQSTMKA-UHFFFAOYSA-N 0.000 description 1
- VEXQTVKQUUSBOD-UHFFFAOYSA-N ON=S(=O)=O Chemical class ON=S(=O)=O VEXQTVKQUUSBOD-UHFFFAOYSA-N 0.000 description 1
- 102000004140 Oncostatin M Human genes 0.000 description 1
- 108090000630 Oncostatin M Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000713112 Orthobunyavirus Species 0.000 description 1
- 108090000417 Oxygenases Proteins 0.000 description 1
- 102000004020 Oxygenases Human genes 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 108090000445 Parathyroid hormone Proteins 0.000 description 1
- 102000003982 Parathyroid hormone Human genes 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 231100000742 Plant toxin Toxicity 0.000 description 1
- 102100036154 Platelet basic protein Human genes 0.000 description 1
- 102100030304 Platelet factor 4 Human genes 0.000 description 1
- 208000000474 Poliomyelitis Diseases 0.000 description 1
- 239000004721 Polyphenylene oxide Substances 0.000 description 1
- 102000017033 Porins Human genes 0.000 description 1
- 108010013381 Porins Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 1
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 1
- 102000016971 Proto-Oncogene Proteins c-kit Human genes 0.000 description 1
- 108010014608 Proto-Oncogene Proteins c-kit Proteins 0.000 description 1
- 101710167959 Putative UTP-glucose-1-phosphate uridylyltransferase Proteins 0.000 description 1
- 102000013009 Pyruvate Kinase Human genes 0.000 description 1
- 108020005115 Pyruvate Kinase Proteins 0.000 description 1
- 102000004879 Racemases and epimerases Human genes 0.000 description 1
- 108090001066 Racemases and epimerases Proteins 0.000 description 1
- 102000003743 Relaxin Human genes 0.000 description 1
- 108090000103 Relaxin Proteins 0.000 description 1
- 108090000783 Renin Proteins 0.000 description 1
- 102100028255 Renin Human genes 0.000 description 1
- 241000702263 Reovirus sp. Species 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 102100023361 SAP domain-containing ribonucleoprotein Human genes 0.000 description 1
- 101710194492 SET-binding protein Proteins 0.000 description 1
- 241000791876 Selene Species 0.000 description 1
- 229920005654 Sephadex Polymers 0.000 description 1
- 239000012507 Sephadex™ Substances 0.000 description 1
- 206010040070 Septic Shock Diseases 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 108010056088 Somatostatin Proteins 0.000 description 1
- 102000005157 Somatostatin Human genes 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 241000295644 Staphylococcaceae Species 0.000 description 1
- 101000882406 Staphylococcus aureus Enterotoxin type C-1 Proteins 0.000 description 1
- 101000882403 Staphylococcus aureus Enterotoxin type C-2 Proteins 0.000 description 1
- 101001057112 Staphylococcus aureus Enterotoxin type D Proteins 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108010023197 Streptokinase Proteins 0.000 description 1
- 102100021669 Stromal cell-derived factor 1 Human genes 0.000 description 1
- 101710088580 Stromal cell-derived factor 1 Proteins 0.000 description 1
- 102000005158 Subtilisins Human genes 0.000 description 1
- 108010056079 Subtilisins Proteins 0.000 description 1
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 description 1
- 102100030529 Suppressor of cytokine signaling 7 Human genes 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 241000589499 Thermus thermophilus Species 0.000 description 1
- 108010078233 Thymalfasin Proteins 0.000 description 1
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 1
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 1
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Natural products CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 1
- 206010044248 Toxic shock syndrome Diseases 0.000 description 1
- 231100000650 Toxic shock syndrome Toxicity 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 241000224526 Trichomonas Species 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 1
- 206010054094 Tumour necrosis Diseases 0.000 description 1
- 102100038834 UTP-glucose-1-phosphate uridylyltransferase Human genes 0.000 description 1
- 102000006321 UTP-hexose-1-phosphate uridylyltransferase Human genes 0.000 description 1
- 108010058532 UTP-hexose-1-phosphate uridylyltransferase Proteins 0.000 description 1
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- 108010000134 Vascular Cell Adhesion Molecule-1 Proteins 0.000 description 1
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 102100023543 Vascular cell adhesion protein 1 Human genes 0.000 description 1
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 1
- 241000269370 Xenopus <genus> Species 0.000 description 1
- 108700040099 Xylose isomerases Proteins 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000008351 acetate buffer Substances 0.000 description 1
- 108091005646 acetylated proteins Proteins 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 238000005882 aldol condensation reaction Methods 0.000 description 1
- 229960002478 aldosterone Drugs 0.000 description 1
- HAXFWIACAGNFHA-UHFFFAOYSA-N aldrithiol Chemical compound C=1C=CC=NC=1SSC1=CC=CC=N1 HAXFWIACAGNFHA-UHFFFAOYSA-N 0.000 description 1
- 150000001335 aliphatic alkanes Chemical class 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 150000001351 alkyl iodides Chemical class 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- 229940061720 alpha hydroxy acid Drugs 0.000 description 1
- 150000001280 alpha hydroxy acids Chemical class 0.000 description 1
- HXXFSFRBOHSIMQ-VFUOTHLCSA-N alpha-D-glucose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@H](O)[C@@H](O)[C@@H]1O HXXFSFRBOHSIMQ-VFUOTHLCSA-N 0.000 description 1
- 150000001370 alpha-amino acid derivatives Chemical class 0.000 description 1
- 102000005922 amidase Human genes 0.000 description 1
- 229940124277 aminobutyric acid Drugs 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000002587 anti-hemolytic effect Effects 0.000 description 1
- 230000000078 anti-malarial effect Effects 0.000 description 1
- 108010082685 antiarrhythmic peptide Proteins 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 239000003430 antimalarial agent Substances 0.000 description 1
- 229940033495 antimalarials Drugs 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 125000000089 arabinosyl group Chemical group C1([C@@H](O)[C@H](O)[C@H](O)CO1)* 0.000 description 1
- 229910052786 argon Inorganic materials 0.000 description 1
- 150000004982 aromatic amines Chemical class 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 230000001746 atrial effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000000376 autoradiography Methods 0.000 description 1
- 108010030694 avidin-horseradish peroxidase complex Proteins 0.000 description 1
- 125000004069 aziridinyl group Chemical group 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000003385 bacteriostatic effect Effects 0.000 description 1
- FXCLIEYDXXVEAI-UHFFFAOYSA-N benzene;dichloromethane Chemical compound ClCCl.C1=CC=CC=C1 FXCLIEYDXXVEAI-UHFFFAOYSA-N 0.000 description 1
- RWCCWEUUXYIKHB-UHFFFAOYSA-N benzophenone Chemical compound C=1C=CC=CC=1C(=O)C1=CC=CC=C1 RWCCWEUUXYIKHB-UHFFFAOYSA-N 0.000 description 1
- 239000012965 benzophenone Substances 0.000 description 1
- 125000003236 benzoyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C(*)=O 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 229940000635 beta-alanine Drugs 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000011953 bioanalysis Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- ZADPBFCGQRWHPN-UHFFFAOYSA-N boronic acid Chemical compound OBO ZADPBFCGQRWHPN-UHFFFAOYSA-N 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 102000023852 carbohydrate binding proteins Human genes 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- NSQLIUXCMFBZME-MPVJKSABSA-N carperitide Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 NSQLIUXCMFBZME-MPVJKSABSA-N 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000007541 cellular toxicity Effects 0.000 description 1
- GWXLDORMOJMVQZ-UHFFFAOYSA-N cerium Chemical compound [Ce] GWXLDORMOJMVQZ-UHFFFAOYSA-N 0.000 description 1
- 150000001793 charged compounds Chemical class 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- PBAYDYUZOSNJGU-UHFFFAOYSA-N chelidonic acid Natural products OC(=O)C1=CC(=O)C=C(C(O)=O)O1 PBAYDYUZOSNJGU-UHFFFAOYSA-N 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 229960003677 chloroquine Drugs 0.000 description 1
- WTFXTQVDAKGDEY-HTQZYQBOSA-N chorismic acid Chemical compound O[C@@H]1C=CC(C(O)=O)=C[C@H]1OC(=C)C(O)=O WTFXTQVDAKGDEY-HTQZYQBOSA-N 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 238000002967 competitive immunoassay Methods 0.000 description 1
- 239000004074 complement inhibitor Substances 0.000 description 1
- 229940125904 compound 1 Drugs 0.000 description 1
- 229940126214 compound 3 Drugs 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 108010082242 corticosterone receptor Proteins 0.000 description 1
- 239000003431 cross linking reagent Substances 0.000 description 1
- 239000012043 crude product Substances 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000006324 decarbonylation Effects 0.000 description 1
- 238000006606 decarbonylation reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 230000005595 deprotonation Effects 0.000 description 1
- 238000010537 deprotonation reaction Methods 0.000 description 1
- 238000003795 desorption Methods 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- YMWUJEATGCHHMB-UHFFFAOYSA-N dichloromethane Substances ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- ISOLMABRZPQKOV-UHFFFAOYSA-N diethyl 2-acetamidopropanedioate Chemical compound CCOC(=O)C(NC(C)=O)C(=O)OCC ISOLMABRZPQKOV-UHFFFAOYSA-N 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 239000002934 diuretic Substances 0.000 description 1
- AFOSIXZFDONLBT-UHFFFAOYSA-N divinyl sulfone Chemical compound C=CS(=O)(=O)C=C AFOSIXZFDONLBT-UHFFFAOYSA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000002451 electron ionisation mass spectrometry Methods 0.000 description 1
- 238000000132 electrospray ionisation Methods 0.000 description 1
- 238000002330 electrospray ionisation mass spectrometry Methods 0.000 description 1
- 231100000655 enterotoxin Toxicity 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 125000003700 epoxy group Chemical group 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- 238000005886 esterification reaction Methods 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 235000019439 ethyl acetate Nutrition 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 238000004299 exfoliation Methods 0.000 description 1
- 239000002095 exotoxin Substances 0.000 description 1
- 231100000776 exotoxin Toxicity 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 229940012413 factor vii Drugs 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 229940012426 factor x Drugs 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000001215 fluorescent labelling Methods 0.000 description 1
- ZHNUHDYFZUAESO-UHFFFAOYSA-N formamide Substances NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 125000002519 galactosyl group Chemical group C1([C@H](O)[C@@H](O)[C@@H](O)[C@H](O1)CO)* 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229950010772 glucose-1-phosphate Drugs 0.000 description 1
- 229960002743 glutamine Drugs 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- 102000035122 glycosylated proteins Human genes 0.000 description 1
- 108091005608 glycosylated proteins Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000002622 gonadotropin Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 125000005179 haloacetyl group Chemical group 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 238000004896 high resolution mass spectrometry Methods 0.000 description 1
- 231100000086 high toxicity Toxicity 0.000 description 1
- WQPDUTSPKFMPDP-OUMQNGNKSA-N hirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(OS(O)(=O)=O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N2)=O)CSSC1)C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)CSSC1)C(C)C)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 WQPDUTSPKFMPDP-OUMQNGNKSA-N 0.000 description 1
- 229940006607 hirudin Drugs 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 229940042795 hydrazides for tuberculosis treatment Drugs 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 150000002431 hydrogen Chemical class 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 150000002463 imidates Chemical class 0.000 description 1
- 150000002466 imines Chemical class 0.000 description 1
- 150000007976 iminium ions Chemical class 0.000 description 1
- 125000001841 imino group Chemical group [H]N=* 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000010324 immunological assay Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000002198 insoluble material Substances 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 102000002467 interleukin receptors Human genes 0.000 description 1
- 108010093036 interleukin receptors Proteins 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000005040 ion trap Methods 0.000 description 1
- RBTARNINKXHZNM-UHFFFAOYSA-K iron trichloride Chemical compound Cl[Fe](Cl)Cl RBTARNINKXHZNM-UHFFFAOYSA-K 0.000 description 1
- 239000012948 isocyanate Substances 0.000 description 1
- 150000002513 isocyanates Chemical class 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 230000000155 isotopic effect Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- CSSYQJWUGATIHM-IKGCZBKSSA-N l-phenylalanyl-l-lysyl-l-cysteinyl-l-arginyl-l-arginyl-l-tryptophyl-l-glutaminyl-l-tryptophyl-l-arginyl-l-methionyl-l-lysyl-l-lysyl-l-leucylglycyl-l-alanyl-l-prolyl-l-seryl-l-isoleucyl-l-threonyl-l-cysteinyl-l-valyl-l-arginyl-l-arginyl-l-alanyl-l-phenylal Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CSSYQJWUGATIHM-IKGCZBKSSA-N 0.000 description 1
- 229940078795 lactoferrin Drugs 0.000 description 1
- 235000021242 lactoferrin Nutrition 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 239000006194 liquid suspension Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 231100000053 low toxicity Toxicity 0.000 description 1
- FSPSELPMWGWDRY-UHFFFAOYSA-N m-Methylacetophenone Chemical compound CC(=O)C1=CC=CC(C)=C1 FSPSELPMWGWDRY-UHFFFAOYSA-N 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 150000004702 methyl esters Chemical class 0.000 description 1
- 231100001224 moderate toxicity Toxicity 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- MEFBJEMVZONFCJ-UHFFFAOYSA-N molybdate Chemical compound [O-][Mo]([O-])(=O)=O MEFBJEMVZONFCJ-UHFFFAOYSA-N 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- PYLWMHQQBFSUBP-UHFFFAOYSA-N monofluorobenzene Chemical compound FC1=CC=CC=C1 PYLWMHQQBFSUBP-UHFFFAOYSA-N 0.000 description 1
- 150000004712 monophosphates Chemical class 0.000 description 1
- 239000002636 mycotoxin Substances 0.000 description 1
- 230000001452 natriuretic effect Effects 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- FEMOMIGRRWSMCU-UHFFFAOYSA-N ninhydrin Chemical compound C1=CC=C2C(=O)C(O)(O)C(=O)C2=C1 FEMOMIGRRWSMCU-UHFFFAOYSA-N 0.000 description 1
- 150000002825 nitriles Chemical class 0.000 description 1
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 231100000956 nontoxicity Toxicity 0.000 description 1
- 238000000655 nuclear magnetic resonance spectrum Methods 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 238000007344 nucleophilic reaction Methods 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 231100000590 oncogenic Toxicity 0.000 description 1
- 230000002246 oncogenic effect Effects 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 230000002188 osteogenic effect Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- PSWJVKKJYCAPTI-UHFFFAOYSA-N oxido-oxo-phosphonophosphanylphosphanium Chemical compound OP(O)(=O)PP(=O)=O PSWJVKKJYCAPTI-UHFFFAOYSA-N 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- TVIDEEHSOPHZBR-AWEZNQCLSA-N para-(benzoyl)-phenylalanine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1C(=O)C1=CC=CC=C1 TVIDEEHSOPHZBR-AWEZNQCLSA-N 0.000 description 1
- 239000000199 parathyroid hormone Substances 0.000 description 1
- 229960001319 parathyroid hormone Drugs 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 108010012038 peptide 78 Proteins 0.000 description 1
- 229940125863 peptide 78 Drugs 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- KHIWWQKSHDUIBK-UHFFFAOYSA-N periodic acid Chemical compound OI(=O)(=O)=O KHIWWQKSHDUIBK-UHFFFAOYSA-N 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 1
- LFGREXWGYUGZLY-UHFFFAOYSA-N phosphoryl Chemical group [P]=O LFGREXWGYUGZLY-UHFFFAOYSA-N 0.000 description 1
- XKJCHHZQLQNZHY-UHFFFAOYSA-N phthalimide Chemical compound C1=CC=C2C(=O)NC(=O)C2=C1 XKJCHHZQLQNZHY-UHFFFAOYSA-N 0.000 description 1
- 125000000612 phthaloyl group Chemical group C(C=1C(C(=O)*)=CC=CC1)(=O)* 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000008635 plant growth Effects 0.000 description 1
- 239000003123 plant toxin Substances 0.000 description 1
- 108010025221 plasma protein Z Proteins 0.000 description 1
- 230000001402 polyadenylating effect Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000026447 protein localization Effects 0.000 description 1
- 230000019639 protein methylation Effects 0.000 description 1
- 230000009822 protein phosphorylation Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 229930182852 proteinogenic amino acid Natural products 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 150000003214 pyranose derivatives Chemical class 0.000 description 1
- 230000001698 pyrogenic effect Effects 0.000 description 1
- HNJBEVLQSNELDL-UHFFFAOYSA-N pyrrolidin-2-one Chemical compound O=C1CCCN1 HNJBEVLQSNELDL-UHFFFAOYSA-N 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000012429 reaction media Substances 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000013557 residual solvent Substances 0.000 description 1
- 230000032537 response to toxin Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 201000005404 rubella Diseases 0.000 description 1
- 108010038196 saccharide-binding proteins Proteins 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 229930195734 saturated hydrocarbon Natural products 0.000 description 1
- 150000003349 semicarbazides Chemical class 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 230000009450 sialylation Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000000741 silica gel Substances 0.000 description 1
- 229910002027 silica gel Inorganic materials 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- QDRKDTQENPPHOJ-UHFFFAOYSA-N sodium ethoxide Chemical compound [Na+].CC[O-] QDRKDTQENPPHOJ-UHFFFAOYSA-N 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 230000003381 solubilizing effect Effects 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 229960000553 somatostatin Drugs 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 230000003335 steric effect Effects 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 229960005202 streptokinase Drugs 0.000 description 1
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- YBBRCQOCSYXUOC-UHFFFAOYSA-N sulfuryl dichloride Chemical compound ClS(Cl)(=O)=O YBBRCQOCSYXUOC-UHFFFAOYSA-N 0.000 description 1
- 231100000617 superantigen Toxicity 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- FESDUDPSRMWIDL-UHFFFAOYSA-N tert-butyl n,n'-di(propan-2-yl)carbamimidate Chemical compound CC(C)NC(OC(C)(C)C)=NC(C)C FESDUDPSRMWIDL-UHFFFAOYSA-N 0.000 description 1
- 229960003604 testosterone Drugs 0.000 description 1
- WROMPOXWARCANT-UHFFFAOYSA-N tfa trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F.OC(=O)C(F)(F)F WROMPOXWARCANT-UHFFFAOYSA-N 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 150000003568 thioethers Chemical class 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- NZVYCXVTEHPMHE-ZSUJOUNUSA-N thymalfasin Chemical compound CC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NZVYCXVTEHPMHE-ZSUJOUNUSA-N 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 229960000187 tissue plasminogen activator Drugs 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- AVBGNFCMKJOFIN-UHFFFAOYSA-N triethylammonium acetate Chemical compound CC(O)=O.CCN(CC)CC AVBGNFCMKJOFIN-UHFFFAOYSA-N 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 1
- 150000003667 tyrosine derivatives Chemical class 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229930195735 unsaturated hydrocarbon Natural products 0.000 description 1
- 229960005356 urokinase Drugs 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
- JPZXHKDZASGCLU-LBPRGKRZSA-N β-(2-naphthyl)-alanine Chemical compound C1=CC=CC2=CC(C[C@H](N)C(O)=O)=CC=C21 JPZXHKDZASGCLU-LBPRGKRZSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/005—Glycopeptides, glycoproteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Plant Pathology (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
Abstract
Método para la síntesis de una glicoproteína, comprendiendo el método: a) incorporar en una proteína un aminoácido no natural que comprende un primer grupo reactivo; en el que la etapa de incorporación comprende la incorporación del aminoácido no natural en la proteína con un par ARNt ortogonal/aminoacil ortogonal-ARNt sintetasa (O-ARNt/O-RS), en el que el O-ARNt reconoce un codón selector e incorpora el aminoácido no natural en la proteína como respuesta al codón selector, y en el que los ORS aminoacilan el O-ARNt con el aminoácido natural; y, b) poner en contacto la proteína con un residuo sacárido que comprende un segundo grupo reactivo, en donde el primer grupo reactivo reacciona con el segundo grupo reactivo para unir el residuo sacárido al aminoácido no natural, produciendo por tanto la glicoproteína.
Description
Síntesis de glicoproteínas.
\global\parskip0.900000\baselineskip
La invención se encuentra en el campo de los
glicopéptidos, glicoproteínas y miméticos relacionados, y métodos
para la síntesis de glicopéptidos, glicoproteínas y miméticos
relacionados.
La modificación post-traducción
de las proteínas mediante glicosilación puede afectar el
desdoblamiento y la estabilidad de las proteínas, modificar la
actividad intrínseca de las proteínas, y modular sus interacciones
con otras biomoléculas. Ver, p. ej., Varki, A. (1993) Glycobiology
3:97-130. Las glicoproteínas naturales se
encuentran presentes frecuentemente como una población de muchas
glicoformas diferentes, lo cual hace difícil el análisis de la
estructura del glicano y el estudio de los efectos de glicosilación
en la estructura y función de las proteínas. En consecuencia, son
necesarios métodos para la síntesis de proteínas naturales y no
naturales homogéneamente glicosiladas para la comprensión
sistemática de la función del glicano, y para el desarrollo de
mejores terapéuticos de glicoproteínas.
Un procedimiento previamente conocido para
elaborar proteínas que tienen los patrones de glicosilación
deseados hace uso de glicosidasas para convertir una glicoproteína
heterogénea natural en un simple núcleo homogéneo, sobre el cual
los sacáridos pueden injertarse en secuencia con
glicosiltransferasas. Ver, p. ej., Witte, K., et al., (1997)
J. Am. Chem. Soc. 119:2114-2118. Una limitación de
este procedimiento es que los sitios principales de glicosilación
se encuentran predeterminados por la línea celular en la cual se
expresa la proteína. Alternativamente, un glicopéptido que contiene
la estructura de glicano deseada puede sintetizarse mediante
síntesis de péptido en fase sólida. Este glicopéptido puede
acoplarse a otros péptidos o a fragmentos de proteína recombinante
para producir una glicoproteína más grande mediante ligación química
natural, (ver, p. ej., Shin, Y., et al., (1999) J. Am. Chem.
Soc. 121:11684-11689) ligación de proteína
expresada, (ver, p. ej., Tolbert, T.J., y Wong, C.H. (2000) J. Am.
Chem. Soc. 122:5421-5428), o con proteasas
diseñadas. Ver, p. ej., Witte, K., et al., (1998) J. Am.
Chem. Soc. 120:1979-1989. Tanto la ligación química
natural como la ligación de proteína expresada son muy efectivas
con proteínas pequeñas, y necesitan un residuo de cisteína en la
terminal N del glicopéptido. Cuando se utiliza una proteasa para
ligar péptidos entre sí, el sitio de ligación debe colocarse
alejado del sitio de glicosilación para producir buen acoplamiento,
Ver, p. ej., Witte, K., et al., (1998) J. Am. Chem. Soc.
120:1979-1989. Un tercer procedimiento es modificar
las proteínas con sacáridos directamente utilizando métodos
químicos. Puede lograrse una buena selectividad con derivados
sacáridos de haloacetamida, que se acoplan al grupo tiol de
cisteína, (ver, p. ej., Davis, N. J. y Flitsch, S.L. (1991)
Tetrahedron Lett. 32:6793-6796; y Macmillan, D.,
et al., (2002) Org. Lett 4:1467-1470), pero
este método puede volverse problemático con proteínas que tiene más
de un residuo de cisteína.
De acuerdo con esto, existe la necesidad de
métodos mejorados para elaborar glicoproteínas que tienen un patrón
de glicosilación deseado. La invención cumple esta y otras
necesidades, como será aparente al revisar la siguiente
descripción.
La invención proporciona métodos para la
síntesis de glicoproteínas. Estos métodos implican, en algunas
realizaciones, incorporar en una proteína un aminoácido no natural
que comprende un primer grupo reactivo; y poner en contacto la
proteína con un residuo sacárido que comprende un segundo grupo
reactivo, en donde el primer grupo reactivo reacciona con el
segundo grupo reactivo para unir el residuo sacárido al aminoácido
no natural. Las glicoproteínas producidas mediante estos métodos
también se incluyen en la invención. El primer grupo reactivo, es
en algunas realizaciones, un residuo electrofílico (p. ej., un
residuo ceto, un residuo aldehído, y/o lo similar) y el segundo
grupo reactivo es un residuo nucleofílico. En algunas realizaciones,
el primer grupo reactivo es un residuo nucleofílico y el segundo
grupo reactivo es un residuo electrofílico (p. ej., un residuo
ceto, un residuo aldehído, y/o lo similar). Por ejemplo, un residuo
electrofílico se une al residuo sacárido y el residuo nucleofílico
se une al aminoácido no natural. El residuo sacárido puede incluir
un solo residuo de carbohidrato, o el residuo sacárido puede incluir
dos o más residuos de carbohidrato.
En algunas realizaciones, los métodos implican
además poner en contacto el residuo sacárido con una
glicosiltransferasa, un residuo donante de azúcar, y otros reactivos
requeridos para la actividad de la glicosiltransferasa durante un
tiempo suficiente y bajo las condiciones apropiadas para transferir
un azúcar desde el residuo donante de azúcar hacia el residuo
sacárido. El producto de esta reacción, si se desea, puede ponerse
en contacto mediante al menos una segunda glicosiltransferasa,
junto con el residuo donante de azúcar apropiado.
En ciertas realizaciones, el método comprende
además poner en contacto el residuo sacárido con una o más de una
\beta1-4N-acetilglucosaminiltransferasa,
una \alpha1,3fucosiltransferasa, una
\alpha1,2fucosiltransferasa, una
\alpha1,4fucosiltransfe-
rasa, una \beta1-4galactosiltransferasa, una sialiltransferasa, y/o lo similar, para formar una estructura de oligosacárido biantenaria o triantenaria.
rasa, una \beta1-4galactosiltransferasa, una sialiltransferasa, y/o lo similar, para formar una estructura de oligosacárido biantenaria o triantenaria.
En una realización, el residuo sacárido
comprende un GlcNAc terminal, el residuo donante de azúcar es
UDP-Gal y la glicosiltransferasa es una
\beta-1,4-galactosiltransferasa.
En una realización, el residuo sacárido comprende un GlcNAc
terminal, el residuo donante de azúcar es UDP-GlcNAc
y la glicosiltransferasa es una
\beta1-4N-acetilglucosaminiltransferasa.
Opcionalmente, el método comprende además poner en contacto el
producto de la reacción de
N-acetilglucosaminiltransferasa con una
\beta1-4manosiltransferasa y
GDP-manosa para formar un residuo sacárido que
comprende
Man\beta1-4GlcNAc\beta1-4GlcNAc-.
Opcionalmente, el método comprende además poner en contacto el
residuo
Man\beta1-4GlcNAc\beta1-4GlcNAc-
con una \alpha1-3manosiltransferasa y
GDP-manosa para formar un residuo sacárido que
comprende
Man\alpha1-3Man\beta1-4GlcNAc\beta1-4GlcNAc-.
Opcionalmente, el método comprende además poner en contacto el
residuo
Man\alpha1-3Man\beta1-4GlcNAc\beta1-4GlcNAc-
con una \alpha1-6manosiltransferasa y
GDP-manosa para formar un residuo sacárido que
comprende
Man\alpha1-6(Man\alpha1-3)Man\beta1-4GlcNAc\beta1-4GlcNAc-.
Opcionalmente, el método comprende además poner en contacto el
residuo
Man\alpha1-6(Man\alpha1-3)Man\beta1-4GlcNAc\beta1-4GlcNAc-
con una
\beta1-2N-acetilglucosaminiltransferasa
y UDP-GlcNAc para formar un residuo sacárido que
comprende
Man\alpha1-6(GlcNAc\beta1-2Man\alpha1-3)Man\beta1-4GlcNAc\beta1-4GlcNAc-.
Opcionalmente, el método comprende además poner en contacto el
residuo
Man\alpha1-6(GlcNAc\beta1-2Man\alpha1-3)Man\beta1-4GlcNAc\beta1-4GlcNAc-
con una
\beta1-2N-acetilglucosaminiltransferasa
y UDP-GlcNAc para formar un residuo sacárido que
comprende
GlcNAc\beta1-2Man\alpha1-6(GlcNAc\beta1-2Man\alpha1-3)Man\beta1-4GlcNAc\beta1-4GlcNAc-.
La etapa de incorporación en una proteína de un
aminoácido no natural que comprende un primer grupo reactivo, en
algunas realizaciones, comprende utilizar un par ARNt
ortogonal/aminoacil ortogonal-ARNt sintetasa
(O-ARNt/O-RS), en donde el
O-ARNt reconoce un codón selector e incorpora el
aminoácido no natural dentro de la proteína en respuesta al codón
selector, y en donde la O-RS preferentemente
aminoacila el O-ARNt con el aminoácido no natural.
Por ejemplo, el O-RS comprende una secuencia de
aminoácidos que comprende cualquiera de las SEQ ID NO.: 1, 2 o 3.
Opcionalmente, el O-ARNt comprende un mutARNTyr CUA.
En algunas realizaciones el aminoácido no natural se incorpora en
el polipéptido in vivo.
La invención proporciona también glicoproteínas
que comprenden un residuo sacárido y un polipéptido. En ciertas
realizaciones en las glicoproteínas de la invención, el residuo
sacárido se une al polipéptido mediante un producto de reacción de
una reacción nucleofílica entre un primer grupo reactivo unido a un
aminoácido no natural presente en el polipéptido y un segundo grupo
reactivo unido al residuo sacárido. En ciertas realizaciones, el
primer grupo reactivo es un residuo electrofílico (p. ej., residuo
ceto, residuo aldehído, y/o lo similar) y el segundo grupo reactivo
es un residuo nucleofílico.
En ciertas realizaciones, el residuo
nucleofílico de la invención incluye, pero no se limita a,
hidrazida, hidroxilamina, semicarbazida, carbohidrazida,
sulfonilhidrazida y similares. Por ejemplo, los residuos
nucleofílicos incluyen, pero no se limitan a, p. ej.,
-NR1-NH2(hidrazida),
-NR1(C=O)NR2NH2(semicarbazida),
-NR1(C=S) NR2NH2(tiosemicarbazida),
-(C=O)NR1NH2(carbonilhidrazida),
-(C=S)NR1NH2(tiocarbonilhidrazida),
-(SO2)NR1NH2 (sulfonilhidrazida),
-NR1NR2(C=O)NR3NH2(carbazida), -NR1NR2
(C=S)NR3NH2(tiocarbazida),
-O-NH2(hidroxilamina), y similares, en donde
cada R1, R2 y R3 es independientemente H, o alquilo que tiene de
1-6 carbonos.
En ciertas realizaciones de la invención, un
producto de reacción de la invención comprende, p. ej., una oxima,
una amida, una hidrazona, una hidrazona reducida, una
carbohidrazona, una tiocarbohidrazona, una sulfonilhidrazona, una
semicarbazona, una tiosemicarbazona, y similares.
Otros aspectos de la invención incluyen métodos
para la síntesis de una glicoproteína incorporando en una proteína
un aminoácido no natural que comprende un residuo sacárido. Es
también una característica de la invención una glicoproteína
producida mediante el método. En ciertas realizaciones, la etapa de
incorporación comprende utilizar un par ARNt ortogonal/aminoacil
ortogonal-ARNt sintetasa
(O-ARNt/O-RS), en donde el
O-ARNt reconoce un codón selector e incorpora el
aminoácido no natural que comprende un residuo sacárido (p. ej.,
una
\beta-O-GlcNAc-L-serina,
una
tri-acetil-\beta-GlcNAc-serina,
una
tri-O-acetil-GalNAc-\alpha-treonina,
una
\alpha-GalNAc-L-treonina,
y/o lo similar) dentro de la proteína en respuesta al codón
selector, y en donde la O-RS preferentemente
aminoacila el O-ARNt con el aminoácido no natural.
En una realización, la etapa de incorporación se lleva a cabo in
vivo. Por ejemplo, la O-RS comprende una
secuencia de aminoácidos que comprende cualquiera de las SEQ ID
NO.: 4, 5 o 6, o se encuentra codificada por un polinucleótido que
comprende una secuencia de polinucleótidos de cualquiera de las SEQ
ID NO.: 8, 9, o 10. Opcionalmente, el O-ARNt
comprende un mutARNTyr CUA. Estos métodos pueden implicar además
poner en contacto el residuo sacárido con una glicosiltransferasa,
un residuo donante de azúcar, y otros reactivos requeridos para la
actividad de la glicosiltransferasa durante un tiempo suficiente y
bajo las condiciones apropiadas para transferir un azúcar del
residuo donante de azúcar hacia el residuo sacárido.
En ciertas realizaciones, el método comprende
además poner en contacto el producto de la reacción de
glicosiltransferasa con al menos una segunda glicosiltransferasa y
un segundo residuo donante de azúcar. En una realización, el
residuo sacárido comprende un GlcNAc terminal, el residuo donante de
azúcar es UDP-GlcNAc y la glicosiltransferasa es
una
\beta1-4N-acetilglucosaminiltransferasa.
En otra realización, el residuo sacárido comprende un GlcNAc
terminal, el residuo donante de azúcar es UDP-Gal y
la glicosiltransferasa es
\beta1-4-galactosiltransferasa.
Pueden agregarse azúcares adicionales.
En ciertas realizaciones, una
glicosiltransferasa de la invención incluye, pero no se limita a, p.
ej., una galactosiltransferasa, una fucosiltransferasa, una
glucosiltransferasa, una
N-acetilgalactosaminiltransferasa, una
N-acetilglucosaminiltransferasa, una
glucuroniltransferasa, una sialiltransferasa, una
manosiltransferasa, una transferasa de ácido glucurónico, una
transferasa de ácido galacturónico, una oligosacariltransferasa, y
similares.
\global\parskip1.000000\baselineskip
La invención también proporciona células huésped
(p. ej., células de mamífero, células de levadura, células
bacteriales, células vegetales, células de hongos, células
arqueobacteriales, células de insecto, y/o lo similar) que son
útiles para sintetizar una glicoproteína. Estas células huésped
contienen: a) un aminoácido no natural que comprende un residuo
sacárido; b) un ARNt ortogonal que reconoce un codón selector; c)
una ARNt sintetasa de aminoacilo ortogonal (O-RS)
que cataliza la unión del aminoácido no natural al ARNt ortogonal;
d) un polinucleótido que codifica para una glicosiltransferasa; y e)
una secuencia de polinucleótidos que codifica para un polipéptido y
comprende al menos un codón selector.
También proporciona la invención composiciones
que incluyen un sistema de traducción. Los sistemas de traducción
incluyen un ARNt ortogonal (O-ARNt) y una ARNt
sintetasa de aminoacilo ortogonal (O-RS), en donde
la O-RS preferentemente aminoacila el
O-ARNt con un aminoácido no natural que comprende un
residuo sacárido (p. ej.,
\beta-O-GlcNAc-L-serina,
una
tri-acetil-\beta-GlcNAc-serina,
una
tri-O-acetil-GalNAc-\alpha-treonina,
una
\alpha-GalNAc-L-treonina,
y/o lo similar) y el O-ARNt reconoce al menos un
codón selector. En ciertas realizaciones, la O-RS
comprende una secuencia de aminoácidos que comprende cualquiera de
las SEQ ID NO.: 4, 5 o 6, o se encuentra codificada por un
polinucleótido que comprende una secuencia de polinucleótidos de
cualquiera de las SEQ ID NO.: 8, 9, o 10. Opcionalmente, el
O-ARNt comprende un mutARN Tyr CUA.
Los polipéptidos y polinucleótidos artificiales
(p. ej., hechos por el hombre y que no se presentan de manera
natural) también son características de la invención. Por ejemplo,
un polipéptido artificial de la invención incluye, p. ej., (a) un
polipéptido que comprende una secuencia de aminoácidos como se
muestra en cualquiera de las SEQ ID NO.: 4-6; (b)
un polipéptido que comprende una secuencia de aminoácidos codificada
por una secuencia de polinucleótidos como se muestra en cualquiera
de las SEQ ID NO.: 8-10; (c) un polipéptido que es
específicamente inmunorreactivo con un anticuerpo específico para un
polipéptido de (a), o (b); y (d) una secuencia de aminoácidos que
comprende una variante conservadora de (a), (b) o (c). También se
proporcionan anticuerpos y antisueros que son específicamente
inmunorreactivos con un polipéptido artificial de la invención. Un
polinucleótido artificial de la invención incluye, p. ej., (a) un
polinucleótido que comprende una secuencia de nucleótidos como se
establece en cualquiera de las SEQ ID NO.: 8-10; (b)
un polinucleótido que es complementario, o que codifica para una
secuencia de polinucleótidos de (a); (c) un polinucleótido que
codifica para un polipéptido que comprende, una secuencia de
aminoácidos como se establece en cualquiera de las SEQ ID NO.:
1-6, o una variante conservadora de las mismas; (d)
un polinucleótido que codifica para un polipéptido artificial; (e)
un ácido nucleico que se híbrida a un polinucleótido de (a), (b),
(c), o (d) bajo condiciones altamente rigurosas sobre
sustancialmente la longitud total del ácido nucleico; (f) un
polinucleótido que es al menos 98% idéntico a un polinucleótido de
(a), (b), (c), (d) o (e); y (h) un polinucleótido que comprende una
variante conservadora de (a), (b), (c), (d), (e) o (f).
Antes de describir la invención en detalle, se
entenderá que esta invención no se limita a dispositivos
particulares o sistemas biológicos, que, por supuesto, pueden
variar. También se entenderá que la terminología utilizada en la
presente es para el propósito de describir solo realizaciones
particulares, y no pretende ser limitante. Como se utiliza en esta
especificación y en las reivindicaciones anexas, las formas de
singular "un(una)", y "el(la)"incluyen
referentes en plural a menos que el contenido lo dicte claramente de
otra manera. De este modo, por ejemplo, la referencia a "una
célula" incluye una combinación de dos o más células; la
referencia a "bacteria" incluye mezclas de bacterias y
similares.
Ortogonal: Como se utiliza en la
presente, el término "ortogonal" se refiere a una molécula (p.
ej., un ARNt ortogonal (O-ARNt) y/o una ARNt
sintetasa de aminoacilo ortogonal (O-RS)) que se
utiliza con una eficiencia reducida por una molécula
correspondiente que es endógena a una célula u otro sistema de
traducción. Ortogonal se refiere a la incapacidad o reducida
eficiencia, p. ej., menor que 20& de eficiencia, menor que 10%
de eficiencia, menor que 5% de eficiencia, o menor que 1% de
eficiencia, de un ARNt ortogonal para funcionar con una ARNt
sintetasa endógena, o de una RS ortogonal para funcionar con un ARNt
endógeno en el sistema de traducción de interés. Por ejemplo, un
ARNt ortogonal en un sistema de traducción de interés se aminoacila
por cualquier RS endógena de un sistema de traducción de interés
con eficiencia reducida o incluso de cero, al compararse a la
aminoacilación de un ARNt endógeno por una RS endógena. En otro
ejemplo, una RS ortogonal aminoacila cualquier ARNt endógeno en el
sistema de traducción de interés con eficiencia reducida o incluso
de cero, en comparación con la aminoacilación del ARNt endógeno por
una RS endógena.
Aminoacila preferentemente: El término
"aminoacila preferentemente" se refiere a una eficiencia de,
p. ej., aproximadamente 70% de eficiencia, aproximadamente 75% de
eficiencia, aproximadamente 85% de eficiencia, aproximadamente 90%
de eficiencia, aproximadamente 95% de eficiencia, o p. ej.,
aproximadamente 99% de eficiencia o más, a la cual una
O-RS aminoacila un O-ARNt con un
aminoácido no natural comparado con un ARNt que se presenta
naturalmente o un material de inicio utilizado para generar el
O-ARNt. El aminoácido no natural se incorpora
entonces en una cadena creciente de polipéptidos con alta fidelidad,
p. ej., en más de aproximadamente 75% de eficiencia para un codón
selector dado, en más de aproximadamente 80% de eficiencia para un
codón selector dado, en más de aproximadamente 90% de eficiencia
para un codón selector dado, en más de aproximadamente 95% de
eficiencia para un codón selector dado, o en más de aproximadamente
99% o más de eficiencia para un codón selector dado.
Codón selector: El término "codón
selector" se refiere a los codones reconocidos por un
O-ARNt en el proceso de traducción y no típicamente
reconocidos por un ARNt endógeno. El ciclo de
anti-codón de O-ARNt reconoce el
codón selector en el mARN e incorpora su aminoácido, p. ej., un
aminoácido no natural, en este sitio en el polipéptido. Los codones
selectores pueden incluir, p. ej., codones de no sentido, tales como
los codones de paro, p. ej., codones ámbar, ocre, y ópalo; cuatro o
más codones base; codones derivados de pares base naturales o no
naturales y/o lo similar. Para un sistema dado, un codón selector
también puede incluir uno de los codones naturales de tres bases,
en donde el sistema endógeno no utiliza dicho codón natural de tres
bases, p. ej., un sistema que carece de un ARNt que reconoce el
codón natural de tres bases o un sistema en donde el codón natural
de tres bases es un codón raro.
ARNt supresor: Un ARNt supresor es un
ARNt que altera la lectura de un ARN mensajero (mARN) en un sistema
de traducción dado. Un ARNt supresor puede leerse a través de p.
ej., un codón de paro, un codón de cuatro bases, un codón raro y/o
lo similar.
Sistema de traducción: El término
"sistema de traducción" se refiere a los componentes necesarios
para incorporar un aminoácido que se presenta naturalmente en una
cadena creciente de polipéptido (proteína). Los componentes de un
sistema de traducción pueden incluir, p. ej., ribosomas, ARNts,
sintetasas, mARN y similares. Los componentes de la invención
pueden agregarse a un sistema de traducción in vivo o in
vitro. Un sistema de traducción puede ser una célula, ya sea
procariótica, p. ej., una célula de E. coli, una célula
Archael, etc., o eucariótica, p. ej., una célula de levadura,
mamífero, vegetal, insecto, etc.
Aminoácido no natural: Como se utiliza en
la presente, el término "aminoácido no natural" se refiere a
cualquier aminoácido, aminoácido modificado, y/o análogo de
aminoácido que no sea uno de los 20 aminoácidos que se presentan de
manera natural o seleno cisteína o pirrolisina.
Residuo sacárido: Como se utiliza en la
presente, el término "residuo sacárido" se refiere a residuos
de azúcar naturales y no naturales (i.e., un residuo de azúcar que
no se presenta naturalmente, p. ej., un residuo de azúcar que se
encuentra modificado, p. ej., en una o más posiciones hidroxilo o
amino, p. ej., dehidroxilado, deaminado, esterificado, etc., p.
ej., 2-deoxiGal es un ejemplo de un residuo de
azúcar no natural). El término "carbohidrato" tiene la fórmula
general (CH2O)n e incluye, pero no se limita a, p. ej.,
monosacáridos, disacáridos, oligosacáridos y polisacáridos. Los
oligosacáridos son cadenas compuestas de unidades de sacárido, que
se conocen alternativamente como azúcares. Las unidades de sacárido
pueden disponerse en cualquier orden y la unión entre dos unidades
de sacárido puede presentarse en cualquiera de aproximadamente diez
maneras diferentes.
Se utilizan en la presente las siguientes
abreviaturas:
- Ara
- = arabinosil;
- Fru
- = fructosil;
- Fuc
- = fucosil;
- Gal
- = galactosil;
- GalNAc
- = N-acetilgalactosaminil;
- Glc
- = glucosil;
- GlcNAc
- = N-acetilglucosaminil;
- Man
- = manosil; y
- NeuAc
- = sialil (típicamente N-acetilneuraminil).
Se considera que los oligosacáridos tienen un
extremo de reducción y un extremo de no reducción, ya sea o no que
el sacárido en el extremo de reducción sea de hecho un azúcar de
reducción. De acuerdo con la nomenclatura aceptada, los
oligosacáridos se ilustran en la presente con el extremo de no
reducción a la izquierda y el extremo de reducción a la derecha.
Todos los oligosacáridos descritos en la presente con el nombre o
abreviatura para el sacárido de no reducción (p. ej., Gal), seguido
por la configuración del enlace glicosídico (a o b), el enlace de
anillo, la posición de anillo del sacárido de reducción involucrado
en el enlace, y después el nombre o abreviatura del sacárido de
reducción (p. ej., GlcNAc). La unión entre dos azúcares puede
expresarse, por ejemplo, como 2,3,
2\rightarrow3,2-3, o (2,3). Las uniones naturales
y no naturales (p. ej., 1-2, 1-3,
1-4, 1-6, 2-3,
2-4, 2-6, etc.) entre dos azúcares
se incluyen en la invención. Cada sacárido es una piranosa.
El término "ácido siálico" (abreviado
"Sia") se refiere a cualquier miembro de una familia de
azúcares carboxilados de nueve carbonos. El miembro más común de la
familia del ácido siálico es el ácido
N-acetil-neuramínico (ácido
2-ceto-5-acetamido-3,5-dideoxi-D-glicero-D-galactononulopiranos-1-ónico)
(frecuentemente abreviado como Neu5Ac, NeuAc, o NANA). Un segundo
miembro de la familia es el ácido
N-glicolil-neuramínico (Neu5Gc o
NeuGc), en el cual el grupo N-acetilo de NeuAc se
encuentra hidroxilado. Un tercer miembro de la familia del ácido
siálico es el ácido
2-ceto-3-deoxi-nonulosónico
(KDN) (Nadano et al., (1986) J. Biol. Chem.
261:11550-11557; Kanamori et al., (1990) J.
Biol.Chem. 265:21811-21819. También se encuentran
incluidos los ácidos siálicos 9-sustituidos tales
como un 9-O-C1-C6
acil-Neu5Ac como
9-O-lactil-Neu5Ac o
9-O-acetil-Neu5Ac,
9-deoxi-9-fluoro-Neu5Ac
y
9-azido-9-deoxi-Neu5Ac.
Para revisión de la familia del ácido siálico, ver, p. ej., Varki
(1992) Glycobiology 2:25-40; Sialic Acids:
Chemistry, Metabolism and Function, R. Schauer, Ed.
(Springer-Verlag, New York (1992). La síntesis y
uso de los compuestos de ácido siálico en un procedimiento de
sialilación se describen, por ejemplo, en la solicitud
internacional WO 92/16640, publicada el 1 de octubre de 1992.
Los sustratos donantes para glicosiltransferasas
son azúcares nucleótidos activados. Tales azúcares activados
consisten generalmente de difosfato de uridina y guanosina, y
monofosfato de citidina, derivados de los azúcares en los cuales el
difosfato o monofosfato nucleósido sirve como un grupo de salida.
Los sistemas bacteriales, vegetales y de hongos pueden utilizar
algunas veces otros azúcares nucleótidos activados.
A menos que se defina de otra manera en la
presente o abajo en el resto de la especificación, todos los
términos técnicos y científicos utilizados en la presente tienen el
mismo significado comúnmente comprendido por los de experiencia
ordinaria en la técnica a la cual pertenece la invención.
La Figura 1 ilustra esquemáticamente ejemplos de
dos diagramas (una vía secuencial y una vía convergente) para unir
un residuo sacárido a un polipéptido que incluye un aminoácido no
natural.
La Figura 2 ilustra el análisis HPLC de la
reacción de acoplamiento entre el sacárido 1 de aminooxi (de la
Figura 1) y la proteína I mutante de dominio Z (de la Figura 1) que
contiene
p-acetil-L-fenilalanina
a 7 horas y 26 horas.
La Figura 3 ilustra el espectro
MALDI-FTICR MS de alta resolución de la proteína I
mutante de dominio Z (de la Figura 1), los miméticos II, III y IV
de glicoproteína (de la Figura 1). Se muestra el grupo isotópico 2+
de cada espectro.
La Figura 4 ilustra la expresión de la
mioglobulina mutante Gly4\rightarrowA (\sim18.5 kD). Las
proteínas se purificaron mediante cromatografía de afinidad Ni2+- y
se disolvieron mediante SDS-PAGE. El gel se coloreó
con plata.
La Figura 5 ilustra el análisis
MALDI-TOF del peso molecular de la mioglobulina
mutante Gly4\rightarrowA.
La Figura 6, Panel A, B y C ilustra la
caracterización de la mioglobulina mutante purificada conteniendo
un aminoácido glicosilado. El Panel A ilustra el enlace de una
lectina específica para GlcNAc, Banderiraea simplicifolia II
(BSII), para mioglobulina de tipo silvestre y glicomioglobulina. El
Panel B ilustra galactosiltransferasa on-blot
marcando glicomioglobulina con UDP-[H3]galactosa. El Panel C
ilustra el análisis cuantitativo de la reacción de
galactosiltransferasa, que se efectuó en solución, y la galactosa
radiomarcada se normalizó de modo que 1.0 corresponde a 100% de
transferencia.
Las modificaciones
post-traslacionales de proteínas regulan muchos
procesos biológicos, incluyendo el metabolismo, la transducción de
señal, y la expresión del gen. Sin embargo, las pruebas sintéticas
asociadas con la generación de poblaciones homogéneas de proteínas
selectivamente modificadas, han impedido estudios detallados de los
efectos de estas modificaciones en la estructura y función de la
proteína. Por ejemplo, la glicosilación es una de las más comunes
modificaciones post-traslacionales de las proteínas
en eucariotos y afecta el desdoblamiento de un amplio rango de
funciones de la proteína, y la secreción para el reconocimiento
biomolecular y la vida media en suero. Ver, p. ej., R.A. Dwek (1996)
Chem. Rev. 96:683. Aunque ha habido avances significativos en
nuestra comprensión de los efectos de la glicosilación, los papeles
específicos de las cadenas de oligosacáridos y las relaciones entre
sus estructuras y funciones apenas comienzan a comprenderse. Ver,
p. ej., C.R. Bertozzi, & L.L. Kiessling, (2001) Science
291:2357. La prueba principal es que las glicoproteínas se producen
típicamente como una mezcla de glicoformas, dificultando el
aislamiento de glicoformas únicas de fuentes naturales. Se han
desarrollado diversos métodos para sintetizar glicoformas
estructuralmente definidas, pero todas imponen severas
restricciones en el tamaño, cantidad y/o calidad de la glicoproteína
producida. Ver, p. ej., P. Sears, & C.H. Wong (2001) Science
291:2344; M. Wacker et al., (2002) Science 298:1790; B.G.
Davis (2002) Chem. Rev. 102:579; y H.C. Hang, & C.R. Bertozzi,
(2001) Acc. Chem. Res. 34:727. La invención resuelve este y otros
problemas, y proporciona glicoproteínas y miméticos de
glicoproteína, y métodos para la síntesis de glicoproteínas que
tienen patrones de glicosilación deseados. Las glicoproteínas y
miméticos de glicoproteínas de la invención tienen utilidad en la
producción de glicoformas de glicoproteínas terapéuticas y/o
facilitan los estudios en las estructuras y funciones de las
proteínas glicosiladas.
La invención proporciona métodos para sintetizar
glicoproteínas. En ciertas realizaciones, estos métodos implican la
incorporación dentro de la proteína de un aminoácido no natural que
comprende un primer grupo reactivo; y la reacción del primer grupo
reactivo con un segundo grupo reactivo que se encuentra unido a un
residuo sacárido, formando así una unión covalente y uniendo el
residuo sacárido a la proteína.
Se conoce una amplia variedad de grupos
reactivos adecuados por los expertos en la técnica. Tales grupos
reactivos adecuados pueden incluir, por ejemplo, grupos amino,
hidroxilo, carboxilo, carboxilato, carbonilo, alquenilo, alquinilo,
aldehído, éster, éter (p. ej., tioéter), amida, amina, nitrilo,
vinilo, sulfuro, sulfonilo, fosforilo, o similarmente químicamente
reactivos. Los grupos reactivos adecuados adicionales incluyen, pero
no se limitan a, maleimida, N-hidroxisuccinimida,
sulfo-N-hidroxisuccinimida, ácido
nitrilotriacético, hidroxilo activado, haloacetilo (p. ej.,
bromoacetilo, yodoacetilo), carboxilo activado, hidracida, epoxi,
aziridina, sulfonilcloruro, trifluorometildiaziridina,
piridildisulfuro, N-acil-imidazolo,
imidazolocarbamato, vinilsulfona, succinimidilcarbonato, arilazida,
anhídrido, diazoacetato, benzofenona, isotiocianato, isocianato,
imidoéster, fluorobenceno, biotina y avidina.
En algunas realizaciones, uno de los grupos
reactivos es un residuo electrofílico, y el segundo grupo reactivo
es un residuo nucleofílico. Tanto el residuo nucleofílico como el
residuo electrofílico pueden unirse a la cadena lateral del
aminoácido no natural; el grupo correspondiente se une entonces al
residuo sacárido. Los residuos electrofílicos adecuados que
reaccionan con residuos nucleofílicos para formar un enlace
covalente son conocidos por los expertos en la técnica. Tales
residuos electrofílicos incluyen, pero no se limitan a, p. ej., un
grupo carbonilo, un grupo sulfonilo, un grupo aldehído, un grupo
cetona, un grupo éster impedido, un grupo tioéster, un grupo imino
estable, un grupo epóxido, un grupo aziridina, etc. Los residuos
nucleofílicos adecuados que pueden reaccionar con residuos
electrofílicos son conocidos por los expertos en la técnica. Tales
nucleófilos incluyen, por ejemplo, aminas alifáticas o aromáticas,
tales como etilenodiamina. En otras realizaciones, el grupo
reactivo es -NR1-NH2(hidrazida),
-NR1(C=O)NR2NH2(semicarbazida),
-NR1(C=S)NR2NH2(tiosemicarbazida),
-(C=O)NR1NH2(carbonilhidrazida),
-(C=S)NR1NH2(tiocarbonilhidrazida),
-(SO2)NR1NH2(sulfonilhidrazida),
-NR1NR2(C=O)NR3NH2(carbazida),
-NR1NR2(C=S)NR3NH2(tiocarbazida),
-O-NH2(hidroxilamina), y similares, en donde
cada R1, R2 y R3 es independientemente H, o un residuo alquilo que
tiene de 1-6 carbonos, preferentemente H. En un
aspecto de la invención, el grupo reactivo es una hidrazida,
hidroxilamina, semicarbazida, carbohidrazida, una sulfonilhidrazida
o lo similar.
El producto de la reacción entre el residuo
nucleofílico y electrofílico típicamente incorpora los átomos
originalmente presentes en el residuo nucleofílico. Los enlaces
típicos obtenidos al reactivar los aldehídos o cetonas con los
residuos nucleofílicos incluyen productos de reacción tales como una
oxima, una amida, una hidrazona, una hidrazona reducida, una
carbohidrazona, una tiocarbohidrazona, una sulfonilhidrazona, una
semicarbazona, una tiosemicarbazona, o de funcionalidad similar,
dependiendo del residuo nucleofílico utilizado y del residuo
electrofílico (p. ej., aldehído, cetona, y/o lo similar) que se
reactiva con el residuo nucleofílico. Los enlaces con ácidos
carboxílicos se refieren típicamente como carbohidrazidas o como
ácidos hidroxámicos. Los enlaces con ácidos sulfónicos se refieren
típicamente como sulfonilhidrazidas o
N-sulfonilhidroxilaminas. El enlace resultante
puede estabilizarse subsecuentemente mediante reducción química.
En ciertas realizaciones, la glicoproteína se
sintetiza incorporando un aminoácido no natural, al cual se une un
residuo sacárido, en un polipéptido. Por ejemplo, puede utilizarse
una O-ARNt/O-RS ortogonal que
incorpora el aminoácido no natural con el residuo sacárido en una
cadena creciente de polipéptidos en respuesta a un codón selector.
Ver, p. ej., la sección en la presente titulada "Preparación de
Proteínas que Tienen un Aminoácido No Natural".
La invención proporciona métodos en los cuales
se glicosila adicionalmente un residuo sacárido enlazado con
aminoácidos o un aminoácido no natural que incluye un residuo. Estas
etapas de glicosilación se efectúan preferentemente enzimáticamente
utilizando, por ejemplo, una glicosiltransferasa, glicosidasa u otra
enzima conocida por los expertos en la técnica. En algunas
realizaciones, se realiza una pluralidad de etapas enzimáticas en
una sola mezcla de reacción que contiene dos o más
glicosiltransferasas diferentes. Por ejemplo, puede conducirse una
etapa de galactosilación y de sialización simultáneamente incluyendo
tanto sialiltransferasa como galactosiltransferasa en la mezcla de
reacción.
Para las síntesis de sacárido enzimáticas que
involucran reacciones glicosiltransferasa, las células
recombinantes de la invención contienen opcionalmente al menos un
gen heterólogo que codifica una glicosiltransferasa. Se conocen
muchas glicosiltransferasas, así como sus secuencias de
polinucleótido. Ver, p. ej., "The WWW Guide To Cloned
Glicosyltransferases", (disponible en la red en
www.vei-co.uk/TGN/gt_guide.htm). Las secuencias de
aminoácidos de glicosiltransferasa y las secuencias de nucleótidos
que codifican para glicosiltransferasas a partir de las cuales
pueden deducirse las secuencias de aminoácidos también se encuentran
en diversas bases de datos públicamente disponibles incluyendo
GenBank, Swiss-Prot, EMBL, y otras.
Las glicosiltransferasas que pueden emplearse en
las células de la invención incluyen, pero no se limitan a,
galactosiltransferasas, fucosiltransferasas, glucosiltransferasas,
una N-acetilgalactosaminiltransferasas,
N-acetilglucosaminiltransferasas,
glucuroniltransferasas, sialiltransferasas, manosiltransferasas,
transferasas de ácido glucurónico, transferasas de ácido
galacturónico, oligosacariltransferasas, y similares. Las
glicosiltransferasas adecuadas incluyen aquellas obtenidas de
eucariotas así como de procariotas.
Un aceptor para las glicosiltransferasas se
encontrará presente en la glicoproteína que va a modificarse
mediante los métodos de la invención. Los aceptores adecuados,
incluyen, por ejemplo, aceptores galactosil tales como
Gal\beta1,4GalNAc-, Gal\beta1,3GalNAc-,
lacto-N-tetraosa-,
Gal\beta1,3GlcNAc-, Gal\beta1,4GlcNAc-,
Gal\beta1,3Ara-,
Gal\beta1,6GlcNAc-, y Gal\beta1,4Glc-(lactosa). Otros aceptores conocidos por los expertos en la técnica (ver, p. ej., Paulson et al., (1978) J. Biol. Chem. 253:5617-5624). Típicamente, los aceptores forman parte de una cadena de residuo sacárido unida a la glicoproteína.
Gal\beta1,6GlcNAc-, y Gal\beta1,4Glc-(lactosa). Otros aceptores conocidos por los expertos en la técnica (ver, p. ej., Paulson et al., (1978) J. Biol. Chem. 253:5617-5624). Típicamente, los aceptores forman parte de una cadena de residuo sacárido unida a la glicoproteína.
Las cantidades o concentraciones de enzima se
expresan en Unidades de actividad, que es una medición del grado
inicial de catálisis. Una Unidad de actividad cataliza la formación
de 1 \mumol de producto por minuto a una temperatura dada
(típicamente 37ºC) y un valor pH (típicamente 7.5). De este modo 10
Unidades de una enzima es una cantidad catalítica de esa enzima en
donde 10 \mumols de sustrato se convierten en 10 \mumol de
producto en un minuto a una temperatura de 37ºC y a un valor pH de
7.5. Las enzimas pueden utilizarse libres en solución o pueden
unirse a un soporte tal como un polímero. La mezcla de reacción es
por tanto sustancialmente homogénea al principio, aunque puede
formarse un poco de precipitado durante la reacción.
Las reacciones de glicosilación incluyen, en
adición a la glicosiltransferasa y aceptor apropiado, un azúcar de
nucleótido activado que actúa como un donante de azúcar para la
glicosiltransferasa. Las reacciones también pueden incluir otros
ingredientes que facilitan la actividad de glicosiltransferasa.
Estos ingredientes pueden incluir un catión divalente (p. ej., Mg+2
o Mn+2), materiales necesarios para la regeneración ATP, iones de
fosfato, y solventes orgánicos. Las concentraciones y cantidades de
los varios reactivos utilizados en el proceso dependen de numerosos
factores incluyendo condiciones de reacción tales como temperatura y
valor pH, y la selección y cantidad de sacáridos aceptores que va a
glicosilarse. El medio de reacción también puede comprender
detergentes solubilizantes (p. ej., Triton o SDS) y solventes
orgánicos tales como metanol o etanol, si es necesario.
Los oligosacáridos producidos utilizando los
métodos de la invención pueden analizarse mediante métodos
conocidos por los expertos en la técnica. Por ejemplo, las unidades
de carbohidratos pueden separarse de los residuos de carbohidratos
mediante eliminación \beta alcalina, por ejemplo, y separarse del
polipéptido mediante filtración de gel. Los oligosacáridos
resultantes se separan uno del otro utilizando una o más técnicas
estándar, tales como filtración de gel, HPLC, cromatografía de capa
delgada, y cromatografía de intercambio de iones, o una combinación
de las mismas, y pueden analizarse completamente. El análisis
estructural completo de las unidades de oligosacárido purificadas
requiere la determinación de las unidades de monosacárido, su forma
de anillo, configuración (D o L), enlace anomérico (\alpha o
\beta), las posiciones de los enlaces entre los azúcares y su
secuencia. En adición, se establece la posición de todo grupo
subsecuente. Puede utilizarse análisis de metilación para
determinar las posiciones de los enlaces glicosídicos entre los
monosacáridos. La configuración anomérica de los residuos de azúcar
puede dirigirse utilizando, p. ej., espectroscopia 1H NMR. Las
condiciones y métodos utilizados para efectuar un análisis
estructural de carbohidratos completo se describen generalmente en
Beeley, Laboratory Techniques in Biochemistry and Molecular Biology,
eds. Burdon and Knippenberg, Elsevier, Amsterdam (1985), Hounsell,
"Glycoanalysis Protocols", Meth. Mol. Biol. Vol. 76, 1998, y
El Rassi Carbohydrate Análisis: High Performance Liquid
Chromatography and Capillary Electrophoresis, Elsevier Science
Ltd., Vol. 58 (1994).
Las técnicas adicionales para caracterizar
totalmente los azúcares de un oligosacárido incluyen
FAB-MS (bombardeo atómico
rápido-espectrometría de masa) y NMR (espectroscopia
de resonancia magnética nuclear, particularmente
1H-NMR y 13C-NMR). Estas técnicas
son complementarias. Ejemplos de cómo se utilizan estas técnicas
para caracterizar completamente la estructura de un oligosacárido
pueden encontrarse en el análisis por Spellman et al., (1989)
J. Biol. Chem. 264:14100, y Stanley et al., (1988) J. Biol.
Chem. 263:11374. Otros métodos incluyen bombardeo atómico rápido de
ión positivo-espectroscopia de masa
(FAB-MS) y análisis de metilación mediante
cromatografía de gas-espectroscopia de masa de
impacto de electrón (GC/EI-MS) (ver solicitud EPO
No. 89305153.2).
Para sintetizar una glicoproteína in
vivo, se puede introducir en un vector de expresión un
polinucleótido que codifica un polipéptido de interés. El
polinucleótido también puede incluir uno o más codones selectores
en las posiciones en las cuales se desea la unión de un residuo
sacárido. El vector de expresión se introduce en una célula huésped
que incluye un aminoácido no natural, p. ej., un aminoácido no
natural que comprende un residuo en donde puede anexarse un residuo
sacárido, tal como un aminoácido derivado de aldehído o ceto, o un
aminoácido no natural que incluye un residuo sacárido; un ARNt
ortogonal que reconoce el codón selector; y una ARNt sintetasa de
aminoacilo ortogonal (O-RS) que cataliza la unión
del aminoácido no natural al ARNt ortogonal. La
O-RS une el aminoácido no natural al ARNt ortogonal,
que entonces introduce el aminoácido no natural dentro de la
proteína naciente.
En algunas realizaciones, la célula huésped
incluye además uno o más polinucleótidos que codifican para
glicosiltransferasas. Tales células huésped pueden catalizar la
adición de uno o más azúcares al residuo sacárido que se encuentra
unido al aminoácido no natural.
Se encuentran disponibles varios métodos muy
conocidos para introducir ácidos nucleicos objetivo en células
bacteriales, cualquiera de los cuales puede utilizarse en la
invención. Estos incluyen: fusión de las células recipiente con
protoplastos bacteriales que contienen el ADN, electroporación,
bombardeo de proyectiles, e infección con vectores virales, etc.
Las células bacteriales pueden utilizarse para amplificar el número
de plásmidos que contienen estructuras de ADN de esta invención. Las
bacterias se cultivan hasta la fase logarítmica y los plásmidos
dentro de las bacterias pueden aislarse mediante una variedad de
métodos conocidos en la técnica (ver, por ejemplo, Sambrook,
infra). En adición, se encuentra comercialmente disponible
una abundancia de equipos para la purificación de plásmidos de
bacterias (ver, p. ej., EasyPrep^{TM}, FlexiPrep^{TM}, ambos de
Pharmacia Biotech; StrataClean^{TM}, de Stratagene; y
QIAprep^{TM} de Qiagen). Los plásmidos aislados y purificados se
manipulan entonces adicionalmente para producir otros plásmidos,
utilizados para transfectar células o incorporados en vectores
relacionados para infectar
organismos.
organismos.
Las células huésped diseñadas pueden cultivarse
en un medio nutriente convencional modificado según sea apropiado
para actividades tales como, por ejemplo, exploración de etapas,
activación de promotores o selección de transformantes. Estas
células opcionalmente pueden cultivarse en organismos
transgénicos.
Otras referencias útiles, p. ej., para aislar y
cultivar células (p. ej., para subsecuente aislamiento del ácido
nucleico) incluyen Freshney (1994) Culture of Animal Cells, a Manual
of Basic Technique, tercera edición, Wiley-Liss,
New York y las referencias citadas en los mismos; Payne et
al., (1992) Plant Cell and Tissue Culture in Liquid Systems
John Wiley & Sons, Inc., New York, NY; Gamborg and Phillips
(eds) (1995) Plant Cell Tissue and Organ Culture; Fundamental
Methods Springer Lab Manual, Springer-Verlag (Berlin
Heidelberg New York) y Atlas and Parks (eds) The Handbook of
Microbiological Media (1993) CRC Press, Boca Raton, FL.
Textos generales que describen las técnicas
biológicas moleculares incluyen Berger and Kimmel, Guide To
Molecular Cloning Techniques, Methods in Enzymology volumen 152
Academic Press, Inc., San Diego, CA (Berger); Sambrook et
al., Molecular Cloning-A Laboratory Manual (3º
Ed), Vol. 1-3 Cold Spring Harbor Laboratory, Cold
Spring Harbor, New York, 2001 ("Sambrook") y Current Protocols
in Molecular Biology F.M. Ausubel et al., eds.,Current
Protocols, una asociación de capitales entre Greene Publishing
Associates, Inc. y John Wiley & Sons, Inc., (suplementado a
través del 2003) ("Ausubel")). Estos textos describen la
mutagénesis, el uso de vectores, promotores y muchos otros tópicos
relevantes relacionados con, p. ej., la generación de genes que
incluyen codones selectores para la producción de proteínas que
incluyen aminoácidos no naturales, ARNts ortogonales, sintetasas
ortogonales, y pares de los mismos.
Las características de la invención incluyen la
producción de glicoproteínas que incluyen un aminoácido no natural,
p. ej., un aminoácido no natural que comprende un residuo en donde
puede anexarse un residuo sacárido, o un aminoácido no natural que
incluye un residuo sacárido. En ciertas realizaciones, la invención
implica la producción de glicoproteínas que incluyen uno o más
aminoácidos no naturales a los cuales se encuentran unidos grupos
reactivos adecuados que pueden formar un enlace covalente al
reactivarse con un segundo grupo reactivo. En algunas
realizaciones, los aminoácidos no naturales comprenden un residuo
electrofílico, p. ej., aminoácidos aldehído o derivados de ceto, y
los residuos aldehído o ceto se reactivan con un residuo
nucleofílico para anexar un residuo sacárido al polipéptido o
proteína. Las proteínas que contienen aminoácidos no naturales se
sintetizan mediante células en las cuales la maquinaria biosintética
de la proteína se ha alterado para acomodar aminoácidos adicionales
genéticamente codificados utilizando pares ortogonales de ARNt/ARNt
sintetasa de aminoacilo
(O-ARNt/O-RS). En particular, las
células incluyen ARNt ortogonal que reconoce un codón selector (p.
ej., codones de paro, codones de cuatro bases, y similares), y una
ARNt sintetasa de aminoacilo ortogonal que puede anexar un
aminoácido derivado de aldehído o ceto al ARNt ortogonal.
En ciertas realizaciones, la invención implica
la producción de glicoproteínas que incluyen uno o más aminoácidos
no naturales que incluye un residuo sacárido. Las proteínas que
contienen aminoácidos no naturales se sintetizan por medio de
células en las cuales la maquinaria biosintética de la proteína se
ha alterado para acomodar aminoácidos adicionales genéticamente
codificados utilizando pares ortogonales de ARNt/ARNt sintetasa de
aminoacilo (O-ARNt/O-RS). En
particular, las células incluyen un ARNt ortogonal que reconoce un
codón selector (p. ej., codones de paro, codones de cuatro bases, y
similares), y una ARNt sintetasa de aminoacilo ortogonal que puede
anexar el aminoácido no natural con el residuo sacárido al ARNt
ortogonal.
Esta tecnología permite la incorporación
específica en el sitio de los aminoácidos no naturales directamente
en proteínas in vivo. De manera importante, el aminoácido no
natural se agrega al repertorio genético, en lugar de sustituirse
por uno de los 20 aminoácidos comunes. La proteína puede tener uno o
múltiples (iguales o diferentes) aminoácidos no naturales en una
posición particular en la proteína. A diferencia de los métodos
anteriores para derivatizar proteínas, el uso de pares de
O-ARNt/O-RS permite producir
proteínas que tienen un aminoácido no natural en solo uno de los
sitios en los cuales se presenta un aminoácido particular en una
proteína, según se desee, en lugar de derivatizar ese aminoácido
particular en cada sitio en el cual se presenta en una
proteína.
Para producir una glicoproteína, pueden
utilizarse células huésped y organismos adaptados para la
incorporación in vivo del aminoácido no natural a través de
pares de ARNt/RS ortogonales. Las células huésped se diseñan
genéticamente (p. ej., se transforman, transducen o transfectan) con
uno o más vectores que expresan el ARNt ortogonal, la ARNt
sintetasa ortogonal, y un vector que codifica la proteína que va a
derivatizarse. Cada uno de estos componentes puede encontrarse en
el mismo vector, o cada uno puede encontrarse en un vector separado,
dos componentes pueden encontrarse en un vector y el tercer
componente en un segundo vector. El vector puede encontrarse, por
ejemplo, en forma de un plásmido, una bacteria, un virus, un
polinucleótido desnudo, o un polinucleótido conjugado.
Las regiones de codificación para el ARNt
ortogonal, la ARNt sintetasa ortogonal y la proteína que va a
derivatizarse se encuentran operablemente enlazadas a elementos de
control de expresión del gen que son funcionales en la célula
huésped deseada. Los vectores típicos contienen terminadores de
transcripción y traducción, secuencias de iniciación de
transcripción y traducción, y promotores útiles para la regulación
de la expresión del ácido nucleico objetivo particular. Los
vectores opcionalmente comprenden casetes genéricos de expresión
que contienen al menos una secuencia de terminación independiente,
secuencias que permiten la replicación del casete en eucariotos, o
procariotos, o en ambos (p. ej., vectores de conexión) y marcadores
de selección para sistemas tanto procarióticos como eucarióticos.
Los vectores son adecuados para replicación y/o integración en
procariotos, eucariotos, o preferentemente en ambos. Ver Giliman
& Smith, Gene 8:81 (1979); Roberts et al., Nature,
328:731 (1987); Schneider, B., et al., Protein Expr. Purif.
6435:10 (1995); Berger and Kimmel, supra, Sambrook, supra, y
Ausubel, supra. Un catálogo de Bacterias y Bacteriófagos útil
para clonación se proporciona, p. ej., por la ATCC, p. ej., The
ATCC Catalogue of Bacteria and Bacteriophage (1992) Gherna et
al., (eds.) publicado por la ATCC. También se encuentran
procedimientos básicos adicionales para secuenciado, clonación y
otros aspectos de la biología molecular y consideraciones teóricas
subyacentes en Watson et al., (1992) Recombinant DNA Second
Edition Scientific American Books, NY. Proteins and Polypeptides of
Interest.
Por ejemplo, los métodos para producir
glicoproteínas incluyen el crecimiento de la célula en un medio
apropiado, en donde la célula comprende un ácido nucleico que
comprende al menos un codón selector y codifica para una proteína,
proporcionando un aminoácido no natural, p. ej., un aminoácido no
natural que comprende un residuo en donde puede anexarse un residuo
sacárido, o un aminoácido no natural que incluye un residuo
sacárido, e incorporar el aminoácido no natural en la posición
especificada en la proteína durante la tanslación del ácido
nucleico con el al menos un codón selector, produciendo así la
proteína. La célula comprende además: un ARNt ortogonal
(O-ARNt) que funciona en la célula y reconoce el
codón selector; y una ARNt sintetasa de aminoacilo ortogonal
(O-RS) que preferentemente aminoacila el
O-ARNt con el aminoácido no natural, p. ej., un
aminoácido no natural que comprende un residuo en donde puede
anexarse un residuo sacárido, o un aminoácido no natural que
incluye un residuo sacárido. La publicación WO 2002/085923, titulada
"IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS"
describe este proceso y se incorpora en la presente por referencia.
Por ejemplo, cuando un par de
O-ARNt/O-RS se introduce en un
huésped el par conduce a la incorporación in vivo del
aminoácido no natural, p. ej., un aminoácido no natural que
comprende un residuo en donde puede anexarse un residuo sacárido, o
un aminoácido no natural que incluye un residuo sacárido, que puede
agregarse de manera exógena al medio de crecimiento, en una
proteína, en respuesta a un codón selector. Opcionalmente, las
composiciones de la invención pueden encontrarse en un sistema de
traducción in vitro, o en sistema(s) in
vivo.
Una célula de la invención proporciona la
capacidad de sintetizar o producir glicoproteínas en muy útiles
cantidades. En un aspecto, la composición opcionalmente incluye, p.
ej., al menos 10 microgramos, al menos 50 microgramos, al menos 75
microgramos, al menos 100 microgramos, al menos 200 microgramos, al
menos 250 microgramos, al menos 1 miligramo, al menos 10 miligramos
o más de la glicoproteína, o una cantidad que puede lograrse con
métodos de producción de proteína in vivo (se proporcionan en
la presente detalles acerca de la producción y purificación de
proteínas). En otro aspecto, la proteína se encuentra opcionalmente
presente en la composición a una concentración de p. ej., al menos
10 microgramos de proteína por litro, al menos 50 microgramos de
proteína por litro, al menos 75 microgramos de proteína por litro,
al menos 100 microgramos de proteína por litro, al menos 200
microgramos de proteína por litro, al menos 250 microgramos de
proteína por litro, al menos 500 microgramos de proteína por litro,
al menos 1 miligramo de proteína por litro, o al menos 10
miligramos de proteína por litro o más, en, p. ej., un lisado
celular, un amortiguador, un amortiguador farmacéutico, u otra
suspensión líquida (p. ej., en un volumen, p. ej., de cualquiera
desde aproximadamente 1 nl hasta aproximadamente 100 l). Es una
característica de la invención la producción de grandes cantidades
(p. ej., mayores que las típicamente posibles con otros métodos, p.
ej., traducción in vitro) de una proteína en una célula
incluyendo al menos un aminoácido no natural, p. ej., un aminoácido
no natural que comprende un residuo en donde puede anexarse un
residuo sacárido, o un aminoácido no natural que incluye un residuo
sacárido.
Puede realizarse la incorporación de un
aminoácido no natural, p. ej., un aminoácido no natural que
comprende un residuo en donde puede anexarse un residuo sacárido, o
un aminoácido no natural que incluye un residuo sacárido, para, p.
ej., cambios de diseño en la estructura y/o función de la proteína,
p. ej., para cambiar el tamaño, acidez, nucleofilicidad, enlace de
hidrógeno, hidrofobicidad, accesibilidad de sitios objetivo de
proteasa, acceso de objetivo a un residuo de proteína, etc. Las
proteínas que incluyen un aminoácido no natural, p. ej., un
aminoácido no natural que comprende un residuo en donde puede
anexarse un residuo sacárido, o un aminoácido no natural que
incluye un residuo sacárido, puede tener propiedades catalíticas o
físicas mejoradas, o incluso completamente nuevas. Por ejemplo, las
siguientes propiedades se modifican opcionalmente por la inclusión
de un aminoácido no natural, p. ej., un aminoácido no natural que
comprende un residuo en donde puede anexarse un residuo sacárido, o
un aminoácido no natural que incluye un residuo sacárido en una
proteína: toxicidad, biodistribución, propiedades estructurales,
propiedades espectroscópicas, propiedades químicas y/o
fotoquímicas, capacidad catalítica, vida media (p. ej., vida media
en suero), capacidad para reaccionar con otras moléculas, p. ej.,
covalentemente o no covalentemente, y similares. Son útiles las
composiciones que incluyen proteínas que incluyen al menos un
aminoácido no natural, p. ej., un aminoácido no natural que
comprende un residuo en donde puede anexarse un residuo sacárido, o
un aminoácido no natural que incluye un residuo sacárido, p. ej.,
para nuevas terapias, diagnósticos, enzimas catalíticas, enzimas
industriales, enlace de proteínas (p. ej., anticuerpos), y p. ej.,
el estudio de la estructura y función de proteínas. Ver, p. ej.,
Dougherty, (2000) Unnatural Amino Acids as Probes of Protein
Structure and Function, Current Opinion in Chemical Biology,
4:645-652.
En un aspecto de la invención, una composición
incluye al menos una proteína con al menos uno, p. ej., al menos
dos, al menos tres, al menos cuatro, al menos cinco, al menos seis,
al menos siete, al menos ocho, al menos nueve, o al menos diez o
más aminoácidos no naturales, p. ej., un aminoácido no natural que
comprende un residuo en donde puede anexarse un residuo sacárido, o
un aminoácido no natural que incluye un residuo sacárido, y/o que
incluye otro aminoácido no natural. Los aminoácidos no naturales
pueden ser el mismo o diferente, p. ej., puede haber 1, 2, 3, 4, 5,
6, 7, 8, 9, o 10 o más sitios diferentes en la proteína que
comprenden 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más aminoácidos no
naturales diferentes. En otro aspecto, una composición incluye una
proteína con al menos uno, pero menos que todos, de un aminoácido
particular presente en la proteína sustituido con el aminoácido no
natural, p. ej., un aminoácido no natural que comprende un residuo
en donde puede anexarse un residuo sacárido, o un aminoácido no
natural que incluye un residuo sacárido. Para una proteína dada con
más de un aminoácido no natural, los aminoácidos no naturales pueden
ser idénticos o diferentes (p. ej., la proteína puede incluir dos o
más tipos diferentes de aminoácidos no naturales, o puede incluir
dos del mismo aminoácido no natural). Para una proteína dada con
más de dos aminoácidos no naturales, los aminoácidos no naturales
pueden ser el mismo, diferente, o una combinación de múltiples
aminoácidos no naturales del mismo tipo con al menos un aminoácido
no natural diferente.
Esencialmente cualquier proteína (o porción de
la misma) que incluye un aminoácido no natural p. ej., un
aminoácido no natural que comprende un residuo en donde se anexa un
residuo sacárido, tal como un aminoácido derivado de aldehído o
ceto, o un aminoácido no natural que incluye un residuo sacárido (y
cualquier ácido nucleico correspondiente, p. ej., que incluye uno o
más codones selectores) puede producirse utilizando las
composiciones y métodos en la presente. No se ha intentado
identificar los cientos de miles de proteínas conocidas, todas las
cuales pueden modificarse para incluir uno o más aminoácidos no
naturales, p. ej., adaptando cualquier método de mutación
disponible para incluir uno o más codones selectores apropiados en
un sistema relevante de traducción. Los depositarios de secuencia
comunes para proteínas conocidas incluyen GenBank EMBL, DDBJ y el
NCBI. Otros depositarios pueden identificarse fácilmente buscando en
internet.
Típicamente, las proteínas son, p. ej., al menos
60%, al menos 70%, al menos 75%, al menos 80%, al menos 90%, al
menos 95%, o al menos 99% o más idénticas a cualquier proteína
disponible (p. ej., proteína terapéutica, una proteína de
diagnóstico, una enzima industrial o una porción de las mismas, y
similares), y comprenden uno o más aminoácidos no naturales. Pueden
encontrarse ejemplos de proteínas terapéuticas, de diagnóstico y
otras que pueden modificarse para comprender uno o más aminoácidos
no naturales, p. ej., un aminoácido no natural que comprende un
residuo en donde se anexa un residuo sacárido, o un aminoácido no
natural que incluye un residuo sacárido, pero sin limitarse a
aquellos en la WO 2002/085923, supra. Ejemplos de proteínas
terapéuticas, de diagnóstico y otras que pueden modificarse para
comprender uno o más aminoácidos no naturales que comprenden un
aminoácido, en donde un residuo sacárido se enlaza y/o un aminoácido
no natural que incluye un residuo sacárido, incluyen, pero no se
limitan a, p. ej., alfa-1 antitripsina,
angiostatina, factor antihemolítico, anticuerpos (abajo se
encuentran detalles adicionales acerca de los anticuerpos),
apolipoproteína, apoproteína, factor natriurético atrial,
polipéptido natriurético atrial, péptidos atriales, quimiosinas
C-X-C (p. ej., T39765,
NAP-2, ENA-78,
Gro-\alpha, Gro-\beta,
IP-10, GCP-2, NAP-4,
SDF-1, PF4, MIG), calcitonina, quimiosinas CC (p.
ej., proteína-1 quimioatrayente de monocitos,
proteína-2 quimioatrayente de monocitos,
proteína-3 quimioatrayente de monocitos,
proteína-1 alfa inflamatoria de monocitos,
proteína-1 beta inflamatoria de monocitos, RANTES
I309, R83915, R91733, HCC1, T58847, D31065, T64262, ligando CD40,
ligando C-kit, colágeno, factor de estimulación de
colonia (CSF), factor 5a de complemento, inhibidor de complemento,
receptor 1 de complemento, citosinas, (p. ej.,
péptido-78 epitelial de activación de neutrófilo,
GRO\alpha/MGSA, GRO\beta, GROg, MIP-1\alpha,
MIP-1\delta, MCP-1), factor de
crecimiento epidérmico (EGF), eritropoyetina ("EPO",
representando un objetivo preferido para la modificación mediante
la incorporación de uno o más aminoácidos no naturales). Toxinas de
exfoliación A y B, Factor IX, Factor VII, Factor VIII, Factor X,
factor de crecimiento de fibroblasto (FGF), fibrinogen,
fibronectin, G-CSF, GM-CSF,
glucocerebrosidasa, gonadotropina, factores de crecimiento,
proteínas Hedgehog (p. ej., Sonic, Indian, Desert), hemoglobina,
factor de crecimiento de hepatocitos (HGF), hirudina, albúmina de
suero humano, insulina, factor de crecimiento similar a la insulina
(IGF), interferones (p. ej., IFN-\alpha,
IFN-\beta, IFN-g), interleucinas
(p. ej., IL-1, IL-2,
IL-3, IL-4, IL-5,
IL-6, IL-7, IL-8,
IL-9, IL-10, IL-11,
IL-12, etc.) factor de crecimiento de queratinocito
(KGF), lactoferrina, factor inhibidor de leucemia, luciferasa,
neurturina, factor inhibidor de neutrófilo (NIF), oncostatina M,
proteína osteogénica, hormona paratiroidea,
PD-ECSF, PDGF, hormonas de péptido (p. ej., hormona
humana del crecimiento, pleyotropina, proteína A, Proteína G,
exotoxinas pirogénicas A, B y C, relaxina, renina, SCF, receptor 1
de complemento soluble, I-CAM 1 soluble, receptores
solubles de interleucina (IL, 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12,
13, 14, 15), receptor soluble TNF, somatomedina, somatostatina,
somatotropina, estreptoquinasa, superantígenos, i.e., enterotoxinas
estafilococales (SEA; SEB, SEC1, SEC2, SEC3, SED, SEE), dismutasa
superóxido (SOD), toxina del síndrome de choque tóxico
(TSST-1), alfa 1 timosina, activador plasminógeno de
tejido, factor beta de necrosis tumoral (TNF beta), receptor del
factor de necrosis tumoral (TNFR), factor alfa de necrosis tumoral
(TNF alfa), factor de crecimiento endotelial vascular (VEGEF),
uroquinasa y muchas otras.
Una clase de proteínas que pueden prepararse
utilizando las composiciones y métodos para la incorporación in
vivo de un aminoácido no natural, p. ej., un aminoácido no
natural que comprende un residuo en donde puede anexarse un residuo
sacárido, o un aminoácido no natural que incluye un residuo sacárido
descrito en la presente, incluye moduladores transcripcionales o
una porción de los mismos. Ejemplos de moduladores transcripcionales
incluyen genes y proteínas de modulador transcripcional que modulan
el crecimiento celular, la diferenciación, regulación o lo similar.
Los moduladores transcripcionales se encuentran en procariotos,
virus y eucariotos, incluyendo hongos, plantas, levaduras,
insectos, y animales, incluyendo mamíferos, proporcionando un amplio
rango de objetivos terapéuticos. Se apreciará que la expresión y
los activadores transcripcionales regulan la transcripción mediante
muchos mecanismos, p. ej., enlazándose a receptores, estimulando una
cascada de señal de transducción, regulando la expresión de
factores de transcripción, enlazándose a promotores y mejoradores,
enlazándose a proteínas que se enlazan a promotores y mejoradores,
desenrollando ADN, dividiendo pre-mARN,
poliadenilando el ARN, y degradando el ARN.
Una clase de proteínas de la invención (p. ej.,
proteínas con uno o más aminoácidos no naturales que comprenden un
aminoácido, en donde se enlaza un residuo sacárido, y/o un
aminoácido no natural que incluye un residuo sacárido) incluye
activadores de expresión tales como citosinas, moléculas
inflamatorias, factores de crecimiento, sus receptores, y productos
oncógenos, p. ej., interleucinas (p. ej., IL-1,
IL-2, IL-8, etc.), interferones,
FGF, IGF-I, IGF-II, FGF, PDGF, TNF,
TGF-\alpha, TGF-\beta, EGF, KGF,
SCF/c-Kit, CD40L/CD40,
VLA-4/VCAM-1,
ICAM-1/LFA-1, e hialurin/CD44;
moléculas de señal de transducción y los productos oncógenos
correspondientes, p. ej., Mos, Ras, Raf, y Met; y activadores y
supresores transcripcionales, p. ej., p53, Tat, Fos, Myc, Jun, Myb,
Rel y receptores de hormona esteroide tales como aquellos para
estrógeno, progesterona, testosterona, aldosterona, el ligando del
receptor LDL y corticosterona.
También se proporcionan mediante la invención
enzimas (p. ej., enzimas industriales) o porciones de las mismas
con al menos un aminoácido no natural, p. ej., un aminoácido no
natural que comprende un residuo en donde se anexa un residuo
sacárido, o un aminoácido no natural que incluye un residuo
sacárido. Ejemplos de enzimas incluyen, pero no se limitan a, p.
ej., amidasas, aminoácido racemasas, acilasas, dehalogenasas,
dioxigenasas, diarilpropano peroxidasas, epimerasas, epóxido
hidrolasas, esterasas, isomerasas, quinasas, glucosa isomerasas,
glicosidasas, glicosil transferasas, haloperoxidasas, monooxigenasas
(p. ej., p450s), lipasas, lignina peroxidasas, nitrilo hidratasas,
nitrilasas, proteasas, fosfatasas, subtilisinas, transaminasa y
nucleasas.
Muchas proteínas que pueden modificarse de
acuerdo con la invención se encuentran disponibles comercialmente
(ver, p. ej., el catálogo y lista de precios de Sigma BioSciences
2002), y las secuencias y genes de proteína correspondientes y
típicamente, muchas de sus variantes son muy conocidas (ver, p. ej.,
GenBank). Cualquiera de ellas puede modificarse mediante la
inserción de uno o más aminoácidos no naturales que comprende un
aminoácido, en donde se enlaza un residuo sacárido o que incluye un
aminoácido no natural que incluye un residuo sacárido de acuerdo
con la invención, p. ej., para alterar la proteína con respecto a
una o más propiedades terapéuticas, de diagnóstico, o enzimáticas
de interés. Ejemplos de las propiedades terapéuticamente relevantes
incluyen la vida media en suero, la vida media en almacenamiento,
estabilidad, inmunogenicidad, actividad terapéutica, detectabilidad
(p. ej., mediante la inclusión de grupos indicadores (p. ej., marcas
o sitios de enlace de marcas) en los aminoácidos no naturales,
especificidad, reducción de LD50 u otros efectos secundarios, la
capacidad para entrar al cuerpo a través del tracto gástrico (p.
ej., disponibilidad oral), o lo similar. Ejemplos de las
propiedades diagnósticas relevantes incluyen la vida media en
almacenamiento, estabilidad, actividad diagnóstica, detectabilidad,
especificidad o lo similar. Ejemplos de las propiedades enzimáticas
relevantes incluyen la vida media en almacenamiento, estabilidad,
especificidad, actividad enzimática, capacidad de producción, o lo
similar.
También puede modificarse una variedad de otras
proteínas para incluir uno o más de los aminoácidos no naturales de
la invención. Por ejemplo, la invención puede incluir la sustitución
de uno o más aminoácidos naturales en una o más proteínas de vacuna
con un aminoácido no natural que comprende un aminoácido, en donde
un residuo sacárido se enlaza, o mediante la incorporación de un
aminoácido no natural que incluye un residuo sacárido, p. ej., en
proteínas de hongos infecciosos, p. ej., especies Aspergillus,
Candida; bacterias, particularmente E. coli que sirve de modelo
para bacterias patogénicas, así como bacterias médicamente
importantes tales como Staphylococci (p. ej., aureus), o
Streptococci (p. ej., pneumoniae); protozoos tales como esporozoos
(p. ej., Plasmodia), rizópodos (p. ej., Entamoeba) y flagelados
(tripanosoma, Leishmania, Tricomonas, Giardia, etc.); virus tales
como los virus (+) de ARN (ejemplos incluyen Poxvirus p. ej.,
vaccinia; Picornavirus, p. ej., polio; Togavirus, p. ej., rubella;
Flavivirus, p. ej., HCV; y Coronavirus), virus (-) de ARN (p. ej.,
Rhabdovirus, p. ej., VSV; Paramixovirus, p. ej., RSV;
Ortomixovirus, p. ej., influenza; Bunyavirus; y Arenavirus), virus
dsADN (Reovirus, por ejemplo), virus de ARN a ADN, i.e., Retrovirus,
p. ej., VIH y HTLV y ciertos virus de ADN a ARN tales como
Hepatitis B.
Las proteínas agrícolamente relacionadas tales
como proteínas de resistencia a insectos (p. ej., las proteínas
Cry), almidón y enzimas de producción de lípidos, toxinas vegetales
y de insectos, proteínas de resistencia a las toxinas, proteínas de
detoxificación de micotoxina, enzimas de crecimiento vegetal (p.
ej., Ribulosa 1,5-Bifosfato Carboxilasa/Oxigenasa,
"RUBISCO"), lipoxigenasa (LOX), y Fosfoenolpiruvato (PEP)
carboxilasa son también objetivos adecuados para la modificación
mediante la incorporación de aminoácidos no naturales y/o las
adiciones de sacárido de la invención.
En ciertas realizaciones, la proteína o
polipéptido de interés (o una porción del mismo) en los métodos y/o
composiciones de la invención se codifica por un ácido nucleico.
Típicamente, el ácido nucleico comprende al menos un codón
selector, al menos dos codones selectores, al menos tres codones
selectores, al menos cuatro codones selectores, al menos cinco
codones selectores, al menos seis codones selectores, al menos siete
codones selectores, al menos ocho codones selectores, al menos
nueve codones selectores, diez o más codones selectores.
Debido a que los glicopolipéptidos de la
invención proporcionan una variedad de nuevas secuencias de
polipéptido (p. ej., que comprenden un aminoácido no natural que
comprende un aminoácido, en donde puede enlazarse un residuo
sacárido, o un aminoácido no natural que incluye un residuo sacárido
en el caso de proteínas sintetizadas en los sistemas de traducción
en la presente, o, p. ej., en el caso de las nuevas sintetasas,
nuevas secuencias de aminoácidos estándar), los glicopolipéptidos
también proporcionan nuevas características estructurales que
pueden reconocerse, p. ej., en ensayos inmunológicos. La generación
de antisueros, que específicamente se enlazan a los polipéptidos de
la invención, así como de los polipéptidos que se enlazan por tales
antisueros, son una característica de la invención. El término
"anticuerpo", como se utiliza en la presente, incluye, pero no
se limita a un polipéptido sustancialmente codificado por un gen de
inmunoglobulina o genes de inmunoglobulina, o fragmentos de los
mismos que se enlazan específicamente y reconocen un analito
(antígeno). Los ejemplos incluyen anticuerpos policlonales,
monoclonales, quiméricos, y de cadena única, y similares. Los
fragmentos de inmunoglobulinas, incluyendo fragmentos Fab y
fragmentos producidos por una biblioteca de expresión, incluyendo
imagen fago, también se encuentran incluidos en el término
"anticuerpo" como se utilizan en la presente. Ver, p. ej.,
Paul, Fundamental Immunology, 4ª Ed. 1999, Raven Press, New York,
para la estructura del anticuerpo y la terminología.
Por ejemplo, la invención incluye proteínas
sintetasa que se enlazan específicamente a, o que son
específicamente inmunorreactivas con, un anticuerpo o antisuero
generado contra un inmunógeno que comprende una secuencia de
aminoácidos sintetasa seleccionados de uno o más de aquellos en las
varias secuencias en la presente. Para eliminar la reactividad
cruzada con otros homólogos, el anticuerpo o antisuero se sustrae
con sintetasas disponibles, tales como Methanococcus jannaschii de
tipo silvestre (M. jannaschii) tirosil sintetasa (TyrRS), o una
sintetasa artificial conocida, tal como cualquiera de aquellas en
la WO 2002/085923. Cuando la M. jannaschii tirosil sintetasa de
tipo silvestre (TyrRS), o la secuencia previa, corresponde a un
ácido nucleico, se genera opcionalmente un polipéptido codificado
por el ácido nucleico y se utiliza para propósitos de sustracción de
anticuerpo/antisuero.
En un formato típico, el inmunoanálisis utiliza
antisuero policlonal levantado en contra de uno o más polipéptidos
que comprenden una o más de las secuencias sintetasa de la presente,
o una subsecuencia sustancial de la misma (i.e., al menos
aproximadamente 30% de la secuencia de longitud total
proporcionada). El conjunto de inmunógenos de polipéptido
potenciales derivados de estas secuencias se refiere colectivamente
abajo como "polipéptidos inmunogénicos". Los antisueros
resultantes se seleccionan opcionalmente para tener baja reactividad
cruzada contra los homólogos de sintetasa de control (TyrRS de tipo
silvestre, y/o las sintetasas en la WO 2002/085923) y se retira
toda reactividad cruzada, p. ej., mediante inmunoabsorción, con uno
o más de los homólogos de sintetasa de control, previo al uso de un
antisuero policlonal en el inmunoanálisis.
A fin de producir antisueros para su uso en un
inmunoanálisis, se produce y se purifica uno o más de los
polipéptidos inmunogénicos como se describe en la presente. Por
ejemplo, puede producirse proteína recombinante en una célula
recombinante. Una cepa criada de la misma familia de ratones
(utilizada en este ensayo debido a que los resultados son más
reproducibles dada la virtual identidad genética de los ratones) se
inmuniza con la(s) proteína(s) inmunogénica(s)
en combinación con un adyuvante estándar, tal como el adyuvante de
Freund, y un protocolo estándar para inmunización de ratones (ver,
p. ej., Harlow y Lane (1988) Antibodies, A Laboratory Manual, Cold
Spring Harbor Publications, New York, para una descripción estándar
de la generación de anticuerpos, formatos de inmunoanálisis y
condiciones que pueden utilizarse para determinar la
inmunorreactividad específica. También se encuentran en la presente
referencias adicionales y descripción de los anticuerpos y puede
aplicarse para definir los polipéptidos por inmunorreactividad).
Alternativamente, uno o más polipéptidos sintéticos o recombinantes
derivados de las secuencias descritas en la presente se conjugan a
una proteína portadora y se utilizan como un inmunógeno. Detalles
adicionales acerca de proteínas, anticuerpos, antisueros, etc.
pueden encontrarse en la WO 2002/085923, supra.
Se recolecta y se titula el suero policlonal
contra el polipéptido inmunogénico en un inmunoanálisis, por
ejemplo, un inmunoanálisis de fase sólida con una o más de las
proteínas inmunogénicas inmovilizadas en un soporte sólido. Se
seleccionan los antisueros policlonales con una titulación de 106 o
mayor, se depositan y se sustraen con los polipéptidos de sintetasa
de control para producir los antisueros policlonales titulados
depositados sustraídos.
Los antisueros policlonales titulados
depositados sustraídos se prueban por reactividad cruzada contra
los homólogos de control en un inmunoanálisis comparativo. En este
ensayo comparativo, se determinan las condiciones discriminatorias
de enlace para los antisueros policlonales titulados sustraídos lo
que da como resultado al menos aproximadamente una señal 10 veces
más alta que la proporción de señal a ruido para el enlace de los
antisueros policlonales titulados para la sintetasa inmunogénica en
comparación con el enlace a los homólogos de sintetasa de control.
Es decir, la rigurosidad de la reacción de enlace se ajusta mediante
la adición de competidores no específicos tales como albúmina o
leche seca no grasosa, y/o ajustando las condiciones de sal,
temperatura, y/o lo similar. Estas condiciones de enlace se utilizan
en ensayos subsecuentes para determinar si un polipéptido de prueba
(un polipéptido que se compara con los polipéptidos inmunogénicos
y/o los polipéptidos de control) se enlaza específicamente por los
antisueros policlonales sustraídos depositados. En particular, los
polipéptidos de prueba que muestran al menos una señal
2-5x mayor que la proporción de señal a ruido que
los homólogos de sintetasa de control bajo condiciones
discriminatorias de enlace, y al menos aproximadamente una señal de
½ de la proporción de señal a ruido en comparación con
el(los) polipéptidos(s) inmunogénico(s),
comparte una similitud estructural sustancial con el polipéptido
inmunogénico en comparación con sintetasas conocidas, y en
consecuencia, es un polipéptido de la invención.
En otro ejemplo, los inmunoanálisis en el
formato de enlace competitivo se utilizan para la detección de un
polipéptido de prueba. Por ejemplo, como se anotó, los anticuerpos
que reaccionan de manera cruzada se retiran de la mezcla de
antisueros depositados mediante inmunoabsorción con los polipéptidos
de control. El(los) polipéptido(s)
inmunogénico(s) se inmovilizan entonces a un soporte sólido
que se expone a los antisueros depositados sustraídos. Se agregan
proteínas de prueba al ensayo para competir por el enlace a los
antisueros sustraídos depositados. La capacidad de la(s)
proteína(s) de prueba para competir por el enlace a los
antisueros sustraídos depositados en comparación con la(s)
proteína(s) inmovilizadas se compara con la capacidad de
el(los) polipéptido(s) inmunogénicos agregados al
ensayo para competir por el enlace (los polipéptidos inmunogénicos
compiten efectivamente con los polipéptidos inmunogénicos
inmovilizados para enlazarse a los antisueros depositados). La
reactividad cruzada porcentual para las proteínas de prueba se
calcula utilizando cálculos estándar.
\newpage
En un ensayo paralelo, la capacidad de las
proteínas de control para competir por el enlace a los antisueros
sustraídos depositados se determina opcionalmente en comparación con
la capacidad de el(los) polipéptidos inmunogénicos para
competir por el enlace a los antisueros. De nuevo, la reactividad
cruzada porcentual para los polipéptidos de control se calcula
utilizando cálculos estándar. Cuando la reactividad cruzada
porcentual es al menos 5-10x tan alta como para los
polipéptidos de prueba en comparación con los polipéptidos de
control y/o cuando el enlace de los polipéptidos de prueba se
encuentra aproximadamente en el rango del enlace de los péptidos
inmunogénicos, se dice que los polipéptidos de prueba enlazan
específicamente los antisueros sustraídos depositados.
En general, los antisueros inmunoabsorbidos y
depositados pueden utilizarse en un inmunoanálisis competitivo de
enlace como se describió en la presente para comparar cualquier
polipéptido de prueba con el(los) polipéptido(s)
inmunogénicos y/o de control. A fin de efectuar esta comparación,
cada uno de los polipéptidos inmunogénicos de prueba y de control
se analizan en un amplio rango de concentraciones y se determina la
cantidad de cada polipéptido requerida para inhibir el 50% del
enlace de los antisueros sustraídos a, p. ej., una proteína
inmovilizado de control, de prueba o inmunogénico utilizando
técnicas estándar. Si la cantidad del polipéptido de prueba
requerida para el enlace en el análisis competitivo es menor a dos
veces la cantidad del polipéptido inmunogénico que se requiere,
entonces se dice que el polipéptido de prueba se enlaza
específicamente a un anticuerpo generado para la proteína
inmunogénica, a condición de que la cantidad sea al menos
aproximadamente 5-10x tan alta como para el
polipéptido de control.
Como una determinación adicional de la
especificidad, el antisuero depositado opcionalmente se
inmunoabsorbe completamente con el(los)
polipéptido(s) inmunogénico(s) (en lugar de los
polipéptidos de control) hasta que sea detectable poco o ningún
enlace del antisuero depositado sustraído de polipéptido
inmunogénico a el(los) polipéptidos inmunogénico(s)
utilizado(s) en la inmunoabsorción. Este antisuero
completamente inmunoabsorbido se prueba entonces por reactividad
con el polipéptido de prueba. Si se observa poca o ninguna
reactividad (i.e., no más de 2x la proporción de señal a ruido
observada para enlazarse al antisuero completamente inmunoabsorbido
al polipéptido inmunogénico), entonces el polipéptido de prueba se
enlaza específicamente por el antisuero emitido por la proteína
inmunogénica.
Los sistemas de traducción adecuados para
elaborar proteínas que incluyen uno o más aminoácidos no naturales
se describen en las solicitudes de patente Internacional WO
2002/086075, titulada "METHODS AND COMPOSITION FOR THE PRODUCTION
OF ORTHOGONAL tRNA-AMINOACIL tRNA SYNTHETASA
PAIRS" (METODOS Y COMPOSICIÓN PARA LA PRODUCCIÓN DE PARES DE
ARNt ORTOGONAL.SINTETASA ARNt DE AMINOACILO ORTOGONAL), y la WO
2002/085923, supra. Cada una de estas solicitudes se
incorpora en la presente por referencia en su totalidad. Tales
sistemas de traducción comprende células que incluyen un ARNt
ortogonal (O-ARNt), una ARNt sintetasa de aminoacilo
ortogonal (O-RS), y un aminoácido no natural (por
ejemplo, un aminoácido no natural que comprende un residuo en donde
un residuo sacárido puede anexarse, tal como un aminoácido
derivatizado de aldehído o ceto, o un aminoácido no natural que
incluye un residuo sacárido), en donde la O-RS
aminoacila el O-ARNt con un aminoácido no natural.
La célula utiliza los componentes para incorporar el aminoácido no
natural en una cadena creciente de polipéptido.
Un par ortogonal se compone de un
O-ARNt, p. ej., un ARNt supresor, un ARNt de cambio
de marco de lectura, o lo similar, y una O-RS. El
O-ARNt no se encuentra acilado por sintetasas
endógenas y es capaz de decodificar un codón selector, como se
describió anteriormente. La O-RS reconoce el
O-ARNt, p. ej., con un bucle de anticodón
extendido, y preferentemente aminoacila el O-ARNt
con un aminoácido no natural, p. ej., un aminoácido no natural que
comprende un residuo en donde un residuo sacárido puede anexarse, o
un aminoácido no natural que incluye un residuo sacárido. El
desarrollo de múltiples pares de ARNt ortogonal/sintetasa puede
permitir la simultánea incorporación de múltiples aminoácidos no
naturales utilizando diferentes codones. Ver, Ejemplo 5 para
secuencias ejemplificativas de O-ARNt y
O-RS.
El O-ARNt y el
O-RS pueden presentarse naturalmente o pueden
derivarse por mutación de un ARNt y/o RS que se presentan de manera
natural de una variedad de organismos, que se describen bajo fuentes
y huéspedes. En varias realizaciones, el ARNt y
O-RS se derivan de al menos un organismo. En otra
realización, el O-ARNt se deriva de un ARNt que se
presenta naturalmente o mutado que se presenta naturalmente de un
primer organismo y la O-RS se deriva de RS que se
presenta naturalmente o mutada que se presenta naturalmente de un
segundo organismo.
Específicamente, estos métodos incluyen: (a) la
generación de una biblioteca de ARNts derivados de al menos un ARNt
de un primer organismo; (b) la selección de manera negativa de la
biblioteca para ARNts que se encuentran aminoacilados por una ARNt
sintetasa de aminoacilo (RS) de un segundo organismo en ausencia de
una RS del primer organismo, proporcionando así un depósito de
ARNts; (c) la selección del depósito de ARNts para miembros que se
encuentran aminoacilados por una RS ortogonal inducida
(O-RS), proporcionando con esto al menos un
O-ARNt recombinante. El O-ARNt
recombinante reconoce un codón selector y no se reconoce
eficientemente por la RS del segundo organismo y preferentemente se
encuentra aminoacilado por la O-RS. El método
incluye también: (d) la generación de una biblioteca de RSs
mutantes derivadas de al menos una ARNt sintetasa de aminoacilo
(RS) de un tercer organismo; (e) la selección de la biblioteca de
RSs para miembros que preferentemente aminoacilan el
O-ARNt recombinante en presencia de un aminoácido no
natural y un aminoácido natural, proporcionando con esto un
depósito de RSs activas; y (f) la selección de maneranegativa del
depósito para RSs activas que preferentemente aminoacilan el al
menos un O-ARNt recombinante en ausencia del
aminoácido no natural, proporcionando así el par específico de
O-ARNt/O-RS, en donde el par
específico de O-ARNt/O-RS comprende
al menos una O-RS recombinante que es específica
para el aminoácido no natural, p. ej., un aminoácido no natural que
comprende un residuo en donde puede anexarse un residuo sacárido, o
un aminoácido no natural que incluye un residuo sacárido, y el
O-ARNt recombinante.
Una estrategia para generar un par ortogonal
implica la generación de bibliotecas mutantes de las cuales separar
y/o seleccionar un O-ARNt o
O-RS.
Una segunda estrategia para la generación de un
par ortogonal de ARNt /sintetasa implica la importación de un par
heterólogo de ARNt/sintetasa, p. ej., la importación de un par de
otro, p. ej., organismo fuente en la célula huésped. Las
propiedades de la sintetasa heteróloga candidato incluyen, p. ej.,
que no carga ARNt de célula huésped, y las propiedades del ARNt
heterólogo candidato incluyen, p. ej., que éste no se encuentra
acilado por ninguna sintetasa de célula huésped. En adición, el ARNt
heterólogo derivado del ARNt es ortogonal para todas las sintetasas
de célula huésped.
Una O-RS de la invención
preferentemente aminoacila un O-ARNt con un
aminoácido no natural, p. ej., un aminoácido no natural que
comprende un residuo en donde puede anexarse un residuo sacárido, o
un aminoácido no natural que incluye un residuo sacárido, in
vitro o in vivo. Una O-RS de la invención
puede proporcionarse al sistema de traducción, p. ej., una célula,
o un sistema de traducción in vivo mediante un polipéptido
que incluye una O-RS y/o mediante un polinucleótido
que codifica una O-RS o una porción de la misma. Por
ejemplo, una O-RS comprende una secuencia de
aminoácidos como se describe en la SEQ ID NO.: 1-6,
o una variante conservadora de la misma. En otro ejemplo, una
O-RS o una porción de la misma, se encuentra
codificada por una secuencia de polinucleótidos que codifica un
aminoácido la SEQ ID NO.: 1-6, o una secuencia
complementaria de polinucleótidos, o se encuentra codificada por un
polinucleótido que comprende una secuencia de polinucleótidos de
cualquiera de las SEQ ID NO.: 8, 9 o 10. Ver, p. ej., Tabla 2 y
Ejemplo 5 en la presente para las secuencias de moléculas
O-RS ejemplificativas. Ver también la sección
titulada "Secuencias y Variantes de Ácido Nucleico y de
Polipéptidos" en la presente.
Los métodos para producir una
O-RS se basan en la generación de un depósito de
sintetasas mutantes desde la estructura de una sintetasa de tipo
silvestre, y después en la selección de RSs mutadas en base a su
especificidad para un aminoácido no natural que tiene, p. ej., un
residuo de aldehído o ceto o un residuo sacárido relativo a los
veinte aminoácidos comunes. Para aislar tal sintetasa, los métodos
de selección de la invención son: (i) sensitivo, dado que la
actividad deseada de las sintetasas desde las rondas iniciales
puede ser baja y la población pequeña; (ii) "regulable", dado
que es deseable variar la rigurosidad de selección en diferentes
rondas de selección; y, (iii) general, de modo que pueda utilizarse
para diferentes aminoácidos no naturales.
Los métodos para generar una sintetasa ortogonal
ARNt de aminoacilo incluyen mutar la sintetasa, p. ej., en el sitio
activo en la sintetasa, en el sitio del mecanismo de edición en la
sintetasa, en diferentes sitios combinando diferentes dominios de
sintetasas, o lo similar, y aplicar un proceso de selección. Se
utiliza una estrategia que se basa en la combinación de una
selección positiva seguida por una selección negativa. En la
selección positiva, la supresión del codón selector introducido en
posición(es) no esencial(es) de un marcador positivo
permite que las células sobrevivan bajo presión de selección
positiva. En presencia de aminoácidos tanto naturales como no
naturales, los sobrevivientes codifican de este modo para sintetasas
activas que cargan el ARNt ortogonal supresor con un aminoácido
natural o no natural. En la selección negativa en ausencia del
aminoácido no natural, la supresión de un codón selector en
posición(es) no esencial(es) de un marcador negativo
retira las sintetasas con especificidades de aminoácido natural. Los
sobrevivientes de la selección negativa y positiva codifican para
sintetasas que aminoacilan (cargan) el ARNt ortogonal supresor solo
con aminoácidos no naturales. Estas sintetasas pueden entonces
someterse a mutagénesis adicional, p. ej., redistribución de ADN,
otros métodos repetitivos de mutagénesis y/o lo similar.
La biblioteca de RSs mutantes puede generarse
utilizando varias técnicas de mutagénesis conocidas en la técnica.
Por ejemplo, las RSs mutantes pueden generarse mediante mutaciones
específicas del sitio, mutaciones en punto aleatorio, recombinación
homóloga, construcción quimérica o lo similar. Las bibliotecas
quiméricas de RSs también se incluyen en la invención.
La selección positiva puede basarse en la
supresión de un codón selector en in marcador de selección positiva
que comprende un codón selector, p. ej., un codón ámbar de paro en
el gen marcador de selección. El antibiótico u otro agente
selectivo puede aplicarse como la presión positiva de selección. En
adición, el marcador de selección puede utilizarse como marcador
positivo y como marcador negativo, como se describe en la presente,
en presencia y ausencia de un aminoácido no natural. Opcionalmente,
el gen marcador de selección que comprende un codón selector se
utiliza para la selección positiva y para la selección negativa se
utiliza un marcador de selección negativa, p. ej., un marcador
tóxico, tal como un gen barnasa que comprende al menos uno o más
codones selectores.
La selección positiva también puede utilizarse
en base a la supresión de un codón selector en una posición no
esencial en el gen \beta-lactamasa, haciendo a las
células resistentes a la ampicilina; y se utiliza una selección
negativa utilizando ribonucleasa barnasa como marcador negativo. En
contraste con la \beta-lactamasa, secretada en el
periplasma, también puede utilizarse una cloranfenicol
acetiltransferasa (CAT), que se localiza en el citoplasma; además,
la ampicilina es bactericida mientras que el cloranfenicol es
bacteriostático.
Una vez que las sintetasas se someten a la
estrategia positiva y negativa de selección/separación, estas
sintetasas pueden entonces someterse a mutagénesis adicional. Por
ejemplo, puede aislarse un ácido nucleico que codifica para la
O-RS; puede generarse un conjunto de polinucleótidos
que codifican O-RSs mutadas (p. ej., mediante
mutagénesis aleatoria, mutagénesis específica del sitio,
recombinación o cualquier combinación de las mismas) a partir del
ácido nucleico; y, estas etapas individuales o una combinación de
estas etapas puede repetirse hasta obtener una O-RS
mutada que preferentemente aminoacila el O-ARNt con
el aminoácido no natural, p. ej., un aminoácido no natural que
comprende un residuo en donde puede anexarse un residuo sacárido, o
un aminoácido no natural que incluye un residuo sacárido. En un
aspecto de la invención, las etapas se realizan múltiples veces, p.
ej., al menos dos veces. Opcionalmente, la concentración del agente
de selección varía.
También pueden utilizarse niveles adicionales de
rigurosidad de selección/separación en los métodos de la invención,
para producir O-ARNt, O-RS o pares
de los mismos. La rigurosidad de selección o separación puede
variar en una o ambas etapas del método para producir una
O-RS. Esto podría incluir, p. ej., variar la
cantidad del agente de selección/separación que se utiliza, etc.
también pueden efectuarse rondas adicionales de selecciones
positivas y/o negativas. La selección o separación también puede
comprender uno o más de un cambio en la permeabilidad del
aminoácido, un cambio en la eficiencia de traducción, un cambio en
la fidelidad translacional, etc. Típicamente, los uno o más cambios
se basan en una mutación en uno o más genes en un organismo en el
cual se utiliza un par ortogonal de ARNt-ARNt para
producir proteínas.
Pueden encontrarse detalles adicionales para
producir O-RS, para alterar la especificidad del
sustrato de la sintetasa, y otros ejemplos de O-RSs
en la WO 2002/086075, supra.
Un ARNt (O-ARNt ortogonal de la
invención media la incorporación de un aminoácido no natural, p.
ej., un aminoácido no natural que comprende un residuo en donde
puede anexarse un residuo sacárido, tal como un aminoácido
derivatizado de aldehído o ceto, o un aminoácido no natural que
incluye un residuo sacárido, en una proteína codificada por un
polinucleótido que comprende un codón selector reconocido por el
O-ARNt, p. ej., in vivo o in
vitro.
Un ejemplo de O-ARNts de la
invención es la SEQ ID NO.: 7. Ver Tabla 2 y Ejemplo 5, en la
presente, para secuencias de moléculas de O-ARNt y
O-RS ejemplificativas. Ver también la sección
titulada "Secuencias y Variantes de Ácido Nucleico y de
Polipéptidos" en la presente. En la molécula de ARNt, la Timina
(T) se reemplaza con Uracilo (U). También pueden presentarse
modificaciones adicionales a las bases. La invención incluye
también variaciones conservadoras de O-ARNt. Por
ejemplo, las variaciones conservadoras de O-ARNt
incluyen aquellas moléculas que funcionan como el
O-ARNt de la SEQ ID NO.: 7 y mantienen la estructura
en forma de L del ARNt, pero no tienen la misma secuencia (y son
diferentes de las moléculas de ARNt de tipo silvestre). Ver también
la sección en la presente titulada "Secuencias y Variantes de
Ácido Nucleico y de Polipéptidos".
Se proporcionan métodos para producir un ARNt
(O-ARNt) recombinante ortogonal en la solicitud de
patente Internacional WO 2002/086075, supra.
Por ejemplo, para mejorar la ortogonalidad de un
ARNt mientras se preserva su afinidad hacia una RS deseada, los
métodos incluyen una combinación de selecciones negativas y
positivas con una biblioteca de ARNt supresor mutante en ausencia y
en presencia de la sintetasa cognado, respectivamente. En la
selección negativa, se introduce un
codón(es) selector(es) en un gen marcador, p. ej., un gen tóxico, tal como barnasa, en una posición no esencial. Cuando un miembro de la biblioteca de ARNt mutante, p. ej., derivado de Methanococcus jannaschii, se aminoacila por un huésped endógeno, p. ej., sintetasas de Escherichia coli (i.e., no es ortogonal al huésped, p. ej., sintetasa de Escherichia coli), el codón selector, p. ej., un codón ámbar, se suprime y el producto del gen tóxico produce guías para la muerte de la célula. Las células que albergan ARNts no funcionales, o ARNts que no pueden reconocerse por la sintetasa de interés son sensibles al antibiótico. En consecuencia, los ARNts que: (i) no son sustratos para el huésped endógeno, p. ej., Escherichia coli, sintetasas; (ii) pueden aminoacilarse por la sintetasa de interés; y (iii) son funcionales en la traducción, sobreviven a ambas selecciones.
codón(es) selector(es) en un gen marcador, p. ej., un gen tóxico, tal como barnasa, en una posición no esencial. Cuando un miembro de la biblioteca de ARNt mutante, p. ej., derivado de Methanococcus jannaschii, se aminoacila por un huésped endógeno, p. ej., sintetasas de Escherichia coli (i.e., no es ortogonal al huésped, p. ej., sintetasa de Escherichia coli), el codón selector, p. ej., un codón ámbar, se suprime y el producto del gen tóxico produce guías para la muerte de la célula. Las células que albergan ARNts no funcionales, o ARNts que no pueden reconocerse por la sintetasa de interés son sensibles al antibiótico. En consecuencia, los ARNts que: (i) no son sustratos para el huésped endógeno, p. ej., Escherichia coli, sintetasas; (ii) pueden aminoacilarse por la sintetasa de interés; y (iii) son funcionales en la traducción, sobreviven a ambas selecciones.
Se construyen bibliotecas de ARNt mutado. Las
mutaciones pueden introducirse en una posición(es)
específi-
ca(s), p. ej., en posición(es) no conservadora(s), o en una posición conservadora, en posición(es) aleatoria(s), o una combinación de ambas en un bucle deseado de un ARNt, p. ej., un bucle anticodón, (brazo D, bucle V, brazo T y C) o una combinación de bucles o todos los bucles. Las bibliotecas quiméricas de ARNt también se incluyen en la invención. Debe notarse que las bibliotecas de ARNt sintetasas de diversos organismos (p. ej., microorganismos tales como eubacterias o arquebacterias) tales como las bibliotecas que comprenden una diversidad natural (ver, p. ej., la Patente de E.U. No. 6,238,884 para Short et al.; la Patente de E.U. No. 5,756,316 para Schallenberger et al.; la Patente de E.U. No. 5,783,431 para Petersen et al.; la Patente de E.U. No. 5,824,485 para Thompson et al.; la Patente de E.U. No. 5,958,672 para Short et al.), se construyen opcionalmente y se separan por pares ortogonales.
ca(s), p. ej., en posición(es) no conservadora(s), o en una posición conservadora, en posición(es) aleatoria(s), o una combinación de ambas en un bucle deseado de un ARNt, p. ej., un bucle anticodón, (brazo D, bucle V, brazo T y C) o una combinación de bucles o todos los bucles. Las bibliotecas quiméricas de ARNt también se incluyen en la invención. Debe notarse que las bibliotecas de ARNt sintetasas de diversos organismos (p. ej., microorganismos tales como eubacterias o arquebacterias) tales como las bibliotecas que comprenden una diversidad natural (ver, p. ej., la Patente de E.U. No. 6,238,884 para Short et al.; la Patente de E.U. No. 5,756,316 para Schallenberger et al.; la Patente de E.U. No. 5,783,431 para Petersen et al.; la Patente de E.U. No. 5,824,485 para Thompson et al.; la Patente de E.U. No. 5,958,672 para Short et al.), se construyen opcionalmente y se separan por pares ortogonales.
Pueden introducirse mutaciones adicionales en
posición(es) específica(s), p. ej., en
posición(es) no conservado-
ra(s), o en una posición conservadora, en posición(es) aleatorizada(s), o una combinación de ambas en un bucle o región deseada de un ARNt, p. ej., un bucle anticodón, una cepa aceptor, brazo o bucle D, brazo o bucle T y C, otras regiones de la molécula de ARNt o una combinación de los mismos. Típicamente, las mutaciones en un ARNt incluyen la mutación del bucle anticodón de cada miembro de la biblioteca de ARNts mutantes para permitir el reconocimiento de un codón selector. El método puede incluir además agregar una secuencia adicional (CCA) al término 3' del O-ARNt. Típicamente, un O-ARNt posee un mejoramiento de ortogonalidad para un organismo deseado en comparación con el material de inicio, p. ej., la pluralidad de secuencias de ARNt, mientras preserva su afinidad hacia una RS deseada.
ra(s), o en una posición conservadora, en posición(es) aleatorizada(s), o una combinación de ambas en un bucle o región deseada de un ARNt, p. ej., un bucle anticodón, una cepa aceptor, brazo o bucle D, brazo o bucle T y C, otras regiones de la molécula de ARNt o una combinación de los mismos. Típicamente, las mutaciones en un ARNt incluyen la mutación del bucle anticodón de cada miembro de la biblioteca de ARNts mutantes para permitir el reconocimiento de un codón selector. El método puede incluir además agregar una secuencia adicional (CCA) al término 3' del O-ARNt. Típicamente, un O-ARNt posee un mejoramiento de ortogonalidad para un organismo deseado en comparación con el material de inicio, p. ej., la pluralidad de secuencias de ARNt, mientras preserva su afinidad hacia una RS deseada.
Por ejemplo, en la selección negativa, un
codón(es) selector(es) se introduce(n) en
polinucleótidos que codifican un marcador de selección negativa, p.
ej., una enzima que confiere resistencia antibiótica, p. ej.,
\beta-lactamasa, una enzima que confiere un
producto detectable, p. ej., \beta-galactosidasa,
cloranfenicol acetiltransferasa (CAT), p. ej., un producto tóxico,
tal como barnasa, en una posición no esencial (p. ej., que aún
produce una barnasa funcional), etc. La separación/selección se
realiza opcionalmente haciendo crecer la población de células en
presencia de un agente selectivo (p. ej., un antibiótico tal como
ampicilina). En una realización, la concentración del agente de
selección
varía.
varía.
Por ejemplo, para medir la actividad de los
ARNts supresores, se utiliza un sistema de selección que se basa en
la supresión in vivo del codón selector, p. ej., mutaciones
de no sentido o mutaciones del cambio del marco de lectura
introducidas en un polinucleótido que codifica un marcador de
selección negativa, p. ej., un gen para
\beta-lactamasa (bla). Por ejemplo, se construyen
variantes de polinucleótidos, p. ej., variantes bla, con un codón
selector en posición en una cierta posición. Las células, p. ej.,
bacterias, se transforman con estos polinucleótidos. En el caso de
un ARNt ortogonal, que no puede cargarse eficientemente por
sintetasas endógenas de E. coli, la resistencia al
antibiótico, p. ej., resistencia a la ampicilina, debe ser de
aproximadamente o menor que esa para una bacteria transformada sin
plásmido. Si el ARNt no es ortogonal, o si una sintetasa heteróloga
capaz de cargar el ARNt se co-expresa en el sistema,
se observa un mayor nivel de resistencia al antibiótico, p. ej.,
ampicilina. Se seleccionan las células, p. ej., bacterias, que no
son capaces de crecer en placas de agar LB con concentraciones de
antibiótico aproximadamente iguales a las células transformadas sin
plásmidos.
En el caso de un producto tóxico (p. ej.,
ribonucleasa barnasa), cuando un miembro de la pluralidad de ARNts
potenciales se aminoacila por el huésped endógeno, p. ej.,
sintetasas de Escherichia coli (i.e., no es ortogonal para
el huésped, p. ej., sintetasas de Escherichia coli), el codón
selector se suprime y el producto tóxico de polinucleótidos
producido condice a la muerte de la célula. Sobreviven las células
que albergan ARNts ortogonales o ARNts no funcionales.
Opcionalmente, el gen de ribonucleasa barnasa puede incluir dos o
más codones ámbar. Las células sobrevivientes pueden seleccionarse,
p. ej., utilizando un análisis de densidad celular de grado de
comparación.
En una realización, el depósito de ARNts que son
ortogonales para un organismo se somete a una selección positiva n
la cual un codón selector se coloca en un marcador de selección
positiva, p. ej., codificado por un gen de resistencia a drogas,
tal como un gen de \beta-lactamasa. La selección
positiva se lleva a cabo en una célula que comprende un
polinucleótido que codifica o comprende un miembro del depósito de
ARNts que son otrogonales para la célula, un polinucleótido que
codifica un marcador de selección positiva, y un polinucleótido que
codifica una RS cognado. En ciertas realizaciones, la segunda
población de células comprende células que no se eliminaron
mediante la selección negativa. Los polinucleótidos se expresan en
la célula y la célula crece en presencia de un agente de selección,
p. ej., ampicilina. Los ARNts se seleccionan entonces por su
habilidad para aminoacilarse mediante la sintetasa cognado
co-expresada y para insertar un aminoácido en
respuesta a su codón selector. Típicamente, estas células muestran
un aumento en la eficiencia de supresión en comparación con células
que albergan ARNts no funcionales, o ARNts que no pueden reconocerse
eficientemente por la sintetasa de interés. La célula que albergan
los ARNts no funcionales que no se reconocen eficientemente por la
sintetasa de interés son sensibles al antibiótico. En consecuencia,
los ARNts que: (i) no son sustratos para el huésped endógeno, p.
ej., Escherichia coli, sintetasas; (ii) pueden aminoacilarse
por la sintetasa de interés; y (iii) son funcionales en la
traducción, sobreviven a ambas selecciones.
La rigurosidad de la selección, p. ej., la
selección positiva, la selección negativa o tanto la selección
positiva como la negativa, en los métodos antes descritos, incluye
opcionalmente la variación de la rigurosidad de la selección. Por
ejemplo, debido a que la barnasa es una proteína extremadamente
tóxica, la rigurosidad de la selección negativa puede controlarse
introduciendo diferentes números de codones selectores en el gen de
barnasa y/o utilizando un promotor inductible. En otro ejemplo, la
concentración del agente de selección o separación varía (p. ej.,
concentración de ampicilina). En un aspecto de la invención, la
rigurosidad varía debido a que la actividad deseada puede ser baja
durante rondas anteriores de separación. De este modo, se aplican
criterios de selección menos rigurosos en las rondas anteriores y se
aplican criterios más rigurosos en rondas posteriores de selección.
En ciertas realizaciones, la selección negativa, la selección
positiva o tanto la selección negativa como la positiva, pueden
repetirse múltiples veces. Pueden utilizarse múltiples marcadores
diferentes de selección negativa, marcadores de selección positiva,
o marcadores tanto de selección negativa como positiva. En ciertas
realizaciones, el marcador de selección positiva y negativa puede
ser el mismo.
Pueden utilizarse otros tipos de selecciones en
la invención para generar, p. ej., O-RS,
O-ARNt, y pares de
O-ARNt/O-RS que utilizan, p. ej., un
aminoácido no natural que comprende un residuo en donde puede
anexarse un residuo sacárido, tal como un aminoácido derivatizado de
aldehído o ceto, o un aminoácido no natural que incluye un residuo
sacárido. Por ejemplo, la etapa de selección positiva, la etapa de
selección negativa o ambas tapas de selección positiva y negativa
pueden incluir el uso de un informante, en donde el informante se
detecta mediante selección de células activada por fluorescencia
(FACS). Por ejemplo, una selección positiva puede realizarse
primero con un marcador de selección positiva, p. ej., un gen de
cloranfenicol acetiltransferasa (CAT), en donde un gen CAT
comprende un codón selector, p. ej., un codón ámbar de paro, en el
gen CAT, que seguido por una separación de selección negativa, se
basa en la incapacidad de suprimir codón(codones)
selector(es), p. ej., dos o más codones, en posiciones
dentro de un marcador negativo, p. ej., un gen de polimerasa T7 ARN,
que efectúa la transcripción de otro gen, p. ej., GFP. En una
realización, el marcador de selección positiva y el marcador de
selección negativa pueden encontrarse en el mismo vector, p. ej., el
plásmido. La expresión del marcador negativo conduce la expresión
del informante, p. ej., la proteína verde fluorescente (GFP). La
rigurosidad de la selección y la separación pueden variar, p. ej.,
la intensidad de la luz necesaria para la fluorescencia del
informante puede variar. En otra realización, puede efectuarse una
selección positiva con un informante como marcador de selección
positiva que se separa mediante FACs, seguida por una separación de
selección negativa, que se basa en la incapacidad para suprimir
el(los) codón(codones) selector(es), p. ej.,
dos o más en las posiciones dentro de un marcador negativo, p. ej.,
un gen de barnasa. Ver también, p. ej., el Ejemplo 4 en la
presente.
Opcionalmente, el informante se despliega en una
superficie celular, en una imagen fago o lo similar. La
visualización de superficie celular, p. ej., el sistema de
visualización de superficie celular en base a OmpA, se basa en la
expresión de un epítope particular, p. ej., un péptido C3 de
poliovirus fusionado a una OmpA porin de membrana externa en la
superficie de la célula de Escherichia coli. El epítope se
despliega en la superficie celular solo cuando el codón selector en
el mensaje de la proteína se suprime durante la traducción. El
péptido desplegado contiene entonces el aminoácido reconocido por
una de las sintetasas mutantes ARNt de aminoacilo en la biblioteca,
y la célula que contiene el gen de sintetasa correspondiente puede
aislarse con anticuerpos cultivados contra péptidos que contienen
aminoácidos no naturales específicos. El sistema de visualización
de superficie celular en base a OmpA se desarrolló y se optimizó por
Georgiou et al., como una alternativa a la imagen fago. Ver,
Francisco, J.A., Campbell, R., Iverson, B.L. & Georgiou, G.,
Production and fluorescence-activated cell sorting
of Escherichia coli expressing a functional antibody fragment
on the external surface, (Producción y separación celular activada
por fluorescencia de Escherichia coli que expresa un
fragmento funcional de anticuerpo en la superficie externa), Proc.
Natl. Acad. Sci. U.S.A. 90:10444-8 (1993).
Las etapas de selección también pueden llevarse
a cabo in vitro. El componente seleccionado, p. ej.,
sintetasa y/o ARNt, puede introducirse entonces en una célula para
su uso en la incorporación in vivo de un aminoácido no
natural.
Los métodos adicionales para producir un ARNt
ortogonal pueden encontrarse, p. ej., en las solicitudes de patente
Internacional WO 2002/086075, supra. Ver también Forster
et al., (2003) Programming peptidomimetic synthetasas by
translating genetic codes designed de novo (Programación de
sintetasas peptidomiméticas trasladando códigos genéticos diseñados
de novo) PNAS 100(11):6353-6357; y Feng et
al., (2003), Expanding tRNA recognition of a tRNA synthetasa by
a single aminoacid change, (Expansión del reconocimiento de ARNt de
una ARNt sintetasa mediante un solo cambio de aminoácidos) PNAS
100(10):5676-5681.
Los componentes traslacionales para producir las
glicoproteínas de la invención se derivan típicamente de organismos
no eucarióticos. Por ejemplo, el O-ARNt ortogonal
puede derivarse de un organismo no eucariótico (o una combinación
de organismos), p. ej., una arquebacteria, tal como Methanococcus
jannaschii, Methanobacterium thermoautotrophicum,
Halobacterium tal como Haloferax volcanii y especies
Halobacterium NRC-1, Archaeoglobus fulgidus,
Pyrococcus furiosus, Pyrococcus horikoshii,
Aeuropyrum pernix, Methanococcus maripaludis,
Methanopyrus kandleri, Methanosarcina mazei (Mm),
Pyrobaculum aerophilum, Pyrococcua abyssi,
Sulfolobus solfataricus (Ss), Sulfolobus tokodaii,
Thermoplasma acidophilum, Thermoplasma volcanium, o lo
similar, o una eubacteria, tal como Escherichia coli
Thermus thermophilus, Bacillus stearothermphilus, o lo
similar, mientras que la O-RS ortogonal puede
derivarse de un organismo no eucariótico (o una combinación de
organismos), p. ej., una arquebacteria, tal como Methanococcus
jannaschii, Methanobacterium thermoautotrophicum,
Halobacterium tal como Haloferax volcanii y especies
Halobacterium NRC-1, Archaeoglobus fulgidus,
Pyrococcus furiosus, Pyrococcus horikoshii,
Aeuropyrum pernix, Methanococcus maripaludis,
Methanopyrus kandleri, Methanosarcina mazei,
Pyrobaculum aerophilum, Pyrococcua abyssi,
Sulfolobus solfataricus (Ss), Sulfolobus tokodaii,
Thermoplasma acidophilum, Thermoplasma volcanium, o
lo similar. En una realización, también pueden utilizarse fuentes
eucarióticas, p. ej., plantas (p. ej., plantas complejas tales como
monocots o dicots), algas, hongos, levaduras, animales (p. ej.,
mamíferos, insectos, antrópodos, etc.) o lo similar, como fuentes
de O-ARNts y O-RSs.
Los componentes individuales de un par de
O-ARNt/O-RS pueden derivarse del
mismo organismo o de organismos diferentes. El par de
ARNt-RS ortogonal puede utilizarse en una diversidad
de organismos huésped, p. ej., un segundo organismo. En una
realización, el par de O-ARNt/O-RS
es del mismo organismo. Alternativamente, el O-ARNt
y la O-RS del par de
O-ARNt/O-RS son de diferentes
organismos.
Los codones selectores de la invención expanden
la estructura genética de codón de la maquinaria biosintética de
las proteínas para la incorporación de un aminoácido no natural, p.
ej., un aminoácido no natural que comprende un residuo en donde
puede anexarse un residuo sacárido, o un aminoácido no natural que
incluye un residuo sacárido. Por ejemplo, un codón selector
incluye, p. ej., un codón único de tres bases, un codón de no
sentido, tal como un codón de paro, p. ej., un codón ámbar, o un
codón ópalo, un codón no natural, al menos un codón de cuatro
bases, un codón raro, o lo similar. Puede introducirse un número de
codones selectores en un gen deseado, p. ej., uno o más, dos o más,
más de tres, etc.
Los 64 codones genéticos codifican para 20
aminoácidos y tres codones de paro. Debido a que solo se necesita
un codón de paro para la terminación traslacional, los otros dos
pueden en principio utilizarse para codificar para aminoácidos no
proteinógenos. El codón ámbar de paro, UAG, se ha utilizado con
éxito en el sistema biosintético in vitro y en oocitos
Xenopus para dirigir la incorporación de aminoácidos no naturales.
Entre los tres codones de paro, el UAG es el codón de paro menos
utilizado en Escherichia coli. Algunas especies de
Escherichia coli contienen ARNts supresores naturales, que
reconocen el UAG e insertan un aminoácido natural. En adición,
estos ARNts supresores ámbar se han utilizado en mutagénesis de
proteína convencional. En ciertas realizaciones de la invención, se
utilizan otros codones de paro en la invención.
En una realización, los métodos implican el uso
de un codón selector que es un codón de paro para la incorporación
de aminoácidos no naturales in vivo. Por ejemplo, se genera
un O-ARNt que reconoce al codón de paro, p. ej.,
UAG, y se aminoacila por una O-RS con un aminoácido
no natural deseado. Este O-ARNt no es reconocido
por las aminoacilo-ARNt sintetasas que se presentan
de manera natural. Puede utilizarse mutagénesis convencional
dirigida al sitio para introducir el codón de paro, p. ej., TAG, en
el sitio de interés en el gen de proteína. Ver, p. ej., Sayers,
J.R., Schmidt, W., Eckstein, F., 5', 3' Exonuclease in
phosphorothioate-based
oligonucleotide-directed mutagénesis, (Exonucleasa
5', 3'en la mutagénesis dirigida por oligonucleótidos en base a
fosforotioato) Nucleic Acids Res., 791-802 (1988).
Cuando la O-RS, O-ARNt y el gen
mutante se combinan in vivo, el aminoácido no natural se
incorpora en respuesta al codón UAG para dar una proteína que
contiene el aminoácido natural en la posición especificada.
La incorporación de aminoácidos no naturales
in vivo puede efectuarse sin perturbación significativa al
huésped, p. ej., Escherichia coli. Por ejemplo, en células no
eucarióticas, tales como Escherichia coli, debido a que la
eficiencia de supresión para el codón UAG depende de la competencia
entre el O-ARNt, p. ej., el ARNt supresor ámbar, y
el factor 1 de desprendimiento (RF1) (que se enlaza al codón UAG e
inicia el desprendimiento del péptido creciente del ribosoma), la
eficiencia de supresión puede modularse, p. ej., ya sea
incrementando el nivel de expresión de O-ARNt, p.
ej., el ARNt supresor, o utilizando una especie deficiente en
RF1.
Los aminoácidos no naturales, p. ej., los
aminoácidos no naturales que comprenden un residuo en donde puede
anexarse un residuo sacárido, tal como un aminoácido derivatizado de
aldehído o ceto o aminoácidos no naturales que incluyen un residuo
sacárido, también pueden codificarse con codones raros. Por ejemplo,
cuando la concentración de arginina en una reacción de síntesis de
proteína in vitro se reduce, el codón raro de arginina, AGG,
ha probado ser eficiente para la inserción de Ala mediante un ARNt
sintético acilado con alanina. Ver, p. ej., Ma et al.,
Biochemistry, 32:7939 (1993). En este caso, el ARNt sintético
compite con el ARNtArg que se presenta naturalmente, que existe
como una especie menor en Escherichia coli. Tales organismos
no utilizan todos los codones triples. Un codón AGA no asignado en
Micrococcus luteus se ha utilizado para la inserción de
aminoácidos en un extracto de transcripción/traducción in
vitro. Ver, p. ej., Kowal y Oliver, Nucl. Acid. Res., 25:4685
(1997). Los componentes de la invención pueden generarse para
utilizar estos codones raros in vivo.
Los codones selectores comprenden además cuatro
o más codones base, tal como, cuatro, cinco, seis o más codones
base. Ejemplos de cuatro codones base incluyen, p. ej., AGGA, CUAG,
UAGA, CCCU y similares. Ejemplos de cinco codones base incluyen p.
ej., AGAAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC y similares. Por
ejemplo, en presencia de O-ARNts mutados, p. ej.,
un ARNt supresor de estructura especial, con bucles de anticodón,
p. ej., con al menos 8-10 nt bucles de anticodón,
los cuatro o más codones base se leen como un solo aminoácido. En
otras realizaciones, los bucles de anticodón pueden decodificar, p.
ej., al menos cuatro codones base, al menos cinco codones base, o
al menos seis codones base o más. Debido a que existen 256 codones
de cuatro bases posibles, pueden codificarse múltiples aminoácidos
no naturales en la misma célula utilizando los cuatro o más codones
base. Ver Anderson et al., Exploring the Limits of Codon and
Anticodon Size, Chemistry and Biology, (Explorando los Límites de
Tamaño de Codones y Aniticodones, Química y Biología) Vol. 9,
237-244 (2002); y, Magliery, Expanding the Genetic
Code: Selection of Eficiente Suppresors of Four-base
Codons and Identification of "Shifty"
Four-base Codon with a Library Approach in
Escherichia coli, (Expansión del Código Genético: Selección
de Supresores Eficientes de Codones de Cuatro bases e Identificación
de Codones "Desplazados" de Cuatro Bases con un Proceso de
Biblioteca en Escherichia coli) J. Mol. Biol.
307:755-769 (2001).
Los métodos de la invención incluyen el uso de
codones extendidos en la supresión del cambio del marco de lectura.
Cuatro o más codones base pueden insertar, p. ej., uno o múltiples
aminoácidos no naturales en la misma proteína. Por ejemplo, los
codones de cuatro bases se han utilizado para incorporar aminoácidos
no naturales en proteínas utilizando métodos biosintéticos in
vitro. Ver, p. ej., Ma et al., Biochemistry, 1993, 32
7939 (1993); y Osaka et al., J. Am. Chem. Soc. 121:34 (1999).
Se utilizaron CGGG y AGO para incorporar simultáneamente
2-naftilalanina y derivado NBD de lisina en
estreptavidina in vitro con dos ARNts supresores del cambio
del marco de lectura químicamente acilados. Ver, p. ej., Osaka et
al., J. Am. Chem. Soc., 121:12194 (1999). En un estudio in
vivo, Moore et al., examinó la capacidad de derivados
ARNtLeu con anticodones NCUA para suprimir codones UAGN (N puede
ser U, A, G, o C), y encontró que la cuádrupla UAGA puede
decodificarse por un ARNtLeu con un anticodón UCUA con una
eficiencia de 13 a 26% con poca decodificación en el marco 0 o -1.
Ver Moore et al., J. Mol. Biol.298:195 (2000). En una
realización, pueden utilizarse en la invención codones extendidos
en base a codones raros o a codones de no sentido, que pueden
reducir la confusión en la lectura y la supresión del cambio del
marco de lectura en otros sitios no
deseados.
deseados.
También puede utilizarse un sistema de paso
traslacional para incorporar un aminoácido no natural, p. ej., un
aminoácido no natural que comprende un residuo en donde puede
anexarse un residuo sacárido, o un aminoácido no natural que
incluye un residuo sacárido, en un polipéptido deseado. En un
sistema de paso traslacional, se inserta una secuencia grande en un
gen pero no se traslada en proteínas. La secuencia contiene una
estructura que sirve como una clave para inducir el ribosoma para
saltar sobre la secuencia y resumir la traducción aguas debajo de
la inserción.
Alternativamente, o en combinación con otros
métodos antes descritos para incorporar un aminoácido no natural,
p. ej., un aminoácido no natural que comprende un residuo en donde
puede anexarse un residuo sacárido, o un aminoácido no natural que
incluye un residuo sacárido, en un polipéptido, puede utilizarse in
sistema de trans-traducción. Este sistema implica
una molécula llamada tmARN presente en Escherichia coli. Esta
molécula ARN se relaciones estructuralmente con un ARNt de alanilo
y se aminoacila por la alanilo sintetasa. La diferencia entre tmARN
y ARNt es que el bucle del anticodón se reemplaza con una secuencia
grande especial. Esta secuencia permite que el ribosoma resuma la
traducción en secuencias que se han detenido utilizando un marco de
lectura abierto codificado dentro de tmARN como plantilla. En la
invención, puede generarse un tmARN ortogonal que preferentemente
se aminoacila con una sintetasa ortogonal y se carga con un
aminoácido no natural. Al transcribir un gen utilizando el sistema,
el ribosoma se detiene en un sitio específico; el aminoácido no
natural se introduce en ese sitio, después la traducción se resume,
utilizando la secuencia codificada dentro de tmARN ortogonal.
Para un sistema dado, el codón selector también
puede incluir uno de los codones naturales de tres bases, en donde
el sistema endógeno no utiliza (o rara vez utiliza) el codón base
natural. Por ejemplo, éste incluye un sistema que carece de un ARNt
que reconoce el codón natural de tres bases, y/o un sistema en donde
el codón de tres bases es un codón raro.
Los codones selectores opcionalmente incluyen
pares base no naturales. Estos pares base no naturales expanden
adicionalmente el alfabeto genético existente. Un par base extra
aumenta el número de codones triples de 64 a 125. Las propiedades
de los terceros pares base incluyen el aparejamiento de base estable
y selectivo, la incorporación enzimática eficiente al ADN con alta
fidelidad por medio de una polimerasa, y la extensión inicial
eficiente continua después de la síntesis del par base no natural
naciente. Las descripciones de pares base no naturales que pueden
adaptarse para métodos y composiciones incluyen, p. ej., Hirao et
al., An unnatural base pair for incorporating amino acid
analogues into protein, (Un par base no natural para incorporar
análogos de aminoácido en proteínas) Nature Biotechnology,
20:177-182 (2002). Otras publicaciones relevantes se
enlistan abajo.
Para uso in vivo, el nucleósido no
natural es permeable a membrana y se fosforila para formar el
trifosfato correspondiente. En adición, la información genética
aumentada es estable y no se destruye por las enzimas celulares.
Esfuerzos previos por Benner y otros tomaron ventaja de los patrones
de enlace de hidrógeno que son diferentes de aquellos en los pares
canónicos Watson-Crick, de los cuales el ejemplo más
notable es el par iso-C:iso-G. Ver,
p. ej., Switzer et al., J. Am. Chem. Soc., 111:8322 (1989); y
Piccirilli et al., Nature, 1990, 343:33 (1990); Kool, Curr.
Opin. Chem. Biol., 4:602 (2000). Estas bases en general deshacen los
pares en cierto grado con bases naturales y no pueden replicarse
enzimáticamente. Kool y colaboradores demostraron que las
interacciones de empaque hidrofóbico entre bases pueden reemplazar
el enlace de hidrógeno para conducir la formación del par base. Ver
Kool, Curr. Opin. Chem. Biol., 4:602 (2000); y Guckian and Kool,
Angew, Chem, Int. Ed. Engl., 36, 2825 (1998). En un esfuerzo por
desarrollar un par base no natural que satisfaga todos los
requerimientos anteriores, Schultz, Romesberg y colaboradores han
sintetizado y estudiado sistemáticamente una serie de bases
hidrofóbicas no naturales. Se encontró que un
auto-par PICS:PICS es más estable que los pares
base naturales, y puede incorporarse eficientemente en ADN por medio
de un fragmento Klenow de Escherichia coli ADN polimerasa I
(KF). Ver, p. ej., McMinn et al., J. Am. Chem. Soc.,
121:11586 (1999); y Ogawa et al., J. Am. Chem. Soc.,
122:3274 (2000). Un auto-par 3MN:3MN puede
sintetizarse mediante KF con eficiencia y selectividad suficiente
para la función biológica. Ver, p. ej., Ogawa et al., J. Am.
Chem. Soc., 122:8803 (2000). Sin embargo, ambas bases actúan como
un terminador de cadena para la replicación adicional. Se ha
desarrollado recientemente una polimerasa de ADN mutante que puede
utilizarse para replicar el auto-par PICS. En
adición, puede replicarse un auto-par 7AI. Ver, p.
ej., Tae et al., J. Am. Chem. Soc., 123:7439 (2001). También
se ha desarrollado un nuevo par metalobase, Dipic:Py, que forma un
par estable al enlazar Cu(II). Ver Megger et al., J.
Am. Chem. Soc., 122:10714 (2000). Debido a que los codones
extendidos y los codones naturales son intrínsecamente ortogonales
a los codones naturales, los métodos de la invención pueden tomar
ventaja de esta propiedad para generar ARNts ortogonales para
ellos.
Como se utiliza en la presente, un aminoácido no
natural se refiere a cualquier aminoácido, aminoácido modificado, o
análogo de aminoácido diferente de selenocisteína y/o pirrolisina y
los siguientes veinte aminoácidos alfa genéticamente codificados:
alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina,
ácido glutámico, glicina, histidina, isoleucina, leucina, lisina,
metionina, fenilalanina, prolina, serina, treonina, triptofán,
tirosina, valina. La estructura genérica del aminoácido alfa se
ilustra por la Fórmula I:
Un aminoácido no natural es típicamente
cualquier estructura que tiene la Fórmula I en donde el grupo R es
cualquier sustituyente diferente del utilizado en los veinte
aminoácidos naturales. Ver, p. ej., Biochemistry por L. Stryer, 3ª
ed. 1988, Freeman and Company, New York, para estructuras de los
veinte aminoácidos naturales. Nótese que, los aminoácidos no
naturales de la invención pueden ser compuestos que se presentan de
manera natural diferentes a los veinte aminoácidos alfa
anteriores.
Debido a que los aminoácidos no naturales de la
invención difieren opcionalmente de los aminoácidos naturales solo
en la cadena lateral, los aminoácidos no naturales típicamente
pueden formar enlaces amida con otros aminoácidos, p. ej.,
naturales o no naturales, de la misma manera en la que se forman en
proteínas que se presentan de manera natural. Sin embargo, los
aminoácidos no naturales tienen grupos de cadena lateral que los
distinguen de los aminoácidos naturales.
De particular interés para elaborar
glicoproteínas de la invención son los aminoácidos no naturales en
los cuales R en la Fórmula I incluye un residuo que puede reaccionar
con un grupo reactivo unido a un residuo sacárido para enlazar el
residuo sacárido a una proteína que incluye el aminoácido no
natural. Los grupos R adecuados incluyen por ejemplo, ceto-,
azido-, hidroxil-, hidracina, ciano-, halo-, aminooxi-, alquenilo,
alquinilo, carbonilo, éter, tiol, seleno-, sulfonil-, borato,
boronato, fosfo, fosfono, fosfina, heterocíclico, enona, imina,
aldehído, éster, tioácido, tioéster, éster interrumpido,
hidroxilamina, amina, y similares o cualquier combinación de los
mismos. En algunas realizaciones, los aminoácidos no naturales
tienen un enlazador fotoactivable.
En adición a los aminoácidos no naturales que
contienen nuevas cadenas laterales, los aminoácidos no naturales
también comprenden opcionalmente estructuras de estructura
modificada, p. ej., como se ilustra mediante las estructuras de las
Fórmulas II y III:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
en donde Z comprende típicamente
OH, NH2, SH, NH-R', o S-R'; X y Y,
que pueden ser el mismo o diferente, típicamente comprenden S o O,
y R y R', que son opcionalmente el mismo o diferente, se seleccionan
típicamente de la misma lista de constituyentes para el grupo R
descrito anteriormente para los aminoácidos no naturales que tienen
la Fórmula I así como hidrógeno. Por ejemplo, los aminoácidos no
naturales de la invención comprenden opcionalmente sustituciones en
el grupo amino o carboxilo como se ilustra por las Fórmulas II y
III. Los aminoácidos no naturales de este tipo incluyen, pero no se
limitan a, ácidos \alpha-hidroxi,
\alpha-tioácidos, o
\alpha-aminotiocarboxilatos, p. ej., con cadenas
laterales correspondientes a los veinte aminoácidos naturales
comunes o cadenas laterales no naturales. En adición, las
sustituciones en el \alpha-carbono incluyen
opcionalmente aminoácidos L, D, o
\alpha-\alpha-disustituidos
tales como D-glutamato, D-alanina,
D-metil-O-tirosina,
ácido aminobutírico, y similares. Otras alternativas estructurales
incluyen aminoácidos cíclicos, tales como análogos de prolina así
como análogos de prolina de anillo de 3, 4, 6, 7, 8, y 9 miembros,
aminoácidos \beta y g tales como \beta-alanina
sustituida y ácido g-amino
butírico.
Por ejemplo, muchos aminoácidos no naturales se
basan en aminoácidos naturales, tales como tirosina, glutamina,
fenilalanina, y similares. Los análogos de tirosina incluyen
tirosinas para-sustituidas, tirosinas
orto-sustituidas, y tirosinas meta sustituidas, en
donde la tirosina sustituida comprende un grupo acetilo, un grupo
benzoilo, un grupo amino, una hidracina, una hidroxiamina, un grupo
tiol, un grupo carboxi, un grupo isopropilo, un grupo metilo, un
hidrocarburo C6-C20 de cadena recta o ramificada, un
hidrocarburo saturado o insaturado, o un grupo
O-metilo, un grupo poliéter, un grupo nitro, o lo
similar. En adición, también se contemplan los anillos arilo
múltiplemente sustituidos. Los análogos de glutamina de la invención
incluyen, pero no se limitan a, derivados
\alpha-hidroxi, derivados
g-sustituidos, derivados cíclicos, y derivados de
glutamina sustituidos con amida. Los ejemplos de análogos de
fenilalanina incluyen, pero no se limitan a, fenilalaninas
meta-sustituidas, orto-sustituidas,
y/o para-sustituidas, en donde el sustituyente
comprende un grupo hidroxi, un grupo metoxi, un grupo metilo, un
grupo alilo, un grupo aldehído o ceto, o lo similar.
Ejemplos específicos de aminoácidos no naturales
incluyen, pero no se limitan a,
p-acetil-L-fenilalanina,
O-metil-L-tirosina,
una L-3-(2-naftil)alanina,
una 3-metil-fenilalanina, una
O-4-alil-L-tirosina,
una
4-propil-L-tirosina,
una
tri-O-acetil-GlcNAcb-serina,
\beta-O-GlcNAc-L-serina,
una
tri-O-acetil-GalNAc-\alpha-treonina,
una
\alpha-GalNAc-L-treonina,
una L-Dopa, una fenilalanina fluorada, una
isopropil-L-fenilalanina, una
p-azido-L-fenilalanina,
una
p-acil-L-fenilalanina,
una
p-benzoil-L-fenilalanina,
una L-fosfoserina, una fosfonoserina, una
fosfonotirosina, una
p-yodo-fenilalanina, una
p-bromofenilalanina, una
p-amino-L-fenilalanina,
una isopropil-L-fenilalanina, las
listadas abajo, o en cualquier otra parte en la presente, y
similares. Las estructuras de una variedad de aminoácidos no
naturales se proporcionan, por ejemplo, en las Figuras 17, 18, 19,
26 y 29 de la WO 2202/085923.
Los aminoácidos no naturales adecuados para su
uso en los métodos de la invención incluyen también los que tienen
un residuo sacárido unido a la cadena lateral de aminoácidos. En una
realización, un aminoácido natural con un residuo sacárido incluye
un aminoácido serina o treonina con un residuo Man, GalNAc, Glc,
Fuc, o Gal. Ejemplos de aminoácidos no naturales que incluyen un
residuo sacárido incluyen, pero no se limitan a, p. ej., una
tri-O-acetil-GlcNAc\beta-serina,
una
\beta-O-GlcNAc-L-serina,
una
tri-O-acetil-GalNAc-\alpha-treonina,
una
\alpha-GalNAc-L-treonina,
una O-Man-L-serina,
una
tetra-acetil-O-Man-L-serina,
una O-GalNAc-L- serina, una
tri-acetil-O-GalNAc-L-serina,
una Glc-L-serina, una
tetraacetil-Glc-L-serina,
una fuc-L-serina, una
tri-acetil-fuc-L-serina,
una O-Gal-L-serina,
una
tetra-acetil-O-Gal-L-serina,
una
beta-O-GlcNAc-L-treonina,
una
tri-acetil-beta-GlcNAc-L-treonina,
una
O-Man-L-treonina,
una
tetra-acetil-O-Man-L-treonina,
una
O-GalNAc-L-treonina,
una
tri-acetil-O-GalNAc-L-treonina,
una Glc-L-treonina, una
tetraacetil-Glc-L-treonina,
una fuc-L-treonina, una
tri-acetil-fuc-L-treonina,
una
O-Gal-L-treonina,
una
tetra-acetil-O-Gal-L-serina,
y similares. La invención incluye formas no protegidas y acetiladas
de las anteriores. Ver también WO 2003/031464A2, titulada
"Remodeling and Glycoconjugation of Péptides" (Remodelación y
Glicoconjugación de Péptidos); y, la Patente de E.U. No. 6,331,418,
titulada "Saccharide Compositions, Methods and Apparatus for
their synthesis" (Composiciones de Sacárido, Métodos y Aparatos
para su síntesis).
Muchos de los aminoácidos no naturales
proporcionados anteriormente se encuentran comercialmente
disponibles, p. ej., de Sigma (EUA) o Aldrich (Milwaukee, WI, EUA).
Los que no se encuentran disponibles comercialmente se sintetizan
opcionalmente como se proporciona en los ejemplos abajo o utilizando
métodos estándar conocidos por los expertos en la técnica. Para
técnicas de síntesis orgánica, ver, p. ej., Organic Chemistry por
Fessendon and Fessendon, (1982, Segunda Edición, Willard Grant
Press, Boston Mass.); Advanced Organic Chemistry por March (Tercera
Edición, 1985, Wiley and Sons, New York); y Advanced Organic
Chemistry por Carey y Sundberg (Tercera Edición, Partes A y B,
1990, Plenum Press, New York). Ver también WO 2002/085923 para una
síntesis adicional de aminoácidos no naturales.
Por ejemplo, las fenilalaninas
meta-sustituidas se sintetizan en un procedimiento
como se subraya en la WO 2002/085923 (ver, p. ej., Figura 14 de la
publicación). Típicamente, se agrega NBS
(N-bromosuccinimida) a un compuesto de metilbenceno
meta-sustituido para dar un bromuro de bencilo
meta-sustituido, que entonces se reactiva con un
compuesto malonato para dar la fenilalanina meta sustituida. Los
sustituyentes típicos utilizados para la posición meta incluyen,
pero no se limitan a, cetonas, grupos metoxi, alquilos, acetilos, y
similares. Por ejemplo, se prepara
3-acetil-fenilalanina reactivando
NBS con una solución de 3-metilacetofenona. Para
más detalles ver los ejemplos abajo. Se utiliza una síntesis similar
para producir una fenilalanina 3-metoxi. El grupo R
en la posición meta del bromuro de bencilo en ese caso es -OCH3.
Ver, p. ej., Matsoukas et al., J. Med. Chem. 1995, 38,
4660-4669.
En algunas realizaciones, el diseño de
aminoácidos no naturales se inclina por la información conocida
acerca de los sitios activos de sintetasas, p. ej., sintetasas de
ARNt ortogonal utilizadas para aminoacilar un ARNt ortogonal. Por
ejemplo, se proporcionan tres clases de análogos de glutamina,
incluyendo derivados sustituidos en el nitrógeno de amida (1), un
grupo metilo en la posición y (2), y un derivado de
N-Cg-cíclico (3). En base a la
estructura cristalina de rayos x de la GlnRS de E. coli, en
la cual los residuos del sitio clave de enlace son homólogos a la
GlnRS de levadura, los análogos se diseñaron para complementar un
ordenamiento de las mutaciones de cadena lateral de los residuos
dentro de una estructura de 10 \ring{A} de la cadena lateral de
glutamina, p. ej., una mutación del sitio activo Phe233 para un
aminoácido hidrofóbico pequeño puede complementarse mediante la
masa estérica en la posición Cg de Gln.
Por ejemplo,
N-ftaloil-L-glutámico
1,5-anhídrido (compuesto número 4 en la Figura 23 de
la WO 2002/085923) se utiliza opcionalmente para sintetizar
análogos de glutamina con sustituyentes en el nitrógeno de la amida.
Ver, p. ej., King, F.E. & Kidd, D.A.A. A New Synthesis of
Glutamine and of g-Dipeptides of Glutamic Acid from
Phthylated Intermediates (Una nueva síntesis de glutamina y de
g-dipéptidos de ácido glutámico a partir de
Intermediarios Ftilados), J. Chem. Soc. 3315-3319
(1949); Friedman, O.M. & Chatterrji, R. Synthesis of Derivatives
of Glutamine as Model Substrates for Anti-Tumor
Agents (Síntesis de Derivados de Glutamina como Sustratos Modelo
para Agentes Anti-Tumorales) J. Am. Chem. Soc. 81,
3750-3752 (1959); Craig, J.C. et al.,
Absolute Configuration of the Enantiomers of
7-Chloro-4[[4-(diethylamino)-1-metilbutil]amino]quinoline
(Chloroquine) (Configuración absoluta de los enantiómeros de
7-cloro-4[[4-(dietilamino)-1-metilbutil]amino]quinolina)
J. Org. Chem. 53, 1167-1170 (1988); y Azoulay, M.,
Vilmont, M. & Frappier, F. Glutamine analogues as Potential
Antimalarials.(Análogos de glutamina como
anti-malaria potenciales), Eur. J. Med. Chem. 26,
201-5 (1991). El anhídrido se prepara típicamente a
partir de ácido glutámico mediante primera protección de la amina
como la ftalimida seguida por reflujo en ácido acético. El
anhídrido se abre entonces con un número de aminas, dando como
resultado un rango de sustituyentes en la amida. La desprotección
del grupo ftaloilo con hidracina produce un aminoácido libre como
se mostró en la Figura 23 de la WO 2002/085923.
La sustitución en la posición y típicamente se
logra a través de la alquilación del ácido glutámico. Verm p. ej.,
Koskinen, A.M.P. & Rapoport, H. Synthesis of
4-Susbstituted Prolines as Conformationally
Constrained Amino Acid Analogues, (Síntesis de prolinas
4-sustituidas como análogos de aminoácido detenidas
de manera conformacional) J. Org. Chem. 54,
1859-1866 (1989). Un aminoácido protegido, p. ej.,
como se ilustró mediante el compuesto número 5 en la Figura 24 de
la WO 2002/085923 se preparó opcionalmente mediante la primera
alquilación del residuo amino con
9-bromo-9-fenilfluoreno
(PhflBr) (ver, p. ej., Christie, B.D. & Rapoport, H. Synthesis
of Optically Pure Pipecolates from L-Asparagine.
Application to the Total Synthesis of
(+)-Apovincamine through Amino Acid Decarbonilation
and Iminium Ion Cyclization, (Síntesis de pipecolatos ópticamente
puros a partir de asparagina. Aplicación s la síntesis total de
(+)- apovincamina a través de la descarbonilación del aminoácido y
la ciclización del ión imino) J. Org. Chem. 1989,
1859-1866 (1985)) y después la esterificación del
residuo ácido utilizando
O-ter-butil-N,N'-diisopropilisourea.
La adición de desprotonatos de regioselectividad
KN(Si(CH3)3)2 en la posición \alpha
del metil éster para formar el enolado, que se alquila entonces
opcionalmente con un rango de yoduros de alquilo. La hidrólisis de
t-butil éster y el grupo Phfl dio el análogo
g-metil glutamina deseado (Compuesto número 2 en la
Figura 24 de la WO 2002/085923).
Un análogo cíclico N-Cg, como se
ilustra por el Compuesto número 3 en la Figura 25 de la WO
2002/085923, se prepara opcionalmente en 4 etapas a partir de
Boc-Asp-Ot-Bu como
se describió previamente. Ver, p. ej., Barton et al.,
Synthesis of Novel a-Amino-Acids and
Derivatives Using Radical Chemistry: Synthesis of
L-and
S-a-Amino-Adipic
Acids, L-a-aminopimelic Acid and
Appropriate Unsaturated Derivatives, (Síntesis de nuevos
a-aminoácidos y derivados utilizando química
radical: síntesis de ácidos L- y
S-a-aminoadípicos, ácido
L-a-aminopimélico y derivados
insaturados apropiados) Tetrahedron Lett., 43,
4297-4308 (1987) y Subasinghe et al.,
Quisqualic acid analogues: synthesis of
beta-heterociclic 2-aminopropanoic
acid derivatives and their activity at a novel
quisqualate-sensitized site, (Análogos de ácido
quiscuálico: síntesis de derivados de ácido
beta-heterocílico 2-aminopropanoico
y su actividad en un nuevo sitio sensibilizado con quiscualato) J.
Med. Chem. 35 4602-7 (1992). La generación del
anión de la
N-t-Boc-Pirrolidinona,
pirrolidinona u oxazolidona seguida por la adición del compuesto 7
como se mostró en la Figura 25, da como resultado un producto de
adición Michael. La desprotección con TFA da como resultado
entonces los aminoácidos libres.
En adición a los aminoácidos no naturales
anteriores, también se ha diseñado una biblioteca de análogos de
tirosina. En base a la estructura cristalina de B.
stearothermophilus TyrRS, cuyo sitio activo es altamente homólogo
al de la M. jannashii sintetasa, los residuos dentro de la
estructura de 10 \ring{A} de la cadena lateral aromática de
tirosina se mutaron (Y32, G34, L65, Q155, D158, A167, Y32 y D158).
La biblioteca de análogos de tirosina, como se muestra en la Figura
26 de la WO 2002/085923, se ha diseñado para complementar una
disposición de sustituciones para estos aminoácidos de sitio
activo. Éstos incluyen una variedad de patrones de sustitución de
fenilo, que ofrecen diferentes propiedades hidrofóbicas y de enlace
de hidrógeno. Los análogos de tirosina se preparan opcionalmente
utilizando la estrategia general ilustrada por la WO 2002/085923
(ver, p. ej., figura 27 de la publicación). Por ejemplo, un enolato
de dietil acetamidomalonato se genera opcionalmente utilizando
etóxido de sodio. Un análogo de tirosina deseado puede prepararse
entonces agregando un bromuro de bencilo apropiado seguido por
hidrólisis.
La incorporación de aminoácido no natural es un
tema que típicamente se considera al diseñar y seleccionar
aminoácidos no naturales, p. ej., para la incorporación en una
proteína. Por ejemplo, la alta densidad de carga de los
a-aminoácidos sugiere que no es probable que estos
compuestos sean celularmente permeables. Los aminoácidos naturales
se incorporan en bacterias a través de una colección de sistemas de
transporte en base a proteínas que despliegan grados variables de
especificidad de aminoácidos. La invención proporciona en
consecuencia una rápida separación para determinar cuáles
aminoácidos no naturales, si existen, se incorporan por las
células.
Por ejemplo, una variedad de aminoácidos no
naturales se separan opcionalmente en un medio mínimo por su
toxicidad a las células. Las toxicidades se seleccionan típicamente
en cinco grupos: (1) no toxicidad, en el cual no se presenta ningún
cambio significativo en los tiempos de duplicación; (2) baja
toxicidad, en el cual los tiempos de duplicación se incrementan en
menos de aproximadamente 10%; (3) toxicidad moderada, en el cual
los tiempos de duplicación se incrementan por aproximadamente 10%
hasta aproximadamente 50%; (4) alta toxicidad, en el cual los
tiempos de duplicación aumentan por aproximadamente 50% hasta
aproximadamente 100%; u (5) toxicidad extrema, en la cual los
tiempos de duplicación se incrementan por más de aproximadamente
100%. Ver, p. ej., Liu, D.R., & Schultz, P.G. Progress toward
the evolution of an organism with an expanded genetic code,
(Progreso hacia la evolución de un organismo con un código genético
extendido), PNAS, USA., 96, 4780-4785 (1999). La
toxicidad de los aminoácidos que califican como altamente o
extremadamente tóxicos se mide típicamente como una función de su
concentración para obtener valores IC50. En general, los aminoácidos
que son análogos muy cercanos de los aminoácidos naturales o que
despliegan una funcionalidad reactiva demuestran las más altas
toxicidades. La tendencia anterior sugiere que los mecanismos de
toxicidad para estos aminoácidos no naturales pueden ser la
incorporación en proteínas o la inhibición de las enzimas esenciales
que procesan los aminoácidos naturales.
Para identificar las rutas de incorporación
posibles para aminoácidos tóxicos, se repiten opcionalmente los
análisis de toxicidad a niveles IC50, p. ej., en medio suplementado
con un exceso de un aminoácido natural estructuralmente similar.
Para aminoácidos tóxicos, la presencia de un exceso de aminoácido
natural típicamente rescata la capacidad de las células para crecer
en presencia de la toxina, presumiblemente debido a que el
aminoácido natural compite efectivamente la toxina ya sea para
incorporación celular o para enlace a enzimas esenciales. En estos
casos, se asigna al aminoácido tóxico una posible ruta de
incorporación y se marca un "alelo letal" cuya complementación
se requiere para la supervivencia celular. Estos alelos letales son
extremadamente útiles para analizar la capacidad de las células a
incorporar aminoácidos no naturales no tóxicos. La complementación
del alelo tóxico, evidenciada por la restauración del crecimiento
celular, sugiere que el aminoácido no tóxico se incorpora por la
célula, posiblemente mediante la misma ruta de incorporación que la
asignada a un alelo letal. Una carencia de complementación es
inconclusa. Para estudios de ejemplos y conclusiones ver los
ejemplos proporcionados abajo.
Los resultados obtenidos, p. ej., como se
describe en los ejemplos abajo, demuestran que la complementación
de los alelos de aminoácidos no naturales letales es un método
eficiente para determinar cualitativamente la incorporación de
aminoácidos. Este método general se basa en la incorporación
mediante permeasas de péptidos, que transportan dipéptidos y
tripéptidos a través de la membrana citoplásmica. Las permeasas de
péptidos no son muy específicas de cadena lateral, y los valores KD
para sus sustratos son comparables a los valores KD de las
permeasas de aminoácidos, p. ej., aproximadamente 0.1 mM hasta
aproximadamente 10 mM). Ver, p. ej., Nickitenko et al., A
structure of DppA, a periplasmic dipeptide transport/chemosensory
receptor, (Una estructura de DppA, un transporte de dipéptido
periplásmico/receptor quimiosensorial) Biochemistry 34,
16585-16595 (1995) y Dunten, P., Mowbray, S.L.,
Cristal structure of the dipeptide binding protein from
Escherichia coli involved in active transport and
chemotaxis, (Estructura cristalina de la proteína de enlace de
dipéptido de Escherichia coli implicada en el transporte
activo y quimiotaxis), Protein Science 4, 2327-34
(1995). Los aminoácidos no naturales se incorporan como conjugados
de los aminoácidos naturales, tales como lisina, y se liberan en el
citoplasma a la hidrólisis del dipéptido mediante una de las
peptidasas endógenas de E. coli. Para probar este
procedimiento, se sintetizan varios dipéptidos
Unn-Lts y Lys-Unn mediante síntesis
de fase sólida, y se prueba el crecimiento de una especie de E.
coli deficiente en biosíntesis de lisina, en un medio mínimo de
lisina en presencia y ausencia de estos péptidos. La única fuente de
lisina disponible para estas células es el dipéptido que contiene
el aminoácido no natural. La incorporación de fosfonoserina,
fosfonotirosina, pentafluorofenilalanina, y serina cerrada se ha
analizado de esta manera. En los cuatro casos, se observó
crecimiento en concentraciones de dipéptido de 10 mM y más altas.
Aunque la incorporación se analiza fácilmente con el método
proporcionado en la presente, una alternativa para diseñar
aminoácidos no naturales dóciles a las rutas de incorporación
celular, es proporcionar rutas biosintéticas para crear aminoácidos
in vivo.
Muchas rutas biosintéticas existen ya en células
para la producción de aminoácidos y otros compuestos. Aunque puede
no existir un método biosintético para un aminoácido no natural
particular en la naturaleza, p. ej., en E. coli, la
invención proporciona tales métodos. Por ejemplo, las rutas
biosintéticas para aminoácidos no naturales se generan
opcionalmente en E. coli agregando nuevas enzimas o
modificando las rutas de E. coli existentes. Nuevas enzimas
adicionales son opcionalmente enzimas que se presentan de manera
natural o enzimas desarrolladas artificialmente. Por ejemplo, la
biosíntesis de p-aminofenilalanina (como se
presenta, p. ej., en la WO 2002/085923) se basa en la adición de
una combinación de enzimas conocidas de otros organismos. Los genes
para estas enzimas pueden introducirse en una célula, p. ej., una
célula de E. coli, transformando la célula con un plásmido
que comprende los genes. Los genes, al expresarse en las células,
proporcionan una ruta enzimática para sintetizar el compuesto
deseado. Ejemplos de los tipos de enzimas que se agregan
opcionalmente se proporcionan en los ejemplos abajo. Se encuentran
secuencias de enzimas adicionales, p. ej., en Genbank. Las enzimas
desarrolladas artificialmente también se agregan en una célula de la
misma manera. De esta manera, la maquinaria celular y los recursos
de una célula se manipulan para producir aminoácidos no
naturales.
Se encuentra disponible una variedad de métodos
para producir nuevas enzimas para su uso en rutas biosintéticas o
para la evolución de las rutas existentes. Por ejemplo, la
recombinación recursiva, p. ej., como se desarrolló por Maxygen,
Inc. (en la red mundial en www.maxygen.com), se utiliza para
desarrollar nuevas enzimas y rutas. Ver, p. ej., Stemmer 1994,
"Rapid evolution of a protein in vitro by DNA
shuffling", (Evolución rápida de una proteína in vitro
mediante redistribución de ADN) Nature, Vol. 370 No. 4: Pg.
389-391; y Stemmer, 1994, "DNA Shuffling by
random fragmentation and reassembly: In vitro recombination
for molecular evolution" (Redistribución de ADN mediante
fragmentación aleatoria y re-ensamblado:
Recombinación in vitro para evolución molecular) Proc. Natl.
Acad Sci USA, Vol. 91: Pg. 10747-10751. De manera
similar, DesignPath^{TM}, desarrollado por Genencor (en la red
mundial en genencor.com) se utiliza ópticamente para el diseño de la
ruta metabólica, p. ej., para diseñar una ruta para la creación de
un aminoácido no natural en E. coli. Esta tecnología
reconstruye las rutas existentes en organismos huésped utilizando
una combinación de nuevos genes, p. ej., identificados a través de
genómicos funcionales, y evolución y diseño molecular. Diversa
Corporation (en la red mundial en diversa.com) también proporciona
tecnología para separar rápidamente bibliotecas de genes y rutas de
genes, p. ej., para crear nuevas rutas.
Típicamente los métodos de biosíntesis de la
invención, p. ej., la ruta para crear
p-aminofenilalanina (pAF) a partir de corismato, no
afectan la concentración de otros aminoácidos producidos en la
célula. Por ejemplo una ruta utilizada para producir pAF a partir
de corismato produce pAF en la célula mientras que las
concentraciones de otros aminoácidos aromáticos típicamente
producidos a partir de corismato no se afectan sustancialmente.
Típicamente el aminoácido no natural producido con una ruta
biosintética diseñada de la invención, se produce en una
concentración suficiente para la eficiente biosíntesis de la
proteína, p. ej., una cantidad celular natural, pero no a tal grado
que afecte la concentración de los otros aminoácidos o que agote los
recursos celulares. Las concentraciones típicas producidas in
vivo de esta manera sonde aproximadamente 10 mM hasta
aproximadamente 0.05 mM. Una vez que la bacteria se transforma con
un plásmido que comprende los genes utilizados para producir las
enzimas deseadas para una ruta específica y se genera un vigésimo
primer aminoácido, p. ej., pAF, dopa,
O-metil-L-tirosina,
o lo similar, las selecciones in vivo se utilizan
opcionalmente para optimizar adicionalmente la producción del
aminoácido no natural tanto para la síntesis de la proteína
ribosomal como para el crecimiento celular.
Como se describió anteriormente y abajo, la
invención proporciona secuencias de polinucleótidos de ácido
nucleico, p. ej., O-ARNts y O-RSs, y
secuencias de aminoácido de polipéptido, p. ej.,
O-RSs y p. ej., composiciones y métodos que
comprenden dichas secuencias. Ejemplos de dichas secuencias, p. ej.,
O-ARNts y O-RSs se describen en la
presente (ver Tabla 2, p. ej., SEQ ID NO. 1-10). Sin
embargo, el experto en la técnica apreciará que la invención no se
limita a las secuencias descritas en la presente, p. ej., los
Ejemplos. El experto en la técnica apreciará que la invención
también proporciona muchas secuencias no relacionadas con las
funciones descritas en la presente, p. ej., que codifican para un
O-ARNt o una O-RS.
La invención proporciona polipéptidos (p. ej.,
O-RSs) y polinucleótidos, p. ej.,
O-ARNt, polinucleótidos que codifican para
O-RSs o porciones de las mismas, oligonucleótidos
utilizados para aislar clones de aminoacil-ARNt
sintetasa, etc. Los polipéptidos de la invención incluyen
polipéptidos o proteínas con los aminoácidos no naturales de la
invención. Un polipéptido de la invención incluye también un
polipéptido artificial, p. ej., (a) un polipéptido que comprende
una secuencia de aminoácidos como se muestra en cualquiera de las
SEQ ID NO: 4-6; (b) un polipéptido que comprende
una secuencia de aminoácidos codificada por una secuencia de
polinucleótidos como se muestra en cualquiera de las SEQ ID NO.:
8-10; (c) un polipéptido que es específicamente
inmunorreactivo con un anticuerpo específico para un polipéptido de
(a), o (b); y (d) una secuencia de aminoácidos que comprende una
variante conservadora de (a), (b) o (c). Se proporcionan también
anticuerpos y antisueros que son específicamente inmunorreactivos
con un polipéptido artificial de la invención. En una realización,
una composición incluye un polipéptido de la invención y un
excipiente (p. ej., amortiguador, agua, excipiente farmacéuticamente
aceptable, etc.).
Los polinucleótidos de la invención incluyen
aquellos que codifican para las proteínas o polipéptidos de interés
de la invención con uno o más codones selectores. Un polinucleótido
de la invención incluye también un polinucleótido de cualquiera de
las SEQ ID NOs: 8, 9, o 10 o una variante conservadora de las
mismas. Un polinucleótido de la invención incluye un polinucleótido
que codifica para una secuencia de aminoácido que comprende las SEQ
ID NO.: 1-6. Un polinucleótido de la invención
también incluye un polinucleótido que codifica un polipéptido de la
invención. De manera similar, un ácido nucleico artificial que se
híbrida a un polinucleótido indicado anteriormente bajo condiciones
altamente rigurosas sobre sustancialmente la longitud total del
ácido nucleico (y es diferente a un polinucleótido natural) es un
polinucleótido de la invención. Un polinucleótido artificial es un
polinucleótido hecho por el hombre y que no se presenta
naturalmente.
En ciertas realizaciones, un vector (p. ej., un
plásmido, un cósmido, un fago, un virus, etc.) comprende un
polinucleótido de la invención. En una realización, el vector es un
vector de expresión. En otra realización, el vector de expresión
incluye un promotor operablemente enlazado a uno o más de los
polinucleótidos de la invención. En otra realización, una célula
comprende un vector que incluye un polinucleótido de la
invención.
El experto en la técnica también apreciará que
se incluyen muchas variantes de las secuencias descritas en la
invención. Por ejemplo, las variaciones conservadoras de las
secuencias descritas que producen una secuencia funcionalmente
idéntica se incluyen en la invención. Variantes de las secuencias de
polinucleótido de ácido nucleico, en donde las variantes se
híbridas a al menos una secuencia descrita, se consideran incluidas
en la invención. Las sub-secuencias únicas de las
secuencias descritas en la presente, determinadas, p. ej., por
técnicas estándar de comparación de secuencia, también se incluyen
en la invención.
\newpage
Debido a la degeneración del código genético,
las "sustituciones silentes" (i.e., sustituciones en una
secuencia de ácido nucleico que no dan como resultado una alteración
en un polipéptido codificado) son una característica implícita de
toda secuencia de ácido nucleico que codifica para un aminoácido. De
manera similar, "las sustituciones conservadoras de
aminoácidos", en uno o pocos aminoácidos en una secuencia de
aminoácidos se sustituyen con diferentes aminoácidos con propiedades
altamente similares, también se identifican fácilmente como
altamente similares a una estructura descrita. Tales variaciones
conservadoras de cada secuencia descrita son una característica de
la presente invención.
"Variaciones conservadoras" de una
secuencia de ácido nucleico particular se refiere a aquellos ácidos
nucleicos que codifican para secuencias de aminoácido idénticas o
esencialmente idénticas, o, en donde el ácido nucleico no codifica
para una secuencia de aminoácido, a secuencias esencialmente
idénticas. El experto en la técnica reconocerá que las
sustituciones, supresiones, o adiciones individuales que alteran,
agregan o suprimen un solo aminoácido o un pequeño porcentaje de
aminoácidos (típicamente menos del 5%, más típicamente menos del
4%, 2% o 1% (en una secuencia codificada son "variaciones
conservadoramente modificadas" en donde las alteraciones dan
como resultado la supresión de un aminoácido, la adición de un
aminoácido, o la sustitución de un aminoácido con un aminoácido
químicamente similar. De este modo las "variaciones
conservadoras" de una secuencia de polipéptido listada de la
presente invención incluyen sustituciones de un pequeño porcentaje,
típicamente menos del 5%, más típicamente menos del 2% o 1%, de los
aminoácidos de la secuencia de polipéptidos, con un aminoácido
conservadoramente no natural que comprende un aminoácido, en donde
se enlaza un residuo sacárido y/o un aminoácido no natural que
incluye un residuo sacárido del mismo grupo de sustitución
conservadora. Finalmente, la adición de secuencias que no alteran
la actividad codificada de una molécula de ácido nucleico, tal como
la adición de una secuencia no funcional, es una variante
conservadora del ácido nucleico básico.
Son muy conocidas en la técnica las tablas de
sustitución conservadora que proporcionan aminoácidos
funcionalmente similares. Lo siguiente describe grupos de ejemplos
que contienen aminoácidos naturales que incluyen "sustituciones
conservadoras" para los mismos.
Grupos de Sustitución Conservadora
1 | Alanina (A) | Serina (S) | Treonina (T) | |
2 | Ácido aspártico (D) | Ácido glutámico (E) | ||
3 | Asaparagina (N) | Glutamina (Q) | ||
4 | Arginina (N) | Lisina (K) | ||
5 | Isoleucina (I) | Leucina (L) | Metionina (M) | Valina (V) |
6 | Fenilalanina (F) | Tirosina (Y) | Triptofano (W) |
La hibridación comparativa puede utilizarse para
identificar los ácidos nucleicos de la invención, tal como las SEQ
ID NO.: 7, 8, 9, o 10, incluyendo variaciones conservadoras de los
ácidos nucleicos de la invención, y este método de hibridación
comparativa es un método preferido para distinguir los ácidos
nucleicos de la invención. En adición, los ácidos nucleicos
objetivo que se hibridan a un ácido nucleico representado, p. ej.,
por las SEQ ID NO: 7, 8, 9, o 10, bajo condiciones de alta, ultra
alta y ultra-ultra alta rigurosidad son una
característica de la invención. Ejemplos de tales ácidos nucleicos
incluyen aquellos con una o pocas sustituciones silentes o
conservadoras de ácido nucleico en comparación con una secuencia de
ácido nucleico dada.
Se dice que un ácido nucleico de prueba se
híbrida específicamente a un ácido nucleico de sonda cuando se
hibrida al menos ½ tan bien a la sonda como al objetivo
complementario perfectamente adaptado, i.e., con una proporción de
señal a ruido de al menos ½ tan alta como la hibridación de la sonda
al objetivo bajo condiciones en las cuales la sonda perfectamente
adaptada se enlaza al objetivo complementario perfectamente adaptado
con una proporción de señal a ruido que es de al menos
aproximadamente 5x-10x tan alta como la observada
para la hibridación a cualquiera de los ácidos nucleicos no
adaptados.
Los ácidos nucleicos se "hibridan" cuando
se asocian, típicamente en solución. Los ácidos nucleicos se
hibridan debido a una variedad de fuerzas
psico-químicas bien caracterizadas, tales como
enlace de hidrógeno, exclusión de solvente, apilamiento de base y
similares. Una extensa guía para la hibridación de ácidos nucleicos
se encuentra en Tijssen (1993) Laboratory Techniques in Biochemistry
and Molecular Biology-Hibridization with Nucleic
Acid Probes parte I capítulo 2, "Overview of principles of
hibridization and the strategy of nucleic acid probe assays",
(Revisión de principios de hibridación y la estrategia de los
análisis de sondas de ácido nucleico), (Elsevier, New York), así
como en Ausubel, supra. Hames y Higgins (1995) Gene Probes 1
IRL Press en Oxford University Press, Oxford, Inglaterra (Hames y
Higgins 1) y Hames y Higgins (1995) Gene Probes 2 IRL Press en
Oxford University Press, Oxford, Inglaterra (Hames y Higgins 2)
proporcionan detalles acerca de la síntesis, marcado, detección y
cuantificación de ADN y ARN, incluyendo oligonucleótidos.
Un ejemplo de condiciones rigurosas de
hibridación para la hibridación de los ácidos nucleicos
complementarios que tienen más de 100 residuos complementarios en
un filtro en un inmunoanálisis Southern o northern es formalina al
50% con 1 mg de heparina a 42ºC, llevando a cabo la hibridación
durante la noche. Un ejemplo de condiciones rigurosas de lavado es
un lavado 0.2x SSC a 65ºC durante 15 minutos (ver Sambrook,
supra para una descripción de amortiguador SSC).
Frecuentemente el lavado de alta rigurosidad se encuentra precedido
por un lavado de baja rigurosidad para retirar la señal de sonda
anterior. Un ejemplo de lavado de baja rigurosidad es 2x SSC a 40ºC
durante 15 minutos. En general, una proporción de señal a ruido de
5x (o mayor) que esa observada para una sonda no relacionada en el
análisis particular de hibridación indica la detección de una
hibridación específica.
Las "condiciones rigurosas de lavado de
hibridación" en el contexto de los experimentos de hibridación
del ácido nucleico tales como las hibridaciones de inmunoanálisis
Southern y northern, dependen de la secuencia y son diferentes bajo
diferentes parámetros ambientales. Se encuentra una extensa guía
para la hibridación de ácidos nucleicos en Tijssen (1993),
supra, y en Hames y Higgins, 1 y 2. La hibridación y
condiciones de lavado rigurosidad fácilmente pueden determinarse
empíricamente para cualquier ácido nucleico de prueba. Por ejemplo,
para determinar las condiciones rigurosas de hibridación y lavado,
las condiciones de hibridación y lavado se incrementan gradualmente
(p. ej., incrementando la temperatura, disminuyendo la concentración
de sal, incrementando la concentración de detergente y/o
incrementando la concentración de solventes orgánicos tales como
formalina en la hibridación o lavado), hasta cumplir un conjunto
seleccionado de criterios. Por ejemplo, en condiciones de
hibridación y lavado altamente rigurosas, las condiciones de
hibridación y de lavado se incrementan gradualmente hasta que una
sonda se enlaza a un objetivo complementario perfectamente adaptado
con una proporción de señal a ruido que sea de al menos 5x tan alta
como la observada para la hibridación de la sonsa a un objetivo no
adaptado.
Se seleccionan condiciones "muy rigurosas"
que sean iguales al punto de fusión térmica (Tm) para una sonda
particular. La Tm es la temperatura (bajo resistencia iónica y pH
definidos) a la cual el 50% de la secuencia de prueba se hibrida a
una sonda perfectamente adaptada. Para los propósitos de la presente
invención, generalmente, se selecciona que las condiciones de
hibridación y lavado "altamente rigurosas" sean aproximadamente
5ºC más bajas que la Tm para la secuencia específica a una
resistencia iónica y pH definidos.
Las condiciones de hibridación y lavado de
"ultra alta rigurosidad" son aquellas en las cuales la
rigurosidad de las condiciones de hibridación y lavado se
incrementan hasta que la proporción de señal a ruido para el enlace
de la sonda al ácido nucleico objetivo complementario perfectamente
adaptado sea al menos 10x tal alta como la observada para la
hibridación a cualquiera de los ácidos nucleicos objetivo no
adaptados. Un ácido nucleico objetivo que se híbrida a una sonda
bajo tales condiciones, con una proporción de señal a ruido de al
menos ½ de aquella del ácido nucleico objetivo complementario
perfectamente adaptado, se dice que se enlaza a la sonda bajo
condiciones de ultra alta rigurosidad.
De manera similar, pueden determinarse niveles
incluso mayores de rigurosidad incrementando gradualmente las
condiciones de hibridación y/o lavado del análisis de hibridación
relevante. Por ejemplo, aquellos en los cuales la rigurosidad de
las condiciones de hibridación y lavado se incrementan hasta que la
proporción de señal a ruido para enlazar las sonda al ácido
nucleico objetivo complementario perfectamente adaptado es al menos
10x, 20x, 50x, 100x, o 500x o más tan alta como la observada para la
hibridación a cualquiera de los ácidos nucleicos objetivo no
adaptados. Un ácido nucleico objetivo que se híbrida a una sonda
bajo tales condiciones, con una proporción de señal a ruido de al
menos ½ de la del ácido nucleico objetivo complementario
perfectamente adaptado para enlazarse a la sonda bajo condiciones de
rigurosidad ultra-ultra-altas.
Los ácidos nucleicos que no se hibridan entre sí
bajo condiciones rigurosas son aún sustancialmente idénticos si los
polipéptidos que codifican son sustancialmente idénticos. Esto
ocurre, p. ej., cuando se crea una copia de un ácido nucleico
utilizando la máxima degeneración del codón permitida por el código
genético.
En un aspecto, la invención proporciona un ácido
nucleico que comprende una subsecuencia única en un ácido nucleico
seleccionado de las secuencias de O-ARNts y
O-RSs descritas en la presente. La subsecuencia
única es única en comparación con un ácido nucleico que corresponde
a cualquier secuencia de ácido nucleico O-ARNt u
O-RS conocida. La alineación puede efectuarse
utilizando, p. ej., un conjunto BLAST de parámetros de falla.
Cualquier subsecuencia única es útil, p. ej., como una sonda para
identificar los ácidos nucleicos de la invención.
De manera similar, la invención incluye un
polipéptido que comprende una subsecuencia única en un polipéptido
seleccionado de las secuencias de O-RSs descritas en
la presente. Aquí, la subsecuencia única es única en comparación
con un polipéptido que corresponde a cualquier secuencia de
polipéptidos previamente conocida.
La invención proporciona también ácidos
nucleicos objetivo que se hibridan bajo condiciones rigurosas a un
oligonucleótido de codificación único que codifica para una
subsecuencia única en un polipéptido seleccionado de las secuencias
de O-RS en donde la subsecuencia única es única en
comparación con un polipéptido que corresponde a cualquiera de los
polipéptidos de control (p. ej., secuencias de origen de las cuales
se derivan las sintetasas de la invención, p. ej., por mutación).
Las secuencias únicas se determinan como se anotó anteriormente.
Los términos "idéntica" o porcentaje de
"identidad", en el contexto de dos o más secuencias de ácido
nucleico o polipéptidos, se refieren a dos o más secuencias o
subsecuencias que son la misma o tienen un porcentaje especificado
de residuos de aminoácido o nucleótidos que son el mismo, al
compararse y alinearse para correspondencia máxima, medidas
utilizando uno de los algoritmos de comparación de secuencia
descritos abajo (u otros algoritmos disponibles para las personas
expertas) o mediante inspección visual.
La frase "sustancialmente idéntico" en el
contexto de dos ácidos nucleicos o polipéptidos (p. ej., ADNs que
codifican una O-ARNt u O-RS, o la
secuencia de aminoácidos de una O-RS) se refiere a
dos o más secuencias o subsecuencias que tienen al menos
aproximadamente 60%, aproximadamente 80%, aproximadamente
90-95%, aproximadamente 98%, aproximadamente 99% o
más de identidad del residuo de nucleótido o de aminoácido, al
compararse y alinearse para máxima correspondencia, medida
utilizando un algoritmo de comparación de secuencia o mediante
inspección visual. Tales secuencias "sustancialmente
idénticas" se consideran típicamente "homólogas", sin
referencia al linaje real. Preferentemente, la "identidad
sustancial" existe sobre una región de las secuencias que es de
al menos aproximadamente 50 residuos de longitud, más
preferentemente sobre una región de al menos aproximadamente 100
residuos, y de mayor preferencia, las secuencias son sustancialmente
idénticas sobre al menos aproximadamente 150 residuos, o sobre la
longitud total de las dos secuencias que van a compararse.
Las proteínas y/o secuencias de proteína son
homólogas cuando se derivan, natural o artificialmente, de una
proteína o secuencia de proteína ancestral común. De manera similar,
los ácidos nucleicos y/o secuencias de ácido nucleico son homólogas
cuando se derivan, natural o artificialmente, de un ácido nucleico o
secuencia de ácido nucleico ancestral común. Por ejemplo, cualquier
ácido nucleico que se presenta naturalmente puede modificarse por
cualquier método de mutagénesis disponible para incluir uno o más
codones selectores. Al expresarse, este ácido nucleico mutagenizado
codifica un polipéptido que comprende uno o más aminoácidos no
naturales. El proceso de mutación, por supuesto, puede alterar
adicionalmente uno o más codones estándar, asimismo cambiando con
ello uno o más aminoácidos estándar en la proteína mutante
resultante. La homología generalmente se infiere de la similitud de
secuencia entre dos o más ácidos nucleicos o proteínas (o sus
subsecuencias). El porcentaje preciso de similitud entre las
secuencias que es útil para establecer la homología varía con el
ácido nucleico y la proteína en cuestión, pero rutinariamente se
utiliza tan poco como un 25% de similitud de secuencia para
establecer la homología. También pueden utilizarse niveles más altos
de similitud de secuencia, p. ej., 30%, 40%, 50%, 60%, 70%, 80%,
90%, 95%, o 99% o más, para establecer la homología. Los métodos
para determinar los porcentajes de similitud de secuencia (p. ej.,
BLASTP u BLASTN que utilizan parámetros de falla) se describen en
la presente y se encuentran generalmente disponibles.
Para comparación de secuencias y determinación
de homología, típicamente una secuencia actúa como una secuencia de
referencia con la cual se comparan las secuencias de prueba. Al
utilizar un algoritmo de comparación de secuencia, se introducen
secuencias de prueba y de referencia en una computadora, se diseñan
coordenadas de subsecuencia, según sea necesario, y se diseñan los
parámetros de programa de algoritmos de secuencia. El algoritmo de
comparación de secuencia calcula entonces el porcentaje de identidad
de secuencia para la(s) secuencia(s) de prueba
relativa(s) a la secuencia de referencia, en base a los
parámetros de programa diseñados.
La óptima alineación de las secuencias para su
comparación puede conducirse, p. ej., mediante el algoritmo de
homología local de Smith & Waterman, Adv. Appl. Math. 2:482
(1981), mediante el algoritmo de alineación de homología de
Needlemann & Wunsch, J. Mol. Biol. 48:443 (1970), mediante la
búsqueda del método de similitud de Pearson & Lipman, Proc.
Natl. Acad Sci USA 85:2444 (1988), mediante implementaciones
computarizadas de estos algoritmos (GAP., BESTFIT, FASTA y TFASTA
en el Wisconsin Genetics Software Package, Genetics Computer Group,
575 Science Dr., Madison, WI), o mediante inspección visual (ver
generalmente Ausubel et al., infra).
Un ejemplo de un algoritmo adecuado para
determinar la identidad de secuencia porcentual y la similitud de
secuencia es el algoritmo BLAST, que se describe en Altschul et
al., J. Mol. Biol. 215:403-410 (1990). El
software para llevar a cabo análisis BLAST se encuentra disponible
públicamente a través del National Center for Biotechnology
Information (www,ncbi,nlm,nih.gov/). Este algoritmo implica primero
identificar pares de secuencia de alto puntaje (HSPs) identificando
palabras cortas de longitud W en la secuencia de consulta, que se
adaptan o satisfacen algún puntaje T de umbral valuado positivamente
al alinearse con una palabra de la misma longitud en una secuencia
de la base de datos. T se refiere como el umbral de puntaje de
palabra de entorno (Altschul et al., supra). Estos
golpes iniciales de palabra de entorno actúan como semillas para
iniciar búsquedas para encontrar HSPs más largos que los contengan.
Los golpes de palabra se extienden entonces en ambas direcciones a
lo largo de cada secuencia durante tanto como el puntaje acumulativo
de alineación se incremente. Los puntajes acumulativos se calculan
utilizando, para secuencias de nucleótido, los parámetros M
(puntaje de recompensa para un par de residuos adaptables; siempre
> 0) y N (puntaje de castigo para residuos que no se adaptan,
siempre < 0). Para las secuencias de aminoácidos, se utiliza una
matriz de puntaje para calcular el puntaje acumulativo. La
extensión del golpe de palabra en cada dirección se detiene cuando:
el puntaje de alineación acumulativo cae por la cantidad X desde su
máximo valor alcanzado; el puntaje acumulativo llega a cero o por
debajo, debido a la acumulación de una o más alineaciones de residuo
de puntaje negativo; o se alcanza el final de cualquier secuencia.
Los parámetros del algoritmo BLAST W, T, y X determinan la
sensibilidad y velocidad de la alineación. El programa BLASTN (para
secuencias de nucleótido) utiliza como fallas una longitud de
palabra (W) de 11, una expectativa (E) de 10, un corte de 100, M=5,
N=4 y una comparación de ambas cuerdas. Para secuencias de
aminoácido, el programa BLASTP utiliza como fallas una longitud de
palabra (W) de 3, una expectativa (E) de 10, y la matriz de puntaje
BLOSUM62 (ver Henikoff & Henikoff (1989) Proc. Natl. Acad Sci
USA 89:10915).
Además de calcular el porcentaje de identidad de
secuencia, el algoritmo BLAST también lleva a cabo un análisis
estadístico de la similitud entre dos secuencias (ver, p. ej.,
Karlin & Altschul, Proc. Natl. Acad Sci USA
90:5873-5787 (1993)). Una medida de similitud
proporcionada por el algoritmo BLAST es la probabilidad de la suma
más pequeña (R(N)), que proporciona una indicación de la
probabilidad mediante la cual ocurrirá por casualidad la adaptación
entre dos secuencias de nucleótidos o aminoácidos. Por ejemplo, un
ácido nucleico se considera similar a una secuencia de referencia
si la probabilidad de la suma más pequeña en una comparación del
ácido nucleico de prueba con el ácido nucleico de referencia es
menor que aproximadamente 0.1, más preferentemente menor que
aproximadamente 0.01, y de mayor preferencia menos que
aproximadamente 0.001.
Los polinucleótidos y polipéptidos de la
invención y utilizados en la invención pueden manipularse
utilizando técnicas biológicas moleculares. Los textos generales que
describen técnicas biológicas moleculares incluyen Berger y Kimmel,
supra; Sambrook, supra, y Ausubel, Supra. Estos
textos describen mutagénesis, el uso de vectores, promotores y
muchos otros tópicos relevantes relacionados con, p. ej., la
generación de genes que incluyen codones selectores para la
producción de las glicoproteínas de la invención, ARNts ortogonales,
sintetasas ortogonales, y sus
pares.
pares.
En la invención se utilizan diversos tipos de
mutagénesis, p. ej., para mutar moléculas ARNt, para producir
bibliotecas de ARNts, para producir bibliotecas de sintetasas, para
insertar codones selectores que codifican un aminoácido no natural,
p. ej., un aminoácido no natural que comprende un residuo en donde
puede anexarse un residuo sacárido, o un aminoácido no natural que
incluye un residuo sacárido, en una proteína o polipéptido de
interés. Éstos incluyen pero no se limitan a mutagénesis de punto
aleatorio dirigida al sitio, recombinación homóloga, redistribución
de ADN u otros métodos de mutagénesis recursivos, construcción
quimérica, mutagénesis utilizando patrones que contienen uracilo,
mutagénesis dirigida al oligonucleótido, mutagénesis de ADN
modificada por fosforotioato, mutagénesis utilizando ADN de doble
ranura o lo similar, o cualquier combinación de las mismas. Los
métodos adicionales adecuados incluyen reparación del punto de no
adaptación, mutagénesis utilizando especies huésped deficientes en
reparación, restricción selección y
restricción-purificación, mutagénesis de supresión,
mutagénesis mediante síntesis total del gen, reparación de
rompimiento de cuerda doble y similares. La mutagénesis, p. ej.,
que implica estructuras quiméricas, también se incluye en la
presente invención. En una realización, la mutagénesis puede
guiarse mediante información conocida de la molécula que se
presenta naturalmente o de la molécula alterada o mutada que se
presenta naturalmente, p. ej., secuencia, comparaciones de
secuencia, propiedades físicas, estructura cristalina o lo
similar.
Las células huésped se encuentran genéticamente
diseñadas (p. ej., transformadas, transducidas o transfectadas) con
los polinucleótidos de la invención o estructuras que incluyen un
polinucleótido de la invención, p. ej., un vector de la invención,
que puede ser, por ejemplo, un vector de clonación o un vector de
expresión. Por ejemplo, las regiones de codificación para el ARNt
ortogonal, la ARNt sintetasa ortogonal, y la proteína que va
derivarse con p. ej., un aminoácido no natural que comprende un
residuo en donde puede anexarse un residuo sacárido, tal como un
aminoácido derivado de aldehído o ceto, o un aminoácido no natural
que incluye un residuo sacárido, se encuentran operablemente
enlazados a los elementos de control de expresión del gen que son
funcionales en la célula huésped deseada. Los vectores típicos
contienen terminadores de transcripción y traducción, secuencias de
iniciación de transcripción y traducción y promotores útiles para la
regulación de la expresión del ácido nucleico objetivo particular.
Los vectores opcionalmente comprenden casetes de expresión genética
que contienen al menos una secuencia terminador independiente,
secuencias que permiten la replicación del casete en eucariotos, o
procariotos, o ambos (p. ej., vectores de conexión) y marcadores de
selección para sistemas tanto procarióticos como eucarióticos. Los
vectores son adecuados para la replicación y/o la integración en
procariotos, eucariotos, o preferentemente ambos. Ver Giliman &
Smith, Gene 8:81 (1979); Roberts, et al., Nature, 328:731
(1987); Schneider, B., et al., Protein Expr. Purif. 6435:10
(1995); Ausubel, Sambrook, Berger (todos supra). El vector
puede encontrarse, por ejemplo, en forma de un plásmido, una
bacteria, un virus, un polinucleótido desnudo, o un polinucleótido
conjugado, Los vectores se introducen en las células y/o
microorganismos mediante métodos estándar incluyendo electroporación
(From et al., Proc. Natl. Acad Sci USA 82, 5824 (1985),
infección por vectores virales, penetración balística a alta
velocidad por pequeñas partículas con el ácido nucleico ya sea
dentro de la matriz de pequeñas perlas o partículas, o en la
superficie (Klein et al., Nature 327, 70-73
(1987)) y/o lo similar.
Se proporciona un catálogo de Bacterias y
Bacteriófagos útiles para la clonación, p. ej., por el ATCC, p.
ej., The ATCC Catalogue of Bacteria and Bacteriophage (El Catálogo
ATCC de Bacterias y Bacteriófagos) (1996) GHerna et al.,
(eds) publicado por la ATCC. También se encuentran procedimientos
básicos adicionales para secuenciado, clonación y otros aspectos de
la biología molecular y señalamiento de consideraciones teóricas en
Sambrook (supra), Ausubel (supra), y en Watson et
al., (1992) Recombinant DNA (ADN recombinante) Segunda Edición,
Scientific American Books, NY. Además, esencialmente cualquier ácido
nucleico (y virtualmente cualquier ácido nucleico marcado, ya sea
estándar o no estándar) puede adecuarse u ordenarse estándar de
cualquiera de una variedad de fuentes comerciales, tales como
Midland Certified Reagent Company (Midland, TX mcrc.com), The Great
American Gene Company (Ramona, CA, disponible en la red mundial en
genco.com), ExpressGen Inc., (Chicago, IL, disponible en la red
mundial en expressgen.com), Operon Technologies Inc., (Alameda, CA)
y muchos otros.
Las células huésped diseñadas pueden cultivarse
en un medio nutriente convencional modificado según sea apropiado
para actividades tales como, por ejemplo, separación de etapas,
activación de promotores o selección de transformantes. Estas
células opcionalmente pueden cultivarse en organismos transgénicos.
Otras referencias útiles, p. ej., para aislamiento y cultivo
celular (p. ej., para el subsecuente aislamiento del ácido nucleico)
incluyen Freshney (1994) Culture of Animal Cells, a Manual of Basic
Technique, (Cultivo de células animales, un manual de técnicas
básicas) tercera edición, Wiley-Liss, New York y las
referencias citadas en las mismas; Payne et al., (1992)
Plant Cell and Tissue Culture in Liquid Systems (Célula vegetal,
cultivo de tejido y órganos en sistemas líquidos); John Wiley &
Son, Inc. New York; Gamborg y Phillips (eds)(1995) Plant Cell,
Tissue and Organ Culture; (Cultivo de célula vegetal, tejido, y
órgano) Fundamental Methods Springer Lab Manual,
Springer-Verlag (Berlín Heidelberg New York) y Atlas
y Parks (eds) The Handbook of Microbiológical Media (1993) CRC
Press, Boca Ratón FL.
Los equipos también son una característica de la
invención. Por ejemplo se proporciona un equipo para producir una
glicoproteína que comprende al menos un residuo sacárido, en donde
el equipo incluye un contenedor, que contiene una secuencia de
polinucleótidos que codifica para una O-ARNt, y/o
una O-ARNt y/o una secuencia de polinucleótidos que
codifica para una O-RS y/o una O-RS.
En una realización, el equipo incluye además un aminoácido no
natural con un residuo sacárido, o un aminoácido no natural con un
residuo para anexar un residuo sacárido. En otra realización, el
equipo comprende además materiales de instrucción para producir la
glicoproteína.
Se ofrecen los siguientes ejemplos para
ilustrar, pero no para limitar la invención. Se comprende que los
ejemplos y realizaciones descritos en la presente son solo para
propósitos ilustrativos y que se sugerirán varias modificaciones o
cambios a la luz de los mismos a las personas expertas en la técnica
y se incluirán dentro del espíritu y sustancia de esta solicitud y
el alcance de las reivindicaciones anexas.
Este ejemplo describe un sistema para elaborar
p-acetil-L-fenilalanina
e incorporar este aminoácido no natural en una proteína.
Los códigos genéticos de la mayoría de los
organismos conocidos codifican para los mismos veinte aminoácidos
comunes como bloques de construcción para la biosíntesis de
proteínas. Solo en casos raros se agrega selenocisteína (ver, p.
ej., Bock, A., et al., (1991) Mol. Microbiol.,
5:5125-520) o pirrolisina (ver, p. ej., Srinivasan,
G., et al., (2002) Science, 296:1459-1462; y
Hao, B., et al., (2002) Science,
296:1462-1466). Las cadenas laterales de los
aminoácidos comunes comprenden un número sorprendentemente limitado
de grupos funcionales - bases de nitrógeno, ácidos y amidas
carboxílicas, alcoholes, y un grupo tiol, siendo el resto alcanos
simples o grupos hidrofóbicos. La capacidad para aumentar los
aminoácidos genéticamente codificados con nuevos aminoácidos, por
ejemplo, los aminoácidos con cadenas laterales metálicas quelantes,
fluorescentes, activas de reducción, fotoactivas o marcadas por
rotación, aumentarían significativamente la capacidad para manipular
las estructuras y funciones de proteínas y tal vez de los
organismos vivos en sí. Recientemente, se reportó que al agregar
nuevos componentes a la maquinaria traslacional de Escherichia
coli, (E. coli) se puede incorporar específicamente en
el sitio con alta fidelidad un número de aminoácidos no naturales
(ver, p. ej., Wang, L., et al., (2001) Science,
292:498-500; Wang, L., et al., (2002) J. Am.
Chem. Soc., 124:1836-1837; y Zhang, Z., et
al., (2002) Angew. Chem. Int. Ed. Engl.,
41:2840-2842) en proteínas in vivo. Este
Ejemplo demuestra que este procedimiento puede generalizarse para
agregar un aminoácido que contiene ceto al código genético de un
organismo, p. ej., E. coli, y que la reactividad única del
grupo ceto puede utilizarse para modificar proteínas selectivamente
in vitro con una amplia variedad de agentes.
El grupo ceto se encuentra en todo sitio en la
química orgánica y participa en un gran número de reacciones desde
las reacciones de adición hasta las condensaciones de aldol. Además,
la reactividad única del grupo ceto le permite ser modificado
selectivamente con derivados de hidrazida e hidroxilamina en
presencia de las otras cadenas laterales de aminoácidos. Ver, p.
ej., Cornish, V.W., et al., (1996) J. Am. Chem. Soc.,
118:8150-8151; Geoghegan, K.F., & Stroh, J.G.,
(1992) Bioconjug. Chem., 3:138-146; y, Mahal, L.K.,
et al., (1997) Science, 276:1125-1128.
Aunque presente en cofactores (ver, p. ej., Begley, T.P., et
al., (1997) en Top Curr. Chem. Eds. Leeper, F.J., &
Vederas, J.C., (Springer-Verlag, New York), Vol.
195, pp. 93-142), metabolitos (ver, p. ej., Diaz,
E., et al., (2001) Microbiol. Mol. Biol. Rev.
65:523-569) y como una modificación
post-traslacional a las proteínas (ver, p. ej.,
Okeley, N.M., & van der Donk, W.A., (2000) Chem. Biol. 7,
R159-R171), este importante grupo funcional se
encuentra ausente de las cadenas laterales de los aminoácidos
comunes. A fin de codificar genéticamente este grupo funcional en
E. coli en forma de
p-acetil-L-fenilalanina,
se desarrolló un par de ARNt-sintetasa que es capaz
de insertar este aminoácido específicamente en el sitio en proteínas
en E. coli en respuesta a (y solo en respuesta a) un codón
ámbar de no sentido. De manera importante, este par de
ARNt-sintetasa es ortogonal a sus contrapartes para
los 20 aminoácidos comunes, i.e., la sintetasa ortogonal (y solo la
sintetasa ortogonal) aminoacila el ARNt ortogonal (y solo este
ARNt) solo con el aminoácido no natural, y el ARNt acilado
resultante inserta el aminoácido no natural solo en respuesta al
codón ámbar.
Preparación de
p-acetil-L-fenilalanina:
Fmoc-4-acetil-L-fenilalanina
se adquirió de RSP Amino Acid Analogues, Inc., (Worcester, MA).
Este compuesto (1.0 g, 2.3 mmol) se agitó con 4 ml de piperidina
(20% en DMF) durante 2 horas a temperatura ambiente. El solvente se
evaporó para obtener un polvo blanco. El sólido se resuspendió
entonces en 10 ml de agua fría (ácido trifluoroacético (TFA) al
0.1%), y el sobrenadante se recolectó mediante filtración. Se
utilizó HPLC de preparación en fase de reversa (Microsorb C18,
Rainin Instrument Co., Inc., Woburn, MA) para separar el producto
deseado de la mezcla de reacción (5-30% CH3CN en H2O
con TFA al 0.1% a lo largo de 30 min.). El eluyente (tR = 12 min.)
se liofilizó hasta obtener un sólido blanco (0.45 g, 88%). 1H NMR
(400 MHz D2O): \delta 7.85-7.28 (m, 4H), 4.23 (dd,
1H, 5.4 Hz), 3.2 (m, 2H), 2.7 (s, 3H), Ionización MS de
electroaspersión (ESI): [M+1]+, calculado para C11H13NO3 208.09,
encontrado 208.47.
Síntesis de
p-acetil-(\pm)-fenilalanina: ver,
p. ej., Cleland, G.H., (1969) J. Org. Chem.,
34:744-747. N-bromosuccinimida
(NMB) se recristalizó previo al uso. NBS (18.5 g, 105 mmol) se
agregó a una solución agitada de 4-metil acetofona
(13.4 g, 100 mmol) en 400 ml de tetracloruro de carbono, seguido por
la adición de 2',2'-azobisisobutironitrilo) (AIBN)
(0.43 g, 2.5 mmol). La mezcla de reacción se calentó entonces hasta
reflujo durante 4 horas. Después de completar la reacción
(TLC:8:1/hexanos:EtOAc), la solución se lavó con agua (1 X 100 ml),
1 M de HCl acuoso (3 X 100 ml), NaHCO3 acuoso al 0.5% (3 X 100 ml)
y salmuera (1 X 100 ml). La capa orgánica se recolectó y se secó
sobre MgSO4 anhidro y el solvente se evaporó para obtener un sólido
amarillo que se recristalizó con hexanos para producir la
1-(4-bromoetil-fenil)tanona
deseada como un sólido (16.8 g, 78%). Se agregó etanol seco (50 ml)
por goteo a piezas de sodio lavado con pentano (2.3 g, 0.1 mol) bajo
una atmósfera de argón a lo largo de 15 minutos y la solución se
agitó durante otros 15 minutos. Se agregó entonces dietil
acetamidomalonato sólido (2.7 g, 10 mmol) a lo largo de 30 minutos
con agitación, seguido por la adición por goteo de
1-(4-bromoetil-fenil)tanona
(2.1 g, 10 mmol) en etanol seco a lo largo de 90 minutos. Después de
calentar la mezcla hasta reflujo durante la noche y enfriarla, se
agregaron dietil éter (150 ml) y agua (100 ml) a la solución. La
capa orgánica se separó y se lavó sucesivamente con NaHCO3 al 0.5%
(3 X 100 ml) y salmuera (1 X 100 ml). Después de secar sobre MgSO4
anhidro, el solvente se retiró in vacuo para producir un sólido
gomoso café. Se agregó hexanos-diclorometano (4:1)
al residuo y el material insoluble se filtró y se lavó
exhaustivamente con 10:1 diclorometano-benceno para
producir dietil éster de ácido
2-acetilamino-2-(4-acetil-bencil)malónico
como un sólido amarillo (3.3 g, 95% producto crudo). Este compuesto
se agitó con 4 M de HCl en dioxano durante la noche. La mezcla se
evaporó entonces hasta secarse y se recristalizó con agua para
producir
p-acetil-(\pm)-fenilalanina (13.2
g, 64% producto total) como un sólido blanco. 1H NMR (400 MHz,
D2O): \delta 7.85-7.28 (m, 4H), 4.27 (dd, 1H, 5.4
Hz), 3.30 (m, 2H), 2.68 (s, 3H), 13C NMR (400 MHz, D2O): \delta
195.8, 174.3, 145.9, 133.1, 128.9, 127.8, 60.2, 38.3, 26.5. MS
(ESI) (M+1)+ calculado para C11H13NO3 208.09, encontrado 208.07.
Evolución de sintetasa mutante: En la selección
positiva el plásmido pYC-J17 se utilizó para
expresar el gen mutARN Tyr CUA y el gen de cloranfenicol acetil
transferasa (CAT) con un codón TAG de paro en Asp112. Ver, p. ej.,
Wang, L. et al., (2001) Science 292:498-500.
El ADN supercoiled que codifica para la biblioteca de
tirosil-ARNt sintetasa (TyrRS) se transformó en
células DH10B competentes de E. coli conteniendo
pYC-J17. Las células se emplacaron en placas de
medio mínimo conteniendo glicerol al 1% y 0.3 mM de leucina (GMML)
con 17 \mug/ml de tetraciclina, 25 mg/ml de canamicina, 60 mg/ml
de cloranfenicol, y 1 mM de
p-acetil-L-fenilalanina.
Después de la incubación a 37ºC durante 40 horas, las colonias se
depositaron y los plásmidos se aislaron. Los plásmidos que
codifican sintetasas mutantes (plásmidos pBK) se separaron de
pYC-J17 utilizando electroforesis de gel y se
transformaron en células competentes DH10B de E. coli que
contienen pLWJ17B3 para la selección negativa. El plásmido pLWJ17B3
expresa el mutARN Tyr CUA bajo el control del promotor lpp y el
terminador rrnC, y el gen de barnasa con tres codones ámbar en
Gln2, Asp44, y Gly65 bajo el control del promotor de arabinosa. Las
células transformadas crecieron en placas LB
(Luria-Bertani) que contienen arabinosa al 0.2%, 50
\mug/ml de canamicina y 35 \mug/ml de cloranfenicol. Después de
8 horas, las células se retiraron de la placa, y los plásmidos pBK
se purificaron para rondas de selección adicionales. En la segunda y
tercera rondas de selección positiva, la concentración de
cloranfenicol aumentó a 80 y 100 \mug/ml, respectivamente. Después
de 3 selecciones positivas alternando con 2 selecciones negativas,
se identificaron once TyrRS mutantes que produjeron un valor IC50
de 9 \mug/ml de cloranfenicol en ausencia de
p-acetil-L-fenilalanina
y 120 \mug/ml de cloranfenicol en presencia de
p-acetil-L-fenilalanina
en un ensayo CAT in vivo. Ver, p. ej., Wang, L., &
Schultz, P.G. (2001) Chem Biol.8:883-890. Las
secuencias de proteínas de estas TyrRS mutantes convergieron en 3
clones independientes LW1, LW5 y LW6, aunque el uso del codón de
cada TyrRS mutante difiere.
Expresión y purificación de proteínas: Se
utilizó el plásmido pLEIZ para expresar el gen de dominio Z con
otro codón ámbar en la 7ª posición y un COOH terminal His6 tag bajo
el control de un promotor T5 bacteriófago y un terminador t0, y el
gen mutARN Tyr CUA bajo el control del promotor lpp y el terminador
rrnC. El gen de sintetasa mutante aislado del clon LW1 (LW1RS) se
codificó en el plásmido pBK-LW1RS bajo el control
del promotor y terminador constitutivo de E. coli GlnRS. Las
células DH10B de E. coli cotransformadas con pLEIZ y
pBK-LW1RS crecieron en medio mínimo conteniendo
glicerol al 1% y 0.3 mM de leucina (medio GMML) con 25 \mug/ml de
canamicina, 34 \mug/ml de cloranfenicol, y 1.0 mM de
p-acetil-(+)-fenilalanina. Cuando
las células alcanzan un OD600 de 0.5, se agregó
isopropilo-\beta-D-tiogalactopiranosida
(IPTG) (1 mM) para inducir la expresión de la proteína. Después de
5 horas, las células se granularon y la proteína se purificó
mediante cromatografía de afinidad Ni2+ bajo condiciones de
desnaturalización de acuerdo con el protocolo del fabricante
(Qiagen, Valencia, CA). Las proteínas se desalaron entonces con una
columna PD-10 (Amersham Pharmacia, Piscataway, NJ)
y se eluyeron en agua. El producto de proteínas se midió mediante un
análisis Bradford (equipo BCA, Biorad, Hercules, CA). Se utilizaron
alícuotas de proteína para electroforesis de gel de sodio dodecil
sulfato-poliacrilamida (SDS-PAGE) y
espectrometría de masa.
Modificación de proteínas in vitro con
hidrazida fluorescente e hidrazida biotina: Las proteínas de tipo
silvestre (wt) purificadas y de dominio Z mutante se intercambiaron
en solución salina amortiguada con fosfato (amortiguador PBS, 100
mM de fosfato de potasio, pH 6.5, 0.5 M de cloruro de sodio)
mediante diálisis. La hidrazida fluorescente 1 (Molecular Probe,
Eugene, OR) o la hidrazida biotina 2 (Molecular Probe, Eugene, OR)
se disolvió en DMF, y se agregaron a 0.07 \mumol de cada proteína
en tubos eppendorff silanizados hasta una concentración final de 1
mM. Se agregó amortiguador PBS (pH 6.5) para llevar el volumen final
a 0.5 ml. La mezcla de reacción se mantuvo a 25ºC durante 18 horas.
El colorante no reactivado o biotina se retiró de la proteína
utilizando una columna PD-10 (Amersham Pharmacia,
Piscataway, NJ), y las proteínas se eluyeron con amortiguador PBS.
Para determinar la eficiencia del marcado, las muestras de proteína
eluidas se analizaron entonces mediante HPLC de fase de reversa
(Agilent ZORBAX SB-C18, 4.6 mm x 250 mm, proporción
de flujo 1.0 ml/min., 10\rightarrow40% CH3CN en 50 mM
amortiguador de trietilamina acetato acuoso, pH 7.0 a lo largo de
70 min., Agilent, Palo Alto, CA). El tiempo de retención (tR) para
el dominio Z mutante sin marcar fue de 39.3 min.; el tR para el
dominio Z mutante marcado con hidrazida fluorescente fue de 40.7
min.; el tR para el dominio Z mutante marcado con hidrazida biotina
fue de 40.9 min.
Medición del espectro de fluorescencia: Todos
los espectros de emisión de fluorescencia se registraron utilizando
un espectroflurómetro FluoroMax-2 (Instruments S.A.,
Inc. Edison, NJ) con excitación a 490 nm; paso de banda tanto de
excitación como de emisión de 4 nm; un voltaje de tubo
fotomultiplicador de 950 V; y a una proporción de exploración de 1
nm/seg. Se utilizaron diez nmol de cada proteína marcada. Los
espectros reportados representan un promedio de 3
exploraciones.
El grupo ceto proporciona una única reactividad
química no presente en los veinte aminoácidos comunes debido a su
capacidad para participar en las reacciones de adición que implican
ya sea el grupo carbonilo o la posición acídica C\alpha. Este
grupo proporciona también una alternativa a la cisteína de
aminoácido natural para la modificación selectiva de proteínas con
una gran variedad de reactivos químicos. El grupo tiol reactivo de
cisteína se ha utilizado extensamente para anexar diversas sondas
biofísicas a proteínas. Ver, p. ej., Creighton, T.E., (1986)
Methods Enzymol. 131:83-106; Altenbach, C., et
al., (1990) Science 248:1088-1092; Brinkley, M.
(1992) Bioconjug. Chem. 3:2-13; Giuliano, K.A.,
et al., (1995) Annu. Rev. Biophys. Biomol. Struct.
24:405-434; Mannuzzu, L.M., et al., (1996)
Science 271:213-216; Griffin, B.A., et al.,
(1998) Science 281:269-272; Llopis, J., et
al., (2000) Methods Enzymol. 327:546-564; y
Gaietta, G., et al., (2002) Science
296:503-507. Desafortunadamente, el marcado de
residuos únicos de cisteína se complica frecuentemente por la
presencia de más de un residuo reactivo en una proteína, así como
reacciones de intercambio en presencia de un tiol libre cuando se
utiliza un enlace disulfuro. En consecuencia, la disponibilidad de
un aminoácido no proteinógeno con reactividad ortogonal hace
posible la modificación selectiva de proteínas en casos en que una
cisteína única no puede marcarse selectivamente, o cuando se
necesitan dos marcas diferentes. El grupo ceto reacciona fácilmente
con hidrazidas, hidroxilaminas, y semicarbazidas bajo condiciones
suaves en una solución acuosa, y formas de hidrazona, oxima, y
enlaces de semicarbazona, respectivamente, que son estables bajo
condiciones fisiológicas. Ver, p. ej., Jencks, W.P., (1959) J. Am.
Chem. Soc. 81:475-481; Shao, J., & Tam, J.P.,
(1995) J. Am. Chem. Soc. 117:3893-3899.
Se han desarrollado varios métodos para
incorporar selectivamente el grupo carbonilo en péptidos y
proteínas pequeñas. Inicialmente, se introdujo un aldehído en la
terminal N de los péptidos oxidando serina
N-terminal o treonina con periodato. El grupo
aldehído se acopló a informadores de biotina y fluorescentes (ver,
p. ej., Geoghegan, K.F. & Stroh, J.G. (1992) Bioconjug. Chem.
3:138-146 o fragmentos de proteína que contienen
una hidrazida COOH-terminal a través de un enlace de
hidrazona (ver, p. ej., Gaertner, H.F., et al., (1994) J.
Biol. Chem. 269:724-7230). El grupo carbonilo
introducido mediante este método restringido al
N-término de la proteína debe ser estable a la
oxidación. Se empleó posteriormente la síntesis de péptido de fase
sólida (SPPS) para la preparación de segmentos de péptido
conteniendo ya sea hidrazida o hidroxilamina, que subsecuentemente
se reactivaron con una matriz de núcleo de aldehído ramificada para
formar dendrímeros de péptido (ver, p. ej., Shao, J. & Tam.
J.P., (1995) J. Am. Chem. Soc. 117:3893-3899; Rose,
K., (1994) J. Am. Chem. Soc. 116:30-33), o con un
segmento de péptido que contiene ceto para formar proteínas
sintéticas (ver, p. ej., Canne, L.E., et al., (1995) J. Am.
Chem. Soc. 117:2998-3007). La SPPS permite que el
grupo ceto se incorpore a lo largo de toda la proteína pero sufre
las dificultades inherentes asociadas con la síntesis de grandes
péptidos o proteínas. La limitación del tamaño puede superarse en
algunos casos mediante ligación de la proteína expresada (EPL), en
la cual un péptido sintético se liga químicamente al
COOH-término de las proteínas recombinantes. Ver,
p. ej., Muir, T.W., et al., (1998) Proc. Natl. Acad Sci USA
95:6705-6710. Un péptido que contiene un grupo
cetona se preparó mediante SPPS y se ligó al dominio 3 de homología
Src de la proteína Abelson tirosina quinasa. Ver, p. ej., Ayers,
B., et al., (1999) Biopolymers
51:343-354.
También se ha utilizado un método biosintético
in vitro para incorporar el grupo ceto en proteínas. Ver, p.
ej., Cornish, V.W., et al., (1996) J. Am. Chem. Soc.
118:8150-8151. En este método, el aminoácido no
natural que contiene el grupo ceto se acila químicamente a un ARNt
supresor ámbar. Cuando el ARNt acilado y el gen mutante se combinan
en un extracto in vitro capaz de soportar la biosíntesis de
la proteína, el aminoácido no natural se incorpora selectivamente
en respuesta a un codón UAG. Este método requiere que el supresor
ARNt se encuentre químicamente aminoacilado con el aminoácido no
natural in vitro, y el ARNt acilado se consume como un
reactivo estequiométrico durante la traducción y no puede
regenerarse, dando como resultado bajos rendimientos de proteína.
Al desarrollar un par ortogonal de ARNt-sintetasa
con especificidad para
p-acetil-L-fenilalanina,
puede incorporarse un aminoácido ceto en proteínas, p. ej., en
respuesta al codón UAG directamente en células vivas de E.
coli. No debe existir limitación de tamaño en la proteína
objetivo mientras que pueda expresarse en el organismo, p. ej.,
E. coli, y debe ser posible expresar grandes cantidades de la
proteína mutante. Además, mientras que el reactivo marcado sea
permeable a la célula y no tóxico, puede ser posible introducir la
marca selectivamente en células completas.
Evolución de sintetasas mutantes con
especificidades para
p-acetil-L-fenilalanina:
Se utilizó una tirosil-ARNt sintetasa Methanococcus
jannaschii (TyrRS) y un ARNt supresor ámbar de tirosina mutante
(mutARN Tyr CUA) como punto de inicio para la generación de los
pares ortogonales de ARNt-sintetasa. Previamente,
este par mostró ser ortogonal en E. coli. Ver, p. ej., Wang,
L., & Schultz, P.G., (2001) Chem. Biol.
8:883-890; y Wang, L., et al., (2000) J. Am.
Chem. Soc. 122:5010-5011. Para cambiar la
especificidad del aminoácido de la TyrRS a modo que cargue
p-acetil-L-fenilalanina
y no cualquiera de los 20 aminoácidos comunes, se generó una
biblioteca de TyrRS mutantes M. jannaschii y se seleccionó. La
estructura cristalina del TyrRS Bacillus stearothermophilus
homóloga (ver, p. ej., Brick, P., et al., (1989) J. Mol.
Biol. 208:83-98) se utilizó para identificar
aquellos residuos que se encuentran dentro de 6.5 A de la para
posición del anillo de arilo de la tirosina enlazada. Cinco
residuos correspondientes (Tyr32, Glu107, Asp158, Ile159 y Leu162)
en el sitio activo de TyrRS M. jannaschii se mutaron aleatoriamente
mediante reacción de cadena de polimerasa (PCR) para generar una
biblioteca de 1.6 x 109 en tamaño (ver, p. ej., Wang, L., et
al., (2001) Science 292:498-500. Esta biblioteca
de TyrRS mutante se pasó primero a través de una selección positiva
en presencia de 1 mM de
p-acetil-L-fenilalanina
que se basa en la supresión de un codón ámbar de paro en un residuo
no esencial (Asp112) en un gen de cloranfenicol acetil transferasa
(CAT) codificado en el plásmido pYC-J17 (ver, p.
ej., Wang, L., et al., (2001) Science
292:498-500) en E. coli. Las células que
sobrevivieron en cloranfenicol deben codificar para una sintetasa
mutante que aminoacila el mutARN Tyr CUA ya sea con un
aminoácido(s) común(es) o
p-acetil-L-fenilalanina.
El ADN que codifica para las sintetasas mutantes se aisló entonces
y se transformó en una especie de selección negativa que expresa el
gen de una proteína tóxica, barnasa, conteniendo tres codones ámbar
en sitios permisivos (codificados en pLWJ17B3 plásmido). Las
células que codifican una sintetasa mutante que carga el mutARN Tyr
CUA con aminoácidos naturales producirá barnasa y morirá. Debido a
que no se agregó
p-acetil-L-fenilalanina
al medio de crecimiento en la selección negativa, las
sobrevivientes deben codificar una sintetasa con especificidad para
el aminoácido no natural. Después de 3 rondas de selección positiva
a concentraciones incrementadas de cloranfenicol, alternando con 2
rondas de selección negativa, emergió un número de clones cuya
supervivencia en cloranfenicol fue dependiente de la adición de
p-acetil-L-fenilalanina.
Estas TyrRSs se caracterizaron utilizando un análisis in
vivo en base a la supresión del codón Asp 112TAG en el gen CAT.
Ver, p. ej., Wang, L., & Schultz, P.G., (2001) Chem. Biol.
8:883-890. Se identificaron once TyrRS mutantes. Las
células que expresan la sintetasa seleccionada y el mutARN Tyr CUA
sobrevivieron en ausencia de
p-acetil-L-fenilalanina
en 9 mg/ml de cloranfenicol en placas de medio mínimo conteniendo
glicerol al 1% y 0.3 mM de leucina (placa GMML); en presencia de
este aminoácido natural, las células sobrevivieron en 120 mg/ml de
cloranfenicol en placas GMML. Este resultado sugiere que la
sintetasa mutante seleccionada tiene más alta actividad para
p-acetil-L-fenilalanina
que para los aminoácidos naturales. La secuenciación del ADN de
estos mutantes reveló que éstos convergen en 3 mutantes
independientes en el nivel de proteínas (LW1, LW5 y LW6), aunque
tienen diferente uso del codón para los aminoácidos. Las mutaciones
activas en el sitio de las sintetasas mutantes se listan en la Tabla
1. En base a la estructura cristalina de las TyrRS homólogas a
partir de B. stearothermophilus, la cadena lateral conservada de
Tyr32 y Asp158 de M. Jannaschii forma probablemente enlaces con el
grupo hidroxilo del sustrato de tirosina. En las sintetasas
mutantes, Tyr32 es mutada ya sea a Leu o Ala, y Asp158 muta a
Gly158. Estas mutaciones deben desfavorecer el enlace de tirosina y
al mismo tiempo pueden crear espacio extra para acomodar el grupo
metilo de
p-acetil-L-fenilalanina.
La determinación de la estructura cristalina de rayos X de los
mutantes debe aclarar los papeles exactos de estos mutantes.
\vskip1.000000\baselineskip
Para probar la capacidad de la sintetasa
desarrollada y el muARNt para incorporar selectivamente
p-acetil-L-fenilalanina
en proteínas, se sustituyó un codón ámbar de paro en un sitio
permisivo (Lys7) en el gen para el dominio Z de la proteína A de
estafilococo (ver, p. ej., Nilsson, B., et al., (1987)
Protein Eng. 1:107-113) con un His6 tag
COOH-terminal. El dominio Z tiene un peso molecular
de aproximadamente 7.9 kD, de modo que su masa puede medirse con
muy alta precisión utilizando espectrometría de masa de resonancia
de ion ciclotron (ICR). Las células transformadas con el mutARN Tyr
CUA, LW1RS y el gen de dominio Z (Lys7TAG) crecieron en presencia
de 1 mM de
p-acetil-(+)-fenilalanina. La
adición del aminoácido no natural no afectó la proporción de
crecimiento de las células. La proteína mutante se purificó
mediante cromatografía de afinidad Ni2+ con un rendimiento total
aislado de 3.6 mg/l en medio mínimo. Para comparación, el
rendimiento de dominio Z fue de 9.2 mg/l en medio mínimo cuando se
reemplazó la TyrRS mutante con la TyrRS de tipo silvestre (wt). No
se obtuvo ningún dominio Z en ausencia de
p-acetil-(+)-fenilalanina, el muARNt
o LW1RS, indicando una muy alta fidelidad en la incorporación del
aminoácido no natural en este sitio. También se tuvo éxito al
incorporar
p-acetil-L-fenilalanina
en otras proteínas tales como
Cdc42.
Cdc42.
Tanto la proteína de dominio Z wt expresada por
muARNt /WT TysRS como la proteína de dominio Z mutante expresada
por el muARNt/LW1RS se analizaron por ionización de electroaspersión
de la espectrometría de masa de resonancia de ion ciclotron Fourier
(FT-ICR MS). Para la proteína de dominio Z wt se
observaron tres picos con masas correspondientes a la proteína
intacta, la proteína sin la primera metionina, y a la forma
acetilada de la proteína sin la primera metionina (confirmada por
análisis espectrométrico de masa en serie del fragmento de péptido
tríptico digerido de N-terminal). Para la proteína
del dominio Z mutante, la masa monoisotópica experimental de la
proteína intacta fue de 7949.893 Da, que se encuentra dentro de 2.2
ppm de la masa teórica de 7949.874 Da. Otros dos picos corresponden
a la proteína sin la primera metionina (Mexperimental = 7818.838
Da, Mteórica = 7818.833 Da) y su forma acetilada (Mexperimental =
7860.843 Da, Mteórica = 7860.844 Da), respectivamente. No se
observó en el espectro ningún pico correspondiente a las proteínas
mutantes con ningún oro aminoácido en la posición del codón ámbar.
La proporción de señal a ruido de más de 1500 observada en el
espectro dde masa de la proteína intacta se traduce a una fidelidad
para la incorporación de
p-acetil-L-fenilalanina
mejor que 99.8%. La espectrometría de masa en serie de
cromatografía líquida de digestión tríptica se llevó a cabo para
confirmar la secuencia del péptido NH2-terminal. El
ion precursor a 606.23 Da, que corresponde al ion molecular
doblemente cargado del péptido tríptico NH2-terminal
MTSVDNY*INK, se aisló y se fragmentó con un espectrómetro de masa
de trampa de ion (ITMS). Las masas de ion de fragmento podrían
asignarse de manera no ambigua, confirmando la incorporación
específica en el sitio de
p-aceil-L-fenilalanina.
Estos resultados claramente demuestran que la sintetasa
desarrollada junto con el muARNt incorpora
p-acetil-L-fenilalanina
y no un aminoácido natural en la posición codificada por el codón
ámbar en ninguna otra posición.
Enseguida determinamos si el grupo ceto de
p-acetil-L-fenilalanina
podría servir como ayuda química para la modificación específica en
el sitio de proteínas in vitro. La proteína de dominio Z de
p-acetil-L-fenilalanina
(dominio Z mutante) y la proteína de dominio Z wt se trataron con 1
mM de hidrazida de fluorescencia (Esquema 1) a 25ºC durante 18
horas en amortiguador de fosfato. Después de la reacción, las
proteínas se separaron del exceso de hidrazida de fluorescencia
mediante cromatografía de exclusión de tamaño, y se analizaron con
electroforesis de gel de sodio dodecil
sulfato-poliacrilamida (SDS-PAGE).
El gel se visualizó primero con un sistema de fluorovisualización,
y después se colorearon con plata. La banda para el dominio Z
mutante muestra una señal fluorescente aunque no puede detectarse
fluorescencia de la banda de dominio Z wt. Se utilizaron alícuotas
de estas dos proteínas para medir el espectro de fluorescencia con
490 nm de excitación. Solo la proteína de dominio Z conteniendo
p-acetil-L-fenilalanina
muestra un espectro de fluorescencia similar al de la
fluorescencia. No se detectó ninguna señal de fluorescencia para el
dominio Z wt, indicando que la reacción de marcado se presentó solo
entre la hidrazida y la cetona, y no en ninguno de los grupos
funcionales existentes en la proteína wt. El producto marcado se
analizó con espectrometría de masa cuádruple de tiempo de vuelo
(QTOF MS). Se obtuvo una masa monoisotrópica experimental de
8425.160 Da (Mteórica = 8424.958 Da), confirmando que la hidrazida
de fluorescencia reaccionó con la proteína de dominio Z mutante en
una proporción molar de 1:1. Para determinar el grado de marcado,
la mezcla de reacción se separó mediante cromatografía líquida de
alto desempeño (HPLC). La proporción del área pico del dominio Z
marcado sobre la del dominio Z no marcado fue de 90 + 5%.
\newpage
Esquema
1
Para demostrar la generalidad de este
procedimiento, también marcamos el dominio Z con derivado de
hidrazida biotina (Estructura C). El mutante purificado y el dominio
Z wt se trataron con 1 mM de hidrazida biotina en amortiguador de
fosfato a 25ºC durante 18 horas. Después de diálisis contra el
amortiguador de fosfato para retirar el exceso de hidrazida
biotina, las proteínas se sometieron a SDS-PAGE. Las
proteínas separadas se transfirieron a una membrana de
nitrocelulosa y se probaron con un conjugado específico a biotina
de avidina-HRP. Como se esperaba, solo se detectó el
dominio Z mutante conteniendo
p-acetil-L-fenilalanina,
indicando que se marcó con hidrazida biotina. No se observó ninguna
señal para el dominio Z wt. La eficiencia del marcado fue de 80 +
10% como se determinó mediante análisis HPLC como se describió en el
experimento de marcado con fluorescencia. Se confirmó que la
proteína marcada mediante QTOF MS (Mexperimental = 8416.236,
Mteórica = 8416.146 Da) es el producto formado entre una molécula de
hidrazida biotina y una molécula de dominio Z mutante. Estos
experimentos demostraron excelente especificidad de la ayuda de
cetona para la modificación in vitro de proteínas.
En resumen, hemos incorporado específicamente en
el sitio un nuevo grupo químico funcional, el grupo ceto, en
proteínas in vivo. Este grupo funcional puede marcarse
selectiva y eficientemente, p. ej., con fluorescencia y biotina
in vitro mediante una reacción química específica entre el
grupo ceto y los derivados de hidrazida. Este procedimiento hace
posible marcar selectivamente proteínas con una amplia variedad de
otros derivados de hidrazida o de hidroxilamina (incluyendo
azúcares, marcas de rotación, queladores metálicos, agentes de
reticulación, poliéteres, ácidos grasos y toxinas), ya sea como
sondas de estructura y función de proteína, para generar proteínas
con propiedades catalíticas o terapéuticas aumentadas, o para el
desarrollo de bioanálisis utilizando proteínas. La capacidad para
incorporar específicamente en el sitio una ayuda química única en
proteínas directamente en una célula viva hace posible la
modificación in vivo de proteínas con fluoróforos de
molécula pequeña para la visualización in vivo de la
localización de proteínas, el movimiento de las proteínas y los
cambios de conformación en las proteínas en una resolución
molecular. El marcado in vivo de proteínas que contienen
p-acetil-L-fenilalanina
con fluoróforos en E. coli también se hace posible mediante
esta técnica.
\vskip1.000000\baselineskip
Se generó una TyrRS ortogonal para la
aminoacilación del mutARN Tyr CUA (descrita en el Ejemplo 1 de la
WO2002/085923) con análogos de meta-tirosina.
Preparación de plásmidos de la biblioteca de
TyrRS mutante: Se construyó una biblioteca de plásmidos que
codifican para TyrRSs mutantes de M. jannaschii dirigidos en
derivados de tirosina meta-sustituidos, siguiendo
en general los métodos descritos en el Ejemplo 1 de la WO
2002/085923. Brevemente, seis residuos (Tyr32, Ala67, His70,
Gln155, Asp158, Ala167) en el sitio activo de la TyrRS de M.
jannaschii que se encuentran dentro de 6.9 A de la posición
meta del anillo de arilo de la tirosina enlazada en la estructura
cristalina de TyrRS de Bacillus stearothermophilus se
mutaron a todos los 20 aminoácidos en el nivel de ADN utilizando el
esquema del codón NNK como se describió en el Ejemplo 1 anterior.
La biblioteca de plásmidos construida pBK-lib
contuvo alrededor de 1X109 clones independientes.
Evolución de pares ortogonales de
ARNt-sintetasa para la incorporación de
m-acetil-fenilalanina: Después de 3
rondas de selección positiva y 2 rondas de selección negativa,
emergieron cinco clones candidato (SEQ ID NO: 17-21
de la WO 2002/085923 y SEQ ID NO: 49-53 de la WO
2002/085923) cuya supervivencia en cloranfenicol dependió de la
adición del aminoácido no natural. En ausencia de
m-acetil-fenilalanina, el IC50 de
resistencia al cloranfenicol para células que albergan el uno de
los tres plásmidos TyrRS mutantes es de 20 mg/ml. En presencia de
m-acetil-fenilalanina, el IC50 de la
resistencia al cloranfenicol para las mismas células es de 100
mg/ml. La gran diferencia entre estos dos números refleja la
capacidad de las sintetasas seleccionadas para especificar la
incorporación de
m-acetil-fenilalanina sobre los
aminoácidos naturales en la célula. Los datos para
m-metoxi-fenilalanina fueron
similares; cinco clones se aislaron (SEQ ID NO:
22-26 de la WO 2002/085923 y la SEQ ID NO:
54-58 de la WO 2002/085923).
Expresión de proteínas de DHFR incorporado a
aminoácidos no naturales: Las sintetasas m-metoxi
fenilalanina y m-acetil fenilalanina seleccionadas
anteriormente se utilizaron para incorporar los aminoácidos no
naturales relevantes en respuesta a un codón ámbar en DHFR como se
describió previamente en el Ejemplo 1 de la WO 2002/085923. Como
control negativo, las células conteniendo tanto el par ortogonal de
ARNt-sintetasa como el vector
ámbar-mutante que codifica para DHFR crecieron en
ausencia de aminoácidos no naturales. Los resultados de la expresión
de proteínas se muestran en la Figura 10 de la WO 2002/085923.
Estos resultados claramente demostraron la especificidad del par
ortogonal de ARNt-sintetasa para incorporar
m-metoxi fenilalanina y m-acetil
fenilalanina no natural. Los rendimientos de la proteína DHFR
expresada son de aproximadamente 0.5 mg/l de cultivo en ambos
casos.
En una realización, los compuestos (p. ej.,
derivados de hidrazida) pueden utilizarse para marcar proteínas
in vivo con al menos un aminoácido no natural, p. ej.,
análogo de meta tirosina.
\vskip1.000000\baselineskip
La disponibilidad de un grupo funcional no
proteinógeno con una reactividad única facilita grandemente la
modificación química selectiva de proteínas. El grupo ceto es una
ayuda química tal - se encuentra ausente de las cadenas laterales
de aminoácidos naturales, y reacciona fácil y selectivamente con
derivados de hidrazida e hidroxilamina bajo condiciones suaves en
presencia de los aminoácidos comunes. Ver, p. ej., Cornish, V.W.,
et al., (1996) J. Am. Chem. Soc.
118:8150-8151 y las referencias en la misma. El
grupo ceto se ha incluido en péptidos mediante síntesis de péptido
en fase sólida, y se ha acoplado con derivados sacárido
nucleofílicos para construir neoglicopéptidos. Ver, p. ej.,
Rodríguez, E.C., et al., (1998) J. Org. Chem.
63:7134-7135. Recientemente desarrollamos un método
general que permite la incorporación específica en el sitio de
aminoácidos no naturales en proteínas directamente en células vivas
(ver, p. ej., WO 2002/085923; ver también, p. ej., Wang. L. Et
al., (2001) Science 292:498-500. Un aminoácido
que contiene ceto,
p-acetil-L-fenilalanina,
se ha incorporado con éxito en respuesta al codón ámbar de no
sentido con una fidelidad de traducción mayor que 99.8%. Ver p.
ej., Wang, L., et al., (2003) Proc. Natl. Acad. Sci U.S.A.
100:56-61. Este Ejemplo describe la preparación de
miméticos homogéneos de glicoproteína utilizando la funcionalidad
ceto genéticamente codificada junto con derivados sacárido
aminooxi.
Se exploraron dos rutas para generar los
miméticos de glicoproteína (ver Figura 1). En el primer
procedimiento, un sacárido derivatizado con un grupo aminooxi se
acopla primero al grupo ceto, y se anexan sacáridos adicionales
enzimáticamente con glicosiltransferasas. En una segunda ruta más
convergente, se prepara un glicano con una estructura definida como
un derivado de aminooxi, y se acopla directamente a la proteína en
un paso. El dominio Z de la proteína A de estafilococo se utilizó
como proteína modelo (ver, p. ej., Nilsson, B., et al.,
(1987) Protein Eng. 1:107-113) debido a su tamaño
relativamente pequeño (peso molecular 7.9 kD) que facilita la
caracterización espectrométrica de masa con muy alta precisión.
El séptimo codón del gen correspondiente se mutó
al codón TAG ámbar de paro y se agregó un tag His6 al término C
para facilitar la purificación de las proteínas. Se incorporó
p-acetil-L-fenilalanina
en la posición ámbar para producir la proteína de dominio Z mutante
mediante protocolos previamente reportados. Ver, p. ej., Wang, L.,
et al., (2003) Proc. Natl. Acad. Sci. U.S.A.
100:56-61. Aproximadamente se obtuvo 3.6 mg/l de
proteínas después de la cromatografía de afinidad de níquel. El
análogo de aminooxi de enlace veta de
N-acetilglucosamina (GlcNAc) 1 de la Figura 1 se
sintetizó entonces siguiendo los procedimientos publicados. Ver, p.
ej., Cao, S., et al., (1995) Tetrahedron
51:6679-6686. La proteína de dominio Z mutante (10
mg/ml) y el sacárido aminooxi 1 (21 mM) se mezclaron en 100 mM de
amortiguador de sodio acetato (pH 5.5) y se incubaron a 37ºC durante
7 a 26 horas. La mezcla de reacción se analizó mediante
cromatografía líquida de fase de reversa de alto desempeño (HPLC)
monitoreando la absorbencia a 280 nm (ver Figura 2). Solo se
observaron dos picos principales, y los eluyentes correspondientes
se caracterizaron mediante espectrometría de masa de resonancia de
transformación de ion ciclotron Fourier asistida por matriz de
desabsorción/ionización láser (MALDI-FTICR MS) (ver
Figura 3). Las masas monoisotópicas obtenidas indican que un pico
(tR = 44.8 min) corresponde al dominio Z mutante no reactivado
(Mteórica = 7818.833 Da, Mexperimental = 7818.836 Da), y el otro
pico (tR = 43.2 min) corresponde al dominio Z mutante derivatizado
con el sacárido aminooxi 1 (Mteórica = 8036.924 Da, Mexperimental =
8036.914 Da). Cuando se expresa en E. coli, la proteína de
dominio Z tiene tres formas: la proteína intacta, la proteínas sin
la primera metionina, y la forma acetilada de la proteína sin
metionina. La proteína intacta puede separarse de las otras dos
formas utilizando HPLC de fase de reversa. Para simplificar el
análisis de espectrometría de masa, se utilizó en este ejemplo la
fracción purificada que contiene el dominio Z sin la primera
metionina y su forma acetilada. Pueden observarse dos picos
moleculares que corresponden a estas dos formas en todo el espectro
de masa, como se marcaron en el espectro para III y IV en la Figura
2. Ver, Figura 1 para estructura. Como control, cuando se incorpora
la tirosina en la séptima posición del dominio Z, no se observa
proteína derivatizada de sacárido. Este hecho, junto con la masa de
alta precisión (error < 1.2 ppm) observada para el dominio Z de
sacárido modificado, confirmó que el sacárido aminooxi 1 se une al
grupo ceto selectivamente. La eficiencia de acoplamiento se
incrementa con el tiempo (determinado de las áreas de los picos de
HPLC que corresponden al material de inicio y al producto): la
conversión del material de inicio al producto fue de 42% después de
7 horas y mayor que 95% después de 26 horas. (Ver Figura 2).
A continuación se determinó si un segundo
sacárido podría acoplarse al primero enzimáticamente. El abducto
purificado II (5 mg/ml) (ver Figura 1 para estructura) se incubó con
UDP-galactosa (UDP-Gal) (16 mM) y
b-1,4-galactosiltransferasa (0.4
unidades/ml) en 150 mM de amortiguador HEPES (ácido
N-2-hidroxietilpiperazina-N'-2-etanosulfónico)
(pH 7.4) durante 48 horas a temperatura ambiente. Se sabe que
beta-1,4-galactosltransferasa
transfiere galactosa del nucleótido de azúcar a la posición 4 de un
residuo GlcNAc para formar Galb1,4GlcNAc. Ver, p. ej., Schanbacher,
F.L., y Ebner, K.E. (1970) J. Biol. Chem.
245:5057-5061. Después de la separación por HPLC, se
identificó un nuevo pico (tR = 42.5 min). La masa monoisotrópica
(Mteórica = 8198.977, Mexperimental = 8198.969) del eluyente medido
por MALDI-FTICR MS confirmó que la galactosa se
acopló a Glc Nac para producir el abducto III (Ver Figura 3). Ver
Figura 1 para estructura. La eficiencia de acoplamiento determinada
por análisis HPLC fue de aproximadamente 60%, un valor cercano al
reportado previamente para
b-1,4-galactosiltransferasa. Ver,
p. ej., Witte, K., et al., (1997) J. Am. Chem. Soc.
119:2114-2118. Este resultado indica que el enlace
no natural entre el primer sacárido y la proteína no afecta
significativamente la reacción de glicosiltransferasa. La reacción
adicional de esta proteína marcada con disacárido con ácido
CMP-siálico y
a-2,3-sialiltransferasa (ver, p.
ej., Kitagawa, H., y Paulson, J.C., (1994) J. Biol. Chem.
269:1394-1401) dio como resultado la adición de
ácido siálico a galactosa para producir IV (tR = 41.7 min), como se
confirmó por MALDI-FTICR MS (Mteórica = 8490.072,
Mexperimental = 8490.014) (Ver Figura 3). La eficiencia de
acoplamiento para la conversión de III a IV fue de 65% en base al
análisis HPLC. Ver Figura 1 para estructuras.
Los miméticos de glicoproteína III y IV también
se prepararon utilizando una ruta convergente. Ver Figura 1. El
aminooxi GlcNAc (0.05 M) se convirtió en 2 utilizando
b-1,4-galactosiltransferasa (0.75
unidades/ml) y la UDP-galactosa donante de
glicosilo en 70% de rendimiento total en 150 mM de amortiguador
HEPES (pH 7.4). después de la purificación mediante HPLC de
aminopropilo de gel de sílice, se agregó ácido siálico a
2(0.03 M) para producir 3 en el mismo amortiguador antes
mencionado en aproximadamente 80% de rendimiento utilizando
a-2,3-sialiltransferasa (0.22
unidades/ml) y ácido CMP-siálico (0.03 M). El
análogo de aminooxi purificado 2 y 3 (13 y 7.2 mM, respectivamente)
se acoplaron a la proteína de dominio Z (5 mg/ml) conteniendo
p-acetil-L-fenilalanina
en 100 mM de amortiguador acuoso de sodio acetato (pH 5.5) a
temperatura ambiente para producir miméticos ded glicoproteína III
y IV, respectivamente. Ver, Figura 1. Los III y IV resultantes
fueron idénticos a los abductos correspondientes preparados por
medio de la primera ruta secuencia, como se confirmó por los
análisis HPLC y MALDI-FTICR MS. La eficiencia de
acoplamiento de 2 a I y de 3 a I bajo las mismas condiciones de
reacción durante 26 horas fueron de aproximadamente 76% y 60%,
respectivamente. Los rendimientos fueron menores que el del
acoplamiento de 1 a I (95%) probablemente debido al incrementado
efecto estérico dado que el glicano se hace más complicado.
En resumen, hemos demostrado un método general
para la síntesis de miméticos homogéneos de glicoproteína
conteniendo sustituyentes de sacárido bien definidos.
General: UDP-Gal,
CMP-NeuAc,
b-1,4-galactosiltransferasa
(b-1,4-GalT) y
a-2,3-sialiltransferasa
(a-2,3-SialT) se adquirieron de
Calbiochem. A menos que se señale de otra manera, todos los químicos
se obtuvieron de Aldrich, Acros o Sigma y se utilizaron son
purificación adicional. Las reacciones se monitorearon mediante
cromatografía de capa delgada (TLC) utilizando colorante de
ninhidrina o molibdato de cerio como agente revelador. Todas las
reacciones no acuosas se llevaron a cabo en instrumentos de vidrio
secados en horno bajo una atmósfera Ar inerte. Todos los solventes
no acuosos se destilaron antes de usarlos. Los espectros NMR se
registraron en espectrómetros Bruker AMX-400,
AMX-500 o AMX-600 MHz y se
refirieron a picos de solvente residual (CDCl3: 1H \delta 7.24,
13C \delta 77.0; CD3OD: 1H \delta 3.30, 13C \delta 49.0; D2O:
1H \delta 4.76).
Compuesto 2 de la Figura 1: El compuesto 1 de la
Figura 1 (5 mg, 0.021 mmol) y UDP-Gal (21 mg, 0.032
mmol) se disolvieron en 350 ml de amortiguador HEPES (150 mM, pH
7.4) conteniendo una solución de MnCl2 recién preparada (2 mmol).
B-1,4-GalT (0.3 U, 0.1 U
ml-1) y fosfatasa alcalina (0.5 U, 1 U ml -1) se
agregaron y la mezcla de reacción se agitó suavemente a temperatura
ambiente durante 2 días. La mezcla de reacción se centrifugó y el
sobrenadante se purificó mediante HPLC de aminopropilo de gel de
sílice empleando una elución gradiente de 100:0 A:B a 50:50 A:B a
lo largo de 90 min a una proporción de flujo de 1 ml
min-1 en donde A = MeCN y B = H2O. El tiempo de
reacción del producto deseado fue de 53 min. La liofilización de las
fracciones de la columna produjeron un compuesto puro 2 de la
Figura 1 (6 mg, 70%) como un polvo blanco; 1H NMR (D2O, 600 MHz)
\delta 4.58 (d, J = 6.12, 1H), 4.42 (d, J = 7.44, 1H), 3.96 (d, J
= 11.88, 1H), 3.87 (m, 1H), 3.78 (dd, J = 4.83, 12.3, 1H),
3.72-3.69 (m, 6H), 3.62 (dd, J = 3.06, 10.08, 1H),
3.56 (m, 1H), 3.50 (m, 1H), 1.98 (s, 3H). 13C NMR (D2O, 150 MHz)
\delta 175.18, 103.98, 103.31, 78.63, 75.78, 75.13, 72.92, 72.82,
71.39, 68.99, 61.46, 60.43, 53.80, 22.55. HR-FTMS
(pos) calculado para C14H26N2O11 [M+Na]+ = 421.1429, encontrado
421.1448.
Compuesto 3 de la Figura 1: El compuesto 2 de la
Figura 1 (5.3 mg, 0.013 mmol) y CMP-NeuAc (10 mg,
0.016 mmol) se disolvieron en 450 ml de amortiguador HEPES (150 mM,
pH 7.4) conteniendo una solución de MnCl2 recién preparada (5
mmol). a-2,3-SialT (22 mU, 3.7 mU
ml-1) y fosfatasa alcalina (50 mU, 50 mU ml -1) se
agregaron y la mezcla de reacción se agitó suavemente a temperatura
ambiente durante 2 días. La mezcla de reacción se centrifugó y el
sobrenadante se purificó mediante HPLC de aminopropilo de gel de
sílice empleando una elución gradiente de 100:0 A:B a 0:100 A:B a
lo largo de 30 min a una proporción de flujo de 1 ml
min-1 en donde A = MeCN y B = H2O. Las fracciones
correspondientes (27 min) se recolectaron y se liofilizaron para dar
un polvo blanco (7 mg, 76%); 1H NMR (D2O, 600 MHz) \delta 4.55
(d, J = 8.34, 1H), 4.48 (d, J = 7.86, 1H), 4.04 (dd, J = 3.06,
9.60, 1H), 3.59-3.96 (m, 17H), 3.51 (m, 1H), 2.67
(dd, J = 4.80, 12.72, 1H), 1.98 (s, 3H), 1.96 (s, 3H), 1.75 (t, J =
12.30, 1H). ES-MS (neg) calculado para C25H43N3O19
[M+H]- = 688, encontrado 688.
Procedimiento General para acoplar un derivado
sacárido de aminooxi a proteína de dominio Z mutante: En una
reacción típica, el derivado sacárido de aminooxi (500 mg) y -1 mg
de proteína de dominio Z mutante se disolvieron en 100 mM de
amortiguador NaOAc, pH 5.5. Se agregó agua a un volumen total de 100
ml y la mezcla de reacción se agitó a 37ºC durante 26 horas.
Después la mezcla de reacción se centrifugó y el sobrenadante se
purificó mediante HPLC de fase de reversa en una columna Agilent
ZORBAX SB-C18 4.6 mm x 250 mm empleando una elución
gradiente de 90:10 A:B a 60:40 A:B a lo largo de 70 min a una
proporción de flujo de 1 ml min-1 en donde A = H2O
con 0.1% de TFA y B = MeCN con 0.1% de TFA. Las fracciones de
columna se neutralizaron con amortiguador TrisCl (pH
7-0) y se desalaron con una columna de exclusión de
tamaño. Después de eluirse con agua el eluyente se liofilizó para
producir II, III y IV puros de la Figura 1 como un polvo blanco en
96%, 76% y 60% de rendimiento, respectivamente.
Preparación de miméticos de glicoproteínas III y
IV (de la Figura 1) utilizando la ruta secuencial: Para la
preparación de III de la Figura 1, el II de la Figura 1 (-0.5 mg) y
UDP-Gal (1 mg) se disolvieron en 90 ml de 150 mM de
amortiguador HEPES, pH 7.4 conteniendo una solución de MnCl2 recién
preparada (0.5 mmol). B-1,4-GalT
(40 mU, 40 mU ml-1) y fosfatasa alcalina (50 mU), 50
mU ml -1) se agregaron y la mezcla de reacción se agitó suavemente
a temperatura ambiente durante 2 días. La mezcla de reacción se
centrifugó y el sobrenadante se purificó mediante HPLC de fase de
reversa. Para la preparación de IV de la Figura 1, el III de la
Figura 1 (-0.5 mg) y CMP-NeuAc (0.5 mg) se
disolvieron en 90 ml de 150 mM de amortiguador HEPES pH 7.4
conteniendo una solución de MnCl2 recién preparada (0.5 mmol).
a-2,3-SialT (10 mU, 3.7 mU
ml-1) y fosfatasa alcalina (50 mU, 50 mU ml -1) se
agregaron y la mezcla de reacción se agitó suavemente a temperatura
ambiente durante 2 días. La mezcla de reacción se centrifugó y el
sobrenadante se purificó mediante HPLC de fase de reversa.
MALDI-FTICR MS: Un instrumento
hecho en casa con una consola APEX II y un imán 9.4 T de Bruker
Daltonics (Billerica, MA) se utilizó para los experimentos
MALDI-FTICR MS. Los residuos de azúcar tienden a
caer cuando se utiliza una preparación de muestra MALDI que
involucra TFA. Utilizamos una matriz menos sensible pero más fría.
La matriz es una mezcla de ácido 3-hidroxipicolínico
(20 mg ml -1) y citrato de diamonio (1 mg ml -1). La descomposición
de la glicoproteína se minimizó adicionalmente mediante la fuente
MALDI especializada de presión intermedia del FTICR que reduce la
fragmentación metaestable proporcionando un enfriamiento por
colisión en la fuente.
\vskip1.000000\baselineskip
En una realización de la invención, se ha
desarrollado otra estrategia para sintetizar glicoproteínas
homogéneas en un organismo. Por ejemplo, la mioglobulina conteniendo
\beta-GlcNAc-serina en una
posición definida puede expresarse en E. coli en buen
rendimiento y con alta fidelidad. El residuo
\beta-GlcNAc puede reconocerse mediante proteína
de enlace carbohidrato o subsecuentemente modificada con una
galactosiltransferasa. Este procedimiento puede ser aplicable a
otras modificaciones post-traslacionales, p. ej.,
fosforilación de proteína, acetilación, metilación y similares.
La glicosilación es una de las más comunes
modificaciones post-traslacionales de proteínas en
eucariotos y afecta un amplio rango de las funciones de proteínas
desde la duplicación y secreción para el reconocimiento
biomolecular y la vida media en suero. Ver, p. ej., R.A. Dwek,
(1996) Chem. Rev. 96:683. Aunque ha habido avances significativos
en nuestra comprensión de los efectos de la glicosilación, apenas
empiezan a comprenderse los roles específicos de las cadenas de
oligosacárido y las relaciones entre sus estructuras y funciones.
Ver, p. ej., C.R. Bertozzi, & L.L. Kiessling (2001) Science
291:2357. El reto principal es que las glicoproteínas se producen
típicamente como una mezcla de glicoformas, dificultando aislar
glicoformas únicas de fuentes naturales. Una variedad de métodos se
han desarrollado para sintetizar glicoformas estructuralmente
definidas, pero todos imponen severas restricciones en el tamaño,
cantidad y/o calidad de las glicoproteínas producidas. Ver, p. ej.,
P. Sears, Y C. H. Wong (2001) Science 291:2344; M. Wacker et
al., (2002) Science 298:1790; B.G. Davis (2002) Chem. Rev.
102:579; y H.C. Hang, & C.R. Bertozzi (2001) Acc. Chem. Res.
34:727. En este ejemplo, se describe una estrategia y los
componentes utilizados para producir glicoformas únicas en E.
coli, que incluyen el desarrollo de un par ortogonal de
sintetasa-ARNt que codifica genéticamente un
aminoácido glicosilado en respuesta a un codón selector, p. ej., un
codón ámbar TAG. La incorporación genética de este y oros
aminoácidos modificados con sacáridos directamente en proteínas
puede aumentar significativamente nuestra capacidad tanto para
analizar como para manipular la estructura y función de
glicoproteínas.
Se desarrollaron métodos previamente que por
primera vez permitieron la adición sistemática de aminoácidos con
nuevas propiedades químicas y físicas para el código genético de
E. coli (ver, p. ej., L. Wang, et al., (2001) Science
292:498; l. Wang et al., (2002) J. Am. Chem. Soc. 124:1836;
Z. Zhang et al., (2002) Angew. Chem. Int. Ed. Engl. 41:2840;
J. W. Chin et al., (2002) J. Am. Chem. Soc. 124:9026; J.W.
Chin et al., (2002) Proc. Natl. Acad. Sci. U.S.A. 99: 11020;
S.W. Santoro et al., (2002) Nat. Biotechnol. 20:1044; L. Wang
et al., Proc. Natl. Acad. Sci. U.S.A. 100:56; y Z. Zhang
et al., (2003) Biochemistry 42:6735) y levadura (ver, p.
ej., J.W. Chin et al., Science (2003 en prensa). En este
procedimiento, un par supresor ámbar de M. jannaschii TyrRS -
muARNt que no reacciona de manera cruzada con ARNts endógenos y
sintetasas se desarrolla para cargar únicamente un aminoácido no
natural deseado. Esta metodología también permitirá incorporar
directamente aminoácidos glicosilados, fosforilados o metilados en
proteínas (ver, p. ej., T. Arslan, et al., (1997) J. Am.
Chem. Soc. 119:10877), evitando la necesidad de la modificación
selectiva enzimática o química de las proteínas. Se intentó
incorporar
b-O-GlcNAc-L-serina
(Compuesto A,
GlcNAc:N-acetilglucosamina)específicamente en
el sitio en proteínas en E. coli. La modificación
O-Glc-Nac se realiza en cualquier
lugar en casi todos los eucariotos, se encuentra implicada en la
regulación de la señalización de células, trafico de proteínas y
crecimiento celular, y también es un sustrato a partir del cual se
generan carbohidratos más complejos. Ver, p. ej., L. Wells., et
al., (2001) Science 291:2376; y N.
Lamarre-Vincent, & L.
Hsieh-Wilson (2003) J. Am. Chem. Soc. 125:6612.
Desafortunadamente, los derivados de sacárido con grupos hidroxilo
libres se transfieren pobremente a través de la membrana de las
células eucarióticas, sugiriendo que el Compuesto A de sustrato
sería poco probablemente permeable a la célula. Ver, p. ej., A.k.
Sarkar., et al., (1995) Proc. Natl. Acad. Sci. U.S.A.
92:3323. Sin embargo, se ha mostrado que la acetilación de los
grupos hidroxilo de azúcares facilita el transporte a través de las
membranas celulares y que los grupos acetilo hidroxilo pueden
desacetilarse mediante estearasas citosólicas no específicas una
vez dentro de la célula. Ver, p. ej., N.
Lamarre-Vincent, & L.
Hsieh-Wilson (2003) J. Am. Chem. Soc. 125:6612. En
consecuencia, el derivado acetilado Compuesto B
tri-acetil-b-GlcNAc-serina
para el cual existe un precursor comercialmente disponible,
N-Fmoc-tri-acetil-b-GlcNAc-serina,
se utilizó en estos experimentos. Compuesto:
Se utilizó una serie de selecciones positivas y
negativas para aislarse de una biblioteca de mutantes activos en el
sitio, un TyrRS que carga específicamente el muARNt ortogonal con
b-GlcNAc-serina en E. coli.
En base a la estructura de rayos X de la TyrRS de Bacillus
stearothermophilus homóloga, se construyeron dos bibiotecas con
residuos activos en el sitio aleatorizados: uno, codificado mediante
el plásmido pBK-lib-m, tuvo
residuos Tyr32, Ala67, His70, Gln155, Asp158, y Ala167
aleatorizados, y un segundo, codificado por el plásmido
pBK-lib, tuvo residuos Tyr32, Glu107, Asp158, y
Leu162 aleatorizados. Estos residuos se encuentran todos dentro de
6.9 A del anillo de fenilo y son los residuos principales que forman
el contenedor de enlace de sustrato. La biblioteca combinada tuvo
aproximadamente 2.6 x 109 de clones independientes. Esta biblioteca
se sometió entonces a una selección positiva, en base a la supresión
de un codón ámbar introducido en Asp112 en el gen de cloranfenicol
acetiltransferasa (CAT), para seleccionar TyrRS mutantes capaces de
incorporar el aminoácido glicosilado. Las células qe sobrevivieron
a altas concentraciones en cloranfenicol deben expresar una TyrRs
mutante con la capacidad de insertar ya sea una
b-GlcNAc-serina o un aminoácido
endógeno en respuesta al codón ámbar Asp112TAG. Una selección
negativa en base a la supresión de tres codones ámbar en el gen
tóxico de barnasa, se utilizó entonces para suprimir de los clones
seleccionados aquellas TyrRSs mutantes que incorporan aminoácidos
endógenos. Después de cinco rondas de selección positiva y cuatro
rondas de selección negativa, emergieron tres clones que
sobrevivieron a alta concentración de cloranfenicol. Estos clones y
sus mutaciones son como sigue: SI-90
(Glu107-Pro107, Asp158-Cys158,
Ile159-Tyr159, Leu162-Arg162),
S4-5 (Tyr32-Gly32,
Glu107-Gly107, Asp158-Cys158,
Leu162-His162, SI-5
(Glu107-Cys107, Asp158-His158,
Ile159-Asp159, Leu162-Met162). Todos
estos clones parecen ser altamente selectivos para
b-GlcNAc-serina, dado que el
reemplazo del Compuesto B con 1 mM de serina,
a-tri-actil-GalNAc-treonina,
a/b-tri-acetil-GalNAc-serina
o
b-tetra-acetil-Glu-asaparagina
no permite el crecimiento celular por arriba de 30 mg/ml de
cloranfenicol. Estaos resultados genéticos in vivo sugieren
que las TyrRSs mutantes nuevamente seleccionadas tienen una
especificidad excelente hacia
b-GlcNAc-L-serina.
Para probar la eficiencia y fidelidad de la
incorporación del Compuesto B, se generó un gen de mioglobulina
mutante (Gly4TAG) conteniendo un codón ámbar en la cuarta posición y
un tag His6 de terminal C. Ver, p. ej., S.W. Santoro et al.,
(2002) Nat. Biotechnol. 20:1044. Cuando la sintetasa mutante,
S1-90, se co-expresó con los genes
muARNt y Gly4TAG de mioglobulina en presencia del Compuesto B en
medio mínimo, se produjo 1 mg/ml de mioglobulina mutante de
longitud total (Ver Figura 4). Para comparación, 5.5 mg/l de
mioglobulina de tipo silvestre se produjo bajo una condición
similar, indicando un buen nivel de supresión para
S1-90. En ausencia ya sea de S1-90,
muARNt, o el Compuesto B, no se observó ninguna expresión de
mioglobulina de longitud total mediante SDS-PAGE
coloreada con plata (ver Figura 4).
La Figura 4 ilustra la expresión de la
mioglobulina mutante Gly4-Compuesto A (-18.5 kD).
Las proteínas se purificaron por cromatografía de afinidad Ni2+ y
se disolvieron mediante SDS-PAGE. El gel se tiño con
plata. El Lane 1 muestra que la mioglobulina se expresó en
presencia del ARNt ortogonal, sintetasa S1-90, y el
Compuesto B. La banda a -18 kDa corresponde a la mioglobulina de
longitud total. El Lane 2 muestra proteínas eluidas después de la
expresión en presencia del tARn ortogonal y la sintetasa
S1-90 pero en ausencia del Compuesto B de sustrato.
El Lane 3 muestra proteínas eluidas después de la expresión en
presencia del ARNt ortogonal y el Compuesto B de sustrato pero en
ausencia de la sintetasa S1-90. El Lane 4 muestra
proteínas eluidas después de la expresión en presencia de sintetasa
S1-90 y el Compuesto B de sustrato pero en ausencia
del ARNt ortogonal. El Lane 5 contiene la mioglobulina purificada
de tipo silvestre para comparación.
El análisis MALDI-TOF de alta
resolución proporcionó una masa monoisotópica de la mioglobulina
mutante purificada con His6 tag de 18430.1 Da, que concuerda dentro
de 32 ppm con la masa teórica de
Glc(OH)3Nac-serina que contiene
mioglobulina sin metionina (Mteórica = 18429.5 Da). Ver Figura 5.
Nótese que la pérdida del Met N-terminal es común
en E. coli. En adición, no se observaron señales
correspondientes ya sea a la glicomioglobulina
O-acetilada o de mioglobulina de tipo silvestre. Los
datos de espectro de masa confirman un alto grado de especificidad
para la incorporación de GlcNAc-serina en
mioglobulina (> 96%).
Se llevaron a cabo varios experimentos
adicionales para caracterizar adicionalmente la mioglobulina
mutante. Primero, se utilizó un análisis similar a ELISA para
analizar el enlace de una lectina específica para GlcNAc,
Bandeiraea simplicifolia II (BSII) (ver, p. ej., S. Ebisu et
al., (1978), Carbohydr. Res. 61:129), a la mioglobulina de tipo
silvestre y la glico-mioglobulina. Ver Figura 6,
Panel A. la Figura 6, Panel A ilustra en enlace de la lectina
específica para GlcNAc, Bandeiraea simplicifolia II (BSII) a la
mioglobulina tipo silvestre y la glicomioglobulina. Se muestran
valores A405 para el mioglobulina de tipo silvestre,
glicomioglobulina, y el control negativo (sin agregar lectina).
Gly4-Compuesto A de mioglobulina mutante (200 ng) y
mioglobulina de tipo silvestre (200 ng) se inmovilizaron en pozos
de placa de micro titulación y subsecuentemente se incubaron con
BSII biotinilado y conjugado de
estreptavidina-fosfatasa alcalina. Los pozos se
incubaron con p-nitrofenil fosfato y se
monitorearon midiendo la absorbencia a 405 nm. Las dos formas de
mioglobulina s inmovilizaron en pozos de placa de micro titulación
y después se incubaron con BSII biotinilada, conjugado de
estreptavidina-fosfatasa alcaliba, y
p-nitrofenil fosfato, respectivamente. Los pozos
conteniendo mioglobulina de tipo silvestre produjeron una señal
equivalente a los pozos de control negativo. En contraste, los pozos
conteniendo glicomioglobulina produjeron una señal al menos 200
veces mayor que la de la mioglobulina de tipo silvestre, demostrando
el reconocimiento selectivo mediante la lectina específica para
GlcNAc. En adición, este resultado muestra que el carbohidrato no
se ha modificado a otras formas isoméricas tales como GalNAc y
ManNAc dado que esta lectina es altamente selectiva para GlcNAc
(ver, p. ej., S. Ebisu et al., (1978) Carbohydr. Res.
61:129).
También investigamos si el residuo
O-GlcNAc-serina en mioglobulina
podría modificarse selectivamente con una galactosiltransferasa. Se
sabe que
beta-1,4-galactosiltransferasa
transfiere galactosa (Gal) desde el nucleótido de azúcar
UDP-Gal hasta la posición 4 de una
N-acetilglucosamina (GlcNAc) para formar
Galb1,4GlcNAc. Para determinar si la mioglobulina
O-glicosilada puede modificarse con
UDP-Gal, tanto la mioglobulina
O-glicosilada como la de tipo silvestre se
disolvieron en SDS-PAGE y se transfirieron a una
membrana PVD. La membrana se incubó entonces con
galactosiltransferasa de leche bovina y
UDP-[H3]-galactosa radiactiva a temperatura ambiente
durante 24 horas. Ver, p. ej., K. Kamemura et al., (2002) J.
Biol. Chem. 277:19229. La incorporación de [H3]-Gal
se monitoreó exponiendo la membrana a película de rayos X. Solo la
glicomioglobulina se marcó; no se observó ninguna señal detectable
para la mioglobulina de tipo silvestre. Ver, Figura 6, Panel B. La
Figura 6, Panel B ilustra la galactosiltransferasa en mancha
marcando la glicomioglobulina con UDO-[H3]galactosa. Se
disolvieron mioglobulina de tipo silvestre (1 mg) y mioglobulina
mutante de Gly4-Compuesto A (1 mg) por
SDS-PAGE 12% y se transformaron en una membrana e
PVD. La membrana se trató entonces con galactosiltransferasa de
leche bovina (1 U), UDP-[H3]galactosa (0.5 mCi) y fosfatasa
alcalina intestinal de calf (1 U) durante 24 horas a temperatura
ambiente. Después de extensos lavados, la membrana se expuso a
película de rayos X utilizando autorradiografía Aumentada.
Para el análisis cuantitativo, también se llevó
a cabo la reacción de glicosilación en solución. Ver, p. ej., K.
Witte et al., (1997) J. Am. Chem. Soc. 119:2114. Después de
la incubación durante 48 horas a temperatura ambiente, se obtuvo un
rendimiento de 72% de disacárido en base a la radio marca presente.
Ver, Figura 6, Panel C. la Figura 6, Panel C ilustra el análisis
cuantitativo de la reacción de galactosiltransferasa, que se llevó
a cabo en solución, y la galactosa radio marcada se normalizó de
modo que 1.0 corresponde a una transferencia al 100%. A las
soluciones conteniendo mioglobulina de tipo silvestre purificada por
HPLC (100 mg) y la mioglobulina mutante de
Gly4-Compuesto A (100 mg) se agregó quinasa de
piruvato (5 U), pirofosforilasa de UDP-glucosa (1
U), pirofosforilasa inorgánica (10 U),
galactosa-1-fosfato-uridil
transferasa (1 U), galactosiltransferasa de leche bovina (2 U),
glucosa-1-fosfato (3 mmol),
difosfato de uridilo (3 mmol), fosfoenolpiruvato (0.01 mmol), y DTT
(2 mmol). Después de que la reacción se ajustó a un pH 7.2, se
agregó
[H3]-galactosa-1-fosfato
(0.01 mmol). La reacción se llevó a cabo durante 48 horas a
temperatura ambiente. Los productos de proteína se separaron con
una columna PD-10 Sephadex 25. La radio marca
incorporada se midió en un analizador de escintilación líquida.
\newpage
Estos estudios demostraron que la
b-GlcNAc-L-serina
puede incorporarse co-traslacionalmente en proteínas
en E. coli con excelente especificidad y buen rendimiento.
La b-GlcNAc-serina incorporada puede
servir como sitio de glicosilación principal al cual pueden
agregarse los sacáridos secuencialmente con glicosiltransferasa, p.
ej., K. Kamemura et al., (2002) J. Biol. Chem. 277:19229.
Evolución dirigida de enzimas TyrRS mutantes.
Los procedimientos generales para las selecciones positivas y
negativas se han reportado previamente. Ver, p. ej., Z. Zhang et
al., (2003) Biochemistry 42:6735. Brevemente, una combinación
del plásmido pBK-lib-m (ver, p. ej.,
Z. Zhang et al., (2003) Biochemistry 42:6735) y
pBK-lib (ver, p. ej., L. Wang et al., (2001)
Science 282:498) se transformó en DH10B de E. coli competente
que alberga el plásmido pRep(2)/YC (ver, p. ej., S.W.
Santoro et al., (2002) Nat. Biotechnol. 20:1044). Las células
transformadas crecieron en 500 ml de medio GMML (1 x M9 medio
mínimo con glicerol al 1%, 0.3 mM de leucina, 1 mM de MgCl2, 0.1 mM
CaCl2 y 0.5% de NaCl) conteniendo 40 mg/ml de tetraciclina, 50 mg/ml
de canamicina, 68 mg/ml de cloranfenicol, y 1 mM de Compuesto B
durante 60 horas a 37ºC. los plásmidos (pBK) se purificaron a partir
de las células sobrevivientes y se transformaron en DH10B de E.
coli que alberga pLWJ18B3 (ver, p. ej., L. Wang et al.,
(2001) Science 292:498= para iniciar la selección negativa. Las
células se emplacaron entonces en placas LB
(Luria-Bertani) conteniendo 40 mg/ml de
cloranfenicol, 50 mg/ml de canamicina, y 0.02% de
L-arabinosa y se incubaron a 37ºC durante 8 horas.
Los plásmidos pBK se purificaron de las células sobrevivientes y se
utilizaron para subsecuentes selecciones positivas y negativas.
Después de cinco rondas de selecciones positivas y cuatro rondas de
selecciones negativas, se aislaron y se secuenciaron tres pares
candidato de ARNt-sintetasas ortogonales que
confirieron resistencia al cloranfenicol dependiente del
sustrato.
Expresión y caracterización de mioglobulina
mutante. Células DH10B conteniendo pBAD/JYAMB-4TAF
(ver, p. ej., S.W. Santoro et al., (2002) Nat. Biotechnol.
20:1044) y pS1-90, crecieron en un cultivo de 500 ml
de GMML conteniendo canamicina, tetraciclina, 0.02% de
L-arabinosa, 5 mM de FeCl3, y 0 o 1 mM del Compuesto
B. Las células se granularon. Se lisaron, y las proteínas se
purificaron mediante cromatografía de afinidad con perlas de NTA
Ni2+ bajo condiciones naturales. Las proteínas se analizaron
mediante SDS-PAGE al 12% y se tiñeron en plata.
Alícuotas de proteínas purificadas se sometieron a análisis de
espectrometría de masa de alta resolución. Se utilizó ionización de
deabsorción de láser asistida por matriz (MALDI) con un
espectrómetro de masa de tiempo de luz (TOF) (Votager
DE-STR, Applied Biosystems, Foster City, CA) para
medir el peso molecular de la proteína. Las muestras de proteína se
deabsorbieron y se ionizaron mediante radiación de un láser de
nitrógeno de 337 nm. El ácido sinapínico se utilizó como la matriz
MALDI. Las reacciones de unión de lecitina y glicosiltransferadsa
se llevaron a cabo siguiendo los protocolos establecidos (ver p.
ej., K. Kamemura, et al., (2002), J. Biol. Chem., 277:19229;
y, K. Witte, et al., (1997) J. Am. Chem. Soc. 119:2114).
\vskip1.000000\baselineskip
Las O-RSs ejemplificatrivas que
pueden utilizarse en la invención incluyen las SEQ ID Nos:
1-6 (Ver Tabla 2), y las O-ARNt
ejemplificativas que pueden utilizarse en la invención incluyen la
SEQ ID NO.: 7. Los polinucleótidos ejemplificativos que codifican
para O-RSs incluyen las SEQ ID Nos:
8-10.
Debe entenderse que los ejemplos y realizaciones
descritos en la presente son para propósitos ilustrativos
únicamente y que se sugerirán varias modificaciones o cambios a la
luz de los mismos a las personas expertas en la técnica.
\vskip1.000000\baselineskip
Esta lista de referencias citadas por el
solicitante está prevista únicamente para ayudar al lector y no
forma parte del documento de patente europea. Aunque se ha puesto
el máximo cuidado en su realización, no se pueden excluir errores u
omisiones y la OEP declina cualquier responsabilidad en este
respecto.
\bullet US 5369017 A, Wang [0003]
\bullet WO 9216640 A [0029]
\bullet EP 89305153 A [0051]
\bullet WO 2002085923 A [0063] [0068] [0077]
[0078] [0079] [0086] [0136] [0138] [0139] [0141] [0141] [0142]
[0142] [0143] [0144] [0144] [0150] [0205] [0206] [0207] [0207]
[0207] [0207] [0208] [0208] [0210]
\bullet WO 2002086075 A [0086] [0100] [0103]
[0115]
\bullet US 6238884 B, Short [0105]
\bullet US 5756316 A, Schallenberger
[0105]
\bullet US 5783431 A, Petersen [0105]
\bullet US 5824485 A, Thompson [0105]
\bullet US 5958672 A, Short [0105]
\bullet WO 2003031464 A2 [0137]
\bullet US 6331418 B [0137]
\bulletVarki, A. Glycobiology, 1993, vol. 3, 97-130 [0002]
\bulletWitte, K. et al. J. Am.
Chem. Soc., 1997, vol. 119, 2114-2118
[0003]
\bulletShin, Y. et al. J. Am. Chem.
Soc, 1999, vol. 121, 11684-11689
[0003]
\bulletTolbert, T. J.; Wong,
C.-H. J. Am. Chem. Soc., 2000, vol. 122,
5421-5428 [0003]
\bulletWitte, K. et al. J.
Am. Chem. Soc., 1998, vol. 120, 1979-1989
[0003] [0003]
\bulletDavis, N. J.; Flitsch,
S. L. Tetrahedron Lett., 1991, vol. 32,
6793-6796 [0003]
\bulletMacmillan, D. et al.
Org Lett, 2002, vol. 4, 1467-1470
[003]
\bulletSchultz; Kunz. H.
Exs, 1995, vol. 73, 201-228 [0003]
\bulletNadano et al. J.
Biol. Chem., 1986, vol. 261, 11550-11557
[0029]
\bulletKanamori et al. J.
Biol. Chem., 1990, vol. 265, 21811-21819
[0029]
\bulletVarki. Glycobiology, 1992, vol. 2, 25-40 [0029]
\bullet Sialic Acids: Chemistry. Metabolism
and Function. Springer-Verlag, 1992
[0029]
\bullet R. A. Dwek. Chem. Rev.,
1996, vol. 96, 683 [0038] [0223]
\bullet C. R. Bertozzi; L. L.
Kiessling. Science, 2001, vol. 291, 2357 [0038]
[0223]
\bullet P. Sears; C.H. Wong.
Science, 2001, vol. 291, 2344 [0223]
\bullet M. Wacker et al.
Science, 2002, vol. 298, 1790 [0223]
\bullet B. G. Davis. Chem. Rev,
2002, vol. 102, 579 [0038]
\bullet H. C. Hang; C. R.
Bertozzi. Acc. Chem. Res., 2001, vol. 34, 727
[0038] [0223]
\bulletPaulson et al. J.
Biol. Chem., 1978, vol. 253, 5617-5624
[0047]
\bulletBeeley. Laboratory Techniques
in Biochemistry and Molecular Biology. Elsevier, 1985
[0050]
\bulletHounsell. Glycoanalysis
Protocols. Meth. Mol. Biol., 1998, vol. 76 [0050]
\bullet El Rassi. Carbohydrate Analysis
: High Performance Liquid Chromatography and Capillary
Electrophoresis. Elsevier Science Ltd, 1994, vol. 58
[0050]
\bulletSpellman et al. J.
Biol. Chem., 1989, vol. 264, 14100 [0051]
\bulletStanley et al. J.
Biol. Chem., 1988, vol. 263, 11374 [0051]
\bulletFreshney. Culture of Animal
Cells, a Manual of Basic Technique.
Wiley-Liss, 1994 [0056] [0184]
\bulletPayne et al. Plant Cell
and Tissue Culture in Liquid Systems. John Wiley&Sons,
Inc, 1992 [0056] [0184]
\bullet Plant Cell, Tissue and Organ Culture.
Fundamental Methods Springer Lab Manual.
Springer-Verlag, 1995 [0056]
\bullet The Handbook of Microbiological Media.
CRC Press, 1993 [0056] [0184]
\bulletBerger; Kimmel. Guide to
Molecular Cloning Techniques, Methods in Enzymology. Academic
Press, Inc, vol. 152 [0057]
\bulletSambrook et al.
Molecular Cloning - A Laboratory Manual. Cold Spring Harbor
Laboratory, 2001, vol. 1-3 [0057]
\bullet Current Protocols in Molecular
Biology. Current Protocols. Greene Publishing Associates, Inc. and
John Wiley & Sons, Inc, 2003 [0057]
\bulletGiliman; Smith.
Gene, 1979, vol. 8, 81 [0062] [0182]
\bulletRoberts et al.
Nature, 1987, vol. 328, 731 [0062] [0182]
\bulletSchneider, B. et al.
Protein Expr. Purif., 1995, vol. 6435, 10 [0062]
[0182]
\bullet TheATCCCatalogue of Bacteria and
Bacteriophage. ATCC, 1992 [0062]
\bulletWatson et al.
Recombinant DNA. Scientific American Books, 1992
[0062] [0183]
\bulletDougherty. Unnatural Amino
Acids as Probes of Protein Structure and Function. Current
Opinion in Chemical Biology, 2000, vol. 4,
645-652 [0065]
\bulletPaul. Fundamental Immunology.
Raven Press, 1999 [0076]
\bulletHarlow; Lane.
Antibodies, A Laboratory Manual. Cold Spring Harbor
Publications, 1988 [0079]
\bulletFrancisco, J. A.;
Campbell, R.; Iverson, B. L.; Georgoiu, G.
Production and fluorescence-activated cell sorting
of Escherichia coli expressing a functional antibody fragment
on the external surface. Proc Natl Acad Sci U S A.,
1993, vol. 90, 10444-8 [0113]
\bulletForster et al.
Programming peptidomimetic synthetases by translating genetic codes
designed de novo. PNAS, 2003, vol. 100 (11),
6353-6357 [0115]
\bulletFeng et al. Expanding
tRNA recognition of a tRNA synthetase by a single amino acid change.
PNAS, 2003, vol. 100 (10), 5676-5681
[0115]
\bulletSayers, J.R.; Schmidt,
W.; Eckstein, F. 5',3' Exonuclease in
phosphorothioate-based
oligonucleotide-directed mutagenesis. Nucleic
Acids Res., 1988, 791-802 [0120]
\bulletMa et al.
Biochemistry, 1993, vol. 32, 7939 [0122] [0124]
\bulletKowal; Oliver. Nucl.
Acid. Res., 1997, vol. 25, 4685 [0122]
\bulletAnderson et al.
Exploring the Limits of Codon and Anticodon Size. Chemistry and
Biology, 2002, vol. 9, 237-244 [0123]
\bulletMagliery. Expanding the Genetic
Code: Selection of Efficient Suppressors of
Four-base Codons and Identification of ''Shifty''
Four-base Codons with a Library Approach in
Escherichia coli. J. Mol. Biol., 2001, vol.
307, 755-769 [0123]
\bulletHohsaka et al. J. Am.
Chem. Soc., 1999, vol. 121, 34 [0124]
\bulletHohsaka et al. J. Am.
Chem. Soc., 1999, vol. 121, 12194 [0124]
\bulletMoore et al. J. Mol.
Biol., 2000, vol. 298, 195 [0124]
\bulletHirao et al. An
unnatural base pair for incorporating amino acid analogues into
protein. Nature Biotechnology, 2002, vol. 20,
177-182 [0128]
\bulletSwitzer et al. J. Am.
Chem. Soc., 1989, vol. 111, 8322 [0129]
\bulletPiccirilli et al.
Nature, 1990, vol. 343, 33 [0129]
\bulletKool. Curr. Opin. Chem.
Biol., 2000, vol. 4, 602 [0129]
\bulletGuckian; Kool. Angew.
Chem. Int. Ed. Engl., 1998, vol. 36, 2825 [0129]
\bulletMcMinn et al. J. Am.
Chem. Soc., 1999, vol. 121, 11586 [0129]
\bulletOgawa et al. J. Am.
Chem. Soc., 2000, vol. 122, 3274 [0129]
\bulletOgawa et al. J. Am.
Chem. Soc., 2000, vol. 122, 8803 [0129]
\bulletTae et al. J. Am.
Chem. Soc., 2001, vol. 123, 7439 [0129]
\bulletMeggers et al. J. Am.
Chem. Soc., 2000, vol. 122, 10714 [0129]
\bullet L. Stryer. Biochemistry.
Freeman and Company, 1988 [0131]
\bulletFessendon; Fessendon.
Organic Chemistry. Willard Grant Press, 1982
[0138]
\bulletMarch. Advanced Organic
Chemistry. Wiley and Sons, 1985 [0138]
\bulletCarey; Sundberg.
Advanced Organic Chemistry. Plenum Press, 1990
[0138]
\bulletMatsoukas et al. J.
Med. Chem., 1995, vol. 38, 4660-4669
[0139]
\bulletKing, F.E.; Kidd, D.A.A.
A New Synthesis of Glutamine mid of
\gamma-Dipeptides of Glutamic Acid from Phthylated
Intermediates. J. Chem. Soc., 1949,
3315-3319 [0141]
\bulletFriedman, O.M.;
Chatterrji, R. Synthesis of Derivatives of Glutamine as Model
Substrates for Anti-Tumor Agents. J. Am. Chem.
Soc., 1959, vol. 81, 3750-3752 [0141]
\bulletCraig, J.C. et al.
Absolute Configuration of the Enantiomers of
7-Chloro-4
[[4-(diethylamino)-1-methylbutyl]amino]quinoline
(Chloroquine). J. Org. Chem, 1988, vol. 53,
1167-1170 [0141]
\bulletAzoulay, M.; Vilmont,
M.; Frappier, F. Glutamine analogues as Potential
Antimalarials. Eur. J. Med. Chem., 1991, vol.
26, 201-5 [0141]
\bulletKoskinen, A.M.P.;
Rapoport, H. Synthesis of 4-Substituted
Prolines as Conformationally ConstrainedAminoAcid Analogues. J.
Org. Chem., 1989, vol. 54, 1859-1866
[0142]
\bulletChristie, B.D.;
Rapoport, H. Synthesis of Optically Pure Pipecolates from
L-Asparagine. Application to the Total Synthesis of
(+)-Apovincamine through Amino Acid Decarbonylation
and Iminium Ion Cyclization. J. Org. Chem., 1985,
1859-1866 [0142]
\bulletBarton et al. Synthesis
of Novel \alpha-Amino-Acids and
Derivatives Using Radical Chemistry: Synthesis of Land
D-\alpha-Amino-Adipic
Acids, L-\alpha-aminopimelic Acid
and Appropriate Unsaturated Derivatives. Tetrahedron Lett., 1987, vol. 43, 4297-4308 [0143]
\bulletSubasinghe et al.
Quisqualic acid analogues: synthesis of
beta-heterocyclic 2-aminopropanoic
acid derivatives and their activity at a novel
quisqualate-sensitized site. J. Med. Chem., 1992, vol. 35, 4602-7 [0143]
\newpage
\bulletLiu, D.R; Schultz, P.G.
Progress toward the evolution of an organism with an expanded
genetic code. PNAS, USA, 1999, vol. 96,
4780-4785 [0146]
\bulletNickitenko et al. A
structure of DppA, a periplasmic depeptide transport/chemosensory
receptor. Biochemistry, 1995, vol. 34,
16585-16595 [0149]
\bulletDunten, P.; Mowbray,
S.L. Crystal structure of the dipeptide binding protein from
Escherichia coli involved in active transport and chemotaxis.
Protein Science, 1995, vol. 4,
2327-34 [0149]
\bulletStemmer. Rapid evolution of a
protein in vitro byDNA shuffling. Nature, 1994,
vol. 370 (4), 389-391 [0151]
\bulletStemmer. DNA shuffling by
random fragmentation and reassembly: In vitro recombination
for molecular evolution. Proc. Natl. Acad. Sci. USA.,
1994, vol. 91, 10747-10751 [0151]
\bullet Overview of principles of
hybridization and the strategy of nucleic acid probe assays.
Tijssen. Laboratory Techniques in Biochemistry and Molecular
Biology-Hybridization with Nucleic Acid Probes.
Elsevier, 1993 [0163]
\bulletHames; Higgins. Gene
Probes 1. IRL Press at Oxford University Press, 1995
[0163]
\bulletHames; Higgins. Gene
Probes 2. IRL Press at Oxford University Press, 1995
[0163]
\bulletSmith; Waterman. Adv.
Appl. Math., 1981, vol. 2, 482 [0177]
\bulletNeedleman; Wunsch. J.
Mol. Biol, 1970, vol. 48, 443 [0177]
\bulletPearson; Lipman.
Proc. Nat'l. Acad. Sci. USA, 1988, vol. 85, 2444
[0177]
\bulletAltschul et al. J.
Mol. Biol., 1990, vol. 215, 403-410
[0178]
\bulletHenikoff; Henikoff.
Proc. Natl. Acad. Sci. USA, 1989, vol. 89, 10915
[0178]
\bulletKarlin; Altschul.
Proc. Nat'l. Acad. Sci. USA, 1993, vol. 90,
5873-5787 [0179]
\bulletFrom et al. Proc.
Natl. Acad. Sci. USA, 1985, vol. 82, 5824 [0182]
\bulletKlein et al.
Nature, 1987, vol. 327, 70-73
[0182]
\bullet TheATCCCatalogue of Bacteria and
Bacteriophage. ATCC, 1996 [0183]
\bullet Plant Cell, Tissue and Organ Culture;
Fundamental Methods. Springer Lab Manual,
Springer-Verlag, 1995 [0184]
\bulletBock, A. et al. Mol.
Microbiol., 1991, vol. 5, 515-520
[0188]
\bulletSrinivasan, G. et al.
Science, 2002, vol. 296, 1459-1462
[0188]
\bulletHao, B. et al.
Science, 2002, vol. 296, 1462-1466
[0188]
\bulletWang, L. et al.
Science, 2001, vol. 292, 498-500
[0192] [0199] [0199] [0210]
\bulletWang, L. et al. J.
Am. Chem. Soc., 2002, vol. 124, 1836-1837
[0188]
\bulletZhang, Z. et al.
Angew. Chem. Int. Ed. Engl., 2002, vol. 41,
2840-2842 [0188]
\bulletCornish, V. W. et al.
J. Am. Chem. Soc., 1996, vol. 118,
8150-8151 [0189] [0198]
\bulletGeoghegan, K. F.; Stroh,
J. G. Bioconjug. Chem., 1992, vol. 3,
138-146 [0189] [0197]
\bulletMahal, L. K. et al.
Science, 1997, vol. 276, 1125-1128
[0189]
\bulletBegley, T. P. et al.
Top. Curr. Chem. Springer-Verlag,
1997, vol. 195, 93-142 [0189]
\bulletDiaz, E. et al.
Microbiol. Mol. Biol. Rev., 2001, vol. 65,
523-569 [0189]
\bulletOkeley, N. M.; van der
Donk, W. A. Chem. Biol., 2000, vol. 7,
R159-R171 [0189]
\bulletCleland, G. H. J. Org.
Chem., 1969, vol. 34, 744-747
\bulletWang, L.; Schultz, P. G.
Chem. Biol., 2001, vol. 8, 883-890
[0192] [0199] [0199]
\bulletCreighton, T. E. Methods
Enzymol., 1986, vol. 131, 83-106
[0196]
\bulletAltenbach, C. et al.
Science, 1990, vol. 248, 1088-1092
[0196]
\bulletBrinkley, M. Bioconjug.
Chem., 1992, vol. 3, 2-13 [0196]
\bulletGiuliano, K. A. et al.
Annu. Rev. Biophys. Biomol. Struct., 1995, vol.
24, 405-434 [0196]
\bulletMannuzzu, L. M. et al.
Science, 1996, vol. 271, 213-216
[0196]
\bulletGriffin, B. A. et al.
Science, 1998, vol. 281, 269-272
[0196]
\bulletLlopis, J. et al.
Methods Enzymol., 2000, vol. 327,
546-564 [0196]
\bulletGaietta, G. et al.
Science, 2002, vol. 296, 503-507
[0196]
\bulletJencks, W. P. J. Am. Chem.
Soc., 1959, vol. 81, 475-481 [0196]
\bulletShao, J.; Tam, J. P. J. Am.
Chem. Soc., 1995, vol. 117, 3893-3899
[0196] [0197]
\bulletGaertner, H. F. et al.
J. Biol. Chem., 1994, vol. 269,
7224-7230 [0197]
\bulletRose, K. J. Am. Chem.
Soc., 1994, vol. 116, 30-33 [0197]
\bulletCanne, L. E. et al.
J. Am. Chem. Soc., 1995, vol.117,
2998-3007 [0197]
\bulletMuir, T. W. et al.
Proc. Natl. Acad. Sci. U S A, 1998, vol. 95,
6705-6710 [0197]
\bulletAyers, B. et al.
Biopolymers, 1999, vol. 51, 343-354
[0197]
\bulletWang, L. et al. J.
Am. Chem. Soc., 2000, vol. 122, 5010-5011
[0199]
\bulletBrick, P. et al. J.
Mol. Biol., 1989, vol. 208, 83-98
[0199]
\bulletNilsson, B. et al.
Protein Eng., 1987, vol. 1, 107-113
[0211]
\bulletCornish, V. W et al.
J. Am. Chem. Soc., 1996, vol. 118,
8150-8151 [0210]
\bulletRodriguez, E. C. et al.
J. Org. Chem, 1998, vol. 63, 7134-7135
[0210]
\bulletWang, L. et al. Proc.
Natl. Acad. Sci. U.S.A., 2003, vol. 100,
56-61 [0210] [0212]
\bulletCao, S. et al.
Tetrahedron, 1995, vol. 51, 6679-6686
[0212]
\bulletSchanbacher, F. L.;
Ebner, K. E. J. Biol. Chem., 1970, vol. 245,
5057-5061 [0213]
\bulletWitte, K. et al. J.
Am. Chem. Soc, 1997, vol. 119, 2114-2118
[0213]
\bulletKitagawa, H.; Paulson,
J. C. J. Biol. Chem., 1994, vol. 269,
1394-1401 [0213]
\bullet B. G. Davis. Chem. Rev.,
2002, vol. 102, 579 [0223]
\bullet L. Wang et al.
Science, 2001, vol. 292, 498 [0224] [0233] [0233]
\bullet L. Wang et al. J. Am.
Chem. Soc., 2002, vol. 124, 1836 [0224]
\bullet Z. Zhang et al.
Angew. Chem. Int. Ed. Engl., 2002, vol. 41, 2840
[0224]
\bullet J. W. Chin et al. J.
Am. Chem. Soc., 2002, vol. 124, 9026 [0224]
\bullet J. W. Chin et al.
Proc. Natl. Acad. Sci. U S A, 2002, vol. 99, 11020
[0224]
\bullet S. W. Santoro et al.
Nat. Biotechnol., 2002, vol. 20, 1044 [0224]
[0226]
\bullet L. Wang et al. Proc.
Natl. Acad. Sci. U S A, 2003, vol. 100, 56 [0224]
\bullet Z. Zhang et al.
Biochemistry, 2003, vol. 42, 6735 [0233] [0233]
\bullet J. W. Chin et al.
Science, 2003 [0224]
\bullet T. Arslan et al. J.
Am. Chem. Soc., 1997, vol. 119, 10877 [0224]
\bullet L. Wells et al.
Science, 2001, vol. 291, 2376 [0224]
\bullet N.
Lamarre-Vincent; L.
Hsieh-Wilson. J. Am. Chem.
Soc., 2003, vol. 125, 6612 [0224] [0224]
\bullet A.K. Sarkar et al.
Proc. Natl. Acad. Sci.US A, 1995, vol. 92, 3323
[0224]
\bullet S. Ebisu et al.
Carbohyrdr. Res., 1978, vol. 61, 129 [0229]
\bullet S. Ebisu et al.
Carbohydr. Res., 1978, vol. 61, 129 [0229]
\bullet K. Kamemura et al. J.
Biol. Chem., 2002, vol. 277, 19229 [0230]
\bullet K. Witte et al. J.
Am. Chem. Soc., 1997, vol. 119, 2114 [0231] [0234]
\bullet K. Kamemura et al. J.
Biol. Chem, 2002, vol. 277, 19229 [0232] [0234]
\bullet S. W. Santoro et al.
Nat. Biotechnol, 2002, vol. 20, 1044 [0233] [0234]
Claims (52)
1. Método para la síntesis de una glicoproteína,
comprendiendo el método:
a) incorporar en una proteína un aminoácido no
natural que comprende un primer grupo reactivo; en el que la etapa
de incorporación comprende la incorporación del aminoácido no
natural en la proteína con un par ARNt ortogonal/aminoacil
ortogonal-ARNt sintetasa
(O-ARNt/O-RS), en el que el
O-ARNt reconoce un codón selector e incorpora el
aminoácido no natural en la proteína como respuesta al codón
selector, y en el que los ORS aminoacilan el O-ARNt
con el aminoácido natural; y,
b) poner en contacto la proteína con un residuo
sacárido que comprende un segundo grupo reactivo, en donde el
primer grupo reactivo reacciona con el segundo grupo reactivo para
unir el residuo sacárido al aminoácido no natural, produciendo por
tanto la glicoproteína.
2. Método de la reivindicación 1, en el que el
primer grupo reactivo es un residuo electrofílico y el segundo
grupo reactivo es un residuo nucleofílico.
3. Método de la reivindicación 2, en el que:
- (a)
- el residuo electrofílico es un residuo ceto o un residuo aldehído; y/o
- (b)
- el residuo nucleofílico se selecciona del grupo que consiste en:
- -NR^{1}-NH_{2}(hidrazida), -NR^{1}(C=O)NR^{2}NH_{2}(semicarbazida), -NR^{1}(C=S) NR^{2}NH_{2}(tiosemicarbazida), -(C=O)NR^{1}NH_{2}(carbonilhidrazida), -(C=S)NR^{1}NH_{2}(tiocarbonilhidrazida), -(SO_{2})NR^{1}NH_{2} (sulfonilhidrazida), -NR^{1}NR^{2}(C=O)NR^{3}NH_{2}(carbazida), -NR^{1}NR^{2} (C=S)NR^{3}NH_{2}(tiocarbazida), -O-NH_{2}(hidroxilamina), en donde cada R^{1}, R^{2} y R^{3} es independientemente H, o alquilo que tiene de 1-6 carbonos.
4. Método de la reivindicación 4, en el que el
residuo nucleofílico se selecciona del grupo que consiste en
hidrazida, hidroxilamina, semicarbazida y carbohidrazida.
5. Método de la reivindicación 2, en el que el
producto de reacción comprende una oxima, una amida, una hidrazona,
una carbohidrazona, una tiocarbohidrazona, una sulfonilhidrazona,
una semicarbazona o una tiosemicarbazona.
6. Método de la reivindicación 6, en el que el
producto de reacción comprende una hidrazona reducida.
7. Método de la reivindicación 1, en el que el
primer grupo reactivo es un residuo nucleofílico y el segundo grupo
reactivo es un residuo electrofílico.
8. Método de la reivindicación 8, en el que el
residuo electrofílico es un residuo ceto o aldehído.
9. Método de la reivindicación 1, en el que el
residuo sacárido comprende dos o más residuos de carbohidrato.
10. Método de la reivindicación 1, que comprende
además:
c) poner en contacto el residuo sacárido con una
glicosiltransferasa, un residuo donante de azúcar, y otros
reactivos requeridos para la actividad de glicosiltransferasa
durante un tiempo suficiente y bajo las condiciones apropiadas para
transferir un azúcar proveniente del residuo donante de azúcar hacia
el residuo sacárido.
11. Método de la reivindicación 11, en el
que
(a) la glicosiltransferasa se selecciona del
grupo que consiste en una galactosiltransferasa, una
fucosiltransferasa, una glucosiltransferasa, una
N-acetilgalactosaminiltransferasa, una
N-acetilglucosaminiltransferasa, una
glucuroniltransferasa, una sialiltransferasa, una
manosiltransferasa, una transferasa de ácido glucurónico, una
transferasa de ácido galacturónico, y una oligosacariltransferasa,
o
(b) el método comprende además poner en contacto
un producto de la etapa (c) con al menos una segunda
glicosiltransferasa y un segundo residuo donante de azúcar; o
(c) el método comprende además poner en contacto
el residuo sacárido con una o más
\beta1-4N-acetilglucosaminiltransferasa,
una \alpha1,3fucosiltransferasa, una
\alpha1,2fucosiltransferasa, una \alpha1,4fucosiltransferasa,
una \beta1-4galactosiltransferasa, una
sialiltransferasa, para formar una estructura de oligosacárido
biantenaria o triantenaria.
12. Método de la reivindicación 10, en el
que
- (a)
- el residuo sacárido comprende un GlcNAc terminal, el residuo donante de azúcar es UDP-Gal y la glicosiltransferasa es una \beta-1,4-galactosiltransferasa; o
- (b)
- el residuo sacárido comprende un GlcNAc terminal, el residuo donante de azúcar es UDP-GlcNAc y la glicosiltransferasa es una \beta1-4N-acetilglucosaminiltransferasa.
13. Método de la reivindicación 12(b), en
el que el método comprende además poner en contacto el producto de
la reacción de N-acetilglucosaminiltransferasa con
una \beta1-4manosiltransferasa y
GDP-manosa para formar un residuo sacárido que
comprende
Man\beta1-4GlcNAc\beta1-4GlcNAc-.
14. Método de la reivindicación 13, en el que el
método comprende además poner en contacto el residuo
Man\beta1-4GlcNAc\beta1-4GlcNAc-
con una \alpha1-3manosiltransferasa y
GDP-manosa para formar un residuo sacárido que
comprende
Man\alpha1-3Man\beta1-4GlcNAc\beta1-4GlcNAc-.
15. Método de la reivindicación 14, en el que el
método comprende además poner en contacto el residuo
Man\alpha1-3Man\beta1-4GlcNAc\beta1-4GlcNAc-
con una \alpha1-6manosiltransferasa y
GDP-manosa para formar un residuo sacárido que
comprende
Man\alpha1-6(Man\alpha1-3)Man\beta1-4GlcNAc\beta1-4GlcNAc-.
16. Método de la reivindicación 15, en el que el
método comprende además poner en contacto el residuo
Man\alpha1-6(Man\alpha1-3)Man\beta1-4GlcNAc\beta1-4GlcNAc-
con una
\beta1-2N-acetilglucosaminiltransferasa
y UDP-GlcNAc para formar un residuo sacárido que
comprende
Man\alpha1-6(GlcNAc\beta1-2Man\alpha1-3)Man\beta1-4GlcNAc\beta1-4GlcNAc-.
17. Método de la reivindicación 16, en el que el
método comprende además poner en contacto el residuo
Man\alpha1-6(GlcNac\beta1-2Man\alpha1-3)Man\beta1-4GlcNAc\beta1-4GlcNAc\beta1-4GlcNAc-
con una
\beta1-2N-acetilglucosaminiltransferasa
y UDP-GlcNAc para formar un residuo sacárido que
comprende
GlcNAc\beta1-2Man\alpha1-6(GlcNAc\beta1-2Man\alpha1-3)Man\beta1-4GlcNAc\beta1-4GlcNAc-.
18. Método de la reivindicación 1, en el que el
sistema de traducción comprende una célula.
19. Método de la reivindicación 1, en el que el
sistema O-RS comprende una secuencia de aminoácidos
que comprende cualquiera de las SEQ ID NO.: 1, 2 ó 3.
20. Método de la reivindicación 23, en el que el
O-ARNt comprende un mutARN Tyr CUA (SEQ ID NO:
7).
21. Método de la reivindicación 1, en el
que:
(a) incorporar el aminoácido no natural en la
proteína comprende aminoacilar le OtARN con el aminoácido no
natural; o
(b) incorporar el aminoácido no natural en la
proteína comprende:
aminoacilar el OtARN con el aminoácido no
natural, utilizando la ORS, en el que la ORS aminoacila el OtRNA
más eficazmente que el ORS aminoacilata cualquier tARN endógeno del
sistema de traducción y en el que el ORS aminoacilata el OtARN más
eficazmente con el aminoácido no natural que con el aminoácido
natural.
22. Método de la reivindicación 1, comprendiendo
además la purificación de la glicoproteína.
23. Método de la reivindicación 1, en el que la
glicoproteína se produce en una célula o lisado celular.
24. Método de la reivindicación 1, en el que se
producen al menos aproximadamente 10 \mug de glicoproteína.
25. Método de la reivindicación 1, en el que la
glicoproteína se produce en una célula o lisado celular en una
concentración de al menos aproximadamente 10 \mug/litro.
26. Glicoproteína que comprende dos o más
residuos polisacáridos unidos a dos o más aminoácidos no naturales
en la glicoproteína, en la que el residuo sacárido se une al
polipéptido mediante un producto de reacción de una reacción
nucleofílica entre un primer grupo reactivo unido a un aminoácido no
natural presente en el polipéptido y un segundo grupo reactivo
unido al residuo sacárido.
27. Glicoproteína de la reivindicación 26, en la
que el primer grupo reactivo es un residuo electrofílico y el
segundo grupo reactivo es un residuo nucleofílico.
28. Glicoproteína de la reivindicación 26 o la
reivindicación 27, en la que los residuos polisacáridos son
iguales, o en el que los aminoácidos no naturales son los
iguales.
29. Glicoproteína de la reivindicación 26 o la
reivindicación 27, en la que los residuos polisacáridos son
diferentes, o en el que los aminoácidos no naturales son los
diferentes.
30. Glicoproteína de cualquiera de las
reivindicaciones 26 a 29, en la que la glicoproteína comprende tres
o más residuos polisacáridos unidos a tres o más aminoácidos no
naturales en la glicoproteína.
31. Glicoproteína de la reivindicación 26, en la
que:
(a) el residuos electrofílico es un residuo ceto
o aldehído; y/o
(b) el residuo nucleofílico se selecciona del
grupo que consiste en: -NR1-NH2(hidrazida),
-NR1(C=O)NR2NH2 (semicarbazida),
-NR1(C=S)NR2NH2(tiosemicarbazida), -(C=O)
NR1NH2(carbonilhidrazida),
-(C=S)NR1NH2(tiocarbonilhidrazida),
-(SO2)NR1NH2(sulfonilhidrazida),
-NR1NR2(C=O)NR3NH2(carbazida),
-NR1NR2(C=S)
NR3NH2(tiocarbazida) o -O-NH2(hidroxilamina, en donde cada R1, R2 y R3 es independientemente H, o alquilo que tiene de 1-6 carbonos.
NR3NH2(tiocarbazida) o -O-NH2(hidroxilamina, en donde cada R1, R2 y R3 es independientemente H, o alquilo que tiene de 1-6 carbonos.
32. Glicoproteína de la reivindicación 27, en la
que el residuo nucleofílico se selecciona del grupo que consiste en
hidrazida, hidroxilamina, semicarbazida y carbohidrazida.
33. Glicoproteína de la reivindicación 28, en la
que el producto de reacción comprende una oxima, una amida, una
hidrazona, una carbohidrazona, una tiocarbohidrazona, una
sulfonilhidrazona, una semicarbazona o una tiosemicarbazona.
34. Glicoproteína de la reivindicación 33, en la
que el producto de reacción comprende una hidrazona reducida.
35. Glicoproteína de cualquiera de las
reivindicaciones 26 a 34, presente en una célula o lisado
celular.
36. Glicoproteína de cualquiera de las
reivindicaciones 26 a 34, en la que la glicoproteína se produce
utilizando un sistema de traducción en una célula.
37. Método para sintetizar una glicoproteína,
comprendiendo el método la incorporación en una proteína de un
aminoácido no natural que comprende un residuo sacárido, en el que
el método comprende además poner en contacto el residuo sacárido
con una glicosiltransferasa recombinante, un residuo donante de
azúcar, y otros reactivos requeridos para la actividad de la
glicosiltransferasa durante un tiempo suficiente y bajo las
condiciones apropiadas para transferir un azúcar desde el residuo
donante de azúcar hacia el residuo sacárido.
38. Método de la reivindicación 37, en el que la
glicosiltransferasa se selecciona del grupo que consiste en una
galactosiltransferasa, una fucosiltransferasa, una
glucosiltransferasa, una
N-acetilgalactosaminiltransferasa, una
N-acetilglucosaminiltransferasa, una
glucuroniltransferasa, una sialiltransferasa, una
manosiltransferasa, una transferasa de ácido glucurónico, una
transferasa de ácido galacturónico, y una
oligosacariltransferasa.
39. Método de la reivindicación 37, en el
que
(a) el método comprende además poner en contacto
el producto de la reacción de glicosiltransferasa con al menos una
segunda glicosiltransferasa y un segundo residuo donante de azúcar,
o
(b) el residuo sacárido comprende una GlcNAc
terminal, el residuo donante de azúcar es UDP-GlcNAc
y la glicosiltransferasa es una
\beta1-4N-acetilglucosaminiltransferasa,
o
(c) el residuo sacárido comprende una GlcNAc
terminal, el residuo donante de azúcar es UDP-Gal y
la glicosiltransferasa es una
\beta1-4-galactosiltransferasa.
40. Método de la reivindicación 37, en el que la
etapa de incorporación comprende utilizar un par ARNt
ortogonal/aminoacil ortogonal-ARNt sintetasa
(O-ARNt/O-RS), en donde el
O-ARNt reconoce un codón selector e incorpora el
aminoácido no natural dentro de la proteína en respuesta al codón
selector, y en donde la O-RS preferentemente
aminoacila el O-ARNt con el aminoácido no
natural.
41. Método de la reivindicación 41, en el
que
la O-RS comprende una secuencia
de aminoácidos que comprende cualquiera de las SEQ ID NO.: 4, 5 o
6.
el O-ARNt comprende un muARN Tyr
CUA (SEQ ID NO:7).
42. Método de la reivindicación 37, en el
que
(a) la etapa de incorporación es in vivo;
o
(b) el aminoácido no natural comprende una
\beta-O-GlcNAc-L-serina,
una
tri-acetil-\beta-GlcNAc-serina,
una
tri-O-acetil-GalNAc-\alpha-treonina,
o una
\alpha-GalNAc-L-treonina.
43. Célula huésped para sintetizar una
glicoproteína, la célula huésped comprendiendo:
a) un aminoácido no natural que comprende un
residuo sacárido;
b) un ARNt ortogonal que reconoce un codón
selector;
c) una ARNt sintetasa de aminoacilo ortogonal
(O-RS) que cataliza la unión del aminoácido no
natural al ARNt ortogonal;
d) un polinucleótido que codifica una
glicosiltransferasa recombinante; y
e) una secuencia de polinucleótidos que codifica
para un polipéptido y comprende al menos un codón selector.
44. Célula huésped de la reivindicación 47, en
la que
(a) la glicosiltransferasa recombinante se
selecciona del grupo que consiste en: una galactosiltransferasa,
una fucosiltransferasa, una glucosiltransferasa, una
N-acetilgalactosaminiltransferasa, una
N-acetilglucosaminiltransferasa, una
glucuroniltransferasa, una sialiltransferasa, una
manosiltransferasa, una transferasa de ácido glucurónico, una
transferasa de ácido galacturónico, y una oligosacariltransferasa;
y/o
(b) la célula huésped es una célula de mamífero,
una célula de levadura, una célula bacterial, una célula vegetal,
una célula de hongo, una célula arqueobacterial, o una célula de
insecto.
45. Composición que comprende un sistema de
traducción, comprendiendo el sistema de traducción un ARNt ortogonal
(O-ARNt) y una ARNt sintetasa de aminoacilo
ortogonal (O-RS),
en la que la O-RS
preferentemente aminoacila el O-ARNt con un
aminoácido no natural que comprende un residuo sacárido y el
O-ARNt reconoce al menos un codón selector, en la
que el aminoácido no natural comprende un aminoácido treonina que
comprende un residuo Man, Gal, GalNac, Glc, GlcNAc p Fuc, o un
aminoácido serina que comprende un residuo Man o Fuc.
46. Composición de la reivindicación 45, en la
que
(a) la O-RS comprende una
secuencia de aminoácidos que comprende un mutARN Tyr CUA (SEQ ID
NO.: 7) o
(b) el aminoácido no natural comprende un
tri-O-acetil-GalNac-\alpha-treonina,
o un
\alpha-GalNAc-L-treonina.
47. Polipéptido artificial seleccionado del
grupo que consiste en:
(a) un polipéptido que comprende una secuencia
de aminoácidos como se muestra en cualquiera de las SEQ ID NO.:
4-6;
(b) un polipéptido que comprende una secuencia
de aminoácidos codificada por una secuencia de polinucleótidos como
se muestra en cualquiera de las SEQ ID NO.:
8-10;
(c) un polipéptido que es específicamente
inmunorreactivo con un anticuerpo específico para un polipéptido de
(a), o (b); y
(d) una secuencia de aminoácidos que comprende
una variante conservadora de (a), (b) o (c).
48. Polinucleótido artificial seleccionado del
grupo que consiste en:
(a) un polinucleótido que comprende una
secuencia de nucleótidos como se establece en cualquiera de las SEQ
ID NO.: 8-10;
(b) un polinucleótido que es complementario, o
que codifica para una secuencia de polinucleótidos de (a);
(c) un polinucleótido que codifica para un
polipéptido que comprende, una secuencia de aminoácidos como se
establece en cualquiera de las SEQ ID NO.: 1-6, o
una variante conservadora de la misma;
(d) un polinucleótido que codifica para un
polipéptido de la reivindicación 55;
(e) un ácido nucleico que se híbrida a un
polinucleótido de (a), (b), (c), o (d) bajo condiciones altamente
rigurosas sobre sustancialmente la longitud total del ácido
nucleico;
(f) un polinucleótido que es al menos 98%
idéntico a un polinucleótido de (a), (b), (c), (d) o (e); y
(h) un polinucleótido que comprende una variante
conservadora de (a), (b), (c), (d), (e) o (f),
en el que el polinucleótido codifica un RS que
aminoacila un tARN con
\beta-GlcNAc-Serina.
\newpage
49. Polinucleótido de la reivindicación 48, en
el que el polinucleótido es un ácido nucleico que comprende una
subsecuencia e polinucleótido correspondiente a SEQ. ID NO: 8.
50. Polineucleótido de la reivindicación 49, en
el que el vector es un vector de expresión que comprende un
promotor enlazado operablemente a la subsecuencia que comprende SEQ
ID NO:8.
51. Equipo que comprende:
un RS que aminoacila un TARN con
\beta-GlcNAc-Serina;
un polinucleótido que codifica un RS que
aminoacila un tARN con
\beta-GlcNAc-Serina;
un vector que comprende un polinucleótido que
codifica un RS que aminoacila un tARN con
\beta-GlcNAc-Serina; o
un sistema de traducción que comprende un RS que
aminoacila un tARN con
\beta-GlcNAc-Serina o un
polinucleótido que codifica un RS que aminoacila un tARN con
\beta-GlcNAc-Serina.
52. Equipo de la reivindicación 51, en el que el
RS, polinucleótido, vector o sistema de traducción está envasado en
un recipiente.
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US41926502P | 2002-10-16 | 2002-10-16 | |
US419265P | 2002-10-16 | ||
US42099002P | 2002-10-23 | 2002-10-23 | |
US420990P | 2002-10-23 | ||
US44145003P | 2003-01-16 | 2003-01-16 | |
US441450P | 2003-01-16 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2333422T3 true ES2333422T3 (es) | 2010-02-22 |
Family
ID=32110831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES03777634T Expired - Lifetime ES2333422T3 (es) | 2002-10-16 | 2003-10-15 | Sintesis de glicoproteinas. |
Country Status (14)
Country | Link |
---|---|
US (11) | US6927042B2 (es) |
EP (1) | EP1558747B1 (es) |
JP (1) | JP4752001B2 (es) |
KR (1) | KR20050073559A (es) |
AT (1) | ATE445709T1 (es) |
AU (1) | AU2003286436B2 (es) |
CA (1) | CA2500653A1 (es) |
DE (1) | DE60329700D1 (es) |
ES (1) | ES2333422T3 (es) |
HK (1) | HK1074855A1 (es) |
IL (6) | IL196906A0 (es) |
MX (1) | MXPA05003978A (es) |
SG (1) | SG160203A1 (es) |
WO (1) | WO2004035605A2 (es) |
Families Citing this family (105)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004537984A (ja) * | 2001-04-19 | 2004-12-24 | ザ スクリップス リサーチ インスティテュート | 直交tRNA−アミノアシルtRNAシンテターゼ対を生産するための方法及び組成物 |
US8414774B2 (en) * | 2001-04-25 | 2013-04-09 | Agilent Technologies, Inc. | Systems and methods for high-throughput screening of fluidic samples |
US20050123970A1 (en) * | 2001-04-25 | 2005-06-09 | Can Ozbal | High throughput autosampler |
EP2062976B1 (en) * | 2002-10-16 | 2011-09-28 | The Scripps Research Institute | Site specific incorporation of keto amino acids into proteins |
EP1558747B1 (en) * | 2002-10-16 | 2009-10-14 | The Scripps Research Institute | Glycoprotein synthesis |
CA2520750A1 (en) * | 2003-04-17 | 2004-11-04 | The Scripps Research Institute | Orthogonal aminoacyl-trna synthetase |
BRPI0411475A (pt) | 2003-06-18 | 2006-07-25 | Scripps Research Inst | adições de código genético de aminoácido reativo não natural |
EP1666604B1 (en) | 2003-07-07 | 2008-02-13 | The Scripps Research Institute | Compositions of orthogonal lysyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof |
EP1658366A4 (en) * | 2003-07-07 | 2006-08-09 | Scripps Research Inst | COMPOSITIONS OF ORTHOGONAL GLUTAMYL-TRNA AND AMINOACYL-TRNA-SYNTHETASEPAARES AND THEIR USES |
US20060160175A1 (en) * | 2003-07-07 | 2006-07-20 | The Scripps Research Institute | Compositions of orthogonal leucyl-trna and aminoacyl-trna synthetase pairs and uses thereof |
CN101532046A (zh) | 2003-10-14 | 2009-09-16 | 斯克利普斯研究院 | 将氧化还原活性氨基酸位点特异地掺入蛋白质 |
BRPI0507159A (pt) | 2004-02-02 | 2007-06-26 | Ambrx Inc | polipeptìdeos em feixe de quatro hélices humanos modificados e seus usos |
US20050260711A1 (en) * | 2004-03-30 | 2005-11-24 | Deepshikha Datta | Modulating pH-sensitive binding using non-natural amino acids |
US20050287639A1 (en) | 2004-05-17 | 2005-12-29 | California Institute Of Technology | Methods of incorporating amino acid analogs into proteins |
EP1774018A2 (en) * | 2004-05-25 | 2007-04-18 | The Scripps Research Institute | Site specific incorporation of heavy atom-containing unnatural amino acids into proteins for crystal structure determination |
AU2005265163B2 (en) | 2004-06-18 | 2009-10-01 | Ambrx, Inc. | Novel antigen-binding polypeptides and their uses |
EP1771573A4 (en) * | 2004-07-21 | 2009-02-18 | Ambrx Inc | BIOSYNTHETIC POLYPEPTIDES OBTAINED FROM NON-NATURALLY CITED AMINO ACIDS |
WO2006034332A2 (en) * | 2004-09-21 | 2006-03-30 | The Scripps Research Institute | In vivo incorporation of alkynyl amino acids into proteins in eubacteria |
US20090181858A1 (en) * | 2004-09-21 | 2009-07-16 | The Scripps Research Institute | Adding photoregulated amino acids to the genetic code |
JP2008513806A (ja) * | 2004-09-22 | 2008-05-01 | ザ スクリップス リサーチ インスティテュート | Nmr試験のための蛋白質の部位特異的標識 |
US20080064059A1 (en) * | 2004-10-20 | 2008-03-13 | Scripps Research Institute | In Vivo Site-Specific Incorporation of N-Acetyl-Galactosamine Amino Acids in Eubacteria |
BRPI0517381A (pt) | 2004-10-27 | 2008-10-07 | Scripps Research Inst | componentes ortogonais de tradução para a incorporação in vivo de aminoácidos não naturais |
CA2585758C (en) | 2004-10-29 | 2017-08-01 | Neose Technologies, Inc. | Remodeling and glycopegylation of fibroblast growth factor (fgf) |
KR20070100299A (ko) | 2004-12-22 | 2007-10-10 | 암브룩스, 인코포레이티드 | 재조합 인간 성장 호르몬의 발현 및 정제 방법 |
EP1833993A4 (en) | 2004-12-22 | 2009-07-22 | Ambrx Inc | HUMAN GROWTH HORMONE FORMULATIONS COMPRISING AN AMINO ACID CODED NON-NATURALLY |
US7939496B2 (en) | 2004-12-22 | 2011-05-10 | Ambrx, Inc. | Modified human growth horomone polypeptides and their uses |
ZA200704927B (en) | 2004-12-22 | 2009-09-30 | Ambrx Inc | Compositions of aminoacyl-tRNA synthetase and uses thereof |
MX2007015058A (es) | 2005-06-03 | 2008-01-28 | Ambrx Inc | Moleculas de interferon humano mejoradas y sus usos. |
BRPI0617191A2 (pt) * | 2005-10-12 | 2011-07-19 | Scripps Research Inst | modificação pós-traducional de polipeptìdeos expressos em fagos |
CN106443006A (zh) * | 2005-11-16 | 2017-02-22 | Ambrx公司 | 包括非天然氨基酸的方法和组合物 |
US7776535B2 (en) * | 2006-02-06 | 2010-08-17 | Franklin And Marshall College | Site-specific incorporation of fluorinated amino acids into proteins |
EP1999259B1 (en) | 2006-03-03 | 2014-06-25 | California Institute of Technology | Site-specific incorporation of amino acids into molecules |
AU2007223830A1 (en) * | 2006-03-09 | 2007-09-13 | The Scripps Research Institute | System for the expression of orthogonal translation components in eubacterial host cells |
US8217145B2 (en) | 2006-03-16 | 2012-07-10 | The Scrips Research Institute | Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine |
WO2007130453A2 (en) | 2006-05-02 | 2007-11-15 | Allozyne, Inc. | Non-natural amino acid substituted polypeptides |
AU2007267950B2 (en) * | 2006-05-23 | 2012-08-16 | The Scripps Research Institute | Genetically encoded fluorescent coumarin amino acids |
NZ574960A (en) | 2006-09-08 | 2012-02-24 | Ambrx Inc | Suppressor trna transcription in vertebrate cells |
CA2662753C (en) | 2006-09-08 | 2016-02-23 | Ambrx, Inc. | Hybrid suppressor trna for vertebrate cells |
CA2663083A1 (en) * | 2006-09-08 | 2008-03-13 | Ambrx, Inc. | Modified human plasma polypeptide or fc scaffolds and their uses |
WO2008036392A2 (en) * | 2006-09-21 | 2008-03-27 | The Scripps Research Institute | Genetically programmed expression of selectively sulfated proteins in eubacteria |
CA2665678A1 (en) | 2006-10-18 | 2008-06-19 | The Scripps Research Institute | Genetic incorporation of unnatural amino acids into proteins in mammalian cells |
US7403686B1 (en) * | 2006-11-30 | 2008-07-22 | The United States Of America As Represented By The Secretary Of The Navy | Fiber optic cable splicing technique |
EP2112928A4 (en) * | 2007-02-22 | 2014-01-08 | Univ Utah Res Found | SYNTHESIS OF NOVEL XYLOSIDES AND ITS POSSIBLE USES |
PL2068909T3 (pl) | 2007-03-30 | 2012-09-28 | Ambrx Inc | Modyfikowane polipeptydy fgf-21 i ich zastosowanie |
CN103965347B (zh) | 2007-05-02 | 2017-07-18 | Ambrx公司 | 经修饰干扰素β多肽和其用途 |
CA2707840A1 (en) | 2007-08-20 | 2009-02-26 | Allozyne, Inc. | Amino acid substituted molecules |
KR20100088618A (ko) * | 2007-10-25 | 2010-08-09 | 더 스크립스 리서치 인스티튜트 | 리덕타제 내로의 3-아미노티로신의 유전적 도입 |
FR2922769A1 (fr) * | 2007-10-31 | 2009-05-01 | Halina Malina | Modification des sequences intrinsequement desordonnees pour la preparation de vaccins |
EP2217356B1 (en) * | 2007-11-02 | 2018-10-17 | Biocius Life Sciences, Inc. | Devices and methods for coupling mass spectrometry devices with chromatography systems |
WO2009059056A2 (en) * | 2007-11-02 | 2009-05-07 | The Scripps Research Institute | A genetically encoded boronate amino acid |
WO2009061369A2 (en) * | 2007-11-02 | 2009-05-14 | The Scripps Research Institute | Directed evolution using proteins comprising unnatural amino acids |
DK2217265T3 (en) | 2007-11-20 | 2017-07-03 | Ambrx Inc | Modified insulin polypeptides and their use |
RU2010125104A (ru) * | 2007-12-11 | 2012-01-20 | Зе Скрипс Ресерч Инститьют (Us) | IN VIVO ЭКСПРЕССИЯ НЕПРИРОДНЫХ АМИНОКИСЛОТ В МЕТИЛОТРОФНЫХ ДРОЖЖАХ Pichia pastoris |
CA2711307C (en) | 2008-01-03 | 2020-10-27 | Cornell Research Foundation, Inc. | Glycosylated protein expression in prokaryotes |
KR20100125290A (ko) * | 2008-02-08 | 2010-11-30 | 더 스크립스 리서치 인스티튜트 | 유전적으로 코딩된 비천연 아미노산에 의한 면역 내성의 파괴 |
CA2712606A1 (en) | 2008-02-08 | 2009-08-13 | Ambrx, Inc. | Modified leptin polypeptides and their uses |
WO2009151491A2 (en) * | 2008-02-27 | 2009-12-17 | The Scripps Research Institute | In vivo incorporation of an unnatural amino acid comprising a 1,2-aminothiol group |
EP3173424A1 (en) | 2008-05-02 | 2017-05-31 | Novartis Ag | Improved fibronectin-based binding molecules and uses thereof |
EA019968B1 (ru) | 2008-07-23 | 2014-07-30 | Амбркс, Инк. | Модифицированные бычьи полипептиды g-csf и их применение |
WO2010037062A1 (en) | 2008-09-26 | 2010-04-01 | Ambrx, Inc. | Non-natural amino acid replication-dependent microorganisms and vaccines |
JP5694171B2 (ja) | 2008-09-26 | 2015-04-01 | アンブルックス, インコーポレイテッドAmbrx, Inc. | 修飾されている動物のエリスロポエチンポリペプチドおよびそれらの使用 |
US20090197339A1 (en) * | 2008-12-10 | 2009-08-06 | The Scripps Research Institute | In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris |
JP5959201B2 (ja) * | 2008-12-10 | 2016-08-02 | ザ スクリプス リサーチ インスティテュート | 化学的に反応性の非天然アミノ酸を使用するキャリア−ペプチド接合体の製造 |
US9238878B2 (en) | 2009-02-17 | 2016-01-19 | Redwood Bioscience, Inc. | Aldehyde-tagged protein-based drug carriers and methods of use |
JP6091892B2 (ja) * | 2009-06-16 | 2017-03-08 | グライセラ・リミテッド | グリコシル化に関連する物質および方法 |
WO2011051327A2 (en) | 2009-10-30 | 2011-05-05 | Novartis Ag | Small antibody-like single chain proteins |
WO2011051466A1 (en) | 2009-11-02 | 2011-05-05 | Novartis Ag | Anti-idiotypic fibronectin-based binding molecules and uses thereof |
EP2805964A1 (en) | 2009-12-21 | 2014-11-26 | Ambrx, Inc. | Modified bovine somatotropin polypeptides and their uses |
AU2010341518B2 (en) | 2009-12-21 | 2014-01-09 | Ambrx, Inc. | Modified porcine somatotropin polypeptides and their uses |
WO2011092233A1 (en) | 2010-01-29 | 2011-08-04 | Novartis Ag | Yeast mating to produce high-affinity combinations of fibronectin-based binders |
US9567386B2 (en) | 2010-08-17 | 2017-02-14 | Ambrx, Inc. | Therapeutic uses of modified relaxin polypeptides |
RS59193B1 (sr) | 2010-08-17 | 2019-10-31 | Ambrx Inc | Modifikovani polipeptidi relaksina i njihova primena |
WO2012032181A2 (en) | 2010-09-10 | 2012-03-15 | Allozyne, Inc | Novel antibody derivatives |
AR083006A1 (es) | 2010-09-23 | 2013-01-23 | Lilly Co Eli | Formulaciones para el factor estimulante de colonias de granulocitos (g-csf) bovino y variantes de las mismas |
BR112013017980A2 (pt) | 2011-01-14 | 2017-06-27 | Redwood Bioscience Inc | polipeptídeos de imunoglobulina marcado com aldeído e método de uso dos mesmos |
JP6321658B2 (ja) | 2012-09-24 | 2018-05-09 | メディミューン リミテッド | アミノ酸誘導体 |
CN102946253B (zh) * | 2012-10-23 | 2016-06-08 | 保定市三川电气有限责任公司 | 数据采样方法与系统及其在参数辨识中的应用方法与系统 |
JO3564B1 (ar) | 2013-03-08 | 2020-07-05 | Novartis Ag | ببتيدات وتركيبات لعلاج ضرر المفاصل |
PT2970398T (pt) | 2013-03-13 | 2024-06-07 | The Us Secretary Department Ofhealth And Human Servic | Proteínas f de pré-fusão do vsr e sua utilização |
EP2855533A4 (en) | 2013-03-15 | 2015-11-25 | Momenta Pharmaceuticals Inc | METHODS RELATING TO CTLA4-FC FUSION PROTEINS |
WO2014186310A1 (en) | 2013-05-13 | 2014-11-20 | Momenta Pharmaceuticals, Inc. | Methods for the treatment of neurodegeneration |
US10005838B2 (en) | 2013-07-19 | 2018-06-26 | The Regents Of The University Of California | Milk fat globule epidermal growth factor 8 regulates fatty acid uptake |
WO2015057622A1 (en) | 2013-10-16 | 2015-04-23 | Momenta Pharmaceuticals, Inc. | Sialylated glycoproteins |
US11504346B2 (en) | 2013-11-03 | 2022-11-22 | Arizona Board Of Regents On Behalf Of The University Of Arizona | Redox-activated pro-chelators |
US10501734B2 (en) * | 2014-02-06 | 2019-12-10 | Yale University | Compositions and methods of use thereof for making polypeptides with many instances of nonstandard amino acids |
US9616114B1 (en) | 2014-09-18 | 2017-04-11 | David Gordon Bermudes | Modified bacteria having improved pharmacokinetics and tumor colonization enhancing antitumor activity |
PT3412302T (pt) | 2014-10-24 | 2021-06-09 | Bristol Myers Squibb Co | Polipéptidos de fgf-21 modificados e utilizações dos mesmos |
CA3019398A1 (en) | 2016-04-26 | 2017-11-02 | R.P. Scherer Technologies, Llc | Antibody conjugates and methods of making and using the same |
CN106316920B (zh) * | 2016-07-23 | 2018-12-04 | 常州大学 | 一种新型吲哚甘氨酸衍生物的合成方法 |
US11339209B2 (en) | 2016-11-14 | 2022-05-24 | Novartis Ag | Compositions, methods, and therapeutic uses related to fusogenic protein minion |
CN109963579A (zh) | 2016-11-14 | 2019-07-02 | 诺华股份有限公司 | 用于治疗软骨损伤和关节炎的方法和组合物 |
US11180535B1 (en) | 2016-12-07 | 2021-11-23 | David Gordon Bermudes | Saccharide binding, tumor penetration, and cytotoxic antitumor chimeric peptides from therapeutic bacteria |
US11129906B1 (en) | 2016-12-07 | 2021-09-28 | David Gordon Bermudes | Chimeric protein toxins for expression by therapeutic bacteria |
US11951165B2 (en) | 2016-12-30 | 2024-04-09 | Vaxcyte, Inc. | Conjugated vaccine carrier proteins |
CA3048981A1 (en) | 2016-12-30 | 2018-07-05 | Sutrovax, Inc. | Polypeptide-antigen conjugates with non-natural amino acids |
TW201837051A (zh) | 2017-02-08 | 2018-10-16 | 美商必治妥美雅史谷比公司 | 包含藥物動力學增強劑之經修飾之鬆弛素(relaxin)多肽及其用途 |
WO2019035916A1 (en) | 2017-08-15 | 2019-02-21 | Northwestern University | DESIGN OF PROTEIN GLYCOSYLATION SITES BY RAPID EXPRESSION AND CHARACTERIZATION OF N-GLYCOSYLTRANSFERASES |
US11530432B2 (en) | 2018-03-19 | 2022-12-20 | Northwestern University | Compositions and methods for rapid in vitro synthesis of bioconjugate vaccines in vitro via production and N-glycosylation of protein carriers in detoxified prokaryotic cell lysates |
US11725224B2 (en) | 2018-04-16 | 2023-08-15 | Northwestern University | Methods for co-activating in vitro non-standard amino acid (nsAA) incorporation and glycosylation in crude cell lysates |
CA3098910A1 (en) | 2018-05-01 | 2019-11-07 | Ambrx, Inc. | A method for optimizing antibody expression |
US12098433B2 (en) | 2018-08-03 | 2024-09-24 | Northwestern University | On demand, portable, cell-free molecular sensing platform |
AU2019337610A1 (en) | 2018-09-11 | 2021-05-06 | Ambrx, Inc. | Interleukin-2 polypeptide conjugates and their uses |
CN113366015A (zh) | 2018-10-19 | 2021-09-07 | Ambrx公司 | 白细胞介素-10多肽缀合物、其二聚体及其用途 |
CN115243726A (zh) | 2020-03-11 | 2022-10-25 | 北京泰德制药股份有限公司 | 白介素-2多肽偶联物及其使用方法 |
US12139921B2 (en) * | 2021-11-18 | 2024-11-12 | Jeff Sellers | Pole cover assembly for a street pole, sign and other objects for improving visibility and aesthetic appeal |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5180674A (en) * | 1990-04-16 | 1993-01-19 | The Trustees Of The University Of Pennsylvania | Saccharide compositions, methods and apparatus for their synthesis |
US5369017A (en) * | 1994-02-04 | 1994-11-29 | The Scripps Research Institute | Process for solid phase glycopeptide synthesis |
US6465612B1 (en) | 1998-09-23 | 2002-10-15 | The Regents Of The University Of California | Synthetic peptides, conjugation reagents and methods |
JP2004537984A (ja) * | 2001-04-19 | 2004-12-24 | ザ スクリップス リサーチ インスティテュート | 直交tRNA−アミノアシルtRNAシンテターゼ対を生産するための方法及び組成物 |
MXPA04003333A (es) | 2001-10-10 | 2006-02-22 | Neose Technologies Inc | Remodelado y glicoconjugacion de peptidos. |
EP1558747B1 (en) * | 2002-10-16 | 2009-10-14 | The Scripps Research Institute | Glycoprotein synthesis |
EP2062976B1 (en) * | 2002-10-16 | 2011-09-28 | The Scripps Research Institute | Site specific incorporation of keto amino acids into proteins |
AU2003300389B2 (en) * | 2002-12-22 | 2009-10-08 | The Scripps Research Institute | Protein arrays |
CA2520750A1 (en) * | 2003-04-17 | 2004-11-04 | The Scripps Research Institute | Orthogonal aminoacyl-trna synthetase |
BRPI0411475A (pt) * | 2003-06-18 | 2006-07-25 | Scripps Research Inst | adições de código genético de aminoácido reativo não natural |
EP1666604B1 (en) * | 2003-07-07 | 2008-02-13 | The Scripps Research Institute | Compositions of orthogonal lysyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof |
US20060160175A1 (en) * | 2003-07-07 | 2006-07-20 | The Scripps Research Institute | Compositions of orthogonal leucyl-trna and aminoacyl-trna synthetase pairs and uses thereof |
EP1658366A4 (en) * | 2003-07-07 | 2006-08-09 | Scripps Research Inst | COMPOSITIONS OF ORTHOGONAL GLUTAMYL-TRNA AND AMINOACYL-TRNA-SYNTHETASEPAARES AND THEIR USES |
CN101532046A (zh) * | 2003-10-14 | 2009-09-16 | 斯克利普斯研究院 | 将氧化还原活性氨基酸位点特异地掺入蛋白质 |
CN1897969B (zh) * | 2003-12-18 | 2013-09-18 | 斯克利普斯研究院 | 在哺乳动物细胞的蛋白质内选择性地掺入5-羟色胺酸 |
EP1774018A2 (en) * | 2004-05-25 | 2007-04-18 | The Scripps Research Institute | Site specific incorporation of heavy atom-containing unnatural amino acids into proteins for crystal structure determination |
WO2006034332A2 (en) * | 2004-09-21 | 2006-03-30 | The Scripps Research Institute | In vivo incorporation of alkynyl amino acids into proteins in eubacteria |
US20090181858A1 (en) * | 2004-09-21 | 2009-07-16 | The Scripps Research Institute | Adding photoregulated amino acids to the genetic code |
JP2008513806A (ja) * | 2004-09-22 | 2008-05-01 | ザ スクリップス リサーチ インスティテュート | Nmr試験のための蛋白質の部位特異的標識 |
US20080064059A1 (en) * | 2004-10-20 | 2008-03-13 | Scripps Research Institute | In Vivo Site-Specific Incorporation of N-Acetyl-Galactosamine Amino Acids in Eubacteria |
BRPI0517381A (pt) * | 2004-10-27 | 2008-10-07 | Scripps Research Inst | componentes ortogonais de tradução para a incorporação in vivo de aminoácidos não naturais |
BRPI0617191A2 (pt) * | 2005-10-12 | 2011-07-19 | Scripps Research Inst | modificação pós-traducional de polipeptìdeos expressos em fagos |
AU2007223830A1 (en) * | 2006-03-09 | 2007-09-13 | The Scripps Research Institute | System for the expression of orthogonal translation components in eubacterial host cells |
US8217145B2 (en) * | 2006-03-16 | 2012-07-10 | The Scrips Research Institute | Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine |
AU2007267950B2 (en) * | 2006-05-23 | 2012-08-16 | The Scripps Research Institute | Genetically encoded fluorescent coumarin amino acids |
WO2008036392A2 (en) * | 2006-09-21 | 2008-03-27 | The Scripps Research Institute | Genetically programmed expression of selectively sulfated proteins in eubacteria |
CA2665678A1 (en) * | 2006-10-18 | 2008-06-19 | The Scripps Research Institute | Genetic incorporation of unnatural amino acids into proteins in mammalian cells |
US20090197339A1 (en) * | 2008-12-10 | 2009-08-06 | The Scripps Research Institute | In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris |
-
2003
- 2003-10-15 EP EP03777634A patent/EP1558747B1/en not_active Expired - Lifetime
- 2003-10-15 ES ES03777634T patent/ES2333422T3/es not_active Expired - Lifetime
- 2003-10-15 KR KR1020057006593A patent/KR20050073559A/ko not_active Application Discontinuation
- 2003-10-15 AU AU2003286436A patent/AU2003286436B2/en not_active Ceased
- 2003-10-15 AT AT03777634T patent/ATE445709T1/de not_active IP Right Cessation
- 2003-10-15 SG SG200702815-2A patent/SG160203A1/en unknown
- 2003-10-15 US US10/686,944 patent/US6927042B2/en not_active Expired - Fee Related
- 2003-10-15 DE DE60329700T patent/DE60329700D1/de not_active Expired - Lifetime
- 2003-10-15 CA CA002500653A patent/CA2500653A1/en not_active Abandoned
- 2003-10-15 WO PCT/US2003/032870 patent/WO2004035605A2/en active Application Filing
- 2003-10-15 JP JP2005501440A patent/JP4752001B2/ja not_active Expired - Fee Related
- 2003-10-15 MX MXPA05003978A patent/MXPA05003978A/es active IP Right Grant
-
2004
- 2004-12-14 US US11/014,402 patent/US7238510B2/en not_active Expired - Fee Related
-
2005
- 2005-03-29 US US11/093,797 patent/US7262040B2/en not_active Expired - Fee Related
- 2005-03-29 US US11/093,597 patent/US7199222B2/en not_active Expired - Fee Related
- 2005-03-29 US US11/094,677 patent/US7217809B2/en not_active Expired - Fee Related
- 2005-03-29 US US11/093,798 patent/US7183082B2/en not_active Expired - Fee Related
- 2005-03-29 US US11/094,676 patent/US7129333B2/en not_active Expired - Fee Related
- 2005-10-07 HK HK05108920.3A patent/HK1074855A1/xx not_active IP Right Cessation
-
2006
- 2006-09-12 US US11/520,849 patent/US7560535B2/en not_active Expired - Fee Related
- 2006-10-11 US US11/580,203 patent/US7834159B2/en not_active Expired - Fee Related
-
2007
- 2007-10-26 US US11/978,232 patent/US7825226B2/en not_active Expired - Fee Related
-
2009
- 2009-02-05 IL IL196906A patent/IL196906A0/en unknown
- 2009-02-05 IL IL196909A patent/IL196909A0/en unknown
- 2009-02-05 IL IL196905A patent/IL196905A/en not_active IP Right Cessation
- 2009-02-05 IL IL196907A patent/IL196907A0/en unknown
- 2009-02-05 IL IL196908A patent/IL196908A0/en unknown
- 2009-02-05 IL IL196904A patent/IL196904A0/en unknown
- 2009-05-15 US US12/454,390 patent/US20100009425A1/en not_active Abandoned
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2333422T3 (es) | Sintesis de glicoproteinas. | |
US7378263B2 (en) | In vivo site-specific incorporation of N-acetyl-galactosamine amino acids in eubacteria | |
JP5932117B2 (ja) | 脊椎動物細胞内におけるサプレッサーtrnaの転写 | |
ES2396712T3 (es) | Incorporación específica para sitio de aminoácidos activos por rédox en proteínas | |
PT1794323E (pt) | Incorporação in vivo de aminoácidos alquinilo em proteínas em eubactérias | |
JP5399906B2 (ja) | 脊椎動物細胞用のハイブリッドサプレッサーtrna | |
BRPI0718389A2 (pt) | incorporação genética de aminoácidos antinaturais em proteìnas em células de mamìferos | |
PT2052083E (pt) | Expressão geneticamente programada de proteínas seletivamente sulfatadas em eubactérias | |
Schultz et al. | Glycoprotein synthesis |