FI106720B - Fuusioproteiinien valmistus in vitro - Google Patents
Fuusioproteiinien valmistus in vitro Download PDFInfo
- Publication number
- FI106720B FI106720B FI913405A FI913405A FI106720B FI 106720 B FI106720 B FI 106720B FI 913405 A FI913405 A FI 913405A FI 913405 A FI913405 A FI 913405A FI 106720 B FI106720 B FI 106720B
- Authority
- FI
- Finland
- Prior art keywords
- protein
- amino acid
- lys
- ser
- asp
- Prior art date
Links
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 57
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 56
- 238000000338 in vitro Methods 0.000 title description 10
- 238000002360 preparation method Methods 0.000 title description 7
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 146
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 111
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 80
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 74
- 229920001184 polypeptide Polymers 0.000 claims abstract description 72
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims abstract description 61
- 101100053619 Yersinia enterocolitica yscF gene Proteins 0.000 claims abstract description 52
- 238000000034 method Methods 0.000 claims abstract description 47
- 101710118538 Protease Proteins 0.000 claims abstract description 16
- 125000001433 C-terminal amino-acid group Chemical group 0.000 claims abstract description 14
- 238000004519 manufacturing process Methods 0.000 claims abstract description 11
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 claims abstract description 6
- 150000001413 amino acids Chemical class 0.000 claims description 79
- 210000004899 c-terminal region Anatomy 0.000 claims description 26
- 239000000203 mixture Substances 0.000 claims description 22
- 239000012528 membrane Substances 0.000 claims description 21
- 230000027455 binding Effects 0.000 claims description 18
- 125000000539 amino acid group Chemical group 0.000 claims description 15
- 108010006303 Carboxypeptidases Proteins 0.000 claims description 11
- 102000005367 Carboxypeptidases Human genes 0.000 claims description 11
- 108010050904 Interferons Proteins 0.000 claims description 8
- 102000014150 Interferons Human genes 0.000 claims description 8
- 230000029087 digestion Effects 0.000 claims description 8
- 229940079322 interferon Drugs 0.000 claims description 7
- 230000007062 hydrolysis Effects 0.000 claims description 6
- 238000006460 hydrolysis reaction Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 230000002209 hydrophobic effect Effects 0.000 claims description 5
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 claims description 4
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 claims description 4
- 108010073652 desirudin Proteins 0.000 claims description 4
- XYWBJDRHGNULKG-OUMQNGNKSA-N desirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N2)=O)CSSC1)C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)CSSC1)C(C)C)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 XYWBJDRHGNULKG-OUMQNGNKSA-N 0.000 claims description 4
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 claims description 3
- 108010047761 Interferon-alpha Proteins 0.000 claims description 3
- 102000006992 Interferon-alpha Human genes 0.000 claims description 3
- 108010051456 Plasminogen Proteins 0.000 claims description 3
- 102000013566 Plasminogen Human genes 0.000 claims description 2
- 239000012190 activator Substances 0.000 claims 2
- 102000013275 Somatomedins Human genes 0.000 claims 1
- 102000004887 Transforming Growth Factor beta Human genes 0.000 claims 1
- 108090001012 Transforming Growth Factor beta Proteins 0.000 claims 1
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 claims 1
- 101150039954 yscA gene Proteins 0.000 claims 1
- 108010067541 carboxypeptidase ysc-alpha Proteins 0.000 abstract 1
- 235000018102 proteins Nutrition 0.000 description 92
- 210000004027 cell Anatomy 0.000 description 66
- 229940024606 amino acid Drugs 0.000 description 63
- 235000001014 amino acid Nutrition 0.000 description 62
- 239000013612 plasmid Substances 0.000 description 60
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 55
- 239000012634 fragment Substances 0.000 description 54
- 101150107787 kex1 gene Proteins 0.000 description 52
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 50
- 239000013598 vector Substances 0.000 description 37
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 35
- 108020004414 DNA Proteins 0.000 description 33
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 30
- 241000588724 Escherichia coli Species 0.000 description 30
- 230000000694 effects Effects 0.000 description 30
- 239000002609 medium Substances 0.000 description 24
- 101150045458 KEX2 gene Proteins 0.000 description 20
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 20
- 102000035195 Peptidases Human genes 0.000 description 20
- 108091005804 Peptidases Proteins 0.000 description 20
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 19
- 108091028043 Nucleic acid sequence Proteins 0.000 description 17
- 239000013604 expression vector Substances 0.000 description 16
- 239000004365 Protease Substances 0.000 description 15
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 14
- 239000000872 buffer Substances 0.000 description 14
- 238000003776 cleavage reaction Methods 0.000 description 14
- 230000012010 growth Effects 0.000 description 14
- 230000007017 scission Effects 0.000 description 14
- 239000006228 supernatant Substances 0.000 description 14
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 13
- 108010031145 eglin proteinase inhibitors Proteins 0.000 description 12
- 239000002243 precursor Substances 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 235000019419 proteases Nutrition 0.000 description 12
- 108010076504 Protein Sorting Signals Proteins 0.000 description 11
- 239000001913 cellulose Substances 0.000 description 11
- 229920002678 cellulose Polymers 0.000 description 11
- 230000004927 fusion Effects 0.000 description 11
- 101000599951 Homo sapiens Insulin-like growth factor I Proteins 0.000 description 10
- 102100037852 Insulin-like growth factor I Human genes 0.000 description 10
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 10
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 10
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 9
- 210000004962 mammalian cell Anatomy 0.000 description 9
- 239000003550 marker Substances 0.000 description 9
- 238000000746 purification Methods 0.000 description 9
- 239000011780 sodium chloride Substances 0.000 description 9
- 210000005253 yeast cell Anatomy 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 8
- -1 Lys and Arg Chemical class 0.000 description 8
- 229960000723 ampicillin Drugs 0.000 description 8
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 229940088598 enzyme Drugs 0.000 description 8
- 244000005700 microbiome Species 0.000 description 8
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 8
- 239000000758 substrate Substances 0.000 description 8
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 7
- 101000741445 Homo sapiens Calcitonin Proteins 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 7
- 230000003115 biocidal effect Effects 0.000 description 7
- 238000005119 centrifugation Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 229940045644 human calcitonin Drugs 0.000 description 7
- 229910052757 nitrogen Inorganic materials 0.000 description 7
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 6
- 239000007995 HEPES buffer Substances 0.000 description 6
- 108700026244 Open Reading Frames Proteins 0.000 description 6
- 238000001042 affinity chromatography Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 230000010076 replication Effects 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 241001131785 Escherichia coli HB101 Species 0.000 description 5
- 108060003951 Immunoglobulin Proteins 0.000 description 5
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 5
- 239000013504 Triton X-100 Substances 0.000 description 5
- 229920004890 Triton X-100 Polymers 0.000 description 5
- 101150050575 URA3 gene Proteins 0.000 description 5
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 108010038633 aspartylglutamate Proteins 0.000 description 5
- 235000010633 broth Nutrition 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 102000018358 immunoglobulin Human genes 0.000 description 5
- 150000002500 ions Chemical class 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 235000019833 protease Nutrition 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 229940035893 uracil Drugs 0.000 description 5
- 102000013563 Acid Phosphatase Human genes 0.000 description 4
- 108010051457 Acid Phosphatase Proteins 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 4
- 108010007267 Hirudins Proteins 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 4
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 4
- 230000002378 acidificating effect Effects 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 4
- 239000000427 antigen Substances 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 210000002421 cell wall Anatomy 0.000 description 4
- 101150056937 cex gene Proteins 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 239000000287 crude extract Substances 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000000855 fermentation Methods 0.000 description 4
- 230000004151 fermentation Effects 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 239000003102 growth factor Substances 0.000 description 4
- 239000003112 inhibitor Substances 0.000 description 4
- 108010054155 lysyllysine Proteins 0.000 description 4
- 239000003016 pheromone Substances 0.000 description 4
- 239000012085 test solution Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- 238000001262 western blot Methods 0.000 description 4
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 3
- OZRFYUJEXYKQDV-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-carboxypropanoyl)amino]-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]butanedioic acid Chemical compound OC(=O)CC(N)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(O)=O OZRFYUJEXYKQDV-UHFFFAOYSA-N 0.000 description 3
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 3
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 241000186321 Cellulomonas Species 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 102000007625 Hirudins Human genes 0.000 description 3
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 3
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 3
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 3
- 108010009583 Transforming Growth Factors Proteins 0.000 description 3
- 102000009618 Transforming Growth Factors Human genes 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000013613 expression plasmid Substances 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 229940006607 hirudin Drugs 0.000 description 3
- WQPDUTSPKFMPDP-OUMQNGNKSA-N hirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(OS(O)(=O)=O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N2)=O)CSSC1)C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)CSSC1)C(C)C)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 WQPDUTSPKFMPDP-OUMQNGNKSA-N 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 238000004255 ion exchange chromatography Methods 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000004007 reversed phase HPLC Methods 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 239000012064 sodium phosphate buffer Substances 0.000 description 3
- 229960000187 tissue plasminogen activator Drugs 0.000 description 3
- 101150091222 yscS gene Proteins 0.000 description 3
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 2
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 2
- 108020005065 3' Flanking Region Proteins 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 2
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 2
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 2
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 2
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 2
- 108010027805 Azocoll Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 2
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- 101710093152 Carboxypeptidase Y Proteins 0.000 description 2
- 108090000746 Chymosin Proteins 0.000 description 2
- 241000699802 Cricetulus griseus Species 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 2
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 2
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 2
- 108090000204 Dipeptidase 1 Proteins 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 2
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 2
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 2
- 108090001117 Insulin-Like Growth Factor II Proteins 0.000 description 2
- 102000048143 Insulin-Like Growth Factor II Human genes 0.000 description 2
- 102000000589 Interleukin-1 Human genes 0.000 description 2
- 108010002352 Interleukin-1 Proteins 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 2
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- 101100395023 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) his-7 gene Proteins 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- 102000001938 Plasminogen Activators Human genes 0.000 description 2
- 108010001014 Plasminogen Activators Proteins 0.000 description 2
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 2
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 2
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 2
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- GZCGUPFRVQAUEE-SLPGGIOYSA-N aldehydo-D-glucose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O GZCGUPFRVQAUEE-SLPGGIOYSA-N 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 235000013405 beer Nutrition 0.000 description 2
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 102000005936 beta-Galactosidase Human genes 0.000 description 2
- 102000006635 beta-lactamase Human genes 0.000 description 2
- 239000003114 blood coagulation factor Substances 0.000 description 2
- 229940019700 blood coagulation factors Drugs 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 239000001110 calcium chloride Substances 0.000 description 2
- 229910001628 calcium chloride Inorganic materials 0.000 description 2
- 235000011148 calcium chloride Nutrition 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 108020001096 dihydrofolate reductase Proteins 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004907 flux Effects 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 2
- 239000007952 growth promoter Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 229940072221 immunoglobulins Drugs 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 239000001573 invertase Substances 0.000 description 2
- 235000011073 invertase Nutrition 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 229910001629 magnesium chloride Inorganic materials 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 229940127126 plasminogen activator Drugs 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 230000001681 protective effect Effects 0.000 description 2
- 239000012460 protein solution Substances 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 108010027345 wheylin-1 peptide Proteins 0.000 description 2
- BRZYSWJRSDMWLG-DJWUNRQOSA-N (2r,3r,4r,5r)-2-[(1s,2s,3r,4s,6r)-4,6-diamino-3-[(2s,3r,4r,5s,6r)-3-amino-4,5-dihydroxy-6-[(1r)-1-hydroxyethyl]oxan-2-yl]oxy-2-hydroxycyclohexyl]oxy-5-methyl-4-(methylamino)oxane-3,5-diol Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H]([C@@H](C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-DJWUNRQOSA-N 0.000 description 1
- NTUPOKHATNSWCY-PMPSAXMXSA-N (2s)-2-[[(2s)-1-[(2r)-2-amino-3-phenylpropanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C([C@@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=CC=C1 NTUPOKHATNSWCY-PMPSAXMXSA-N 0.000 description 1
- VHJLVAABSRFDPM-UHFFFAOYSA-N 1,4-dithiothreitol Chemical compound SCC(O)C(O)CS VHJLVAABSRFDPM-UHFFFAOYSA-N 0.000 description 1
- JDIIGWSSTNUWGK-UHFFFAOYSA-N 1h-imidazol-3-ium;chloride Chemical compound [Cl-].[NH2+]1C=CN=C1 JDIIGWSSTNUWGK-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- NKDFYOWSKOHCCO-YPVLXUMRSA-N 20-hydroxyecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@](C)(O)[C@H](O)CCC(C)(O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 NKDFYOWSKOHCCO-YPVLXUMRSA-N 0.000 description 1
- JRBJSXQPQWSCCF-UHFFFAOYSA-N 3,3'-Dimethoxybenzidine Chemical compound C1=C(N)C(OC)=CC(C=2C=C(OC)C(N)=CC=2)=C1 JRBJSXQPQWSCCF-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 101100295756 Acinetobacter baumannii (strain ATCC 19606 / DSM 30007 / JCM 6841 / CCUG 19606 / CIP 70.34 / NBRC 109757 / NCIMB 12457 / NCTC 12156 / 81) omp38 gene Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- WQVYAWIMAWTGMW-ZLUOBGJFSA-N Ala-Asp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WQVYAWIMAWTGMW-ZLUOBGJFSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UFBFGSQYSA-N Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UFBFGSQYSA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 102100021253 Antileukoproteinase Human genes 0.000 description 1
- 101710081722 Antitrypsin Proteins 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- YUGFLWBWAJFGKY-BQBZGAKWSA-N Arg-Cys-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O YUGFLWBWAJFGKY-BQBZGAKWSA-N 0.000 description 1
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 1
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 1
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 1
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 1
- 240000003291 Armoracia rusticana Species 0.000 description 1
- 235000011330 Armoracia rusticana Nutrition 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- CQMQJWRCRQSBAF-BPUTZDHNSA-N Asn-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N CQMQJWRCRQSBAF-BPUTZDHNSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- FFMIYIMKQIMDPK-BQBZGAKWSA-N Asn-His Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 FFMIYIMKQIMDPK-BQBZGAKWSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 1
- BSBNNPICFPXDNH-SRVKXCTJSA-N Asn-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BSBNNPICFPXDNH-SRVKXCTJSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 1
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- ZCKYZTGLXIEOKS-CIUDSAMLSA-N Asp-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N ZCKYZTGLXIEOKS-CIUDSAMLSA-N 0.000 description 1
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- NRIFEOUAFLTMFJ-AAEUAGOBSA-N Asp-Gly-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NRIFEOUAFLTMFJ-AAEUAGOBSA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- ODNWIBOCFGMRTP-SRVKXCTJSA-N Asp-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CN=CN1 ODNWIBOCFGMRTP-SRVKXCTJSA-N 0.000 description 1
- OOXKFYNWRVGYFM-XIRDDKMYSA-N Asp-His-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC3=CN=CN3)NC(=O)[C@H](CC(=O)O)N OOXKFYNWRVGYFM-XIRDDKMYSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- OEDJQRXNDRUGEU-SRVKXCTJSA-N Asp-Leu-His Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O OEDJQRXNDRUGEU-SRVKXCTJSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- KRQFMDNIUOVRIF-KKUMJFAQSA-N Asp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N KRQFMDNIUOVRIF-KKUMJFAQSA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 1
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- GXIUDSXIUSTSLO-QXEWZRGKSA-N Asp-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N GXIUDSXIUSTSLO-QXEWZRGKSA-N 0.000 description 1
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 1
- 241000020089 Atacta Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 102100023995 Beta-nerve growth factor Human genes 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- VLKSJYFGXZQSDX-UHFFFAOYSA-N BrC1=CC=C2NC(OP(O)(=O)O)=CC2=C1Cl Chemical compound BrC1=CC=C2NC(OP(O)(=O)O)=CC2=C1Cl VLKSJYFGXZQSDX-UHFFFAOYSA-N 0.000 description 1
- 101100148606 Caenorhabditis elegans pst-1 gene Proteins 0.000 description 1
- 102000055006 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 102100035024 Carboxypeptidase B Human genes 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 102000005572 Cathepsin A Human genes 0.000 description 1
- 108010059081 Cathepsin A Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 101800000414 Corticotropin Proteins 0.000 description 1
- KIQKJXYVGSYDFS-ZLUOBGJFSA-N Cys-Asn-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KIQKJXYVGSYDFS-ZLUOBGJFSA-N 0.000 description 1
- UUERSUCTHOZPMG-SRVKXCTJSA-N Cys-Asn-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UUERSUCTHOZPMG-SRVKXCTJSA-N 0.000 description 1
- SRUKWJMBAALPQV-IHPCNDPISA-N Cys-Phe-Trp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SRUKWJMBAALPQV-IHPCNDPISA-N 0.000 description 1
- CMYVIUWVYHOLRD-ZLUOBGJFSA-N Cys-Ser-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CMYVIUWVYHOLRD-ZLUOBGJFSA-N 0.000 description 1
- WYVKPHCYMTWUCW-YUPRTTJUSA-N Cys-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)N)O WYVKPHCYMTWUCW-YUPRTTJUSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 229920002491 Diethylaminoethyl-dextran Polymers 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 101150094690 GAL1 gene Proteins 0.000 description 1
- 102100028501 Galanin peptides Human genes 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- HKTRDWYCAUTRRL-YUMQZZPRSA-N Glu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 HKTRDWYCAUTRRL-YUMQZZPRSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- SXGAGTVDWKQYCX-BQBZGAKWSA-N Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SXGAGTVDWKQYCX-BQBZGAKWSA-N 0.000 description 1
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- 108010056771 Glucosidases Proteins 0.000 description 1
- 102000004366 Glucosidases Human genes 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- JPWIMMUNWUKOAD-STQMWFEESA-N Gly-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN JPWIMMUNWUKOAD-STQMWFEESA-N 0.000 description 1
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- IMRNSEPSPFQNHF-STQMWFEESA-N Gly-Ser-Trp Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O IMRNSEPSPFQNHF-STQMWFEESA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- WTUSRDZLLWGYAT-KCTSRDHCSA-N Gly-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN WTUSRDZLLWGYAT-KCTSRDHCSA-N 0.000 description 1
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 206010019799 Hepatitis viral Diseases 0.000 description 1
- 241000709721 Hepatovirus A Species 0.000 description 1
- UOAVQQRILDGZEN-SRVKXCTJSA-N His-Asp-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UOAVQQRILDGZEN-SRVKXCTJSA-N 0.000 description 1
- JFFAPRNXXLRINI-NHCYSSNCSA-N His-Asp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JFFAPRNXXLRINI-NHCYSSNCSA-N 0.000 description 1
- TVRMJKNELJKNRS-GUBZILKMSA-N His-Glu-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N TVRMJKNELJKNRS-GUBZILKMSA-N 0.000 description 1
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 1
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 1
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 1
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 1
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- MDOBWSFNSNPENN-PMVVWTBXSA-N His-Thr-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O MDOBWSFNSNPENN-PMVVWTBXSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000615334 Homo sapiens Antileukoproteinase Proteins 0.000 description 1
- 101000946524 Homo sapiens Carboxypeptidase B Proteins 0.000 description 1
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 1
- 101001009007 Homo sapiens Hemoglobin subunit alpha Proteins 0.000 description 1
- 101000878605 Homo sapiens Low affinity immunoglobulin epsilon Fc receptor Proteins 0.000 description 1
- 101000801481 Homo sapiens Tissue-type plasminogen activator Proteins 0.000 description 1
- 241000701109 Human adenovirus 2 Species 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102100040018 Interferon alpha-2 Human genes 0.000 description 1
- 108010078049 Interferon alpha-2 Proteins 0.000 description 1
- 102100036532 Interferon alpha-8 Human genes 0.000 description 1
- 102000003996 Interferon-beta Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- 102100039064 Interleukin-3 Human genes 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 101710096444 Killer toxin Proteins 0.000 description 1
- 108010008292 L-Amino Acid Oxidase Proteins 0.000 description 1
- 102000007070 L-amino-acid oxidase Human genes 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 1
- RIMMMMYKGIBOSN-DCAQKATOSA-N Leu-Asn-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O RIMMMMYKGIBOSN-DCAQKATOSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- HOMFINRJHIIZNJ-HOCLYGCPSA-N Leu-Trp-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O HOMFINRJHIIZNJ-HOCLYGCPSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- 108091036060 Linker DNA Proteins 0.000 description 1
- 102100038007 Low affinity immunoglobulin epsilon Fc receptor Human genes 0.000 description 1
- 102000009151 Luteinizing Hormone Human genes 0.000 description 1
- 108010073521 Luteinizing Hormone Proteins 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- CRNNMTHBMRFQNG-GUBZILKMSA-N Lys-Glu-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N CRNNMTHBMRFQNG-GUBZILKMSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- CFOLERIRBUAYAD-HOCLYGCPSA-N Lys-Trp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O CFOLERIRBUAYAD-HOCLYGCPSA-N 0.000 description 1
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 241000710118 Maize chlorotic mottle virus Species 0.000 description 1
- 108050005735 Maltoporin Proteins 0.000 description 1
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 1
- 229910021380 Manganese Chloride Inorganic materials 0.000 description 1
- GLFNIEUTAYBVOC-UHFFFAOYSA-L Manganese chloride Chemical compound Cl[Mn]Cl GLFNIEUTAYBVOC-UHFFFAOYSA-L 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 239000000637 Melanocyte-Stimulating Hormone Substances 0.000 description 1
- 108010007013 Melanocyte-Stimulating Hormones Proteins 0.000 description 1
- QWTGQXGNNMIUCW-BPUTZDHNSA-N Met-Asn-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QWTGQXGNNMIUCW-BPUTZDHNSA-N 0.000 description 1
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 1
- IMTUWVJPCQPJEE-IUCAKERBSA-N Met-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN IMTUWVJPCQPJEE-IUCAKERBSA-N 0.000 description 1
- GRKPXCKLOOUDFG-UFYCRDLUSA-N Met-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 GRKPXCKLOOUDFG-UFYCRDLUSA-N 0.000 description 1
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000701029 Murid betaherpesvirus 1 Species 0.000 description 1
- 101100059658 Mus musculus Cetn4 gene Proteins 0.000 description 1
- 101100021974 Mus musculus Ltk gene Proteins 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 108010025020 Nerve Growth Factor Proteins 0.000 description 1
- 101100293593 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) nar-1 gene Proteins 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102000003982 Parathyroid hormone Human genes 0.000 description 1
- 108090000445 Parathyroid hormone Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 1
- UEHNWRNADDPYNK-DLOVCJGASA-N Phe-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N UEHNWRNADDPYNK-DLOVCJGASA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- BVHFFNYBKRTSIU-MEYUZBJRSA-N Phe-His-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BVHFFNYBKRTSIU-MEYUZBJRSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- OAOLATANIHTNCZ-IHRRRGAJSA-N Phe-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N OAOLATANIHTNCZ-IHRRRGAJSA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 102000004211 Platelet factor 4 Human genes 0.000 description 1
- 108090000778 Platelet factor 4 Proteins 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- RETPETNFPLNLRV-JYJNAYRXSA-N Pro-Asn-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O RETPETNFPLNLRV-JYJNAYRXSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- BEPSGCXDIVACBU-IUCAKERBSA-N Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BEPSGCXDIVACBU-IUCAKERBSA-N 0.000 description 1
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 1
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 1
- AJNGQVUFQUVRQT-JYJNAYRXSA-N Pro-Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 AJNGQVUFQUVRQT-JYJNAYRXSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- RSTWKJFWBKFOFC-JYJNAYRXSA-N Pro-Trp-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RSTWKJFWBKFOFC-JYJNAYRXSA-N 0.000 description 1
- 102100027467 Pro-opiomelanocortin Human genes 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 108010054530 RGDN peptide Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 102000003743 Relaxin Human genes 0.000 description 1
- 108090000103 Relaxin Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 108010086019 Secretin Proteins 0.000 description 1
- 102100037505 Secretin Human genes 0.000 description 1
- 239000012507 Sephadex™ Substances 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 1
- RNFKSBPHLTZHLU-WHFBIAKZSA-N Ser-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)O RNFKSBPHLTZHLU-WHFBIAKZSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 1
- HZNFKPJCGZXKIC-DCAQKATOSA-N Ser-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N HZNFKPJCGZXKIC-DCAQKATOSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- KIEIJCFVGZCUAS-MELADBBJSA-N Ser-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N)C(=O)O KIEIJCFVGZCUAS-MELADBBJSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108010056088 Somatostatin Proteins 0.000 description 1
- 102000005157 Somatostatin Human genes 0.000 description 1
- 108010039445 Stem Cell Factor Proteins 0.000 description 1
- 101000879712 Streptomyces lividans Protease inhibitor Proteins 0.000 description 1
- 102000019197 Superoxide Dismutase Human genes 0.000 description 1
- 108010012715 Superoxide dismutase Proteins 0.000 description 1
- 101150006914 TRP1 gene Proteins 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- JMQUAZXYFAEOIH-XGEHTFHBSA-N Thr-Arg-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)O JMQUAZXYFAEOIH-XGEHTFHBSA-N 0.000 description 1
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 1
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 1
- NRBUKAHTWRCUEQ-XGEHTFHBSA-N Thr-Cys-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(O)=O NRBUKAHTWRCUEQ-XGEHTFHBSA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- ZXIHABSKUITPTN-IXOXFDKPSA-N Thr-Lys-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O ZXIHABSKUITPTN-IXOXFDKPSA-N 0.000 description 1
- BDYBHQWMHYDRKJ-UNQGMJICSA-N Thr-Phe-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N)O BDYBHQWMHYDRKJ-UNQGMJICSA-N 0.000 description 1
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- UMFLBPIPAJMNIM-LYARXQMPSA-N Thr-Trp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N)O UMFLBPIPAJMNIM-LYARXQMPSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108010046075 Thymosin Proteins 0.000 description 1
- 102000007501 Thymosin Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- TZNNEYFZZAHLBL-BPUTZDHNSA-N Trp-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O TZNNEYFZZAHLBL-BPUTZDHNSA-N 0.000 description 1
- PXYJUECTGMGIDT-WDSOQIARSA-N Trp-Arg-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 PXYJUECTGMGIDT-WDSOQIARSA-N 0.000 description 1
- BXKWZPXTTSCOMX-AQZXSJQPSA-N Trp-Asn-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXKWZPXTTSCOMX-AQZXSJQPSA-N 0.000 description 1
- OENGVSDBQHHGBU-QEJZJMRPSA-N Trp-Glu-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OENGVSDBQHHGBU-QEJZJMRPSA-N 0.000 description 1
- DZIKVMCFXIIETR-JSGCOSHPSA-N Trp-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O DZIKVMCFXIIETR-JSGCOSHPSA-N 0.000 description 1
- KBUBZAMBIVEFEI-ZFWWWQNUSA-N Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CNC=N1 KBUBZAMBIVEFEI-ZFWWWQNUSA-N 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 1
- GRSCONMARGNYHA-PMVMPFDFSA-N Trp-Lys-Phe Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GRSCONMARGNYHA-PMVMPFDFSA-N 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- SGQSAIFDESQBRA-IHPCNDPISA-N Trp-Tyr-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SGQSAIFDESQBRA-IHPCNDPISA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- XMNDQSYABVWZRK-BZSNNMDCSA-N Tyr-Asn-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XMNDQSYABVWZRK-BZSNNMDCSA-N 0.000 description 1
- QZOSVNLXLSNHQK-UWVGGRQHSA-N Tyr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UWVGGRQHSA-N 0.000 description 1
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- MVYRJYISVJWKSX-KBPBESRZSA-N Tyr-His-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)NCC(=O)O)N)O MVYRJYISVJWKSX-KBPBESRZSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- SCZJKZLFSSPJDP-ACRUOGEOSA-N Tyr-Phe-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SCZJKZLFSSPJDP-ACRUOGEOSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- VNYDHJARLHNEGA-RYUDHWBXSA-N Tyr-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 1
- ZSXJENBJGRHKIG-UWVGGRQHSA-N Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UWVGGRQHSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- KWKJGBHDYJOVCR-SRVKXCTJSA-N Tyr-Ser-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O KWKJGBHDYJOVCR-SRVKXCTJSA-N 0.000 description 1
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 1
- NVJCMGGZHOJNBU-UFYCRDLUSA-N Tyr-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N NVJCMGGZHOJNBU-UFYCRDLUSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 1
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 101150073130 ampR gene Proteins 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000001475 anti-trypsic effect Effects 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 229940019748 antifibrinolytic proteinase inhibitors Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 101150042295 arfA gene Proteins 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010036999 aspartyl-alanyl-histidyl-lysine Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000008366 buffered solution Substances 0.000 description 1
- 235000014121 butter Nutrition 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 159000000007 calcium salts Chemical class 0.000 description 1
- OSGAYBCDTDRGGQ-UHFFFAOYSA-L calcium sulfate Chemical class [Ca+2].[O-]S([O-])(=O)=O OSGAYBCDTDRGGQ-UHFFFAOYSA-L 0.000 description 1
- 235000011132 calcium sulphate Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 150000001805 chlorine compounds Chemical class 0.000 description 1
- 239000003593 chromogenic compound Substances 0.000 description 1
- 229940080701 chymosin Drugs 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 1
- 229960000258 corticotropin Drugs 0.000 description 1
- IDLFZVILOHSSID-OVLDLUHVSA-N corticotropin Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)NC(=O)[C@@H](N)CO)C1=CC=C(O)C=C1 IDLFZVILOHSSID-OVLDLUHVSA-N 0.000 description 1
- 208000035250 cutaneous malignant susceptibility to 1 melanoma Diseases 0.000 description 1
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000007857 degradation product Substances 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 210000001840 diploid cell Anatomy 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000003527 fibrinolytic agent Substances 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001997 free-flow electrophoresis Methods 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 150000002303 glucose derivatives Chemical class 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 230000034659 glycolysis Effects 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 102000047823 human PLAT Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 108010008429 immunoglobulin-binding factors Proteins 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 108010047126 interferon-alpha 8 Proteins 0.000 description 1
- 229940047124 interferons Drugs 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 229940040129 luteinizing hormone Drugs 0.000 description 1
- 101150109301 lys2 gene Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 230000036244 malformation Effects 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 239000011572 manganese Substances 0.000 description 1
- 239000011565 manganese chloride Substances 0.000 description 1
- 235000002867 manganese chloride Nutrition 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000002073 methionyl group Chemical group 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 230000011278 mitosis Effects 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 229940053128 nerve growth factor Drugs 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 101150087557 omcB gene Proteins 0.000 description 1
- 101150115693 ompA gene Proteins 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 239000000199 parathyroid hormone Substances 0.000 description 1
- 229960001319 parathyroid hormone Drugs 0.000 description 1
- 238000004810 partition chromatography Methods 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 235000015277 pork Nutrition 0.000 description 1
- 239000005373 porous glass Substances 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000008057 potassium phosphate buffer Substances 0.000 description 1
- 235000011151 potassium sulphates Nutrition 0.000 description 1
- 238000011533 pre-incubation Methods 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 108010066381 preproinsulin Proteins 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 229960002101 secretin Drugs 0.000 description 1
- OWMZNFCDEHGFEP-NFBCVYDUSA-N secretin human Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(N)=O)[C@@H](C)O)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)C1=CC=CC=C1 OWMZNFCDEHGFEP-NFBCVYDUSA-N 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000003998 size exclusion chromatography high performance liquid chromatography Methods 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 235000011152 sodium sulphate Nutrition 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 229960000553 somatostatin Drugs 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000003774 sulfhydryl reagent Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- LCJVIYPJPCBWKS-NXPQJCNCSA-N thymosin Chemical compound SC[C@@H](N)C(=O)N[C@H](CO)C(=O)N[C@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@H](C(C)C)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](C(C)C)C(=O)N[C@H](CO)C(=O)N[C@H](CO)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H]([C@@H](C)CC)C(=O)N[C@H]([C@H](C)O)C(=O)N[C@H](C(C)C)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](C(C)C)C(=O)N[C@H](C(C)C)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@H](CCC(O)=O)C(O)=O LCJVIYPJPCBWKS-NXPQJCNCSA-N 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000008467 tissue growth Effects 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 1
- 108010029384 tryptophyl-histidine Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 102000003390 tumor necrosis factor Human genes 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 1
- 229960005356 urokinase Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 201000001862 viral hepatitis Diseases 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 108010078692 yeast proteinase B Proteins 0.000 description 1
- 239000007222 ypd medium Substances 0.000 description 1
- 101150018336 yscY gene Proteins 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/06—Preparation of peptides or proteins produced by the hydrolysis of a peptide bond, e.g. hydrolysate products
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/585—Calcitonins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/65—Insulin-like growth factors, i.e. somatomedins, e.g. IGF-1, IGF-2
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/81—Protease inhibitors
- C07K14/815—Protease inhibitors from leeches, e.g. hirudin, eglin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/58—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi
- C12N9/60—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi from yeast
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/74—Fusion polypeptide containing domain for protein-protein interaction containing a fusion for binding to a cell surface receptor
- C07K2319/75—Fusion polypeptide containing domain for protein-protein interaction containing a fusion for binding to a cell surface receptor containing a fusion for activation of a cell surface receptor, e.g. thrombopoeitin, NPY and other peptide hormones
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Microbiology (AREA)
- Toxicology (AREA)
- Mycology (AREA)
- Endocrinology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Plant Pathology (AREA)
- Diabetes (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
Description
106720
Fuusioproteiinien valmistus in vitro In vitro preparering av fusionsproteiner 5 Tämä keksintö koskee menetelmää valmiiden proteiinien tuottamiseksi fuusioproteiinien in vitro -prosessoinnin avulla, ja keinoja, joita tarvitaan sellaisten fuusioproteiinien valmistamiseksi.
10
Farmaseuttisesti käyttökelpoisten tai entsymaattisesti aktiivisten proteiinien tuotanto on avainaluetta nopeasti kehittyvässä biotekniikan teollisuudessa. Yhdistelmä-DNA-tekniikan aikakauden alusta saakka suuri joukko arvokkaita 15 heterologisia proteiineja on ilmennetty prokaryoottisissa ja eukaryoottisissa isäntäsoluissa, jotka oli transformoitu sopivilla ekspressiovektoreilla, jotka sisälsivät mainittuja proteiineja koodittavia DNA-sekvenssejä. Monissa tapauksissa kohdataan kuitenkin suuria vaikeuksia tuotettaessa 20 riittäviä määriä puhtaita tuotteita. Usein havaitaan, erityisesti pienimolekyylipainoisten proteiinien ollessa kysymyksessä, että tuote on epäpuhdas, johtuen hajonneiden, erityisesti C-terminaalisesti hajonneiden sivutuotteiden läsnäolosta vaihtelevina määrinä, mikä alentaa saantoa ja 25 tekee puhdistamisesta vaikean tehtävän. Toisissa tapauksissa halutun proteiinin kokonaissaanto on epätyydyttävä, ja ** sitä ei voida merkittävästi nostaa prosessia modifioimalla (esim. tiettyjen vektoreiden ja isäntäkantojen valinnalla, viljelyolosuhteilla). Proteiinien puhdistaminen ei sitä 30 paitsi ole merkityksetön tehtävä. Eristämisen perusseos sisältää usein äärimmäisen pieniä määriä haluttua proteiinia, samalla kun isäntäspesifiset proteiinit ovat vallitsevia. Näiden isäntäspesifisten proteiinien erottaminen, säilyttäen samalla halutun proteiinin biologinen aktiivi-35 suus ja rakenteellinen yhtenäisyys voi aiheuttaa vakavia ongelmia.
Yksi tunnettu lähestymistapa mainittujen vaikeuksien voit- 2 106720 tamlseksi on halutun proteiinin ilmentäminen fuusioprote-iinina, so. halutun proteiinin C-päähän tai erityisesti N-päähän sidotaan stabiloiva ja/tai suo j aava polypeptidi. - Tämä polypeptidi valitaan riippuen ratkaistavista ongelmis-5 ta (hajoaminen, puhdistaminen jne.) ja fuusioproteiinin ilmentämiseen käytettävästä isännästä. Sellaiset fuusiopro-teiinit ovat osoittautuneet tehokkaiksi haluttujen proteiinien hajoamisen estämisessä ja puhdistustoimenpiteiden helpottamisessa. Lukuisia polypeptidejä on kuvailtu, joita 10 on käytetty fuusiopareina fuusioproteiineissa, katso esimerkiksi H.M. Sassenfeld, Trends in Biotechnology 8, 88-93 (1990). Tyypillisiä polypeptidejä ovat β-galaktosidaasi, proteiini A ja kloramfenikoliasetyylitransferääsi. Koska useimmissa tapauksissa ja luonnollisista syistä johtuen 15 (antigeenisyys jne.) fuusioproteiineista ei ole käytännön hyötyä sellaisenaan, fuusiopari on poistettava halutusta proteiinista ilmentämisen ja puhdistamisen jälkeen (vaihtoehtoisesti, fuusioproteiinina voi olla toinen heterologi-nen proteiini ja erottaminen johtaa kahteen haluttuun pro-20 teiiniin). Tämä voidaan tehdä yleensä linkkerisekvenssin avulla, joka kytkee halutun proteiinin fuusiopariin ja sisältää katkaisukohdan, joka voidaan katkaista selektiivisesti kemiallisin tai entsymaattisin keinoin. Sellaisia katkaisukohtia ovat esimerkiksi metionyyliryhmä, joka on 25 altis syanogeenibromidin katkaisuvaikutukselle, tai poly-peptidiketju, joka sisältää tetrapeptidyyliryhmän Asp-Asp-Asp-Lys, jonka enterokinaasi katkaisee Lys:n jälkeen. On selvää, että sellaiset aminohappoalasekvenssit eivät saa olla haluttujen proteiinien pinnalla. Koska fuusioparin 30 tarkoituksenmukainen poistaminen on yhä merkittävin ratkaistava ongelma, tarvitaan vaihtoehtoisia menetelmiä, joiden avulla on mahdollista irrottaa spesifisesti ja hellävaraisesti haluttu proteiini fuusioparista. Tämän keksinnön kohteena on saada aikaan sellainen menetelmä.
35
Proteaasi yscF:n (eli KEX2:n koodittaman endoproteaasin) ja peptidaasi ysca:n (eli KEXl:n koodittaman karboksipepti- 3 106720 daasin) on todettu vastaavan α-pariutumistekijän esiasteen prosessoinnista hiivassa, jolloin saadaan valmis a-tekijä feromoni. Proteaasi yscF on membraaniin sitoutunut endopro-teaasi, joka on aktiivinen neutraalilla pH-alueella ja on 5 täysin riippuvainen Ca2*-ioneista. Se sisältää karboksipään lähellä hydrofobisen alueen, jonka on todettu vastaavan sitoutumisesta membraaniin. Tämän membraaniin sitoutuvan domeenin poistaminen tuottaa liukoisen yscF-johdannaisen, jossa yhä on jäljellä entsyymiaktiivisuutta ja -spesifΙ-ΙΟ syyttä, nimittäin katkaisu emäksisen aminohappoparin, kuten Lys-Arg:n tai Arg-Arg:n, C-terminaaliselta puolelta [vrt.
R.S. Fuller et ai., Proc. Natl. Acad. Sei. USA 86, 1434-1438 (1989)]. Toisaalta, proteaasi ysca on membraaniin sitoutunut karboksieksopeptidaasi, joka on hyvin aktiivinen 15 C-terminaalisia emäksisiä aminohappoja kohtaan (Arg, Lys) pH-välillä 6 - 7,5. yscF:n tavoin, ysca sisältää hydrofobisen, membraaniin sitoutuneen alueen C-pään läheisyydessä. Tämän membraaniin sitoutuvan domeenin poistaminen tuottaa liukoisen ysca-johdannaisen, jossa entsyymiaktiivisuus ja -20 spesifisyys ovat säilyneet. [A. Cooper ja H. Bussey, Mol. Cell. Biol. 9., 2706-2714 (1989)]. Tämän jälkeen on havaittu, että proteaaseja yscF ja ysca voidaan käyttää edullisesti yhdistelmänä valmiiden proteiinien valmistamiseksi prosessoimalla in vitro sopivasti räätälöityj ä fuusioprote-- r - 25 iineja.
Tämä keksintö koskee siis menetelmää biologisesti aktiivisen proteiinin tuottamiseksi, joka menetelmä käsittää sen, että käsitellään fuusioproteiinia, joka sisältää 30 1. yhden tai useamman perättäisen proteiiniosan, joista jokainen sisältää mainitun biologisesti aktiivisen proteiinin, jonka C-terminaalinen aminohappo on kytketty linkkeri-polypeptidisekvenssi L:ään, jolloin mainitun linkkeri-35 polypeptidisekvenssi L:n N-terminaalin ensimmäinen ja toinen aminohappotähde ja, useainrran peräkkäisen proteiiniosan ollessa kysymyksessä, myös C-terminaalin viimeistä 4 106720 edellinen ja viimeinsen aminohappotähde on emäksinen aminohappo Lys tai Arg, ja 2. polypeptidileiman, liitettynä mainittujen perättäisten 5 proteiiniosien (mainitun proteiiniosan) C-terminaaliseen aminohappoon, tai, joka sisältää 10 1. polypeptidileiman kytkettynä 2. useamman perättäisen proteiiniosan N-terminaaliseen aminohappoon, joista proteiiniosista jokainen sisältää linkkeripolypeptidisekvenssi L:n, jolloin mainitun link-15 keripolypeptidisekvenssi L:n N-terminaalinen ensimmäinen ja toinen aminohappo, samoin kuin C-terminaalinen viimeistä edellinen ja viimeinen aminohappo ovat emäksisiä aminohappoja, joita ovat Lys ja Arg, ja jolloin mainitun linkkeripolypeptidisekvenssi L:n viimeinen emäksinen aminohappo 20 on kytkettynä mainittuun biologisesti aktiiviseen proteiiniin, liukoisella hiivan endoproteaasi yscF:llä ja liukoisella hiivan karboksipeptidaasi yscarlla, ja eristetään1 mainittu . . 25 biologisesti aktiivinen proteiini.
Fuusioproteiinia voidaan esittää kaavoilla (P-L)m-T (I) tai 30 T- (L-P )n (II), joissa kaavoissa P on biologisesti aktiivinen proteiini, L on linkkeripolypeptidisekvenssi kuten edellä määriteltiin, T on polypeptidileima, m on kokonaisluku 1 - 10 ja n on 35 kokonaisluku 2-10.
Biologisesti aktiivinen proteiini voi olla mikä tahansa 5 106720 biologisesti kiinnostava proteiini ja alkuperältään proka-. ryoottinen tai erityisesti eukaryoottinen, nimenomaan korkeampi eukaryoottinen kuten nisäkäsperäinen (mukaanlukien eläimet ja ihmiset), ja se on esimerkiksi entsyymi, jota 5 voidaan käyttää esimerkiksi ravintoaineiden tuottamiseen ja entsyymireaktioiden toteuttamiseen kemian tai molekyylibiologian alalla, tai proteiini, joka on käyttökelpoinen ja arvokas ihmisten ja eläinten sairauksien hoitamisessa tai niiden estämisessä, esimerkiksi hormoni, polypeptidi, jolla 10 on immunogisesti sopeuttavia, viruksia vastustavia ja tuumoria vastustavia ominaisuuksia, vasta-aine, virusan-tigeeni, veren hyytymistekijä, fibrinolyyttinen aine, kasvua säätelevä tekijä, lisäksi ravintoaineproteiini ja vastaava .
15
Esimerkkeinä sellaisista proteiineista ovat esim. hormonit kuten sekretiini, tymosiini, relaksiini, kalsitoniini, luteinisoiva hormoni, lisäkilpirauhashormoni, adrenokorti-kotropiini, melanosyyttiä stimuloiva hormoni, β-lipotropii-20 ni, urogastroni, insuliini, kasvutekijät kuten epidermikas-vutekijä (EGF), insuliinin kaltainen kasvutekijä (IGF), esim. IGF-I ja IGF-II, syöttösolun kasvutekijä, hermon kasvutekijä, hermotukikudosperäisen hermosolun kasvutekijä, verihiutaleperäinen kasvutekijä (PDGF), tai transformoiva 25 kasvutekijä (TGF) kuten ΤβΡβ, kasvuhormonit kuten ihmisen tai naudan kasvuhormonit, interleukiini kuten interleukii-ni-1 tai -2, ihmisen makrofagien vaeltamista estävä tekijä (MIF), interferonit kuten ihmisen α-interferoni, esimerkiksi interferoni-aA, -aB, -aD tai -aF, β-interferoni, x-30 interferoni tai hybridi-interferoni, esimerkiksi aA-aD- tai aB-aD-hybridi-interferoni, erityisesti hybridi-interferoni BDBB, proteinaasi-inhibiittorit kuten o^-antitrypsiini, SLPI ja vastaavat, hepatiittivirusantigeenit kuten hepatiitti B-viruksen pinta- tai ydinantigeeni tai hepatiitti A-viruksen 35 antigeeni tai ei-A, eiB-hepatiitin antigeeni, plasminogeenin aktivaattorit kuten kudosplasminogeenin aktivaattori tai urokinaasi, hybridiplasminogeeniakti- 6 106720 vaattorit kuten K2tuPA, punkin antikoagulanttipeptidi (TAP), tuumorin nekroositekijä, somatostatiini, renniini, immunoglobuliinit kuten immunoglobuliini D:n, E:n tai 6:n kevyt- ja/tai raskasketjut, tai ihminen-hiiri-hybridi-im-5 munoglobuliinit, immunoglobuliinia sitovat tekijät kuten immunoglobuliini E:tä sitova tekijä, ihmisen kaisitoniiniin liittyvä peptidi, veren hyytymistekijät kuten tekijä IX tai Ville, verihiutaletekijä 4, erytropetiini, egliini kuten egliini C, desulfatohirudiini kuten desulfatohirudiinivari-10 antti HV1, HV2 tai PA, kortikostatiini, ekistatiini, kysta-tiinit, ihmisen superoksididismutaasi, viruksen tymidiini-kinaasi, β-laktamaasi tai glukoosi-isomeraasi. Edullisia geenejä ovat ne, jotka koodattavat ihmisen a-interferonia esim. interferoni aB:tä, tai hybridi-interferonia, erityi-15 sesti hybridi-interferoni BDBB:tä (katso EP 205 404), ihmisen kudosplasminogeenin aktivaattoria (t-PA), ihmisen yksi-ketjuista urokinaasityyppistä plasminogeenin aktivaattoria (scu-PA), hybridiplasminogeeniaktivaattori K2tuPA:ta (katso EP 277 313), transformoivaa kasvutekijä p:aa, ihmisen 20 kalsitoniinia, insuliinin kaltaista kasvutekijä I:tä ja II: ta ja desulfatohirudiinia, esim. HV1-varianttia.
Proteiinit, jotka sisältävät emäksisen aminohappoparin kuten Arg-Arg:n, Lys-Arg:n, Lys-Lys:n ja Arg-Lys:n, joka on suojaamattomana proteiinin pinnalla ja sen vuoksi sopiva . - 25 proteolyyttiseen katkaisuun, eivät ole sopivia keksinnön mukaisen menetelmän kannalta, ja ne on mutatoitava siten, että toinen peräkkäisistä emäksisistä aminohapoista korvataan toisella ei-emäksisellä aminohapolla vaikuttamatta biologiseen aktiivisuuteen. Proteiineja, joissa on C-ter-30 minaalinen emäksinen aminohappo, joka on olennainen biologisen aktiivisuuden kannalta, ei voi tuottaa keksinnön mukaisella menetelmällä (koska liukoinen ysca poistaa tämän emäksisen aminohapon), ellei proteiinien C-päähän lisätä ylimääräistä ei-emäksistä suojaavaa aminohappoa.
35
Linkkeripolypeptidisekvenssi L sisältää 2 - noin 20, erityisesti 2-12 aminohappotähdettä, ja se sisältää yhden 7 106720 tai useamman, erityisesti 1-5, emäksistä aminohappoparia kuten Arg-Arg:n, Lys-Arg:n, Lys-Lys:n tai Arg-Lys:n, edellyttäen, että kaavan 1 (m > 1) ja 11 mukaisissa yhdisteissä N-terminaaliset ensimmäinen ja toinen aminohappo samoin 5 kuin C-terminaaliset viimeistä edellinen ja viimeinen aminohappo edustavat sellaista emäksistä aminohappoparia, kun taas kaavan I (m = 1) mukaisilla yhdisteillä riittää, että yksistään N-terminaaliset ensimmäinen ja toinen aminohappo edustavat sellaista emäksistä aminohappoparia. Aminohappo-10 tähteiden valinta, jotka yhdistävät yksittäiset emäksiset aminohappoparit ja/tai yhdistävät emäksisen aminohappotäh-deparin (parit) polypeptidileimaan (vrt. kaavan I mukaiset yhdisteet, joissa m = 1), ei ole ratkaiseva. Tuohon tarkoitukseen voidaan esimerkiksi valita mikä tahansa geneetti-15 sesti kooditettu neutraali aminohappo. Yksinkertaisin link-keripolypeptidisekvenssi L on dipeptidyyliryhmä valikoituna ryhmästä Arg-Arg, Lys-Arg, Lys-Lys ja Arg-Lys.
Koska pienen tai keskikokoisen biologisesti aktiivisen 20 proteiinin pidentämisellä on osoitettu olevan suotuisa vaikutus pysyvyyteen, polypeptidileima voi periaatteessa olla mikä tahansa kuviteltavissa oleva synteettinen poly-peptidi tai mikä tahansa luonnollisena esiintyvä polypepti-di tai sen osa. Polypeptidileima sisältää edullisesti noin 25 10 - noin 1000, erityisesti 30 - 300 aminohappotähdettä ja •· edustaa täyspitkää polypeptidiä, joka ilmentyy hyvin isännässä, jota käytetään fuusioproteiinin tai sen osan ilmentämiseen (katso jäljempänä). Jos pääasiallisena kohteena on helpottaa puhdistamista, on edullista käyttää polypeptidi-30 leimaa, joka on altis affiniteettikromatografialle (poly-peptidileiman tunnistaa esimerkiksi käytettävissä oleva monoklonaalinen tai polyklonaalinen vasta-aine, tai sen sitoo spesifinen aine kuten selluloosa), tai ioninvaihto-kromatografialle (polypeptidileima-aine sisältää suuren 35 määrän happamia tai emäksisiä aminohappotähteitä). Esimerkkeihin sellaisista polypeptidileima-aineista lukeutuvat esimerkiksi hiivan hapan fosfataasi PH05, hiivan invertaasi 8 106720 tai hiivan karboksipeptidaasi Y erityisesti silloin, kun hiivaa käytetään isäntänä, MS2-fagin polymeraasi, β-galak-tosidaasi tai E. colin hapan fosfataasi erityisesti silloin, kun E. colia käytetään isäntänä, neomysiini, fosfo-5 transferääsi, dehydrofolaattireduktaasi, immunoglobuliini tai lektiini erityisesti silloin, kun käytetään nisäkäs-isäntäsoluja, näiden lisäksi desulfatohirudiini, egliini C, kymosiini, interleukiini I, Cellulomonas f imin Exg-proteii-ni, ja vastaavat leima-aineet, näiden polypeptidien frag-10 menttien käytön ollessa myös mahdollista.
m on edullisesti kokonaisluku 1 - 5, ja n on kokonaisluku 2-5.
15 Liukoinen hiivan endoproteaasi yscF ja liukoinen hiivan karboksipeptidaasi ysca ovat yscF:n ja ysca:n muteiineja, joista hydrofobiset membraanin sitoutumiskohdat on poistettu. 814 tähdettä sisältävän proteaasi yscF:n aminohapposekvenssi tunnetaan julkaisusta K. Mizuno et ai. [Biochem. 20 Biophys. Res. Commun. 156. 246-254 (1988)]. Membraanin sitoutumiskohta sijaitsee alueella Tyr679 - Met699. Keksinnön mukaisissa liukoisissa yscF-endoproteaaseissa membraanin sitoutumiskohta on poistettu selektiivisesti, joten C-pää, joka alkaa esimerkiksi aminohapolla 700 (Lys) on yhä 25 jäljellä, tai koko C-pää, mukaanlukien membraanin sitoutu- « miskohta, so. 136 - suunnilleen 200 aminohappoa C-päästä, on poistettu. Sellaisia liukoisia yscF-deleetiomuteiineja kuvaillaan esimerkiksi EP 327 377:ssa tai julkaisussa R. S. Fuller et ai. (edellä). 729 tähdettä sisältävän peptidaasi 30 ysca:n aminohapposekvenssi tunnetaan myös [A. Dmochowska et ai., Cell 50, 573-584 (1987)]. Membraanin sitoutumiskohta sijaitsee alueella Ala619 - Tyr637. Kuten edellä, keksinnön mukaisissa liukoisissa ysca-karboksipeptidaaseissa membraanin sitoutumiskohta on poistettu selektiivisesti, 35 jättäen siten C-pää, joka alkaa esimerkiksi aminohapolla 638 (Asp) koskemattomaksi, tai koko C-pää, mukaanlukien membraanin sitoutumiskohta, so. 93 - suunnilleen 110 9 106720 aminohappoa C-päästä, on poistettu. Yhtä sellaista liukoista ysca-karboksipeptidaasimuteiinia ovat kuvailleet A. Cooper ja H. Bussey (edellä). Tämän keksinnön mukaisella edullisella liukoisella yscF-endoproteaasilla on sekvenssi, 5 jota on kuvattu sekvenssiluettelossa kohdassa SEKV. ID. N:o 1, kun taas edullisella liukoisella ysca-karboksipepti-daasilla on sekvenssi, jota on kuvattu sekvenssiluettelossa kohdassa SEKV. ID. N:o 2.
10 Fuusioproteiinien pilkonta liukoisella yscF:llä ja liukoisella ysca:lla suoritetaan käyttäen olosuhteita, joissa yscF:n ja ysca:n tiedetään toimivan parhaiten, so. puskuroidussa liuoksessa pH-arvossa noin 6,0 - noin 7,5, edullisesti noin 7,0, lämpötila-alueella noin 25°C - noin 37°C ja 15 noin 1-4 tunnin ajan, edullisesti siihen saakka, että hydrolyysi on täydellinen pääteltynä HPLC-tarkistuksen avulla. Koska yscF on voimakkaasti riippuvainen Ca2*-io-neista, kalsiumsuolaa kuten kalsiumkloridia lisätään hydro-lyysiseokseen. Molaariset fuusioproteiini:liukoinen yscF:-20 liukoinen ysca -suhteet vaihtelevat alueella 1:1:1 104:1:1. Ca2+-ionien molaarinen pitoisuus on alueella 0,1 mM - 10 mM. Seokseen voidaan valinnaisesti lisätä pienenä pitoisuutena (< 1 %) ei-ionista pesuainetta kuten Triton X-100:aa, koska yscF:n tiedetään aktivoituvan sillä tavalla.
... 25 Fuusioproteiinia voidaan käsitellä pilkkovalla seoksella, joka sisältää sekä liukoisen yscF:n että liukoisen ysca:n, tai fuusioproteiinia voidaan ensin käsitellä liukoisella yscF:llä ja, kun pilkkoutuminen on riittävästi edennyt tai mennyt loppuun, siinä yhteydessä liukoisella ysca:11a, 30 edullisesti in situ. so. eristämättä ensimmäisen hydrolyysivaiheen tuotetta.
Biologisesti aktiivinen proteiini voidaan eristää hydrolyysi seoksesta tavanomaisia menetelmiä käyttäen. Sopivia 35 puhdistusvaiheita ovat esimerkiksi suolanpoisto, kromatografiset menetelmät kuten ioninvaihtokromatografia, gee-lisuodatuskromatografia, jakaantumiskromatografia, HPLC, 10 106720 käänteisfaasinen HPLC, geelielektroforeesi, kantoaineeton elektroforeesi, affiniteettikromatografia kuten affiniteet-tikromatografia monoklonaalisten vasta-aineiden kanssa kytkettynä liukenemattomaan matriisiin, ja vastaavat vai-5 heet, tai jokin niiden yhdistelmä.
Siinä tapauksessa, että haluttu proteiini ei järjesty oikeaan kolmiulotteiseen rakenteeseen, johtuen esimerkiksi disulfidisidosten virheellisestä muodostumisesta (jos kys-10 teiinitähteitä on läsnä), voi olla välttämätöntä liuottaa se olosuhteissa, jotka ovat sopivat sen säilyttämiseksi denaturoidussa muodossa, ja myöhemmin laskostaa uudelleen disulfidisidosten samanaikaisen kytkennän kanssa (jos kys-teiinitähteitä on läsnä). Sopivia menetelmiä tunnetaan 15 suurelle proteiinijoukolle. Muutoin on tarpeellista soveltaa alalla tunnettuja menetelmiä esille tuleviin spesifisiin ongelmiin.
Kuten edellä on mainittu, joitakin liukoisia yscF- ja ysca-20 deleetiomuteiineja tunnetaan kirjallisuudesta. Muita kek sinnön mukaisia deleetiomuteiineja voidaan valmistaa käyttämällä alalla tunnettuja menetelmiä, esimerkiksi valmistamalla vastaavaa DNA:ta, joka koodittaa mainittua muteiinia, liittämällä se sopivaan vektori-DNA:hän ilmenemistä sääte-25 levän sekvenssin ohjauksessa, transformoimalla sopivia mikro-organismeja muodostetulla ekspressiovektorilla, viljelemällä transformoitua isäntämikro-organismia sopivassa kasvualustassa ja eristämällä aikaansaatu muteiini. DNA:ta, joka koodittaa jotakin mainituista muteiineista, voidaan 30 valmistaa esimerkiksi valitsemalla plasmidi, joka sisältää DNA:ta, joka koodittaa yscF:ää (KEX2:ta) tai ysca:aa (KEXl:tä) ja 1. pilkkomalla se restriktioentsyymillä, joka katkaisee DNA-alueella tai sen 3'-puolella, joka koodittaa membraanin sitoutumiskohtaa (esimerkiksi EcoRI. BstXI tai 35 Narl KEX2:n ollessa kysymyksessä, ja HgiAI, Taall tai Clal KEXl:n tapauksessa), pilkkomalla katkaistu DNA sopivalla endonukleaasilla, esimerkiksi Bal31:llä siten, että mainit- u 106720 tu DNA-alue poistuu, ja tekemällä linearisoitu plasmidi jälleen renkaanmuotoiseksi tasapääligaation avulla tai vastaavalla tavalla, tai 2. valitsemalla tai luomalla (esimerkiksi paikkakohdennetun mutatoinnin avulla) yksi rest-5 riktiokohta membraanin sitoutumiskohtaa koodittavan DNA-alueen 5'-puolelta ja yksi restriktiokohta sen 3'-puolelta (esimerkiksi PvuII ja Narl tai EcoRI KEX2:n tapauksessa, XhoI. Stul tai Xcal KEXl:n tapauksessa; 3'-restriktiokohta voi sijaita myös plasmidi-DNA-alueella KEX2- tai KEXl-gee-10 nin translaation lopetussignaalin vieressä), pilkkomalla plasmidi kahdella restriktioentsyymillä, jotka tunnistavat mainitut restriktiokohdat, ja saattamalla linearisoitu plasmidi jälleen renkaan muotoon tasapääligaation avulla, tai 3. poistamalla membraanin sitoutumiskohtaa koodittava 15 DNA-alue käyttäen silmukointimutatointia, tai 4. poistamalla C-pää kokonaan pilkkomalla PvuII;11a KEX2:n tapauksessa ja vastaavasti XhoI:llä. Stulrllä tai Scilrllä KEXl:n tapauksessa, ja saattamalla linearisoitu plasmidi jälleen renkaan muotoon tasapääligaation avulla tai vastaavalla 20 tavalla. Koska KEX2:n ja KEXl:n DNA-sekvenssit ovat tunnettuja (K. Mizumo et ai., A. Dmochowska et ai., edellä), sopiva mutageeninen oligonukleotidi voidaan helposti suunnitella ja ottaa käyttöön mainitun DNA-alueen poistamiseksi, käyttäen M13-kloonaussysteemiä. On huolehdittava siitä, 25 että mutatoidut KEX2- tai KEXl-geenit sisältävät translaation lopetussignaalin (TAA:n, TAG:n tai TGA:n). Sellainen lopetussignaali voidaan tarvittaessa liittää halutussa paikassa synteettisen linkkeri-DNA:n avulla, tai se voidaan toimittaa viereisen vektori-DNA:n avulla. Mutatoidut KEX2-30 ja KEXl-geenit voivat niin muodoin sisältää 3’-päissään kodoneita, jotka ovat peräisin vektori-DNA:sta, jotka koo-dittavat muutamaa (esim. 2-20) lisäaminohappoa liukoisten yscF- ja ysca-muteiinien C-päässä. Kaikissa näissä menetelmissä käytetään tavanomaisia tekniikoita.
12 106720
Fuusioproteiinin valmistaminen
Keksinnön mukaisia fuusioproteiineja voidaan valmistaa 5 yhdistelmä-DNA-tekniikan avulla, joka käsittää transfor moidun isännän viljelemisen olosuhteissa, jotka sallivat niiden ilmenemisen, ja fuusioproteiinin eristämisen. Erityisemmin haluttuja yhdisteitä valmistetaan 10 a) ottamalla käyttöön ekspressiovektori, joka käsittää ekspressiokasetin, joka sisältää mainittua fuusioproteiinia koodittavan DNA-sekvenssin, b) siirtämällä ekspressiovektori vastaanottajaisäntään, 15 c) viljelemällä transformoitua isäntää olosuhteissa, jotka sallivat fuusioproteiinin ilmenemisen, ja d) eristämällä fuusioproteiini.
20
Vaiheita, jotka tulevat kysymykseen fuusioproteiinien valmistuksessa yhdistelmä-DNA-tekniikan avulla, käsitellään yksityiskohtaisemmin tämän jälkeen.
25 Ekspressiovektorit
Keksintö koskee ekspressiovektoreita, jotka käsittävät < ekspressiokasetin, joka sisältää DNA-sekvenssin, joka koo-dittaa fuusioproteiinia, joka sisältää 1. yhden tai 30 useamman perättäisen proteiiniosan, joista jokainen sisäl tää biologisesti aktiivisen proteiinin, jonka C-terminaalinen aminohappo on kytketty linkkeripolypeptidisekvenssi L:ään, jolloin mainitun linkkeripolypeptidisekvenssi L:n N-terminaalinen ensimmäinen ja toinen aminohappotähde ja, 35 useamman peräkkäisen proteiiniosan ollessa kysymyksessä, myös C-terminaalinen viimeistä edellinen ja viimeinen aminohappotähde on Lys tai Arg, ja 2. polypeptidileiman, liitettynä mainittujen perättäisten proteiiniosien (mainitun proteiiniosan) C-terminaaliseen aminohappoon, 40 tai, joka sisältää 1. polypeptidileiman kytkettynä 2.
13 106720 useamman perättäisen proteiiniosan N-terminaaliseen aminohappoon, joista proteiiniosista jokainen sisältää • linkkeripolypeptidisekvenssi L:n, jolloin mainitun linkkeripolypeptidisekvenssi L:n N-terminaalinen 5 ensimmäinen ja toinen aminohappo, samoin kuin C-terminaalinen viimeistä edellinen ja viimeinen aminohappo ovat emäksisiä aminohappoja, joita ovat Lys ja Arg, ja jolloin mainitun linkkeripolypeptidisekvenssi L:n viimeinen emäksinen aminohappo on kytkettynä mainittuun biologisesti 10 aktiiviseen proteiiniin, ja menetelmää niiden valmistamiseksi .
Ekspressiokasettia voidaan esittää kaavalla 15 Pr-S- (DP-DL-DT )B-T (III) jossa kaavassa Pr on ilmentymistä ohjaava sekvenssi, S on sidos tai tarkoittaa DNA-sekvenssiä, joka koodittaa signaa-lipeptidiä, Dp tarkoittaa DNA-sekvenssiä, joka koodittaa 20 biologisesti aktiivista proteiinia, DL on DNA-sekvenssi, joka koodittaa linkkeripolypeptidi L:ää, jossa ensimmäinen ja toinen kodoni Dp:n 3'-pään vieressä ja, jos m on eri kuin 1, myös viimeistä edellinen ja viimeinen kodoni DT:n 5' -pään vieressä, koodittavat emäksisiä aminohappoja Lys tai Arg, • - 25 DT tarkoittaa DNA-sekvenssiä, joka koodittaa polypeptidileimaa, ja T tarkoittaa DNA-sekvenssiä, joka sisältää kopioinnin lopetussignaalit, jossa S, Dp, DL ja DT ovat samassa lukukehyksessä, ja m on kokonaisluku 1-10, tai kaavalla 30
Pr-S- ( Dt-Dl-Dp )n-T (IV) jossa kaavassa Pr, S, DT, DL, Dp ja T tarkoittavat samaa kuin edellä, ja jossa S, DT, DL ja Dp ovat samassa lukukehyksessä, 35 ja n on kokonaisluku 2-10.
Rakenteet, joissa S edustaa DNA-sekvenssiä, joka koodittaa 14 106720 signaalipeptidiä, ovat edullisia.
Vektori valitaan riippuen transformaatioon kaavailluista isäntäsoluista. Periaatteessa kaikki vektorit, jotka repli-5 koituvat ja ilmentävät keksinnön mukaista geeniä valitussa isännässä, ovat sopivia. Esimerkkejä sopivista isännistä ovat prokaryootit ja eukaryootit, joilta puuttuvat tai joilla on niukasti restriktioentsyymejä tai modifiointient-syymejä, ja joilta puuttuu yscF-aktiivisuus tai yscF:n 10 kaltainen aktiivisuus, kuten bakteerit, esimerkiksi Escherichia coli tai Bacillus subtilis, hiivat, esimerkiksi Saccharomvces cerevisiae. erityisesti sen kex2-mutantit, ja niiden lisäksi nisäkässolut, erityisesti vakiinnutetut ihmis- tai eläinsolulinjat, esim. myeloomasolut, ihmisen 15 alkion keuhkojen L-132-fibroblastit, hiirien LTK-solut, ihmisen pahanlaatuisen melanooman Bowess-solut, HeLa-solut, afrikkalaisten vihreiden C0S-7-apinoiden SV-40-viruksen transformoimat munuaissolut tai kiinanhamsterin munasarjan (CHO) solut ja niiden muunnokset. Kiinanhamsterin munasar-20 jän solut ja Escherichia coli - ja Saccharomvces cerevisiae -kannat ovat edullisia isäntämikro-organismeja.
Hiivassa ja E. colissa käytettäviä vektoreita 25 Esimerkkejä vektoreista, jotka ovat sopivia fuusioproteii-nigeenin ilmentämiseksi E. coli -kannassa, ovat bakteriofagit, esimerkiksi λ-bakteriofagin johdannaiset, tai plasmidit kuten plasmidi colEl ja sen johdannaiset, esimerkiksi pMB9, pSF2124, pBR317 tai pBR322. Sopivat vektorit 30 sisältävät täydellisen replikonin ja merkkigeenin, joka mahdollistaa ekspressioplasmideilla transformoitujen mikro-organismien valikoinnin ja identifioinnin fenotyyppiominai-suuden avulla. Sopivat merkkigeenit siirtävät mikro-organismiin esimerkiksi resistenssin raskasmetalleille, antibi-35 ooteille kuten ampisilliinille tai tetrasykliinille, ja vastaaville.
15 106720
Useita ilmentymistä ohjaavia sekvenssejä Pr voidaan käyttää ekspressiokasetin säätelemiseen E. colissa. Erityisesti * voimakkaasti ilmentyvien geenien promoottoreja käytetään.
Sopivia promoottoreja ovat lac-, tae-, trp- ja lpp-promoot-5 torit, niiden lisäksi λΝ-fagin tai λρΐι-fagin promoottori ja muut. Tämän keksinnön mukaisesti E. colissa edullisesti käytettävä promoottori on λρΐ»-, trp- ja lac-promoottori.
Vektorit, jotka ovat sopivia replikointiin ja ilmentämiseen 10 S. cerevisiaessa, sisältävät hiivan replikoinnin aloitus-kohdan ja selektiivisen geneettisen markkerin hiivalle. Hybridivektorit, jotka sisältävät hiivan replikoinnin aloituskohdan, esimerkiksi kromosomaalisen itsenäisesti replikoitavan fragmentin (ARS:in), säilyvät ekstrakromosomaali-15 sesti hiivasolun sisällä transformaation jälkeen ja replikoi tuvat itsenäisesti mitoosin aikana. Hybridivektoreita, jotka sisältävät hiivan 2p-plasmidi-DNA:n kanssa homologisia sekvenssejä, tai jotka sisältävät ARS:n ja kromosomaalisen sentromeerisekvenssin, esimerkiksi CEN4:n, voidaan 20 myös käyttää. Sopivia merkkigeenejä hiivalle ovat erityisesti sellaiset, jotka siirtävät antibioottiresistenssin isäntään tai, auksotrofisten hiivamutanttien ollessa kysymyksessä, geenit, jotka korjaavat isännän virheitä. Vastaavat geenit siirtävät esimerkiksi resistenssin syklohek-25 simidiantibiootille tai saavat aikaan prototrofian auksot-rofisessa hiivamutantissa, esimerkiksi URA3-, LEU2-. HIS3-tai TRPI-geeni.
Hiivan hybridivektorit sisältävät edullisesti lisäksi rep-30 likaation aloituskohdan ja merkkigeenin bakteeri-isäntää, erityisesti E. colia varten niin, että hybridivektoreiden : ja niiden prekursoreiden konstruointi ja kloonaus voidaan suorittaa E. colissa. Ilmentymistä ohjaavat Pr-sekvenssit, jotka ovat sopivia ilmentämistä varten hiivassa, ovat esi-35 merkiksi CYC1-. GAL1/10- tai PH05-geenien ohjaavat sekvenssit, ja myös promoottorit, jotka toimivat glykolyysissä, esimerkiksi PGK- tai GAP- (mukaanlukien 5'-päästä typistet- 16 106720 ty GAP) promoottori, lisäksi a-tekijän promoottori ja hyb-ridipromoottorit kuten PHQ5-GAP-hvbridipromoottorit.
Signaalipeptidiä S koodittava DNA-sekvenssi ("signaalisek-5 venssi”) saadaan mikrobi-isännän geenistä, joka koodittaa polypeptidiä, joka yleensä erittyy. Kun E. colia käytetään isäntämikro-organismina, voidaan valita ompA:n, lpp:n, mal-toosia sitovan proteiinin, λ-reseptorin, happamen fosfataasin tai β-laktamaasin signaalisekvenssi. Sopivia 10 signaalisekvenssejä S, käytettäväksi hiivassa, ovat esimerkiksi hiivan invertaasin, feromonipeptidaasin (KEX1), "tappaja toksiinin" ja repressoituvan happamen fosfataasin (PH05) geenien signaali- ja preprosekvenssit, a-tekijän ohjaussekvenssi ja glukoamylaasin signaalisekvenssi Asper-15 aillus awamorista. Vaihtoehtoisesti voidaan konstruoida yhdistettyjä signaalisekvenssejä liittämällä osa käytettävään promoottoriin (esimerkiksi PH05) luonnollisesti kytketyn geenin signaalisekvenssistä (jos läsnä) osaan biologisesti aktiivisen proteiinin signaalisekvenssistä (jos läs-20 nä). Sellaisia yhdistelmiä suositaan, jotka mahdollistavat täsmällisen katkaisun signaalipeptidin ja fuusioproteiinin aminohapposekvenssien välillä.
DNA-sekvenssi, joka sisältää kopioinnin lopetussignaalit T, 25 on edullisesti valikoidusta mikrobi-isännästä saadun geenin viereinen 3'-pään sekvenssi, joka sisältää oikeat signaalit kopioinnin lopetukselle. Sopivia 3'-pään viereisiä sekvenssejä ovat esimerkiksi ne geenin sekvenssit, jotka ovat luonnollisesti kytketyt käytettävään promoottoriin.
30
Nisäkässoluissa käytettävät vektorit
Vektorit, jotka on tarkoitettu replikointiin ja ilmentämiseen nisäkässoluissa, sisältävät usein virusperäistä DNA:-35 ta, esim. DNA:ta ihmisäpinän virus 40:stä (SV 40), Rous'in sarkoomaviruksesta (RSV), adenovirus 2:sta, naudan papil-loomaviruksesta (BPV), papovirus BK:n mutantista (BKV) tai 17 106720 hiiren tai ihmisen sytomegaloviruksesta (MCMV ja vastaavasti HCMV).
Ilmentymisen ohjaussekvenssit Pr, jotka ovat sopivia 5 käytettäviksi nisäkässoluissa, sisältävät muiden muassa SV40:n aikaiset ja myöhäiset promoottorit, adenoviruksen myöhäisen huomattavan promoottorin, hiiren metallotio-neiinigeenin promoottorin ja hiiren tai ihmisen syto-megaloviruksen huomattavan, välittömästi toimivan 10 (ensimmäisen vaiheen aikaisen) geenin tehostaja- promoottori-alueen promoottorin, ihmisen immunoglobuliinin tehostaja-promoottorialueen, ihmisen a-globiinin promoottorin yhdistettynä valinnaisesti SV40-tehostaja-elementin kanssa ja lämpöshokkigeeeneistä peräisin olevat 15 promoottorit. Signaalisekvenssejä S, nisäkässoluissa käyttöä varten, ovat esimerkiksi signaalisekvenssit, jotka ovat peräisin influenssahemagglutiniinista, ihmisen t-PA:sta ja prepro-insuliinista.
20 Sopivia merkkigeenej ä nisäkässoluja varten ovat esimerkiksi neo- ja ble-geenit transposoni Tn5:stä, jotka antavat resistenssin antibiootti-G418:lle ja vastaavasti bleomysiini-tyyppisille antibiooteille, E. colin geeni hygromysiini-B -resistenssille, dihydrofolaattireduktaasigeeni (dhfr) 25 nisäkäs soluista tai E. colls ta. joka muuttaa DHFR"“olu j en fenotyypin DHFR*-soluiksi ja/tai antaa resistenssin metot-reksaatille, ja herpes simplex -viruksen tymidiinikinaasi-geeni, joka tekee TK‘"“oluista fenotyyppisesti TK+-soluja.
30 Hybridivektorit nisäkässoluja varten sisältävät edullisesti nisäkäsgeenin 3'-pään ei-luetun alueen, joka sisältää signaalit kopioinnin oikealle lopettamiselle ja polyadenylaa-tiolle (T), kuten esimerkiksi β-globiinigeenin 3'-viereisen alueen. Polypeptidiä koodittavaa aluetta reunustavat alueet 35 sisältävät edullisesti yhden tai useamman natiivin intro- nin, jotka sisältävät päissään sopivat silmukointisignaa-lit. Sellaisia lisäosia pidetään välttämättöminä, koska Ιβ 106720 cDNA:sta ja prokaryoottisesta DNA:sta, kuten edellä mainituista valikointigeeneistä, puuttuvat yleensä kopioinnin ja prosessoinnin signaalit.
5 Sellaiset vektorit sisältävät edullisesti replikaation aloituskohdan ja antibioottiresistenssigeenin E. colissa lisääntymistä varten. Nisäkkään replikaatioaloituskohta voidaan toimittaa joko sisällyttämällä vektorirakenteeseen eukaryoottinen aloituskohta, kuten sellainen, joka on pe-10 räisin SV40:stä tai muusta viruslähteestä, tai se voidaan toimittaa isäntäsolun kromosomin kautta vektorin kiinnittyessä isäntäsolun kromosomiin.
DNA-sekvenssit Dp ja DT, jotka koodittavat biologisesti 15 aktiivista proteiinia ja polypeptidileima-ainetta, ovat tunnettuja, tai jos eivät ole, ne voidaan johtaa tunnetuista aminohapposekvensseistä ja syntetisoida käyttäen sinänsä tunnettuja menetelmiä. Linkkeripolypeptidi L:ää koodittava DNA-sekvenssi DL on edullisesti synteettinen DNA-sekvenssi, 20 joka sisältää emäksisiä aminohappopareja (aminohappoparin) kuten edellä on määritelty, ja se valmistetaan synteettisesti käyttäen tavanomaisia synteettisiä menetelmiä.
Keksinnön mukaisessa ekspressiokasetissa kooditussekvenssit 25 S, Dp, Dl ja DT on liitetty yhteen yhdessä keskeytymättömässä lukukehyksessä alkaen ATG:llä 5'-päässä ja päättyen translaation lopetussignaalilla (TAA, TAG tai TGA) 3'-päässä. Kooditussekvenssit S-(Dp-DL-DT)m ja S-(DT-DL-Dp)n ovat toimivasti kytketyt ilmenemisen ohjaussekvenssi Pr:ään.
30
Keksinnön mukaisia ekspressiovektoreita valmistetaan alalla : tunnetuilla menetelmillä käyttäen tavanomaisia ligaatiome- netelmiä, esimerkiksi liittämällä ekspressiokasetti (valmistettu aikaisemmin) sellaisenaan tai ekspressiokasetin 35 komponentit perättäisesti, ennaltamääritetyssä järjestyk sessä vektori-DNA:han. Ekspressiovektoreiden komponentit liitetään tavallisten restriktiokohtien välityksellä ja/tai 19 106720 synteettisten linkkerimolekyylien avulla ja/tai tasapääli-gaation avulla.
Transformoidut isännät 5 Tämän keksinnön mukainen toinen näkökohta käsittää isän-täsolut, jotka on transformoitu ekspressiovektorilla, joka käsittää ekspressiokasetin, joka sisältää DNA-sekvenssin, joka koodittaa fuusioproteiinia, joka sisältää 1. yhden tai 10 useamman perättäisen proteiiniosan, joista jokainen sisältää biologisesti aktiivisen proteiinin, jonka C-ter-minaalinen aminohappo on kytketty linkkeripolypeptidisek-venssi L:ään, jolloin mainitun linkkeripolypeptidisekvenssi L:n N-terminaalinen ensimmäinen ja toinen aminohappotähde 15 ja, useamman perättäisen proteiiniosan ollessa kysymyksessä, myös C-terminaalinen viimeistä edellinen ja viimeinen aminohappotähde on Lys tai Arg, ja 2. polypeptidileiman, liitettynä mainittujen perättäisten proteiiniosien (mainitun proteiiniosan) C-terminaaliseen 20 aminohappoon, tai, joka sisältää 1. polypeptidileiman kyt kettynä 2. useamman perättäisen proteiiniosan N-termi-naaliseen aminohappoon, joista proteiiniosista jokainen sisältää linkkeripolypeptidisekvenssi L:n, jolloin mainitun linkkeripolypeptidisekvenssi L:n N-terminaalinen ensim-25 mäinen ja toinen aminohappo, samoin kuin C-terminaalinen viimeistä edellinen ja viimeinen aminohappo ovat emäksisiä aminohappoja, joita ovat ryhmästä Lys ja Arg, ja jolloin mainitun linkkeripolypeptidisekvenssi L:n viimeinen emäksinen aminohappo on kytkettynä mainittuun biologisesti 30 aktiiviseen proteiiniin, ja menetelmän niiden valmista miseksi .
•
Esimerkkejä sopivista isännistä, mukaanlukien prokaryootti-set ja eukaryoottiset isännät, ovat ne, joita edellä on *- 35 määritelty. Menetelmä transformoitujen isäntäsolujen val mistamiseksi käsittää isäntäsolujen transformoinnin edellä mainitulla ekspressiovektorilla.
^ · » 106720
Eukaryoottisten isäntäsolujen transformointi suoritetaan alalla tunnetuilla menetelmillä. Esimerkiksi, hiivan trans-formointi hybridivektoreilla voidaan suorittaa Hinnen'in et ai. menetelmän mukaisesti [Proc. Natl. Acad. Sei. USA 75.
5 1919(1978)]. Tämä menetelmä voidaan jakaa kolmeen vai heeseen : (1) Hiivan soluseinän tai sen osien poistaminen.
(2) "Kuorittujen" hiivasolujen (sferoplastien) käsittelemi-10 nen ekspressiovektorilla PEG:n (polyetyleeniglykoli) ja
Ca2+-ionien läsnä ollessa.
(3) Soluseinän regenerointi ja transformoitujen solujen valikointi kiinteässä agarkerroksessa.
15 Ekspressiovektoreiden siirtäminen nisäkässoluihin suoritetaan transfektoimalla auttajayhdisteiden, esim. dietyyli-aminoetyylidekstraanin, dimetyylisulfoksidin, glyserolin, polyetyleeniglykolin tai vastaavien yhdisteiden läsnäollessa, tai vektori-DNA:n ja kalsiumfosfaatin yhteissaostumina.
20 Muihin sopiviin menetelmiin lukeutuvat vektori-DNA:n suora mikroinjisointi solun tumaan ja elektroporaatio, so. DNA:n siirtäminen lyhyen sähköpulssin avulla, joka lisää solumem-braanien läpäisevyyttä. Transfektoitujen solujen valikointi voidaan sen jälkeen tehdä käyttämällä valikointimarkkeria, 25 joka joko kiinnitetään kovalenttisesti ekspressiovektoriin tai lisätään erillisenä kokonaisuutena. Valintamarkkereihin lukeutuu geenejä, jotka antavat antibioottiresistenssin, tai geenejä, jotka korjaavat isäntäsolun geneettisen virheen (edellä).
30
Bakteeri-isäntäkantojen transformointi keksinnön mukaisilla ekspressiovektoreilla suoritetaan esimerkiksi tavalla, jota on kuvailtu kirjallisuudessa koskien B. subtilista [Anag-nostopoulos et ai., J. Bacteriol. 81., 741 (1961)] ja E.
35 colia [M. Mandel et ai., J. Mol. Biol. 53, 159 (1970)]. Transformoitujen isäntäsolujen eristäminen suoritetaan edullisesti valikoivasta ravintoalustasta, johon on lisätty . · 21 106720 esimerkiksi biosidiä, jota vastaan ekspressioplasmidin sisältämä merkkigeeni antaa resistenssin. Jos hybridi vektorit sisältävät esimerkiksi ampR-geenin, ampisilliiniä lisätään sen mukaisesti ravintoalustaan. Solut, jotka eivät 5 sisällä hybridivektoria, tuhoutuvat sellaisessa alustassa.
Transformoitunen isäntäsoluien viljely
Keksintö koskee lisäksi menetelmää fuusioproteiinin tuotta-10 miseksi, joka sisältää 1. yhden tai useamman perättäisen proteiiniosan, joista jokainen sisältää mainitun biologisesti aktiivisen proteiinin, jonka C-terminaalinen aminohappo on kytketty linkkeripolypeptidisekvenssi L:ään, jolloin mainitun linkkeripolypeptidisekvenssi L:n N-termi-15 naalinen ensimmäinen ja toinen aminohappotähde, ja useamman perättäisen proteiiniosan ollessa kysymyksessä, myös C-terminaalinen viimeistä edellinen ja viimeinen aminohappotähde on emäksinen aminohappo Lys tai Arg, ja 2. polypeptidileiman, liitettynä mainittujen perättäisten 20 proteiiniosien (mainitun proteiiniosan) C-terminaaliseen aminohappoon, tai, joka sisältää 1. polypeptidileiman kytkettynä 2. useamman perättäisen proteiiniosan N-termi-naaliseen aminohappoon, joista proteiiniosista jokainen sisältää linkkeripolypeptidisekvenssi L:n, jolloin mainitun 25 linkkeripolypeptidisekvenssi L:n N-terminaalinen ensim mäinen ja toinen aminohappo, samoin kuin C-terminaalinen viimeistä edellinen ja viimeinen aminohappo ovat emäksisiä aminohappoja, joita ovat Lys ja Arg, ja jolloin mainitun linkkeripolypeptidisekvenssi L:n viimeinen emäksinen amino-30 happo on kytkettynä mainittuun biologisesti aktiiviseen proteiiniin, joka menetelmä käsittää transformoitujen : isäntäsolujen viljelemisen sopivissa ravinneolosuhteissa, jotka isäntäsolut sisältävät ekspressiovektorin, joka sisältää DNA-sekvenssin, joka koodittaa mainittua fuusiopro-35 teiinia, ja mainitun fuusioproteiinin eristämisen.
Transformoituja isäntäsoluja viljellään alalla tunnetuilla > 22 106720 menetelmillä nestemäisessä alustassa, joka sisältää assimiloituvia hiilenlähteitä, typpeä ja epäorgaanisia suoloja. Useita erilaisia hiilenlähteitä voidaan käyttää keksinnön mukaisten transformoitujen E. coli- ja hiivasolujen vilje-5 lyyn. Esimerkkejä edullisista hiilenlähteistä ovat assimiloituvat hiilihydraatit kuten glukoosi, maltoosi, mannitoli tai laktoosi, tai asetaatti, joita voidaan käyttää joko yksin tai sopivissa seoksissa. Esimerkkejä sopivista typen-lähteistä ovat aminohapot kuten kasaminohapot, peptidit ja 10 proteiinit ja niiden hajoamistuotteet kuten tryptoni, pep-toni tai lihauutteet, hiivauutteet, mallasuute ja myös ammoniumsuolat, esimerkiksi ammoniumkloridi, -sulfaatti tai -nitraatti, joita voidaan käyttää joko yksin tai sopivissa seoksissa. Epäorgaanisia suoloja, joita myös voidaan 15 käyttää, ovat esimerkiksi natriumin, kaliumin, magnesiumin ja kalsiumin sulfaatit, kloridit, fosfaatit ja karbonaatit. Alusta sisältää lisäksi esimerkiksi kasvua edistäviä aineita kuten esimerkiksi hivenaineita, esimerkiksi rautaa, sinkkiä, mangaania ja vastaavia aineita, ja edullisesti 20 aineita, jotka käyttävät valintapainetta ja estävät solujen kasvun, jotka ovat menettäneet ekspressioplasmidin. Näin ollen, jos esimerkiksi hiivakantaa, joka on auksotrofinen esimerkiksi välttämättömän aminohapon suhteen, käytetään isäntämikro-organismina, plasmidi sisältää edulliseti gee-25 nin, joka koodittaa entsyymiä, joka korjaa isännän vajavuuden. Hiivakannan viljely suoritetaan minimaalialustassa, josta puuttuu mainittu aminohappo.
Viljely suoritetaan alalla tunnetuilla menetelmillä. Vilje-30 lyolosuhteet kuten lämpötila, alustan pH-arvo ja fermen-tointiaika valitaan siten, että keksinnön mukaisia fuusio- • proteiineja saadaan maksimitiitteri. Hiivakantaa viljellään siten edullisesti aerobisissa olosuhteissa pinnanalaisvil-jelmänä ravistellen tai sekoittaen lämpötilan ollessa noin 35 20 - 40°C, edullisesti noin 30°C, ja pH-arvossa 5 - 8, edullisesti noin pH 7:ssä, noin 4-30 tunnin ajan, edullisesti kunnes keksinnön mukaisia proteiineja saadaan maksi- • 106720 23 misaannoin. Nisäkässoluja kasvatetaan kudosviljelyolosuh-teissa käyttäen kaupallisesti saatavia alustoja, joita on valinnaisesti täydennetty kasvua edistävillä aineilla ja/-tai nisäkässeerumeilla. Soluja kasvatetaan joko kiinnitet-5 tyinä kiinteään kantajaan, esim. mikrokantajaan tai huokoisiin lasikuituihin, tai vapaina sopivissa viljelyastioissa. Viljelyalusta valitaan sillä tavoin, että valintapainetta käytetään ja vain ne solut ovat elinkykyisiä, jotka yhä sisältävät hybridivektori-DNA:n mukaanlukien geneettisen 10 markkerin. Alustaan lisätään siten esimerkiksi antibioottia, kun hybridivektori sisältää vastaavan antibioottire-sistenssigeenin.
Kun solutiheys on saavuttanut riittävän tason, viljely 15 keskeytetään ja proteiini eristetään. Jos ekspressiokasetti sisältää signaalisekvenssin, haluttu fuusioproteiini voi erittyä alustaan. Tuotteen sisältävä alusta erotetaan soluista, joille voidaan antaa tuoretta alustaa ja käyttää jatkuvaan tuotantoon. Kun käytetään hiivasoluja tai E. coli 20 -soluja, proteiini voi myös kerääntyä solujen sisään, erityisesti periplasmiseen tilaan. Jälkimmäisessä tapauksessa fuusioproteiinin ensimmäinen talteenottovaihe käsittää proteiinin vapauttamisen solun sisäosista. Soluseinä poistetaan ensin pilkkomalla entsymaattisesti glukosidaaseilla 25 (edellä), tai vaihtoehtoisesti soluseinä poistetaan käsittelemällä kemiallisilla aineilla, so. tiolireagensseilla tai EDTA:11a, jotka saavat aikaan soluseinävaurioita, mikä sallii tuotettujen proteiinien vapautumisen. Tuloksena olevan seoksen sisältämää fuusioproteiinia rikastetaan 30 tavanomaislla menetelmillä kuten poistamalla suurin osa ei-proteiiniaineksesta polyetyleeni-imiinikäsittelyllä, i seostamalla proteiinit käyttäen anunoniumsulfaattia, gee- lielektroforesoimalla, dialyysillä, kromatografoimalla, esimerkiksi ioninvaihtokromatografiällä (erityisesti edul-35 lista silloin, kun fuusioproteiinin polypeptidileima sisältää suuren määrän happamia tai emäksisiä aminohappoja), kokoekskluusiokromatografiällä, HPLC:llä tai käänteisfaasi- • 24 106720 sella HPLCrllä, molekyylilajittelun avulla sopivassa Sepha-dexR-kolonnissa, tai vastaavilla menetelmillä. Esipuhdiste-tun tuotteen lopullinen puhdistaminen suoritetaan esimerkiksi affiniteettikromatografian avulla, esimerkiksi vasta-5 aineaffiniteettikromatografialla, erityisesti monoklonaali-sen vasta-aineen käsittävällä affiniteettikromatografialla käyttäen vasta-aineita, jotka on kiinnitetty liukenemattomaan matriisiin alalla tunnetuilla menetelmillä, jotka vasta-aineet tunnistavat esimerkiksi epitooppeja, jotka 10 sijaitsevat fuusioproteiinin polypeptidileima-aineessa.
Keksintö koskee lisäksi keksinnön mukaisia fuusioproteiine-ja sinänsä, jotka ovat arvokkaita välituotteita biologisesti aktiivisten proteiinien tuotannossa.
15
Keksintö koskee erityisesti ekspressiovektoreita, transformoituja isäntiä, fuusioproteiineja ja menetelmiä niiden valmistamiseksi, ja menetelmää biologisesti aktiivisen proteiinin valmistamiseksi kuten esimerkeissä kuvaillaan.
20
Seuraavat esimerkit auttavat valaisemaan keksintöä mutta niitä ei tulisi pitää keksintöä rajoittavina.
Esimerkki 1: Liukoista vscF-varianttia koodittavan lvhenne-25 tvn KEX2:n konstruointi
Hiivan KEX2-geeni koodittaa yscF-nimistä endoproteaasia, joka on membraaniin sidottu proteiini, joka sijaitsee Golgi' n laitteessa. yscF-proteiini sisältää N-terminaalisen 30 katalyyttisen domeenin, Ser/Thr-runsaan domeenin, membraaniin ulottuvan domeenin ja C-terminaalisen hännän, joka » vastaa yscF-proteiinin sijoittumisesta Golgi'n laitteessa.
Mutantissa yscF-entsyymissä, josta puuttuu 200 C-terminaa-lista aminohappoa, mukaanlukien Ser/Thr-runsas domeeni, 35 membraaniin ulottuva domeeni ja C-terminaalinen häntä, on yhä jäljellä proteiiniaktiivisuutta [Fuller et ai., 1989, Proc. Natl. Acad. Sei. 86, 1434-1438; Fuller et ai., 1989, 25 106720
Science 246. 482-485]. Liukoisen yscF-proteaasiaktiivisuu-den saamiseksi konstruoidaan mutantti KEX2-geeni, josta puuttuu 600 emäsparia (ep), jotka koodittavat 200 C-terminaalista aminohappoa. Typistetty geeni on KEX2-promootto-5 rin ohjauksessa, joka kattaa alueen -1 - -502. Translaatio lopetetaan lopetuskodonin kohdalla (TAA), joka on lähtöisin pUC18:n polylinkkeristä.
Yksityiskohtaisesti esitettynä, plasmidi pUC19 [Boehringer 10 Mannheim Gmbh, Saksa] pilkotaan loppuun Hindlllrlla ja 2686 ep fragmentti eristetään. Päät täytetään ja fragmentti ligoidaan uudelleen. Erä ligaatioseoksesta lisätään kalsiumilla käsiteltyihin, transformaatiokompetentteihin E. coli JM101 [Invitrogen, San Diego, USA] -soluihin. Kahta-15 toista transformoitua ampisilliiniresistenttiä E. coli -transformanttia kasvatetaan ampisilliinia ollessa läsnä 100 pg/ml. Plasmidi-DNA valmistetaan ja analysoidaan pilkkomalla HindiII:11a sekä BamHI:llä♦ Plasmidia, josta puuttuu Hindlll-kohta. merkitään tunnuksella pUC19woH.
20 3207 ep Ball-Ahalll KEX2-fragmentti (saatavissa koko geno-misesta hiivan DNA:sta) varustetaan molemmista päistä Bam-HI-linkkereillä, minkä jälkeen pilkottiin loppuun BamHI:-llä. Plasmidi pUC19woH pilkotaan kokonaan BamHI:llä. line-25 aarinen 2690 ep fragmentti eristetään ja liitetään edellä ' kuvailtuun BamHI KEX2-fragmenttiin. Näyte-erä ligaatioseok sesta transformoidaan E. coli JM101-soluihin. Kahtatoista transformoitua ampisilliiniresistenttiä pesäkettä kasvatetaan ampisilliiniä (100 pg/ml) sisältävässä LB-alustassa, 30 plasmidi-DNA uutetaan ja analysoidaan BamHI-hvdrolvsaattien avulla. Yksi klooni, joka sisältää odotetut restriktiofrag-: mentit, valitaan ja nimetään tunnuksella pKS301b.
2 pm hiivavektori pAB24, joka vastaa olennaisilta osiltaan 35 plasmidi pDP34:ää, pilkotaan kokonaan BamHI:llä. ja lineaarinen pAB24 eristetään. Plasmidi pKS301b pilkotaan BamHI:-llä, ja täydellisen KEX2-geenin sisältävä fragmentti eris- 26 106720 tetään ja liitetään lineaariseksi tehtyyn hiivavektori pAB24:ään. Erä ligaatioseoksesta transformoidaan E. coli JMlOlieen, ja kahdentoista positiivisen kloonin plasmidi-DNA tutkitaan BamHI-hydrolysaattien avulla. Yhtä odotettuja 5 restriktiofragmentteja sisältävää kloonia nimitetään tunnuksella pAB226.
Plasmidi pKS301b pilkotaan loppuun Sphl:llä. PvuII:lla ja Seal:llä. 2,37 ke sisältävä Sphl-PvuII-fragmentti, joka 10 sisältää KEX2-sekvenssit -502:sta +1843:een ja osan poly-linkkeri pUC19:sta, eristetään. Plasmidi pUC18 [Boehringer Mannheim, Saksa] katkaistaan kokonaan Sphl; llä ja Smalillä. 2660 ep Sohi-Smal-pUCl8-fragmentti liitetään 2,37 ke Sphl-PvuII-KEX2-fragmenttiin Sphl/Sphl- ja PvuII/Smal-liaaation 15 avulla. PvuII/Smal-ligaatiosta on tuloksena 614 aminohappoa koodittavan KEX2-ORF:in (-avoimen lukukehyksen) yhteensulautuminen ORFiään pUC18-sekvensseissä, joka koodittaa seitsemää C-terminaalista lisäaminohappoa (-G-V-P-S-S-N-S), ja jota seuraa lopetuskodoni (TAA). Ligaatioseoserä trans-20 formoidaan E. coli JMlOlieen. Plasmidi-DNA eristetään am-pisilliiniresistenteistä E. coli -transformanteista ja analysoidaan pilkkomalla Sphl:llä ja EcoRIillä sekä myös HindiII:11a. Yhtä odotetun restriktiokuvion sisältävää kloonia nimitetään tunnuksella pl8kexp. Sekvenssiluettelos-25 sa kohdassa SEKV. ID. N:o 1 esitetään ORF, joka koodittaa liukoista yscF:ää, KEX2-peräisen DNA:n kanssa.
Plasmidi pl8kexp pilkotaan loppuun PvuIIilla, Sällillä ja Seal:llä. 2552 ep Sall-PvuII-fraomentti. joka sisältää 30 KEX2-sekvenssit, jotka ulottuvat -502:sta +1843reen, sekä 206 ep pUC18-sekvenssejä eristetään. Plasmidi pDP34 pilko-: taan BamHI:llä ja linearisoidun plasmidin päät täytetään.
T4-polymeraasin inaktivoinnin jälkeen, linearisoitu täytetty plasmidi katkaistaan Sällillä, ja 11,78 ke fragmentti 35 eristetään. pDP34:n BamHI*-SalI-fraomentti liitetään 2552 ep Sall-PvuII-fragmenttiin Sall/Sall- ja BamHI*/PvuII-li-gaation avulla (BamHI*; täytetty BamHI). Ligaatioseoserä 27 106720 transformoidaan transformaatiokompetentteihin E. coli JM101-soluihin. Plasmidi-DNA uutetaan ampisilliiniresisten-teistä soluista ja analysoidaan restriktioanalyysin avulla Sällillä. Ncolillä. Smalillä. Xbalillä. EcoRIillä. Yhtä 5 odotettuja restriktiofragmentteja sisältävää kloonia nimitetään tunnuksella pDPkexp.
Esimerkki 2: Endoproteaasiaktiivisuuden määrittäminen 10 Soluja viljellään kuten esimerkissä 3 on kuvailtu. Kasvu-liemi sentrifugoidaan ja erotetaan soluiksi ja kasvualustaksi. Endoproteaasiaktiivisuus määritetään kasvualustassa, käsittelemättömien solujen pinnalla, ja "läpäiseviksi tehdyissä" soluissa. Solut pestään kerran yhdellä tilavuudella 15 0,2 M HEPES:ia (4-(2-hydroksietyyli)-piperatsiini-l-etaa- nisulfonihappo, Fluka, Sveitsi) pH 7,0 ja resuspendoidaan yhteen tilavuuteen 0,2 M HEPES:ia pH 7,0, määrityksiä varten käsittelemättömillä soluilla, tai resuspendoidaan 0,2 M HEPES:iin pH 7,0, joka sisältää 0,1 % Triton X-100:aa 20 "läpäisevien" solujen aikaansaamiseksi. Endoproteaasiaktiivisuus määritetään seuraavasti: 900 μΐ määritysseosta (0,2 M HEPES pH 7,0, 1 mM CaCl2, 0,5 mM PMSF [läpäiseviksi tehtyjen solujen aktiivisuuden määrittämiseksi lisäksi 0,1 % Triton X-100:aa]) inkuboidaan 50 μ1:η näytteen kanssa 25 37°C:ssa 2 minuutin ajan, ja A405-arvon lisäys tämän inku-bointij akson aikana määritetään spektrofotometrisesti. Mitään muutosta A405:ssä ei voida havaita tämän esi-inku-boinnin aikana ilman substraattia. Reaktio aloitetaan lisäämällä substraatti (50 μΐ 10 mM bentsyylioksikarbonyyli-30 L-tyrosyyli-L-lysyyli-L-arginiini-4-nitroanilidi, Bachem, Bubendorf, Sveitsi), ja lisäys A405:ssä otetaan muistiin : endoproteaasiaktiivisuuden laskemista varten. 1 U endopro- teaasiaktiivisuutta määritellään 1 pmooliksi 4-nitroanili-diä, joka muodostuu minuutissa, kuvailluissa määritysolo-35 suhteissa. Noin 90 % yscF-aktiivisuudesta tavataan viljely-alustasta.
28 106720
Esimerkki 3; S. cerevisiae -kannan AB110 transformointi
Saccharomyces cerevisiae -kanta AB110 (ATCC 20796) transformoidaan plasmideilla pDP34, pAB226 ja pDPkexp, käyttäen 5 Dohmen'in et ai. kuvailemaa toimintaohjetta [1989, Curr. Genet. 15, 319-325], Transformoidut hiivasolut valikoidaan hiivan minimaalimaljoilla, joita on täydennetty aminohap-po/nukleotidiseoksella, josta puuttuu urasiili (aminohap-po/nukleotidiseos lisää kasvualustaan adeniinia 12 mg/1, 10 arginiinia 40 mg/1, histidiiniä 40 mg/1, isoleusiinia 60 mg/1, leusiinia 60 mg/1, lysiiniä 60 mg/1, metioniinia 40 mg/1, fenyylialaniinia 50 mg/1, treoniinia 60 mg/1, trypto-faania 40 mg/1, tyrosiinia 15 mg/1, urasiilia 40 mg/1, valiinia 60 mg/1). Erillisiä transformoituja hiivaklooneja 15 eristetään ja niitä nimitetään tunnuksilla:
Saccharomyces cerevisiae AB110/pDP34 Saccharomyces cerevisiae AB110/pAB226 Saccharomvces cerevisiae ABllO/pDPkexp 20
Esimerkki 4: Transformoitujen hiivakantolen fermentointi laboratoriomitassa S. cerevisiae AB110/pDP34:n, S. cerevisiae AB110/pAB226:n 25 ja S. cerevisiae AB110/pDPkexp:n soluja kasvatetaan 10 ml:n esiviljelmänä alustassa, joka sisältää:
Difco*n Yeast Nitrogen Base'a ilman aminohappoja 6,7 g/1 glukoosia 20,o g/1 30 HEPES:ia 24,0 g/1.
: Kasvualustaa täydennetään aminohappo/nukleotidiseoksella, josta puuttuu leusiini (kuvailtu esimerkissä 3) ja pH säädetään arvoon 7,0.
Esiviljelmiä kasvatetaan 48 tunnin ajan 30°C:ssa ja 180 kierrosta minuutissa (r.p.m.).
35 29 106720 Pääkasvatusalusta sisältää:
Difco'n Yeast Nitrogen Base's ilman aminohappoja 6,7 g/1 glukoosia 40,0 g/1 5 arginiinia 8,0 g/1
Difco'n Casaminoacids -aminohappoja 8,5 g/1 HEPES:ia 24,0 g/1 pH säädetään 7,0:ksi 10 Pääviljelmät siirrostetaan noin 1 %:lla tilavuus/tilavuus esiviljelmiä ja inkuboidaan 30°C:ssa ja 180 r.p.m.. Useana ajankohtana fermentoinnin aikana otetaan näyte-eriä viljelmästä, ja niistä analysoidaan solutiheys, kasvuliemen pH ja endoproteaasiaktiivisuus. Se, että S. cerevisiae 15 ABllO/pDPkexp-transformantti syntetisoi intrasellulaarisia ja ekstrasellulaarisia yscF-aktiivisuuksia, osoittaa, että liukoinen erittynyt yscF-variantti ilmentyy, verrattuna transformanttiin ABllO/pDP34, joka sisältää vain hiivavektorin, ja transformanttiin AB110/pAB226, joka il- 20 mentää koko yscF-proteiinin.
Esimerkki 5i Typistetyn liukoisen vscF-proteiinin immunologinen osoittaminen S. cerevisiae ABllO/pDPkexp-transfor-manttien kasvualustasta 25
Kantoja S. cerevisiae ABllO/pDPkexp ja AB110/pDP34 kasvatetaan kuten esimerkissä 4 on' kuvailtu. Kasvuliemet erotetaan soluiksi ja kasvusupernatanteiksi sentrifugoimalla. Kasva-tussupernatantit väkevöidään käyttäen Centricon 30000-kal-30 voja (Amicon) l/5:aan alkuperäisestä tilavuudesta. Erilai sia määriä väkevöityjä supernatantteja pelkistetään 1,4-ditio-DL-treitolilla ja erotetaan 8 %:isella polyakryyli- » amidigeelillä denaturoivissa olosuhteissa. Proteiinit joko värjätään Coomassie'n briljanttisinisellä tai blotataan 35 nitroselluloosakalvoile (Western-blottaus). PAGE- ja Wes- terb-blot -menetelmiä kuvaillaan julkaisussa Sambrook et ai., 1989, Molecular Cloning, 2. painos. Cold Spring Harbor . * ·. · äo 106720
Laboratory Press, New York. Nitroselluloosasuodinta inku-boidaan 37°C:ssa 2 tunnin ajan liuoksessa, joka sisältää 10 mM NaH2P04:ää, 150 mM NaCl:ia, 1 % BSA:ta, pH 7,2, jota seuraa toinen inkubointi samoissa olosuhteissa samassa 5 liuoksessa, joka nyt sisältää lisäksi polyklonaalisia vasta-aineita, jotka on saatu aikaan kaneissa IacZ-yscF-fuusiota vastaan. (Vasta-aineiden tuottamista ja puhdistamista kuvaillaan julkaisussa Sambrook et ai., 1989, Molecular Cloning, 2. painos, Cold Spring Harbor Laboratory Press, 10 New York). Suodinta pestään kolme kertaa 30 minuutin ajan 37°C:ssa liuoksessa, joka sisältää 10 mM NaH2P04:ää, 150 mM NaClria, 1 % Triton X-100:aa, 0,1 % BSA:ta, pH 7,2. Näitä pesuja seuraa hybridisaatioreaktio vuohen anti-kani-Ig-alkalinen fosfataasi-konjugaatin kanssa (TAGO, Inc., 15 Burlingame, CA), aikaiinen fosfataasi, joka on kytketty vasta-aineeseen, joka on spesifinen kaneissa synnytettyjen vasta-aineiden vakioalueille. Tämä reaktio suoritetaan liuoksessa, joka sisältää 10 mM NaH2P04:ää, 150 mM NaCl:ia, 0,01 % Tween 20:tä, 0,1 % BSA:ta, pH 7,2, joka sisältää 20 anti-kani-Ig-alkalinen fosfataasikonjugaattia. Blottia pes
tään kolme kertaa 30 minuutin ajan liuoksessa, joka sisältää 10 mM NaH2P04:ää, 150 mM NaCl:ia, 0,01 % Tween 20:tä, 0,1 % BSA:ta, pH 7,2. Spesifisen sitoutumisen havainnollistaminen tapahtuu inkuboimalla blottia liuoksessa, joka 25 sisältää: 0,1 M Tris-HCl:ää pH 8,8, 100 mM NaCl:ia, 2 mM
MgCl2:ta, 10 mg/100 ml 5-bromi-4-kloori-indolyyli-fosfaattia (BCIP) ja 100 mg/100 ml nitrosini-tetratsoliumkloridia (NBT). Ylimääräinen 68 kDa proteiini havaitaan S. cerevi-siae AB110/pDPkexp:n kasvusupernatanteissa, verrattuna S.
30 cerevisiae AB110/pDP34:n kasvusupernatantteihin. Tämä 68 kDa proteiini reagoi yscF-proteiinia vastaan synnytettyjen : vasta-aineiden kanssa.
Esimerkki 6: Pre-pro-IGFl:n in'vitro -prosessointi IGF1 ilmentyy S. cerevisiaessa intrasellulaarisena fuusiop-roteiinina, joka koostuu valmiista IGFl:stä yhtyneenä S.
; J
35 31 106720 cerevlslaen a-tekijän prekursorin ohjaussekvenssiin. Fuu-sioproteiinilla on seuraava rakenne: N-(a-tekijä-ohj aussekvenssi)-IGF1-C 5
Aminohapposekvenssi Tyr-Lys- Arg on 89 aminohappoa sisältävän a-teki jän ohjaussekvenssin C-terminaalinen pää [Kurjan, J. ja Herskowitz, I. 1982, Cell 30, 933-943] ja substraatti yscF-proteaasille. Fuusioproteiinin katkaisee typistetty 10 liukoinen yscF-proteaasi, mikä johtaa hydrolyysituotteisiin N-pre-pro-a-tekijä-C ja valmis IGF1.
S. cerevisiaen raakauutenäytteitä, joista kukin sisältää 50 pmoolia a-tekijä-ohjaussekvenssi-IGFl-fuusioproteiinia, 15 inkuboidaan S. cerevisiae AB110/pDPkexp:n kasvusupernatant-tinäytteiden kanssa, joista kukin sisältää 5 mU liukoista yscF-endoproteaasiaktiivisuutta (laskettuna endoproteaasi-aktiivisuusmäärityksestä, jota kuvailtiin esimerkissä 2). Reaktiot toteutetaan 10 pl:ssa 50 mM Na-fosfaattipuskuria 20 pH 7,5 eri pituisina ajanjaksoina. In vitro -prosessointi- toiminnasta peräisin oleva valmis IGF1 detektoidaan "Wes-tern-blottaus" -analyysillä. Tätä menetelmää kuvaillaan esimerkissä 5. Hybridisaatio suoritetaan käyttäen polyklo-naalisia vasta-aineita, jotka on tehty kaneissa valmista 25 IGFlrtä vastaan. Spesifisen sitoutumisen detektoimista kuvaillaan esimerkissä 5. Western-blot-analyysi osoittaa pre-pro-IGFl:n prosessoinnin kasvusupernatantin kanssa, joka sisältää liukoisen yscF-proteaasivariantin, joka on erittynyt S. cerevisiae ABllO/pDPkexp-transformantista. 30 Pre-pro-IGFl-proteiini prosessoituu valmiiksi IGFl:ksi 30- 120 minuutin kuluessa käytettäessä kuvailtuja määritysolo-: suhteita.
Esimerkki 7: Hvbridiaeenin konstruointi, joka sisältää 35 GAPFL-promoottorin ia KEXl-rakenneqeenin
Kuten eurooppalaisessa patenttihakemuksessa n:o 341 215 on 32 106720 esitetty, täyspitkä KEXl-geeni eristetään kokonaisesta genomisesta Saccharomvces cerevisiaen DNA:sta 3,1 ke Hin-dlll-fragmentissa. Tämä fragmentti kloonataan hiivaplasmidi pJDB207:n yhdestä kohdasta pilkottuun HindiII-kohtaan 5 [Beggs, J.D., 1981, julkaisussa D. von Wettstein et ai. (ed.), Molecular Genetics in Yeast, Alfred Benzon Symposium 16. Munsgaard, Kööpenhamina]. E. coli HB101 transformoidaan tuloksena olevalla plasmidi pJDB207/KEXl: llä. Transformoitu E. coli -kanta on nimeltään E. coli HB101/KEX1.
10
Jotta saataisiin eritetyn liukoisen ysca-muodon ilmeneminen korkeatasoiseksi (KEXl:n koodittama proteiini), Hindlll-fragmentissa läsnäoleva KEX1-promoottori vaihdetaan hiivan glyseraldehydi-3-fosfaattidehydrogenaasipromoottorin voi-15 makkaaseen konstitutiiviseen promoottorielementtiin ( GAPFL) (eurooppalainen patenttihakemus n:o 225 633). Koska GAPFL-promoottori sijaitsee 478 ep Sall-EcoRI-fragmentissa, KEX1-kooditusalueella oleva EcoRI-kohta eliminoidaan ensin in vitro -mutatoinnin avulla, minkä jälkeen liitetään uusi 20 EcoRI-kohta suoraan 5'-puolelle KEX1 ATG -aloituskodoniin, mikä mahdollistaa GAPFL-promoottorin oikean sulautumisen KEX1-kooditusalueeseen.
Yksityiskohtaisesti esitettynä, KEXl:n sisältävä 3,1 ke 25 HindiII-fragmentti subkloonataan M13-peräisen vektori pBluescript KS+:n HindiII-kohtaan (Stratagene, La Jolla,
Ca. USA), jolloin saadaan KS+/KEX1. Sisäisen EcoRI-kohdan poistamiseksi, joka sijaitsee 420 emäsparia 5*-Hindlll-kohdan yläpuolella, seuraava oligonukleotidi syntetisoi-30 daan: : 5'-CCTTTTAGGGTCAATTCAGACGGT-3' «
Paikkakohdennettu in vitro -mutatointi suoritetaan kuten on 35 kuvailtu (Bio-Rad Muta-Gene M13 -pakkaus, Bio-Rad, Richmond, Ca, USA). Ensiksi, KS+/KEX1 transfektoidaan E. coli CJ236:een urasiilin inkorporoimiseksi (Muta-Gene -pakkaus, 4 106720 33 edellä). Yksijuosteista DNA:ta transfektoidusta E. coli CJ236:sta eristetään käyttäen Ml3-auttajafagia (Stratagene, edellä).
5 200 pmoolia ollgonukleotidialuketta fosforyloidaan 30 μ1:η kokonaistilavuudessa, joka sisältää 3 μΐ 1 M Tris-HCl:ää pH 8,0, 0,3 μΐ 1 M MgCl2:ta, 0,75 μΐ 0,2 M DTTitä, 0,6 μΐ 20 mM ATP:tä. 4,5 yksikköä T4 polynukleotidikinaasia lisätään ja seosta inkuboidaan 37°C:ssa 45 min. ajan ja 65°C:ssa 10 10 min. ajan.
Fosforyloitu oligonukleotidi pariutetaan sen jälkeen temp-laatti-DNA:han seuraavissa olosuhteissa: 0,1 pmoolia
KS+/KEXl:stä saatua, urasiilia sisältävää DNA:ta inkuboi-15 daan 2 pmoolin kanssa fosforyloitua aluketta 10 μ1:η kokonaistilavuudessa pariuttamispuskuria (20 mM Tris-HCl pH
7,4, 2 mM MgCl2, 50 mM NaCl). Seos kuumennetaan vesihau teessa 80°C:seen, ja sen annetaan sitten hitaasti jäähtyä, kunnes ympäristön lämpötila saavutetaan. Vastinjuoste muo-20 dostetaan sen jälkeen seuraavissa olosuhteissa: 10 μΐ pa-riuttamisseosta inkuboidaan liuoksen kanssa, joka sisältää 4 μΐ 2 mM dNTP:itä, 0,75 μΐ 0,5 M Tris-HCl:ää pH 7,4, 0,75 μΐ 0,1 M MgCl2:ta, 2,15 μΐ 0,2 M DTTrtä, 1 yksikön T4 DNA -polymeraasia ja 2 yksikköä T4 DNA -ligaasia. Reaktioseosta 25 inkuboidaan ensin jäiden päällä 5 minuuttia, sitten 25°C:ssa l 5 minuuttia ja lopuksi 37°C:ssa 90 minuuttia. Tuloksena olevat kaksijuosteiset DNA:t transformoidaan E. coli JM101:een, kantaan, joka poistaa tehokkaasti urasiilia sisältävän templaatin, jättäen mutatoidun vastinjuosteen 30 replikoitumaan (Bio-Rad, edellä). Plasmideja valmistetaan ja ne analysoidaan EcoRI-kohdan poissaolon osalta. Oikea mutatointi varmistetaan lisäksi sekvenssianalyysillä. Yhtä £ plasmidia, jossa sisäinen EcoRI-kohta on oikein hajaantunut, merkitään tunnuksella KS+/KEX1(-EcoRI).
Uusi EcoRI-kohta liitetään sen jälkeen KS+/KEX1 (-EcoRI): een käyttäen seuraavaa oligonukleotidiä alukkeena: . ♦ 35 34 106720 5'-AGATAAAGACCTGAATTCAGATGTTTTACAAT-3'
In vitro -mutatointi suoritetaan täsmälleen kuten yllä on kuvailtu. Plasmidit tarkistetaan restriktioanalyysin avulla 5 uuden EcoRI-kohdan läsnäolon osalta välittömästi aloitusko- donin vieressä, ja sekvenssianalyysin avulla. Yhtä plasmi-dia, joka sisältää oikean uuden EcoRI-kohdan. merkitään tunnuksella KS+/KEX1(EcoRIuusi).
10 KS+/KEX1(EcoRIuusi) pilkotaan EcoRI:llä ja HindIII:lla. ja 3,0 ke KEXl:n sisältävä fragmentti erotetaan 0,8 %:isella preparatiivisella agaroosigeelillä ja eristetään käyttäen Geneclean'ia (Bio 101 Inc., La Jolla, CA, USA).
15 GAPFL-promoottorifragmentin saamiseksi, plasmidi pJDB207/-GAPFL-HIR (eurooppalainen patenttihakemus n: o 225 633) pilkotaan Sällillä ja EcoRI:llä, ja 478 ep fragmentti eristetään käyttäen samaa menetelmää, jota kuvailtiin (Gene-clean, yllä).
20 0,2 pmoolia 478 ep Sall-EcoRI-promoottorifragmenttia, 0,2 pmoolia EcoRI-Hindlll-fragmenttia, joka sisältää täyspitkän KEXl-rakennegeenin, ja 0,1 pmoolia Sall-Hindlll:11a katkaistua hiivan monikopiovektori pDP34:ää (vrt. eurooppalai-25 nen patenttihakemus n:o 340 170) ligoidaan ja plasmideja valmistetaan transformoiduista E. coli JM 101-soluista. Yhtä oikeaa plasmidia nimitetään tunnuksella pDP34/GAPFL-KEX1.
30 Esimerkki 8: Liukoista vsca-aktiivisuutta koodittavan lyhennetyn KEX1-geenin konstruointi • · KEX1 koodittaa membraaniin sidottua karboksipeptidaasia -ysca:aa- , joka sijaitsee eritysmekanismin alueella, toden-35 näköisimmin Golgi'n laitteessa, ysca-proteiini sisältää aminoterminaalisen katalyyttisen domeenin, jota seuraa Asp-Glu-rikas hapan alue, transmembraanidomeeni ja C-terminaa- 35 106720 linen häntä. Erityksen mahdollistamiseksi alustaan virheellisellä reitillä, C-pään typistäminen on valittu menetelmä. Sopiva, yhdestä kohdasta pilkkova XhoI-kohta sijaitsee kohta kooditetun proteiinin transmembraanidomeenin yläpuo-5 lella happamen alueen lopussa.
KS+/KEX1(EcoRI uusi) pilkotaan EcoRI:llä ja XhoI:llä. ja 1,7 ke fragmentti, joka sisältää C-terminaalisesti typistetyn KEXl-geenin, eristetään. Tämä 1,7 ke KEXl-kooditusfrag-10 mentti ja 478 ep Sali/EcoRI GAPFL-promoottorifragmentti (esimerkki 7) liitetään sen jälkeen pDP34:n yhdestä kohdasta katkaisevaan Sali-kohtaan. Tuloksena olevaa plasmidia nimitetään pDP34/GAPFL-KEXl*:ksi. Liukoista ysca*:aa koodattava ORF, joka sisältää KEXl-peräiset sekvenssit, kuva-15 taan sekvenssiluettelossa kohdassa SEKV. ID. N:o 2.
Esimerkki 9: S. cerevisiae -kannan Tr 1176 transformointi a. S. cerevisiae kexl-mutanttikanta 96:n risteytys S. cere-20 visiae kanta BYS:n kanssa 1a itiöiden analysointi koskien g-tekiIän eritvskvkvä 1a karboksipeotidaasi vsca:n (KEX1-aeenin) aktiivisuutta 1 cerevisiaen kexl-mutanttikanta 96 (a, kexl, ade2, thrl), 25 joka saadaan hiivan Genetic Stock CenterTstä, Berkeley, USA, risteytetään S. cerevisiae -kantaan BYS232-31-42 (a, prbl-1, prcl-1, cpsl-3, lys2, leu2, his7) [Achstetter, T. ja Wolf, D.H. (1985) EMBO J. 4, 173-177; Wolf, D.H. ja
Ehmann, C. (1981) J. Bacteriol. 147. 418-426], joka sisäl-30 tää villityypin KEXl-alleelin. Genotyypiltään kexl/KEXl, diploidiset heterotsygoottisolut eristetään tästä ristey-.: tyksestä. Diploidisoluista peräisin olevat tetradit eritel lään geneettisten vakiomenetelmien mukaisesti [Hawthorne, D.C. ja Mortimer, R.K. (1960) Genetics 45, 1085-1110; Met-35 hods in Yeast Genetics 1986 (Sherman, F. et ai., ed.) Cold Spring Harbor Laboratory, N.Y.].
’tm >9 106720
Kunkin tetradin neljän itiön kyky erittää a-tekijää testataan. KEXl-villityypin ja kexl-mutantin pesäkkeiden erottamiseksi toisistaan käytetään feromonille superherkkää tes-tauskantaa S. cerevisiae RC629 (a, sst-2, ade2-l, ural, 5 his6, metl, canl, cyh2, rme) [Chan, R.K. ja Otte, C.K. (1982) Mol. Cell. Biol. 2, 11-20; Chan, R.K. ja Otte, C.K. (1982) Mol. Cell. Biol. 2, 21-29]. Kuten yksinkertaisten tumageenien koodittamista ominaisuuksista oli odotettavissa, kaikista analysoiduista tetradeista kunkin tetradin 10 kaksi itiötä erittää a-tekijää, kun taas kaksi muuta itiötä erittävät a-tekijää. α-pariutumistyyppiset villityypin KEX1-pesäkkeet inhiboivat testauskannan kasvua suuressa määrin, ja muodostavat siten laajan kehän ympärilleen, koska ne kykenevät prosessoimaan a-tekijän prekursorin 15 täydellisesti ja tuottamaan neljä aktiivista a-tekijämole-kyyliä yhdestä preskursorimolekyylistä. Päinvastaisesta kexl-mutanttipesäkkeet inhiboivat testauskannan kasvua vähemmässä määrin, ja muodostavat siten pienen kehän ympärilleen, koska ne kykenevät tuottamaan vain yhden valmiin 20 a-tekijämolekyylin yhdestä prekursorimolekyylistä.
Usean täydellisen tetradin itiöistä, jotka identifioidaan vajaavaisiksi kexl-geenin osalta edellä kuvaillun feromoni-määrityksen avulla, testataan lopuksi karboksipeptidaasi 25 yscarn spesifinen aktiivisuus. Soluja kasvatetaan, niiden membraaneja valmistetaan ja niistä testataan karboksipeptidaasi ysca-aktiivisuus käyttäen Cbz-Tyr-Lys-Arg:ia substraattina kuten on kuvailtu [Wagner, J.C. ja Wolf, D.H. (1987) FEBS Lett. 221, 2, 423-426]. Se tosiseikka, että 30 karboksipeptidaasi ysca-aktiivisuus puuttuu kexl-mutant-tisoluista, osoittaa, että KEX1 on tämän entsyymin rakenne-geeni. Tämä merkitsee sitä, että karboksipeptidaasi ysca on todella osallisena a-tekijän karboksiterminaalisessa prosessoinnissa.
35 - · . . · 37 106720 b. Varmistettujen kexl-mutanttien luokittelu perustuen proteaasien vscB. vscY ia vscS lisävaiavuuteen.
S. cerevisiaen kexl-mutantit luokitellaan ottamalla huomi-5 oon muiden proteiinien vajavuus (proteinaasi yscB, karbok-sipeptidaasi yscY ja karboksipeptidaasi yscS) ja kasvutekijöiden lisävaatimukset.
kexl-mutanttien soluaines, joita mutantteja valmistetaan 10 stationäärivaiheesta YPD-alustassa (Difco), suspendoidaan 200 μΐ:aan 20 mM Tris-HCl-puskuria pH 7,2 Eppendorf-mikro-fugissa, ja lasihelmiä (halkaisija 0,4 mm) lisätään kahteen kolmasosatilavuuteen saakka. Suspensiota ravistetaan voimakkaasti kolme kertaa 1 minuutin ajan pyörresekoittajalla, 15 jäähdyttäen ajoittain jäiden päällä.
Viiden minuutin sentrifugointi mahdollistaa supematantin raakauutteiden talteenoton. Nämä uutteet dialysoidaan 0,1 M imidatsoli-HCl-puskuria vastaan pH:ssa 5,2 0,1 mM ZnCl2:n 20 kanssa proteaasien aktivoimiseksi ja vapaiden aminohappojen poistamiseksi -uutteista.
Proteinaasi yscBrn aktiivisuudet määritetään Azocoll-testin mukaisesti [R.E. Ulane et ai. (1976) J. Biol. Chem. 251. 25 3367; E. Cabib et ai. (1973) Biochem. Biophys. Res. Commun.
50, 186; T. Saheki et ai. (1974) Eur. J. Biochem. 42, 621]. Proteiinipitoisuusmääritysten jälkeen, näyte-erä kustakin näytteestä täytetään 0,1 M natriumfosfaatti (NaPi)-puskurilla pH 7,0 100 pl:ksi, tarvittavien toisiaan vastaavien 30 proteiinimäärien säätämiseksi. Proteiiniliuokseen lisätään 500 μΐ Azocoll-suspensiota (240 mg 10 ml:ssa 0,1 M NaPi-,j puskuria, pH 7,0). Näitä seoksia inkuboidaan 30°C;ssa yhden tunnin ajan sekoituksessa. Sen jälkeen, kun 500 μΐ 10 %:ista trikloorietikkahappoa on lisätty, joka pysäyttää 35 reaktion, seoksia sentrifugoidaan kaksi kertaa ja superna-tanttien absorptiospektrit 520 nmtssä mitataan.
38 106720
Karboksipeptldaasien yscY ja yscS aktiivisuudet määritetään käyttäen kromogeenistä substraattia Cbz-Gln-Leu [vrt. D.H. Wolf et ai. (1978) FEBS Lett. 91, 59; D.H. Wolf et ai.
(1977) Eur. J. Biochem. 73, 553]. Dialysoidut uutteet jae-5 taan kolmeen osaan, ja kahteen niistä lisätään fenyylime-tyylisulfonyylifluoridia (PMSF) loppupitoisuuteen 1 mM tai EDTA:aa loppupitoisuuteen 5 mM, ko. kahden proteaasiaktii-visuuden estämiseksi selektiivisesti. PMSF nimittäin inhiboi karboksipeptidaasi yscY:n aktiivisuutta ja EDTA inhiboi 10 karboksipeptidaasi yscSrn aktiivisuutta. Kutakin seosta inkuboidaan inhibiittoreiden kanssa 25°C:ssa yhden tunnin ajan inhibition loppuunsaattamiseksi. Proteiinipitoisuuden määrittämisen jälkeen, kaksi erää inhibiittorin kanssa ja yksi erä ilman inhibiittoria kunkin näytteen kontrollina 15 täytetään 0,1 M NaPi-puskurilla pH 7,4 50 pl:aan saakka, jotta saataisiin yhtäläiset proteiinimäärät. Näihin prote-iiniliuoksiin lisätään seuraavat testiliuokset.
500 μΐ testiliuosta I; 20 L-aminohappo-oksidaasi 0,24 mg/ml piparj uuriperoksidaasi 0,40 mg/ml 0,01 mM MnCl2
0,1 M NaPi-puskurissa, pH 7,4 25 50 μΐ testiliuosta II
' o-dianisidiini 2 mg/ml vedessä 500 μΐ testiliuosta III 30 20 mM Cbz-Gly-Leu 0,2 M kaliumfosfaattipuskurissa, pH 7,4 «
Seoksia inkuboidaan 28°C:ssa yhden tunnin ajan, ja kun 100 μΐ 20 %:ista Triton X-100:aa on lisätty reaktion pysäyttä-35 miseksi, absorbanssit 405 nm:ssä mitataan.
Seuraavaa transformointia varten, aminohappoauksotrofimark- 106720 keri leusiinille rekisteröidään toistotekniikalla minimaa-limaljoilla, joihin on lisätty adeniinia, treoniinia, ly-siiniä ja histidiiniä, ja leusiinin kanssa tai ilman.
5 Edellä kuvailtujen määritysten avulla eristetään mutantte-ja, joita merkitään tunnuksella S. cerevisiae BYSkexl, joiden proteaasivajavuus (a, prb-1, prc-1, cps-3, kexl) on nelinkertainen ja jotka tarvitsevat ylimääräistä leusiinia.
10 c. ura3-vaiaan hiivakannan TR1176 tuottaminen
Tr 1176 on edellä kuvaillun kannan BYSkexl ura3-johdannainen. URA3-geenin hajauttaminen BYSkexl:ssä suoritetaan kuten eurooppalaisessa patenttihakemuksessa n:o 340 170 on 15 yksityiskohtaisesti esitetty. Tr 1176 sisältää seuraavat geneettiset markkerit: MATa, prb-1, prc-1, cps-1, kexl, ade2, leu2, ura3.
S. cerevisiae Tr 1176 transformoidaan plasmideilla 20 PDP34/GAPFL-KEX1 ja pDP34/GAPFL-KEXl*, käyttäen transfor-mointitoimenpideohjelmaa, jota Dohmen (yllä) on kuvaillut. Transformoidut hiivasolut valikoidaan hiivan minimaalialus-tamaljoilla, joita on täydennetty leusiinilla ja adeniinil-la, ja joista puuttuu urasiili. Erillisiä transformoituja 25 hiivapesäkkeitä eristetään ja niihin viitataan tunnuksilla:
Saccharomvces cerevisiae Tr 1176/pDP34/GAPFL-KEXl ja Saccharomvces cerevisiae Tr 1176/pDP34/GAPFL-KEXl* 30 Esimerkki 10: Liukoisen vsca:n biologinen aktiivisuus
Saccharomvces cerevisiae Tr 1176/pDP34/GAPFL-KEXl- ja Saccharomvces cerevisiae Tr 1176/pDP34/GAPFL-KEXl* -soluja kasvatetaan minimaalialustassa, joka sisältää: 35 40 106720
Difco'n Yeast Nitrogen Base'a ilman aminohappoja 8,4 g/1 glukoosia 20,0 g/1 L-asparagiinia 10,0 g/1 adeniinia 0,1 g/1 5 48 tunnin ajan 30°C:ssa ja 180 r.p.m.
Solut erotetaan alustasta sentrifugoimalla, solut suspen-doidaan uudelleen 0,9 %:iseen NaCl:iin ja niiden ysca-ak-10 tiivisuus testataan kehänmuodostuksen avulla a-tekijälle superherkkien a-solujen solukerroksessa (Chan, R.K. ja Otte, C.K. (1982) Mol. Cell. Biol. 2, 11-20). Kannalla Tr 1176 ilman plasmidia näkyy vain vähäinen kehä a-solukerrok-sessa, johtuen ysca-aktiivisuuden puuttumisesta. Kannat 15 Saccharomvces cerevisiae Tr 1176/pDP34/GAPFL-KEXl ja Sac-charomvces cerevisiae Tr 1176/pDP34/GAPFL-KEXl* osoittavat kumpikin kehänmuodostusta, joten liukoinen ysca on siis säilyttänyt normaalin biologisen funktionsa, so. α-faktorin prosessoimisen.
20
Saccharomvces -cerevisiae Tr 1176/pDP34/GAPFL-KEXl- ja Saccharomvces cerevisiae Tr 1176/pDP34/GAPFL-KEXl* -fermen-tointien (edellä) supernatanteista analysoidaan sen jälkeen ysca-aktiivisuuden läsnäolo alustassa, käyttäen synteettis-25 tä peptidisubstraattia Cbz-Tyr-Lys-Arg ja kuvailtua määritystä (Wolf, D.H. ja Weiser, U. (1977) Eur. J. Biochem. 73, 553-556). Vain Saccharomvces cerevisiae Tr 1176/pDP34/GAPFL-KEXl*:n supernatanteissa esiintyy tämän substraatin proteolyyttistä hajotusta, kun taas Saccharomv-30 ces cerevisiae Tr 1176/pDP34/GAPFL-KEXl:n supernatanteissa ei ole mitään aktiivisuutta Cbz-Tyr-Lys-Arg:ia kohtaan.
: Siitä johtuen voidaan päätellä, että KEX1* koodittaa biolo gisesti aktiivista ysca:aa, joka vapautuu alustaan. Uutta proteiinia nimitetään ysca:ksi.
35 4l 106720
Esimerkki 11: vsca:n puhdistaminen 5 ml ioninvaihtajaa Fractogel TSK DEAE 650 (Merck AG, Darmstadt, Saksa) pakataan kolonniin ja tasapainotetaan 50 mM 5 natriumfosfaattipuskurilla, pH 7,0. 80 ml Saccharomvces cerevisiae Tr 1176/pDP34/GAPFL-KEXl*:n (edellä) kasvulientä säädetään pH-arvoon 7,0 ja ladataan kolonniin yön yli. ysca* sitoutuu noissa olosuhteissa kolonniin. Sitoutuneet proteiinit eluoidaan sen jälkeen yhdistetyn pH/suola-gra-10 dientin avulla (40 ml 50 mM natriumfosfaattipuskuria pH 7,0 ja 40 ml 50 mM natriumfosfaattipuskuria pH 4,0 + 1 M NaCl:ia). Noin 0,2 M NaCl:n kohdalla ysca* eluoituu olennaisesti puhtaassa muodossa, jonka näennäinen molekyylipai-no on noin 66 kDa (laskettu molekyylipaino 65 kDa). Verrat-15 taessa porsaan haiman karboksipeptidaasi B:hen (Boehringer Mannheim, Saksa), ysca*:11a on samassa proteiinipitoisuudessa vastaava aktiivisuus substraattia Cbz-Tyr-Lys-Arg kohtaan pH:ssa 7,0, ja hieman korkeampi aktiivisuus pH:ssa 4,0.
20
Esimerkki 12: Yhdistelmäfuusiopeptidin konstruointi, loka ilmentää hirudiinia 1a ihmisen kalsitoniinia samanaikaisesti 25 Fuusiopeptidi konstruoidaan, joka mahdollistaa hirudiinin ; ja ihmisen kalsitoniinin prekursorin yhtäaikaisen ilmenemi sen. Kahden peptidin väliin liitetään KEX2/KEX1-tunnistus-kohta Lys-Arg, mikä mahdollistaa in vitro -prosessoinnin liukoisella yscF:llä ja liukoisella ysca*:llä (yllä).
30
Yksityiskohtaisesti esitettynä, plasmidi pJDB207/GAPFL-HIR (edellä, esimerkki 7) pilkotaan Sall:llä ja BamHI:llä. ja 0,7 ke fragmentti subkloonataan pBluescript KS+:n Sall-BamHI-kohtaan. Geeni, joka koodittaa ihmisen kalsitoniinin 35 C-terminaalista glysiiniprekursoria, kootaan yksittäisistä oligonukleotideistä kuten hirudiinin osalta on kuvailtu (vrt. eurooppalainen patenttihakemus n:o 168 342), ja subk- 4* 106720 loonataan pUC19:n PstI-kohtaan. Ihmisen kalsitoniinin pre-kursorin sekvenssi, joka sisältää 5*-laajennuksen, joka vastaa in vitro -prosessoinnista, kuvataan sekvenssiluette-lossa kohdassa SEKV. ID. N:o 3 (varmistettuna sekvenssiana-5 lyysillä).
132 emäsparia sisältävä PstI-fragmentti leikataan ja kloonataan hirudiinigeenin sisältävän Bluescript-vektorin Pstl-kohtaan. Transformanteista tarkistetaan insertin oikea 10 suuntautuminen, ja yhtä oikeaa plasmidia nimitetään KS+/-GAPFL-HIR-CALC:ksi.
Plasmidi pJDB207/GAPFL-HIR pilkotaan Sällillä ja Hindlllr-11a, ja 7 ke suuri vektorifragmentti eristetään. Plasmidi 15 PJDB207/GAPFL-HIR pilkotaan BamHI:llä ja Hindllltlla, jolloin saadaan 350 ep PH05-terminaattorifragmentti.
Lopuksi, pJDB207-vektorifragmentti, terminaattorifragmentti ja KS+/GAPFL-HIR-CALC:in Sali-BamHI-fragmentti ligoidaan 20 kolmoisligaatiossa, jolloin saadaan plasmidi pJDB207/GAPFL-HIR-CALC.
Saccharomvces cerevisiaen kanta HT246 (DSM 4084) transformoidaan plasmidilla pJDB207/GAPFL-HIR-CALC esimerkin 3 25 mukaisesti. Transformoidut hiivasolut valikoidaan hiivan minimaalialustamaljoilla, joista puuttuu leusiini. Erilli-siä transformoituja hiivasoluja eristetään ja niitä nimitetään tunnuksella S. cerevisiae HT246/pJDB207/GAPFL-HIR-CALC.
30
Fuusioproteiinin ilmentämistä ja erittämistä varten S.
• cerevisiae HT246/pJDB207/GAPFL-HIR-CALC;ia viljellään kuten eurooppalaisessa patenttihakemuksessa n:o 340 170 (esimerkki 10 siinä) on esitetty. Näytteitä otetaan 48 tunnin ja 72 35 tunnin viljelemisen jälkeen, solut poistetaan sentrifu-goimalla ja fuusioproteiinin sisältävä kasvusupernatantti viedään jatkoprosessointiin. Ensiksi, hirudiini-kalsitonii- • 43 106720 ni-fuusioproteiinin sisältävä supernatantti jaetaan osiin pilkkomalla typistetyn liukoisen yscF-proteiinin avulla esimerkin 6 mukaisesti. Tästä katkaisusta on tuloksena täyspitkä ihmisen kalsitoniinin prekursori ja hirudiiniva-5 rlantti, joka yhä sisältää lysiini-arginiini-jatkeen C- päässään. Tämä lysiini-arginiini jatke poistetaan pilkkomalla ysca*:lla käyttäen puhdistettua entsyymiä (katso esimerkki 11). Lysiini-arginiini-jatkeen oikea poistuminen osoitetaan reaktioseoksen käänteisfaasisella HPLC:llä kuten 10 eurooppalaisessa patenttihakemuksessa n:o 340 170 on esitetty .
Esimerkki 13; Yhdistelmäfuusioproteiinin konstruointi, loka ilmentää ealiini C:n 15
Fuusiopeptidi konstruoidaan, joka mahdollistaa kaavan P-L-T mukaisen fuusioproteiinin ilmentymisen, jossa kaavassa P on egliini C -polypeptidi (Rink, H. et ai., 1984 Nucl. Acids Res. 12, 6369-6387), L on linkkerisekvenssi Lys-Arg-20 Glu-Ala-Glu-Ala-Trp-Val-Pro, ja T on Cellulomonas f imin Exg-proteiinin selluloosaan sitoutuva domeeni, jota proteiinia koodittaa Cellulomonas fimin cex-geeni (Neill G.O. et ai., 1986 Gene 44, 325-330).
25 Yksityiskohtaisesti esitettynä, plasmidi pEC-1 (Neill, G.O.
"I et ai., 1986 Gene 44, 325-330) katkaistaan kokonaan Smal:- llä ja Stulillä. Sellulomonadin cex-geenin 433 ep fragmentti, joka koodittaa selluloosaa sitovaa domeenia, eristetään. Plasmidi pl8kexp (esimerkki 1) katkaistaan Asp718:11a 30 ja tarttuvat päät täytetään käyttäen Klenow-polymeraasia, josta on tuloksena tasaiset päät. Linearisoitu plasmidi ·· ligoidaan 433 ep Smal-Stul cex-fragmentin kanssa ja trans formoidaan E. coli HB101:een. Klooneista tarkistetaan 433 ep cex-fragmentin suuntautuminen. Yhtä kloonia, jolla on 35 orientaatio, joka kytkee KEX2-geenin lukukehyksen cex-gee-nin lukukehykseen, nimitetään pl8kexpcex:ksi.
. · * 44 106720
Plasmidi pUC19 katkaistaan Sällillä ja BamHIillä. ja pBR322:n 276 ep Sall-BamHI-fraamentti liitetään. Tuloksena oleva plasmidi pUC19pBR katkaistaan BamHIillä ja EcoRIillä ja ligoidaan BamHI-EcoRI GAPDH-promoot tori fragmentin läsnä-5 ollessa, mistä on tuloksena plasmidi pTMl. pTMl katkaistaan EcoRIillä ja seuraava linkkeri liitetään 5’-AATTCATGCA TGCATGCAGA TCT-3' 3'-GTACGT ACGTACGTCT AGATTAA-5' 10 sillä tavalla, että EcoRI-kohta järjestäytyy uudelleen promoottorisekvenssien vieressä. Tuloksena olevaa plasmidia nimitetään pTM2iksi.
15 Plasmidi pML147 (Rink H. et ai., 1984 Nucl. Acids Res. 12, 6369-6387) hydrolysoidaan loppuun EcoRIillä ja BamHIillä. EcoRI-BamHI egliini C -fragmentti kloonataan EcoRI-BamHIi-llä katkaistuun pBR322ieen. Yhtä plasmidia, jolla on haluttu sekvenssi, nimitetään pML141iksi. Oligonukleotidejä 20 5'-CCGGTACCCA AGCTTCGGCT TCTCTCTTAC CAACATGCGG AACATG-3' ja 5'-CGGGATCCAA GAATTCATGA CTGAATT-3 ' 25 käyttäen (sekvenssi, joka koodittaa edellä viitattua link-Ί kerisekvenssi Liää, on alleviivattu) pML141illä suoritetaan PCR-reaktio (polymeraasiketjureaktio), käyttäen PCR-pak-kausta Perkin-Elmer-Cetus'lta ja noudattamalla tarkoin toimittajan ohjeita. PCR-reaktiosta on seurauksena 257 ep 30 fragmentin laajentuminen, joka fragmentti sisältää egliini C -geenin yhdityneenä linkkerisekvenssi L:ään. Fragmentti *: eristetään agaroosigeelistä ja katkaistaan loppuun BamHI;- llä ja Asn718;lla. Plasmidi pl8kexpcex (katso edellä) katkaistaan loppuun BamHI:llä ja Asp718:lla, ja 3,1 ke frag-35 mentti eristetään. 3,1 ke BamHI-Asp718 pl8kexpcex -fragmentti, joka sisältää cex-geeni fragment in ja pUCl 9-sekvenssit, ligoidaan PCR:llä luodun BamHI-Asp718 egliini C -frag- » « 45 106720 mentin kanssa, ja tuloksena olevaa plasmidia nimitetään pl8egliinicex:ksi. Plasmidi sisältää avoimen lukukehyksen, joka ulottuu egliini C:n ensimmäisestä aminohaposta Exg-proteiinin viimeiseen aminohappoon. Kyseiset kaksi domee-5 nia, so. egliini C ja Exg:n 133 C-terminaalista aminohappoa (mukaanlukien ylimääräinen proliini), erotetaan edellä esitetyllä linkkerisekvenssillä. Fuusioproteiinia kooditta-va nukleotidisekvenssi (katso SEKV. ID. N:o 4) varmistetaan DNA-sekvensoinnin avulla.
10
Plasmidi pTM2 katkaistaan EcoRI:llä ja 5'-päät defosfory-loidaan. Plasmidi pl8egliinicex katkaistaan EcoRI;llä. ja 686 ep egliini-cex-fragmentti eristetään. Tämä 686 ep fragmentti liitetään EcoRI:llä katkaistuun ja defosforyloituun 15 vektori pTM2:een. Tuloksena olevista klooneista tarkistetaan egliini-cex-fragmentin suuntaus. Yhtä kloonia, jolla on haluttu suuntaus, mikä johtaa seuraavaan sekvenssijärjestykseen GAPDH-egliini-cex, nimitetään pl9/GAPDH-EGLIINI-CEX:ksi.
20
Plasmidi pl9/GAPDH-EGLIINI-CEX pilkotaan BamHI:llä ja Bglllilla, ja 1,1 ke fragmentti, joka koodittaa GAPDH-eg-liini-cex-sekvenssejä, eristetään. Plasmidi pDP34 katkaistaan BamHI:llä, 5'-päät defosforyloidaan, ja tuloksena 25 oleva fragmentti ligoidaan 1,1 ke BamHI-Bglll-fragmentin • kanssa. Klooneista tarkistetaan 1,1 ke BamHI-Bglll-fragmentin suuntaus ja niitä nimitetään tunnuksilla pDP34GAPDH-egliinicex-1 ja pDP34GAPDH-egliinicex-2, joissa viiteindek-si 1 osoittaa, että insertti GAPDH-egliini-cex on myötäpäi- 30 vään suuntautunut plasmidissa pDP34, kun taas viiteindeksi 2 osoittaa vastapäiväisen orientaation.
• · pDP34GAPDH-egliini-l transformoidaan Saccharomvces cere-visiae -kantaan AB110 (ATCC 20796) esimerkin 3 mukaisesti.
35 AB110/pDP34GAPDH-egliinicex-l -soluja kasvatetaan 10 ml:ssa minimaalialustaa (Difco'n Yeast Nitrogen Base'a ilman aminohappoja 6,7 g/1, glukoosia 40 g/1, aminohappo/nukleoti- „ 106720 46 diseosta esimerkin 3 mukaisesti ilman leusiinia) 24 tunnin ajan 30°C:ssa 180 rpmrssä. Pääviljelmät, 250 ml minimaa-lialustaa siirrostetaan esiviljelmällä ja kasvatetaan 30°C:ssa 24 tunnin ajan 180 rpm:ssä. Tuotantoviljelmä val-5 mistellaan seuraavasti: pääviljelmän solut erotetaan kasvu-liemestä sentrifugoimalla, suspendoidaan uudelleen 250 ml:aan kaksinkertaista minimaalialustaa (Difco'n Yeast Nitrogen Base'a ilman aminohappoja 13,4 g/1, glukoosia 40 g/1, 2x aminohappo/nukleotidiseosta esimerkin 3 mukaisesti 10 ilman leusiinia) ja fermentoidaan 30°C:ssa 24 tuntia 180 rpm.
Tuotantoviljelmän solut erotetaan kasvualustasta sentrifugoimalla, pestään ensin 200 ml:ssa ja sitten 40 ml:ssa 15 puskuria A (puskuri A: 50 mM Tris-HCl pH 7,0, 100 mM NaCl). Solut rikotaan lasihelmien kanssa toistuvina vaiheina, joista kukin noin 10 ml:ssa puskuria A, ja kokonaistilavuudeltaan 40 ml oleva raakauute kirkastetaan sentrifugoimalla (25000 x g, 15 min. 4°C). 5 g (kuivapainoa) selluloosaa 20 (Avicel tai kuituinen selluloosa) lisätään raakauutteeseen ja inkuboidaan pyöriväliikkeisessä ravistelijassa 1,5 tunnin ajan 4°C:ssa.
Selluloosaan sitoutunut fuusioproteiini eluoidaan vedellä 25 fuusioproteiinina, ja pilkotaan jälkeenpäin yscF:llä, josta "I on tuloksena egliini C, jossa on C-terminaalinen Lys-Arg- jatke. Nämä kaksi C-terminaalista aminohappoa poistetaan pilkkomalla ysca:lla. Yksityiskohtaisesti: Raakauutteessa inkuboinnin jälkeen selluloosa pakataan kromatografiakolon-30 niin (1,6 x 20 cm) ja pestään kolonnissa kolmella pakatun kolonnin tilavuudella puskuri A:ta. Sen jälkeen lisätään : puskuri A:ta ja vettä käsittävä gradientti. Gradientti on lineaarinen ja ulottuu tasosta 100 % puskuri A:ta, 0 % vettä tasolle 0 % puskuri A:ta, 100 % vettä kolmen kolonni-35 peti tilavuuden puitteissa. Fraktioita kerätään ja testataan fuusioproteiinin osalta immunologisella menetelmällä, jota kuvailtiin esimerkissä 5. Fuusioproteiinin sisältäviä frak- • 47 106720 tioita käsitellään liukoisella proteaasi yscFjllä kuten esimerkissä 6 on kuvailtu, mistä on tuloksena katkaisutuote egliini C-Lys-Arg, joka pilkotaan myöhemmin liukoisella yscailla Lys-Arg-hännän poistamiseksi.
5
Selluloosaan sidottu fuusioproteiini pilkotaan vaihtoehtoisesti yscF:llä sen ollessa sidottuna selluloosaan, ja proteiini, joka sisältää egliini C:n C-terminaalisen Lys-Arg-jatkeen kanssa, vapautetaan. Tämä proteiini pilkotaan myö-10 hemmin ysca*:llä kahden C-terminaalisen aminohapon poistamiseksi. Yksityiskohtaisesti: eri selluloosamääriä (10 mg -500 mg), inkuboinnin jälkeen raakauutteen kanssa, inkuboi-daan liukoisen proteaasi yscF:n kanssa kuten esimerkissä 6 on kuvailtu, jossa yhteydessä egliini C-Lys-Arg vapaute-15 taan. Egliini C-Lys-Arg pilkotaan edelleen liukoisella ysca*:llä Lys-Arg-hännän poistamiseksi* Saatu egliini C on identtinen rakenteeltaan luonnollisen egliini C:n kanssa, osoitettuna HPLC:n avulla.
20 Mikro-organismien tallentaminen
Seuraavat mikro-organismikannat talletettiin the Deutsche Sammlung von Mikroorganismen (DSM)'iin, Mascheroder Weg Ib, D-3300 Braunschweig (annetut talletuspäivämäärät ja 25 talletusnumerot): «· *· *
Escherichia coll JMl09/pDP34: 14. maaliskuuta, 1988, DSM 4473.
Saccharomvces cerevisiae BYS232-31-42: 6. toukokuuta, 1988, 30 DSM 4583.
Escherichia coli JM101/pKS301b: 25. kesäkuuta, 1990, DSM *: 6028.
Escherichia coli HB101/KEX1: 25. kesäkuuta, 1990, DSM 6027. Escherichia coli JM101/pl9/GAPDH-EGLIINI-CEX: 3. kesäkuuta, 35 1991, DSM6546.
. · 106720 SEKV. ID. N:o 1
Sekvenssityyppi: Polynukleotidi vastaavan polypeptidin kanssa
Sekvenssin pituus: 1866 emäsparia 5 Juosteisuus: kaksinkertainen
Topologia: lineaarinen Lähde: hiivan genominen DNA
Välitön koelähde: E. coli JM101/pKS301b (DSM6028) Yksityiskohdat: 1-1866, liukoisen yscF:n kooditusalue ATG AAA GTG AGG AAA TAT ATT ACT TTA TGC TTT TGG TGG 39
Met Lys Vai Arg Lys Tyr Ile Thr Leu Cys Phe Trp Trp 1 5 10 GCC TTT TCA ACA TCC GCT CTT GTA TCA TCA CAA CAA ATT 78
Ala Phe Ser Thr Ser Ala Leu Vai Ser Ser Gin Gin Ile 15 20 25 CC A TTG AAG GAC CAT ACG TCA CGA CAG TAT TTT GCT GTA 117
Pro Leu Lys Asp Hi s Thr Ser Arg Gin Tyr Phe Ala Vai 30 35 GAA AGC AAT G AA ACA TTA TCC CGC TTG GAG GAA ATG CAT 156
Glu Ser Asn Glu Thr Leu Ser Arg Leu Glu Glu Met His 40 45 50 • CCA AAT TGG AAA TAT GAA CAT GAT GTT CGA GGG CTA CCA 195
Pro Asn Trp Lys Tyr Glu His Asp Val Arg Gly Leu Pro 55 60 65 AAC CAT TAT GTT TTT TCA AAA GAG TTG CTA AAA TTG GGC 234 . Asn His iyr Val Phe Ser Lys Glu Leu Leu Lys Leu Gly 70 75 AAA AGA TCA. TCA TTA GAA GAG TTA CAG GGG GAT AAC AAC 279
Lys Arg Ser Ser Leu Glu Glu Leu Gin Gly Asp Asn Asn 80 85 90 . * * 49 106720 G AC CAC ΑΤΑ TTA TCT GTC CAT G AT TTA TTC CCG CGT AAC 312
Asp His Ile Leu Ser Vai His Asp Leu Phe Pro Arg Asn 95 100 GAC CTA TTT AAG AGA CTA CCG GTG CCT GCT CC A CCA ATG 351
Asp Leu Phe Lys Arg Leu Pro Vai Pro Ala Pro Pro Met 105 110 115 GAC TCA AGC TTG TTA CCG GTA AAA GAA GCT GAG GAT AAA 390
Asp Ser Ser Leu Leu Pro Vai Lys Glu Ala Glu Asp Lys 120 125 130 CTC AGC ΑΤΑ AAT GAT CCG CTT TTT GAG AGG CAG TGG CAC 429
Leu Ser Ile Asn Asp Pro Leu Phe Glu Arg Gin Trp His 135 140 TTG GTC AAT CCA AGT TTT CCT GGC AGT GAT ATA AAT GTT 468
Leu Vai Asn Pro Ser Phe Pro Gly Ser Asp Ile Asn Vai 145 150 155 CTT GAT CTG TGG TAC AAT AAT ATT ACA GGC GCA GGG GTC 507
Leu Asp Leu Trp Tyr Asn Asn Ile Thr Gly Ala Gly Vai 160 · 165 GTG GCT GCC ATT GTT GAT GAT GGC CTT GAC TAC GAA AAT 546
Vai Ala Ala Ile Vai Asp Asp Gly Leu Asp Tyr Glu Asn 170 175 180 GAA GAC TTG AAG GAT AAT TTT TGC GCT GAA GGT TCT TGG 585 >: Glu Asp Leu Lys Asp Asn Phe Cys Ala Glu Gly Ser Trp 185 190 195 GAT TTC AAC GAC AAT ACC AAT TTA CCT AAA CC A AGA TTA 624
Asp Phe Asn Asp Asn Thr Asn Leu Pro Lys Pro Arg Leu 200 205 50 106720 TCT GAT GAC TAC CAT GGT ACG AGA TGT GCA GGT GAA ATA 663
Ser Asp Asp Tyr His Gly Thr Arg Cys Ala Gly Glu lie 210 215 220 GCT GCC AAA AAA GGT AAC AAT TTT TGC GGT GTC GGG GTA 7 02
Ala Ala Lys Lys Gly Asn Asn Phe Cys Gly Vai Gly Val 225 230 GGT TAC AAC GCT AAA ATC TCA GGC ATA AGA ATC TTA TCC 741
Gly Tyr Asn Ala Lys lie Ser Gly lie Arg lie Leu Ser 235 240 245 GGT GAT ATC ACT ACG GAA GAT GAA GCT GCG TCC TTG ATT 780
Gly Asp lie Thr Thr Glu Asp Glu Ala Ala Ser Leu lie 250 255 260 TAT GGT CTA GAC GTA AAC GAT ATA TAT TCA TGC TCA TGG 819
Tyr Gly Leu Asp Val Asn Asp lie Tyr Ser Cys Ser Trp 265 270 GGT CCC GCT GAT GAC GGA AGA CAT TTA CAA GGC CCT AGT 858
Gly Pro Ala Asp Asp Gly Arg His Leu Gin Gly Pro Ser 275 280 285 GAC CTG GTG AAA AAG GCT TTA GTA AAA GGT GTT ACT GAG 897
Asp Leu Val Lys Lys Ala Leu Val Lys Gly Val Thr Glu 290 295 GGA AGA GAT TCC AAA GGA GCG ATT TAC GTT TTT GCC AGT 936 : Gly Arg Asp Ser Lys Gly Ala lie Tyr Val Phe Ala Ser 300 305 310 GGA AAT GGT GGA ACT CGT GGT GAT AAT TGC AAT TAC GAC 975
Gly Asn Gly Gly Thr Arg Gly Asp Asn Cys Asn Tyr Asp 315 320 325 106720 GGC TAT ACT AAT TCC ATA TAT TCT ATT ACT ATT GGG GCT 1014
Gly Tyr Thr Asn Ser lie Tyr Ser lie Thr lie Gly Ala 330 335 ATT GAT CAC AAA GAT CTA CAT CCT CCT TAT TCC GAA GGT 1053 lie Asp His Lys Asp Leu His Pro Pro Tyr Ser Glu Gly 340 345 350 TGT TCC GCC GTC ATG GCA GTC ACG TAT TCT TCA GGT TCA 1092
Cys Ser Ala Val Met Ala Val Thr Tyr Ser Ser Gly Ser 355 360 GGC GAA TAT ATT CAT TCG AGT GAT ATC AAC GGC AGA TGC 1131
Gly Glu Tyr lie His Ser Ser Asp lie Asn Gly Arg Cys 365 370 375 AGT. AAT AGC CAC GGT GGA ACG TCT GCG GCT GCT CCA TTA 117 0
Ser Asn Ser His Gly Gly Thr Ser Ala Ala Ala Pro Leu 380 385 390 GCT GCC GGT GTT TAC ACT TTG TTA CTA GAA GCC AAC CCA 12 09
Ala Ala Gly Val Tyr Thr Leu Leu Leu Glu Ala Asn Pro 395 400 AAC CTA ACT TGG AGA GAC GTA CAG TAT TTA TCA ATC TTG 1248
Asn Leu Thr Trp Arg Asp Val Gin Tyr Leu Ser lie Leu 405 410 415 TCT GCG GTA GGG TTA GAA AAG AAC GCT GAC GGA GAT TGG 1287
Ser Ala Val Gly Leu Glu Lys Asn Ala Asp Gly Asp Trp 420 425 AGA GAT AGC GCC ATG GGG AAG AAA TAC TCT CAT CGC TAT 1326
Arg Asp Ser Ala Met Gly Lys Lys Tyr Ser His Arg Tyr 430 435 440 • 52 106720 GGC TTT GGT AAA ATC GAT GCC CAT AAG TTA ATT GAA ATG 1365
Gly Phe Gly Lys lie Asp Ala His Lys Leu lie Glu Met 445 450 455 • TCC AAG ACC TGG GAG AAT GTT AAC GCA CAA ACC TGG TTT 14 04
Ser Lys Thr Trp Glu Asn Val Asn Ala Gin Thr Trp Phe 460 465 TAC CTG CCA AC A TTG TAT GTT TCC CAG TCC ACA AAC TCC 1449
Tyr Leu Pro Thr Leu Tyr Val Ser Gin Ser Thr Asn Ser 470 475 480 ACG GAA GAG ACA TTA GAA TCC GTC ATA ACC ATA TCA GAA 1482
Thr Glu Glu Thr Leu Glu Ser Val lie Thr lie Ser Glu 485 490 AAA AGT CTT CAA GAT GCT AAC TTC AAG AGA ATT GAG CAC 1521
Lys Ser Leu Gin Asp Ala Asn Phe Lys Arg lie Glu His 495 500 505 GTC ACG GTA ACT GTA GAT ATT GAT ACA GAA ATT AGG GGA 1560
Val Thr Val Thr Val Asp lie Asp Thr Glu lie Arg Gly 510 ' 515 520 ACT ACG ACT GTC GAT TTA ATA TCA CCA GCG GGG ATA ATT 159 9
Thr Thr Thr Val Asp Leu lie Ser Pro Ala Gly lie lie 525 530 TCA AAC CTT GGC GTT GTA AGA CCA AGA GAT GTT TCA TCA 1638 : Ser Asn Leu Gly Val Val Arg Pro Arg Asp Val Ser Ser 535 540 545 GAG GGA TTC AAA GAC TGG ACA TTC ATG TCT GTA GCA CAT 1677
Glu Gly Phe Lys Asp Trp Thr Phe Met Ser Val Ala His 550 555 » 53 106720 TGG GGT GAG AAC GGC GTA GGT GAT TGG AAA ATC AAG GTT 1716
Trp Gly Glu Asn Gly Vai Gly Asp Trp Lys Ile Lys Val 560 565 570 AAG AC A AC A GAA AAT GGA CAC AGG ATT GAC TTC CAC AGT 1755
Lys Thr Thr Glu Asn Gly His Arg lie Asp Phe His Ser 575 580 585 TGG AGG CTG AAG CTC TTT GGG GAA TCC ATT GAT TCA TCT 17 94
Trp Arg Leu Lys Leu Phe Gly Glu Ser lie Asp Ser Ser 590 595 AAA ACA GAA ACT TTC GTC TTT GGA AAC GAT AAA GAG GAG 1833
Lys Thr Glu Thr Phe Val Phe Gly Asn Asp Lys Glu Glu 600 605 610 GTT GAA CCA GGG GTA CCG AGC TCG AAT TCG TAA 1866
Val Glu Pro Gly Val Pro Ser Ser Asn Ser 615 620 : J · 54 106720 SEKV. ID. N:o 2 * Sekvenssityyppi: Polynukleotidi vastaavan polypeptidin kanssa
5 Sekvenssin pituus: 1797 emäsparia Juosteisuus: kaksinkertainen Topologia: lineaarinen Lähde: hiivan genominen DNA
Välitön koelähde: E. coli HB101/KEX1 (DSM6027) 10 yksityiskohdat: 1-1797, liukoisen ysca:n kooditusalue ATG TTT TAC AAT AGG TGG CTC GGA ACG TGG CTA GCC ATG 39
Met Phe Tyr Asn Arg Trp Leu Gly Thr Trp Leu Ala Met 15 10 TCT GCT TTA ATA AGG ATC TCA GTA TCC CTT CCG TCA TCT 78
Ser Ala Leu Ile Arg Ile Ser Vai Ser Leu Pro Ser Ser 15 20 25 GAG GAG TAC AAA GTG GCA TAT GAG CTG TTG CCA GGG TTA 117
Glu Glu Tyr Lys Vai Ala Tyr Glu Leu Leu Pro Gly Leu 30 35 TCT GAA GTG CCA GAC CCT TCA AAT ATT CCA CAG ATG CAT 156
Ser Glu Vai Pro Asp Pro Ser Asn Ile Pro Gin Met His 40 45 50 GCT GGC CAT ATT CCT TTA CGT TCC GAA GAT GCG GAT GAA 195
Ala Gly His Ile Pro Leu Arg Ser Glu Asp Ala Asp Glu 55 60 65 CAG GAT AGC TCT GAC TTG GAG TAC TTT TTT TGG AAG TTT 234
Gin Asp Ser Ser Asp Leu Glu Tyr Phe Phe Trp Lys Phe 70 75 ACC AAT AAC GAC TCT AAT GGC AAT GTC GAC CGT CCC TTA 279
Thr Asn Asn Asp Ser Asn Gly Asn Vai Asp Arg Pro Leu 80 85 90 55 106720 ATT ΑΤΑ TGG TTA AA GGT GGA CCC GGT TGC TCT TCC ATG 312 lie lie Trp Leu Asn Gly Gly Pro Gly Cys Ser Ser Met 95 100 GAT GGT GCC TTG GTC GAA TCC GGC CCT TTT AGG GTG AAT 3 51
Asp Gly Ala Leu Val Glu Ser Gly Pro Phe Arg Val Asn 105 110 115 TCA GAC GGT AAA CTT TAT CTA AAT GAA GGG TCC TGG ATA 390
Ser Asp Gly Lys Leu Tyr Leu Asn Glu Gly Ser Trp lie 120 125 130 TCC AAA GGC GAT CTT TTA TTT ATC GAC CAA CCT ACT GGT 429
Ser Lys Gly Asp Leu Leu Phe lie Asp Gin Pro Thr Gly 135 140 ACT GGG TTT TCT GTC GAA CAA AAT AAA GAC GAA GGT AAA 468
Thr Gly Phe Ser Val Glu Gin Asn Lys Asp Glu Gly Lys 145 150 155 ATC GAC AAA AAC AAA TTT GAC GAA GAC CTA GAA GAT GTG 507 lie Asp Lys Asn Lys Phe Asp Glu Asp Leu Glu Asp Val 160 165 ACC AAG CAT TTT ATG GAT TTT CTG GAG AAC TAT TTC AAG 54 6
Thr Lys His Phe Met Asp Phe Leu Glu Asn Tyr Phe Lys 170 175 180 ATT TTT CCA GAA GAC CTC ACT AGG AAA ATC ATA CTA TCG 585 lie Phe Pro Glu Asp Leu Thr Arg Lys lie lie Leu Ser 185 190 195 GGT GAA AGT TAC GCT GGC CAA TAC ATA CCA TTC TTT GCC 624
Gly Glu Ser Tyr Ala Gly Gin Tyr lie Pro Phe Phe Ala 200 205 56 106720 AAT GCA ATT TTG AAC CAT AAC AAA TTT TCA AAG ATC GAC 663
Asn Ala Ile Leu Asn His Asn Lys Phe Ser Lys Ile Asp 210 215 220 GGG GAT AC A TAC GAC TTG AAG GCG CTA TTG ATT GGT AAC 7 02
Gly Asp Thr Tyr Asp Leu Lys Ala Leu Leu Ile Gly Asn 225 230 GGT TGG ATT GAC CCC AAT ACA CAG TCC CTA TCG TAC CTT 741
Gly Trp Ile Asp Pro Asn Thr Gin Ser Leu Ser Tyr Leu 235 240 245 CCG TTT GCT ATG GAG AAG AAA CTG ATT GAT GAA AGC AAC 780
Pro Phe Ala Met Glu Lys Lys Leu Ile Asp Glu Ser Asn 250 255 260 CCC AAT TTC AAA CAC TTA ACG AAC GCA CAC G AG AAT TGC 819
Pro Asn Phe Lys His Leu Thr Asn Ala His Glu Asn Cys 265 270 CAG AAT CTG ATA AAC TCT GCC AGT ACA GAT GAG GCA GCC 858
Gin Asn Leu Ile Asn Ser Ala Ser Thr Asp Glu Ala Ala 275 280 285 CAT TTT TCG TAT CAG GAA TGT GAG AAT ATT TTA AAC CTT 897
His Phe Ser Tyr Gin Glu Cys Glu Asn Ile Leu Asn Leu 290 295 CTA TTG TCT TAT ACC AGG GAA TCT TCG CAA AAG GGA ACA 936
Leu Leu Ser Tyr Thr Arg Glu Ser Ser Gin Lys Gly Thr 300 305 310 GCG G AT TGC TTG AAC ATG TAT AAC TTC AAT TTA AAA GAT 975
Ala Asp Cys Leu Asn Met Tyr Asn Phe Asn Leu Lys Asp 315 320 325 57 106720 AGT TAT CCA TCT TGT GGT ATG AAT TGG CCG AAA GAT ATT 1014
Ser Tyr Pro Ser Cys Gly Met Asn Trp Pro Lys Asp lie 330 335 TCC TTT GTC AGT AAA TTC TTC AGC AC A CCT GGT GTT ATT 1053
Ser Phe Val Ser Lys Phe Phe Ser Thr Pro Gly Val lie 340 345 350 GAT TCG TTG CAT CTT GAT TCT GAT AAA ATT GAT CAT TGG 1092
Asp Ser Leu His Leu Asp Ser Asp Lys lie Asp His Trp 355 360 AAG GAA TGC ACT AAT AGC GTT GGA ACT AAA TTG TCT AAT 1131
Lys Glu Cys Thr Asn Ser Val Gly Thr Lys Leu Ser Asn 365 370 375 CCT ATT TCA AAG CCA TCT ATC CAT TTA TTA CCT GGT CTA 117 0
Pro lie Ser Lys Pro Ser lie His Leu Leu Pro Gly Leu 380 385 390 CTT GAA AGT GGA ATA GAG ATT GTC TTG TTC AAT GGT GAC 12 09
Leu Glu Ser Gly lie Glu lie Val Leu Phe Asn Gly Asp 395 400 • o ‘ AAA GAC TTG ATT TGT AAT AAC AAG GGC GTA TTA GAT ACT 1248
Lys Asp Leu lie Cys Asn Asn Lys Gly Val Leu Asp Thr 405 410 415 ATA GAC AAT CTA AAA TGG GGT GGA ATA AAG GGA TTT AGC 1287 lie Asp Asn Leu Lys Trp Gly Gly lie Lys Gly Phe Ser 420 425 GAC GAT GCT GTT TCG TTC GAT TGG ATC CAT AAA TCG AAG 1326
Asp Asp Ala Val Ser Phe Asp Trp lie His Lys Ser Lys 430 435 440 ♦ se 106720 AGT ACA GAC GAC AGC GAA GAA TTT AGC GGA TAC GTG AAG 13 65
Ser Thr Asp Asp Ser Glu Glu Phe Ser Gly Tyr Val Lys 445 450 455 TAT GAT AGA AAT TTG ACG TTT GTT AGC GTT TAT AAT GCT 1404
Tyr Asp Arg Asn Leu Thr Phe Val Ser Val Tyr Asn Ala 460 465 TCT CAC ATG GTA CCC TTC GAT AAA AGT TTA GTG AGT AGA 1443
Ser His Met Val Pro Phe Asp Lys Ser Leu Val Ser Arg 470 475 480 GGC ATT GTC GAT ATT TAC TCG AAC GAT GTT ATG ATC ATT 1482
Gly lie Val Asp lie Tyr Ser Asn Asp Val Met lie lie 485 490 GAC AAC AAT GGG AAA AAT GTT ATG ATT ACT ACT GAC GAC 1521
Asp Asn Asn Gly Lys Asn Val Met lie Thr Thr Asp Asp 495 · 500 505 GAT AGT GAT CAA GAT GCT ACT ACT GAA AGC GGT GAT AAG 1560
Asp Ser Asp Gin Asp Ala Thr Thr Glu Ser Gly Asp Lys 510 515 520 • CCA AAA GAA AAC CTC GAA GAG GAA GAA CAG GAA GCG CAG 1599
Pro Lys Glu Asn Leu Glu Glu Glu Glu Gin Glu Ala Gin 525 530 AAT GAG GAA GGA AAG GAA AAA GAA GGC AAT AAA GAT AAA 1638
Asn Glu Glu Gly Lys Glu Lys Glu Gly Asn Lys Asp Lys 535 540 545 GAT GGC GAT GAT GAT AAC GAC AAT GAT GAC GAC GAT GAA 1677
Asp Gly Asp Asp Asp Asn Asp Asn Asp Asp Asp Asp Glu 550 555 59 106720 GAC GAT CAC AAC TCC GAG GGC GAC GAC GAT GAT GAC GAT -1716
Asp Asp His Asn Ser Glu Gly Asp Asp Asp Asp Asp Asp 560 565 570 GAC GAT GAT GAA GAC GAT AAT AAT GAA AAA CAA AGT AAT 1755
Asp Asp Asp Glu Asp Asp Asn Asn Glu Lys Gin Ser Asn 575 580 585 CAA GGC CTC GAC TAC GTC GTA AGG CCG TTT CTG AC A GAG 17 94
Gin Gly Leu Asp Tyr Vai Val Arg Pro Phe Leu Thr Glu 590 595 TAA 1797 106720 60 SEKV. ID. N:o 3
Sekvenssityyppi: Polynukleotidi vastaavan polypeptidin kanssa 5 Sekvenssin pituus: 132 emäsparia Juosteisuus: kaksinkertainen Topologia: lineaarinen
Välitön koelähde: S. cerevisiae HT246/pJDB207/GAPFL-HIR-CALC
10 Yksityiskohdat: 1-7, linkkerisekvenssi, joka sisältää Pstl-restriktiokohdan ja linkkerin kooditusalueen, joka on katkaistavissa yscF:llä ja ysca*:llä; 8-127, kooditusalue ihmisen kalsitoniinin C-terminaaliselle glysiiniprekurso-rille; 125-132, sekvenssi, joka sisältää Pstl-restriktio-15 kohdan G AAG AGG G TA CAG CTG GAT AAA AGA TGT GGT AAC TTG TCT 40
Lys Arg Vai Gin Leu Asp Lys Arg Cys Gly Asn Leu Ser 5 10 ACC TGT ATG TTG GGT ACC TAC ACC CAA GAC TTC AAC AAG 79
Thr Cys Met Leu Gly Thr Thr Thr Gin Asp Phe Asn Lys 15 20 25 TTC CAC ACC TTC CC A CAA ACC GCT ATC GGT GTT GGT GCT 118 ·* Phe His Thr Phe Pro Gin Thr Ala Ile Gly Vai Gly Ala 30 35 CCA GGT TGA CTGCA 132
Pro Gly 40 ·· 61 106720 SEKV. ID. N:o 4 Sekvenssityyppi: Polypeptidi Sekvenssin pituus: 212 aminohappoa Topologia: lineaarinen 5 Välitön koelähde: S. cerevisiae AB110/pDP34GAPDH-egliini-cex-1
Yksityiskohdat: 1-71, egliini C:n aminohapposekvenssi; 72-79, linkkerisekvenssi; 80-212, C. fimin Exg-proteiini selluloosaan sitoutuvan domeenin aminohapposekvenssi
Met Thr Glu Phe Gly Ser Glu Leu Lys Ser Phe Pro Glu 5 10
Vai Vai Gly Lys Thr Vai Asp Gin Ala Arg Glu Tyr Phe 15 20 25
Thr Leu Hi s Tyr Pro Gin Tyr Asp Vai Tyr Phe Leu Pro 30 35
Glu Gly Ser Pro Vai Thr Leu Asp Leu Arg Tyr Asn Arg 40 45 50
Vai Arg Vai Phe Tyr Asn Pro Gly Thr Asn Vai Vai Asn 55 -60 65 -
His Vai Pro His Vai Gly Lys Arg Glu Ala Glu Ala Trp 70 75
Vai Pro Phe Gly Ala Ser Pro Thr Pro Thr Pro Thr Thr 80 85 90
Pro Thr Pro Thr Pro Thr Thr Pro Thr Pro Thr Pro Thr 95 100
Ser Gly Pro Ala Gly Cys Gin Vai Leu Trp Gly Vai Asn 105 HO 115 j 62 106720
Gin Trp Asn Thr Gly Phe Thr Ala Asn Vai Thr Vai Lys 120 125 130
Asn Thr Ser Ser Ala Pro Vai Asp Gly Trp Thr Leu Thr 135 140
Phe Ser Phe Pro Ser Gly Gin Gin Vai Thr Gin Ala Trp 145 150 155
Ser Ser Thr Vai Thr Gin Ser Gly Ser Ala Vai Thr Vai 160 165
Arg Asn Ala Pro Trp Asn Gly Ser Ile Pro Ala Gly Gly 170 175 180
Thr Ala Gin Phe Gly Phe Asn Gly Ser His Thr Gly Thr 185 190 195
Asn Ala Ala Pro Thr Ala Phe Ser Leu Asn Gly Thr Pro 200 205
Cys Thr Vai Gly 210
Claims (12)
- 63 106720
- 1. Menetelmä biologisesti aktiivisen proteiinin tuottami-5 seksi, tunnettu siitä, että käsitellään fuusioproteiinia, joka sisältää 1. yhden tai useamman perättäisen proteiiniosan, joista jokainen sisältää mainitun biologisesti aktiivisen proteii- 10 nin, jonka C-terminaalinen aminohappo on kytketty linkkeri-polypeptidisekvenssi L:ään, jolloin mainitun linkke-ripolypeptidisekvenssi L:n N-terminaalinen ensimmäinen ja toinen aminohappotähde ja, useamman perättäisen proteiini-osan ollessa kysymyksessä, myös C-terminaalinen viimeistä 15 edellinen ja viimeinen aminohappotähde on emäksinen aminohappo Lys tai Arg, ja 2. polypeptidileiman, liitettynä mainittujen perättäisten proteiiniosien (mainitun proteiiniosan) C-terminaaliseen 20 aminohappoon, tai, joka sisältää 1. polypeptidileiman kytkettynä 25 2. useamman perättäisen proteiiniosan N-terminaaliseen aminohappoon, joista proteiiniosista jokainen sisältää linkkeripolypeptidisekvenssi L:n, jolloin mainitun link-keripolypeptidisekvenssi L:n N-terminaalinen ensimmäinen ja 30 toinen aminohappo, samoin kuin C-terminaalinen viimeistä edellinen ja viimeinen aminohappo ovat emäksisiä aminohappoja, joita ovat Lys ja Arg, ja jolloin mainitun linkkeripolypeptidisekvenssi L:n viimeinen emäksinen aminohappo on kytkettynä mainittuun biologisesti aktiiviseen pro-35 teiiniin, liukoisella hiivan endoproteaasi yscFtllä ja liukoisella 64 106720 hiivan karboksipeptidaasi ysca:lla, ja eristetään mainittu . biologisesti aktiivinen proteiini.
- 2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu sii-5 tä, että fuusioproteiinilla on kaava (P-L)b-T (I) tai T-(L-P)n (II), 10 joissa kaavoissa P on biologisesti aktiivinen proteiini, L:n merkitys on annettu patenttivaatimuksessa 1, T on poly-peptidileima, m on kokonaisluku 1-10 ja n on kokonaisluku 2-10.
- 3. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu sii tä, että fuusioproteiinilla on kaava (P-L).-T (I) 20 jossa kaavassa P:llä, L:llä ja T:llä on edellä esitetyt merkitykset ja m on 1.
- 4. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että biologisesti aktiivinen proteiini on alkuperältään 25 prokaryoottinen tai eukaryoottinen. 1 2 Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että biologisesti aktiivinen proteiini on ihmisen a-interferoni, hybridi-interferoni, ihmisen kudosplasmino- 30 geenin aktivaattori, ihmisen yksiketjuinen urokinaasi-tyyppinen plasminogeenin aktivaattori, plasminogeeni-hybridiaktivaattori, transformoiva kasvutekijä β, ihmisen kalsitoniini, insuliinin kaltainen kasvutekijä I ja II tai desulfatohirudiini. 35 2 Patenttivaatimuksen 1 mukainen menetelmä, tunnettu sii- . tä, että linkkeripolypeptidisekvenssi L sisältää 2 - noin . « · 65 106720 20 aminohappotähdettä ja sisältää yhden tai useamman emäksisen aminohappoparin edellyttäen, että N-terminaalinen ensimmäinen ja toinen aminohappo samoin kuin C-terminaalinen viimeistä edellinen ja viimeinen aminohappo edustavat 5 sellaista emäksistä aminohappoparia.
- 7. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että polypeptidileima T käsittää noin 10 - noin 1000 aminohappotähdettä. 10
- 8. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että m on kokonaisluku 1-5 tai n on kokonaisluku 2-5.
- 9. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että liukoinen yscF on hiivan endoproteaasi yscF:n muteiini, josta hydrofobinen membraanin sitoutumiskohta on poistettu.
- 10. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että liukoinen ysca on hiivan karboksipeptidaasi ysca:n muteiini, josta hydrofobinen membraanin sitoutumiskohta on poistettu.
- 11. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu / siitä, että fuusioproteiinia käsitellään pilkkovalla seok sella, joka sisältää sekä liukoisen yscF:n että liukoisen ysca:n.
- 12. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että fuusioproteiinia käsitellään ensin liukoisella yscF:llä ja, kun hydrolyysi on riittävästi edennyt tai mennyt loppuun, sen jälkeen liukoisella ysca:11a. 35 . * 66 :06720
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB909015825A GB9015825D0 (en) | 1990-07-18 | 1990-07-18 | In vitro processing of fusion proteins |
GB9015825 | 1990-07-18 |
Publications (3)
Publication Number | Publication Date |
---|---|
FI913405A0 FI913405A0 (fi) | 1991-07-15 |
FI913405A FI913405A (fi) | 1992-01-19 |
FI106720B true FI106720B (fi) | 2001-03-30 |
Family
ID=10679295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI913405A FI106720B (fi) | 1990-07-18 | 1991-07-15 | Fuusioproteiinien valmistus in vitro |
Country Status (19)
Country | Link |
---|---|
EP (1) | EP0467839B1 (fi) |
JP (1) | JP3140488B2 (fi) |
AT (1) | ATE141645T1 (fi) |
AU (1) | AU651830B2 (fi) |
CA (1) | CA2047119C (fi) |
DE (1) | DE69121489T2 (fi) |
DK (1) | DK0467839T3 (fi) |
ES (1) | ES2091897T3 (fi) |
FI (1) | FI106720B (fi) |
GB (1) | GB9015825D0 (fi) |
GR (1) | GR3020840T3 (fi) |
HU (1) | HU216104B (fi) |
IE (1) | IE73209B1 (fi) |
NO (1) | NO303132B1 (fi) |
NZ (1) | NZ238989A (fi) |
PT (1) | PT98332B (fi) |
SG (1) | SG49863A1 (fi) |
TW (1) | TW209247B (fi) |
ZA (1) | ZA915579B (fi) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5525491A (en) * | 1991-02-27 | 1996-06-11 | Creative Biomolecules, Inc. | Serine-rich peptide linkers |
EP0816510A4 (en) * | 1995-12-22 | 2001-04-11 | Toray Industries | PROCESS FOR PRODUCING BIOLOGICALLY ACTIVE FUSED PROTEINS |
US6800726B1 (en) | 1996-11-01 | 2004-10-05 | Pioneer Hi-Bred International, Inc. | Proteins with increased levels of essential amino acids |
US6265204B1 (en) | 1997-01-17 | 2001-07-24 | Genencor International, Inc. | DNA sequences, vectors, and fusion polypeptides for secretion of polypeptides in filamentous fungi |
GB9716790D0 (en) | 1997-08-07 | 1997-10-15 | Creative Peptides Sweden Ab | Recombinant DNA molecules comprising multimeric copies of a gene sequence and expression thereof |
BR112015021960A2 (pt) | 2013-03-06 | 2017-08-29 | Glaxosmithkline Llc | Células hospedeiras e métodos de uso |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MC1834A1 (fr) * | 1986-07-10 | 1988-06-03 | Transgene Sa | Bloc fonctionnel d'adn et plasmide codant pour l'hirudine,levure transformee,procede de preparation de l'hirudine,hirudine obtenue et son utilisation |
US5010182A (en) * | 1987-07-28 | 1991-04-23 | Chiron Corporation | DNA constructs containing a Kluyveromyces alpha factor leader sequence for directing secretion of heterologous polypeptides |
DK105489D0 (da) * | 1989-03-03 | 1989-03-03 | Novo Nordisk As | Polypeptid |
-
1990
- 1990-07-18 GB GB909015825A patent/GB9015825D0/en active Pending
-
1991
- 1991-07-09 SG SG9607721A patent/SG49863A1/en unknown
- 1991-07-09 AT AT91810543T patent/ATE141645T1/de not_active IP Right Cessation
- 1991-07-09 ES ES91810543T patent/ES2091897T3/es not_active Expired - Lifetime
- 1991-07-09 EP EP91810543A patent/EP0467839B1/en not_active Expired - Lifetime
- 1991-07-09 DE DE69121489T patent/DE69121489T2/de not_active Expired - Fee Related
- 1991-07-09 DK DK91810543.8T patent/DK0467839T3/da active
- 1991-07-15 FI FI913405A patent/FI106720B/fi active
- 1991-07-16 AU AU80463/91A patent/AU651830B2/en not_active Ceased
- 1991-07-16 PT PT98332A patent/PT98332B/pt not_active IP Right Cessation
- 1991-07-16 CA CA002047119A patent/CA2047119C/en not_active Expired - Lifetime
- 1991-07-16 NZ NZ238989A patent/NZ238989A/en not_active IP Right Cessation
- 1991-07-17 IE IE250191A patent/IE73209B1/en not_active IP Right Cessation
- 1991-07-17 TW TW080105554A patent/TW209247B/zh active
- 1991-07-17 HU HU2398/91A patent/HU216104B/hu not_active IP Right Cessation
- 1991-07-17 NO NO912803A patent/NO303132B1/no not_active IP Right Cessation
- 1991-07-17 ZA ZA915579A patent/ZA915579B/xx unknown
- 1991-07-17 JP JP03176552A patent/JP3140488B2/ja not_active Expired - Fee Related
-
1996
- 1996-08-22 GR GR960402054T patent/GR3020840T3/el unknown
Also Published As
Publication number | Publication date |
---|---|
IE912501A1 (en) | 1992-01-29 |
NO912803L (no) | 1992-01-20 |
FI913405A (fi) | 1992-01-19 |
ES2091897T3 (es) | 1996-11-16 |
IE73209B1 (en) | 1997-05-07 |
AU651830B2 (en) | 1994-08-04 |
DK0467839T3 (da) | 1996-09-16 |
HUT58369A (en) | 1992-02-28 |
HU912398D0 (en) | 1991-12-30 |
GB9015825D0 (en) | 1990-09-05 |
DE69121489D1 (de) | 1996-09-26 |
PT98332B (pt) | 1999-01-29 |
AU8046391A (en) | 1992-01-23 |
EP0467839A1 (en) | 1992-01-22 |
FI913405A0 (fi) | 1991-07-15 |
NO912803D0 (no) | 1991-07-17 |
NZ238989A (en) | 1992-09-25 |
SG49863A1 (en) | 2002-03-19 |
ZA915579B (en) | 1992-03-25 |
JPH04229188A (ja) | 1992-08-18 |
GR3020840T3 (en) | 1996-11-30 |
TW209247B (fi) | 1993-07-11 |
HU216104B (hu) | 1999-04-28 |
CA2047119C (en) | 2002-10-08 |
NO303132B1 (no) | 1998-06-02 |
CA2047119A1 (en) | 1992-01-19 |
EP0467839B1 (en) | 1996-08-21 |
ATE141645T1 (de) | 1996-09-15 |
DE69121489T2 (de) | 1997-02-27 |
PT98332A (pt) | 1992-05-29 |
JP3140488B2 (ja) | 2001-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2090969C (en) | Production of insulin-like growth factor-1 in methylotrophic yeast cells | |
US6500645B1 (en) | N-terminally extended proteins expressed in yeast | |
US5102789A (en) | Production of epideramal growth factor in pichia pastoris yeast cells | |
CZ284251B6 (cs) | Způsob výroby heterologního proteinu v transformované buňce | |
US5902735A (en) | Functional DNA block and plasmid coding for hirudin, transformed yeast, method for hirudin, hirudin obtained, and its pharmaceutical use | |
CA2105064A1 (en) | Genes which influence pichia proteolytic activity, and uses therefor | |
JPS62272976A (ja) | 変異組織プラスミノ−ゲンアクチベ−タ−及びその製造 | |
JP3305781B2 (ja) | 新規なるdna分子及び宿主 | |
US5939287A (en) | Method for production of proteins in yeast | |
US6861237B2 (en) | Production of heterologous polypeptides in yeast | |
FI106720B (fi) | Fuusioproteiinien valmistus in vitro | |
NO302899B1 (no) | Rekombinant DNA-molekyl, transformert vertscelle, anvendelse av rekombinant DNA-molekyl og hybridvektor, og pektinlyasene PLA, PLB, PLC, PLE eller PLF i ren form | |
JP2000501617A (ja) | 酵母細胞におけるn末端を伸長されたタンパクの発現のためのベクター | |
US5710033A (en) | Superoxide dismutase cloning and expression in microorganisms | |
JP2769541B2 (ja) | 平衡型構成誘導性転写系 | |
AU673384B2 (en) | Process for the production of polypeptides | |
US6331421B1 (en) | DNA construct comprising a vector for expression of human cytoplasmic Cu/Zn superoxide dismutase in E. coli and method of use of same | |
JPH06503718A (ja) | メチロトローフ酵母細胞におけるヒトリゾチムの産生とその効率的な分泌 | |
NO864442L (no) | Mutantkodende sekvens. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GB | Transfer or assigment of application |
Owner name: NOVARTIS AG |