KR20110104512A - 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 - Google Patents
고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 Download PDFInfo
- Publication number
- KR20110104512A KR20110104512A KR1020117015465A KR20117015465A KR20110104512A KR 20110104512 A KR20110104512 A KR 20110104512A KR 1020117015465 A KR1020117015465 A KR 1020117015465A KR 20117015465 A KR20117015465 A KR 20117015465A KR 20110104512 A KR20110104512 A KR 20110104512A
- Authority
- KR
- South Korea
- Prior art keywords
- human
- seq
- ser
- polypeptide
- sfp
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 224
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 187
- 230000004927 fusion Effects 0.000 title claims abstract description 141
- 238000004519 manufacturing process Methods 0.000 title abstract description 30
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 title abstract description 15
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 title abstract description 15
- 238000012216 screening Methods 0.000 title description 17
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 365
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 343
- 238000000034 method Methods 0.000 claims abstract description 144
- 230000028327 secretion Effects 0.000 claims abstract description 75
- 108091005804 Peptidases Proteins 0.000 claims abstract description 47
- 230000003248 secreting effect Effects 0.000 claims abstract description 42
- 239000004365 Protease Substances 0.000 claims abstract description 41
- 229920001184 polypeptide Polymers 0.000 claims description 334
- 235000018102 proteins Nutrition 0.000 claims description 171
- 239000012634 fragment Substances 0.000 claims description 137
- 210000004027 cell Anatomy 0.000 claims description 124
- 239000013598 vector Substances 0.000 claims description 114
- 108091033319 polynucleotide Proteins 0.000 claims description 91
- 239000002157 polynucleotide Substances 0.000 claims description 91
- 102000040430 polynucleotide Human genes 0.000 claims description 91
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 84
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 81
- 150000001413 amino acids Chemical class 0.000 claims description 62
- 229940024606 amino acid Drugs 0.000 claims description 60
- 150000007523 nucleic acids Chemical class 0.000 claims description 50
- 102000035195 Peptidases Human genes 0.000 claims description 46
- 230000014509 gene expression Effects 0.000 claims description 43
- 108010011459 Exenatide Proteins 0.000 claims description 41
- JUFFVKRROAPVBI-PVOYSMBESA-N chembl1210015 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N[C@H]1[C@@H]([C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO[C@]3(O[C@@H](C[C@H](O)[C@H](O)CO)[C@H](NC(C)=O)[C@@H](O)C3)C(O)=O)O2)O)[C@@H](CO)O1)NC(C)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 JUFFVKRROAPVBI-PVOYSMBESA-N 0.000 claims description 41
- 229960001519 exenatide Drugs 0.000 claims description 40
- 102000039446 nucleic acids Human genes 0.000 claims description 40
- 108020004707 nucleic acids Proteins 0.000 claims description 40
- 235000019419 proteases Nutrition 0.000 claims description 40
- 238000004458 analytical method Methods 0.000 claims description 35
- -1 factor IX Proteins 0.000 claims description 29
- 238000003776 cleavage reaction Methods 0.000 claims description 25
- 230000007017 scission Effects 0.000 claims description 25
- 101100041916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SCW4 gene Proteins 0.000 claims description 23
- 230000037430 deletion Effects 0.000 claims description 23
- 238000012217 deletion Methods 0.000 claims description 23
- 210000005253 yeast cell Anatomy 0.000 claims description 21
- 238000000855 fermentation Methods 0.000 claims description 20
- 230000004151 fermentation Effects 0.000 claims description 20
- 108010000521 Human Growth Hormone Proteins 0.000 claims description 18
- 108091036060 Linker DNA Proteins 0.000 claims description 17
- 241000700605 Viruses Species 0.000 claims description 17
- 102000002265 Human Growth Hormone Human genes 0.000 claims description 16
- 239000000854 Human Growth Hormone Substances 0.000 claims description 16
- 241000222120 Candida <Saccharomycetales> Species 0.000 claims description 15
- 108090000445 Parathyroid hormone Proteins 0.000 claims description 14
- 241000894006 Bacteria Species 0.000 claims description 13
- 101001002657 Homo sapiens Interleukin-2 Proteins 0.000 claims description 13
- 108090000848 Ubiquitin Proteins 0.000 claims description 13
- 102000044159 Ubiquitin Human genes 0.000 claims description 13
- 101150038242 GAL10 gene Proteins 0.000 claims description 12
- 102100024637 Galectin-10 Human genes 0.000 claims description 12
- 102000055277 human IL2 Human genes 0.000 claims description 12
- 101150046766 BGL2 gene Proteins 0.000 claims description 11
- 102100021786 CMP-N-acetylneuraminate-poly-alpha-2,8-sialyltransferase Human genes 0.000 claims description 11
- 101100166113 Candida albicans (strain SC5314 / ATCC MYA-2876) SAP9 gene Proteins 0.000 claims description 11
- 101100372300 Candida albicans (strain SC5314 / ATCC MYA-2876) SIM1 gene Proteins 0.000 claims description 11
- 241000196324 Embryophyta Species 0.000 claims description 11
- 241000233866 Fungi Species 0.000 claims description 11
- 101000616698 Homo sapiens CMP-N-acetylneuraminate-poly-alpha-2,8-sialyltransferase Proteins 0.000 claims description 11
- 101001000631 Homo sapiens Peripheral myelin protein 22 Proteins 0.000 claims description 11
- 101000703681 Homo sapiens Single-minded homolog 1 Proteins 0.000 claims description 11
- 102000003982 Parathyroid hormone Human genes 0.000 claims description 11
- 102100035917 Peripheral myelin protein 22 Human genes 0.000 claims description 11
- 101100106110 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YGP1 gene Proteins 0.000 claims description 11
- 101100433395 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ZPS1 gene Proteins 0.000 claims description 11
- 102100031980 Single-minded homolog 1 Human genes 0.000 claims description 11
- 101150091312 UTH1 gene Proteins 0.000 claims description 11
- 101150008621 YPS1 gene Proteins 0.000 claims description 11
- 101150077246 gas5 gene Proteins 0.000 claims description 11
- 239000000199 parathyroid hormone Substances 0.000 claims description 11
- 229960001319 parathyroid hormone Drugs 0.000 claims description 11
- 230000001131 transforming effect Effects 0.000 claims description 11
- 241000283690 Bos taurus Species 0.000 claims description 10
- 101100291915 Candida albicans (strain SC5314 / ATCC MYA-2876) MP65 gene Proteins 0.000 claims description 10
- 241000588724 Escherichia coli Species 0.000 claims description 10
- 101500025419 Homo sapiens Epidermal growth factor Proteins 0.000 claims description 10
- 101100041913 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SCW10 gene Proteins 0.000 claims description 10
- 239000001963 growth medium Substances 0.000 claims description 10
- 229940116978 human epidermal growth factor Drugs 0.000 claims description 10
- GVUGOAYIVIDWIO-UFWWTJHBSA-N nepidermin Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CS)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CS)NC(=O)[C@H](C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C(C)C)C(C)C)C1=CC=C(O)C=C1 GVUGOAYIVIDWIO-UFWWTJHBSA-N 0.000 claims description 10
- 241001195348 Nusa Species 0.000 claims description 9
- 102000002933 Thioredoxin Human genes 0.000 claims description 9
- 108060008226 thioredoxin Proteins 0.000 claims description 9
- 229940094937 thioredoxin Drugs 0.000 claims description 9
- 239000004475 Arginine Substances 0.000 claims description 8
- 101800003838 Epidermal growth factor Proteins 0.000 claims description 8
- 102400001368 Epidermal growth factor Human genes 0.000 claims description 8
- 108090001060 Lipase Proteins 0.000 claims description 8
- 102000004882 Lipase Human genes 0.000 claims description 8
- 239000004367 Lipase Substances 0.000 claims description 8
- 241000311088 Schwanniomyces Species 0.000 claims description 8
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 8
- 229940116977 epidermal growth factor Drugs 0.000 claims description 8
- 235000019421 lipase Nutrition 0.000 claims description 8
- 241000701959 Escherichia virus Lambda Species 0.000 claims description 7
- 241000235648 Pichia Species 0.000 claims description 7
- 238000012258 culturing Methods 0.000 claims description 7
- 239000000203 mixture Substances 0.000 claims description 7
- 108091008146 restriction endonucleases Proteins 0.000 claims description 7
- 102100026189 Beta-galactosidase Human genes 0.000 claims description 6
- 241000222122 Candida albicans Species 0.000 claims description 6
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 claims description 6
- 102000002464 Galactosidases Human genes 0.000 claims description 6
- 108010093031 Galactosidases Proteins 0.000 claims description 6
- 108010043121 Green Fluorescent Proteins Proteins 0.000 claims description 6
- 102000004144 Green Fluorescent Proteins Human genes 0.000 claims description 6
- 102000008100 Human Serum Albumin Human genes 0.000 claims description 6
- 108091006905 Human Serum Albumin Proteins 0.000 claims description 6
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 claims description 6
- 102000006992 Interferon-alpha Human genes 0.000 claims description 6
- 108010047761 Interferon-alpha Proteins 0.000 claims description 6
- 241001465754 Metazoa Species 0.000 claims description 6
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 claims description 6
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 claims description 6
- 241000235070 Saccharomyces Species 0.000 claims description 6
- 241000235015 Yarrowia lipolytica Species 0.000 claims description 6
- 108010005774 beta-Galactosidase Proteins 0.000 claims description 6
- 229940095731 candida albicans Drugs 0.000 claims description 6
- CVSVTCORWBXHQV-UHFFFAOYSA-N creatine Chemical compound NC(=[NH2+])N(C)CC([O-])=O CVSVTCORWBXHQV-UHFFFAOYSA-N 0.000 claims description 6
- 239000005090 green fluorescent protein Substances 0.000 claims description 6
- 108010011619 6-Phytase Proteins 0.000 claims description 5
- 102100022987 Angiogenin Human genes 0.000 claims description 5
- 102000007347 Apyrase Human genes 0.000 claims description 5
- 108010007730 Apyrase Proteins 0.000 claims description 5
- 102000004452 Arginase Human genes 0.000 claims description 5
- 108700024123 Arginases Proteins 0.000 claims description 5
- 102000006996 Aryldialkylphosphatase Human genes 0.000 claims description 5
- 108010008184 Aryldialkylphosphatase Proteins 0.000 claims description 5
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 claims description 5
- 102100023995 Beta-nerve growth factor Human genes 0.000 claims description 5
- 108010015428 Bilirubin oxidase Proteins 0.000 claims description 5
- 102100035882 Catalase Human genes 0.000 claims description 5
- 108010053835 Catalase Proteins 0.000 claims description 5
- 108010035722 Chloride peroxidase Proteins 0.000 claims description 5
- 108090000317 Chymotrypsin Proteins 0.000 claims description 5
- 102100023804 Coagulation factor VII Human genes 0.000 claims description 5
- 108010025880 Cyclomaltodextrin glucanotransferase Proteins 0.000 claims description 5
- 241000701022 Cytomegalovirus Species 0.000 claims description 5
- 102000002148 Diacylglycerol O-acyltransferase Human genes 0.000 claims description 5
- 108010001348 Diacylglycerol O-acyltransferase Proteins 0.000 claims description 5
- 241000222175 Diutina rugosa Species 0.000 claims description 5
- 108010023321 Factor VII Proteins 0.000 claims description 5
- 108010054218 Factor VIII Proteins 0.000 claims description 5
- 102000001690 Factor VIII Human genes 0.000 claims description 5
- 239000004366 Glucose oxidase Substances 0.000 claims description 5
- 108010015776 Glucose oxidase Proteins 0.000 claims description 5
- 102000004366 Glucosidases Human genes 0.000 claims description 5
- 108010056771 Glucosidases Proteins 0.000 claims description 5
- 101000987586 Homo sapiens Eosinophil peroxidase Proteins 0.000 claims description 5
- 101000920686 Homo sapiens Erythropoietin Proteins 0.000 claims description 5
- 101001052035 Homo sapiens Fibroblast growth factor 2 Proteins 0.000 claims description 5
- 101000967904 Homo sapiens Galectin-3-binding protein Proteins 0.000 claims description 5
- 101000746367 Homo sapiens Granulocyte colony-stimulating factor Proteins 0.000 claims description 5
- 101000746373 Homo sapiens Granulocyte-macrophage colony-stimulating factor Proteins 0.000 claims description 5
- 101000893549 Homo sapiens Growth/differentiation factor 15 Proteins 0.000 claims description 5
- 101001054334 Homo sapiens Interferon beta Proteins 0.000 claims description 5
- 101000599940 Homo sapiens Interferon gamma Proteins 0.000 claims description 5
- 101001033249 Homo sapiens Interleukin-1 beta Proteins 0.000 claims description 5
- 101001076408 Homo sapiens Interleukin-6 Proteins 0.000 claims description 5
- 101000798114 Homo sapiens Lactotransferrin Proteins 0.000 claims description 5
- 101001063991 Homo sapiens Leptin Proteins 0.000 claims description 5
- 101001018100 Homo sapiens Lysozyme C Proteins 0.000 claims description 5
- 101000874165 Homo sapiens Probable ATP-dependent RNA helicase DDX41 Proteins 0.000 claims description 5
- 101500025614 Homo sapiens Transforming growth factor beta-1 Proteins 0.000 claims description 5
- 101000997832 Homo sapiens Tyrosine-protein kinase JAK2 Proteins 0.000 claims description 5
- 108010082302 Human Follicle Stimulating Hormone Proteins 0.000 claims description 5
- 102000003864 Human Follicle Stimulating Hormone Human genes 0.000 claims description 5
- 241000361919 Metaphire sieboldi Species 0.000 claims description 5
- 108010025020 Nerve Growth Factor Proteins 0.000 claims description 5
- 241000320412 Ogataea angusta Species 0.000 claims description 5
- 241000242583 Scyphozoa Species 0.000 claims description 5
- 229940122055 Serine protease inhibitor Drugs 0.000 claims description 5
- 101710102218 Serine protease inhibitor Proteins 0.000 claims description 5
- 102000003425 Tyrosinase Human genes 0.000 claims description 5
- 108060008724 Tyrosinase Proteins 0.000 claims description 5
- 108010092464 Urate Oxidase Proteins 0.000 claims description 5
- HXXFSFRBOHSIMQ-FPRJBGLDSA-N alpha-D-galactose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@H](O)[C@@H](O)[C@H]1O HXXFSFRBOHSIMQ-FPRJBGLDSA-N 0.000 claims description 5
- 108010030291 alpha-Galactosidase Proteins 0.000 claims description 5
- 102000005840 alpha-Galactosidase Human genes 0.000 claims description 5
- 108010072788 angiogenin Proteins 0.000 claims description 5
- 108010047754 beta-Glucosidase Proteins 0.000 claims description 5
- 102000006995 beta-Glucosidase Human genes 0.000 claims description 5
- 229960002376 chymotrypsin Drugs 0.000 claims description 5
- VJJPUSNTGOMMGY-MRVIYFEKSA-N etoposide Chemical compound COC1=C(O)C(OC)=CC([C@@H]2C3=CC=4OCOC=4C=C3[C@@H](O[C@H]3[C@@H]([C@@H](O)[C@@H]4O[C@H](C)OC[C@H]4O3)O)[C@@H]3[C@@H]2C(OC3)=O)=C1 VJJPUSNTGOMMGY-MRVIYFEKSA-N 0.000 claims description 5
- 229960005420 etoposide Drugs 0.000 claims description 5
- 108010015174 exendin 3 Proteins 0.000 claims description 5
- LMHMJYMCGJNXRS-IOPUOMRJSA-N exendin-3 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@H](C)O)[C@H](C)O)C(C)C)C1=CC=CC=C1 LMHMJYMCGJNXRS-IOPUOMRJSA-N 0.000 claims description 5
- 229940012413 factor vii Drugs 0.000 claims description 5
- 229960000301 factor viii Drugs 0.000 claims description 5
- 229940116332 glucose oxidase Drugs 0.000 claims description 5
- 235000019420 glucose oxidase Nutrition 0.000 claims description 5
- 230000006801 homologous recombination Effects 0.000 claims description 5
- 238000002744 homologous recombination Methods 0.000 claims description 5
- 102000044890 human EPO Human genes 0.000 claims description 5
- 102000046181 human GDF15 Human genes 0.000 claims description 5
- 102000043557 human IFNG Human genes 0.000 claims description 5
- 102000049953 human LEP Human genes 0.000 claims description 5
- 102000050459 human LTF Human genes 0.000 claims description 5
- 229960000027 human factor ix Drugs 0.000 claims description 5
- 229940116886 human interleukin-6 Drugs 0.000 claims description 5
- 239000003446 ligand Substances 0.000 claims description 5
- 229940053128 nerve growth factor Drugs 0.000 claims description 5
- 150000002978 peroxides Chemical class 0.000 claims description 5
- 229940085127 phytase Drugs 0.000 claims description 5
- GCYXWQUSHADNBF-AAEALURTSA-N preproglucagon 78-108 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 GCYXWQUSHADNBF-AAEALURTSA-N 0.000 claims description 5
- 235000019833 protease Nutrition 0.000 claims description 5
- 239000003001 serine protease inhibitor Substances 0.000 claims description 5
- 108010045348 trehalose synthase Proteins 0.000 claims description 5
- 102000007469 Actins Human genes 0.000 claims description 4
- 108010085238 Actins Proteins 0.000 claims description 4
- 241001138401 Kluyveromyces lactis Species 0.000 claims description 4
- 241001580565 Peachia Species 0.000 claims description 4
- 206010039491 Sarcoma Diseases 0.000 claims description 4
- 241000723792 Tobacco etch virus Species 0.000 claims description 4
- 210000004102 animal cell Anatomy 0.000 claims description 4
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 claims description 3
- 108010021809 Alcohol dehydrogenase Proteins 0.000 claims description 3
- 241000206602 Eukaryota Species 0.000 claims description 3
- 101150094690 GAL1 gene Proteins 0.000 claims description 3
- 102100028501 Galanin peptides Human genes 0.000 claims description 3
- 108010017544 Glucosylceramidase Proteins 0.000 claims description 3
- 102000004547 Glucosylceramidase Human genes 0.000 claims description 3
- 102000053187 Glucuronidase Human genes 0.000 claims description 3
- 108010060309 Glucuronidase Proteins 0.000 claims description 3
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 claims description 3
- 108010054147 Hemoglobins Proteins 0.000 claims description 3
- 102000001554 Hemoglobins Human genes 0.000 claims description 3
- 101100121078 Homo sapiens GAL gene Proteins 0.000 claims description 3
- 101000626080 Homo sapiens Thyrotroph embryonic factor Proteins 0.000 claims description 3
- 101001046426 Homo sapiens cGMP-dependent protein kinase 1 Proteins 0.000 claims description 3
- 241000725303 Human immunodeficiency virus Species 0.000 claims description 3
- 102000003792 Metallothionein Human genes 0.000 claims description 3
- 108090000157 Metallothionein Proteins 0.000 claims description 3
- 241000713333 Mouse mammary tumor virus Species 0.000 claims description 3
- 101000715411 Mus musculus Caspase-1 Proteins 0.000 claims description 3
- 102000003505 Myosin Human genes 0.000 claims description 3
- 108060008487 Myosin Proteins 0.000 claims description 3
- 101001000154 Schistosoma mansoni Phosphoglycerate kinase Proteins 0.000 claims description 3
- 102100024729 Thyrotroph embryonic factor Human genes 0.000 claims description 3
- 102000004357 Transferases Human genes 0.000 claims description 3
- 108090000992 Transferases Proteins 0.000 claims description 3
- 229960003624 creatine Drugs 0.000 claims description 3
- 239000006046 creatine Substances 0.000 claims description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 claims description 3
- 101150066555 lacZ gene Proteins 0.000 claims description 3
- 210000003205 muscle Anatomy 0.000 claims description 3
- 101150079601 recA gene Proteins 0.000 claims description 3
- 230000035939 shock Effects 0.000 claims description 3
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical group C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 claims description 3
- 241000680806 Blastobotrys adeninivorans Species 0.000 claims description 2
- 241000235646 Cyberlindnera jadinii Species 0.000 claims description 2
- 241000235035 Debaryomyces Species 0.000 claims description 2
- 241000701044 Human gammaherpesvirus 4 Species 0.000 claims description 2
- 102000000588 Interleukin-2 Human genes 0.000 claims description 2
- 108010002350 Interleukin-2 Proteins 0.000 claims description 2
- 241000235649 Kluyveromyces Species 0.000 claims description 2
- 241000235058 Komagataella pastoris Species 0.000 claims description 2
- 102000004316 Oxidoreductases Human genes 0.000 claims description 2
- 108090000854 Oxidoreductases Proteins 0.000 claims description 2
- 241000235060 Scheffersomyces stipitis Species 0.000 claims description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 claims description 2
- 241001123650 Schwanniomyces occidentalis Species 0.000 claims description 2
- 241000235013 Yarrowia Species 0.000 claims description 2
- 241000222124 [Candida] boidinii Species 0.000 claims description 2
- 108010024976 Asparaginase Proteins 0.000 claims 4
- 102000015790 Asparaginase Human genes 0.000 claims 4
- 102000014429 Insulin-like growth factor Human genes 0.000 claims 4
- 101710098554 Lipase B Proteins 0.000 claims 4
- 229960003272 asparaginase Drugs 0.000 claims 4
- DCXYFEDJOCDNAF-UHFFFAOYSA-M asparaginate Chemical compound [O-]C(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-M 0.000 claims 4
- 108010070324 lumbrokinase Proteins 0.000 claims 4
- 101100382568 Danio rerio caspa gene Proteins 0.000 claims 2
- 101000932478 Homo sapiens Receptor-type tyrosine-protein kinase FLT3 Proteins 0.000 claims 2
- 101150012394 PHO5 gene Proteins 0.000 claims 2
- 108091000080 Phosphotransferase Proteins 0.000 claims 2
- 210000004185 liver Anatomy 0.000 claims 2
- 102000020233 phosphotransferase Human genes 0.000 claims 2
- RSWGJHLUYNHPMX-UHFFFAOYSA-N Abietic-Saeure Natural products C12CCC(C(C)C)=CC2=CCC2C1(C)CCCC2(C)C(O)=O RSWGJHLUYNHPMX-UHFFFAOYSA-N 0.000 claims 1
- 102400000322 Glucagon-like peptide 1 Human genes 0.000 claims 1
- DTHNMHAUYICORS-KTKZVXAJSA-N Glucagon-like peptide 1 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 DTHNMHAUYICORS-KTKZVXAJSA-N 0.000 claims 1
- 101800000224 Glucagon-like peptide 1 Proteins 0.000 claims 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 1
- 101710118538 Protease Proteins 0.000 claims 1
- KHPCPRHQVVSZAH-HUOMCSJISA-N Rosin Natural products O(C/C=C/c1ccccc1)[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 KHPCPRHQVVSZAH-HUOMCSJISA-N 0.000 claims 1
- 241000235346 Schizosaccharomyces Species 0.000 claims 1
- 230000006698 induction Effects 0.000 claims 1
- 229910052698 phosphorus Inorganic materials 0.000 claims 1
- 239000011574 phosphorus Substances 0.000 claims 1
- KHPCPRHQVVSZAH-UHFFFAOYSA-N trans-cinnamyl beta-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OCC=CC1=CC=CC=C1 KHPCPRHQVVSZAH-UHFFFAOYSA-N 0.000 claims 1
- 238000001727 in vivo Methods 0.000 abstract description 13
- 229960000074 biopharmaceutical Drugs 0.000 abstract description 7
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 abstract 1
- 108020004414 DNA Proteins 0.000 description 117
- 101150003216 SFP1 gene Proteins 0.000 description 57
- 235000001014 amino acid Nutrition 0.000 description 44
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 44
- 102000037865 fusion proteins Human genes 0.000 description 41
- 108020001507 fusion proteins Proteins 0.000 description 41
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 30
- 125000003275 alpha amino acid group Chemical group 0.000 description 29
- 239000002609 medium Substances 0.000 description 29
- 102100029727 Enteropeptidase Human genes 0.000 description 28
- 108010013369 Enteropeptidase Proteins 0.000 description 28
- 239000013604 expression vector Substances 0.000 description 28
- 239000013612 plasmid Substances 0.000 description 25
- 230000000692 anti-sense effect Effects 0.000 description 24
- 241000235088 Saccharomyces sp. Species 0.000 description 23
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 19
- 239000008103 glucose Substances 0.000 description 19
- 239000002773 nucleotide Substances 0.000 description 19
- 125000003729 nucleotide group Chemical group 0.000 description 19
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 16
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 15
- 108010076504 Protein Sorting Signals Proteins 0.000 description 15
- 238000006467 substitution reaction Methods 0.000 description 15
- 241000880493 Leptailurus serval Species 0.000 description 14
- 238000007792 addition Methods 0.000 description 14
- 108010047857 aspartylglycine Proteins 0.000 description 14
- 108091026890 Coding region Proteins 0.000 description 13
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 12
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 12
- 239000012228 culture supernatant Substances 0.000 description 12
- 229940041514 candida albicans extract Drugs 0.000 description 11
- 238000007857 nested PCR Methods 0.000 description 11
- 239000012138 yeast extract Substances 0.000 description 11
- 108020004705 Codon Proteins 0.000 description 10
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 10
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 10
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 10
- 229930182830 galactose Natural products 0.000 description 10
- 108010051242 phenylalanylserine Proteins 0.000 description 10
- 238000000746 purification Methods 0.000 description 10
- 108010061238 threonyl-glycine Proteins 0.000 description 10
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 9
- 108700026244 Open Reading Frames Proteins 0.000 description 9
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 230000013595 glycosylation Effects 0.000 description 9
- 238000006206 glycosylation reaction Methods 0.000 description 9
- 239000003550 marker Substances 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 230000001105 regulatory effect Effects 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 8
- 125000000539 amino acid group Chemical group 0.000 description 8
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 8
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 8
- 238000004128 high performance liquid chromatography Methods 0.000 description 8
- 229910052757 nitrogen Inorganic materials 0.000 description 8
- 230000006798 recombination Effects 0.000 description 8
- 238000005215 recombination Methods 0.000 description 8
- PCDUALPXEOKZPE-DXCABUDRSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoic acid Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O PCDUALPXEOKZPE-DXCABUDRSA-N 0.000 description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 7
- 101100506090 Caenorhabditis elegans hil-2 gene Proteins 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 239000001888 Peptone Substances 0.000 description 7
- 108010080698 Peptones Proteins 0.000 description 7
- 101100540541 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) VOA1 gene Proteins 0.000 description 7
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 7
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 7
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 235000014304 histidine Nutrition 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 238000011534 incubation Methods 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- 108010054155 lysyllysine Proteins 0.000 description 7
- 210000004962 mammalian cell Anatomy 0.000 description 7
- 235000019319 peptone Nutrition 0.000 description 7
- 230000010076 replication Effects 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 6
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 6
- 101001135770 Homo sapiens Parathyroid hormone Proteins 0.000 description 6
- 101001135995 Homo sapiens Probable peptidyl-tRNA hydrolase Proteins 0.000 description 6
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 6
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 6
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 6
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 6
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 6
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 6
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 6
- 238000001042 affinity chromatography Methods 0.000 description 6
- 235000003704 aspartic acid Nutrition 0.000 description 6
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 6
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 6
- 230000027455 binding Effects 0.000 description 6
- 230000010261 cell growth Effects 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 6
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 6
- 235000011073 invertase Nutrition 0.000 description 6
- 238000002955 isolation Methods 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 238000003259 recombinant expression Methods 0.000 description 6
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 6
- 108010026333 seryl-proline Proteins 0.000 description 6
- 230000003612 virological effect Effects 0.000 description 6
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 5
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 5
- 102100039555 Galectin-7 Human genes 0.000 description 5
- 239000004471 Glycine Substances 0.000 description 5
- 101000608772 Homo sapiens Galectin-7 Proteins 0.000 description 5
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 5
- 239000004472 Lysine Substances 0.000 description 5
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 5
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 5
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 5
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 5
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 5
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 5
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 239000001573 invertase Substances 0.000 description 5
- 108010064235 lysylglycine Proteins 0.000 description 5
- 210000003705 ribosome Anatomy 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 4
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 4
- BIVYLQMZPHDUIH-WHFBIAKZSA-N Asp-Gly-Cys Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)C(=O)O BIVYLQMZPHDUIH-WHFBIAKZSA-N 0.000 description 4
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 4
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 4
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 4
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 4
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 4
- 108020004511 Recombinant DNA Proteins 0.000 description 4
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 4
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 4
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 4
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 4
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 4
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 4
- 239000004473 Threonine Substances 0.000 description 4
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 4
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 4
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 4
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 4
- 230000002378 acidificating effect Effects 0.000 description 4
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 238000001502 gel electrophoresis Methods 0.000 description 4
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 4
- 108010010147 glycylglutamine Proteins 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 108010087823 glycyltyrosine Proteins 0.000 description 4
- 102000058004 human PTH Human genes 0.000 description 4
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 4
- 229960000310 isoleucine Drugs 0.000 description 4
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000002703 mutagenesis Methods 0.000 description 4
- 231100000350 mutagenesis Toxicity 0.000 description 4
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 238000011218 seed culture Methods 0.000 description 4
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 108010084932 tryptophyl-proline Proteins 0.000 description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 4
- 108010003137 tyrosyltyrosine Proteins 0.000 description 4
- 239000004474 valine Substances 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 3
- 108010036211 5-HT-moduline Proteins 0.000 description 3
- 229920001817 Agar Polymers 0.000 description 3
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 3
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 3
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 3
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 3
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 3
- 241000219194 Arabidopsis Species 0.000 description 3
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 3
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 3
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 3
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 3
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 3
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 3
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 3
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 3
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 3
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 3
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 3
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 3
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 3
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 3
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 101001055144 Homo sapiens Interleukin-2 receptor subunit alpha Proteins 0.000 description 3
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 3
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 3
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 3
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 3
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 3
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 3
- 102100026878 Interleukin-2 receptor subunit alpha Human genes 0.000 description 3
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 3
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 3
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 3
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 3
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 3
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 3
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 3
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 3
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 3
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 3
- VOOINLQYUZOREH-SRVKXCTJSA-N Met-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N VOOINLQYUZOREH-SRVKXCTJSA-N 0.000 description 3
- ZRACLHJYVRBJFC-ULQDDVLXSA-N Met-Lys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZRACLHJYVRBJFC-ULQDDVLXSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- 241000208125 Nicotiana Species 0.000 description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 102100036893 Parathyroid hormone Human genes 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 3
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 3
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 3
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 3
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 3
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 3
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 3
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 3
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 3
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 244000061456 Solanum tuberosum Species 0.000 description 3
- 235000002595 Solanum tuberosum Nutrition 0.000 description 3
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 3
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 3
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 3
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 3
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 3
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 3
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 3
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 3
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 3
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 3
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 3
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 3
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- 229960003180 glutathione Drugs 0.000 description 3
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 3
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 239000003102 growth factor Substances 0.000 description 3
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 3
- 108010028295 histidylhistidine Proteins 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 3
- 108010038320 lysylphenylalanine Proteins 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 231100000219 mutagenic Toxicity 0.000 description 3
- 230000003505 mutagenic effect Effects 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 108010071207 serylmethionine Proteins 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 241000701447 unidentified baculovirus Species 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 2
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 2
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 2
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 2
- ZDYNWWQXFRUOEO-XDTLVQLUSA-N Ala-Gln-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDYNWWQXFRUOEO-XDTLVQLUSA-N 0.000 description 2
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 2
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 2
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 2
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- 239000004382 Amylase Substances 0.000 description 2
- 108010065511 Amylases Proteins 0.000 description 2
- 102000013142 Amylases Human genes 0.000 description 2
- JTWOBPNAVBESFW-FXQIFTODSA-N Arg-Cys-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N JTWOBPNAVBESFW-FXQIFTODSA-N 0.000 description 2
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 2
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 2
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 2
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 2
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 2
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 2
- ZTRJUKDEALVRMW-SRVKXCTJSA-N Asn-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZTRJUKDEALVRMW-SRVKXCTJSA-N 0.000 description 2
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 2
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 2
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 2
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 2
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 2
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 2
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 2
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 2
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 2
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 2
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 2
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 2
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 2
- WNGZKSVJFDZICU-XIRDDKMYSA-N Asp-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N WNGZKSVJFDZICU-XIRDDKMYSA-N 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 2
- 108010083946 Asp-Tyr-Leu-Lys Proteins 0.000 description 2
- WOKXEQLPBLLWHC-IHRRRGAJSA-N Asp-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 WOKXEQLPBLLWHC-IHRRRGAJSA-N 0.000 description 2
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 108010023063 Bacto-peptone Proteins 0.000 description 2
- 108060001064 Calcitonin Proteins 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 101100286980 Daucus carota INV2 gene Proteins 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 108090000204 Dipeptidase 1 Proteins 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 101100501135 Escherichia coli O157:H7 ehaG gene Proteins 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 2
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 2
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 2
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 2
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 2
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 2
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 2
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 2
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 2
- 102100022624 Glucoamylase Human genes 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 2
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 2
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 2
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 2
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 2
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 2
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 2
- 101150009006 HIS3 gene Proteins 0.000 description 2
- ZNPRMNDAFQKATM-LKTVYLICSA-N His-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZNPRMNDAFQKATM-LKTVYLICSA-N 0.000 description 2
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 2
- 241001272567 Hominoidea Species 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 2
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 2
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 2
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 2
- WKSHBPRUIRGWRZ-KCTSRDHCSA-N Ile-Trp-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N WKSHBPRUIRGWRZ-KCTSRDHCSA-N 0.000 description 2
- NXRNRBOKDBIVKQ-CXTHYWKRSA-N Ile-Tyr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N NXRNRBOKDBIVKQ-CXTHYWKRSA-N 0.000 description 2
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 2
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 2
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 102000015696 Interleukins Human genes 0.000 description 2
- 108010063738 Interleukins Proteins 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 2
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 2
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 2
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 2
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 2
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 2
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 2
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 2
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 2
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 2
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 2
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 2
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 2
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 2
- USPJSTBDIGJPFK-PMVMPFDFSA-N Lys-Tyr-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O USPJSTBDIGJPFK-PMVMPFDFSA-N 0.000 description 2
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- OBVHKUFUDCPZDW-JYJNAYRXSA-N Met-Arg-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OBVHKUFUDCPZDW-JYJNAYRXSA-N 0.000 description 2
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 101100494726 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) pep-4 gene Proteins 0.000 description 2
- 241000228143 Penicillium Species 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 2
- GYEPCBNTTRORKW-PCBIJLKTSA-N Phe-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O GYEPCBNTTRORKW-PCBIJLKTSA-N 0.000 description 2
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 2
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 2
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 2
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 2
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 2
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 2
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 2
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 2
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- MUPFEKGTMRGPLJ-RMMQSMQOSA-N Raffinose Natural products O(C[C@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](O[C@@]2(CO)[C@H](O)[C@@H](O)[C@@H](CO)O2)O1)[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 MUPFEKGTMRGPLJ-RMMQSMQOSA-N 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 2
- 108091058545 Secretory proteins Proteins 0.000 description 2
- 102000040739 Secretory proteins Human genes 0.000 description 2
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 2
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 2
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 2
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 2
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 2
- RNFKSBPHLTZHLU-WHFBIAKZSA-N Ser-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)O RNFKSBPHLTZHLU-WHFBIAKZSA-N 0.000 description 2
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 2
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 2
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 2
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 2
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 2
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 2
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 2
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 2
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 2
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 2
- UQGAAZXSCGWMFU-UBHSHLNASA-N Ser-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N UQGAAZXSCGWMFU-UBHSHLNASA-N 0.000 description 2
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 2
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 2
- 102000013275 Somatomedins Human genes 0.000 description 2
- 101000895926 Streptomyces plicatus Endo-beta-N-acetylglucosaminidase H Proteins 0.000 description 2
- 101000805921 Strongylocentrotus purpuratus Upstream stimulatory factor Proteins 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- YRNBANYVJJBGDI-VZFHVOOUSA-N Thr-Ala-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N)O YRNBANYVJJBGDI-VZFHVOOUSA-N 0.000 description 2
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 2
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 2
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 2
- DXNUZQGVOMCGNS-SWRJLBSHSA-N Thr-Gln-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O DXNUZQGVOMCGNS-SWRJLBSHSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 2
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 2
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 2
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 2
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 2
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 2
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 2
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 2
- 241000223259 Trichoderma Species 0.000 description 2
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 2
- ZAGPDPNPWYPEIR-SRVKXCTJSA-N Tyr-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ZAGPDPNPWYPEIR-SRVKXCTJSA-N 0.000 description 2
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 2
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 2
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 2
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 2
- MUPFEKGTMRGPLJ-UHFFFAOYSA-N UNPD196149 Natural products OC1C(O)C(CO)OC1(CO)OC1C(O)C(O)C(O)C(COC2C(C(O)C(O)C(CO)O2)O)O1 MUPFEKGTMRGPLJ-UHFFFAOYSA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 2
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 2
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 2
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 2
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 2
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 2
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 2
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 2
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 2
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 2
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 2
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 2
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 2
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- 101000671634 Xenopus borealis Upstream stimulatory factor 1 Proteins 0.000 description 2
- 101100397045 Xenopus laevis invs-b gene Proteins 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010070783 alanyltyrosine Proteins 0.000 description 2
- 235000019418 amylase Nutrition 0.000 description 2
- KBZOIRJILGZLEJ-LGYYRGKSSA-N argipressin Chemical compound C([C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSC[C@@H](C(N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)=O)N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(N)=O)C1=CC=CC=C1 KBZOIRJILGZLEJ-LGYYRGKSSA-N 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 102000006635 beta-lactamase Human genes 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 2
- ORTQZVOHEJQUHG-UHFFFAOYSA-L copper(II) chloride Chemical compound Cl[Cu]Cl ORTQZVOHEJQUHG-UHFFFAOYSA-L 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 229930004094 glycosylphosphatidylinositol Natural products 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010054666 glycyl-leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 101150014702 hil-2 gene Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 235000012015 potatoes Nutrition 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 230000006337 proteolytic cleavage Effects 0.000 description 2
- MUPFEKGTMRGPLJ-ZQSKZDJDSA-N raffinose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)O1 MUPFEKGTMRGPLJ-ZQSKZDJDSA-N 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000005063 solubilization Methods 0.000 description 2
- 230000007928 solubilization Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229960000187 tissue plasminogen activator Drugs 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- BRZYSWJRSDMWLG-DJWUNRQOSA-N (2r,3r,4r,5r)-2-[(1s,2s,3r,4s,6r)-4,6-diamino-3-[(2s,3r,4r,5s,6r)-3-amino-4,5-dihydroxy-6-[(1r)-1-hydroxyethyl]oxan-2-yl]oxy-2-hydroxycyclohexyl]oxy-5-methyl-4-(methylamino)oxane-3,5-diol Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H]([C@@H](C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-DJWUNRQOSA-N 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Chemical group OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- CXWGKAYMVASWDQ-UHFFFAOYSA-N 1,2-dithiane Chemical compound C1CCSSC1 CXWGKAYMVASWDQ-UHFFFAOYSA-N 0.000 description 1
- OTEWWRBKGONZBW-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]-4-methylpentanoyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NC(CC(C)C)C(=O)NCC(=O)NCC(O)=O OTEWWRBKGONZBW-UHFFFAOYSA-N 0.000 description 1
- AXAVXPMQTGXXJZ-UHFFFAOYSA-N 2-aminoacetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol Chemical compound NCC(O)=O.OCC(N)(CO)CO AXAVXPMQTGXXJZ-UHFFFAOYSA-N 0.000 description 1
- BRMWTNUJHUMWMS-UHFFFAOYSA-N 3-Methylhistidine Chemical group CN1C=NC(CC(N)C(O)=O)=C1 BRMWTNUJHUMWMS-UHFFFAOYSA-N 0.000 description 1
- PHKJVUUMSPASRG-UHFFFAOYSA-N 4-[4-chloro-5-(2,6-dimethyl-8-pentan-3-ylimidazo[1,2-b]pyridazin-3-yl)-1,3-thiazol-2-yl]morpholine Chemical compound CC=1N=C2C(C(CC)CC)=CC(C)=NN2C=1C(=C(N=1)Cl)SC=1N1CCOCC1 PHKJVUUMSPASRG-UHFFFAOYSA-N 0.000 description 1
- 229940117976 5-hydroxylysine Drugs 0.000 description 1
- 108091006112 ATPases Proteins 0.000 description 1
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 1
- YHOPXCAOTRUGLV-XAMCCFCMSA-N Ala-Ala-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YHOPXCAOTRUGLV-XAMCCFCMSA-N 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 1
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 1
- FSBCNCKIQZZASN-GUBZILKMSA-N Ala-Arg-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O FSBCNCKIQZZASN-GUBZILKMSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 1
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 1
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- KRHRBKYBJXMYBB-WHFBIAKZSA-N Ala-Cys-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O KRHRBKYBJXMYBB-WHFBIAKZSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 1
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- XCZXVTHYGSMQGH-NAKRPEOUSA-N Ala-Ile-Met Chemical compound C[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C([O-])=O XCZXVTHYGSMQGH-NAKRPEOUSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- QQACQIHVWCVBBR-GVARAGBVSA-N Ala-Ile-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QQACQIHVWCVBBR-GVARAGBVSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 1
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 1
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- XMIAMUXIMWREBJ-HERUPUMHSA-N Ala-Trp-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XMIAMUXIMWREBJ-HERUPUMHSA-N 0.000 description 1
- LFFOJBOTZUWINF-ZANVPECISA-N Ala-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O)=CNC2=C1 LFFOJBOTZUWINF-ZANVPECISA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 102100033367 Appetite-regulating hormone Human genes 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- UIUXXFIKWQVMEX-UFYCRDLUSA-N Arg-Phe-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UIUXXFIKWQVMEX-UFYCRDLUSA-N 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- LOVIQNMIPQVIGT-BVSLBCMMSA-N Arg-Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)C1=CC=CC=C1 LOVIQNMIPQVIGT-BVSLBCMMSA-N 0.000 description 1
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 1
- UTSMXMABBPFVJP-SZMVWBNQSA-N Arg-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UTSMXMABBPFVJP-SZMVWBNQSA-N 0.000 description 1
- 241001523626 Arxula Species 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- CIBWFJFMOBIFTE-CIUDSAMLSA-N Asn-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N CIBWFJFMOBIFTE-CIUDSAMLSA-N 0.000 description 1
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 1
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 1
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 1
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 1
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 1
- OKZOABJQOMAYEC-NUMRIWBASA-N Asn-Gln-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OKZOABJQOMAYEC-NUMRIWBASA-N 0.000 description 1
- OGMDXNFGPOPZTK-GUBZILKMSA-N Asn-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N OGMDXNFGPOPZTK-GUBZILKMSA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- XLHLPYFMXGOASD-CIUDSAMLSA-N Asn-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLHLPYFMXGOASD-CIUDSAMLSA-N 0.000 description 1
- QEQVUHQQYDZUEN-GUBZILKMSA-N Asn-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N QEQVUHQQYDZUEN-GUBZILKMSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- KSGAFDTYQPKUAP-GMOBBJLQSA-N Asn-Met-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KSGAFDTYQPKUAP-GMOBBJLQSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 1
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 1
- IPPFAOCLQSGHJV-WFBYXXMGSA-N Asn-Trp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O IPPFAOCLQSGHJV-WFBYXXMGSA-N 0.000 description 1
- QIRJQYQOIKBPBZ-IHRRRGAJSA-N Asn-Tyr-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QIRJQYQOIKBPBZ-IHRRRGAJSA-N 0.000 description 1
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 1
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 1
- LRCIOEVFVGXZKB-BZSNNMDCSA-N Asn-Tyr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LRCIOEVFVGXZKB-BZSNNMDCSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- BUVNWKQBMZLCDW-UGYAYLCHSA-N Asp-Asn-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BUVNWKQBMZLCDW-UGYAYLCHSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- ICZWAZVKLACMKR-CIUDSAMLSA-N Asp-His-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 ICZWAZVKLACMKR-CIUDSAMLSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 1
- BPTFNDRZKBFMTH-DCAQKATOSA-N Asp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N BPTFNDRZKBFMTH-DCAQKATOSA-N 0.000 description 1
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 1
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- OFYVKOXTTDCUIL-FXQIFTODSA-N Asp-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OFYVKOXTTDCUIL-FXQIFTODSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- OZBXOELNJBSJOA-UBHSHLNASA-N Asp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OZBXOELNJBSJOA-UBHSHLNASA-N 0.000 description 1
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 1
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 1
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 1
- HTSSXFASOUSJQG-IHPCNDPISA-N Asp-Tyr-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HTSSXFASOUSJQG-IHPCNDPISA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- VXEORMGBKTUUCM-KWBADKCTSA-N Asp-Val-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O VXEORMGBKTUUCM-KWBADKCTSA-N 0.000 description 1
- XQFLFQWOBXPMHW-NHCYSSNCSA-N Asp-Val-His Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O XQFLFQWOBXPMHW-NHCYSSNCSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- 101150089473 CWP1 gene Proteins 0.000 description 1
- 102000055006 Calcitonin Human genes 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 101100172290 Candida albicans (strain SC5314 / ATCC MYA-2876) ENG1 gene Proteins 0.000 description 1
- 101100445809 Candida albicans (strain SC5314 / ATCC MYA-2876) XOG1 gene Proteins 0.000 description 1
- 108010031797 Candida antarctica lipase B Proteins 0.000 description 1
- 241000282461 Canis lupus Species 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 241001303562 Centrolophus niger Species 0.000 description 1
- 102100038385 Coiled-coil domain-containing protein R3HCC1L Human genes 0.000 description 1
- 102000007644 Colony-Stimulating Factors Human genes 0.000 description 1
- 108010071942 Colony-Stimulating Factors Proteins 0.000 description 1
- 102100021752 Corticoliberin Human genes 0.000 description 1
- NQSUTVRXXBGVDQ-LKXGYXEUSA-N Cys-Asn-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NQSUTVRXXBGVDQ-LKXGYXEUSA-N 0.000 description 1
- VNLYIYOYUNGURO-ZLUOBGJFSA-N Cys-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N VNLYIYOYUNGURO-ZLUOBGJFSA-N 0.000 description 1
- FWYBFUDWUUFLDN-FXQIFTODSA-N Cys-Asp-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N FWYBFUDWUUFLDN-FXQIFTODSA-N 0.000 description 1
- UWXFFVQPAMBETM-ZLUOBGJFSA-N Cys-Asp-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UWXFFVQPAMBETM-ZLUOBGJFSA-N 0.000 description 1
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 1
- BPHKULHWEIUDOB-FXQIFTODSA-N Cys-Gln-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BPHKULHWEIUDOB-FXQIFTODSA-N 0.000 description 1
- PORWNQWEEIOIRH-XHNCKOQMSA-N Cys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)C(=O)O PORWNQWEEIOIRH-XHNCKOQMSA-N 0.000 description 1
- GUKYYUFHWYRMEU-WHFBIAKZSA-N Cys-Gly-Asp Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O GUKYYUFHWYRMEU-WHFBIAKZSA-N 0.000 description 1
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 1
- OXOQBEVULIBOSH-ZDLURKLDSA-N Cys-Gly-Thr Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O OXOQBEVULIBOSH-ZDLURKLDSA-N 0.000 description 1
- VFGADOJXRLWTBU-JBDRJPRFSA-N Cys-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N VFGADOJXRLWTBU-JBDRJPRFSA-N 0.000 description 1
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 1
- LHMSYHSAAJOEBL-CIUDSAMLSA-N Cys-Lys-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O LHMSYHSAAJOEBL-CIUDSAMLSA-N 0.000 description 1
- ORYFTECKJZTNQP-DCAQKATOSA-N Cys-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N ORYFTECKJZTNQP-DCAQKATOSA-N 0.000 description 1
- RJPKQCFHEPPTGL-ZLUOBGJFSA-N Cys-Ser-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RJPKQCFHEPPTGL-ZLUOBGJFSA-N 0.000 description 1
- IXPSSIBVVKSOIE-SRVKXCTJSA-N Cys-Ser-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O IXPSSIBVVKSOIE-SRVKXCTJSA-N 0.000 description 1
- JAHCWGSVNZXHRR-SVSWQMSJSA-N Cys-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)N JAHCWGSVNZXHRR-SVSWQMSJSA-N 0.000 description 1
- KFYPRIGJTICABD-XGEHTFHBSA-N Cys-Thr-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N)O KFYPRIGJTICABD-XGEHTFHBSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 241000125666 Devario Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- 101150108911 EGT2 gene Proteins 0.000 description 1
- 101150000833 EXG1 gene Proteins 0.000 description 1
- 108010092674 Enkephalins Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 1
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 1
- 102000012673 Follicle Stimulating Hormone Human genes 0.000 description 1
- 108010079345 Follicle Stimulating Hormone Proteins 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 1
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 1
- IKDOHQHEFPPGJG-FXQIFTODSA-N Gln-Asp-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IKDOHQHEFPPGJG-FXQIFTODSA-N 0.000 description 1
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 1
- KZEUVLLVULIPNX-GUBZILKMSA-N Gln-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N KZEUVLLVULIPNX-GUBZILKMSA-N 0.000 description 1
- OIIIRRTWYLCQNW-ACZMJKKPSA-N Gln-Cys-Asn Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O OIIIRRTWYLCQNW-ACZMJKKPSA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 1
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 1
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 1
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 1
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 1
- HXOLDXKNWKLDMM-YVNDNENWSA-N Gln-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HXOLDXKNWKLDMM-YVNDNENWSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 1
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 1
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 1
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- OUBUHIODTNUUTC-WDCWCFNPSA-N Gln-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OUBUHIODTNUUTC-WDCWCFNPSA-N 0.000 description 1
- RONJIBWTGKVKFY-HTUGSXCWSA-N Gln-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O RONJIBWTGKVKFY-HTUGSXCWSA-N 0.000 description 1
- CMFBOXUBWMZZMD-BPUTZDHNSA-N Gln-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N CMFBOXUBWMZZMD-BPUTZDHNSA-N 0.000 description 1
- YJCZUTXLPXBNIO-BHYGNILZSA-N Gln-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)N)N)C(=O)O YJCZUTXLPXBNIO-BHYGNILZSA-N 0.000 description 1
- AKDOUBMVLRCHBD-SIUGBPQLSA-N Gln-Tyr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AKDOUBMVLRCHBD-SIUGBPQLSA-N 0.000 description 1
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 1
- HPBKQFJXDUVNQV-FHWLQOOXSA-N Gln-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O HPBKQFJXDUVNQV-FHWLQOOXSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 1
- FKGNJUCQKXQNRA-NRPADANISA-N Glu-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O FKGNJUCQKXQNRA-NRPADANISA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- ZTNHPMZHAILHRB-JSGCOSHPSA-N Glu-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)NCC(O)=O)=CNC2=C1 ZTNHPMZHAILHRB-JSGCOSHPSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- KXRORHJIRAOQPG-SOUVJXGZSA-N Glu-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KXRORHJIRAOQPG-SOUVJXGZSA-N 0.000 description 1
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- GQGAFTPXAPKSCF-WHFBIAKZSA-N Gly-Ala-Cys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O GQGAFTPXAPKSCF-WHFBIAKZSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 1
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- GNBMOZPQUXTCRW-STQMWFEESA-N Gly-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)CN)C(O)=O)=CNC2=C1 GNBMOZPQUXTCRW-STQMWFEESA-N 0.000 description 1
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- YDWZGVCXMVLDQH-WHFBIAKZSA-N Gly-Cys-Asn Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O YDWZGVCXMVLDQH-WHFBIAKZSA-N 0.000 description 1
- LEGMTEAZGRRIMY-ZKWXMUAHSA-N Gly-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN LEGMTEAZGRRIMY-ZKWXMUAHSA-N 0.000 description 1
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 1
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 1
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 1
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 1
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- ONSARSFSJHTMFJ-STQMWFEESA-N Gly-Trp-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ONSARSFSJHTMFJ-STQMWFEESA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 239000000579 Gonadotropin-Releasing Hormone Substances 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 1
- 102100036683 Growth arrest-specific protein 1 Human genes 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- MJNWEIMBXKKCSF-XVYDVKMFSA-N His-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MJNWEIMBXKKCSF-XVYDVKMFSA-N 0.000 description 1
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 1
- HDXNWVLQSQFJOX-SRVKXCTJSA-N His-Arg-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HDXNWVLQSQFJOX-SRVKXCTJSA-N 0.000 description 1
- MWWOPNQSBXEUHO-ULQDDVLXSA-N His-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 MWWOPNQSBXEUHO-ULQDDVLXSA-N 0.000 description 1
- OMNVOTCFQQLEQU-CIUDSAMLSA-N His-Asn-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMNVOTCFQQLEQU-CIUDSAMLSA-N 0.000 description 1
- WZOGEMJIZBNFBK-CIUDSAMLSA-N His-Asp-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O WZOGEMJIZBNFBK-CIUDSAMLSA-N 0.000 description 1
- SWSVTNGMKBDTBM-DCAQKATOSA-N His-Gln-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SWSVTNGMKBDTBM-DCAQKATOSA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 1
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 1
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 1
- QEYUCKCWTMIERU-SRVKXCTJSA-N His-Lys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QEYUCKCWTMIERU-SRVKXCTJSA-N 0.000 description 1
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 1
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 1
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 1
- 108091006054 His-tagged proteins Proteins 0.000 description 1
- 101000743767 Homo sapiens Coiled-coil domain-containing protein R3HCC1L Proteins 0.000 description 1
- 101000895481 Homo sapiens Corticoliberin Proteins 0.000 description 1
- 101500028775 Homo sapiens Glucagon Proteins 0.000 description 1
- 101001072723 Homo sapiens Growth arrest-specific protein 1 Proteins 0.000 description 1
- 101000941289 Homo sapiens Hepatic triacylglycerol lipase Proteins 0.000 description 1
- 101001047912 Homo sapiens Hydroxymethylglutaryl-CoA lyase, mitochondrial Proteins 0.000 description 1
- 101100232904 Homo sapiens IL2 gene Proteins 0.000 description 1
- 101000687855 Homo sapiens Suppressor of cytokine signaling 3 Proteins 0.000 description 1
- 101001052849 Homo sapiens Tyrosine-protein kinase Fer Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 241000701109 Human adenovirus 2 Species 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- REJKOQYVFDEZHA-SLBDDTMCSA-N Ile-Asp-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N REJKOQYVFDEZHA-SLBDDTMCSA-N 0.000 description 1
- CTHAJJYOHOBUDY-GHCJXIJMSA-N Ile-Cys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N CTHAJJYOHOBUDY-GHCJXIJMSA-N 0.000 description 1
- BALLIXFZYSECCF-QEWYBTABSA-N Ile-Gln-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N BALLIXFZYSECCF-QEWYBTABSA-N 0.000 description 1
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- DJQUZZAFLFQVFL-UHFFFAOYSA-N Ile-Gly-Leu-Pro Chemical compound CCC(C)C(N)C(=O)NCC(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O DJQUZZAFLFQVFL-UHFFFAOYSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- MTONDYJJCIBZTK-PEDHHIEDSA-N Ile-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)O)N MTONDYJJCIBZTK-PEDHHIEDSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 1
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 1
- NPAYJTAXWXJKLO-NAKRPEOUSA-N Ile-Met-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N NPAYJTAXWXJKLO-NAKRPEOUSA-N 0.000 description 1
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 1
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 1
- IIWQTXMUALXGOV-PCBIJLKTSA-N Ile-Phe-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IIWQTXMUALXGOV-PCBIJLKTSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 1
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- FBGXMKUWQFPHFB-JBDRJPRFSA-N Ile-Ser-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N FBGXMKUWQFPHFB-JBDRJPRFSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 1
- OAQJOXZPGHTJNA-NGTWOADLSA-N Ile-Trp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N OAQJOXZPGHTJNA-NGTWOADLSA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 1
- REXAUQBGSGDEJY-IGISWZIWSA-N Ile-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N REXAUQBGSGDEJY-IGISWZIWSA-N 0.000 description 1
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 1
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 1
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 102000003996 Interferon-beta Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical group OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 102000004407 Lactalbumin Human genes 0.000 description 1
- 108090000942 Lactalbumin Proteins 0.000 description 1
- 108010063045 Lactoferrin Proteins 0.000 description 1
- 102000010445 Lactoferrin Human genes 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- IIKJNQWOQIWWMR-CIUDSAMLSA-N Leu-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N IIKJNQWOQIWWMR-CIUDSAMLSA-N 0.000 description 1
- WCTCIIAGNMFYAO-DCAQKATOSA-N Leu-Cys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O WCTCIIAGNMFYAO-DCAQKATOSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 1
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 1
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 1
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- SXOFUVGLPHCPRQ-KKUMJFAQSA-N Leu-Tyr-Cys Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(O)=O SXOFUVGLPHCPRQ-KKUMJFAQSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- NTXYXFDMIHXTHE-WDSOQIARSA-N Leu-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 NTXYXFDMIHXTHE-WDSOQIARSA-N 0.000 description 1
- URLZCHNOLZSCCA-VABKMULXSA-N Leu-enkephalin Chemical class C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 URLZCHNOLZSCCA-VABKMULXSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 102000009151 Luteinizing Hormone Human genes 0.000 description 1
- 108010073521 Luteinizing Hormone Proteins 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- BTSXLXFPMZXVPR-DLOVCJGASA-N Lys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BTSXLXFPMZXVPR-DLOVCJGASA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- NDSNUWJPZKTFAR-DCAQKATOSA-N Lys-Cys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCCN NDSNUWJPZKTFAR-DCAQKATOSA-N 0.000 description 1
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- OIYWBDBHEGAVST-BZSNNMDCSA-N Lys-His-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OIYWBDBHEGAVST-BZSNNMDCSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 1
- UDXSLGLHFUBRRM-OEAJRASXSA-N Lys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCCN)N)O UDXSLGLHFUBRRM-OEAJRASXSA-N 0.000 description 1
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 1
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 1
- PPNCMJARTHYNEC-MEYUZBJRSA-N Lys-Tyr-Thr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)CC1=CC=C(O)C=C1 PPNCMJARTHYNEC-MEYUZBJRSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- 101710089743 Mating factor alpha Proteins 0.000 description 1
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 1
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 1
- WDTLNWHPIPCMMP-AVGNSLFASA-N Met-Arg-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O WDTLNWHPIPCMMP-AVGNSLFASA-N 0.000 description 1
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 1
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 1
- FBQMBZLJHOQAIH-GUBZILKMSA-N Met-Asp-Met Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O FBQMBZLJHOQAIH-GUBZILKMSA-N 0.000 description 1
- PTYVBBNIAQWUFV-DCAQKATOSA-N Met-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCSC)N PTYVBBNIAQWUFV-DCAQKATOSA-N 0.000 description 1
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 1
- DJDFBVNNDAUPRW-GUBZILKMSA-N Met-Glu-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O DJDFBVNNDAUPRW-GUBZILKMSA-N 0.000 description 1
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 1
- SXWQMBGNFXAGAT-FJXKBIBVSA-N Met-Gly-Thr Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SXWQMBGNFXAGAT-FJXKBIBVSA-N 0.000 description 1
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- LBNFTWKGISQVEE-AVGNSLFASA-N Met-Leu-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCSC LBNFTWKGISQVEE-AVGNSLFASA-N 0.000 description 1
- KRLKICLNEICJGV-STQMWFEESA-N Met-Phe-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 KRLKICLNEICJGV-STQMWFEESA-N 0.000 description 1
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 1
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- KPVLLNDCBYXKNV-CYDGBPFRSA-N Met-Val-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KPVLLNDCBYXKNV-CYDGBPFRSA-N 0.000 description 1
- JACMWNXOOUYXCD-JYJNAYRXSA-N Met-Val-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JACMWNXOOUYXCD-JYJNAYRXSA-N 0.000 description 1
- IQJMEDDVOGMTKT-SRVKXCTJSA-N Met-Val-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IQJMEDDVOGMTKT-SRVKXCTJSA-N 0.000 description 1
- 102000005431 Molecular Chaperones Human genes 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 101000933447 Mus musculus Beta-glucuronidase Proteins 0.000 description 1
- JDHILDINMRGULE-LURJTMIESA-N N(pros)-methyl-L-histidine Chemical group CN1C=NC=C1C[C@H](N)C(O)=O JDHILDINMRGULE-LURJTMIESA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000710778 Pestivirus Species 0.000 description 1
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 1
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 1
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 1
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 1
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 1
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- SXJGROGVINAYSH-AVGNSLFASA-N Phe-Gln-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SXJGROGVINAYSH-AVGNSLFASA-N 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 1
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 1
- MMYUOSCXBJFUNV-QWRGUYRKSA-N Phe-Gly-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N MMYUOSCXBJFUNV-QWRGUYRKSA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 1
- OWSLLRKCHLTUND-BZSNNMDCSA-N Phe-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OWSLLRKCHLTUND-BZSNNMDCSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 1
- FZBGMXYQPACKNC-HJWJTTGWSA-N Phe-Pro-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FZBGMXYQPACKNC-HJWJTTGWSA-N 0.000 description 1
- FKFCKDROTNIVSO-JYJNAYRXSA-N Phe-Pro-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O FKFCKDROTNIVSO-JYJNAYRXSA-N 0.000 description 1
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 1
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 1
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 1
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 1
- ABEFOXGAIIJDCL-SFJXLCSZSA-N Phe-Thr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 ABEFOXGAIIJDCL-SFJXLCSZSA-N 0.000 description 1
- DXWNFNOPBYAFRM-IHRRRGAJSA-N Phe-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N DXWNFNOPBYAFRM-IHRRRGAJSA-N 0.000 description 1
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 1
- GNZCMRRSXOBHLC-JYJNAYRXSA-N Phe-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N GNZCMRRSXOBHLC-JYJNAYRXSA-N 0.000 description 1
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 1
- 102100032572 Phospholipase A-2-activating protein Human genes 0.000 description 1
- 102000013566 Plasminogen Human genes 0.000 description 1
- 108010051456 Plasminogen Proteins 0.000 description 1
- 108010001014 Plasminogen Activators Proteins 0.000 description 1
- 102000001938 Plasminogen Activators Human genes 0.000 description 1
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 1
- ODPIUQVTULPQEP-CIUDSAMLSA-N Pro-Gln-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ODPIUQVTULPQEP-CIUDSAMLSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 1
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 1
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 1
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- SXMSEHDMNIUTSP-DCAQKATOSA-N Pro-Lys-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SXMSEHDMNIUTSP-DCAQKATOSA-N 0.000 description 1
- VWHJZETTZDAGOM-XUXIUFHCSA-N Pro-Lys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VWHJZETTZDAGOM-XUXIUFHCSA-N 0.000 description 1
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 1
- GNADVDLLGVSXLS-ULQDDVLXSA-N Pro-Phe-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GNADVDLLGVSXLS-ULQDDVLXSA-N 0.000 description 1
- SPLBRAKYXGOFSO-UNQGMJICSA-N Pro-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@@H]2CCCN2)O SPLBRAKYXGOFSO-UNQGMJICSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- BXHRXLMCYSZSIY-STECZYCISA-N Pro-Tyr-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O BXHRXLMCYSZSIY-STECZYCISA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- 102000003946 Prolactin Human genes 0.000 description 1
- 108010057464 Prolactin Proteins 0.000 description 1
- 102000006010 Protein Disulfide-Isomerase Human genes 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 101150030816 SCW4 gene Proteins 0.000 description 1
- 101000718529 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) Alpha-galactosidase Proteins 0.000 description 1
- 101100172292 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DSE4 gene Proteins 0.000 description 1
- 101100537666 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) TOS1 gene Proteins 0.000 description 1
- 241000710961 Semliki Forest virus Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 1
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 1
- JJKSSJVYOVRJMZ-FXQIFTODSA-N Ser-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)CN=C(N)N JJKSSJVYOVRJMZ-FXQIFTODSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- ZHYMUFQVKGJNRM-ZLUOBGJFSA-N Ser-Cys-Asn Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O ZHYMUFQVKGJNRM-ZLUOBGJFSA-N 0.000 description 1
- TUYBIWUZWJUZDD-ACZMJKKPSA-N Ser-Cys-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(N)=O TUYBIWUZWJUZDD-ACZMJKKPSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- YMDNFPNTIPQMJP-NAKRPEOUSA-N Ser-Ile-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O YMDNFPNTIPQMJP-NAKRPEOUSA-N 0.000 description 1
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 1
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 1
- JUTGONBTALQWMK-NAKRPEOUSA-N Ser-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N JUTGONBTALQWMK-NAKRPEOUSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- VFWQQZMRKFOGLE-ZLUOBGJFSA-N Ser-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O VFWQQZMRKFOGLE-ZLUOBGJFSA-N 0.000 description 1
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- SOACHCFYJMCMHC-BWBBJGPYSA-N Ser-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O SOACHCFYJMCMHC-BWBBJGPYSA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- PZHJLTWGMYERRJ-SRVKXCTJSA-N Ser-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O PZHJLTWGMYERRJ-SRVKXCTJSA-N 0.000 description 1
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 1
- BIWBTRRBHIEVAH-IHPCNDPISA-N Ser-Tyr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O BIWBTRRBHIEVAH-IHPCNDPISA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 102100024283 Suppressor of cytokine signaling 3 Human genes 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 1
- JHBHMCMKSPXRHV-NUMRIWBASA-N Thr-Asn-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JHBHMCMKSPXRHV-NUMRIWBASA-N 0.000 description 1
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- JVTHIXKSVYEWNI-JRQIVUDYSA-N Thr-Asn-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JVTHIXKSVYEWNI-JRQIVUDYSA-N 0.000 description 1
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 1
- NLJKZUGAIIRWJN-LKXGYXEUSA-N Thr-Asp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O NLJKZUGAIIRWJN-LKXGYXEUSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- ODSAPYVQSLDRSR-LKXGYXEUSA-N Thr-Cys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O ODSAPYVQSLDRSR-LKXGYXEUSA-N 0.000 description 1
- YAAPRMFURSENOZ-KATARQTJSA-N Thr-Cys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O YAAPRMFURSENOZ-KATARQTJSA-N 0.000 description 1
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- DDDLIMCZFKOERC-SVSWQMSJSA-N Thr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N DDDLIMCZFKOERC-SVSWQMSJSA-N 0.000 description 1
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- YJVJPJPHHFOVMG-VEVYYDQMSA-N Thr-Met-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YJVJPJPHHFOVMG-VEVYYDQMSA-N 0.000 description 1
- PUEWAXRPXOEQOW-HJGDQZAQSA-N Thr-Met-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O PUEWAXRPXOEQOW-HJGDQZAQSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- WRUWXBBEFUTJOU-XGEHTFHBSA-N Thr-Met-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N)O WRUWXBBEFUTJOU-XGEHTFHBSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- XIHGJKFSIDTDKV-LYARXQMPSA-N Thr-Phe-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XIHGJKFSIDTDKV-LYARXQMPSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- NBIIPOKZPUGATB-BWBBJGPYSA-N Thr-Ser-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O NBIIPOKZPUGATB-BWBBJGPYSA-N 0.000 description 1
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 1
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- TZQWJCGVCIJDMU-HEIBUPTGSA-N Thr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N)O TZQWJCGVCIJDMU-HEIBUPTGSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- REJRKTOJTCPDPO-IRIUXVKKSA-N Thr-Tyr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O REJRKTOJTCPDPO-IRIUXVKKSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- XVHAUVJXBFGUPC-RPTUDFQQSA-N Thr-Tyr-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XVHAUVJXBFGUPC-RPTUDFQQSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 102000011923 Thyrotropin Human genes 0.000 description 1
- 108010061174 Thyrotropin Proteins 0.000 description 1
- 102000006747 Transforming Growth Factor alpha Human genes 0.000 description 1
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 1
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 1
- 101800004564 Transforming growth factor alpha Proteins 0.000 description 1
- BDWDMRSGCXEDMR-WFBYXXMGSA-N Trp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N BDWDMRSGCXEDMR-WFBYXXMGSA-N 0.000 description 1
- VZBWRZGNEPBRDE-HZUKXOBISA-N Trp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N VZBWRZGNEPBRDE-HZUKXOBISA-N 0.000 description 1
- AVYVKJMBNLPWRX-WFBYXXMGSA-N Trp-Ala-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 AVYVKJMBNLPWRX-WFBYXXMGSA-N 0.000 description 1
- NKUIXQOJUAEIET-AQZXSJQPSA-N Trp-Asp-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 NKUIXQOJUAEIET-AQZXSJQPSA-N 0.000 description 1
- JZHJLBPBQKPTNX-UBHSHLNASA-N Trp-Cys-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 JZHJLBPBQKPTNX-UBHSHLNASA-N 0.000 description 1
- NXJZCPKZIKTYLX-XEGUGMAKSA-N Trp-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NXJZCPKZIKTYLX-XEGUGMAKSA-N 0.000 description 1
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 1
- OGXQLUCMJZSJPW-LYSGOOTNSA-N Trp-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O OGXQLUCMJZSJPW-LYSGOOTNSA-N 0.000 description 1
- WSGPBCAGEGHKQJ-BBRMVZONSA-N Trp-Gly-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WSGPBCAGEGHKQJ-BBRMVZONSA-N 0.000 description 1
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 1
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 1
- HJXOFWKCWLHYIJ-SZMVWBNQSA-N Trp-Lys-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HJXOFWKCWLHYIJ-SZMVWBNQSA-N 0.000 description 1
- IKUMWSDCGQVGHC-UMPQAUOISA-N Trp-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O IKUMWSDCGQVGHC-UMPQAUOISA-N 0.000 description 1
- GSCPHMSPGQSZJT-JYBASQMISA-N Trp-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GSCPHMSPGQSZJT-JYBASQMISA-N 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 1
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- JRXKIVGWMMIIOF-YDHLFZDLSA-N Tyr-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JRXKIVGWMMIIOF-YDHLFZDLSA-N 0.000 description 1
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- JFDGVHXRCKEBAU-KKUMJFAQSA-N Tyr-Asp-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JFDGVHXRCKEBAU-KKUMJFAQSA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- FFCRCJZJARTYCG-KKUMJFAQSA-N Tyr-Cys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O FFCRCJZJARTYCG-KKUMJFAQSA-N 0.000 description 1
- CKHQKYHIZCRTAP-SOUVJXGZSA-N Tyr-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CKHQKYHIZCRTAP-SOUVJXGZSA-N 0.000 description 1
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 1
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 1
- NJLQMKZSXYQRTO-FHWLQOOXSA-N Tyr-Glu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NJLQMKZSXYQRTO-FHWLQOOXSA-N 0.000 description 1
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 1
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 1
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 1
- AVIQBBOOTZENLH-KKUMJFAQSA-N Tyr-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AVIQBBOOTZENLH-KKUMJFAQSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 1
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 1
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- PHKQVWWHRYUCJL-HJOGWXRNSA-N Tyr-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PHKQVWWHRYUCJL-HJOGWXRNSA-N 0.000 description 1
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 1
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 1
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 1
- PLVVHGFEMSDRET-IHPCNDPISA-N Tyr-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PLVVHGFEMSDRET-IHPCNDPISA-N 0.000 description 1
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 1
- NZBSVMQZQMEUHI-WZLNRYEVSA-N Tyr-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NZBSVMQZQMEUHI-WZLNRYEVSA-N 0.000 description 1
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 1
- ANHVRCNNGJMJNG-BZSNNMDCSA-N Tyr-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CS)C(=O)O)N)O ANHVRCNNGJMJNG-BZSNNMDCSA-N 0.000 description 1
- DJSYPCWZPNHQQE-FHWLQOOXSA-N Tyr-Tyr-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=C(O)C=C1 DJSYPCWZPNHQQE-FHWLQOOXSA-N 0.000 description 1
- QVYFTFIBKCDHIE-ACRUOGEOSA-N Tyr-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O QVYFTFIBKCDHIE-ACRUOGEOSA-N 0.000 description 1
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 1
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 1
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 1
- YKBUNNNRNZZUID-UFYCRDLUSA-N Tyr-Val-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YKBUNNNRNZZUID-UFYCRDLUSA-N 0.000 description 1
- 102100024537 Tyrosine-protein kinase Fer Human genes 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 1
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- WJVLTYSHNXRCLT-NHCYSSNCSA-N Val-His-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WJVLTYSHNXRCLT-NHCYSSNCSA-N 0.000 description 1
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- PHZGFLFMGLXCFG-FHWLQOOXSA-N Val-Lys-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N PHZGFLFMGLXCFG-FHWLQOOXSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- 102100026383 Vasopressin-neurophysin 2-copeptin Human genes 0.000 description 1
- 108010004977 Vasopressins Proteins 0.000 description 1
- 102000002852 Vasopressins Human genes 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 102000004139 alpha-Amylases Human genes 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- NNISLDGFPWIBDF-MPRBLYSKSA-N alpha-D-Gal-(1->3)-beta-D-Gal-(1->4)-D-GlcNAc Chemical compound O[C@@H]1[C@@H](NC(=O)C)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](O)[C@@H](CO)O1 NNISLDGFPWIBDF-MPRBLYSKSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 102000016679 alpha-Glucosidases Human genes 0.000 description 1
- 229940024171 alpha-amylase Drugs 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010019077 beta-Amylase Proteins 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- DLRVVLDZNNYCBX-ZZFZYMBESA-N beta-melibiose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@H](O)O1 DLRVVLDZNNYCBX-ZZFZYMBESA-N 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 102100022422 cGMP-dependent protein kinase 1 Human genes 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 102000014509 cathelicidin Human genes 0.000 description 1
- 108060001132 cathelicidin Proteins 0.000 description 1
- POIUWJQBRNEFGX-XAMSXPGMSA-N cathelicidin Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C1=CC=CC=C1 POIUWJQBRNEFGX-XAMSXPGMSA-N 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 108010015046 cell aggregation factors Proteins 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 238000001218 confocal laser scanning microscopy Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000006184 cosolvent Substances 0.000 description 1
- 229960003280 cupric chloride Drugs 0.000 description 1
- OOTFVKOQINZBBF-UHFFFAOYSA-N cystamine Chemical compound CCSSCCN OOTFVKOQINZBBF-UHFFFAOYSA-N 0.000 description 1
- 229940099500 cystamine Drugs 0.000 description 1
- 108010057085 cytokine receptors Proteins 0.000 description 1
- 102000003675 cytokine receptors Human genes 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- YSMODUONRAFBET-UHFFFAOYSA-N delta-DL-hydroxylysine Chemical group NCC(O)CCC(N)C(O)=O YSMODUONRAFBET-UHFFFAOYSA-N 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- LOZWAPSEEHRYPG-UHFFFAOYSA-N dithiane Natural products C1CSCCS1 LOZWAPSEEHRYPG-UHFFFAOYSA-N 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 230000008472 epithelial growth Effects 0.000 description 1
- YSMODUONRAFBET-UHNVWZDZSA-N erythro-5-hydroxy-L-lysine Chemical group NC[C@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-UHNVWZDZSA-N 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 230000010856 establishment of protein localization Effects 0.000 description 1
- 238000005530 etching Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 101150017859 exgA gene Proteins 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229940126864 fibroblast growth factor Drugs 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 102000035175 foldases Human genes 0.000 description 1
- 108091005749 foldases Proteins 0.000 description 1
- 229940028334 follicle stimulating hormone Drugs 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 108010077689 gamma-aminobutyryl-2-methyltryptophyl-2-methyltryptophyl-2-methyltryptophyl-lysinamide Proteins 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 210000002149 gonad Anatomy 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 239000003966 growth inhibitor Substances 0.000 description 1
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 1
- 238000002169 hydrotherapy Methods 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 230000002267 hypothalamic effect Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 210000003000 inclusion body Anatomy 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 229960001388 interferon-beta Drugs 0.000 description 1
- 229940065638 intron a Drugs 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- CSSYQJWUGATIHM-IKGCZBKSSA-N l-phenylalanyl-l-lysyl-l-cysteinyl-l-arginyl-l-arginyl-l-tryptophyl-l-glutaminyl-l-tryptophyl-l-arginyl-l-methionyl-l-lysyl-l-lysyl-l-leucylglycyl-l-alanyl-l-prolyl-l-seryl-l-isoleucyl-l-threonyl-l-cysteinyl-l-valyl-l-arginyl-l-arginyl-l-alanyl-l-phenylal Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CSSYQJWUGATIHM-IKGCZBKSSA-N 0.000 description 1
- 229940078795 lactoferrin Drugs 0.000 description 1
- 235000021242 lactoferrin Nutrition 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 238000005374 membrane filtration Methods 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000001000 micrograph Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 210000004898 n-terminal fragment Anatomy 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 108010044533 phospholipase A2-activating protein Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 229940127126 plasminogen activator Drugs 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 229940097325 prolactin Drugs 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 108020003519 protein disulfide isomerase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 210000003935 rough endoplasmic reticulum Anatomy 0.000 description 1
- 108060007223 rubredoxin Proteins 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 238000003153 stable transfection Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 230000002992 thymic effect Effects 0.000 description 1
- 230000008467 tissue growth Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- 108010060175 trypsinogen activation peptide Proteins 0.000 description 1
- 102000003390 tumor necrosis factor Human genes 0.000 description 1
- 108010079202 tyrosyl-alanyl-cysteine Proteins 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010029599 tyrosyl-glutamyl-tryptophan Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 210000003934 vacuole Anatomy 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 229960003726 vasopressin Drugs 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 235000021241 α-lactalbumin Nutrition 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
- C12N15/625—DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1051—Gene trapping, e.g. exon-, intron-, IRES-, signal sequence-trap cloning, trap vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Chemical & Material Sciences (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 재조합 단백질의 고분비 생산에 적합한 최적의 분비 융합 파트너 (SFP)를 확보하기 위한 기술에 관한 것이다. SFP는 시크리톰 분석으로부터 얻을 수 있다. 재조합 단백질은 분비 융합 파트너 (SFP)와의 융합 형태로 생성되며, 생체내 프로테아제 처리에 의해 SFP로부터 분리될 수 있다. 본 발명의 SFP는 바이오-제약 및 바이오-산업에서 가치있는 목적 단백질 및 펩티드의 분비 수준을 유의하게 향상시킨다.
Description
본 발명은 재조합 단백질 발현 기술 분야에 관한 것이다. 특히, 본 발명은 분비 융합 파트너 (secretion fusion partner: SFP) 및 적절한 SFP를 스크리닝하기 위한 기술에 관한 것이다. 목적 폴리펩티드의 과량 분비 생산을 달성하기 위한 최적화된 SFP가 기재되어 있다. 본 발명의 SFP는 재조합 단백질의 고분비 생산을 유도할 수 있다.
관심있는 단백질의 재조합 발현은 연구 목적 또는 치료용 및 다른 상업적 용도를 위해 대량의 단백질의 생산을 위해 널리 이용되는 방법이다. 박테리아, 효모, 및 포유류 숙주 세포계를 비롯한 다양한 재조합 발현계가 당업계에 공지되어 있으며, 다수의 단백질이 이들 발현계에서 성공적으로 생산된다. 그러나, 이러한 발현계에서 발현율이 낮은 단백질이 존재하며, 경우에 따라서 전혀 발현 및 분비가 되지 않는 경우가 많이 있다. 이러한 분비생산성이 낮은 재조합 단백질의 분비생산을 증진시키기 위한 방법, 예컨대 분자 샤페론 및 폴다아제 (foldase)의 과발현 (Hackel et al., Pharm Res 23: 790(2006); Poewer and Robinson, Biotechnol Prog 23: 364 (2007); Shusta et al., Nat Biotechnol 16: 773 (1998)), 분비 경로와 관련된 유전자의 과발현 (Carla Fama et al., Biochim Biophys Acta 1773: 232 (2007); Wentz and Shusta et al., Appl Environ Microbiol 73: 1189 (1998)), 리더 서열의 조작 (Clements et al., Gene 106: 267 (1991); Kjaerulff and Jensen, Biochem Biophys Res Commun 336: 974 (2005); Sagiya et al., Microbiol. Biotechnol 42: 358 (1994); Li et al., Bitechnol Prog 18: 831 (2002))등이 보고되어 있으나 이 경우에도 몇몇 특정 단백질에서만 효과적임이 확인되었다.
단백질 생산을 증가시키는 또 다른 방식으로는 목적단백질을 융합 파트너에 연결하여 생산하는 것이다. 인간 혈청 알부민 (Kang et al., Protein Expr Purif 53: 331 (2007); Huang et al., J. Pept. Sci 14:588 (2008)), 알파-락트알부민 (WO1995027782A1), 루브레독신 (WO2000039310A1), 인간 글루카곤 (WO2000053777A1), 먹장어로부터 유래된 카텔리시딘-관련 펩티드 (WO2005019242A2), 포스포리불로키나아제 (US6500647B1), 단백질 디술파이드 이성질화효소 (문헌 [Kajino et al., Appl Environ Microbiol 66:638 (2000), 포도상구균 단백질 A (문헌 [Moreno et al., Protein Expr Purif 18:242 (2000)], Hsp150 단백질 (문헌 [Sievi et al., Biotechnol. Prog. 19:1368 (2003)], 셀룰로스-결합 도메인 (문헌 [Ahn et al., Appl Microbiol Biotechnol. 64:833 (2004)]) 및 금 결합 펩티드 (US20050106625A1)등과 같은 융합 파트너를 사용하여 몇몇 분비 단백질의 생산을 증가시켰다.
분비단백질 또는 새로운 분비 신호 서열을 확보하기 위한 노력으로, 다양한 분비시그널 트랩 시스템이 개발되었다. 미국 특허 제6,228,590호에는 리포터 단백질-결핍 효모를 리포터 단백질에 융합된 포유류 코딩 서열을 포함하는 핵산으로 형질전환시키고, 리포터 단백질을 분비하는 세포를 검출함으로써 포유류 분비 신호 서열을 스크리닝하기 위한 기술이 기재되어 있다. 인버타아제 (invertase)-결핍 효모 및 인버타아제 리포터 단백질을 이용한 유사한 시스템이 EP0907727에 개시되어 있다. 효모에 기초한 분비 신호 서열 트랩은 인간 DNA (Klein et al., Proc. Natl. Acad. Sci. USA 93:7108 (1996); Jacobs et al., Gene 198:289 (1997)), 마우스 DNA (Gallicioti et al., J. Membrane Biol. 183:175 (2001)), 제브라피쉬 DNA (Crosier et al., Dev. Dynamics 222:637 (2001)), 아라비돕시스 (Arabidopsis) DNA (Goo et al., Plant Mol. Biol. 41:415 (1999)), 감자 DNA (Surpili et al., Anais de Academia Brasileira de Ciencias 74:599 (2002)), 및 칸디다 알비칸스 (Candida albicans) DNA (Monteoliva et al., Eukaryotic Cell 1:514 (2002))로부터 분비되는 단백질을 확인하기 위해 사용되었다. 포유류 숙주 세포 (Gallicioti et al., J. Membrane Biol. 183:175 (2001)) 및 박테리아 숙주 세포 (Ferguson et al., Cancer Res. 65:8209 (2000))를 이용한 유사한 트랩 시스템이 개발되었다. 분비 신호 서열 트랩에서 사용된 리포터 단백질에는 인버타아제 (Klein et al., Proc. Natl. Acad. Sci. USA 93:7108 (1996)), 알파 아밀라아제 (미국 특허 제6,228,590호), 산성 포스파타아제 (PHO5) (Surpili et al., Anais de Academia Brasileira de Ciencias 74:599 (2002)), 및 β-락타마아제 (Ferguson et al., Cancer Res. 65:8209 (2000))가 포함된다.
목적 단백질의 분비에 유용한 번역 융합 파트너 (translational fusion partner: TFP)를 확인하기 위한 방법은 WO 2005/068658에 개시되어 있다. 상기 방법은, (i) 핵산 단편의 라이브러리 및 리포터 단백질을 인코딩하는 뉴클레오티드 서열과 함께 융합된 목적 단백질을 인코딩하는 뉴클레오티드 서열을 포함하는 다양한 벡터로 형질전환된, 리포터 단백질이 결핍된 다수의 숙주 세포를 수득하는 단계, 및 (ii) 상기 숙주 세포로부터, 목적 단백질의 분비를 개별적으로 유도하는 핵산 단편을 포함하는 TFP 라이브러리를 확인하는 단계를 포함한다.
효모에서 거의 분비되지 않는 단백질의 분비 생산을 위한 번역 융합 파트너 (TFP) 기술은 WO 2007/015178에 기재되어 있다. 효모 게놈으로부터의 TFP 스크리닝 과정에서, YGR106C (Voa1p) 유전자를 발견하였다. Voa1p 단백질의 세포 위치는 ER 막에서 최근 확인되었다 (Ryan et al., Mol. Biol. Cell, Epub ahead of print, Sep 17, 2008). Voa1p는 액포 ATPase에 대한 5개의 조립 인자 중 하나로 제시되었다.
목적 단백질의 발현 및 분비를 증진시키는 추가적 서열, 및 그러한 서열을 확인하기 위한 방법에 대한 요구가 당업계에 존재한다.
본 발명은 시크리톰 (secretome) 분석에 의해 얻을 수 있는 분비 융합 파트너 (SFP)를 이용하여 다양한 재조합 단백질의 고분비 생성 및 효율적 정제에 관한 것이다. 재조합 단백질은 분비 융합 파트너와 함께 융합 형태로 세포외 생성되고, 시험관내 프로테아제 처리에 의해 SFP로부터 분리될 수 있다. 본 발명에 기재된 SFP는 바이오-제약 및 바이오-산업에서 가치있는 목적 단백질 및 폴리펩티드의 분비 수준을 유의하게 향상시킨다. SFP의 선택/스크리닝을 위한 방법 또한 기재되어 있다. 비록 특정 단백질이 분비되는지 여부를 결정하거나 또는 이를 예상할 수 있더라도, 분비되는 단백질이 SFP로서 작용할 것인지 여부를 예상하는 것은 불가능하다. 본 발명의 선택/스크리닝 방법은 SFP로서 작용하는 단백질, 및 그러한 단백질의 단편 및 유도체의 선택을 가능하게 한다. 본 발명의 스크리닝/선택 방법에 의해 선택된 SFP는 바이오-제약 및 바이오-산업에서 유용한 단백질의 재조합 생성을 증진시킨다. 또한, 본 발명은 확인된 SFP 및 그의 단편 및 유도체를 포함한다.
따라서, 본 발명의 목적은 하기 단계 (i) 내지 (v)를 포함하는, 분비 융합 파트너 (SFP)를 확인하는 방법을 제공하는 것이다:
(i) 제1 숙주 세포를, 분비 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 이종 프로모터로 형질전환시키는 단계;
(ⅱ) 상기 분비 폴리펩티드의 천연 프로모터가 상기 분비 폴리펩티드를 인코딩하는 상기 폴리뉴클레오티드에 연결된 경우 분석된 상기 폴리펩티드의 분비 수준과 비교하여, 상기 제1 숙주 세포로부터 상기 분비된 폴리펩티드가 과분비되는지를 결정하는 단계;
(ⅲ) 제2 숙주 세포를, 목적 폴리펩티드를 인코딩하는 제1 폴리뉴클레오티드 및 단계 (ⅱ)에서 과분비된 것으로 결정된 폴리펩티드를 인코딩하는 제2 폴리뉴클레오티드를 포함하는 작제물로 형질전환시키는 단계로서, 여기서 상기 제1 및 제2 폴리뉴클레오티드는 서로에 대해 임의의 순서이며 동일한 프레임 내에 있는 것인 단계;
(ⅳ) 상기 작제물이 상기 목적 폴리펩티드 및 상기 과분비된 폴리펩티드의 융합 폴리펩티드를 발현시키는 조건 하에 상기 제2 숙주 세포를 배양하는 단계; 및
(v) 상기 융합 폴리펩티드가 배양 배지로 분비되는지 여부를 결정함으로써, 상기 과분비된 폴리펩티드의 SFP를 확인하는 단계.
본 발명의 또다른 목적은, (i) 상기 언급한 SFP 또는 그의 단편 또는 유도체; 및 (ⅱ) 목적 폴리펩티드를 포함하는, 단리된 융합 폴리펩티드를 제공하는 것이다.
본 발명의 추가적 목적은, (i) 서열번호 1의 아미노산 176-213을 포함하는 친수성 (HL) 도메인, 또는 그의 단편 또는 유도체를 포함하는, 막관통 도메인 (TM)이 결여된 SFP; 및 (ⅱ) 목적 폴리펩티드를 포함하는, 단리된 융합 폴리펩티드를 제공하는 것이다.
본 발명의 추가적 목적은, (i) 프로모터; (ⅱ) 상기 언급된 SFP 또는 그의 단편 또는 유도체를 인코딩하는 제1 폴리뉴클레오티드; 및 (ⅲ) 목적 폴리펩티드를 인코딩하는 제2 폴리뉴클레오티드를 포함하는, 작제물을 제공하는 것이다.
본 발명의 추가적 목적은 상기 언급된 작제물을 포함하는 숙주 세포를 제공하는 것이다.
본 발명 추가적 목적은, (i) 숙주 세포를 SFP를 인코딩하는 폴리뉴클레오티드 및 목적 폴리펩티드를 인코딩하는 폴리뉴클레오티드로 형질전환시키는 단계; (ⅱ) 상기 목적 폴리펩티드에 융합된 상기 SPF를 포함하는 융합 폴리펩티드가 숙주 세포로부터 생성되고 분비되는 조건 하에 상기 숙주 세포를 배양하는 단계; 및 (ⅲ) 상기 융합 폴리펩티드를 단리하는 단계를 포함하는, 목적 폴리펩티드를 재조합적으로 생성하는 방법을 제공하는 것이다.
본 발명의 추가적 목적은 상기 언급된 방법에 의해 재조합적으로 생성된 목적 폴리펩티드를 제공하는 것이다.
본 발명은 시크리톰 분석에 의해 얻을 수 있는 분비 융합 파트너 (SFP)를 이용한 다양한 재조합 단백질의 고분비 생성 및 효율적 정제를 제공한다. 재조합 단백질은 분비 융합 파트너와의 융합 형태로 세포외 생성되고, SFP로부터 시험관내 프로테아제 처리에 의해 분리될 수 있다. 본 발명에 기재된 SFP는 바이오-제약 및 바이오-산업에서 가치있는 목적 단백질 및 폴리펩티드의 분비 수준을 현저히 향상시킨다. 본 발명의 선택/스크리닝 방법은 SFP로서 작용하는 단백질, 및 그러한 단백질의 단편 및 유도체의 선택을 가능하게 한다. 스크리닝/선택의 본 발명의 방법에 의해 선택된 SFP는 바이오-제약 및 바이오-산업에 유용한 단백질의 재조합 생성을 증진시키다. 또한 본 발명에 포함되는 것은 확인된 SFP 및 그의 단편 및 유도체이다.
본 발명의 상기 및 다른 목적, 특성 및 이점은 첨부된 도면과 함께 제시된 하기 상세한 설명으로부터 보다 명백하게 이해될 것이다.
도 1의 (A)는 SFP1 단백질의 예측된 아미노 서열 및 도메인, (B)는 순차적으로 결실된 SFP1 유전자를 발현시키는 벡터의 모식도, (C)는 상대적 SFP1 단백질 발현 수준의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축시킨 각각의 배양 브로쓰 0.6 ml의 10% 트리스-트리신 SDS-PAGE 분석. 레인 1: YGaT91 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 2: YGaT92 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 3: YGaT93 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 4: YGaT94 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 5: YGaT95 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 6: YGaT96 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 7: YGaT97 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐: Invitrogen).
도 2의 (A)는 SFP1-IL2 융합 단백질을 발현하는 벡터의 모식도, (B)는 SFP1-IL2 융합 단백질 발현 수준의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축시킨 각각의 배양 브로쓰 0.6 ml의 10% 트리스-트리신 SDS-PAGE 분석. 레인 1: YGaT92-IL2 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 2: YGaT93-IL2 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 3: YGaT94-IL2 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 3은 YGaT92-EXD4를 함유하는 재조합 효모 균주의 유가식 (fed-batch) 발효에 대한 프로파일 및 발효 시간에 따른 배지로 분비된 단백질 분석을 위한 SDS-PAGE의 결과를 도시한다.
도 4는 상이한 농도의 엔테로키나아제 (인비트로겐, USA)로 절단시킨 정제된 SFP1-EXD4 융합 단백질의 SDS-PAGE 분석을 나타낸다. 레인 1: 정제된 SFP1-EXD4 융합 단백질; 레인 2: 엔테로키나아제 0.1 μl로 1시간 동안 37℃에서 절단시킨 정제된 SFP1-EXD4 융합 단백질; 레인 3: 엔테로키나아제 0.2 μl로 1시간 동안 37℃에서 절단시킨 정제된 SFP1-EXD4 융합 단백질; 레인 4: 엔테로키나아제 0.3 μl로 1시간 동안 37℃에서 절단시킨 정제된 SFP1-EXD4 융합 단백질; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 5의 (A)는 엔테로키나아제 절단시킨 SFP1-EXD4 융합 단백질의 HPLC 분석, (B)는 HPLC 분획의 SDS-PAGE 분석을 나타낸다. 겔 위의 수는 HPLC 분획 수를 나타낸다.
도 6은 정제된 EXD4 단백질의 MALDI-TOF 분석이다.
도 7의 (A)는 SFP1 변이체-EXD4 융합 단백질을 발현하는 벡터의 모식도, (B)는 SFP1 변이체-EXD4 융합 단백질 발현 수준의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축된 각각의 배양 브로쓰 0.6 ml의 10% 트리스-트리신 SDS-PAGE 분석. 레인 1: YGaT92-EXD4 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 2: YGaT921-EXD4 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 3: YGaT922-EXD4 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 4: YGaT923-EXD4 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 8은 제시된 발효 시간에서 YGaMKH-EXD4를 함유하는 재조합 효모 균주의 유가 발효의 SDS-PAGE 분석을 나타낸다.
도 9는 YGaST6-EXD4-HL을 함유하는 재조합 효모 균주의 유가 발효에 대한 프로파일, 및 발효 시간에 따른 배지로 분비된 단백질 분석에 대한 SDS-PAGE의 결과를 도시한다.
도 10은 YGaMKH-EGF를 함유하는 재조합 효모 균주의 유가 발효에 대한 프로파일, 및 발효 시간에 따른 배지로 분비된 단백질 분석에 대한 SDS-PAGE의 결과를 도시한다.
도 11의 (A)는 HL-EGF 융합 단백질의 Ni-NTA 친화성 크로마토그래피 결과를 나타낸다. 첨부된 작은 도면은 제시된 분획의 SDS-PAGE 분석이다. (B)는 엔테로키나아제로 절단시킨 후, HL-EGF 융합 단백질의 Ni-NTA 친화성 크로마토그래피의 결과를 나타낸다. 첨부된 작은 도면은 제시된 분획의 SDS-PAGE 분석이다.
도 12는 YGaMKH-PTH를 함유하는 재조합 효모 균주의 유가 발효에 대한 프로파일, 및 발효 시간에 따른 배지로 분비된 단백질 분석에 대한 SDS-PAGE의 결과를 도시한다.
도 13은 엔테로키나아제 (인비트로겐, USA) 및 재조합체 Kex2p (JH Sohn, KRIBB)의 분비 형태로 절단시킨 정제된 HL-PTH 융합 단백질의 SDS-PAGE 분석을 나타낸다. 레인 1: 정제된 HL-PTH 융합 단백질; 레인 2: Kex2p로 1시간 동안 37℃에서 절단시킨 정제된 HL-PTH 융합 단백질; 레인 3: 엔테로키나아제로 1시간 동안 37℃에서 절단시킨 정제된 HL-PTH 융합 단백질; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 14의 (A)는 2805 균주의 성장곡선을 나타내며, 화살표는 샘플링 포인트를 나타내고, (B)는 형광 염료 획스트 (hochest)로 염색한 후, 샘플링한 세포의 공초점 레이저 스캐닝 현미경 사진을 나타낸다.
도 15는 M2 샘플의 2D 겔 전기영동 결과를 나타낸다.
도 16은 1-DE/MudPIT (Multidimensional Protein Identification Technology)에 대한 SDS-PAGE 분석을 나타낸다.
도 17의 (A)는 시크리톰 분석으로부터 선택된 19개의 유전자를 발현하는 Y2805 형질전환체의 배양 상등액의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축시킨 각각의 배양 브로쓰 0.6 ml의 10% 트리스-글리신 SDS-PAGE 분석. 레인 1: BGL2 유전자를 과발현하는 2805 균주의 배양 브로쓰; 레인 2: CIS3를 과발현하는 2805 균주의 배양 브로쓰; 레인 3: CRH1을 과발현하는 2805 균주의 배양 브로쓰; 레인 4: CWP1을 과발현하는 2805 균주의 배양 브로쓰; 레인 5: DSE4를 과발현하는 2805 균주의 배양 브로쓰; 레인 7: EGT2를 과발현하는 2805 균주의 배양 브로쓰; 레인 8: EXG1을 과발현하는 2805 균주의 배양 브로쓰; 레인 9: GAS1을 과발현하는 2805 균주의 배양 브로쓰; 레인 10: GAS3를 과발현하는 2805 균주의 배양 브로쓰; 레인 11: GAS5를 과발현하는 2805 균주의 배양 브로쓰; 레인 12: PST1을 과발현하는 2805 균주의 배양 브로쓰; 레인 13: SCW4를 과발현하는 2805 균주의 배양 브로쓰; 레인 15: SIM1을 과발현하는 2805 균주의 배양 브로쓰; 레인 16: TOS1을 과발현하는 2805 균주의 배양 브로쓰; 레인 17: UTH1을 과발현하는 2805 균주의 배양 브로쓰; 레인 18: YGP1을 과발현하는 2805 균주의 배양 브로쓰; 레인 19: YPS1을 과발현하는 2805 균주의 배양 브로쓰; 레인 20: ZPS1을 과발현하는 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐). (B)는 엔도-H 처리 후에 배양 상등액의 SDS-PAGE 분석을 나타낸다.
도 18은 EXD4 유전자와 융합된 11개의 유전자를 발현하는 Y2805 형질전환체의 배양 상등액의 각각의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축시킨 각각의 배양 브로쓰 0.6 ml의 10% 트리스-트리신 SDS-PAGE 분석. 레인 1: BGL2-EXD4 유전자를 과발현하는 2805 균주의 배양 브로쓰; 레인 2: GAS3-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 3: GAS5-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 4: PST1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 5: SCW4-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 6: SCW10-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 7: SIM1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 8: UTH1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 9: YGP1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 10: YPS1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 11: ZPS1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 19의 (A)는 SCW4 및 EXD4 융합의 결실 단편에 대한 카이트-둘리틀 소수성 (Kyte-Doolittle hydropathy) 분석 및 모식도, (B)는 점진적으로 결실된 SCW4-EXD4 융합 단편을 함유하는 각각의 형질전환체의 배양 상등액의 SDS-PAGE 분석을 나타낸다.
도 20은 YGa-SCW4-1-EXD4 및 YGa-SCW4-3-EXD4를 각각 함유하는 재조합 2805 효모 균주의 유가 발효 동안 배지로 분비된 단백질의 분석에 대한 SDS-PAGE의 결과를 나타낸다.
도 21은 엔테로키나아제의 처리 전 및 후 분비된 융합 단백질, SCW4-1-EXD4 및 SCW4-3-EXD4 분석에 대한 SDS-PAGE의 결과를 나타낸다.
도 22는 (A) 각각의 벡터를 함유하는 세포의 배양 브로쓰 10 마이크로리터, (B) 엔테로키나아제의 처리 전 및 후 샘플의 배지로 분비된 SCW4-hGH의 SDS-PAGE 결과를 나타낸다.
도 23은 발효 시간에 따른 YGa-SCW4-2-hGH를 함유하는 재조합 효모 균주의 유가 발효 동안 배지로 분비된 단백질 분석에 대한 SDS-PAGE의 결과를 나타낸다.
도 24는 IL-2 발현 벡터 pYGaT92-IL2의 지도를 나타낸다.
도 25는 엑센딘 (exendin)-4 발현 벡터 pYGaT923-EXD4의 지도를 나타낸다.
도 26은 엑센딘-4 발현 벡터 pYGaMKH-EXD4의 지도를 나타낸다.
도 27은 엑센딘-4 발현 벡터 pYGaST6-EXD-HL의 지도를 나타낸다.
도 28은 EGF 발현 벡터 pYGaMKH-EGF의 지도를 나타낸다.
도 29는 PTH 발현 벡터 pYGaMKH-PTH의 지도를 나타낸다.
도 30은 엑센딘-4 발현 벡터 pYGaSCW4-1-EXD4의 지도를 나타낸다.
도 31은 엑센딘-4 발현 벡터 pYGaSCW4-3-EXD4의 지도를 나타낸다.
도 32는 hGH 발현 벡터 pYGaSCW4-2-hGH의 지도를 나타낸다.
<본 발명을 수행하기 위한 최선의 양태>
본 발명에서는 목적 폴리펩티드의 높은 수준의 분비에 대한 필요성, 및 목적 폴리펩티드의 높은 수준의 분비를 달성하는데 사용할 수 있는 SFP 확인을 위한 신속하고 효율적인 스크리닝 기술에 대한 필요성에 대해 고심하였다. 본 발명은 임의의 단백질의 재조합 발현을 최적화하는데 유용한 한편, 공지된 발현계에서 그의 낮은 수준의 발현으로 인해 큰 규모 및/또는 낮은 비용으로 생산될 수 없는 단백질의 생산을 가능하도록 하는데 특히 유용하다. 목적 폴리펩티드의 높은 수준의 분비를 달성하기 위한 최적화된 SFP가 기재되어 있다.
정의
용어 "하나의" 또는 "한" 독립체는 하나 이상의 그 독립체를 나타내려는 것으로, 예를 들어, "하나의 벡터"는 하나 이상의 벡터를 나타내는 것으로 이해되어야 한다. 이처럼, 용어 "하나의" (또는 "한"), "하나 이상의," 및 "적어도 하나의"는 본원에서 상호교환가능하게 사용될 수 있다.
본원에 사용된 바와 같은 용어 "폴리펩티드"는 단수의 "폴리펩티드" 뿐만 아니라 다수의 "폴리펩티드"를 포함하려는 것이며, 아미드 결합 (펩티드 결합이라고도 공지됨)에 의해 선형으로 연결된 모노머 (아미노산)들로 이루어진 분자를 나타낸다. 용어 "폴리펩티드"는 둘 이상의 아미노산의 임의의 쇄 또는 쇄들을 나타내며, 생성물의 구체적인 길이를 나타내는 것은 아니다. 따라서, 펩티드, 디펩티드, 트리펩티드, 올리고펩티드, "단백질," "아미노산 쇄", 또는 둘 이상의 아미노산의 쇄 또는 쇄들을 나타내기 위해 사용된 임의의 다른 용어는 "폴리펩티드"의 정의 내에 포함되며, 용어 "폴리펩티드"는 임의의 이들 용어 대신에, 또는 상호교환가능하게 사용될 수 있다. 또한 용어 "폴리펩티드"는, 여기에 제한되지 않지만, 공지된 보호/차단기에 의한 글리코실화, 아세틸화, 인산화, 아미드화, 유도체화, 단백질분해성 절단, 또는 자연적으로 발생하지 않는 아미노산에 의한 변형을 비롯한 폴리펩티드의 발현 후 변형의 생성물을 나타내려는 것이다. 폴리펩티드는 천연 생물학적 공급원으로부터 유래되거나 또는 재조합 기술에 의해 제조될 수 있으나, 지정된 핵산 서열로부터 필수적으로 번역되는 것은 아니다. 이는 화학 합성에 의한 것을 비롯한 임의의 방식으로 생성될 수 있다.
"단리된 폴리펩티드" 또는 그의 단편, 변이체, 또는 유도체는 그의 자연 환경에서 존재하지 않는 폴리펩티드를 나타낸다. 특정 수준의 정제가 요구되진 않는다. 예를 들어, 단리된 폴리펩티드는 그의 천연 상태 또는 자연 환경으로부터 제거될 수 있다. 재조합적으로 제조된 폴리펩티드 및 숙주 세포에서 발현된 단백질은 본 발명의 목적을 위해 단리된 것으로 고려되는데, 이는 천연 상태이거나 또는 임의의 적합한 기술에 의해 분리, 분획, 또는 부분적으로 또는 상당히 정제된 재조합 폴리펩티드이다.
또한 본 발명의 폴리펩티드로 포함되는 것은 상기 폴리펩티드의 단편, 유도체, 유사체, 또는 변이체, 및 이들의 임의의 조합이다. 본 발명의 폴리펩티드를 지칭하는 경우, 용어 "단편", "변이체", "유도체" 및 "유사체"는 상응하는 천연 폴리펩티드의 생물학적, 항원적, 또는 면역적 특성을 일부 이상 보유하는 폴리펩티드를 포함한다. 본 발명의 폴리펩티드의 단편은 단백질 분해된 단편, 뿐만 아니라 결실 단편, 또한 본원에서 논의된 다른 특이적 단편을 포함한다. 본 발명의 폴리펩티드의 변이체는 상기 기재된 단편, 및 아미노산 치환, 결실, 또는 삽입으로 인해 변경된 아미노산 서열을 갖는 폴리펩티드를 또한 포함한다. 변이체는 자연적으로 발생하거나 또는 자연적으로 발생하지 않을 수 있다. 자연적으로 발생하지 않는 변이체는 당업계에 공지된 돌연변이유발 기술을 이용하여 제조될 수 있다. 변이체 폴리펩티드는 보존적 또는 비-보존적 아미노산 치환, 결실 또는 첨가를 포함할 수 있다. 본 발명의 폴리펩티드의 유도체는 천연 폴리펩티드 상에서 발견되지 않는 추가적 특징을 나타내도록 하기 위해 변경된 폴리펩티드를 포함한다. 변이체 폴리펩티드는 또한 "폴리펩티드 유사체"로 본원에서 지칭될 수 있다. 본원에서 사용된 폴리펩티드의 "유도체"는 측면 작용기의 반응에 의해 화학적으로 유도화된 하나 이상의 잔기를 갖는 대상 폴리펩티드를 나타낸다. 또한 "유도체"로 포함되는 것은 20개의 표준 아미노산 중 하나 이상의 자연적으로 발생하는 아미노산 유도체를 함유하는 펩티드이다. 예를 들어, 4-히드록시프롤린은 프롤린으로 치환될 수 있고, 5-히드록시리신은 리신으로 치환될 수 있고, 3-메틸히스티딘은 히스티딘으로 치환될 수 있고, 호모세린은 세린으로 치환될 수 있으며, 오르니틴은 리신으로 치환될 수 있다.
"참고 아미노산 서열"은 임의의 아미노산 치환의 도입 없이 특정된 서열을 의미한다. 당업자에게 통용되는 바와 같이, 치환이 없는 경우, 본 발명의 "단리된 폴리펩티드"는 참고 아미노산 서열과 동일한 아미노산 서열을 포함한다.
본원에 기재된 폴리펩티드는 다양한 변경, 예컨대 치환, 삽입 또는 결실을 가질 수 있다. 폴리펩티드에서 치환될 수 있는 예시적 아미노산은 염기성 측쇄 (예를 들어, 리신, 아르기닌, 히스티딘), 산성 측쇄 (예를 들어, 아스파르트산, 글루탐산), 하전되지 않은 극성 측쇄 (예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄 (예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지형 측쇄 (예를 들어, 트레오닌, 발린, 이소류신) 및 방향족 측쇄 (예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)를 갖는 아미노산을 포함한다.
본원에 기재된 폴리펩티드 및 참고 폴리펩티드와 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 폴리펩티드의 상응하는 단편이 또한 고려된다.
서열 동일성은 비교대상이 되는 부위가 최적으로 정렬된 두 서열을 비교하고, 두 서열 모두에서 나타나는 동일한 아미노산 잔기 또는 뉴클레오티드의 위치 수를 결정하여 매치되는 위치 수를 얻고, 매치되는 위치 수를 비교 대상 부위의 총 위치 수로 나누고 (즉, 윈도우 크기), 결과를 100으로 곱하여 서열 동일성의 백분율을 구함으로써 계산할 수 있다. 하나의 양태로서, 정렬을 극대화하기 위해 100개의 아미노산 또는 뉴클레오티드 길이에서 4개의 갭 (gap)이 도입될 수 있는 경우, 백분율 동일성은 비교할 서열에서 동일한 아미노산 잔기 또는 뉴클레오티드를 정렬한 두 서열보다 작은 서열에서의 아미노산 잔기 또는 뉴클레오티드의 백분율로 계산된다 (Dayhoff, in Atlas of Protein Sequence and Structure, Vol.5, p.124, National Biochemical Research Foundation, Washington, D.C. (1972), 본원에 참고로 포함됨). 동일성의 결정은 당업계에 공지된 컴퓨터 상동성 프로그램에 의해 전형적으로 이루어진다. 예시적 프로그램은 스미쓰 (Smith) 및 워터맨 (Waterman)의 알고리즘 (Adv. Appl. Math., 1981, 2: 482-489, 그의 전문이 본원에 참고로 포함됨)을 이용하는, 디폴트 셋팅을 이용한 갭 (Gap) 프로그램이다 (Wisconsin Sequence Analysis Package, Version 8 for UNIX, Genetics Computer Group, University Research Park, Madison, WI).
바람직하게는, 임의의 치환은 보존적 아미노산 치환이다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 대체된 것이다. 유사한 측쇄를 갖는 아미노산 잔기의 군은 당업계에 정의되어 있다. 이들 군에는 염기성 측쇄 (예를 들어, 리신, 아르기닌, 히스티딘), 산성 측쇄 (예를 들어, 아스파르트산, 글루탐산), 하전되지 않은 극성 측쇄 (예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄 (예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지형 측쇄 (예를 들어, 트레오닌, 발린, 이소류신) 및 방향성 측쇄 (예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)를 갖는 아미노산이 포함된다.
한 실시양태에서, 본 발명은, (i) 제1 숙주 세포를, 분비 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 이종 프로모터로 형질전환시키는 단계; (ⅱ) 상기 폴리펩티드의 천연 프로모터가 상기 분비 폴리펩티드를 인코딩하는 상기 폴리뉴클레오티드에 연결된 경우 분석된 상기 폴리펩티드의 분비 수준과 비교하여 상기 제1 숙주 세포로부터 상기 분비 폴리펩티드가 과분비되었는지를 결정하는 단계; (ⅲ) 제2 숙주 세포를, 목적 폴리펩티드를 인코딩하는 폴리뉴클레오티드 및 단계 (ⅱ)에서 과분비된 것으로 결정된 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드 작제물로 형질전환시키는 단계로서, 여기서 상기 목적 폴리펩티드 및 상기 과분비된 폴리펩티드가 임의의 순서로 융합된 것인 단계; (ⅳ) 상기 폴리뉴클레오티드 작제물이 융합 폴리펩티드를 발현하는 조건 하에 상기 제2 숙주 세포를 배양하는 단계; 및 (v) 상기 융합 폴리펩티드가 세포외 배양 배지로 분비되는지 여부를 결정하고; 이로써 상기 과분비된 폴리펩티드가 분비 융합 파트너인지를 확인하는 단계를 포함하는, 분비 융합 파트너 (SFP)를 확인하는 방법에 관한 것이다.
본 발명의 방법에서, SFP는 "시크리톰" 또는 "총 분비된 폴리펩티드"로부터 확인될 수 있다. 시크리톰은 세포외 배양 배지로 분비되고, 그로부터 수집한 폴리펩티드를 포함한다. 시크리톰은 박테리아, 균류 (예를 들어, 효모), 식물, 및 동물 (예를 들어, 포유류)을 비롯한 임의의 진핵 또는 원핵 유기체의 DNA에 의해 인코딩된다. 적합한 박테리아에는, 여기에 제한되지는 않지만, 에세리키아 (Escherichia) 및 바실러스 (Bacillus) 종이 포함된다. 적합한 효모에는, 여기에 제한되지는 않지만, 칸디다 (Candida), 데바리오미세스 (Debaryomyces), 한세눌라 (Hansenula), 클루이베로미세스 (Kluyveromyces), 피치아 (Pichia), 스키조사카로미세스 (Schizosaccharomyces), 야로위아 (Yarrowia), 사카로미세스 (Saccharomyces), 슈반니오미세스 (Schwanniomyces), 및 아르크술라 (Arxula) 종이 포함된다. 구체적 종의 예에는 칸디다 유틸리스 (Candida utilis), 칸디다 보이디니 (Candida boidinii), 칸디다 알비칸스 (Candida albicans), 클루이베로미세스 락티스 (Kluyveromyces lactis), 피치아 파스토리스 (Pichia pastoris), 피치아 스티피티스 (Pichia stipitis), 스키조사카로미세스 폼베 (Schizosaccharomyces pombe), 사카로미세스 세레비지애 (Saccharomyces cerevisiae), 한세눌라 폴리몰파 (Hansenula polymorpha), 야로위아 리포리티카 (Yarrowia lipolytica), 슈반니오미세스 옥시덴탈리스 (Schwanniomyces occidentalis), 및 아르크술라 아데니니보란스 (Arxula adeninivorans)가 포함된다. DNA 공급원으로서 제공될 수 있는 기타 균류에는, 여기에 제한되지는 않지만 아스퍼길루스 (Aspergillus), 페니실리움 (Penicillium), 리조푸스 (Rhizopus), 및 트리코더마 (Trichoderma) 종이 포함된다. DNA 공급원으로서 제공될 수 있는 식물에는, 여기에 제한되지는 않지만, 아라비돕시스, 옥수수, 담배, 및 감자가 포함된다. 적합한 동물에는, 여기에 제한되지는 않지만, 인간, 마우스, 래트, 토끼, 개, 고양이, 및 원숭이가 포함된다. 한 실시양태에서, 시크리톰은 효모, 박테리아, 식물 또는 동물로부터 유래될 수 있다.
고분비된 폴리펩티드를 선택하기 위한 시크리톰 분석은 당업계에서 입수가능한 기술을 이용하여 달성될 수 있다. 예를 들어, 배양 상등액을 농축시킴으로써 단리된 총 분비된 폴리펩티드는 2-D 겔 전기영동 및/또는 다차원 단백질 확인 기술 (Multidimensional Protein Identification Technology: 1-DE/MudPIT)을 이용하여 분석될 수 있다. 시크리톰으로부터의 폴리펩티드는 임의의 종류의 단백질 정제 칼럼, 예컨대 이온 교환 칼럼, 소수성 상호작용 칼럼, 겔 여과 칼럼, 친화성 칼럼, 및 역상 칼럼에 의해 분석될 수 있다.
한 실시양태에서, 정상 효모 세포 성장 동안 생성된 효모 총 분비된 폴리펩티드 (효모 시크리톰)를 분석하였다. 정상 세포 성장은 최소 배지 (예를 들어, 0.67% 아미노산이 없는 효모 질소 베이스, 0.5% 카자미노산 (casamino acid), 2% 글루코스 및 0.002% 우라실)에서 배양되는 세포를 의미한다. 글루코스 대신 상이한 탄소원, 예를 들어, 갈락토스, 크실로스, 프룩토스, 만노스, 수크로스, 라피노스, 및 셀로비오스를 포함할 수 있는 변경된 조건이 이용될 수 있다. 변경된 조건은 또한 배지의 임의의 성분, 예를 들어, 질소 또는 인산염의 수준을 제한하는 것을 포함한다.
용어 "고분비된"은 시크리톰으로부터 분비된 폴리펩티드의 수준이 상위 40%, 45%, 50%, 55%, 60%, 65%, 또는 70% 이상인 폴리펩티드를 나타낸다. 고분비된 폴리펩티드는 분비된 단백질의 수에 비례할 수 있는 단백질 수도 지수 (protein abundance index: PAI)에 의해 결정될 수 있다 (문헌 [Rappsilber et al., Genome Res. 12:1231-45 (2002)]). 고분비된 단백질의 예는 표 1에 제시되어 있다.
용어 "과분비된"은 폴리펩티드의 천연 프로모터로부터 발현되는 경우, 폴리펩티드의 분비 수준보다 적어도 5X, 6X, 7X, 8X, 9X 또는 1OX의 수준에서 숙주 세포로부터 폴리펩티드가 분비되는 것으로 정의된다. 고분비는 또한 야생형 단백질 분비 수준과 비교하여 고분비되는 폴리펩티드의 분비 수준을 비교함으로써 분석할 수 있다. 예를 들어, 야생형 효모 분비된 단백질은 정상 세포 성장 동안 분비 수준이 약 20 mg/L를 초과하지 않으나, 강력한 이종 프로모터와 연결된 경우, 이들 단백질 중 일부는 고분비되고, 분비 수준이 20 mg/L를 초과한다.
한 실시양태에서, 본 발명의 방법은 융합 폴리펩티드의 분비를 위한 SFP의 최적 크기를 결정하는 것을 추가로 포함한다. SFP의 최적 크기는 상기 SFP의 결실 분석에 의해 결정될 수 있으며, 여기서 SFP의 상이한 결실 작제물을 각각 함유하는 융합 폴리펩티드의 분비 수준을 비교한다. 일부 SFP는 초기에 확인된 SFP로 얻은 발현보다 융합 폴리펩티드의 훨씬 높은 발현을 가능하게 하는 최적 크기를 가질 수 있다. SFP의 최적 크기는, 차선적인 SFP에 융합된 경우의 목적 폴리펩티드의 분비 수준에 비해서 목적 폴리펩티드의 증가된 분비 수준을 가능하게 할 수 있다. SFP의 최적 크기는 목적 폴리펩티드 사이에서 다양할 수 있으며, SFP가 우선 확인되면 본원에 개시된 방법 또는 당업계에 공지된 방법을 이용하여 결정될 수 있다.
한 실시양태에서, 친수성 서열로 끝나는 SFP 결실 단편이 선택된다. 단백질의 친수성 도메인은 일반적으로 단백질의 표면 근처에 위치한다. 따라서, SFP 및 목적 폴리펩티드의 접합부는 두 폴리펩티드 사이에서 쉽게 노출될 수 있으며, 이는 프로테아제가 상기 접합부를 절단하는 것을 보다 용이하게 하여 목적 폴리펩티드를 시험관 내로 방출하도록 한다.
SFP에 대해 적용된 바와 같은 용어 "그의 단편"은 SFP의 아미노산 서열의 임의의 부분을 포함하는 폴리펩티드를 나타내며, 여기서 단편은 융합된 목적 폴리펩티드의 분비를 유도할 수 있는 능력을 실질적으로 보유한다.
본원에 사용된 용어 "융합된 목적 폴리펩티드의 분비를 유도할 수 있는 능력을 실질적으로 보유한다"는 것은 융합된 목적 폴리펩티드의 분비를 유도하는 모 SFP의 능력을 50% 이상 보유하는 SFP의 단편 또는 유도체를 나타낸다. 특정 실시양태에서, 융합된 목적 폴리펩티드의 분비를 유도하는 능력이 60, 65, 70, 75, 80, 85, 90, 또는 95% 이상 보유된다. 목적 폴리펩티드의 분비를 유도하는 능력은 당업계에 익히 공지된 통상적 기술 및 상기 기재된 기술에 의해 결정될 수 있다.
SFP에 적용된 용어 "그의 유도체"는 SFP의 아미노산 서열과 70% 이상 동일한 아미노산 서열로 이루어진 폴리펩티드를 나타내며, 여기서 폴리펩티드는 융합된 목적 폴리펩티드의 분비를 유도하는 능력을 실질적으로 보유한다. 특정 실시양태에서, 유도체는 SFP의 아미노산 서열과 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 유도체는 SFP의 아미노산 서열에 첨가, 결실, 치환, 또는 그의 조합을 포함할 수 있다. 유도체는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11-15, 16-20, 21-25, 26-30 첨가, 치환, 또는 결실을 갖는 돌연변이 폴리펩티드를 포함할 수 있다. 첨가 또는 치환은 또한 자연적으로 발생하지 않는 아미노산의 사용을 포함한다.
SFP의 유도체의 예에는, 여기에 제한되지는 않지만, 결실 돌연변이 (예를 들어, 단일방향성 결실), 기능성 서열의 첨가 (예를 들어, 글리코실화 부위, 제한 효소 부위), 및 SFP 내에서 확인된 프로-서열 또는 프리-서열의 결실 또는 첨가 (예를 들어, 스와핑)가 포함된다. 당업자는 통상적 돌연변이유발 기술, 예컨대 상기 언급된 참조문헌에 기재된 기술을 이용하여 SFP의 유도체 또는 SFP를 인코딩하는 핵산을 준비하고, 융합된 목적 폴리펩티드의 분비를 유도하는 능력을 실질적으로 보유하는 유도체를 확인할 수 있다.
한 실시양태에서, SFP 또는 그의 유도체 또는 단편은 본 발명의 방법에 의해 확인된다. 다른 실시양태에서, SFP를 인코딩하는 뉴클레오티드 서열은 BGL2 (서열번호 62), GAS3 (서열번호 63), GAS5 (서열번호 64), PST1 (서열번호 65), SCW4 (서열번호 66), SCW10 (서열번호 67), SIM1 (서열번호 68), UTH1 (서열번호 69), YGP1 (서열번호 70), YPS1 (서열번호 71), 및 ZPS1 (서열번호 72)로부터 선택된다. 또다른 실시양태에서, SFP는 BGL2 (서열번호 80), GAS3 (서열번호 81), GAS5 (서열번호 82), PST1 (서열번호 83), SCW4 (서열번호 84), SCW10 (서열번호 85), SIM1 (서열번호 86), UTH1 (서열번호 87), YGP1 (서열번호 88), YPS1 (서열번호 89), 및 ZPS1 (서열번호 90)로부터 선택된다.
본 발명의 방법은 높은 수준의 재조합 발현에 대한 바람이 존재하는 "목적 폴리펩티드" 또는 그의 유도체를 가지고 이용될 수 있다. 목적 폴리펩티드에 적용된 바와 같은 용어 "그의 유도체"는 목적 폴리펩티드의 아미노산 서열과 70% 이상 동일한 아미노산 서열로 이루어진 폴리펩티드를 나타내며, 여기서 폴리펩티드는 그의 생물학적 활성을 실질적으로 보유한다. 특정 실시양태에서, 유도체는 목적 폴리펩티드의 아미노산 서열과 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 유도체는 목적 폴리펩티드의 아미노산 서열에 첨가, 결실, 치환, 또는 그의 조합을 포함할 수 있다. 유도체는 목적 폴리펩티드의 아미노산 서열에 첨가, 결실, 치환, 또는 그의 조합을 포함할 수 있다. 유도체는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11-15, 16-20, 21-25, 26-30 첨가, 치환, 또는 결실을 갖는 변이체 폴리펩티드를 포함할 수 있다. 첨가 또는 치환은 또한 자연적으로 발생하지 않는 아미노산의 사용을 포함한다.
목적 단백질 또는 폴리펩티드의 유도체의 예에는, 여기에 제한되지는 않지만, 결실 돌연변이 (예를 들어, 단일방향성 결실), 기능성 서열의 첨가 (예를 들어, 글리코실화 부위, 제한 효소 부위), 및 목적 폴리펩티드 내에서 확인된 프로-서열 또는 프리-서열의 결실 또는 첨가 (예를 들어, 스와핑)가 포함된다. 당업자는 통상적 돌연변이유발 기술, 예컨대 상기 언급된 참조문헌에 기재된 기술을 이용하여 목적 폴리펩티드의 유도체 또는 목적 폴리펩티드를 인코딩하는 핵산을 준비할 수 있으며, 목적 폴리펩티드의 생물학적 활성을 실질적으로 보유하는 유도체를 확인할 수 있다.
목적 폴리펩티드가 SFP에 융합되는 경우, 목적 폴리펩티드 및 SFP는 동일한 자연적으로 발생하는 단백질의 폴리펩티드가 아니다. 목적 폴리펩티드는 학술 목적을 위해 연구되는 것이거나, 또는 상업적 목적, 예를 들어, 치료 또는 산업적 용도를 위해 제조되는 것일 수 있다. 목적 폴리펩티드는 임의의 식물, 동물, 또는 미생물로부터 얻을 수 있고, 자연적으로 발생하거나 핵산에 의해 인코딩될 수 있는 한 변형될 수 있다. 한 실시양태에서, 목적 폴리펩티드는 인간 단백질이다. 또다른 실시양태에서, 목적 폴리펩티드는 사이토카인, 혈청 단백질, 콜로니 자극 인자, 성장 인자, 호르몬, 또는 효소이다.
예를 들어, 목적 폴리펩티드는 인터루킨, 응집 인자, 인터페론-α, 인터페론-β, 인터페론-γ, 과립구-콜로니 자극 인자, 과립구 대식세포-콜로니 자극 인자, 조직 성장 인자, 상피 성장 인자, TGFα, TGFβ, 표피 성장 인자, 혈소판-유래 성장 인자, 섬유아세포 성장 인자, 여포 자극 호르몬, 갑상선 자극 호르몬, 항이뇨 호르몬, 색소분비 호르몬, 부갑상선 호르몬, 황체형성 호르몬-방출 호르몬, 탄수화물-특이적 효소, 단백질분해성 효소, 리파아제, 산화환원효소, 전달효소, 가수분해효소, 리아제, 이성질화효소, 리가아제, 면역글로불린, 사이토카인 수용체, 락토페린, 포스포리파아제 A2-활성화 단백질, 인슐린, 종양 괴사 인자, 칼시토닌, 칼시토닌 유전자 관련 펩티드, 엔케팔린, 소마토메딘, 에리스로포이에틴, 시상하부 방출 인자, 프로락틴, 융모막 성 생식선 자극호르몬, 조직 플라스미노겐 활성인자, 성장 호르몬 방출 펩티드, 흉선 체액성 인자, 항암 펩티드, 또는 항생제 펩티드로부터 선택될 수 있다. 구체적인 예에는, 여기에 제한되지는 않지만, 인간 인터루킨-2 (hIL-2), 엑센딘-3, 엑센딘-4 (EXD4), 글루카곤-유사-펩티드-1 (GLP-1), 부갑상선 호르몬 (PTH), 인간 인터루킨-1β, 인간 인터루킨-6, 인간 인터루킨-32α, 인간 인터루킨-32β, 인간 인터루킨-32γ, 인자 VII, 인자 VIII, 인자 IX, 인간 혈청 알부민, 인간 인터페론-α, 인간 인터페론-β, 인간 인터페론-γ, 인간 과립구-콜로니 자극 인자, 인간 과립구 대식세포-콜로니 자극 인자, 인간 성장 호르몬 (hGH), 인간 혈소판-유래 성장 인자, 인간 염기성 섬유아세포 성장 인자, 인간 표피 성장 인자 (EGF), 인간 인슐린-유사 성장 인자, 인간 신경 성장 인자, 인간 형질전환 성장 인자 β-1, 인간 여포 자극 호르몬, 글루코스 옥시다아제, 글루코다아제, 갈락토시다아제, 글루코세레브로시다아제, 글루쿠로니다아제, 아스파라기나아제, 아르기나아제, 아르기닌 데아미나아제, 퍼록시드 디스뮤타아제, 엔도톡시나아제, 카탈라아제, 키모트립신, 우리카아제, 아데노신 디포스파타아제, 티로시나아제, 빌리루빈 옥시다아제, 소 갈락토스-1-포스페이트 유리딜트랜스퍼라아제, 해파리 녹색 형광 단백질, 칸디다 안타르티카 (Candida antarctica) 리파아제 B, 칸디다 루고사 (Candida rugosa) 리파아제, 균류 클로로퍼옥시다아제, β-갈락토시다아제, 레솔바아제, α-갈락토시다아제, β-글루코시다아제, 트레할로오스 신타아제, 시클로덱스트린 글리코실 트랜스퍼라아제, 크실라나아제, 피타아제, 인간 락토페린, 인간 에리스로포이에틴, 인간 파라옥소나아제, 인간 성장 분화 인자 15, 인간 갈렉틴-3 결합 단백질, 인간 세린 프로테아제 억제제, 쿠니츠 유형 (Kunitz type) 2, 인간 야누스 (Janus) 키나아제 2, 인간 fms-유사 티로신 키나아제 3 리간드, 인간 YM1 & 2, 인간 CEMI, 인간 디아실글리세롤 아실트랜스퍼라아제, 인간 렙틴, 인간 mL259, 인간 프로테이나아제 3, 인간 라이소자임, 인간 데드 박스 (DEAD box) 단백질 41, 인간 에토포시드 도입 단백질 24 (human etoposide induced protein 24), 마우스 카스파아제 1, 소 앤지오제닌, 및 지렁이 룸브로키나아제가 포함된다.
한 실시양태에서, 목적 폴리펩티드는 통상적 재조합 생성 방법을 이용하여 제조하기 어려운 폴리펩티드, 즉, 전혀 생성되지 않거나 또는 낮은 수준으로만 생성되는 폴리펩티드이다. 또다른 실시양태에서, 목적 폴리펩티드는 공지된 발현계를 이용하여 용이하게 생성되지만, 보다 높은 수준의 발현을 달성하고자 하는 바람이 있다.
한 실시양태에서, 본 발명의 융합 폴리펩티드는 임의의 순서로 목적 폴리펩티드에 융합된, 분비 폴리펩티드를 포함하는 폴리펩티드를 나타낸다. 또다른 실시양태에서, 본 발명은 목적 폴리펩티드에 융합된 본 발명의 SFP를 포함하는, 단리된 융합 폴리펩티드에 관한 것이다.
본원에 사용된 바와 같은 용어 "융합된"은 재조합적으로 제조된 융합 폴리펩티드를 나타낸다. 한 실시양태에서, 융합 폴리펩티드는 목적 폴리펩티드에 융합된 분비 폴리펩티드를 포함하며, 여기서 분비 폴리펩티드 및 목적 폴리펩티드는 임의의 순서로 융합된다. 또다른 실시양태에서, SFP는 목적 폴리펩티드의 N-말단 또는 C-말단에서 융합된다. SFP 및 목적 폴리펩티드는 개입하는 아미노산, 예컨대 링커 DNA에 의해 인코딩된 아미노산과 함께 또는 그것 없이 융합될 수 있다. 특정 실시양태에서, SFP와 목적 폴리펩티드 사이의 거리는 0 내지 10; 0 내지 20; 0 내지 30; 0 내지 40; 또는 그 이상의 아미노산일 수 있다. 특정 실시양태에서, 융합 폴리펩티드는 프로테아제 인식 서열 및/또는 친화성 태그를 포함한다.
한 실시양태에서, 단리된 융합 폴리펩티드는 서열번호 1의 아미노산 176-213을 포함하는 친수성 (HL) 도메인을 포함하는 SFP 또는 그의 유도체, 및 목적 폴리펩티드를 포함한다. 한 실시양태에서, 변형된 HL 도메인은 서열번호 45에 의해 인코딩된다.
본 발명은 추가적으로 본 발명의 SFP를 사용하여 목적 폴리펩티드를 재조합적으로 생성하는 방법에 관한 것이다. 한 실시양태에서, 상기 방법은 SFP 또는 그의 유도체 또는 단편을 인코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 목적 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함하는 작제물을 준비하고, 숙주 세포를 상기 작제물로 형질전환시키고, 융합 폴리펩티드가 생성되고 숙주 세포로부터 분비되는 조건 하에 숙주 세포를 배양하고, 상기 목적 폴리펩티드로부터 상기 SFP를 분리하는 것을 포함한다.
목적 폴리펩티드는 당업계에 공지된 임의의 발현계를 이용하여 재조합적으로 생성될 수 있다. 바람직하게는, 목적 폴리펩티드는, 예를 들어, 박테리아, 효모, 또는 포유류 세포 배양물에서 재조합적으로 발현된다. 재조합 발현은 목적 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 포함하는 벡터를 준비하고, 벡터를 숙주 세포로 전달하고, 목적 폴리펩티드가 발현되는 조건 하에 숙주 세포를 배양하고, 목적 폴리펩티드를 분리하는 것을 포함할 수 있다. 재조합 벡터의 준비하고, 이를 이용하여 숙주 세포를 형질전환시키고, 숙주 세포에서 벡터를 복제하고, 생물학적으로 활성인 외부 폴리펩티드 및 단백질을 발현시키기 위한 방법 및 물질은 본원에서 논의되고, 문헌 [Sambrook et al., Molecular Cloning, 3rd edition, Cold Spring Harbor Laboratory, 2001] 및 [Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, New York 3rd edition, (2000)]에 기재되어 있으며, 이들은 각각 참고로 본원에 포함된다.
목적 폴리펩티드는 숙주 세포가 성장한 배지로부터, 당업계에 공지된 정제 방법, 예를 들어, 배지로부터의 침전법, 또는 면역친화성 크로마토그래피, 수용체 친화성 크로마토그래피, 소수성 상호작용 크로마토그래피, 렉틴 친화성 크로마토그래피, 크기 배재 여과, 양이온 또는 음이온 교환 크로마토그래피, 고압 액체 크로마토그래피 (HPLC), 역상 HPLC 등을 비롯한 통상적 크로마토그래피 방법에 의해 단리될 수 있다. 정제의 또 다른 방법은 원하는 폴리펩티드가 발현되고, 특이적 결합 파트너 또는 작용제에 의해 인식되는 특이적 친화성 펩티드, 태크, 라벨, 또는 킬레이팅 잔기를 갖는 융합 폴리펩티드로서 정제되는 방법을 포함한다. 정제된 폴리펩티드는 절단되어 원하는 폴리펩티드를 얻을 수 있거나, 또는 온전한 융합 폴리펩티드로서 남아있을 수 있다. 친화성 태그 성분의 절단은 절단 과정의 결과로서 추가적 아미노산 잔기를 갖는 원하는 폴리펩티드의 형태를 생성할 수 있다. 한 실시양태에서, 친화성 태그는 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, S-태그, 또는 그의 임의의 조합이다.
본 발명의 목적 폴리펩티드는 분비 융합 파트너와의 융합 형태로 세포외 생성될 수 있고, 시험관내 프로테아제 처리에 의해 SFP로부터 분리될 수 있다. 단리 절차가 이용된 후에 단리된 목적 폴리펩티드가 생물학적으로 활성이 아닌 경우, "리폴딩 (refolding)" 또는 폴리펩티드의 그의 3차 구조로의 전환 및 이황화 결합의 생성을 위한 다양한 방법이 생물학적 활성을 회복시키기 위해 사용될 수 있다. 당업자에게 공지된 방법은 가용화된 폴리펩티드의 pH를 일반적으로 pH 7 초과로 조정하거나, 특정 농도의 카오트로프 (chaotrope)의 존재 하에 두는 것을 포함한다. 카오트로프의 선택은 봉입체 (inclusion body) 가용화를 위해 이용된 선택과 매우 유사하나 일반적으로 보다 낮은 농도에서 이루어지고, 필수적으로 가용화를 위해 사용된 바와 같은 동일한 카오트로프일 필요는 없다. 단백질의 시스테인 다리(들)를 형성시킬 이황화 셔플링을 일으키는 특정 산화환원 전위를 생성하기 위해 환원제, 또는 환원제에 특정 비율로 그의 산화된 형태를 더한 것을 사용하는 것이 요구될 수 있다. 몇 가지의 통상적으로 사용되는 산화환원 커플에는 시스테인/시스타민, 글루타티온 (GSH)/디티오비스 GSH, 염화제2구리, 디티오트레이톨 (DTT)/디티안 DTT, 2-머캅토에탄올 (bME)/디티오-b(ME)가 포함된다. 리폴딩의 효율을 증가시키기 위해, 글리세롤, 다양한 분자량의 폴리에틸렌 글리콜, 및 아르기닌과 같은 공용매를 사용하는 것이 필요할 수 있다.
용어 "폴리뉴클레오티드"는 단수형 핵산뿐만 아니라 복수형 핵산도 포함하는 것으로, 단리된 핵산 분자 또는 작제물, 예를 들어, 메신저 RNA (mRNA), 바이러스-유래 RNA, 또는 플라스미드 DNA (pDNA)를 나타낸다. 폴리뉴클레오티드는 통상적 인산디에스테르 결합 또는 비-통상적 결합 (예를 들어, 아미드 결합, 예컨대 펩티드 핵산 (PNA)에서 발견됨)을 포함할 수 있다. 용어 "핵산"은 폴리뉴클레오티드에 존재하는 임의의 하나 이상의 핵산 절편, 예를 들어, DNA 또는 RNA 단편을 나타낸다. "단리된" 핵산 또는 폴리뉴클레오티드는 그의 자연 환경 상태로부터 제거된 핵산 분자, DNA 또는 RNA를 나타낸다. 예를 들어, 벡터에 함유된 치료적 폴리펩티드를 인코딩하는 재조합 폴리뉴클레오티드는 본 발명의 목적을 위해 단리될 것이 고려된다. 단리된 폴리뉴클레오티드의 추가적 예에는 이종 숙주 세포에 남아있는 재조합 폴리뉴클레오티드 또는 용액 중의 (부분적으로 또는 상당히) 정제된 폴리뉴클레오티드가 포함된다. 단리된 RNA 분자는 본 발명의 생체내 또는 시험관내 RNA 전사체, 뿐만 아니라 본원에 개시된 페스티바이러스 벡터의 양성 및 음성 가닥 형태, 및 이중 가닥 형태를 포함한다.
본 발명에 따른 단리된 폴리뉴클레오티드 또는 핵산은 합성적으로 생성된 그러한 분자를 추가적으로 포함한다. 또한, 폴리뉴클레오티드 또는 핵산은 조절 요소, 예컨대 프로모터, 리보솜 결합 부위, 또는 전사 터미네이터일 수 있거나, 또는 이들을 포함할 수 있다.
본원에 사용된 바와 같은 "코딩 영역"은 아미노산으로 번역되는 코돈으로 이루어진 핵산의 일부이다. 비록 "정지 코돈" (TAG, TGA, 또는 TAA)이 아미노산으로 번역되지 않더라도, 이는 코딩 영역의 일부로 고려될 수 있으나, 존재하는 경우, 임의의 측면 서열, 예를 들어 프로모터, 리보솜 결합 부위, 전사 터미네이터, 인트론, 5' 및 3' 비-번역 영역 등은 코딩 영역의 일부가 아니다. 본 발명의 둘 이상의 코딩 영역은 단일 폴리뉴클레오티드 작제물에, 예를 들어, 단일 벡터 상에, 또는 분리 폴리뉴클레오티드 작제물에, 예를 들어, 분리 (상이한) 벡터 상에 존재할 수 있다. 또한, 임의의 벡터는 단일 코딩 영역을 함유할 수 있거나, 또는 둘 이상의 코딩 영역을 포함할 수 있으며, 예를 들어, 본 발명의 벡터는 단백질분해성 절단을 통해 최종 폴리펩티드로 번역 후 또는 번역과 동시에 분리되는 하나 이상의 폴리펩티드를 인코딩할 수 있다. 게다가, 본 발명의 벡터, 폴리뉴클레오티드, 또는 핵산은 본 발명의 폴리펩티드를 인코딩하는 제1 또는 제2 핵산, 또는 그의 변이체 또는 유도체에 융합되거나 또는 융합되지 않은 이종 코딩 영역을 인코딩할 수 있다. 이종 코딩 영역은 제한 없이, 세분화된 요소 또는 모티프, 예컨대 분비 신호 펩티드 또는 이종 기능성 도메인을 포함한다.
특정 실시양태에서, 폴리뉴클레오티드 또는 핵산은 DNA이다. DNA의 경우, 정상적으로 폴리펩티드를 인코딩하는 핵산을 포함하는 폴리뉴클레오티드는 하나 이상의 코딩 영역과 작동가능하게 연결된 프로모터 및/또는 다른 전사 또는 번역 제어 요소를 포함할 수 있다. 작동가능한 연결은 유전자 생성물, 예를 들어, 폴리펩티드에 대한 코딩 영역이 하나 이상의 조절 서열에 연결되고, 그러한 방식으로 조절 서열(들)의 영향 또는 제어 하에 유전자 생성물의 발현이 일어나도록 하는 경우이다. 2개의 DNA 단편 (예컨대, 폴리펩티드 코딩 영역 및 거기에 연결된 프로모터)은, 프로모터 기능의 도입이 원하는 유전자 생성물을 인코딩하는 mRNA의 전사를 초래하는 경우, 및 2개의 DNA 단편 사이에 연결의 특성이 유전자 생성물의 발현을 지시하기 위한 발현 조절 서열의 능력을 방해하지 않거나, 또는 전사될 DNA 주형의 능력을 방해하지 않는 경우에 "작동가능하게 연결"된 것이다. 따라서, 프로모터가 그 핵산의 전사에 작용할 수 있는 경우, 프로모터 영역은 폴리펩티드를 인코딩하는 핵산과 작동가능하게 연결된 것이다. 프로모터는 미리 결정된 세포에서만 DNA의 실질적인 전사를 지시하는 세포-특이적 프로모터일 수 있다. 프로모터 외에 다른 전사 제어 요소, 예를 들어 인핸서, 오퍼레이터, 리프레서, 및 전사 종결 신호가 폴리뉴클레오티드와 작동가능하게 연결되어 세포-특이적 전사를 지시할 수 있다. 적절한 프로모터 및 다른 전사 제어 영역은 본원에 개시되어 있다.
다양한 전사 제어 영역이 당업자에게 공지되어 있다. 이들은 제한 없이, 척추동물 세포에서 작용하는 전사 제어 영역, 예컨대, 여기에 제한되지는 않지만, 사이토메갈로바이러스 (예를 들어, 즉시 초기 (immediate early) 프로모터, 인트론-A와 함께), 유인원 바이러스 40 (예를 들어, 초기 프로모터), 및 레트로바이러스 (예컨대, 예를 들어, 라우스 육종 바이러스)로부터의 프로모터 및 인핸서 절편을 포함한다. 다른 전사 제어 영역은 척추동물 유전자로부터 유래된 것, 예컨대 액틴, 열 충격 단백질, 소 성장 호르몬 및 토끼 β-글로빈, 뿐만 아니라 진핵 세포에서 유전자 발현을 제어할 수 있는 다른 서열을 포함한다. 추가적인 적절한 전사 제어 영역은 조직-특이적 프로모터 및 인핸서 뿐만 아니라 림포카인-유도성 프로모터 (예를 들어, 인터페론 또는 인터루킨에 의해 유도가능한 프로모터)를 포함한다.
유사하게는, 다양한 번역 제어 요소가 당업자에게 공지되어 있다. 이들은, 여기에 제한되지는 않지만, 리보솜 결합 부위, 번역 개시 및 종결 코돈, 및 바이러스계로부터 유래한 요소 (특히 내부 리보솜 엔트리 부위, 또는 IRES, CITE 서열로도 지칭함)를 포함한다.
본 발명의 폴리뉴클레오티드는 RNA, 예를 들어, 메신저 RNA (mRNA)의 형태를 포함할 수 있다. 본 발명의 RNA는 단일 가닥 또는 이중 가닥일 수 있다.
본 발명의 폴리뉴클레오티드 및 핵산 코딩 영역은 본 발명의 폴리뉴클레오티드에 의해 인코딩되는 폴리펩티드의 분비를 지시하는 분비 또는 신호 펩티드를 인코딩하는 추가적 코딩 영역과 연결될 수 있다. 신호 가설에 따라 성장하는 단백질 쇄가 조면 소포체를 거쳐 나오기 시작하면, 포유류 세포에 의해 분비된 단백질은 성숙 단백질로부터 절단되는 신호 펩티드 또는 분비 리더 서열을 갖는다. 당업자는 척추동물 세포에 의해 분비된 폴리펩티드가 폴리펩티드의 N-말단에 융합된 신호 펩티드를 일반적으로 가지고 있고, 이는 폴리펩티드의 분비된 또는 "성숙된" 형태를 생성하기 위해 완전한 또는 "전장" 폴리펩티드로부터 절단된다는 것을 인지할 것이다. 특정 실시양태에서, 천연 신호 펩티드, 예를 들어, 면역글로불린 중쇄 또는 경쇄 신호 펩티드, 또는 그에 작동가능하게 연결된 폴리펩티드의 분비를 지시하는 능력을 보유하는 그 서열의 기능성 유도체가 사용된다. 별법으로는, 이종 포유류 신호 펩티드, 또는 그의 기능성 유도체가 사용될 수 있다. 예를 들어, 야생형 리더 서열은 인간 조직 플라스미노겐 활성화인자 (TPA) 또는 마우스 β-글루쿠로니다아제의 리더 서열로 치환될 수 있다.
용어 "작제물"은 자연적으로 발생하지 않는 핵산 분자를 나타낸다. 작제물은 융합 폴리펩티드를 인코딩하는 폴리뉴클레오티드이다. 한 실시양태에서, 작제물은 SFP 또는 후보자 SFP 및 목적 폴리펩티드를 포함하는 융합 폴리펩티드를 인코딩한다. 작제물은 원형 또는 선형 벡터를 추가적 포함할 수 있고, 예를 들어 상동 재조합에 의해 다른 폴리뉴클레오티드와 조합될 수 있다.
본원에 사용된 용어 "벡터"는 그가 연결된 또다른 핵산을 수송할 수 있는 핵산 분자를 나타낸다. 벡터의 한 유형은 "플라스미드"이며, 이는 추가적 DNA 절편이 라이게이션될 수 있는 원형 이중 가닥 DNA 루프를 나타낸다. 다른 유형의 벡터는 바이러스 벡터이며, 여기서 추가적 DNA 절편은 바이러스 게놈으로 라이게이션될 수 있다. 특정 벡터는 이들이 도입된 숙주 세포에서 자율적 복제가 가능하다 (예를 들어, 박테리아 복제 기점을 갖는 박테리아 벡터 및 에피솜 포유류 벡터). 다른 벡터 (예를 들어, 비-에피솜 포유류 벡터)는 숙주 세포로 도입되어 숙주 세포의 게놈으로 통합됨으로써, 숙주 게놈과 함께 복제된다. 본 발명의 벡터는 작동적으로 연결된 목적 폴리펩티드를 인코딩하는 유전자의 발현을 지시할 수 있다. 그러한 벡터는 본원에서 "발현 벡터"로 지칭한다. 일반적으로, 재조합 DNA 기술에서 유용한 발현 벡터는 종종 플라스미드의 형태이다. 본원에서, "플라스미드" 및 "벡터"는 상호교환적으로 사용되는데, 플라스미드는 벡터의 가장 통상적으로 사용되는 형태이기 때문이다. 그러나, 본 발명은 동등한 기능을 하는 그러한 다른 형태의 발현 벡터, 예컨대 바이러스 (예를 들어, 복제 결함 레트로바이러스, 아데노바이러스 및 아데노-관련 바이러스) 벡터를 포함한다.
벡터 DNA는 통상적 형질전환 또는 형질감염 기술을 통해 원핵 또는 진핵 세포로 도입될 수 있다. 본원에 사용된 바와 같은 용어 "형질전환" 및 "형질감염"은 인산칼슘 또는 염화칼슘 공동-침전법, DEAE-덱스트란-매개 형질감염, 리포펙션, 또는 전기천공법을 비롯한 외부 핵산 (예를 들어, DNA)을 숙주 세포로 도입하기 위한 다양한 당업계-인지된 기술을 나타낸다. 숙주 세포를 형질전환시키거나 또는 형질감염시키기 위한 적절한 방법은 문헌 [Sambrook, et al. MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989], 및 다른 실험 매뉴얼에서 찾아볼 수 있다.
포유류 세포의 안정한 형질감염을 위해, 이용된 발현 벡터 및 형질감염 기술에 따라 달라지는데, 세포의 작은 분획만이 외부 DNA를 그의 게놈으로 통합시킬 수 있다는 것이 공지되어 있다. 이들 통합체를 확인 및 선택하기 위해, 선택가능한 마커 (예를 들어, 항생제 내성)를 인코딩하는 유전자가 관심있는 유전자와 함께 숙주 세포로 일반적으로 도입된다. 다양한 선택가능한 마커는 약물에 내성을 부여하는 것들, 예컨대 G418, 히그로마이신 및 메토트렉세이트를 포함한다. 선택가능한 마커를 인코딩하는 핵산은 목적 폴리펩티드를 인코딩하는 것과 동일한 벡터 상에서 숙주 세포로 도입될 수 있거나, 또는 분리 벡터 상에서 도입될 수 있다. 도입된 핵산으로 안정하게 형질감염된 세포는 약물 선택, 영양요구성 마커 선택, 배지 조성, 탄소원 선택, 또는 당업계에 공지된 다른 방법 (예를 들어, 다른 세포는 죽는 한편, 선택가능한 마커 유전자를 통합한 세포는 생존할 것임)에 의해 확인될 수 있다.
한 실시양태에서, 본 발명의 방법에서 사용된 폴리펩티드 또는 그의 단편 또는 유도체를 인코딩하는 뉴클레오티드 서열은 5' 말단 및 3' 말단에서 본 발명의 선형 벡터로 생체내 상동 재조합을 위해 사용되는 DNA를 추가적으로 포함할 수 있다. 5' 말단 및 3' 말단 DNA는 충분한 상동적 서열을 제공하여, 이들이 숙주 세포로 공동-형질전환되는 경우, 폴리펩티드 또는 그의 단편 또는 유도체를 인코딩하는 뉴클레오티드 서열 및 선형 벡터 사이에 생체내 재조합이 가능하게 한다. 한 실시양태에서, 5' 말단 및 3' 말단 DNA 각각은 선형 벡터의 서열과 중복되는 20개 이상의 염기 쌍, 예를 들어, 30 또는 40개 이상의 염기 쌍을 포함한다. 5' 및 3' DNA의 첨가는 통상적 재조합 DNA 기술, 예를 들어, PCR 및/또는 제한 효소 절단 및 라이게이션을 이용하여 수행될 수 있다.
본 발명의 폴리뉴클레오티드는 친화성 태그, 예를 들어, GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, 또는 S-태그를 추가로 인코딩할 수 있다. 친화성 태그는 링커 DNA에 의해 인코딩될 수 있거나, 또는 본 발명의 폴리뉴클레오티드의 또다른 부분, 예컨대 융합 단백질을 인코딩하는 영역의 5' 또는 3' 부분에 의해 인코딩될 수 있다.
본 발명의 폴리뉴클레오티드는 링커 DNA를 추가로 포함할 수 있다. 한 실시양태에서, 링커 DNA는 링커 펩티드를 인코딩한다.
본 발명의 링커 DNA는 충분한 길이일 수 있으며, 선형 벡터의 뉴클레오티드 서열의 일부에 대해 충분한 서열 동일성을 가져서, 이들이 숙주 세포로 공동-형질전환되는 경우, 폴리펩티드-인코딩 뉴클레오티드 서열 및 선형 벡터 사이에 생체내 재조합을 가능하게 한다. 한 실시양태에서, 링커 DNA는 20개 이상의 염기쌍 길이, 예를 들어, 30 또는 40개 이상의 염기쌍 길이이다. 추가적 실시양태에서, 링커 DNA는 선형 벡터 상에서 상응하는 서열과 80% 이상, 예를 들어 85%, 90%, 95%, 또는 99% 이상 동일하다.
한 실시양태에서, 링커 DNA는 프로테아제 인식 서열을 인코딩함으로써 SFP 및 목적 폴리펩티드의 접합부에서 절단되도록 한다. 예를 들어, 링커 DNA는 효모 kex2p- 또는 Kex2-유사 프로테아제 인식 서열 (예를 들어, Lys-Arg, Arg-Arg, 또는 Leu-Asp-Lys-Arg을 포함하는 아미노산 서열 (서열번호 74)), 포유류 푸린 (furin)-인식 서열 (예를 들어, Arg-X-X-Arg을 포함하는 아미노산 서열), 인자 Xa-인식 서열 (예를 들어, Ile-Glu-Gly-Arg을 포함하는 아미노산 서열 (서열번호 75)), 엔테로키나아제-인식 서열 (예를 들어, Asp-Asp-Lys을 포함하는 아미노산 서열), 서브틸리신-인식 서열 (예를 들어, Ala-Ala-His-Tyr을 포함하는 아미노산 서열 (서열번호 76)), 담배 식각 바이러스 프로테아제-인식 서열 (예를 들어, Glu-Asn-Leu-Tyr-Phe-Gln-Gly을 포함하는 아미노산 서열 (서열번호 77)), 유비퀴틴 가수분해효소-인식 서열 (예를 들어, Arg-Gly-Gly을 포함하는 아미노산 서열) 또는 트롬빈-인식 서열 (예를 들어, Arg-Gly-Pro-Arg을 포함하는 아미노산 서열 (서열번호 78))을 인코딩할 수 있다.
링커의 프로테아제 부위 내에서 또는 분비 폴리펩티드 또는 목적 폴리펩티드 내에서, 내재적 숙주 프로테아제에 의한 융합 폴리펩티드의 원치 않는 절단을 피하는 것이 바람직하다. 이와 유사하게, 목적 폴리펩티드 또는 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 내에서 목적 폴리펩티드로부터 분비된 폴리펩티드를 절단하기 위해 사용되는 프로테아제에 의한 절단을 피하는 것이 바람직하다. 따라서, 프로테아제 인식 서열을 인코딩하는 링커 DNA가 융합 폴리펩티드를 인코딩하는 폴리뉴클레오티드의 부분으로서 숙주 세포로 형질전환되는 경우, 숙주 세포는 바람직하게는 링커에서 프로테아제 서열을 인지하는 프로테아제를 발현하지 않는다. 숙주 세포는 프로테아제를 자연적으로 발현하지 않을 수 있거나, 또는 숙주 세포는 프로테아제를 발현하지 않도록 변형될 수 있다 (예를 들어, kex2 돌연변이 숙주 세포, kex2-유사 프로테아제 돌연변이 숙주 세포, 및 푸린 돌연변이 숙주 세포). 융합 폴리펩티드가 분비 폴리펩티드 및 목적 폴리펩티드를 포함하는 경우, 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 및/또는 목적 폴리펩티드는 숙주 프로테아제 인식 서열을 자연적으로 포함하지 않을 수 있거나, 또는 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 및/또는 목적 폴리펩티드는 숙주 프로테아제에 의해 인식되는 서열을 함유하지 않도록 변형될 수 있다. 융합 폴리펩티드가 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체, 목적 폴리펩티드, 및 프로테아제 인식 서열을 포함하는 펩티드 링커를 포함하는 경우, 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 및/또는 목적 폴리펩티드는 프로테아제 인식 서열을 자연적으로 포함하지 않을 수 있거나, 또는 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 및/또는 목적 폴리펩티드는 펩티드 링커의 프로테아제 인식 서열을 인식하는 프로테아제에 의해 인식되는 서열을 함유하지 않도록 변형될 수 있다.
또다른 실시양태에서, 링커 DNA는 친화성 태그, 예를 들어, GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, 또는 S-태그를 인코딩한다.
추가적 실시양태에서, 링커 DNA는 제한 효소 인식 부위 및 프로테아제 인식 서열 (예를 들어, kex2p-유사 프로테아제- 또는 kex- 2p-인식 서열)을 인코딩한다.
원핵생물에서 폴리펩티드의 발현은 목적 폴리펩티드-리포터 폴리펩티드 융합의 발현을 지시하는 구성적 또는 유도성 프로모터를 함유하는 벡터로 수행될 수 있다. 적합한 E. 콜라이 발현 벡터의 예에는 pTrc (Amrann et al., Gene 69:301-315 (1988)) 및 pET (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89)가 포함된다.
효모 세포에서의 발현을 위해, 적절한 효모 발현 벡터에는, 여기에 제한되지는 않지만, pYepSec1 (Baldari et al., EMBO J. 6:229-234 (1987)), pMFa (Kurjan et al., Cell 30:933-943 (1982)), pJRY88 (Schultz et al., Gene 54:113-123 (1987)), pYES2 (인비트로겐 코포레이션: Invitrogen Corporation, San Diego, Calif.), 및 picZ (인비트로겐 코포레이션)가 포함된다.
곤충 세포에서의 발현을 위해, 배큘로바이러스 발현 벡터가 사용될 수 있다. 배양된 곤충 세포 (예를 들어, SF9 세포)에서 폴리펩티드의 발현에 이용가능한 배큘로바이러스 벡터에는 pAc 시리즈 (Smith et al., Mol. Cell. Biol. 3:2156-2165 (1983)) 및 pVL 시리즈 (Lucklow et al., Virology 170:31-39 (1989))가 포함된다.
또다른 실시양태에서, 숙주 세포는 포유류 세포이고, 벡터는 포유류 발현 벡터이다. 포유류 발현 벡터의 예에는 pCDM8 (문헌 [Seed, Nature 329:840 (1987)]) 및 pMT2PC (문헌 [Kaufman et al., EMBO J. 6: 187-195 (1987)])이 포함된다. 포유류 세포에서 사용되는 경우, 발현 벡터의 제어 기능은 바이러스 조절 요소에 의해 종종 제공된다. 예를 들어, 흔히 사용되는 프로모터는 폴리오마, 아데노바이러스 2, 사이토메갈로바이러스 및 유인원 바이러스 40으로부터 유래된다. 원핵세포 및 진핵세포 둘 다에 적절한 다른 발현계에 대해서는, 예를 들어, 문헌 [Chapters 16 and 17 of Sambrook et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989]을 참조한다.
바람직한 벡터에는, 여기에 제한되지는 않지만, 플라스미드, 파지, 코스미드, 에피솜, 바이러스 입자 또는 바이러스, 및 통합가능한 DNA 단편 (즉, 상동적 재조합에 의해 숙주 게놈으로 통합가능한 단편)이 포함된다. 바람직한 바이러스 입자에는, 여기에 제한되지는 않지만, 아데노바이러스, 배큘로바이러스, 파르보바이러스, 헤르페스바이러스, 폭스바이러스, 아데노연관 바이러스, 셈리키 포레스트 (Semliki Forest) 바이러스, 백시니아 바이러스, 및 레트로바이러스가 포함된다. 바람직한 발현 벡터에는, 여기에 제한되지는 않지만, pcDNA3 (인비트로겐) 및 pSVL (Pharmacia Biotech)이 포함된다. 다른 발현 벡터에는, 여기에 제한되지는 않지만, pSPORTTM 벡터, pGEMTM 벡터 (프로메가: Promega), pPROEX벡터TM (LTI, Bethesda, MD), 블루스크립트 (Bluescript)TM 벡터 (스트라타젠: Stratagene), pQETM 벡터 (퀴아젠: Qiagen), pSE420TM (인비트로겐), 및 pYES2TM (인비트로겐)이 포함된다.
한 실시양태에서, 발현 벡터는 목적 폴리펩티드를 인코딩하는 DNA 서열이 작동가능하게 연결되거나, 또는 적합한 숙주에서 목적 폴리펩티드의 발현을 작용하게 할 수 있는 적절한 제어 서열에 연결된 복제가능한 DNA 작제물이다. DNA 영역은 이들이 서로 기능적으로 연관된 경우, 작동가능하게 연결되거나 또는 이어져있다. 예를 들어, 프로모터는 서열의 전사를 제어하는 경우에 코딩 서열에 작동가능하게 연결되거나 또는 이어져있다. 벡터의 증폭은 발현 제어 도메인을 요구하지 않지만, 일반적으로 복제 기점에 의해 부여된 숙주에서의 복제 능력, 및 형질전환체의 인식을 촉진하기 위한 유전자 선택 능력만이 요구된다. 발현 벡터에서 제어 서열에 대한 요건은 선택된 숙주 및 선택된 형질전환 방법에 따라 달라질 것이다. 일반적으로, 제어 서열에는, 여기에 제한되지는 않지만 전사 프로모터, 인핸서, 전사를 제어하기 위한 선택적 아퍼레이터 서열, 폴리아데닐화 신호, 적절한 mRNA 리보솜 결합을 인코딩하는 서열, 및 전사 및 번역의 종결을 제어하는 서열이 포함된다. 그러한 조절 서열은, 예를 들어, 문헌 [Goeddel; GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990)]에 기재되어 있다. 조절 서열은, 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 지시하는 서열, 및 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 지시하는 서열 (예를 들어, 조직-특이적 조절 서열)을 포함한다. 당업자는 발현 벡터의 고안이 형질전환될 숙주 세포의 선택, 원하는 폴리펩티드의 발현 수준 등과 같은 인자에 따라 달라질 수 있음을 인지할 것이다.
본 발명의 발현 벡터는 숙주 세포로 도입됨으로써 본원에 기재된 바와 같은 핵산에 의해 인코딩되는 융합 단백질 또는 펩티드를 비롯한 단백질 또는 펩티드를 생성할 수 있다. 바람직한 벡터는 숙주 유기체에 의해 인식되는 프로모터를 함유한다.
한 실시양태에서, 본 발명의 프로모터는 외부 폴리펩티드의 재조합 생성을 위해 사용되는 강력한 이종 프로모터이다. 이종 프로모터는 유도성일 수 있거나, 또는 구성적일 수 있다. 바람직한 이종 프로모터는 단백질의 상업적 생성을 위해 사용되는 것들, 예컨대 하기 기재된 것들이다. 본 발명의 이종 프로모터는 천연 또는 야생형 SFP 프로모터로부터 구별가능하다.
본 발명의 프로모터 서열은 원핵생물, 진핵생물 또는 바이러스 유래일 수 있다. 적절한 원핵생물 서열의 예에는 박테리오파지 람다의 PR 및 PL 프로모터 (The bacteriophage Lambda, Hershey, A. D., Ed., Cold Spring Harbor Press, Cold Spring Harbor, NY (1973), 그 전문이 본원에 참고로 포함됨; Lambda II, Hendrix, R. W., Ed., Cold Spring Harbor Press, Cold Spring Harbor, NY (1980), 그 전문이 본원에 참고로 포함됨); 이. 콜라이의 trp, recA, 열 충격, 및 lacZ 프로모터 및 SV40 초기 프로모터 (Benoist et al., Nature, 290:304-310 (1981), 그 전문이 본원에 참고로 포함됨)가 포함된다. 효모에 대해서는, 적절한 프로모터의 예에는, 여기에 제한되지는 않지만 GAPDH, PGK, ADH, PHO5, TEF, GAL1, 및 GAL10이 포함된다. 추가적 프로모터에는, 여기에 제한되지는 않지만, 마우스 유선 종양 바이러스, 인간 면역결핍 바이러스의 긴 말단 반복, 말로니 바이러스, 사이토메갈로바이러스 즉시 초기 프로모터, 엡스테인 바르 (Epstein Barr) 바이러스, 라우스 육종 바이러스, 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴, 및 인간 메탈로티오네인이 포함된다.
추가적 조절 서열이 또한 바람직한 벡터에 포함될 수 있다. 적절한 조절 서열의 예는 파지 MS-2의 레플리카아제 유전자 및 박테리오파지 람다의 유전자 cII의 샤인-달가노 (Shine-Dalgarno) 서열에 의해 나타낸다.
게다가, 적절한 발현 벡터는 형질전환된 숙주 세포의 스크리닝을 가능하게 하는 적합한 마커를 포함할 수 있다. 선택된 숙주의 형질전환은 당업자에게 익히 공지된 다양한 기술 중 임의의 하나를 이용하여 수행되고, 삼브룩 등 (Sambrook et al.)의 상기 문헌에 기재되어 있다.
복제 기점은 또한 벡터의 작제에 의해 외인성 기점을 포함하도록 제공될 수 있거나, 또는 숙주 세포 염색체 복제 기작에 의해 제공될 수 있다. 벡터가 숙주 세포 염색체로 통합되는 경우, 후자가 충분할 수 있다. 이와는 달리, 바이러스 복제 기점을 함유하는 벡터를 사용하기보다, 당업자는 선택가능한 마커 및 목적 폴리펩티드 DNA로 공동-형질전환의 방법에 의해 포유류 세포를 형질전환시킬 수 있다. 적절한 마커의 예는 디히드로엽산환원효소 (DHFR) 또는 티미딘 키나아제 (미국 특허 제4,399,216호 참조)이다.
목적 폴리펩티드를 인코딩하는 뉴클레오티드 서열은 라이게이션을 위한 블런트-엔드 (blunt-ended) 또는 스태거드-엔드 (staggered-ended) 말단, 적절한 말단을 제공하기 위한 제한 효소의 절단, 점착성 말단 (cohesive end)을 적절한 위치에 채우기, 바람직하지 않은 연결을 피하기 위한 알칼리성 포스파타아제 처리, 및 적합한 리가아제로 라이게이션시키기를 비롯한 통상적 기술에 따라 벡터 DNA로 재조합될 수 있다. 그러한 조작에 대한 기술은 샘브룩 등 (Sambrook et al.)의 상기 문헌에 개시되어 있으며, 당업계에 익히 공지되어 있다. 포유류 발현 벡터의 작제 방법은, 예를 들어 문헌 [Okayama et al., Mol. Cell. Biol. 3:280 (1983)], [Cosman et al., Mol. Immunol. 23:935 (1986)], [Cosman et al., Nature 312:768 (1984)], EP-A-0367566, 및 WO 91/18982에 기재되어 있으며, 이들 각각은 그 전문이 본원에 참고로 포함된다.
본 발명에서 사용된 숙주 세포는 당업자에게 공지된 임의의 숙주 세포일 수 있다. 적합한 숙주 세포에는 박테리아, 균류 (예를 들어, 효모), 식물, 또는 동물 (예를 들어, 포유류 또는 곤충) 세포가 포함된다. 적합한 효모 세포에는 칸디다, 데바리오미세스, 한세눌라, 클루이베로미세스, 피치아, 스키조사카로미세스, 야로위아, 사카로미세스, 슈반니오미세스, 및 아르크술라 종이 포함된다. 구체적 예에는 칸디다 유틸리스, 칸디다 보이디니, 칸디다 알비칸스, 클루이베로미세스 락티스, 피치아 파스토리스, 피치아 스티피티스, 스키조사카로미세스 폼베, 사카로미세스 세레비지애, 한세눌라 폴리몰파, 야로위아 리포리티카, 슈반니오미세스 옥시덴탈리스, 및 아르크술라 아데니니보란스가 포함된다. 다른 적절한 균류에는 아스퍼길루스, 페니실리움, 리조푸스, 및 트리코더마 종이 포함된다. 숙주 세포로 사용될 수 있는 박테리아에는 에세리키아, 슈도모나스, 및 바실러스 종이 포함된다. 적절한 식물 숙주 세포에는 아라비돕시스, 옥수수, 담배, 및 감자가 포함된다. 동물 세포에는 인간, 마우스, 래트, 토끼, 개, 고양이, 원숭이, 및 곤충으로부터 유래된 세포가 포함된다. 예에는 CHO, COS 1, COS 7, BSC 1, BSC 40, BMT 10, 및 Sf9 세포가 포함된다. 특정 실시양태에서, 숙주 세포는 효모 세포이다.
본 발명의 폴리뉴클레오티드는 단리된 폴리펩티드 코딩 영역 또는 바이러스 벡터를 포함하는 원형 플라스미드의 일부로서, 또는 선형 DNA로서 숙주 세포에 도입될 수 있다. 당업계에서 익히 공지되고 통상적으로 이용되는 DNA의 숙주 세포로의 도입 방법은 형질전환법, 형질감염법, 전기천공법, 핵 주입법, 또는 운반체, 예컨대 리포솜, 미셀, 껍질 세포, 및 프로토플라스트와의 융합법을 포함한다.
신속하고 효율적으로 검출가능한 리포터 단백질이 본 발명에서 사용될 수 있다. 한 실시양태에서, 리포터 단백질은 스크리닝 과정을 자동화하기 위해 양성적으로 선택될 수 있는 활성을 갖는다. 추가적 실시양태에서, 리포터 단백질은 세포외 공간으로 분비된 단백질, 예를 들어, 인버타아제, 수크라아제, 셀룰라아제, 크실라나아제, 말타아제, 아밀라아제, 글루코아밀라아제, 갈락토시다아제 (예를 들어, 알파-갈락토시다아제 베타-갈락토시다아제, 멜리비아제), 포스파타아제 (예를 들어, PHO5), 베타-락타마아제, 리파아제 또는 프로테아제이다. 특정 실시양태에서, 분비된 단백질은 세포가 특정 기질 상에서 성장하도록 한다. 포유류 세포에서 리포터 시스템의 예로서, 마우스 배아 줄기 세포에서 분비 경로 유전자를 찾기 위해 항생제 G418을 함유하는 배지에서 CD2/네오마이신-포스포트랜스퍼라아제 (Ceo) 유전자는 분비 리포터로서 사용될 수 있다 (De-Zolt et al., Nucleic Acid Res. 34:e25 (2006)).
한 실시양태에서, 숙주 세포는 효모이고, 리포터 단백질은 인버타아제이며, 형질전환된 효모 세포는 수크로스 또는 라피노스 상에서 성장할 수 있는 그의 능력에 대해 선택된다. 또다른 실시양태에서, 숙주 세포는 효모이고, 리포터 단백질은 멜리비아제이며, 형질전환된 효모 세포는 멜리비오스 상에서 성장할 수 있는 그의 능력에 대해 선택된다. 추가적 실시양태에서, 숙주 세포는 효모이고, 리포터 단백질은 아밀라아제 (예를 들어, 엔도아밀라아제, 엑소아밀라아제, β-아밀라아제, 또는 글루코아밀라아제)이며, 효모 세포는 비-녹말분해성이고, 형질전환된 세포는 전분을 분해할 수 있는 그의 능력에 대해 스크리닝된다. 추가적 실시양태에서, 리포터 단백질의 활성을 나타내는 세포를 확인하는 단계는 성장 억제제, 예를 들어, 항생제에 내성을 제공하는 리포터 단백질을 사용함으로써 이루어진다. 또다른 실시양태에서, 리포터 단백질은 가시적으로 검출될 수 있는 단백질, 예를 들어, 녹색 형광 단백질 또는 루시페라제이다. 한 실시양태에서, 리포터 단백질의 활성을 나타내는 세포를 확인하는 단계는 둘 이상의 리포터 단백질, 예를 들어, 리파아제 및 인버타아제를 사용함으로써 이루어진다.
본 발명의 숙주 세포는 리포터 단백질 활성을 나타내지 않는다. 한 실시양태에서, 숙주 세포는 리포터 단백질을 자연적으로 발현시키지 않는다. 다른 실시양태에서, 리포터 단백질을 인코딩하는 유전자(들)은 전체 또는 일부가 결실되거나, 리포터 단백질이 발현되지 않거나 또는 비활성 형태로 발현되도록 돌연변이된다. 세포에 특정 단백질이 결핍되도록 하는 방법은 당업계에 익히 공지되어 있고, 임의의 그러한 방법이 본 발명의 숙주 세포를 준비하기 위해 이용될 수 있다 (Sambrook et al., 상기 문헌). 효모에 있어서, 리포터 유전자 결핍은 익히 공지된 유전자 대체 기술을 이용하여 도입될 수 있다 (문헌 [Rothstein, Meth. Enzymol. 194:281 (1991)]).
목적 폴리펩티드를 인코딩하는 핵산은 게놈 또는 cDNA 라이브러리로부터의 단리, PCR에 의한 증폭, 또는 화학적 합성을 비롯한 당업계에 익히 공지된 통상적 기술을 이용하여 임의의 공급원으로부터 얻을 수 있다.
핵산 또는 그의 단편의 라이브러리는 게놈 DNA, cDNA, 합성 DNA, 및 재조합 DNA를 비롯한 임의의 유형의 DNA로부터 얻을 수 있다. RNA 및 자연적으로 발생하지 않는 핵산을 비롯한 DNA 이외의 핵산이 또한 사용될 수 있다. 미리 선택된 핵산 단편의 라이브러리는 이전에 확인된 핵산 단편을 다양화함으로써, 예를 들어, 단일방향성 결실, 돌연변이, 기능성 서열 (예를 들어, 글리코실화 부위)의 첨가 또는 핵산 단편 사이에서의 프리- 및 프로-신호 서열의 스와핑에 의해 얻을 수 있다. 한 실시양태에서, 핵산 단편은 1000 염기 쌍 미만, 예를 들어, 700, 500, 또는 300 염기 쌍 미만의 크기를 갖는다. 핵산 단편의 라이브러리는 DNA의 효소적 절단, cDNA 합성, 또는 재조합 DNA 기술 (예를 들어, 단일방향성 결실, 돌연변이유발)에 의해 작제될 수 있다.
핵산 단편은 유기체의 전체 게놈, 예를 들어, 전체 게놈 또는 cDNA 라이브러리로부터 유래될 수 있다. 단편은 또한 전체 게놈의 임의의 부분, 예를 들어, 차감된 라이브러리 또는 크기에 따라 분류한 라이브러리로부터 유래될 수 있다.
하기 실시예는, 여기에 제한되지 않으면서, 본 발명의 방법 및 조성물을 예시한다. 당업자에게 명백하고 임상 치료에서 일반적으로 포함되는 다양한 조건 및 파라미터의 다른 적절한 변형 및 적용은 본 발명의 취지 및 범주 내에 있다.
도 1의 (A)는 SFP1 단백질의 예측된 아미노 서열 및 도메인, (B)는 순차적으로 결실된 SFP1 유전자를 발현시키는 벡터의 모식도, (C)는 상대적 SFP1 단백질 발현 수준의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축시킨 각각의 배양 브로쓰 0.6 ml의 10% 트리스-트리신 SDS-PAGE 분석. 레인 1: YGaT91 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 2: YGaT92 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 3: YGaT93 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 4: YGaT94 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 5: YGaT95 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 6: YGaT96 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 7: YGaT97 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐: Invitrogen).
도 2의 (A)는 SFP1-IL2 융합 단백질을 발현하는 벡터의 모식도, (B)는 SFP1-IL2 융합 단백질 발현 수준의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축시킨 각각의 배양 브로쓰 0.6 ml의 10% 트리스-트리신 SDS-PAGE 분석. 레인 1: YGaT92-IL2 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 2: YGaT93-IL2 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 3: YGaT94-IL2 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 3은 YGaT92-EXD4를 함유하는 재조합 효모 균주의 유가식 (fed-batch) 발효에 대한 프로파일 및 발효 시간에 따른 배지로 분비된 단백질 분석을 위한 SDS-PAGE의 결과를 도시한다.
도 4는 상이한 농도의 엔테로키나아제 (인비트로겐, USA)로 절단시킨 정제된 SFP1-EXD4 융합 단백질의 SDS-PAGE 분석을 나타낸다. 레인 1: 정제된 SFP1-EXD4 융합 단백질; 레인 2: 엔테로키나아제 0.1 μl로 1시간 동안 37℃에서 절단시킨 정제된 SFP1-EXD4 융합 단백질; 레인 3: 엔테로키나아제 0.2 μl로 1시간 동안 37℃에서 절단시킨 정제된 SFP1-EXD4 융합 단백질; 레인 4: 엔테로키나아제 0.3 μl로 1시간 동안 37℃에서 절단시킨 정제된 SFP1-EXD4 융합 단백질; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 5의 (A)는 엔테로키나아제 절단시킨 SFP1-EXD4 융합 단백질의 HPLC 분석, (B)는 HPLC 분획의 SDS-PAGE 분석을 나타낸다. 겔 위의 수는 HPLC 분획 수를 나타낸다.
도 6은 정제된 EXD4 단백질의 MALDI-TOF 분석이다.
도 7의 (A)는 SFP1 변이체-EXD4 융합 단백질을 발현하는 벡터의 모식도, (B)는 SFP1 변이체-EXD4 융합 단백질 발현 수준의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축된 각각의 배양 브로쓰 0.6 ml의 10% 트리스-트리신 SDS-PAGE 분석. 레인 1: YGaT92-EXD4 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 2: YGaT921-EXD4 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 3: YGaT922-EXD4 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 4: YGaT923-EXD4 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 8은 제시된 발효 시간에서 YGaMKH-EXD4를 함유하는 재조합 효모 균주의 유가 발효의 SDS-PAGE 분석을 나타낸다.
도 9는 YGaST6-EXD4-HL을 함유하는 재조합 효모 균주의 유가 발효에 대한 프로파일, 및 발효 시간에 따른 배지로 분비된 단백질 분석에 대한 SDS-PAGE의 결과를 도시한다.
도 10은 YGaMKH-EGF를 함유하는 재조합 효모 균주의 유가 발효에 대한 프로파일, 및 발효 시간에 따른 배지로 분비된 단백질 분석에 대한 SDS-PAGE의 결과를 도시한다.
도 11의 (A)는 HL-EGF 융합 단백질의 Ni-NTA 친화성 크로마토그래피 결과를 나타낸다. 첨부된 작은 도면은 제시된 분획의 SDS-PAGE 분석이다. (B)는 엔테로키나아제로 절단시킨 후, HL-EGF 융합 단백질의 Ni-NTA 친화성 크로마토그래피의 결과를 나타낸다. 첨부된 작은 도면은 제시된 분획의 SDS-PAGE 분석이다.
도 12는 YGaMKH-PTH를 함유하는 재조합 효모 균주의 유가 발효에 대한 프로파일, 및 발효 시간에 따른 배지로 분비된 단백질 분석에 대한 SDS-PAGE의 결과를 도시한다.
도 13은 엔테로키나아제 (인비트로겐, USA) 및 재조합체 Kex2p (JH Sohn, KRIBB)의 분비 형태로 절단시킨 정제된 HL-PTH 융합 단백질의 SDS-PAGE 분석을 나타낸다. 레인 1: 정제된 HL-PTH 융합 단백질; 레인 2: Kex2p로 1시간 동안 37℃에서 절단시킨 정제된 HL-PTH 융합 단백질; 레인 3: 엔테로키나아제로 1시간 동안 37℃에서 절단시킨 정제된 HL-PTH 융합 단백질; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 14의 (A)는 2805 균주의 성장곡선을 나타내며, 화살표는 샘플링 포인트를 나타내고, (B)는 형광 염료 획스트 (hochest)로 염색한 후, 샘플링한 세포의 공초점 레이저 스캐닝 현미경 사진을 나타낸다.
도 15는 M2 샘플의 2D 겔 전기영동 결과를 나타낸다.
도 16은 1-DE/MudPIT (Multidimensional Protein Identification Technology)에 대한 SDS-PAGE 분석을 나타낸다.
도 17의 (A)는 시크리톰 분석으로부터 선택된 19개의 유전자를 발현하는 Y2805 형질전환체의 배양 상등액의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축시킨 각각의 배양 브로쓰 0.6 ml의 10% 트리스-글리신 SDS-PAGE 분석. 레인 1: BGL2 유전자를 과발현하는 2805 균주의 배양 브로쓰; 레인 2: CIS3를 과발현하는 2805 균주의 배양 브로쓰; 레인 3: CRH1을 과발현하는 2805 균주의 배양 브로쓰; 레인 4: CWP1을 과발현하는 2805 균주의 배양 브로쓰; 레인 5: DSE4를 과발현하는 2805 균주의 배양 브로쓰; 레인 7: EGT2를 과발현하는 2805 균주의 배양 브로쓰; 레인 8: EXG1을 과발현하는 2805 균주의 배양 브로쓰; 레인 9: GAS1을 과발현하는 2805 균주의 배양 브로쓰; 레인 10: GAS3를 과발현하는 2805 균주의 배양 브로쓰; 레인 11: GAS5를 과발현하는 2805 균주의 배양 브로쓰; 레인 12: PST1을 과발현하는 2805 균주의 배양 브로쓰; 레인 13: SCW4를 과발현하는 2805 균주의 배양 브로쓰; 레인 15: SIM1을 과발현하는 2805 균주의 배양 브로쓰; 레인 16: TOS1을 과발현하는 2805 균주의 배양 브로쓰; 레인 17: UTH1을 과발현하는 2805 균주의 배양 브로쓰; 레인 18: YGP1을 과발현하는 2805 균주의 배양 브로쓰; 레인 19: YPS1을 과발현하는 2805 균주의 배양 브로쓰; 레인 20: ZPS1을 과발현하는 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐). (B)는 엔도-H 처리 후에 배양 상등액의 SDS-PAGE 분석을 나타낸다.
도 18은 EXD4 유전자와 융합된 11개의 유전자를 발현하는 Y2805 형질전환체의 배양 상등액의 각각의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축시킨 각각의 배양 브로쓰 0.6 ml의 10% 트리스-트리신 SDS-PAGE 분석. 레인 1: BGL2-EXD4 유전자를 과발현하는 2805 균주의 배양 브로쓰; 레인 2: GAS3-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 3: GAS5-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 4: PST1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 5: SCW4-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 6: SCW10-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 7: SIM1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 8: UTH1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 9: YGP1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 10: YPS1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 11: ZPS1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 19의 (A)는 SCW4 및 EXD4 융합의 결실 단편에 대한 카이트-둘리틀 소수성 (Kyte-Doolittle hydropathy) 분석 및 모식도, (B)는 점진적으로 결실된 SCW4-EXD4 융합 단편을 함유하는 각각의 형질전환체의 배양 상등액의 SDS-PAGE 분석을 나타낸다.
도 20은 YGa-SCW4-1-EXD4 및 YGa-SCW4-3-EXD4를 각각 함유하는 재조합 2805 효모 균주의 유가 발효 동안 배지로 분비된 단백질의 분석에 대한 SDS-PAGE의 결과를 나타낸다.
도 21은 엔테로키나아제의 처리 전 및 후 분비된 융합 단백질, SCW4-1-EXD4 및 SCW4-3-EXD4 분석에 대한 SDS-PAGE의 결과를 나타낸다.
도 22는 (A) 각각의 벡터를 함유하는 세포의 배양 브로쓰 10 마이크로리터, (B) 엔테로키나아제의 처리 전 및 후 샘플의 배지로 분비된 SCW4-hGH의 SDS-PAGE 결과를 나타낸다.
도 23은 발효 시간에 따른 YGa-SCW4-2-hGH를 함유하는 재조합 효모 균주의 유가 발효 동안 배지로 분비된 단백질 분석에 대한 SDS-PAGE의 결과를 나타낸다.
도 24는 IL-2 발현 벡터 pYGaT92-IL2의 지도를 나타낸다.
도 25는 엑센딘 (exendin)-4 발현 벡터 pYGaT923-EXD4의 지도를 나타낸다.
도 26은 엑센딘-4 발현 벡터 pYGaMKH-EXD4의 지도를 나타낸다.
도 27은 엑센딘-4 발현 벡터 pYGaST6-EXD-HL의 지도를 나타낸다.
도 28은 EGF 발현 벡터 pYGaMKH-EGF의 지도를 나타낸다.
도 29는 PTH 발현 벡터 pYGaMKH-PTH의 지도를 나타낸다.
도 30은 엑센딘-4 발현 벡터 pYGaSCW4-1-EXD4의 지도를 나타낸다.
도 31은 엑센딘-4 발현 벡터 pYGaSCW4-3-EXD4의 지도를 나타낸다.
도 32는 hGH 발현 벡터 pYGaSCW4-2-hGH의 지도를 나타낸다.
<본 발명을 수행하기 위한 최선의 양태>
본 발명에서는 목적 폴리펩티드의 높은 수준의 분비에 대한 필요성, 및 목적 폴리펩티드의 높은 수준의 분비를 달성하는데 사용할 수 있는 SFP 확인을 위한 신속하고 효율적인 스크리닝 기술에 대한 필요성에 대해 고심하였다. 본 발명은 임의의 단백질의 재조합 발현을 최적화하는데 유용한 한편, 공지된 발현계에서 그의 낮은 수준의 발현으로 인해 큰 규모 및/또는 낮은 비용으로 생산될 수 없는 단백질의 생산을 가능하도록 하는데 특히 유용하다. 목적 폴리펩티드의 높은 수준의 분비를 달성하기 위한 최적화된 SFP가 기재되어 있다.
정의
용어 "하나의" 또는 "한" 독립체는 하나 이상의 그 독립체를 나타내려는 것으로, 예를 들어, "하나의 벡터"는 하나 이상의 벡터를 나타내는 것으로 이해되어야 한다. 이처럼, 용어 "하나의" (또는 "한"), "하나 이상의," 및 "적어도 하나의"는 본원에서 상호교환가능하게 사용될 수 있다.
본원에 사용된 바와 같은 용어 "폴리펩티드"는 단수의 "폴리펩티드" 뿐만 아니라 다수의 "폴리펩티드"를 포함하려는 것이며, 아미드 결합 (펩티드 결합이라고도 공지됨)에 의해 선형으로 연결된 모노머 (아미노산)들로 이루어진 분자를 나타낸다. 용어 "폴리펩티드"는 둘 이상의 아미노산의 임의의 쇄 또는 쇄들을 나타내며, 생성물의 구체적인 길이를 나타내는 것은 아니다. 따라서, 펩티드, 디펩티드, 트리펩티드, 올리고펩티드, "단백질," "아미노산 쇄", 또는 둘 이상의 아미노산의 쇄 또는 쇄들을 나타내기 위해 사용된 임의의 다른 용어는 "폴리펩티드"의 정의 내에 포함되며, 용어 "폴리펩티드"는 임의의 이들 용어 대신에, 또는 상호교환가능하게 사용될 수 있다. 또한 용어 "폴리펩티드"는, 여기에 제한되지 않지만, 공지된 보호/차단기에 의한 글리코실화, 아세틸화, 인산화, 아미드화, 유도체화, 단백질분해성 절단, 또는 자연적으로 발생하지 않는 아미노산에 의한 변형을 비롯한 폴리펩티드의 발현 후 변형의 생성물을 나타내려는 것이다. 폴리펩티드는 천연 생물학적 공급원으로부터 유래되거나 또는 재조합 기술에 의해 제조될 수 있으나, 지정된 핵산 서열로부터 필수적으로 번역되는 것은 아니다. 이는 화학 합성에 의한 것을 비롯한 임의의 방식으로 생성될 수 있다.
"단리된 폴리펩티드" 또는 그의 단편, 변이체, 또는 유도체는 그의 자연 환경에서 존재하지 않는 폴리펩티드를 나타낸다. 특정 수준의 정제가 요구되진 않는다. 예를 들어, 단리된 폴리펩티드는 그의 천연 상태 또는 자연 환경으로부터 제거될 수 있다. 재조합적으로 제조된 폴리펩티드 및 숙주 세포에서 발현된 단백질은 본 발명의 목적을 위해 단리된 것으로 고려되는데, 이는 천연 상태이거나 또는 임의의 적합한 기술에 의해 분리, 분획, 또는 부분적으로 또는 상당히 정제된 재조합 폴리펩티드이다.
또한 본 발명의 폴리펩티드로 포함되는 것은 상기 폴리펩티드의 단편, 유도체, 유사체, 또는 변이체, 및 이들의 임의의 조합이다. 본 발명의 폴리펩티드를 지칭하는 경우, 용어 "단편", "변이체", "유도체" 및 "유사체"는 상응하는 천연 폴리펩티드의 생물학적, 항원적, 또는 면역적 특성을 일부 이상 보유하는 폴리펩티드를 포함한다. 본 발명의 폴리펩티드의 단편은 단백질 분해된 단편, 뿐만 아니라 결실 단편, 또한 본원에서 논의된 다른 특이적 단편을 포함한다. 본 발명의 폴리펩티드의 변이체는 상기 기재된 단편, 및 아미노산 치환, 결실, 또는 삽입으로 인해 변경된 아미노산 서열을 갖는 폴리펩티드를 또한 포함한다. 변이체는 자연적으로 발생하거나 또는 자연적으로 발생하지 않을 수 있다. 자연적으로 발생하지 않는 변이체는 당업계에 공지된 돌연변이유발 기술을 이용하여 제조될 수 있다. 변이체 폴리펩티드는 보존적 또는 비-보존적 아미노산 치환, 결실 또는 첨가를 포함할 수 있다. 본 발명의 폴리펩티드의 유도체는 천연 폴리펩티드 상에서 발견되지 않는 추가적 특징을 나타내도록 하기 위해 변경된 폴리펩티드를 포함한다. 변이체 폴리펩티드는 또한 "폴리펩티드 유사체"로 본원에서 지칭될 수 있다. 본원에서 사용된 폴리펩티드의 "유도체"는 측면 작용기의 반응에 의해 화학적으로 유도화된 하나 이상의 잔기를 갖는 대상 폴리펩티드를 나타낸다. 또한 "유도체"로 포함되는 것은 20개의 표준 아미노산 중 하나 이상의 자연적으로 발생하는 아미노산 유도체를 함유하는 펩티드이다. 예를 들어, 4-히드록시프롤린은 프롤린으로 치환될 수 있고, 5-히드록시리신은 리신으로 치환될 수 있고, 3-메틸히스티딘은 히스티딘으로 치환될 수 있고, 호모세린은 세린으로 치환될 수 있으며, 오르니틴은 리신으로 치환될 수 있다.
"참고 아미노산 서열"은 임의의 아미노산 치환의 도입 없이 특정된 서열을 의미한다. 당업자에게 통용되는 바와 같이, 치환이 없는 경우, 본 발명의 "단리된 폴리펩티드"는 참고 아미노산 서열과 동일한 아미노산 서열을 포함한다.
본원에 기재된 폴리펩티드는 다양한 변경, 예컨대 치환, 삽입 또는 결실을 가질 수 있다. 폴리펩티드에서 치환될 수 있는 예시적 아미노산은 염기성 측쇄 (예를 들어, 리신, 아르기닌, 히스티딘), 산성 측쇄 (예를 들어, 아스파르트산, 글루탐산), 하전되지 않은 극성 측쇄 (예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄 (예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지형 측쇄 (예를 들어, 트레오닌, 발린, 이소류신) 및 방향족 측쇄 (예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)를 갖는 아미노산을 포함한다.
본원에 기재된 폴리펩티드 및 참고 폴리펩티드와 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 폴리펩티드의 상응하는 단편이 또한 고려된다.
서열 동일성은 비교대상이 되는 부위가 최적으로 정렬된 두 서열을 비교하고, 두 서열 모두에서 나타나는 동일한 아미노산 잔기 또는 뉴클레오티드의 위치 수를 결정하여 매치되는 위치 수를 얻고, 매치되는 위치 수를 비교 대상 부위의 총 위치 수로 나누고 (즉, 윈도우 크기), 결과를 100으로 곱하여 서열 동일성의 백분율을 구함으로써 계산할 수 있다. 하나의 양태로서, 정렬을 극대화하기 위해 100개의 아미노산 또는 뉴클레오티드 길이에서 4개의 갭 (gap)이 도입될 수 있는 경우, 백분율 동일성은 비교할 서열에서 동일한 아미노산 잔기 또는 뉴클레오티드를 정렬한 두 서열보다 작은 서열에서의 아미노산 잔기 또는 뉴클레오티드의 백분율로 계산된다 (Dayhoff, in Atlas of Protein Sequence and Structure, Vol.5, p.124, National Biochemical Research Foundation, Washington, D.C. (1972), 본원에 참고로 포함됨). 동일성의 결정은 당업계에 공지된 컴퓨터 상동성 프로그램에 의해 전형적으로 이루어진다. 예시적 프로그램은 스미쓰 (Smith) 및 워터맨 (Waterman)의 알고리즘 (Adv. Appl. Math., 1981, 2: 482-489, 그의 전문이 본원에 참고로 포함됨)을 이용하는, 디폴트 셋팅을 이용한 갭 (Gap) 프로그램이다 (Wisconsin Sequence Analysis Package, Version 8 for UNIX, Genetics Computer Group, University Research Park, Madison, WI).
바람직하게는, 임의의 치환은 보존적 아미노산 치환이다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 대체된 것이다. 유사한 측쇄를 갖는 아미노산 잔기의 군은 당업계에 정의되어 있다. 이들 군에는 염기성 측쇄 (예를 들어, 리신, 아르기닌, 히스티딘), 산성 측쇄 (예를 들어, 아스파르트산, 글루탐산), 하전되지 않은 극성 측쇄 (예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄 (예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지형 측쇄 (예를 들어, 트레오닌, 발린, 이소류신) 및 방향성 측쇄 (예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)를 갖는 아미노산이 포함된다.
한 실시양태에서, 본 발명은, (i) 제1 숙주 세포를, 분비 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 이종 프로모터로 형질전환시키는 단계; (ⅱ) 상기 폴리펩티드의 천연 프로모터가 상기 분비 폴리펩티드를 인코딩하는 상기 폴리뉴클레오티드에 연결된 경우 분석된 상기 폴리펩티드의 분비 수준과 비교하여 상기 제1 숙주 세포로부터 상기 분비 폴리펩티드가 과분비되었는지를 결정하는 단계; (ⅲ) 제2 숙주 세포를, 목적 폴리펩티드를 인코딩하는 폴리뉴클레오티드 및 단계 (ⅱ)에서 과분비된 것으로 결정된 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드 작제물로 형질전환시키는 단계로서, 여기서 상기 목적 폴리펩티드 및 상기 과분비된 폴리펩티드가 임의의 순서로 융합된 것인 단계; (ⅳ) 상기 폴리뉴클레오티드 작제물이 융합 폴리펩티드를 발현하는 조건 하에 상기 제2 숙주 세포를 배양하는 단계; 및 (v) 상기 융합 폴리펩티드가 세포외 배양 배지로 분비되는지 여부를 결정하고; 이로써 상기 과분비된 폴리펩티드가 분비 융합 파트너인지를 확인하는 단계를 포함하는, 분비 융합 파트너 (SFP)를 확인하는 방법에 관한 것이다.
본 발명의 방법에서, SFP는 "시크리톰" 또는 "총 분비된 폴리펩티드"로부터 확인될 수 있다. 시크리톰은 세포외 배양 배지로 분비되고, 그로부터 수집한 폴리펩티드를 포함한다. 시크리톰은 박테리아, 균류 (예를 들어, 효모), 식물, 및 동물 (예를 들어, 포유류)을 비롯한 임의의 진핵 또는 원핵 유기체의 DNA에 의해 인코딩된다. 적합한 박테리아에는, 여기에 제한되지는 않지만, 에세리키아 (Escherichia) 및 바실러스 (Bacillus) 종이 포함된다. 적합한 효모에는, 여기에 제한되지는 않지만, 칸디다 (Candida), 데바리오미세스 (Debaryomyces), 한세눌라 (Hansenula), 클루이베로미세스 (Kluyveromyces), 피치아 (Pichia), 스키조사카로미세스 (Schizosaccharomyces), 야로위아 (Yarrowia), 사카로미세스 (Saccharomyces), 슈반니오미세스 (Schwanniomyces), 및 아르크술라 (Arxula) 종이 포함된다. 구체적 종의 예에는 칸디다 유틸리스 (Candida utilis), 칸디다 보이디니 (Candida boidinii), 칸디다 알비칸스 (Candida albicans), 클루이베로미세스 락티스 (Kluyveromyces lactis), 피치아 파스토리스 (Pichia pastoris), 피치아 스티피티스 (Pichia stipitis), 스키조사카로미세스 폼베 (Schizosaccharomyces pombe), 사카로미세스 세레비지애 (Saccharomyces cerevisiae), 한세눌라 폴리몰파 (Hansenula polymorpha), 야로위아 리포리티카 (Yarrowia lipolytica), 슈반니오미세스 옥시덴탈리스 (Schwanniomyces occidentalis), 및 아르크술라 아데니니보란스 (Arxula adeninivorans)가 포함된다. DNA 공급원으로서 제공될 수 있는 기타 균류에는, 여기에 제한되지는 않지만 아스퍼길루스 (Aspergillus), 페니실리움 (Penicillium), 리조푸스 (Rhizopus), 및 트리코더마 (Trichoderma) 종이 포함된다. DNA 공급원으로서 제공될 수 있는 식물에는, 여기에 제한되지는 않지만, 아라비돕시스, 옥수수, 담배, 및 감자가 포함된다. 적합한 동물에는, 여기에 제한되지는 않지만, 인간, 마우스, 래트, 토끼, 개, 고양이, 및 원숭이가 포함된다. 한 실시양태에서, 시크리톰은 효모, 박테리아, 식물 또는 동물로부터 유래될 수 있다.
고분비된 폴리펩티드를 선택하기 위한 시크리톰 분석은 당업계에서 입수가능한 기술을 이용하여 달성될 수 있다. 예를 들어, 배양 상등액을 농축시킴으로써 단리된 총 분비된 폴리펩티드는 2-D 겔 전기영동 및/또는 다차원 단백질 확인 기술 (Multidimensional Protein Identification Technology: 1-DE/MudPIT)을 이용하여 분석될 수 있다. 시크리톰으로부터의 폴리펩티드는 임의의 종류의 단백질 정제 칼럼, 예컨대 이온 교환 칼럼, 소수성 상호작용 칼럼, 겔 여과 칼럼, 친화성 칼럼, 및 역상 칼럼에 의해 분석될 수 있다.
한 실시양태에서, 정상 효모 세포 성장 동안 생성된 효모 총 분비된 폴리펩티드 (효모 시크리톰)를 분석하였다. 정상 세포 성장은 최소 배지 (예를 들어, 0.67% 아미노산이 없는 효모 질소 베이스, 0.5% 카자미노산 (casamino acid), 2% 글루코스 및 0.002% 우라실)에서 배양되는 세포를 의미한다. 글루코스 대신 상이한 탄소원, 예를 들어, 갈락토스, 크실로스, 프룩토스, 만노스, 수크로스, 라피노스, 및 셀로비오스를 포함할 수 있는 변경된 조건이 이용될 수 있다. 변경된 조건은 또한 배지의 임의의 성분, 예를 들어, 질소 또는 인산염의 수준을 제한하는 것을 포함한다.
용어 "고분비된"은 시크리톰으로부터 분비된 폴리펩티드의 수준이 상위 40%, 45%, 50%, 55%, 60%, 65%, 또는 70% 이상인 폴리펩티드를 나타낸다. 고분비된 폴리펩티드는 분비된 단백질의 수에 비례할 수 있는 단백질 수도 지수 (protein abundance index: PAI)에 의해 결정될 수 있다 (문헌 [Rappsilber et al., Genome Res. 12:1231-45 (2002)]). 고분비된 단백질의 예는 표 1에 제시되어 있다.
용어 "과분비된"은 폴리펩티드의 천연 프로모터로부터 발현되는 경우, 폴리펩티드의 분비 수준보다 적어도 5X, 6X, 7X, 8X, 9X 또는 1OX의 수준에서 숙주 세포로부터 폴리펩티드가 분비되는 것으로 정의된다. 고분비는 또한 야생형 단백질 분비 수준과 비교하여 고분비되는 폴리펩티드의 분비 수준을 비교함으로써 분석할 수 있다. 예를 들어, 야생형 효모 분비된 단백질은 정상 세포 성장 동안 분비 수준이 약 20 mg/L를 초과하지 않으나, 강력한 이종 프로모터와 연결된 경우, 이들 단백질 중 일부는 고분비되고, 분비 수준이 20 mg/L를 초과한다.
한 실시양태에서, 본 발명의 방법은 융합 폴리펩티드의 분비를 위한 SFP의 최적 크기를 결정하는 것을 추가로 포함한다. SFP의 최적 크기는 상기 SFP의 결실 분석에 의해 결정될 수 있으며, 여기서 SFP의 상이한 결실 작제물을 각각 함유하는 융합 폴리펩티드의 분비 수준을 비교한다. 일부 SFP는 초기에 확인된 SFP로 얻은 발현보다 융합 폴리펩티드의 훨씬 높은 발현을 가능하게 하는 최적 크기를 가질 수 있다. SFP의 최적 크기는, 차선적인 SFP에 융합된 경우의 목적 폴리펩티드의 분비 수준에 비해서 목적 폴리펩티드의 증가된 분비 수준을 가능하게 할 수 있다. SFP의 최적 크기는 목적 폴리펩티드 사이에서 다양할 수 있으며, SFP가 우선 확인되면 본원에 개시된 방법 또는 당업계에 공지된 방법을 이용하여 결정될 수 있다.
한 실시양태에서, 친수성 서열로 끝나는 SFP 결실 단편이 선택된다. 단백질의 친수성 도메인은 일반적으로 단백질의 표면 근처에 위치한다. 따라서, SFP 및 목적 폴리펩티드의 접합부는 두 폴리펩티드 사이에서 쉽게 노출될 수 있으며, 이는 프로테아제가 상기 접합부를 절단하는 것을 보다 용이하게 하여 목적 폴리펩티드를 시험관 내로 방출하도록 한다.
SFP에 대해 적용된 바와 같은 용어 "그의 단편"은 SFP의 아미노산 서열의 임의의 부분을 포함하는 폴리펩티드를 나타내며, 여기서 단편은 융합된 목적 폴리펩티드의 분비를 유도할 수 있는 능력을 실질적으로 보유한다.
본원에 사용된 용어 "융합된 목적 폴리펩티드의 분비를 유도할 수 있는 능력을 실질적으로 보유한다"는 것은 융합된 목적 폴리펩티드의 분비를 유도하는 모 SFP의 능력을 50% 이상 보유하는 SFP의 단편 또는 유도체를 나타낸다. 특정 실시양태에서, 융합된 목적 폴리펩티드의 분비를 유도하는 능력이 60, 65, 70, 75, 80, 85, 90, 또는 95% 이상 보유된다. 목적 폴리펩티드의 분비를 유도하는 능력은 당업계에 익히 공지된 통상적 기술 및 상기 기재된 기술에 의해 결정될 수 있다.
SFP에 적용된 용어 "그의 유도체"는 SFP의 아미노산 서열과 70% 이상 동일한 아미노산 서열로 이루어진 폴리펩티드를 나타내며, 여기서 폴리펩티드는 융합된 목적 폴리펩티드의 분비를 유도하는 능력을 실질적으로 보유한다. 특정 실시양태에서, 유도체는 SFP의 아미노산 서열과 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 유도체는 SFP의 아미노산 서열에 첨가, 결실, 치환, 또는 그의 조합을 포함할 수 있다. 유도체는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11-15, 16-20, 21-25, 26-30 첨가, 치환, 또는 결실을 갖는 돌연변이 폴리펩티드를 포함할 수 있다. 첨가 또는 치환은 또한 자연적으로 발생하지 않는 아미노산의 사용을 포함한다.
SFP의 유도체의 예에는, 여기에 제한되지는 않지만, 결실 돌연변이 (예를 들어, 단일방향성 결실), 기능성 서열의 첨가 (예를 들어, 글리코실화 부위, 제한 효소 부위), 및 SFP 내에서 확인된 프로-서열 또는 프리-서열의 결실 또는 첨가 (예를 들어, 스와핑)가 포함된다. 당업자는 통상적 돌연변이유발 기술, 예컨대 상기 언급된 참조문헌에 기재된 기술을 이용하여 SFP의 유도체 또는 SFP를 인코딩하는 핵산을 준비하고, 융합된 목적 폴리펩티드의 분비를 유도하는 능력을 실질적으로 보유하는 유도체를 확인할 수 있다.
한 실시양태에서, SFP 또는 그의 유도체 또는 단편은 본 발명의 방법에 의해 확인된다. 다른 실시양태에서, SFP를 인코딩하는 뉴클레오티드 서열은 BGL2 (서열번호 62), GAS3 (서열번호 63), GAS5 (서열번호 64), PST1 (서열번호 65), SCW4 (서열번호 66), SCW10 (서열번호 67), SIM1 (서열번호 68), UTH1 (서열번호 69), YGP1 (서열번호 70), YPS1 (서열번호 71), 및 ZPS1 (서열번호 72)로부터 선택된다. 또다른 실시양태에서, SFP는 BGL2 (서열번호 80), GAS3 (서열번호 81), GAS5 (서열번호 82), PST1 (서열번호 83), SCW4 (서열번호 84), SCW10 (서열번호 85), SIM1 (서열번호 86), UTH1 (서열번호 87), YGP1 (서열번호 88), YPS1 (서열번호 89), 및 ZPS1 (서열번호 90)로부터 선택된다.
본 발명의 방법은 높은 수준의 재조합 발현에 대한 바람이 존재하는 "목적 폴리펩티드" 또는 그의 유도체를 가지고 이용될 수 있다. 목적 폴리펩티드에 적용된 바와 같은 용어 "그의 유도체"는 목적 폴리펩티드의 아미노산 서열과 70% 이상 동일한 아미노산 서열로 이루어진 폴리펩티드를 나타내며, 여기서 폴리펩티드는 그의 생물학적 활성을 실질적으로 보유한다. 특정 실시양태에서, 유도체는 목적 폴리펩티드의 아미노산 서열과 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 유도체는 목적 폴리펩티드의 아미노산 서열에 첨가, 결실, 치환, 또는 그의 조합을 포함할 수 있다. 유도체는 목적 폴리펩티드의 아미노산 서열에 첨가, 결실, 치환, 또는 그의 조합을 포함할 수 있다. 유도체는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11-15, 16-20, 21-25, 26-30 첨가, 치환, 또는 결실을 갖는 변이체 폴리펩티드를 포함할 수 있다. 첨가 또는 치환은 또한 자연적으로 발생하지 않는 아미노산의 사용을 포함한다.
목적 단백질 또는 폴리펩티드의 유도체의 예에는, 여기에 제한되지는 않지만, 결실 돌연변이 (예를 들어, 단일방향성 결실), 기능성 서열의 첨가 (예를 들어, 글리코실화 부위, 제한 효소 부위), 및 목적 폴리펩티드 내에서 확인된 프로-서열 또는 프리-서열의 결실 또는 첨가 (예를 들어, 스와핑)가 포함된다. 당업자는 통상적 돌연변이유발 기술, 예컨대 상기 언급된 참조문헌에 기재된 기술을 이용하여 목적 폴리펩티드의 유도체 또는 목적 폴리펩티드를 인코딩하는 핵산을 준비할 수 있으며, 목적 폴리펩티드의 생물학적 활성을 실질적으로 보유하는 유도체를 확인할 수 있다.
목적 폴리펩티드가 SFP에 융합되는 경우, 목적 폴리펩티드 및 SFP는 동일한 자연적으로 발생하는 단백질의 폴리펩티드가 아니다. 목적 폴리펩티드는 학술 목적을 위해 연구되는 것이거나, 또는 상업적 목적, 예를 들어, 치료 또는 산업적 용도를 위해 제조되는 것일 수 있다. 목적 폴리펩티드는 임의의 식물, 동물, 또는 미생물로부터 얻을 수 있고, 자연적으로 발생하거나 핵산에 의해 인코딩될 수 있는 한 변형될 수 있다. 한 실시양태에서, 목적 폴리펩티드는 인간 단백질이다. 또다른 실시양태에서, 목적 폴리펩티드는 사이토카인, 혈청 단백질, 콜로니 자극 인자, 성장 인자, 호르몬, 또는 효소이다.
예를 들어, 목적 폴리펩티드는 인터루킨, 응집 인자, 인터페론-α, 인터페론-β, 인터페론-γ, 과립구-콜로니 자극 인자, 과립구 대식세포-콜로니 자극 인자, 조직 성장 인자, 상피 성장 인자, TGFα, TGFβ, 표피 성장 인자, 혈소판-유래 성장 인자, 섬유아세포 성장 인자, 여포 자극 호르몬, 갑상선 자극 호르몬, 항이뇨 호르몬, 색소분비 호르몬, 부갑상선 호르몬, 황체형성 호르몬-방출 호르몬, 탄수화물-특이적 효소, 단백질분해성 효소, 리파아제, 산화환원효소, 전달효소, 가수분해효소, 리아제, 이성질화효소, 리가아제, 면역글로불린, 사이토카인 수용체, 락토페린, 포스포리파아제 A2-활성화 단백질, 인슐린, 종양 괴사 인자, 칼시토닌, 칼시토닌 유전자 관련 펩티드, 엔케팔린, 소마토메딘, 에리스로포이에틴, 시상하부 방출 인자, 프로락틴, 융모막 성 생식선 자극호르몬, 조직 플라스미노겐 활성인자, 성장 호르몬 방출 펩티드, 흉선 체액성 인자, 항암 펩티드, 또는 항생제 펩티드로부터 선택될 수 있다. 구체적인 예에는, 여기에 제한되지는 않지만, 인간 인터루킨-2 (hIL-2), 엑센딘-3, 엑센딘-4 (EXD4), 글루카곤-유사-펩티드-1 (GLP-1), 부갑상선 호르몬 (PTH), 인간 인터루킨-1β, 인간 인터루킨-6, 인간 인터루킨-32α, 인간 인터루킨-32β, 인간 인터루킨-32γ, 인자 VII, 인자 VIII, 인자 IX, 인간 혈청 알부민, 인간 인터페론-α, 인간 인터페론-β, 인간 인터페론-γ, 인간 과립구-콜로니 자극 인자, 인간 과립구 대식세포-콜로니 자극 인자, 인간 성장 호르몬 (hGH), 인간 혈소판-유래 성장 인자, 인간 염기성 섬유아세포 성장 인자, 인간 표피 성장 인자 (EGF), 인간 인슐린-유사 성장 인자, 인간 신경 성장 인자, 인간 형질전환 성장 인자 β-1, 인간 여포 자극 호르몬, 글루코스 옥시다아제, 글루코다아제, 갈락토시다아제, 글루코세레브로시다아제, 글루쿠로니다아제, 아스파라기나아제, 아르기나아제, 아르기닌 데아미나아제, 퍼록시드 디스뮤타아제, 엔도톡시나아제, 카탈라아제, 키모트립신, 우리카아제, 아데노신 디포스파타아제, 티로시나아제, 빌리루빈 옥시다아제, 소 갈락토스-1-포스페이트 유리딜트랜스퍼라아제, 해파리 녹색 형광 단백질, 칸디다 안타르티카 (Candida antarctica) 리파아제 B, 칸디다 루고사 (Candida rugosa) 리파아제, 균류 클로로퍼옥시다아제, β-갈락토시다아제, 레솔바아제, α-갈락토시다아제, β-글루코시다아제, 트레할로오스 신타아제, 시클로덱스트린 글리코실 트랜스퍼라아제, 크실라나아제, 피타아제, 인간 락토페린, 인간 에리스로포이에틴, 인간 파라옥소나아제, 인간 성장 분화 인자 15, 인간 갈렉틴-3 결합 단백질, 인간 세린 프로테아제 억제제, 쿠니츠 유형 (Kunitz type) 2, 인간 야누스 (Janus) 키나아제 2, 인간 fms-유사 티로신 키나아제 3 리간드, 인간 YM1 & 2, 인간 CEMI, 인간 디아실글리세롤 아실트랜스퍼라아제, 인간 렙틴, 인간 mL259, 인간 프로테이나아제 3, 인간 라이소자임, 인간 데드 박스 (DEAD box) 단백질 41, 인간 에토포시드 도입 단백질 24 (human etoposide induced protein 24), 마우스 카스파아제 1, 소 앤지오제닌, 및 지렁이 룸브로키나아제가 포함된다.
한 실시양태에서, 목적 폴리펩티드는 통상적 재조합 생성 방법을 이용하여 제조하기 어려운 폴리펩티드, 즉, 전혀 생성되지 않거나 또는 낮은 수준으로만 생성되는 폴리펩티드이다. 또다른 실시양태에서, 목적 폴리펩티드는 공지된 발현계를 이용하여 용이하게 생성되지만, 보다 높은 수준의 발현을 달성하고자 하는 바람이 있다.
한 실시양태에서, 본 발명의 융합 폴리펩티드는 임의의 순서로 목적 폴리펩티드에 융합된, 분비 폴리펩티드를 포함하는 폴리펩티드를 나타낸다. 또다른 실시양태에서, 본 발명은 목적 폴리펩티드에 융합된 본 발명의 SFP를 포함하는, 단리된 융합 폴리펩티드에 관한 것이다.
본원에 사용된 바와 같은 용어 "융합된"은 재조합적으로 제조된 융합 폴리펩티드를 나타낸다. 한 실시양태에서, 융합 폴리펩티드는 목적 폴리펩티드에 융합된 분비 폴리펩티드를 포함하며, 여기서 분비 폴리펩티드 및 목적 폴리펩티드는 임의의 순서로 융합된다. 또다른 실시양태에서, SFP는 목적 폴리펩티드의 N-말단 또는 C-말단에서 융합된다. SFP 및 목적 폴리펩티드는 개입하는 아미노산, 예컨대 링커 DNA에 의해 인코딩된 아미노산과 함께 또는 그것 없이 융합될 수 있다. 특정 실시양태에서, SFP와 목적 폴리펩티드 사이의 거리는 0 내지 10; 0 내지 20; 0 내지 30; 0 내지 40; 또는 그 이상의 아미노산일 수 있다. 특정 실시양태에서, 융합 폴리펩티드는 프로테아제 인식 서열 및/또는 친화성 태그를 포함한다.
한 실시양태에서, 단리된 융합 폴리펩티드는 서열번호 1의 아미노산 176-213을 포함하는 친수성 (HL) 도메인을 포함하는 SFP 또는 그의 유도체, 및 목적 폴리펩티드를 포함한다. 한 실시양태에서, 변형된 HL 도메인은 서열번호 45에 의해 인코딩된다.
본 발명은 추가적으로 본 발명의 SFP를 사용하여 목적 폴리펩티드를 재조합적으로 생성하는 방법에 관한 것이다. 한 실시양태에서, 상기 방법은 SFP 또는 그의 유도체 또는 단편을 인코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 목적 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함하는 작제물을 준비하고, 숙주 세포를 상기 작제물로 형질전환시키고, 융합 폴리펩티드가 생성되고 숙주 세포로부터 분비되는 조건 하에 숙주 세포를 배양하고, 상기 목적 폴리펩티드로부터 상기 SFP를 분리하는 것을 포함한다.
목적 폴리펩티드는 당업계에 공지된 임의의 발현계를 이용하여 재조합적으로 생성될 수 있다. 바람직하게는, 목적 폴리펩티드는, 예를 들어, 박테리아, 효모, 또는 포유류 세포 배양물에서 재조합적으로 발현된다. 재조합 발현은 목적 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 포함하는 벡터를 준비하고, 벡터를 숙주 세포로 전달하고, 목적 폴리펩티드가 발현되는 조건 하에 숙주 세포를 배양하고, 목적 폴리펩티드를 분리하는 것을 포함할 수 있다. 재조합 벡터의 준비하고, 이를 이용하여 숙주 세포를 형질전환시키고, 숙주 세포에서 벡터를 복제하고, 생물학적으로 활성인 외부 폴리펩티드 및 단백질을 발현시키기 위한 방법 및 물질은 본원에서 논의되고, 문헌 [Sambrook et al., Molecular Cloning, 3rd edition, Cold Spring Harbor Laboratory, 2001] 및 [Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, New York 3rd edition, (2000)]에 기재되어 있으며, 이들은 각각 참고로 본원에 포함된다.
목적 폴리펩티드는 숙주 세포가 성장한 배지로부터, 당업계에 공지된 정제 방법, 예를 들어, 배지로부터의 침전법, 또는 면역친화성 크로마토그래피, 수용체 친화성 크로마토그래피, 소수성 상호작용 크로마토그래피, 렉틴 친화성 크로마토그래피, 크기 배재 여과, 양이온 또는 음이온 교환 크로마토그래피, 고압 액체 크로마토그래피 (HPLC), 역상 HPLC 등을 비롯한 통상적 크로마토그래피 방법에 의해 단리될 수 있다. 정제의 또 다른 방법은 원하는 폴리펩티드가 발현되고, 특이적 결합 파트너 또는 작용제에 의해 인식되는 특이적 친화성 펩티드, 태크, 라벨, 또는 킬레이팅 잔기를 갖는 융합 폴리펩티드로서 정제되는 방법을 포함한다. 정제된 폴리펩티드는 절단되어 원하는 폴리펩티드를 얻을 수 있거나, 또는 온전한 융합 폴리펩티드로서 남아있을 수 있다. 친화성 태그 성분의 절단은 절단 과정의 결과로서 추가적 아미노산 잔기를 갖는 원하는 폴리펩티드의 형태를 생성할 수 있다. 한 실시양태에서, 친화성 태그는 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, S-태그, 또는 그의 임의의 조합이다.
본 발명의 목적 폴리펩티드는 분비 융합 파트너와의 융합 형태로 세포외 생성될 수 있고, 시험관내 프로테아제 처리에 의해 SFP로부터 분리될 수 있다. 단리 절차가 이용된 후에 단리된 목적 폴리펩티드가 생물학적으로 활성이 아닌 경우, "리폴딩 (refolding)" 또는 폴리펩티드의 그의 3차 구조로의 전환 및 이황화 결합의 생성을 위한 다양한 방법이 생물학적 활성을 회복시키기 위해 사용될 수 있다. 당업자에게 공지된 방법은 가용화된 폴리펩티드의 pH를 일반적으로 pH 7 초과로 조정하거나, 특정 농도의 카오트로프 (chaotrope)의 존재 하에 두는 것을 포함한다. 카오트로프의 선택은 봉입체 (inclusion body) 가용화를 위해 이용된 선택과 매우 유사하나 일반적으로 보다 낮은 농도에서 이루어지고, 필수적으로 가용화를 위해 사용된 바와 같은 동일한 카오트로프일 필요는 없다. 단백질의 시스테인 다리(들)를 형성시킬 이황화 셔플링을 일으키는 특정 산화환원 전위를 생성하기 위해 환원제, 또는 환원제에 특정 비율로 그의 산화된 형태를 더한 것을 사용하는 것이 요구될 수 있다. 몇 가지의 통상적으로 사용되는 산화환원 커플에는 시스테인/시스타민, 글루타티온 (GSH)/디티오비스 GSH, 염화제2구리, 디티오트레이톨 (DTT)/디티안 DTT, 2-머캅토에탄올 (bME)/디티오-b(ME)가 포함된다. 리폴딩의 효율을 증가시키기 위해, 글리세롤, 다양한 분자량의 폴리에틸렌 글리콜, 및 아르기닌과 같은 공용매를 사용하는 것이 필요할 수 있다.
용어 "폴리뉴클레오티드"는 단수형 핵산뿐만 아니라 복수형 핵산도 포함하는 것으로, 단리된 핵산 분자 또는 작제물, 예를 들어, 메신저 RNA (mRNA), 바이러스-유래 RNA, 또는 플라스미드 DNA (pDNA)를 나타낸다. 폴리뉴클레오티드는 통상적 인산디에스테르 결합 또는 비-통상적 결합 (예를 들어, 아미드 결합, 예컨대 펩티드 핵산 (PNA)에서 발견됨)을 포함할 수 있다. 용어 "핵산"은 폴리뉴클레오티드에 존재하는 임의의 하나 이상의 핵산 절편, 예를 들어, DNA 또는 RNA 단편을 나타낸다. "단리된" 핵산 또는 폴리뉴클레오티드는 그의 자연 환경 상태로부터 제거된 핵산 분자, DNA 또는 RNA를 나타낸다. 예를 들어, 벡터에 함유된 치료적 폴리펩티드를 인코딩하는 재조합 폴리뉴클레오티드는 본 발명의 목적을 위해 단리될 것이 고려된다. 단리된 폴리뉴클레오티드의 추가적 예에는 이종 숙주 세포에 남아있는 재조합 폴리뉴클레오티드 또는 용액 중의 (부분적으로 또는 상당히) 정제된 폴리뉴클레오티드가 포함된다. 단리된 RNA 분자는 본 발명의 생체내 또는 시험관내 RNA 전사체, 뿐만 아니라 본원에 개시된 페스티바이러스 벡터의 양성 및 음성 가닥 형태, 및 이중 가닥 형태를 포함한다.
본 발명에 따른 단리된 폴리뉴클레오티드 또는 핵산은 합성적으로 생성된 그러한 분자를 추가적으로 포함한다. 또한, 폴리뉴클레오티드 또는 핵산은 조절 요소, 예컨대 프로모터, 리보솜 결합 부위, 또는 전사 터미네이터일 수 있거나, 또는 이들을 포함할 수 있다.
본원에 사용된 바와 같은 "코딩 영역"은 아미노산으로 번역되는 코돈으로 이루어진 핵산의 일부이다. 비록 "정지 코돈" (TAG, TGA, 또는 TAA)이 아미노산으로 번역되지 않더라도, 이는 코딩 영역의 일부로 고려될 수 있으나, 존재하는 경우, 임의의 측면 서열, 예를 들어 프로모터, 리보솜 결합 부위, 전사 터미네이터, 인트론, 5' 및 3' 비-번역 영역 등은 코딩 영역의 일부가 아니다. 본 발명의 둘 이상의 코딩 영역은 단일 폴리뉴클레오티드 작제물에, 예를 들어, 단일 벡터 상에, 또는 분리 폴리뉴클레오티드 작제물에, 예를 들어, 분리 (상이한) 벡터 상에 존재할 수 있다. 또한, 임의의 벡터는 단일 코딩 영역을 함유할 수 있거나, 또는 둘 이상의 코딩 영역을 포함할 수 있으며, 예를 들어, 본 발명의 벡터는 단백질분해성 절단을 통해 최종 폴리펩티드로 번역 후 또는 번역과 동시에 분리되는 하나 이상의 폴리펩티드를 인코딩할 수 있다. 게다가, 본 발명의 벡터, 폴리뉴클레오티드, 또는 핵산은 본 발명의 폴리펩티드를 인코딩하는 제1 또는 제2 핵산, 또는 그의 변이체 또는 유도체에 융합되거나 또는 융합되지 않은 이종 코딩 영역을 인코딩할 수 있다. 이종 코딩 영역은 제한 없이, 세분화된 요소 또는 모티프, 예컨대 분비 신호 펩티드 또는 이종 기능성 도메인을 포함한다.
특정 실시양태에서, 폴리뉴클레오티드 또는 핵산은 DNA이다. DNA의 경우, 정상적으로 폴리펩티드를 인코딩하는 핵산을 포함하는 폴리뉴클레오티드는 하나 이상의 코딩 영역과 작동가능하게 연결된 프로모터 및/또는 다른 전사 또는 번역 제어 요소를 포함할 수 있다. 작동가능한 연결은 유전자 생성물, 예를 들어, 폴리펩티드에 대한 코딩 영역이 하나 이상의 조절 서열에 연결되고, 그러한 방식으로 조절 서열(들)의 영향 또는 제어 하에 유전자 생성물의 발현이 일어나도록 하는 경우이다. 2개의 DNA 단편 (예컨대, 폴리펩티드 코딩 영역 및 거기에 연결된 프로모터)은, 프로모터 기능의 도입이 원하는 유전자 생성물을 인코딩하는 mRNA의 전사를 초래하는 경우, 및 2개의 DNA 단편 사이에 연결의 특성이 유전자 생성물의 발현을 지시하기 위한 발현 조절 서열의 능력을 방해하지 않거나, 또는 전사될 DNA 주형의 능력을 방해하지 않는 경우에 "작동가능하게 연결"된 것이다. 따라서, 프로모터가 그 핵산의 전사에 작용할 수 있는 경우, 프로모터 영역은 폴리펩티드를 인코딩하는 핵산과 작동가능하게 연결된 것이다. 프로모터는 미리 결정된 세포에서만 DNA의 실질적인 전사를 지시하는 세포-특이적 프로모터일 수 있다. 프로모터 외에 다른 전사 제어 요소, 예를 들어 인핸서, 오퍼레이터, 리프레서, 및 전사 종결 신호가 폴리뉴클레오티드와 작동가능하게 연결되어 세포-특이적 전사를 지시할 수 있다. 적절한 프로모터 및 다른 전사 제어 영역은 본원에 개시되어 있다.
다양한 전사 제어 영역이 당업자에게 공지되어 있다. 이들은 제한 없이, 척추동물 세포에서 작용하는 전사 제어 영역, 예컨대, 여기에 제한되지는 않지만, 사이토메갈로바이러스 (예를 들어, 즉시 초기 (immediate early) 프로모터, 인트론-A와 함께), 유인원 바이러스 40 (예를 들어, 초기 프로모터), 및 레트로바이러스 (예컨대, 예를 들어, 라우스 육종 바이러스)로부터의 프로모터 및 인핸서 절편을 포함한다. 다른 전사 제어 영역은 척추동물 유전자로부터 유래된 것, 예컨대 액틴, 열 충격 단백질, 소 성장 호르몬 및 토끼 β-글로빈, 뿐만 아니라 진핵 세포에서 유전자 발현을 제어할 수 있는 다른 서열을 포함한다. 추가적인 적절한 전사 제어 영역은 조직-특이적 프로모터 및 인핸서 뿐만 아니라 림포카인-유도성 프로모터 (예를 들어, 인터페론 또는 인터루킨에 의해 유도가능한 프로모터)를 포함한다.
유사하게는, 다양한 번역 제어 요소가 당업자에게 공지되어 있다. 이들은, 여기에 제한되지는 않지만, 리보솜 결합 부위, 번역 개시 및 종결 코돈, 및 바이러스계로부터 유래한 요소 (특히 내부 리보솜 엔트리 부위, 또는 IRES, CITE 서열로도 지칭함)를 포함한다.
본 발명의 폴리뉴클레오티드는 RNA, 예를 들어, 메신저 RNA (mRNA)의 형태를 포함할 수 있다. 본 발명의 RNA는 단일 가닥 또는 이중 가닥일 수 있다.
본 발명의 폴리뉴클레오티드 및 핵산 코딩 영역은 본 발명의 폴리뉴클레오티드에 의해 인코딩되는 폴리펩티드의 분비를 지시하는 분비 또는 신호 펩티드를 인코딩하는 추가적 코딩 영역과 연결될 수 있다. 신호 가설에 따라 성장하는 단백질 쇄가 조면 소포체를 거쳐 나오기 시작하면, 포유류 세포에 의해 분비된 단백질은 성숙 단백질로부터 절단되는 신호 펩티드 또는 분비 리더 서열을 갖는다. 당업자는 척추동물 세포에 의해 분비된 폴리펩티드가 폴리펩티드의 N-말단에 융합된 신호 펩티드를 일반적으로 가지고 있고, 이는 폴리펩티드의 분비된 또는 "성숙된" 형태를 생성하기 위해 완전한 또는 "전장" 폴리펩티드로부터 절단된다는 것을 인지할 것이다. 특정 실시양태에서, 천연 신호 펩티드, 예를 들어, 면역글로불린 중쇄 또는 경쇄 신호 펩티드, 또는 그에 작동가능하게 연결된 폴리펩티드의 분비를 지시하는 능력을 보유하는 그 서열의 기능성 유도체가 사용된다. 별법으로는, 이종 포유류 신호 펩티드, 또는 그의 기능성 유도체가 사용될 수 있다. 예를 들어, 야생형 리더 서열은 인간 조직 플라스미노겐 활성화인자 (TPA) 또는 마우스 β-글루쿠로니다아제의 리더 서열로 치환될 수 있다.
용어 "작제물"은 자연적으로 발생하지 않는 핵산 분자를 나타낸다. 작제물은 융합 폴리펩티드를 인코딩하는 폴리뉴클레오티드이다. 한 실시양태에서, 작제물은 SFP 또는 후보자 SFP 및 목적 폴리펩티드를 포함하는 융합 폴리펩티드를 인코딩한다. 작제물은 원형 또는 선형 벡터를 추가적 포함할 수 있고, 예를 들어 상동 재조합에 의해 다른 폴리뉴클레오티드와 조합될 수 있다.
본원에 사용된 용어 "벡터"는 그가 연결된 또다른 핵산을 수송할 수 있는 핵산 분자를 나타낸다. 벡터의 한 유형은 "플라스미드"이며, 이는 추가적 DNA 절편이 라이게이션될 수 있는 원형 이중 가닥 DNA 루프를 나타낸다. 다른 유형의 벡터는 바이러스 벡터이며, 여기서 추가적 DNA 절편은 바이러스 게놈으로 라이게이션될 수 있다. 특정 벡터는 이들이 도입된 숙주 세포에서 자율적 복제가 가능하다 (예를 들어, 박테리아 복제 기점을 갖는 박테리아 벡터 및 에피솜 포유류 벡터). 다른 벡터 (예를 들어, 비-에피솜 포유류 벡터)는 숙주 세포로 도입되어 숙주 세포의 게놈으로 통합됨으로써, 숙주 게놈과 함께 복제된다. 본 발명의 벡터는 작동적으로 연결된 목적 폴리펩티드를 인코딩하는 유전자의 발현을 지시할 수 있다. 그러한 벡터는 본원에서 "발현 벡터"로 지칭한다. 일반적으로, 재조합 DNA 기술에서 유용한 발현 벡터는 종종 플라스미드의 형태이다. 본원에서, "플라스미드" 및 "벡터"는 상호교환적으로 사용되는데, 플라스미드는 벡터의 가장 통상적으로 사용되는 형태이기 때문이다. 그러나, 본 발명은 동등한 기능을 하는 그러한 다른 형태의 발현 벡터, 예컨대 바이러스 (예를 들어, 복제 결함 레트로바이러스, 아데노바이러스 및 아데노-관련 바이러스) 벡터를 포함한다.
벡터 DNA는 통상적 형질전환 또는 형질감염 기술을 통해 원핵 또는 진핵 세포로 도입될 수 있다. 본원에 사용된 바와 같은 용어 "형질전환" 및 "형질감염"은 인산칼슘 또는 염화칼슘 공동-침전법, DEAE-덱스트란-매개 형질감염, 리포펙션, 또는 전기천공법을 비롯한 외부 핵산 (예를 들어, DNA)을 숙주 세포로 도입하기 위한 다양한 당업계-인지된 기술을 나타낸다. 숙주 세포를 형질전환시키거나 또는 형질감염시키기 위한 적절한 방법은 문헌 [Sambrook, et al. MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989], 및 다른 실험 매뉴얼에서 찾아볼 수 있다.
포유류 세포의 안정한 형질감염을 위해, 이용된 발현 벡터 및 형질감염 기술에 따라 달라지는데, 세포의 작은 분획만이 외부 DNA를 그의 게놈으로 통합시킬 수 있다는 것이 공지되어 있다. 이들 통합체를 확인 및 선택하기 위해, 선택가능한 마커 (예를 들어, 항생제 내성)를 인코딩하는 유전자가 관심있는 유전자와 함께 숙주 세포로 일반적으로 도입된다. 다양한 선택가능한 마커는 약물에 내성을 부여하는 것들, 예컨대 G418, 히그로마이신 및 메토트렉세이트를 포함한다. 선택가능한 마커를 인코딩하는 핵산은 목적 폴리펩티드를 인코딩하는 것과 동일한 벡터 상에서 숙주 세포로 도입될 수 있거나, 또는 분리 벡터 상에서 도입될 수 있다. 도입된 핵산으로 안정하게 형질감염된 세포는 약물 선택, 영양요구성 마커 선택, 배지 조성, 탄소원 선택, 또는 당업계에 공지된 다른 방법 (예를 들어, 다른 세포는 죽는 한편, 선택가능한 마커 유전자를 통합한 세포는 생존할 것임)에 의해 확인될 수 있다.
한 실시양태에서, 본 발명의 방법에서 사용된 폴리펩티드 또는 그의 단편 또는 유도체를 인코딩하는 뉴클레오티드 서열은 5' 말단 및 3' 말단에서 본 발명의 선형 벡터로 생체내 상동 재조합을 위해 사용되는 DNA를 추가적으로 포함할 수 있다. 5' 말단 및 3' 말단 DNA는 충분한 상동적 서열을 제공하여, 이들이 숙주 세포로 공동-형질전환되는 경우, 폴리펩티드 또는 그의 단편 또는 유도체를 인코딩하는 뉴클레오티드 서열 및 선형 벡터 사이에 생체내 재조합이 가능하게 한다. 한 실시양태에서, 5' 말단 및 3' 말단 DNA 각각은 선형 벡터의 서열과 중복되는 20개 이상의 염기 쌍, 예를 들어, 30 또는 40개 이상의 염기 쌍을 포함한다. 5' 및 3' DNA의 첨가는 통상적 재조합 DNA 기술, 예를 들어, PCR 및/또는 제한 효소 절단 및 라이게이션을 이용하여 수행될 수 있다.
본 발명의 폴리뉴클레오티드는 친화성 태그, 예를 들어, GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, 또는 S-태그를 추가로 인코딩할 수 있다. 친화성 태그는 링커 DNA에 의해 인코딩될 수 있거나, 또는 본 발명의 폴리뉴클레오티드의 또다른 부분, 예컨대 융합 단백질을 인코딩하는 영역의 5' 또는 3' 부분에 의해 인코딩될 수 있다.
본 발명의 폴리뉴클레오티드는 링커 DNA를 추가로 포함할 수 있다. 한 실시양태에서, 링커 DNA는 링커 펩티드를 인코딩한다.
본 발명의 링커 DNA는 충분한 길이일 수 있으며, 선형 벡터의 뉴클레오티드 서열의 일부에 대해 충분한 서열 동일성을 가져서, 이들이 숙주 세포로 공동-형질전환되는 경우, 폴리펩티드-인코딩 뉴클레오티드 서열 및 선형 벡터 사이에 생체내 재조합을 가능하게 한다. 한 실시양태에서, 링커 DNA는 20개 이상의 염기쌍 길이, 예를 들어, 30 또는 40개 이상의 염기쌍 길이이다. 추가적 실시양태에서, 링커 DNA는 선형 벡터 상에서 상응하는 서열과 80% 이상, 예를 들어 85%, 90%, 95%, 또는 99% 이상 동일하다.
한 실시양태에서, 링커 DNA는 프로테아제 인식 서열을 인코딩함으로써 SFP 및 목적 폴리펩티드의 접합부에서 절단되도록 한다. 예를 들어, 링커 DNA는 효모 kex2p- 또는 Kex2-유사 프로테아제 인식 서열 (예를 들어, Lys-Arg, Arg-Arg, 또는 Leu-Asp-Lys-Arg을 포함하는 아미노산 서열 (서열번호 74)), 포유류 푸린 (furin)-인식 서열 (예를 들어, Arg-X-X-Arg을 포함하는 아미노산 서열), 인자 Xa-인식 서열 (예를 들어, Ile-Glu-Gly-Arg을 포함하는 아미노산 서열 (서열번호 75)), 엔테로키나아제-인식 서열 (예를 들어, Asp-Asp-Lys을 포함하는 아미노산 서열), 서브틸리신-인식 서열 (예를 들어, Ala-Ala-His-Tyr을 포함하는 아미노산 서열 (서열번호 76)), 담배 식각 바이러스 프로테아제-인식 서열 (예를 들어, Glu-Asn-Leu-Tyr-Phe-Gln-Gly을 포함하는 아미노산 서열 (서열번호 77)), 유비퀴틴 가수분해효소-인식 서열 (예를 들어, Arg-Gly-Gly을 포함하는 아미노산 서열) 또는 트롬빈-인식 서열 (예를 들어, Arg-Gly-Pro-Arg을 포함하는 아미노산 서열 (서열번호 78))을 인코딩할 수 있다.
링커의 프로테아제 부위 내에서 또는 분비 폴리펩티드 또는 목적 폴리펩티드 내에서, 내재적 숙주 프로테아제에 의한 융합 폴리펩티드의 원치 않는 절단을 피하는 것이 바람직하다. 이와 유사하게, 목적 폴리펩티드 또는 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 내에서 목적 폴리펩티드로부터 분비된 폴리펩티드를 절단하기 위해 사용되는 프로테아제에 의한 절단을 피하는 것이 바람직하다. 따라서, 프로테아제 인식 서열을 인코딩하는 링커 DNA가 융합 폴리펩티드를 인코딩하는 폴리뉴클레오티드의 부분으로서 숙주 세포로 형질전환되는 경우, 숙주 세포는 바람직하게는 링커에서 프로테아제 서열을 인지하는 프로테아제를 발현하지 않는다. 숙주 세포는 프로테아제를 자연적으로 발현하지 않을 수 있거나, 또는 숙주 세포는 프로테아제를 발현하지 않도록 변형될 수 있다 (예를 들어, kex2 돌연변이 숙주 세포, kex2-유사 프로테아제 돌연변이 숙주 세포, 및 푸린 돌연변이 숙주 세포). 융합 폴리펩티드가 분비 폴리펩티드 및 목적 폴리펩티드를 포함하는 경우, 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 및/또는 목적 폴리펩티드는 숙주 프로테아제 인식 서열을 자연적으로 포함하지 않을 수 있거나, 또는 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 및/또는 목적 폴리펩티드는 숙주 프로테아제에 의해 인식되는 서열을 함유하지 않도록 변형될 수 있다. 융합 폴리펩티드가 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체, 목적 폴리펩티드, 및 프로테아제 인식 서열을 포함하는 펩티드 링커를 포함하는 경우, 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 및/또는 목적 폴리펩티드는 프로테아제 인식 서열을 자연적으로 포함하지 않을 수 있거나, 또는 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 및/또는 목적 폴리펩티드는 펩티드 링커의 프로테아제 인식 서열을 인식하는 프로테아제에 의해 인식되는 서열을 함유하지 않도록 변형될 수 있다.
또다른 실시양태에서, 링커 DNA는 친화성 태그, 예를 들어, GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, 또는 S-태그를 인코딩한다.
추가적 실시양태에서, 링커 DNA는 제한 효소 인식 부위 및 프로테아제 인식 서열 (예를 들어, kex2p-유사 프로테아제- 또는 kex- 2p-인식 서열)을 인코딩한다.
원핵생물에서 폴리펩티드의 발현은 목적 폴리펩티드-리포터 폴리펩티드 융합의 발현을 지시하는 구성적 또는 유도성 프로모터를 함유하는 벡터로 수행될 수 있다. 적합한 E. 콜라이 발현 벡터의 예에는 pTrc (Amrann et al., Gene 69:301-315 (1988)) 및 pET (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89)가 포함된다.
효모 세포에서의 발현을 위해, 적절한 효모 발현 벡터에는, 여기에 제한되지는 않지만, pYepSec1 (Baldari et al., EMBO J. 6:229-234 (1987)), pMFa (Kurjan et al., Cell 30:933-943 (1982)), pJRY88 (Schultz et al., Gene 54:113-123 (1987)), pYES2 (인비트로겐 코포레이션: Invitrogen Corporation, San Diego, Calif.), 및 picZ (인비트로겐 코포레이션)가 포함된다.
곤충 세포에서의 발현을 위해, 배큘로바이러스 발현 벡터가 사용될 수 있다. 배양된 곤충 세포 (예를 들어, SF9 세포)에서 폴리펩티드의 발현에 이용가능한 배큘로바이러스 벡터에는 pAc 시리즈 (Smith et al., Mol. Cell. Biol. 3:2156-2165 (1983)) 및 pVL 시리즈 (Lucklow et al., Virology 170:31-39 (1989))가 포함된다.
또다른 실시양태에서, 숙주 세포는 포유류 세포이고, 벡터는 포유류 발현 벡터이다. 포유류 발현 벡터의 예에는 pCDM8 (문헌 [Seed, Nature 329:840 (1987)]) 및 pMT2PC (문헌 [Kaufman et al., EMBO J. 6: 187-195 (1987)])이 포함된다. 포유류 세포에서 사용되는 경우, 발현 벡터의 제어 기능은 바이러스 조절 요소에 의해 종종 제공된다. 예를 들어, 흔히 사용되는 프로모터는 폴리오마, 아데노바이러스 2, 사이토메갈로바이러스 및 유인원 바이러스 40으로부터 유래된다. 원핵세포 및 진핵세포 둘 다에 적절한 다른 발현계에 대해서는, 예를 들어, 문헌 [Chapters 16 and 17 of Sambrook et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989]을 참조한다.
바람직한 벡터에는, 여기에 제한되지는 않지만, 플라스미드, 파지, 코스미드, 에피솜, 바이러스 입자 또는 바이러스, 및 통합가능한 DNA 단편 (즉, 상동적 재조합에 의해 숙주 게놈으로 통합가능한 단편)이 포함된다. 바람직한 바이러스 입자에는, 여기에 제한되지는 않지만, 아데노바이러스, 배큘로바이러스, 파르보바이러스, 헤르페스바이러스, 폭스바이러스, 아데노연관 바이러스, 셈리키 포레스트 (Semliki Forest) 바이러스, 백시니아 바이러스, 및 레트로바이러스가 포함된다. 바람직한 발현 벡터에는, 여기에 제한되지는 않지만, pcDNA3 (인비트로겐) 및 pSVL (Pharmacia Biotech)이 포함된다. 다른 발현 벡터에는, 여기에 제한되지는 않지만, pSPORTTM 벡터, pGEMTM 벡터 (프로메가: Promega), pPROEX벡터TM (LTI, Bethesda, MD), 블루스크립트 (Bluescript)TM 벡터 (스트라타젠: Stratagene), pQETM 벡터 (퀴아젠: Qiagen), pSE420TM (인비트로겐), 및 pYES2TM (인비트로겐)이 포함된다.
한 실시양태에서, 발현 벡터는 목적 폴리펩티드를 인코딩하는 DNA 서열이 작동가능하게 연결되거나, 또는 적합한 숙주에서 목적 폴리펩티드의 발현을 작용하게 할 수 있는 적절한 제어 서열에 연결된 복제가능한 DNA 작제물이다. DNA 영역은 이들이 서로 기능적으로 연관된 경우, 작동가능하게 연결되거나 또는 이어져있다. 예를 들어, 프로모터는 서열의 전사를 제어하는 경우에 코딩 서열에 작동가능하게 연결되거나 또는 이어져있다. 벡터의 증폭은 발현 제어 도메인을 요구하지 않지만, 일반적으로 복제 기점에 의해 부여된 숙주에서의 복제 능력, 및 형질전환체의 인식을 촉진하기 위한 유전자 선택 능력만이 요구된다. 발현 벡터에서 제어 서열에 대한 요건은 선택된 숙주 및 선택된 형질전환 방법에 따라 달라질 것이다. 일반적으로, 제어 서열에는, 여기에 제한되지는 않지만 전사 프로모터, 인핸서, 전사를 제어하기 위한 선택적 아퍼레이터 서열, 폴리아데닐화 신호, 적절한 mRNA 리보솜 결합을 인코딩하는 서열, 및 전사 및 번역의 종결을 제어하는 서열이 포함된다. 그러한 조절 서열은, 예를 들어, 문헌 [Goeddel; GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990)]에 기재되어 있다. 조절 서열은, 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 지시하는 서열, 및 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 지시하는 서열 (예를 들어, 조직-특이적 조절 서열)을 포함한다. 당업자는 발현 벡터의 고안이 형질전환될 숙주 세포의 선택, 원하는 폴리펩티드의 발현 수준 등과 같은 인자에 따라 달라질 수 있음을 인지할 것이다.
본 발명의 발현 벡터는 숙주 세포로 도입됨으로써 본원에 기재된 바와 같은 핵산에 의해 인코딩되는 융합 단백질 또는 펩티드를 비롯한 단백질 또는 펩티드를 생성할 수 있다. 바람직한 벡터는 숙주 유기체에 의해 인식되는 프로모터를 함유한다.
한 실시양태에서, 본 발명의 프로모터는 외부 폴리펩티드의 재조합 생성을 위해 사용되는 강력한 이종 프로모터이다. 이종 프로모터는 유도성일 수 있거나, 또는 구성적일 수 있다. 바람직한 이종 프로모터는 단백질의 상업적 생성을 위해 사용되는 것들, 예컨대 하기 기재된 것들이다. 본 발명의 이종 프로모터는 천연 또는 야생형 SFP 프로모터로부터 구별가능하다.
본 발명의 프로모터 서열은 원핵생물, 진핵생물 또는 바이러스 유래일 수 있다. 적절한 원핵생물 서열의 예에는 박테리오파지 람다의 PR 및 PL 프로모터 (The bacteriophage Lambda, Hershey, A. D., Ed., Cold Spring Harbor Press, Cold Spring Harbor, NY (1973), 그 전문이 본원에 참고로 포함됨; Lambda II, Hendrix, R. W., Ed., Cold Spring Harbor Press, Cold Spring Harbor, NY (1980), 그 전문이 본원에 참고로 포함됨); 이. 콜라이의 trp, recA, 열 충격, 및 lacZ 프로모터 및 SV40 초기 프로모터 (Benoist et al., Nature, 290:304-310 (1981), 그 전문이 본원에 참고로 포함됨)가 포함된다. 효모에 대해서는, 적절한 프로모터의 예에는, 여기에 제한되지는 않지만 GAPDH, PGK, ADH, PHO5, TEF, GAL1, 및 GAL10이 포함된다. 추가적 프로모터에는, 여기에 제한되지는 않지만, 마우스 유선 종양 바이러스, 인간 면역결핍 바이러스의 긴 말단 반복, 말로니 바이러스, 사이토메갈로바이러스 즉시 초기 프로모터, 엡스테인 바르 (Epstein Barr) 바이러스, 라우스 육종 바이러스, 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴, 및 인간 메탈로티오네인이 포함된다.
추가적 조절 서열이 또한 바람직한 벡터에 포함될 수 있다. 적절한 조절 서열의 예는 파지 MS-2의 레플리카아제 유전자 및 박테리오파지 람다의 유전자 cII의 샤인-달가노 (Shine-Dalgarno) 서열에 의해 나타낸다.
게다가, 적절한 발현 벡터는 형질전환된 숙주 세포의 스크리닝을 가능하게 하는 적합한 마커를 포함할 수 있다. 선택된 숙주의 형질전환은 당업자에게 익히 공지된 다양한 기술 중 임의의 하나를 이용하여 수행되고, 삼브룩 등 (Sambrook et al.)의 상기 문헌에 기재되어 있다.
복제 기점은 또한 벡터의 작제에 의해 외인성 기점을 포함하도록 제공될 수 있거나, 또는 숙주 세포 염색체 복제 기작에 의해 제공될 수 있다. 벡터가 숙주 세포 염색체로 통합되는 경우, 후자가 충분할 수 있다. 이와는 달리, 바이러스 복제 기점을 함유하는 벡터를 사용하기보다, 당업자는 선택가능한 마커 및 목적 폴리펩티드 DNA로 공동-형질전환의 방법에 의해 포유류 세포를 형질전환시킬 수 있다. 적절한 마커의 예는 디히드로엽산환원효소 (DHFR) 또는 티미딘 키나아제 (미국 특허 제4,399,216호 참조)이다.
목적 폴리펩티드를 인코딩하는 뉴클레오티드 서열은 라이게이션을 위한 블런트-엔드 (blunt-ended) 또는 스태거드-엔드 (staggered-ended) 말단, 적절한 말단을 제공하기 위한 제한 효소의 절단, 점착성 말단 (cohesive end)을 적절한 위치에 채우기, 바람직하지 않은 연결을 피하기 위한 알칼리성 포스파타아제 처리, 및 적합한 리가아제로 라이게이션시키기를 비롯한 통상적 기술에 따라 벡터 DNA로 재조합될 수 있다. 그러한 조작에 대한 기술은 샘브룩 등 (Sambrook et al.)의 상기 문헌에 개시되어 있으며, 당업계에 익히 공지되어 있다. 포유류 발현 벡터의 작제 방법은, 예를 들어 문헌 [Okayama et al., Mol. Cell. Biol. 3:280 (1983)], [Cosman et al., Mol. Immunol. 23:935 (1986)], [Cosman et al., Nature 312:768 (1984)], EP-A-0367566, 및 WO 91/18982에 기재되어 있으며, 이들 각각은 그 전문이 본원에 참고로 포함된다.
본 발명에서 사용된 숙주 세포는 당업자에게 공지된 임의의 숙주 세포일 수 있다. 적합한 숙주 세포에는 박테리아, 균류 (예를 들어, 효모), 식물, 또는 동물 (예를 들어, 포유류 또는 곤충) 세포가 포함된다. 적합한 효모 세포에는 칸디다, 데바리오미세스, 한세눌라, 클루이베로미세스, 피치아, 스키조사카로미세스, 야로위아, 사카로미세스, 슈반니오미세스, 및 아르크술라 종이 포함된다. 구체적 예에는 칸디다 유틸리스, 칸디다 보이디니, 칸디다 알비칸스, 클루이베로미세스 락티스, 피치아 파스토리스, 피치아 스티피티스, 스키조사카로미세스 폼베, 사카로미세스 세레비지애, 한세눌라 폴리몰파, 야로위아 리포리티카, 슈반니오미세스 옥시덴탈리스, 및 아르크술라 아데니니보란스가 포함된다. 다른 적절한 균류에는 아스퍼길루스, 페니실리움, 리조푸스, 및 트리코더마 종이 포함된다. 숙주 세포로 사용될 수 있는 박테리아에는 에세리키아, 슈도모나스, 및 바실러스 종이 포함된다. 적절한 식물 숙주 세포에는 아라비돕시스, 옥수수, 담배, 및 감자가 포함된다. 동물 세포에는 인간, 마우스, 래트, 토끼, 개, 고양이, 원숭이, 및 곤충으로부터 유래된 세포가 포함된다. 예에는 CHO, COS 1, COS 7, BSC 1, BSC 40, BMT 10, 및 Sf9 세포가 포함된다. 특정 실시양태에서, 숙주 세포는 효모 세포이다.
본 발명의 폴리뉴클레오티드는 단리된 폴리펩티드 코딩 영역 또는 바이러스 벡터를 포함하는 원형 플라스미드의 일부로서, 또는 선형 DNA로서 숙주 세포에 도입될 수 있다. 당업계에서 익히 공지되고 통상적으로 이용되는 DNA의 숙주 세포로의 도입 방법은 형질전환법, 형질감염법, 전기천공법, 핵 주입법, 또는 운반체, 예컨대 리포솜, 미셀, 껍질 세포, 및 프로토플라스트와의 융합법을 포함한다.
신속하고 효율적으로 검출가능한 리포터 단백질이 본 발명에서 사용될 수 있다. 한 실시양태에서, 리포터 단백질은 스크리닝 과정을 자동화하기 위해 양성적으로 선택될 수 있는 활성을 갖는다. 추가적 실시양태에서, 리포터 단백질은 세포외 공간으로 분비된 단백질, 예를 들어, 인버타아제, 수크라아제, 셀룰라아제, 크실라나아제, 말타아제, 아밀라아제, 글루코아밀라아제, 갈락토시다아제 (예를 들어, 알파-갈락토시다아제 베타-갈락토시다아제, 멜리비아제), 포스파타아제 (예를 들어, PHO5), 베타-락타마아제, 리파아제 또는 프로테아제이다. 특정 실시양태에서, 분비된 단백질은 세포가 특정 기질 상에서 성장하도록 한다. 포유류 세포에서 리포터 시스템의 예로서, 마우스 배아 줄기 세포에서 분비 경로 유전자를 찾기 위해 항생제 G418을 함유하는 배지에서 CD2/네오마이신-포스포트랜스퍼라아제 (Ceo) 유전자는 분비 리포터로서 사용될 수 있다 (De-Zolt et al., Nucleic Acid Res. 34:e25 (2006)).
한 실시양태에서, 숙주 세포는 효모이고, 리포터 단백질은 인버타아제이며, 형질전환된 효모 세포는 수크로스 또는 라피노스 상에서 성장할 수 있는 그의 능력에 대해 선택된다. 또다른 실시양태에서, 숙주 세포는 효모이고, 리포터 단백질은 멜리비아제이며, 형질전환된 효모 세포는 멜리비오스 상에서 성장할 수 있는 그의 능력에 대해 선택된다. 추가적 실시양태에서, 숙주 세포는 효모이고, 리포터 단백질은 아밀라아제 (예를 들어, 엔도아밀라아제, 엑소아밀라아제, β-아밀라아제, 또는 글루코아밀라아제)이며, 효모 세포는 비-녹말분해성이고, 형질전환된 세포는 전분을 분해할 수 있는 그의 능력에 대해 스크리닝된다. 추가적 실시양태에서, 리포터 단백질의 활성을 나타내는 세포를 확인하는 단계는 성장 억제제, 예를 들어, 항생제에 내성을 제공하는 리포터 단백질을 사용함으로써 이루어진다. 또다른 실시양태에서, 리포터 단백질은 가시적으로 검출될 수 있는 단백질, 예를 들어, 녹색 형광 단백질 또는 루시페라제이다. 한 실시양태에서, 리포터 단백질의 활성을 나타내는 세포를 확인하는 단계는 둘 이상의 리포터 단백질, 예를 들어, 리파아제 및 인버타아제를 사용함으로써 이루어진다.
본 발명의 숙주 세포는 리포터 단백질 활성을 나타내지 않는다. 한 실시양태에서, 숙주 세포는 리포터 단백질을 자연적으로 발현시키지 않는다. 다른 실시양태에서, 리포터 단백질을 인코딩하는 유전자(들)은 전체 또는 일부가 결실되거나, 리포터 단백질이 발현되지 않거나 또는 비활성 형태로 발현되도록 돌연변이된다. 세포에 특정 단백질이 결핍되도록 하는 방법은 당업계에 익히 공지되어 있고, 임의의 그러한 방법이 본 발명의 숙주 세포를 준비하기 위해 이용될 수 있다 (Sambrook et al., 상기 문헌). 효모에 있어서, 리포터 유전자 결핍은 익히 공지된 유전자 대체 기술을 이용하여 도입될 수 있다 (문헌 [Rothstein, Meth. Enzymol. 194:281 (1991)]).
목적 폴리펩티드를 인코딩하는 핵산은 게놈 또는 cDNA 라이브러리로부터의 단리, PCR에 의한 증폭, 또는 화학적 합성을 비롯한 당업계에 익히 공지된 통상적 기술을 이용하여 임의의 공급원으로부터 얻을 수 있다.
핵산 또는 그의 단편의 라이브러리는 게놈 DNA, cDNA, 합성 DNA, 및 재조합 DNA를 비롯한 임의의 유형의 DNA로부터 얻을 수 있다. RNA 및 자연적으로 발생하지 않는 핵산을 비롯한 DNA 이외의 핵산이 또한 사용될 수 있다. 미리 선택된 핵산 단편의 라이브러리는 이전에 확인된 핵산 단편을 다양화함으로써, 예를 들어, 단일방향성 결실, 돌연변이, 기능성 서열 (예를 들어, 글리코실화 부위)의 첨가 또는 핵산 단편 사이에서의 프리- 및 프로-신호 서열의 스와핑에 의해 얻을 수 있다. 한 실시양태에서, 핵산 단편은 1000 염기 쌍 미만, 예를 들어, 700, 500, 또는 300 염기 쌍 미만의 크기를 갖는다. 핵산 단편의 라이브러리는 DNA의 효소적 절단, cDNA 합성, 또는 재조합 DNA 기술 (예를 들어, 단일방향성 결실, 돌연변이유발)에 의해 작제될 수 있다.
핵산 단편은 유기체의 전체 게놈, 예를 들어, 전체 게놈 또는 cDNA 라이브러리로부터 유래될 수 있다. 단편은 또한 전체 게놈의 임의의 부분, 예를 들어, 차감된 라이브러리 또는 크기에 따라 분류한 라이브러리로부터 유래될 수 있다.
하기 실시예는, 여기에 제한되지 않으면서, 본 발명의 방법 및 조성물을 예시한다. 당업자에게 명백하고 임상 치료에서 일반적으로 포함되는 다양한 조건 및 파라미터의 다른 적절한 변형 및 적용은 본 발명의 취지 및 범주 내에 있다.
실시예 1
세포외 분비를 위한 YGR106C 유전자의 최적 크기의 결정
이 실시예는 세포외 분비를 위해 필요한 YGR 106의 최적 영역을 입증한다. 도 1A에 제시된 바와 같이, YGR106C (이하, 분비 융합 파트너 1, SFP1) 단백질 (서열번호 1)은 신호 펩티드, 3개의 글리코실화 부위, 하나의 친수성 도메인 (HL) 및 하나의 막관통 도메인 (TM)을 함유하는 265개의 아미노산 잔기로 이루어진다.
GAL10 프로모터의 제어 하에서 온전한 YGR106C 유전자의 과발현은 배양 배지에서 YGR106C 단백질을 분비 생성하지 않았다. 그러나, 말단절단형 (truncated) SFP1 (서열번호 1의 아미노산 1-213)은 YGR106C의 C-말단 말단절단형 형태를 이용하여 효모 GAL10 프로모터의 제어 하에서 배양 배지로 높은 수준으로 분비하였다.
SFP1 유전자의 최적 도메인의 추가적 확인은 분비에 대해 결정하였다. SFP1 단백질에는 몇가지 기능성 도메인이 존재하는데, 예컨대 분비 신호 (서열번호 1의 아미노산 1-19), 친수성 도메인 (HL) (서열번호 1의 아미노산 176-213) 및 막관통 도메인 (TM) (서열번호 1의 아미노산 220-247)을 카이트-둘리틀 소수성 분석에 의해 결정하였다 (도 1A).
SFP1 유전자가 순차적으로 결실된 상이한 벡터를 함유하는 재조합 효모 사카로미세스 세레비지애 2805 (Mat a ura3 INV2 pep4::HIS3 can1) 균주를 작제하고, 각각의 벡터로부터 SFP1 관련 단백질의 분비를 비교하였다 (도 1B). 처음으로, 온전한 SFP1 단백질을 발현시키기 위해, SFP1의 오픈 리딩 프레임 (ORF)을 사카로마이세스 세레비지애 2805 게놈 DNA로부터 PCR 프라이머, BamHI 부위를 함유하는 센스 프라이머 T9F (서열번호 2) 및 SalI 부위를 함유하는 안티센스 프라이머 H159 (서열번호 3)로 증폭시켰다. PCR을 Pfu 폴리머라아제 (스트라타젠, USA) 또는 Ex-Taq DNA 폴리머라아제 (타카라 코리아 바이오메디칼 인코포레이션: TaKaRa Korea Biomedical Inc., Seoul, Korea)로 수행하였다. PCR 조건은 94℃에서 5분 동안 한 번의 변성 단계, 및 94℃에서 30초 동안, 55℃에서 30초 동안, 및 72℃에서 1분 동안의 25회 증폭 사이클, 이어서 72℃에서 7분 동안의 최종 연장을 포함하였다. 증폭된 SFP1 ORF를 BamHI-SalI으로 절단시키고, YEGα-HIR525의 BamHI-SalI 부위로 서브클로닝하고 (문헌 [Sohn et al., Process Biochem. 30:653 (1995)]), 이로써 생성된 플라스미드를 YGaT91로 명명하였다.
C-말단에서 TM 도메인까지 결실된 말단절단형 SFP1 단백질을 발현시키기 위해, 부분적 SFP1 유전자를 YGaT91 벡터로부터 센스 프라이머 T9F (서열번호 2) 및 안티센스 프라이머 H160 (서열번호 4)으로 증폭시켰다. 증폭된 부분적 SFP1 유전자를 YGaT91 작제와 동일한 방법을 이용하여 YEGα-HIR525로 클로닝하고, 이로써 생성된 플라스미드를 YGaT92로 명명하였다.
C-말단부터 HL 도메인의 반까지 결실된 또다른 말단절단형 SFP1 단백질을 발현시키기 위해, 부분적 SFP1 유전자를 YGaT91 벡터로부터 센스 프라이머 T9F (서열번호 2) 및 안티센스 프라이머 H161 (서열번호 5)로 증폭시켰다. 증폭된 부분적 SFP1 유전자를 YGaT91 작제와 동일한 방법을 이용하여 YEGα-HIR525로 클로닝하고, 이로써 생성된 플라스미드를 YGaT93으로 명명하였다.
C-말단부터 HL 도메인까지 결실된 또다른 말단절단형 SFP1 단백질을 발현시키기 위해, 부분적 SFP1 유전자를 YGaT91 벡터로부터 센스 프라이머 T9F (서열번호 2) 및 안티센스 프라이머 H162 (서열번호 6)로 증폭시켰다. 증폭된 부분적 SFP1 유전자를 YGaT91 작제와 동일한 방법을 이용하여 YEGα-HIR525로 클로닝하고, 이로써 생성된 플라스미드를 YGaT94로 명명하였다.
C-말단부터 제3 글리코실화 부위까지 결실된 또다른 말단절단형 SFP1 단백질을 발현시키기 위해, 부분적 SFP1 유전자를 YGaT91 벡터로부터 센스 프라이머 T9F (서열번호 2) 및 안티센스 프라이머 H205 (서열번호 7)로 증폭시켰다. 증폭된 부분적 SFP1 유전자를 YGaT91 작제와 동일한 방법을 이용하여 YEGα-HIR525로 클로닝하고, 이로써 생성된 플라스미드를 YGaT95로 명명하였다.
C-말단에서 제2 글리코실화 부위까지가 결실된 또다른 말단절단형 SFP1 단백질을 발현시키기 위해, 부분적 SFP1 유전자를 YGaT91 벡터로부터 센스 프라이머 T9F (서열번호 2) 및 안티센스 프라이머 H204 (서열번호 8)로 증폭시켰다. 증폭된 부분적 SFP1 유전자를 YGaT91 작제와 동일한 방법을 이용하여 YEGα-HIR525로 클로닝하고, 이로써 생성된 플라스미드를 YGaT96로 명명하였다.
C-말단부터 제1 글리코실화 부위까지가 결실된 또다른 말단절단형 SFP1 유전자를 발현시키기 위해, 부분적 SFP1 유전자를 YGaT91 벡터로부터 센스 프라이머 T9F (서열번호 2) 및 안티센스 프라이머 H203 (서열번호 9)으로 증폭시켰다. 증폭된 부분적 SFP1 유전자를 YGaT91 작제와 동일한 방법을 이용하여 YEGα-HIR525로 클로닝하고, 이로써 생성된 플라스미드를 YGaT97로 명명하였다.
효모 사카로마이세스 세레비지애 2805 균주 (Mat a ura3 INV2 pep4::HIS3 can1)를 작제된 벡터 (YGaT91, YGaT92, YGaT93, YGaT94, YGaT95, YGaT96, 및 YGaT97)로 형질전환시켰다. 상이한 형질전환의 UD 플레이트 (0.67% 아미노산 없는 효모 질소 베이스, 0.77 g/l 아미노산 혼합물, 2% 글루코스 및 2% 아가)로부터 선택되는 단일 콜로니를 YPDG 브로쓰 배지 (1% 효모 추출물, 2% 박토-펩톤, 1% 글루코스, 1% 갈락토스)에서 40시간 동안 30℃에서 배양하였다. 각각의 배양 브로쓰 0.6 ml 중 분비된 단백질을 아세톤 0.4 ml로 농축시키고, SDS-PAGE에 의해 분리하였다. 도 1C에 제시된 바와 같이, SFP1 관련 단백질을 YGaT92, YGaT93 및 YGaT94를 보유하는 세포 (각각 레인 2, 3, 및 4)에서만 확인되었다. 하나의 글리코실화된 형태 및 다른 비-글리코실화된 두 밴드를 세 균주 모두에서 검출하였다. 그러나 다른 세포, YGaT91, YGaT95, YGaT96, 및 YGaT97은 그러한 밴드를 나타내지 않았다 (각각 레인 1, 5, 6, 및 7). 이들 결과는 TM 도메인의 제거 및 세 글리코실화 부위 모두를 함유하는 도메인의 보유는 SFP1 세포외 분비를 가능하게 한다는 것을 제시한다.
실시예 2
목적 단백질의 분비를 위한 융합 파트너로서 SFP1 유전자의 최적 크기의 결정
이 실시예는 SPF1 유도체의 융합 파트너로서의 용도를 입증한다. 예시적 목적 단백질, 인간 인터루킨-2 (hIL-2)의 분비를 위한 융합 파트너로서 SFP1 유도체를 시험하기 위해, 3개의 벡터를 작제하여 3개의 YGaT92, YGaT93 및 YGaT94 각각의 3개의 SFP1 유도체 (SFP 1-92 (서열번호 39), SFP1-93 (서열번호 40), 및 SFP1-94 (서열번호 41))와의 융합 단백질로서 hIL-2를 발현시켰다 (도 2A). YGaT91와의 hIL-2 융합, SFP 1-91 (서열번호 38)을 또한 생성하였으며, 데이타는 제시하지 않았다. hIL2 유전자를 YGaT92의 SFP1-92와 융합시키기 위해, 부분적 SFP1 유전자를 YGaT92 벡터로부터 GAL10 프로모터를 인식하는 센스 프라이머 GAL100 (서열번호 10) 및 안티센스 프라이머 H121 (서열번호 11)로 증폭시켰다. hIL2 유전자와의 융합을 촉진하고, hIL2 융합 단백질의 효모 디펩티딜 프로테아제 Kex2p에 의한 생체내 절단을 유도하기 위해 (Mizuno K et al., Biochem. Biophys. Res. Commun. 156:246 (1988)), H121 프라이머 (서열번호 11)를 Kex2p 절단 서열 및 N-말단 hIL2 서열을 함유하도록 고안하였다. 인간 IL-2 유전자를 H121 프라이머 (서열번호 11)에 상보적인 SFP1 서열의 일부를 함유하는 센스 프라이머 IL2F (서열번호 12) 및 안티센스 프라이머 IL2R (서열번호 13)로 증폭시켰다. IL2R 프라이머는 GAL7 터미네이터 서열의 일부를 함유한다. SFP1-92 및 hIL-2 유전자를 함유하는 증폭된 PCR 단편을 중복-연장 (overlap-extension) PCR에 의해 GAL100 및 GT50R (서열번호 14) 프라이머로 융합시켰다. GT50R 프라이머는 GAL7 터미네이터를 인식하는 안티센스 프라이머이다. 이로써 생성된 PCR 생성물을 GAL10 프로모터 서열 lOO bp 및 GAL7 터미네이터 서열 50 bp로 플랭킹시켰다. 발현 숙주로서 사카로마이세스 세레비지애의 장점 중 하나는 효율적이고 정확한 상동적 재조합 전략을 이용하는 것이 가능하다는 것이다. 단편 말단의 한 측면 상에 DNA 서열 중복을 공유하는 선형화된 벡터 및 DNA 단편은 플라스미드의 원형 토폴로지를 복구하는 재조합을 수행할 수 있다는 것이 당업계에 공지되어 있다 (문헌 [Kunes et al., Genetics. 115:73 (1987)]). 사카로마이세스 세레비지애의 이 특성을 발현 숙주계의 작제를 위해 이용하였다.
생체내 재조합 골격으로 YGaT92 벡터를 사용하기 위해, YGaT92 벡터를 BamHI/SalI으로 절단시켰다. 선형화된 벡터 단편을 아가로스 겔로부터 겔 추출 키트 (바이오니어: Bioneer, Korea)를 이용하여 단리하였다. GAL100/GT50R 프라이머 세트로 증폭된 PCR 생성물은 선형화된 벡터와 50개 이상의 뉴클레오티드를 공유하였다. 생체내 재조합을 위한 최소 요건은 약 30개의 뉴클레오티드 중복이다 (문헌 [Oldenberg et al., Nucleic Acids Res. 25:451 (1997)]). 50개의 뉴클레오티드 중복은 사카로마이세스 세레비지애에서 플라스미드 재작제에 충분하다. 재조합 사카로마이세스 세레비지애 2805 균주를 상기 기재된 PCR 생성물 및 벡터 단편으로 공동-형질전환 시킴으로써 직접 작제하였다. 재조합에 의해 작제되어 생성된 플라스미드를 YGaT92-IL2로 명명하였다 (도 24). YGaT93-IL2 벡터로 형질전환된 사카로마이세스 세레비지애 2805 균주의 작제를 위해, 본 발명자들은 H120 프라이머 (서열번호 15)를 H121 프라이머 (서열번호 11) 대신 사용한 것을 제외하고는, YGaT92-IL2 플라스미드 작제에 사용된 바와 동일한 절차를 이용하였다. H120 프라이머는 YGaT93 벡터의 SFP1 유전자의 3' 말단을 인식하고, Kex2p 절단 서열 및 N-말단 hIL2 서열을 함유하는 안티센스 프라이머이다. 사카로마이세스 세레비지애 2805 균주를 YGaT94-IL2 벡터로 형질전환시키기 위해, H119 프라이머 (서열번호 16)를 H121 프라이머 (서열번호 11) 대신 사용하였고, 그 외에는 YGaT92-IL2 플라스미드 작제에 대해 기재한 바와 동일한 절차를 이용하였다. Hl 19 프라이머는 YGaT94 벡터의 SFP1 유전자의 3' 말단을 인식하는 안티센스 프라이머이며, Kex2p 절단 서열 및 N-말단 hIL2 서열을 함유한다.
UD 플레이트 (0.67% 아미노산 없는 효모 질소 베이스, 0.77 g/l 아미노산 혼합물, 2% 글루코스 및 2% 아가)로부터 선택되는 단일 콜로니를 YPDG 브로쓰 배지 (1% 효모 추출물, 2% 박토-펩톤, 1% 글루코스, 1% 갈락토스)에서 40시간 동안 30℃에서 배양하였다. 각각의 배양 브로쓰 0.6 ml 중 분비된 단백질을 아세톤 0.4 ml로 농축시키고, SDS-PAGE에 의해 분리하였다. 도 2B에 제시된 바와 같이, SFP1 유도체 단백질 및 hIL2는 YGaT92-IL2 (서열번호 58) 및 YGaT93-IL2 (각각 레인 1 및 2)를 보유하는 사카로마이세스 세레비지애 세포로부터 분비되었으나, YGaT94-IL2 세포 (레인 3)는 분비하지 않았다. 이 결과는 융합 형태로 발현되는 경우, HL 도메인이 SPF1 유도체 단백질의 분비에서 중요함을 시사한다.
실시예 3
SFP1 유도체와 융합된 목적 단백질의 발현
YGaT92로부터 실시예 2에서 작제된 SFP1-92 (서열번호 39)를 엑센딘-4 (EXD4), 글루카곤-유사 펩티드-1 (GLP1)의 39개의 아미노산 펩티드 유사체의 분비 생성을 위해 사용하였다. 온전한 EXD4 단백질의 단순하고 효율적 정제를 위해, 6-히스티딘 태그 및 엔테로키나아제 절단 부위 (DDDDK (서열번호 79), D: 아스파르트산, K: 리신)를 SFP1의 C-말단에 첨가하였다. 따라서 융합 단백질 N-말단에서 C-말단은 SFP1 단편, 6-히스티딘 태그, 엔테로키나아제 절단 부위 및 EXD4 서열을 포함하였다. SFP1-92 EXD4 융합 단백질을 발현하는 YGaT92-EXD4 벡터를 작제하기 위해, SFP1-92 유전자를 YGaT92 벡터로부터 HL 서열을 인식하고, 6개의 히스티딘 코돈을 함유하는 안티센스 프라이머 HDK-R (서열번호 17) 및 GAL100 프라이머 (서열번호 10)로 증폭시켰다. EXD4 유전자를 DDDDK 코돈 및 HDK-R 프라이머에 상보적인 18개의 뉴클레오티드를 함유하는 센스 프라이머 HDK-F (서열번호 18) 및 GT50R (서열번호 14) 프라이머 서열의 18개의 뉴클레오티드를 함유하는 안티센스 프라이머 EXD-R (서열번호 19)로 증폭시켰다. 증폭된 SFP1-92 및 EXD4 유전자를 중복-연장 PCR에 의해 GAL100/GT50R 프라이머 세트로 융합시켰다. YGaT92-EXD4 벡터를 보유하는 재조합 사카로마이세스 세레비지애 2805 균주를 실시예 2에 기재된 바와 같이 융합된 단편 및 BamHI/SalI 절단시킨 YGaT92 벡터 단편의 공동-형질전환을 통해 생체내 재조합에 의해 직접 작제하였다.
YGaT92-EXD4로 형질전환된 재조합 효모 균주를 5-L 발효기 (jar fermentor)에서 유가 배양에 의해 배양하여 SFP1-92-EXD4 융합 단백질의 분비 생성을 유도하는 그의 능력에 대해 평가하였다. 발효기에서 접종시킬 종균 배양물을 플라스크에서 종균 배양 배지 (6.7% 아미노산 없이 효모 질소 베이스, 0.5% 카자미노산 및 2% 글루코스)를 사용하여 배양하였다. 초기 발효 배지로서 발효 배양 배지 (4% 효모 추출물, 1% 펩톤, 2% 글루코스)를 사용하여 배양하는 경우, OD600이 약 15에 달하였고, 유가 배지 (15% 효모 추출물, 30% 글루코스, 30% 갈락토스)를 세포 성장 속도에 따라 다양한 양으로 공급하였다. 약 48시간 동안 배양 후, 배양물은 OD600이 약 160에 달하였다. 배지 10 μl를 제시된 시점에서 수집하고, 분비된 단백질을 SDS-PAGE에 의해 평가하였다 (도 3A-B). 표준 단백질 밴드와 비교하여, 분비된 SFP1-EXD4는 약 500 mg/L로 측정되었다. 상등액을 원심분리에 의해 회수하여 효모 세포를 제거하고, 한외여과 (퀵스탠드, 아머샴: Quickstand, Amersham)에 의해 농축시키고 탈염시켰다.
융합 단백질, SFP1-92-EXD4를 Ni-NTA 친화성 칼럼 (퀴아젠, USA)으로 정제하였다 (도 4, 레인 1). SFP1-92 융합 단백질로부터 EXD-4를 회수하기 위해, 정제된 융합 단백질을 상이한 농도의 엔테로키나아제 (인비트로겐, USA)로 절단시켰다. 샘플을 엔테로키나아제 완충액 [2O mM 트리스-HCl (pH 8.0), 50 mM NaCl, 2 mM CaCl2]에 용해시켰다. 동량의 단백질 샘플을 0.1, 0.2 및 0.3 μl의 엔테로키나아제로 1시간 동안 37℃에서 절단시켰다. 이로써 생성된 단백질을 SDS-PAGE에 의해 분석하였다 (도 4, 각각 레인 2, 3 및 4).
두 밴드가 아닌 수가지 작은 단백질 밴드가 생성되었다. 이들 작은 단편은 엔테로키나아제에 의한 SFP1의 비-특이적 절단의 결과로 보인다. SFP1 단백질은 DDK (137번째 아미노산) 및 EDK (168번째 아미노산) 잔기를 함유하였으며, 이는 엔테로키나아제의 기질로 사용가능하다.
SFP1-92-EXD4로부터 회수한 EXD-4의 추가적 분석을 위해, 엔테로키나아제를 처리한 샘플 (도 4, 레인 3)을 HPLC에 의해 분획화하였다 (도 5A). HPLC 크로마토그램에서 피크로 검출된 단백질을 SDS-PAGE에 의해 분석하였다 (도 5B). HPLC 분획 수 41은 EXD-4로 예상되는 단일 밴드를 나타내었다. 단백질을 추가적으로 분석하여 말디-토프 (MALDI-TOF; 한국 기초과학 지원 연구원: Korea Basic Science Institute, Daejeon, Korea)에 의해 그의 분자량 (MW)을 결정하였다 (도 6). SFP 1-92 융합으로부터 생성된 EXD-4의 MW는 4187.8 Da이었으며, 그의 아미노산 서열에 의해 계산된 MW와 일치하였다.
엔테로키나아제에 내성인 강력한 SFP1-92 융합 파트너를 작제하기 위해, DDK 및 EDK 잔기를 DGK 및 EGK 잔기로 각각 교체하였다 (도 7A). DDK 잔기를 DGK 잔기로 교체하기 위해, 5' SFP1-92 단편을 YGaT92-EXD4로부터 GAL100 프라이머 (서열번호 8) 및 DDK 잔기의 아스파르트산 코돈 대신에 글리신 코돈을 함유하는 안티센스 돌연변이유발성 프라이머 H307 (서열번호 20)로 증폭시켰다. 3' SFP1-92-EXD4 단편을 또한 H307 (서열번호 20)에 상보적인 센스 프라이머 H306 (서열번호 21) 및 GT50R 프라이머 (서열번호 14)로 YGaT92-EXD4 벡터로부터 증폭시켰다. 이들 단편을 중복 연장 PCR에 의해 GAL100/GT50R 프라이머 세트로 융합시켰다. BamHI/SalI으로 절단시킨 후, 융합된 단편을 YGaT92-EXD4 벡터의 BamHI/SalI 부위로 클로닝하였다. 이로써 생성된 플라스미드의 뉴클레오티드 서열을 확인하고, SFP1-921 (서열번호 42)을 함유하는 YGaT921-EXD4로 명명하였다.
EDK 잔기를 EGK 잔기로 교체하기 위해, 5' SFP1 단편을 YGaT92-EXD4로부터 GAL100 프라이머 (서열번호 10) 및 EDK 잔기의 아스파르트산 코돈 대신에 글리신 코돈을 함유하는 안티센스 돌연변이유발성 프라이머 H309 (서열번호 22)로 증폭시켰다. 3' SFP1-92-EXD4 단편을 또한 H309 (서열번호 22)에 상보적인 센스 프라이머 H308 (서열번호 23) 및 GT50R 프라이머 (서열번호 14)로 YGaT92-EXD4 벡터로부터 증폭시켰다. 이들 단편을 GAL100/GT50R 프라이머 세트로 중복 연장 PCR에 의해 융합시켰다. BamHI/SalI으로 절단시킨 후, 융합된 단편을 YGaT92-EXD4 벡터의 BamHI/SalI 부위로 클로닝하였다. 이로써 생성된 플라스미드의 뉴클레오티드 서열을 확인하고, SFP1-922 (서열번호 43)을 함유하는 YGaT922-EXD4로 명명하였다.
DDK 및 EDK 잔기 둘 다를 DGK 및 EGK로 각각 교체하기 위해, 5' SFP1 단편을 GAL100 프라이머 (서열번호 10) 및 EDK 잔기의 아스파르트산 코돈 대신 글리신 코돈을 함유하는 안티센스 돌연변이유발성 프라이머 H309 (서열번호 22)로 YGaT921-EXD4로부터 증폭시켰다. 3' SFP1-EXD4 단편을 또한 H309 (서열번호 22)에 상보적인 센스 프라이머 H308 (서열번호 23) 및 GT50R 프라이머 (서열번호 14)로 YGaT92-EXD4 벡터로부터 증폭시켰다. 이들 단편을 GAL100/GT50R 프라이머 세트로 중복 연장 PCR에 의해 융합시켰다. BamHI/SalI으로 절단시킨 후, 융합된 단편을 YGaT92-EXD4 벡터의 BamHI/SalI 부위로 클로닝하였다. 이로써 생성된 플라스미드의 뉴클레오티드 서열을 확인하고, SFP1-923 (서열번호 44)을 함유하는 YGaT923-EXD4로 명명하였다 (도 25).
사카로마이세스 세레비지애 2805 균주를 벡터: YGaT92-EXD4, YGaT921-EXD4, YGaT922-EXD4, 및 YGaT923-EXD4로 형질전환시켰다. UD 플레이트 (0.67% 아미노산 없는 효모 질소 베이스, 0.77 g/l 아미노산 혼합물, 2% 글루코스 및 2% 아가)로부터 선택되는 단일 콜로니를 YPDG 브로쓰 배지 (1% 효모 추출물, 2% 박토-펩톤, 1% 글루코스, 1% 갈락토스)에서 40시간 동안 30℃에서 배양하였다. 배양 상등액 0.6 ml 중에 함유된 단백질을 아세톤 0.4 ml로 침전시키고, 엔테로키나아제 완충액 [2O mM 트리스-HCl (pH 8.0), 50 mM NaCl, 2 mM CaC12]에 용해시켰다. 동량의 단백질 샘플을 엔테로키나아제 0.1 μl로 1시간 동안 37℃에서 절단시키고, SDS-PAGE에 의해 분리하였다.
도 7B에 제시된 바와 같이, YGaT92-EXD4 형질전환체로부터 생성된 SFP1을 약 15 kDa 단편 (도 7B, 레인 1)으로 절단시켰으나, YGaT921-EXD4 및 YGaT922-EXD4 형질전환체로부터 생성된 SFP1 (도 7B, 각각 레인 2 및 3)이 YGaT92-EXD4로부터의 SFP1보다 내부 SFP1 엔테로키나아제 절단에 더 내성이 있었다. 최종적으로, YGaT923-EXD4 (서열번호 59) 형질전환체로부터 생성된 SFP1 단편 대부분은 온전하였다 (도 7B, 레인 4). 따라서, 결과는 YGaT923-EXD4로부터의 SFP1 변이체는 목적 단백질의 발현 및 정제에 성공적으로 적용되었음을 시사한다.
실시예 4
SFP1의 HL 도메인과 융합된 목적 단백질의 분비
실시예 2에 제시된 바와 같이, HL 도메인은 목적 단백질의 분비에서 중요한 역할을 한다. 목적 단백질의 분비에서 HL의 기능은 HL 도메인 내의 산성 하전된 아미노산으로 인한 것일 수 있는데, 단백질의 가용성은 단백질의 순전하 (net charge)와 밀접하게 관련되어 있기 때문이다. HL 도메인의 융합 파트너로서의 기능을 조사하기 위해, 본 발명자들은 EXD4의 분비를 위해 HL 도메인을 사용하였다.
HL 도메인을 목적 단백질의 N-말단에 융합시켰다. HL-EXD4 유전자를 YGaT923-EXD4 벡터로부터 H221 (서열번호 24)/GT50R (서열번호 14) 프라이머 세트로 증폭시키고, 메이팅 인자 α(MFα)의 프리-프로 리더 펩티드를 GAL100/LNK-R (서열번호 25) 프라이머 세트로 증폭시켰다. H221 및 LNK-R 프라이머 (서열번호 25)가 상보적 링커 서열을 함유하므로, 이들 두 단편을 GAL100 (서열번호 8)/GT50R (서열번호 14) 프라이머 세트로 중복-연장 PCR에 의해 융합시켰다. YGaMKH-EXD4 (도 26) 형질전환체를 실시예 2에 기재된 바와 같이 융합된 단편 및 BamHI/SalI 절단시킨 YGaT92 벡터 단편으로 공동 형질전환시킴으로써 직접 작제하였다. YGaMKH-EXD4 플라스미드는 Kex2p에 의한 생체내 프로세싱을 위해 MFα의 프리-프로 리더 펩티드와 HL 펩티드 사이에 링커 펩티드 (AASASAGLALDKR)를 함유한다. YGaMKH-EXD4로 형질전환된 재조합 효모 균주를 5-L 발효기에서 유가 배양에 의해 배양하여 HL-EXD4의 분비 생성을 유도하는 그의 능력에 대해 평가하였다. 발효기에 접종할 종균 배양물을 플라스크에서 종균 배양 배지 (6.7% 아미노산 없는 효모 질소 베이스, 0.5% 카자미노산 및 2% 글루코스)를 사용하여 배양하였다. 초기 발효 배지로 발효 배양 배지 (4% 효모 추출물, 1% 펩톤, 2% 글루코스)를 사용하여 배양하는 경우 OD600이 약 15에 달하였을 때, 유가 배지 (15% 효모 추출물, 30% 글루코스, 30% 갈락토스)를 세포 성장 속도에 따라 다양한 양으로 공급하였다. 약 48시간 동안 배양 후, 배양물은 OD600이 약 150에 달하였다. 배지 10 μl를 제시된 시점에서 수집하고, 분비된 단백질에 대해 SDS-PAGE에 의해 분석하였다 (도 8). 표준 단백질 밴드와 비교하는 경우, 분비된 HL-EXD4는 약 200 mg/L로 측정되었다.
HL 펩티드의 목적 단백질로의 C-말단 융합의 효과를 시험하기 위해, 플라스미드, YGaST6-EXD-HL (도 27)을 작제하였다. EXD4 유전자를 YGaMKH-EXD4로부터의 센스 프라이머 H412 (서열번호 26) 및 안티센스 프라이머 H413 (서열번호 27)으로 증폭시키고, HL 펩티드를 YGaMKH-EXD4로부터의 HL-F (서열번호 28) 및 HL-GT50R (서열번호 29)로 증폭시켰다. H413 프라이머 (서열번호 27)는 HL-F 프라이머에 상보적 서열을 함유하므로, 이들 두 단편을 H412 (서열번호 26)/GT50R 프라이머 세트로 중복-연장 PCR에 의해 융합시켰다. H412 프라이머 (서열번호 26)는 링커 서열을 함유하고, GAL100 (서열번호 10)/LNK-R (서열번호 25) 프라이머 세트로 증폭된 MFα의 프리-프로 리더와 융합시킬 수 있다. 각각의 증폭된 단편을 MFα의 프리-프로 리더, EXD4 및 HL 도메인 유전자의 순서로 GAL100/GT50R 프라이머 세트로 중복-연장 PCR에 의해 융합시켰다. YGaST6-EXD-HL 형질전환체를 실시예 2에 기재된 바와 같이 융합된 단편 및 BamHI/SalI 절단시킨 YGaT92 벡터 단편으로 공동-형질전환에 의해 직접 작제하였다. YGaST6-EXD4-HL로 형질전환된 재조합 효모 균주를 5-L 발효기에서 유가 배양에 의해 배양하여 EXD4-HL의 분비 생성을 유도하는 그의 능력에 대해 평가하였다. 약 48시간 배양 후, 배양물은 OD600이 약 160에 달하였다. 배지 10 μl를 제시된 시점에서 수집하고, 분비된 단백질에 대해 SDS-PAGE에 의해 분석하였다 (도 9A 및 B). 표준 단백질 밴드와 비교하여, 분비된 EXD4-HL은 약 500 mg/L로 측정되었다. HL이 EXD4로 융합되는 경우, C-말단 융합은 N-말단 융합보다 EXD4의 훨씬 높은 분비 수준을 나타냈다. 따라서, 결과는 HL 도메인이 목적 단백질의 N-말단 및 C-말단 둘 다에서 융합 형태로 단백질의 분비에 유용함을 시사한다. 그러나, C-말단 융합이 목적 단백질의 증가된 분비를 나타내었다.
HL 도메인의 융합 파트너로서의 추가적 시험을 위해, HL 도메인을 인간 표피 성장 인자 (hEGF)의 발현을 위해 사용하였다. YGaMKH-EGF 플라스미드 (도 28)를 작제하였다. YGaMKH-EGF에서, HL 도메인을 hEGF의 N-말단에 융합시키고, MFα 프리-프로 펩티드-HL 융합 펩티드 유전자를 GAL100 (서열번호 10)/DDK-R (서열번호 30) 프라이머 세트로 YGaMKH-EXD4 벡터로부터 증폭시키고, hEGF 유전자를 DDK-R 프라이머에 상보적 서열을 함유하는 센스 프라이머 H410 (서열번호 31) 및 GT50R (서열번호 14)와 동일한 서열을 함유하는 안티센스 프라이머 H411 (서열번호 32)로 증폭시켰다. 각각의 증폭된 단편을 GAL100/GT50R 프라이머 세트로 중복-연장 PCR에 의해 융합시켰다. YGaMKH-EGF 형질전환체를 실시예 2에 기재된 바와 같이 융합된 단편 및 BamHI/SalI 절단시킨 YGaT92 벡터 단편으로 공동-형질전환시켰다.
YGaMKH-EGF로 형질전환된 재조합 효모 균주를 5-L 발효기에서 유가 배양에 의해 배양하여 HL-EGF의 분비 생성을 유도하는 그의 능력에 대해 평가하였다. 약 48시간 동안 배양 후, 배양물은 OD600이 약 155에 달하였다. 배지 10 μl를 제시된 시점에서 수집하고, SDS-PAGE에 의해 분비된 단백질에 대해 분석하였다 (도 1OA 및 B). 표준 단백질 밴드와 비교하여, 분비된 HL-EGF는 약 400 mg/L로 측정되었다.
HL-hEGF 융합 단백질을 Ni-NTA 친화성 크로마토그래피에 의해 직접 정제하였다 (도 11A). hEGF 및 HL 펩티드를 분리하기 위해, 정제된 융합 단백질을 엔테로키나아제로 절단시키고, 이로써 생성된 단편을 Ni-NTA 친화성 크로마토그래피에 의해 다시 분획화시켰다. 도 11B에 제시된 바와 같이, 온전하고 순수한 hEGF (6 kD)를 효율적으로 정제하였다.
HL 도메인을 또한 인간 부갑상선 호르몬 (hPTH)의 분비 생성에 대해 적용하였다. HL 도메인을 hPTH의 N-말단에 융합시킴으로써 YGaMKH-PTH (도 29) 벡터를 작제하였다. hPTH 유전자를 DDK-R 프라이머 (서열번호 30)에 상보적 서열을 함유하는 센스 프라이머 H310 (서열번호 33) 및 GT50R (서열번호 14)과 동일한 서열을 함유하는 안티센스 프라이머 H311 (서열번호 34)로 증폭시켰다. 이 단편을 GALlOO (서열번호 10)/GT50R (서열번호 14) 프라이머 세트를 이용한 중복-연장 PCR에 의해 MFα 프리-프로 펩티드-HL 융합 펩티드 유전자와 융합시켰다. YGaMKH-PTH 형질전환체를 실시예 2에 기재된 바와 같이 융합된 단편 및 BamHI/SalI 절단시킨 YGaT92 벡터 단편으로 공동-형질전환에 의해 직접 작제하였다. YGaMKH-PTH로 형질전환된 재조합 효모 균주를 5-L 발효기에서 유가 배양에 의해 배양하여 HL-PTH의 분비 생성을 유도하는 그의 능력에 대해 평가하였다. 약 48시간 동안 배양 후, 배양물은 OD600이 약 120에 달하였다. 배지 10 μl를 제시된 시점에서 수집하고, SDS-PAGE에 의해 분비된 단백질에 대해 분석하였다 (도 12A 및 B). HL-PTH와 관련된 두 주요 밴드가 검출되었다. 대다수의 hPTH가 Kex2p에 의한 불완전 생체내 절단으로 인해 MFα pro-HL-PTH의 융합 형태로 6OkD에서 검출되었다. HL-PTH의 Kex2p 절단을 나타내는 밴드가 또한 검출되었다. PTH와 관련된 총 분비된 단백질은 500 mg/L 이상으로 측정되었다. 발효 상등액 중의 His 태그된 단백질을 Ni-NTA 친화성 크로마토그래피에 의해 직접 정제하였다. 정제된 단백질을 예상한 바와 같이 SDS-PAGE에서 두 종류의 밴드로 분리하였다 (도 13, 레인 1). 보다 큰 밴드 (Pro-HL-PTH)가 Kex2p를 이용한 시험관내 프로세싱 후에 사라졌다 (도 13, 레인 2). 융합 단백질 (HL-PTH)을 엔테로키나아제 절단에 의해 HL 펩티드 및 hPTH 펩티드로 정확하게 분리하였다 (레인 3).
실시예 1 내지 4는 재조합 단백질의 분비 생성 및 단리를 위하여 YGR106C 유전자의 최적 영역의 확인 및 변형이 SFP1로부터 유래한 효율적 다중-기능성 융합 파트너를 작제하게 한다는 것을 제시한다.
실시예 5
효모 시크리톰으로부터의 분비 융합 파트너의 선택
이 실시예는 융합 파트너로서 유용한, 고분비된 단백질을 확인하기 위한 기술을 입증하였다.
우선, 정상 효모 세포 성장 동안 생성된 효모의 총 분비된 단백질 (효모 시크리톰)을 분석하였다. 효모 시크리톰 단리를 위해, 효모 사카로마이세스 세레비지애 2805 균주를 최소 배지 (0.67% 아미노산 없는 효모 질소 베이스, 0.5% 카자미노산, 2% 글루코스 및 0.002% 우라실)에서 20시간 (M1) 및 40시간 (M2) 동안 배양하였다. 배양 상등액 500 밀리리터를 막 여과를 이용해 농축시키고, 총 분비된 단백질을 회수하였다. 효모 세포를 형광 염료 획스트로 염색한 후, 공초점 레이저 스캐닝 현미경을 이용하여 온전함을 확인하였다 (도 14A 및 B).
M2 시크리톰 샘플을 2-D 겔 전기영동에 의해 분석하였다 (도 15). 총 단백질 샘플에서 리보핵산 오염을 제거하기 위해 첨가한 RNase를 제외하고, 대부분의 시크리톰 단백질을 산성 영역에서 확인하였다. 도 15에 제시된 바와 같이, 2-D 겔 전기영동은 샘플 M2에 존재하는 모든 분비된 단백질을 확인하는 데 충분하지 않았다. 따라서, 1-DE/MudPIT (Multidimensional Protein Identification Technology) 방법을 또한 효모 시크리톰의 보다 완벽한 확인을 위해 적용하였다 (도 16). 결과로서, 57 및 83개의 단백질을 M1 및 M2로부터 각각 확인하였다. 이와 함께, 98개의 독특한 단백질을 확인하였다. 이들 중에서, 42개의 단백질이 M1 및 M2 샘플에서 공통적으로 검출되었다. 분비된 단백질과 가장 유사한 단백질을 확인하기 위해, 단백질 위치설정 예측 및 신호 예측을 위한 두 프로그램 WoLF PSORT 및 pTARGET을 이용하였다. 42개의 단백질 중에서, 35개의 단백질을 분비 단백질로서 예측하였다 (표 1).
다수의 분비 단백질을 세포벽 단백질 및 GPI (글리코실포스파티딜 이노시톨) 앵커를 갖는 단백질로 확인하였다. 고분비된 단백질을 분비된 단백질의 수에 비례할 수 있는 PAI (단백질 수도 지수)에 의해 결정하였다 (Rappsilber et al., Genome Res. 12:1231-45(2002)). 이 분석을 기초로, 20개의 고분비된 단백질을 선택하였다.
19개의 고분비된 단백질의 유전자를 19개의 상이한 센스 프라이머 (서열번호 35) 및 안티센스 프라이머 (서열번호 36)를 이용하여 게놈 DNA로부터 증폭시켰다. 증폭된 DNA 단편의 5' 및 3' 말단은 상기 기재된 바와 같이 EcoRI-SalI 절단시킨 YEGα-HIR525와 생체내 재조합을 위해 GAL10 프로모터 및 GAL7 터미네이터 각각의 일부와 상동적 서열의 연장을 함유하였다. 효모 형질전환체를 생체내 재조합을 통해 선형화된 벡터 및 PCR 단편 둘 다의 형질전환에 의해 용이하게 얻었다. 19개의 상이한 PCR 단편으로부터 얻은 20개의 상이한 형질전환체를 YPDG (1% 효모 추출물, 2% 펩톤, 1% 글루코스, 및 1% 갈락토스) 배지에서 배양하였다. 각각의 배양 상등액 300 마이크로리터를 아세톤으로 농축시켰다. 각각의 아세톤-농축된 배양 상등액을 도 17A에 제시된 바와 같이 SDS-PAGE에서 분석하였다.
고효율의 SFP를 선별하기 위하여, 강한 프로모터를 사용하여 고발현을 유도하고 결과적으로 고분비된 단백질의 분비 수준을 형질전환하지 않은 야생형 효모의 단백질 분비 수준과 비교하여 결정하였다. 도 17A의 레인 WT에 제시된 야생형 단백질 분비 수준과 비교하여, 강한 GAL10 프로모터를 이용하여 발현된, 시험된 단백질의 부분집합 (11개)은 뚜렷하게 강한 밴드를 나타냈는데, 이는 배양 상등액으로 고분비되었음을 시사한다. 각각의 샘플의 글리코시다아제, 엔도-H 처리는 각각의 단백질의 아미노산 서열로부터 예상되는 정확한 단백질 크기로 나타났으며 (도 17B), 이는 대부분의 고분비된 단백질이 글리코실화되었음을 입증한다. 19개의 선택된 고분비된 단백질 중 11개인 BGL2 (서열번호 80), GAS3 (서열번호 81), GAS5 (서열번호 82), PST1 (서열번호 83), SCW4 (서열번호 84), SCW10 (서열번호 85), SIM1 (서열번호 86), UTH1 (서열번호 87), YGP1 (서열번호 88), YPS1 (서열번호 89), 및 ZPS1 (서열번호 90)을 이종 단백질의 분비에 대한 후보자 SFP로 시험하였다. 11개의 단백질은 하기 폴리뉴클레오티드: BGL2 (서열번호 62), GAS3 (서열번호 63), GAS5 (서열번호 64), PST1 (서열번호 65), SCW4 (서열번호 66), SCW10 (서열번호 67), SIM1 (서열번호 68), UTH1 (서열번호 69), YGP1 (서열번호 70), YPS1 (서열번호 71) 및 ZPS1 (서열번호 72)에 의해 인코딩된다.
융합 단백질의 발현을 위한 벡터를 EXD4에 각각 융합된 11개의 고분비된 단백질을 인코딩하는 폴리뉴클레오티드의 오픈 리딩 프레임 (OFR)을 사용하여 작제하였다. 11개의 융합 단백질을 배양 상등액으로의 이들의 분비 수준에 대해 시험하였다. YGa-ORF 벡터를 도 17과 같이 각각의 단백질을 생성하는 각각의 형질전환체로부터 회수하였다. 각각의 융합 단백질 발현 벡터의 작제를 위해, 11개의 PCR 단편을 상이한 ORF를 함유하는 11개의 YGa-ORF 벡터로부터 프라이머 GAL100 (서열번호 10) 및 11개의 상이한 안티센스 프라이머 (서열번호 37)를 사용하여 증폭시켰다. 증폭된 DNA 단편의 5' 및 3' 말단은 GAL10 프로모터 및 엑센딘-4와 각각 상동적 서열의 연장을 함유하였다. YGaT92-EXD4로부터 프라이머 EXD-F (서열번호 46) 및 GT50R (서열번호 14)로 증폭된 11개의 PCR 단편 및 엑센딘-4를, 프라이머 GAL100 (서열번호 10) 및 GT50R (서열번호 14) 각각을 사용한 11번의 상이한 중복 연장 PCR에 대한 주형으로 사용하였다. 각각의 연장된 PCR 단편을 상기 기재된 바와 같이 EcoRI-SalI 절단시킨 YEGα-HIR525로 형질전환시켰다. 각각의 형질전환으로부터의 2개의 형질전환체를 YPDG (1% 효모 추출물, 2% 펩톤, 1% 글루코스 및 1% 갈락토스)에서 40시간 동안 배양하였다. 상등액으로부터의 샘플 0.6 ml를 아세톤 0.4 ml를 사용하여 농축시키고, SDS-PAGE에 의해 도 18에 제시된 바와 같이 분석하였다. 6개의 융합 단백질 (GAS3-EXD4, GAS5-EXD4, PST1-EXD4, SCW4-EXD4, YGP1-EXD4, 및 YPS1-EXD4)은 세포외 배지로 효율적으로 분비됨이 밝혀졌다.
실시예 5는 효모 시크리톰으로부터 선택된 고분비된 단백질이 재조합 단백질의 분비 생성에 대한 분비 융합 파트너로 작용함을 제시하였다. 실시예 5에서는 효모 분비된 단백질을 사용하였지만, 임의의 유기체의 분비된 폴리펩티드, 예컨대 명세서 전반에 기재된 것들을 사용할 수 있다. 이 실시예에 제시된 바와 같이, 본 발명의 스크리닝 방법은 가능한 후보자 SFP를 35개의 분비된 단백질에서 11개로 좁혔으며, 이중 6개가 효과적인 SFP로 밝힌 바와 같이 SFP를 선별하기 위한 효율적 방법이다.
실시예 6
융합 파트너로서 SCW4 유전자의 최적 크기의 결정
이 실시예는 목적 단백질, 예를 들어, 엑센딘-4의 분비를 위한 융합 파트너로서 SCW4의 최적 크기의 결정을 입증하였다. 8개의 SCW4 결실 클론을 카이트-둘리틀 소수성 분석을 기초로 작제하였다 (도 19A). 8개의 SCW4 단편을 GAL100 (서열번호 10) 및 6개의 히스티딘 서열을 각각 함유하는 8개의 상이한 안티센스 프라이머 H453-H460 (서열번호 47 내지 54)로 증폭시켰다. 증폭된 단편을 YGaT92-EXD4로부터 센스 프라이머 (서열번호 55) 및 GT50R (서열번호 14)로 증폭된 EXD4 유전자와 중복 연장 PCR에 의해 프라이머, GAL100 (서열번호 10) 및 GT50R (서열번호 14)을 각각 사용하여 융합시켰다. 각각의 연장된 PCR 단편을 이전 실시예에 기재된 바와 같이 EcoRI-SalI 절단시킨 YEGα-HIR525로 형질전환시켰다. 8개의 상이한 형질전환체의 3개의 콜로니를 YPDG (1% 효모 추출물, 2% 펩톤, 1% 글루코스, 및 1% 갈락토스) 배지에서 배양하였다. 각각의 샘플에 대한 배양 브로쓰 10 마이크로리터를 SDS-PAGE (농축 없이)에서 직접 분석하였다. 도 19B에 제시된 바와 같이, SCW4의 상이한 C-말단 단편을 함유하는 SCW4-1, SCW4-2, SCW4-3 및 SCW4-4는 EXD4의 분비에 대한 융합 파트너로서 강한 활성을 보였다. EXD4에 대한 융합 파트너로서 SCW4의 최적 크기는 전체 SCW4 단백질 (380개의 아미노산) 중 169개 미만의 아미노산으로 나타났다.
YGaSCW4-1-EXD4 (도 30) 및 YGaSCW4-3-EXD4 (도 31)로 형질전환된 재조합 효모 균주를 5-L 발효기에서 유가 배양에 의해 배양하여 융합 단백질의 분비 생성을 유도하는 능력에 대해 평가하였다. 약 48시간 동안 배양 후, 배양물은 OD600이 약 130에 달하였다. 배지 10 μl를 제시된 시점에서 수집하고, 분비된 단백질에 대해 SDS-PAGE에 의해 분석하였다 (도 20). 표준 단백질 밴드와 비교하여, 분비된 SCW4-1-EXD4 (서열번호 60) 및 SCW4-3-EXD4 (서열번호 61)는 리터 당 3 그램 이상으로 측정되었다.
엔테로키나아제에 이용하여 SCW4-엑센딘 융합단백질의 분리실험을 위해, 발효 브로쓰를 엔테로키나아제로 1시간 동안 37℃에서 정제 없이 절단시켰다. 융합 단백질은 도 21에 제시된 바와 같이 SCW4 단백질 및 엑센딘-4 펩티드로 정확하게 나뉘었다. 따라서, 이들 결과는 변형된 SCW4 융합 파트너가 엑센딘-4 단백질의 수율을 유의하게 증가시키고, 정제 과정을 단순화시킨다는 것을 제시한다.
다른 단백질에 대한 일반적인 융합 파트너로서의 SCW4의 효과를 시험하였다. SCW4-1, SCW4-2, SCW4-3 및 SCW4-4를 인간 성장 호르몬 (hGH)의 분비 생성에 대해 적용하였다. hGH 유전자를 센스 프라이머 (서열번호 56) 및 안티센스 프라이머 (서열번호 57)로 증폭시켰다. 이 단편을 6개의 히스티딘의 연장 및 GAL7 터미네이터 서열로 플랭킹시켰다. PCR 증폭된 SCW4-1, -2, -3 및 -4 단편을 프라이머, GAL100 (서열번호 10) 및 GT50R (서열번호 14)를 각각 사용하여 중복 연장 PCR에 의해 hGH 유전자와 융합시켰다. 각각의 연장된 PCR 단편을 상기 기재된 바와 같이 EcoRI-SalI 절단시킨 YEGα-HIR525로 형질전환시켰다. 4개의 상이한 형질전환체의 2개의 콜로니를 YPDG (1% 효모 추출물, 2% 펩톤, 1% 글루코스, 및 1% 갈락토스) 배지에서 배양하였다. 각각의 샘플의 배양 브로쓰 10 마이크로리터를 SDS-PAGE (농축 없이)에서 직접 분석하였다. 도 22A에 제시된 바와 같이, 상이한 크기의 SCW4-hGH 융합 단백질 밴드를 각각의 샘플에 대해 검출하였다. 융합 단백질을 확인하기 위해, 배양 상등액을 엔테로키나아제와 함께 1시간 동안 37℃에서 인큐베이션시켜 융합 단백질을 절단하였다. 정확한 크기의 hGH를 SCW4-1-hGH, SCW4-2-hGH 및 SCW4-4-hGH로부터 회수하였다 (도 22B). 따라서, SCW4의 N-말단 단편은 hGH, 뿐만 아니라 EXD4의 분비에 대한 융합 파트너로서 강한 활성을 나타내었다.
YGaSCW4-2-hGH로 형질전환된 재조합 효모 균주 (도 32)를 5-L 발효기에서 유가 배양에 의해 배양하여 융합 단백질의 분비 생성을 유도하는 그의 능력에 대해 평가하였다. 약 48시간 동안 배양 후, 배지 10 μl를 제시된 시점에서 수집하고, 분비된 단백질에 대해 SDS-PAGE에 의해 분석하였다 (도 23). 표준 단백질 밴드와 비교하여, 분비된 SCW4-2-hGH (서열번호 73)는 리터 당 3 그램 초과로 측정되었다.
따라서, 실시예 6의 결과는, SCW4 및 그의 단편이 목적 단백질의 재조합 발현에 대한 융합 파트너로서 작용하고, 대량의 목적 단백질을 생성하는 데 사용될 수 있음을 시사한다.
<산업적 적용가능성>
본 발명은 시크리톰 분석에 의해 얻을 수 있는 분비 융합 파트너 (SFP)를 이용한 다양한 재조합 단백질의 초과-분비 생성 및 효율적 정제를 제공한다. 재조합 단백질은 분비 융합 파트너와의 융합 형태로 세포외 생성되고, SFP로부터 시험관내 프로테아제 처리에 의해 분리될 수 있다. 본 발명에 기재된 SFP는 바이오-제약 및 바이오-산업에서 가치있는 목적 단백질 및 폴리펩티드의 분비 수준을 현저히 향상시킨다. 본 발명의 선택/스크리닝 방법은 SFP로서 작용하는 단백질, 및 그러한 단백질의 단편 및 유도체의 선택을 가능하게 한다. 스크리닝/선택의 본 발명의 방법에 의해 선택된 SFP는 바이오-제약 및 바이오-산업에 유용한 단백질의 재조합 생성을 증진시키다. 또한 본 발명은 확인된 SFP 및 그의 단편 및 유도체를 포함한다.
이제까지 본 발명을 충분히 설명하였는바, 당업자는 본 발명의 범주 또는 그의 임의의 실시양태에 영향을 미치지 않으면서 넓거나 동등한 범위의 조건, 제형, 및 다른 파라미터 내에서 본 발명을 수행할 수 있음을 이해할 것이다. 본원에 언급된 모든 특허, 특허 출원 및 공개문헌은 그의 전문이 참고로 본원에 포함된다.
<110> Korea Research Institute of Bioscience and Biotechnology
<120> SCREENING OF ABUNDANTLY SECRETED PROTEINS AND THEIR USE AS FUSION
PARTNERS FOR THE PRODUCTION OF RECOMBINANT PROTEINS
<130> IKPA110375
<150> US61/119,972
<151> 2008-12-04
<160> 90
<170> PatentIn version 3.3
<210> 1
<211> 265
<212> PRT
<213> Saccharomyces sp.
<400> 1
Met Val Phe Gly Gln Leu Tyr Ala Leu Phe Ile Phe Thr Leu Ser Cys
1 5 10 15
Cys Ile Ser Lys Thr Val Gln Ala Asp Ser Ser Lys Glu Ser Ser Ser
20 25 30
Phe Ile Ser Phe Asp Lys Glu Ser Asn Trp Asp Thr Ile Ser Thr Ile
35 40 45
Ser Ser Thr Ala Asp Val Ile Ser Ser Val Asp Ser Ala Ile Ala Val
50 55 60
Phe Glu Phe Asp Asn Phe Ser Leu Leu Asp Asn Leu Met Ile Asp Glu
65 70 75 80
Glu Tyr Pro Phe Phe Asn Arg Phe Phe Ala Asn Asp Val Ser Leu Thr
85 90 95
Val His Asp Asp Ser Pro Leu Asn Ile Ser Gln Ser Leu Ser Pro Ile
100 105 110
Met Glu Gln Phe Thr Val Asp Glu Leu Pro Glu Ser Ala Ser Asp Leu
115 120 125
Leu Tyr Glu Tyr Ser Leu Asp Asp Lys Ser Ile Val Leu Phe Lys Phe
130 135 140
Thr Ser Asp Ala Tyr Asp Leu Lys Lys Leu Asp Glu Phe Ile Asp Ser
145 150 155 160
Cys Leu Ser Phe Leu Glu Asp Lys Ser Gly Asp Asn Leu Thr Val Val
165 170 175
Ile Asn Ser Leu Gly Trp Ala Phe Glu Asp Glu Asp Gly Asp Asp Glu
180 185 190
Tyr Ala Thr Glu Glu Thr Leu Ser His His Asp Asn Asn Lys Gly Lys
195 200 205
Glu Gly Asp Asp Asp Ile Leu Ser Ser Ile Trp Thr Glu Gly Leu Leu
210 215 220
Met Cys Leu Ile Val Ser Ala Leu Leu Leu Phe Ile Leu Ile Val Ala
225 230 235 240
Leu Ser Trp Ile Ser Asn Leu Asp Ile Thr Tyr Gly Ala Leu Glu Lys
245 250 255
Ser Thr Asn Pro Ile Lys Lys Asn Asn
260 265
<210> 2
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer T9F
<400> 2
ggatccatgg tgttcggtca gctg 24
<210> 3
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H159
<400> 3
cactccgttc aagtcgactt aattgttttt ttttattgg 39
<210> 4
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H160
<400> 4
cactccgttc aagtcgactt aatcatcgtc gccttcttta c 41
<210> 5
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H161
<400> 5
cactccgttc aagtcgactt actcttctgt tgcatattc 39
<210> 6
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H162
<400> 6
cactccgttc aagtcgactt aaaaagccca accaagagag 40
<210> 7
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H205
<400> 7
atcggtcgac ttagtcgcca gatttatctt cc 32
<210> 8
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H204
<400> 8
atcggtcgac ttaatcatct aaggagtatt catatag 37
<210> 9
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H203
<400> 9
atcggtcgac ttaatcgtca tgaacagtta aac 33
<210> 10
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer GAL100
<400> 10
gtatatggtg gtaatgccat g 21
<210> 11
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H121
<400> 11
tcttttatct aaggcgagat catcgtcgcc ttctttac 38
<210> 12
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer IL2F
<400> 12
ctcgccttag ataaaagagc acctacttca agttctac 38
<210> 13
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer IL2R
<400> 13
gtcactccgt tcaagtcgac ctaagttagt gttgagatg 39
<210> 14
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer GT50R
<400> 14
gtcattatta aatatatata tatatatatt gtcactccgt tcaagtcgac 50
<210> 15
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H120
<400> 15
tcttttatct aaggcgagct cttctgttgc atattc 36
<210> 16
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H119
<400> 16
tcttttatct aaggcgagaa aagcccaacc aagagag 37
<210> 17
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer HDK-R
<400> 17
gtcatcgtca ccgtggtgat ggtgatgatg gctcaaagtc tctt 44
<210> 18
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer HDK-F
<400> 18
caccacggtg acgatgacga taaacatggt gaaggtactt tc 42
<210> 19
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer EXD-R
<400> 19
gtcactccgt tcaagtcgac ttaagatggt ggtggag 37
<210> 20
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H307
<400> 20
gatgctttta ccatctaagg agtattcata 30
<210> 21
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H306
<400> 21
tccttagatg gtaaaagcat cgttttgttc 30
<210> 22
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H309
<400> 22
cgccagattt accttccaaa aacgataagc 30
<210> 23
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H308
<400> 23
tttttggaag gtaaatctgg cgacaatttg 30
<210> 24
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H221
<400> 24
ctcgccttag ataaaagagt tattaactct cttggttg 38
<210> 25
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer LNK-R
<400> 25
cttttatcta aggcgaggcc agcagaggcc gaggcggcca ccccttcttc ttta 54
<210> 26
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H412
<400> 26
ctcgccttag ataaaagaca tggtgaaggt actttc 36
<210> 27
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H413
<400> 27
accaagagag ttaataacag atggtggtgg agcacc 36
<210> 28
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer HL-F
<400> 28
gttattaact ctcttggttg 20
<210> 29
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer HL-GT50R
<400> 29
cactccgttc aagtcgactt agtggtgatg gtgatgatgg 40
<210> 30
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer DDK-R
<400> 30
cttatcgtca tcgtcaccgt ggtg 24
<210> 31
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H410
<400> 31
ggtgacgatg acgataagaa ctccgactcc gagtgtc 37
<210> 32
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H411
<400> 32
cactccgttc aagtcgactt actatcatct cagctc 36
<210> 33
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H310
<400> 33
ggtgacgatg acgataagtc tgtgagtgaa atacagc 37
<210> 34
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer H311
<400> 34
cactccgttc aagtcgactt actgggattt agctttag 38
<210> 35
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<220>
<221> misc_feature
<222> (20)..(37)
<223> n is a, c, g, or t
<400> 35
gaaaattcaa gaattcatgn nnnnnnnnnn nnnnnnn 37
<210> 36
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<220>
<221> misc_feature
<222> (21)..(38)
<223> n is a, c, g, or t
<400> 36
actccgttca agtcgactta nnnnnnnnnn nnnnnnnn 38
<210> 37
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<220>
<221> misc_feature
<222> (19)..(36)
<223> n is a, c, g, or t
<400> 37
gaaagtacct tcaccatgnn nnnnnnnnnn nnnnnn 36
<210> 38
<211> 798
<212> DNA
<213> Artificial Sequence
<220>
<223> Modified yeast SFP1-91
<400> 38
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatgata acaacaaggg taaagaaggc gacgatgata ttttaagctc catctggact 660
gaaggactac taatgtgttt aatagtttct gcgttgctat tgttcatttt gattgttgca 720
ctttcttgga tatctaattt ggatatcaca tatggtgcgt tggaaaaatc aacaaaccca 780
ataaaaaaaa acaattaa 798
<210> 39
<211> 639
<212> DNA
<213> Artificial Sequence
<220>
<223> Modified yeast SFP1-92
<400> 39
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatgata acaacaaggg taaagaaggc gacgatgat 639
<210> 40
<211> 591
<212> DNA
<213> Artificial Sequence
<220>
<223> Modified yeast SFP1-93
<400> 40
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga g 591
<210> 41
<211> 552
<212> DNA
<213> Artificial Sequence
<220>
<223> Modified yeast SFP1-94
<400> 41
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt tt 552
<210> 42
<211> 639
<212> DNA
<213> Artificial Sequence
<220>
<223> Modified yeast SFP1-921
<400> 42
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatggtaa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatgata acaacaaggg taaagaaggc gacgatgat 639
<210> 43
<211> 639
<212> DNA
<213> Artificial Sequence
<220>
<223> Modified yeast SFP1-922
<400> 43
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaagg taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatgata acaacaaggg taaagaaggc gacgatgat 639
<210> 44
<211> 639
<212> DNA
<213> Artificial Sequence
<220>
<223> Modified yeast SFP1-923
<400> 44
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatggtaa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaagg taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatgata acaacaaggg taaagaaggc gacgatgat 639
<210> 45
<211> 114
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic modified HL domain
<400> 45
gttattaact ctcttggttg ggcttttgaa gatgaagatg gtgacgatga atatgcaaca 60
gaagagactt tgagccatca tgataacaac aagggtaaag aaggcgacga tgat 114
<210> 46
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer EXD-F
<400> 46
catggtgaag gtactttc 18
<210> 47
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<400> 47
cgtggtgatg gtgatgatga gcagcagcgg tagctac 37
<210> 48
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<400> 48
cgtggtgatg gtgatgatgg gaggctggag atgcggc 37
<210> 49
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<400> 49
cgtggtgatg gtgatgatga cctctgacac cagaggc 37
<210> 50
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<400> 50
cgtggtgatg gtgatgatgg tacaatctaa tgactgg 37
<210> 51
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<400> 51
cgtggtgatg gtgatgatgg tagtaaatac ctaaaaag 38
<210> 52
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<400> 52
cgtggtgatg gtgatgatgt tcgttaccaa tggaaac 37
<210> 53
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<400> 53
cgtggtgatg gtgatgatgg ttgttgatca cagcaat 37
<210> 54
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<400> 54
cgtggtgatg gtgatgatgg aaggcagtga ataagaag 38
<210> 55
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<400> 55
catcatcacc atcaccacgg tgacgatgac gataagcatg gtgaaggtac tttc 54
<210> 56
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<400> 56
catcatcacc atcaccacgg tgacgatgac gataagttcc caaccattcc ctta 54
<210> 57
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer
<400> 57
cactccgttc aagtcgactt agaagccaca gctgccctc 39
<210> 58
<211> 1059
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic YG2T92-IL2
<400> 58
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatgata acaacaaggg taaagaaggc gacgatgatc tcgccttaga taaaagagca 660
cctacttcaa gttctacaaa gaaaacacag ctacaactgg agcatttact gctggattta 720
cagatgattt tgaatggaat taataattac aagaatccca aactcaccag gatgctcaca 780
tttaagtttt acatgcccaa gaaggccaca gaactgaaac atcttcagtg tctagaagaa 840
gaactcaaac ctctggagga agtgctaaat ttagctcaaa gcaaaaactt tcacttaaga 900
cccagggact taatcagcaa tatcaacgta atagttctgg aactaaaggg atctgaaaca 960
acattcatgt gtgaatatgc tgatgagaca gcaaccattg tagaatttct gaacagatgg 1020
attacctttt gtcaaagcat catctcaaca ctaacttaa 1059
<210> 59
<211> 756
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic YGaT923-EXD4
<400> 59
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acagcttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttgc aaatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatggtaa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaagg taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatcacc atcaccacgg tgacgatgac gataagcatg gtgaaggtac tttcacctct 660
gatttgtcta agcaaatgga agaagaagct gttagattgt tcttggaatg gttgaagaac 720
ggtggtccat cctccggtgc tccaccacca tcttaa 756
<210> 60
<211> 408
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic SCW4-1-EXD4
<400> 60
atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60
cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120
accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180
gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240
accgctgctg ctcatcatca ccatcaccac ggtgacgatg acgataagca tggtgaaggt 300
actttcacct ctgatttgtc taagcaaatg gaagaagaag ctgttagatt gttcttggaa 360
tggttgaaga acggtggtcc atcctccggt gctccaccac catcttaa 408
<210> 61
<211> 561
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic SCW4-3-EXD4
<400> 61
atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60
cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120
accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180
gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240
accgctgctg cttcctcttc tgagaacaac tcacaagttt ctgctgccgc atctccagcc 300
tccagctctg ctgctacatc tactcaatct tcctcttcct cccaagcttc ttcctctagt 360
tcttccggcg aagacgtcag cagctttgcc tctggtgtca gaggtcatca tcaccatcac 420
cacggtgacg atgacgataa gcatggtgaa ggtactttca cctctgattt gtctaagcaa 480
atggaagaag aagctgttag attgttcttg gaatggttga agaacggtgg tccatcctcc 540
ggtgctccac caccatctta a 561
<210> 62
<211> 942
<212> DNA
<213> Saccharomyces sp.
<400> 62
atgcgtttct ctactacact cgctactgca gctactgcgc tatttttcac agcctcccaa 60
gtttcagcta ttggtgaact agcctttaac ttgggtgtca agaacaacga tggtacttgt 120
aagtccactt ccgactatga aaccgaatta caagctttga agagctacac ttccaccgtc 180
aaagtttacg ctgcctcaga ttgtaacact ttgcaaaact taggtcctgc tgctgaagct 240
gagggattta ctatctttgt cggtgtttgg ccaacagacg acagtcatta cgctgctgaa 300
aaggctgctt tgcaaaccta tttgccaaaa attaaagaat ccactgttgc tggtttcttg 360
gttggttctg aagccttata ccgtaacgat ttgactgcct ctcaattatc agacaaaatt 420
aatgacgtcc gtagtgtcgt tgctgacatt tccgattctg acggaaagtc atactctggt 480
aagcaagtcg gtactgtcga ttcctggaat gttttggttg ctggttacaa ttctgccgtt 540
atcgaagctt ccgattttgt tatggctaac gcgttctcct actggcaagg tcaaaccatg 600
caaaatgcct cttactcatt ctttgatgat attatgcaag ctctacaggt tatccaatct 660
actaaaggtt ctaccgatat taccttctgg gttggtgaga ccggttggcc aactgatggt 720
accaactttg aaagttctta cccatctgtt gacaacgcca aacaattctg gaaagaaggt 780
atctgttcca tgagagcttg gggtgttaac gttattgttt ttgaagcctt tgatgaagat 840
tggaagccaa acacctctgg tacctctgat gtcgagaagc actggggtgt tttcacttca 900
agtgacaatt tgaaatactc cttggactgt gacttttcat ga 942
<210> 63
<211> 1575
<212> DNA
<213> Saccharomyces sp.
<400> 63
atgcaactat ctaaaagtat actactggca gcattagctg ctacaccatc tctggtgaat 60
gccatgctcc ccatccatat caagaattat aggttcatta agccatcctc tgccacaaat 120
agcgaatccg ataacgaagt tttttttgtg aaaggtgtcg attatcagcc tggtgggtcg 180
tctggttacg atgctgactc tgatacagat attctttctg accctgaagt gtgtgccaga 240
gacgcctacg ctttccaaca acttggtgtc aacacagtga gaatttactc cctgaaccct 300
gacctaaatc atgacaagtg catgactatc ttcaacaatg ctggtatcta cgccattttg 360
gatgttaata gtggtaatta cggggagagt ttgaaccgtg ctgacccatc tggaacatat 420
gactctttgt atttgtcaag agtcttcaaa tttattgacg ctttcaagaa ctaccctaac 480
gtgctaggat tcttttctgg caacgaagtc ataaatgatc aaagcgacta tgcaaaaatt 540
gatcctccat acatccgcgc tgttcaaaga gatatgaaac agtatatttc aaaacatgcg 600
aacagaagca tcccagtcgg atattctgct gctgacaata ctgatttgag gttagcaacc 660
ttcaagtact tgcagtgtaa ttcgttggat ggaaacaaag tcaatgatga tttggacata 720
tctaaatctg atttctttgg cctaaatact tatgaatggt gctctggcac ttctagttgg 780
gaatcttctg gctatgacaa gttaaactca actttcgaag atgctgttat tccgttgata 840
ttttctgagt atggttgcaa caaaaataca ccaagaactt ttgacgaagt ctctgagggt 900
ttgtatggtg gtttaaagaa cgtcttctct ggtgggttgg tatacgaata cactgaagaa 960
gctaataatt acggtttggt taagcttgat gatagcggtt ctttaactta taaggatgat 1020
tttgttaatt tagaatcaca attgaagaac gtttcattgc caacaacaaa agaaagcgaa 1080
atatcttctg actctatcta caagtgcgat aacagtgcca tcaccaatat ttattctggc 1140
tttggaacga acaatttcac tttgccttct caaccagcag aaattgccaa tatgattgaa 1200
tacggtgtta atggcaccaa caccggtaag atattgactg attatgctgt tccaactact 1260
tttaactata caattaaaaa caataaagat gataccattt cagctactat ttcatacgac 1320
aaagctaact cactgaacga actagacgtc acagccacaa cggtcgcaaa gtcagcttcc 1380
acatcacaat catcttctcg ctccttaact tcaagcacca gtccatcttc aagcactggc 1440
tcatcttcaa gcaccggttc atcttcagct tcaagcagct ccaaaagtaa aggcgtcgga 1500
aatattgtta atgtttcctt tagtcagtct ggataccttg cattatttgc aggtctgatt 1560
tctgctctac tctga 1575
<210> 64
<211> 1455
<212> DNA
<213> Saccharomyces sp.
<400> 64
atgttactac gttctcttac aagtgccttc gttttaagtg ctggtttggc tcaggctgct 60
agcagcagta acagttccac accatccatt gaaattaaag gcaatgcatt ttttaattcg 120
gaatcaggtg aaaggtttta tatccgtggt gttgattacc agcctggtgg ttcttctaac 180
ttgactgatc ccttagcaga cgcatctgtc tgtgacagag acgtccccgt tctgaaagat 240
ctagggataa atactgtcag agtttatact gtggataact cgcaagatca ttcccattgt 300
atgaaactat tgcaggagaa cggtatatac ttgatcctgg atgtcaatac ccccacgagt 360
gctatttctc gttacgatcc agcctgctcc tataacgctg actacttaca aaatgtcttt 420
gccaccattg atacctttgc tgattacgac aatgttctag gttttttcgc tggtaacgag 480
gtcatcaata gtgttaatac taccaacact gctacttatg tcaaggcagt ggtcagggac 540
atgaagaaat acatcaaggc tagaaaatac agacaaattc cggtaggtta ctcggctgct 600
gatatcgtcg ctaacagaca attggctgct gaatacttta actgtggtga tgaagctgac 660
gctagaatcg acatgtttgg tgttaatgac tattcttggt gtggtgaatc ttcatttgtg 720
gtatcgggtt attccaccaa gatgaagcta tatcaagatt actccgttcc tgtcttctta 780
agtgaatttg gttgtaacca agtcaagagc tctcgtccat tcacagaaat tgaagctatc 840
tattccactc aaatgtcttc tgtattctcc ggtgggctag tctacgaata ttccaatgaa 900
actaacaatt acgggctcgt tcaaattgat ggtgacaagg tcactaaatt gacagatttt 960
gaaaacttga aaaatgaata cagcaaagta tccaacccag aaggcaatgg tggttacagt 1020
acttccaaca actattctac atgtcctgat tatgaaaagg gtgtctggga agctaataac 1080
actttgcctg ctatgccaag tgctgcttct gcttacttca catctggagc aggttctcct 1140
atgggaaccg gaatcgccac ccaacaaagt tgtgatgcta aggacgatga cgacgaagaa 1200
gacgacgaca cctcctcttc atcctcttct tcctcttcat cttcatcttc cgcttcttca 1260
tcttctgaat catcatcctc gacttcaaag gcatcttcct cctccccttc tgctagcgaa 1320
acgagcttgc taaaatctgc cgcatctgct acttcgtcca gccaatcgtc ctcgaaatca 1380
aagggtgctg ccggaattat tgagattcct ttgatattcc gtgctttggc agaactttat 1440
aacttggttt tatga 1455
<210> 65
<211> 1335
<212> DNA
<213> Saccharomyces sp.
<400> 65
atgcaattac attcacttat cgcttcaact gcgctcttaa taacgtcagc tttggctgct 60
acttcctctt cttccagcat accctcttcc tgtaccataa gctcacatgc cacggccaca 120
gctcagagtg acttagataa atatagccgc tgtgatacgt tagtcgggaa cttaactatt 180
ggtggtggtt tgaagactgg tgctttggct aatgttaaag aaatcaacgg gtctctaact 240
atatttaacg ctacaaatct aacctcattc gctgctgatt ccttggagtc catcacagat 300
tctttgaacc tacagagttt gacaatcttg acttctgctt catttgggtc tttacagagc 360
gttgatagta taaaactgat tactctaccc gccatctcca gttttacttc aaatatcaaa 420
tctgctaaca acatttatat ttccgacact tcgttacaat ctgtcgatgg attctcagcc 480
ttgaaaaaag ttaacgtgtt caacgtcaat aacaataaga aattaacctc gatcaaatct 540
ccagttgaaa cagtcagcga ttctttacaa ttttcgttca acggtaacca gactaaaatc 600
accttcgatg acttggtttg ggcaaacaat atcagtttga ccgatgtcca ctctgtttcc 660
ttcgctaact tgcaaaagat taactcttca ttgggtttca tcaacaactc catctcaagt 720
ttgaatttca ctaagctaaa caccattggc caaaccttca gtatcgtttc caatgactac 780
ttgaagaact tgtcgttctc taatttgtca accataggtg gtgctcttgt cgttgctaac 840
aacactggtt tacaaaaaat tggtggtctc gacaacctaa caaccattgg cggtactttg 900
gaagttgttg gtaacttcac ctccttgaac ctagactctt tgaagtctgt caagggtggc 960
gcagatgtcg aatcaaagtc aagcaatttc tcctgtaatg ctttgaaagc tttgcaaaag 1020
aaagggggta tcaagggtga atcttttgtc tgcaaaaatg gtgcatcatc cacatctgtt 1080
aaactatcgt ccacttccaa atctcaatca agccaaacta ctgccaaggt ttccaagtca 1140
tcttctaagg ccgaggaaaa gaagttcact tctggcgata tcaaggctgc tgcttctgcc 1200
tctagtgttt ctagttctgg cgcttccagc tctagctcta agagttccaa aggcaatgcc 1260
gctatcatgg caccaattgg ccaaacaacc cctttggtcg gtcttttgac ggcaatcatc 1320
atgtctataa tgtaa 1335
<210> 66
<211> 1161
<212> DNA
<213> Saccharomyces sp.
<400> 66
atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60
cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120
accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180
gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240
accgctgctg cttcctcttc tgagaacaac tcacaagttt ctgctgccgc atctccagcc 300
tccagctctg ctgctacatc tactcaatct tcctcttcct cccaagcttc ttcctctagt 360
tcttccggcg aagacgtcag cagctttgcc tctggtgtca gaggtatcac ttatacccca 420
tacgagtcca gcggtgcttg taaatccgct tcggaagttg cttccgattt agctcaattg 480
actgacttcc cagtcattag attgtacggt accgactgta accaagttga aaatgttttc 540
aaggctaagg cttcgaacca aaaagtcttt ttaggtattt actacgttga ccaaatccaa 600
gacggtgtca acaccatcaa gtctgctgtt gaatcttacg gttcttggga cgatgtcacc 660
actgtttcca ttggtaacga attggttaac ggtaaccaag ctaccccatc ccaagtcggt 720
caatacattg actctggtag atctgccttg aaggctgccg gttacactgg tccagttgtt 780
tctgttgata cttttattgc tgtgatcaac aaccctgaat tgtgtgacta ctccgactac 840
atggctgtta atgcccatgc ttactttgac aagaacacag ttgcccaaga ctccggtaaa 900
tggttactag aacaaatcca aagagtctgg actgcttgtg atggtaagaa gaatgttgtt 960
atcactgagt ctggttggcc atcaaagggt gagacttacg gtgttgctgt tccatctaag 1020
gaaaatcaaa aggacgctgt ttccgccatt accagctcct gtggtgctga taccttctta 1080
ttcactgcct tcaacgacta ctggaaggcc gacggtgctt acggtgttga aaaatactgg 1140
ggtattctat ccaatgaata a 1161
<210> 67
<211> 1170
<212> DNA
<213> Saccharomyces sp.
<400> 67
atgcgttttt caaatttcct aactgtatct gcattattaa ccggagctct aggagctcct 60
gctgttcgcc ataaacatga aaagcgtgac gttgttactg ccacagtcca tgcgcaggtt 120
actgttgtcg tttccggtaa cagcggcgaa actattgttc cagtgaacga gaatgctgtt 180
gtagctacta ccagcagtac tgcagttgct tctcaagcaa ctacatccac tttagaacca 240
acaacttccg ctaatgtcgt cacttctcaa caacaaacca gcactcttca atcttccgag 300
gcagcatcta cggttggttc ttcgacttca tcctcaccct catcctcatc ctcaacttca 360
tcttcagctt catcctccgc ttcatctagt atctcagcct ccggtgctaa gggtattact 420
tacagtcctt acaatgatga tgggtcctgt aaatctactg ctcaagtcgc ctcagattta 480
gaacagttga ctggttttga caacatcaga ttatatggcg ttgactgtag tcaggttgag 540
aatgtcttgc aagctaaaac ttcaagccag aaattattct taggcatata ttacgttgac 600
aaaattcaag acgccgttga tactattaaa tctgcagttg agtcttatgg ctcctgggat 660
gatattacca ctgtttctgt cggtaacgaa ctggtcaatg gcggttctgc cactacgacg 720
caagtcggtg aatacgtttc cacggccaag tcagctttaa cctctgctgg ttatacaggc 780
tcagtcgttt ccgttgatac cttcattgct gttataaata accctgacct gtgtaattat 840
tctgactata tggctgtcaa cgcccatgca tacttcgatg aaaatactgc ggcccaagat 900
gcaggaccat gggtactaga acaaatcgaa agggtttaca ctgcttgtgg tgggaaaaag 960
gacgtcgtta ttaccgaaac tggttggcca tctaagggtg atacttacgg cgaagctgtc 1020
ccatctaaag caaaccaaga agccgccatt tcttctatca aaagctcctg cggctcttca 1080
gcttacttat ttaccgcctt caatgatcta tggaaagatg atgggcaata cggtgttgaa 1140
aaatactggg gtattctatc aagtgattaa 1170
<210> 68
<211> 1428
<212> DNA
<213> Saccharomyces sp.
<400> 68
atgaaattct caactgccgt tactacgttg attagttctg gtgccatcgt gtctgcttta 60
ccacacgtgg atgttcacca agaagatgcc caccaacata agagggccgt tgcgtacaaa 120
tacgtttacg aaactgttgt tgtcgattct gatggccaca ctgtaactcc tgctgcttca 180
gaagtcgcta ctgctgctac ctctgctatc attacaacat ctgtgttggc tccaacctcc 240
tccgcagccg ctgggatagc cgcttccatt gctgtttcat ctgctgcctt agccaagaat 300
gagaaaatct ctgatgccgc tgcatctgcc actgcctcaa catctcaagg ggcatcctcc 360
tcctcctcct cctcctcggc aacttctacc ctagaaagca gctctgtttc ttcatctagt 420
gaagaagctg ctccaacatc tactgtcgtg tcaacttctt ccgcaaccca atctagtgct 480
tcttctgcca ctaaatctag tacttcttcc acttcaccat ctacttctac ttctacttcc 540
acttcttcta cttcctcttc ctcttcctcc tcctcctcct cttcttcttc ttcttctggc 600
agtggtagta tctacggtga tttggccgac ttttcaggcc caagtgagaa attccaagac 660
ggcactattc catgtgacaa attcccatct ggtcaaggtg tcatttctat tgactggatt 720
ggcgagggtg gatggtccgg tgtggaaaac accgacactt ccactggcgg ttcatgcaag 780
gaggggtcct actgttccta ctcctgccaa ccaggtatgt ctaagaccca atggccatcc 840
gatcaaccat ctgacggtag atctgtcggg ggtttgttgt gtaaaaatgg ttatttgtac 900
cgttctaaca ctgacgcgga ttacttatgt gaatggggtg tcgaggctgc ctatgttgtt 960
tctaaactaa gcaagggtgt cgccatttgc agaaccgact acccgggcac tgaaaacatg 1020
gttatcccaa cctatgttga agggggtagc tctttgccat tgaccgttgt tgaccaagat 1080
acttacttta cttgggaagg caaaaagaca tctgctcaat actacgttaa taacgccggc 1140
gtctcagttg aagatgggtg tatctggggt acttctggat ctggtattgg taactgggca 1200
ccattaaact ttggtgctgg ctccactggt ggagtgacat acttatcatt gattcctaac 1260
ccaaacaaca gcgacgcatt gaactacaac gtcaagatag ttgctgctga tgattcatcc 1320
aatgtcatcg gtgaatgtgt ttacgaaaat ggtgagttct ctggcggtgc tgacgggtgt 1380
accgtctctg ttacttccgg taaagctcat ttcgtcttat acaattaa 1428
<210> 69
<211> 1098
<212> DNA
<213> Saccharomyces sp.
<400> 69
atgaaattat ccgctctatt agctttatca gcctccaccg ccgtcttggc cgctccagct 60
gtccaccata gtgacaacca ccaccacaac gacaagcgtg ccgttgtcac cgttactcag 120
tacgtcaacg cagacggcgc tgttgttatt ccagctgcca ccaccgctac ctcggcggct 180
gctgatggaa aggtcgagtc tgttgctgct gccaccacta ctttgtcctc gactgccgcc 240
gccgctacta cctctgccgc cgcctcttct tcctcctctt cctcttcctc ctcttcctct 300
tcttcctctg ttggttctgg agattttgaa gatggtacca tttcctgttc tgatttccca 360
tccggacaag gtgctgtctc cttggactgg ttaggtctag gcggctgggc ttccatcatg 420
gacatgaacg gtaacaccgc cacctcttgt caagacggat actactgttc ttacgcttgt 480
tctccaggtt acgctaagac ccaatggcct tctgaacaac cttccgatgg tagatccgtt 540
ggtggtttat actgtaagaa cggtaaatta taccgttcca acaccgacac taacagtttg 600
tgtgtagaag gtcaaggctc tgctcaagct gttaacaagg tctccggctc cattgctatc 660
tgtggtaccg attatccagg ttctgaaaac atggtcgttc ctaccgtagt tggcgctggt 720
tcctcccaac caatcaacgt catcaaggag gactcctact atcaatggca aggtaagaag 780
acctctgccc aatactacgt taacaacgct ggtgtctctg tggaagatgg ttgtatctgg 840
ggtactgagg gttccggtgt cggtaactgg gccccagttg tcttgggtgc tggttacact 900
gatggtatca cttacttgtc catcattcca aacccaaaca acaaagaagc accaaacttt 960
aacatcaaga tcgttgccac cgatggctct accgtcaatg gtgcttgctc ttacgaaaat 1020
ggtgtctact ctggctctgg ctctgacggt tgtactgttt cagttacttc tggttctgct 1080
aactttgtct tctactag 1098
<210> 70
<211> 1065
<212> DNA
<213> Saccharomyces sp.
<400> 70
atgaagttcc aagttgtttt atctgccctt ttggcatgtt catctgccgt cgtcgcaagc 60
ccaatcgaaa acctattcaa atacagggct gttaaggcat ctcacagtaa gaatatcaac 120
tccactttgc cggcctggaa tgggtctaac tctagcaatg ttacctacgc taatggaaca 180
aacagtacta ccaatactac tactgccgaa agcagtcaat tacaaatcat tgtaacaggt 240
ggtcaagtac caatcaccaa cagttctttg acccacacaa actacaccag attattcaac 300
agttcttctg ctttgaacat taccgaattg tacaatgttg cccgtgttgt taacgaaacg 360
atccaagata agtcatccgc cggtgccgtt gttgttgcca acgccaaatc tttggaagct 420
gtctcattct tcttctctat catttttgac accgaaaagc ctattgttgt cactgaagat 480
tccgcttatg ccattccagt cgctaacaat aagaacgcta ccaaacgtgg tgtcttgtcc 540
gtcacttctg acaaattagt gtactccggt gtcttcactc cacctactgc ttgttcttac 600
ggtgctggtt tgcctgttgc tatcgttgat gaccaagacg aagttaaatg gttcttcgat 660
gcttctaagc caactttaat ctcttctgac tcgattatca gaaaggaata cagtaacttc 720
actactcctt atggtctatt agaaaacggt gttccaattg ttccaattgt ctatgacggt 780
ggttactctt ccagtttgat tgactccttg agttctgccg ttcaaggttt ggttgttgtt 840
tcttctggtt ctaccaactc aacctcatct actattgaaa gcactgaaat cccagtcgta 900
tatgctcaag ctaacactcc attaaacttt attgacaaca aagatgttcc aaagaacgct 960
gtgggtgctg gttacctatc cccaattaag gcccaaatct tgttgtccat tgctgccgtt 1020
aatggtgtca cctccaagtc cgctctggaa agcattttcc catga 1065
<210> 71
<211> 1710
<212> DNA
<213> Saccharomyces sp.
<400> 71
atgaaactga aaactgtaag atctgcggtc ctttcgtcac tctttgcatc gcaggttctc 60
ggtaagataa taccagcagc aaacaagcgc gacgacgact cgaattccaa gttcgtcaag 120
ttgccctttc ataagcttta cggggactcg ctagaaaatg tgggaagcga caaaaaaccg 180
gaagtacgcc tattgaagag ggctgacggt tatgaagaaa ttataattac caaccagcaa 240
agtttctatt cggtggactt ggaagtgggc acgccaccac agaacgtaac ggtcctggtg 300
gacacaggct cctctgatct atggattatg ggctcggata atccatactg ttcttcgaac 360
agtatgggta gtagccggag acgtgttatt gacaaacgtg atgattcgtc aagcggcgga 420
tctttgatta atgatataaa cccatttggc tggttgacgg gaacgggcag tgccattggc 480
cccactgcta cgggcttagg aggcggttca ggtacggcaa ctcaatccgt gcctgcttcg 540
gaagccacca tggactgtca acaatacggg acattttcca cttcgggctc ttctacattt 600
agatcaaaca acacctattt cagtattagc tacggtgatg ggacttttgc ctccggtact 660
tttggtacgg atgttttgga tttaagcgac ttgaacgtta ccgggttgtc ttttgccgtt 720
gccaatgaaa cgaattctac tatgggtgtg ttaggtattg gtttgcccga attagaagtc 780
acttattctg gctctactgc gtctcatagt ggaaaagctt ataaatacga caacttcccc 840
attgtattga aaaattctgg tgctatcaaa agcaacacat attctttgta tttgaacgac 900
tcggacgcta tgcatggcac cattttgttc ggagccgtgg accacagtaa atataccggc 960
accttataca caatccccat cgtaaacact ctgagtgcta gtggatttag ctctcccatt 1020
caatttgatg tcactattaa tggtatcggt attagtgatt ctgggagtag taacaagacc 1080
ttgactacca ctaaaatacc tgctttgttg gattccggta ctactttgac ttatttacct 1140
caaacagtgg taagtatgat cgctactgaa ctaggtgcgc aatactcttc caggataggg 1200
tattacgtat tggactgtcc atctgatgat agtatggaaa tagtgttcga ttttggtggt 1260
tttcacatca atgcaccact ttcgagtttt atcttgagta ctggcactac atgtctttta 1320
ggtattatcc caacgagtga tgacacaggt accattttgg gtgattcatt tttgactaac 1380
gcgtacgtgg tttatgattt ggagaatctt gaaatatcca tggcacaagc tcgctataat 1440
accacaagcg aaaatatcga aattattaca tcctctgttc caagcgccgt aaaggcacca 1500
ggctatacaa acacttggtc cacaagtgca tctattgtta ccggtggtaa catatttact 1560
gtaaattcct cacaaactgc ttcctttagc ggtaacctga cgaccagtac tgcatccgcc 1620
acttctacat caagtaaaag aaatgttggt gatcatatag ttccatcttt acccctcaca 1680
ttaatttctc ttctttttgc attcatctga 1710
<210> 72
<211> 750
<212> DNA
<213> Saccharomyces sp.
<400> 72
atgaagttct cttccggcaa atctatcatc tttgcaacta ttgcttctct agctttgagt 60
gctcctgtca cttacgacac caactctact gctgagttac aatctccttc atctcaagaa 120
attctgggtt ggagtcacgc aacttttcct accatttacc aaacctgtaa tgagacgaac 180
gcaagaatgt tgaatgcagc ttttaaggat accgctgaaa tcaccgctta tggtaaagat 240
agacttttga actatggtgt cgatgacgtt tactacaaaa gatggtttgg taatggtagt 300
attttcaccg tcatgggtgt ctttgagcaa ttgatggagg cttccaaggg tgccatgctc 360
atgagatgtg atgatattga tggcttgtgt gcagctaatc caaactatta cgctggtcat 420
caccgtcaat ctgctccagc tgaaactgtt atttgtgatt acttctacac ttccaaaaag 480
ccactatcaa caatttgttt cgaaggtact attgtcgatg tcggtccaaa acattatgca 540
ggtattgata tgttacatcg ttacttgcac gtccctacca tgagtatgga tggatatgtt 600
ggcgagtacg cggaaactct tgaagaagtt gtggactaca cccagaacaa tgctacttac 660
gcagttagaa acaccgacaa ctatctttac tatctcgctg acgtttacag tgcttctgtt 720
atacctggtg gctgtctagg taacttgtaa 750
<210> 73
<211> 915
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic SCW4-2-hGH
<400> 73
atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60
cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120
accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180
gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240
accgctgctg cttcctcttc tgagaacaac tcacaagttt ctgctgccgc atctccagcc 300
tcccatcatc accatcacca cggtgacgat gacgataagt tcccaaccat tcccttatcc 360
aggctttttg acaacgctat gctccgcgcc catcgtctgc accagctggc ctttgacacc 420
taccaggagt ttgaagaagc ctatatccca aaggaacaga agtattcatt cctgcagaac 480
ccccagacct ccctctgttt ctcagagtct attccgacac cctccaacag ggaggaaaca 540
caacagaaat ccaacctaga gctgctccgc atctccctgc tgctcatcca gtcgtggctg 600
gagcccgtgc agttcctcag gagtgtcttc gccaacagcc tggtgtacgg cgcctctgac 660
agcaacgtct atgacctcct aaaggaccta gaggaaggca tccaaacgct gatggggagg 720
ctggaagatg gcagcccccg gactgggcag atcttcaagc agacctacag caagttcgac 780
acaaactcac acaacgatga cgcactactc aagaactacg ggctgctcta ctgcttcagg 840
aaggacatgg acaaggtcga gacattcctg cgcatcgtgc agtgccgctc tgtggagggc 900
agctgtggct tctaa 915
<210> 74
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic yeast kex2-like protease recognition sequence
<400> 74
Leu Asp Lys Arg
1
<210> 75
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic factor Xa-recognition sequence
<400> 75
Ile Glu Gly Arg
1
<210> 76
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic subtilisin-recognition sequence
<400> 76
Ala Ala His Tyr
1
<210> 77
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic tobacco etch virus protease-recognition sequence
<400> 77
Glu Asn Leu Tyr Phe Gln Gly
1 5
<210> 78
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic thrombin-recognition sequence
<400> 78
Arg Gly Pro Arg
1
<210> 79
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic enterokinase cleavage sequence
<400> 79
Asp Asp Asp Asp Lys
1 5
<210> 80
<211> 313
<212> PRT
<213> Saccharomyces sp.
<400> 80
Met Arg Phe Ser Thr Thr Leu Ala Thr Ala Ala Thr Ala Leu Phe Phe
1 5 10 15
Thr Ala Ser Gln Val Ser Ala Ile Gly Glu Leu Ala Phe Asn Leu Gly
20 25 30
Val Lys Asn Asn Asp Gly Thr Cys Lys Ser Thr Ser Asp Tyr Glu Thr
35 40 45
Glu Leu Gln Ala Leu Lys Ser Tyr Thr Ser Thr Val Lys Val Tyr Ala
50 55 60
Ala Ser Asp Cys Asn Thr Leu Gln Asn Leu Gly Pro Ala Ala Glu Ala
65 70 75 80
Glu Gly Phe Thr Ile Phe Val Gly Val Trp Pro Thr Asp Asp Ser His
85 90 95
Tyr Ala Ala Glu Lys Ala Ala Leu Gln Thr Tyr Leu Pro Lys Ile Lys
100 105 110
Glu Ser Thr Val Ala Gly Phe Leu Val Gly Ser Glu Ala Leu Tyr Arg
115 120 125
Asn Asp Leu Thr Ala Ser Gln Leu Ser Asp Lys Ile Asn Asp Val Arg
130 135 140
Ser Val Val Ala Asp Ile Ser Asp Ser Asp Gly Lys Ser Tyr Ser Gly
145 150 155 160
Lys Gln Val Gly Thr Val Asp Ser Trp Asn Val Leu Val Ala Gly Tyr
165 170 175
Asn Ser Ala Val Ile Glu Ala Ser Asp Phe Val Met Ala Asn Ala Phe
180 185 190
Ser Tyr Trp Gln Gly Gln Thr Met Gln Asn Ala Ser Tyr Ser Phe Phe
195 200 205
Asp Asp Ile Met Gln Ala Leu Gln Val Ile Gln Ser Thr Lys Gly Ser
210 215 220
Thr Asp Ile Thr Phe Trp Val Gly Glu Thr Gly Trp Pro Thr Asp Gly
225 230 235 240
Thr Asn Phe Glu Ser Ser Tyr Pro Ser Val Asp Asn Ala Lys Gln Phe
245 250 255
Trp Lys Glu Gly Ile Cys Ser Met Arg Ala Trp Gly Val Asn Val Ile
260 265 270
Val Phe Glu Ala Phe Asp Glu Asp Trp Lys Pro Asn Thr Ser Gly Thr
275 280 285
Ser Asp Val Glu Lys His Trp Gly Val Phe Thr Ser Ser Asp Asn Leu
290 295 300
Lys Tyr Ser Leu Asp Cys Asp Phe Ser
305 310
<210> 81
<211> 524
<212> PRT
<213> Saccharomyces sp.
<400> 81
Met Gln Leu Ser Lys Ser Ile Leu Leu Ala Ala Leu Ala Ala Thr Pro
1 5 10 15
Ser Leu Val Asn Ala Met Leu Pro Ile His Ile Lys Asn Tyr Arg Phe
20 25 30
Ile Lys Pro Ser Ser Ala Thr Asn Ser Glu Ser Asp Asn Glu Val Phe
35 40 45
Phe Val Lys Gly Val Asp Tyr Gln Pro Gly Gly Ser Ser Gly Tyr Asp
50 55 60
Ala Asp Ser Asp Thr Asp Ile Leu Ser Asp Pro Glu Val Cys Ala Arg
65 70 75 80
Asp Ala Tyr Ala Phe Gln Gln Leu Gly Val Asn Thr Val Arg Ile Tyr
85 90 95
Ser Leu Asn Pro Asp Leu Asn His Asp Lys Cys Met Thr Ile Phe Asn
100 105 110
Asn Ala Gly Ile Tyr Ala Ile Leu Asp Val Asn Ser Gly Asn Tyr Gly
115 120 125
Glu Ser Leu Asn Arg Ala Asp Pro Ser Gly Thr Tyr Asp Ser Leu Tyr
130 135 140
Leu Ser Arg Val Phe Lys Phe Ile Asp Ala Phe Lys Asn Tyr Pro Asn
145 150 155 160
Val Leu Gly Phe Phe Ser Gly Asn Glu Val Ile Asn Asp Gln Ser Asp
165 170 175
Tyr Ala Lys Ile Asp Pro Pro Tyr Ile Arg Ala Val Gln Arg Asp Met
180 185 190
Lys Gln Tyr Ile Ser Lys His Ala Asn Arg Ser Ile Pro Val Gly Tyr
195 200 205
Ser Ala Ala Asp Asn Thr Asp Leu Arg Leu Ala Thr Phe Lys Tyr Leu
210 215 220
Gln Cys Asn Ser Leu Asp Gly Asn Lys Val Asn Asp Asp Leu Asp Ile
225 230 235 240
Ser Lys Ser Asp Phe Phe Gly Leu Asn Thr Tyr Glu Trp Cys Ser Gly
245 250 255
Thr Ser Ser Trp Glu Ser Ser Gly Tyr Asp Lys Leu Asn Ser Thr Phe
260 265 270
Glu Asp Ala Val Ile Pro Leu Ile Phe Ser Glu Tyr Gly Cys Asn Lys
275 280 285
Asn Thr Pro Arg Thr Phe Asp Glu Val Ser Glu Gly Leu Tyr Gly Gly
290 295 300
Leu Lys Asn Val Phe Ser Gly Gly Leu Val Tyr Glu Tyr Thr Glu Glu
305 310 315 320
Ala Asn Asn Tyr Gly Leu Val Lys Leu Asp Asp Ser Gly Ser Leu Thr
325 330 335
Tyr Lys Asp Asp Phe Val Asn Leu Glu Ser Gln Leu Lys Asn Val Ser
340 345 350
Leu Pro Thr Thr Lys Glu Ser Glu Ile Ser Ser Asp Ser Ile Tyr Lys
355 360 365
Cys Asp Asn Ser Ala Ile Thr Asn Ile Tyr Ser Gly Phe Gly Thr Asn
370 375 380
Asn Phe Thr Leu Pro Ser Gln Pro Ala Glu Ile Ala Asn Met Ile Glu
385 390 395 400
Tyr Gly Val Asn Gly Thr Asn Thr Gly Lys Ile Leu Thr Asp Tyr Ala
405 410 415
Val Pro Thr Thr Phe Asn Tyr Thr Ile Lys Asn Asn Lys Asp Asp Thr
420 425 430
Ile Ser Ala Thr Ile Ser Tyr Asp Lys Ala Asn Ser Leu Asn Glu Leu
435 440 445
Asp Val Thr Ala Thr Thr Val Ala Lys Ser Ala Ser Thr Ser Gln Ser
450 455 460
Ser Ser Arg Ser Leu Thr Ser Ser Thr Ser Pro Ser Ser Ser Thr Gly
465 470 475 480
Ser Ser Ser Ser Thr Gly Ser Ser Ser Ala Ser Ser Ser Ser Lys Ser
485 490 495
Lys Gly Val Gly Asn Ile Val Asn Val Ser Phe Ser Gln Ser Gly Tyr
500 505 510
Leu Ala Leu Phe Ala Gly Leu Ile Ser Ala Leu Leu
515 520
<210> 82
<211> 484
<212> PRT
<213> Saccharomyces sp.
<400> 82
Met Leu Leu Arg Ser Leu Thr Ser Ala Phe Val Leu Ser Ala Gly Leu
1 5 10 15
Ala Gln Ala Ala Ser Ser Ser Asn Ser Ser Thr Pro Ser Ile Glu Ile
20 25 30
Lys Gly Asn Ala Phe Phe Asn Ser Glu Ser Gly Glu Arg Phe Tyr Ile
35 40 45
Arg Gly Val Asp Tyr Gln Pro Gly Gly Ser Ser Asn Leu Thr Asp Pro
50 55 60
Leu Ala Asp Ala Ser Val Cys Asp Arg Asp Val Pro Val Leu Lys Asp
65 70 75 80
Leu Gly Ile Asn Thr Val Arg Val Tyr Thr Val Asp Asn Ser Gln Asp
85 90 95
His Ser His Cys Met Lys Leu Leu Gln Glu Asn Gly Ile Tyr Leu Ile
100 105 110
Leu Asp Val Asn Thr Pro Thr Ser Ala Ile Ser Arg Tyr Asp Pro Ala
115 120 125
Cys Ser Tyr Asn Ala Asp Tyr Leu Gln Asn Val Phe Ala Thr Ile Asp
130 135 140
Thr Phe Ala Asp Tyr Asp Asn Val Leu Gly Phe Phe Ala Gly Asn Glu
145 150 155 160
Val Ile Asn Ser Val Asn Thr Thr Asn Thr Ala Thr Tyr Val Lys Ala
165 170 175
Val Val Arg Asp Met Lys Lys Tyr Ile Lys Ala Arg Lys Tyr Arg Gln
180 185 190
Ile Pro Val Gly Tyr Ser Ala Ala Asp Ile Val Ala Asn Arg Gln Leu
195 200 205
Ala Ala Glu Tyr Phe Asn Cys Gly Asp Glu Ala Asp Ala Arg Ile Asp
210 215 220
Met Phe Gly Val Asn Asp Tyr Ser Trp Cys Gly Glu Ser Ser Phe Val
225 230 235 240
Val Ser Gly Tyr Ser Thr Lys Met Lys Leu Tyr Gln Asp Tyr Ser Val
245 250 255
Pro Val Phe Leu Ser Glu Phe Gly Cys Asn Gln Val Lys Ser Ser Arg
260 265 270
Pro Phe Thr Glu Ile Glu Ala Ile Tyr Ser Thr Gln Met Ser Ser Val
275 280 285
Phe Ser Gly Gly Leu Val Tyr Glu Tyr Ser Asn Glu Thr Asn Asn Tyr
290 295 300
Gly Leu Val Gln Ile Asp Gly Asp Lys Val Thr Lys Leu Thr Asp Phe
305 310 315 320
Glu Asn Leu Lys Asn Glu Tyr Ser Lys Val Ser Asn Pro Glu Gly Asn
325 330 335
Gly Gly Tyr Ser Thr Ser Asn Asn Tyr Ser Thr Cys Pro Asp Tyr Glu
340 345 350
Lys Gly Val Trp Glu Ala Asn Asn Thr Leu Pro Ala Met Pro Ser Ala
355 360 365
Ala Ser Ala Tyr Phe Thr Ser Gly Ala Gly Ser Pro Met Gly Thr Gly
370 375 380
Ile Ala Thr Gln Gln Ser Cys Asp Ala Lys Asp Asp Asp Asp Glu Glu
385 390 395 400
Asp Asp Asp Thr Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
405 410 415
Ser Ala Ser Ser Ser Ser Glu Ser Ser Ser Ser Thr Ser Lys Ala Ser
420 425 430
Ser Ser Ser Pro Ser Ala Ser Glu Thr Ser Leu Leu Lys Ser Ala Ala
435 440 445
Ser Ala Thr Ser Ser Ser Gln Ser Ser Ser Lys Ser Lys Gly Ala Ala
450 455 460
Gly Ile Ile Glu Ile Pro Leu Ile Phe Arg Ala Leu Ala Glu Leu Tyr
465 470 475 480
Asn Leu Val Leu
<210> 83
<211> 444
<212> PRT
<213> Saccharomyces sp.
<400> 83
Met Gln Leu His Ser Leu Ile Ala Ser Thr Ala Leu Leu Ile Thr Ser
1 5 10 15
Ala Leu Ala Ala Thr Ser Ser Ser Ser Ser Ile Pro Ser Ser Cys Thr
20 25 30
Ile Ser Ser His Ala Thr Ala Thr Ala Gln Ser Asp Leu Asp Lys Tyr
35 40 45
Ser Arg Cys Asp Thr Leu Val Gly Asn Leu Thr Ile Gly Gly Gly Leu
50 55 60
Lys Thr Gly Ala Leu Ala Asn Val Lys Glu Ile Asn Gly Ser Leu Thr
65 70 75 80
Ile Phe Asn Ala Thr Asn Leu Thr Ser Phe Ala Ala Asp Ser Leu Glu
85 90 95
Ser Ile Thr Asp Ser Leu Asn Leu Gln Ser Leu Thr Ile Leu Thr Ser
100 105 110
Ala Ser Phe Gly Ser Leu Gln Ser Val Asp Ser Ile Lys Leu Ile Thr
115 120 125
Leu Pro Ala Ile Ser Ser Phe Thr Ser Asn Ile Lys Ser Ala Asn Asn
130 135 140
Ile Tyr Ile Ser Asp Thr Ser Leu Gln Ser Val Asp Gly Phe Ser Ala
145 150 155 160
Leu Lys Lys Val Asn Val Phe Asn Val Asn Asn Asn Lys Lys Leu Thr
165 170 175
Ser Ile Lys Ser Pro Val Glu Thr Val Ser Asp Ser Leu Gln Phe Ser
180 185 190
Phe Asn Gly Asn Gln Thr Lys Ile Thr Phe Asp Asp Leu Val Trp Ala
195 200 205
Asn Asn Ile Ser Leu Thr Asp Val His Ser Val Ser Phe Ala Asn Leu
210 215 220
Gln Lys Ile Asn Ser Ser Leu Gly Phe Ile Asn Asn Ser Ile Ser Ser
225 230 235 240
Leu Asn Phe Thr Lys Leu Asn Thr Ile Gly Gln Thr Phe Ser Ile Val
245 250 255
Ser Asn Asp Tyr Leu Lys Asn Leu Ser Phe Ser Asn Leu Ser Thr Ile
260 265 270
Gly Gly Ala Leu Val Val Ala Asn Asn Thr Gly Leu Gln Lys Ile Gly
275 280 285
Gly Leu Asp Asn Leu Thr Thr Ile Gly Gly Thr Leu Glu Val Val Gly
290 295 300
Asn Phe Thr Ser Leu Asn Leu Asp Ser Leu Lys Ser Val Lys Gly Gly
305 310 315 320
Ala Asp Val Glu Ser Lys Ser Ser Asn Phe Ser Cys Asn Ala Leu Lys
325 330 335
Ala Leu Gln Lys Lys Gly Gly Ile Lys Gly Glu Ser Phe Val Cys Lys
340 345 350
Asn Gly Ala Ser Ser Thr Ser Val Lys Leu Ser Ser Thr Ser Lys Ser
355 360 365
Gln Ser Ser Gln Thr Thr Ala Lys Val Ser Lys Ser Ser Ser Lys Ala
370 375 380
Glu Glu Lys Lys Phe Thr Ser Gly Asp Ile Lys Ala Ala Ala Ser Ala
385 390 395 400
Ser Ser Val Ser Ser Ser Gly Ala Ser Ser Ser Ser Ser Lys Ser Ser
405 410 415
Lys Gly Asn Ala Ala Ile Met Ala Pro Ile Gly Gln Thr Thr Pro Leu
420 425 430
Val Gly Leu Leu Thr Ala Ile Ile Met Ser Ile Met
435 440
<210> 84
<211> 830
<212> PRT
<213> Saccharomyces sp.
<400> 84
Met Gln Leu Met Arg Leu Ser Asn Leu Ile Ala Ser Ala Ser Leu Leu
1 5 10 15
Ser Ala Ala Thr Leu Ala Ala Pro Ala Asn His Glu His Lys Asp Lys
20 25 30
Arg Ala Val Val Thr Thr Thr Val Gln Lys Gln Thr Thr Ile Ile Val
35 40 45
Asn Gly Ala Ala Ser Thr Pro Val Ala Ala Leu Glu Glu Asn Ala Val
50 55 60
Val Asn Ser Ala Pro Ala Ala Ala Thr Ser Thr Thr Ser Ser Ala Ala
65 70 75 80
Ser Val Ala Thr Ala Ala Ala Ser Ser Ser Glu Asn Asn Ser Gln Val
85 90 95
Ser Ala Ala Ala Ser Pro Ala Ser Ser Ser Ala Ala Thr Ser Thr Gln
100 105 110
Ser Ser Ser Ser Ser Gln Ala Ser Ser Ser Ser Ser Ser Gly Glu Asp
115 120 125
Val Ser Ser Phe Ala Ser Gly Val Arg Gly Ile Thr Tyr Thr Pro Tyr
130 135 140
Glu Ser Ser Gly Ala Cys Lys Ser Ala Ser Glu Val Ala Ser Asp Leu
145 150 155 160
Ala Gln Leu Thr Asp Phe Pro Val Ile Arg Leu Tyr Gly Thr Asp Cys
165 170 175
Asn Gln Val Glu Asn Val Phe Lys Ala Lys Ala Ser Asn Gln Lys Val
180 185 190
Phe Leu Gly Ile Tyr Tyr Val Asp Gln Ile Gln Asp Gly Val Asn Thr
195 200 205
Ile Lys Ser Ala Val Glu Ser Tyr Gly Ser Trp Asp Asp Val Thr Thr
210 215 220
Val Ser Ile Gly Asn Glu Leu Val Asn Gly Asn Gln Ala Thr Pro Ser
225 230 235 240
Gln Val Gly Gln Tyr Ile Asp Ser Gly Arg Ser Ala Leu Lys Ala Ala
245 250 255
Gly Tyr Thr Gly Pro Val Val Ser Val Asp Thr Phe Ile Ala Val Ile
260 265 270
Asn Asn Pro Glu Leu Cys Asp Tyr Ser Asp Tyr Met Ala Val Asn Ala
275 280 285
His Ala Tyr Phe Asp Lys Asn Thr Val Ala Gln Asp Ser Gly Lys Trp
290 295 300
Leu Leu Glu Gln Ile Gln Arg Val Trp Thr Ala Cys Asp Gly Lys Lys
305 310 315 320
Asn Val Val Ile Thr Glu Ser Gly Trp Pro Ser Lys Gly Glu Thr Tyr
325 330 335
Gly Val Ala Val Pro Ser Lys Glu Asn Gln Lys Asp Ala Val Ser Ala
340 345 350
Ile Thr Ser Ser Cys Gly Ala Asp Thr Phe Leu Phe Thr Ala Phe Asn
355 360 365
Asp Tyr Trp Lys Ala Asp Gly Ala Tyr Gly Val Glu Lys Tyr Trp Gly
370 375 380
Ile Leu Ser Asn Glu His Ser Leu Ile Ala Ser Thr Ala Leu Leu Ile
385 390 395 400
Thr Ser Ala Leu Ala Ala Thr Ser Ser Ser Ser Ser Ile Pro Ser Ser
405 410 415
Cys Thr Ile Ser Ser His Ala Thr Ala Thr Ala Gln Ser Asp Leu Asp
420 425 430
Lys Tyr Ser Arg Cys Asp Thr Leu Val Gly Asn Leu Thr Ile Gly Gly
435 440 445
Gly Leu Lys Thr Gly Ala Leu Ala Asn Val Lys Glu Ile Asn Gly Ser
450 455 460
Leu Thr Ile Phe Asn Ala Thr Asn Leu Thr Ser Phe Ala Ala Asp Ser
465 470 475 480
Leu Glu Ser Ile Thr Asp Ser Leu Asn Leu Gln Ser Leu Thr Ile Leu
485 490 495
Thr Ser Ala Ser Phe Gly Ser Leu Gln Ser Val Asp Ser Ile Lys Leu
500 505 510
Ile Thr Leu Pro Ala Ile Ser Ser Phe Thr Ser Asn Ile Lys Ser Ala
515 520 525
Asn Asn Ile Tyr Ile Ser Asp Thr Ser Leu Gln Ser Val Asp Gly Phe
530 535 540
Ser Ala Leu Lys Lys Val Asn Val Phe Asn Val Asn Asn Asn Lys Lys
545 550 555 560
Leu Thr Ser Ile Lys Ser Pro Val Glu Thr Val Ser Asp Ser Leu Gln
565 570 575
Phe Ser Phe Asn Gly Asn Gln Thr Lys Ile Thr Phe Asp Asp Leu Val
580 585 590
Trp Ala Asn Asn Ile Ser Leu Thr Asp Val His Ser Val Ser Phe Ala
595 600 605
Asn Leu Gln Lys Ile Asn Ser Ser Leu Gly Phe Ile Asn Asn Ser Ile
610 615 620
Ser Ser Leu Asn Phe Thr Lys Leu Asn Thr Ile Gly Gln Thr Phe Ser
625 630 635 640
Ile Val Ser Asn Asp Tyr Leu Lys Asn Leu Ser Phe Ser Asn Leu Ser
645 650 655
Thr Ile Gly Gly Ala Leu Val Val Ala Asn Asn Thr Gly Leu Gln Lys
660 665 670
Ile Gly Gly Leu Asp Asn Leu Thr Thr Ile Gly Gly Thr Leu Glu Val
675 680 685
Val Gly Asn Phe Thr Ser Leu Asn Leu Asp Ser Leu Lys Ser Val Lys
690 695 700
Gly Gly Ala Asp Val Glu Ser Lys Ser Ser Asn Phe Ser Cys Asn Ala
705 710 715 720
Leu Lys Ala Leu Gln Lys Lys Gly Gly Ile Lys Gly Glu Ser Phe Val
725 730 735
Cys Lys Asn Gly Ala Ser Ser Thr Ser Val Lys Leu Ser Ser Thr Ser
740 745 750
Lys Ser Gln Ser Ser Gln Thr Thr Ala Lys Val Ser Lys Ser Ser Ser
755 760 765
Lys Ala Glu Glu Lys Lys Phe Thr Ser Gly Asp Ile Lys Ala Ala Ala
770 775 780
Ser Ala Ser Ser Val Ser Ser Ser Gly Ala Ser Ser Ser Ser Ser Lys
785 790 795 800
Ser Ser Lys Gly Asn Ala Ala Ile Met Ala Pro Ile Gly Gln Thr Thr
805 810 815
Pro Leu Val Gly Leu Leu Thr Ala Ile Ile Met Ser Ile Met
820 825 830
<210> 85
<211> 389
<212> PRT
<213> Saccharomyces sp.
<400> 85
Met Arg Phe Ser Asn Phe Leu Thr Val Ser Ala Leu Leu Thr Gly Ala
1 5 10 15
Leu Gly Ala Pro Ala Val Arg His Lys His Glu Lys Arg Asp Val Val
20 25 30
Thr Ala Thr Val His Ala Gln Val Thr Val Val Val Ser Gly Asn Ser
35 40 45
Gly Glu Thr Ile Val Pro Val Asn Glu Asn Ala Val Val Ala Thr Thr
50 55 60
Ser Ser Thr Ala Val Ala Ser Gln Ala Thr Thr Ser Thr Leu Glu Pro
65 70 75 80
Thr Thr Ser Ala Asn Val Val Thr Ser Gln Gln Gln Thr Ser Thr Leu
85 90 95
Gln Ser Ser Glu Ala Ala Ser Thr Val Gly Ser Ser Thr Ser Ser Ser
100 105 110
Pro Ser Ser Ser Ser Ser Thr Ser Ser Ser Ala Ser Ser Ser Ala Ser
115 120 125
Ser Ser Ile Ser Ala Ser Gly Ala Lys Gly Ile Thr Tyr Ser Pro Tyr
130 135 140
Asn Asp Asp Gly Ser Cys Lys Ser Thr Ala Gln Val Ala Ser Asp Leu
145 150 155 160
Glu Gln Leu Thr Gly Phe Asp Asn Ile Arg Leu Tyr Gly Val Asp Cys
165 170 175
Ser Gln Val Glu Asn Val Leu Gln Ala Lys Thr Ser Ser Gln Lys Leu
180 185 190
Phe Leu Gly Ile Tyr Tyr Val Asp Lys Ile Gln Asp Ala Val Asp Thr
195 200 205
Ile Lys Ser Ala Val Glu Ser Tyr Gly Ser Trp Asp Asp Ile Thr Thr
210 215 220
Val Ser Val Gly Asn Glu Leu Val Asn Gly Gly Ser Ala Thr Thr Thr
225 230 235 240
Gln Val Gly Glu Tyr Val Ser Thr Ala Lys Ser Ala Leu Thr Ser Ala
245 250 255
Gly Tyr Thr Gly Ser Val Val Ser Val Asp Thr Phe Ile Ala Val Ile
260 265 270
Asn Asn Pro Asp Leu Cys Asn Tyr Ser Asp Tyr Met Ala Val Asn Ala
275 280 285
His Ala Tyr Phe Asp Glu Asn Thr Ala Ala Gln Asp Ala Gly Pro Trp
290 295 300
Val Leu Glu Gln Ile Glu Arg Val Tyr Thr Ala Cys Gly Gly Lys Lys
305 310 315 320
Asp Val Val Ile Thr Glu Thr Gly Trp Pro Ser Lys Gly Asp Thr Tyr
325 330 335
Gly Glu Ala Val Pro Ser Lys Ala Asn Gln Glu Ala Ala Ile Ser Ser
340 345 350
Ile Lys Ser Ser Cys Gly Ser Ser Ala Tyr Leu Phe Thr Ala Phe Asn
355 360 365
Asp Leu Trp Lys Asp Asp Gly Gln Tyr Gly Val Glu Lys Tyr Trp Gly
370 375 380
Ile Leu Ser Ser Asp
385
<210> 86
<211> 475
<212> PRT
<213> Saccharomyces sp.
<400> 86
Met Lys Phe Ser Thr Ala Val Thr Thr Leu Ile Ser Ser Gly Ala Ile
1 5 10 15
Val Ser Ala Leu Pro His Val Asp Val His Gln Glu Asp Ala His Gln
20 25 30
His Lys Arg Ala Val Ala Tyr Lys Tyr Val Tyr Glu Thr Val Val Val
35 40 45
Asp Ser Asp Gly His Thr Val Thr Pro Ala Ala Ser Glu Val Ala Thr
50 55 60
Ala Ala Thr Ser Ala Ile Ile Thr Thr Ser Val Leu Ala Pro Thr Ser
65 70 75 80
Ser Ala Ala Ala Gly Ile Ala Ala Ser Ile Ala Val Ser Ser Ala Ala
85 90 95
Leu Ala Lys Asn Glu Lys Ile Ser Asp Ala Ala Ala Ser Ala Thr Ala
100 105 110
Ser Thr Ser Gln Gly Ala Ser Ser Ser Ser Ser Ser Ser Ser Ala Thr
115 120 125
Ser Thr Leu Glu Ser Ser Ser Val Ser Ser Ser Ser Glu Glu Ala Ala
130 135 140
Pro Thr Ser Thr Val Val Ser Thr Ser Ser Ala Thr Gln Ser Ser Ala
145 150 155 160
Ser Ser Ala Thr Lys Ser Ser Thr Ser Ser Thr Ser Pro Ser Thr Ser
165 170 175
Thr Ser Thr Ser Thr Ser Ser Thr Ser Ser Ser Ser Ser Ser Ser Ser
180 185 190
Ser Ser Ser Ser Ser Ser Ser Gly Ser Gly Ser Ile Tyr Gly Asp Leu
195 200 205
Ala Asp Phe Ser Gly Pro Ser Glu Lys Phe Gln Asp Gly Thr Ile Pro
210 215 220
Cys Asp Lys Phe Pro Ser Gly Gln Gly Val Ile Ser Ile Asp Trp Ile
225 230 235 240
Gly Glu Gly Gly Trp Ser Gly Val Glu Asn Thr Asp Thr Ser Thr Gly
245 250 255
Gly Ser Cys Lys Glu Gly Ser Tyr Cys Ser Tyr Ser Cys Gln Pro Gly
260 265 270
Met Ser Lys Thr Gln Trp Pro Ser Asp Gln Pro Ser Asp Gly Arg Ser
275 280 285
Val Gly Gly Leu Leu Cys Lys Asn Gly Tyr Leu Tyr Arg Ser Asn Thr
290 295 300
Asp Ala Asp Tyr Leu Cys Glu Trp Gly Val Glu Ala Ala Tyr Val Val
305 310 315 320
Ser Lys Leu Ser Lys Gly Val Ala Ile Cys Arg Thr Asp Tyr Pro Gly
325 330 335
Thr Glu Asn Met Val Ile Pro Thr Tyr Val Glu Gly Gly Ser Ser Leu
340 345 350
Pro Leu Thr Val Val Asp Gln Asp Thr Tyr Phe Thr Trp Glu Gly Lys
355 360 365
Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asn Ala Gly Val Ser Val Glu
370 375 380
Asp Gly Cys Ile Trp Gly Thr Ser Gly Ser Gly Ile Gly Asn Trp Ala
385 390 395 400
Pro Leu Asn Phe Gly Ala Gly Ser Thr Gly Gly Val Thr Tyr Leu Ser
405 410 415
Leu Ile Pro Asn Pro Asn Asn Ser Asp Ala Leu Asn Tyr Asn Val Lys
420 425 430
Ile Val Ala Ala Asp Asp Ser Ser Asn Val Ile Gly Glu Cys Val Tyr
435 440 445
Glu Asn Gly Glu Phe Ser Gly Gly Ala Asp Gly Cys Thr Val Ser Val
450 455 460
Thr Ser Gly Lys Ala His Phe Val Leu Tyr Asn
465 470 475
<210> 87
<211> 365
<212> PRT
<213> Saccharomyces sp.
<400> 87
Met Lys Leu Ser Ala Leu Leu Ala Leu Ser Ala Ser Thr Ala Val Leu
1 5 10 15
Ala Ala Pro Ala Val His His Ser Asp Asn His His His Asn Asp Lys
20 25 30
Arg Ala Val Val Thr Val Thr Gln Tyr Val Asn Ala Asp Gly Ala Val
35 40 45
Val Ile Pro Ala Ala Thr Thr Ala Thr Ser Ala Ala Ala Asp Gly Lys
50 55 60
Val Glu Ser Val Ala Ala Ala Thr Thr Thr Leu Ser Ser Thr Ala Ala
65 70 75 80
Ala Ala Thr Thr Ser Ala Ala Ala Ser Ser Ser Ser Ser Ser Ser Ser
85 90 95
Ser Ser Ser Ser Ser Ser Ser Val Gly Ser Gly Asp Phe Glu Asp Gly
100 105 110
Thr Ile Ser Cys Ser Asp Phe Pro Ser Gly Gln Gly Ala Val Ser Leu
115 120 125
Asp Trp Leu Gly Leu Gly Gly Trp Ala Ser Ile Met Asp Met Asn Gly
130 135 140
Asn Thr Ala Thr Ser Cys Gln Asp Gly Tyr Tyr Cys Ser Tyr Ala Cys
145 150 155 160
Ser Pro Gly Tyr Ala Lys Thr Gln Trp Pro Ser Glu Gln Pro Ser Asp
165 170 175
Gly Arg Ser Val Gly Gly Leu Tyr Cys Lys Asn Gly Lys Leu Tyr Arg
180 185 190
Ser Asn Thr Asp Thr Asn Ser Leu Cys Val Glu Gly Gln Gly Ser Ala
195 200 205
Gln Ala Val Asn Lys Val Ser Gly Ser Ile Ala Ile Cys Gly Thr Asp
210 215 220
Tyr Pro Gly Ser Glu Asn Met Val Val Pro Thr Val Val Gly Ala Gly
225 230 235 240
Ser Ser Gln Pro Ile Asn Val Ile Lys Glu Asp Ser Tyr Tyr Gln Trp
245 250 255
Gln Gly Lys Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asn Ala Gly Val
260 265 270
Ser Val Glu Asp Gly Cys Ile Trp Gly Thr Glu Gly Ser Gly Val Gly
275 280 285
Asn Trp Ala Pro Val Val Leu Gly Ala Gly Tyr Thr Asp Gly Ile Thr
290 295 300
Tyr Leu Ser Ile Ile Pro Asn Pro Asn Asn Lys Glu Ala Pro Asn Phe
305 310 315 320
Asn Ile Lys Ile Val Ala Thr Asp Gly Ser Thr Val Asn Gly Ala Cys
325 330 335
Ser Tyr Glu Asn Gly Val Tyr Ser Gly Ser Gly Ser Asp Gly Cys Thr
340 345 350
Val Ser Val Thr Ser Gly Ser Ala Asn Phe Val Phe Tyr
355 360 365
<210> 88
<211> 719
<212> PRT
<213> Saccharomyces sp.
<400> 88
Met Lys Phe Gln Val Val Leu Ser Ala Leu Leu Ala Cys Ser Ser Ala
1 5 10 15
Val Val Ala Ser Pro Ile Glu Asn Leu Phe Lys Tyr Arg Ala Val Lys
20 25 30
Ala Ser His Ser Lys Asn Ile Asn Ser Thr Leu Pro Ala Trp Asn Gly
35 40 45
Ser Asn Ser Ser Asn Val Thr Tyr Ala Asn Gly Thr Asn Ser Thr Thr
50 55 60
Asn Thr Thr Thr Ala Glu Ser Ser Gln Leu Gln Ile Ile Val Thr Gly
65 70 75 80
Gly Gln Val Pro Ile Thr Asn Ser Ser Leu Thr His Thr Asn Tyr Thr
85 90 95
Arg Leu Phe Asn Ser Ser Ser Ala Leu Asn Ile Thr Glu Leu Tyr Asn
100 105 110
Val Ala Arg Val Val Asn Glu Thr Ile Gln Asp Lys Ser Ser Ala Gly
115 120 125
Ala Val Val Val Ala Asn Ala Lys Ser Leu Glu Ala Val Ser Phe Phe
130 135 140
Phe Ser Ile Ile Phe Asp Thr Glu Lys Pro Ile Val Val Thr Glu Asp
145 150 155 160
Ser Ala Tyr Ala Ile Pro Val Ala Asn Asn Lys Asn Ala Thr Lys Arg
165 170 175
Gly Val Leu Ser Val Thr Ser Asp Lys Leu Val Tyr Ser Gly Val Phe
180 185 190
Thr Pro Pro Thr Ala Cys Ser Tyr Gly Ala Gly Leu Pro Val Ala Ile
195 200 205
Val Asp Asp Gln Asp Glu Val Lys Trp Phe Phe Asp Ala Ser Lys Pro
210 215 220
Thr Leu Ile Ser Ser Asp Ser Ile Ile Arg Lys Glu Tyr Ser Asn Phe
225 230 235 240
Thr Thr Pro Tyr Gly Leu Leu Glu Asn Gly Val Pro Ile Val Pro Ile
245 250 255
Val Tyr Asp Gly Gly Tyr Ser Ser Ser Leu Ile Asp Ser Leu Ser Ser
260 265 270
Ala Val Gln Gly Leu Val Val Val Ser Ser Gly Ser Thr Asn Ser Thr
275 280 285
Ser Ser Thr Ile Glu Ser Thr Glu Ile Pro Val Val Tyr Ala Gln Ala
290 295 300
Asn Thr Pro Leu Asn Phe Ile Asp Asn Lys Asp Val Pro Lys Asn Ala
305 310 315 320
Val Gly Ala Gly Tyr Leu Ser Pro Ile Lys Ala Gln Ile Leu Leu Ser
325 330 335
Ile Ala Ala Val Asn Gly Val Thr Ser Lys Ser Ala Leu Glu Ser Ile
340 345 350
Phe Pro Met Lys Leu Ser Ala Leu Leu Ala Leu Ser Ala Ser Thr Ala
355 360 365
Val Leu Ala Ala Pro Ala Val His His Ser Asp Asn His His His Asn
370 375 380
Asp Lys Arg Ala Val Val Thr Val Thr Gln Tyr Val Asn Ala Asp Gly
385 390 395 400
Ala Val Val Ile Pro Ala Ala Thr Thr Ala Thr Ser Ala Ala Ala Asp
405 410 415
Gly Lys Val Glu Ser Val Ala Ala Ala Thr Thr Thr Leu Ser Ser Thr
420 425 430
Ala Ala Ala Ala Thr Thr Ser Ala Ala Ala Ser Ser Ser Ser Ser Ser
435 440 445
Ser Ser Ser Ser Ser Ser Ser Ser Ser Val Gly Ser Gly Asp Phe Glu
450 455 460
Asp Gly Thr Ile Ser Cys Ser Asp Phe Pro Ser Gly Gln Gly Ala Val
465 470 475 480
Ser Leu Asp Trp Leu Gly Leu Gly Gly Trp Ala Ser Ile Met Asp Met
485 490 495
Asn Gly Asn Thr Ala Thr Ser Cys Gln Asp Gly Tyr Tyr Cys Ser Tyr
500 505 510
Ala Cys Ser Pro Gly Tyr Ala Lys Thr Gln Trp Pro Ser Glu Gln Pro
515 520 525
Ser Asp Gly Arg Ser Val Gly Gly Leu Tyr Cys Lys Asn Gly Lys Leu
530 535 540
Tyr Arg Ser Asn Thr Asp Thr Asn Ser Leu Cys Val Glu Gly Gln Gly
545 550 555 560
Ser Ala Gln Ala Val Asn Lys Val Ser Gly Ser Ile Ala Ile Cys Gly
565 570 575
Thr Asp Tyr Pro Gly Ser Glu Asn Met Val Val Pro Thr Val Val Gly
580 585 590
Ala Gly Ser Ser Gln Pro Ile Asn Val Ile Lys Glu Asp Ser Tyr Tyr
595 600 605
Gln Trp Gln Gly Lys Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asn Ala
610 615 620
Gly Val Ser Val Glu Asp Gly Cys Ile Trp Gly Thr Glu Gly Ser Gly
625 630 635 640
Val Gly Asn Trp Ala Pro Val Val Leu Gly Ala Gly Tyr Thr Asp Gly
645 650 655
Ile Thr Tyr Leu Ser Ile Ile Pro Asn Pro Asn Asn Lys Glu Ala Pro
660 665 670
Asn Phe Asn Ile Lys Ile Val Ala Thr Asp Gly Ser Thr Val Asn Gly
675 680 685
Ala Cys Ser Tyr Glu Asn Gly Val Tyr Ser Gly Ser Gly Ser Asp Gly
690 695 700
Cys Thr Val Ser Val Thr Ser Gly Ser Ala Asn Phe Val Phe Tyr
705 710 715
<210> 89
<211> 569
<212> PRT
<213> Saccharomyces sp.
<400> 89
Met Lys Leu Lys Thr Val Arg Ser Ala Val Leu Ser Ser Leu Phe Ala
1 5 10 15
Ser Gln Val Leu Gly Lys Ile Ile Pro Ala Ala Asn Lys Arg Asp Asp
20 25 30
Asp Ser Asn Ser Lys Phe Val Lys Leu Pro Phe His Lys Leu Tyr Gly
35 40 45
Asp Ser Leu Glu Asn Val Gly Ser Asp Lys Lys Pro Glu Val Arg Leu
50 55 60
Leu Lys Arg Ala Asp Gly Tyr Glu Glu Ile Ile Ile Thr Asn Gln Gln
65 70 75 80
Ser Phe Tyr Ser Val Asp Leu Glu Val Gly Thr Pro Pro Gln Asn Val
85 90 95
Thr Val Leu Val Asp Thr Gly Ser Ser Asp Leu Trp Ile Met Gly Ser
100 105 110
Asp Asn Pro Tyr Cys Ser Ser Asn Ser Met Gly Ser Ser Arg Arg Arg
115 120 125
Val Ile Asp Lys Arg Asp Asp Ser Ser Ser Gly Gly Ser Leu Ile Asn
130 135 140
Asp Ile Asn Pro Phe Gly Trp Leu Thr Gly Thr Gly Ser Ala Ile Gly
145 150 155 160
Pro Thr Ala Thr Gly Leu Gly Gly Gly Ser Gly Thr Ala Thr Gln Ser
165 170 175
Val Pro Ala Ser Glu Ala Thr Met Asp Cys Gln Gln Tyr Gly Thr Phe
180 185 190
Ser Thr Ser Gly Ser Ser Thr Phe Arg Ser Asn Asn Thr Tyr Phe Ser
195 200 205
Ile Ser Tyr Gly Asp Gly Thr Phe Ala Ser Gly Thr Phe Gly Thr Asp
210 215 220
Val Leu Asp Leu Ser Asp Leu Asn Val Thr Gly Leu Ser Phe Ala Val
225 230 235 240
Ala Asn Glu Thr Asn Ser Thr Met Gly Val Leu Gly Ile Gly Leu Pro
245 250 255
Glu Leu Glu Val Thr Tyr Ser Gly Ser Thr Ala Ser His Ser Gly Lys
260 265 270
Ala Tyr Lys Tyr Asp Asn Phe Pro Ile Val Leu Lys Asn Ser Gly Ala
275 280 285
Ile Lys Ser Asn Thr Tyr Ser Leu Tyr Leu Asn Asp Ser Asp Ala Met
290 295 300
His Gly Thr Ile Leu Phe Gly Ala Val Asp His Ser Lys Tyr Thr Gly
305 310 315 320
Thr Leu Tyr Thr Ile Pro Ile Val Asn Thr Leu Ser Ala Ser Gly Phe
325 330 335
Ser Ser Pro Ile Gln Phe Asp Val Thr Ile Asn Gly Ile Gly Ile Ser
340 345 350
Asp Ser Gly Ser Ser Asn Lys Thr Leu Thr Thr Thr Lys Ile Pro Ala
355 360 365
Leu Leu Asp Ser Gly Thr Thr Leu Thr Tyr Leu Pro Gln Thr Val Val
370 375 380
Ser Met Ile Ala Thr Glu Leu Gly Ala Gln Tyr Ser Ser Arg Ile Gly
385 390 395 400
Tyr Tyr Val Leu Asp Cys Pro Ser Asp Asp Ser Met Glu Ile Val Phe
405 410 415
Asp Phe Gly Gly Phe His Ile Asn Ala Pro Leu Ser Ser Phe Ile Leu
420 425 430
Ser Thr Gly Thr Thr Cys Leu Leu Gly Ile Ile Pro Thr Ser Asp Asp
435 440 445
Thr Gly Thr Ile Leu Gly Asp Ser Phe Leu Thr Asn Ala Tyr Val Val
450 455 460
Tyr Asp Leu Glu Asn Leu Glu Ile Ser Met Ala Gln Ala Arg Tyr Asn
465 470 475 480
Thr Thr Ser Glu Asn Ile Glu Ile Ile Thr Ser Ser Val Pro Ser Ala
485 490 495
Val Lys Ala Pro Gly Tyr Thr Asn Thr Trp Ser Thr Ser Ala Ser Ile
500 505 510
Val Thr Gly Gly Asn Ile Phe Thr Val Asn Ser Ser Gln Thr Ala Ser
515 520 525
Phe Ser Gly Asn Leu Thr Thr Ser Thr Ala Ser Ala Thr Ser Thr Ser
530 535 540
Ser Lys Arg Asn Val Gly Asp His Ile Val Pro Ser Leu Pro Leu Thr
545 550 555 560
Leu Ile Ser Leu Leu Phe Ala Phe Ile
565
<210> 90
<211> 249
<212> PRT
<213> Saccharomyces sp.
<400> 90
Met Lys Phe Ser Ser Gly Lys Ser Ile Ile Phe Ala Thr Ile Ala Ser
1 5 10 15
Leu Ala Leu Ser Ala Pro Val Thr Tyr Asp Thr Asn Ser Thr Ala Glu
20 25 30
Leu Gln Ser Pro Ser Ser Gln Glu Ile Leu Gly Trp Ser His Ala Thr
35 40 45
Phe Pro Thr Ile Tyr Gln Thr Cys Asn Glu Thr Asn Ala Arg Met Leu
50 55 60
Asn Ala Ala Phe Lys Asp Thr Ala Glu Ile Thr Ala Tyr Gly Lys Asp
65 70 75 80
Arg Leu Leu Asn Tyr Gly Val Asp Asp Val Tyr Tyr Lys Arg Trp Phe
85 90 95
Gly Asn Gly Ser Ile Phe Thr Val Met Gly Val Phe Glu Gln Leu Met
100 105 110
Glu Ala Ser Lys Gly Ala Met Leu Met Arg Cys Asp Asp Ile Asp Gly
115 120 125
Leu Cys Ala Ala Asn Pro Asn Tyr Tyr Ala Gly His His Arg Gln Ser
130 135 140
Ala Pro Ala Glu Thr Val Ile Cys Asp Tyr Phe Tyr Thr Ser Lys Lys
145 150 155 160
Pro Leu Ser Thr Ile Cys Phe Glu Gly Thr Ile Val Asp Val Gly Pro
165 170 175
Lys His Tyr Ala Gly Ile Asp Met Leu His Arg Tyr Leu His Val Pro
180 185 190
Thr Met Ser Met Asp Gly Tyr Val Gly Glu Tyr Ala Glu Thr Leu Glu
195 200 205
Glu Val Val Asp Tyr Thr Gln Asn Asn Ala Thr Tyr Ala Val Arg Asn
210 215 220
Thr Asp Asn Tyr Leu Tyr Tyr Leu Ala Asp Val Tyr Ser Ala Ser Val
225 230 235 240
Ile Pro Gly Gly Cys Leu Gly Asn Leu
245
Claims (145)
- (i) 제1 숙주 세포를, 분비 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 이종 프로모터로 형질전환시키는 단계;
(ii) 상기 분비 폴리펩티드의 천연 프로모터가 상기 분비 폴리펩티드를 인코딩하는 상기 폴리뉴클레오티드에 연결된 경우 분석된 상기 폴리펩티드의 분비 수준과 비교하여 상기 제1 숙주 세포로부터 상기 분비 폴리펩티드가 과분비되는지를 결정하는 단계;
(iii) 제2 숙주 세포를, 목적 폴리펩티드를 인코딩하는 제1 폴리뉴클레오티드 및 단계 (ii)에서 과분비된 것으로 결정된 폴리펩티드를 인코딩하는 제2 폴리뉴클레오티드를 포함하는 작제물로 형질전환시키는 단계로서, 여기서 상기 제1 및 제2 폴리뉴클레오티드는 서로에 대해 임의의 순서이며 동일한 프레임 내에 있는 것인 단계;
(iv) 상기 작제물이 상기 목적 폴리펩티드 및 상기 과분비된 폴리펩티드의 융합 폴리펩티드를 발현시키는 조건 하에 상기 제2 숙주 세포를 배양하는 단계; 및
(v) 상기 융합 폴리펩티드가 배양 배지로 분비되는지 여부를 결정함으로써, 상기 과분비된 폴리펩티드가 SFP인지 확인하는 단계
를 포함하는, 분비 융합 파트너 (SFP)를 확인하는 방법. - 제1항에 있어서, 상기 분비 폴리펩티드가 시크리톰에서 고발현되는 것으로 선택된 것인 방법.
- 제2항에 있어서, 상기 시크리톰이 효모, 박테리아, 식물 또는 동물로부터 단리된 것인 방법.
- 제3항에 있어서, 상기 시크리톰이 효모로부터 단리된 것인 방법.
- 제1항에 있어서, 상기 융합 폴리펩티드 또는 제2 융합 폴리펩티드의 분비에 대한 상기 SFP의 최적 크기를 결정하는 것을 추가로 포함하는 방법.
- 제5항에 있어서, 상기 최적 크기가 상기 SFP의 결실 분석에 의해 결정되는 것인 방법.
- 제1항에 있어서, 상기 이종 프로모터가 원핵생물, 진핵생물 또는 바이러스 유래인 방법.
- 제7항에 있어서, 상기 이종 프로모터가 박테리오파지 람다 PR, 박테리오파지 람다 PL, 람다 II, 이. 콜라이 trp, 이. 콜라이 recA, 이. 콜라이 열 충격, 이. 콜라이 lacZ, SV40 초기, 효모 GAPDH, PGK, ADH, PHO5, TEF, GAL1, GAL10, 마우스 유선 종양 바이러스, 인간 면역결핍 바이러스의 긴 말단 반복, 말로니 바이러스, 사이토메갈로바이러스 즉시 초기 프로모터, 엡스테인 바르 (Epstein Barr) 바이러스, 라우스 육종 바이러스, 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴, 및 인간 메탈로티오네인으로 이루어진 군으로부터 선택되는 것인 방법.
- 제8항에 있어서, 상기 이종 프로모터가 GAL10인 방법.
- 제1항에 있어서, 상기 분비된 폴리펩티드가 글리코실화된 것인 방법.
- 제1항에 있어서, 상기 제1 숙주 세포가 식물, 박테리아, 균류, 효모, 또는 동물 세포로부터 선택되는 것인 방법.
- 제11항에 있어서, 상기 제1 숙주 세포가 효모 세포인 방법.
- 제12항에 있어서, 상기 제1 숙주 세포가 칸디다 (Candida), 데바리오미세스 (Debaryomyces), 한세눌라 (Hansenula), 클루이베로미세스 (Kluyveromyces), 피치아 (Pichia), 스키조사카로미세스 (Schizosaccharomyces), 야로위아 (Yarrowia), 사카로미세스 (Saccharomyces), 슈반니오미세스 (Schwanniomyces), 및 아르크술라로 이루어진 군으로부터 선택되는 것인 방법.
- 제13항에 있어서, 상기 제1 숙주 세포가 칸디다 유틸리스 (Candida utilis), 칸디다 보이디니 (Candida boidinii), 칸디다 알비칸스 (Candida albicans), 클루이베로미세스 락티스 (Kluyveromyces lactis), 피치아 파스토리스 (Pichia pastoris), 피치아 스티피티스 (Pichia stipitis), 스키조사카로미세스 폼베 (Schizosaccharomyces pombe), 사카로미세스 세레비지애 (Saccharomyces cerevisiae), 한세눌라 폴리몰파 (Hansenula polymorpha), 야로위아 리포리티카 (Yarrowia lipolytica), 슈반니오미세스 옥시덴탈리스 (Schwanniomyces occidentalis), 및 아르크술라 아데니니보란스 (Arxula adeninivorans)로 이루어진 군으로부터 선택되는 것인 방법.
- 제1항에 있어서, 상기 제2 숙주 세포가 식물, 박테리아, 균류, 효모, 또는 동물 세포로부터 선택되는 것인 방법.
- 제15항에 있어서, 상기 제2 숙주 세포가 효모 세포인 방법.
- 제16항에 있어서, 상기 제2 숙주 세포가 칸디다, 데바리오미세스, 한세눌라, 클루이베로미세스, 피치아, 스키조사카로미세스, 야로위아, 사카로미세스, 슈반니오미세스, 및 아르크술라로 이루어진 군으로부터 선택되는 것인 방법.
- 제17항에 있어서, 상기 제2 숙주 세포가 칸디다 유틸리스, 칸디다 보이디니, 칸디다 알비칸스, 클루이베로미세스 락티스, 피치아 파스토리스, 피치아 스티피티스, 스키조사카로미세스 폼베, 사카로미세스 세레비지애, 한세눌라 폴리몰파, 야로위아 리포리티카, 슈반니오미세스 옥시덴탈리스, 및 아르크술라 아데니니보란스로 이루어진 군으로부터 선택되는 것인 방법.
- (i) 제1항의 SFP 또는 그의 단편 또는 유도체; 및
(ii) 목적 폴리펩티드
를 포함하는 단리된 융합 폴리펩티드. - 제19항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-84 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
- 제20항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-101 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
- 제21항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-135 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
- 제22항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-169 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
- 제23항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-195 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
- 제24항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-227 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
- 제25항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-271 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
- 제26항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-364 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
- 제19항에 있어서, 상기 SFP가 BGL2 (서열번호 80), GAS3 (서열번호 81), GAS5 (서열번호 82), PST1 (서열번호 83), SCW4 (서열번호 84), SCW10 (서열번호 85), SIM1 (서열번호 86), UTH1 (서열번호 87), YGP1 (서열번호 88), YPS1 (서열번호 89), 및 ZPS1 (서열번호 90)로 이루어진 군으로부터 선택되는 것인 단리된 융합 폴리펩티드.
- 제19항에 있어서, 상기 SFP가 BGL2 (서열번호 62), GAS3 (서열번호 63), GAS5 (서열번호 64), PST1 (서열번호 65), SCW4 (서열번호 66), SCW10 (서열번호 67), SIM1 (서열번호 68), UTH1 (서열번호 69), YGP1 (서열번호 70), YPS1 (서열번호 71), 및 ZPS1 (서열번호 72)로 이루어진 군으로부터 선택되는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
- 제19항에 있어서, 상기 목적 폴리펩티드가 인간 인터루킨-2 (hIL-2), 엑센딘-3, 엑센딘-4 (EXD4), 글루카곤-유사-펩티드-1 (GLP-1), 부갑상선 호르몬 (PTH), 인간 인터루킨-1β, 인간 인터루킨-6, 인간 인터루킨-32α, 인간 인터루킨-32β, 인간 인터루킨-32γ, 인자 VII, 인자 VIII, 인자 IX, 인간 혈청 알부민, 인간 인터페론-α, 인간 인터페론-β, 인간 인터페론-γ, 인간 과립구-콜로니 자극 인자, 인간 과립구 대식세포-콜로니 자극 인자, 인간 성장 호르몬 (hGH), 인간 혈소판-유래 성장 인자, 인간 염기성 섬유아세포 성장 인자, 인간 표피 성장 인자 (EGF), 인간 인슐린-유사 성장 인자, 인간 신경 성장 인자, 인간 형질전환 성장 인자 β-1, 인간 여포 자극 호르몬, 글루코스 옥시다아제, 글루코다아제, 갈락토시다아제, 글루코세레브로시다아제, 글루쿠로니다아제, 아스파라기나아제, 아르기나아제, 아르기닌 데아미나아제, 퍼록시드 디스뮤타아제, 엔도톡시나아제, 카탈라아제, 키모트립신, 우리카아제, 아데노신 디포스파타아제, 티로시나아제, 빌리루빈 옥시다아제, 소 갈락토스-1-포스페이트 유리딜트랜스퍼라아제, 해파리 녹색 형광 단백질, 칸디다 안타르티카 리파아제 B, 칸디다 루고사 (Candida rugosa) 리파아제, 균류 클로로퍼옥시다아제, β-갈락토시다아제, 레솔바아제, α-갈락토시다아제, β-글루코시다아제, 트레할로오스 신타아제, 시클로덱스트린 글리코실 트랜스퍼라아제, 크실라나아제, 피타아제, 인간 락토페린, 인간 에리스로포이에틴, 인간 파라옥소나아제, 인간 성장 분화 인자 15, 인간 갈렉틴-3 결합 단백질, 인간 세린 프로테아제 억제제, 쿠니츠 유형 2, 인간 야누스 키나아제 2, 인간 fms-유사 티로신 키나아제 3 리간드, 인간 YM1 & 2, 인간 CEMI, 인간 디아실글리세롤 아실트랜스퍼라아제, 인간 렙틴, 인간 mL259, 인간 프로테이나아제 3, 인간 라이소자임, 인간 데드 박스 단백질 41, 인간 에토포시드 유도된 단백질 24, 마우스 카스파아제 1, 소 앤지오제닌, 및 지렁이 룸브로키나아제로 이루어진 군으로부터 선택되는 것인 단리된 융합 폴리펩티드.
- 제30항에 있어서, 상기 목적 폴리펩티드가 EXD4인 단리된 융합 폴리펩티드.
- 제30항에 있어서, 상기 목적 폴리펩티드가 hGH인 단리된 융합 폴리펩티드.
- 제31항에 있어서, 상기 융합 폴리펩티드가 SCW4-3-EXD4 (서열번호 61)에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
- 제32항에 있어서, 상기 융합 폴리펩티드가 SCW4-4-hGH (서열번호 73)에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
- 제19항에 있어서, 상기 SFP가 목적 폴리펩티드의 N-말단에서 융합되는 것인 단리된 융합 폴리펩티드.
- 제19항에 있어서, 상기 SFP가 목적 폴리펩티드의 C-말단에서 융합되는 것인 단리된 융합 폴리펩티드.
- (i) 서열번호 1의 아미노산 176-213 또는 그의 단편 또는 유도체를 포함하는 친수성 (HL) 도메인을 포함하며, 막관통 도메인 (TM)이 결여된 SFP; 및
(ii) 목적 폴리펩티드
를 포함하는, 단리된 융합 폴리펩티드. - 제37항에 있어서, 상기 SFP가 목적 폴리펩티드의 N-말단에서 융합된 것인 단리된 융합 폴리펩티드.
- 제37항에 있어서, 상기 SFP가 목적 폴리펩티드의 C-말단에서 융합된 것인 단리된 융합 폴리펩티드.
- 제37항에 있어서, 상기 SFP가 서열번호 39 또는 그의 단편 또는 유도체를 포함하는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
- 제37항에 있어서, 상기 SFP가 서열번호 42 또는 그의 단편 또는 유도체를 포함하는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
- 제37항에 있어서, 상기 SFP가 서열번호 43 또는 그의 단편 또는 유도체를 포함하는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
- 제37항에 있어서, 상기 SFP가 서열번호 44 또는 그의 단편 또는 유도체를 포함하는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
- 제37항에 있어서, 상기 HL 도메인이 서열번호 45 또는 그의 단편 또는 유도체를 포함하는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
- 제37항에 있어서, 상기 목적 폴리펩티드가 인간 인터루킨-2 (hIL-2), 엑센딘-3, 엑센딘-4 (EXD4), 글루카곤-유사-펩티드-1 (GLP-1), 부갑상선 호르몬 (PTH), 인간 인터루킨-1β, 인간 인터루킨-6, 인간 인터루킨-32α, 인간 인터루킨-32β, 인간 인터루킨-32γ, 인자 VII, 인자 VIII, 인자 IX, 인간 혈청 알부민, 인간 인터페론-α, 인간 인터페론-β, 인간 인터페론-γ, 인간 과립구-콜로니 자극 인자, 인간 과립구 대식세포-콜로니 자극 인자, 인간 성장 호르몬 (hGH), 인간 혈소판-유래 성장 인자, 인간 염기성 섬유아세포 성장 인자, 인간 표피 성장 인자 (EGF), 인간 인슐린-유사 성장 인자, 인간 신경 성장 인자, 인간 형질전환 성장 인자 β-1, 인간 여포 자극 호르몬, 글루코스 옥시다아제, 글루코다아제, 갈락토시다아제, 글루코세레브로시다아제, 글루쿠로니다아제, 아스파라기나아제, 아르기나아제, 아르기닌 데아미나아제, 퍼록시드 디스뮤타아제, 엔도톡시나아제, 카탈라아제, 키모트립신, 우리카아제, 아데노신 디포스파타아제, 티로시나아제, 빌리루빈 옥시다아제, 소 갈락토스-1-포스페이트 유리딜트랜스퍼라아제, 해파리 녹색 형광 단백질, 칸디다 안타르티카 리파아제 B, 칸디다 루고사 (Candida rugosa) 리파아제, 균류 클로로퍼옥시다아제, β-갈락토시다아제, 레솔바아제, α-갈락토시다아제, β-글루코시다아제, 트레할로오스 신타아제, 시클로덱스트린 글리코실 트랜스퍼라아제, 크실라나아제, 피타아제, 인간 락토페린, 인간 에리스로포이에틴, 인간 파라옥소나아제, 인간 성장 분화 인자 15, 인간 갈렉틴-3 결합 단백질, 인간 세린 프로테아제 억제제, 쿠니츠 유형 2, 인간 야누스 키나아제 2, 인간 fms-유사 티로신 키나아제 3 리간드, 인간 YM1 & 2, 인간 CEMI, 인간 디아실글리세롤 아실트랜스퍼라아제, 인간 렙틴, 인간 mL259, 인간 프로테이나아제 3, 인간 라이소자임, 인간 데드 박스 단백질 41, 인간 에토포시드 유도된 단백질 24, 마우스 카스파아제 1, 소 앤지오제닌, 및 지렁이 룸브로키나아제로 이루어진 군으로부터 선택되는 것인 단리된 융합 폴리펩티드.
- 제45항에 있어서, 상기 목적 폴리펩티드가 IL2인 단리된 융합 폴리펩티드.
- 제45항에 있어서, 상기 목적 폴리펩티드가 EXD4인 단리된 융합 폴리펩티드.
- 제45항에 있어서, 상기 목적 폴리펩티드가 EGF인 단리된 융합 폴리펩티드.
- 제45항에 있어서, 상기 목적 폴리펩티드가 PTH인 단리된 융합 폴리펩티드.
- 제19항 내지 제49항 중 어느 한 항에 있어서, 친화성 태그를 추가적으로 포함하는 단리된 융합 폴리펩티드.
- 제50항에 있어서, 상기 친화성 태그가 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, S-태그, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 단리된 융합 폴리펩티드.
- 제51항에 있어서, 상기 친화성 태그가 6HIS인 단리된 융합 폴리펩티드.
- 제19항 내지 제52항 중 어느 한 항에 있어서, 링커 펩티드를 추가적으로 포함하며, 여기서 상기 링커는 상기 SFP와 상기 목적 폴리펩티드 사이에 위치하는 것인 단리된 융합 폴리펩티드
- 제53항에 있어서, 상기 링커 펩티드가 프로테아제 인식 서열을 포함함으로써 SFP와 목적 폴리펩티드 사이를 절단하도록 하는 단리된 융합 폴리펩티드.
- 제54항에 있어서, 상기 프로테아제 인식 서열이 효모 kex2p-인식 서열, kex2p-유사 프로테아제-인식 서열, 포유류 푸린-인식 서열, 엔테로키나아제-인식 서열, 서브틸리신-인식 서열, 담배 식각 바이러스 프로테아제-인식 서열, 트롬빈-인식 서열, 유비퀴틴 가수분해효소-인식 서열, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 단리된 융합 폴리펩티드.
- 제55항에 있어서, 상기 프로테아제 인식 서열이 엔테로키나아제-인식 서열인 단리된 융합 폴리펩티드.
- 제56항에 있어서, 상기 프로테아제 인식 서열이 아미노산 서열 Asp-Asp-Lys을 포함하는 것인 단리된 융합 폴리펩티드.
- 제55항에 있어서, 상기 프로테아제 인식 서열이 kex2p-유사 프로테아제- 또는 kex2p-인식 서열인 단리된 융합 폴리펩티드.
- 제53항에 있어서, 상기 링커 펩티드가 친화성 태그를 포함하는 것인 단리된 융합 폴리펩티드.
- 제59항에 있어서, 상기 친화성 태그가 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, S-태그, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 단리된 융합 폴리펩티드.
- 제60항에 있어서, 상기 친화성 태그가 6HIS인 단리된 융합 폴리펩티드.
- 제53항에 있어서, 상기 링커 펩티드가 제한 효소 인식 부위를 포함하는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
- (i) 프로모터;
(ii) 제1항의 SFP 또는 그의 단편 또는 유도체를 인코딩하는 제1 폴리뉴클레오티드; 및
(iii) 목적 폴리펩티드를 인코딩하는 제2 폴리뉴클레오티드
를 포함하는 작제물. - (i) 프로모터;
(ii) 서열번호 1의 아미노산 176-213을 포함하며 막관통 도메인 (TM)이 결여된 SFP, 또는 그의 단편 또는 유도체를 인코딩하는 제1 폴리뉴클레오티드; 및
(iii) 목적 폴리펩티드 또는 그의 유도체를 인코딩하는 제2 폴리뉴클레오티드
를 포함하는 작제물. - 제63항에 있어서, 상기 제1 폴리뉴클레오티드가 BGL2 (서열번호 80), GAS3 (서열번호 81), GAS5 (서열번호 82), PST1 (서열번호 83), SCW4 (서열번호 84), SCW10 (서열번호 85), SIM1 (서열번호 86), UTH1 (서열번호 87), YGP1 (서열번호 88), YPS1 (서열번호 89), 및 ZPS1 (서열번호 90)로 이루어진 군으로부터 선택되는 SFP를 인코딩하는 것인 작제물.
- 제63항에 있어서, 상기 제1 폴리뉴클레오티드가 BGL2 (서열번호 62), GAS3 (서열번호 63), GAS5 (서열번호 64), PST1 (서열번호 65), SCW4 (서열번호 66), SCW10 (서열번호 67), SIM1 (서열번호 68), UTH1 (서열번호 69), YGP1 (서열번호 70), YPS1 (서열번호 71), 및 ZPS1 (서열번호 72)로 이루어진 군으로부터 선택되는 것인 작제물.
- 제63항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-252 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
- 제67항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-303 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
- 제68항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-405 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
- 제69항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-507 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
- 제70항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-585 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
- 제71항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-681 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
- 제72항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-813 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
- 제73항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-1092 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
- 제63항에 있어서, 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드가 목적 폴리펩티드의 N-말단에서 융합된 SFP를 인코딩하는 것인 작제물.
- 제63항에 있어서, 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드가 목적 폴리펩티드의 C-말단에서 융합된 SFP를 인코딩하는 것인 작제물.
- 제64항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 39 또는 그의 단편 또는 유도체인 작제물.
- 제64항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 42 또는 그의 단편 또는 유도체인 작제물.
- 제64항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 43 또는 그의 단편 또는 유도체인 작제물.
- 제64항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 44 또는 그의 단편 또는 유도체인 작제물.
- 제64항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 45 또는 그의 단편 또는 유도체인 작제물.
- 제64항에 있어서, 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드가 목적 폴리펩티드의 N-말단에서 융합된 SFP를 인코딩하는 것인 작제물.
- 제64항에 있어서, 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드가 목적 폴리펩티드의 C-말단에서 융합된 SFP를 인코딩하는 것인 작제물.
- 제63항 내지 제83항 중 어느 한 항에 있어서, 상기 작제물이 벡터인 작제물.
- 제63항 내지 제84항 중 어느 한 항에 있어서, 상기 프로모터가 원핵생물, 진핵생물 또는 바이러스 유래인 작제물.
- 제85항에 있어서, 상기 프로모터가 박테리오파지 람다 PR, 박테리오파지 람다 PL, 람다 II, 이. 콜라이 trp, 이. 콜라이 recA, 이. 콜라이 열 충격, 이. 콜라이 lacZ, SV40 초기, GAPDH, PGK, ADH, PHO5, TEF, GAL1, GAL10, 마우스 유선 종양 바이러스, 인간 면역결핍 바이러스의 긴 말단 반복, 말로니 바이러스, 사이토메갈로바이러스 즉시 초기, 엡스테인 바르 바이러스, 라우스 육종 바이러스, 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴, 및 인간 메탈로티오네인으로 이루어진 군으로부터 선택되는 것인 작제물.
- 제86항에 있어서, 상기 프로모터가 GAL10인 작제물.
- 제63항 내지 제87항 중 어느 한 항에 있어서, 상기 제2 폴리뉴클레오티드가 인간 인터루킨-2 (hIL-2), 엑센딘-3, 엑센딘-4 (EXD4), 글루카곤-유사-펩티드-1 (GLP-1), 부갑상선 호르몬 (PTH), 인간 인터루킨-1β, 인간 인터루킨-6, 인간 인터루킨-32α, 인간 인터루킨-32β, 인간 인터루킨-32γ, 인자 VII, 인자 VIII, 인자 IX, 인간 혈청 알부민, 인간 인터페론-α, 인간 인터페론-β, 인간 인터페론-γ, 인간 과립구-콜로니 자극 인자, 인간 과립구 대식세포-콜로니 자극 인자, 인간 성장 호르몬 (hGH), 인간 혈소판-유래 성장 인자, 인간 염기성 섬유아세포 성장 인자, 인간 표피 성장 인자 (EGF), 인간 인슐린-유사 성장 인자, 인간 신경 성장 인자, 인간 형질전환 성장 인자 β-1, 인간 여포 자극 호르몬, 글루코스 옥시다아제, 글루코다아제, 갈락토시다아제, 글루코세레브로시다아제, 글루쿠로니다아제, 아스파라기나아제, 아르기나아제, 아르기닌 데아미나아제, 퍼록시드 디스뮤타아제, 엔도톡시나아제, 카탈라아제, 키모트립신, 우리카아제, 아데노신 디포스파타아제, 티로시나아제, 빌리루빈 옥시다아제, 소 갈락토스-1-포스페이트 유리딜트랜스퍼라아제, 해파리 녹색 형광 단백질, 칸디다 안타르티카 리파아제 B, 칸디다 루고사 (Candida rugosa) 리파아제, 균류 클로로퍼옥시다아제, β-갈락토시다아제, 레솔바아제, α-갈락토시다아제, β-글루코시다아제, 트레할로오스 신타아제, 시클로덱스트린 글리코실 트랜스퍼라아제, 크실라나아제, 피타아제, 인간 락토페린, 인간 에리스로포이에틴, 인간 파라옥소나아제, 인간 성장 분화 인자 15, 인간 갈렉틴-3 결합 단백질, 인간 세린 프로테아제 억제제, 쿠니츠 유형 2, 인간 야누스 키나아제 2, 인간 fms-유사 티로신 키나아제 3 리간드, 인간 YM1 & 2, 인간 CEMI, 인간 디아실글리세롤 아실트랜스퍼라아제, 인간 렙틴, 인간 mL259, 인간 프로테이나아제 3, 인간 라이소자임, 인간 데드 박스 단백질 41, 인간 에토포시드 유도된 단백질 24, 마우스 카스파아제 1, 소 앤지오제닌, 및 지렁이 룸브로키나아제로 이루어진 군으로부터 선택되는 목적 폴리펩티드를 인코딩하는 것인 작제물.
- 제63항 내지 제88항 중 어느 한 항에 있어서, 친화성 태그를 추가적으로 포함하는 작제물.
- 제89항에 있어서, 상기 친화성 태그가 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, S-태그, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 작제물 융합 폴리펩티드.
- 제90항에 있어서, 상기 친화성 태그가 6HIS인 작제물 융합 폴리펩티드.
- 제63항 내지 제91항 중 어느 한 항에 있어서, 링커 DNA를 추가적 포함하며, 여기서 상기 링커 DNA는 상기 제1 폴리펩티드와 상기 제2 폴리펩티드 사이에 위치하는 것인 작제물.
- 제92항에 있어서, 상기 링커 DNA가 프로테아제 인식 서열을 인코딩함으로써 SFP와 목적 폴리펩티드 사이를 절단하도록 하는 작제물.
- 제93항에 있어서, 상기 프로테아제 인식 서열이 효모 kex2p-인식 서열, kex2p-유사 프로테아제- 인식 서열, 포유류 푸린-인식 서열, 엔테로키나아제-인식 서열, 서브틸리신-인식 서열, 담배 식각 바이러스 프로테아제-인식 서열, 트롬빈-인식 서열, 유비퀴틴 가수분해효소-인식 서열, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 작제물.
- 제94항에 있어서, 상기 프로테아제 인식 서열이 엔테로키나아제-인식 서열인 작제물.
- 제95항에 있어서, 상기 엔테로키나아제-인식 서열이 아미노산 Asp-Asp-Lys인 작제물.
- 제94항에 있어서, 상기 프로테아제 인식 서열이 kex2p-유사 프로테아제- 또는 kex2p-인식 서열인 작제물.
- 제92항에 있어서, 상기 링커 DNA가 친화성 태그를 인코딩하는 것인 작제물.
- 제98항에 있어서, 상기 친화성 태그가 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, S-태그, 또는 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 작제물.
- 제99항에 있어서, 상기 친화성 태그가 6HIS인 작제물.
- 제92항에 있어서, 상기 링커 DNA가 제한 효소 인식 부위를 포함하는 것인 작제물.
- 제63항 내지 제101항 중 어느 한 항의 작제물을 포함하는 숙주 세포.
- 제102항에 있어서, 상기 숙주 세포가 식물, 박테리아, 균류, 효모, 또는 동물 세포로부터 선택되는 것인 숙주 세포.
- 제103항에 있어서, 상기 숙주 세포가 효모 세포인 숙주 세포.
- 제104항에 있어서, 상기 효모 세포가 칸디다, 데바리오미세스, 한세눌라, 클루이베로미세스, 피치아, 스키조사카로미세스, 야로위아, 사카로미세스, 슈반니오미세스, 및 아르크술라로 이루어진 군으로부터 선택되는 것인 숙주 세포.
- 제105항에 있어서, 상기 효모 세포가 칸디다 유틸리스, 칸디다 보이디니, 칸디다 알비칸스, 클루이베로미세스 락티스, 피치아 파스토리스, 피치아 스티피티스, 스키조사카로미세스 폼베, 사카로미세스 세레비지애, 한세눌라 폴리몰파, 야로위아 리포리티카, 슈반니오미세스 옥시덴탈리스, 및 아르크술라 아데니니보란스로 이루어진 군으로부터 선택되는 것인 숙주 세포.
- 제102항에 있어서, 상기 숙주 세포가 kex2 돌연변이체인 숙주 세포.
- (i) 숙주 세포를 SFP를 인코딩하는 폴리뉴클레오티드 및 목적 폴리펩티드를 인코딩하는 폴리뉴클레오티드로 형질전환시키는 단계;
(ii) 상기 목적 폴리펩티드에 융합된 상기 SPF를 포함하는 융합 폴리펩티드가 숙주 세포로부터 생성되고 분비되는 조건 하에 상기 숙주 세포를 배양하는 단계; 및
(iii) 상기 융합 폴리펩티드를 단리하는 단계
를 포함하는, 목적 폴리펩티드를 재조합적으로 생성하는 방법. - 제108항에 있어서, SFP를 인코딩하는 상기 폴리뉴클레오티드 및 목적 폴리펩티드를 인코딩하는 상기 폴리뉴클레오티드가 단일 작제물의 일부인 방법.
- 제108항에 있어서, SFP를 인코딩하는 상기 폴리뉴클레오티드 및 목적 폴리펩티드를 인코딩하는 상기 폴리뉴클레오티드가 다수의 작제물의 일부인 방법.
- 제110항에 있어서, 상기 다수의 작제물이 선형인 방법.
- 제111항에 있어서, 상기 다수의 작제물이 상동적 재조합에 의해 재조합된 것인 방법.
- 제108항에 있어서, 상기 SPF 및 상기 목적 폴리펩티드가 엔도프로테아제 절단에 의해 분리되는 것인 방법.
- 제108항에 있어서, 상기 융합 폴리펩티드가 친화성 태그를 추가적으로 포함하는 것인 방법.
- 제114항에 있어서, 상기 친화성 태그가 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, S-태그, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
- 제115항에 있어서, 상기 친화성 태그가 6HIS인 방법.
- 제108항에 있어서, 상기 융합 폴리펩티드가 링커 펩티드를 추가적으로 포함하며, 여기서 상기 링커 펩티드는 상기 SFP와 상기 목적 폴리펩티드 사이에 위치하는 것인 방법.
- 제117항에 있어서, 상기 링커 펩티드가 프로테아제 인식 서열을 포함함으로써 SFP와 목적 폴리펩티드 사이를 절단하도록 하는 것인 방법.
- 제118항에 있어서, 상기 프로테아제 인식 서열이 효모 kex2p-인식 서열, kex2p-유사 프로테아제-인식 서열, 포유류 푸린-인식 서열, 엔테로키나아제-인식 서열, 서브틸리신-인식 서열, 담배 식각 바이러스 프로테아제-인식 서열, 트롬빈-인식 서열, 유비퀴틴 가수분해효소-인식 서열, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
- 제119항에 있어서, 상기 프로테아제 인식 서열이 엔테로키나아제-인식 서열인 방법.
- 제120항에 있어서, 상기 엔테로키나아제-인식 서열이 아미노산 Asp-Asp-Lys인 방법.
- 제119항에 있어서, 상기 프로테아제 인식 서열이 kex2p-유사 프로테아제- 또는 kex2p-인식 서열인 방법.
- 제117항에 있어서, 상기 링커 펩티드가 친화성 태그를 포함하는 것인 방법.
- 제123항에 있어서, 상기 친화성 태그가 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, 및 S-태그로 이루어진 군으로부터 선택되는 것인 방법.
- 제124항에 있어서, 상기 친화성 태그가 6HIS인 방법.
- 제108항에 있어서, 상기 숙주 세포가 유가 발효에 의해 배양되는 것인 방법.
- 제108항 내지 제126항 중 어느 한 항에 있어서, 상기 SFP 또는 그의 단편 또는 유도체가 제1항의 방법에 의해 확인되는 것인 방법.
- 제127항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-84 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
- 제128항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-101 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
- 제129항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-135 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
- 제130항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-169 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
- 제131항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-195 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
- 제132항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-227 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
- 제133항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-271 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
- 제134항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-364 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
- 제108항 내지 제126항 중 어느 한 항에 있어서, SFP가 BGL2 (서열번호 80), GAS3 (서열번호 81), GAS5 (서열번호 82), PST1 (서열번호 83), SCW4 (서열번호 84), SCW10 (서열번호 85), SIM1 (서열번호 86), UTH1 (서열번호 87), YGP1 (서열번호 88), YPS1 (서열번호 89), 및 ZPS1 (서열번호 90)로 이루어진 군으로부터 선택되는 것인 방법.
- 제108항 내지 제126항 중 어느 한 항에 있어서, 상기 SFP가 BGL2 (서열번호 62), GAS3 (서열번호 63), GAS5 (서열번호 64), PST1 (서열번호 65), SCW4 (서열번호 66), SCW10 (서열번호 67), SIM1 (서열번호 68), UTH1 (서열번호 69), YGP1 (서열번호 70), YPS1 (서열번호 71), 및 ZPS1 (서열번호 72)로 이루어진 군으로부터 선택되는 폴리뉴클레오티드에 의해 인코딩되는 것인 방법.
- 제108항 내지 제126항 중 어느 한 항에 있어서, 상기 SFP가 서열번호 1의 아미노산 176-213 또는 그의 단편 또는 유도체를 포함하는 친수성 (HL) 도메인을 포함하며, 막관통 도메인 (TM)이 결여된 것인 방법.
- 제138항에 있어서, 상기 SFP가 서열번호 39 또는 그의 단편 또는 유도체에 의해 인코딩되는 것인 방법.
- 제138항에 있어서, 상기 SFP가 서열번호 42 또는 그의 단편 또는 유도체에 의해 인코딩되는 것인 방법.
- 제138항에 있어서, 상기 SFP가 서열번호 43 또는 단편 또는 유도체에 의해 인코딩되는 것인 방법.
- 제138항에 있어서, 상기 SFP가 서열번호 44 또는 그의 단편 또는 유도체에 의해 인코딩되는 것인 방법.
- 제138항에 있어서, 상기 SFP가 서열번호 45 또는 그의 단편 또는 유도체에 의해 인코딩되는 것인 방법.
- 제108항 내지 제143항 중 어느 한 항에 있어서, 상기 목적 폴리펩티드가 인간 인터루킨-2 (hIL-2), 엑센딘-3, 엑센딘-4 (EXD4), 글루카곤-유사-펩티드-1 (GLP-1), 부갑상선 호르몬 (PTH), 인간 인터루킨-1β, 인간 인터루킨-6, 인간 인터루킨-32α, 인간 인터루킨-32β, 인간 인터루킨-32γ, 인자 VII, 인자 VIII, 인자 IX, 인간 혈청 알부민, 인간 인터페론-α, 인간 인터페론-β, 인간 인터페론-γ, 인간 과립구-콜로니 자극 인자, 인간 과립구 대식세포-콜로니 자극 인자, 인간 성장 호르몬 (hGH), 인간 혈소판-유래 성장 인자, 인간 염기성 섬유아세포 성장 인자, 인간 표피 성장 인자 (EGF), 인간 인슐린-유사 성장 인자, 인간 신경 성장 인자, 인간 형질전환 성장 인자 β-1, 인간 여포 자극 호르몬, 글루코스 옥시다아제, 글루코다아제, 갈락토시다아제, 글루코세레브로시다아제, 글루쿠로니다아제, 아스파라기나아제, 아르기나아제, 아르기닌 데아미나아제, 퍼록시드 디스뮤타아제, 엔도톡시나아제, 카탈라아제, 키모트립신, 우리카아제, 아데노신 디포스파타아제, 티로시나아제, 빌리루빈 옥시다아제, 소 갈락토스-1-포스페이트 유리딜트랜스퍼라아제, 해파리 녹색 형광 단백질, 칸디다 안타르티카 리파아제 B, 칸디다 루고사 (Candida rugosa) 리파아제, 균류 클로로퍼옥시다아제, β-갈락토시다아제, 레솔바아제, α-갈락토시다아제, β-글루코시다아제, 트레할로오스 신타아제, 시클로덱스트린 글리코실 트랜스퍼라아제, 크실라나아제, 피타아제, 인간 락토페린, 인간 에리스로포이에틴, 인간 파라옥소나아제, 인간 성장 분화 인자 15, 인간 갈렉틴-3 결합 단백질, 인간 세린 프로테아제 억제제, 쿠니츠 유형 2, 인간 야누스 키나아제 2, 인간 fms-유사 티로신 키나아제 3 리간드, 인간 YM1 & 2, 인간 CEMI, 인간 디아실글리세롤 아실트랜스퍼라아제, 인간 렙틴, 인간 mL259, 인간 프로테이나아제 3, 인간 라이소자임, 인간 데드 박스 단백질 41, 인간 에토포시드 유도된 단백질 24, 마우스 카스파아제 1, 소 앤지오제닌, 및 지렁이 룸브로키나아제로 이루어진 군으로부터 선택되는 것인 방법.
- 제108항 내지 제144항 중 어느 한 항의 방법에 의해 재조합적으로 생성된 목적 폴리펩티드.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11997208P | 2008-12-04 | 2008-12-04 | |
US61/119,972 | 2008-12-04 | ||
PCT/KR2008/007231 WO2010064748A1 (en) | 2008-12-04 | 2008-12-05 | Screening of abundantly secreted proteins and their use as fusion partners for the production of recombinant proteins |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137020486A Division KR101387693B1 (ko) | 2008-12-04 | 2008-12-05 | 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 |
KR1020137020485A Division KR101498668B1 (ko) | 2008-12-04 | 2008-12-05 | 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110104512A true KR20110104512A (ko) | 2011-09-22 |
KR101431091B1 KR101431091B1 (ko) | 2014-08-26 |
Family
ID=42233390
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137020485A KR101498668B1 (ko) | 2008-12-04 | 2008-12-05 | 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 |
KR1020137020486A KR101387693B1 (ko) | 2008-12-04 | 2008-12-05 | 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 |
KR1020117015465A KR101431091B1 (ko) | 2008-12-04 | 2008-12-05 | 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137020485A KR101498668B1 (ko) | 2008-12-04 | 2008-12-05 | 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 |
KR1020137020486A KR101387693B1 (ko) | 2008-12-04 | 2008-12-05 | 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9550997B2 (ko) |
EP (3) | EP2573122A3 (ko) |
JP (2) | JP5524977B2 (ko) |
KR (3) | KR101498668B1 (ko) |
CN (2) | CN102239183B (ko) |
WO (1) | WO2010064748A1 (ko) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1713930B1 (en) | 2004-01-17 | 2010-11-03 | Korea Research Institute of Bioscience and Biotechnology | Rapid screening method of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom |
WO2012060666A2 (ko) * | 2010-11-04 | 2012-05-10 | 한국생명공학연구원 | 효모에서 인체 상피세포 성장인자를 대량 생산하는 방법 |
CN103180442A (zh) * | 2010-11-05 | 2013-06-26 | 旭硝子株式会社 | 裂殖酵母属酵母的转化体及其制造方法 |
CN102206615B (zh) * | 2011-04-27 | 2013-06-12 | 珠海市御品堂生物科技有限公司 | 一种用酶解法制备乙醇脱氢酶的工艺 |
CN102732549B (zh) * | 2012-06-20 | 2014-04-23 | 上海普欣生物技术有限公司 | 一种重组胰岛素样生长因子-i的制备方法 |
WO2015001460A2 (en) * | 2013-07-01 | 2015-01-08 | Biocon Limited | Signal sequence for protein expression in pichia pastoris |
EP2871235A1 (en) * | 2013-11-07 | 2015-05-13 | Centre National de la Recherche Scientifique (CNRS) | New methods to produce active hTERT |
CN103709253A (zh) * | 2013-12-20 | 2014-04-09 | 南开大学 | 一种生物合成制备glp-1及其类似物的方法 |
WO2015141705A1 (ja) * | 2014-03-19 | 2015-09-24 | 独立行政法人産業技術総合研究所 | 耐酸耐塩性付与方法と耐酸耐塩性酵母を用いた有用物質生産 |
CN104232666A (zh) * | 2014-09-01 | 2014-12-24 | 江苏海王生物制药有限公司 | 表达重组艾塞那肽的基因及其载体 |
MX2017006866A (es) * | 2014-12-01 | 2017-11-15 | Pfenex Inc | Pares de unión para producción de péptidos. |
CN105219663B (zh) * | 2015-09-18 | 2018-10-23 | 上海交通大学 | 合成海藻糖的专用菌株及其用于合成海藻糖的方法 |
WO2017120890A1 (zh) * | 2016-01-15 | 2017-07-20 | 江南大学 | 一种利用磷脂酶融合表达以提高外源蛋白表达量的方法 |
CN108192910A (zh) * | 2017-09-19 | 2018-06-22 | 陈玉皎 | 培育降血糖和降血栓的转基因植物 |
CN110863046B (zh) * | 2018-08-28 | 2021-11-30 | 博尔诚(北京)科技有限公司 | 用于检测食道癌的组合物及其用途 |
EP3752617A1 (en) * | 2018-02-12 | 2020-12-23 | Lonza Ltd. | Host cell for producing a protein of interest |
WO2019178056A1 (en) * | 2018-03-12 | 2019-09-19 | Massachusetts Institute Of Technology | Computational platform for in silico combinatorial sequence space exploration and artificial evolution of peptides |
CN108707634B (zh) * | 2018-06-05 | 2021-08-24 | 江南大学 | 一种多酶偶联生产海藻糖的方法及其应用 |
CN110373340A (zh) * | 2019-07-12 | 2019-10-25 | 广东利世康低碳科技有限公司 | 一种降解餐厨废弃物的产朊假丝酵母单基因表达菌株及其构建方法 |
CN110498859B (zh) * | 2019-07-29 | 2021-07-02 | 因之彩生物科技(武汉)有限公司 | 重组PLB-hbFGF融合蛋白及其应用 |
CN110734490A (zh) * | 2019-11-28 | 2020-01-31 | 苏州华研医用科技有限公司 | 重组人金属硫蛋白ⅲ纯品的制备方法 |
KR102613936B1 (ko) * | 2020-11-13 | 2023-12-15 | 한국생명공학연구원 | 자가분해능이 저하된 켁신 효소 및 이의 생산 방법 |
CN113087787B (zh) * | 2021-05-19 | 2023-03-21 | 广西医科大学第二附属医院(广西医科大学第二临床医学院) | 一种蚯蚓血红蛋白分离及纯化方法 |
CN116554298A (zh) * | 2022-02-25 | 2023-08-08 | 南京工业大学 | 一种强化细菌卷曲菌毛提高人表皮生长因子分泌生产效率的方法 |
CN115925805B (zh) * | 2022-07-08 | 2023-12-22 | 华兰基因工程(河南)有限公司 | 一种人质膜膜泡关联蛋白pv-1融合蛋白及其制备方法 |
CN115807023B (zh) * | 2022-09-20 | 2024-06-25 | 中国科学院天津工业生物技术研究所 | 一种提高α-乳白蛋白在酵母菌中表达的分子伴侣及其组合 |
CN116355932B (zh) * | 2022-11-04 | 2024-01-23 | 北京百奥茵诺生物科技有限公司 | 重组载体和制备μ-芋螺毒素的方法 |
CN116064617A (zh) * | 2022-11-16 | 2023-05-05 | 美药星(南京)制药有限公司 | 一种提高欧洲牡蛎溶菌酶产量的方法 |
CN117867007B (zh) * | 2024-03-11 | 2024-06-04 | 北京国科星联科技有限公司 | 一种合成人源乳铁蛋白的马克斯克鲁维酵母的构建方法与应用 |
CN117903295B (zh) * | 2024-03-19 | 2024-05-31 | 北京国科星联科技有限公司 | 一种用于分泌表达乳铁蛋白的马克斯克鲁维酵母及其构建方法与应用 |
CN118580980B (zh) * | 2024-08-07 | 2024-10-15 | 通化安睿特生物制药股份有限公司 | 一种用于制备重组人白蛋白的重组工程菌及其应用 |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4399216A (en) | 1980-02-25 | 1983-08-16 | The Trustees Of Columbia University | Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials |
ATE110111T1 (de) | 1986-05-02 | 1994-09-15 | Gist Brocades Nv | Sekretionssignal-selektionsvektoren für extrazelluläre proteinsynthese in bazillen. |
WO1990005183A1 (en) | 1988-10-31 | 1990-05-17 | Immunex Corporation | Interleukin-4 receptors |
US5486599A (en) * | 1989-03-29 | 1996-01-23 | The Board Of Trustees Of The Leland Stanford Junior University | Construction and use of synthetic constructs encoding syndecan |
FR2648713B1 (fr) | 1989-06-26 | 1994-06-10 | Commissariat Energie Atomique | Proteines hybrides entre une enzyme extracytoplasmique et une autre proteine, leur procede de preparation, ainsi que leur application comme agent de diagnostic |
US5212058A (en) | 1990-05-09 | 1993-05-18 | Massachusetts Institute Of Technology | Nucleic acid encoding ubiquitin-specific proteases |
AU651596B2 (en) | 1990-06-05 | 1994-07-28 | Immunex Corporation | Type II interleukin-1 receptors |
US5547871A (en) | 1993-01-25 | 1996-08-20 | American Cyanamid Company | Heterologous signal sequences for secretion of insect controlling proteins |
US5536637A (en) | 1993-04-07 | 1996-07-16 | Genetics Institute, Inc. | Method of screening for cDNA encoding novel secreted mammalian proteins in yeast |
US5563046A (en) | 1993-08-02 | 1996-10-08 | Celtrix Pharmaceuticals, Inc. | Fusion polypeptides and proteins |
ATE197608T1 (de) | 1993-12-10 | 2000-12-15 | Korea Inst Sci & Tech | Signalsequenzen für die secretion heterologer proteine von hefe |
DE4344350C2 (de) * | 1993-12-23 | 1995-09-21 | Max Planck Gesellschaft | Bakterien zur Herstellung stabiler Fusionsproteine und Verfahren zu deren Nachweis |
GB9406974D0 (en) | 1994-04-08 | 1994-06-01 | Pharmaceutical Proteins Ltd | Transgenic production |
EP0907727B1 (en) | 1996-04-24 | 2002-10-09 | Genetics Institute, LLC | Yeast invertase gene as reporter system for isolating cytokines |
EP1170366A1 (en) | 1996-04-24 | 2002-01-09 | Genetics Institute, Inc. | Secreted proteins obtained by using Yeast invertase gene as reporter system |
CN1247786C (zh) * | 1996-11-18 | 2006-03-29 | 诺沃奇梅兹生物技术有限公司 | 在芽孢杆菌细胞的枯草菌脂肽突变体中生产多肽的方法 |
US5952171A (en) | 1996-11-19 | 1999-09-14 | Millennium Biotherapeutics, Inc. | Method for identifying genes encoding secreted or membrane-associated proteins |
US6136569A (en) | 1997-02-27 | 2000-10-24 | Genentech, Inc. | Method of creating a cDNA library enriched in signal sequences |
KR100230578B1 (ko) | 1997-07-25 | 1999-12-01 | 허영섭 | 포스포리불로키나제를 융합파트너로 이용하는 재조합 인간 부갑상선호르몬의 발현벡터 |
US6548633B1 (en) | 1998-12-22 | 2003-04-15 | Genset, S.A. | Complementary DNA's encoding proteins with signal peptides |
US20060009633A9 (en) | 1997-11-13 | 2006-01-12 | Genset, S.A. | Complementary DNAs encoding proteins with signal peptides |
US6150098A (en) | 1998-02-20 | 2000-11-21 | Amgen Inc. | Methods for identifying novel secreted mammalian polypeptides |
US6228590B1 (en) | 1998-03-23 | 2001-05-08 | Genentech, Inc. | Method of selection for genes encoding secreted and transmembrane proteins |
WO2001000803A2 (en) | 1999-06-25 | 2001-01-04 | Genset | Apolipoprotein a-iv-related protein: polypeptide, polynucleotide sequences and biallelic markers thereof |
WO2000039310A1 (en) | 1998-12-29 | 2000-07-06 | The University Of Georgia Research Foundation, Inc. | Rubredoxin fusion proteins, protein expression system and methods |
KR100368073B1 (ko) | 1999-03-09 | 2003-01-24 | 한국생명공학연구원 | 융합파트너를 이용한 재조합 단백질의 제조방법 |
US7029842B2 (en) | 2000-04-07 | 2006-04-18 | Novozymes A/S | Signal sequence trapping |
DK1276857T3 (da) * | 2000-04-07 | 2008-10-06 | Novozymes As | Signalsekvens indfangning |
DE60211329T2 (de) * | 2001-01-16 | 2007-05-24 | Regeneron Pharmaceuticals, Inc. | Isolierung von sezernierte proteine exprimierenden zellen |
WO2002066669A1 (en) * | 2001-02-23 | 2002-08-29 | Biovitrum Ab | Method for purification of soluble ssao |
US20020127557A1 (en) | 2001-03-09 | 2002-09-12 | Ruoying Tan | Method for identification of cDNAs encoding signal peptides |
WO2005019242A2 (en) | 2003-08-18 | 2005-03-03 | E.I. Dupont De Nemours And Company | Recombinant expression of the hag1 antimicrobial peptide: use as fusion partner for the expression of alpha helical antimicrobial peptides |
US20050106625A1 (en) | 2003-09-26 | 2005-05-19 | Biohesion Incorporated | Recombinant fusion proteins with high affinity binding to gold and applications thereof |
ATE420169T1 (de) | 2003-10-16 | 2009-01-15 | Novozymes As | Verfahren zum screening auf proteinsezernierende rekombinante wirtszellen |
SE0303093D0 (sv) * | 2003-11-18 | 2003-11-18 | Darcy Birse | Expression vector, host cell and method for producing fusion proteins |
EP1713930B1 (en) | 2004-01-17 | 2010-11-03 | Korea Research Institute of Bioscience and Biotechnology | Rapid screening method of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom |
CN101128487B (zh) | 2004-12-02 | 2012-10-10 | 杜门蒂斯有限公司 | 靶向血清白蛋白和glp-1或pyy的双特异性结构域抗体 |
CN101155828A (zh) * | 2005-02-11 | 2008-04-02 | 安米林药品公司 | Gip类似物和具有可选择性质的杂合多肽 |
KR20070009269A (ko) * | 2005-07-15 | 2007-01-18 | 한국생명공학연구원 | 재조합단백질 생산용 단백질융합인자 라이브러리 및이로부터 획득된 단백질융합인자 |
US8658174B2 (en) * | 2005-07-27 | 2014-02-25 | Qinghua Wang | GLP/1/exendin 4 IgG Fc fusion constructs for treatment of diabetes |
CN1935846A (zh) * | 2005-09-14 | 2007-03-28 | 王庆华 | 一种用于治疗糖尿病的融合蛋白及其制备方法和应用 |
CN101313216A (zh) * | 2005-09-22 | 2008-11-26 | 普洛茨股份有限公司 | 酵母突变体中产生的糖基化多肽及其使用方法 |
JP5354559B2 (ja) * | 2005-11-24 | 2013-11-27 | 独立行政法人産業技術総合研究所 | 高効率分泌シグナルペプチド及びそれらを利用したタンパク質発現系 |
US7579005B2 (en) * | 2005-11-28 | 2009-08-25 | E. I. Du Pont De Nemours And Company | Process for recombinant expression and purification of antimicrobial peptides using periplasmic targeting signals as precipitable hydrophobic tags |
EP2505651A3 (en) * | 2006-12-10 | 2013-01-09 | Dyadic International, Inc. | Isolated fungus with reduced protease activity |
JP2008263975A (ja) * | 2007-03-29 | 2008-11-06 | Toyota Central R&D Labs Inc | 細胞表層結合性タンパク質及びその利用 |
-
2008
- 2008-12-05 CN CN200880132268.3A patent/CN102239183B/zh active Active
- 2008-12-05 KR KR1020137020485A patent/KR101498668B1/ko active IP Right Grant
- 2008-12-05 KR KR1020137020486A patent/KR101387693B1/ko active IP Right Grant
- 2008-12-05 CN CN201410174695.5A patent/CN103952425B/zh active Active
- 2008-12-05 EP EP12187155.2A patent/EP2573122A3/en not_active Withdrawn
- 2008-12-05 KR KR1020117015465A patent/KR101431091B1/ko active IP Right Grant
- 2008-12-05 WO PCT/KR2008/007231 patent/WO2010064748A1/en active Application Filing
- 2008-12-05 EP EP15160709.0A patent/EP2918606B1/en active Active
- 2008-12-05 EP EP08878601.7A patent/EP2370470B1/en active Active
- 2008-12-05 JP JP2011539432A patent/JP5524977B2/ja active Active
-
2009
- 2009-12-04 US US12/631,449 patent/US9550997B2/en active Active
-
2014
- 2014-02-24 JP JP2014033449A patent/JP5955875B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
KR20130091797A (ko) | 2013-08-19 |
EP2573122A3 (en) | 2013-07-10 |
EP2370470A1 (en) | 2011-10-05 |
JP2012510808A (ja) | 2012-05-17 |
KR101387693B1 (ko) | 2014-04-21 |
KR101498668B1 (ko) | 2015-03-06 |
EP2370470A4 (en) | 2012-04-11 |
KR20130091798A (ko) | 2013-08-19 |
EP2573122A2 (en) | 2013-03-27 |
JP5955875B2 (ja) | 2016-07-20 |
CN103952425B (zh) | 2017-04-12 |
EP2370470B1 (en) | 2016-10-05 |
CN103952425A (zh) | 2014-07-30 |
EP2918606A2 (en) | 2015-09-16 |
WO2010064748A1 (en) | 2010-06-10 |
CN102239183A (zh) | 2011-11-09 |
JP2014138600A (ja) | 2014-07-31 |
US9550997B2 (en) | 2017-01-24 |
EP2918606A3 (en) | 2015-10-28 |
US20100159465A1 (en) | 2010-06-24 |
KR101431091B1 (ko) | 2014-08-26 |
CN102239183B (zh) | 2017-06-30 |
JP5524977B2 (ja) | 2014-06-18 |
EP2918606B1 (en) | 2018-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101498668B1 (ko) | 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 | |
EP1904656B1 (en) | Library of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom | |
TWI702289B (zh) | 用於胜肽生產之融合夥伴 | |
US9012367B2 (en) | Rapid screening method of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom | |
KR20130059404A (ko) | 원핵생물 발현 구축물 | |
KR101291241B1 (ko) | 효모에서 인체 상피세포 성장인자를 대량 생산하는 방법 | |
US20160168198A1 (en) | Signal sequence for protein expression in pichia pastoris | |
WO2007012334A1 (en) | Improved protein expression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
FPAY | Annual fee payment |
Payment date: 20170718 Year of fee payment: 4 |