KR20070091156A - 단백질 제조 - Google Patents
단백질 제조 Download PDFInfo
- Publication number
- KR20070091156A KR20070091156A KR1020077014382A KR20077014382A KR20070091156A KR 20070091156 A KR20070091156 A KR 20070091156A KR 1020077014382 A KR1020077014382 A KR 1020077014382A KR 20077014382 A KR20077014382 A KR 20077014382A KR 20070091156 A KR20070091156 A KR 20070091156A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- leu
- pro
- protein
- cells
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 97
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 79
- 238000004519 manufacturing process Methods 0.000 title description 5
- 210000004027 cell Anatomy 0.000 claims abstract description 97
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 91
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 89
- 241000196324 Embryophyta Species 0.000 claims abstract description 36
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 30
- 239000013598 vector Substances 0.000 claims abstract description 23
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 21
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims abstract description 17
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims abstract description 17
- 150000007523 nucleic acids Chemical class 0.000 claims description 62
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 55
- 108060006613 prolamin Proteins 0.000 claims description 30
- 229920002494 Zein Polymers 0.000 claims description 23
- 239000005019 zein Substances 0.000 claims description 23
- 229940093612 zein Drugs 0.000 claims description 23
- 229920001184 polypeptide Polymers 0.000 claims description 15
- 102000039446 nucleic acids Human genes 0.000 claims description 14
- 108020004707 nucleic acids Proteins 0.000 claims description 14
- 210000005253 yeast cell Anatomy 0.000 claims description 13
- 238000000429 assembly Methods 0.000 claims description 12
- 230000000712 assembly Effects 0.000 claims description 12
- 210000004962 mammalian cell Anatomy 0.000 claims description 12
- 239000013604 expression vector Substances 0.000 claims description 11
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 10
- 235000007164 Oryza sativa Nutrition 0.000 claims description 8
- 230000001105 regulatory effect Effects 0.000 claims description 8
- 235000009566 rice Nutrition 0.000 claims description 8
- 210000004102 animal cell Anatomy 0.000 claims description 7
- 230000001939 inductive effect Effects 0.000 claims description 6
- 230000002538 fungal effect Effects 0.000 claims description 4
- 230000002797 proteolythic effect Effects 0.000 claims description 3
- 240000007594 Oryza sativa Species 0.000 claims 2
- 210000003527 eukaryotic cell Anatomy 0.000 abstract description 11
- 230000009466 transformation Effects 0.000 abstract description 9
- 230000015572 biosynthetic process Effects 0.000 abstract description 7
- 230000006698 induction Effects 0.000 abstract description 7
- 235000018102 proteins Nutrition 0.000 description 71
- 108020004414 DNA Proteins 0.000 description 41
- 102000053602 DNA Human genes 0.000 description 41
- 108010077112 prolyl-proline Proteins 0.000 description 23
- 239000012634 fragment Substances 0.000 description 22
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 20
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 20
- 102000002265 Human Growth Hormone Human genes 0.000 description 19
- 108010000521 Human Growth Hormone Proteins 0.000 description 19
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 17
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 16
- 239000000854 Human Growth Hormone Substances 0.000 description 15
- 238000009825 accumulation Methods 0.000 description 15
- 230000031787 nutrient reservoir activity Effects 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 15
- 150000001413 amino acids Chemical group 0.000 description 13
- 239000002609 medium Substances 0.000 description 13
- 108010025306 histidylleucine Proteins 0.000 description 12
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 10
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 9
- 241000235070 Saccharomyces Species 0.000 description 9
- 240000008042 Zea mays Species 0.000 description 9
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 9
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 108020004511 Recombinant DNA Proteins 0.000 description 8
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 7
- 241001465754 Metazoa Species 0.000 description 7
- 241000235648 Pichia Species 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- 210000003463 organelle Anatomy 0.000 description 7
- 241000701447 unidentified baculovirus Species 0.000 description 7
- VRBRSQUJTJSJCL-FRSCJGFNSA-N (2s)-1-[(2s)-1-[(2s)-1-[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-methylbutanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)NC(=O)[C@@H](N)C(C)C)C1=CN=CN1 VRBRSQUJTJSJCL-FRSCJGFNSA-N 0.000 description 6
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 6
- NPMFDZGLKBNFOO-SRVKXCTJSA-N Gln-Pro-His Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NPMFDZGLKBNFOO-SRVKXCTJSA-N 0.000 description 6
- 241000209094 Oryza Species 0.000 description 6
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 6
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 108010085325 histidylproline Proteins 0.000 description 6
- 108010053725 prolylvaline Proteins 0.000 description 6
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 5
- 102000055006 Calcitonin Human genes 0.000 description 5
- 108060001064 Calcitonin Proteins 0.000 description 5
- URDUGPGPLNXXES-WHFBIAKZSA-N Cys-Gly-Cys Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O URDUGPGPLNXXES-WHFBIAKZSA-N 0.000 description 5
- 241000238631 Hexapoda Species 0.000 description 5
- MDXAULHWGWETHF-SRVKXCTJSA-N Met-Arg-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCNC(N)=N MDXAULHWGWETHF-SRVKXCTJSA-N 0.000 description 5
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 5
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 5
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 5
- 235000001014 amino acid Nutrition 0.000 description 5
- 229960004015 calcitonin Drugs 0.000 description 5
- 235000005822 corn Nutrition 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 5
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 5
- 241000271566 Aves Species 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 4
- 241000725303 Human immunodeficiency virus Species 0.000 description 4
- 241000235058 Komagataella pastoris Species 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 4
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 4
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 4
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 4
- 108700005078 Synthetic Genes Proteins 0.000 description 4
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 4
- 108010055615 Zein Proteins 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 238000003119 immunoblot Methods 0.000 description 4
- 235000009973 maize Nutrition 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 4
- 108010026333 seryl-proline Proteins 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 4
- 238000001262 western blot Methods 0.000 description 4
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 241000195493 Cryptophyta Species 0.000 description 3
- BPHKULHWEIUDOB-FXQIFTODSA-N Cys-Gln-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BPHKULHWEIUDOB-FXQIFTODSA-N 0.000 description 3
- 102400001368 Epidermal growth factor Human genes 0.000 description 3
- 101800003838 Epidermal growth factor Proteins 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 3
- ISQOVWDWRUONJH-YESZJQIVSA-N His-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ISQOVWDWRUONJH-YESZJQIVSA-N 0.000 description 3
- FBOMZVOKCZMDIG-XQQFMLRXSA-N His-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBOMZVOKCZMDIG-XQQFMLRXSA-N 0.000 description 3
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 3
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 3
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 3
- 101710118538 Protease Proteins 0.000 description 3
- 241000592344 Spermatophyta Species 0.000 description 3
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 125000002619 bicyclic group Chemical group 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 229940116977 epidermal growth factor Drugs 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- -1 gamma-zein Chemical class 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- IGAZHQIYONOHQN-UHFFFAOYSA-N Alexa Fluor 555 Chemical compound C=12C=CC(=N)C(S(O)(=O)=O)=C2OC2=C(S(O)(=O)=O)C(N)=CC=C2C=1C1=CC=C(C(O)=O)C=C1C(O)=O IGAZHQIYONOHQN-UHFFFAOYSA-N 0.000 description 2
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 2
- 241000972773 Aulopiformes Species 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 102000008186 Collagen Human genes 0.000 description 2
- 108010035532 Collagen Proteins 0.000 description 2
- 241000711573 Coronaviridae Species 0.000 description 2
- PFAQXUDMZVMADG-AVGNSLFASA-N Cys-Gln-Tyr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PFAQXUDMZVMADG-AVGNSLFASA-N 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 102100037642 Elongation factor G, mitochondrial Human genes 0.000 description 2
- 108010013369 Enteropeptidase Proteins 0.000 description 2
- 102100029727 Enteropeptidase Human genes 0.000 description 2
- 208000005577 Gastroenteritis Diseases 0.000 description 2
- MFLMFRZBAJSGHK-ACZMJKKPSA-N Gln-Cys-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N MFLMFRZBAJSGHK-ACZMJKKPSA-N 0.000 description 2
- LVNILKSSFHCSJZ-IHRRRGAJSA-N Gln-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LVNILKSSFHCSJZ-IHRRRGAJSA-N 0.000 description 2
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 2
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 2
- KVQOVQVGVKDZNW-GUBZILKMSA-N Gln-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KVQOVQVGVKDZNW-GUBZILKMSA-N 0.000 description 2
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 2
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 2
- 101000798114 Homo sapiens Lactotransferrin Proteins 0.000 description 2
- 102000004157 Hydrolases Human genes 0.000 description 2
- 108090000604 Hydrolases Proteins 0.000 description 2
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 2
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- 101710182846 Polyhedrin Proteins 0.000 description 2
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 2
- DIZLUAZLNDFDPR-CIUDSAMLSA-N Pro-Cys-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 DIZLUAZLNDFDPR-CIUDSAMLSA-N 0.000 description 2
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 2
- 108010016634 Seed Storage Proteins Proteins 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- XQAPEISNMXNKGE-FXQIFTODSA-N Ser-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CS)C(=O)O XQAPEISNMXNKGE-FXQIFTODSA-N 0.000 description 2
- 241000209140 Triticum Species 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 2
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 2
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 2
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 2
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 2
- 241000269370 Xenopus <genus> Species 0.000 description 2
- 241000607479 Yersinia pestis Species 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 230000000443 biocontrol Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 2
- 229920001436 collagen Polymers 0.000 description 2
- 229960005188 collagen Drugs 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 230000008021 deposition Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000002073 fluorescence micrograph Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 229930182830 galactose Natural products 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000000122 growth hormone Substances 0.000 description 2
- 208000002672 hepatitis B Diseases 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 102000050459 human LTF Human genes 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000003262 industrial enzyme Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000004898 n-terminal fragment Anatomy 0.000 description 2
- XXRYFVCIMARHRS-UHFFFAOYSA-N propan-2-yl n-dimethoxyphosphorylcarbamate Chemical compound COP(=O)(OC)NC(=O)OC(C)C XXRYFVCIMARHRS-UHFFFAOYSA-N 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 235000019515 salmon Nutrition 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- MHTGCGBUKAKZJN-KOQQHMENSA-N (2s)-2-[[(2s)-2-[[(2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)[C@@H](N)[C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 MHTGCGBUKAKZJN-KOQQHMENSA-N 0.000 description 1
- CYNAPIVXKRLDER-LBPRGKRZSA-N (2s)-2-benzamido-3-(4-hydroxy-3-nitrophenyl)propanoic acid Chemical compound C([C@@H](C(=O)O)NC(=O)C=1C=CC=CC=1)C1=CC=C(O)C([N+]([O-])=O)=C1 CYNAPIVXKRLDER-LBPRGKRZSA-N 0.000 description 1
- RBNPOMFGQQGHHO-UHFFFAOYSA-N -2,3-Dihydroxypropanoic acid Natural products OCC(O)C(O)=O RBNPOMFGQQGHHO-UHFFFAOYSA-N 0.000 description 1
- 101710102211 11S globulin Proteins 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- OARAZORWIMYUPO-FXQIFTODSA-N Ala-Met-Cys Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CS)C(O)=O OARAZORWIMYUPO-FXQIFTODSA-N 0.000 description 1
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 1
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 1
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 108010025188 Alcohol oxidase Proteins 0.000 description 1
- 239000012103 Alexa Fluor 488 Substances 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 1
- MTANSHNQTWPZKP-KKUMJFAQSA-N Arg-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O MTANSHNQTWPZKP-KKUMJFAQSA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 1
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 1
- CTAPSNCVKPOOSM-KKUMJFAQSA-N Arg-Tyr-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CTAPSNCVKPOOSM-KKUMJFAQSA-N 0.000 description 1
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 1
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 1
- QQEWINYJRFBLNN-DLOVCJGASA-N Asn-Ala-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QQEWINYJRFBLNN-DLOVCJGASA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- 241000201370 Autographa californica nucleopolyhedrovirus Species 0.000 description 1
- 101150071434 BAR1 gene Proteins 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 101000767750 Carya illinoinensis Vicilin Car i 2.0101 Proteins 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 101000767759 Corylus avellana Vicilin Cor a 11.0101 Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 101710190853 Cruciferin Proteins 0.000 description 1
- MGAWEOHYNIMOQJ-ACZMJKKPSA-N Cys-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N MGAWEOHYNIMOQJ-ACZMJKKPSA-N 0.000 description 1
- HHABWQIFXZPZCK-ACZMJKKPSA-N Cys-Gln-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N HHABWQIFXZPZCK-ACZMJKKPSA-N 0.000 description 1
- PQHYZJPCYRDYNE-QWRGUYRKSA-N Cys-Gly-Phe Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PQHYZJPCYRDYNE-QWRGUYRKSA-N 0.000 description 1
- DIUBVGXMXONJCF-KKUMJFAQSA-N Cys-His-Tyr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DIUBVGXMXONJCF-KKUMJFAQSA-N 0.000 description 1
- CYHMMWIOEUVHHZ-IHRRRGAJSA-N Cys-Met-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CYHMMWIOEUVHHZ-IHRRRGAJSA-N 0.000 description 1
- ALTQTAKGRFLRLR-GUBZILKMSA-N Cys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N ALTQTAKGRFLRLR-GUBZILKMSA-N 0.000 description 1
- RBNPOMFGQQGHHO-UWTATZPHSA-N D-glyceric acid Chemical compound OC[C@@H](O)C(O)=O RBNPOMFGQQGHHO-UWTATZPHSA-N 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 108010001498 Galectin 1 Proteins 0.000 description 1
- 102100021736 Galectin-1 Human genes 0.000 description 1
- 102100024637 Galectin-10 Human genes 0.000 description 1
- 101001011019 Gallus gallus Gallinacin-10 Proteins 0.000 description 1
- 101001011021 Gallus gallus Gallinacin-12 Proteins 0.000 description 1
- 108010061711 Gliadin Proteins 0.000 description 1
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 1
- GNDJOCGXGLNCKY-ACZMJKKPSA-N Gln-Cys-Cys Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O GNDJOCGXGLNCKY-ACZMJKKPSA-N 0.000 description 1
- ZRXBYKAOFHLTDN-GUBZILKMSA-N Gln-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N ZRXBYKAOFHLTDN-GUBZILKMSA-N 0.000 description 1
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- SWDSRANUCKNBLA-AVGNSLFASA-N Gln-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SWDSRANUCKNBLA-AVGNSLFASA-N 0.000 description 1
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 1
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 1
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 1
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 1
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- FTMLQFPULNGION-ZVZYQTTQSA-N Gln-Val-Trp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FTMLQFPULNGION-ZVZYQTTQSA-N 0.000 description 1
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101150069554 HIS4 gene Proteins 0.000 description 1
- OMNVOTCFQQLEQU-CIUDSAMLSA-N His-Asn-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMNVOTCFQQLEQU-CIUDSAMLSA-N 0.000 description 1
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 1
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 1
- XJFITURPHAKKAI-SRVKXCTJSA-N His-Pro-Gln Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CN=CN1 XJFITURPHAKKAI-SRVKXCTJSA-N 0.000 description 1
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 1
- 101000880344 Homo sapiens Elongation factor G, mitochondrial Proteins 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- 101000622316 Juglans regia Vicilin Jug r 2.0101 Proteins 0.000 description 1
- 101150045458 KEX2 gene Proteins 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 101710094902 Legumin Proteins 0.000 description 1
- 241000255777 Lepidoptera Species 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- YORLGJINWYYIMX-KKUMJFAQSA-N Leu-Cys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YORLGJINWYYIMX-KKUMJFAQSA-N 0.000 description 1
- JYOAXOMPIXKMKK-YUMQZZPRSA-N Leu-Gln Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCC(N)=O JYOAXOMPIXKMKK-YUMQZZPRSA-N 0.000 description 1
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 1
- KVOFSTUWVSQMDK-KKUMJFAQSA-N Leu-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KVOFSTUWVSQMDK-KKUMJFAQSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- 229910009891 LiAc Inorganic materials 0.000 description 1
- BYEBKXRNDLTGFW-CIUDSAMLSA-N Lys-Cys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O BYEBKXRNDLTGFW-CIUDSAMLSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101001018085 Lysobacter enzymogenes Lysyl endopeptidase Proteins 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 1
- LQMHZERGCQJKAH-STQMWFEESA-N Met-Gly-Phe Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LQMHZERGCQJKAH-STQMWFEESA-N 0.000 description 1
- HOZNVKDCKZPRER-XUXIUFHCSA-N Met-Lys-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HOZNVKDCKZPRER-XUXIUFHCSA-N 0.000 description 1
- VWFHWJGVLVZVIS-QXEWZRGKSA-N Met-Val-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O VWFHWJGVLVZVIS-QXEWZRGKSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- TYBWABJIIOVYOR-UHFFFAOYSA-N OCC(C(O)=O)OP(=O)=O Chemical compound OCC(C(O)=O)OP(=O)=O TYBWABJIIOVYOR-UHFFFAOYSA-N 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 1
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 1
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000425347 Phyla <beetle> Species 0.000 description 1
- 101000767757 Pinus koraiensis Vicilin Pin k 2.0101 Proteins 0.000 description 1
- 101000767758 Pistacia vera Vicilin Pis v 3.0101 Proteins 0.000 description 1
- 108010064851 Plant Proteins Proteins 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- OYEUSRAZOGIDBY-JYJNAYRXSA-N Pro-Arg-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OYEUSRAZOGIDBY-JYJNAYRXSA-N 0.000 description 1
- CMOIIANLNNYUTP-SRVKXCTJSA-N Pro-Gln-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CMOIIANLNNYUTP-SRVKXCTJSA-N 0.000 description 1
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- GYXVUTAOICLGKJ-ACZMJKKPSA-N Ser-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N GYXVUTAOICLGKJ-ACZMJKKPSA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 1
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 1
- QUGRFWPMPVIAPW-IHRRRGAJSA-N Ser-Pro-Phe Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QUGRFWPMPVIAPW-IHRRRGAJSA-N 0.000 description 1
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 1
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- 101100226845 Strongylocentrotus purpuratus EGF2 gene Proteins 0.000 description 1
- 101100226846 Strongylocentrotus purpuratus EGF3 gene Proteins 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 1
- DSLHSTIUAPKERR-XGEHTFHBSA-N Thr-Cys-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O DSLHSTIUAPKERR-XGEHTFHBSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 1
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 1
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 1
- 241000255985 Trichoplusia Species 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- DQDXHYIEITXNJY-BPUTZDHNSA-N Trp-Gln-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N DQDXHYIEITXNJY-BPUTZDHNSA-N 0.000 description 1
- IYHRKILQAQWODS-VJBMBRPKSA-N Trp-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IYHRKILQAQWODS-VJBMBRPKSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- QJBWZNTWJSZUOY-UWJYBYFXSA-N Tyr-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QJBWZNTWJSZUOY-UWJYBYFXSA-N 0.000 description 1
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 1
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 1
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 1
- BVDHHLMIZFCAAU-BZSNNMDCSA-N Tyr-Cys-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BVDHHLMIZFCAAU-BZSNNMDCSA-N 0.000 description 1
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- LMSBRIVOCYOKMU-NRPADANISA-N Val-Gln-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N LMSBRIVOCYOKMU-NRPADANISA-N 0.000 description 1
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- VSCIANXXVZOYOC-AVGNSLFASA-N Val-Pro-His Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VSCIANXXVZOYOC-AVGNSLFASA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- 101710196023 Vicilin Proteins 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- XKRFYHLGVUSROY-UHFFFAOYSA-N argon Substances [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 1
- 229910052786 argon Inorganic materials 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 229960003773 calcitonin (salmon synthetic) Drugs 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004624 confocal microscopy Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- NEKNNCABDXGBEN-UHFFFAOYSA-L disodium;4-(4-chloro-2-methylphenoxy)butanoate;4-(2,4-dichlorophenoxy)butanoate Chemical compound [Na+].[Na+].CC1=CC(Cl)=CC=C1OCCCC([O-])=O.[O-]C(=O)CCCOC1=CC=C(Cl)C=C1Cl NEKNNCABDXGBEN-UHFFFAOYSA-L 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 101150016954 efg1 gene Proteins 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 210000005168 endometrial cell Anatomy 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 101150100117 gfm1 gene Proteins 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000010874 maintenance of protein location Effects 0.000 description 1
- 238000011177 media preparation Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 238000001000 micrograph Methods 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 239000002417 nutraceutical Substances 0.000 description 1
- 235000021436 nutraceutical agent Nutrition 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 235000021118 plant-derived protein Nutrition 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 210000002729 polyribosome Anatomy 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 238000000164 protein isolation Methods 0.000 description 1
- 239000012474 protein marker Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000003935 rough endoplasmic reticulum Anatomy 0.000 description 1
- 108010068072 salmon calcitonin Proteins 0.000 description 1
- 210000004761 scalp Anatomy 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 210000000352 storage cell Anatomy 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 108010079202 tyrosyl-alanyl-cysteine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 210000003934 vacuole Anatomy 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
- 210000004885 white matter Anatomy 0.000 description 1
- 239000007222 ypd medium Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
- C07K14/425—Zeins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/475—Growth factors; Growth regulators
- C07K14/485—Epidermal growth factor [EGF], i.e. urogastrone
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/585—Calcitonins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/61—Growth hormone [GH], i.e. somatotropin
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/02—Preparation of hybrid cells by fusion of two or more cells, e.g. protoplast fusion
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8257—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/04—Fusion polypeptide containing a localisation/targetting motif containing an ER retention signal such as a C-terminal HDEL motif
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Microbiology (AREA)
- Endocrinology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Toxicology (AREA)
- Botany (AREA)
- Cell Biology (AREA)
- Pharmacology & Pharmacy (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
숙주 시스템들로서 고등 식물 외의 숙주 진핵 세포들 및 유기체들에서 재조합 단백질체 유사 조립체로서 발현되는 융합 단백질을 형성하는 방법이 개시된다. 특히, 펩티드들 및 단백질들이 재조합 단백질체 유사 조립체(RPBLA) 형성의 유도를 매개하는 단백질 서열들에 융합되어, 적절한 벡터로 형질 전환 후 이들 숙주 세포들에서 안정되게 발현 및 축적된다. 융합 단백질의 제조 방법들도 개시된다.
Description
본 발명은 숙주 시스템들로서 고등 식물 외의 진핵 세포들 및 유기체들에서 재조합 펩티드들 및 단백질들의 제조를 고려한 것이다. 보다 구체적으로, 펩티드들 및 단백질들이, 단백질체 유사 조립체 (recombinant protein body-like assemblies: RPBLA) 형성의 유도를 매개하는 단백질 서열에 융합되어, 적절한 벡터로 형질 전환 후 이들 숙주 시스템들에서 안정하게 발현 및 축적된다.
치료, 준의약식품 (nutraceutical) 또는 산업적 용도를 위한 재조합 단백질들의 제조는 지난 십 년간에 걸쳐 큰 성공을 누려왔다. 상이한 진핵 세포들 및 유기체들은 유효 단백질-기재의 치료제를 생산할 수 있는 것으로 나타났다. 유감스럽게도, 낮은 재조합 단백질 생산 수준 및/또는 단백질 단리 및 정제 절차들로 인해 종종 유발되는 높은 비용은 이들의 산업적 적용을 실효시킬 수 있다. 상이한 접근 방법들에 의하여, 제조 수준 및 정제 절차들을 모두 개선시키기 위한 연구가 활발히 이루어졌다.
식물 종자 저장 단백질 도메인(domain)과 관심 대상이 되는 단백질과의 융합에 기초한 신규 기술 (WO 2004/003207)이, 재조합 단백질들의 고등 식물들에서의 안정화 및 축적을 증가시키기 위해 개발되었다. 이들 저장 단백질들은 식물 종자 들에 특이적인 것으로, 이들은 단백질 체들에 안정하게 축적된다 (Galili 등, 1993, Trends Cell Biol 3:437-442).
저장 단백질들은 신호 펩티드를 거쳐 소포체 (ER)의 내강(lumen) 내로 삽입되고, ER-유도된 단백질체들 (ER-PBs)로 불리는 특이적 세포 소기관들을 발생시키는 그 소포체 내에서 또는 단백질 저장 액포 (PSV)에서 조립된다 (Okita 및 Rogers 1996 Annu. Rev. Plant Physiol Mol. Biol. 47: 327-50; Herman 및 Larkins 1999 Plant Cell 11:601-613; Sanderfoot 및 Raikel 1999 Plant Cell 11:629-642).
재조합 저장 단백질들은, 제노푸스 오오사이트들 (Xenopus oocytes) 및 효모와 같은 비-식물성 숙주 계들에서, PB-유사 세포 소기관들 내에서 조립되는 것으로도 기재되었다.
곡물 프롤라민들 (가장 많은 곡물 저장 단백질)의 발현이, 대응 mRNA들의 주입 후 제노푸스 오오사이트들에서 기재되었다. 이 계는 이들 저장 단백질들의 표적화(targeting) 성질들의 연구 (Simon 등, 1990, Plant Cell 2:941-950; Altschuler 등, 1993, Plant Cell 5:443-450; Torrent 등, 1994, Planta 192:512-518) 및 19 kDa α-제인, 즉 옥수수 프롤라민의 개질 가능성을, 필수 아미노산들인 리신 및 트립토판을 그의 안정성을 변경하지 않으면서 그 서열 내로 도입함에 의해 시험(Wallace 등, 1988, Science 240:662-664)하기 위한 모델로서 사용되어 왔다.
제인류, 즉 옥수수 프롤라민들의 복합군은, 각종 목적으로 효모에서도 제조되어 왔다. Coraggio 등 (1988, Eur J Cell Biol 47:165-172)은 이 단백질의 표적화 결정 인자들을 연구하기 위하여 효모에서 천연 및 개질된 α-제인들을 발현시켰 다. Kim 등 (2002, Plant Cell 14: 655-672)은 단백질체 형성을 이끄는 가능한 α-, β-, γ- 및 δ-제인 상호작용들을 연구하였다. 이러한 문제를 다루기 위해, 그들은 효모 세포들을 이들 단백질들을 암호화하는 cDNA들로 형질 전환하였다. 추가적으로, 이들 저자들은, 효모 세포들 중에서 제인 단백질들의 세포내 분포 위치(sucellular loclization)를 결정하기 위하여 제인-GFP 융합 단백질들을 구축하였다. 상기 효모 세포들은, 그 후 제인의 성질들을 연구하기 위한 모델 발현 시스템으로서 사용되었다. Kim 등(2002, Plant Cell 14: 655-672)이, 제인류 혼자서는 형질 전환된 효모 내에서 잘 축적되지 않기 때문에, 효모가 제인 상호작용을 연구하는데 양호한 모델이 아니라고 결정한 것에 유의할 필요가 있다. 효모 세포들은, 글리아딘이라고 하는 밀 저장 단백질들의 운반 및 단백질체 침적을 제어하는 메커니즘들을 연구하기 위한 모델로서도 사용되었다 (Rosenberg 등, 1993, Plant Physiol 102:61-69).
이제 본 발명자들은 재조합 단백질체 유사 조립체들(RPBLAs)의 유도를 매개하는 단백질 서열의 융합, 예로서 프롤라민 또는 프롤라민 도메인들과 관심 대상의 (표적) 펩티드 또는 단백질과의 융합이 진균 (효모 포함), 조류 및 동물과 같은 유기체들의 세포들 중에서 그러한 RPBLA들의 축적을 매개한다는 것을 보여준다. 흥미롭게도, 이들 융합 단백질들은 동물 세포들내에, 단백질체 유사 세포 소기관 구조들 내부에서 안정하게 축적된다.
발명의 개요
본 발명은 단백질체 유도 서열 (PBIS) 및 관심 대상의 펩티드 또는 단백질 (종종 집합적으로 여기에서 폴리펩티드로서 언급됨)을 함유하는 융합 단백질을, 고등 식물들 외의 진핵 세포들 중에서, 예로서 동물, 진균 및 조류에서 및 배양된 동물성, 진균 및 조류 세포들에서 제조하기 위한 계 및 방법을 제공하며, 여기에서 관심 대상의 펩티드 또는 단백질을 함유하는 융합 단백질들은 재조합 단백질체 유사 조립체들 (RPBLAs)로서 안정하게 축적된다. 상기 PBIS는 이들 세포 소기관들 내에서, RPBLA 형성 및 단백질, 예로서 관심 대상의 펩티드 또는 단백질 (표적들)을 갖는 천연 또는 개질된 저장 단백질 서열들의 도입 및/또는 축적의 유도를 매개할 수 있다.
본 발명은, 다른 것들 중, 관심 대상의 생성물을 융합 단백질의 형태로, PBIS를 코딩하는 핵산 부분 및 관심 대상의 폴리펩티드 생성물을 암호화하는 핵산 부분을 함유하는 핵산 서열로 형질 전환된 숙주 시스템으로서 고등 식물 외의 진핵 세포들 중에서 제조하는 방법을 제공한다.
특정 구현예에서, 형질 전환을 위해 사용된 상기 핵산 서열은 (i) PBIS를 코딩하는 핵산 서열, 및 (ii) 관심 대상의 생성물을 코딩하는 뉴클레오티드 서열을 함유하는 핵산 서열을 함유한다. 한 구현예에서, 핵산 서열 (i)의 3' 말단은 상기 핵산 서열 (ii)의 5' 말단에 연결된다. 또 다른 구현예에서, 핵산 서열 (i)의 5' 말단은 핵산 서열 (ii)의 3' 말단에 연결된다. 따라서, PBIS 서열은 융합 단백질의 N-말단 또는 C- 말단에 존재할 수 있다.
또 다른 특정 구현예에서, 형질 전환에 사용된 핵산 서열은, 상기 언급된 핵산 서열들 (i) 및 (ii)에 추가하여, 스페이서(spacer) 아미노산 서열을 코딩하는 뉴클레오티드 서열을 함유하는 핵산 서열을 함유한다. 상기 스페이서 아미노산 서열은, 효소적 또는 화학적 수단에 의해, 분할가능한 또는 분할가능하지 않은 아미노산 서열일 수 있다. 특정 구현예에서, 상기 핵산 서열 (iii)은 핵산 서열들 (i) 및 (ii) 사이에 위치되며, 예로서 핵산 서열 (iii)의 3' 말단은 상기 핵산 서열 (ii)의 5' 말단에 연결된다. 또 다른 구현예에서, 상기 핵산 서열 (iii)의 5' 말단은 핵산 서열 (ii)의 3' 말단에 연결된다.
또한, 특정 구현예에서, 형질 전환 목적을 위해 사용된 핵산 서열은 특이적으로 분할가능한 서열을 암호화하고, 이는 본 출원과 공동명의의(co-assigned) 특허 출원 WO 2004003207 에 따라 정의된 바와 같다. 또한, 다른 구현예에서, 상기 핵산은 특허 출원 WO 2004003207에 일치하며, 여기에서 상기 효소적 또는 화학적 수단에 의해 특이적으로 분할가능한 아미노산 서열을 코딩하는 핵산 서열은 부재한다. 다른 구현예에서, 상기 융합 단백질들은 PBIS와 관심 대상의 펩티드 또는 단백질 간의 직접 융합일 수 있다.
다른 구현예에서, 본 발명의 방법은 융합 단백질의 단리 및 정제를 더 포함한다.
또 다른 구현예에서, 관심 대상의 단백질은 천연 또는 개질된 저장 단백질, 예로서 천연 또는 개질된 프롤라민류 또는 프롤라민 도메인들에 융합된다. 관심 대상의 단백질들의 예들은 치료, 준의약적, 생체제어 또는 산업적 용도를 갖는 임의의 단백질을 포함한다. 예시적인 단백질들 및 펩티드들은, 예로서 칼시토닌, 성장 호르몬 등과 같은 호르몬, 단일 클론성 항체 및 그의 단편들과 같은 항체들, 인 간 면역결핍 바이러스 (HIV)에 대한 백신들에 유용한 것들과 같은 항원들; 간염 B 표면 또는 중심 단백질들, 위장염, 코로나 바이러스, 등, 프로테아제 억제제, 항생제, 콜라겐, 인간 락토페린, 사이토킨, 산업용 효소들 예로서 가수분해효소 (hydrolases), 글리코시다제 (glycosidases), 옥시도-리덕타제 (oxido-reductases) 등을 포함한다.
도면들은, 본 개시의 일부를 형성한다.
도 1은, 감마-제인-유도된 RX3 단백질체 유도 서열에 연결된, 관심 대상의 개별적인 단백질들로서 칼시토닌 (Ct), 인간 성장 호르몬 (hGH) 및 표피 성장 인자 (EGF)를 포함하는 융합 단백질들의, 형질 감염된 포유류 세포들 중에서의 축적을 나타내는 SDS/PAGE 분석 사진이다. 형질 감염된 293T, CHO 및 Cos1 배양된 포유류 세포들 중에서 축적된 융합 단백질들 RX3-Ct, RX3-hGH 및 RX3-EGF를 나타내었다. 동량의 형질 감염된 포유류 세포들을 형질 감염 후 44 시간 후 추출하고, 대응하는 총 가용성 단백질들을 전기영동 및 항-감마-제인 항체를 사용한 웨스턴 블롯 (western blot)에 의해 분석하였다. RX3-Ct, RX3-hGH 및 RX3-EGF 융합 단백질들을 코딩하는 구축물들의 개략적 표현들도 포함되어 있다. "c" = 세포들; "RX3" = 단일 펩티드가 없는 N-말단 프롤린-풍부 감마-제인 서열; "m" = 매질. 분자량 마커들 (kDa 단위)을 왼쪽에 나타내었다.
도 2는 형질 감염된 세포들 내의 RPBLAs 중의 융합 단백질들의 분포 위치를 나타내는 6 개의 패널들 (A-F)의 사진이다. 동일 초점 현미경법을 사용하여 RX3- CT 를 발현하는 Cos1 세포들 (도 2A), RX3-Ct (도 2B) 및 RX3-EGF (Fig. 2C)를 발현하는 CHO 세포들, 및 RX3-Ct 및 DsRed2-ER 마커 단백질을 공동 발현하는 293T 세포들(도 2D, 도 2E 및 도 2F)을 나타내었다. RX3-유도된 융합 단백질들은, 단백질체 유사 구조물들 (도 2A-2D) 중 및 소포체 (도 2A에서 화살표 참조) 중에서 항-감마-제인 혈청을 사용하여 면역위치확인되었다(immunolocalized). 도 2E 는 적색 형광 DsRed2-ER 단백질 마커를 사용하여 염색된 ER을 나타낸다. 도 2F 는 ER 및 PBLS 중에서 DsRed2 를 사용하여 RX3-Ct의 공동-분포 위치를 나타내는 도 2D 및 도 2E를 겹쳐놓은 것을 보여준다. 도 2A 및 2C에서의 삽입 사진은 PBLS의 고배율 이미지를 나타낸다. 막대 표시: 1 미크론.
두 개의 패널들로 (A 및 B) 나타낸 도 3은 형질 전환된 효모 세포들 중에서 융합 단백질들의 축적을 예시한다. 도 3A 는 형질 전환된 사카로마이세스(Saccharomyces) 중에서 RX3-EGF (c117 래인) 및 RX3-hGH (c118 래인) 융합 단백질들의 축적을 나타낸다. 세포들 및 매질들로부터의 동량의 총 단백질 추출물들을 특이적 항체들을 사용하여 면역블롯에 의해 분석하였다. 삽입 없이 pYX243 플라스미드로 형질 전환된 세포들을 대조군 (C)로서 사용하였다. 각 패널의 밑에 RX3-hGH 및 RX3-EGF 융합 단백질들을 코딩하는 구축물들의 개략적인 표시를 나타내었다.
도 3B는, 두 개의 상이한 신호 펩티드들을 사용함에 의한 피키아 파스토리스(Pichia pastoris) 중에서 hGH 및 RX3-hGH 함유 융합 단백질들의 축적을 예시한다. 형질 전환된 세포들 및 매질들로부터 동량의 총 단백질 추출물들을, 특이적 항체들을 사용하여 면역블롯에 의해 분석하였다. C1 및 C2 는, 대조군들로서 사용된 pPIC9 및 pPIC3.5K 플라스미드들로 각각 형질 전환된 세포들을 나타낸다. RX3-hGH 융합 단백질을 코딩하는 구축물들 c135 및 c121 및 hGH 를 코딩하는 구축물 c136의 개략적 표시들을 패널들의 밑에 나타내었다. 도의 왼편에 분자량 마커들 (kDa)을 나타내었다. "y" = 효모 세포들; "m" = 매질; "SPg" = 감마-제인으로부터의 단일 펩티드; "RX3" = 단일 펩티드 없는 N-말단 프롤린-풍부 감마-제인 서열; "EGF" = 표피 성장 인자; "hGH" = 인간 성장 호르몬; "Afprepro" = 알파 인자 프리프로 펩티드 (alfa factor prepro peptide).
본 발명은 몇 가지 잇점 및 장점들을 갖는다.
한 잇점은 이의 사용으로, 선택된 비-고등 식물 진핵 세포 중에서, 원하는 재조합 단백질의 상대적으로 간단하고 신속한 발현이 가능하다는 것이다.
본 발명의 한 장점은, RPBLAs 중에서의 발현으로 인해, 쉽게 수득가능하고 정제가능한 재조합 단백질원이 제공된다는 것이다.
추가의 잇점 및 장점들은 다음의 설명으로부터 당업자에게 명백할 것이다.
고려된 재조합 단백질들은 그를 발현하는 숙주 세포 중에서 재조합 단백질체 유사 조립체들 (RPBLAs)을 형성하는 융합 단백질들이다. 상기 RPBLA 형성은 세포들 내에서 고밀도 침적물들을 형성하는 저장 단백질 도메인들에 의해 유도된다. 이들 밀집된 침적물들은 세포질, 내막계 세포 소기관들, 미토콘드리아, 플라티즈(platids) 중에서 축적 또는 분비될 수 있다. 상기 재조합 단백질체 유사 조립체들은 상이한 융합 단백질들마다 상이할 수 있지만, 제조되는 특정 융합 단백질에 대해 알려진 예정된 밀도를 갖는다. RPBLAs 의 예정된 밀도는 전형적으로, 균질액 중에 존재하는 실질적으로 모든 내생의 숙주 세포 단백질들의 밀도보다 크며, 전형적으로 약 1.1 내지 약 1.35 g/ml 이다. 신규 RPBLAs 의 높은 밀도는 멀티머들(multimers)로서 조립 및 축적하는 재조합 융합 단백질들의 일반적 능력에 기인한다. 고려되는 RPBLAs는 비-고등 식물 진핵 생물들 중에서 발현되고, 상기 나타낸 것과 같이 그들의 밀도에 의해 전형적으로 특징화된다. 동물 세포들에서 발현될 때, RPBLAs 는 전형적으로 구형의 형태이며, 약 1 미크론 (μ)의 직경을 갖고 둘레의 막을 갖는다.
이들 융합 단백질들은 펩티드 결합에 의해 직접적으로 또는 간접적으로 함께 연결된 두 개의 폴리펩티드 서열들을 함유하며, 여기에서 하나의 서열은 관심 대상의 폴리펩티드 생성물 (예로서 펩티드 또는 단백질) (타겟)에 연결된 단백질체 유도 서열 (PBIS)의 서열이다. PBIS 는 세포 소기관들 중에서 RPBLA 형성의 유도 및 백질 도입 및/또는 축적의 유도를 매개하는 단백질 또는 펩티드 아미노산 서열들이다. PBIS 및 숙주 세포는 바람직하게는 상이한 생물학적 문(phyla)에 속한다. 즉, PBIS 는 전형적으로 고등 식물, 종자 식물로부터 유래하는 한편, 숙주 세포는 종자 식물을 제외하고, 동물 세포, 예로서 포유류 또는 곤충 세포들, 진균/효모, 또는 조류 세포일 수 있는 진핵 세포이고, 이들 모두는 종자 식물과 상이한 문이다. 예시적이고 비제한적인 PBIS의 예들은 저장 단백질들 또는 개질된 저장 단백질들, 예로서 프롤라민류 또는 개질 프롤라민류, 프롤라민 도메인들 또는 개질 프롤라민 도메인들을 포함한다. 프롤라민류는 Shewry 등, 2002 J. Exp . Bot . 53(370):947-958에서 검토되었다. 바람직한 PBIS 는 하기 나타낸 감마-제인, 알파-제인 또는 쌀 프롤라민과 같은 프롤라민 화합물들의 것들이다.
감마-제인, 즉 옥수수 저장 단백질은 (그의 DNA 및 아미노산 잔기 서열들을 이하에 나타내었음), 네 개의 옥수수 프롤라민들 중의 하나로, 옥수수 배유 중의 총 단백질의 10-15 퍼센트에 상당하다. 기타 곡물 프롤라민들로서, 알파- 및 감마-제인들이 조면 소포체의 세포질 쪽에서 막-결합된 폴리리보솜에서 생합성되고, 내강 내에서 조립된 후 소포체-유도된 단백질체들 내로 격리된다 (Herman 등, 1999 Plant Cell 11:601-613; Ludevid 등, 1984 Plant Mol . Biol . 3:277-234; Torrent 등, 1986 Plant Mol . Biol . 7:93-403).
감마-제인은 네 개의 특징적인 도메인들로 구성된다: i) 19 개의 아미노산들의 한 펩티드 신호; ii) 헥사펩티드 PPPVHL (서열 번호 1)의 8 단위를 함유하는 반복 도메인 (53aa), iii) 프롤린 잔기들이 다른 아미노산들과 번갈아 존재하는 ProX 도메인 (29aa) 및 iv) 소수성의 시스테인 풍부 C-말단 도메인 (111aa).
감마-제인의 소포체-유도된 RPBLAs 중에서 조합되는 능력은 종자들에 제한되지 않는다. 실제로, 감마-제인-유전자가 유전자이식된 (transgenic) 아기장대 (Arabidopsis) 식물들에서 구조적으로 발현되었을 때, 상기 저장 단백질은 잎 옆육 세포들에서 소포체-유도된 PBLS 내에 축적되었다 (Geli 등, 1994 Plant Cell 6:1911-1922). 소포체-유도된 단백질체들 내로의 감마-제인 침적의 원인이 되는 신호를 찾고자(프롤라민들은 KDEL 신호를 갖지 않는다), 세로 (tandem) 반복 도메인을 포함하는 프롤린 풍부한 N-말단 도메인이 ER 보유에 필요하다는 것과, C 말단 도메인이 단백질체들 형성에 연루되었다는 것이 증명되어 왔다. 그러나, 이들 도메인들이 단백질체 조립을 촉진하는 메카니즘은 여전히 알려지지 않았다.
단백질체들은 종자들에서만 그러한 명칭으로 불리는 것이 적절하기 때문에, 다른 식물 기관들 및 비-고등 식물들에서 제조된 유사 구조물들은 일반적으로 재조합 단백질체 유사 조립체들 (RPBLAs)로서 언급된다.
예시적인 기타 유용한 프롤라민-유형 서열들을 그들의 GenBank 표시와 함께 아래 표에 나타내었다.
단백질 명 | GenBank ID |
α-제인 (22kD) | M86591 |
알부민 (32kD) | X70153 |
β-제인 (14kD) | M13507 |
γ-제인 (27kD) | X53514 |
γ-제인 (50kd) | AF371263 |
δ-제인 (18kD) | AF371265 |
δ-제인 (10kD) | U25674 |
7S 글로불린 또는 비실린(Vicilin)형 | NM 113163 |
11S 글로불린 또는 레규민(Legumin)형 | DQ256294 |
프롤라민 13kD | AB016504 |
프롤라민 16kD | AY427574 |
프롤라민 10kD | AF294580 |
Altschul 등, 1997 Nucleic Acids Res. 25:3389-3402에 기재된 것과 같은, 모든 비-중복된 GenBank CDS 번역+PDB+SwissProt+PIR+PRF (환경 시료들 제외) 데이타베이스에서, 하기 나타낸 것들과 같은 질문(query)을 사용하여 BLAST 검색을 실시하여 추가의 유용한 서열들을 수득한다:
RX3 질문 서열 번호 2; 알파-제인 서열 번호 3 및 쌀 프롤라민 질문 서열 번호 4.
한 예시적인 개질 프롤라민은 (a) 신호 펩티드 서열, (b) 단백질 감마-제인의 반복 도메인 헥사펩티드 PPPVHL (서열 번호 1)의 하나 이상의 복제물들의 서열, (전체 도메인은 8 개의 헥사펩티드 단위들을 함유); 및 (c) 감마-제인의 ProX 도메인의 전체 또는 일부 서열을 포함한다. 예시적인 특정 개질 프롤라민들은, R3, RX3 및 P4 로서 하기에 나타낸 폴리펩티드들을 포함하며, 그의 DNA 및 아미노산 잔기 서열들도 하기에 나타내었다.
특히 바람직한 프롤라민들은 공개 출원 WO2004003207 호에 개시된 것과 같은 감마-제인 및 그의 성분 부분들, 즉 쌀 rP13 단백질 및 22 kDa 옥수수 알파-제인 및 그의 N-말단 단편을 포함한다. 감마-제인 (27kD), 쌀 및 알파-제인 단백질들의 DNA 및 아미노산 잔기 서열들을 서열 번호 5 (DNA 서열) 및 서열 번호 6 (단백질 서열); 서열 번호 7 (RX3 DNA 서열) 및 서열 번호 8 (단백질 서열); 서열 번호 9 (R3 DNA 서열) 및 서열 번호 10 (단백질 서열); 서열 번호 11 (P4 DNA 서열) 및 서열 번호 12 (단백질 서열); 서열 번호 13 (X10 DNA 서열) 및 서열 번호 14 (단백질 서열)에 나타내었다.
rP13: (단백질 서열, 서열 번호 15 및 DNA 서열, 서열 번호 16) - 클론에 상동성인 13kD 쌀 프롤라민 - AB016504 Sha 등, 1996 Biosci. Biotechnol. Biochem. 60(2):335-337; Wen 등, 1993 Plant Physiol. 101(3):1115-1116; Kawagoe 등, 2005 Plant Cell 17(4):1141-1153; Mullins 등, 2004 J. Agric. Food Chem . 52(8):2242-2246; Mitsukawa 등, 1999 Biosci . Biotechnol . Biochem . 63(11):1851-1858.
22kD 의 22aZt (단백질 서열 전체 길이, 서열 번호 17 및 DNA 서열 전체 길이, 서열 번호 18) 옥수수 알파-제인의 N-말단 단편 - V01475 Kim 등, 2002 Plant Cell 14(3):655-672; Woo 등, 2001 Plant Cell 13(10):2297-2317; Matsushima 등, 1997 Biochim. Biophys. Acta 1339(1):14-22; Thompson 등, 1992 Plant Mol. Biol. 18(4):827-833.
관심 대상의 단백질들의 예들은 치료, 준의약식품, 생체제어 또는 산업용 용도를 갖는 임의의 단백질을 포함하며, 예로서 단일클론성 항체들 (IgG, IgM, IgA, 등과 같은 mAbs) 및 그의 단편들, 백신에 대한 항원들 (인간 면역 결핍 바이러스, HIV; 간염 B 전-표면 (pre-surface), 표면 및 중심 항원들, 위장염 코로나 바이러스 등), 호르몬 (칼시토닌, 성장 호르몬 등), 프로테아제 저해제, 항생제, 콜라겐, 인간 락토페린, 시토카인, 산업용 효소들 (가수분해효소, 글리코시다제, 옥시도-리덕타제 등)이 있다. 예시적인 관심 대상의 단백질들에 대한 예시적인 DNA 및 아미노산 잔기 서열들이 제공된다: 연어 칼시토닌 BAC57417 (단백질 서열, 서열 번호 19 및 DNA 서열, 서열 번호 20).
hEGF - 신호 펩티드 없는 AAF85790 에 기초한 구축 (단백질 서열, 서열번호 21 및 DNA 서열, 서열 번호 22).
hGH - 신호 단백질 없는 P01241 에 기초한 구축 (단백질 서열, 서열 번호 23 및 DNA 서열, 서열 번호 24).
또 다른 구현예에서, 재조합 융합 단백질은, PBIS 및 관심 대상의 생성물의 서열들에 추가하여, 스페이서 아미노산 서열을 더 함유한다. 상기 스페이서 아미노산 서열은 효소적 또는 화학적 수단에 의해 분할가능하거나 또는 분할가능하지 않은 아미노산 서열이다. 특정 구현예에서, 스페이서 아미노산 서열은 PBIS 및 관심 대상의 생성물 사이에 위치된다. 예시적인 아미노산 서열은 엔테로키나아제(enterokinase), Arg--C 엔도프로테아제 (endoprotease), Glu--C 엔도프로테아제, Lys--C 엔도프로테아제, Xa 인자 등과 같은 프로테아제에 의해 분할가능하다. 선택적으로, 아미노산 서열은 화학 시약에 의해 특이적으로 분할가능하게 암호화되어 있으며, 예로서 시아노겐 브로마이드는 메티오닌 잔기들에서 분할시킨다.
추가의 구현예에서, 형질 전환 목적에 사용되는 핵산 서열은 공동 명의의 특허 출원 WO 2004003207 에 개시된 바와 같다. 또한, 다른 구현예에서, 핵산 서열은 특허 출원 WO 2004003207에 개시된 바와 같지만, 분할가능한 아미노산 서열을 코딩하는 핵산 서열이 부재이다.
바람직한 구현예에서, 융합 단백질들은 동물, 동물 세포 배양물, 진균/효모, 곤충 또는 조류와 같은 비-고등 식물 진핵 숙주 세포계를 하기를 함유하는 핵산 (DNA 또는 RNA) 서열로 형질 전환하는 것을 포함하는 방법에 따라 제조된다: (i) 프레임 상에서 (ii)에 작동적으로 연결된 PBIS 를 코딩하는 제 1 핵산, (ii) 관심 대상의 폴리펩티드 생성물을 코딩하는 뉴클레오티드 서열을 함유하는 제 2 핵산 서열; 즉, PBIS 를 암호화하는 상기 핵산 서열은, 관심 대상의 폴리펩티드를 암호화하는 서열에 화학적으로 결합되어 (펩티드 결합), 두 폴리펩티드들 모두가 그들의 적절한 리딩 프레임들 (reading frames)로부터 발현되도록 한다. 숙주 세포는 일정 시간 동안 융합 단백질의 발현 및 그 발현된 융합 단백질의 재조합 단백질체 유사 조립체들 (RPBLAs) 내로의 조립에 적합한 배양 조건 하에서 유지된다. 발현시, 생성되는 융합 단백질은 형질 전환된 숙주계 내에서 고밀도 재조합 단백질체 유사 조립체들로서 축적된다. 융합 단백질은 그 후 숙주 세포들로부터 회수될 수 있거나, 또는 그 융합 단백질을 함유하는 숙주 세포들은 원하는 대로, 예로서 부가 영양분 또는 보충물을 함유하는 동물성 식품으로서 사용될 수 있다. 융합 단백질은 RPBLAs 의 일부로서 단리될 수 있거나 또는 RPBLAs 가 없을 수 있다.
융합 단백질의 발현에 적합한 배양 조건들은 전형적으로 숙주 세포의 각 유형에 따라 상이하다. 그러나, 그러한 조건들은 숙련된 작업자들에 의해 알려져 있으며, 쉽게 결정된다. 유사하게, 유지 기간은 숙주 세포들 및 제조하고자 하는 융합 단백질의 양에 따라 상이할 수 있다. 또한, 그러한 조건들은 공지이며, 특정 상황들에서 쉽게 결정될 수 있다. 추가적으로, 특정 배양 조건들은 여기에서 예시한 인용문헌들로부터 얻을 수 있다.
한 구현예에서, 제 1 핵산 서열 (i)의 3' 말단은 제 2 핵산 서열 (ii)의 5' 말단에 연결 (결합)된다. 다른 구현예에서, 제 1 핵산 서열 (i)의 5' 말단은 제 2 핵산 서열 (ii)의 3' 말단에 연결 (결합)된다. 또 다른 구현예에서, 상기 PBIS 는 저장 단백질 또는 개질된 저장 단백질, 그의 단편 또는 개질 단편을 함유한다.
또 다른 특정 구현예에서, 융합 단백질은, 동물, 동물 세포 배양물, 진균/효모 또는 조류와 같은 숙주 세포계를, 앞서 언급된 핵산 서열들 (i) 및 (ii)에 추가하여, 스페이서 아미노산 서열을 코딩하는 프레임 중 핵산 서열 (iii)을 함유하는 핵산 서열로 형질 전환하는 것을 포함하는 방법에 따라 제조된다. 상기 스페이서 아미노산은, 상기 언급된 것과 같이, 효소적 또는 화학적 수단에 의해 분할가능하거나 또는 분할가능하지 않은 아미노산 서열일 수 있다. 한 특정 구현예에서, 상기 핵산 서열 (iii)은 상기 핵산 서열들 (i)과 (ii)의 사이에 위치되며, 예로서, 제 3 의 핵산 서열 (iii)의 3' 말단이 제 2 핵산 서열 (ii)의 5' 말단에 연결된다. 또 다른 구현예에서, 상기 제 3 핵산 서열 (iii)의 5' 말단이 제 2 핵산 서열 (ii)의 3' 말단에 연결된다.
이전에 언급된 융합 단백질 분자를 암호화하는 핵산 서열 (절편) 또는 그 코딩 서열의 상보물 또한 본 명세서에서 고려된다. 그러한 핵산 절편은 일부 바람직한 구현예들에서 단리 및 정제된 형태로 존재한다.
살아있는 유기체에서, 단백질 또는 폴리펩티드의 아미노산 서열은 유전적 코드를 거쳐 그 단백질을 코딩하는 유전자의 데옥시리보핵산 (DNA) 서열에 직접 관련된다. 따라서, 유전적 코드의 공지된 퇴화(degeneracy)를 통해, 부가적인 DNA들 및 대응 RNA 서열들 (핵산들)은 바람직한 경우 동일한 융합 단백질 아미노산 잔기 서열들을 암호화하도록 제조될 수 있지만, 상기 두 개의 서열들을 높은 수준의 엄격함(stringency)으로 혼성화하는 것이 아니라 중간 수준의 엄격함으로 혼성화하는 상기 논의된 유전자 서열과 충분히 상이하다.
높은 수준의 엄격한 조건은 6XSSC 에서 약 50-55℃의 온도에서의 혼성화 및 1-3XSSC 에서 68℃의 온도에서의 최종 세척을 포함하는 것으로서 정의될 수 있다. 중간 수준의 엄격한 조건은 0.2 내지 0.3 M NaCl 에서 약 50 ∼ 약 65℃ 의 온도에서의 혼성화에 이어, 0.2X SSC, 0.1% SDS (소듐 도데실 설페이트 ) 에서 약 50-약 55℃에서의 세척을 포함한다.
(1) 그 자체가 또는 그의 상보물이 단백질체 유도 서열 (PBIS) 및 관심 대상의 폴리펩티드를 함유하는 융합 단백질을 암호화하는 핵산 서열 (DNA 서열 또는 RNA 서열)도 본 명세서에서 고려된다. 공지된 바와 같이, 고려되는 핵산 서열과 같은 핵산 서열은, 본 명세서 중에서 논의된 것과 같이 적절한 발현 시스템 중에서 적절한 프로모터에 작동적으로 연결된 경우 발현된다.
상이한 숙주들은 종종, 특정 아미노산 잔기를 암호화하는데 사용되는 특정 코돈에 대한 선호를 갖는다. 그러한 코돈 선호성은 공지이며, 바람직한 융합 단백질 서열을 암호화하는 DNA 서열은, 시험관 내 돌연변이 유발을 사용하여, 예로서 숙주-선호된 코돈들이, 융합 단백질이 발현되어지는 특정 숙주에 대해 사용되도록 변경될 수 있다.
상기 논의된 것과 같이, 고려되는 융합 단백질을 암호화하는 유전자를 규정하는 외생의 핵산 절편 (예로서 DNA 절편 또는 서열)에 작동적으로 연결된 적합성(compatible) 진핵 숙주 세포 유기체에서 유전자의 발현을 유도하는데 적합한 프로모터와 같은, 하나 이상의 조절 서열들 (제어 성분들)을 함유하는 벡터를 포함하는, DNA 분자와 같은 재조합 핵산 분자도 본 발명에서 고려된다. 보다 구체적으로, 관심 대상의 폴리펩티드에 연결된 단백질체 유도 서열 (PBIS)를 암호화하는 유전자를 규정하는 DNA 절편에 작동적으로 연결된 숙주 유기체 세포들에서 융합 단백질의 발현을 유도하기 위한 프로모터를 함유하는 벡터를 포함하는 재조합 DNA 분자도 고려된다. 상기 재조합 DNA 분자는, 적합한 형질 감염 및 숙주 진핵 세포에서의 발현시, 고려되는 융합 단백질을 RPBLAs로서 제공한다.
당 기술 분야에서 공지된 바와 같이, 필요한 핵산, 예시적으로 DNA 서열이 존재하는 한 (출발 및 정지 신호 포함), 추가적인 염기쌍들은 일반적으로 DNA 절편의 각 말단 중 하나에 존재할 수 있으며, 그 절편은 단백질을 발현하는데 여전히 사용될 수 있다. 이는 물론, 발현을 억제하거나, 발현시키고자 하는 융합 단백질을 소비하는 추가의 생성물을 발현하거나, 그 원하는 융합 단백질에 의해 생성된 원하는 반응 생성물을 소비하는 생성물을 발현하거나, 또는 그렇지 않으면 DNA 절편의 유전자의 발현을 방해하는, 작동적으로 연결된 DNA 서열의 절편의 부재를 가정한 것이다.
따라서, 상기 DNA 절편이 그러한 방해 DNA 서열들을 갖지 않는 한, 본 발명의 DNA 절편은 길이가 약 500 내지 약 15,000 염기쌍일 수 있다. 재조합 DNA 분자, 특히 발현 벡터의 최대 크기는, 대개 편의성에 의해 좌우되고, 복제 및 발현에 요구되는 최소 DNA 서열들의 전부가, 바람직한 경우, 존재하는 경우, 숙주 세포에 의해 수용될 수 있는 벡터 크기에 의해 좌우된다. 최소 벡터 크기는 공지이다. 그러한 긴 DNA 절편들은 바람직하지 않지만, 사용될 수 있다.
상기 기재된 융합 단백질을 암호화하는 DNA 절편은 화학적 기술들, 예로서 Matteucci 등 ((1981) J. Am. Chem. Soc., 103:3185)의 포스포트리에스테르 (phosphotriester)법에 의해 합성될 수 있다. 물론, 코딩 서열을 화학적으로 합성함에 의해, 천연 아미노산 잔기 서열을 암호화하는 것들을 적절한 염기들로 치환함에 의해 임의의 바람직한 변경을 간단히 이룰 수 있다. 그러나, 여기에서 특이적으로 논의된 서열들을 포함하는 DNA 절편들이 바람직하다.
융합 단백질을 암호화하는 유전자를 함유하는 DNA 절편들은 바람직하게는 그 유전자를 함유하는 재조합 DNA 분자들 (플라스미드 벡터들)로부터 수득된다. 융합 단백질 유전자의 숙주 세포에서의 발현을 지휘하는 벡터를, 여기에서 "발현 벡터"로서 언급된다.
발현 벡터는 프로모터를 포함하는 발현 제어 요소들을 함유한다. 융합 단백질-코딩 유전자는 상기 발현 벡터에 작동적으로 연결되어 그 프로모터 서열이 RNA 중합효소 결합 및 융합 단백질 암호화 유전자의 발현을 지휘하도록 한다. 폴리펩티드 코딩 유전자를 발현하는데에는, Poszkowski 등 (1989) EMBO J., 3:2719 및 Odell 등 (1985) Nature , 313:810에 의해 기재된 것과 같은 유도성, 바이러스성, 합성, 구조적인 프로모터들, 및 Chua 등 (1989) Science, 244:174-181 에서 제시된 것과 같은, 시간적으로 조절되고, 공간적으로 조절되고, 시공간적으로 조절되는 프로모터들이 유용하다.
진핵 세포들에 적합성인 발현 벡터들, 예로서 효모 세포들에 적합성인 것들 또는 포유류, 조류 또는 곤충들 등의 세포들에 적합성인 것들이 본 명세서에서 고려된다. 그러한 발현 벡터들은 본 발명의 재조합 DNA 분자들을 형성하는데 사용될 수도 있다. 사카로마이세스 세레비시에 (Saccharomyces cerevisiae) 또는 피키아 파스토리스와 같은 효모들에서의 사용에 적합한 벡터들은 공지된 바와 같은, 에피좀성(episomal) 또는 통합성 (integrating)일 수 있다. 진핵 세포 발현 벡터들은 당 기술 분야에서 공지이며, 몇몇 상업적 공급원들로부터 구입가능하다. 정상적으로, 그러한 벡터들은 바람직한 DNA 절편 및 프로모터 서열들의 삽입을 위해 하나 이상의 편리한 제한효소 부위들을 함유한다. 임의로, 그러한 벡터들은 진핵 세포들에서의 사용에 특이적인 선택가능한 마커를 함유한다. 사카로마이세스 세레비시 에에서의 사용을 위한 예시적인 프로모터들은 사카로마이세스 세레비시에 포스포글리세르산 키나아제 (phosphoglyceric acid kinase: PGK) 프로모터 및 분기성 프로모터들 GAL 10 및 GAL 1을 포함하며, 한편 알코올 옥시다제 유전자 (AOX1)는 피키 아 파스토리스에 대해 유용한 프로모터이다. 사카로마이세스 세레비시에 및 피키아 파스토리스에서의 융합 단백질의 예시적인 발현을 이하에 나타내었다.
포유류 세포들에서의 재조합 DNA 발현에 의한 융합 단백질의 제조를, 중국 햄스터 난자 (Chinese hamster ovary: CHO) 숙주 세포들, Cos1 원숭이 숙주 및 인간 293T 숙주 세포들에서 상기 융합 단백질을 발현하는 재조합 DNA 벡터를 사용하여, 이하에서 설명한다. 이는 당 기술 분야에서 공지되고, Sambrook 등, Molecular Cloning : A Laboratory Manual, 2 판, Cold Spring Harbor Laboratories (1989)에서 보다 상세히 기재된 절차들을 사용하여 실시하였다.
곤충 세포계도 고려되는 융합 단백질을 발현하는데 사용될 수 있다. 예로서, 그러한 한 계에서 오토그래파 캘리포니카 핵 다각체 바이러스 (Autographa californica nuclear polyhedrosis virus: AcNPV) 또는 배큘로바이러스(baculovirus)가, 나비목 해충 (Spodoptera frugiperda) 세포들에서 또는 나방 (Trichoplusia) 애벌레에서 외래 유전자들을 발현시키기 위한 벡터로서 사용된다. 융합 단백질을 암호화하는 서열들은 예로서 다각성 (polyhedrin) 유전자와 같이, 상기 바이러스의 비-필수 영역 내로 클론될 수 있으며, 상기 다각성 프로모터의 제어 하에 배치될 수 있다. 융합 단백질 서열의 성공적인 삽입은 그 다각성 유전자를 불활성으로 하여 코트(coat) 단백질이 없는 재조합 바이러스를 제조한다. 상기 재조합 바이러스들은 그 후 예로서, 나비목 해충 세포들 또는 나방 애벌레를 감염시키는데 사용될 수 있으며, 여기에서 상기 융합 단백질이 발현될 수 있다. E. Engelhard 등 (1994) Proc. Natl. Acad. Sci., USA, 91:3224-3227; 및 V. Luckow, Insect Cell Expression Technology, pp. 183-218, Protein Engineering: Principles and Practice, J.L. Cleland 등, eds., Wiley Liss, Inc, 1996. 상기 오토그래파 캘리포니카 핵 다각체 바이러스 (AcNPV)의 다각성 프로모터의 제어 하에 위치된 이종성 유전자들은 종종, 감염의 후반 단계들 동안 높은 수준으로 발현된다.
융합 단백질 유전자를 함유하는 재조합 배큘로바이러스들은 배큘로바이러스 셔틀 벡터계 (Luckow 등 (1993) J. Virol ., 67:4566-4579)를 사용하여 구축되며, Bac-To-Bac 배큘로바이러스 발현계 (Life Technologies)로서 상업적으로 판매된다. 재조합 바이러스들의 군체들을 제조하고, 그 재조합 단백질의 발현을 표준 프로토콜에 의해 모니터링 한다 (O'Reilly 등, Baculovirus Expression Vectors : A Laboratory Manual, W.H. Freeman and Company, New York, 1992; 및 King 등, The Baculovirus Expression System: A Laboratory Guide, Chapman & Hall, London, 1992).
궁극적으로 융합 단백질 암호화 유전자가 작동적으로 연결되는, 발현 벡터 및 프로모터의 선택은 바람직한 기능적 성질들, 예로서 단백질 발현의 위치 및 타이밍, 및 형질 전환되는 숙주 세포에 직접적으로 의존한다. 이들은 재조합 DNA 분자들을 구축하는 기술에 고유한 공지된 제한요소들이다. 그러나, 본 발명을 실시하는데 유용한 벡터는, 그 융합 단백질이 작동적으로 연결되는 DNA 절편에 포함된 상기 융합 단백질의 복제 및 바람직하게는 발현 (발현 벡터의 경우)을 지휘할 수 있다.
발현된 RPBLAs 및 그들의 융합 단백질들은 생화학 또는 생물학적 회수에서 사용되는 일반적인 방법들에 의해 발현 숙주 세포들로부터 수득될 수 있다. RPBLAs 는 숙주 세포들에 존재하는 다른 단백질들에 비해 밀집되어 있기 때문에, 상기 RPBLAs 는 특히 세포 균질액의 원심 분리에 의해 수집되어 분석될 수 있다. 상기 융합 단백질들은, 2-머캡토에탄올과 같은 환원제를 함유하는 버퍼 중에서 그 둘러싼 막을 용해함에 의해 수집된 RPBLAs 로부터 수득될 수 있다.
더 이상의 설명 없이도, 본 기술분야의 당업자라면, 상기 설명 및 하기의 상세한 실시예들을 사용하여, 본 발명을 완전히 이용할 수 있을 것으로 생각된다. 하기 바람직한 특정 구현예들은, 따라서, 단순히 예시적인 것으로 해석되어야 하며, 본 개시의 나머지 부분을 어떤 방식으로도 제한하지 않는다.
실시예
실시예 1: 형질 감염된 포유류 세포들에서 융합 단백질들의 축적
성숙 칼시토닌 (Ct) 및 EGF 서열들에 대응하는 합성 유전자들 및 hGH 서열을 암호화하는 cDNA 를, N-말단 감마-제인 코딩 서열 RX3 (WO2004003207)에 융합하고, pcDNA3.1 (Invitrogen) 벡터 내로 도입하여 구축물 p3.1RX3Ct, p3.1RX3EGF 및 p3.1RX3hGH 을 수득하였다. 융합 단백질들 RX3-Ct, RX3-EGF 및 RX3-hGH를 코딩하는 이들 구축물들을, 리포펙타민에 기초한 형질 감염 방법에 의해 (Invitrogen) 293T, Cos1 및 CHO 포유류 배양 세포들 내로 도입하였다. 개선된 시안 형광 개질 GFP의 유전자 서열을 함유하는 플라스미드 pECFP-N1 (Clontech)로 형질 감염된 293T 및 Cos1 세포들을 대조군으로서 사용하였다.
일시적으로 형질 감염된 세포들 중에서 융합 단백질들의 축적은, 감마-제인에 대해 발생된 항체들을 사용하여, 웨스턴 블롯에 의해 분석하였다. 44 시간의 형질 감염 후, 총 가용성 단백질들을 버퍼 A (100 mM Tris-HCl pH 8.0, 150 mM NaCl, 5mM EDTA, 0.5% SDS, 0.5% 트리톤 X-100, 2% 2-머캡토에탄올 및 프로테아제 저해제들)로 추출하였다. 세포 인큐베이션 매질의 분액을 침전시키고, -20℃ 에서 저장하였다. 동량의 형질 감염된 세포들로부터 추출된 단백질들을 SDS 폴리아크릴아미드 겔 전기영동에 의해 분리하고, 니트로셀룰로오스 시트들(sheets)로 이동시켰다.
도 1 에 나타낸 결과들로부터 알 수 있는 바와 같이, 분석된 세 개의 융합 단백질들 RX3-Ct, RX3-EGF 및 RX3-hGH은, 발현을 위해 선택된 배양 세포 유형에 무관하게 매우 효율적으로 축적되었다: 293T 및 CHO 배양된 세포들 모두에서 축적된 RX3-hGH 의 패턴, 및 CHO 및 Cos1 세포들에서의 RX3-EGF 의 패턴 비교. 상기 융합 단백질들을, 형질 감염된 세포들 (c 래인)에 대응하는 단백질 추출물 중에서 관찰하였으며, 세포 배양 매질 (m 래인)에서는 어떤 면역반응성 밴드도 탐지되지 않았다. 이러한 관찰 결과는 RX3 도메인이 내막 구역에서 상기 융합 단백질들을 조립 및 유지할 수 있다는 것을 나타낸다.
이들 결과들은 RX3-유도된 융합 단백질들이 어떻게 내막계 중에서, 분석된 세 가지 유형의 포유류 세포들 (인간 293T 세포들, 원숭이 Cos1 세포들 및 햄스터 CHO 세포들)에서 조립되고 축적되는지를 설명하여주며, 이는 바람직한 단백질의 효율적인 축적이 RX3 도메인을 사용한 융합을 통해, 선택된 어떤 포유류 세포 또는 유기체에서도 달성될 수 있음을 나타낸다.
실시예 2: 형질 감염된 포유류 세포들에서, 융합 단백질들의 세포내 분포 위치
N-말단 감마-제인 서열 RX3 이 포유류 세포들에서 재조합 단백질체 유사 조립체들을 유도할 수 있는지의 여부를 결정하는데 있어서, RX3-Ct 및 RX3-EGF 융합 단백질들의 분포 위치를, 동일 초점 현미경법을 사용하여 면역 세포 화학에 의해 분석하였다. 형질 감염된 세포들을 10 분 동안 3.7 % 파라포름알데히드 중에서 고정시키고, 인산염 완충액으로 세척 후, 감마-제인 항혈청 (1/700 희석)과 함께 1 시간 동안 인큐베이션하였다. 비-면역성 혈청을 대조군으로서 사용하였다. 일차 항체들을, Alexa Fluor 488 또는 Alexa Fluor 555 염료에 결합된 항-토끼 항체들을 사용하여 검출하였다 (분자 탐침자).
형질 감염된 세포들로부터의 현미경 사진들을, 방출 대역 파장 선택을 위한 분광 광도계가 장착된 동일 초점 레이저 스캐닝 현미경 (Leica TCS SP, 하이델베르그, 독일)을 사용하여 수득하였다. 495-535 nm로 세팅된 방출 범위를 사용함에 의해, 아르곤 이온 레이저를 사용한 488nm 여기(excitation)에서 초록색 형광 이미지들이 수집되었다. HeNe 레이저 및 방출 범위 550-600 를 사용하여 543 nm 여기 후, 적색 형광 이미지들이 수집되었다. 광학 구역들은 0.5 ㎛ 두께였다. 디지털 이미지들 및 투영 영상들(projections)은, 동일 초점 현미경 소프트웨어를 사용하여 기록되었다.
도 2 는 p3.1Ct- 및 p3.1RX3EGF-형질 감염된 세포들의 동일 초점 투영 영상들을 나타낸다. 상기 도에 나타난 바와 같이, 대응 융합 단백질들, RX3-Ct 및 RX3EGF 이, 소포체 (ER) 내에서 검출되었으며 (도 2A 의 화살표), 이는 감마-제인 신호 펩티드가, 상기 융합 단백질의 ER 내로의 전위(translocation)를 매개하는 포유류 세포들 중에서 기능적임을 나타낸다. 대조군으로서 사용된 상기 비-면역성 혈청과 함께 인큐베이션된 시료들은 어떤 현저한 형광도 나타내지 않았다 (미도시).
놀랍게도 상기 융합 단백질들이, 외관 상으로 막에 의해 둘러싸인 큰 지점들에서 우선적으로 축적되는 것이 보인다는 것에 주의하는 것이 중요하다 (도 2A의 삽입 사진 참조). 비-형질 감염된 세포들이 없는, 이들 구조물들은 약 1 미크론의 직경을 갖는 식물 단백질체들의 크기에 비교할만 하다 (A 및 C의 삽입 사진들). 이러한 결과는, 동물 세포들이 식물에서 설명된 PB 저장 세포 소기관을 재생할 수 있다는 사실 뿐만 아니라, 모든 형질 감염된 세포들에서 관찰되는 많은 수의 RPBLAs 에 의해서도 놀라운 것이며, 이는 이들 세포들의 효율적인 축적능을 나타내는 것이다. 또한, 상이한 형질 감염된 세포 유형들이 융합 단백질들의 비교할만한 위치 분포 및 축적 패턴들을 나타내었으며 (도 2A, 2B 및 2D 참조), 이 패턴은 PBIS 에 융합된 표적물에 무관한 것으로 보인다 (도 2B 및 2C).
세포들을, 유도된 PBLS 의 세포내(subcellular) 기원을 분석하기 위하여 ER 마커로서 사용된 형광 단백질에 대한 서열을 함유하는 플라스미드 pDsRed2-ER (Clontech)로 공동형질 감염시켰다. 흥미롭게도, 도 2D, 2E 및 2F 에서 알 수 있는 바와 같이, RX3-Ct 및 ER 마커 모두 ER 및 PB-유사 조립체들 중에서 공동 분포 위치되며(colocalize), 이는 포유류 세포들에서 유도된 RPBLAs 들의 ER 기원이 식물 세포들에서 일어난 것과 같음을 나타낸다.
실시예 3: 형질 전환된 효모 세포들에서의 융합 단백질들의 축적
EGF 및 hGH를 암호화하는 서열들을 N-말단 감마-제인 코딩 서열 RX3 (WO2004003207)에 융합시키고, 벡터 pYX243 (R&D systems) 내로 도입시켜 구축물들 c117 및 c118 을 수득하였다. 융합 단백질들 RX3-EGF 및 RX-hGH를 코딩하는 이들 구축물들을 사카로마이세스 세레비시에 내로 도입시켰다.
상기 형질 전환체들을 갈락토오스 함유 매질에서 배양함에 의해 발현 분석을 실시하고, 동량의 세포들 및 매질을 SDS-PAGE 및 재조합 발현된 단백질들에 대한 특정 항체들을 사용함에 의한 면역 블롯에 의해 분석하였다. 도 3A 에서 알 수 있는 것과 같이, RX3-EGF (c117 래인들) 및 RX3-hGH (c118 래인들) 융합 단백질들이 상기 효모 세포들 중에 축적되었으며, 매질에서는 단백질의 흔적이 검출되지 않았다.
hGH 및 hGH-유도된 융합물들의 축적은 구축물들 c135 및 c121 (융합 RX3-hGH 단백질을 코딩) 및 c136 (hGH 단백질을 코딩, 도 3B의 개략적 표시 참조)로 형질 전환된 피키아 파스토리스 효모에서도 연구되었다. 가장 높은 수준의 재조합 단백질들을 축적하는 형질 전환체들이 선택되었다.
두 개의 상이한 신호 펩티드들을 사용하여 융합 단백질, 감마-제인 신호 펩티드 (도 3B, SPg) 및 효모 알파 인자 프리프로 펩티드 (도 3B, Afprepro)를 발현하였다. 또한, hGH에 직접 융합된 효모 알파 인자 프리프로 펩티드를 사용함에 의해 분비의 제어도 분석하였다 (도 3B, c136). 세포들 및 매질로부터의 총 단백질들을, 토끼에서 발생된 hGH 에 대한 특정 항체들을 사용함에 의해 웨스턴 블롯으로 분석하였다.
예측된 것과 같이, Afprepro 펩티드가 사용된 경우 hGH 가 매질 내로 분비되었다 (도 3B, c136/m 래인). 대조적으로, 융합 단백질 RX3-hGH 는 사용된 신호 펩티드에 무관하게 효모 세포들 내에 축적되었다. 도 3B 에서 알 수 있는 것과 같이, 융합 단백질은, 효모 Afprepro 펩티드 (c135/y 래인)를 사용할 때 및 감마-제인 신호 펩티드 (c121/y 래인)를 사용할 때의 두 경우들 모두에서 세포들 내부에 존재하였으며, 매질에서는 단백질의 흔적이 검출되지 않았다 (미도시). 따라서, 감마-제인의 N-말단 프롤린 풍부 도메인은 효모 세포들의 내막 구역에서, 보다 구체적으로 원심 분리에 의해 분리될 수 있는 PB 유사 구조물들에 대응하는 밀집한 분획으로 단백질 보유를 매개하기에 충분하였다.
사카로마이세스 세레비시에 및 피키아 파스토리스에서 수득된 결과들은, 종자 저장 단백질을 함유하는 융합 단백질들이 PB 유사 구조물들로 효율적으로 조립 및 축적되어지는, 식물 및 동물계들과 상이한 기타 진핵 유기체의 예들이다.
실험 절차들
포유류 형질 감염을 위한 플라스미드 구축물들
성숙 칼시토닌 서열 (Ct)에 대응하는 합성 유전자를 (특허 출원 WO2004003207)에 기재된 바와 같이 수득하였다.
활성 hEGF 의 53 개의 아미노산들을 암호화하는 합성 유전자를, 약 60 개의 염기들의 4 개의 올리고뉴클레오티드를 사용하여, 20 개의 중복 염기들로, 프라이머 중복 연장 PCR 법에 의해 수득하였다. 합성 hEGF cDNA는 Xa 인자 특이적 분할 부위에 대응하는 5' 링커 서열을 포함하였다. 올리고뉴클레오티드들 (EGF1 서열 번호 25; EGF2, 서열 번호 26; EGF3, 서열 번호 27; EGF4, 서열 번호 28)을 폴리아크릴아미드 변성 겔에 의해 정제하였다.
인간 성장 호르몬 (hGH)의 191 개 아미노산들을 암호화하는 cDNA 서열을 인간 뇌하수체의 cDNA (Clontech, BDBiosciences)로부터, 엔테로키나아제 분할 부위에 대응하는 서열을 포함한 올리고뉴클레오티드 GH5 (서열 번호 29) 및 GH3 (서열 번호 30)를 사용하여 수득하였다.
성숙 칼시토닌 (Ct, WO2004003207) 및 hEGF 서열들에 대응하는 합성 유전자들 및 hGH 를 암호화하는 cDNA를 RX3 N-말단 감마-제인 코딩 서열 (특허 WO2004003207)에 융합시키고, pUC18 내로 도입시켰다. RX3-Ct, RX3-EGF 및 RX3-hGH 서열들을 함유하는, pUC18 유도된 플라스미드들 pUC18RX3Ct, pUC18RX3EGF 및 pUC18RX3gHG 로부터의 SalI-BamHI 제한 단편들을 Xho I-Bam HI 로 제한된 벡터 pcDNA3.1- (Invitrogen) 내에 도입시켰다. p3.1RX3CT, p3.1RX3EGF 및 p3.1RX3hGH 로 명명된 결과의 구축물들에서, 융합 단백질 서열들은 CMV 프로모터 및 종료기 pA BGH 하에 존재하였다.
효모 형질 전환을 위한 플라스미드 구축물들
숙주 균주들 및 벡터들:
사카로마이세스 세레비시에 균주 (유전형 Mata his3 leu2 met15 ura3 bar1::URA3)를 벡터 pYX243 (GAL 프로모터, LEU2 , AmpR, R&D Systems) 유도된 구축물들을 사용함에 의해 형질 전환하였다. 피키아 파스토리스 균주 GS115 (his4) 및 벡터들 pPIC9 및 pPIC3.5K (AOX1 프로모터, HIS4 , AmpR)를 Invitrogen life tech 로부터 수득하였다.
플라스미드 구축물들:
대응 융합 단백질 RX3-EGF 및 RX3-hGH 서열들을 함유하는, 상기 기재된 pUC18-유도된 플라스미드들 pUC18RX3EGF 및 pUC18RX3hGH 로부터의 SalI(블런트(blunt) 말단 처리됨)-BamHI 제한 단편들을, EcoRI (블런트 말단 처리됨)-Bam HI 제한된 벡터 pYX243 (R&D Systems) 내로 도입하였다. 각각 c117 및 c118로 명명된 결과의 구축물들에서, 융합 단백질 서열들은 유도성 GAL 프로모터 하에 존재하였다.
pUC18 유도된 플라스미드들 pUC18RX3EGF 및 pUC18RX3hGH로부터의 제한 단편들, SalI(블런트 말단 처리됨)-BamHI (블런트 말단 처리됨)을 NotI (블런트 말단 처리됨)-EcoRI (블런트 말단 처리됨)으로 제한된 벡터 pPIC3.5K (Invitrogen) 내로 도입하여, 피키아 파스토리스를 형질 전환하기 위한 플라스미드들 c120 및 c121을 수득하였다.
플라스미드 pPIC9 (Invitrogen)을 사용하여, 효모 신호 펩티드인, 사카로마 이세스의 알파 프리프로 펩티드를 사용하는 융합 단백질 발현을 분석하였다. RX3-hGH 및 hGH 단백질들을 코딩하는 XhoI-NotI 측면(flanked) 서열들을, pUC18RX3hGH을 주형으로서 사용하고, 올리고뉴클레오티드들 af06 (서열 번호 31), afRX (서열 번호 32) 및 06Not (서열 번호 33)를 사용하여 PCR에 의해 수득하였다.
이들 서열들은 알파 프리프로 펩티드의 효율적인 분할에 필요한 KEX2 부위를 코딩하는 서열을 함유하였다 (Invitrogen, 피키아 발현 키트). 상기 PCR 생성물들을 XhoI-NotI 로 제한된 pPIC9 내로 클로닝하여, 상기 알파 인자 프리프로 펩티드에 융합된 RX3-hGH 및 hGH 단백질 서열들을 각각 함유하는 플라스미드 c135 및 c136 을 제공하였다.
효모 형질 전환
사카로마이세스 세레비시에 균주 (leu2)를 LiAc 법 (Ito 등 1983, J. Bacteriol. 153:163-168)에 의해 플라스미드 구축물들 c117 및 c118로 형질 전환하고, 형질 전환체들을 Leu- 플레이트들 상에서 선발하였다. 갈락토오스 함유 매질(demanar composicio.) 중에서 형질 전환체들을 성장시켜 발현 분석들을 수행하였다.
피키아 파스토리스 균주 GS115 (his4)를 Pichia EasyComp 키트 (Invitrogen life tech.)에 의해, SacI 선형화된 c120 및 c121 플라스미드들을 사용하여 형질 전환시키고, RDB His-매질 상에 플레이팅하였다 (plated). Mut 표현형들은, 상기 콜로니들을 MD 및 MM 한천 플레이트들 상에서 스트리킹하여(streaking) 결정하였다. 상기 형질 전환체들을 YPD 매질 중에서 이틀 동안 성장시킴에 의해 발현 실험들을 수행하였다. 그 후, 세포들을 침전시키고, MM 매질에 또 다른 48 시간 동안 현탁하였으며, 메탄올을 매 24 시간 마다 0.5% 의 최종 농도로 첨가하였다. 가장 높은 수준의 재조합 단백질을 축적하는 형질 전환체들을 선발하였다. 매질 제조 방법들은 Invitrogen 에 의해 기재된 바와 같다 (피키아 발현 키트).
효모 단백질들 추출 및 웨스턴 블롯
사카로마이세스 세레비시에 및 피키아 파스토리스 발현 재조합 융합 단백질들을 펠렛화하였다. 각 인큐베이션 매질의 분액들을 침전시키고, 분석을 위해 -20℃에서 저장하였다. 세포 펠렛들도 냉동시키고, 해동 후, 유리 비즈(beads) 및 매질 H (50 mM HCl-Tris pH 8.0, 150 mM NaCl, 5 mM EDTA, 200 mM DTT 및 프로테아제 저해제들)를 사용하여 표준 방법에 의해 세포들을 파쇄하였다. 세포들 및 매질들을 모두 동량으로 하여, SDS-PAGE 및 재조합 발현된 단백질들에 대한 특정 항체들을 사용함에 의해 면역 블롯하여 분석하였다.
여기 언급된 특허들 및 논문들은 각각 참조로서 포함된다. 단수 ( 관사 "a" 또는 "an")의 사용은 하나 또는 그 이상을 포함하고자 하는 의도이다.
상기 기재 및 실시예들은 예시적인 것으로 의도된 것이지, 제한적인 것으로 받아들여져서는 안된다. 본 발명의 기술 사상 및 범주에 속하는 여전히 다른 변경들이 가능하며, 당업자들에게는 그러한 변경들이 쉽게 제시될 수 있을 것이다.
<110> ERA BIOTECH S.A.
<120> Production of proteins
<130> F07-5448-ES
<150> 0426160.8
<151> 2004-11-29
<160> 33
<170> KopatentIn 1.71
<210> 1
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> repeat domain hexapeptide
<400> 1
Pro Pro Pro Val His Leu
1 5
<210> 2
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3 query aa sequence
<400> 2
Pro Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro
1 5 10 15
Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro
20 25 30
Pro Pro Val His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His
35 40 45
Leu Pro Pro Pro Pro
50
<210> 3
<211> 65
<212> PRT
<213> Artificial Sequence
<220>
<223> Alpha zein aa sequence
<400> 3
Gln Gln Gln Gln Gln Phe Leu Pro Ala Leu Ser Gln Leu Asp Val Val
1 5 10 15
Asn Pro Val Ala Tyr Leu Gln Gln Gln Leu Leu Ala Ser Asn Pro Leu
20 25 30
Ala Leu Ala Asn Val Ala Ala Tyr Gln Gln Gln Gln Gln Leu Gln Gln
35 40 45
Phe Leu Pro Ala Leu Ser Gln Leu Ala Met Val Asn Pro Ala Ala Tyr
50 55 60
Leu
65
<210> 4
<211> 70
<212> PRT
<213> Artificial Sequence
<220>
<223> rice prolamin query aa sequence
<400> 4
Gln Gln Val Leu Ser Pro Tyr Asn Glu Phe Val Arg Gln Gln Tyr Gly
1 5 10 15
Ile Ala Ala Ser Pro Phe Leu Gln Ser Ala Thr Phe Gln Leu Arg Asn
20 25 30
Asn Gln Val Trp Gln Gln Leu Ala Leu Val Ala Gln Gln Ser His Cys
35 40 45
Gln Asp Ile Asn Ile Val Gln Ala Ile Ala Gln Gln Leu Gln Leu Gln
50 55 60
Gln Phe Gly Asp Leu Tyr
65 70
<210> 5
<211> 672
<212> DNA
<213> Maize
<400> 5
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg 60
catacaagcg gcggctgcgg ctgccagcca ccgccgccgg ttcatctacc gccgccggtg 120
catctgccac ctccggttca cctgccacct ccggtgcatc tcccaccgcc ggtccacctg 180
ccgccgccgg tccacctgcc accgccggtc catgtgccgc cgccggttca tctgccgccg 240
ccaccatgcc actaccctac tcaaccgccc cggcctcagc ctcatcccca gccacaccca 300
tgcccgtgcc aacagccgca tccaagcccg tgccagctgc agggaacctg cggcgttggc 360
agcaccccga tcctgggcca gtgcgtcgag tttctgaggc atcagtgcag cccgacggcg 420
acgccctact gctcgcctca gtgccagtcg ttgcggcagc agtgttgcca gcagctcagg 480
caggtggagc cgcagcaccg gtaccaggcg atcttcggct tggtcctcca gtccatcctg 540
cagcagcagc cgcaaagcgg ccaggtcgcg gggctgttgg cggcgcagat agcgcagcaa 600
ctgacggcga tgtgcggcct gcagcagccg actccatgcc cctacgctgc tgccggcggt 660
gtcccccacg cc 672
<210> 6
<211> 224
<212> PRT
<213> Maize
<400> 6
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1 5 10 15
Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro
20 25 30
Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu
35 40 45
Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val
50 55 60
His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His Leu Pro Pro
65 70 75 80
Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro
85 90 95
Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
100 105 110
Leu Gln Gly Thr Cys Gly Val Gly Ser Thr Pro Ile Leu Gly Gln Cys
115 120 125
Val Glu Phe Leu Arg His Gln Cys Ser Pro Thr Ala Thr Pro Tyr Cys
130 135 140
Ser Pro Gln Cys Gln Ser Leu Arg Gln Gln Cys Cys Gln Gln Leu Arg
145 150 155 160
Gln Val Glu Pro Gln His Arg Tyr Gln Ala Ile Phe Gly Leu Val Leu
165 170 175
Gln Ser Ile Leu Gln Gln Gln Pro Gln Ser Gly Gln Val Ala Gly Leu
180 185 190
Leu Ala Ala Gln Ile Ala Gln Gln Leu Thr Ala Met Cys Gly Leu Gln
195 200 205
Gln Pro Thr Pro Cys Pro Tyr Ala Ala Ala Gly Gly Val Pro His Ala
210 215 220
<210> 7
<211> 339
<212> DNA
<213> Artificial Sequence
<220>
<223> RX3 DNA sequence
<400> 7
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg 60
catacaagcg gcggctgcgg ctgccagcca ccgccgccgg ttcatctacc gccgccggtg 120
catctgccac ctccggttca cctgccacct ccggtgcatc tcccaccgcc ggtccacctg 180
ccgccgccgg tccacctgcc accgccggtc catgtgccgc cgccggttca tctgccgccg 240
ccaccatgcc actaccctac tcaaccgccc cggcctcagc ctcatcccca gccacaccca 300
tgcccgtgcc aacagccgca tccaagcccg tgccagacc 339
<210> 8
<211> 113
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3 aa
<400> 8
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1 5 10 15
Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro
20 25 30
Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu
35 40 45
Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val
50 55 60
His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His Leu Pro Pro
65 70 75 80
Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro
85 90 95
Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
100 105 110
Tyr
<210> 9
<211> 240
<212> DNA
<213> Artificial Sequence
<220>
<223> R3 DNA
<400> 9
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg 60
catacaagcg gcggctgcgg ctgccagcca ccgccgccgg ttcatctacc gccgccggtg 120
catctgccac ctccggttca cctgccacct ccggtgcatc tcccaccgcc ggtccacctg 180
ccgccgccgg tccacctgcc accgccggtc catgtgccgc cgccggttca tctgccgccg 240
240
<210> 10
<211> 92
<212> PRT
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 10
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1 5 10 15
Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro
20 25 30
Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu
35 40 45
Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val
50 55 60
His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His Leu Pro Pro
65 70 75 80
Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Tyr
85 90
<210> 11
<211> 213
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 11
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg 60
catacaagcg gcggctgcgg ctgccagcca ccgccgccgg ttcatctgcc gccgccacca 120
tgccactacc ctacacaacc gccccggcct cagcctcatc cccagccaca cccatgcccg 180
tgccaacagc cgcatccaag cccgtgccag acc 213
<210> 12
<211> 71
<212> PRT
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 12
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1 5 10 15
Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro
20 25 30
Pro Val His Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro
35 40 45
Arg Pro Gln Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro
50 55 60
His Pro Ser Pro Cys Gln Tyr
65 70
<210> 13
<211> 180
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 13
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg 60
catacaagcg gcggctgcgg ctgccaatgc cactacccta ctcaaccgcc ccggcctcag 120
cctcatcccc agccacaccc atgcccgtgc caacagccgc atccaagccc gtgccagacc 180
180
<210> 14
<211> 60
<212> PRT
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 14
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1 5 10 15
Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Cys His Tyr
20 25 30
Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His Pro Cys
35 40 45
Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln Tyr
50 55 60
<210> 15
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 15
Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Ala Ala Cys Ser
1 5 10 15
Ala Ser Ala Gln Phe Asp Val Leu Gly Gln Ser Tyr Arg Gln Tyr Gln
20 25 30
Leu Gln Ser Pro Val Leu Leu Gln Gln Gln Val Leu Ser Pro Tyr Asn
35 40 45
Glu Phe Val Arg Gln Gln Tyr Gly Ile Ala Ala Ser Pro Phe Leu Gln
50 55 60
Ser Ala Thr Phe Gln Leu Arg Asn Asn Gln Val Trp Gln Gln Leu Ala
65 70 75 80
Leu Val Ala Gln Gln Ser His Cys Gln Asp Ile Asn Ile Val Gln Ala
85 90 95
Ile Ala Gln Gln Leu Gln Leu Gln Gln Phe Gly Asp Leu Tyr Phe Asp
100 105 110
Arg Asn Leu Ala Gln Ala Gln Ala Leu Leu Ala Phe Asn Val Pro Ser
115 120 125
Arg Tyr Gly Ile Tyr Pro Arg Tyr Tyr Gly Ala Pro Ser Thr Ile Thr
130 135 140
Thr Leu Gly Gly Val Leu
145 150
<210> 16
<211> 450
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 16
atgaagatca ttttcgtctt tgctctcctt gctattgctg catgcagcgc ctctgcgcag 60
tttgatgttt taggtcaaag ttataggcaa tatcagctgc agtcgcctgt cctgctacag 120
caacaggtgc ttagcccata taatgagttc gtaaggcagc agtatggcat agcggcaagc 180
cccttcttgc aatcagctac gtttcaactg agaaacaacc aagtctggca acagctcgcg 240
ctggtggcgc aacaatctca ctgtcaggac attaacattg ttcaggccat agcgcagcag 300
ctacaactcc agcagtttgg tgatctctac tttgatcgga atctggctca agctcaagct 360
ctgttggctt ttaacgtgcc atctagatat ggtatctacc ctaggtacta tggtgcaccc 420
agtaccatta ccacccttgg cggtgtcttg 450
<210> 17
<211> 144
<212> PRT
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 17
Met Ala Thr Lys Ile Leu Ala Leu Leu Ala Leu Leu Ala Leu Phe Val
1 5 10 15
Ser Ala Thr Asn Ala Phe Ile Ile Pro Gln Cys Ser Leu Ala Pro Ser
20 25 30
Ala Ile Ile Pro Gln Phe Leu Pro Pro Val Thr Ser Met Gly Phe Glu
35 40 45
His Leu Ala Val Gln Ala Tyr Arg Leu Gln Gln Ala Leu Ala Ala Ser
50 55 60
Val Leu Gln Gln Pro Ile Asn Gln Leu Gln Gln Gln Ser Leu Ala His
65 70 75 80
Leu Thr Ile Gln Thr Ile Ala Thr Gln Gln Gln Gln Gln Phe Leu Pro
85 90 95
Ala Leu Ser Gln Leu Asp Val Val Asn Pro Val Ala Tyr Leu Gln Gln
100 105 110
Gln Leu Leu Ala Ser Asn Pro Leu Ala Leu Ala Asn Val Ala Ala Tyr
115 120 125
Gln Gln Gln Gln Gln Leu Gln Gln Phe Leu Pro Ala Leu Ser Gln Leu
130 135 140
<210> 18
<211> 432
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 18
atggctacca agatattagc cctccttgcg cttcttgccc tttttgtgag cgcaacaaat 60
gcgttcatta ttccacaatg ctcacttgct cctagtgcca ttataccaca gttcctccca 120
ccagttactt caatgggctt cgaacaccta gctgtgcaag cctacaggct acaacaagcg 180
cttgcggcaa gcgtcttaca acaaccaatt aaccaattgc aacaacaatc cttggcacat 240
ctaaccatac aaaccatcgc aacgcaacag caacaacagt tcctaccagc actgagccaa 300
ctagatgtgg tgaaccctgt cgcctacttg caacagcagc tgcttgcatc caacccactt 360
gctctggcaa acgtagctgc ataccaacaa caacaacaat tgcagcagtt tctgccagcg 420
ctcagtcaac ta 432
<210> 19
<211> 34
<212> PRT
<213> Salmon
<400> 19
Lys Cys Ser Asn Leu Ser Thr Cys Val Leu Gly Lys Leu Ser Gln Glu
1 5 10 15
Leu His Lys Leu Gln Thr Tyr Pro Arg Thr Asn Thr Gly Ser Gly Thr
20 25 30
Pro Gly
<210> 20
<211> 102
<212> DNA
<213> Salmon
<400> 20
aagtgctcca acctctctac ctgcgttctt ggtaagctct ctcaggagct tcacaagctc 60
cagacttacc ctagaaccaa cactggttcc ggtacccctg gt 102
<210> 21
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 21
Asn Ser Asp Ser Glu Cys Pro Leu Ser His Asp Gly Tyr Cys Leu His
1 5 10 15
Asp Gly Val Cys Met Tyr Ile Glu Ala Leu Asp Lys Tyr Ala Cys Asn
20 25 30
Cys Val Val Gly Tyr Ile Gly Glu Arg Cys Gln Tyr Arg Asp Leu Lys
35 40 45
Trp Trp Glu Leu Arg
50
<210> 22
<211> 162
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 22
aactctgatt cagaatgccc actcagtcac gacggatatt gtcttcacga tggggtatgc 60
atgtacatcg aggccttgga caagtacgca tgtaattgtg tagtgggata cattggtgaa 120
cgctgtcagt atcgagactt gaaatggtgg gagcttaggt ga 162
<210> 23
<211> 191
<212> PRT
<213> Artificial Sequence
<220>
<223> hGH protein
<400> 23
Phe Pro Thr Ile Pro Leu Ser Arg Leu Phe Asp Asn Ala Met Leu Arg
1 5 10 15
Ala His Arg Leu His Gln Leu Ala Phe Asp Thr Tyr Gln Glu Phe Glu
20 25 30
Glu Ala Tyr Ile Pro Lys Glu Gln Lys Tyr Ser Phe Leu Gln Asn Pro
35 40 45
Gln Thr Ser Leu Cys Phe Ser Glu Ser Ile Pro Thr Pro Ser Asn Arg
50 55 60
Glu Glu Thr Gln Gln Lys Ser Asn Leu Glu Leu Leu Arg Ile Ser Leu
65 70 75 80
Leu Leu Ile Gln Ser Trp Leu Glu Pro Val Gln Phe Leu Arg Ser Val
85 90 95
Phe Ala Asn Ser Leu Val Tyr Gly Ala Ser Asp Ser Asn Val Tyr Asp
100 105 110
Leu Leu Lys Asp Leu Glu Glu Gly Ile Gln Thr Leu Met Gly Arg Leu
115 120 125
Glu Asp Gly Ser Pro Arg Thr Gly Gln Ile Phe Lys Gln Thr Tyr Ser
130 135 140
Lys Phe Asp Thr Asn Ser His Asn Asp Asp Ala Leu Leu Lys Asn Tyr
145 150 155 160
Gly Leu Leu Tyr Cys Phe Arg Lys Asp Met Asp Lys Val Glu Thr Phe
165 170 175
Leu Arg Ile Val Gln Cys Arg Ser Val Glu Gly Ser Cys Gly Phe
180 185 190
<210> 24
<211> 576
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 24
ttcccaacca ttcccttatc caggcttttt gacaacgcta tgctccgcgc ccatcgtctg 60
caccagctgg cctttgacac ctaccaggag tttgaagaag cctatatccc aaaggaacag 120
aagtattcat tcctgcagaa cccccagacc tccctctgtt tctcagagtc tattccgaca 180
ccctccaaca gggaggaaac acaacagaaa tccaacctag agctgctccg catctccctg 240
ctgctcatcc agtcgtggct ggagcccgtg cagttcctca ggagtgtctt cgccaacagc 300
ctggtgtacg gcgcctctga cagcaacgtc tatgacctcc taaaggacct agaggaaggc 360
atccaaacgc tgatggggag gctggaagat ggcagccccc ggactgggca gatcttcaag 420
cagacctaca gcaagttcga cacaaactca cacaacgatg acgcactact caagaactac 480
gggctgctct actgcttcag gaaggacatg gacaaggtcg agacattcct gcgcatcgtg 540
cagtgccgct ctgtggaggg cagctgtggc ttctga 576
<210> 25
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> EFG1 DNA sequence
<400> 25
catgccatgg gaattgaggg taggaactct gattcagaat gcccactcag tcacgacgga 60
tatt 64
<210> 26
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial sequence
<400> 26
acttgtccaa ggcctcgatg tacatgcata ccccatcgtg aagacaatat ccgtcgtgac 60
tgagt 65
<210> 27
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 27
catcgaggcc ttggacaagt acgcatgtaa ttgtgtagtg ggatacattg gtgaacgctg 60
tcagt 65
<210> 28
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 28
tcaggatcct tatcacctaa gctcccacca tttcaagtct cgatactgac agcgttcacc 60
aatgt 65
<210> 29
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 29
gtccatggac gacgatgata agttcccaac cattccctta tcca 44
<210> 30
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 30
tcaggatcct tatcagaagc cacagctgcc ctcca 35
<210> 31
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 31
gctctcgaga aaagattccc aaccattccc ttatcc 36
<210> 32
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 32
gctctcgaga aaagaacgca tacaagcggc ggctgc 36
<210> 33
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial sequence
<400> 33
cttcgcggcc gcttatcaga agccacagct gcc 33
Claims (20)
- 재조합 단백질체 유사 조립체들 (RPBLAs) 내에 재조합 융합 단백질을 함유하고, 상기 융합 단백질은 함께 연결된 두 개의 서열들을 함유하며, 여기에서 한 서열은 숙주 세포에 대해 이종성인 단백질체 유도 서열이고 다른 한 서열은 관심 대상의 생성물의 서열인, 비-고등 식물 진핵 숙주 세포.
- 제 1 항에 있어서, RPBLAs의 밀도가 약 1.1 내지 약 1.35 g/ml 인 숙주 세포.
- 제 1 항에 있어서, 상기 융합 단백질이 단백질체 유도 서열 및 관심 대상의 생성물의 서열 간의 링커(linker) 서열을 더 포함하는 숙주 세포.
- 제 1 항에 있어서, 단백질체 유도 서열이 프롤라민(prolamiin) 또는 개질 프롤라민을 함유하는 숙주 세포.
- 제 4 항에 있어서, 상기 단백질체 유도 서열이 프롤라민 서열인 숙주 세포.
- 제 5 항에 있어서, 프롤라민 서열이 감마-제인(zein), 알파-제인 또는 쌀 프롤라민인 숙주 세포.
- 다음 단계들을 함유하는 융합 단백질의 제조방법:(a) (i) 프레임 내에서 하기 (ii)에 작동적으로 연결된 단백질체 유도 서열 (PBIS)을 코딩하는 제 1 핵산, 및 (ii) 관심 대상의 폴리펩티드 생성물을 코딩하는 제 2 핵산 서열을 함유하는 핵산 서열을 사용하여, 비-고등 식물 진핵 숙주 세포들을 형질 전환시키는 단계;(b) 상기 형질 전환된 숙주 세포들을 일정 시간 동안, 융합 단백질의 발현 및 발현된 융합 단백질의 재조합 단백질체 유사 조립체들(RPBLAs)로의 조립에 적합한 배양 조건 하에서 유지시키는 단계.
- 제 7 항에 있어서, 제 1 핵산 서열 (i)의 3' 말단이 제 2 핵산 서열 (ii)의 5' 말단에 연결되는 제조 방법.
- 제 7 항에 있어서, 상기 핵산이 PBIS 및 관심 대상의 폴리펩티드 생성물 사이의 링커 서열을 암호화하는 제조 방법.
- 제 7 항에 있어서, 상기 숙주 세포들이 진균 세포들, 특히 효모 세포들인 제조 방법.
- 제 7 항에 있어서, 숙주 세포들이 조류(algal) 세포들인 제조 방법.
- 제 7 항에 있어서, 상기 숙주 세포들이 동물 세포들, 특히 포유류 세포들인 제조 방법.
- 제 7 항에 있어서, 발현된 융합 단백질을 회수하는 단계를 더 포함하는 제조 방법.
- 제 7 항에 있어서, 상기 단백질체 유도 서열이 프롤라민 또는 개질 프롤라민을 함유하는 제조 방법.
- 제 14 항에 있어서, 프롤라민 서열이, 하기를 포함하는 개질 프롤라민인 제조 방법: (a) 신호 펩티드 서열, (b) 단백질 감마-제인의 반복 도메인 헥사펩티드 PPPVHL (서열번호 1)의 하나 이상의 복제물들의 서열, 및 (c) 감마-제인의 ProX 도메인 전부 또는 일부의 서열.
- 제 14 항에 있어서, 프롤라민 서열이 감마-제인, 알파-제인 또는 쌀 프롤라민인 방법.
- 제 7 항에 있어서, 숙주 세포들을 형질 전환하는데 사용된 핵산 서열이 하나 이상의 조절 서열들을 포함하는 발현 벡터에 존재하는 제조 방법.
- 제 17 항에 있어서, 상기 하나 이상의 조절 서열들이 프로모터를 포함하는 제조 방법.
- (i) 하기 (ii)에 연결된 단백질체 유도 서열 및 (ii) 관심 대상의 폴리펩티드 생성물을 함유하는 융합 단백질을 암호화하는 유전자를 규정하는, 외생의 핵산 절편에 작동적으로 연결된 하나 이상의 조절 서열들을 함유하는 벡터를 포함하는 재조합 핵산 분자.
- 제 19 항에 있어서, 상기 벡터의 하나 이상의 조절 서열들이, 적합성(compatible) 진핵 숙주 세포에서 상기 유전자의 발현을 유도하는데 적합한 프로모터를 포함하는 핵산.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB0426160.8A GB0426160D0 (en) | 2004-11-29 | 2004-11-29 | Production of proteins |
GB0426160.8 | 2004-11-29 | ||
PCT/EP2005/012877 WO2006056483A1 (en) | 2004-11-29 | 2005-11-29 | Production of proteins |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070091156A true KR20070091156A (ko) | 2007-09-07 |
KR101430081B1 KR101430081B1 (ko) | 2014-08-13 |
Family
ID=33561506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077014382A KR101430081B1 (ko) | 2004-11-29 | 2005-11-29 | 단백질 제조 |
Country Status (12)
Country | Link |
---|---|
US (1) | US8822181B2 (ko) |
EP (1) | EP1819725B1 (ko) |
JP (1) | JP2008521391A (ko) |
KR (1) | KR101430081B1 (ko) |
CN (1) | CN101098886B (ko) |
AR (1) | AR051837A1 (ko) |
AU (1) | AU2005308921B2 (ko) |
BR (1) | BRPI0517121A (ko) |
CA (1) | CA2589164C (ko) |
GB (1) | GB0426160D0 (ko) |
RU (1) | RU2429243C2 (ko) |
WO (1) | WO2006056483A1 (ko) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2224792B1 (es) * | 2002-06-28 | 2007-02-16 | Era Plantech, S.L. | Produccion de peptidos y proteinas por acumulacion de cuerpos proteicos derivados de reticulos endoplasmico en plantas. |
GB0426161D0 (en) * | 2004-11-29 | 2004-12-29 | Era Plantech S L | Protein isolation and purification |
US8163880B2 (en) | 2006-02-23 | 2012-04-24 | Era Biotech S.A. | Production of biologically active proteins |
KR20110084906A (ko) | 2008-10-10 | 2011-07-26 | 에라 바이오테크, 에스.에이. | 면역원-특이적 면역보강제로서의 재조합 단백질체들 |
EP2418284A1 (en) | 2010-08-13 | 2012-02-15 | ERA Biotech, S.A. | Protein body-inducing polypeptide sequences |
EP2468872A1 (en) * | 2010-12-23 | 2012-06-27 | Philip Morris Products S.A. | Method for producing mullerian inhibitor substance in plants |
CA2824155A1 (en) | 2011-01-17 | 2012-07-26 | Philip Morris Products S.A. | Vectors for nucleic acid expression in plants |
JP6037395B2 (ja) | 2011-01-17 | 2016-12-07 | フィリップ・モーリス・プロダクツ・ソシエテ・アノニム | 植物におけるタンパク質発現 |
FI20115704L (fi) | 2011-07-01 | 2013-01-02 | Teknologian Tutkimuskeskus Vtt Oy | Vierasproteiinien tuoton parantaminen |
GB201514648D0 (en) * | 2015-08-18 | 2015-09-30 | Univ Cape Town | Synthetic BTV VP2 fusion protein |
GB201514652D0 (en) * | 2015-08-18 | 2015-09-30 | Univ Cape Town | Synthetic BTV VP2 multiepitope peptide vaccine |
AU2017260277A1 (en) * | 2016-05-06 | 2018-11-22 | Glaxosmithkline Intellectual Property Development Limited | Method of producing a recombinant protein |
CN112048518B (zh) * | 2020-08-22 | 2022-06-24 | 江西农业大学 | 一种玉米醇溶蛋白降解酶的制备方法及其应用 |
US10894812B1 (en) | 2020-09-30 | 2021-01-19 | Alpine Roads, Inc. | Recombinant milk proteins |
US10947552B1 (en) | 2020-09-30 | 2021-03-16 | Alpine Roads, Inc. | Recombinant fusion proteins for producing milk proteins in plants |
CA3191387A1 (en) | 2020-09-30 | 2022-04-07 | Nobell Foods, Inc. | Recombinant milk proteins and food compositions comprising the same |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4215040A (en) | 1978-12-22 | 1980-07-29 | The Procter & Gamble Company | Density separation process |
US5650554A (en) | 1991-02-22 | 1997-07-22 | Sembiosys Genetics Inc. | Oil-body proteins as carriers of high-value peptides in plants |
US6642437B1 (en) | 1997-09-30 | 2003-11-04 | The Regents Of The University Of California | Production of proteins in plant seeds |
WO2002086077A2 (en) | 2001-04-18 | 2002-10-31 | New Mexico State University Technology Transfer Corporation | Co-expression of zein proteins |
ATE452137T1 (de) * | 2002-05-24 | 2010-01-15 | Restoragen Inc | Verfahren und konstrukte zur expression von clostripain mit hoher ausbeute |
DK1532261T3 (da) | 2002-05-24 | 2010-05-31 | Medtronic Inc | Fremgangsmåder og DNA-konstrukter til produktion af polypeptider med højt udbytte |
ES2224792B1 (es) * | 2002-06-28 | 2007-02-16 | Era Plantech, S.L. | Produccion de peptidos y proteinas por acumulacion de cuerpos proteicos derivados de reticulos endoplasmico en plantas. |
GB0426161D0 (en) | 2004-11-29 | 2004-12-29 | Era Plantech S L | Protein isolation and purification |
US8163880B2 (en) | 2006-02-23 | 2012-04-24 | Era Biotech S.A. | Production of biologically active proteins |
KR20110084906A (ko) | 2008-10-10 | 2011-07-26 | 에라 바이오테크, 에스.에이. | 면역원-특이적 면역보강제로서의 재조합 단백질체들 |
EP2418284A1 (en) | 2010-08-13 | 2012-02-15 | ERA Biotech, S.A. | Protein body-inducing polypeptide sequences |
-
2004
- 2004-11-29 GB GBGB0426160.8A patent/GB0426160D0/en not_active Ceased
-
2005
- 2005-11-29 AU AU2005308921A patent/AU2005308921B2/en not_active Ceased
- 2005-11-29 BR BRPI0517121-0A patent/BRPI0517121A/pt not_active Application Discontinuation
- 2005-11-29 EP EP05812587A patent/EP1819725B1/en active Active
- 2005-11-29 CN CN2005800461115A patent/CN101098886B/zh not_active Expired - Fee Related
- 2005-11-29 KR KR1020077014382A patent/KR101430081B1/ko active IP Right Grant
- 2005-11-29 JP JP2007541877A patent/JP2008521391A/ja active Pending
- 2005-11-29 AR ARP050104995A patent/AR051837A1/es not_active Application Discontinuation
- 2005-11-29 CA CA2589164A patent/CA2589164C/en not_active Expired - Fee Related
- 2005-11-29 US US11/288,853 patent/US8822181B2/en not_active Expired - Fee Related
- 2005-11-29 WO PCT/EP2005/012877 patent/WO2006056483A1/en active Application Filing
- 2005-11-29 RU RU2007124369/10A patent/RU2429243C2/ru active
Also Published As
Publication number | Publication date |
---|---|
EP1819725A1 (en) | 2007-08-22 |
GB0426160D0 (en) | 2004-12-29 |
RU2429243C2 (ru) | 2011-09-20 |
CA2589164A1 (en) | 2006-06-01 |
CA2589164C (en) | 2014-10-28 |
CN101098886A (zh) | 2008-01-02 |
CN101098886B (zh) | 2012-09-26 |
US20060121573A1 (en) | 2006-06-08 |
KR101430081B1 (ko) | 2014-08-13 |
US8822181B2 (en) | 2014-09-02 |
WO2006056483A1 (en) | 2006-06-01 |
AU2005308921B2 (en) | 2011-11-24 |
RU2007124369A (ru) | 2009-01-10 |
BRPI0517121A (pt) | 2008-09-30 |
EP1819725B1 (en) | 2013-03-27 |
JP2008521391A (ja) | 2008-06-26 |
AU2005308921A1 (en) | 2006-06-01 |
AR051837A1 (es) | 2007-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101430081B1 (ko) | 단백질 제조 | |
EP2576797B1 (en) | Protein body-inducing polypeptide sequences | |
EP3438125B1 (en) | Yeast strains and methods for controlling hydroxylation of recombinant collagen | |
US20110135596A1 (en) | Fusion protein comprising ubiquitin or ubiquitin-like protein, membrane translocation sequence and biologically active molecule and use thereof | |
Fairlie et al. | Expression of a TGF-β superfamily protein, macrophage inhibitory cytokine-1, in the yeast Pichia pastoris | |
KR20130091797A (ko) | 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 | |
BRPI0708260A2 (pt) | célula hospedeira eucariótica, conjuntos semelhantes a corpo proteìnicos recombinantes, método para a preparação de um polipeptìdeo biologicamente ativo e vacina ou inóculo | |
KR20070091157A (ko) | 단백질 단리 및 정제 | |
Koganesawa et al. | Expression and purification of a small cytokine growth-blocking peptide from armyworm Pseudaletia separata by an optimized fermentation method using the methylotrophic yeast Pichia pastoris | |
Kadonookuda et al. | Baculovirus-mediated production of the human growth hormone in larvae of the silkworm, Bombyx mori | |
KR101049859B1 (ko) | N-말단 pI 값 조절에 의한 수용성 재조합 단백질 생산방법 | |
ES2258371B1 (es) | Levadura transformante productora de hormona paratiroidea humana y procedimiento para producir la hormona. | |
KR20210064144A (ko) | GroES 융합을 이용한 글루카곤 유사 펩타이드-1 또는 이의 유사체의 생산방법 | |
KR101184011B1 (ko) | 폴딩되는 큰 활성 단백질의 수용성 발현 | |
US8691530B2 (en) | Process for obtaining aspart insulin using a Pichia pastoris yeast strain | |
US5641649A (en) | Expression of osteogenic factor OP-1 in cells of spodoptera frugiperda infected with recombinant baculovirus | |
Yan et al. | Overexpression of a small medicinal peptide from ginseng in the yeast Pichia pastoris | |
WO1997003089A2 (en) | Method for the preparation of insulin by cleavage of a fusion protein and fusion proteins containing insulin a and b chains | |
CN100429226C (zh) | 胰岛素及胰岛素类似物的基因工程制备新方法 | |
KR100761790B1 (ko) | GsMTx4 유전자를 포함하는 효모 발현용 재조합플라스미드 및 이를 이용한 칠레산 타란툴라 거미독펩타이드 GsMTx4의 생산 방법 | |
MX2007006330A (en) | Production of proteins | |
KR102345013B1 (ko) | GroES 융합을 이용한 글루카곤 유사 펩타이드-2 또는 이의 유사체의 생산방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
A107 | Divisional application of patent | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20170727 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20190725 Year of fee payment: 6 |