KR20130113967A - 단백질체 유도 폴리펩티드 서열 - Google Patents
단백질체 유도 폴리펩티드 서열 Download PDFInfo
- Publication number
- KR20130113967A KR20130113967A KR1020127034217A KR20127034217A KR20130113967A KR 20130113967 A KR20130113967 A KR 20130113967A KR 1020127034217 A KR1020127034217 A KR 1020127034217A KR 20127034217 A KR20127034217 A KR 20127034217A KR 20130113967 A KR20130113967 A KR 20130113967A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- sequence
- rpbla
- protein
- fusion protein
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 198
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 155
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 63
- 108090000623 proteins and genes Proteins 0.000 title claims description 242
- 102000004169 proteins and genes Human genes 0.000 title claims description 207
- 230000001939 inductive effect Effects 0.000 title abstract description 7
- 238000000034 method Methods 0.000 claims abstract description 101
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 claims abstract description 90
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims abstract description 34
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims abstract description 34
- 108010076504 Protein Sorting Signals Proteins 0.000 claims abstract description 32
- 229960005486 vaccine Drugs 0.000 claims abstract description 23
- 108010026466 polyproline Proteins 0.000 claims abstract description 15
- 229920000037 Polyproline Polymers 0.000 claims abstract description 14
- 238000000746 purification Methods 0.000 claims abstract description 10
- 108020001507 fusion proteins Proteins 0.000 claims description 225
- 102000037865 fusion proteins Human genes 0.000 claims description 223
- 235000018102 proteins Nutrition 0.000 claims description 183
- 235000013930 proline Nutrition 0.000 claims description 178
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 175
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 claims description 171
- 235000001014 amino acid Nutrition 0.000 claims description 159
- 150000001413 amino acids Chemical class 0.000 claims description 156
- 210000004027 cell Anatomy 0.000 claims description 154
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 91
- 241000196324 Embryophyta Species 0.000 claims description 86
- 235000018417 cysteine Nutrition 0.000 claims description 70
- 241000208125 Nicotiana Species 0.000 claims description 60
- 230000015572 biosynthetic process Effects 0.000 claims description 53
- 239000013598 vector Substances 0.000 claims description 42
- 210000002472 endoplasmic reticulum Anatomy 0.000 claims description 40
- 150000007523 nucleic acids Chemical class 0.000 claims description 38
- 239000012528 membrane Substances 0.000 claims description 31
- 102000039446 nucleic acids Human genes 0.000 claims description 28
- 108020004707 nucleic acids Proteins 0.000 claims description 28
- 235000013305 food Nutrition 0.000 claims description 25
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 20
- 230000001965 increasing effect Effects 0.000 claims description 19
- 239000004472 Lysine Substances 0.000 claims description 18
- 239000004475 Arginine Substances 0.000 claims description 17
- 241000238631 Hexapoda Species 0.000 claims description 17
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 17
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 17
- 238000004519 manufacturing process Methods 0.000 claims description 16
- 229920002494 Zein Polymers 0.000 claims description 15
- 239000005019 zein Substances 0.000 claims description 15
- 229940093612 zein Drugs 0.000 claims description 15
- 230000002829 reductive effect Effects 0.000 claims description 14
- 108010013369 Enteropeptidase Proteins 0.000 claims description 13
- 235000004279 alanine Nutrition 0.000 claims description 13
- 102100029727 Enteropeptidase Human genes 0.000 claims description 12
- 210000004899 c-terminal region Anatomy 0.000 claims description 12
- 238000003776 cleavage reaction Methods 0.000 claims description 12
- 230000007017 scission Effects 0.000 claims description 12
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 11
- 102000004190 Enzymes Human genes 0.000 claims description 10
- 108090000790 Enzymes Proteins 0.000 claims description 10
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 10
- 210000004962 mammalian cell Anatomy 0.000 claims description 7
- 239000004094 surface-active agent Substances 0.000 claims description 7
- 239000003085 diluting agent Substances 0.000 claims description 6
- 230000015556 catabolic process Effects 0.000 claims description 5
- 239000003153 chemical reaction reagent Substances 0.000 claims description 5
- 238000006731 degradation reaction Methods 0.000 claims description 5
- 239000008194 pharmaceutical composition Substances 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims description 5
- 241000271566 Aves Species 0.000 claims description 4
- 239000012062 aqueous buffer Substances 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 4
- 230000017730 intein-mediated protein splicing Effects 0.000 claims description 4
- 108010074860 Factor Xa Proteins 0.000 claims description 3
- 108700026244 Open Reading Frames Proteins 0.000 claims description 3
- 241000194019 Streptococcus mutans Species 0.000 claims description 3
- 230000002538 fungal effect Effects 0.000 claims description 3
- 150000003148 prolines Chemical class 0.000 claims description 3
- 238000001742 protein purification Methods 0.000 claims description 3
- 230000002797 proteolythic effect Effects 0.000 claims description 3
- 230000002255 enzymatic effect Effects 0.000 claims description 2
- 150000001945 cysteines Chemical group 0.000 claims 8
- 108010026552 Proteome Proteins 0.000 claims 1
- 239000000556 agonist Substances 0.000 claims 1
- 230000012743 protein tagging Effects 0.000 claims 1
- 230000014616 translation Effects 0.000 abstract description 9
- IMPJIKIXNAGRCR-XTWDHKKOSA-N (2s)-2-[[(1s)-2-[hydroxy-[2-phenyl-1-(phenylmethoxycarbonylamino)ethyl]phosphoryl]cyclopentanecarbonyl]amino]-3-(1h-indol-3-yl)propanoic acid Chemical compound C([C@H]1C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)O)CCC1P(O)(=O)C(NC(=O)OCC=1C=CC=CC=1)CC1=CC=CC=C1 IMPJIKIXNAGRCR-XTWDHKKOSA-N 0.000 description 387
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 219
- 229940024606 amino acid Drugs 0.000 description 157
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 149
- 239000005090 green fluorescent protein Substances 0.000 description 112
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 94
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 89
- 230000014509 gene expression Effects 0.000 description 89
- 108010077112 prolyl-proline Proteins 0.000 description 78
- 108010053725 prolylvaline Proteins 0.000 description 72
- 230000000694 effects Effects 0.000 description 45
- 108020004414 DNA Proteins 0.000 description 42
- 230000000172 allergic effect Effects 0.000 description 40
- 208000010668 atopic eczema Diseases 0.000 description 39
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 39
- 238000009825 accumulation Methods 0.000 description 36
- 101150067366 adh gene Proteins 0.000 description 36
- 244000061176 Nicotiana tabacum Species 0.000 description 32
- 108010045262 enhanced cyan fluorescent protein Proteins 0.000 description 32
- 238000001262 western blot Methods 0.000 description 30
- 230000002209 hydrophobic effect Effects 0.000 description 28
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 27
- 238000005119 centrifugation Methods 0.000 description 27
- 239000012634 fragment Substances 0.000 description 27
- 108091026890 Coding region Proteins 0.000 description 26
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 26
- 108010087924 alanylproline Proteins 0.000 description 26
- 239000006228 supernatant Substances 0.000 description 26
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 25
- ZFXQNADNEBRERM-BJDJZHNGSA-N Ala-Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZFXQNADNEBRERM-BJDJZHNGSA-N 0.000 description 23
- 101800003838 Epidermal growth factor Proteins 0.000 description 23
- 102400001368 Epidermal growth factor Human genes 0.000 description 23
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 23
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 23
- 239000013604 expression vector Substances 0.000 description 23
- 229940116977 epidermal growth factor Drugs 0.000 description 22
- 235000014304 histidine Nutrition 0.000 description 21
- 230000006698 induction Effects 0.000 description 21
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 20
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 19
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 19
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 19
- 238000011084 recovery Methods 0.000 description 19
- 210000001519 tissue Anatomy 0.000 description 19
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 18
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 18
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 18
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 18
- 108010025306 histidylleucine Proteins 0.000 description 18
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 17
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 17
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 17
- 238000000464 low-speed centrifugation Methods 0.000 description 17
- 239000000047 product Substances 0.000 description 17
- 230000001105 regulatory effect Effects 0.000 description 17
- URDUGPGPLNXXES-WHFBIAKZSA-N Cys-Gly-Cys Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O URDUGPGPLNXXES-WHFBIAKZSA-N 0.000 description 16
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 16
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 16
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 16
- 210000000056 organ Anatomy 0.000 description 16
- 210000003463 organelle Anatomy 0.000 description 16
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 15
- 241001465754 Metazoa Species 0.000 description 15
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 14
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 description 14
- 229930006000 Sucrose Natural products 0.000 description 14
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 14
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 14
- 108091033319 polynucleotide Proteins 0.000 description 14
- 102000040430 polynucleotide Human genes 0.000 description 14
- 239000002157 polynucleotide Substances 0.000 description 14
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 14
- 239000005720 sucrose Substances 0.000 description 14
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 13
- ISQOVWDWRUONJH-YESZJQIVSA-N His-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ISQOVWDWRUONJH-YESZJQIVSA-N 0.000 description 13
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 13
- 240000008042 Zea mays Species 0.000 description 13
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 13
- 239000002054 inoculum Substances 0.000 description 13
- 238000005063 solubilization Methods 0.000 description 13
- 230000007928 solubilization Effects 0.000 description 13
- 238000005406 washing Methods 0.000 description 13
- 238000011537 Coomassie blue staining Methods 0.000 description 12
- NPMFDZGLKBNFOO-SRVKXCTJSA-N Gln-Pro-His Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NPMFDZGLKBNFOO-SRVKXCTJSA-N 0.000 description 12
- 108010000521 Human Growth Hormone Proteins 0.000 description 12
- 206010020751 Hypersensitivity Diseases 0.000 description 12
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 12
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 12
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 12
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 12
- 125000003275 alpha amino acid group Chemical group 0.000 description 12
- 235000005822 corn Nutrition 0.000 description 12
- 108010085325 histidylproline Proteins 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- 238000003860 storage Methods 0.000 description 12
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 12
- 102000002265 Human Growth Hormone Human genes 0.000 description 11
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical group CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 11
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 11
- XQAPEISNMXNKGE-FXQIFTODSA-N Ser-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CS)C(=O)O XQAPEISNMXNKGE-FXQIFTODSA-N 0.000 description 11
- 241000700605 Viruses Species 0.000 description 11
- 108010055615 Zein Proteins 0.000 description 11
- 238000000942 confocal micrograph Methods 0.000 description 11
- 239000008188 pellet Substances 0.000 description 11
- 108060006613 prolamin Proteins 0.000 description 11
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 10
- BPHKULHWEIUDOB-FXQIFTODSA-N Cys-Gln-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BPHKULHWEIUDOB-FXQIFTODSA-N 0.000 description 10
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 10
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 10
- 239000000854 Human Growth Hormone Substances 0.000 description 10
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 10
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 10
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 10
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 10
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 10
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 10
- 230000007815 allergy Effects 0.000 description 10
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 10
- 210000003527 eukaryotic cell Anatomy 0.000 description 10
- 230000004927 fusion Effects 0.000 description 10
- 238000000926 separation method Methods 0.000 description 10
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 9
- JXVXYRZQIUPYSA-NHCYSSNCSA-N Pro-Val-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JXVXYRZQIUPYSA-NHCYSSNCSA-N 0.000 description 9
- 108700019146 Transgenes Proteins 0.000 description 9
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 9
- 239000013566 allergen Substances 0.000 description 9
- 239000000872 buffer Substances 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 9
- 235000013339 cereals Nutrition 0.000 description 9
- 238000002983 circular dichroism Methods 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- 239000000203 mixture Substances 0.000 description 9
- 239000004474 valine Substances 0.000 description 9
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 9
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 8
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Chemical group CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 8
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 8
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 8
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 8
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 8
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 8
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 8
- 208000026935 allergic disease Diseases 0.000 description 8
- 238000004624 confocal microscopy Methods 0.000 description 8
- 108010060199 cysteinylproline Proteins 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 229940088598 enzyme Drugs 0.000 description 8
- 230000002163 immunogen Effects 0.000 description 8
- 230000001976 improved effect Effects 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 108010093374 pneumococcal purpura-producing principle Proteins 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000028327 secretion Effects 0.000 description 8
- 125000006850 spacer group Chemical group 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 238000011282 treatment Methods 0.000 description 8
- 241000701447 unidentified baculovirus Species 0.000 description 8
- VRBRSQUJTJSJCL-FRSCJGFNSA-N (2s)-1-[(2s)-1-[(2s)-1-[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-methylbutanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)NC(=O)[C@@H](N)C(C)C)C1=CN=CN1 VRBRSQUJTJSJCL-FRSCJGFNSA-N 0.000 description 7
- 108010035532 Collagen Proteins 0.000 description 7
- 239000007983 Tris buffer Substances 0.000 description 7
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 7
- 230000002776 aggregation Effects 0.000 description 7
- 238000004220 aggregation Methods 0.000 description 7
- 238000000429 assembly Methods 0.000 description 7
- 230000000712 assembly Effects 0.000 description 7
- 229920001222 biopolymer Polymers 0.000 description 7
- 238000004113 cell culture Methods 0.000 description 7
- 238000011143 downstream manufacturing Methods 0.000 description 7
- 230000005284 excitation Effects 0.000 description 7
- 239000000499 gel Substances 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- -1 proline amino acids Chemical class 0.000 description 7
- 230000000717 retained effect Effects 0.000 description 7
- 238000001890 transfection Methods 0.000 description 7
- 230000009261 transgenic effect Effects 0.000 description 7
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 7
- 101150078509 ADH2 gene Proteins 0.000 description 6
- 101150026777 ADH5 gene Proteins 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- 102000008186 Collagen Human genes 0.000 description 6
- 101100269269 Drosophila mayaguana Adh gene Proteins 0.000 description 6
- 241000233866 Fungi Species 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 6
- 101100054943 Mus musculus Adh4 gene Proteins 0.000 description 6
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 6
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 6
- 108020004511 Recombinant DNA Proteins 0.000 description 6
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 6
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 6
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 6
- 229920001436 collagen Polymers 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 239000012071 phase Substances 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 239000000523 sample Substances 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 5
- 241000589158 Agrobacterium Species 0.000 description 5
- 101100328886 Caenorhabditis elegans col-2 gene Proteins 0.000 description 5
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 5
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 5
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 5
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 5
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 102000034287 fluorescent proteins Human genes 0.000 description 5
- 108091006047 fluorescent proteins Proteins 0.000 description 5
- 210000003630 histaminocyte Anatomy 0.000 description 5
- 238000003119 immunoblot Methods 0.000 description 5
- 230000016507 interphase Effects 0.000 description 5
- 230000003834 intracellular effect Effects 0.000 description 5
- NBQNWMBBSKPBAY-UHFFFAOYSA-N iodixanol Chemical compound IC=1C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C(I)C=1N(C(=O)C)CC(O)CN(C(C)=O)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NBQNWMBBSKPBAY-UHFFFAOYSA-N 0.000 description 5
- 229960004359 iodixanol Drugs 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 238000011068 loading method Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000005215 recombination Methods 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 239000000725 suspension Substances 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 210000003934 vacuole Anatomy 0.000 description 5
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 4
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 4
- 241000283690 Bos taurus Species 0.000 description 4
- 102000004127 Cytokines Human genes 0.000 description 4
- 108090000695 Cytokines Proteins 0.000 description 4
- 102000053187 Glucuronidase Human genes 0.000 description 4
- 108010060309 Glucuronidase Proteins 0.000 description 4
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 4
- 241000699670 Mus sp. Species 0.000 description 4
- 102000057297 Pepsin A Human genes 0.000 description 4
- 108090000284 Pepsin A Proteins 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- 101710182846 Polyhedrin Proteins 0.000 description 4
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 4
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 4
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 4
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 4
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 4
- OJOBTAOGJIWAGB-UHFFFAOYSA-N acetosyringone Chemical compound COC1=CC(C(C)=O)=CC(OC)=C1O OJOBTAOGJIWAGB-UHFFFAOYSA-N 0.000 description 4
- 230000002378 acidificating effect Effects 0.000 description 4
- 239000000427 antigen Substances 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 239000003638 chemical reducing agent Substances 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 239000000356 contaminant Substances 0.000 description 4
- 238000004132 cross linking Methods 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 4
- 238000003365 immunocytochemistry Methods 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 230000008595 infiltration Effects 0.000 description 4
- 238000001764 infiltration Methods 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 4
- 210000001161 mammalian embryo Anatomy 0.000 description 4
- 210000001589 microsome Anatomy 0.000 description 4
- 235000016709 nutrition Nutrition 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 229940111202 pepsin Drugs 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 4
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- JQXXHWHPUNPDRT-WLSIYKJHSA-N rifampicin Chemical compound O([C@](C1=O)(C)O/C=C/[C@@H]([C@H]([C@@H](OC(C)=O)[C@H](C)[C@H](O)[C@H](C)[C@@H](O)[C@@H](C)\C=C\C=C(C)/C(=O)NC=2C(O)=C3C([O-])=C4C)C)OC)C4=C1C3=C(O)C=2\C=N\N1CC[NH+](C)CC1 JQXXHWHPUNPDRT-WLSIYKJHSA-N 0.000 description 4
- 229960001225 rifampicin Drugs 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 230000006641 stabilisation Effects 0.000 description 4
- 238000011105 stabilization Methods 0.000 description 4
- 238000010561 standard procedure Methods 0.000 description 4
- 239000013589 supplement Substances 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- 108010011619 6-Phytase Proteins 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 3
- 208000002109 Argyria Diseases 0.000 description 3
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 102000001301 EGF receptor Human genes 0.000 description 3
- 108060006698 EGF receptor Proteins 0.000 description 3
- 241000283086 Equidae Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 208000004262 Food Hypersensitivity Diseases 0.000 description 3
- 206010016946 Food allergy Diseases 0.000 description 3
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 108091006905 Human Serum Albumin Proteins 0.000 description 3
- 102000008100 Human Serum Albumin Human genes 0.000 description 3
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- 240000007594 Oryza sativa Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 101000900567 Pisum sativum Disease resistance response protein Pi49 Proteins 0.000 description 3
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 3
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 3
- 101710118538 Protease Proteins 0.000 description 3
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 230000006044 T cell activation Effects 0.000 description 3
- 210000001744 T-lymphocyte Anatomy 0.000 description 3
- 241000499912 Trichoderma reesei Species 0.000 description 3
- 241001080519 Zera Species 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 239000007864 aqueous solution Substances 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 238000006664 bond formation reaction Methods 0.000 description 3
- 210000000481 breast Anatomy 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000013256 coordination polymer Substances 0.000 description 3
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 235000020776 essential amino acid Nutrition 0.000 description 3
- 239000003797 essential amino acid Substances 0.000 description 3
- 239000012091 fetal bovine serum Substances 0.000 description 3
- 238000002073 fluorescence micrograph Methods 0.000 description 3
- 235000020932 food allergy Nutrition 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 238000000265 homogenisation Methods 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 235000013336 milk Nutrition 0.000 description 3
- 239000008267 milk Substances 0.000 description 3
- 210000004080 milk Anatomy 0.000 description 3
- 239000002417 nutraceutical Substances 0.000 description 3
- 235000021436 nutraceutical agent Nutrition 0.000 description 3
- 238000006384 oligomerization reaction Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 239000002953 phosphate buffered saline Substances 0.000 description 3
- 230000026731 phosphorylation Effects 0.000 description 3
- 238000006366 phosphorylation reaction Methods 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 239000002244 precipitate Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N squalane Chemical compound CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 3
- 231100000027 toxicology Toxicity 0.000 description 3
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 238000011179 visual inspection Methods 0.000 description 3
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 2
- JBFQOLHAGBKPTP-NZATWWQASA-N (2s)-2-[[(2s)-4-carboxy-2-[[3-carboxy-2-[[(2s)-2,6-diaminohexanoyl]amino]propanoyl]amino]butanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)C(CC(O)=O)NC(=O)[C@@H](N)CCCCN JBFQOLHAGBKPTP-NZATWWQASA-N 0.000 description 2
- WLKSPGHQGFFKGE-UHFFFAOYSA-N 1-chloropropan-2-yl n-(3-chlorophenyl)carbamate Chemical compound ClCC(C)OC(=O)NC1=CC=CC(Cl)=C1 WLKSPGHQGFFKGE-UHFFFAOYSA-N 0.000 description 2
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 2
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 2
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 2
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000201370 Autographa californica nucleopolyhedrovirus Species 0.000 description 2
- 235000004936 Bromus mango Nutrition 0.000 description 2
- 102000055006 Calcitonin Human genes 0.000 description 2
- 108060001064 Calcitonin Proteins 0.000 description 2
- 108010059892 Cellulase Proteins 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 2
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 2
- DIUBVGXMXONJCF-KKUMJFAQSA-N Cys-His-Tyr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DIUBVGXMXONJCF-KKUMJFAQSA-N 0.000 description 2
- RAGIABZNLPZBGS-FXQIFTODSA-N Cys-Pro-Cys Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(O)=O RAGIABZNLPZBGS-FXQIFTODSA-N 0.000 description 2
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 210000001783 ELP Anatomy 0.000 description 2
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 2
- 108010061711 Gliadin Proteins 0.000 description 2
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 2
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 2
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 2
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 2
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 2
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 2
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- 101800000653 Helper component proteinase Proteins 0.000 description 2
- XJFITURPHAKKAI-SRVKXCTJSA-N His-Pro-Gln Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CN=CN1 XJFITURPHAKKAI-SRVKXCTJSA-N 0.000 description 2
- NTYJJOPFIAHURM-UHFFFAOYSA-N Histamine Chemical compound NCCC1=CN=CN1 NTYJJOPFIAHURM-UHFFFAOYSA-N 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- 108090001060 Lipase Proteins 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 2
- 239000007987 MES buffer Substances 0.000 description 2
- 235000014826 Mangifera indica Nutrition 0.000 description 2
- 240000007228 Mangifera indica Species 0.000 description 2
- MVBZBRKNZVJEKK-DTWKUNHWSA-N Met-Gly-Pro Chemical compound CSCC[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N MVBZBRKNZVJEKK-DTWKUNHWSA-N 0.000 description 2
- 102000016943 Muramidase Human genes 0.000 description 2
- 108010014251 Muramidase Proteins 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 2
- 241000207746 Nicotiana benthamiana Species 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- KBCRGXXRYMVDMW-UHFFFAOYSA-N PPPPPPPPPPPPPPPPPPPP Chemical compound PPPPPPPPPPPPPPPPPPPP KBCRGXXRYMVDMW-UHFFFAOYSA-N 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 2
- 108010047620 Phytohemagglutinins Proteins 0.000 description 2
- WPQKSRHDTMRSJM-CIUDSAMLSA-N Pro-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 WPQKSRHDTMRSJM-CIUDSAMLSA-N 0.000 description 2
- OGRYXQOUFHAMPI-DCAQKATOSA-N Pro-Cys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O OGRYXQOUFHAMPI-DCAQKATOSA-N 0.000 description 2
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 2
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 2
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 2
- JUJGNDZIKKQMDJ-IHRRRGAJSA-N Pro-His-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O JUJGNDZIKKQMDJ-IHRRRGAJSA-N 0.000 description 2
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 2
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 2
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 2
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 2
- 240000003768 Solanum lycopersicum Species 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 241000256251 Spodoptera frugiperda Species 0.000 description 2
- 235000009184 Spondias indica Nutrition 0.000 description 2
- 102100029856 Steroidogenic factor 1 Human genes 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 230000005867 T cell response Effects 0.000 description 2
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 241000223259 Trichoderma Species 0.000 description 2
- 241000255985 Trichoplusia Species 0.000 description 2
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 210000000612 antigen-presenting cell Anatomy 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 235000015173 baked goods and baking mixes Nutrition 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 235000008429 bread Nutrition 0.000 description 2
- 235000012813 breadcrumbs Nutrition 0.000 description 2
- 235000012970 cakes Nutrition 0.000 description 2
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 2
- 229960004015 calcitonin Drugs 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 229940106157 cellulase Drugs 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000002071 chiral Raman spectroscopy Methods 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 235000019504 cigarettes Nutrition 0.000 description 2
- 238000001142 circular dichroism spectrum Methods 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 230000009260 cross reactivity Effects 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 235000004879 dioscorea Nutrition 0.000 description 2
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 210000002919 epithelial cell Anatomy 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 235000013312 flour Nutrition 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 239000011539 homogenization buffer Substances 0.000 description 2
- 229960002591 hydroxyproline Drugs 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 238000003364 immunohistochemistry Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000003262 industrial enzyme Substances 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 239000004325 lysozyme Substances 0.000 description 2
- 229960000274 lysozyme Drugs 0.000 description 2
- 235000010335 lysozyme Nutrition 0.000 description 2
- 108010089256 lysyl-aspartyl-glutamyl-leucine Proteins 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 238000001000 micrograph Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 239000004570 mortar (masonry) Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 235000015927 pasta Nutrition 0.000 description 2
- MXHCPCSDRGLRER-UHFFFAOYSA-N pentaglycine Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O MXHCPCSDRGLRER-UHFFFAOYSA-N 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 229940085127 phytase Drugs 0.000 description 2
- 230000001885 phytohemagglutinin Effects 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 239000001103 potassium chloride Substances 0.000 description 2
- 235000011164 potassium chloride Nutrition 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 229910052709 silver Inorganic materials 0.000 description 2
- 239000004332 silver Substances 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- CWERGRDVMFNCDR-UHFFFAOYSA-N thioglycolic acid Chemical compound OC(=O)CS CWERGRDVMFNCDR-UHFFFAOYSA-N 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- CHHHXKFHOYLYRE-UHFFFAOYSA-M 2,4-Hexadienoic acid, potassium salt (1:1), (2E,4E)- Chemical compound [K+].CC=CC=CC([O-])=O CHHHXKFHOYLYRE-UHFFFAOYSA-M 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- JBIJLHTVPXGSAM-UHFFFAOYSA-N 2-naphthylamine Chemical compound C1=CC=CC2=CC(N)=CC=C21 JBIJLHTVPXGSAM-UHFFFAOYSA-N 0.000 description 1
- RSEBUVRVKCANEP-UHFFFAOYSA-N 2-pyrroline Chemical compound C1CC=CN1 RSEBUVRVKCANEP-UHFFFAOYSA-N 0.000 description 1
- UMCMPZBLKLEWAF-BCTGSCMUSA-N 3-[(3-cholamidopropyl)dimethylammonio]propane-1-sulfonate Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCC[N+](C)(C)CCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 UMCMPZBLKLEWAF-BCTGSCMUSA-N 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- WOVKYSAHUYNSMH-RRKCRQDMSA-N 5-bromodeoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 WOVKYSAHUYNSMH-RRKCRQDMSA-N 0.000 description 1
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical class O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 1
- 241001133760 Acoelorraphe Species 0.000 description 1
- 102100036664 Adenosine deaminase Human genes 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 1
- DYJJJCHDHLEFDW-FXQIFTODSA-N Ala-Pro-Cys Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N DYJJJCHDHLEFDW-FXQIFTODSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 239000004382 Amylase Substances 0.000 description 1
- 102000013142 Amylases Human genes 0.000 description 1
- 108010065511 Amylases Proteins 0.000 description 1
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 241000272814 Anser sp. Species 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 101000866319 Arabidopsis thaliana Glucan endo-1,3-beta-glucosidase, acidic isoform Proteins 0.000 description 1
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 1
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 1
- 241001367049 Autographa Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 241000167854 Bourreria succulenta Species 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 101000708016 Caenorhabditis elegans Sentrin-specific protease Proteins 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 102000003846 Carbonic anhydrases Human genes 0.000 description 1
- 108090000209 Carbonic anhydrases Proteins 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- 235000009467 Carica papaya Nutrition 0.000 description 1
- 102000011632 Caseins Human genes 0.000 description 1
- 108010076119 Caseins Proteins 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000251204 Chimaeridae Species 0.000 description 1
- 108010035722 Chloride peroxidase Proteins 0.000 description 1
- 244000241235 Citrullus lanatus Species 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 102100029136 Collagen alpha-1(II) chain Human genes 0.000 description 1
- 235000006481 Colocasia esculenta Nutrition 0.000 description 1
- 244000205754 Colocasia esculenta Species 0.000 description 1
- 240000004270 Colocasia esculenta var. antiquorum Species 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000009849 Cucumis sativus Nutrition 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- YHDXIZKDOIWPBW-WHFBIAKZSA-N Cys-Gln Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O YHDXIZKDOIWPBW-WHFBIAKZSA-N 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- DYDCUQKUCUHJBH-UWTATZPHSA-N D-Cycloserine Chemical compound N[C@@H]1CONC1=O DYDCUQKUCUHJBH-UWTATZPHSA-N 0.000 description 1
- DYDCUQKUCUHJBH-UHFFFAOYSA-N D-Cycloserine Natural products NC1CONC1=O DYDCUQKUCUHJBH-UHFFFAOYSA-N 0.000 description 1
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical group O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 102000000541 Defensins Human genes 0.000 description 1
- 108010002069 Defensins Proteins 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 235000002723 Dioscorea alata Nutrition 0.000 description 1
- 235000007056 Dioscorea composita Nutrition 0.000 description 1
- 235000009723 Dioscorea convolvulacea Nutrition 0.000 description 1
- 235000005362 Dioscorea floribunda Nutrition 0.000 description 1
- 235000004868 Dioscorea macrostachya Nutrition 0.000 description 1
- 235000005361 Dioscorea nummularia Nutrition 0.000 description 1
- 235000005360 Dioscorea spiculiflora Nutrition 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 238000008157 ELISA kit Methods 0.000 description 1
- 208000027534 Emotional disease Diseases 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101001091269 Escherichia coli Hygromycin-B 4-O-kinase Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 208000014770 Foot disease Diseases 0.000 description 1
- 108090000698 Formate Dehydrogenases Proteins 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 101710087459 Gamma-gliadin Proteins 0.000 description 1
- 208000005577 Gastroenteritis Diseases 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- 101100476633 Glycine max PR-10 gene Proteins 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 241000162682 Heterogen Species 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- HBGKOLSGLYMWSW-DCAQKATOSA-N His-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CS)C(=O)O HBGKOLSGLYMWSW-DCAQKATOSA-N 0.000 description 1
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 1
- 101000771163 Homo sapiens Collagen alpha-1(II) chain Proteins 0.000 description 1
- 101500025419 Homo sapiens Epidermal growth factor Proteins 0.000 description 1
- 101000798114 Homo sapiens Lactotransferrin Proteins 0.000 description 1
- 101000878605 Homo sapiens Low affinity immunoglobulin epsilon Fc receptor Proteins 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- 241000701806 Human papillomavirus Species 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- 102000018251 Hypoxanthine Phosphoribosyltransferase Human genes 0.000 description 1
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 235000006350 Ipomoea batatas var. batatas Nutrition 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- 102100038007 Low affinity immunoglobulin epsilon Fc receptor Human genes 0.000 description 1
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 1
- 101001018085 Lysobacter enzymogenes Lysyl endopeptidase Proteins 0.000 description 1
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 108010059896 Manganese peroxidase Proteins 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- MDXAULHWGWETHF-SRVKXCTJSA-N Met-Arg-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCNC(N)=N MDXAULHWGWETHF-SRVKXCTJSA-N 0.000 description 1
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- BACYUWVYYTXETD-UHFFFAOYSA-N N-Lauroylsarcosine Chemical compound CCCCCCCCCCCC(=O)N(C)CC(O)=O BACYUWVYYTXETD-UHFFFAOYSA-N 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 101100426732 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-9 gene Proteins 0.000 description 1
- 101710149086 Nuclease S1 Proteins 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 208000025157 Oral disease Diseases 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- UTOGVBKEQYRZJE-UHFFFAOYSA-N PPPPPPPP Chemical compound PPPPPPPP UTOGVBKEQYRZJE-UHFFFAOYSA-N 0.000 description 1
- JNOJRRIGRCMXLQ-UHFFFAOYSA-N PPPPPPPPP Chemical compound PPPPPPPPP JNOJRRIGRCMXLQ-UHFFFAOYSA-N 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 244000288157 Passiflora edulis Species 0.000 description 1
- 235000000370 Passiflora edulis Nutrition 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 1
- TXKWKTWYTIAZSV-KKUMJFAQSA-N Phe-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N TXKWKTWYTIAZSV-KKUMJFAQSA-N 0.000 description 1
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 1
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000425347 Phyla <beetle> Species 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- ALJGSKMBIUEJOB-FXQIFTODSA-N Pro-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 ALJGSKMBIUEJOB-FXQIFTODSA-N 0.000 description 1
- FKKHDBFNOLCYQM-FXQIFTODSA-N Pro-Cys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O FKKHDBFNOLCYQM-FXQIFTODSA-N 0.000 description 1
- DIZLUAZLNDFDPR-CIUDSAMLSA-N Pro-Cys-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 DIZLUAZLNDFDPR-CIUDSAMLSA-N 0.000 description 1
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 1
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 101710088675 Proline-rich peptide Proteins 0.000 description 1
- 102000007327 Protamines Human genes 0.000 description 1
- 108010007568 Protamines Proteins 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 235000009827 Prunus armeniaca Nutrition 0.000 description 1
- 244000018633 Prunus armeniaca Species 0.000 description 1
- 240000005809 Prunus persica Species 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 241000508269 Psidium Species 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101001072501 Sarocladium strictum Glucooligosaccharide oxidase Proteins 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 101800001978 Ssp dnaB intein Proteins 0.000 description 1
- 101001091268 Streptomyces hygroscopicus Hygromycin-B 7''-O-kinase Proteins 0.000 description 1
- 101710132906 Structural polyprotein Proteins 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 101000606420 Sus scrofa Prophenin-2 Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- 102000036693 Thrombopoietin Human genes 0.000 description 1
- 108010041111 Thrombopoietin Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- CKHQKYHIZCRTAP-SOUVJXGZSA-N Tyr-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CKHQKYHIZCRTAP-SOUVJXGZSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- TVGWMCTYUFBXAP-QTKMDUPCSA-N Val-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N)O TVGWMCTYUFBXAP-QTKMDUPCSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- 241000700647 Variola virus Species 0.000 description 1
- 238000002441 X-ray diffraction Methods 0.000 description 1
- 108700040099 Xylose isomerases Proteins 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 230000002009 allergenic effect Effects 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 108020004166 alternative oxidase Proteins 0.000 description 1
- PNEYBMLMFCGWSK-UHFFFAOYSA-N aluminium oxide Inorganic materials [O-2].[O-2].[O-2].[Al+3].[Al+3] PNEYBMLMFCGWSK-UHFFFAOYSA-N 0.000 description 1
- CEGOLXSVJUTHNZ-UHFFFAOYSA-K aluminium tristearate Chemical compound [Al+3].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O CEGOLXSVJUTHNZ-UHFFFAOYSA-K 0.000 description 1
- 229940063655 aluminum stearate Drugs 0.000 description 1
- 229940126575 aminoglycoside Drugs 0.000 description 1
- APUPEJJSWDHEBO-UHFFFAOYSA-P ammonium molybdate Chemical compound [NH4+].[NH4+].[O-][Mo]([O-])(=O)=O APUPEJJSWDHEBO-UHFFFAOYSA-P 0.000 description 1
- 235000018660 ammonium molybdate Nutrition 0.000 description 1
- 239000011609 ammonium molybdate Substances 0.000 description 1
- 229940010552 ammonium molybdate Drugs 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 235000019418 amylase Nutrition 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000005875 antibody response Effects 0.000 description 1
- 230000030741 antigen processing and presentation Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- XKRFYHLGVUSROY-UHFFFAOYSA-N argon Substances [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 1
- 229910052786 argon Inorganic materials 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 235000008452 baby food Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 210000000013 bile duct Anatomy 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 235000015895 biscuits Nutrition 0.000 description 1
- 238000009954 braiding Methods 0.000 description 1
- 235000015496 breakfast cereal Nutrition 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 210000005056 cell body Anatomy 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 239000008119 colloidal silica Substances 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 235000011950 custard Nutrition 0.000 description 1
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 description 1
- 230000001461 cytolytic effect Effects 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 229940124447 delivery agent Drugs 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 210000004443 dendritic cell Anatomy 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 229940009976 deoxycholate Drugs 0.000 description 1
- KXGVEGMKQFWNSR-LLQZFEROSA-N deoxycholic acid Chemical compound C([C@H]1CC2)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)[C@@H](O)C1 KXGVEGMKQFWNSR-LLQZFEROSA-N 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 235000011850 desserts Nutrition 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 108020001096 dihydrofolate reductase Proteins 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- GXGAKHNRMVGRPK-UHFFFAOYSA-N dimagnesium;dioxido-bis[[oxido(oxo)silyl]oxy]silane Chemical compound [Mg+2].[Mg+2].[O-][Si](=O)O[Si]([O-])([O-])O[Si]([O-])=O GXGAKHNRMVGRPK-UHFFFAOYSA-N 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 235000021186 dishes Nutrition 0.000 description 1
- BNIILDVGGAEEIG-UHFFFAOYSA-L disodium hydrogen phosphate Chemical compound [Na+].[Na+].OP([O-])([O-])=O BNIILDVGGAEEIG-UHFFFAOYSA-L 0.000 description 1
- 229910000397 disodium phosphate Inorganic materials 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 239000000890 drug combination Substances 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 239000003792 electrolyte Substances 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 229960003276 erythromycin Drugs 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- BEFDCLMNVWHSGT-UHFFFAOYSA-N ethenylcyclopentane Chemical compound C=CC1CCCC1 BEFDCLMNVWHSGT-UHFFFAOYSA-N 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000002376 fluorescence recovery after photobleaching Methods 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 239000013568 food allergen Substances 0.000 description 1
- 235000012041 food component Nutrition 0.000 description 1
- 239000005417 food ingredient Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 229930182480 glucuronide Natural products 0.000 description 1
- 150000008134 glucuronides Chemical class 0.000 description 1
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 1
- 125000005456 glyceride group Chemical group 0.000 description 1
- 229960002449 glycine Drugs 0.000 description 1
- 150000002333 glycines Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 235000020268 grain milk Nutrition 0.000 description 1
- 235000013882 gravy Nutrition 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 229960001340 histamine Drugs 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 239000002835 hiv fusion inhibitor Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 102000050459 human LTF Human genes 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000005660 hydrophilic surface Effects 0.000 description 1
- 230000005661 hydrophobic surface Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229940047124 interferons Drugs 0.000 description 1
- 210000004020 intracellular membrane Anatomy 0.000 description 1
- 230000004068 intracellular signaling Effects 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- PVTHJAPFENJVNC-MHRBZPPQSA-N kasugamycin Chemical compound N[C@H]1C[C@H](NC(=N)C(O)=O)[C@@H](C)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@H](O)[C@@H]1O PVTHJAPFENJVNC-MHRBZPPQSA-N 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- IZWSFJTYBVKZNK-UHFFFAOYSA-N lauryl sulfobetaine Chemical compound CCCCCCCCCCCC[N+](C)(C)CCCS([O-])(=O)=O IZWSFJTYBVKZNK-UHFFFAOYSA-N 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 239000006193 liquid solution Substances 0.000 description 1
- 239000006194 liquid suspension Substances 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000001050 lubricating effect Effects 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 239000000391 magnesium silicate Substances 0.000 description 1
- 229940099273 magnesium trisilicate Drugs 0.000 description 1
- 229910000386 magnesium trisilicate Inorganic materials 0.000 description 1
- 235000019793 magnesium trisilicate Nutrition 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 235000013622 meat product Nutrition 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 229920000609 methyl cellulose Polymers 0.000 description 1
- 239000001923 methylcellulose Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 210000002433 mononuclear leukocyte Anatomy 0.000 description 1
- 208000030194 mouth disease Diseases 0.000 description 1
- 239000006870 ms-medium Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- JXTPJDDICSTXJX-UHFFFAOYSA-N n-Triacontane Natural products CCCCCCCCCCCCCCCCCCCCCCCCCCCCCC JXTPJDDICSTXJX-UHFFFAOYSA-N 0.000 description 1
- MHWLWQUZZRMNGJ-UHFFFAOYSA-N nalidixic acid Chemical compound C1=C(C)N=C2N(CC)C=C(C(O)=O)C(=O)C2=C1 MHWLWQUZZRMNGJ-UHFFFAOYSA-N 0.000 description 1
- 229960000210 nalidixic acid Drugs 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 235000012149 noodles Nutrition 0.000 description 1
- 230000031787 nutrient reservoir activity Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 230000000050 nutritive effect Effects 0.000 description 1
- HEGSGKPQLMEBJL-RKQHYHRCSA-N octyl beta-D-glucopyranoside Chemical compound CCCCCCCCO[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HEGSGKPQLMEBJL-RKQHYHRCSA-N 0.000 description 1
- 229940126578 oral vaccine Drugs 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 239000006174 pH buffer Substances 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 235000014594 pastries Nutrition 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000000419 plant extract Substances 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 235000010241 potassium sorbate Nutrition 0.000 description 1
- 239000004302 potassium sorbate Substances 0.000 description 1
- 229940069338 potassium sorbate Drugs 0.000 description 1
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- BDERNNFJNOPAEC-UHFFFAOYSA-N propan-1-ol Chemical compound CCCO BDERNNFJNOPAEC-UHFFFAOYSA-N 0.000 description 1
- 229950008679 protamine sulfate Drugs 0.000 description 1
- 230000004845 protein aggregation Effects 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 230000016434 protein splicing Effects 0.000 description 1
- 230000005588 protonation Effects 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- ZVJHJDDKYZXRJI-UHFFFAOYSA-N pyrroline Natural products C1CC=NC1 ZVJHJDDKYZXRJI-UHFFFAOYSA-N 0.000 description 1
- 230000029610 recognition of host Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 235000014438 salad dressings Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000003118 sandwich ELISA Methods 0.000 description 1
- 108700004121 sarkosyl Proteins 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 235000015067 sauces Nutrition 0.000 description 1
- WTGQALLALWYDJH-AKTDCHNFSA-N scopolamine hydrobromide Chemical compound Br.C1([C@@H](CO)C(=O)OC2C[C@@H]3N([C@@H](C2)[C@H]2[C@@H]3O2)C)=CC=CC=C1 WTGQALLALWYDJH-AKTDCHNFSA-N 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 235000011888 snacks Nutrition 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 239000011537 solubilization buffer Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 235000010199 sorbic acid Nutrition 0.000 description 1
- 239000004334 sorbic acid Substances 0.000 description 1
- 229940075582 sorbic acid Drugs 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 235000014347 soups Nutrition 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 229940032094 squalane Drugs 0.000 description 1
- 229940031439 squalene Drugs 0.000 description 1
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000012134 supernatant fraction Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229940065721 systemic for obstructive airway disease xanthines Drugs 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 229940055835 triptone Drugs 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 239000001993 wax Substances 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
- 238000002424 x-ray crystallography Methods 0.000 description 1
- 235000013618 yogurt Nutrition 0.000 description 1
- 150000003751 zinc Chemical class 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8221—Transit peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8257—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
Abstract
재조합 단백질체를 유도하는 폴리펩티드 서열이 기재된다. 이 서열은 일측 말단 위의 두 시스테인 잔기들 사이에 폴리프롤린 II(PPII) 구조를 포함하고, ER 신호 서열 재조합 단백질체는 많은 양의 재조합 단백질의 간단하고 효율적인 정제를 가능하게 하기 때문에 단백질 생산에 유용하다. 아울러, 예를 들어, 백신에서 재조합 단백질체를 사용하는 다른 방법들도 기재되어 있다.
Description
본 발명은 진핵 세포에서 재조합 단백질체 유사 조립체(RPBLA)의 형성을 유도할 수 있는 펩티드들을 고려한다. 아울러, 재조합 단백질체 유사 조립체(RPBLA)의 유도를 중재하는 서열에 융합되는 이종 폴리펩티드들은 안정적으로 발현되어 숙주계에 축적된다.
수십년 전에, 프롤라민은 곡류의 배젖에서 천연 단백질체(PB)의 형성에 관련된 매우 특별한 저장 단백질로 기재되어 있다((Sherry et al., 1990, Biochem . J. 267:1-12). 그럼에도 불구하고, 오늘날까지, 이러한 유형의 세포기관을 유도하는 기작 및 요구에 관해서는 거의 알려지지 않고 있다.
배젖은 단백질을 조직 및 세포 형태들 이외의 단백질체(PB)으로 정렬시키는 큰 경향을 갖는 것으로 나타나는 특별한 식물 조직이다. 이는 단백질이 프롤라민으로 융합되지 않을 때에도 사실이다. 예를 들어, 쌀잎 세포로부터 분비되는 재조합 피타아제 단백질은 배젖에서 발현시 단백질체(PB) 내에서 유지된다. (Drakakaki et al., 2006, Plant Physiology, 141, 578-586). 유사하게, 인간 시토메갈로바이러스(Wright et al., 2001, Transgenic Research 10: 177-181) 및 리소자임(Yang et al., 2003, Planta 216: 597-603)의 주 당단백질(gB)은 프롤라민에 융합되지 않을 때에도 쌍떡잎 식물 및 외떡잎 식물 배젖에서 단백질체에 축적된다. 흥미롭게도, 리소자임이 비-프롤라민 신호 펩티드에 융합되어 비-프롤라민 촉진제(푸로인돌린 b)의 제어 하에서 발현될 때에도, 쌀 배젖의 단백질체에 축적된다. (Hennegan et al., 2005, Transgenic Reserch 14:583-592). 이들 데이터는 단백질체에서 단백질의 축적은 배젖의 특별하게 된 저장 환경을 요구할 수 있다는 것을 제시한다.
단백질이 배젖 내로 정렬되는 경향의 증가는 KDEL (서열번호 110)-태그가 붙은 재조합 단백질을 이용한 실험에 의해서도 나타난다. KDEL 태그는 소포체(ER)에서 단백질 유지를 돕기 때문에 "ER 유지신호"로서 알려져 있다. 이처럼, 인간 혈청 알부민이 KDEL 태그에 융합될 때, 잎 세포에서 ER 루멘에 국소화된다. 그러나, 배젖에서 발현시, KDEL-태그가 붙은 인간 혈청 알부민은 액포 내 프롤라민 응집체에 침전된다. 아울러, 잎의 소포체에 효율적으로 보유되는 KDEL-태그가 붙은 단일클론 항체는 분비되어 종자에서 단백질 저장 액포에 부분적으로 정렬된다(Petruccelli et al, 2006, Plant Biotechnol J. 4:511-27).
그러므로, 곡물 배젖 세포 내에서 단백질 전달은 소포체(ER)-유래 및 액포 단백질체의 풍부를 포함하는 배젖 특이 환경에 영향을 받는다. 따라서, 배젖에서 단백질체들로 정렬된 단백질은 다른 세포들 또는 조직에서는 거기에 정렬되지 않을 수 있고, 배젖에서 단백질체의 형성을 유도하기에 충분한 서열 및 구조는 다른 세포 또는 조직에서 단백질체의 형성을 위해 필요충분조건이 아닐 수도 있다.
또한, 단백질체의 형성을 유도하기에 충분한 특이 서열 및 구조는 확인되지 않았다. 사실상, 단백질체의 형성에 관련된 모든 단백질을 비교시, 서열, 구조, 또는 물리적 및 화학적 특성들에서 분명한 상동성은 분명하지 않다.
감마 제인(zein)은 옥수수(maize)에서 단백질체의 주요한 구성 성분이다(Ludevid et al., 1984, Plant Mol . Biol . 3, 227-234). 감마 제인의 N-말단 도메인은 프로-X 영역(P-X) 및 ER에서 감마 제인의 정렬(Geli, et al . Plant Cell 6:1911(1994)) 및 단백질체의 형성을 위해 필요한 반복성이 높은 서열 (PPPVHL)8 (서열번호 27) (RD)을 포함한다 (미국 공개출원번호 제2007/0243198호 참조). pH 5인 물에서 서열 (VHLPPP)n(서열번호 28)(n=3, 5, 8)의 합성 펩티드 시리즈의 원편광 이색성 연구는 이들 펩티드가 폴리프롤린 II(PPII) 나선(Rabanal, Biopolymers 33: 1019-28(1993))을 채택하였다는 것을 보여주었다. 감마 제인은 또한 안정한 PB들의 형성을 요구받는 것으로 나타난 여러 시스테인을 포함한다(Pompa, Plant Cell 18: 2608-2621 (2006)).
감마 제인의 RD의 PPII 나선은 두드러진 양친매성 특성을 가진다. 이전의 연구들은 PPII 나선의 양친매성 성질이 안정한 PB들의 형성에 중요하고 양친매성 PPII 나선 (VHLPPP)8 (서열번호 27)의 계면활성제 성질들이 몇 가지 접근법들에서 나타났다는 것을 제시하였다(Kogan et al., 2001, J. Mol . Biol . 312, 907-913003; Kogan et al., 2002, BiolBiophysical Journal . Volume 83. 1194-1204). 예를 들어, 합성 옥타머 펩티드 (VHLPPP)8은 크게는 수용성 상으로부터 떨어져서 배향된 소수성 모이어티와 함께 양친매성 물질의 공기-물 계면으로의 흡착으로 인해 물이 표면 장력을 낮출 수 있었던 것으로 나타났다(Ludevid et al., 1984, Plant Mol . Biol. 3, 227-234). 또한 이 양친매성 펩티드는 대두의 포스파티딜콜린 리포좀과 상호작용하여 합쳐져서 막에 대해 연장된 도메인을 형성하여 안정성과 투과성을 높이는 것으로 나타났다(Kogan et al., 2004, Biopolymers, Vol. 73, 258~268). 막 상에서 (VHLPPP)8 (서열번호 27)의 자발적 양친매성 조립체는 옥수수 단백질체들 내 감마-제인 침적의 기작을 제시한다. 감마-제인 RD의 양친매성 특성을 근거로, 이 단백질은 PB 유도의 기작에서 주요 요소일 수 있는 내부 코팅을 유도하는 ER 막의 내부면과 상호작용한다고 제안되었다(Ludevid et al., 1984, Plant Mol . Biol . 3, 227~234). 이 코팅은 이후 감마 제인의 반복 서열을 양 옆에 둔 시스테인 잔기들을 포함하는 분자 내 디설파이드 교차결합을 통해 공유결합적으로 안정화될 수 있다.
감마-제인 단백질의 특징들 중 일부가 특징화되었을 때, 이전에는 이들 특징들 중 어느 것 또는 특징들의 조합이 단백질체 형성을 위해 적합했던 것으로 이해되지 않았었다. 더욱이, 다른 단백질체 유도 서열은 감마-제인과 구조적 또는 서열 유사성을 거의 또는 전혀 포함하지 않는다. 아래에서 더욱 상세히 기재되듯이, 단백질체를 유도할 수 있는 최소 서열이 확인되었다. 또한, 재조합 단백질체 유사 조립체(RPBLA)들을 형성하는 향상된 능력 및 개선된 특성을 가진 RPBLA들을 형성하는 능력의 향상과 같은 개선된 성질들을 갖는 재조합 단백질체 유도 서열들이 확인되었다.
해결하려는 과제
일 양태에서, 본 발명은 길이가 최소 36개의 아미노산들인 폴리프롤린 II(PPII) 구조를 포함하는 재조합 단백질체 유도 폴리펩티드 서열(PBIS)에 관한 것으로서;
상기 PPII 구조는 N-말단에서 최소 두 시스테인들 사이 및 C-말단에서 최소 두 시스테인들 사이에 위치되고;
상기 PPII 구조 내 단지 10%의 아미노산들은 리신 또는 아르기닌이고;
상기 PPII 구조는 서열 (PPPVHL)6. (서열번호 29)을 포함하지 않는다.
다른 양태에서, 본 발명은 길이가 최소 36개의 아미노산들인 프롤린 풍부 서열을 포함하는 재조합 단백질체 유도 폴리펩티드 서열(PBIS)에 관한 것으로서;
상기 프롤린 풍부 서열은 N-말단에서 최소 두 시스테인들 사이 및 C-말단에서 최소 두 시스테인들 사이에 위치되고;
상기 프롤린 풍부 서열 내 단지 10%의 아미노산들은 리신 또는 아르기닌이고;
상기 프롤린 풍부 서열은 서열 (PPPVHL)6.(서열번호 29)을 포함하지 않는다.
또 다른 양태에서, 본 발명은 본 발명에 따른 재조합 PBIS 및 이종 단백질을 포함하는 융합 단백질에 관한 것이다.
또 다른 양태에서, 본 발명은 본 발명에 따른 재조합 PBIS 또는 본 발명에 따른 융합 단백질을 인코딩하는 서열을 포함하는 핵산 분자 및 본 발명의 핵산을 포함하는 벡터에 관한 것이다.
또 다른 양태에서, 본 발명은 본 발명에 따른 재조합 PBIS 또는 본 발명에 따른 융합 단백질을 포함하는 RPBLA에 관한 것이다. 또 다른 양태에서, 본 발명은 본 발명의 재조합 PBIS, 본 발명에 따른 융합 단백질, 본 발명에 따른 핵산, 본 발명에 따른 벡터 또는 본 발명에 따른 RPBLA를 포함하는 숙주 세포에 관한 것이다.
또 다른 양태에서, 본 발명은 본 발명에 따른 RPBLA를 생산 및 정제하기 위한 방법 및 본 발명에 따른 RPBLA의 일부를 형성하는 융합 단백질을 정제하고 본 발명에 따른 RPBLA의 일부를 형성하는 융합 단백질의 일부를 형성하는 단백질을 정제하기 위한 방법에 관한 것이다.
또 다른 양태에서, 본 발명은 치료적으로 유효한 양의 본 발명의 RPBLA를 포함하는 약제학적 조성물, 면역학적으로 유효한 양의 본 발명의 RPBLA를 포함하는 백신, 및 본 발명에 따른 RPBLA를 포함하는 식품에 관한 것이다.
발명의 효과
도 1. (A) 리포터 형광 단백질에 융합되고 담배잎에서 아그로인필트레이션(agroinfiltration) 에 의해 형질전환된 RX3 펩티드들의 다른 이형들로부터 반복 도메인(RD)의 도식. PPII 나선을 따라 비-프롤린 아미노산의 상대적 위치는 삼각형으로 표시된다. 친수성 측(상부)으로부터 소수성 측(하부)을 분리하는 점선은 양친매성 나선을 가진 이형들에서 보여진다. 와일드 타입 RX3 반복 도메인은 중앙(회색 박스)에 보여진다. 히스티딘 잔기들이 알라닌 또는 류신(각각 RX3(A) 및 RX3(L))으로 치환된 완전 소수성 이종들은 우측에 보여진다. 히스티딘 잔기들이 아르기닌 또는 리신(각각 RX3(R) 및 RX3(K))으로 치환된 양친매성의 양으로 대전된 이형들은 좌측에 보여진다. (B) 항-GFP 항체로 탐색된, RX3-GFP, RX3(R)-GFP, RX3-ECFP, 및 RX3(K)-ECFP를 발현하는 담배 잎 균질현탁액들의 등가량들의 웨스턴 블롯 분석. 흰색 화살표는 융합 단백질을 표시하고, 흑색 화살표는 부분적으로 퇴화된 형광 단백질을 나타낸다. (C) GFP (RX3-GFP)에게 융합된 와일드 타입 RX3 펩티드, 또는 RX3 펩티드의 몇몇 이형들을 발현하는 담배 잎 세포들의 공초점 현미경 영상들로서, 여기서 반복 도메인으로부터 히스티딘 잔기들은 알라닌, 류신, 아르기닌 또는 리신으로 돌연변이되었다(각각 RX3(A)-GFP, RX3(L)-GFP, RX3(R)-GFP 및 RX3(K)-ECFP)). 화살표는 분비된 단백질에 대응하는 형광을 표시한다. 흰 화살촉은 ER 유도 RPBLA들을, 흑색 화살촉은 엽록체들을 표시한다. 막대는 5 마이크로미터에 해당한다.
도 2. (A) 담배 잎에서 발현된 몇몇 융합 단백질(RX3-GFP, RX3(A)-GFP, 및 RX3(L)-GFP)에 대해 항-GFP 항체를 사용하여 웨스턴 블롯에 의해 분석된 단계 밀도 구배 결과들의 사진. (B) 단계별 밀도 구배 후 RX3(A)-GFP의 풍부를 보여주는 쿠마시 블루 염색. 밀도 구배의 다른 분획물들((H) 균질화액, (S) 상청액, (f) 해당 Optiprep™ 쿠션 위 경계면)이 표시되어 있다.
도 3. (A) 저속 원심분리에 의한 RPBLA 회수. 좌측 패널은 담배 잎에서 발현된 RX3-GFP 및 RX3(A)-GFP RPBLA들의 분리 후 SDS-PAGE 실버 염색을 보여준다. 우측 패널은 온순 조건(50mM 붕산염 pH10, 10 mM bME)에서 세척된 RX3-GFP 및 RX3(A)-GFP RPBLA들의 SDS-PAGE 실버 염색을 보여준다. (B) 쿠마시 블루 염색(좌측) 및 웨스턴 블롯(우측, 항 GFP 항체)은 RX3(L)-GFP의 발현에 의해 담배 식물에서 유도된 RPBLA들의 저속 원심분리에 의한 회수를 보여준다 (H0) 맑게 되기 전 균질화액, (H1) 여과에 의해 맑게 된 균질화액, (SN) 원심분리에 의한 RPBLA 회수 후 상청액, (Ws) 세척 단계 상청액, (wPB) 세척 단계후 원심분리에 의해 회수된 RPBLA들, (sPB) wPB로부터 가용화된 융합 단백질, 및 (iPB) 가용화 단계 후 불용 부분. 화살표는 해당 단량체의 융합 단백질들을 나타낸다. 별표는 융합 단백질의 다중결합 형태들을 나타낸다.
도 4. (A)는 도 1에 기재된 것처럼 RX3(A3)으로부터 반복 도메인(RD)의 도식적 표시. (B)는 RX3(A3)-ECFP 발현 벡터로 3일 및 6일 후 침투(dpi) 담배 잎 세포들의 공초점 현미경 영상들. RPBLA는 화살표로 표시된다. 막대는 2 마이크로미터에 해당한다.
도 5. (A) 도 1에 대해 기재된 것처럼 RX3 펩티드들(RX3(E) 및 RX3(D))의 양친매성의 음으로 대전된 이형들로부터 반복 도메인의 도식적 표시. (B)는 RX3-GFP, RX3(E)-GFP, RX3-ECFP, 및 RX3(D)-ECFP를 발현하는 담배 잎들로부터 균질화액의 등가량에 대한 항-GFP 웨스턴 블롯. (C) RX3(E)-GFP(좌측), 및 RX3(D)-ECFP(우측)를 발현하는 담배 잎 세포들의 공초점 현미경 영상. RPBLA는 화살표로 표시된다. 막대는 2 마이크로미터에 해당한다.
도 6. (A) 도 1에 대해 기재된 것처럼 RX3 펩티드들(RX3(T), RX3(N), 및 RX3(Q))의 극성 비대전된 이형들로부터 반복 도메인의 도식적 표시. (B) 3일 및 6일 후 아그로인필트레이션(dpi) ECFP에 융합된 조립체 펩티드들의 발현에 의해 유도된 RPBLA 영상들. 3 및 6 dpi 영상들에 도시된 바(bar)는 각각 5 및 2 마이크로미터에 해당한다.
도 7. (A)는 성인 RX3, PP, 및 PA 조립체 펩티드들의 서열 정렬. 세 펩티드들 간 동일성은 굵게 표시되고, 시스테인 잔기는 회색 박스로 표시된다. SP는 신호 펩티드를 나타낸다. (B)는 PP-ECFP, PA-ECFP, 및 RX3-ECFP를 발현하는 담배 잎들의 균질화액들의 등가량들의 항-GFP 웨스턴 블롯. 화살표는 융합 단백질을 표시한다. (C) RX3-ECFP, PP-ECFP, 및 PA-ECFP를 발현하는 담배 잎 세포들의 공초점 현미경 영상. RPBLA는 화살표로 표시된다.
도 8. (A) ECFP에 융합된 RX3 조립체 펩티드에서 시스테인 잔기들의 위치들을 보여주는 도식. (B) 담배 잎들의 총 단백질 분석을 보여주는 SDS-PAGE/쿠마시 블루 염색(상측 패널) 및 항-GFP 면역블롯(하측 패널): 형질전환되지 않은 담배(레인 1); RX3-ECFP 발현 담배(레인 2); RX3 Cys7 발현 담배(레인 3); RX3 Cys9 발현 담배(레인 4); RX3 Cys64 발현 담배(레인 5); RX3 Cys82 발현 담배(레인 6); RX3 Cys84 발현 담배(레인 7); RX3 Cys92 발현 담배(레인 8); RX3 Cys7-Cys9 발현 담배(레인 9); 및 RX3 Cys82- Cys84- Cys92 발현 담배(레인 10). 화살표는 RX3-ECFP 및 RX3-ECFP Cys 돌연변이체들이 전기영동 밴드를 나타내고, 화살촉은 추가적인 면역활성 밴드를 나타낸다. (C-K) ECFP에 융합된 RX3-Cys 돌연변이체로 형질전환된 상피세포들의 형광 패턴을 보여주는 공초점 영상들. C-H의 바는 10 μm에 해당한다. I-K의 바는 20 μm에 해당한다.
도 9. (A) 성숙한 PP 및 PP2의 서열 정렬. 두 펩티드들 간 동일성은 굵게 표시되고, 시스테인 잔기는 회색 박스로 표시된다. SP는 신호 펩티드를 나타낸다. (B) PP 및 PP2로부터 PPII 나선의 도식 표시. 시스테인 잔기들이 표시되어 있다. (C) PP2-GFP를 발현하는 담배 잎 세포들의 공초점 현미경 영상. 좌측 패널은 우측 패널의 확대도이다.
도 10. (A) RD에서 단위들 수의 점진적 감소를 제공하는 ECFP에 융합된 RX3 펩티드의 버전들의 도식 표시. 단위들은 번호가 매겨진 회색 박스들로 도시되어 있고, 시스테인 잔기들은 별표로 표시되어 있다. SP는 감마 제인으로부터 신호 펩티드를 나타낸다. PX는 프로-X 도메인을 나타낸다. N1 및 N2는 비반복성 서열들을 나타낸다. (B) RX3-, R8(4C)-, R7(4C)-, R6(4C)- 및 R4(4C)-ECFP 융합 단백질(화살표)을 발현하는 담배 잎들로부터 등가량의 균질화액들의 단백질 패턴을 보여주는 쿠마시 블루로 염색된 SDS-PAGE 겔. (C) R8(4C)-, R6(4C)- 및 R4(4C)-ECFP를 발현하는 담배 잎 세포들의 공초점 현미경 영상. 삽입도 내 화살표는 RPBLA를 표시한다. 바는 전체 영상에서 20 마이크로미터에, 그리고 삽입도 내에서 5 마이크로미터에 해당한다.
도 11. (A, B, 및 C) RX3, RX3(A), 및 RX3(E) 펩티드(각각, A, B 및 C)에 융합된 mCherry 형광 단백질을 발현하는 담배 잎 세포들의 공초점 현미경 영상. (A', B', 및 C') RPBLA(화살촉)를 강조하기 위한 A, B 및 C 영상의 고배율 영상. 화살표는 분비된 RX3-mCherry를 보여준다. 막대는 5 마이크로미터에 해당한다.
도 12. (A) RX3-, RX3(E)- 및 RX3(A)-EGF의 발현으로 유도된 RPBLA의 저속 원심분리에 의한 회수를 비교하는 웨스턴 블롯. 맑게 된 균질화액(레인 1), 원심분리에 의한 RPBLA 회수 후 상청액(레인 2), 세척 단계 상청액(레인 3), 및 세척 단계 후 원심분리로 회수된 RPBLA(레인 4)가 도시되어 있다. (B) 온순 조건들에서 인큐베이션 후 가용화된 RX3(E)-EGF(레인 1), RX3(A)-EGF(레인 2), 및 RX3-EGF(레인 3)를 보여주는 웨스턴 블롯. 해당 용융 단백질의 가용화되지 않은 부분은 10’ 동안 16000 x g로 원심분리에 의해 회수되었고, 레인 4, 5, 및 6에 각각 도시되어 있다. (C) PP-, PA-, RX3(E)-, 및 RX3-EGF를 발현하는 담배 잎들로부터 등가량의 균질화액들의 웨스턴 블롯 분석. (D) 저속 원심분리에 의해 분리된 해당 RPBLA(각각 레인 1, 4 및 7)로부터 가용화된 RX3(E)-EGF(레인 2), PP-EGF(레인 5), 및 PA-EGF(레인 8) 융합 단백질을 보여주는 웨스턴 블롯. 나머지 가용화되지 않은 융합 단백질은 레인 3, 6, 및 9에 도시되어 있다.
도 13. (A) 저속 원심분리에 의한 RPBLA 분리에서부터 FXa 소화에 의한 융합 단백질 분절까지 RX3(E)-EGF 다운스트림 과정의 SDS-PAGE 실버 염색: 분자 마커(레인 1); 맑게 되기 전 균질화액(레인 2); 여과에 의해 맑게 된 균질화액(레인 3); 원심분리에 의한 RPBLA 회수 후 상청액(레인 4); 세척 단계 상청액(레인 5, 6); 세척 단계 후 원심분리에 의해 회수된 RPBLA(레인 7); 가용화 단계 후 불용 부분(레인 8); wPB로부터 가용화된 융용 단백질(레인 9); 및 분할된 RX3(E)-EGF 융합 단백질(레인 10). (B) 역 상 FPLC에 의한 EGF 정제의 크로마토그램. 화살표는 30%의 아세토니트릴에 해당하는 EGF 피크를 나타낸다. (C) RF-FPLC 입력(레인 1) 및 순수한 EGF를 함유하고 (B)에서 화살표로 나타낸 피크에 해당하는 두 부분(레인 2 및 3)을 보여주는 쿠마시 블루 염색.
도 14. (A) SDS-PAGE 쿠마시 블루 염색(좌측) 및 웨스턴 블롯(우측)은 분리된 RX3(A)-hGH RPBLA를 보여준다. (B) RX3-hGH 및 RX3(A)-hGH의 가용화 효율을 보여주는 항-hGH 웨스턴 블롯. (H0) 맑게 되기전 균질현탁액; (H1) 여과에 의해 맑게 된 균질현탁액, (SN) 원심분리에 의한 RPBLA 회수 후 상청액; (Ws) 세척 단계 상청액; (wPB) 세척 단계후 원심분리에 의해 회수된 RPBLA들; (sPB) wPB로부터 가용화된 융합 단백질; 및 (iPB) 가용화 단계 후 불용 부분.
도 15. (A 및 B) 단백질체 유도 서열(PBIS), 5 글리신 링커((Gly)5), 분절 부위(CS), 뉴 잉글랜드 바이오랩사의 인테인 MxeGyrA (I), 및 목적 단백질(POI)을 나타내는 융합 단백질들의 도식적 표시. CS는 엔테로키나아제 분절 부위(EK) 및 FXa 분절 부위(FXa)이다. POI는 인간 성장 호르몬(hGH), 상피 성장 인자(EGF), 향상된 시안 형광 단백질(ECFP), 엔테로키나아제 프로테아제(EKp), 크실라나아제(Xyl) 및 그린 형광 단백질(GFP)이다. Zera(Adh) 융합 단백질들은 PPII 나선을 형성하는 부착소(adhesion) 절편으로부터 유래된 다음 PBIS에 기반한 융합 단백질이다: Z(Adh), Z(Adh2), Z(Adh)Px 및 Z(Adh2)Px. Zera(Col) 융합 단백질은 PPII 나선을 형성하는 콜라겐 절편으로부터 유래된 다음 PBIS에 기반한 융합 단백질이다: Z(Col), Z(Col 2), Z(Col)Px 및 Z(Col 2)Px.
도 16. (A) 상측 패널은 RX3ΔCys64,82,84,92-ECFP-KDEL (레인 1), RX3-ECFP (레인 2), 및 SP-ECFP-KDEL (레인3)을 발현하는 담배 잎들이 맑게 되기 전 균질화액으로부터 전체 단백질 중 20 마이크로그램의 쿠마시 블루 염색. 하측 패널은 항-GFP 항체에 의한 동일 균질화액의 웨스턴 블롯. 화살표는 융합 단백질을 나타낸다. (B) 침투 3일 및 7일 후 RX3ΔCys64,82,84,92-ECFP-KDEL을 발현하는 담배 잎들의 공초점 현미경 영상. 흰 막대는 5 마이크로미터에 해당한다. (C) 단계별 밀도 구배에 의한 RX3-ECFP (좌측) 및 RX3ΔCys64,82,84,92-ECFP-KDEL (우측)의 밀도 판단. 회수된 부분들의 등가량들은 쿠마시 블루 염색(상측 패널)과 항-GFP 항체를 사용한 웨스턴 블롯(하측 패널)으로 분석되었다. 레인들은 (1) OptiprepTM 밀도 구배 상에 로딩된 시료, (2) 18% OptiprepTM 쿠션 이상으로부터 회수된 상청액, (3) 18~30% 사이의 부분, (4) 30~34% 사이의 부분, (5) 34~38% 사이의 부분, (6) 38~42% 사이의 부분, (7) 42~46% 사이의 부분, 및 (8) 펠릿으로 회수된 부분을 보여준다.
도 17. (A) Z(Adh) (서열번호 98), Z(Adh)Px (서열번호 94), Z(Col) (서열번호 100), 및 Z(Col)Px (서열번호 96) 조립자 펩티드들의 서열 정렬. 신호 펩티드(모든 경우들에서 27KDa 감마 제인으로부터)는 보이지 않는다. 밑줄 친 아미노산들(Adh - 서열번호 128; Col- 서열번호 129)은 부착소 또는 콜라겐 유전자들로부터 단백질 절편들에 해당한다. 흑색 바는 PPII 구조를 채택한 높은 성향을 가진 절편들을 나타낸다. (B) Z(Adh)Px-GFP, Z(Col)Px-GFP, Z(Adh)-GFP 및 Z(Col)-GFP (각각, 레인 1 내지 4)를 발현하는 담배 잎들의 등가량(총 단백질 중 20 마이크로그램)으로부터 생긴, 맑아지기 전 균질화액들의 쿠마시 블루 염색. 화살표는 융합 단백질을 표시한다. (C) 좌측에서 우측으로, Z(Adh)-GFP, Z(Col)-GFP, Z(Adh)Px-GFP, 및 Z(Col)Px-GFP를 발현하는 담배 잎들의 공초점 현미경 영상. 흰 막대는 5 마이크로미터에 해당한다. (D) 쿠마시 블루 염색에 의해 분석된 1500 xg의 저속 원심분리에 의해 RPBLA 회수의 다운스트림 과정. 맑아지기 전 균질화액(레인 1)은 1500 xg로 원심분리되었고, 상청액(레인 2)은 버려졌다. 3 라운드의 세척 단계(레인 3~5) 후, RPBLA 부분(레인 6)에 해당하는 펠릿이 얻어졌다. Z(Adh)-GFP (D1), Z(Col)-GFP (D2), Z(Adh)Px-GFP (D3) 및 Z(Col)Px-GFP (D4)를 발현하는 담배 잎들의 등가량에 대하여 수행된 과정이 도시되어 있다.
도 18. (A) 성숙 어셈블러 펩티드들의 도식적 표시: (i) RX3 및 (ii) 역위 RX3 (iRX3). 다른 도메인들의 방위: (N)-말단 절편, (RD, 회색) 반복 도메인 및 (PX) 프로-X 도메인은 화살표로 표시된다. 시스테인 잔기들의 위치가 또한 도시되어 있다. (B) RX3-ECFP, ECFP-RX3, iRX3-ECFP 및 ECFP-iRX3를 발현하는 담배 잎 세포들의 공초점 현미경 영상. RPBLA는 화살표로 표시된다. 막대는 5 마이크로미터에 해당한다. (C) RX3-ECFP, ECFP-RX3, iRX3-ECFP 또는 ECFP-iRX3를 발현하는 담배 식물들의 RPLBA 밀도 판단. 균질화액(레인 1)은 다단 Optiprep 밀도 구배의 상단 위에 로딩되었고, 다음 부분들은 80,000xg로 원심분리 후 회수되었다. (레인 2) 상청액, (레인 3) 1,117 g/cm3 초과 상간 쿠션, (레인 4) 1.175 g/cm3 초과 상간 쿠션, (레인 5) 1.21 g/cm3 초과 상간 쿠션, (레인 6) 1.233 g/cm3 초과 상간 쿠션, (레인 7) 1.26 g/cm3 초과 상간 쿠션, 및 (레인 8) 튜브의 하단에서 펠릿. 각 부분의 등가 용적 양들을 항-RX3 항체에 의해 웨스턴 블롯으로 분석하였다.
도 19. (A) CHO 세포들에서 RPBLA로 hGH-iRX3의 축적. 좌측 패널은 CHO 세포들에서 hGH-iRX3 발현에 의해 유도된 RPBLA 밀도의 판단을 보여준다. 균질화액(H)은 다단 수크로오스 밀도 구배로 로딩되었고, 다음 부분들은 80,000xg로 원심분리 후 회수되었다. (S) 상청액, (F27) 27% 초과 상간 수크로오스 쿠션, (F35) 35% 초과 상간 수크로오스 쿠션, (F42) 42% 초과 상간 수크로오스 쿠션, (F56) 56% 초과 상간 수크로오스 쿠션, 및 (P) 튜브의 하단에서 펠릿. 분자 마커들은 좌측에 kDa로 표시되고, hGH-iRX3 융합 단백질의 예상 위치 및 hGH는 우측에 화살촉으로 표시된다. 웨스턴 블롯에서 사용된 항체는 항-hGH에 해당한다. 우측 패널은 포유동물 CHO 세포들에서 hGH-iRX3 융합 단백질의 면역조직화학을 보여준다. 항-hGH 항체로 인큐베이션되었던 hGH-iRX3을 발현하는 CHO 세포들의 공초점 현미경 영상들은 세포내 RPBLA에서 융합 단백질의 축적(화살표)을 보여준다. (B) 포유동물 CHO 세포들에서 EK-RX3 및 DsRED-iRX3 융합 단백질들의 면역조직화학. 좌측 패널은 항체 항-RX3(αR8)로 인큐베이션된 EK-RX3을 발현하는 CHO 세포들의 공초점 현미경 영상들을 보여준다. 우측 패널은 RPBLA들이 DsRED-iRX3고유 형광에 의해 직접 관찰될 수 있다는 것을 보여준다. DsRED-iRX3 융합 단백질을 함유하는 세포내 RPBLA들은 화살표로 표시되어 있다. N은 세포핵에 해당한다. (C) Sf9 곤충 세포들에서 hGH-iRX3의 발현에 의한 RPBLA의 유도. 좌측 패널은 hGH-iRX3을 발현하고 항-hGH 항체로 인큐베이션된 곤충 세포들의 공초점 현미경 영상들을 보여준다. 상측 영상은 백그라운드 라벨링을 보여주는 미감염 Sf9 세포들에 해당한다. 하측 영상은 RPBLA에서 hGH-iRX3 융합 단백질을 발현하는 Sf9 세포(화살표)를 보여준다. 우측 패널은 저속 원심분리에 의한 RPBLA 회수를 보여준다. hGH-I-RX3(레인 1)을 발현하는 Sf9 곤충 세포들의 맑아지기 전 균질화액이 5000Xg로 원심분리되었다. 상청액(레인 2)은 버려졌고 RPBLA(레인 3)를 포함하는 해당 펠릿이 여러 세척 단계(레인 3)에서 얻어졌다. 화살촉은 hGH-I-RX3 융합 단백질의 위치를 나타낸다.
도 2. (A) 담배 잎에서 발현된 몇몇 융합 단백질(RX3-GFP, RX3(A)-GFP, 및 RX3(L)-GFP)에 대해 항-GFP 항체를 사용하여 웨스턴 블롯에 의해 분석된 단계 밀도 구배 결과들의 사진. (B) 단계별 밀도 구배 후 RX3(A)-GFP의 풍부를 보여주는 쿠마시 블루 염색. 밀도 구배의 다른 분획물들((H) 균질화액, (S) 상청액, (f) 해당 Optiprep™ 쿠션 위 경계면)이 표시되어 있다.
도 3. (A) 저속 원심분리에 의한 RPBLA 회수. 좌측 패널은 담배 잎에서 발현된 RX3-GFP 및 RX3(A)-GFP RPBLA들의 분리 후 SDS-PAGE 실버 염색을 보여준다. 우측 패널은 온순 조건(50mM 붕산염 pH10, 10 mM bME)에서 세척된 RX3-GFP 및 RX3(A)-GFP RPBLA들의 SDS-PAGE 실버 염색을 보여준다. (B) 쿠마시 블루 염색(좌측) 및 웨스턴 블롯(우측, 항 GFP 항체)은 RX3(L)-GFP의 발현에 의해 담배 식물에서 유도된 RPBLA들의 저속 원심분리에 의한 회수를 보여준다 (H0) 맑게 되기 전 균질화액, (H1) 여과에 의해 맑게 된 균질화액, (SN) 원심분리에 의한 RPBLA 회수 후 상청액, (Ws) 세척 단계 상청액, (wPB) 세척 단계후 원심분리에 의해 회수된 RPBLA들, (sPB) wPB로부터 가용화된 융합 단백질, 및 (iPB) 가용화 단계 후 불용 부분. 화살표는 해당 단량체의 융합 단백질들을 나타낸다. 별표는 융합 단백질의 다중결합 형태들을 나타낸다.
도 4. (A)는 도 1에 기재된 것처럼 RX3(A3)으로부터 반복 도메인(RD)의 도식적 표시. (B)는 RX3(A3)-ECFP 발현 벡터로 3일 및 6일 후 침투(dpi) 담배 잎 세포들의 공초점 현미경 영상들. RPBLA는 화살표로 표시된다. 막대는 2 마이크로미터에 해당한다.
도 5. (A) 도 1에 대해 기재된 것처럼 RX3 펩티드들(RX3(E) 및 RX3(D))의 양친매성의 음으로 대전된 이형들로부터 반복 도메인의 도식적 표시. (B)는 RX3-GFP, RX3(E)-GFP, RX3-ECFP, 및 RX3(D)-ECFP를 발현하는 담배 잎들로부터 균질화액의 등가량에 대한 항-GFP 웨스턴 블롯. (C) RX3(E)-GFP(좌측), 및 RX3(D)-ECFP(우측)를 발현하는 담배 잎 세포들의 공초점 현미경 영상. RPBLA는 화살표로 표시된다. 막대는 2 마이크로미터에 해당한다.
도 6. (A) 도 1에 대해 기재된 것처럼 RX3 펩티드들(RX3(T), RX3(N), 및 RX3(Q))의 극성 비대전된 이형들로부터 반복 도메인의 도식적 표시. (B) 3일 및 6일 후 아그로인필트레이션(dpi) ECFP에 융합된 조립체 펩티드들의 발현에 의해 유도된 RPBLA 영상들. 3 및 6 dpi 영상들에 도시된 바(bar)는 각각 5 및 2 마이크로미터에 해당한다.
도 7. (A)는 성인 RX3, PP, 및 PA 조립체 펩티드들의 서열 정렬. 세 펩티드들 간 동일성은 굵게 표시되고, 시스테인 잔기는 회색 박스로 표시된다. SP는 신호 펩티드를 나타낸다. (B)는 PP-ECFP, PA-ECFP, 및 RX3-ECFP를 발현하는 담배 잎들의 균질화액들의 등가량들의 항-GFP 웨스턴 블롯. 화살표는 융합 단백질을 표시한다. (C) RX3-ECFP, PP-ECFP, 및 PA-ECFP를 발현하는 담배 잎 세포들의 공초점 현미경 영상. RPBLA는 화살표로 표시된다.
도 8. (A) ECFP에 융합된 RX3 조립체 펩티드에서 시스테인 잔기들의 위치들을 보여주는 도식. (B) 담배 잎들의 총 단백질 분석을 보여주는 SDS-PAGE/쿠마시 블루 염색(상측 패널) 및 항-GFP 면역블롯(하측 패널): 형질전환되지 않은 담배(레인 1); RX3-ECFP 발현 담배(레인 2); RX3 Cys7 발현 담배(레인 3); RX3 Cys9 발현 담배(레인 4); RX3 Cys64 발현 담배(레인 5); RX3 Cys82 발현 담배(레인 6); RX3 Cys84 발현 담배(레인 7); RX3 Cys92 발현 담배(레인 8); RX3 Cys7-Cys9 발현 담배(레인 9); 및 RX3 Cys82- Cys84- Cys92 발현 담배(레인 10). 화살표는 RX3-ECFP 및 RX3-ECFP Cys 돌연변이체들이 전기영동 밴드를 나타내고, 화살촉은 추가적인 면역활성 밴드를 나타낸다. (C-K) ECFP에 융합된 RX3-Cys 돌연변이체로 형질전환된 상피세포들의 형광 패턴을 보여주는 공초점 영상들. C-H의 바는 10 μm에 해당한다. I-K의 바는 20 μm에 해당한다.
도 9. (A) 성숙한 PP 및 PP2의 서열 정렬. 두 펩티드들 간 동일성은 굵게 표시되고, 시스테인 잔기는 회색 박스로 표시된다. SP는 신호 펩티드를 나타낸다. (B) PP 및 PP2로부터 PPII 나선의 도식 표시. 시스테인 잔기들이 표시되어 있다. (C) PP2-GFP를 발현하는 담배 잎 세포들의 공초점 현미경 영상. 좌측 패널은 우측 패널의 확대도이다.
도 10. (A) RD에서 단위들 수의 점진적 감소를 제공하는 ECFP에 융합된 RX3 펩티드의 버전들의 도식 표시. 단위들은 번호가 매겨진 회색 박스들로 도시되어 있고, 시스테인 잔기들은 별표로 표시되어 있다. SP는 감마 제인으로부터 신호 펩티드를 나타낸다. PX는 프로-X 도메인을 나타낸다. N1 및 N2는 비반복성 서열들을 나타낸다. (B) RX3-, R8(4C)-, R7(4C)-, R6(4C)- 및 R4(4C)-ECFP 융합 단백질(화살표)을 발현하는 담배 잎들로부터 등가량의 균질화액들의 단백질 패턴을 보여주는 쿠마시 블루로 염색된 SDS-PAGE 겔. (C) R8(4C)-, R6(4C)- 및 R4(4C)-ECFP를 발현하는 담배 잎 세포들의 공초점 현미경 영상. 삽입도 내 화살표는 RPBLA를 표시한다. 바는 전체 영상에서 20 마이크로미터에, 그리고 삽입도 내에서 5 마이크로미터에 해당한다.
도 11. (A, B, 및 C) RX3, RX3(A), 및 RX3(E) 펩티드(각각, A, B 및 C)에 융합된 mCherry 형광 단백질을 발현하는 담배 잎 세포들의 공초점 현미경 영상. (A', B', 및 C') RPBLA(화살촉)를 강조하기 위한 A, B 및 C 영상의 고배율 영상. 화살표는 분비된 RX3-mCherry를 보여준다. 막대는 5 마이크로미터에 해당한다.
도 12. (A) RX3-, RX3(E)- 및 RX3(A)-EGF의 발현으로 유도된 RPBLA의 저속 원심분리에 의한 회수를 비교하는 웨스턴 블롯. 맑게 된 균질화액(레인 1), 원심분리에 의한 RPBLA 회수 후 상청액(레인 2), 세척 단계 상청액(레인 3), 및 세척 단계 후 원심분리로 회수된 RPBLA(레인 4)가 도시되어 있다. (B) 온순 조건들에서 인큐베이션 후 가용화된 RX3(E)-EGF(레인 1), RX3(A)-EGF(레인 2), 및 RX3-EGF(레인 3)를 보여주는 웨스턴 블롯. 해당 용융 단백질의 가용화되지 않은 부분은 10’ 동안 16000 x g로 원심분리에 의해 회수되었고, 레인 4, 5, 및 6에 각각 도시되어 있다. (C) PP-, PA-, RX3(E)-, 및 RX3-EGF를 발현하는 담배 잎들로부터 등가량의 균질화액들의 웨스턴 블롯 분석. (D) 저속 원심분리에 의해 분리된 해당 RPBLA(각각 레인 1, 4 및 7)로부터 가용화된 RX3(E)-EGF(레인 2), PP-EGF(레인 5), 및 PA-EGF(레인 8) 융합 단백질을 보여주는 웨스턴 블롯. 나머지 가용화되지 않은 융합 단백질은 레인 3, 6, 및 9에 도시되어 있다.
도 13. (A) 저속 원심분리에 의한 RPBLA 분리에서부터 FXa 소화에 의한 융합 단백질 분절까지 RX3(E)-EGF 다운스트림 과정의 SDS-PAGE 실버 염색: 분자 마커(레인 1); 맑게 되기 전 균질화액(레인 2); 여과에 의해 맑게 된 균질화액(레인 3); 원심분리에 의한 RPBLA 회수 후 상청액(레인 4); 세척 단계 상청액(레인 5, 6); 세척 단계 후 원심분리에 의해 회수된 RPBLA(레인 7); 가용화 단계 후 불용 부분(레인 8); wPB로부터 가용화된 융용 단백질(레인 9); 및 분할된 RX3(E)-EGF 융합 단백질(레인 10). (B) 역 상 FPLC에 의한 EGF 정제의 크로마토그램. 화살표는 30%의 아세토니트릴에 해당하는 EGF 피크를 나타낸다. (C) RF-FPLC 입력(레인 1) 및 순수한 EGF를 함유하고 (B)에서 화살표로 나타낸 피크에 해당하는 두 부분(레인 2 및 3)을 보여주는 쿠마시 블루 염색.
도 14. (A) SDS-PAGE 쿠마시 블루 염색(좌측) 및 웨스턴 블롯(우측)은 분리된 RX3(A)-hGH RPBLA를 보여준다. (B) RX3-hGH 및 RX3(A)-hGH의 가용화 효율을 보여주는 항-hGH 웨스턴 블롯. (H0) 맑게 되기전 균질현탁액; (H1) 여과에 의해 맑게 된 균질현탁액, (SN) 원심분리에 의한 RPBLA 회수 후 상청액; (Ws) 세척 단계 상청액; (wPB) 세척 단계후 원심분리에 의해 회수된 RPBLA들; (sPB) wPB로부터 가용화된 융합 단백질; 및 (iPB) 가용화 단계 후 불용 부분.
도 15. (A 및 B) 단백질체 유도 서열(PBIS), 5 글리신 링커((Gly)5), 분절 부위(CS), 뉴 잉글랜드 바이오랩사의 인테인 MxeGyrA (I), 및 목적 단백질(POI)을 나타내는 융합 단백질들의 도식적 표시. CS는 엔테로키나아제 분절 부위(EK) 및 FXa 분절 부위(FXa)이다. POI는 인간 성장 호르몬(hGH), 상피 성장 인자(EGF), 향상된 시안 형광 단백질(ECFP), 엔테로키나아제 프로테아제(EKp), 크실라나아제(Xyl) 및 그린 형광 단백질(GFP)이다. Zera(Adh) 융합 단백질들은 PPII 나선을 형성하는 부착소(adhesion) 절편으로부터 유래된 다음 PBIS에 기반한 융합 단백질이다: Z(Adh), Z(Adh2), Z(Adh)Px 및 Z(Adh2)Px. Zera(Col) 융합 단백질은 PPII 나선을 형성하는 콜라겐 절편으로부터 유래된 다음 PBIS에 기반한 융합 단백질이다: Z(Col), Z(Col 2), Z(Col)Px 및 Z(Col 2)Px.
도 16. (A) 상측 패널은 RX3ΔCys64,82,84,92-ECFP-KDEL (레인 1), RX3-ECFP (레인 2), 및 SP-ECFP-KDEL (레인3)을 발현하는 담배 잎들이 맑게 되기 전 균질화액으로부터 전체 단백질 중 20 마이크로그램의 쿠마시 블루 염색. 하측 패널은 항-GFP 항체에 의한 동일 균질화액의 웨스턴 블롯. 화살표는 융합 단백질을 나타낸다. (B) 침투 3일 및 7일 후 RX3ΔCys64,82,84,92-ECFP-KDEL을 발현하는 담배 잎들의 공초점 현미경 영상. 흰 막대는 5 마이크로미터에 해당한다. (C) 단계별 밀도 구배에 의한 RX3-ECFP (좌측) 및 RX3ΔCys64,82,84,92-ECFP-KDEL (우측)의 밀도 판단. 회수된 부분들의 등가량들은 쿠마시 블루 염색(상측 패널)과 항-GFP 항체를 사용한 웨스턴 블롯(하측 패널)으로 분석되었다. 레인들은 (1) OptiprepTM 밀도 구배 상에 로딩된 시료, (2) 18% OptiprepTM 쿠션 이상으로부터 회수된 상청액, (3) 18~30% 사이의 부분, (4) 30~34% 사이의 부분, (5) 34~38% 사이의 부분, (6) 38~42% 사이의 부분, (7) 42~46% 사이의 부분, 및 (8) 펠릿으로 회수된 부분을 보여준다.
도 17. (A) Z(Adh) (서열번호 98), Z(Adh)Px (서열번호 94), Z(Col) (서열번호 100), 및 Z(Col)Px (서열번호 96) 조립자 펩티드들의 서열 정렬. 신호 펩티드(모든 경우들에서 27KDa 감마 제인으로부터)는 보이지 않는다. 밑줄 친 아미노산들(Adh - 서열번호 128; Col- 서열번호 129)은 부착소 또는 콜라겐 유전자들로부터 단백질 절편들에 해당한다. 흑색 바는 PPII 구조를 채택한 높은 성향을 가진 절편들을 나타낸다. (B) Z(Adh)Px-GFP, Z(Col)Px-GFP, Z(Adh)-GFP 및 Z(Col)-GFP (각각, 레인 1 내지 4)를 발현하는 담배 잎들의 등가량(총 단백질 중 20 마이크로그램)으로부터 생긴, 맑아지기 전 균질화액들의 쿠마시 블루 염색. 화살표는 융합 단백질을 표시한다. (C) 좌측에서 우측으로, Z(Adh)-GFP, Z(Col)-GFP, Z(Adh)Px-GFP, 및 Z(Col)Px-GFP를 발현하는 담배 잎들의 공초점 현미경 영상. 흰 막대는 5 마이크로미터에 해당한다. (D) 쿠마시 블루 염색에 의해 분석된 1500 xg의 저속 원심분리에 의해 RPBLA 회수의 다운스트림 과정. 맑아지기 전 균질화액(레인 1)은 1500 xg로 원심분리되었고, 상청액(레인 2)은 버려졌다. 3 라운드의 세척 단계(레인 3~5) 후, RPBLA 부분(레인 6)에 해당하는 펠릿이 얻어졌다. Z(Adh)-GFP (D1), Z(Col)-GFP (D2), Z(Adh)Px-GFP (D3) 및 Z(Col)Px-GFP (D4)를 발현하는 담배 잎들의 등가량에 대하여 수행된 과정이 도시되어 있다.
도 18. (A) 성숙 어셈블러 펩티드들의 도식적 표시: (i) RX3 및 (ii) 역위 RX3 (iRX3). 다른 도메인들의 방위: (N)-말단 절편, (RD, 회색) 반복 도메인 및 (PX) 프로-X 도메인은 화살표로 표시된다. 시스테인 잔기들의 위치가 또한 도시되어 있다. (B) RX3-ECFP, ECFP-RX3, iRX3-ECFP 및 ECFP-iRX3를 발현하는 담배 잎 세포들의 공초점 현미경 영상. RPBLA는 화살표로 표시된다. 막대는 5 마이크로미터에 해당한다. (C) RX3-ECFP, ECFP-RX3, iRX3-ECFP 또는 ECFP-iRX3를 발현하는 담배 식물들의 RPLBA 밀도 판단. 균질화액(레인 1)은 다단 Optiprep 밀도 구배의 상단 위에 로딩되었고, 다음 부분들은 80,000xg로 원심분리 후 회수되었다. (레인 2) 상청액, (레인 3) 1,117 g/cm3 초과 상간 쿠션, (레인 4) 1.175 g/cm3 초과 상간 쿠션, (레인 5) 1.21 g/cm3 초과 상간 쿠션, (레인 6) 1.233 g/cm3 초과 상간 쿠션, (레인 7) 1.26 g/cm3 초과 상간 쿠션, 및 (레인 8) 튜브의 하단에서 펠릿. 각 부분의 등가 용적 양들을 항-RX3 항체에 의해 웨스턴 블롯으로 분석하였다.
도 19. (A) CHO 세포들에서 RPBLA로 hGH-iRX3의 축적. 좌측 패널은 CHO 세포들에서 hGH-iRX3 발현에 의해 유도된 RPBLA 밀도의 판단을 보여준다. 균질화액(H)은 다단 수크로오스 밀도 구배로 로딩되었고, 다음 부분들은 80,000xg로 원심분리 후 회수되었다. (S) 상청액, (F27) 27% 초과 상간 수크로오스 쿠션, (F35) 35% 초과 상간 수크로오스 쿠션, (F42) 42% 초과 상간 수크로오스 쿠션, (F56) 56% 초과 상간 수크로오스 쿠션, 및 (P) 튜브의 하단에서 펠릿. 분자 마커들은 좌측에 kDa로 표시되고, hGH-iRX3 융합 단백질의 예상 위치 및 hGH는 우측에 화살촉으로 표시된다. 웨스턴 블롯에서 사용된 항체는 항-hGH에 해당한다. 우측 패널은 포유동물 CHO 세포들에서 hGH-iRX3 융합 단백질의 면역조직화학을 보여준다. 항-hGH 항체로 인큐베이션되었던 hGH-iRX3을 발현하는 CHO 세포들의 공초점 현미경 영상들은 세포내 RPBLA에서 융합 단백질의 축적(화살표)을 보여준다. (B) 포유동물 CHO 세포들에서 EK-RX3 및 DsRED-iRX3 융합 단백질들의 면역조직화학. 좌측 패널은 항체 항-RX3(αR8)로 인큐베이션된 EK-RX3을 발현하는 CHO 세포들의 공초점 현미경 영상들을 보여준다. 우측 패널은 RPBLA들이 DsRED-iRX3고유 형광에 의해 직접 관찰될 수 있다는 것을 보여준다. DsRED-iRX3 융합 단백질을 함유하는 세포내 RPBLA들은 화살표로 표시되어 있다. N은 세포핵에 해당한다. (C) Sf9 곤충 세포들에서 hGH-iRX3의 발현에 의한 RPBLA의 유도. 좌측 패널은 hGH-iRX3을 발현하고 항-hGH 항체로 인큐베이션된 곤충 세포들의 공초점 현미경 영상들을 보여준다. 상측 영상은 백그라운드 라벨링을 보여주는 미감염 Sf9 세포들에 해당한다. 하측 영상은 RPBLA에서 hGH-iRX3 융합 단백질을 발현하는 Sf9 세포(화살표)를 보여준다. 우측 패널은 저속 원심분리에 의한 RPBLA 회수를 보여준다. hGH-I-RX3(레인 1)을 발현하는 Sf9 곤충 세포들의 맑아지기 전 균질화액이 5000Xg로 원심분리되었다. 상청액(레인 2)은 버려졌고 RPBLA(레인 3)를 포함하는 해당 펠릿이 여러 세척 단계(레인 3)에서 얻어졌다. 화살촉은 hGH-I-RX3 융합 단백질의 위치를 나타낸다.
다음은 재조합 단백질체 유사 조립체(RPBLA)의 형성을 위해 유용한 재조합 단백질체 유도 서열(PBIS)들의 기재를 제공한다. 재조합 PBIS는 목적 단백질에 융합될 수 있고, 세포들에서 융합 단백질의 발현에 의해 형성된 RPBLA는 많은 양의 목적 단백질을 단순화하고 효율적으로 정제하기 위해 사용될 수 있다. 아울러, RPBLA는 백신접종과 같은 치료학에서 사용될 수 있다.
본원에서 사용된 섹션 주제들은 단지 구조적 목적을 위한 것으로서 기재된 요지를 한정하는 식으로 해석되지 말아야 한다.
I.
정의
달리 표현적으로 정의되지 않으면, 본원에서 사용된 용어들은 이 기술에서 그 용어들의 통상적 의미에 따라 이해될 것이다. 달리 특정되지 않거나 본문에서 나타내지 않으면, 단수형으로 사용되거나 부정관사(“a”, 또는 “an”)가 달린 용어들은 복수 형태를 포함하고, 그 역도 가능하다. 표준 기술 및 절차들이 본 문서를 통하여 제공되는 이 기술의 종래 방법들 및 다양한 일반적 참증(일반적으로 본원에 참조로 결합된 Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed. (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.을 참조)에 따라 일반적으로 수행된다.
"폴리펩티드", "펩티드", 및 "단백질"이란 용어들은 본원에서 임의 길이의 아미노산들의 고분자들을 지칭하기 위해서 상호 교환적으로 사용된다. 고분자는 선형 또는 분지쇄일 수 있고, 변형된 아미노산들을 포함할 수 있으며, 비아미노산들에 의해 차단될 수 있다. 용어들은 천연적으로 변형되었거나 개입, 예를 들어, 이황화물 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 또는 라벨링 성분과의 콘쥬게이션과 같은 임의의 기타 조작 또는 변형에 의해 변형된 아미노산 고분자를 포함한다. 또한, 예를 들어, 이 기술에서 공지된 기타 변형들뿐만 아니라 (예를 들어, 비천연 아미노산 등을 포함하는) 하나 이상의 아미노산 유사체를 포함하는 폴리펩티드가 본 정의 내에 포함된다. 본 발명의 폴리펩티드들은 항체들에 기반하기 때문에, 어떤 실시예들에서, 폴리펩티드들은 단쇄 또는 연관쇄로서 발생할 수 있다고 이해된다.
"융합 폴리펩티드" 또는 "융합 단백질"은 최소 두 개의 폴리펩티드 및 선택적으로 상기 두 개의 폴리펩티드를 하나의 연속적인 폴리펩티드로 작용적으로 연결하는 연결 서열로 구성되는 폴리펩티드이다. 융합 폴리펩티드로 연결된 두 개의 폴리펩티드는 전형적으로는 두 개의 독립적 소스로부터 유래되므로, 융합 폴리펩티드는 정상적으로는 천연적으로 연결되는 것으로 발견되지 않는 두 개의 연결된 폴리펩티드를 포함한다. 두 개의 폴리펩티드는 펩티드 결합에 의해 직접 작용적으로 부착될 수 있고, 혹은 본원에서 설명되거나 그렇지 않으면 이 기술에서 알려져 있는 링커를 통해 간접적으로 연결될 수 있다.
"핵산", "폴리뉴클레오티드", 또는 "핵산 분자"는 뉴클레오티드로 불리는 공유결합된 아단위(subunit)들로 구성되는 고분자 화합물이다. 핵산은 단일 가닥 또는 이중 가닥일 수 있는 폴리리보핵산(RNA) 및 폴리디옥시리보핵산(DNA)을 포함한다. DNA는 cDNA, 유전체 DNA, 합성 DNA, 및 반-합성 DNA를 포함한다.
본문에서 둘 이상의 핵산 또는 폴리펩티드들의 "동일한(identical)" 또는 백분율 "동일성(identity)"이란 용어는 동일하거나, 서열 동일성의 일부로서 임의의 보존적 아미노산 치환을 고려하지 않고서, 최대 일치 (필요하면, 갭을 도입)를 위해 비교 및 정렬시 동일한 뉴클레오티드 또는 아미노산 잔기들의 특정 백분율을 갖는 둘 이상의 서열 또는 아서열을 말한다. 백분율 동일성은 서열 비교 소프트웨어 또는 알고리즘을 사용하거나 시각적 검사에 의해 측정될 수 있다. 아미노산 또는 뉴클레오티드 서열들의 정렬을 얻기 위해 사용될 수 있는 다양한 알고리즘 및 소프트웨어가 이 기술에 공지되어 있다. 서열 정렬 알고리즘의 비제한적 한 가지 예는 Karlin 등, 1990, Proc. Natl. Acad. Sci., 87:2264-2268에 기재되어 있고, Karlin 등, 1993, Proc. Natl. Acad. Sci., 90:5873-5877에서 변형되었으며, NBLAST 및 XBLAST 프로그램 (Altschul et al., 1991, Nucleic Acids Res., 25:3389-3402)에 통합된 알고리즘이다. 어떤 실시예에서, Gapped BLAST가 Altschul et al., 1997, Nucleic Acids Res. 25:3389-3402에 기재된 것처럼 사용될 수 있다. BLAST-2, WU-BLAST-2 (Altschul et al., 1996, Methods in Enzymology, 266:460-480), ALIGN, ALIGN-2 (Genentech, South San Francisco, California) 또는 Megalign(DNASTAR)은 서열들을 정렬하기 위해 사용될 수 있는 추가적인 공용 소프트웨어 프로그램이다. 어떤 실시예에서, 두 개의 뉴클레오티드 서열들 간 백분율 동일성은 GCG 소프트웨어에서 GAP 프로그램을 사용하여 결정된다(예를 들어, NWSgapdna.CMP 매트릭스, 40, 50, 60, 70, 또는 90의 갭 중량, 및 1, 2, 3, 4, 5, 또는 6의 길이 중량). 어떤 대안적 실시예에서, Needleman 및 Wunsch (J. Mol. Biol. 48:444-453 (1970))의 알고리즘을 포함하는 GCG 소프트웨어 패키지에서 GAP 프로그램은 (예를 들어, Blossum 62 matrix 또는 PAM250 matrix 중 어느 하나, 및 16, 14, 12, 10, 8, 6, 또는 4의 갭 중량 및 1, 2, 3, 4, 5의 길이 중량을 이용하여) 두 아미노산 서열들 간 백분율 동일성을 판단하기 위해 사용될 수 있다. 대안적으로, 어떤 실시예에서, 뉴클레오티드 또는 아미노산 서열들 간 백분율 동일성은 Myers 및 Miller (CABIOS, 4:11-17 (1989))의 알고리즘을 사용하여 판단된다. 예를 들어, 백분율 동일성은 ALIGN 프로그램(버전 2.0) 및 잔기 테이블, 12의 갭 길이 페널티, 및 4의 갭 페널티를 가진 PAM120을 이용하여 판단될 수 있다. 특별한 정렬 소프트웨어에 의한 최대 정렬을 위한 적절한 패러미터들은 이 기술에서 통상의 지식을 가진 자에 의해 판단될 수 있다. 어떤 실시예에서, 정렬 소프트웨어의 디폴트 패러미터들이 사용된다. 어떤 실시예에서, 제2 아미노산 서열에 대한 제1 아미노산 서열의 백분율 동일성 "X"는 100 x (Y/Z)로서 계산되고, 여기서 Y는 (시각적 검사 또는 특별한 서열 정렬 프로그램에 의한 정렬시) 제1, 제2 서열들의 정렬에서 동일 대응으로 기록된 아미노산 잔기들의 수이고, Z는 제2 서열에서 잔기들의 총 수이다. 제1 서열의 길이가 제2 서열보다 길면, 제2 서열에 대한 제1 서열의 백분율 동일성은 제1 서열에 대한 제2 서열의 백분율 동일성보다 길 것이다.
비제한적 예로서, 임의의 특별한 폴리펩티드가 기준 서열에 대해 소정의 백분율 서열 동일성(예를 들어, 최소 80% 동일, 최소 85% 동일, 최소 90% 동일, 및 일부 실시예에서 최소 95%, 96%, 97%, 98%, 또는 99% 동일)을 가지는, 어떤 실시예에서, Bestfit 프로그램(Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, 575 Science Drive, Madison, WI 53711)을 사용하여 판단될 수 있다. Bestfit은 Smith and Waterman의 Advances in Applied Mathematics 2: 482-489 (1981)의 국소 상동성 알고리즘을 사용하여, 두 서열들 간 최적의 상동성 단편을 찾아낸다. 특별한 서열이, 본 발명에 따른 기준 서열과, 예를 들어, 95% 동일한 지를 판단하기 위해 Bestfit 또는 임의의 기타 서열 정렬 프로그램을 사용할 때, 패러미터들은 동일성의 백분율이 기준 뉴클레오티드 서열의 전체 길이에 대해 계산되도록 그리고 기준 서열에서 뉴클레오티드들의 총 수의 5%에 이르는 상동성 갭이 허용되도록 설정된다.
일부 실시예에서, 본 발명의 두 핵산들 또는 폴리펩티드들은, 최대 일치를 위해 비교 및 정렬되어, 서열 비교 알고리즘을 사용하여 또는 시각적 조사에 의해 측정될 때, 이들이 최소 70%, 최소 75%, 최소 80%, 최소 85%, 최소 90%를, 그리고 일부 실시예에서 최소 95%, 96%, 97%, 98%, 99% 뉴클레오티드 또는 아미노산 잔기 동일성을 가진다는 점에서 실질적으로 동일하다. 동일성은 최소 약 10, 약 20, 약 40~60개 길이인 잔기들 또는 그 사이의 임의 필수 값인 서열들의 영역에 대해 존재할 수 있고, 60~80 잔기들보다 더 긴, 예를 들어 90~100 잔기들의 영역에 대해 존재할 수 있고, 일부 실시예에서, 서열들은, 예를 들어 뉴클레오티드 서열의 코딩 영역과 같이, 서열들이 비교되는 전체 길이에 대해 실질적으로 동일하다.
"벡터"라는 용어는 숙주 세포에서 관심이 있는 하나 이상의 유전자(들) 또는 서열(들)을 전달, 및 선택적으로 발현할 수 있는 컨스트럭트를 의미한다. 벡터의 예는, 이들에 한정되지는 않지만, 바이러스 벡터, 네이키드 DNA 또는 RNA 발현 벡터, 플라스미드, 코스미드 또는 파지 벡터, 양이온 축합제와 관련된 DNA 또는 RNA 발현 벡터, 리포좀 내에 캡슐화된 DNA 또는 RNA 발현 벡터, 및 프로듀서 세포와 같은 소정 진핵세포가 있다. 벡터는 안정할 수 있고 자기 복제가능하다. "발현 벡터"는 사용 가능하게 관련된 유전자들의 발현을 안내할 수 있는 벡터이다.
"프로모터"는 코딩 서열 또는 기능성 RNA의 발현을 조절할 수 있는 DNA 절편을 말한다. 일반적으로, 코딩 영역은 프로모터에 대해 3'에 위치된다. 프로모터들은 전부 재래종 유전자로부터 유래될 수 있고, 혹은 자연에서 발견되는 다른 프로모터들로부터 유래된 다른 요소들로 구성되거나, 심지어 합성 DNA 절편들로 구성될 수 있다. 다른 프로모터들은 유전자의 발현을 다른 조직 또는 세포 타입으로, 혹은 다른 발전 단계로, 또는 다른 환경 또는 생리학적 조건들에 대한 반응으로 안내할 수 있다는 것을 이해한다. 대부분의 세포 유형들에서 대부분의 시간에 유전자가 발현되도록 하는 프로모터는 공통적으로 "항시성 프로모터(constitutive promoter)"라 부른다. 대부분의 경우, 조절 순서의 정확한 경계는 완전히 정의되지 않았기 때문에, 다른 길이이 DNA 절편들은 동일한 프로모터 활성을 가질 수도 있다고 추가로 인식된다. 프로모터는 일반적으로 전사 시작 부위에 의해 그의 3' 말단에 결속되고 업스트림(5' 방향)로 연장되어 최소 수의 염기들 또는 배경을 넘어서 검출가능한 레벨에서 전사를 시작하기 위해 필요한 요소들을 포함한다. 프로모터 내에서 RNA 폴리머라제의 결속에 대한 책임이 있는 단백질 결합 도메인(공통서열)뿐만 아니라 전사 시작 부위(편리하게는 예를 들어 뉴클레아제 S1과 맵핑에 의해 정의됨)가 발견될 것이다.
본원에서 사용된 것처럼, "이종(heterologous)의"라는 용어는 내생 소스 이외의 소스로부터 유래된 벡터, 플라스미드 또는 숙주 세포의 요소를 말한다. 그러므로, 예를 들어, 이종 서열은 동일 숙주로부터, 숙주 세포의 다른 종으로부터, 또는 다른 분류 군(예를 들어, 계, 문, 강, 목, 과, 속 또는 종, 또는 이들 분류들 중 하나 이내의 아군)의 유기체로부터 다른 유전자 또는 플라스미드로부터 유래된 서열일 수 있다. "이종의"라는 용어는 또한 본원에서 "외생의(exogenous)"라는 용어와 유사하게 사용된다.
DNA 또는 RNA "코딩 영역"은 적절한 조절 서열들의 제어 하에 놓여 있을 때 생체 외 또는 생체 내 세포의 폴리펩티드로 전사되고/거나 번역되는 DNA 또는 RNA 분자이다. "적합한 조절 영역"은 코딩 영역 내 코딩 영역의 업스트림(5' 비-코딩 서열) 또는 다운스트림(3' 비-코딩 서열)에 위치되고, 전사, RNA 가공 또는 안정화, 또는 관련 코딩 영역의 번역에 영향을 미치는 핵산 영역을 말한다. 조절 영역은 프로모터, 번역 리더 서열, RNA 가공 부위, 효과기 결합 부위 및 줄기-루프 구조를 포함할 수 있다. 코딩 영역의 경계는 5’ (아미노) 말단에서 시작 코돈 및 3' (카복실) 말단에서 번역 중단 코돈에 의해 결정된다. 코딩 영역은, 이에 한정되지는 않지만, 원핵 영역, mRNA로부터 cDNA, 게놈 DNA 분자, 합성 DNA 분자, 또는 RNA 분자들을 포함할 수 있다. 코딩 영역이 진핵 세포 내에서 발현을 위해 의도되면, 폴리아데닐화 신호 및 전사 종료 서열은 보통 코딩 영역에 대해 3'에 위치될 것이다.
"오픈 리딩 프레임(Open reading frame)"은 약어로 ORF이고, 번역 시작 신호 또는 시작 코돈, 예를 들어 ATG 또는 AUG, 및 종료 코돈을 포함하며, 잠재적으로 폴리펩티드 서열로 번역될 수 있는 DNA, cDNA, 또는 RNA 중 하나인 핵산의 길이를 의미한다.
코딩 영역은, RNA 폴리머라아제가 코딩 영역을 mRNA (이는 이후 (코딩 영역이 인트론들을 포함하면) 트랜스-RNA로 끝이 붙어서 코딩 영역에 의해 인코딩된 단백질로 번역됨)로 전사할 때, 세포 내 전사 및 번역 조절 요소들의 "조절 하"에 있다.
"전사 및 번역 조절 영역"은 프로모터, 인핸서(enhancer), 종결신호 등과 같이, 숙주 세포에서 코딩 영역의 발현을 가능하게 하는 DNA 조절 영역이다. 진핵 세포들에서, 폴리아데닐화 신호는 조절 영역이다.
"작동가능하게 관련된(operably associated)" 및 "작동가능하게 연결된(operably linked)"은 두 개의 분자들 중 하나의 기능이 다른 것에 영향을 받게 되는 두 분자들의 관련성을 말한다. 예를 들어, 프로모터가 코딩 영역의 발현에 영향을 미칠 수 있을 때(즉, 코딩 영역이 프로모터의 전사조절 하에 있을 때), 프로모터는 코딩 영역과 작동가능하게 관련된다. 코딩 영역은 센서 방위 또는 안티센서 방위에서 조절 영역에 작동가능하게 관련될 수 있다. 직접(예를 들어, 융합 단백질) 부착되는지 아니면 간접(예를 들어, 링커를 경유) 부착되던지, 두 개의 분자들은 "작동가능하게 연결"되어 있다.
본원에서 사용된 것처럼, "발현"이란 용어는 핵산 템플릿으로부터 RNA(예: mRNA)의 전사 및/또는 mRNA의 폴리펩티드로의 번역을 말한다. "발현의 증가"라는 용어는 증가된 mRAN 생산의 레벨로 그리고/또는 폴리펩티드 발현의 레벨로 유전자 발현의 변화를 포함하도록 한 것으로서, 유전자 생성물 또는 단백질의 양의 증가로 이어진다. 일부 예에서, "발현의 증가"는 "과발현" 또는 "과발현된"이라는 용어와 상호 교환적으로 사용된다.
"선택가능한 마커"는 그의 발현이 검출가능한 표현형을 생성하고 선택가능한 마커를 갖는 플라스미드를 포함하는 숙주 세포들의 검출을 쉽게 하는 유전자이다. 선택가능한 마커들의 비제한적 예들은 약물 저항성 유전자 및 영양성 마커들을 포함한다. 예를 들어, 선택가능한 마커는 암피실린, 카나마이신, 에리트로마이신, 클로람페니콜, 젠타마이신, 카수가마이신, 리팜피신, 스펙티노마이신, D-시클로세린, 날리딕스산, 스트렙토마이신, 또는 테트라시클린으로 구성되는 군으로부터 선택된 항생체에 대한 저항성을 부여하는 유전자일 수 있다. 선택 마커의 기타 비제한적 예들은 아데노신 데아미나아제, 아미노글리코시드, 포스포트란스페라아제, 디하이드로폴레이트 리덕타아제, 하이그로마이신-B-포스포트란스페라아제, 티미딘 키나아제, 및 크산틴-구아닌 포스포리보실트란스페라아제를 포함한다. 단일 플라스미드는 하나 이상의 선택가능한 마커를 포함할 수 있다.
본원에서 사용된 것처럼, "처치하다(treat)" 또는 "처치(treatment)"라는 용어는 치료적 처치 및 예방적 조치들을 말하고, 여기서 목적은 암의 생성 및 전파와 같은 원치않는 생리학적 변화 또는 장애를 예방 또는 늦추기(경감하기) 위한 것이다. 이익이 되거나 원하는 임상 결과는, 이에 한정되지는 않지만, 검출 가능하든 검출 불가능하든 징후의 완화, 질병 정도의 감소, 질병의 안정된 상태(즉, 악화되지 않음), 질병 진행의 지연 또는 감속, 질병 상태의 개선 또는 완화, 및 (부분적이든 전체적이든) 차도를 포함한다. "처치"는 또한 처치를 받지 않았을 때의 예상 생존에 비해 더 긴 생존을 의미할 수 있다. 처치가 필요한 사람들은 병적 상태 또는 장애를 갖기 쉬운 사람들 또는 병적상태 또는 장애가 예방될 사람들뿐만 아니라 이미 병적상태 또는 장애를 가진 사람들을 포함한다.
"대상(subject)" 또는 "개인(individual)" 또는 "동물" 또는 "환자" 또는 "포유류"는 임의 대상, 특히 진단, 예후, 또는 치료가 요구되는 포유류 대상을 의미한다. 포유류 대상들은 인간, 개, 고양이, 기니 피그, 토끼, 쥐, 마우스, 말, 소, 젖소 등과 같은 가축, 농경용 동물, 및 동물원, 스포츠 또는 애완 동물을 포함한다.
II
.
재조합 단백질체 유도 서열(
PBIS
)
단백질체 유도 서열(PBIS)은 배젖 조직 이외로부터의 세포에서 단백질체 또는 RPBLA의 형성을 중재할 수 있는 폴리펩티드 서열로서, 이는 아래에 더욱 상세히 기재되어 있다. RPBLA의 형성을 중재하는 후보자 PBIS의 능력은 (i) 본 발명의 실시예 1에 기재된 것처럼, 식물 세포에서 후보자 PBIS의 융합 단백질 및 형광 단백질을 발현함에 의한 형광 집합체의 검출; (ii) 본 발명의 실시예 2에 기재된 것처럼, 밀도 구배에서 후보자 PBIS를 발현하는 식물 추출물의 분할에 의해 약 1.175 내지 약 1.194의 밀도를 갖는 집합체의 검출; (iii) 본 발명의 실시예 3에 기재된 것처럼, 저속 원심분리(전형적으로 4°C에서 30분간 10,000 x g) 후 침전물에서 웨스턴 블롯에 의한 후보자 PBIS의 확인과 같이, 통상의 지식을 가진 자에게 이용가능한 기술을 이용하여 결정될 수 있다.
천연 발생 PBIS는 옥수수 단백질 감마-제인에서 확인되었고 미국특허 제7,575,898호, 미국 공개출원번호 제2006/0121573호, 미국 공개출원번호 제2006/0123509, 및 미국 공개출원번호 제2007/0243198호에 상세히 기재되어 있으며, 이들 각각은 전체가 참조로서 포함된다.
놀랍게도, 개선된 성질을 갖는 재조합 단백질체 유사 조립체(RPBLA)의 형성을 중재하는 재조합 PBIS는 확인되었고 본원에 기재되어 있다. 일부 실시예에서, 재조합 PBIS는 폴리프롤린 II(PPII) 구조를 포함한다. 일부 실시예에서, 재조합 PBIS는 프롤린 풍부 서열을 포함한다.
제1 양태에서, 본 발명은 길이가 최소 36개의 아미노산들인 폴리프롤린 II(PPII) 구조를 포함하는 재조합 단백질체 유도 폴리펩티드 서열(PBIS)에 관한 것으로서;
상기 PPII 구조는 N-말단에서 최소 두 시스테인들 사이 및 C-말단에서 최소 두 시스테인들 사이에 위치되고;
상기 PPII 구조 내 단지 10%의 아미노산들은 리신 또는 아르기닌이고;
상기 PPII 구조는 서열 (PPPVHL)6. (서열번호 1)을 포함하지 않는다.
바람직한 실시예에서, PPII 구조는 WO2004003207에 기재된 바와 같이 P4 서열로 구성되지 않고 서열 QPPPPVHLPPPPCHYPTQPPRPQPHPQPHP (서열번호 130)을 가진다.
바람직한 실시예에서, PPII 구조는 서열 (PPPVHL)6PPPVHVPPPVHL (서열번호 2)로 구성되지 않거나, 서열 (PPPVHL)6PPPVHVPPPVHLPPPPCH (서열번호 3)을 포함하지 않는다.
바람직한 실시예에서, PPII 구조는 최소 37, 최소 38, 최소 39 또는 최소 40개의 아미노산들을 갖는다. 다른 실시예에서, PPII 구조는 시스테인 잔기들을 포함하지 않는다. 또 다른 실시예에서, PPII 구조는 단지 10%의 히스티딘 잔기들을 포함한다.
제2 양태에서, 본 발명은 길이가 최소 36개의 아미노산들인 프롤린 풍부 서열을 포함하는 재조합 단백질체 유도 폴리펩티드 서열(PBIS)에 관한 것으로서;
상기 프롤린 풍부 서열은 N-말단에서 최소 두 시스테인들 사이 및 C-말단에서 최소 두 시스테인들 사이에 위치되고;
상기 프롤린 풍부 서열에서 단지 10%의 아미노산들은 리신 또는 아르기닌이고, 상기 프롤린 풍부 서열은 서열 (PPPVHL)6 (서열번호 1)을 포함하지 않는다.
바람직한 실시예에서, 상기 프롤린 풍부 서열은 WO2004003207에 기재된 바와 같이 P4 서열의 PBIS로 구성되지 않고 서열 QPPPPVHLPPPPCHYPTQPPRPQPHPQPHP (서열번호 130)을 가진다.
바람직한 실시예에서, 상기 프롤린 풍부 영역은 서열 (PPPVHL)6PPPVHVPPPVHL (서열번호 2)를 포함하지 않거나, 서열 (PPPVHL)6PPPVHVPPPVHLPPPPCH (서열번호 3)을 포함하지 않는다.
바람직한 실시예에서, 상기 프롤린 풍부 서열은 최소 37, 최소 38, 최소 39 또는 최소 40개의 아미노산들을 갖는다. 또 다른 바람직한 실시예에서, 프롤린 풍부 영역은 시스테인 잔기들을 포함하지 않는다. 또 다른 실시예에서, 상기 프롤린 풍부 영역은 단지 10%의 히스티딘 잔기들을 포함한다.
혹은 WO2004003207에 기재된 바와 같이 P4 서열로 구성되지 않고 서열 QPPPPVHLPPPPCHYPTQPPRPQPHPQPHP (서열번호 130)을 가진다.
일부 실시예에서, 상기 재조합 PBIS는 N 말단 상 최소 두 개의 시스테인 및 C 말단 상 최소 두 개의 시스테인 사이에 PPII 구조를 포함하고, 상기 PPII 구조 및 상기 두 개의 C-말단 시스테인 사이에 추가 시스테인 및 프롤린 풍부 서열을 더 포함한다.
일부 실시예에서, 상기 재조합 PBIS는 N 말단 상 최소 두 개의 시스테인 및 C 말단 상 최소 두 개의 시스테인 사이에 제1 프롤린 풍부 서열을 포함하고, 상기 제1 프롤린 풍부 서열 및 상기 두 개의 C-말단 시스테인 사이에 추가 시스테인 및 제2 프롤린 풍부 서열을 더 포함한다.
일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열에서 아미노산들 중 단지 약 10%가 리신 또는 아르기닌이다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열 내 아미노산의 약 9%, 약 8%, 약 7%, 약 6%, 약 5%, 약 4%, 약 3%, 약 2% 또는 약 1%만이 리신 또는 아르기닌이다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 리신을 함유하지 않는다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 아르기닌을 함유하지 않는다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 리신 또는 아르기닌을 함유하지 않는다.
일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열에서 아미노산들 중 단지 약 15%가 히스티딘이다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열 내 아미노산의 약 14%, 약 13%, 약 12%, 약 11%, 약 10%, 약 9%, 약 8%, 약 7%, 약 6%, 약 5%, 약 4%, 약 3%, 약 2% 또는 약 1%만이 히스티딘이다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 히스티딘을 함유하지 않는다.
일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 서열 (PPPVHL)6PPPVHVPPPVHL (서열번호 2)을 포함하지 않는다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 서열 (PPPVHL)6PPPVHVPPPPVHLPCH (서열번호 3)을 포함하지 않는다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 서열 PPPVHL (서열번호 4)을 포함하지 않는다.
일부 실시예에서, 상기 재조합 PBIS는 특별한 최소 농도로 발현시 RPBLA의 형성을 중재할 수 있다. 이처럼, 일부 실시예에서, 상기 재조합 PBIS는 약 0.5 그램/kg의 담배 잎 생중량에서 발현시 RPBLA의 형성을 중재할 수 있다.
PBIS로 작용하는 재조합 서열의 능력은 본원에 기재된 방법 또는 이 기술에 공지된 기타 방법에 따라 검사될 수 있다.
III
.
폴리프롤린
II
구조 및 프롤린 풍부 서열
위에서 기재된 것처럼, 본원에서 사용된 재조합 PBIS는 폴리프롤린 타입 II (PPII) 구조를 포함할 수 있다.
본원에서 사용된 바와 같이, “폴리프롤린 II" 또는 "PPII"라는 용어는 나선형 2차 단백질 구조의 한 유형이다. 예시적인 PPII 구조의 특별한 특징들은, 예를 들어, Eisenberg 등, J. Mol. Biol. 179: 125-142 (1984), Bicudo 등, (2008, Biopolymers, 89:175-178) Fernandez-Carneado, J. Mol. Biol. 372: 708-22 (2004); Bochicchio and Tamburro, Chirality 14:782-92 (2002); Knighton 등. Science 253: 414-420 (1991); 및 Caldwell 등. Biopolymers 10:1891-1904 (1984)에 기재되어 있고, 이들 각각은 전체내용이 본원에 참조로 포함되어 있다.
PPII 나선은 2차 단백질 구조이다. 이는 전체 형상이 삼각 프리즈을 닮은 좌선성 나선 구조이다. 이는 회전당 9.3 Å의 나선 피치, 회전당 3 잔기, 및 각각 -75° 및 145°를 중심으로 Φ각 및 ψ각을 갖고서 꽤 연장될 수 있다.
PPII 구조는 문헌에 기재되어 있다(예를 들어, 전체가 본원에 참조로 포함되어 있는 Eisenberg D, et al. J. Mol. Biol. 179:125-142 (1984) 참조). 프롤린 잔기는 PPII 나선에서 매우 선호된다. 글리신 및 티로신은 일반적으로 선호되지 않지만, 콜라겐과 같은 일부 PPII 구조에서 발견된다. 감마 제인의 히스티딘이 Ala, Glu, 및 Lys로 치환된 반복 서열의 합성 펩티드의 배좌해석은 이들 펩티드 모두가 PPII 타입 구조를 채택하였다는 것을 나타낸다. 그러므로, PPII 구조는 대전된 아미노산(Lys 또는 Glu) 및 대전되거나 대전되지 않은 잔기(Ala)에 대해 대전 부호 양자에 무관하게 채택된다(Dalcol, J. Org. Chem 61: 6775-6782 (1996) 참조). 반복 서열의 길이, 산성 pH, 및 높은 펩티드 농도는 PPII 함량을 증가시켰다. 히스티딘이 글루탐산으로 치환되었을 때를 제외하고, pH 7에서보다 pH 3.0에서 PPII 함량은 더 많다. 이 경우, PPII의 불안성은 아마도 pH 3에서 글루탐산의 카르복실 기들의 양성자 첨가 및 수소 결합에 의한 측쇄들간 후속 상호작용에 기인한다.
PPII 구조는 단백질의 동적 특징이다. Bicudo 등(2008, Biopolymers, 89:175-178)은, 환원제를 이용하거나 이용하지 않고서 물, SDS 및 2-프로판올에 가용화될 때 원평광 이색성에 의해 옥수수 PB들로부터 정제된 감마 제인의 2차 구조를 분석하였다. PPII 구조는 SDS에서 단지 1%, 프로판올에서 4%, 그리고 물에서 약 7%였다. RD가 전체 감마-제인 서열의 22%을 나타낸다는 것을 고려하면, 이들 결과들은 이 도메인의 최소 30%가 물에서 PPII 구조를 채택할 것이라는 것을 나타낸다(Fernandez-Carneado, J. Mol. Biol. 372: 708-22 (2004); Bicudo, 2007). 또한, PPII의 크기는 단백질 조립체 및 PB들의 형성을 이끄는 제인-제인 상호작용에 의해 크게 증가될 수 있다. 그러므로, 폴리펩티드들은 그들이 PPII 구조를 형성하는 경향을 가지면 PPII 구조를 갖는 것으로 생각된다.
서열이 PPII 구조를 형성하는 지를 판단하는 방법들 또한 알려져 있다. 예를 들어, 원편광 이색성(CD), 진동 원편광 이색성(VCD), 및 라만 광학 활성(ROA)과 같은 광학 활성에 기반한 분광학이 사용될 수 있다. 전체가 본원에 참고로 포함된 Bochicchio and Tamburro, Chirality 14:782-92 (2002)를 참조. 아울러, 결정화된 단백질에서 PPII 구조는 X-ray 분석으로 판단될 수 있다. Knighton et al. Science 253: 414-420 (1991); Caldwell et al. Biopolymers 10:1891-1904 (1984). CD는 2차 구조에 매우 민감하다. 그래서, 일부 실시예에서, PPII 구조를 판단하는 방법은 CD이다. 길이가 약 30 내지 100 아미노산인 펩티드의 CD 스펙트럼은 약 pH 7 및 약 5℃에서 판단될 수 있다. PPII 구조의 존재는 약 λ=202 nm에서 최소값을 그리고 약 λ=228 nm에서 최대값을 갖는 CD 패턴을 특징으로 한다. 시료 펩티드에서 PPII 구조의 백분율은 H-(Pro)n-OH 기준 펩티드에 대한 시료 펩티드의 [θmax]M (최대 약 λ=228 nm에서 몰 타원율) 크기의 비로 결정될 것이다. 시료 펩티드와 유사한 길이를 갖는 기준 펩티드는 100% PPII 구조를 갖는 것으로 생각될 수 있다. PPII 구조를 판단하기 위한 CD 스펙트럼 기반의 방법에 대한 더욱 자세한 기재는 Dalcol 등. Org. Chem. 61: 6675-6782 (1996)에 나타나 있다.
예를 들어, 폴리-프롤린 펩티드 (H-(Pro)n-OH)는 기준으로 간주될 수 있고 100% PPII 나선을 형성하는 것으로 간주될 수 있다. 일부 실시에에서, PPII 구조의 [θ max]M 은 기준 폴리펩티드((H-(Pro)n-OH)의 최소 약 25%, 최소 약 30%, 최소 약 40%, 최소 약 55%, 최소 약 60%, 최소 약 65%, 최소 약 70%, 최소 약 75%, 최소 약 80%, 최소 약 85%, 최소 약 90%, 최소 약 95%, 또는 [θ max]M의 100%이다.
위에서 기재된 바와 같이, 재조합 PBIS는 프롤린 풍부 서열을 포함할 수 있다. 일부 실시예에서, PPII 구조는 프롤린 풍부 서열을 포함한다. 일부 실시예에서, 재조합 PBIS는 PPII 구조 및 PPII 나선을 형성하는 경향을 갖지 않는 프롤린 풍부 서열을 포함한다. 일부 실시예에서, 프롤린 풍부 서열은 PPII 구조를 형성할 수 있다.
본원에서 사용된 "프롤린 풍부 영역(proline-rich region)"이란 용어는 상대적으로 높은 프롤린 비율을 포함하는 폴리펩티드 서열을 말한다. 일부 실시예에서, 상기 프롤린 풍부 영역은 최소 40%, 최소 50%, 최소 60%, 최소 70%, 최소 80%, 최소 90%, 최소 95%, 최소 96%, 최소 97%, 최소 98%, 최소 99%, 또는 100% 프롤린을 포함한다.
일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 길이가 30 아미노산이다. 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 길이가 최소 32, 최소 34, 최소 36, 최소 38, 최소 40, 최소 42, 최소 44, 최소 46, 또는 최소 48 아미노산이다.
일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 길이가 100 이하, 98이하, 96 이하, 94 이하, 92 이하, 90 이하, 88 이하, 86 이하, 84 이하, 82 이하, 80 이하, 78 이하, 76 이하, 74 이하, 72 이하, 70 이하, 68 이하, 66 이하, 64 이하, 62 이하, 60 이하, 58 이하, 56 이하, 54 이하, 또는 52 이하 아미노산이다.
일부 실시에에서, PPII 구조 또는 프롤린 풍부 서열은 길이가 약 36 내지 약 100 아미노산, 약 36 내지 약 90 아미노산, 약 36 내지 약 80 아미노산, 또는 약 36 내지 약 70 아미노산이다. 일부 실시에에서, PPII 구조 또는 프롤린 풍부 서열은 길이가 약 42 내지 약 100 아미노산, 약 42 내지 약 90 아미노산, 약 42 내지 약 80 아미노산, 또는 약 42 내지 약 70 아미노산이다. 일부 실시에에서, PPII 구조 또는 프롤린 풍부 서열은 길이가 약 48 내지 약 100 아미노산, 약 48 내지 약 90 아미노산, 약 48 내지 약 80 아미노산, 또는 약 48 내지 약 48 아미노산이다.
일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15 PX 반복(repeat)을 포함한다. 일부 실시예에서, PX 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 연속 반복이다. 일부 실시예에서, PX 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 동가 동의(homomeric)이다. 일부 실시예에서, PX 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 이가 동의(heteromeric)이다.
일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15개의 3-아미노산 반복(예를 들어, PPX, PXP, XPP, 또는 PXX)을 포함한다. 일부 실시예에서, 3-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 연속 반복이다. 일부 실시예에서, 3-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 동가 동의이다. 일부 실시예에서, 3-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 이가 동의이다.
일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15개의 4-아미노산 반복(예를 들어, PPPX (서열번호 119), PPXX (서열번호 117), PXXX (서열번호 137), PPXP (서열번호 138), PXPP (서열번호 139))을 포함한다. 일부 실시예에서, 4-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 연속 반복이다. 일부 실시예에서, 4-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 동가 동의이다. 일부 실시예에서, 4-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 이가 동의이다.
일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15개의 5-아미노산 반복(예를 들어, PPPXX(서열번호 140))을 포함한다. 일부 실시예에서, 5-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 연속 반복이다. 일부 실시예에서, 3-아미노산 반복 5-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 동가 동의이다. 일부 실시예에서, 5-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 이가 동의이다.
일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15개의 6-아미노산 반복(예를 들어, PPPXX(서열번호 116) 또는 PPPXPX (서열번호 141))을 포함한다. 일부 실시예에서, 6-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 연속 반복이다. 일부 실시예에서, 6-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 동가 동의이다. 일부 실시예에서, 6-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 이가 동의이다.
일부 실시예에서, PPI 구조 또는 프롤린 풍부 영역은 양친매성 분자들이다.
양친매성 분자는 그 영역과 비교해 볼 때 소수성인 나머지 분자에 비해 상당히 더 높은 소수성 특성을 갖는 영역을 가진 분자이다. 분자 또는 그의 영역의 소수성 또는 친수성 특성은 주변 매질에 대한 그의 거동에 대해 중요한 효과를 가진다. 소수성 표면은 수용성 매질과 상호작용을 피하려는 경향이 있고, 반면에 친수성 표면은 상호작용에 의해 안정화된다. 단백질은 3차원 구조이므로, 그의 아미노산 잔기들 중 일부가 매질에 노출된다. 그 결과, 표면에 위치되어서 매질에 노출된 아미노산들만이 단백질 또는 단백질 영역의 특성이 소수성, 친수성, 또는 양친매성인지를 판단함에 있어서 고려되어야 한다.
본원에서 언급된 바와 같이, PPII 구조는 회전당 세 개의 아미노산을 가진 연장된 좌선성 나선이다. 각 1회전은 시계방향 순서로 삼각형의 꼭지점들 중 하나에 위치된 회전에서 3 아미노산들 중 각 하나를 가진 삼각형(예: 도 1A)으로 표시될 수 있다. 그 결과, PPII 구조의 연속적 삼각형들(회전들)의 적층은 단백질 또는 단백질 영역의 전체 구조를 나타내는 삼각형 프리즘을 생성할 것이다. PPII 나선에서, 삼각형 프리즘의 에지에 놓인 아미노산들은 매질에 노출되어 모두 소수성/친수성 판단에서 고려되어야 한다. 삼각 프리즘의 에지들 중 하나가 독립적이라고 여져지는 나머지 두 에지들에 대해 상당히 다른 소수성 특성을 가질 때, PPII 구조는 양매성으로 여겨질 수 있다.
아미노산들의 소수성/친수성 특성은 그의 측쇄의 성질에 의해 판단된다. Kyte-Doolittle 소수성 스케일(Kyte J., Doolittle R.F., J. Mol. Biol. 157:105-132(1982))은 아미노산 측쇄들의 물리화학적 성질들로부터 유래되고, 공통적으로 사용되며 잘 수용된다. 아미노산들은 Kyte-Doolittle 값에 따라 세 가지 군으로 분류될 것이다: (i) 비극성 또는 소수성으로 여겨질 4,5 내지 1,8 범위의 아미노산 (I, V, L F C, M 및 A), (ii) 부분적 극성 또는 부분적 친수성으로 여겨질 -0,4 내지 -1,6 범위의 아미노산 (G, S, T, W, Y 및 P), 그리고 극성이자 친수성으로 여겨질 -3,2 내지 -4,5 범위의 아미노산 (R, H, D, E, N, Q 및 K). 극성인 군의 아미노산들 중에서, 양으로 대전(R, H, 및 K), 음으로 대전(D 및 E), 미대전된(Q 및 N) 아미노산들을 찾을 수 있다. PPII 나선의 소수성의 계산을 간략화하기 위해, 이 분류를 고려한 공통 극성 값을 할당받았다: (i) 비극성 아미노산의 경우 0, (ii) 부분 극성 아미노산의 경우 0,5, 및 (iii) 극성 아미노산의 경우 1.
PPII 구조의 양친매성 특성은 삼각 프리즘에서 공간 아미노산 분포의 맥락에서 본원에 기재된 아미노산 분류를 고려하여 계산될 수 있다. 친수성 아미노산들의 백분율은 각 에지(edge 1: i, i+4, i+7 …; edge 2: i+1, i+5, i+8…; edge 3:i+2, i+6, i+9 …)에 대해 계산될 수 있고, 에지들 중 하나의 백분율 차이가 독립적으로 여겨지는 두 에지들에 대하여 최소 약 35일 때, PPII 구조는 양친매성으로 여겨질 수 있다.
이처럼, PPII 구조에서 모든 제3 잔기는 나선의 일측을 따라서 정렬되므로, 나선의 일측을 따라 위치된 잔기들의 소수성이 나선의 타측을 따라 위치된 잔기들의 소수성과 다르면, PPII 나선은 양친매성일 것이다. 감마 제인의 RD의 PPII 나선은 두드러진 양친매성 특성을 가진다. 회전당 3.0 잔기들을 갖고서, 감마 제인의 발린 및 류신 잔기들은 나선의 동일 측(각각, 에지 1 및 2) 위에 정렬되고, 반면에 극성 히스티딘 잔기들은 반대 측(에지 3) 위에 정렬된다. 이 양친매성은 직전에 언급된 계산에 의해 분명히 지적되었고, 여기서 친수성 아미노산들의 백분율은 에지 1, 2, 및 3에서 각각 29.4, 29.4, 그리고 78.1이다 (표 1 참조).
PPII 군 | PBIS | 잔기 * | %프롤린 | %동일성 | 에지극성 *** | 에지 극성 차이**** | 순 전하 |
양으로 대전된 양친매성 |
RX3 | 11-63 | 54,7 | 100 | (29,4/29,4/78,1) | (0/48,7/48,7) | +8 |
RX3(K) | 11-63 | 54,7 | 84,9 | (29,4/29,4/78,1) | (0/48,7/48,7) | +8 | |
RX3(R) | 11-63 | 54,7 | 84,9 | (29,4/29,4/78,1) | (0/48,7/48,7) | +8 | |
음으로 대전된 양친매성 |
RX3(D) | 11-63 | 54,7 | 84,9 | (29,4/29,4/78,1) | (0/48,7/48,7) | -8 |
RX3(E) | 11-63 | 54,7 | 84,9 | (29,4/29,4/78,1) | (0/48,7/48,7) | -8 | |
비 대전된 양친매성 | RX3(N) | 11-63 | 54,7 | 84,9 | (29,4/29,4/78,1) | (0/48,7/48,7) | 0 |
RX3(Q) | 11-63 | 54,7 | 84,9 | (29,4/29,4/78,1) | (0/48,7/48,7) | 0 | |
비- 양친매성 |
RX3(A) | 11-63 | 54,7 | 86,8 | (29,4/29,4/34,4) | (0/5/5) | +1 |
RX3(A)2 | 11-63 | 54,7 | 84,9 | (29,4/29,4/28,1) | (0/1,3/1,3) | 0 | |
RX3(A3) | 11-63 | 54,7 | 54,7 | (29,4/29,4/28,1) | (0/1,3/1,3) | 0 | |
RX3(L) | 11-63 | 54,7 | 84,9 | (29,4/29,4/28,1) | (0/1,3/1,3) | 0 | |
RX3(V) | 11-63 | 54,7 | 84,9 | (29,4/29,4/28,1) | (0/1,3/1,3) | 0 | |
RX3(T) | 11-63 | 54,7 | 84,9 | (29,4/29,4/53,1) | (0/23,7/23,7) | 0 | |
PP | 11-63 | 96,2 | 58,5 | (50/52,9/56,3) | (0/1,3/1,3) | +1 | |
PP3 | 11-63 | 100 | 54,7 | (50/50/50) | (0/0/0) | 0 | |
PA | 11-63 | 66 | 58,5 | (29,4/29,4/56,7) | (0/27,3/27,3) | +1 | |
PA2 | 11-63 | 67,9 | 54,7 | (29,4/29,4/53,1) | (0/23,7/23,7) | 0 | |
Z(Col) | 11-63 | 39,6 | 38,6 | (52,9/52,9/56,3) | (0/3,4/3,4) | +1 | |
Z(Col2) | 11-56 | 36,9 | 27,8 | (50/50/50) | (0/0/0) | 0 | |
Z(Adh) | 11-63 | 39,6 | 35,8 | (64,7/61,8/50) | (2,9/14,7/11,8) | -5 | |
Z(Adh2) | 11-56 | 39,6 | 27,8 | (68,8/65,6/46,7) | (4,4/22,1/18,9) | -6 | |
* 분석에 사용된 잔기(성숙 단백질의 N-말단에 대한 상대적 위치 | |||||||
** RX3을 기준으로 취한 동일 아미노산들의 % | |||||||
*** PPII 구조의 삼각형 프리즘 표시의 에지 1, 2, 및 3에서 극성 아미노산들의 백분율 | |||||||
**** PPII 구조의 삼각형 프리즘 표시의 에지들을 따른 극성 아미노산들의 백분율 차이 (에지 1 대 에지 2, 에지 1 대 에지 3, 그리고 에지 2 대 에지 3) |
일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 양친매성 이고 음으로 대전된다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 양친매성 이고 대전되지 않는다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 비양친매성이다.
일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열의 길이를 따라 위치된 프롤린의 백분율은 일정하다. 그러므로, 예를 들어, 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열의 길이를 가로지르는 10-아미노산 윈도우들은 프롤린 백분율이 단지 약 50%, 약 45%, 약 35%, 약 30%, 약 25%, 약 20%, 약 15%, 약 10%, 또는 약 5%만큼 다르다.
일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열에 존재하는 프롤린 아미노산들은 하이드록실화 되게 하는 하이드로프롤린(예를 들어, (2S,4R)-4-Hydroxyproline, 또는 L-hydroxyproline (C5H9O3N))일 수 있다. 이는 프롤린의 감마 카본 원자에 부착된 히드록실(OH) 기의 존재만이 다른 프롤린의 공통적인 번역후 변형이다. 히드록시프롤린은 콜라겐과 같이 프롤린 풍부 서열들에 존재한다. 예를 들어, 기본 GXY 트라이어드(triad) (여기서 X와 Y는 독립적인 임의 아미노산)에서, Yaa 위치를 차지하는 프롤린은 히드록시화될 수 있다. 히드록시프롤린은 PPII 나선 형성과 간섭하지 않는다.
일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 콜라겐 관련 서열을 포함하지 않는다. 이처럼, 일부 실시예에서, 상기 PPII 구조 또는 프롤린 풍부 서열은 서열 (GXY)n을 포함하고, 여기서 n은 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 12, 최소 14, 최소 16, 최소 18, 또는 최소 20이다. 일부 실시예에서, (GXY)n을 포함하는 서열은 최소 약 30%의 프롤린을 포함한다.
상기 PPII 구조 또는 프롤린 풍부 서열은 길이가 최소 30 아미노산이다. 재조합 PBIS는 PPII 구조 또는 프롤린 풍부 서열의 아미노 말단(N-말단)에 최소 두 개의 시스테인을 포함한다(즉, PPI 구조 또는 프롤린 풍부 영역의 두 시스테인 업스트림). 재조합 PBIS는 PPII 구조 또는 프롤린 풍부 서열의 카복시 말단(C-말단)에 최소 두 개의 시스테인을 포함한다(즉, PPI 구조 또는 프롤린 풍부 영역의 두 시스테인 다운스트림).
일부 실시예에서, PBIS의 최소 약95%, 약 90%, 약 85%, 약 80%, 약 75%, 약 70%, 약 65%, 약 60%, 약 55%, 또는 약 50%는 폴리프롤린 II 구조를 보여준다.
위에서 기재된 바와 같이, 재조합 PBIS는 프롤린 풍부 서열을 포함할 수 있다. 일부 실시예에서, PPII 구조는 프롤린 풍부 서열을 포함한다. 일부 실시예에서, 재조합 PBIS는 PPII 구조 및 PPII 나선을 형성하는 경향을 갖지 않는 프롤린 풍부 서열을 포함한다.
PPII 구조에서 모든 제3 잔기는 나선의 일측을 따라서 정렬되므로, 나선의 일측을 따라 위치된 잔기들의 소수성이 나선의 다른 일측을 따라 위치된 잔기들의 소수성과 다르면, PPII 나선은 양친매성일 것이다. 감마 제인의 RD의 PPII 나선은 두드러진 양친매성 특성을 가진다. 회전당 3 잔기들을 갖고서, 감마 제인의 발린 및 류신 잔기들은 나선의 동일 측 위에 정렬되고, 반면에 pH에 따라 대전된 극성 히스티딘 잔기들은 반대 측 위에 정렬된다.
일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 프롤린 풍부 반복을 포함한다. 기재된 바와 같이, 프롤린 풍부 반복은 프롤린을 함유하는 서열의 최소 2 카피를 포함하는 서열이다. 반복은 최소 길이가 2 아미노산 (예: PX), 최소 길이가 3 아미노산 (예: PPX, PXP, XPP, 또는 PXX), 최소 길이가 4 아미노산 (예: PPPX (서열번호 5), PPXX (서열번호 6), PXXX (서열번호 7), PPXP (서열번호 8), PXPP (서열번호 65), 최소 길이가 5 아미노산 (예: PPPXX (서열번호 9)), 최소 길이가 6 아미노산 (예: PPPXXX (서열번호 10) 또는 PPPXPX (서열번호 11)), 최소 길이가 7 아미노산, 최소 길이가 8 아미노산, 최소 길이가 9 아미노산, 또는 최소 길이가 10 아미노산일 수 있다. 여기서 나열된 반복들은 다지 예시로서 제공된다.
프롤린 풍부 반복은 프롤린을 포함하는 서열의 최소 두 개의 카피, 최소 세 개의 카피, 최소 네 개의 카피, 최소 다섯 개의 카피, 최소 여섯 개의 카피, 최소 일곱 개의 카피, 최소 여덟 개의 카피, 최소 아홉 개의 카피, 최소 열 개의 카피를 포함할 수 있다. 프롤린 풍부 반복은 동일 반복(즉, 동가 동의 프롤린 풍부 반복)의 모든 카피들을 포함할 수 있거나, 프롤린 풍부 반복들의 조합(즉, 이가 동의 프롤린 풍부 반복)을 포함할 수 있다. 예시로서, 서열 PPPAAAPPPAAAPPPAAA (서열번호 12)은 동일한 PPPAAA (서열번호 13) 반복을 포함하는 세 개의 카피들을 포함하는 동가 동의 프롤린 풍부 반복이고, 서열 PPPAAAPPPAAAPPAPPPPPAPPP (서열번호 14)은 한 서열 PPPAAA (서열번호 13)의 2 카피와 다른 서열 PPAPPP (서열번호 15)의 2 카피를 포함하는 이종 동의 프롤린 풍부 반복이다.
일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 (i) 프롤린, (ii) 발린, (iii) 류신, 및 (iv) 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수적으로 구성된다. 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 (i) 프롤린, (ii) 발린, (iii) 류신, (iv) 아스파트산, 및 (v) 글루타민으로 구성되는 군으로부터 선택된 아미노산들로 필수적으로 구성된다. 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 (i) 프롤린, (ii) 발린, (iii) 류신, (iv) 트레오닌, (v) 아스파라긴, 및 (vi) 글루타민으로 구성되는 군으로부터 선택된 아미노산들로 필수적으로 구성된다. 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 (i) 프롤린, (ii) 음으로 대전된 아미노산들 (즉, D 및 E), (iii) 극성의 대전된 측쇄들을 가진 아미노산들(즉. N, 및 Q), (iv) 부분 극성의 대전되지 않은 측쇄들을 가진 아미노산들(즉, S, T, W, Y 및 G) 또는 부분 극성의 대전되지 않은 측쇄들을 가진 아미노산들(즉, S, T, 및 G), (v) 소수성 측쇄들을 가진 아미노산들(즉, A, I, L, M, F, 및 V) 또는 소수성 측쇄들을 가진 아미노산들(즉, A, I, L, M 및 V)로 구성되는 군으로부터 선택된 아미노산들로 필수 구성된다. 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 (i) 프롤린, 및 (ii) 아날린으로 구성되는 군으로부터 선택된 아미노산들로 필수적으로 구성된다.
일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열에서 아미노산들 중 최소 약 40%가 프롤린이다. 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열에서 아미노산들의 최소 약 45%, 최소 약 50%, 최소 약 55%, 최소 약 60%, 최소 약 65%, 최소 약 70%, 최소 약 75%, 최소 약 80%, 최소 약 85%, 최소 약 90%, 최소 약 95% 또는 100%가 프롤린이다.
일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열 내 아미노산의 약 95%, 약 90%, 약 85%, 약 80%, 약 75%, 약 70%, 약 65%, 약 60%, 약 55%, 또는 약 50%만이 프롤린이다.
일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 비양친매성 이다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 양친매성이고 음으로 대전된다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 양친매성이고 대전되지 않는다.
일 실시예에서, 상기 재조합 PPII 구조 또는 상기 프롤린 풍부 영역은 음으로 대전된 양친매성 서열을 포함한다. "음으로 대전된 양친매성 서열"이란 용어는 위에서 설명되었고, 위에서 정의된 방법을 이용하여 계산된 음의 순전하를 보여주는 PPII 구조들 또는 프롤린 풍부 영역들을 언급하기 위해 사용된다. 또 다른 바람직한 실시예에서, 상기 음으로 대전된 양친매성 서열은 PPPVDL (서열번호 19) 및 PPPVEL (서열번호 18)로 구성되는 군으로부터 독립적으로 선택되는 최소 하나의 반복을 포함한다. 바람직한 실시예에서, 상기 양친매성 서열은 (PPPVEL)n, (서열번호 18) 및 (PPPVDL)n, (서열번호 19)로부터 선택된 서열을 포함하고, 여기서 n은 4, 5, 6, 7, 또는 8이다.
또 다른 실시예에서, 상기 음으로 대전된 양친매성 서열은 아래에 정의된 바와 같은 서열로 필수 구성된다:
PPPVELPPP VELPPPVELP PPVELPPPVE LPPPVELPPP VEVPPPVELPPPP (서열번호 30),
PPPVELPPP VELPPPVELP PPVELPPPVE LPPPVELPPP VELPPPVELPPPP (서열번호 123).
PPPVDLPPP VDLPPPVDLP PPVDLPPPVD LPPPVDLPPP VDVPPPVDLPPPP (서열번호 124), 및
PPPVDLPPP VDLPPPVDLP PPVDLPPPVD LPPPVDLPPP VDLPPPVDLPPPP (서열번호 31).
또 다른 실시예에서, 본 발명에 따라 PBIS의 일부를 형성하는 상기 PPII 구조 또는 상기 프롤린 풍부 영역은 대전되지 않은 양친매성 서열이다. "대전되지 않은 양친매성 서열"이란 용어는 0의 순전하를 갖는 서열을 말하고, PPII 구조의 삼각형 프리즘 표시의 에지 2에서의 잔기들은 Asn과 Gln으로 구성되는 군으로부터 선택된다. 또 다른 더 바람직한 실시예에서, 상기 음으로 대전된 양친매성 서열은 PPPVDL (서열번호 21) 및 PPPVEL (서열번호 22)로 구성되는 군으로부터 독립적으로 선택되는 최소 하나의 반복을 포함한다. 또 다른 더 바람직한 실시예에서, 상기 음으로 대전된 양친매성 서열은 최소 6개의 반복을 포함하고, 각 반복은 PPPVNL (서열번호 21) 및 PPPVQL (서열번호 22)로 구성되는 군으로부터 독립적으로 선택된다. 바람직한 실시예에서, 상기 PBIS는 (PPPVNL)n, (서열번호 21) 및 (PPPVQL)n, (서열번호 22)로부터 선택된 서열을 포함하고, 여기서 n은 4, 5, 6, 7, 또는 8이다.
바람직한 실시예에서, 본 발명에 따라 PPII 구조의 일부를 형성하는 상기 대전되지 않은 양친매성 서열 또는 PBIS의 일부를 형성하는 상기 프롤린 풍부 영역은 하기에 정의된 바와 같은 서열로부터 독립적으로 선택된다:
PPPVNLPPP VNLPPPVNLP PPVNLPPPVN LPPPVNLPPP VNVPPPVNLPPPP (서열번호 32),
PPPVNLPPP VNLPPPVNLP PPVNLPPPVN LPPPVNLPPP VNLPPPVNLPPPP (서열번호 33),
PPPVQLPPP VQLPPPVQLP PPVQLPPPVQ LPPPVQLPPP VQVPPPVQLPPPP (서열번호 34), 및
PPPVQLPPP VQLPPPVQLP PPVQLPPPVQ LPPPVQLPPP VQLPPPVQLPPPP (서열번호 35).
또 다른 실시예에서, 본 발명에 따라 PBIS의 일부를 형성하는 상기 PPII 구조 또는 상기 프롤린 풍부 영역은 비양친매성 서열이다. "비양친매성 서열(non-amphipathic sequence)"이란 용어는 0의 순전하를 갖는 서열을 말하고, PPII 구조의 삼각형 프리즘 표시의 에지 2에서의 잔기들은 Ala, Leu, Val, Thr 및 Ser로 구성되는 군으로부터 선택된다. 또 다른 더 바람직한 실시예에서, 비양친매성 서열은 PPPVAL (서열번호 16), PPPVTL (서열번호 20), PPPVSL (서열번호 36), PPPVVL, (서열번호 37) 및 PPPVLL (서열번호 17)로 구성되는 군으로부터 독립적으로 선택된 최소 하나의 반복을 포함한다. 바람직한 실시예에서, 상기 PBIS는 PPPVAL)n, (서열번호 16), (PPPVTL)n, (서열번호 20), (PPPVSL)n, (서열번호 36), (PPPVVL)n, (서열번호 37) 및 (PPPVLL)n, (서열번호 17)로부터 선택된 서열을 포함하고, 여기서 n은 4, 5, 6, 7, 또는 8이다.
또 다른 바람직한 실시예에서, 상기 비양친매성 서열은 하기의 서열들로 구성되는 군으로부터 선택된다:
PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VAVPPPVALPPPP (서열번호 38),
PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VALPPPVALPPPP (서열번호 39),
PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VAVPPPVHLPPPP (서열번호 40),
PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VALPPPVHLPPPP (서열번호 41),
PPPVLLPPP VLLPPPVLLP PPVLLPPPVL LPPPVLLPPP VLVPPPVLLPPPP (서열번호 42),
PPPVLLPPP VLLPPPVLLP PPVLLPPPVL LPPPVLLPPP VLLPPPVLLPPPP (서열번호 43),
PPPVVLPPP VVLPPPVVLP PPVVLPPPVV LPPPVVLPPP VVVPPPVVLPPPP (서열번호 44),
PPPVVLPPP VVLPPPVVLP PPVVLPPPVV LPPPVVLPPP VVLPPPVVLPPPP (서열번호 45),
PPPVTLPPP VTLPPPVTLP PPVTLPPPVT LPPPVTLPPP VTVPPPVTLPPPP (서열번호 46),
PPPVTLPPP VTLPPPVTLP PPVTLPPPVT LPPPVTLPPP VTLPPPVTLPPPP (서열번호 47),
PPPVSLPPP VSLPPPVSLP PPVSLPPPVS LPPPVSLPPP VSVPPPVSLPPPP (서열번호 48), 및
PPPVSLPPP VSLPPPVSLP PPVSLPPPVS LPPPVSLPPP VSLPPPVSLPPPP (서열번호 49)
또 다른 실시예에서, 상기 재조합의 비양친매성 서열은 프롤린과 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수 구성된다. 바람직한 실시예에서, 프롤린과 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수 구성되는 상기 서열은 PPPAAA (서열번호 13), PPPAPA (서열번호 23) 및 PPPPPP (서열번호 24)로 구성되는 군으로부터 선택된 최소 하나의 반복을 포함한다. 바람직한 실시예에서, 상기 양친매성 서열은 (PPPAAA)n, (서열번호 13), (PPPAPA)n (서열번호 23) 및 PPPPPP)n (서열번호 24)로부터 선택된 서열을 포함하고, 여기서 n은 4, 5, 6, 7, 또는 8이다.
또 다른 바람직한 실시예에서, 프롤린과 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수 구성되는 상기 서열은 하기 서열들로 구성되는 군으로부터 선택된다:
PPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPAAAPPPP (서열번호 50),
PPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPVHLPPPP (서열번호 51),
PPPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPPPPPPPP (서열번호 52),
PPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPVHLPPPP (서열번호 53),
PPPAPAPPP APAPPPAPAP PPAPAPPPAP APPPAPAPPP APAPPPVHLPPPP (서열번호 54), 및
PPPAPAPPP APAPPPAPAP PPAPAPPPAP APPPAPAPPP APAPPPAPAPPPP (서열번호 55).
또 다른 실시예에서, 상기 비양친매성 서열은 서열 (GXY)n으로 필수 구성되고, 여기서 X 및 Y는 독립적인 임의 아미노 산이고, n은 1 내지 20의 정수이며, (GXY)n을 포함하는 상기 서열은 최소 30% 프롤린을 포함한다. 또 다른 실시예에서, 상기 비양친매성 서열은 유전자은행 등록번호 CAA34683의 아미노산 135 내지 179와 최소 70% 동일성을 보이는 아미노산들로 구성되는 군으로부터 선택된 아미노산들로 필수 구성된다. 또 다른 실시예에서, 상기 비양친매성 서열은 하기 서열들로 필수 구성된다:
GPMGPRGPPG PAGAPGPQGF QGNPGEPGEP GVSGPMGPRG PPGPPPVHL (서열번호 56) 및
GPMGPRGPPG PAGAPGPQGF QGNPGEPGEP GVSGPMGPRG PPGPP (서열번호 68)
또 다른 실시예에서, 상기 양친매성 서열은 표면 부착분자 AgI/II (Streptococcus mutans변종 NG8, 유전자은행: GQ456171)으로부터 아미노산 884 내지 927과 최소 70% 동일성을 보이는 아미노산들로 필수 구성된다. 바람직한 실시예에서, 상기 비양친매성 서열은 하기 서열들로 구성되는 군으로부터 선택된 아미노산들로 필수 구성된다:
PPTPPTYETE KPLEPAPVEP SYEAEPTPPT RAPDQAEPNK PTPPTPVHLP PPP (서열번호 69) 및
PPTPPTYETE KPLEPAPVEP SYEAEPTPPT RAPDQAEPNK PTPPTP (서열번호 70).
일부 실시예에서, PPII/Pro-풍부 서열은 C-말단에서 네 개의 프롤린 잔기들을 포함한다. 이 PPPP 서열은 C-말단 시스테인들의 업스트림, 즉 PPII/Pro-풍부 서열의 C-말단과 C-말단 시스테인들 사이에서 발견된다.
IV
.
시스테인
잔기
달리 특정하게 기재되지 않으면, 시스테인 잔기들의 위치는 PPII 구조의 N- 또는 C-말단, 폴리프롤린 풍부 서열 또는 PPII 구조 및 프롤린 풍부 서열 양자에 대하여 상대적이다.
위에 기재된 바와 같이, 재조합 PBIS는 N-말단에서 최소 두 개의 시스테인들 및 C-말단에서 최소 두 개의 시스테인들 사이의 PPII 구조, 폴리프롤린 풍부 서열 또는 PPII 구조 및 프롤린 풍부 서열 양자를 포함할 수 있다. 일부 실시예에서, 상기 재조합 PBIS는 C-말단에서 최소 세 개의 시스테인, 또는 최소 네 개의 시스테인들을 포함한다.
일부 실시예에서, 상기 재조합 PBIS는 다수의 PPII 구조들 및/또는 추가 시스테인에 의해 분리된 프롤린 풍부 서열들을 포함한다. 단지 예시로서, 상기 재조합 PBIS는 N-말단부터 C-말단까지 두 개의 시스테인 잔기, PPII 구조, 시스테인 잔기, 프롤린 풍부 서열, 및 두 개의 시스테인 잔기들을 포함할 수 있다. 또다른 실시예에서, 상기 재조합 PBIS는 N-말단부터 C-말단까지 두 개의 시스테인 잔기, 제1 프롤린 풍부 서열, 시스테인 잔기, 제2 프롤린 풍부 서열, 및 두 개의 시스테인 잔기들을 포함할 수 있다.
일부 실시예에서, C-말단에서 두 개의 시스테인들 사이의 아미노산들의 수는 0 내지 20의 정수이고/이거나 N-말단에서 두 개의 시스테인들 사이의 아미노산들의 수는 0 내지 20의 정수이다. 바람직하게, N-말단에서 두 개의 시스테인들은 최소 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 아미노산에 의해 분리될 수 있고, 혹은 인접할 수도 있다. 바람직하게, C-말단에서 두 개의 시스테인들은 최소 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 아미노산에 의해 분리될 수 있고, 혹은 인접할 수도 있다. 바람직한 실시예에서, N-말단에서 최소 두 개의 시스테인들은 하나의 아미노산(즉, CXC)에 의해, 두 개의 아미노산들(즉, CXXC(서열번호 57))에 의해 분리된다.
일부 실시예에서, PPII 서열 또는 프롤린 풍부 영역과 PPII 서열 또는 프롤린 풍부의 N-말단에서 두 개의 시스테인들은 약 0 내지 40개의 아미노산들(두 개의 시스테인들의 최대 C-말단과 폴리프롤린 II 또는 프롤린 풍부 영역의 N-말단 아미노산 사이의 아미노산들의 수로 측정시)에 의해 분리된다. 일부 실시예에서, PPII 서열 또는 프롤린 풍부 영역과 PPII 서열 또는 프롤린 풍부의 N-말단에서 두 개의 시스테인들은 최소 40, 최소 35, 최소 30, 최소 25, 최소 20, 최소 15, 최소 10, 최소 5개의 아미노산들에 의해 분리된다.
일부 실시에에서, PPII 서열 또는 프롤린 풍부 영역과 PPII 서열 또는 프롤린 풍부의 C-말단에서 두 개의 시스테인들은 약 0 내지 40개의 아미노산들(두 개의 시스테인들의 가장 N-말단과 폴리프롤린 II 또는 프롤린 풍부 영역의 C-말단 아미노산 사이의 아미노산들의 수로 측정시)에 의해 분리된다. 일부 실시예에서, PPII 서열 또는 프롤린 풍부 영역과 PPII 서열 또는 프롤린 풍부의 C-말단에서 두 개의 시스테인들은 최소 40, 최소 35, 최소 30, 최소 25, 최소 20, 최소 15, 최소 10, 최소 5개의 아미노산들에 의해 분리된다.
일부 실시예에서, N-말단에서 최소 두 개의 시스테인들은 구형 도메인 내에 있지 않다. 일부 실시예에서, C-말단에서 최소 두 개의 시스테인들은 구형 도메인 내에 있지 않다. 일부 실시예에서, 재조합 PBIS는 구형 도메인 내에 시스테인을 포함하지 않는다. 바람직한 실시예에서, PBIS가 이종 단백질에게 융합 단백질로 제공될 때, 시스테인은 이종 단백질의 일부를 형성하지 않는다.
V. ProX 도메인
또 다른 바람직한 실시예에서, PBIS는 이전 단락에서 정의된 바와 같은 서열을 포함하고, PPII 구조 또는 프롤린 풍부 도메인을 옆에 두는 시스테인들은 N1과 N2로 알려져 있는 추가 서열들 내에서 발견된다. 이들 N1과 N2 서열은 PPII 또는 프롤린 풍부 영역 옆에 위치한다. 본 발명에서 사용될 수 있는 전형적인 N1 및 N2 서열들은 제한없이 포함한다.
적합한 N1 서열들은 THTSGGCGCQ (서열번호 25), THPPPPCPCP (서열번호 26) 또는 QCPSPHPQQCPCPHPQPHPQPRPPQTPYHC (서열번호 126)를 포함한다. 일 실시예에서, N1 서열은 PPII 또는 프롤린 풍부 영역의 업스트림으로 나타난다.
N2 서열은 프롤린 풍부 영역일 수 있다. "프롤린 풍부 영역(proline-rich region)"이란 용어는 프롤린이 두드러지게 형성되는 서열로 위에서 정의되었다. 바람직한 실시예에서, 프롤린 풍부 영역은 프롤린들이 두드러지게 형성되고, 서열을 따라서 모두 균일하게 분포된 프롤린들을 가진다. 그러므로, 예를 들어, 일부 실시예에서, 10-아미노산 윈도우들이 PPII 구조 또는 프롤린 풍부 서열의 길이를 가로질러 추출되면, 각 윈도우는 나머지 윈도우들에 대해 프롤린 백분율이 단지 약 50%, 약 45%, 약 35%, 약 30%, 약 25%, 약 20%, 약 15%, 약 10%, 또는 약 5%만큼 다르다. 또 다른 바람직한 실시예에서, 프롤린 풍부 영역은 프롤린이 두드러지게 형성되는 서열로서, 상기 프롤린은 그 서열을 따라서 모두 균일하게 분포되고, 취급하기 힘든 측쇄(Trp, Tyr 및/또는 Phe)를 갖는 아미노산들의 백분율은 그 서열의 전체 길이에 대해 10% 이하이다.
본 발명에서 사용될 수 있는 적합한 프롤린 풍부 영역들은 g-제인 HYPYQPPRPQPHPQPHPCPC (서열번호 71) 또는 다음의 서열들로 구성되는 군으로부터 선택된 변형 서열에서 발견되는 ProX 도메인을 포함한다:
CHYPTQPPRPQPHPQPHPCPCQQPHPS (서열번호 72),
CPPPPPPPPPPPPPPPPPCPCPPPPPPPCP (서열번호 73),
CPPPPPPPPPPPPPPPPPCPPCPPPPPCPP (서열번호 74),
CPPPAPAPPPAPAPPPAPCPCPAPAPP (서열번호 75),
CHYPPAPAPPAPAPPAPACPCAAPAPSPCQ (서열번호 76 ) 및
CHYPTAPARPAPAPAPAPCPCAAPAPSPCQ (서열번호 127)
N2 서열은 PPII 영역 또는 프롤린 풍부 영역의 다운스트림 또는 업스트림으로 발견될 수 있다. 바람직한 실시예에서, N2 서열은 PPII 영역의 다운스트림으로 발견된다.
그러므로, 바람직한 실시예에서, 본 발명에 따르는 PBIS는 다음의 서열들로 구성되는 군으로부터 선택된 서열을 포함한다:
THTSGGCGCQP(PPPVEL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 107),
THTSGGCGCQP(PPPVDL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 108),
THTSGGCGCQP(PPPVNL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 109),
THTSGGCGCQP(PPPVQL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 111),
THTSGGCGCQP(PPPVAL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 112),
THTSGGCGCQP(PPPVTL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 113),
THTSGGCGCQP(PPPVSL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 114),
THTSGGCGCQP(PPPVLL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 115),
THTSGGCGCQP(PPPVVL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 116),
THTSGGCGCQP(PPPAAA)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 117),
THTSGGCGCQP(PPPAAA)nPPPAPAPPPAPAPPPAPCPCPAPAPPPCP (서열번호 118),
THTSGGCGCQP(PPPPPP)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 119),
THTSGGCGCQP(PPPPPP)nPPPCPPPPPPPPPPPPPPPPPCPCPPPPPPPCP (서열번호 120),
THTSGGCGCQP(PPPAPA)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 121), 및
THTSGGCGCAP(PPPAAA)nPPPPCHYPPAPAPPAPAPPAPACPCAAPAPSPCQ (서열번호 122)
여기서 n은 4, 5, 6, 7 또는 8이다. 바람직한 실시예에서, n은 8이다.
또 다른 실시예에서, 본 발명에 따른 PBIS는 표 2에서 언급된 서열들로 필수 구성된다.
PBIS | 서열번호 | PBIS |
THTSGGCGCQP(PPPVEL)6PPPVEVPPPVELPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ | 77 | RX3(E) |
THTSGGCGCQPPPPVDL)6PPPVDVPPPVDLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ | 78 | RX3(D) |
THTSGGCGCQP(PPPVNL)6PPPVNVPPPVNLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ | 79 | RX3(N) |
THTSGGCGCQP(PPPVQL)6PPPVQVPPPVQLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ | 80 | RX3(Q) |
THTSGGCGCQP(PPPVAL)6PPPVAVPPPVHLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ | 81 | RX3(A) |
THTSGGCGCQP(PPPVAL)6PPPVAVPPPVALPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ | 82 | RX3(A)2 |
THTSGGCGCQP(PPPVTL)6PPPVTVPPPVTLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ | 85 | RX3(T) |
THTSGGCGCQP(PPPVSL)6PPPVSVPPPVSLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ | 86 | RX3(S) |
THTSGGCGCQP(PPPVLL)6PPPVLVPPPVLLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ | 83 | RX3(L) |
THTSGGCGCQP(PPPVVL)6PPPVVVPPPVVLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ | 84 | RX3(V) |
THTSGGCGCQP ( PPPAAA ) 8 PPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ | 87 | RX3(A3) |
THTSGGCGCQP(PPPPPP)7PPPHLPPPP 7PPPPHLPPPPCPPPPPPPPPPPPPPPPPCPCPPPPPPPCP | 88 | PP |
THPPPPCPPCP(PPPPPP)7PPPHLPPPP 7PPPPHLPPPPCPPPPPPPPPPPPPPPPPCPPCPPPPPCPP | 125 | PP2 |
THTSGGCGCQ(PPPPPP)8 PPPPCPPPPPPPPPPPPPPPPPCPCPPPPPPPCP | 89 | PP3 |
THTSGGCGCQP(PPPAPA)7PPPAHLPPPPCPPPAPAPPPAPAPPPAPCPCPAPAPPPCP | 90 | PA |
THTSGGCGCQP(PPPAPA)8PPPPCPPPAPAPPPAPAPPPAPCPCPAPAPPPCP | 91 | PA2 |
THPPPPCPCPP ( PPPPPP ) 7 PPPHLPPPPCPPPPPPPPPPPPPPPPPCPCPPPPPPPCP | 92 | NPP |
THPPPPCPCPP ( PPPAPA)7 PPPAHLPPPPCPPPAPAPPPAPAPPPAPCPCPAPAPPPCP | 93 | NPA |
THTSGGCGCQPPPTPPTYETE KPLEPAPVEP SYEAEPTPPT RAPDQAEPNK PTPPTPVHLP PPPPPTPPTYETEKPLEPAPVEPSYEAEPTPPTRAPDQAEPNKPTPPTPVHLPPPP CHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ |
94 | Z(Adh)Px |
THTSGGCGCQPPPTPPTYETE KPLEPAPVEP SYEAEPTPPT RAPDQAEPNK PTPPTP CHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ |
95 | Z(Adh2)Px |
THTSGGCGCQPGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPPPVHLPPPP CHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ |
96 | Z(col)Px |
THTSGGCGCQPGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPP CHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ |
97 | Z(col2)Px |
THTSGGCGCQPPTPPTYETEKPLEPAPVEPSYEAEPTPPTRAPDQAEPNKPTPPTPVHLPPPPCPPCPTPPTYETEKPLEPAPVEPSYEAEPTPPTRAPDQAEPNKPTPPTPVHLPPPPCPPC | 98 | Z(Adh) |
THTSGGCGCQPPTPPTYETEKPLEPAPVEPSYEAEPTPPTRAPDQAEPNKPTPPTPCPPCPTPPTYETEKPLEPAPVEPSYEAEPTPPTRAPDQAEPNKPTPPTPCPPC | 99 | Z(Adh)2 |
THTSGGCGCQPGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPPPVHLCPPCGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPPPVHLCPPC | 100 | Z(col) |
THTSGGCGCQ PGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPPCPPCGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPPCPPC |
101 | Z(col2) |
또 다른 양태에서, 본 발명은 N1 영역(두 개의 N-말단 시스테인들을 포함) 및 RX3 PPII의 전부 또는 일부를 포함하는 PPII/pro-풍부 영역을 포함하지만, 제2 프롤린 풍부 영역이 부족한 PBIS에 관한 것이다. 필요한 C-말단 시스테인들을 제공하기 위해, 이들 PBIS는 PPII 영역의 C-말단에 직접 연결된 CPPC 테트라펩티드를 형성하는 두 개의 시스테인들을 포함한다. 이처럼, 또 다른 양태에서, 본 발명은 다음 서열로 구성되는 군으로부터 선택된 서열을 포함하는 PBIS에 관한 것이다:
R8(4C) (서열번호 102):
THTSGGCGCQ PPPPVHLPPP VHLPPPVHLP PPVHLPPPVH LPPPVHLPPP
VHVPPPVHLC PPC
R7(4C) (서열번호 103):
THTSGGCGCQ PPPPVHLPPP VHLPPPVHLP PPVHLPPPVH LPPPVHLPPP
VHVCPPC
R6(4C) (서열번호 104):
THTSGGCGCQ PPPPVHLPPP VHLPPPVHLP PPVHLPPPVH LPPPVHLCPP C
R4(4C) (서열번호 105):
THTSGGCGCQ PPPPVHLPPP VHLPPPVHLP PPVHLPPPVH LCPPC
또 다른 양태에서, 본 발명은 N1 영역(두 개의 N-말단 시스테인들을 포함), RX3 PPII의 전부 또는 일부를 포함하는 PPII/pro-풍부 영역, N2 영역을 포함하지만, N1 영역은 역방위로 RX3에서 발견되는 ProX 도메인의 아미노산을 포함하고, N2 영역은 역방위로 RX3의 N1 영역에서 발견되는 아미노산들을 포함하는 PBIS에 관한 것이다 이처럼, 또 다른 양태에서, 본 발명은 다음 서열로 구성되는 군으로부터 선택된 서열을 포함하는 PBIS에 관한 것이다:
iRX3 (서열번호 106)
QCPSPHPQQC PCPHPQPHPQ PRPPQTPYHC PPPPVHLPPP VHLPPPVHLP PPVHLPPPVH LPPPVHLPPP VHLPPPVHLP PPPQCGCGGS THT
VI
.
PBIS
융합 단백질
본원에 기재된 바와 같이, 재조합 PBIS는 관심이 있는 임의 생성물과 융합될 수 있다. 그러므로, 또 다른 양태에서, 본 발명은 본 발명의 재조합 PBIS 및 이종 단백질을 포함하는 융합 단백질에 관한 것이다. "이종 단백질(heterologous protein)"이란 용어는 본원에서 "관심이 있는 생성물(product of interest)" 또는 "POI"와 상호 교환적으로 사용되고, 예를 들어, 단백질 또는 펩티드일 수 있다. 재조합 PBIS는 목적 단백질 또는 펩티드의 N 또는 C 말단에 융합될 수 있다. 아울러, 재조합 PBIS는 목적 단백질 또는 펩티드에 직접 융합될 수 있고, 혹은 간접적, 예를 들어, 스페이서를 통하여, 목적 단백질 또는 펩티드에게 융합될 수 있다.
이처럼, 재조합 PBIS는, 예를 들어, 효소, 칼시토닌, 에리트로포이에틴, 트롬보포이에틴, 사람 성장 호르몬, 상피 성장 인자 등과 같은 호르몬, 인터페론, 또는 사이토킨에 융합될 수 있다. 목적 단백질 또는 펩티드의 다른 예들은 치료적, 기능식품의, 농업의, 또는 산업의 용도를 갖는 임의 단백질을 포함한다. 예를 들어, 일부 실시예에서, 재조합 PBIS는 필수 아미노산이 풍부한 펩티드에 융합될 수 있다. 이러한 기타 단백질들의 예시적 활성들은 (a) 녹색 형광 단백질(GFP)에 의한 제공시 광 포획 및 방출, 향상된 시안 형광 단백질(ECFP), 적색 형광 단백질(DsRed) 등, (b) 엔테로키나아제, 베타-글루쿠로니다아제 (GUS), 피타아제, 탄산 탈수 효소, 및 공업용 효소(하이드로라아제, 글리코시다아제, 셀룰라아제, 옥시도-리덕타아제 등)로 예시되는 1차 및 2차 세포내 시그널링 및 대사 경로와 관련될 수 있는 효소 활성, (c) 예를 들어, 항체(IgG, IgM, IgA 등과 같은 mAbs) 및 그의 절편, 호르몬(칼시토닌, 인간 성장 호르몬(hGH), 상피 성장 인자(EGF) 등), 프로테아제 억제제, 항생제, 항균제, HIV 엔트리 억제제(Ryser 등, 2005 Drug Discov Today. 10:1085-1094), 콜라겐, 인간 락토페린, 및 사이토킨과 같은 단백질-단백질, 단백질-수용체, 및 단백질-리간드 상호작용, (d) 백신용 단백질 및 펩티드 (인체 면역 결핍 바이러스, HIV; 헤파티티스 B 표면 이전(pre-surface), 표면 및 코어 항원, 발 및 구강 질환 바이러스(FMDV) 구조적 다단백질 유전자 P1 (Dus Santos 등, 2005 Vaccine.23:1838-1843), 미국특허 제4,882,145호의 T 세포 자극 펩티드, 위장염 코로나 바이러스, 인간 유두종 바이러스 등); (e) 피토헤마글루티닌(PHA), 리신 톡신 아단위 B(RTB) 및 기타 렉틴과 같은 단백질-비단백질 상호작용을 포함한다.
본원에 기재된 바와 같이, 재조합 PBIS로의 융합으로서 발현시 또는 RPBLA로부터 정제시, 관심이 있는 생성물은 그의 기능적 활성을 유지할 수 있다. 이렇게 발현된 폴리펩티드들의 생물학적 활성에 대한 평가는 이 기술에 잘 알려져 있고, 하나 이상의 공보들에서 이용가능하다. 예를 들어, ECFP 활성은 단백질이 458 nm에서 방출되었을 때 470~530 nm에서 방출되는 형광을 수량화함으로써 측정될 수 있다. (Richards 등, 2003 Plant Cell Rep. 22:117-121. 예를 들어, 엔테로키나아제(EK)의 효소 활성은 두 가지 다른 접근법으로 측정될 수 있다. 활성은 Invitrogen Life Technologies 카탈로그(E180-01과 E180-2)에서 논의된 바와 같이, 웨스턴 블롯으로 엔테로키나아제 특이 분할 부위를 포함하는 융합 단백질의 분할을 분석하고, 또한 EK(Sigma G-5261, CAS RN 70023-02-8)에 대한 형광 펩티드 기질을 사용하여 EK 활성을 수치화함으로써 판단될 수 있고, 효소 활성은 시간에 따라 펩티드로부터 β-나프틸아민의 방출에 의해 야기되는 형광(337nm에서 여기, 420nm에서 방출)의 증가에 의해 측정된다. (LaVallie 등, 1993 J. Biol . Chem . 268:23311-23317 참조). 효소 베타-글루쿠로니다아제(GUS)의 활성은 기질 MUG(4-메틸 움벨리페릴 글루쿠로니데)를 생성물 MU로 전환함으로써 측정될 수 있다. 이 생성물은 분광 형광계에서 365 nm에서 여기와 455 nm에서 방출로 형광을 측정함으로써 수치화될 수 있다. (Pai-Hsiang 등, 2001 J. Plant Physiol 158:247-254; and Jefferson 등, 1987 EMBO J. 6:3901-3907 참조). 피타아제 평가는 아세톤, 5.0 N 황산, 및 10 mM 암모늄 몰리브덴산염으로 구성되는 AAM 시약으로부터 해리된 무기 오르쏘 인산염들의 수량화로 수행된다. (Ullah 등, 1999 Biochem . Biophys . Res . Commun . 264:201-206 참조).
유사한 평가가 다른 생물학적 단백질에 대해서 이용될 수 있다. RTB 활성 평가는 Reed 등, 2005 Plant Cell Rep . 24:15-24에서 기재된 바와 같이, 아시아로페투인, 락토오스 및 갈락토오스에 대한 RTB의 결합을 측정함으로써 수행될 수 있다. EGF는 섬유아페소 증식에 관련된 성장 인자이다. EGF 활성은 세포 증식 ELISA 키트를 사용하여 티미딘 대신 피리미딘 유사 5-브로모-2'-데옥시우리딘(BrdU)을 증식하는 세포들의 DNA 로 결합시킴으로써 측정되는 DNA 합성의 유도의 수량화에 의해 평가될 수 있다. (Oliver, 등, 2004 Am . J. Physiol . Cell Physiol . 286:1118-1129; Catalog no. 1647229, Roche Diagnostics, 만하임, 독일 참조).
광 포획 및 방출은 별도의 그리고 특별한 유형의 "생물학적 활성", 즉 발광 활성을 구성한다는 것에 주목해야 한다. 이들 단백질은, 예를 들어, 생물학적으로 중요한 분자들의 분석 또는 발견에서 사용되는 많은 형태의 평가 또는 스크린에서 리포터 분자로서 유용하고, 이들의 발광 활성은 올바른 2차 및 3차 단백질 구조의 존재를 요구한다.
일부 실시예에서, 재조합 PBIS 융합 단백질은 스페이서 아미노산 서열을 포함한다. 스페이서 아미노산 서열은 효소 또는 화학적 수단에 의해 분할가능하거나 분할되지 않는 아미노산일 수 있다. "분할할 수 없는"이란 용어는 생물학적 활성 폴리펩티드의 일부 또는 전부의 파괴 없이는 스페이서의 분할이 일어나지 않는다는 것을 의미한다.
스페이서는 재조합 PBIS와 생물학적으로 활성인 폴리펩티드 사이에 놓일 수 있다. 예시적 스페이서는 엔테로키나아제, Arg-C 엔도프로테아제, Glu-C 엔도프로테아제, Lys-C 엔도프로테아제, 인자 Xa, SUMO 프로테아제(Tauseef 등, 2005 Protein Expr . Purif. 43:1-9) 등과 같은 프로테아제에 의해 분할되는 아미노산 서열이다. 스페이서는 또한 New England Biolabs 및 다른 곳에서 상업적으로 구매할 수 있는, FMDV 바이러스 오토-프로세싱 2A 서열, Ssp DNAb 인테인과 같은 단백질 인트론(inteins)과 같은 자동 분할가능한 서열에 해당할 수 있다. 인테인 링커의 사용은 이러한 서열이 선택적으로 유도되어 단백질 스플라이싱을 일으키고 그리하여 자신들을 발현 및 회수된 단백질로부터 제거하기 때문에 유리할 수 있다. 인테인은 특히 흥미로운데, 이는 이들이 목적 단백질로부터 재조합 PBIS를 분할하기 위해 이들의 표적 부위에 도착하는 큰 단백질 효소를 요구하기 않기 때문이다. 이러한 성질은 관심이 있는 단백질을 온전한 RPBLA로부터 직접 분리하는데 특히 유용할 수 있다. 대안적으로, 스페이서는, 메티오닌 잔기에서 분할하는 시아노겐 브로마이드와 같은 화학적 시약에 의해 특별히 분할될 수 있는 아미노산 서열일 수 있다.
바람직한 실시예에서, 스페이서는 펜타글리신 펩티드를 포함한다. 더욱 바람직한 실시예에서, 스페이서는 프로테아제 분할 부위 앞에 펜타글리신 펩티드를 포함한다. 더욱 더 바람직한 실시예에서, 프로테아제 분할 부위는 엔테로키나아제 분할 부위(D-D-D-D-K, K 잔기 뒤에서 분할) 및 인자 Xa 분할 부위(I-D/E-G-R, R 잔기 뒤에서 분할)로 구성되는 군으로부터 선택된다.
VII
.
재조합
PBIS
및 재조합
PBIS
융합 단백질을 인코딩하는 핵산
재조합 PBIS를 인코딩하는 폴리뉴클레오티드들 또한 본원에 기재되어 있다. 유사하게, 재조합 PBIS를 포함하는 융합 단백질을 인코딩하는 폴리펩티드들도 기재되어 있다. 본 발명의 폴리펩티드들은 RNA의 형태 또는 DNA의 형태로 있을 수 있다. DNA는 cDNA, 유전체 DNA, 및 합성 DNA를 포함하고, 이중 가닥 또는 단일 가닥일 수 있고, 단일 가닥이면, 암호 가닥 또는 비암호(안티-센스) 가닥일 수 있다. 어떤 실시예에서, 폴리뉴클레오티드는 분리된다. 어떤 실시예에서, 폴리뉴클레오티드는 실질적으로 순수하다. 어떤 실시예에서, 폴리뉴클레오티드는 숙주에 최적화된 코돈이고, 여기서 RPBLA들이 발현된다.
본 발명에 따른 폴리뉴클레오티드는 PBIS 또는 융합 단백질을 소포체로 안내하는 신호 서열을 인코딩하는 서열을 더 포함할 수 있고, 여기서 상기 신호 서열은 동일한 개방 리딩 프레임 내에 PBIS 또는 융합 단백질로서 존재한다.
위에서 기재된 바와 같이, 재조합 PBIS는 재조합 PBIS를 세포 내 특별한 위치로 안내하는 신호를 포함한다. 예를 들어, 재조합 PBIS는 신호 펩티드를 통하여 소포체(ER)의 루멘으로 안내될 수 있다.
신호는 재조합 PBIS를 ER로 안내하는 임의 도메인일 수 있다. 단지 예시로서, ER-신호전달 도메인은 감마-제인 또는 알파-제인과 같은 제인 단백질, 알파-글리아딘 또는 감마-글리아딘과 같은 글리아딘 단백질, 또는 PR10 클래스 25의 감염특이적 단백질로부터 유래된 ER-신호전달 펩티드일 수 있다. 바람직한 실시예에서, 신호 서열은 서열 MRVLLVALALLALAASATS (서열번호 58)을 포함한다. 대안적으로, 신호 서열은 감염특이적 유전자, 특히 PR-10 유전자, 그리고 가장 바람직하게는 담배 PR-2 유전자로부터 유래될 수 있다(Veroverd 등, Plant Physiol., 1995, 109:1199-1205). 바람직한 실시예에서, 신호 서열은 서열 MFLKSPFYAFLCFGQYFVAVTHA (서열번호 59)을 포함한다.
단백질을 ER에 안내하는 책임이 있는 신호 펩티드들의 특징들은 광범위하게 연구되었다(von Heijne 등, 2001 Biochim . Biophys . Acta 1541:114-119). 신호 펩티드들은 1차 구조에서 상동성을 공유하지 않지만, 공통적으로 세 갈래 구조를 가진다: 중앙의 소수성 h-영역 및 친수성 N- 및 C-말단 양측부 영역. 이들 유사성, 및 단백질들이 분명히 공통적 경로를 이용하여 ER 멤브레인을 통해 위치변화된다는 사실은 다른 단백질들 간 또는 심지어 다른 문(phyla)에 속하는 다른 유기체들로부터 신호 펩티드들의 상호교환을 허용한다. (Martoglio 등, 1998 Trends Cell Biol . 8: 410-415 참조).
신호 펩티드는 재조합 PBIS가 적절한 세포의 위치, 예를 들어, ER에 도달하면, 일단 분할될 수 있다. 대부분의 진핵생물에서, 신호 펩티드는 공-번역적으로 분할되므로, 세포내막부(예를 들어, ER, 골지, 액포)에서 발견되는 단백질의 대다수는 성숙 단백질, 즉 신호 펩티드가 없는 단백질이다. 결과적으로, 성숙 단백질은 RPBLA의 유도에 책임이 있다. 바람직한 실시예에서, 신호 서열은 서열 MRVLLVALALLALAASATS (서열번호 58)을 갖는 감마 제인 신호 펩티드이다.
이러한 폴리뉴클레오티드들은, 예를 들어, 세포 내에서 재조합 PBIS 또는 재조합 PBIS를 포함하는 융합 단백질을 생산하기 위해 발현 벡터에 포함된다. 발현 벡터는 재조합 PBIS 또는 재조합 PBIS를 포함하는 융합 단백질을 인코딩하고, 적합한 전사 또는 번역 조절 요소들에 작동적으로 연결된 합성 또는 cDNA-유래 DNA 절편을 갖는 복제가능한 DNA 컨스트럭트이다. 전사 또는 번역 조절 요소들은, 예를 들어, 포유류, 미생물, 바이러스, 곤충, 또는 유전자로부터 유래될 수 있다. 전사 단위는 하기에서 상세히 기재된 바와 같이, 일반적으로 (1) 유전자 발현에서 조절 역할을 하는 유전자 요소 또는 요소들, 예를 들어 프로모터 또는 인핸서, (2) mRNA로 전사되어 단백질로 번역되는 구조적 또는 코딩 서열, 및 (3) 적절한 전사 및 번역 시작 및 종결 서열의 조립체를 포함한다. 이러한 조절 요소들은 전사를 조절하는 오퍼레이터 서열을 포함할 수 있다. 보통 복제의 기원에 의해 부여받은, 숙주에서 복제 능력, 및 형질전환주들의 인식을 쉽게하는 선택 유전자가 추가로 결합될 수 있다. 기능적으로 서로 관련이 있으면, DNA 영역들은 작동적으로 연결된다. 예를 들어, 신호 펩티드를 위한 DNA가 폴리펩티드의 분비에 참여하는 전구체로서 발현되면, 폴리펩티드를 위한 DNA에 작동적으로 연결되고, 프로모터가 서열의 전사를 조절하면, 그 프로모터는 코딩 서열에 작동적으로 연결되고, 또는 리보솜 결합 부위가 번역을 허용하기 위해 위치되면, 그 리보솜 결합 부위는 코딩 서열에 작동적으로 연결된다.
발현 조절 서열 및 발현 벡터의 선택은 숙주의 선택에 따를 것이다. 광범위한 발현 숙주/벡터 조합들이 채용될 수 있다. 진핵세포 숙주를 위한 유용한 발현 벡터는, 예를 들어, SV40, 소유두종 바이러스, 아데노바이러스 및 시토메갈로바이러스로부터 발현 조절 서열들을 포함하는 벡터들을 포함한다. 박테리아 숙주를 위해 유용한 발현 벡터들은, pCR 1, pBR322, pMB9 및 이들의 유도체들을 포함하는 Esherichia coli 유래 플라스미드와 같은 공지된 박테리아 플라스미드, M13과 같은 더 넓은 숙주 범위의 플라스미드, 및 사상 단일가닥 DNA 파지를 포함한다.
일부 실시예에서, 재조합 PBIS를 인코딩하는 폴리뉴클레오티드를 포함하는 벡터는 다수의 클로닝 부위를 더 포함한다. 다수의 클로닝 부위는 하나 이상의 고유한 제한 부위들을 포함하는 폴리뉴클레오티드 서열이다. 제한 부위들의 비제한적 예들은 EcoRI, SacI, KpnI, SmaI, XmaI, BamHI, XbaI, HincII, PstI, SphI, HindIII, AvaI, 또는 이들의 임의 조합을 포함한다.
벡터는 재조합 PBIS 및 단백질 또는 관심있는 펩티드를 포함하는 융합 단백질을 발현하기 위해 사용될 수 있도록, 다수의 클로닝 부위들은 재조합 PBIS를 인코딩하는 폴리뉴클레오티드를 포함하는 벡터에서 사용되어 단백질 또는 관심있는 펩티드를 인코딩하는 폴리펩티드를 벡터에 결합하는 것을 단순화할 수 있다. 일부 실시예에서, 재조합 PBIS를 인코딩하는 폴리뉴클레오티드는 다수의 클로닝 부위에 대해 5'이다. 일부 실시예에서, 재조합 PBIS를 인코딩하는 폴리뉴클레오티드는 다수의 클로닝 부위에 대해 3'이다.
벡터는 최소 하나의 프로모터를 포함할 수 있다. 프로모터는 재조합 PBIS 또는 재조합 PBIS를 포함하는 융합 단백질의 발현을 구동하기에 적합한 임의 서열일 수 있다. 특별한 일 실시예에서, 프로모터는 담배 잎에서 발현을 구동한다.
다른 숙주들은 종종 특별한 아미노산 잔기를 인코딩하기 위해 사용될 특별한 코돈에 대한 선호를 가진다. 이러한 코돈 선호는 잘 알려져 있고 원하는 융합 단백질 서열을 인코딩하는 DNA 서열은 예를 들어 시험관 내 돌연변이 생성을 이용하여 변경될 수 있고, 그 결과 숙주가 선호하는 코돈은 융합 단백질이 발현될 특별한 숙주를 위해 이용될 수 있다.
고려된 융합 단백질을 인코딩하는 유전자를 정의하는 외인성 핵산 단편(예를 들어, DNA 단편 또는 서열)에 작동적으로 연결된 호환성 진핵 숙주 세포에서 유전자의 발현을 구동하기에 적합한 프로모터와 같은 하나 이상의 조절 서열(조절 요소)을 포함하는 유전자 벡터 또는 컨스트럭트를 포함하는, DNA-분자와 같은 재조합 핵산 분자가 또한 고려된다. 보다 특별하게, 관심있는 폴리펩티드에 연결된 단백질체 유도 서열(PBIS)을 인코딩하는 유전자를 정의하는 DNA 단편에 작동적으로 연결된 숙주 유기체 세포들에서 융합 단백질의 발현을 구동하기 위한 프로모터를 포함하는 유전자 벡터를 포함하는 재조합 DNA 분자가 또한 고려된다. 숙주 진핵 세포에서 적합한 형질주입 및 발현시 이 재조합 DNA 분자는 고려된 융합 단백질을 RPBLA로서 제공한다.
이 기술에서 잘 알려진 것처럼, 필요한 핵산, 예시적으로 DNA 서열이 존재하기만 하면(시작 및 멈춤 신호를 포함), 추가적인 염기쌍들은 보통 DNA 단편의 어느 한쪽 끝에 존재할 수 있고, 그 단편은 여전히 단백질을 발현하기 위해 이용될 수 있다. 물론, 이는 발현을 억제하는, 발현되기를 원하는 융합 단백질을 소비하는 추가적인 생성물을 발현하는, 바라는 그 융합 단백질에 의해 생성된 원하는 반응 생성물을 소비하는 생성물을 발현하는, 그렇지 않으면, DNA 단편의 유전자의 발현과 간섭하는 작동적으로 연결된 DNA 서열의 단편의 부재를 추정한다.
이처럼, DNA 단편이 이러한 간섭 DNA 서열이 없는 한, 본 발명의 DNA 단편은 그 길이가 약 500 내지 약 15,000 염기쌍일 수 있다. 필요시 복제 및 발현을 위해 필요한 최소 DNA 서열들 모두가 존재하면, 재조합 DNA 분자, 특히 발현 벡터의 최대 크기는 대부분 숙주 세포에 의해 수용될 수 있는 편의성과 벡터 크기에 의해 결정된다. 최소 벡터 크기는 잘 알려져 잇다.
앞서 기재된 융합 단백질을 인코딩하는 DNA 단편은 화학적 기술, 예를 들어, Matteucci 등, 1981 J. Am. Chem. Soc., 103:3185의 포스포트리에스테르 방법에 의해 합성될 수 있다. 물론, 코딩 서열을 화학적으로 합성함으로써, 임의의 원하는 변형들이 재래종(native) 아미노산 잔기를 인코딩하는 것들 대신 적절한 염기들을 치환함으로써 간단하게 만들어질 수 있다.
융합 단백질을 인코딩하는 유전자를 포함하는 DNA 단편들은 그 유전자를 포함하는 재조합 DNA 분자들(플라스미드 벡터들)로부터 얻어질 수 있다.
숙주 세포에서 융합 단백질 유전자의 발현을 안내하는 벡터는 본원에서는 "발현 벡터"라고 말한다. 발현 벡터는 프로모터를 포함하는 발현 조절 요소들을 포함한다. 융합 단백질-암호화 유전자는 발현 벡터에 작동적으로 연결되어 프로모터 서열이 융합 단백직-인코딩 유전자의 RNA 폴리머라아제 결합 및 발현을 안내하도록 한다. Paszkowski 등, 1989 EMBO J., 3:2719 and Odell 등, 1985 Nature, 313:810에 의해 기재된 바와 같이 유도가능하고, 바이러스성이고, 합성이고, 구성적이고, 그리고 일시적으로 조절되고, 공간적으로 조절되고, 그리고 Chua 등, 1989 Science, 244:174-181에서 제공된 바와 같이, 시공간적으로 조절되는 프로모터들은 폴리펩티드 암호화 유전자를 발현함에 있어 유용하다.
포유류, 조류 또는 곤충 등의 세포와 양립할 수 있는 것들과 같은, 진핵세포와 양립할 수 있는 발현 벡터들이 본원에서 고려된다. 이러한 발현 벡터들은 본 발명의 재조합 DNA 분자들을 형성하기 위해 사용될 수도 있다. 진핵세포 발현 벡터는 이 기술에 잘 알려져 있고 몇몇 상업적 소스로부터 이용가능하다. 정상적으로, 이러한 벡터는 원하는 DNA 단편 및 프로모터 서열의 삽입을 위한 하나 이상의 편리한 제한 부위를 포함한다. 선택적으로, 이러한 벡터는 진핵세포에서의 사용을 위해 특이적인 선택가능한 마커를 포함한다.
융합 단백질 인코딩 유전자가 작동적으로 어느 발현 벡터 및 궁극적으로 어느 프로모터에 연결되는 가에 대한 선택은 원하는 기능적 성질, 예를 들어, 단백질 발현의 위치 및 타이밍, 그리고 형질전환될 숙주 세포에 직접 달려 있다. 이들은 재조합 DNA 분자를 구성하는 기술에서 고유한 잘 알려져 있는 제한들이다. 그러나, 본 발명을 구현함에 유용한 벡터는 복사를 안내하고, 바람직하게는 작용적으로 연결되는 DNA 단편에 포함된 융합 단백질의 (발현 벡터를 위한) 발현을 안내할 수 있다.
고등 식물 및 고등 포유동물의 세포에서 유전자의 발현을 위해 유용한 전형적인 벡터들은 이 기술에 잘 알려져 있고, Rogers 등이 (1987) Meth in Enzymol., 153:253-277에서 기재한 아그로박테리움 투메파키엔스의 종양-유도(Ti) 플라스미드로부터 유래된 식물 벡터, 위의 포유동물 발현 벡터 pKSV-10, 및 pCI-neo (Promega Corp., #E1841, Madison, Wis.)를 포함한다. 그러나, 몇몇 다른 발현 벡터 시스템들은 Fromm 등(1985)이 Proc . Natl . Acad . Sci. USA, 82:58-24에 기재한 pCaMVCN 전이 조절 벡터를 포함하는 식물들에서 기능하는 것으로 알려져 있다. (Pharmacia사(Piscataway, N.J.)로부터 구입가능한) 플라스미드 pCaMVCN은 꽃양배추 모자이크 바이러스 CaMV 35S 프로모터를 포함한다.
VIII
.
재조합
단백질체
유사 조립체(RPBLA), 숙주 세포, 및 재조합
단백질체
유사 조립체(RPBLA) 생산 방법
천연 단백질체는 곡류의 배젖에서 만들어진다. 이들은 프롤라민 및 글루테린의 발현에 의해 유도된다. 단백질체는 조립된 단백질(예를 들어, 프롤라민 및 글루테린)이 매우 풍부하고 ER 또는 액포로부터 유래될 수 있는 막으로 둘러싸인 세포기관이다. 대부분의 단백질체들은 약 0.5 내지 약 3.0 마이크론의 직경을 갖는 둥근 형태(대략 구형) 구조이다.
재조합 단백질체 유사 조립체(RPBLA)는 세포 내에서 재조합 PBIS의 발현에 의해 형성될 수 있다. PBIS가 매우 풍부한 세포기관인 천연 단백질체과 유사하게, RPBLA는 PBIS가 매우 풍부한 재조합 세포기관이다. 세포기관에서 조립된 PBIS 또는 재조합 PBIS는 막으로 둘러싸인다. 세포에서, RPBLA는 통상적으로 세포의 세포질에서 발견되므로, 추가적인 막(원형질 막)으로 둘러싸인다. 이들 막들(원형질막 및 세포기관막)은 RPBLA 회수 과정동안 제거될 수 있고, 세포기관은 여전히 RPBLA로 여겨진다.
동물 세포들에서 발현시, RPBLA는 대개 구형이고, 약 0.5 내지 약 3 마이크론의 직경을 가지며, 주위 막을 가진다. 식물세포에서 발현된 RPBLA도 대개 구형이고, 약 0.5 내지 2 마이크론의 직경을 가지며, 막으로 둘러싸인다. 그러나, RPBLA는 때때로 형태가 비정형이고 불균일한 크기를 가질 수 있다.
일부 실시예에서, RPBLA는 최소 약 0.3, 최소 약 0.4, 또는 최소 약 0.5 마이크로미터이다. 일부 실시예에서, RPBLA는 약 3 마이크로미터 이하, 약 2.5 마이크로미터 이하, 또는 약 2 마이크로미터 이하이다. 일부 실시예에서, RPBLA는 약 0.3 내지 약 3.0 마이크로미터, 약 0.3 내지 약 2.5 마이크로미터, 또는 약 0.3 내지 약 2 마이크로미터이다. 일부 실시예에서, RPBLA는 약 0.5 내지 약 3.0 마이크로미터, 약 0.5 내지 약 2.5 마이크로미터, 또는 약 0.5 내지 약 2 마이크로미터이다.
일부 실시예에서, RPBLA는 다른 융합 단백질들 중에서 다를 수 있는 밀도를 가지지만, 제조된 특정 융합 단백질에 대해서는 숙주를 가로 질러서 예측될 수 있다. RPBLA의 소정 밀도는 통상적으로는 균질화액에 존재하는 실질적으로 내생 숙주 세포 단백질 전부의 밀도보다 높고, 통상적으로 약 1.1 내지 약 1.4 g/ml이다. RPBLA의 높은 밀도는 자기 조립되고 막과 관련된 규칙적인 응집체로 축적되는 재조합 융합 단백질들의 일반적 능력에 기인한다.
일부 실시예에서, RPBLA는 최소 약 1.0 g/ml의 밀도를 가진다. 일부 실시예에서, RPBLA는 약 1.1 내지 약 1.4 g/ml, 약 1.15 내지 약 1.35 g/ml, 또는 약 1.0 내지 약 1.3 g/ml의 밀도를 가진다. 일부 실시예에서, RPBLA는 단지 약 1.4 g/ml인 밀도를 가진다.
고려된 RPBLA는 위에서 언급된 밀도, 및 이들의 크기 및 형상을 특징으로 한다. 실시예, 물질 및 방법들에서 기재된 스텝-쿠션 이오딕사놀(Optiprep®) 밀도 구배는 주어진 RPBLA의 밀도를 판단하는 유용한 방법이다. RPBLA의 밀도를 판단하기 위해 사용될 수 있는 다른 보완적 또는 적합한 방법은 수크로오스, 글리세롤, 및 퍼콜과 같은 다른 밀도-제공 용질에 기반한 스텝-쿠션 밀도 구배를 포함한다.
또 다른 양태에서, 본 발명은
(i) 식물 숙주 시스템을 핵산 또는 본 발명에 따른 벡터로 형질전환하는 단계;
(ii) 상기 형질전환된 식물 숙주 시스템으로부터 식물을 생성하는 단계; 및
(iii) RPBLA 형성에 적합한 조건으로 상기 식물을 성장시키는 단계를 포함하는 RPBLA 생산 방법에 관한 것이다.
일부 실시예에서, RPBLA는 진핵세포에서 생산된다. 예를 들어, RPBLA는 식물, 동물, 곤충 또는 균류에서 생산될 수 있다. RPBLA의 생산을 위해 적합한 숙주 세포들은, 예로서, 고등 식물(예: 토마토, 담배, 아라비도프시스, 알팔파), 포유동물 세포(예: CHO, COS, 및 293T 세포), 사상균류(예: 트리코더마 리세이 및 아스퍼질럼 sp.), 곤충 세포를 포함한다. 본원에 참조로 포함되고, 본원에서 언급된 바와 같이 RPBLA를 생산하기 위해 사용될 수 있는 다른 예시적 숙주 세포들을 기재한 미국특허 제7,575,898 및 미국 공개출원 번호 제2006/0121573호를 참조하라. 일부 실시예에서, RPBLA는 담배 식물 세포에서 발현된다.
또 다른 실시예에서, 숙주 세포는 고등 진핵 세포이다. 고등 진핵세포는 포유동물 기원의 확립된 세포주를 포함한다. RPBLA를 발현하기 위해 다양한 포유동물 세포 배양 시스템이 유리하게 채용되는데, 이는 단백질이 대개는 올바르게 접혀지고, 적절하게 변형되고 완전히 기능적이기 때문이다. 적합한 포유동물 숙주 세포주의 예는 Gluzman(Cell 23:175, 1981)에 의해 기재된 원숭이 신장 세포의 COS-7 라인, 및 예를 들어, L 세포, C127, 3T3, 중국 햄스터 난소(CHO), HeLa 및 BHK 세포주를 포함하는 적합한 벡터를 발현할 수 있는 기타 세포주를 포함한다. 곤충 세포에서 이종 단백질을 생산하기 위한 바큐로바이러스 시스템이 Luckow and Summers에 의해 Bio / Technology 6:47 (1988)에서 검토되었다.
RPBLA는 잎, 곡물, 뿌리 및 떡잎과 같은 다른 조직에서 생산될 수 있다. 일부 실시예에서, RPBLA는 담배 잎 세포에서 발현된다.
아래에 더욱 상세히 기재된 바와 같이, RPBLA는 재조합 PBIS 또는 재조합 PBIS를 포함하는 융합 단백질을 인코딩하는 폴리뉴클레오티드를 포함하는 숙주 세포를 RPBLA 형성을 위한 적합한 조건에서 배양함으로써 생산될 수 있다. 예를 들어, RPBLA는 식물 숙주 세포를 재조합 PBIS 또는 재조합 PBIS를 포함하는 융합 단백질을 인코딩하는 서열을 포함하는 폴리뉴클레오티드로 형질전환하여, 숙주 세포로부터 형질전환된 식물을 생성하고, 그 식물을 RPBLA 형성에 적합한 조건에서 성장시킴으로써 식물 숙주 세포에서 생산될 수 있다.
RPBLA 형성을 위해 적합한 특정 조건은 실시예에 기재되어 있다. RPBLA 형성에 적합한 다른 조건은, 본원에 기재된 바와 같이 재조합 PBIS를 발현하고 이러한 공지된 재조합 PBIS의 능력에 접근하여 시험된 조건에서 RPBLA를 형성함으로써, 이 기술에서 통상의 지식을 가진 자에 의해 판단될 수 있다.
IX
.
재조합
PBIS
를 포함하는 융합 단백질 및 목적 단백질의
RPBLA
의 정제
본 발명에 따른 RPBLA는 알려져 있는 방법을 사용하여 정제될 수 있다. 특히, RPBLA는 숙주 세포에 존재하는 다른 단백질들에 비해 상대적으로 더 조밀하기 때문에, RPBLA는 특히 세포의 균질화액의 원심분리에 의해 수집됨에 있어 수정가능하다.
그러므로, 또 다른 양태에서, 본 발명은 (i) 본 발명에 따른 숙주 세포를 RPBLA 형성을 위한 적합한 조건에서 배양하는 단계; 및 (ii) 재조합 단백질체를 정제하는 단계를 포함하는 RPBLA 정제 방법에 관한 것이다. 또 다른 양태에서, RPBLA 생산 방법은
(i) 식물 숙주 시스템을 핵산 또는 본 발명에 따른 벡터로 형질전환하는 단계;
(ii) 상기 형질전환된 식물 숙주 시스템으로부터 식물을 생성하는 단계;
(iii) RPBLA 형성에 적합한 조건으로 상기 식물을 성장시키는 단계; 및
(iv) 상기 RPBLA를 정제하는 단계를 더 포함한다.
이처럼, 바람직한 실시예에서, 상기 RPBLA의 정제는
(i) 수용성 세포 균질화액을 제조하는 단계;
(ii) 상기 수용성 세포 균질화액에 다른 밀도 영역들을 형성하여 RPBLA의 농도 증가를 포함하는 영역과 상기 RPBLA 농도 감소를 포함하는 영역을 제공하는 단계;
(iii) 상기 RPBLA-감소된 영역을 상대적으로 증가된 농도의 RPBLA 영역으로부터 분리하여 RPBLA를 정제하는 단계를 포함한다.
이처럼, 상이한 밀도의 영역들은 균질화액 내에 형성되어 상대적으로 증가된 농도의 RPBLA를 포함하는 영역과 상대적으로 감소된 농도의 RPBLA를 포함하는 영역을 제공한다. RPBLA-감소된 영역은 상대적으로 증가된 농도의 RPBLA 영역으로부터 분리되어 상기 RPBLA를 정제한다.
RPBLA가 일단 정제되면, 채집된 RPBLA는, RPBLA가 경구 백신으로서 사용된 곳에서처럼, 융합 단백질을 분리할 필요없이, 현재 그대로 사용된다. 그러나, RPBLA의 농도가 상대적으로 증가된 영역은 이후 모아지거나, 하나 이상의 시약으로 처치되거나, 혹은 거기에서 RPBLA 또는 융합 단백질의 분리에 앞서 하나 이상의 절차를 받을 수 있다. 이처럼, 또 다른 양태에서, 본 발명은
(i) 막으로 둘러싸인 본 발명에 따른 융합 단백질을 포함하는 RPBLA를 제공하는 단계;
(ii) 상기 RPBLA를 막 분해할 수 있는 양의 계면활성제 및/또는 환원제를 포함하는 수용성 완충제와 접촉시키는 단계;
(iii) 상기 막을 분리하기에 충분한 시간 동안 상기 융합 단백질을 변성시키지 않는 온도에서 상기 접촉을 유지하여 상기 막을 상기 융합 단백질로부터 분리하는 단계; 및
(iv) 상기 분리된 융합 단백질을 채집하는 단계를 포함하는 융합 단백질 정제방법에 관한 것이다.
생물학적으로 활성인 폴리펩티드를 포함하는 융합 단백질은 세제 및/또는 환원제를 포함하는 수용성 완충제에서 주위 막을 용해시킴으로써 채집된 RPBLA로부터 얻어질 수 있다. 예시적인 환원제는, 단백질 분리 방법에 앞서, 2-머캅토에탄올, 티오글리콜산 및 티오클리콘산염, 디티오트레이톨(DTT), 설파이트 또는 바이설파이트 이온을 포함한다. 다른 이온성(데옥시콜레이트, N-라우로일사르코신 등), 비이온성(트윈 20, Nonidet P-40, 옥틸 글루코시드 등), 및 양성이온(CHAPS, Zwittergent.TM. 3-X serie 등) 계면활성제가 사용될 수 있지만, 소듐 도데실 설페이트(SDS)는 바람직한 세제이다. 융합 단백질을 용해시키거나 분산시키는 최소량의 계면활성제가 사용된다.
재조합 PBIS 또는 재조합 PBIS를 포함하는 융합 단백질이 임의의 다른 적합한 방법에 따라 정제될 수 있다. 단백질 정제를 위한 표준 방법은 크로마토그라피(예: 이온 교환, 친화도 및 사이징 컬럼 크로마토그라피), 원심분리, 용해도 차이법, 또는 임의의 다른 표준 기술을 포함한다. 헥사히스티딘, 말토오스 결합 도메인, 인플루엔자 코트 서열 및 글루타티온-S-트란스페라제와 같은 친화성 태그들이 단백질에 부착되어 적절한 친화성 컬럼 위로 통과시 정제를 쉽게 할 수 있다.
분리된 단백질들은 단백질 가수분해, 핵 자기 공명 및 x-선 결정학과 같은 공지된 기술들을 이용하여 물리적 특징이 분석될 수 있다.
또 다른 양태에서, 본 발명은
(i) 막으로 둘러싸인 본 발명에 따른 융합 단백질을 포함하는 RPBLA를 제공하는 단계;
(ii) 상기 RPBLA를 막 분해할 수 있는 양의 계면활성제를 포함하는 수용성 완충제와 접촉시키는 단계;
(iii) 상기 막을 분리하기에 충분한 시간 동안 상기 융합 단백질을 변성시키지 않는 온도에서 상기 접촉을 유지하여 상기 막을 상기 융합 단백질로부터 분리하는 단계;
(iv) 상기 분리된 융합 단백질을 채집하는 단계; 및
(v) 상기 재조합 PBIS 및 이종 단백질 사이의 분할 부위를 분할하는 단계를 포함하는 융합 단백질 정제방법에 관한 것이다.
융합 단백질은 동물, 동물 세포 배양액, 식물 또는 식물 세포 배양액, 균류 배양액, 곤충 세포 배양액 또는 조류 배양액과 같은 진핵 숙주 세포계를 (i) 재조합 PBIS를 인코딩하며 제 2 핵산에 작동적으로 연결된 제 1 핵산, 및 (ii) 생물학적으로 활성인 관심있는 폴리펩티드 생성물을 인코딩하는 제 2 핵산 서열을 포함하는 핵산 서열(DNA 또는 RNA)로 형질전환하는 단계를 포함하는 방법에 따라 제조될 수 있다. 바이러스성 형질도입 또는 감염을 통하는 것과 같이 DNA를 도입하는 간접 수단의 사용이 또한 고려되고, 형질주입과 같은 직접 DNA 전달 방법과 상호교환적으로 사용될 것이다.
형질전환된 숙주 세포 또는 개체(entity)는 소정 시간 동안 융합 단백질의 발현 및 발현된 융합 단백질의 RPBLA로의 조립에 적합한 배양 조건에서 유지된다. 발현시, 결과적인 융합 단백질은 형질전환된 숙주계에 RPBLA로서 축적된다. 첨가된 영양소 또는 보충제를 함유하는 동물 식품의 경우, 융합 단백질은 이후 숙주 세포로부터 회수되거나 융합 단백질을 포함하는 숙주 세포가 원하면 사용될 수 있다. 융합 단백질은 RPBLA의 일부로서 분리될 수 있고 혹은 RPBLA 없이 분리될 수 있다.
융합 단백질의 발현에 적합한 배양 조건들은 통상적으로는 숙주 개체 또는 숙주 세포의 각 유형에 대해 다르다. 그러나, 이러한 조건들은 통상의 지식을 가진 자들에게 알려져 있고 쉽게 판단된다. 유사하게, 유지 지속시간은 숙주 세포마다 그리고 제조를 원하는 융합 단백질의 양에 따라 다를 수 있다. 다시, 이러한 조건들은 잘 알려져 있고 특정 상황들에서 쉽게 판단될 수 있다. 추가로, 특이적 배양 조건들은 본원에서 인용문헌 및 실시예들로부터 얻어질 수 있다.
또 다른 특별한 실시예에서, 융합 단백질은 동물, 동물 세포 배양액, 식물, 식물 세포 배양액, 균류 또는 조류를 앞서 언급한 핵산 서열 (i)과 (ii) 외에, 스페이서 아미노산 서열에 대해 암호화하는 인 프레임 핵산 서열 (iii)으로 형질전환하는 단계를 포함하는 방법에 따라 제조된다. 스페이서 아미노산 서열은 앞서 언급된 바와 같이, 효소 또는 화학적 수단에 의해 분할가능한 아미노산 서열이거나 분할되지 않는 아미노산 서열일 수 있다. 특별한 일 실시예에서, 핵산 서열 (iii)은 상기 핵산 서열 (i)과 (ii) 사이에 놓인다. 예를 들어, 제3 핵산 서열 (iii)의 3' 말단은 제2 핵산 서열 (ii)의 5' 말단에 연결된다. 또 다른 실시예에서, 제3 핵산 서열 (iii)의 5' 말단은 제2 핵산 서열 (ii)의 3' 말단에 연결된다.
곤충 세포계도 고려된 융합 단백질을 발현하기 위해 사용될 수 있다. 예를 들어, 이러한 하나의 계에서, 오토그라파 캘리포니아 핵 다면체(Autographa californica nuclear polyhedrosis) 바이러스(AcNPV) 또는 바큐로바이러스는 스포돕테라 프루기페르다(Spodoptera frugiperda) 세포 또는 트리촙루시아 라배(Trichoplusia larvae)로 외래 유전자를 발현하기 위한 벡터로서 사용된다. 융합 단백질을 인코딩하는 서열들은 폴리헤드린 유전자와 같이 바이러스의 비필수 영역으로 복제될 수 있고, 폴리헤드린 프로모터의 조절 하에 놓일 수 있다. 융합 단백질 서열의 성공적인 삽입으로 폴리헤드린 유전자가 비활성이 되고 코트 단백질이 부족한 재조합 바이러스가 생산된다. 이후 재조합 바이러스들은, 예를 들어, Engelhard et al.(1994) Proc. Natl. Acad. Sci., USA, 91:3224-3227; 및 V. Luckow, "Insect Cell Expression Technology", pages 183-218, in Protein Engineering: Principles and Practice, J. L. Cleland et al. eds., Wiley-Liss, Inc. 1996에 기재된 바와 같이 예를 들어, 융합 단백질이 발현될 수 있는 S. Frugiperda 세포 또는 Trichoplusia larvae를 감염시키기 위해 사용될 수 있다. 오토그라파 캘리포니아 핵 다면체 바이러스의 폴리헤드린 프로모터의 조절 하에 놓인 이종유전자들은 종종 감염의 늦은 단계 동안 높은 레벨로 발현된다
융합 단백질 유전자를 포함하는 재조합 바큐로바이러스들은 Bac-To-Bac.TM. 바쿠로바이러스 발현계(Life Technologies)로서 상업적으로 판매되는 바큐로바이러스 셔틀 벡터계를 이용하여 구성된다(Luckow et al., 1993 J. Virol., 67:4566-4579). 재조합 바이러스들의 군체들이 제조되고 재조합 단백질의 발현은 표준 프로토콜에 의해 탐지된다(O'Reilly et al., Baculovirus Expression Vectors: A Laboratory Manual, W.H. Freeman and Company, New York, 1992; 및 King et al., The Baculovirus Expression System: A Laboratory Guide, Chapman & Hall, London, 1992). 이 기술에 통상의 지식을 가진 자에게 알려진 바와 같이 T. Kost 및 공동연구자들(예를 들어, Merrihew 등, 2004 Methods Mol . Biol . 246:355-365 참조)에 의해 기재된 'BacMam' 시스템과 같이, 포유동물 세포들에서 바큐로바이러스 또는 다른 전달 벡터들의 사용이 현재의 발명에서 또한 고려된다.
통상적으로 식물 발현계는 삽입된 이식유전자의 계통적 또는 구성적 발현을 제공한다. 계통적 발현은 식물의 대부분 또는 전부가 RPBLA 및 그의 융합 단백질의 소스로서 사용되는 경우 유용할 수 있다. 그러나, RPBLA와 그의 융합 단백질 함량을 입자들이 더 쉽게 분리 또는 섭취될 수 있는 뿌리, 씨앗, 또는 과일과 같은 식물 저장 기관에서 발현시키는 것이 더 효과적일 수 있다.
저장 기관 발현을 성취하는 한 가지 방식은 하나 이상의 미리 선택되거나 미리 결정된 비광합성 식물 기관에서 그의 조절된 유전자를 발현하는 프로모터를 사용하는 것이다. 뿌리, 씨앗 또는 과일 대 잎 또는 줄기와 같이 하나 이상의 미리 선택된 저장 기관들에서의 발현은 거의 없고, 다른 기관에서 전혀 발현이 없는 발현을 본원에서는 향상된 또는 우선적 발현이라고 한다. 하나의 저장 기관에서만 실질적으로 발현이 있고 다른 저장 기관에서는 실질적으로 발현이 없는 것을 기관-특이적 발현이라고 하고, 즉 약 100:1 이상의 다른 저장 기관에 대한 어떤 저장 기관의 발현 생성물 비는 기관 특이성을 나타낸다. 그러므로, 저장 기관-특이적 프로모터들은 저장 기관-향상 프로모터들의 클래스의 멤버들이다.
예시적인 식물 저장 기관들은 당근, 토란 또는 카사바(manioc), 감자 덩이줄기의 뿌리들, 및 붉은 구아바, 시계꽃 열매, 망고, 파파야, 토마토, 아보카도, 체리, 탄제린, 만다린, 야자, 멜론 써치 칸탈루프 및 워터멜론과 같은 과육 및 호박, 오이, 망고, 살구, 복숭아와 같은 기타 육과, 그리고 옥수수 씨, 대두, 쌀, 지방 종자 평지 등을 포함한다.
아그로박테리아 투메파시엔스를 이용한 식물 세포들의 형질주입은 통상적으로 쌍떡잎 식물에서 가장 잘 수행된다. 외떡잎식물들은 보통 원형질체들의 소위 직접 유전자 전이에 의해 가장 쉽게 형질전환된다. 직접 유전자 전이는 보통 전기천공법에 의해, 폴리에틸렌 글리콜-중재 전이에 의해, 또는 필요한 DNA를 나르는 마이크로프로젝타일에 의한 세포 충돌에 의해 수행된다. 이들 형질주입의 방법들은 이 기술에서 잘 알려져 있고 본원에서 더 논의될 필요는 없다. 식물 조직으로부터 원하는 단백질을 얻기 위한 기술로서 형질주입된 세포들 및 원형질체들로부터 전체 식물들을 재생하는 방법들은 잘 알려져 있다. (미국특허 제5,618,988호 및 제5,679,880호 및 거기에 있는 인용들을 참조).
아그로박테리아 형질전환, 전기천공법 또는 다른 방법들을 이용하여 형성된 이식유전자를 가진 식물은 통상적으로 하나의 염색체에 대해 하나의 유전자를 포함한다. 이식유전자를 가진 식물은 또한 추가된 구조적 유전자에 대해 동형접합(homozygous), 즉 두 개의 추가된 유전자들을 포함하고, 염색체 쌍의 각 염색체 위의 동일 장소에서 하나의 유전자를 포함하는 이식유전자를 가진 식물일 수 있다. 동형접합의 이식유전자를 가진 식물은 하나의 추가된 유전자를 포함하는 독립적인 분리개체의 이식유전자를 가진 식물을 교배(자가수정)하고, 생산된 씨앗의 일부를 싹트게 하고 대조군(재래종, 이식유전자를 갖지 않은) 또는 독립적인 분리개체 이식유전자를 가진 식물에 상대적인 향상된 키머(chimer) 입자 축적을 위해 생산된 결과적인 식물들을 분석함으로써 얻어질 수 있다. 동형접합의, 이식유전자를 가진 식물은 고유한, 이식유전자를 갖지 않은 식물 및 독립적인 분리개체의 이식유전자를 가진 식물 양자와 비교시 향상된 키머 입자 축적을 보여준다.
이 기술에 통상의 지식을 가진 자는 기재된 바와 같이 본 발명을 이용하여 생산될 수 있는 단백질 또는 펩티드의 선택은 크고 가변적이라는 것을 이해할 것이다. 이들은, 예를 들어 산업 효소, 항원, 사이토카인, 수용체, 작용제, 기능식품 단백질, 부가 생성물, 약학적으로 활성 단백질 등일 수 있다. 이는 제한없이 16ESH, CTB, Gb, Les, TB, PAP, Cap, E2, NP, Her, 글루코사 옥시다아제, 글루코스 이소메라제, 페록시다아제, 대안적 옥시다아제, GOOX, 베타-갈락토시다아제, 글루코스 아밀라아제, 리파아제, 다용도 리파아제, 클로로페록시다아제, 크실로오스(Xylose) 이소메라제, Mn 페록시다아제, 카탈라아제, 포름산염 디하이드로게나아제, 알코올 디하이드로게나아제, 알파1 안티트립신, 디펜신, 인간 성장 호르몬, GM-CSF, EGF, 헤파토사이트 성장 인자 를 포함한다. 이 목록은 결코 철저하지 않다는 것이 이해될 것이다.
X.
약으로서
RPBLA
들의 용도
본원에서 기재된 바와 같이, RPBLA들의 형성은 재조합 PBIS를 포함하는 융합 단백질들이 매우 간단한 기술들을 이용하여 정제될 수 있도록 한다. 그러므로, 재조합 PBIS 및 목적 단백질을 포함하는 융합 단백질들은 쉽게 발현되어 정제될 수 있다. 일부 실시예에서, 목적 단백질은 치료 단백질이다. 그와 같이, 치료제는 재조합 PBIS 및 목적 단백질을 포함하는 융합 단백질을 정제하고 본원에 기재되거나 이 기술에 공지된 방법들을 사용하여 재조합 PBIS를 선택적으로 제거함으로써 제형화될 수 있다. 이후 분리된 목적 단백질은 공지된 기술들에 따라서 약제학적 용도로 제형화될 수 있다.
이처럼, 일부 실시예에서, 본원에 기재된 방법들에 의해 얻어지는 융합 단백질 또는 목적 단백질은 "약제학적으로 허용가능한(pharmaceutically acceptable)" 형태로 제형화된다. "약제학적으로 허용가능한"이란 말은 타당한 치료적 판단의 범위 내에서, 타당한 이익/위험 비와 어울리는 과도한 독성 또는 기타 합병증 없이 인간 및 동물들의 조직과 접촉을 위해 적합할 수 있는 생물학적 생성물을 말한다.
본원에 기재된 방법들에 의해 얻어진 융합 단백질 또는 목적 단백질은 인간을 포함하는 포유동물에게 투여하기 위한 약제학적 조성물로 제형화될 수 있다. 본 발명의 방법들에서 사용된 약제학적 조성물들은, 예를 들어, 이온 교환제, 알루미나, 알루미늄 스테아레이트, 레시틴, 인간 혈청 알부민과 같은 혈청 단백질, 인산염, 글리신, 소르브산, 소르브산염 칼륨, 포화 식물성 지방산의 부분 글리세라이드 혼합물, 물, 프로타민 설페이트, 인산수소이나트륨, 인산수소칼륨, 염화칼륨, 아연염, 콜로이드성 실리카, 마그네슘 트리실리케이트, 폴리비닐 피롤리돈, 셀룰로오스계 물질들, 폴리에틸렌 글리콜, 소듐 카복시메틸셀룰로오스, 폴리아크릴레이트, 왁스, 폴리에틸렌-폴리옥시프로필렌-블록 고분자, 폴리에틸렌 글리콜 및 양모지와 같은 염 또는 전해질를 포함하는 약제학적으로 허용가능한 운반제를 포함한다.
본 발명의 방법들에서 사용된 조성물들은 임의의 적합한 방법, 예를 들어, 비경구적으로, 심실내로, 경구적으로, 흡입 스프레이로, 국소적으로, 직장으로, 비강으로, 구강으로, 질 동맥으로, 또는 주입된 저장기관을 통하여 투여될 수 있다. 본원에서 사용된 바와 같이 "비경구적(parenteral)"이란 용어는 피하의, 정맥내의, 근육내의, 관절 내의, 윤활액 분비 관절 내의, 흉골 내의, 척추 강내의, 담관 내의, 병소 내의, 및 두개 내의 주사 또는 주입 기술들을 포함한다.
임의의 특정 환자를 위한 특정 복용량 및 치료 계획은 사용된 특별 항체, 환자의 나이, 체중, 일반적 건강, 성별, 및 다이어트를 포함하는 다양한 인자들에 달려 있으며, 투여 시간, 분비율, 약 조합, 및 치료될 특정 질환의 심각성을 포함하는 다양한 인자들에 달려있을 것이다. 의료진들에 의한 이러한 인자들의 판단은 이 기술에서 통상의 범위 내이다. 양은 치료될 개별 환자, 투약 경로, 제형의 종류, 사용된 화합물의 특징들, 질병의 심각성, 및 원하는 효과에 의존할 것이다. 사용되는 양은 이 기술에 잘 알려져 있는 약물학 및 약물동력학 원리들에 의해 판단될 수 있다.
또한, RPBLA들은 자체적으로 치료적으로 사용될 수 있다. 예를 들어, 백신 및 접종물에서 RPBLA들의 사용은 전체가 본원에 참조로서 결합되어 있는 미국 공개출원번호 제2007/0243198호에 앞서 기재되었다.
RPBLA들은 인간 환자 또는 침판지, 마우스, 쥐, 말, 양, 소, 개, 고양이 등과 같은 다른 적합한 동물 숙주에서 접종원 또는 백신의 면역원으로서 사용될 수 있다. 접종원은 면역원 에피토우프 또는 항체 결정인자와 면역반응하는 항체들의 생산과 같은 B 세포 또는 T 세포 반응(자극), 또는 이러한 에피토우프에 대한 T 세포 활성화를 유도할 수 있고, 반면에 백신은 면역원이 B 세포 또는 T 세포 반응 중 하나 또는 양자를 통해 유도되었던 개체에 대항하는 보호를 제공한다.
고려된 백신 또는 접종원의 RPBLA들은 RPBLA들을 둘러싸고 그들의 양을 처리하는 수지상 세포들 및 단핵 백혈구/대식세포와 가은 항원 제공 세포(APC)들에 작용할 수 있다. 이러한 세포 유형들에 작용시, RPBLA들은 항원 제공 세포들에게 항원 전달을 개선할 수 있다. 이러한 RPBLA들은 또한 항원 제공 세포들에 대한 항원 처리 및 제공을 개선할 수 있다.
이처럼, 백신 또는 접종원은 약제학적으로 허용가능한 희석제에서 면역성의, 효과적인 양의 재조합 단백질체(RPBLA)들을 용해하거나 분산시킴으로써 생산될 수 있다. RPBLA들은 재조합 융합 단백질을 포함할 수 있고, 상기 재조합 융합 단백질 자체는 서로 연결된 두 개의 서열을 포함한다: 한 서열은 재조합 PBIS이고, 나머지 서열은 면역반응이 상기 백신 또는 접종원에 의해 유도되는 생물학적 활성 폴리펩티드이다.
T 세포 활성화는 다양한 기술에 의해 측정될 수 있다. 실제로는, 숙주 동물은 고려된 RPBLA 백신 또는 접종원으로 접종되고, 말초혈액 단핵구 세포(PMBC)는 이후 수집된다. 이들 PMBC는 이후 약 3 내지 5일 동안 생물학적으로 활성인 폴리펩티드(T 세포 면역원)의 존재 하에서 시험관 내에서 배양된다. 배양된 PMBC는 이후 IL-2, IFN-감마의 GM-CSF와 같은 사이토킨의 증식 또는 분비를 위해 분석된다. T 세포 활성화에 대한 분석은 이 기술에 잘 알려져 있다(예를 들어, 미국특허 제5,478,726호 및 거기에 인용된 기술을 참조).
고려된 접종원 또는 백신은 통상적으로는 물 또한 함유하는 약제학적으로 허용가능한 희석제 조성물에 용해되거나 분산되는 면역학적으로 효과적인 양의 RPBLA들을 포함한다. 생물학적으로 활성인 폴리펩티드에 대한 면역 반응이 면역을 필요로 하는 숙주 동물과 같은 백신 또는 접종원에 의해 유도되거나 항체들이 유도되기를 바라는 포유동물(예를 들어, 마우스, 개, 염소, 양, 말, 소, 원숭이, 유인원 또는 인간) 또는 새(예를 들어, 닭, 칠면조, 오리 또는 거위)와 같은 숙주 동물에 투여시, 접종원은 표적이 되는 생물학적으로 활성인 폴리펩티드의 하나 이상의 항원 결정인자와 면역반응하는 항체들을 유도한다.
각 면역에서 사용된 RPBLA 면역원의 양은 면역학적 유효량이라고 하고, 넓게는 그 중에서도 RPBLA 면역원, 면역된 환자, 및 백신에서 보조제의 존재에 의존한다. (i) 백신 및 (ii) 접종원에 대한 면역학적 유효량들은 앞서 논의된 (i) 보호 또는 (ii) 항체 또는 T 세포 활성을 각각 제공한다.
백신 또는 접종원들은 통상적으로 접종 당 약 1 마이크로그램 내지 약 1 밀리그램(단위 투여량), 바람직하게는 약 10 마이크로그램 내지 약 50 마이크로그램의 RPBLA 면역원 농도를 포함한다. "단위 투여량"이란 용어는, 본 발명의 백신 또는 접종원에 관한 것일 때, 동물들을 위한 단위 복용량으로서 적합한 물리적으로 이산적인 단위들을 말하고, 각 단위는 원하는 희석제, 즉, 운반제 또는 이송제와 관련하여 원하는 면역원 효과를 개별적으로 또는 집합적으로 생성하기 위해 계산된 활성 물질의 소정 양을 포함한다.
백신 또는 접종원들은 전형적으로는 생리학적으로 타당한(허용가능한) 희석제 이송제, 예를 들어 물, 식염수, 인산염-완충 식염수(PBS), 아세트산염-완충 식염수(ABS), 링거액, 등에 면역원을 특별한 형태로 분산시켜서 수용액 조성물을 형성함으로써 회수된 RPBLA 면역원으로부터 제조된다. 희석제 이송체는 이하에서 논의되는 바와 같이 또한 땅콩유, 스쿠알란, 또는 스쿠알렌을 포함할 수 있다.
단백질성 물질을 활성 성분으로서 포함하는 접종원 및 백신의 제조는 이 기술에서 잘 이해된다. 통상적으로, 이러한 접종원 또는 백신들은 액체 용액 또는 현탁액 중 어느 하나로서 비경구제로서 제조되고; 주사 전 액체로 있는 용액 또는 현탁액을 위한 고체 형태들이 제조될 수 있다. 제조품은 에멀션화될 수도 있는데, 이것이 특히 바람직하다.
면역적으로 활성인 RPBLA들은 약제학적으로 허용가능하고 활성 성분과 양립할 수 있는 부형제들과 종종 혼합된다. 적합한 부형제들은, 예를 들어, 물, 식염수, 덱스트로스, 글리세롤, 에탄올 등 및 이들의 조합들이다. 아울러, 원하면, 접종원 또는 백신은 조성물의 면역성 효과를 향상시키는 미량의 보조 물질들, 예를 들어 습식 또는 에멀션화제, pH 완충제를 포함할 수 있다.
XI
.
식품으로서
RPBLA
들의 용도
또한 RPBLA는 음식물의 영양가를 증대시키기 위하여 이용될 수도 있다. 예를 들어, 융합 단백질은 재조합 PBIS 및 영양가 있는 단백질이나 펩티드(예컨대, 필수 아미노산 내에 풍부한 펩티드)를 포함하며 식품으로 발현될 수 있다. 이러한 융합 단백질은 일부 실시예에서, 와일드 타입 PBIS 보다 덜 알레르기성인 재조합 PBIS를 포함한다. 본 발명의 저자들은 본 발명에 따른 PBIS가, 비변형된 제인 PBIS와 비교시, 예상되는 알레르기의 감소를 나타낸다는 것을 관찰하였다. 또한, 이러한 관찰을 기초로 본 발명의 저자들은 감소된 알레르기를 나타내는 신규 PBIS(이하에서 RX3-LA1 및 RX3-LA2로 칭함)를 또한 개발하였다.
따라서, 다른 양태에서, 본 발명은 PBIS의 비 알레르기성 버전에 관한 것으로, 상기 PBIS는 RX3-LA1 (서열번호 60) 및 RX3-LA2 (서열번호 61)로 이루어진 군에서 선택된다.
RX3-LA1 (서열번호 60)
THTSGGCGCA PPPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPAAAP PPPCHYPTAP ARPAPAPAPA PCPCAAPAPS PCQ
RX3-LA2 (서열번호 61)
THTSGGCGCA PPPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPAAAP PPPCHYPPAP APPAPAPPAP ACPCAAPAPS PCQ
일부 실시예에서, 재조합 PBIS는 와일드 타입 PBIS, 예컨데, 옥수수 감마-제인의 PBIS 보다 알레르기성이 덜하다.
알레르기는 본원에서 설명된 방법 또는 당업계에서 알려진 다른 방법들에 따라 판단될 수 있다. 예를 들어, 아미노산 서열 상동성이 알레르기 포텐셜을 평가하는 데 사용되었다. 서열 상동성 비교는 신규 발현되거나 식별된 단백질이 공지의 알레르기와 구조가 어느 정도 유사한지를 결정하는 데 사용될 수 있다. 이러한 정보로 그 단백질이 알레르기 포텐셜을 갖는지를 예측할 수 있다. 이러한 비교는 FASTA 또는 BLASTP와 같은 다양한 알고리즘을 이용하여 수행되어 전체적인 구조적 유사성을 예측할 수 있다. 신규 발현되거나 식별된 단백질과 공지의 알레르겐 사이의 IgE 교차 반응성은 80 이상의 아미노산의 단편에서 35 퍼센트 이상의 동일성이 있는 경우 가능성 있는 것으로 간주될 수 있다(유엔 식량농업기구 및 세계보건기구, 2001). 또한 기타 과학적으로 정당한 기준이 IgE 교차 반응성을 예측하는 데 사용될 수 있다.
일부 실시예에서, 재조합 PBIS의 식품알레르기는 FARRP(Food Allergy Research and Resource Program)이 개발한 알레르겐 온라인 데이터베이스(Allergen Online Database)(버전 10.0, 2010년 1월; http://www.allergenonline.com)를 이용하여 결정된다. 따라서, 일부 실시예에서, 재조합 PBIS는 알레르겐 온라인 데이터베이스를 이용하면 옥수수 감마-제인의 PBIS보다 알레르기성 펩티드에 대한 35%초과의 동일성을 가지는 결과(hit)들은 많지 않다.
일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 9개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 8개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 7개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 6개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 5개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 4개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 3개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 2개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 1개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 결과들을 아무것도 포함하지 않는다.
일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 9개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 8개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 7개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 6개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 5개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 4개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 3개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 2개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 1개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 결과들을 어느 것도 포함하지 않는다.
여러 기술들이 알레르기의 투여 후 발생하는 알레르기성 반응을 판단하기 위해 발전되어 왔다. 일례로, IgE의 존재, 알레르기와 관련된 면역 글로불린이 ELISA 검정 및 ELISA 비교 시험에 의해 판단될 수 있다. Kim 등의 Yonsei Medical Journal 47: 505-12 (2006) 및 Fritsche의 Toxicology letters 140-141:303-309 (2003), 양자 모두가 그 전체가 본원에 참고로 포함된다. 일부 실시예에서, 재조합 PBIS는 옥수수 감마-제인의 PBIS과 비교시 생체 내에서 감소된 IgE 항체 응답을 일으킨다. 일부 실시예에서, 재조합 PBIS는 옥수수 감마-제인의 PBIS와 비교시 알레르기 피부단자 시험에서 감소된 응답을 일으킨다.
또한, 펩신 소화에 대한 저항성이 몇몇 음식 알레르겐에서 관찰되었다. 따라서, 펩신에 의한 소화 저항성과 알레르기 포텐셜 간에는 상관관계가 존재한다. 미국 약전(United States Pharmacopoeia)(1995)에 개략 서술된 방법이 상관관계를 수립하는 데 사용되었다. 그 전체가 참조로 본원에 포함된 Astwood 등의 Nat Biotechnol 14:1269-73 (1996). 따라서, 적절한 조건에서 펩신의 존재 하에서의 단백질의 분해 저항성은 단백질이 알레르기성 포텐셜을 가질 수 있음을 나타낸다. 일부 실시예에서, 재조합 PBIS는 옥수수 감마-제인의 PBIS 보다 펩신의 존재 하에서 단백질 분해에 대한 저항성이 덜하다.
신규 발현되거나 식별된 단백질의 알레르기성 포텐셜의 가능성을 판단하기 위해 추가 분석이 수행될 수 있다. 생체 외 과정도 또한 세포나 조직 배양을 이용하여 알레르기성에 대한 시험으로 기술되었다. 유전자 변형 식품의 알레르기성에 대한 평가: 바이오기술에서 유래된 식품의 알레르기성에 대한 FAO/WHO 공동 전문가 상담 보고서(Report of Joint FAO/WHO Expert Consultation on Allergenicity of Foods Derived from Biotechnology); 유엔 식량농업기구; 이태리, 로마(2001)). 이러한 기술들 중 하나는 알레르기 유발 항원요소의 능력을 촉발하는 IgE 중재된 비만 세포가 생체내 기능성 검정을 이용하여 측정될 수 있다는 사실에 기초한다. 수동적으로 특정 쥐 IgE에 민감하며 3H-용액으로 표지화된 복막 쥐 비만 세포에 기초하여, 세포가 알레르겐의 표준 희석에 의해 매개체의 유리를 위해 촉발된다. Fritsche의 Toxicology letters 140-141:303-309 (2003). 따라서, 일부 실시예에서 재조합 PBIS는 옥수수 감마-제인의 PBIS와 비교 시 감소된 매개체 유리를 일으킨다.
IgE 의존성 알레르기 반응은 2단계로 이루어진다. 제1 단계는 유도 단계로 숙주의 면역계가 알레르겐에 의해 민감하게 되는 단계이다. 그 결과, 특정 IgE 항-알레르겐 항체가 생성된 후 항체가 표적 기관의 비만 세포에 고정된다. 제2 단계는 알레르겐이 이러한 IgE 항체에 결합하여 비만 세포로부터 매개체(히스타민) 유리를 촉진함으로서 매개되는 촉발 단계이다. 항원의 알레르기성을 평가하기 위해, 기본적으로 그 전체가 본원에 참조로 포함된 Fritsche의 Toxicology letters 140-141:303-309 (2003)에 기술된 것과 같은 적절한 생체 내 시험에 의해 조사될 수 있다. 따라서, 예를 들어, 일부 실시예에서 재조합 PBIS는 옥수수 감마-제인의 PBIS와 비교시 감소된 IgE 항체 생산을 일으킨다. 일부 실시예에서, 재조합 PBIS는 옥수수 감마-제인의 PBIS와 비교시 비만 세포로부터의 감소된 매개체 유리를 일으킨다.
다른 양태에서, 본 발명은 본 발명에 따른 RPBLA 또는 상기 RPBLA를 포함하는 숙주 세포 또는 유기체로부터 유래된 물질을 함유하는 식품, 보조 식품, 화장 제재, 영양 제재를 제공한다. RPBLA는 RPBLA를 포함하는 융합 단백질과 같은 PBIS에 의해 또는 그러한 융합 단백질에 의해 형성될 수 있다. 바람직한 실시예에서, 식품의 일부를 구성하는 RPBLA는 PA, RX3(A3), R8(4C), RX3-LA1, RX3-LA2 및 이들의 조합의 군으로부터 선택된 PBIS를 포함하는 융합 단백질의 조립체에 의해 형성된다.
본원에서 사용되는 "식품"이라는 용어는 인간 및/또는 동물이 소비하기 적합한 물질 또는 조성물을 말한다. 본원에서 사용되는 "식품"이라는 용어는 소비되기 쉬운 형태의 식품을 의미할 수 있다. 하지만, 대안적으로 또는 추가적으로, 본원에서 사용되는 식품이라는 용어는 식품 제조에 사용되는 하나 이상의 식재료를 의미할 수 있다. 단지 예로서 식품이라는 용어는 밀가루 반죽으로부터 만들어진 구워진 제품 뿐만 아니라 상기 구워진 제품의 제조에 사용되는 밀가루 반죽을 포함한다.
본 발명에 따른 식품은 본 발명에 따른 RBPLA를 발현시키는 재조합 유기체의 전체 또는 일부로부터 유래할 수 있다. 예를 들어, 식품은 RBPLA을 발현하는 배젖으로부터 유래할 수 있다. 본 발명의 번식물질 또는 그 일부를 함유하는 식품 및 보조 식품은 곡류계 음식, 예컨대, 조식용 시리얼, 곡물가루, 이러한 곡물가루를 포함하는 식품(예컨대, 빵, 빵 부스러기, 반죽, 케이크, 페이스트리, 비스켓, 베이커리 제품 및 파스타)을 포함할 수 있다. 또한, 괴경 또는 얌과 같은 야채류의 번식물질 또는 그 일부를 함유하는 식품 및 보조 식품도 제공된다. 예를 들어, 식품은 (a) 유아 음식 또는 유동식; 또는 (b) 베이커리 제품(예컨대 빵, 효모 제품 또는 케이크); (c) 베이커리 공급품(예컨대, 커스타드 또는 베이커리 필링(filling) 또는 토핑(topping)); (d) 빵 부스러기; 또는 (e) 브레딩; 또는 (f) 시리얼; 또는 (g) 제과; 또는 (h) 가루 또는 음료수 유제; (i) 과일 필링; 또는 (j) 그레이비(gravy),수프, 소스 또는 식품 점증제(food thickner); 또는 (k) 곡물 또는 곡물 성분; 또는 (l) 육류 제품; 또는 (m) 애완 동물 먹이; (n) 약 또는 기능 식품; 또는 (o) 감자 또는 얌 제품; 또는 (p) 유제품(예컨대, 디저트나 요거트); 또는 (q) 샐러드 드레싱; 또는 (r) 스낵 또는 크래커; 또는 (s) 스프레드; 또는 (t) 파스타 제품(예컨대, 국수)에서 선택될 수 있다.
이상에서 기술한 본 발명의 형질전환 식물은 가축류, 가금류, 애완동물 및 기타 동물뿐만 아니라 사람에게도 적용가능하다.
본 발명은 다음의 예로써 보다 상세히 기재되는데, 이 예들은 단지 예시적일 뿐 본 발명의 범주를 제한하는 것으로 해석해서는 안 된다.
실시예
재료 및 방법
식물 형질전환을 위한 플라스미드 구성
모든 플라스미드 컨스트럭트들은 동일 제한 효소들에 의해 열려진 pC2300 벡터(AF234315)로 SalI/BamHI 소화에 의해 도 15a 및 15b에 도시된 융합 단백질을 암호화하는 DNA 절편을 복제함으로써 구성되었다.
식물 물질
담배(Nicotiana benthamiana) 식물들을 24~26℃에서 16 시간의 광주기로 시험관 내 성장 챔버에서 성장시켰다. 18~28℃ 사이의 그린하우스에서 성인 식물들을 성장시켰다. 평균 16시간의 광주기와 함께 습도를 55%와 65% 사이에서 유지하였다.
아그로인필트레이션(Vaquero et al., 1999 Proc. Natl. Acad. Sci., USA 96(20):11128-11133; Kapila et al., 1997 Plant Sci. 122:101-108)를 위한 묘목들을 위에서 기재된 시험관 내 조건으로 종자로부터 4~6주 동안 성장시켰다.
진공에 의한 담배
아그로인필트레이션
원하는 컨스트럭트를 포함하는 투메페이션스 변종 EHA 105를 카나마이신(50 mg/l) 및 리팜피신(100 mg/l)으로 보충된 LB 배지(Triptone 10 g/l, 효소 추출물 5 g/l, NaCl 10 g/l)에서 28℃로 밤새(약 18시간) 교반(250 rpm)하면서 성장시켰다. 이후 아그로박테리아를 카나마이신(50 mg/l) 및 리팜피신(100 mg/l)으로 보충된 30 ml의 LB에 접종하였다. 28℃에서 밤새(약 18시간) 배양 후, 아그로박테리아 세포들을 3,000 x g로 10분 동안 원심분리에 의해 채집하여 MES (Sigma Chemical) 4.9 g/l 및 수크로오스 30 g/l으로 pH 5.8에서 10 ml의 액체 MS 배지에 재현탁하였다. 박테리아 배양을 아그로인필트레이션 동안 0.1의 최종 OD600으로 조절하였다. 이후, 세포 배양액을 0.2 mM의 최종 농도까지 아세토시린곤으로 보충하였고 28℃에서 90분 동안 인큐베이션하였다(Torrent, M., Llop-Tous, I., and Ludevid, M.D. (2009) In Recombinant Proteins from plants. Methods in Molecular Biology. Vol 483. Ed by Gomord V and Faye L, Springer Verlag, Humana Press, Heidelberg; pp 193-208; Voinnet, O., Rivas, S., Mestre, P., and Baulcombe, D. (2003) Plant J. 33, 949-956 참조). RX3 컨스트럭트들과 HC-Pro 사일런싱 억제 컨스트럭트(Goytia et al.,2006)을 나르는 개별적인 아그로박테리아 배양액들을 함께 혼합하였다. 식물들을 현탁액으로 완전히 덮었고, 5~6초 동안 진공을 적용하였다(100 KPa). 현탁액을 제거하였고 식물들을 온실에서 유지하였다. 식물 재료를 회수하여 적당한 항체를 이용하는 면역블롯으로 총 단백질 추출물을 분석하였다.
주사에 의한 담배
아그로인필트레이션
아그로박테리아 투메페이션스 변종 EHA 105를 50 μg mL-1 카나마이신 및 50μg mL-1 리팜피신으로 보충된 L-브로스에서 정지상으로 성장시켰다. 실온에서 5000 x g로 15분 동안 원심분리하여 박테리아를 침전시켰고 10mM MES 완충액 pH 5.6, 10 mM MgCl2 및 200 μM 아세토시린곤에 0.2의 최종 OD600까지 재현탁하였다. 세포들을 이 배지에 실온에서 3시간 동안 남겨두었다. RX3 컨스트럭트와 HC-Pro 사일런싱 억제 컨스트럭트(Goytia et al., 2006)를 나르는 개별적인 아그로박테리아 배양액들을 함께 혼합하여 생후 24주의 니코티아나 벤타미아나 식물들의 잎들의 배축면으로 침투시켰다.
단백질 추출 및 총 단백질 또는
면역블롯
분석
형질전환된 잎들로부터 총 가용성 단백질(TSPs)을 100 mM NaCl, 0.5% SDS 및 200 mM DTT를 함유하는 100 mM Tris-HCl 완충액 pH 7.5에서 실온에서 1시간 동안 추출하였다. 결과적인 추출물들을 10,000 x g로 30분 동안 4℃에서 원심분리하였고 TSP들을 SDS-폴리아크릴아미드 겔 상에 분리하였다. 쿠마시 블루로 염색 또는 실버 염색 또는 항-R8 항혈청(Torrent, M., Llompart, B., Lasserre-Ramassamy, S., Llop-Tous, I., Bastida, M., Marzabal, P., Westerholm-Pavinen, A., Saloheimo, M., Heifetz, P. B., and Ludevid, M.D. (2009) BMC Biology 7, 5), 항-GFP, 또는 대장균(E.Coli) 세포로부터 발현되고 정제된 재조합 GFP 또는 hGH 단백질을 주사받은 토끼에서 높아진 항-hGH, 및 상업적 항-EGF(Abcam)를 사용하는 면역 블롯에 의해 단백질을 검출하였다.
초원심세포 분획법 및 RPBLA 밀도 판단.
아그로인필트레이션된 담배 잎 조직을 HB 균질화 완충액(Tris 10 mM pH 8.0, 0.25 M 수크로오스 및 프로테아제 억제제)에서 0℃로 모르타르로 연마하였다. 균질화액을 2층의 미라클로스(22-24 micrometers, Calbiochem)로 여과하여 50 x g로 4℃에서 5분 동안 원심분리하기 전에 조직 파편을 제거하였다. 다양한 조직들로부터 얻은 맑게 된 균질화액들을 HB 완충액으로 완충된 다단 이오딕사놀(Optiprep, Sigma) 밀도 기반 구배(밀도 계산을 위한 바람직한 단계: 1.11, 1.17, 1.19, 1.21, 1.23 및 1.25 g/cm3)로 로딩하였다.구배들을 Beckman SW40 Ti 로터에서 80,000 x g로 2시간 동안 4°C에서 원심분리하였다. 상청액, 계면 분획물, 및 펠릿의 등가 약수들을 특정 항체들을 이용하여 SDS-PAGE 및 면역블롯으로 분석하였다.
위에 나타낸 바와 같이, 이 기술은 RPBLA들의 밀도를 판단하기에 적합한 기술이다. 다음 표는 주어진 쿠션에서의 이오딕사놀 %(w/v) 및 해당 밀도 사이의 상세한 비율을 제공한다:
퍼센트 이오딕사놀 (w/v) |
밀도(g/mL) | 백분율 이오딕사놀 (w/v) |
밀도(g/mL) |
8 | 1.069 | 30 | 1.175 |
10 | 1.079 | 32 | 1.185 |
12 | 1.088 | 34 | 1.194 |
14 | 1.098 | 36 | 1.204 |
16 | 1.107 | 38 | 1.214 |
18 | 1.117 | 40 | 1.223 |
20 | 1.127 | 42 | 1.233 |
22 | 1.136 | 44 | 1.243 |
24 | 1.146 | 46 | 1.252 |
26 | 1.156 | 48 | 1.262 |
28 | 1.165 | 50 | 1.272 |
면역세포화학 및 영상화: 공초점 현미경.
형광 유도 서열로 형질전환된 잎 담배 조직의 단편들을 직접 공초점 관찰을 위하여 물에 넣었다. 공초점 레이저 스캐닝 현미경 라이카 TCS SP(Heidelberg, Germany)를 사용하여 현미경 사진을 얻었다. 530~630 nm의 방출창을 사용한 515 nm 여기 후 녹색 형광 영상을 수집하였다. 458 nm 여기 및 470~530 nm 방출창에서 시안 형광 영상을 수집하였다. 495~535 nm 에서 세팅된 방출창을 이용하여 488 nm 여기에서 아르곤 이온 레이저로 녹색 형광 단백질 영상을 수집하였다. HeNe 레이저 및 550~600 nm 방출창으로 543 nm 여기 후 적색 형광 영상을 수집하였다. 광학 섹션들(optical sections)은 0.5 ㎛ 두께였다. 디지털 영상 및 투사 영상을 공초점 현미경 소프트웨어를 사용하여 기록하였다. 현미경 사진으로 제공된 영상들은 최소 5가지 독립적인 실험들을 나타낸다.
공초점
현미경에 의한
RPBLA
들의 수 및 크기 판단
시간에 따른 PB들의 크기(상대적 백분율)에 의한 분포를 시점 (2, 4, 7, 및 10 dpi) 당 약 500 PB들의 겉보기 직경을 측정하여 판단하였다. 세 가지 독립적인 형질전환 식물들을 시점 마다 분석하였고 OLympus fluoview v. 1.6a 소프트웨어를 사용하여 FV1000 Olympus 공초점 현미경으로 관찰된 형광 PB들을 측정하였다. PB 수 판단을 위해, 105 μm3 (70 x 70 x 20) 의 형질전환된 조직에 대응하는 공초점 투사를 사용하였다. 8 가지 독립적인 형질전환 식물로부터 40개의 공초점 영상을 시점 마다 분석하였다. 일방향 ANOVA(Analysis of Variance) 및 Bonferroni Multiple Comparisions 검사(p < 0.05 는 상당히 다르게 여겨짐)로 결과를 분석하였다.
저속 스밈 원심분리법에서(
low
seep
centrifugation
)
RPBLA
분리
약 1그램의 아그로인필트레이션된 담배 잎 조직을 5 mL의 PB3 균질화 완충액(Tris 100 mM pH 8.0, 50 mM KCl, 6 mM MgCl2, 10 mM EDTA 및 0.5 M NaCl)에서 0℃로 모르타르에서 분쇄하였다. 균질화액(H0)을 1층 미라클로스(22~24 micrometers, Calbiochem)를 통해 여과하였다. 미리 맑게 처리된 균질화액으로부터 결과적으로 맑게 된 균질화액을 저속(1,500 x g)로 10분간 원심분리하였고, 결과적인 펠릿과 상청액(SN)을 분석하였다. 저속 원심분리 펠릿을 3~5 mL의 세정 완충액(0.5% Triton® X-100)에서 약한 초음파파쇄(사이클 50%, 출력 조절 3, 10 초, Brandson sonifier 250)로 재현탁하였고 마지막으로 실온에서 15~60분 동안 인큐베이션하였다. 제2 저속 원심분리 후, 동일량의 결과적인 펠릿(wPB) 및 상청액(Ws)을 분석하였다.
EGF
정제
80그램(신선한 중량)의 Zera(E)-EGF 아그로인필트레이션된 담배 식물 잎에서 얻은 wPB분획물을 위에서처럼 가용화하였고 2 mM CaCl2의 존재하에서 37℃로 30마이크로리터의 FXa(Quiagen)으로 분할하였다. 50 mM EDTA를 첨가하고 3시간 후에 반응이 멈췄다. 이후 시료를 완충액 A에서 5배 희석하였다. Amersham의 3 mL 리소스 역상 컬럼으로 EGF를 정제하였다. 완충액 A(10 mM 아세트산염 pH4, 2 mM bME 및 5% 아세토니트릴) 및 완충액 B(10mM 아세트산염 pH4, 2 mM bME 및 75% 아세토니트릴)를 이용하여 20 가지 컬럼 용적으로 아세토니트릴 구배를 수행하였다. 약 40%의 아세토니트릴에서 순수한 EGF 두 분획물을 회수하여 50 mM Tris pH8, 2 mM bME 및 100 mM NaCl에 대해 3.5 kDA 투석막에서 4°C로 밤새 투석하였다.
EGF
활성 분석
EGF 수용체를 과발현하는 인간 상피조직의 암종 세포주 세포(A431)를 0.5x105 세포/플레이트로 플레이트들(P-35)에 심었다. 성장 배지(MEMx1, 2 mM 글루타민, 1% 의 비필수 아미노산) 및 10% FBS(소태아혈청)에서 48시간 동안 세포들을 인큐베이션 하였다. 이 후, 그 세포들을 FBS 없이 성장 배지에서 밤새 굶겼다. 이후, 프로메가로부터의 표준 EGF(0 내지 100 ng EGF/mL)와 대응 시료들(가용화된 RX3(E)-EGF 및 EGF)을 동일 범위의 농도로 첨가하였고 세포들을 9분 동안 인큐베이션 하였다. 이후, 세포들을 찬 PBS로 2회 세척하였고 액체 질소(N2)에서 냉각시켜 세포대사를 멈추었다. EGF 수용체의 인산화를 분석하기 위해, 세포들을 긁어내어 동일양의 총 단백질을 제조자가 기재한 바와 같이 PathScan® Phospho-EGF Receptor (Tyr1068) sandwich ELISA kit로 분석하였다.
실시예
1: 형질전환된 담배 식물들의
RPBLA
들에서
RX3
-
GFP
,
RX3
(R)-
GFP
, RX3(K)-ECFP,
RX3
(A)-
GFP
및
RX3
(L)-
GFP
의 축적
RX3의 반복 도메인의 양친매성은 자기 조립체 및 RPBLA 형성에 있어서 필수적인 것으로 기재되어 있다(Ludevid et al., Plant Mol. Biol. (1984) 3:277-234; Kogan et al., J. Mol. Biol. (2001) 312:907-913). RPBLA들 유도 용량에 대한 양친매성의 중요성을 특징화하기 위해, 리포터 형광 단백질(GFP 또는 ECFP)에 융합된 RX3 태그 세트를 분석하였다(도 1A): 히스티딘 (PPPVHL)8 (서열번호 62) [RX3]을 갖는 재래종 RX3, 히스티딘의 아르기닌 (PPPVRL)8 (서열번호 63) [RX3(R)] 및 리신 (PPPVKL)8 (서열번호 64) [RX3(K)]에 의한 치환에 의해 얻어지는 향상된 양친매성 특성을 갖는 두 개의 RX3 이형, 및 히스티딘들이 아날린 (PPPVAL)8 (서열번호 66) [RX3(A)] 및 류신 (PPPVLL)8 (서열번호 67) [RX3(L)]으로 치환된 경우 완전 소수성 RD를 갖는 두 개의 RX3 이형.
예상한 바와 같이, RX3-GFP로 형질전환된 담배 식물들은 세포 내에 약 1 마이크로미터 직경의 수많은 둥근 형상의 형광 RPBLA들을 축적하였다. 놀랍게도, 양친매성 RD가 없음에도 불구하고, 융합 단백질 RX3(A)-GFP 및 RX3(L)-GFP는 세포의 소포체(ER) 내에 유지되었고 RPBLA들을 형성하였다(도 1C).
RX3(A)-GFP 융합 단백질은 RX3-GFP의 발현으로부터 얻어지는 RPBLA보다 약간 더 큰 대형 RPBLA에 축적되었다. RX3(L)-GFP RPBLA들은 약 0.5 마이크로미터로 측정되었다. 세포 표면에서 형광은 관찰되지 않았는데, 이는 RPBLA들에 단백질이 효율적으로 축적되었으며 분비되지 않았음을 나타낸다. 이들 연구들은 또한 완전히 소수성인 RD를 갖는 RX3 태그들은 식물에서 RPBLA들의 형성을 조립 및 유도할 수 있다는 것을 나타낸다.
소수성 RD를 포함하는 RX3 태그들로 얻어진 놀라운 결과들을 근거로, 히스티딘 전부가 아르기닌 [RX3(R)] 또는 리신 [RX3(K)]으로 치환되는 양친매성 RX3의 축적을 분석함으로써 RX3 태그들의 RD 양친매성의 중요성을 더욱 특징화하는 것이 결정되었다. 아르기닌 및 리신은 히스티딘에 비해 높은 pKa(각각 12 및 10.5)를 가진다. 이처럼, 이들 치환은 소포체 pH 값이 더 높은 양의 순전하, 증가된 순 양전하 및 증가된 RD의 양친매성을 갖는 RD로 귀결된다. 놀랍게도, 공초점 현미경 분석은 이들 컨스트럭트들을 사용한 경우 매우 낮은 형광을 보여주었다. 다른 RX3 이형들을 위해 사용된 동일 조건들이 RX3(R)-GFP 및 RX3(K)-ECFP에 적용되었을 때, 상당한 신호는 관찰되지 않았다. 유사하게, RX3(R)-GFP 및 RX3(K)-ECFP 융합 단백질의 낮은 축적이 항-GFP 항체를 이용한 웨스턴 블롯으로 관찰되었다. 도 1B에 도시된 바와 같이, RX3(R)-GFP는 RX3-GFP에 비해 축적이 빈약하였고, RX3(K)-ECFP 융합 단백질은 관찰되지 않았다. 흥미롭게도, RX3(K)-ECFP를 발현하는 균질화액에서, 항-GFP 항체와 면역반응성인 더 높은 이동도 밴드만이 관찰되었다. 이 밴드는 아마도 부분 퇴화된 ECFP(도 1B, 레인 4, 흑색 화살촉)에 해당한다. pRX3(R)-GFP 또는 pRX3(K)-ECFP로 아그로박테리아 침투된 담배 잎의 장시간 노출 영상들은 단백질이 ER 유래 RPBLA에 효율적으로 유지되지 않는다는 것을 보여주었다. RX3(R)-GFP의 발현은 다수의 융합 단백질의 분비 및 세포 내에 아주 작은 수의 매우 작은 크기의 RPBLA들만 축적되는 결과를 낳았다 (도 1C). RX3(K)-ECFP의 경우, 결과는 심지어 더욱 놀라웠는데, 이는 RPBLA가 전혀 관찰되지 않았고 형광이 엽록체 및 분비와 관련이 있었기 때문이었다(도 1C, 박스내). 이 실험 및 융합 단백질 대부분이 퇴화되는 것처럼 보인다는 사실을 근거로, 염색체와 관련된 형광은 부분 퇴화된 ECFP에 기인하는 것이 가능하다. RX3(K)-ECFP는 이 세포기관으로 분류되지 않을 것 같다.
점증적으로, 이들 결과들은 문헌에서 제시된 것과는 반대로, RX3의 양친매성이 단백질 조립 및 RPBLA 유도에 필요한 주요 요소는 아니다. 더욱이, 히스티딘을 아르기닌 또는 리신으로 치환함에 의한 RD의 양친매성의 향상은 RPBLA의 형성을 유도하는 이들 펩티드들의 능력을 상당히 감소시킨다.
실시예
2: 담배 식물들에서
RX3
-
GFP
,
RX3
(A)-
GFP
, 및
RX3
(L)-
GFP
에 의해 유도된
RPBLA
들의 밀도 특성화
RPBLA들의 한 가지 특징은 단계별 밀도 구배(Torrent, BMC Biology 2009, 7:5)로 판단될 수 있는 이들의 높은 밀도이다. 본 연구에서, OptiprepTM 구배들은 하기 OptiprepTM 단계 쿠션들 하에서 여과된 식물 균질화액들을 로딩함으로써 수행되었다:
OptiprepTM | 밀도 (g/mL) |
18 | 1.117 |
30 | 1.175 |
34 | 1.194 |
38 | 1.214 |
42 | 1.233 |
46 | 1.252 |
마이크로솜들(ER, 골지 등)은 18%의 OptiprepTM을 갖는 저밀도 쿠션 위의 상간(interphase)인 분획물 fl8로 침전되었다. 통상적으로, RPBLA들은 마이크로솜들보다 더 조밀하고 26~28%의 OptiprepTM보다 더 고밀도의 분획물들로부터 회수된다.
도 2에 도시된 바와 같이, 융합 단백질 RX3-GFP를 발현하는 담배 식물의 균질화액이 예상과 같이 주어진 단계 밀도 구배로 초원심분리되었을 때, 단백질 대부분은 고밀도 분획물들 f34 및 f38에 회수되었다. 이 결과는 융합 단백질이 ER 내부에 단단하게 조립되어 RPBLA들을 형성한다는 것을 나타낸다. 일부 RX3-GFP 또한 마이크로솜들에 대응하는 저밀도 분획물 f18에서 관찰되지만, 이는 아마도 고밀도 구조로 완전히 형성되지 않은 새로 합성된 융합 단백질을 나타낸다.
위에서 언급된 바와 같이, 분석된 컨스트럭트들 중 두 개는 완전히 소수성인 RD(RX3(A)-GFP 및 RX3(L)-GFP)를 가졌고, 둘 모두 세포 내부에서 RPBLA들의 형성을 유도하였다. RX3(A)-GFP를 밀도 구배로 분석하였을 때, 융합 단백질 대부분은 고밀도 분획물들(f30 및 f34)에 축적되었고, RX3(A)-GFP는 고밀도 RPBLA들에 축적된다는 것을 확인하였다. RX3(L)-GFP로 형질전환된 담배 잎들로부터 얻은 맑은 균질화액들을 분석하였을 때 유사한 결과들을 얻었다. 이 경우, RPBLA들이 RX3(A)-GFP의 발현에 의해 유도된 것들보다 심지어 덜 조밀하였음에도, 이들 중 상당한 부분은 고밀도 분획물들(도 2B; f30 및 f34)에서 회수되었다.
이들 데이터는 양친매성 RD가 없음에도 불구하고, RX3(A)-GFP 및 어느 정도까지 RX3(L)-GFP는 세포 오염물들 대부분으로부터 분리되기에 충분한 고밀도의 RPBLA들에서 효율적으로 자기조립될 수 있다는 것을 보여준다. RX3(A)-GFP 균질화액으로 로딩된 밀도 구배로부터 회수된 동일 용적의 분획물들의 쿠마시 블루 염색에 의한 분석이 도 2B에 도시되어 있다. 세포 오염물들 대부분이 분획물 S 에서 회수되지만, f18, f30, 및 f34는 RX3(A)-GFP의 매우 순수한 분획물을 포함하였다는 것을 알 수 있다.
실시예
3: 담배 식물들로부터 저속 원심분리에 의한
RPBLA
들의 분리를 위한 다운스트림 과정
밀도 구배 원심분리는 RPBLA 밀도 측정을 위해 적합한 분석적 과정이지만, 이들 세포기관들을 큰 스케일로 정제하기에는 적합치 않다. 저속에서 간단한 원심분리 및 회수된 침전물(실험 과정 참조)의 일부 세척에 기반한 다운스트림 과정은 깨끗한 RPBLA 분획물의 회수를 허용하도록 개발되었다.
이 간단한 다운스트림 과정은 RX3-GFP 및 RX3(A)-GFP로 형질전환된 담배 잎들에 적용되고, 이 과정의 다른 단계들의 동일 양들을 쿠마시 블루로 염색된 웨스턴 및 SDS-PAGE로 분석하였다. 도 3A에 도시된 바와 같이, 해당 균질화액들(H0)에 존재하는 융합 단백질 거의 모두가 RPBLA 분획물(wPB)에서 회수되었다. 양 경우들에서 수율은 유사했고 상청액(SN)과 세척 단계(Ws)에서 융합 단백질이 손실되지 않을 만큼 매우 높았다. 이 관찰은 웨스턴 블롯으로 확인되었다. 처리된 동일한 양의 바이오매스로부터 얻은 RX3-GFP(도 3A, wPB 분획물을 비교)보다 더 많은 RX3(A)-GFP 융합 단백질이 회수된다는 사실은 더 나은 회수율을 반영하는게 아니라, 담배 잎에서 RX3(A)-GFP의 더 높은 축적율을 반영한다. RX3(A)-GFP RPBLA들이 RX3-GFP보다 덜 조밀한 경우 유효한 회수는 아주 놀라운 결과이다.
이 과정에서 달성된 풍부함은 매우 높다. 균질화액(H0)에 존재하는 오염물 대부분은 그 과정 동안에 제거되고, 세척된 RPBLA들(wPB)에 해당하는 분획물은 거의 융합 단백질만을 포함하였다. 몇몇 밴드들이 wPB 분획물에서 관찰되지만, 이들은 단백질 불순물에 해당하는 것이 아니라 동일 융합 단백질의 몇몇 올리고머화 상태들에 해당한다.
RX3(L)-GFP의 RPBLA들의 다운스트림 회수는, 이 융합 단백질을 포함하는 작고 덜 조밀한 세포기관들을 더 효율적으로 회수하기 위해, 더 높은 속도(4,000~5,000 x g)로 해당 균질화액을 원심분리함으로써 맞추어졌다 (도 2). 놀랍게도, RX3(L)-GFP의 경우, 도 3B(우측 패널)에서 관찰될 수 있듯이, 수율은 매우 효율적이었고 융합 단백질 대부분은 RPBLA 분획물(wPB)에서 회수되었다. RPBLA들을 포함하는 RX3(L)-GFP를 회수하기 위해 더 고속이 필요하다는 사실은 쿠마시 블루(도 3B, 좌측 패널)로 염색된 SDS-PAGE 겔들로 나타낸 것처럼 과정의 농축에 상당한 영향을 미치지는 않는다. 이들 결과들은 완전히 소수성인 RD를 갖는 RX3 태그들이 RPBLA 분리를 통한 단백질 생산 및 정제를 위해 적합하다는 것을 확인한다.
실시예
4:
RX3
융합 단백질들의
가용화
RPBLA 분획물로부터 얻은 RX3-기반 융합 단백질들의 가용화는 RPBLA 다운스트림 처리에서 주요한 단계들 중 하나이다. 실시예 3에 도시된 바와 같이 필수적으로 저속 원심분리에 의해 회수된 RPBLA 분획물들은 RX3-GFP 및 RX3(A)-GFP의 용해도를 비교하기 위해 사용되었다. 단백질의 전체 극성이 감소되기 때문에 RD의 히스티딘을 알라닌으로 치환하는 것은 수용액에서 융합 단백질들의 용해도를 감소시킬 것으로 예상되었지만, 놀랍게도 RX3(A)-GFP는 각 검사 조건에서 훨씬 많이 용해될 수 있었다.
도 3A에서 예로서, 깨끗하게 된 RPBLA 분획물(wPB)을 약한 완충액(50 mM Tris pH 8, 5 mM TCEP 및 10 mM 2bME)에서 4시간 동안 인큐베이션 한 후, 가용화된 분획물(sPB)과 가용화되지 않은 분획물(uPB)을 비교한다. 가용화 단계 직후, 시료를 16,000 x g로 10분 동안 원심분리하였고 sPB를 상청액으로 회수하였다. uPB는 펠릿으로 회수하였다.
예상된 바와 같이, RX3-GFP는 부분적으로만 가용화되었다. 단량체 형태의 융합 단백질 대부분은 주어진 조건(도 3A, sPB 대 uPB들의 비교, 화살촉)에서 가용화되지만, 많은 양의 단단하게 응집된 다중결합 형태의 융합 단백질은 가용화되지 않은 분획물로 남아 있다(도 3A, 별표). 대비적으로, 동일한 가용화 조건들에서, RX3(A)-GFP 단백질 모두는 응집 형태와 무관하게 실질적으로 가용화되었다. 세척된 RPBLA들로부터 융합 단백질의 회수에서 매우 높은 수율을 허용하는 이 놀라운 결과는 아래에 도시된 바와 같이 몇몇 단백질에 융합된, 완전히 소수성인 조립체 펩티드의 넓은 스펙트럼으로 확인되었다.
실시예
5: 형질전환된 담배 식물들의
RPBLA
들에서
RX3
(A3)-
ECFP
의 축적
이전 실험들에서, 새로운 RX3 이형들 모두는 RD에 존재하는 히스티딘의 단일 변종들로 구성되어서, 히스티딘 전, 후의 발린 및 류신 잔기들의 역할은 여전히 분석되지 않았다. 그렇게 하기 위해, RD를 따라 존재하는 발린, 히스티딘, 및 류신 모두는 새로운 RX3 비-양친매성 이형(RX3(A3))에서 알라닌으로 치환되었다(도 4A). 담배 잎들은 ECFP에 융합된 RX3(A3) 펩티드를 발현하는 벡터로 형질전환되었고, RPBLA 형성은 인필트레이션(dpi) 후 3일 및 6일째에 공초점 현미경으로 분석되었다. 심지어 인필트레이션 후 첫 번째 날(3 dpi)에, 다수의 작은 RPBLA들의 존재가 관찰되었는데, 이는 RX3(A3) 이형이 매우 효율적이라는 것을 제시한다. 이러한 관찰은 6 dpi에서 클러스터에서 조직화된 굉장히 많은 큰 RPBLA들의 존재에 의해 확인되었는데 (도 4B), 이는 새로운 조립자(assembler) 펩티드가 와일드 타입 RX3보다 예상밖으로 더 효율적이라는 것을 나타낸다.
식물들에서 RX3(A3)-ECFP 발현의 분석은 RD에 존재하는 발린 및 류신 잔기들이 단백질 조립 및 RPBLA 형성에 필요치 않다는 것을 나타낸다. 이러한 결론의 명백한 결과는 RD 구조가 접혀지지 않으면, RD에 존재하는 발린, 히스티딘, 및 류신이 임의의 다른 소수성 아미노산으로 치환될 수 있다는 것이다. 다음의 실험들은 이들 잔기들이 극성의 비대전되거나 음으로 대전된 아미노산들로 치환될 수 있다는 것을 나타낸다.
실시예
6: 형질전환된 담배 식물들의
RPBLA
들에서
RX3
(E)-
GFP
and
RX3
(D)-ECFP의 축적
위에서 언급된 바와 같이, RD에서 히스티딘 잔기들을 리신 또는 아르기닌으로 치환하는 것은 순 전하를 증가시켜 결과적으로 이 도메인의 양친매성을 증가시킨다. 놀랍게도, 이는 RPBLA 형성과 총 단백질 축적의 측면에서 조립자 펩티드의 효율을 극적으로 또한 감소시킨다. 이들 잔기들의 첨가 또한 RD의 순 전하를 증가시켜서 양친매성을 증가시키기 때문에, 이들 결과들을 근거로, 히스티딘을 아스파트산 및 글루탐산으로 치환하는 것 또한 RPBLA 내 축적의 감소로 귀결되리라 예상되었다. 그러나, 도 5B에 도시된 바와 같이, RX3(E)-GFP, RX3(D)-ECFP 및 대응하는 대조군들 (각각 RX3-GFP 및 RX3-ECFP)로 형질전환된 담배 식물들로부터 얻은 총 단백질 추출물들의 웨스턴 블롯은 산성 아미노산을 갖는 융합 단백질이 대조군들보다 약간 더 좋게 축적되었다는 것을 나타내었다. RX3(E)-GFP 및 RX3(D)-ECFP의 더 낮은 이동도는, 다른 단백질들의 경우 앞서 보고되었던 바와 같이, 산성 아미노산들의 함량이 더 높은 것으로 설명될 수 있다.
더욱이, RX3(E)-GFP 및 RX3(D)-ECFP로 형질전환된 담배 식물들은 클러스터들에서 조직화된, 다수의 크고 둥근 형상의 형광 RPBLA들의 형성을 유도하였다(도 5C). 사실, 1 내지 2 마이크로미터의 큰 RPBLA들은 형질전환된 세포들 대부분에서 빈번하게 존재한다. 흥미롭게도, 이들 RPBLA들의 평균 크기는 GFP 또는 RX3에 융합된 ECFP의 발현으로 유도된 것들의 평균 크기보다 상당히 더 컸다.
실시예
7: 담배 식물들의
RPBLA
들에서
RX3
(T)-
ECFP
,
RX3
(N)-
ECFP
, 및 RX3(Q)-ECFP의 축적
위의 결과들은 히스티딘을 소수성 또는 산성 아미노산으로 치환하는 것이 RPBLA들을 유도하는 조립자 펩티드의 용량을 높였다는 것을 나타낸다. 아울러, 히스티딘을 염기성 아미노산으로 치환함으로써 RD의 양전하를 증가시키는 부정적 효과가 관찰되었다. 그러나, 조립자 펩티드의 기능성에 대한 극성의 비-대전된 아미노산들의 효과가 여전히 알려져 있지 않았다. 그러므로, RD의 히스티딘들 모두가 트레오닌, 아스파라긴, 및 글루타민 잔기로 치환되었고 ECFP (각각 RX3(T)-ECFP, RX3(N)-ECFP, 및 RX3(Q)-ECFP)에 융합된 세 개의 새로운 컨스트럭트들이 생성되었다. 이들 아미노산들의 첨가는 양친매성이지만, 순 전하가 없는 RD로 귀결된다(도 6A).
이들 모든 컨스트럭트들을 발현하는 담배 잎들은 침투 후 3일 및 6일 (dpi)에 공초점 현미경으로 분석되었다. 3 dpi에서, 다수의 작은 RPBLA들이 관찰되었는데, 이는 이들 RX3 이형들 모두가 매우 효율적이었다는 것을 나타낸다. 이 관찰은 클러스터들에 조직화된 많고, 큰 RPBLA들의 존재에 의해 6 dpi에서 확인되었다(도 4B).
이들 결과들은 극성의 비대전된 아미노산들을 갖는 RX3 이종들의 식물들에서 발현이 RPBLA 형성으로 귀결된다는 것을 나타낸다.
실시예
8: 형질전환된 담배 식물의
RPBLA
들에서
PP
-
ECFP
및
PA
-
ECFP
의 축적
RX3의 두 주요 도메인들(RD 및 PX)은 둘 다 통상적으로 PPII 구조를 채택하는 프롤린 풍부 서열들이다. 원편광 이색성 (circular dichroism)에 의한 합성 RD의 연구는 수용액에서 이 도메인 내에 PPII 나선의 존재를 확인하였다(Dalcol, J. Org. Chem., 1996, 61 (20), pp 6775?6782). PPII 도메인들을 갖는 단백질들은 식물 및 다른 유기체에 풍부하다. 그러나, 이들은 대개는 RPBLA들의 형성을 유도하는 능력을 갖지 않는다. 예를 들어, 콜라겐(Caldwell JW, Applequist J.,. Biopolymers 1984;10:1891-1904), 알파-카제인 밀크 단백질(Syme CD. et al., Eur J Biochem 2002;269:148-156.), 및 PKA (Knighton D.R. et al., Science 1991;253:414-420)는 PPII 나선을 갖지만, RPBLA를 유도하는 능력을 갖지 않는 단백질들의 예들이다. 그 결과, PPII 구조 서열 외에, RX3에 있는 다른 요소들이 RPBLA의 형성을 유도하기 위해 필요할 것으로 예상되었다.
RX3 서열을 따라 이러한 요소들을 식별하기 위해, RD 및 PX 도메인들은 RX3에 비 상동인 프롤린계 서열로 치환되었다. PPII 구조는 유지되었고 시스테인 잔기의 수 및 상대적 위치는 변경되지 않았다(PP; 도 7A). 추가로, 유사하지만, 더욱 소수성 펩티드가 합성되었는데, 여기서 RD 및 PX 도메인들은 이 서열을 따라서 모두 반복되는 헥사펩티드 PPPAPA로 치환되었다(PA; 도 7A). 이들 두 펩티드들은 RX3으로 반드시 동일한 PPII 구조를 가지지만, 높은 프롤린 함량 및 시스테인들의 수 및 위치 이외는 1차 상동성을 공유하지 않는다.
RX3-ECFP, PP-ECFP 또는 PA-ECFP를 과발현하는 담배 잎들의 웨스턴 블롯 분석은 놀랍게도 ECFP에 융합된 두 개의 합성 펩티드들이 천연 RX3보다 더 높은 효율로 축적되었다는 것을 보여주었다(도 7B; 레인 1과 2 대 3을 비교). PP-ECFP, 및 정도가 덜하지만 PA-ECFP는, 심지어 세 개의 모든 융합 단백질들이 동일한 수의 아미노산들을 가짐에도 불구하고, RX3-ECFP보다 SDS-PAGE 겔에서 더 낮은 이동도를 보여주었다. 이는, 심지어 웨스턴 블롯 조건들에서 PP 및 PA는 RX3보다 더 안정한 PPII 연장 나선을 제공한다는 것을 제시한다. 결과적으로, 이들 합성 펩티드들의 조립이 선호될 것이고, 단백질은 웨스턴 블롯으로 판단된 것처럼 축적의 증가를 보일 것이다. 이 가설은 RX3-, PP-, 및 PA-ECFP 융합 단백질들을 발현하는 벡터로 형질전환 후 6일 째에 공초점 현미경으로 담배 잎들의 관찰로 확인되었다. 도 7C는 RX3-ECFP를 발현하는 잎들에 비해 많은 수의 RPBLA들을 제공하는, PP-ECFP 및 PA-ECFP로 형질전환된 잎들의 공초점 영상들을 표시한다. 게다가, PP- 및 PA-ECFP 발현으로 유도된 RPBLA들의 평균 크기는 RX3-ECFP RPBLA들의 평균 크기보다 2배 더 컸다.
이들 3가지 단백질체 유도 서열들(도 7A)의 서열 비교는 이들 중 상동성의 단독 영역이 신호 펩티드 (THTSGGCGCQ) (서열번호 25) 다음의 첫 번째 10개의 아미노산들임을 밝혀냈다. 이 서열이 단백질 조립체에서 특정 역할을 하지 않는다는 것을 확인하기 위해, 이 서열은 합성 프롤린계 서열 (THPPPPCPCP) (서열번호 26)로 치환되었다. 프롤린계 서열은 PA-ECFP 컨스트럭트들의 컨텍스트에서 시스테인들의 위치들을 유지하였다. 이 컨스트럭트(NPA-ECFP)는 RPBLA 유도에서 PA-ECFP만큼 효율적이었다.
추가로, RX3으로부터 감마-제인의 신호 펩티드 또한 PR-S로도 알려져 있는 PR10 신호 펩티드로 치환되었다(Veroverd et al., Plant Physiol., 1995, 109:1199-1205). 이 결과적 컨스트럭트는 GFP(RX3(PR10)-GFP)에 융합되었다. 신호 펩티드는 ER에 대한 단백질의 입구에서 동시번역으로(cotranslationaly) 분할되기 때문에 RPBLA에 영향을 줄 것 같지 않고, 예상된 것처럼, RPBLA들의 축적율 및 유도는 사용된 신호 펩티드와 완전히 무관하다.
PP, PA, NPP, 및 NPA 펩티드가 RX3과 1차 서열 상동성을 공유하지 않는다는 사실은, 예상외로 RPBLA들을 조립하고 유도하는 능력이 RX3의 서열이 아니라 그의 3차원 구조에 의존한다는 것을 나타낸다. RX3, PP, PA 펩티드, 및 이들의 이형들에 존재하는 연장된 PPII 나선은 RPBLA 유도에 책임이 있는 주요 특징이다.
복제 이유들 때문에, PP 및 PA 펩티드는 RX3 반복 도메인의 마지막 반복의 부분을 유지한다. RD로부터 마지막 RX3 반복 단위가 RPBLA를 형성하도록 요구받는 것을 버리기 위해, 이 반복이 없는(PP3과 PA2) 새로운 컨스트럭트의 집합이 수행된다. 이들 두 컨스트럭트들은 RPBLA들을 형성하는 능력을 유지한다.
실시예
9: 형질전환된 담배 식물들에서
RPBLA
들의 유도 또는 안정화에 관련된
RX3
의 시스테인
잔기들의
판단
여기에 제시된 작업은 RX의 다량체화 및 RPBLA 형성을 가능하게 하는 RX3의 특이적 특성에 대한 주요 통찰력을 제공한다. 적절하지만, 독특하지는 않은 특성은 RX3 분자들 간 디설파이드간 결합에 참여할 수 있는 시스테인 잔기들의 존재이다.
6개의 시스테인들 각각의 점 돌연변이는 RX3 중합에서 디설파이드 결합의 역할을 판단하는 간단한 방안으로서 사용되었다. C7 또는 C9이 결여된 RX3-ECFP(RX3C7G-ECFP 및 RX3C9G-ECFP)의 과발현은 융합 단백질의 다량체화 과정을 분명히 방해하였다: 양 변종들은 많이 분비되었다(도 8C~D). 사실, 개별적인 C7 또는 C9 돌연변이로 형질변경된 상피 세포들의 세포마다의 영상 분석에서, 융합 단백질들이 주로 분비되었고 몇몇 고형광의 단일 세포들은 형광 RPBLA 유사 스폿을 표시하였다. 이 관찰은 ER에서 재조합 단백질의 고 발현율은, 와일드 타입 RX3에 비해 더 높은 임계 단백질 농도가 단백질 응집을 위해 필요하다는 것을 나타내는 응집 효율의 증가로 귀결됨을 제시한다(도 8C~D 박스 내). 예상한 바와 같이, 양 시스테인 잔기들이 동일 시점에 돌연변이 되었을 때(도 8I; RX3C7, 9G-ECFP), RPBLA들의 축적은 관찰되지 않았다. 이들 결과들은 RX3 도메인의 N-말단 부근의 두 개의 시스테인 잔기들의 존재는 단백질을 ER에 유지하여 RPBLA들의 형성을 유도하기 위해 필요하다는 것을 나타낸다. 그러나, 첫 번째 두 시스테인들을 배타적으로 유지하는 다중 돌연변이 RX3C64,82,84,92G-ECFP는 C7 및 C9이 ER에서 융합 단백질을 유지하기에 충분치 않고 RPBLA들이 형성되도록 한다는 것을 나타낸다(도 8K). 이처럼, RX3 펩티드에 존재하는 다른 시스테인들의 일부는 그의 적절한 단백질 조립체에서 중요한 역할을 한다.
RX3 도메인(C64)의 중간에 국부화된 시스테인 잔기의 돌연변이는 올리고머화 과정 및 RPBLA들에 축적된 단백질에 대해 상당한 효과를 갖지 못하였다(도 8E; RX3C64G-ECFP). 게다가, RX3의 C-말단에 위치된 상기 세 시스테인 잔기들(C82, C84, 또는 C92)의 개별적 돌연변이들은 RPBLA들에 축적되는 능력에 상당한 영향을 갖지는 못했다(도 8F~H; 각각 RX3C82G-ECFP, RX3C84G-ECFP 또는 RX3C92G-ECFP). 이들 단일 돌연변이들의 정상적인 응집 능력은 이들 잔기들 중 어느 것도 홀로 RPBLA들을 유도 및 안정화하도록 요구받지 않는다는 가설을 지원한다. 그러나, 다중 C-말단 Cys 돌연변이(도 8J; RX3C82,84,92G-ECFP)는 RPBLA 생물발생과 함께 진행될 수 없기 때문에, RX3은 또한 RPBLA들을 형성하기 위해 C-말단 부근에 최소 두 개의 시스테인 잔기들을 요구한다는 것이 분명하다.
아울러, 단백질 농도는 자기조립 펩티드들의 응집을 조절하는 주요 매개변수인 것으로 알려져 있다(Wetzel, R. (1999) In Methods in Enzymology, vol. 309, Academic Press, San Diego, California). 그러나, RX3-ECFP 및 RX3 Cys 돌연변이들의 발현은 SDS-PAGE 쿠마시 블루 염색 겔들에서 분명히 가시화되었고, RPBLA들을 형성했던 단백질들과 분비되어 응집되지 않았던 단백질들 사이에서 단백질 레벨의 상당한 차이는 관찰되지 않았다(도 8B). 그러므로, 검사된 RX3 돌연변이의 단백질 다량체화 차이들은 응집 능력에 영향을 미치는 그들의 내인성 성질들에서의 차이와 관련이 있다. RX3 서열의 변형들은 응집 능력을 손상시키거나 올리고머화를 위해 필요한 단백질 임계 농도를 높일 수 있었다.
조립자 펩티드가 RPBLA의 효율적 유도를 허용하기 위해 필요한 시스테인들이 최소 수의 판단은 대단히 중요하다. 우선, 주로 이 단백질이 또한 시스테인 잔기들을 포함할 때, 조립자 펩티드에서 시스테인 잔기들은, 목적 단백질의 적절한 폴딩, 이런 이유로 그의 활성에 부정적 영향을 끼칠 수 있다. 그러나, 조립자 펩티드에서 시스테인들의 존재는 디설파이드 결합 형성에 의한 융합 단백질의 교차결합을 확실하게 한다. 이 교차결합은 RPBLA들의 안정화 및 강력화로 귀결된다. 이들 특징들은 이 세포기관의 분리를 쉽게 하기 때문에 바람직하다. 또한, RPBLA 세포기관이 사용되는 임의의 산업적 응용은 디설파이드 결합 형성에 의한 교차결합에 의존할 것이다. 도입부에 기재된 바와 같이, 프롤라민 외의 PBIS는 단백질의 C-말단에서 KDEL의 추가에 의해 RPBLA들의 형성을 유도할 수 있다. 심지어 이러한 접근법이 RPBLA들의 형성을 허용함에도 불구하고, 이들 세포기관들의 분리는 그들의 안정성 감소로 인하여 어려울 것이다.
실시예
10: 시스테인
잔기들의
방위는 형질전환된 담배 식물들에서
PP
펩티드가
RPBLA
들에 축적되는 능력에 영향을 미치지 않는다.
단백질 조립체 및 RPBLA 유도에서 시스테인 잔기들의 중요성은 실시예 9에서 이들 잔기들의 단일 및 다수의 돌연변이들에 의해 나타내어졌다. 그러나, 이들 잔기들의 방위의 영향은 탐구될 여지가 있다. 방위의 영향을 탐구하기 위해, 새로운 조립자 펩티드(PP2)를 합성하였다. PP2는 시스테인 잔기 일부 위치를 제외하고 PP와 상동이다(도 9A; C9→10, C84→85 및 C92→91).
프롤린이 매우 풍부한 펩티드들은 도 9B에 도시된 것처럼 회전 당 세 개의 아미노산들을 갖는 것을 특징으로 하는 PPII 나선을 형성한다(Brochicchio, 2002, Chirality, 14: 782-92). 천연 RX3에서, 시스테인 잔기들은 나선의 세 측부들 각각을 향하여 배향된다. 이 방위는 천연 및 RPBLA들이 디설파이드 브릿지들에 의해 조립되고 안정화된 단백질들로 가득찬 통상의 크고(3 마이크로미터까지) 둥근 형상의 세포기관들을 형성하도록 하는 세 개의 모든 치수들에서 조립 및 안정화를 촉진하기 위해 중요할 수 있다는 것이 가설이었다. 이처럼, PP2는 모든 시스테인 잔기들이 나선의 동일한 측부를 향하여 배향되도록 설계되었다. 예상외로, GFP에 융합된 PP2는 PP-GFP만큼 많이 축적될 수 없었고, 심지어 놀랍게도 큰 RPBLA들의 형성을 유도할 수 없었다(도 9C).
실시예
11: 형질전환된 담배 식물들의
RPBLA
들에서
R8
(4C)-
ECFP
,
R7
(4C)-ECFP,
R6
(4C)-
ECFP
, 및
R4
(4C)-
ECFP
의 축적
RPBLA 생물학적 발생을 위해 필요한 PPII의 최소 길이가 또한 측정되었다. 그렇게 하기 위해, 최소 RX3-ECFP 유래 단백질, R8(C4)-ECFP가 RX3의 PX 서열을 삭제하고 추가적인 최소 서열을 첨가함으로써 생성되었다. 이처럼, R8(C4)-ECFP는 C82, C84, 및 C92가 부족하지만, 쇄간 디설파이드 브릿지를 강화하기 위해 두 개의 프롤린에 의해 C64에 연결된 추가적인 새로운 시스테인 잔기를 포함한다(도 10A). N. benthamiana 잎들에서 발현시 R8(C4)-ECFP 단백질의 분포 패턴은, 고배율에서, 작은 RPBLA들로서 보이는 분명한 구형의 형광 스폿들에 축적되었다(도 10C). RX3-ECFP에 의해 유도된 RPBLA는 4 dpi에서 1.4 μm의 입자 평균에 도달하였고 7 dpi에서 2 μm에 도달하기까지 점진적으로 증가된 반면, R8(C4)-ECFP에 의해 유도된 형광 스폿들은 7 dpi에서 1 μm의 직경에 거의 도달하지 못하였다(하기 표 참조). 그러므로, 앞서 제시된 바와 같이, PPII 나선(R8(C4)의 컨텍스트에서 RD)의 각 측부에서 시스테인 쌍은 RPBLA들로 진화될 단백질 응집체들을 핵생성하기에 충분하다. RX3-ECFP가 R8(C4)-ECFP보다 큰 RPBLA들을 형성하는 더 강한 경향을 가지는 관찰은 RX3-ECFP 올리고머들이 그의 6개의 시스테인 잔기들에 의해서 쇄간 교차결합을 증가시킴으로써 더 높은 성장확률을 가진다는 사실에 기인할 수 있다.
그러므로, 중합이 PPII의 길이에 관련되는 정도가 또한 조사되었다. 이들 실험들은 RD를 점진적으로 단축함으로써 수행되었다. 세 개 이상의 컨스트럭트들이 R8(C4)-ECFP로부터 생성되었다. 반복 도메인이 7, 6 및 4 PPPVHL 단위까지 짧아졌다(도 10A). 도 10C에 도시된 바와 같이, 6개 또는 4개의 반복 단위(각각, R6(C4)-ECFP 및 R4(C4)-ECFP)를 포함하는 과발현된 단백질들은 여전히 작은 응집체들을 형성할 수 있지만, 분비는 반복 도메인의 단축에 따라 증가한다(도 10B 삽도). R7(C4)-EGF는 R8(C4)-EGF와 유사한 결과를 낳았다.
RX3-끝이 잘린 단백질들을 과발현하는 잎들로부터 추출된 총 단백질들의 쿠마시 블루 염색 분석(도 10B)은 재조합 단백질들의 농도가 모든 경우들에서 유사하였다는 것을 보여주었다. 이는 융합 단백질들 각각이 안정하고 좋은 발현 레벨은 RPBLA들이 효율적으로 형성될 것이라는 증거가 아니라는 것을 나타낸다. 즉, 돌연별이에서 더 낮은 응집 효율은 단백질 발현 레벨에 관련되지 않았다. 이들 결과들은 최적의 RX3 펩티드 상호작용을 선호하고 PB 형성 효율을 판단하는 임계 크기가 있다는 것을 제시한다.
융합 단백질 |
크기 범위 (μm) |
|
4 dpi | 7 dpi | |
RX3-ECFP | 1.1~1.85 | 1.1~1.85 |
R8(4C)-ECFP | 0.4~0.7 | 0.9~1.3 |
R7(4C)-ECFP | 0.4~0.75 | 0.78~1.3 |
R6(4C)-ECFP | 0.3~0.6 | 1~1.4 |
R4(4C)-ECFP | 0.2~0.4 | 0.75~1 |
나머지 컨스트럭트들에 비해 R4(C4)-ECFP의 융합 단백질 분비에서 상당한 증가를 근거로, R4(C4)는 효율적인 조립자 펩티드의 최소 길이를 표시한다. 이들 결과들은 PPII 나선을 채택하고 각 말단에서 한쌍의 시스테인 잔기들을 옆에 둔 24개의 아미노산들(R4(C4) 반복 도메인의 길이)보다 긴 펩티드들이 ER 내에 보유되고 RPBLA들의 형성을 유도하기에 충분하다는 것을 나타낸다.
실시예
12: 형질전환된 담배 식물들의
RPBLA
들에서
RX3
(A)-
mCherry
RX3
(E)-mCherry의 축적
RX3에 융합시, 형광 단백질 mCherry는 가용성이 높아서 RPBLA들에 축적되지 않는다. RX3-mCherry를 발현하는 벡터로 형질전환된 담배 잎들의 공초점 현미경 분석은, 도 11A에 도시된 바와 같이, 관찰된 적색 형광의 대부분이 세포의 주변에 국소화된 분명한 분비 패턴을 보여주었다. 흥미롭게도, 담배 잎들이 RX3(A)-mCherry로 형질전환되었을 때, 형광의 대부분은 세포 내부에서 관찰되었는데, 이는 융합 단백질이 세포 내에 효율적으로 유지되었다는 것을 나타낸다.
게다가, 분명한 미립자 패턴이 관찰되었는데(도 11B 및 11B'), 이는 융합 단백질이 RPBLA에 축적되었음을 나타낸다. 이들 재조합 단백질체의 크기(약 1 마이크로미터 직경)는 몇몇 융합 단백질들로 형질전환된 식물들에서 앞서 특징으로 한 RPBLA들과 매치된다(미국특허번호 제7,575,898호; 및 미국특허공개번호 제20060123509호, 제20060121573호, 및 제20070243198호 참조).
이 결과는 최소 두 가지 이유 때문에 예상 밖이었다. 첫째, 천연 발생 반복 도메인을 포함하는 미변형 프롤라민 유래 RX3에 비해 mCherry가 RX3(A)에 융합되었을 때 RPBLA 형성 효율이 증가되었다. 추가로, RX3의 반복 도메인의 양친매성은 단백질체 형성에 중요하고(Kogan et al ., 2001, J. Mol. Biol. 312:907-913), RX3(A)은 완전히 소수성인 반복 도메인을 가지도록 돌연변이된다(실시예 1 참조)라고 기재되어 있다.
위에서 나타낸 바와 같이, mCherry의 높은 용해도는 RPBLA들을 형성하기 위해 천연 RX3과 mCherry의 융합 능력을 감소시키는 주요 인자들 중 하나일 수 있었다. RX3(A)의 더 높은 성능이 RD(소수성 알라닌에 대한 히스티딘(양으로 대전된 아미노산)의 치환)의 소수성 함량의 단순한 증가에 기인하는지를 판단하기 위해, RX3(E)에 대한 mCherry의 융합이 발현되었다. 도 11C에 도시된 바와 같이, RX3(E)-mCherry는 세포 내에 효율적으로 보유되었고, 아울러, RX3(A)-mCherry의 발현으로 유도된 것들보다 심지어 더 큰 RPBLA들에 축적되었다.
양친매성의 대전된 RD를 갖는 RX3(E)가 mCherry에 융합시 RPBLA들의 형성을 유도할 수도 있다는 사실은 RX3에 비해 RX3(A)의 성능 증가는 펩티드의 소수성 특징의 불특정 증가에 기인하지 않지만, 조립 능력의 증가에 기인하고, 따라서 이들 두 개의 합성 RX3 유래 펩티드들의 단백질체 유도 능력에 기인한다는 것을 제시한다.
실시예
13: 형질전환된 담배 식물들에서
RX3
,
RX3
(A),
RX3
(E),
PP
및
PA
조립자
펩티드들에 융합된
EGF
의 축적
담배 아그로인필터된 식물들에서 RX3에 융합된 상피 성장 인자(EGF)의 생산 및 정제가 앞서 보고되었다(WO2006056484). 저속 원심분리, 가용화, 및 RX3-EGF 융합 단백질의 분할에 의한 RPBLA 분리방법 및 역상(RF) FPLC에 의한 EGF의 후속 정제가 WO2007096192에서 발전되었다. 새로운 조립자 펩티드의 효능을 검사하기 위해, EGF는 RX3(A) 및 RX3(E)에 융합되었고 동일한 다운스트림 방법이 수행되었다. RX3(A)-EGF 및 RX3(E)-EGF의 발현에 의해 유도된 RPBLA들은 RX3-EGF의 발현에 의해 유도된 대조 RPBLA만큼 효율적으로 저속 원심분리에 의해 회수되었다(도 12A). 세 가지 모든 경우에서, 상청액(도 12A, 레인 2) 및 세척 단계(도 12A, 레인 3)에서의 단지 사소한 손실이 있었지만 융합 단백질 거의 전부가 wPB 분획물(도 12A, 레인 4)에서 회수되었다. 이들 결과들로부터, 융합 단백질은 거의 전부가 RPBLA 세포기관에 강하게 조립되고 wPB 분획물에서 쉽게 회수된다는 것은 분명하다.
다운스트림에서 요점은 RPBLA들로부터 얻은 융합 단백질의 가용화이다. 온순 조건(25℃에서 4 시간 동안 pH 10의 50 mM 붕산염 완충액 및 10 mM의 bME)에서 RX3-EGF RPBLA 가용화 후, 융합 단백질의 작은 백분율만이 가용화되었다. 사실, RX3-EGF 단량체의 50%만이 가용화되었다 (도 12B; 레인 3(sPB)을 레인 6(iPB)과 비교). 놀랍게도, RX3(A)-EGF 또는 RX3(E)-EGF를 포함하는 RPBLA들의 가용화가 훨씬 더 효율적이었다. RX3(A)-EGF의 거의 모든 단량체 형태는 가용화되었고, 사용된 조건들에서 RX3(A)-EGF가 가용화 되지 않고서 남아 있는 것은 거의 없어 보였다(도 12B; 레인 1(sPB)을 레인 4(iPB)와 비교).
다운스트림 처리에 대한 PP-EGF 및 PA-EGF의 효과들 또한 조사되었다. 도 12C는 이들 두 가지 융합 단백질들이 담배 아그로인필터된 잎들에서 RX3-EGF 및 RX3(E)-EGF와 동일 레벨로 축적된다는 것을 보여준다. 아울러, 저속 원심분리에 의한 RPBLA들의 회수 후, PP-EGF 및 PA-EGF는 위에서 기재된 온순 조건들에서 RX3(E)-EGF와 유사하게 매우 효율적으로 가용화되었다(도 12D). 앞서 언급된 바와 같이, 이들 모든 융합 단백질들 사이의 전기영동 이동도 차이는 단백질 크기 차이에 관련되는 것이 아니라 심지어 SDS-PAGE 조건들 하에서 단백질 형태의 약간의 차이들에 기인한다.
예상 외로, 새로운 조립자 펩티드들 RX3(A), RX3(E), PP 및 PA 모두 RPBLA들의 형성을 조립하고 유도하는 그들의 능력에 영향을 주지 않고서 융합 단백질의 용해도를 크게 증가시킨다. 이들 펩티드가 그 방법의 총 수율을 극적으로 증가시키기 때문에, 이 눈에 띄는 결과는 RPBLA 다운스트림 처리에서 매우 중요하다(RX3(A)의 경우 최소 2배, 그리고 RX3(E), PP, 및 PA의 경우 최소 10배).
이들 새로운 조립자 펩티드에 의해 생산된 EGF의 형태에 접근하기 위해, 이 융합 단백질로부터 FXa에 의해 분할되어 RF-FPLC에 의해 정제된 EGF뿐만 아니라 가용화된 RX3(E)-EGF의 활성을 검사하였다. 도 13A는 맑게 되지 않은 균질화액에서부터 분할 단계까지 모든 다운스트림 단계들과 함께 실버 염색된 겔을 보여준다. 부위 특이적 프로테아제 FXa로 분할 후, RF-FPLC에 의한 재료 및 방법들에서 기재된 바와 같이 자유롭게 된 EGF는 정제되었다. 도 13B에서 화살표로 표시된 날카로운 피크에 해당하는 단지 두 분획물들에서 EGF 단백질이 30%의 아세토니트릴로 회수되었다. 회수된 두 분획물들의 혼합물의 순도(도 13C)는 HPLC에 의해 92% 이상으로 추정되었다. EGF 활성은 RX3(E)-EGF 및 EGF의 증가량으로 인큐베이션된 A431 세포들의 EGF 수용체 인산화의 분석에 의해 생체 외에서 측정되었다. 부대조군 (negative control)로서 이들 세포들을 RX3과 병렬로 인큐베이션하였다. 세 가지 독립적 실험들은 Promega(GS02A)의 상업적 EGF에 비해 RX3(E)-EGF 및 EGF가 각각 50% 및 100% 활성이었다는 것을 나타내었다.
실시예
14: 형질전환된 담배 식물들에서
RX3
및
RX3
(A)
조립자
펩티드에 융합된
hGH
의 축적
인간 성장 호르몬이 다운스트림 과정을 향상시키는 RX3 이형들의 능력을 체크하기 위한 추가적 예로서 선택되었다. RX3(A)-hGH 융합 단백질을 발현하는 담배 식물들을 균질화액으로 만들었고 유도된 RPBLA들을 저속 원심분리로 분리하였다. 도 14A(좌측 패널)에 도시된 바와 같이, RPBLA들의 매우 순수한 분획물(wPB)을 균질화액(H0)으로부터 얻었다. 그의 올리고머 형태가 다른 융합 단백질 RX3(A)-hGH는 쿠마시 염색법으로 분석시 이 분획물에서 관찰되는 유일한 단백질이다. 흥미롭게도, 공정 수율을 웨스턴 블롯으로 분석시, 대부분의 융합 단백질은 안정하고 단단하게 조립된 RPBLA들에 축적되었는데, 이는 원심분리에 의해 회수될 수 있고, 그의 단지 소량만이 대응하는 상청액에서 손실된다(도 14A, 좌측 패널).
RX3(A)-hGH을 함유하는 RPBLA들이 이러한 간단한 원심분리 방법에 의해 얻어졌으면, 이들은 온순 가용화 완충액(실온에서 50 mM 붕산염 pH10, 10 mM 베타-머캅토에탄올(bME))에서 3시간 동안 인큐베이션되었다. 참고로서, RX3-hGH를 함유하는 동일량의 RPBLA들을 동일 조건으로 인큐베이션하였고 항-hGH 항체들을 이용하는 웨스턴 블롯으로 병렬적으로 분석하였다. 놀랍게도, RPBLA 회수의 높은 수율이 이들 두 융합 단백질들 중 어느 하나의 발현으로 유도된 세포기관들 둘 모두 안정하고 단단하게 조립됨을 제시함에도 불구하고, RX3(A)-hGH 융합 단백질은 RX3-hGH보다 훨씬 더 많이 용해될 수 있었다. 물 용해도의 증가는 RX3 히스티딘 잔기를 RX3(a)에서 알라닌으로 치환이 조립자 펩티드의 소수성을 증가시킨다는 사실을 고려하면 놀라운 것이다(Eisenberg, 1984, J. Mol . Biol . 179: 125-142).
실시예
15: 형질전환된 담배 식물들에서 고밀도
RPBLA
생물발생에 대한
Cys
잔기들의 의존
위에서 언급된 바와 같이, 고밀도 RPBLA 형성에서 PBIS의 필수적 요소들 중 하나는 폴리프롤린 타입 II 도메인의 각 말단에서 최소 2개의 시스테인 잔기들의 존재이다. 그럼에도 불구하고, KDEL 서열에 융합시, 심지어 디설파이드 브릿지 형성이 없음에도, ER 내에 유지되고 소포 유사 구조들 내에 축적되는 다른 조립자 펩티드들(예를 들어, 하이드로포빈, ELP)이 있다. 어떤 조립자 단백질들의 C-말단에서 KDEL의 존재는 ER 내에 이 분자를 보유하기에 충분하고, 단백질의 조립자 능력은 소포 구조들의 형성으로 이어진다.
RX3 조립자 펩티드의 말단에서 ER 보유 서열의 추가가 Cys 잔기들의 필요성을 대체할 수 있었는지를 판단하기 위해, RPBLA들을 유도할 수 없었고 실시예 9에 도시된 바와 같이 분비되었던 RX3 이형(RX3ΔCys64 ,82,84,92-ECFP)을 KDEL을 갖는 ECFP에 융합하였다(RX3ΔCys64 ,82,84,92-ECFP-KDEL).
쿠마시 염색법 및 웨스턴 블롯(도 16A)로 RX3-ECFP 및 RX3ΔCys64 ,82,84,92-ECFP-KDEL을 과발현하는 담배 잎 분석은 두 RX3 기반 융합 단백질들이 유사한 레벨로 축적되었다는 것을 보여주었다. RX3ΔCys64 ,82,84,92-ECFP-KDEL이 RPBLA에 축적되는지를 판단하기 위해, 이 융합 단백질을 발현하는 잎들을 침투 후 3일 및 7일 (dpi)에 공초점 현미경으로 분석하였다. 앞서 RX3-ECFP 발현 담배 잎에서 관찰된 것처럼, RX3ΔCys64 ,82,84,92-ECFP-KDEL의 발현에 의해 유도된 약 1 마이크로미터의 둥근 형상의 소포들이 3 dpi에서만 관찰되었다(도 16B). 이러한 관찰은 ECFP의 C-말단에 부착된 KDEL 서열이 세포 내에 융합 단백질의 효율적인 보유를 허용한다는 것을 나타낸다. 추가적으로, 이는 RX3계 펩티드의 조립자 능력이 자동 조립 및 소포 구조들의 유도를 허용한다는 것을 또한 보여준다. 이들 소포 구조들은 3 dpi 후 성장을 계속하고, 흥미롭게는 7 dpi에서 불규칙하고 큰 소포 구조체들이 (일부가 5 마이크로미터를 넘는) 관찰되었다(도 16B). 이러한 크기의 RPBLA들은 대조 RX3-ECFP 융합 단백질을 과발현하는 담배 잎들에서는 관찰되지 않았는데, 이는 RX3-ECFP가 RPBLA들로 자동조립되는 기작이 RX3ΔCys64 ,82,84,92-ECFP-KDEL 소포들의 조립 기작과 같지 않다는 것을 제시한다.
소포 구조체들 내에서 융합 단백질 조립체의 단단함을 간접적인 특징으로 하는 기술적 접근법은 단계별 쿠션 OptiprepTM 구배에 의한 소포 구조체들의 밀도의 판단이다. 그러므로, 담배 식물에서 RX3ΔCys64 ,82,84,92-ECFP-KDEL (또는 RX3-ECFP) 발현으로 유도된 소포 구조체들은 다음의 OptiprepTM 단계 쿠션들의 상단에 여과된 식물 균질화액을 로딩함으로써 수행되었다. 각 단계 쿠션의 밀도는 위에서 정의된 것처럼 표 4에 있다.
RX3-ECFP 구배로 예시된 것처럼, 고밀도 RPBLA들은 내생 단백질의 대부분이 없는, 약 1.2 g/mL의 밀도를 갖는 분획물들(도 16C, 좌측, 레인 5 및 6)로부터 회수된다. 사실, 이미 미국 공개출원번호 제2006/0123509호에 기재된 바와 같이, RPBLA 분리에서 RPBLA들의 밀도 및 인성은 매우 중요하다. RX3ΔCys64 ,82,84,92-ECFP-KDEL 소포 구조체들을 동일 수단으로 분석하였을 때, 놀랍게도 거의 모든 융합 단백질이 상청액 분획물에서 회수되었다(도 16C, 우측). 이 결과는 RX3ΔCys64 ,82,84,92-ECFP-KDEL 융합 단백질들이 진실한 RPBLA로 여길 수 없는 소포체 유사 구조로 축적된다는 것을 분명히 나타낸다. 예를 들어, ER 또는 골지체로부터 유래된 세포내 기관들은 통상적으로는 18%와 30%의 Optiprep 쿠션들 사이에서 침전되고, 조직 균질화 과정 동안, 마이크로솜들의 루멘에 존재하는 가용성 단백질들의 많은 비율이 자유롭게 되어 상청액에서 회수될 것이다. 그러므로, RX3ΔCys64 ,82,84,92-ECFP-KDEL 융합 단백질은 ER 내에 보유되지만, 조립되지 않거나 약하게 조립되고, 고밀도 RPBLA들은 형성되지 않는다고 결론지을 수 있다.
실시예
16: 형질전환된 담배 식물들의
RPBLA
들에서 Z(
Adh
)-
GFP
, Z(
Adh
)Px-Gfp, Z(
Col
)-
Gfp
, Z(
Col
)Px-
Gfp
의 축적
RX3과 낮은 서열 상동성을 가진 PBIS는 RPBLA들을 생성할 수 있는 것으로 나타났다. PP 및 PA는 C9와 C64 잔기 사이에서 RX3 서열에 대해 60% 미만의 동일성을 공유한다. 반면에, PP 및 PA 서열이 높은 프롤린 퍼센트(각각 96.2 및 67.9 퍼센트) (와일드 타입 RX3(54,7%)보다 상당히 높은)를 가진다는 것을 지적하는 것은 중요하다. PPII 구조를 채택한 다른 단백질 서열들의 RPBLA 유도 능력을 평가하였다. 서열들은 다음 임계치를 충족하였다: (i) RX3에 대해 40% 미만이고 (ii) 40% 프롤린 함량 미만. 아미노산 135 내지 179 (AccN: CAA34683)을 포함하는 인간 콜라겐 COL2A1의 단편, 및 표면 부착소 AgI/II (Streptococcus mutans strain NG8; GeneBank: GQ456171. AccN: ACV69919)로부터 얻은 884 내지 927 단편이 선택되었다. 도 17A에 도시된 바와 같이, 이러한 서열들은 R8(C4) (Z(Adh) 및 Z(Col)) 또는 RX3 (Z(Adh)Px 및 Z(Col)Px) 조립자 펩티드들에 대한 RD를 치환하기 위해 사용되었다.
GFP에 융합된 이들 조립자 펩티드들은 담배 잎에서 높은 레벨로 축적되었고 쿠마시로 염색된 이들 잎들로부터 미리 맑게 만든 균질화액들에서 주요한 밴드로서 나타났다 (도 17B). 각각 37.7 kDa 및 34.6 kDa의 예상 MW를 가진 Z(Adh)-Gfp 및 Z(Adh)Px-Gfp는 SDS-PAGE 겔에서 더 낮은 이동도를 가진다. 위에서 기재된 PPII 구조를 채택한 조립자 펩티드(예를 들어, PP, RX3(E) 등)의 대부분에서 또한 관찰되는 이동 시프트는 이러한 2차 구조의 강한 안정성 때문일 수 있다.
Z(Adh)-GFP, Z(Adh)Px-GFP, Z(Col)-GFP 및 Z(Col)Px-GFP를 발현하는 담배 잎들의 공초점 현미경에 의한 분석은 이들 융합 단백질들이 약 1 마이크로미터 직경의 둥근 형상의 형광 RPBLA들에서 세포 내에 축적되는 것을 보여주었다. RX3에 대한 낮은 상동성 백분율 및 낮은 프롤린 함량에도 불구하고, 융합 단백질들은 소포체(ER) 내에 보유되었고, 이들의 조립체는 RPBLA들의 형성을 효율적으로 유도하였다(도 17C).
ELP, 하이드로포빈 또는 RX3ΔCys64 ,82,84,92-ECFP-KDEL에 의해 생산된 단백질체들과는 달리, RPBLA들의 중요한 특징은 고밀도 세포기관들 내에 있는 단백질의 단단한 패킹이다. 이 특징은 원심분리에 의한 RPBLA 분리를 허용한다. 그러므로, Z(Adh)-GFP, Z(Adh)Px-GFP, Z(Col)-GFP 및 Z(Col)Px-GFP가 1500 xg(도 17D)로 원심분리 후 펠릿(RPBLA 분획물)으로 회수된다는 관찰은 이들 융합 단백질들이 고밀도 RPBLA들의 형성을 유도한다는 것을 나타낸다. Px 도메인의 존재로 인한 Cys 잔기(4 내지 6)의 수의 증가 및 피롤린 풍부 서열에 의한 조립자 펩티드의 확대는 조립자의 단단함이 상당히 증가하고 RPBLA의 더 높은 효율적 회수로 나타났다(도 17에서 Z(Adh)-GFP 대 Z(Adh)Px-GFP 및 Z(Col)-GFP 대 Z(Col)Px-GFP 비교). 밀도 구배 및 FRAP 실험들은 이 데이터를 지원한다.
Z(Adh)-GFP, Z(Adh)Px-GFP, Z(Col)-GFP 및 Z(Col)Px-GFP의 서열 비교 (도 17A)로부터 관찰될 수 있듯이, RX3 반복 도메인의 마지막 반복은 복제 이유때문에 모든 경우들에서 유지되었다. RPBLA를 형성하기 위해 Adh 및 Col PPII가 RD로부터 마지막 RX3 반복 단위를 필요로 한다는 것을 버리기 위해, 이 반복이 없는(Z(Adh2)-GFP, Z(Adh2)Px-GFP, Z(Col2)-GFP 및 Z(Col2)Px-GFP) 새로운 컨스트럭트의 집합이 수행된다. 이들 새로운 모든 컨스트럭트들은 RPBLA를 유도하는 능력을 유지하였다.
실시예
17: 형질전환된 담배 식물들에서
RX3
-
Xyl
,
RX3
(L)-
Xyl
,
RX3
(E)-
Xyl
, RX3(A)-Xyl
PP
-
Xyl
및
PA
-
Xyl
의 발현에 의해 유도된
RPBLA
에 대한
크실라나아제
활성의 판단
앞서(WO2007/096192A1) 기재된 바와 같이, 와일드 타입 RX3-유래 융합 단백질들의 발현에 의해 유도된 RPBLA들은 이러한 PBIS에 융합된 목적 단백질(POI)의 활성을 유지하는 능력을 가진다.
본원에 기재된 조립자 펩티드들이 이들에 융합된 단백질들의 활성에 어떻게 영향을 미치는지를 판단하기 위해, 비-양친매성(PP, PA, RX3(A) 및 RX3(L)) 및 음으로 대전된 양친매성(RX3(E)) 조립자 펩티드들을 연구하였다. 크실라나아제(xylanase) 효소(DQ465452)가 리포터 POI로서 선택되었고 와일드 타입 RX3뿐만 아니라 이들 모든 조립자 펩티드들에 대해 5개의 글리신을 기준으로 포함하는 링커를 통해 융합되었다.
PP-Xyl, PA-Xyl, RX3(E)-Xyl, RX3(L)-Xyl, RX3(A)-Xyl 및 RX3-Xyl을 과발현하는 담배 잎을, 불일치 및 가변성을 감소시키기 위해 괴저성 조직을 회피하면서, 아그로인필트레이션 6일 후 수확하였다. 저속 원심분리에 의한 다운스트림 처리를 각 컨스트럭트에 대해 수행하였고, RPBLA가 풍부한 분획물을 쿠마시 블루 염색에 의해 SDS-PAGE로 분석하였다. 모든 경우들에서, RPBLA 분획물은 분획물 내에서 가장 풍부한 단백질인 융합 단백질이 매우 풍부했다. 단백질 함량은 EZQ 단백질 수량화 키트(Invitrogen, Molecular Probes)로 측정되었고, 각 시료와 관련된 크실라나아제 활성은 2분 마다 해당하는 형광 생성물을 측정(파장: 여기 360/40 nm, 방출 460/40 nm)하면서 합성 기질(DiFMUX2)을 이용하여 수량화되었다.
예상 외로, 분석된 모든 시료들 중에서, 가장 낮은 특이적 활성(11.7 nmols/(분*단백질 마이크로그램))을 갖는 RPBLA 분획물이 RX3-Xyl 융합 단백질에 해당하였다. 이 융합 단백질을 기준으로 하여, RX3(A)-Xyl은 거의 두 배의 특이적 활성을 보여주었고; RX3(E)-Xyl 및 RX3(L)-Xyl은 약 3배의 증가를 보여주었으며; 그리고 PP-Xyl 및 PA-Xyl은 기준보다 7배 이상 높은 특이적 활성을 보여주었다(표 4 참조). 동일량의 융합 단백질을 사용하여 활성이 측정되었고, RX3에 비해 이들 조립자 펩티드들의 특이적 활성 증가는 다른 RPBLA 성질들에 관련될 수 있었다. 이 관찰은 높은 특이적 활성이 효소 응용들에서 유용한 속성이라는 것을 고려하면 매우 중요하다.
nmols/ min/μg prot | Std.Dev | FOLD | Std.Dev.Rel | |
RX3-Xyl | 11.7 | 0.63 | 1.0 | 0.05 |
PA-Xyl | 84.7 | 0.57 | 7.3 | 0.05 |
PP-Xyl | 84.4 | 4.51 | 7.2 | 0.50 |
RX3(A)-Xyl | 21 | 0.5 | 1.8 | 0.05 |
RX3(E)-Xyl | 33.5 | 2.89 | 2.9 | 0.25 |
RX3(L)-Xyl | 41.2 | 4.00 | 3.5 | 0.34 |
실시예
18: 담배 식물들에서
RPBLA
들을 유도하는 능력에서 시스테인
잔기들에
대한 그리고
관심있는
폴리펩티드에 대한
RX3
반복 도메인의 방위의 비 의존성
와일드 타입 RX3으로부터 얻은 반복 도메인(RD)은 각각 N-말단 및 C-말단에 위치된 2개 및 4개의 시스테인 잔기들을 옆에 갖고 있다. 이러한 비대칭 분포는 RPBLA 유도에서 조립체 능력 및/또는 효율에 관해 약간 중요할 수 있다. 이를 검사하기 위해, 새로운 컨스트럭트(iRX3)가 RD의 옆에 있는 영역들이 역방위에서 스웹 및 복제되도록 생성되었다 (도 18A). 담배 잎들이 ECFP(iRX3-ECFP)에 융합된 역위 RX3 조립자 펩티드를 암호화하는 컨스트럭트로 아그로인필트레이션될 때, 크고 둥근 형상의 RPBLA들일 관찰되었다. 놀랍게도, 유도된 RPBLA들의 크기는 기준으로 사용된 RX3-ECFP 융합 단백질의 발현으로 수득된 대응하는 RPBLA들보다 상당히 더 컸다 (도 18B). RX3-ECFP 및 iRX3-ECFP의 평균 크기는 각각 약 1 마이크로미터와 약 2.5 마이크로미터였다.
RPBLA들의 높은 밀도와 단단함은 세포의 기관들 및 가용성 단백질의 나머지로부터 원심분리에 의한 효율적 분리를 허용하여(미국 공개출원번호 제2006/0123509호), iRX3-ECFP RPBLA의 밀도는 다단계 Optiprep 밀도 구배에 의해 판단되었다. iRX3-ECFP 및 RX3-ECFP의 발현에 의해 유도된 밀도 구배를 따라서 RPBLA들 분포 비교는 유의미한 차이가 없음을 보여주었다. 두 경우들에서, 대다수의 RPBLA들은 아그로인필트레이션 6일 후 형성되었고 1.175 g/cm3 내지 1.26 g/cm3 범위의 고밀도 분획물들로부터 회수되었다(도 18C; 레인 4 내지 7). 이 분획물들은 또한 내생 세포 단백질 대부분을 갖고 있지 않는다.
목적 단백질(ECFP)에 대해 조립자 펩티드(RX3 및 iRX3)의 상대적 위치의 중요성을 또한 분석하였다. 두 개의 추가적인 컨스트럭트들은 ECFP의 C-말단에서 RX3 또는 iRX3 조립자 펩티드를 복제함으로써 생성되었다(도 18; ECFP-RX3 및 ECFP-iRX3) 이들 융합 단백질들을 발현하는 담배 잎들은 대응하는 N-말단 융합 단백질들(RX3-ECFP 및 iRX3-ECFP)보다 덜 효율적이지만, RPBLA들을 유도할 수 있었다. 도 18B에서, 공초점 영상들은 ECFP-RX3 및 ECFP-iRX3이, 대부분 약 0.5 마이크로미터인 수많은 작은 RPBLA들을 유도한다는 것을 보여준다. 흥미롭게도, 감소된 크기에도 불구하고, 일부 RPBLA들은 세포 오염물들 대부분이 없는 1.175 g/cm3 및 1.21 g/cm3 의 고밀도 분획물들 (도 18C, 레인 4 및 5)에서 회수되었다. 더 낮은 밀도(도 18C, 레인 2 및 3)를 갖는 분획물들에서 일부 융합 단백질의 존재는 아마도 더 느린 조립 동력학으로 인해 완전한 RPBLA들로 조립되지 못한 융합 단백질을 나타낼 수 있다. 목적 단백질의 C-말단에 연결된 조립자 펩티드를 갖는 융합 단백질들의 발현에 의해 유도된 RPBLA들은 원심분리에 의해 분리될 수 있다고 결론지을 수 있다.
실시예
19:
CHO
세포들에서
hGH
-I-
RX3
,
DsRED
-I-
RX3
및
EK
-
RX3
의
RPBLA
들에서 축적
POI의 C-말단에서 융합된 PBIS가 CHO 세포들에서 RPBLA들의 형성을 유도할 수 있다는 것을 나타내기 위해, 다음 융합 단백질들 (i) hGH-I-RX3, (ii) EK-RX3, 및 (iii) DsRED-I-RX3을 발현하는 세 컨스트럭트들이 생성되었다 (도 19 참조). 세 가지 모든 경우에서, CHO 세포 형질주입 후, 세포내 스폿들의 특징적 패턴의 관찰은 해당 융합 단백질들이 RPBLA들에서 세포들 내에 유지되었다는 것을 나타내었다(도 19A 및 B). 도 19A에서 명확하게 관찰될 수 있는 RPBLA 크기의 비균질성은 RPBLA 형성의 다른 단계들 또는 형질주입 효율 차이 및 융합 단백질 발현 레벨의 결과적 차이와 관련될 수 있다.
단백질체 내에서 융합 단백질 조립체의 단단함을 간접적인 특징으로 하는 기술적 접근법은 단계별 쿠션 수크로오스 구배에 의한 RPBLA 밀도의 판단이다. 그러므로, CHO 세포들에서 hGH-I-RX3의 발현으로 유도된 RPBLA들은 다음 수크로오스 단계벌 쿠션들 구배의 상단 위에 로딩되었다:
% 수크로오스 | 밀도 (g/mL) |
20 | 1.08 |
27 | 1.12 |
35 | 1.16 |
42 | 1.2 |
56 | 1.28 |
웨스턴 블롯에 의한 밀도 구배로부터 회수된 다른 분획물들의 동일한 용적들의 분석은 로딩된 융합 단백질(도 19A, 레인 H) 대부분이 고밀도 분획물들(도 19A, 레인 F42 및 F56)에서 회수되었다는 것을 보여주었다. 조립되지 않은 소량의 융합 단백질 또한 S 및 F27 분획물들에서 관찰되었는데, 이는 아마도 더 느린 조립 동력학에 기인한다. 조밀성이 높은 RPBLA들은 통상적으로 약 1.2 g/mL의 밀도를 갖는 분획물들로부터 회수되므로, RPBLA들은 단백질의 C-말단에서 RX3 도메인을 갖는 융합 단백질에 의해 유도될 수 있다고 결론지을 수 있다.
실시예
20:
SF9
곤충 세포들에서
hGH
-I-
RX3
의
RPBLA
들에서의 축적
단백질의 C-말단에서 RX3 조립자 펩티드를 갖는 융합 단백질들이 곤충 세포들에서 RPBLA들을 유도할 수 있다는 표시는 hGH-I-RX3으로 수행되었다. hGH-I-RX3을 발현하는 pBacPAK8 재조합 바이러스로 감염된 곤충 세포들은 RPBLA 축적의 면역형광 패턴 특징을 보여주었다(도 19C). 세포를 따라서 균일하게 분포된 스폿들은 RPBLA들에 해당하고 융합 단백질이 ER 내에 효율적으로 유지된다는 것을 나타내었다. hGH-I-RX3을 발현하는 SF9 세포들이 균질화액으로 만들어져서 저속(3000xg)으로 원심분리되었을 때, 많은 비율의 융합 단백질은 RPBLA 분획물에서 회수되었다(도 19C, 우측 패널, 레인 3). N-말단 RX3 융합 단백질들(미국특허 공개번호 제2006/0123509호)에서 관찰된 바와 같이, RX3:RX3 상호작용에 의해 유도된 고밀도 세포기관들(RPBLA들)에서 단단한 조립은 RPBLA들이 매우 풍부하게 있는 분획물의 효율적인 회수를 허용한다.
실시예
21: 포유동물 세포들에서
RPBLA
들의 축적
다음 단백질들을 인코딩하는 서열들은 크실라나아제를 인코딩하는 서열들에 융합되고 포유동물 세포들에서 발현을 위한 벡터 pcDNA 3.1 (Invitrogen)로 복제되었다: RX3, RX3(A), RX3(L), RX3(A3), RX3(E), RX3(D), RX3(T), RX3(N), RX3(Q), PP, PA, RX3C64G, RX3C82G, RX3C84G, RX3C92G, PP2, R8(C4), R7(C4), R6(C4), R4(C4), Z(Adh), Z(Adh)Px, Z(Col), Z(Col)Px, 및 iRX3. 결과적인 벡터들은 리포펙타민계 형질주입 방법(Invitrogen)을 이용하여 293T, Cos1, 및 CHO 세포로 도입된다.
형질주입된 세포들의 웨스턴 블롯은 융합 단백질 모두의 축적을 보여준다. 아울러, 면역세포화학에 의한 융합 단백질의 국소화는 융합 단백질들이 약 0.5 내지 약 3 마이크론의 직경을 갖는 구형 RPBLA들에 축적된다는 것을 나타낸다. RPBLA들의 밀도는 수크로오스 단계별-쿠션들 상의 로딩에 의해 판단되고 약 1.1 내지 약 1.4 g/mL이다. RPBLA들은 저속 원심분리(약 5000xg 미만)를 사용하여 정제되고, 회수된 RPBLA들은 최소 약 95% 순수하다. RPBLA들은 온순 완충액(50 mM Tris pH 8, 5 mM TCEP 및 10 mM 2bME)에서 약 4시간 동안 인큐베이팅하고 이후 약 16,000xg로 약 10분 동안 원심분리함으로써 가용화된다. 가용화된 부분에서 단백질이 고 수율로 회수된다. 크실라나아제 활성은 합성 기질(DiFMUX2)을 사용하여 측정되고 높은 활성 레벨이 관찰된다.
실시예
22: 곤충 세포들에서
RPBLA
들의 축적
다음 단백질들을 인코딩하는 서열들은 크실라나아제를 인코딩하는 서열들에 융합되고 pFastBAck 바큐로바이러스 발현 벡터계(Invitrogen)로 복제되었다: RX3, RX3(A), RX3(L), RX3(A3), RX3(E), RX3(D), RX3(T), RX3(N), RX3(Q), PP, PA, RX3C64G, RX3C82G, RX3C84G, RX3C92G, PP2, R8(C4), R7(C4), R6(C4), R4(C4), Z(Adh), Z(Adh)Px, Z(Col), Z(Col)Px, 및 iRX3. 재조합 바이러스는 BaculoGold 형질주입 키트(PharMingen, San Diego, California, USA)를 사용하여 생산되었다. Sf9 세포들은 배양액 접시들의 바닥에 부착되도록 허용되었고 15분 내지 1시간 인큐베이션 후, 바이러스 군체가 습한 공기에서 27℃로 약 30 내지 약 36시간 동안 유지되는 배지들에 첨가된다.
감염된 세포들의 웨스턴 블롯은 융합 단백질 모두의 축적을 보여준다. 아울러, 면역세포화학에 의한 융합 단백질의 국소화는 융합 단백질들이 약 0.5 내지 약 3 마이크론의 직경을 갖는 구형 RPBLA들에 축적된다는 것을 나타낸다. RPBLA들의 밀도는 수크로오스 단계별-쿠션들 상에 로딩에 의해 판단되고 약 1.1 내지 약 1.4 g/mL이다. RPBLA들은 저속 원심분리(약 5000xg 미만)를 사용하여 정제되고, 회수된 RPBLA들은 최소 약 95% 순수하다. RPBLA들은 온순 완충액(50 mM Tris pH 8, 5 mM TCEP 및 10 mM 2bME)에서 약 4시간 동안 인큐베이팅하고 이후 약 16,000xg로 약 10분 동안 원심분리함으로써 가용화된다. 가용화된 부분에서 단백질이 고 수율로 회수된다. 크실라나아제 활성은 합성 기질(DiFMUX2)을 사용하여 측정되고 높은 활성 레벨이 관찰된다.
실시예
23: 사상균류 세포들에서
RPBLA
들의 축적
[Penttila M, Nevalainen H, Ratto M, Salminen E, Knowles J: A versatile transformation system for the cellulolytic filamentous fungus Trichoderma reesei. Gene 1987, 61:155-164]에 기재된 것처럼, 다음 단백질들을 인코딩하는 서열들이 크실라나아제를 인코딩하는 서열들에 융합되고 T. reesei 변종 RutC-30[Montenecourt BS, Eveleigh DE: Selective screening methods for the isolation of high yielding cellulase mutants of Trichoderma reesei . Adv Chem Ser 1979, 181:289-301.]으로 도입된 Trichoderma reesei 발현 벡터들로 복제된다: RX3, RX3(A), RX3(L), RX3(A3), RX3(E), RX3(D), RX3(T), RX3(N), RX3(Q), PP, PA, RX3C64G, RX3C82G, RX3C84G, RX3C92G, PP2, R8(C4), R7(C4), R6(C4), R4(C4), Z(Adh), Z(Adh)Px, Z(Col), Z(Col)Px, 및 iRX3. 형질전환주들은 125 μg/ml의 하이그로마이신 B를 포함하는 플레이트들 위에 선택된다. 이 형질전환주들은 유도된 발현을 위해 락토오스를 포함하는 선택적 배지 위에 줄무늬가 만들어지고 형광 현미경으로 스크린된다. 가장 많은 양의 융합 단백질들을 생산하는 형질전환주로부터 균류들이 여과로 수집되었다.
형질전환된 균류들의 웨스턴 블롯은 융합 단백질 모두의 축적을 보여준다. 아울러, 면역세포화학에 의한 융합 단백질의 국소화는 융합 단백질들이 약 0.5 내지 약 3 마이크론의 직경을 갖는 구형 RPBLA들에 축적된다는 것을 나타낸다. RPBLA들의 밀도는 Optiprep 단계별-쿠션들 상에 로딩에 의해 판단되고 약 1.1 내지 약 1.4 g/mL이다. RPBLA들은 저속 원심분리(약 5000xg 미만)를 사용하여 정제되고, 회수된 RPBLA들은 최소 약 95% 순수하다. RPBLA들은 온순 완충액(50 mM Tris pH 8, 5 mM TCEP 및 10 mM 2bME)에서 약 4시간 동안 인큐베이팅하고 이후 약 16,000xg로 약 10분 동안 원심분리함으로써 가용화된다. 가용화된 부분에서 단백질이 고 수율로 회수된다. 크실라나아제 활성은 합성 기질(DiFMUX2)을 사용하여 측정되고 높은 활성 레벨이 관찰된다.
실시예
24: 본 발명에 따라
PBIS
를 사용하여 얻어진
RPBLA
들의 성질들의 요약
RX3, RX3(E), RX3(D), RX3(Q), RX3(N), RX3(T), RX3(A), RX3(A3), RX3(L), PA, PP 및 iRX3 PBIS 및 ECFP (iRX3 PBIS 사용시, 융합 단백질들은 ECFP에 대해 PBIS의 양 방위들을 갖고서 구성되었다)의 융합 단백질들을 발현하는 해당 컨스트럭트들로 아그로인필터된 담배 식물들로부터 제조된 RPBLA들의 직경 및 밀도가 위에서 설명된 바와 같이 판단되었다. 결과들은 표 9에 제시되어 있다.
융합 단백질 | 직경 * (μm) |
RPBLA* 밀도 (g/mL) |
RX3-ECFP | 1<d<2 | 1.21~1.26 |
RX3(E)-ECFP | 1<d<5 | 1.166~1.185 |
RX3(D)-ECFP | 1<d<2 | nd |
RX3(Q)-ECFP | 0.5<d<2 | 약 1.17 |
RX3(N)-ECFP | 0.5<d<1 | nd |
RX3(T)-ECFP | 0.5<d<1 | nd |
RX3(A)-ECFP | 1<d<2 | 1.194~1.204 |
RX3(A3)-ECFP | 1<d<2 | 약 1.17 |
RX3(L)-ECFP | 약 0.5 | 1.160~1.204 |
PA-ECFP | 0.5<d<1 | 1.175~1.204 |
PP-ECFP | 0.5<d<1 | 1.175~1.204 |
ECFP-iRX3 | 0.5<d<1 | 1.11~1.17 |
iRX3-ECFP | 1<d<3 | 1.21~1.23 |
실시예
25: 비 알레르기성
PBIS
의 구성
프롤라민으로부터 유도된 프롤라민 단백질 및 펩티드는 알레르기성일 수 있다. 흥미롭게도 RX3 펩티드의 추정 알레르기원성을 FARRP(Food Allergy Research and Resource Program)이 개발한 AllergenOnline Database (버전 10.0, 2010년 1월; http://www.allergenonline.com)로 분석했을 때, 알레르기성 펩티드들과 35%를 넘는 동일성을 가진 10개의 결과들이 발견되었다. 이 결과는 와일드-타입 RX3이 알레르기성 포텐셜을 가진다는 것을 제시한다. 이 펩티드의 낮은 알레르기성 또는 비 알레르기성 버전은 몇몇 애플리케이션들에서 유용하다(즉, 영양). 그러므로, 본 출원에 기재된 RX3 펩티드들의 다른 이형들로 동일한 분석이 수행되었고, PA 및 RX3(A3)은 와일드 타입 RX3보다 상당히 덜 알레르기성이라는 결과가 나타났다. AllergenOnline Database에서 PA 및 RX3(A3)의 서열 분석은 알레르기성 펩티드들과 35%를 넘는 동일성을 가진 세 개 및 두 개 결과들만 각각 보여주었다. 이들 관찰을 근거로, RX3 조립자 펩티드의 몇몇 새로운 비알레르기성 버전들이 합성되었다: RX3(LA1) (서열번호 110) 및 RX3(LA2) (서열번호 111). 이들 두 펩티드들은 알레르기성 펩티드와 35%를 넘는 동일성을 가진 결과들을 갖지 않고, 이는 이들이 알레르기성이 아니라는 것을 나타낸다. GFP 및 ECFP에 대한 RX3(LA1) 및 RX3(LA2)의 융합 단백질들이 담배 잎들에서 발현되었고, RPBLA 유도를 위한 이들의 능력은 영향을 받지 않는다.
RX3-LA1 (서열번호 60)
THTSGGCGCA PPPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPAAAP PPPCHYPTAP ARPAPAPAPA PCPCAAPAPS PCQ
RX3-LA2 (서열번호 61)
THTSGGCGCA PPPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPAAAP PPPCHYPPAP APPAPAPPAP ACPCAAPAPS PCQ
특히, R8(4C)는 알레르기성 펩티드들과 35%를 넘는 동일성을 가진 결과를 갖지 않는데, 이는 R8(4C)가 결코 알레르기성이 아니라는 것을 나타낸다. 이 결과는 RX3의 알레르기가 Pro-X 도메인에서의 아미노산 서열에 주로 기인한다는 것을 나타낸다. 조립자 펩티드에서 추정되는 알레르기성 효과들을 회피하기 위해, 몇몇 비알레르기성 R8(C4) 이형들이 합성되었고 담배 잎들에서 RPBLA 유도에 대해 성공적으로 검사되었다.
* * *
요약(Summary) 및 요약서(Abstract) 부분이 아니라 상세한 설명 부분이 청구항들을 해석하기 위해 사용되도록 한 것이라는 것이 잘 이해될 것이다. 요약 및 요약서 부분은 하나 이상을 기재하지만 발명자(들)가 심사숙고한 본 발명의 모든 예시적 실시예들을 기재하지 않을 수 있으므로, 이들 부분들은 어떠한 식으로든 본 발명 및 첨부된 청구항들을 한정하고자 하는 것은 아니다.
본 발명이 그의 특정된 기능들 및 관계들의 구현을 예시하는 기능적 빌딩 블록들의 도움으로 위에서 기재되었다. 이들 기능적 빌딩 블록들의 경계는 본원에서 설명의 편의를 위해 임의로 정의되었다. 그의 특정된 기능들 및 관계들이 적절하게 수행되기만 하면 대안적 경계들이 정의될 수 있다.
특정 실시예들의 상기한 기재는 본 발명의 일반적인 성질을 매우 충분히 보여서, 지식을 적용함으로써, 이 기술에 통상의 지식을 가진 자들은 지나친 실험 없이, 본 발명의 일반적 개념으로부터 벗어남이 없이도, 다양한 응용을 위해 이러한 특정 실시예들을 쉽게 변경 및/또는 변형할 수 있다. 그러므로, 이러한 변형 및 변경은, 본원에서 제시된 교시 및 안내를 근거로, 개시된 실시예들의 등가물들의 의미 및 범위 내이고자 한다. 본 명세서의 용어 또는 어구가 교시 및 안내의 견지에서 통상인에 의해 해석되도록, 본원에서 사용된 어구 또는 용어는 제한이 아니라 설명의 기재의 목적을 위한 것이라는 사실이 이해될 것이다.
본 발명의 폭 및 범주는 위에서 기재된 예시적 실시예들 중 어느 것에 의해서도 제한되어서는 안되며, 다음 청구항들 및 그들의 등가물들에 따라서만 정의되어야 한다.
본 출원의 청구항들은 모 출원 또는 기타 관련 출원들의 청구항들과 다르다. 따라서, 출원인은 현재의 출원과 관련하여 모출원 또는 임의의 선출원에서 작성된 청구 범위의 어떠한 디스클레이머를 취하한다. 따라서, 심사관은 회피 목적으로 행해진 이와 같은 어떠한 앞선 디스클레이머 및 인용 참증들이 다시 논의될 필요가 있을 수도 있다는 것을 알아야 한다. 또한, 심사관은 현재의 출원에서 이루어진 어떤 디스클레이머가 모 출원으로 이해되거나 모 출원에 반하는 것으로 이해되어서는 안된다는 것을 기억해야 한다.
SEQUENCE LISTING
<110> ERA BIOTECH, S.A.
<120> PROTEIN BODY-INDUCING POLYPEPTIDE SEQUENCES
<130> F12-6742-ES
<150> US 61/349655
<151> 2010-05-28
<150> EP10382231.8
<151> 2010-08-13
<160> 130
<170> PatentIn version 3.5
<210> 1
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> PPVHLx6
<400> 1
Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val
1 5 10 15
His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro
20 25 30
Pro Val His Leu
35
<210> 2
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> (PPPVHL)x6 - PPPVHVPPPVHL
<400> 2
Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val
1 5 10 15
His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro
20 25 30
Pro Val His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His Leu
35 40 45
<210> 3
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> (PPPVHL)x6 - PPPVHVPPPVHLPPPPCH
<400> 3
Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val
1 5 10 15
His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro
20 25 30
Pro Val His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His Leu
35 40 45
Pro Pro Pro Pro Cys His
50
<210> 4
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVHL
<400> 4
Pro Pro Pro Val His Leu
1 5
<210> 5
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPX
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 5
Pro Pro Pro Xaa
1
<210> 6
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> PPXX
<220>
<221> misc_feature
<222> (3)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 6
Pro Pro Xaa Xaa
1
<210> 7
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> PXXX
<220>
<221> misc_feature
<222> (2)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 7
Pro Xaa Xaa Xaa
1
<210> 8
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> PPXP
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa can be any naturally occurring amino acid
<400> 8
Pro Pro Xaa Pro
1
<210> 9
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPXX
<220>
<221> misc_feature
<222> (4)..(5)
<223> Xaa can be any naturally occurring amino acid
<400> 9
Pro Pro Pro Xaa Xaa
1 5
<210> 10
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPXXX
<220>
<221> misc_feature
<222> (4)..(6)
<223> Xaa can be any naturally occurring amino acid
<400> 10
Pro Pro Pro Xaa Xaa Xaa
1 5
<210> 11
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPXPX
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (6)..(6)
<223> Xaa can be any naturally occurring amino acid
<400> 11
Pro Pro Pro Xaa Pro Xaa
1 5
<210> 12
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPAAAPPPAAAPPPAAA
<400> 12
Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala
1 5 10 15
Ala Ala
<210> 13
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPAAA
<400> 13
Pro Pro Pro Ala Ala Ala
1 5
<210> 14
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPAAAPPPAAAPPAPPPPPAPPP
<400> 14
Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Ala Pro
1 5 10 15
Pro Pro Pro Pro Ala Pro Pro Pro
20
<210> 15
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPAPPP
<400> 15
Pro Pro Ala Pro Pro Pro
1 5
<210> 16
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVAL
<400> 16
Pro Pro Pro Val Ala Leu
1 5
<210> 17
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVLL
<400> 17
Pro Pro Pro Val Leu Leu
1 5
<210> 18
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVEL
<400> 18
Pro Pro Pro Val Glu Leu
1 5
<210> 19
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVDL
<400> 19
Pro Pro Pro Val Asp Leu
1 5
<210> 20
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVTL
<400> 20
Pro Pro Pro Val Thr Leu
1 5
<210> 21
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVNL
<400> 21
Pro Pro Pro Val Asn Leu
1 5
<210> 22
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVQL
<400> 22
Pro Pro Pro Val Gln Leu
1 5
<210> 23
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPAPA
<400> 23
Pro Pro Pro Ala Pro Ala
1 5
<210> 24
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPPPP
<400> 24
Pro Pro Pro Pro Pro Pro
1 5
<210> 25
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> THTSGGCGCQ
<400> 25
Thr His Thr Ser Gly Gly Cys Gly Cys Gln
1 5 10
<210> 26
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> THPPPPCPCP
<400> 26
Thr His Pro Pro Pro Pro Cys Pro Cys Pro
1 5 10
<210> 27
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> (PPPVHL) x 8
<400> 27
Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val
1 5 10 15
His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro
20 25 30
Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu
35 40 45
<210> 28
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> VHLPPP
<400> 28
Val His Leu Pro Pro Pro
1 5
<210> 29
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> (PPPVHL) x 6
<400> 29
Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val
1 5 10 15
His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro
20 25 30
Pro Val His Leu
35
<210> 30
<211> 52
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVELPPP VELPPPVELP PPVELPPPVE LPPPVELPPP VEVPPPVELPPPP
<400> 30
Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val
1 5 10 15
Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro
20 25 30
Pro Val Glu Leu Pro Pro Pro Val Glu Val Pro Pro Pro Val Glu Leu
35 40 45
Pro Pro Pro Pro
50
<210> 31
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVDLPPP VDLPPPVDLP PPVDLPPPVD LPPPVDLPPP VDLPPPVDL
<400> 31
Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val
1 5 10 15
Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro
20 25 30
Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu
35 40 45
<210> 32
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVNLPPP VNLPPPVNLP PPVNLPPPVN LPPPVNLPPP VNVPPPVNL
<400> 32
Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val
1 5 10 15
Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro
20 25 30
Pro Val Asn Leu Pro Pro Pro Val Asn Val Pro Pro Pro Val Asn Leu
35 40 45
<210> 33
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVNLPPPV NLPPPVNLPP PVNLPPPVNL PPPVNLPPPV NLPPPVNL
<400> 33
Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val
1 5 10 15
Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro
20 25 30
Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu
35 40 45
<210> 34
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVQLPPP VQLPPPVQLP PPVQLPPPVQ LPPPVQLPPP VQVPPPVQL
<400> 34
Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val
1 5 10 15
Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro
20 25 30
Pro Val Gln Leu Pro Pro Pro Val Gln Val Pro Pro Pro Val Gln Leu
35 40 45
<210> 35
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVQLPPP VQLPPPVQLP PPVQLPPPVQ LPPPVQLPPP VQLPPPVQL
<400> 35
Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val
1 5 10 15
Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro
20 25 30
Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu
35 40 45
<210> 36
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVSL
<400> 36
Pro Pro Pro Val Ser Leu
1 5
<210> 37
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVVL
<400> 37
Pro Pro Pro Val Val Leu
1 5
<210> 38
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VAVPPPVAL
<400> 38
Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val
1 5 10 15
Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro
20 25 30
Pro Val Ala Leu Pro Pro Pro Val Ala Val Pro Pro Pro Val Ala Leu
35 40 45
<210> 39
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VALPPPVAL
<400> 39
Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val
1 5 10 15
Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro
20 25 30
Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu
35 40 45
<210> 40
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VAVPPPVHL
<400> 40
Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val
1 5 10 15
Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro
20 25 30
Pro Val Ala Leu Pro Pro Pro Val Ala Val Pro Pro Pro Val His Leu
35 40 45
<210> 41
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VALPPPVHL
<400> 41
Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val
1 5 10 15
Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro
20 25 30
Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val His Leu
35 40 45
<210> 42
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVLLPPP VLLPPPVLLP PPVLLPPPVL LPPPVLLPPP VLVPPPVLL
<400> 42
Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val
1 5 10 15
Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro
20 25 30
Pro Val Leu Leu Pro Pro Pro Val Leu Val Pro Pro Pro Val Leu Leu
35 40 45
<210> 43
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVLLPPP VLLPPPVLLP PPVLLPPPVL LPPPVLLPPP VLLPPPVLL
<400> 43
Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val
1 5 10 15
Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro
20 25 30
Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu
35 40 45
<210> 44
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVVLPPP VVLPPPVVLP PPVVLPPPVV LPPPVVLPPP VVVPPPVVL
<400> 44
Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val
1 5 10 15
Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro
20 25 30
Pro Val Val Leu Pro Pro Pro Val Val Val Pro Pro Pro Val Val Leu
35 40 45
<210> 45
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVVLPPP VVLPPPVVLP PPVVLPPPVV LPPPVVLPPP VVLPPPVVL
<400> 45
Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val
1 5 10 15
Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro
20 25 30
Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu
35 40 45
<210> 46
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVTLPPP VTLPPPVTLP PPVTLPPPVT LPPPVTLPPP VTVPPPVTL
<400> 46
Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val
1 5 10 15
Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro
20 25 30
Pro Val Thr Leu Pro Pro Pro Val Thr Val Pro Pro Pro Val Thr Leu
35 40 45
<210> 47
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVTLPPPV TLPPPVTLPP PVTLPPPVTL PPPVTLPPPV TLPPPVTL
<400> 47
Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val
1 5 10 15
Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro
20 25 30
Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu
35 40 45
<210> 48
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVSLPPP VSLPPPVSLP PPVSLPPPVS LPPPVSLPPP VSVPPPVSL
<400> 48
Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val
1 5 10 15
Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro
20 25 30
Pro Val Ser Leu Pro Pro Pro Val Ser Val Pro Pro Pro Val Ser Leu
35 40 45
<210> 49
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVSLPPP VSLPPPVSLP PPVSLPPPVS LPPPVSLPPP VSLPPPVSL
<400> 49
Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val
1 5 10 15
Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro
20 25 30
Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu
35 40 45
<210> 50
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPAAA
<400> 50
Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala
1 5 10 15
Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro
20 25 30
Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala
35 40 45
<210> 51
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPVHL
<400> 51
Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala
1 5 10 15
Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro
20 25 30
Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Val His Leu
35 40 45
<210> 52
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPPPP
<400> 52
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
1 5 10 15
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
20 25 30
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
35 40 45
Pro Pro
50
<210> 53
<211> 49
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPVHL
<400> 53
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
1 5 10 15
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
20 25 30
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Val His
35 40 45
Leu
<210> 54
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPAPAPPP APAPPPAPAP PPAPAPPPAP APPPAPAPPP APAPPPVHL
<400> 54
Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala
1 5 10 15
Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro
20 25 30
Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Val His Leu
35 40 45
<210> 55
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPAPAPPP APAPPPAPAP PPAPAPPPAP APPPAPAPPP APAPPPAPA
<400> 55
Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala
1 5 10 15
Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro
20 25 30
Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala
35 40 45
<210> 56
<211> 49
<212> PRT
<213> Artificial Sequence
<220>
<223> GPMGPRGPPG PAGAPGPQGF QGNPGEPGEP GVSGPMGPRG PPGPPPVHL
<400> 56
Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly
1 5 10 15
Pro Gln Gly Phe Gln Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val
20 25 30
Ser Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Pro Pro Val His
35 40 45
Leu
<210> 57
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> CXXC
<220>
<221> misc_feature
<222> (2)..(3)
<223> Xaa can be any naturally occurring amino acid
<400> 57
Cys Xaa Xaa Cys
1
<210> 58
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Signal sequence
<400> 58
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1 5 10 15
Ala Thr Ser
<210> 59
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Signal sequence
<400> 59
Met Phe Leu Lys Ser Pro Phe Tyr Ala Phe Leu Cys Phe Gly Gln Tyr
1 5 10 15
Phe Val Ala Val Thr His Ala
20
<210> 60
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3-LA1
<400> 60
Thr His Thr Ser Gly Gly Cys Gly Cys Ala Pro Pro Pro Pro Ala Ala
1 5 10 15
Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro
20 25 30
Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro
35 40 45
Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Pro Cys
50 55 60
His Tyr Pro Thr Ala Pro Ala Arg Pro Ala Pro Ala Pro Ala Pro Ala
65 70 75 80
Pro Cys Pro Cys Ala Ala Pro Ala Pro Ser Pro Cys Gln
85 90
<210> 61
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3-LA2
<400> 61
Thr His Thr Ser Gly Gly Cys Gly Cys Ala Pro Pro Pro Pro Ala Ala
1 5 10 15
Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro
20 25 30
Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro
35 40 45
Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Pro Cys
50 55 60
His Tyr Pro Pro Ala Pro Ala Pro Pro Ala Pro Ala Pro Pro Ala Pro
65 70 75 80
Ala Cys Pro Cys Ala Ala Pro Ala Pro Ser Pro Cys Gln
85 90
<210> 62
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3
<400> 62
Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val
1 5 10 15
His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro
20 25 30
Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu
35 40 45
<210> 63
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(R)
<400> 63
Pro Pro Pro Val Arg Leu Pro Pro Pro Val Arg Leu Pro Pro Pro Val
1 5 10 15
Arg Leu Pro Pro Pro Val Arg Leu Pro Pro Pro Val Arg Leu Pro Pro
20 25 30
Pro Val Arg Leu Pro Pro Pro Val Arg Leu Pro Pro Pro Val Arg Leu
35 40 45
<210> 64
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(K)
<400> 64
Pro Pro Pro Val Lys Leu Pro Pro Pro Val Lys Leu Pro Pro Pro Val
1 5 10 15
Lys Leu Pro Pro Pro Val Lys Leu Pro Pro Pro Val Lys Leu Pro Pro
20 25 30
Pro Val Lys Leu Pro Pro Pro Val Lys Leu Pro Pro Pro Val Lys Leu
35 40 45
<210> 65
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> PXPP
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa can be any naturally occurring amino acid
<400> 65
Pro Xaa Pro Pro
1
<210> 66
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(A)
<400> 66
Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val
1 5 10 15
Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro
20 25 30
Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu
35 40 45
<210> 67
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(L)
<400> 67
Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val
1 5 10 15
Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro
20 25 30
Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu
35 40 45
<210> 68
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> GPMGPRGPPG PAGAPGPQGF QGNPGEPGEP GVSGPMGPRG PPGPP
<400> 68
Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly
1 5 10 15
Pro Gln Gly Phe Gln Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val
20 25 30
Ser Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Pro
35 40 45
<210> 69
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> PPTPPTYETE KPLEPAPVEP SYEAEPTPPT RAPDQAEPNK PTPPTPVHLP PPP
<400> 69
Pro Pro Thr Pro Pro Thr Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala
1 5 10 15
Pro Val Glu Pro Ser Tyr Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala
20 25 30
Pro Asp Gln Ala Glu Pro Asn Lys Pro Thr Pro Pro Thr Pro Val His
35 40 45
Leu Pro Pro Pro Pro
50
<210> 70
<211> 46
<212> PRT
<213> Artificial Sequence
<220>
<223> PPTPPTYETE KPLEPAPVEP SYEAEPTPPT RAPDQAEPNK PTPPTP
<400> 70
Pro Pro Thr Pro Pro Thr Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala
1 5 10 15
Pro Val Glu Pro Ser Tyr Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala
20 25 30
Pro Asp Gln Ala Glu Pro Asn Lys Pro Thr Pro Pro Thr Pro
35 40 45
<210> 71
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> ProX domain of gamma-zein
<400> 71
His Tyr Pro Tyr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His
1 5 10 15
Pro Cys Pro Cys
20
<210> 72
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> CHYPTQPPRPQPHPQPHPCPCQQPHPS
<400> 72
Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro
1 5 10 15
His Pro Cys Pro Cys Gln Gln Pro His Pro Ser
20 25
<210> 73
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> CPPPPPPPPPPPPPPPPPCPCPPPPPPPCP
<400> 73
Cys Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
1 5 10 15
Pro Pro Cys Pro Cys Pro Pro Pro Pro Pro Pro Pro Cys Pro
20 25 30
<210> 74
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> CPPPPPPPPPPPPPPPPPCPPCPPPPPCPP
<400> 74
Cys Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
1 5 10 15
Pro Pro Cys Pro Pro Cys Pro Pro Pro Pro Pro Cys Pro Pro
20 25 30
<210> 75
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> CPPPAPAPPPAPAPPPAPCPCPAPAPP
<400> 75
Cys Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro
1 5 10 15
Ala Pro Cys Pro Cys Pro Ala Pro Ala Pro Pro
20 25
<210> 76
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> CHYPPAPAPPAPAPPAPACPCAAPAPSPCQ
<400> 76
Cys His Tyr Pro Pro Ala Pro Ala Pro Pro Ala Pro Ala Pro Pro Ala
1 5 10 15
Pro Ala Cys Pro Cys Ala Ala Pro Ala Pro Ser Pro Cys Gln
20 25 30
<210> 77
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(E)
<400> 77
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Glu
1 5 10 15
Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro
20 25 30
Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro
35 40 45
Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Pro Cys
50 55 60
His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His
65 70 75 80
Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
85 90
<210> 78
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(D)
<400> 78
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Asp
1 5 10 15
Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro
20 25 30
Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro
35 40 45
Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Pro Cys
50 55 60
His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His
65 70 75 80
Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
85 90
<210> 79
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(N)
<400> 79
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Asn
1 5 10 15
Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro
20 25 30
Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro
35 40 45
Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Pro Cys
50 55 60
His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His
65 70 75 80
Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
85 90
<210> 80
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(Q)
<400> 80
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Gln
1 5 10 15
Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro
20 25 30
Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro
35 40 45
Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Pro Cys
50 55 60
His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His
65 70 75 80
Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
85 90
<210> 81
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(A)
<400> 81
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Ala
1 5 10 15
Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro
20 25 30
Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro
35 40 45
Pro Pro Val Ala Leu Pro Pro Pro Val His Leu Pro Pro Pro Pro Cys
50 55 60
His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His
65 70 75 80
Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
85 90
<210> 82
<211> 98
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(A)2
<400> 82
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Ala
1 5 10 15
Leu Pro Pro Pro Pro Val Ala Leu Pro Pro Pro Pro Val Ala Leu Pro
20 25 30
Pro Pro Pro Val Ala Leu Pro Pro Pro Pro Val Ala Leu Pro Pro Pro
35 40 45
Pro Val Ala Leu Pro Pro Pro Val Ala Val Pro Pro Pro Val His Leu
50 55 60
Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro
65 70 75 80
His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro
85 90 95
Cys Gln
<210> 83
<211> 86
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(L)
<400> 83
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Leu
1 5 10 15
Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro
20 25 30
Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro
35 40 45
Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Pro Cys
50 55 60
His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His
65 70 75 80
Pro Cys Pro Cys Gln Gln
85
<210> 84
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(V)
<400> 84
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Val
1 5 10 15
Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro
20 25 30
Val Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro
35 40 45
Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Pro Cys
50 55 60
His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His
65 70 75 80
Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
85 90
<210> 85
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(T)
<400> 85
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Thr
1 5 10 15
Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro
20 25 30
Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro
35 40 45
Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Pro Cys
50 55 60
His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His
65 70 75 80
Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
85 90
<210> 86
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(S)
<400> 86
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Ser
1 5 10 15
Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro
20 25 30
Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro
35 40 45
Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Pro Cys
50 55 60
His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His
65 70 75 80
Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
85 90
<210> 87
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> RX3(A3)
<400> 87
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Ala Ala
1 5 10 15
Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro
20 25 30
Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro
35 40 45
Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Pro Cys
50 55 60
His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His
65 70 75 80
Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
85 90
<210> 88
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> PP
<400> 88
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Pro Pro
1 5 10 15
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
20 25 30
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
35 40 45
Pro Pro Pro Pro Pro Pro Pro Pro Pro His Leu Pro Pro Pro Pro Cys
50 55 60
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
65 70 75 80
Pro Cys Pro Cys Pro Pro Pro Pro Pro Pro Pro Cys Pro
85 90
<210> 89
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> PP3
<400> 89
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Pro Pro
1 5 10 15
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
20 25 30
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
35 40 45
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Cys
50 55 60
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
65 70 75 80
Pro Cys Pro Cys Pro Pro Pro Pro Pro Pro Pro Cys Pro
85 90
<210> 90
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> PA
<400> 90
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Ala Pro
1 5 10 15
Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro
20 25 30
Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro
35 40 45
Pro Pro Ala Pro Ala Pro Pro Pro Ala His Leu Pro Pro Pro Pro Cys
50 55 60
Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala
65 70 75 80
Pro Cys Pro Cys Pro Ala Pro Ala Pro Pro Pro Cys Pro
85 90
<210> 91
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> PA2
<400> 91
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Ala Pro
1 5 10 15
Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro
20 25 30
Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro
35 40 45
Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Pro Cys
50 55 60
Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala
65 70 75 80
Pro Cys Pro Cys Pro Ala Pro Ala Pro Pro Pro Cys Pro
85 90
<210> 92
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> NPP
<400> 92
Thr His Pro Pro Pro Pro Cys Pro Cys Pro Pro Pro Pro Pro Pro Pro
1 5 10 15
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
20 25 30
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
35 40 45
Pro Pro Pro Pro Pro Pro Pro Pro Pro His Leu Pro Pro Pro Pro Cys
50 55 60
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
65 70 75 80
Pro Cys Pro Cys Pro Pro Pro Pro Pro Pro Pro Cys Pro
85 90
<210> 93
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> NPA
<400> 93
Thr His Pro Pro Pro Pro Cys Pro Cys Pro Pro Pro Pro Pro Ala Pro
1 5 10 15
Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro
20 25 30
Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro
35 40 45
Pro Pro Ala Pro Ala Pro Pro Pro Ala His Leu Pro Pro Pro Pro Cys
50 55 60
Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala
65 70 75 80
Pro Cys Pro Cys Pro Ala Pro Ala Pro Pro Pro Cys Pro
85 90
<210> 94
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> Z(Adh)Px
<400> 94
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Thr Pro Pro Thr
1 5 10 15
Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala Pro Val Glu Pro Ser Tyr
20 25 30
Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala Pro Asp Gln Ala Glu Pro
35 40 45
Asn Lys Pro Thr Pro Pro Thr Pro Val His Leu Pro Pro Pro Pro Cys
50 55 60
His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His
65 70 75 80
Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
85 90
<210> 95
<211> 86
<212> PRT
<213> Artificial Sequence
<220>
<223> Z(Adh2)Px
<400> 95
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Thr Pro Pro Thr
1 5 10 15
Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala Pro Val Glu Pro Ser Tyr
20 25 30
Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala Pro Asp Gln Ala Glu Pro
35 40 45
Asn Lys Pro Thr Pro Pro Thr Pro Cys His Tyr Pro Thr Gln Pro Pro
50 55 60
Arg Pro Gln Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro
65 70 75 80
His Pro Ser Pro Cys Gln
85
<210> 96
<211> 94
<212> PRT
<213> Artificial Sequence
<220>
<223> Z(col)Px
<400> 96
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Gly Pro Met Gly Pro
1 5 10 15
Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Pro Gln Gly Phe Gln
20 25 30
Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val Ser Gly Pro Met Gly
35 40 45
Pro Arg Gly Pro Pro Gly Pro Pro Pro Val His Leu Pro Pro Pro Pro
50 55 60
Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro
65 70 75 80
His Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
85 90
<210> 97
<211> 86
<212> PRT
<213> Artificial Sequence
<220>
<223> Z(col2)Px
<400> 97
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Gly Pro Met Gly Pro
1 5 10 15
Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Pro Gln Gly Phe Gln
20 25 30
Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val Ser Gly Pro Met Gly
35 40 45
Pro Arg Gly Pro Pro Gly Pro Pro Cys His Tyr Pro Thr Gln Pro Pro
50 55 60
Arg Pro Gln Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro
65 70 75 80
His Pro Ser Pro Cys Gln
85
<210> 98
<211> 67
<212> PRT
<213> Artificial Sequence
<220>
<223> Z(Adh)
<400> 98
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Thr Pro Pro Thr
1 5 10 15
Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala Pro Val Glu Pro Ser Tyr
20 25 30
Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala Pro Asp Gln Ala Glu Pro
35 40 45
Asn Lys Pro Thr Pro Pro Thr Pro Val His Leu Pro Pro Pro Pro Cys
50 55 60
Pro Pro Cys
65
<210> 99
<211> 60
<212> PRT
<213> Artificial Sequence
<220>
<223> Z(Adh2)
<400> 99
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Thr Pro Pro Thr
1 5 10 15
Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala Pro Val Glu Pro Ser Tyr
20 25 30
Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala Pro Asp Gln Ala Glu Pro
35 40 45
Asn Lys Pro Thr Pro Pro Thr Pro Cys Pro Pro Cys
50 55 60
<210> 100
<211> 64
<212> PRT
<213> Artificial Sequence
<220>
<223> Z(col)
<400> 100
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Gly Pro Met Gly Pro
1 5 10 15
Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Pro Gln Gly Phe Gln
20 25 30
Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val Ser Gly Pro Met Gly
35 40 45
Pro Arg Gly Pro Pro Gly Pro Pro Pro Val His Leu Cys Pro Pro Cys
50 55 60
<210> 101
<211> 60
<212> PRT
<213> Artificial Sequence
<220>
<223> Z(col2)
<400> 101
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Gly Pro Met Gly Pro
1 5 10 15
Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Pro Gln Gly Phe Gln
20 25 30
Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val Ser Gly Pro Met Gly
35 40 45
Pro Arg Gly Pro Pro Gly Pro Pro Cys Pro Pro Cys
50 55 60
<210> 102
<211> 63
<212> PRT
<213> Artificial Sequence
<220>
<223> R8(4C)
<400> 102
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val His
1 5 10 15
Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro
20 25 30
Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro
35 40 45
Pro Pro Val His Val Pro Pro Pro Val His Leu Cys Pro Pro Cys
50 55 60
<210> 103
<211> 57
<212> PRT
<213> Artificial Sequence
<220>
<223> R7(4C)
<400> 103
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val His
1 5 10 15
Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro
20 25 30
Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro
35 40 45
Pro Pro Val His Val Cys Pro Pro Cys
50 55
<210> 104
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> R6(4C)
<400> 104
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val His
1 5 10 15
Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro
20 25 30
Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Cys
35 40 45
Pro Pro Cys
50
<210> 105
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> R4(4C)
<400> 105
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val His
1 5 10 15
Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro
20 25 30
Val His Leu Pro Pro Pro Val His Leu Cys Pro Pro Cys
35 40 45
<210> 106
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> iRX3
<400> 106
Gln Cys Pro Ser Pro His Pro Gln Gln Cys Pro Cys Pro His Pro Gln
1 5 10 15
Pro His Pro Gln Pro Arg Pro Pro Gln Thr Pro Tyr His Cys Pro Pro
20 25 30
Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His
35 40 45
Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro
50 55 60
Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro
65 70 75 80
Pro Pro Pro Gln Cys Gly Cys Gly Gly Ser Thr His Thr
85 90
<210> 107
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n times
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 107
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Glu
1 5 10 15
Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln
20 25 30
Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser
35 40 45
Pro Cys Gln
50
<210> 108
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n times
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 108
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Asp
1 5 10 15
Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln
20 25 30
Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser
35 40 45
Pro Cys Gln
50
<210> 109
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n times
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 109
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Asn
1 5 10 15
Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln
20 25 30
Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser
35 40 45
Pro Cys Gln
50
<210> 110
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> KDEL
<400> 110
Lys Asp Glu Leu
1
<210> 111
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n times
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 111
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Gln
1 5 10 15
Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln
20 25 30
Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser
35 40 45
Pro Cys Gln
50
<210> 112
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n times
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 112
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Ala
1 5 10 15
Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln
20 25 30
Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser
35 40 45
Pro Cys Gln
50
<210> 113
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n times
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 113
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Thr
1 5 10 15
Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln
20 25 30
Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser
35 40 45
Pro Cys Gln
50
<210> 114
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n times
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 114
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Ser
1 5 10 15
Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln
20 25 30
Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser
35 40 45
Pro Cys
50
<210> 115
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n times
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 115
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Leu
1 5 10 15
Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln
20 25 30
Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser
35 40 45
Pro Cys Gln
50
<210> 116
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n times
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 116
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Val
1 5 10 15
Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln
20 25 30
Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser
35 40 45
Pro Cys Gln
50
<210> 117
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n times
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 117
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Ala Ala
1 5 10 15
Ala Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln
20 25 30
Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser
35 40 45
Pro Cys Gln
50
<210> 118
<211> 46
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n timed
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 118
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Ala Ala
1 5 10 15
Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro
20 25 30
Ala Pro Cys Pro Cys Pro Ala Pro Ala Pro Pro Pro Cys Pro
35 40 45
<210> 119
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n times
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 119
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Pro Pro
1 5 10 15
Pro Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln
20 25 30
Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser
35 40 45
Pro Cys Gln
50
<210> 120
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n times
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 120
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Pro Pro
1 5 10 15
Pro Pro Pro Pro Cys Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
20 25 30
Pro Pro Pro Pro Pro Pro Cys Pro Cys Pro Pro Pro Pro Pro Pro Pro
35 40 45
Cys Pro
50
<210> 121
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated n times
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 121
Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Ala Pro
1 5 10 15
Ala Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln
20 25 30
Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser
35 40 45
Pro Cys Gln
50
<210> 122
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> PBIS
<220>
<221> REPEAT
<222> (12)..(17)
<223> The sequence may be repeated 4, 5, 6, 7 or 8 times
<400> 122
Thr His Thr Ser Gly Gly Cys Gly Cys Ala Pro Pro Pro Pro Ala Ala
1 5 10 15
Ala Pro Pro Pro Pro Cys His Tyr Pro Pro Ala Pro Ala Pro Pro Ala
20 25 30
Pro Ala Pro Pro Ala Pro Ala Cys Pro Cys Ala Ala Pro Ala Pro Ser
35 40 45
Pro Cys Gln
50
<210> 123
<211> 52
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVELPPPV ELPPPVELPP PVELPPPVEL PPPVELPPPV ELPPPVELPP PP
<400> 123
Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val
1 5 10 15
Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro
20 25 30
Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu
35 40 45
Pro Pro Pro Pro
50
<210> 124
<211> 52
<212> PRT
<213> Artificial Sequence
<220>
<223> PPPVDLPPPV DLPPPVDLPP PVDLPPPVDL PPPVDLPPPV DVPPPVDLPP PP
<400> 124
Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val
1 5 10 15
Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro
20 25 30
Pro Val Asp Leu Pro Pro Pro Val Asp Val Pro Pro Pro Val Asp Leu
35 40 45
Pro Pro Pro Pro
50
<210> 125
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> PP2
<400> 125
Thr His Pro Pro Pro Pro Cys Pro Pro Cys Pro Pro Pro Pro Pro Pro
1 5 10 15
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
20 25 30
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
35 40 45
Pro Pro Pro Pro Pro Pro Pro Pro Pro His Leu Pro Pro Pro Pro Cys
50 55 60
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
65 70 75 80
Pro Cys Pro Pro Cys Pro Pro Pro Pro Pro Cys Pro Pro
85 90
<210> 126
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> QCPSPHPQQCPCPHPQPHPQPRPPQTPYHC
<400> 126
Gln Cys Pro Ser Pro His Pro Gln Gln Cys Pro Cys Pro His Pro Gln
1 5 10 15
Pro His Pro Gln Pro Arg Pro Pro Gln Thr Pro Tyr His Cys
20 25 30
<210> 127
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> CHYPTAPARPAPAPAPAPCPCAAPAPSPCQ
<400> 127
Cys His Tyr Pro Thr Ala Pro Ala Arg Pro Ala Pro Ala Pro Ala Pro
1 5 10 15
Ala Pro Cys Pro Cys Ala Ala Pro Ala Pro Ser Pro Cys Gln
20 25 30
<210> 128
<211> 46
<212> PRT
<213> Artificial Sequence
<220>
<223> Adh
<400> 128
Pro Pro Thr Pro Pro Thr Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala
1 5 10 15
Pro Val Glu Pro Ser Tyr Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala
20 25 30
Pro Asp Gln Ala Glu Pro Asn Lys Pro Thr Pro Pro Thr Pro
35 40 45
<210> 129
<211> 47
<212> PRT
<213> Artificial Sequence
<220>
<223> Col
<400> 129
Pro Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro
1 5 10 15
Gly Pro Gln Gly Phe Gln Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly
20 25 30
Val Ser Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Pro Pro
35 40 45
<210> 130
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> QPPPPVHLPPPPCHYPTQPPRPQPHPQPHP
<400> 130
Gln Pro Pro Pro Pro Val His Leu Pro Pro Pro Pro Cys His Tyr Pro
1 5 10 15
Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His Pro
20 25 30
Claims (55)
- 길이가 최소 36개의 아미노산들인 폴리프롤린 II(PPII) 구조를 포함하는 재조합 단백질체 유도 폴리펩티드 서열(PBIS)로서;
상기 PPII 구조는 N-말단에서 최소 두 시스테인들 사이 및 C-말단에서 최소 두 시스테인들 사이에 위치되고;
상기 PPII 구조 내 단지 10%의 아미노산들은 리신 또는 아르기닌이고;
상기 PPII 구조는 서열 (PPPVHL)6. (서열번호 29)을 포함하지 않는 재조합 단백질체 유도 폴리펩티드 서열. - 길이가 최소 36개의 아미노산들인 프롤린 풍부 서열을 포함하는 재조합 단백질체 유도 폴리펩티드 서열(PBIS)로서;
상기 프롤린 풍부 서열은 N-말단에서 최소 두 시스테인들 사이 및 C-말단에서 최소 두 시스테인들 사이에 위치되고;
상기 프롤린 풍부 서열 내 단지 10%의 아미노산들은 리신 또는 아르기닌이고;
상기 프롤린 풍부 서열은 서열 (PPPVHL)6.(서열번호 29)을 포함하지 않는 재조합 단백질체 유도 폴리펩티드 서열. - 제1항 또는 제2항에 있어서,
상기 PPII 구조 또는 상기 프롤린 풍부 영역은 적어도 5개의 프롤린 풍부 반복들을 포함하는 재조합 단백질체 유도 폴리펩티드 서열. - 제3항에 있어서,
상기 프롤린 풍부 반복들의 각각은 PPPXXX (서열번호 10), PPXX (서열번호 6), PX, PPPXX (서열번호 9), PPPX (서열번호 5), PPX 및 PPPXPX (서열번호 11)로 구성되는 군으로부터 독립적으로 선택되고, 여기서 X는 임의의 아미노산인 재조합 단백질체 유도 폴리펩티드 서열. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 PPII 구조 또는 상기 프롤린 풍부 영역의 길이는 약 40 내지 60개의 아미노산들인 재조합 단백질체 유도 폴리펩티드 서열. - 제1항 내지 제5항 중 어느 한 항에 있어서,
상기 PPII 구조 또는 상기 프롤린 풍부 영역은 비양친매성 PPII 구조, 양매성 및 음으로 대전된 PPII 구조 및 양매성 및 비대전된 PPII 구조로 구성되는 군으로부터 선택되는 재조합 단백질체 유도 폴리펩티드 서열. - 제6항에 있어서,
상기 PPII 구조 또는 상기 프롤린 풍부 영역은 음으로 대전된 양친매성 서열을 포함하는 재조합 단백질체 유도 폴리펩티드 서열. - 제7항에 있어서,
상기 음으로 대전된 양친매성 서열은 PPPVDL (서열번호 19) 및 PPPVEL (서열번호 18)로 구성되는 군으로부터 독립적으로 선택되는 적어도 하나의 반복을 포함하는 재조합 단백질체 유도 폴리펩티드 서열. - 제8항에 있어서,
상기 음으로 대전된 양친매성 서열은 서열번호 30, 서열번호 31, 서열번호 123 및 서열번호 124로 구성되는 군으로부터 독립적으로 선택되는 재조합 단백질체 유도 폴리펩티드 서열. - 제9항에 있어서,
상기 PPII 구조 또는 상기 프롤린 풍부 영역은 비대전된 양친매성 서열을 포함하는 재조합 단백질체 유도 폴리펩티드 서열. - 제10항에 있어서,
상기 비대전된 양친매성 서열은 PPPVNL (서열번호 21) 및 PPPVQL (서열번호 22)로 구성되는 군으로부터 독립적으로 선택되는 적어도 하나의 반복을 포함하는 재조합 단백질체 유도 폴리펩티드 서열. - 제11항에 있어서, 상기 비대전된 양친매성 서열은 서열번호 32, 서열번호 33, 서열번호 34 및 서열번호 35로 구성되는 군으로부터 독립적으로 선택되는 재조합 단백질체 유도 폴리펩티드 서열.
- 제6항에 있어서,
상기 PPII 구조 또는 상기 프롤린 풍부 영역은 비양친매성 서열인 재조합 단백질체 유도 폴리펩티드 서열. - 제13항에 있어서,
상기 비양친매성 서열은 PPPVAL (서열번호 16), PPPVTL (서열번호 20), PPPVSL (서열번호 36), PPPVVL, (서열번호 37) 및 PPPVLL (서열번호 17)로 구성되는 군으로부터 독립적으로 선택되는 적어도 하나의 반복을 포함하는 재조합 단백질체 유도 폴리펩티드. - 제14항에 있어서,
상기 비양친매성 서열은 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45, 서열번호 46, 서열번호 47, 서열번호 48 및 서열번호 49로 구성되는 군으로부터 독립적으로 선택되는 재조합 단백질체 유도 폴리펩티드 서열. - 제15항에 있어서,
상기 비양친매성 서열은 프롤린 및 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수 구성되는 재조합 단백질체 유도 폴리펩티드 서열. - 제16항에 있어서,
프롤린 및 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수 구성되는 상기 서열은 PPPAAA (서열번호 13), PPPAPA (서열번호 23) 및 PPPPPP (서열번호 24)로 구성되는 군으로부터 선택된 적어도 하나의 반복을 포함하는 재조합 단백질체 유도 폴리펩티드 서열. - 제17항에 있어서,
프롤린 및 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수 구성되는 상기 서열은 서열번호 50, 서열번호 51, 서열번호 52, 서열번호 53, 서열번호 54, 서열번호 55, 서열번호 60 및 서열번호 61로 구성되는 군으로부터 독립적으로 선택되는 재조합 단백질체 유도 폴리펩티드 서열. - 제13항에 있어서,
상기 비양친매성 서열은 서열 (GXY)n 으로 필수 구성되고, 여기서 X 및 Y는 독립적인 임의의 아미노산이고, n은 5 내지 20의 정수이며, (GXY)n 을 포함하는 상기 서열은 최소 30% 프롤린들을 포함하는 재조합 단백질체 유도 폴리펩티드 서열. - 제19항에 있어서,
상기 비양친매성 서열은 유전자은행 등록번호 (GenBank accession number) CAA34683.1의 아미노산 135 내지 179와 최소 70% 동일성을 보이는 아미노산들로 구성되는 군으로부터 선택된 아미노산들로 필수 구성되는 재조합 단백질체 유도 폴리펩티드 서열. - 제20항에 있어서,
상기 비양친매성 서열은 서열번호 56 및 서열번호 68로 구성되는 군으로부터 선택되는 아미노산들로 필수 구성되는 재조합 단백질체 유도 폴리펩티드 서열. - 제13항에 있어서,
상기 비양친매성 서열은 표면 부착소 AgI/II (Streptococcus mutans 변종 NG8; GeneBank: GQ456171)로부터 얻은 아미노산 884 내지 927과 최소 70% 동일성을 보이는 아미노산들로 필수 구성되는 재조합 단백질체 유도 폴리펩티드 서열. - 제22항에 있어서,
상기 비양친매성 서열은 서열번호 69 및 서열번호 70로 구성되는 군으로부터 선택되는 아미노산들로 필수 구성되는 재조합 단백질체 유도 폴리펩티드 서열. - 제1항 내지 제23항 중 어느 한 항에 있어서,
C-말단에서 상기 두 시스테인들 사이의 아미노산들의 수는 0 내지 20까지의 정수이고/이거나 N-말단에서 상기 두 시스테인들 사이의 아미노산의 수는 0 내지 20까지의 정수인 재조합 단백질체 유도 폴리펩티드 서열. - 제1항 내지 제24항 중 어느 한 항에 있어서,
상기 N-말단에서 상기 C-말단 시스테인과 상기 PPII 구조의 N-말단 사이 또는 상기 C-말단에서 상기 N-말단 시스테인과 상기 PPII 구조의 상기 C-말단 사이의 아미노산들의 수는 약 1 내지 30까지에서 독립적으로 선택된 정수인 재조합 단백질체 유도 폴리펩티드 서열. - 제1항 내지 제25항 중 어느 한 항에 있어서,
상기 N-말단에서 상기 두 시스테인들 또는 상기 C-말단에서 상기 두 시스테인들은 제2 프롤린 풍부 영역 내에서 발견되는 재조합 단백질체 유도 폴리펩티드 서열. - 제26항에 있어서,
상기 제2 프롤린 풍부 서열은 서열 (PX)n으로 필수 구성되고, n은 0과 20 사이의 정수인 재조합 단백질체 유도 폴리펩티드 서열. - 제27항에 있어서,
상기 제2 프롤린 풍부 서열은 서열번호 71, 서열번호 72, SEQ ID NO; 73, 서열번호 74, 서열번호 75, 서열번호 76, 및 서열번호 127로 구성되는 군으로부터 선택되는 재조합 단백질체 유도 폴리펩티드 서열. - 제28항에 있어서,
상기 PBIS는 서열번호 77, 서열번호 78, 서열번호 79, 서열번호 80, 서열번호 81, 서열번호 82, 서열번호 85, 서열번호 86, 서열번호 83, 서열번호 84, 서열번호 87, 서열번호 88, 서열번호 125, 서열번호 89, 서열번호 90, 서열번호 91, 서열번호 92, 서열번호 93, 서열번호 94, 서열번호 95, 서열번호 96, 서열번호 97, 서열번호 98, 서열번호 99, 서열번호 100 및 서열번호 101로 구성되는 군으로부터 선택되는 재조합 단백질체 유도 폴리펩티드 서열. - 제1항 내지 제29항 중 어느 한 항의 재조합 PBIS 및 이종 단백질을 포함하는 융합 단백질.
- 제30항에 있어서, 상기 이종 단백질은 재조합 PBIS에 대한 C-말단인 융합 단백질.
- 제 31항에 있어서, 상기 이종 단백질은 재조합 PBIS에 대한 N-말단인 융합 단백질.
- 제30 항 내지 제32항 중 어느 한 항에 있어서,
상기 PBIS 및 상기 이종 단백질은 링커에 의해 연결되는 융합 단백질. - 제33항에 있어서,
상기 링커는 화학적으로 단백질 분해 시약의 효소에 대한 표적 부위인 융합 단백질. - 제34항에 있어서,
효소적 단백질 분해 시약에 대한 상기 표적 부위는 엔테로키나아제 표적 부위, 인자 Xa 표적 부위 및 인테인으로 구성되는 군으로부터 선택되는 융합 단백질. - 제1항 내지 제29항 중 어느 한 항의 재조합 PBIS 또는 제30항 내지 제35항 중 어느 한 항의 융합 단백질을 인코딩하는 서열을 포함하는 핵산 분자.
- 제36항에 있어서,
상기 PBIS 또는 상기 융합 단백질을 소포체로 안내하는 신호 서열을 인코딩하는 서열을 더 포함하고, 상기 신호 서열은 상기 PBIS 또는 상기 융합 단백질로서 동일 오픈 리딩 프레임 내에 있는 핵산 분자. - 제37항에 있어서,
상기 신호 서열은 감마 제인 신호 펩티드 (gamma zein signal peptide)인 핵산 분자. - 제36항 내지 제38항 중 어느 한 항에 있어서,
프로모터를 더 포함하는 핵산 분자. - 제39항에 있어서,
상기 프로모터는 담배 세포, 포유동물 세포, 균류 세포, 곤충 세포 또는 조류 세포로 구성되는 군으로부터 선택되는 세포에서 기능적인 핵산 분자. - 제37항 내지 제40항 중 어느 한 항의 핵산을 포함하는 벡터.
- 제1항 내지 제29항 중 어느 한 항의 재조합 PBIS 또는 제30항 내지 제33항의 융합 단백질을 포함하는 RPBLA.
- 제1항 내지 제29항 중 어느 한 항의 재조합 PBIS, 제30항 내지 제35항 중 어느 한 항의 융합 단백질, 제36항 내지 제40항 중 어느 한 항의 핵산, 제41항의 벡터, 및 제42항의 RPBLA를 포함하는 숙주 세포.
- 제43항에 있어서,
상기 세포는 고등식물세포, 사상균류 세포, 곤충세포, 포유동물 세포, 또는 조류 세포인 숙주. - RPBLA 형성을 위한 적합한 조건들 하에서 제43항 또는 제44항 중 어느 한 항의 세포를 배양하는 것을 포함하는 RPBLA 생산방법.
- (i) RPBLA 형성을 위한 적합한 조건들 하에서 양태 43 또는 44 중 어느 하나의 세포를 배양하고;
(ii) 상기 재조합 단백질체를 정제하는 것
을 포함하는 RPBLA 정제방법. - (i) 제36항 내지 제40 항 중 어느 한 항의 핵산 또는 제41항의 벡터로 식물 숙주계를 형질전환하는 단계;
(ii) 상기 형질전환된 식물 숙주계로부터 식물을 생성하는 단계; 및
(iii) RPBLA 형성에 적합한 조건들 하에서 상기 식물을 성장시키는 단계
를 포함하는 RPBLA 생산방법. - (i) 제36항 내지 제40 항 중 어느 한 항의 핵산 또는 제41항의 벡터로 식물 숙주계를 형질전환하는 단계;
(ii) 상기 형질전환된 식물 숙주계로부터 식물을 생성하는 단계;
(iii) RPBLA 형성에 적합한 조건들 하에서 상기 식물을 성장시키는 단계; 및
(iv) 상기 RPBLA를 정제하는 단계
를 포함하는 RPBLA 생산방법. - 제48항에 있어서,
상기 RPBLA 정제단계는,
(i) 수용성 세포 균질화액을 제조하는 단계;
(ii) 상기 수용성 세포 균질화액에 다른 밀도 영역들을 형성하여 RPBLA의 농도 증가를 포함하는 영역과 상기 RPBLA 농도 감소를 포함하는 영역을 제공하는 단계; 및
(iii) 상기 RPBLA-감소된 영역을 상대적으로 증가된 농도의 RPBLA 영역으로부터 분리하여 RPBLA를 정제하는 단계
를 포함하는 RPBLA 생산방법. - (i) 막으로 둘러싸인 융합 단백질을 포함하는 RPBLA를 제공하는 단계로서, 상기 융합 단백질은 제30항 내지 제35항 중 어느 한 항의 융합 단백질임;
(ii) 상기 RPBLA를 막 분해할 수 있는 양의 계면활성제를 포함하는 수용성 완충제와 접촉시키는 단계;
(iii) 상기 막을 분해하기에 충분한 시간 동안 상기 융합 단백질을 변성시키지 않는 온도에서 상기 접촉을 유지하여 상기 막을 상기 융합 단백질로부터 분리하는 단계; 및
(iv) 상기 분리된 융합 단백질을 채집하는 단계
를 포함하는 융합 단백질 정제방법. - (i) 막으로 둘러싸인 융합 단백질을 포함하는 RPBLA를 제공하는 단계로서, 상기 융합 단백질은 양태 30 내지 35 중 어느 한 항의 융합 단백질임;
(ii) 상기 RPBLA를 막 분해할 수 있는 양의 계면활성제를 포함하는 수용성 완충제와 접촉시키는 단계;
(iii) 상기 막을 분해하기에 충분한 시간 동안 상기 융합 단백질을 변성시키지 않는 온도에서 상기 접촉을 유지하여 상기 막을 상기 융합 단백질로부터 분리하는 단계;
(iv) 상기 분리된 융합 단백질을 채집하는 단계; 및
(v) 상기 재조합 PBIS 및 이종 단백질 사이의 분할 부위를 분할하는 단계
를 포함하는 융합 단백질 정제방법. - 제42항의 RPBLA의 치료적으로 유효량을 포함하는 약제학적 조성물.
- 제42항의 RPBLA의 면역학적으로 유효량을 포함하는 백신.
- 약제학적으로 허용가능한 희석제를 추가로 포함하는 제52항의 약제학적 조성물 또는 제53항의 백신.
- 제42항의 RPBLA를 포함하는 식품.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US34965510P | 2010-05-28 | 2010-05-28 | |
US61/349,655 | 2010-05-28 | ||
EP10382231A EP2418284A1 (en) | 2010-08-13 | 2010-08-13 | Protein body-inducing polypeptide sequences |
EP10382231.8 | 2010-08-13 | ||
PCT/EP2011/058864 WO2011147995A1 (en) | 2010-05-28 | 2011-05-30 | Protein body-inducing polypeptide sequences |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20130113967A true KR20130113967A (ko) | 2013-10-16 |
Family
ID=43063942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127034217A KR20130113967A (ko) | 2010-05-28 | 2011-05-30 | 단백질체 유도 폴리펩티드 서열 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9637751B2 (ko) |
EP (3) | EP2418284A1 (ko) |
JP (1) | JP6087277B2 (ko) |
KR (1) | KR20130113967A (ko) |
CA (1) | CA2800852A1 (ko) |
DK (1) | DK2576797T3 (ko) |
ES (1) | ES2623147T3 (ko) |
WO (1) | WO2011147995A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190116982A (ko) * | 2017-02-14 | 2019-10-15 | 가부시끼가이샤니혼세이부쯔세이자이 | 기억 개선용 펩티드 |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0426160D0 (en) | 2004-11-29 | 2004-12-29 | Era Plantech S L | Production of proteins |
GB0426161D0 (en) * | 2004-11-29 | 2004-12-29 | Era Plantech S L | Protein isolation and purification |
JP5667062B2 (ja) | 2008-10-10 | 2015-02-12 | エラ、ビオテック、ソシエダッド、アノニマEra Biotech, S.A. | 免疫原特異的アジュバントとしての組換えタンパク粒 |
EP2418284A1 (en) | 2010-08-13 | 2012-02-15 | ERA Biotech, S.A. | Protein body-inducing polypeptide sequences |
WO2013139393A1 (en) * | 2012-03-22 | 2013-09-26 | Bioorganic Research And Services Sa | Formulations for non-invasive delivery of active proteins to an animal or human |
US10392611B2 (en) | 2013-05-30 | 2019-08-27 | Duke University | Polymer conjugates having reduced antigenicity and methods of using the same |
US10364451B2 (en) | 2013-05-30 | 2019-07-30 | Duke University | Polymer conjugates having reduced antigenicity and methods of using the same |
US10577617B2 (en) * | 2015-01-13 | 2020-03-03 | The Board Of Trustees Of The University Of Illinois | Plants having increased biomass and methods for making the same |
US10385115B2 (en) | 2015-03-26 | 2019-08-20 | Duke University | Fibronectin type III domain-based fusion proteins |
MX2018001511A (es) | 2015-08-04 | 2018-08-01 | Univ Duke | Polimeros furtivos desordenados de forma intrinseca codificados geneticamente para suministro y metodos para usar los mismos. |
US11752213B2 (en) | 2015-12-21 | 2023-09-12 | Duke University | Surfaces having reduced non-specific binding and antigenicity |
WO2017210476A1 (en) | 2016-06-01 | 2017-12-07 | Duke University | Nonfouling biosensors |
CN109890833A (zh) | 2016-09-14 | 2019-06-14 | 杜克大学 | 用于递送亲水性药物的基于三嵌段多肽的纳米粒子 |
US11155584B2 (en) | 2016-09-23 | 2021-10-26 | Duke University | Unstructured non-repetitive polypeptides having LCST behavior |
US11648200B2 (en) | 2017-01-12 | 2023-05-16 | Duke University | Genetically encoded lipid-polypeptide hybrid biomaterials that exhibit temperature triggered hierarchical self-assembly |
US11554097B2 (en) | 2017-05-15 | 2023-01-17 | Duke University | Recombinant production of hybrid lipid-biopolymer materials that self-assemble and encapsulate agents |
US11680083B2 (en) | 2017-06-30 | 2023-06-20 | Duke University | Order and disorder as a design principle for stimuli-responsive biopolymer networks |
WO2020028806A1 (en) | 2018-08-02 | 2020-02-06 | Duke University | Dual agonist fusion proteins |
RU2711111C1 (ru) * | 2018-09-05 | 2020-01-15 | Илья Владимирович Духовлинов | Гибридный белок igf-1-long для лечения инсульта, нуклеиновая кислота, вектор, клетка, фармацевтическая композиция, способ лечения |
US11512314B2 (en) | 2019-07-12 | 2022-11-29 | Duke University | Amphiphilic polynucleotides |
IL301396A (en) | 2020-09-30 | 2023-05-01 | Nobell Foods Inc | Recombinant milk proteins and food compositions containing them |
US10894812B1 (en) | 2020-09-30 | 2021-01-19 | Alpine Roads, Inc. | Recombinant milk proteins |
US10947552B1 (en) | 2020-09-30 | 2021-03-16 | Alpine Roads, Inc. | Recombinant fusion proteins for producing milk proteins in plants |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4215040A (en) | 1978-12-22 | 1980-07-29 | The Procter & Gamble Company | Density separation process |
US5215912A (en) | 1986-08-29 | 1993-06-01 | Lubrizol Genetics, Inc. | Monocot seed storage proteins in dicots |
US4882145A (en) | 1986-12-09 | 1989-11-21 | Scripps Clinic And Research Foundation | T cell epitopes of the hepatitis B virus nucleocapsid protein |
US4976958A (en) | 1987-02-26 | 1990-12-11 | Scripps Clinic And Research Foundation | Mycobacterial recombinants and peptides |
US4886782A (en) | 1987-02-26 | 1989-12-12 | The United States Of America As Represented By The Department Of Health And Human Services | Malarial immunogen |
AU634153B2 (en) | 1988-02-01 | 1993-02-18 | Wyeth Holdings Corporation | T-cell epitope as carriers molecule for conjugate vaccines |
CA1339307C (en) | 1988-09-06 | 1997-08-19 | Roy Curtiss, Iii | Oral immunization by transgenic plants |
US5618988A (en) | 1990-03-02 | 1997-04-08 | Amoco Corporation | Enhanced carotenoid accumulation in storage organs of genetically engineered plants |
US5948682A (en) | 1991-02-22 | 1999-09-07 | Sembiosys Genetics Inc. | Preparation of heterologous proteins on oil bodies |
US5650554A (en) | 1991-02-22 | 1997-07-22 | Sembiosys Genetics Inc. | Oil-body proteins as carriers of high-value peptides in plants |
JPH08511007A (ja) | 1993-06-09 | 1996-11-19 | コノート ラボラトリーズ リミテッド | タンデム合成hiv−1ペプチド |
GB9501826D0 (en) * | 1995-01-31 | 1995-03-22 | St Thomas Hosp Med School | Polypeptide fragments |
US6096710A (en) * | 1995-11-17 | 2000-08-01 | The Regents Of The University Of California | Collagen-like peptoid residue-containing structures |
US5990384A (en) | 1996-05-31 | 1999-11-23 | New Mexico State University | Co-expression of proteins |
WO1998035037A1 (en) * | 1997-02-07 | 1998-08-13 | Genentech, Inc. | TYROSINE PHOSPHORYLATED CLEAVAGE FURROW-ASSOCIATED PROTEINS (PSTPIPs) |
EP1019517B2 (en) | 1997-09-30 | 2014-05-21 | The Regents of The University of California | Production of proteins in plant seeds |
BR9916731A (pt) | 1998-12-31 | 2001-11-06 | Univ New Mexico State Tech Tra | Co-expressão de proteìnas |
US6942866B2 (en) | 2000-08-16 | 2005-09-13 | Apovia, Inc. | Malaria immunogen and vaccine |
WO2002086077A2 (en) | 2001-04-18 | 2002-10-31 | New Mexico State University Technology Transfer Corporation | Co-expression of zein proteins |
WO2003072731A2 (en) | 2002-02-21 | 2003-09-04 | Apovia, Inc. | STABILIZED HBc CHIMER PARTICLES HAVING MENINGOCCOCAL IMMUNOGENS |
ES2224792B1 (es) | 2002-06-28 | 2007-02-16 | Era Plantech, S.L. | Produccion de peptidos y proteinas por acumulacion de cuerpos proteicos derivados de reticulos endoplasmico en plantas. |
WO2005025497A2 (en) | 2003-09-05 | 2005-03-24 | Genencor International, Inc. | Hpv cd8+ t-cell epitopes |
WO2005113775A1 (en) | 2004-05-21 | 2005-12-01 | Simon Fraser University | Pproduction of a protein localized to the endoplasmic reticulum protein bodies in a transgenic plant and seed |
GB0426160D0 (en) | 2004-11-29 | 2004-12-29 | Era Plantech S L | Production of proteins |
GB0426161D0 (en) * | 2004-11-29 | 2004-12-29 | Era Plantech S L | Protein isolation and purification |
US8252893B2 (en) | 2005-01-31 | 2012-08-28 | Board Of Trustees Of The University Of Arkansas | CD8 T cell epitopes in HPV 16 E6 and E7 proteins and uses thereof |
US8163880B2 (en) | 2006-02-23 | 2012-04-24 | Era Biotech S.A. | Production of biologically active proteins |
JP5667062B2 (ja) | 2008-10-10 | 2015-02-12 | エラ、ビオテック、ソシエダッド、アノニマEra Biotech, S.A. | 免疫原特異的アジュバントとしての組換えタンパク粒 |
EP2418284A1 (en) | 2010-08-13 | 2012-02-15 | ERA Biotech, S.A. | Protein body-inducing polypeptide sequences |
-
2010
- 2010-08-13 EP EP10382231A patent/EP2418284A1/en not_active Withdrawn
-
2011
- 2011-05-30 EP EP11723923.6A patent/EP2576797B1/en active Active
- 2011-05-30 JP JP2013511705A patent/JP6087277B2/ja active Active
- 2011-05-30 CA CA2800852A patent/CA2800852A1/en not_active Abandoned
- 2011-05-30 WO PCT/EP2011/058864 patent/WO2011147995A1/en active Application Filing
- 2011-05-30 ES ES11723923.6T patent/ES2623147T3/es active Active
- 2011-05-30 EP EP17152652.8A patent/EP3184640A3/en not_active Withdrawn
- 2011-05-30 KR KR1020127034217A patent/KR20130113967A/ko active IP Right Grant
- 2011-05-30 DK DK11723923.6T patent/DK2576797T3/en active
- 2011-05-31 US US13/149,813 patent/US9637751B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190116982A (ko) * | 2017-02-14 | 2019-10-15 | 가부시끼가이샤니혼세이부쯔세이자이 | 기억 개선용 펩티드 |
Also Published As
Publication number | Publication date |
---|---|
DK2576797T3 (en) | 2017-03-27 |
US9637751B2 (en) | 2017-05-02 |
US20110305718A1 (en) | 2011-12-15 |
EP2576797B1 (en) | 2017-01-25 |
EP2576797A1 (en) | 2013-04-10 |
EP3184640A2 (en) | 2017-06-28 |
JP6087277B2 (ja) | 2017-03-01 |
EP2418284A1 (en) | 2012-02-15 |
ES2623147T3 (es) | 2017-07-10 |
WO2011147995A1 (en) | 2011-12-01 |
JP2013532960A (ja) | 2013-08-22 |
EP3184640A3 (en) | 2017-12-06 |
CA2800852A1 (en) | 2011-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9637751B2 (en) | Recombinant protein body-inducing polypeptides | |
RU2441911C2 (ru) | Получение биологически активных белков | |
CN103987728B (zh) | 抗癌融合蛋白 | |
CA2624667A1 (en) | Silk proteins containing coiled coil region | |
Wei et al. | Molecular cloning and characterization of a new G-type lysozyme gene (Ec-lysG) in orange-spotted grouper, Epinephelus coioides | |
US6916782B1 (en) | Gene coding for heliomicine and use thereof | |
JPH09173066A (ja) | 殺虫に有効なペプチド | |
Scott et al. | Elevation of oil body integrity and emulsion stability by polyoleosins, multiple oleosin units joined in tandem head‐to‐tail fusions | |
CA2456390A1 (en) | Fusion proteins for insect control | |
US20030092624A1 (en) | Denaturat stable and/or protease resistant, chaperone-like oligomeric proteins, polynucleotides encoding same, their uses and methods of increasing a specific activity thereof | |
KR102213745B1 (ko) | 돼지 유행성 설사병 바이러스 백신 조성물 및 이의 제조 방법 | |
Lay et al. | Recombinant expression and purification of the tomato defensin TPP3 and its preliminary X-ray crystallographic analysis | |
Takaiwa et al. | Specific region affects the difference in accumulation levels between apple food allergen Mal d 1 and birch pollen allergen Bet v 1 which are expressed in vegetative tissues of transgenic rice | |
JP2006238821A (ja) | 機能性ペプチド含有ダイズ形質転換体およびその利用 | |
WO2022015699A1 (en) | Methods to produce very long chain fatty acids | |
WO2023069905A1 (en) | Insect toxin delivery mediated by a begomovirus coat protein | |
Yang | Exploitation of small cysteine-rich spider protein toxins as bio-insecticides | |
JP2005281291A (ja) | 新規な抗菌性ペプチド、それを産生するための組換え体植物及び該抗菌性ペプチドの製造方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) |