KR20120014940A - 펩티드의 재조합 생산 - Google Patents
펩티드의 재조합 생산 Download PDFInfo
- Publication number
- KR20120014940A KR20120014940A KR1020127000053A KR20127000053A KR20120014940A KR 20120014940 A KR20120014940 A KR 20120014940A KR 1020127000053 A KR1020127000053 A KR 1020127000053A KR 20127000053 A KR20127000053 A KR 20127000053A KR 20120014940 A KR20120014940 A KR 20120014940A
- Authority
- KR
- South Korea
- Prior art keywords
- peptide
- precursor protein
- amino acid
- ala ala
- gly
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 324
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 116
- 238000004519 manufacturing process Methods 0.000 title description 13
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 220
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 199
- 239000002243 precursor Substances 0.000 claims abstract description 175
- 238000000034 method Methods 0.000 claims abstract description 60
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 43
- 230000014509 gene expression Effects 0.000 claims abstract description 32
- 235000018102 proteins Nutrition 0.000 claims description 195
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 claims description 75
- 150000001413 amino acids Chemical group 0.000 claims description 70
- 235000001014 amino acid Nutrition 0.000 claims description 61
- 239000013598 vector Substances 0.000 claims description 42
- 230000002209 hydrophobic effect Effects 0.000 claims description 34
- 125000000539 amino acid group Chemical group 0.000 claims description 31
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 claims description 21
- 230000001105 regulatory effect Effects 0.000 claims description 18
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 17
- 244000005700 microbiome Species 0.000 claims description 12
- 239000004202 carbamide Substances 0.000 claims description 11
- 108010050820 Antimicrobial Cationic Peptides Proteins 0.000 claims description 10
- 102000014133 Antimicrobial Cationic Peptides Human genes 0.000 claims description 10
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 10
- 230000000845 anti-microbial effect Effects 0.000 claims description 9
- 230000001681 protective effect Effects 0.000 claims description 9
- 108091026890 Coding region Proteins 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000001338 self-assembly Methods 0.000 claims description 7
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 6
- 241000588724 Escherichia coli Species 0.000 claims description 5
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 5
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 claims description 5
- 101710150620 Anionic peptide Proteins 0.000 claims description 4
- 239000004471 Glycine Substances 0.000 claims description 4
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 3
- 235000004279 alanine Nutrition 0.000 claims description 3
- 239000004474 valine Substances 0.000 claims description 3
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 229920001184 polypeptide Polymers 0.000 description 69
- 229940024606 amino acid Drugs 0.000 description 57
- 238000003776 cleavage reaction Methods 0.000 description 55
- 210000004027 cell Anatomy 0.000 description 53
- 230000007017 scission Effects 0.000 description 49
- 102100021381 Eukaryotic translation elongation factor 1 epsilon-1 Human genes 0.000 description 41
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 34
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 33
- XLOMVQKBTHCTTD-UHFFFAOYSA-N Zinc monoxide Chemical compound [Zn]=O XLOMVQKBTHCTTD-UHFFFAOYSA-N 0.000 description 32
- 125000003275 alpha amino acid group Chemical group 0.000 description 31
- 108010093581 aspartyl-proline Proteins 0.000 description 28
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 25
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 24
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 24
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 24
- 235000011121 sodium hydroxide Nutrition 0.000 description 24
- 239000000243 solution Substances 0.000 description 24
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 23
- 239000008188 pellet Substances 0.000 description 23
- 102000039446 nucleic acids Human genes 0.000 description 22
- 108020004707 nucleic acids Proteins 0.000 description 22
- 150000003839 salts Chemical class 0.000 description 21
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 20
- 108010038320 lysylphenylalanine Proteins 0.000 description 19
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 18
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 18
- 239000002253 acid Substances 0.000 description 18
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 16
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 16
- 230000004927 fusion Effects 0.000 description 16
- 239000011787 zinc oxide Substances 0.000 description 16
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 15
- 230000002378 acidificating effect Effects 0.000 description 15
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 15
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 14
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 14
- -1 n-octyl Chemical group 0.000 description 14
- 239000006228 supernatant Substances 0.000 description 14
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 13
- 238000007792 addition Methods 0.000 description 13
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 12
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 12
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 12
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 12
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 12
- 239000000463 material Substances 0.000 description 12
- 239000000047 product Substances 0.000 description 12
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 11
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 11
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 11
- 108700005078 Synthetic Genes Proteins 0.000 description 11
- 238000005277 cation exchange chromatography Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 11
- 239000003480 eluent Substances 0.000 description 11
- 238000004128 high performance liquid chromatography Methods 0.000 description 11
- 108010043322 lysyl-tryptophyl-alpha-lysine Proteins 0.000 description 11
- 108010054155 lysyllysine Proteins 0.000 description 11
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 11
- 239000000126 substance Substances 0.000 description 11
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 10
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 10
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 10
- 238000000746 purification Methods 0.000 description 10
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 10
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 9
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 9
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 9
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 9
- YUTZYVTZDVZBJJ-IHPCNDPISA-N Lys-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 YUTZYVTZDVZBJJ-IHPCNDPISA-N 0.000 description 9
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 9
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 9
- 238000004587 chromatography analysis Methods 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 102000037865 fusion proteins Human genes 0.000 description 9
- 108020001507 fusion proteins Proteins 0.000 description 9
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 9
- 108010025306 histidylleucine Proteins 0.000 description 9
- 239000000203 mixture Substances 0.000 description 9
- 239000002028 Biomass Substances 0.000 description 8
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 8
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 8
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 8
- 239000004472 Lysine Substances 0.000 description 8
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 8
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 8
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 8
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 8
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 8
- 108010003196 alanyl-prolyl-arginyl-prolyl-glycine Proteins 0.000 description 8
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 8
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 8
- 239000002773 nucleotide Substances 0.000 description 8
- 125000003729 nucleotide group Chemical group 0.000 description 8
- 238000004062 sedimentation Methods 0.000 description 8
- 239000011780 sodium chloride Substances 0.000 description 8
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 7
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 7
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 7
- 108020004414 DNA Proteins 0.000 description 7
- 241000196324 Embryophyta Species 0.000 description 7
- 241000233866 Fungi Species 0.000 description 7
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 7
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 7
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 7
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 7
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 7
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 7
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 7
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 7
- 230000009435 amidation Effects 0.000 description 7
- 238000007112 amidation reaction Methods 0.000 description 7
- 238000001816 cooling Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 7
- 239000000523 sample Substances 0.000 description 7
- 239000002904 solvent Substances 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- 108700042778 Antimicrobial Peptides Proteins 0.000 description 6
- 102000044503 Antimicrobial Peptides Human genes 0.000 description 6
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 6
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 6
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 6
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 6
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 6
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 6
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 6
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 6
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 6
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 6
- 239000008351 acetate buffer Substances 0.000 description 6
- 229940009098 aspartate Drugs 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 210000004899 c-terminal region Anatomy 0.000 description 6
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 6
- 239000002299 complementary DNA Substances 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 238000010369 molecular cloning Methods 0.000 description 6
- 108091033319 polynucleotide Proteins 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000001243 protein synthesis Methods 0.000 description 6
- 239000011541 reaction mixture Substances 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 239000004094 surface-active agent Substances 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- LMDZBCPBFSXMTL-UHFFFAOYSA-N 1-Ethyl-3-(3-dimethylaminopropyl)carbodiimide Substances CCN=C=NCCCN(C)C LMDZBCPBFSXMTL-UHFFFAOYSA-N 0.000 description 5
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 5
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 102100021277 Beta-secretase 2 Human genes 0.000 description 5
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 5
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 5
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 5
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 5
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 5
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 5
- MCGOGXFMKHPMSQ-AVGNSLFASA-N His-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MCGOGXFMKHPMSQ-AVGNSLFASA-N 0.000 description 5
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 5
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 5
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 5
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 5
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 5
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 5
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 5
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 5
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 108010008355 arginyl-glutamine Proteins 0.000 description 5
- 108010068380 arginylarginine Proteins 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 238000000855 fermentation Methods 0.000 description 5
- 230000004151 fermentation Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- 108010064235 lysylglycine Proteins 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 239000002157 polynucleotide Substances 0.000 description 5
- 239000013615 primer Substances 0.000 description 5
- 239000012266 salt solution Substances 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- NQUNIMFHIWQQGJ-UHFFFAOYSA-N 2-nitro-5-thiocyanatobenzoic acid Chemical compound OC(=O)C1=CC(SC#N)=CC=C1[N+]([O-])=O NQUNIMFHIWQQGJ-UHFFFAOYSA-N 0.000 description 4
- DVLFYONBTKHTER-UHFFFAOYSA-N 3-(N-morpholino)propanesulfonic acid Chemical compound OS(=O)(=O)CCCN1CCOCC1 DVLFYONBTKHTER-UHFFFAOYSA-N 0.000 description 4
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 4
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 4
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 4
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 4
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 4
- 101710150190 Beta-secretase 2 Proteins 0.000 description 4
- GUKYYUFHWYRMEU-WHFBIAKZSA-N Cys-Gly-Asp Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O GUKYYUFHWYRMEU-WHFBIAKZSA-N 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 4
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 4
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 4
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 4
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 4
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 4
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 4
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 4
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 4
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 4
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 4
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 4
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 102000035195 Peptidases Human genes 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 4
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 4
- SMFQZMGHCODUPQ-ULQDDVLXSA-N Pro-Lys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SMFQZMGHCODUPQ-ULQDDVLXSA-N 0.000 description 4
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 4
- 150000007513 acids Chemical class 0.000 description 4
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 4
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 4
- 235000011130 ammonium sulphate Nutrition 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 239000000356 contaminant Substances 0.000 description 4
- 108010009297 diglycyl-histidine Proteins 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 239000000835 fiber Substances 0.000 description 4
- 235000019253 formic acid Nutrition 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 238000004949 mass spectrometry Methods 0.000 description 4
- 238000001819 mass spectrum Methods 0.000 description 4
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 4
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 4
- 108010005942 methionylglycine Proteins 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 239000003910 polypeptide antibiotic agent Substances 0.000 description 4
- 239000002244 precipitate Substances 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- 235000019833 protease Nutrition 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 4
- 238000004007 reversed phase HPLC Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000003756 stirring Methods 0.000 description 4
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- FCPBCJMDBJLGQA-AJNGGQMLSA-N 2-[[(2s)-1-[(2s)-2-[[(2s)-1-[(2s)-2-aminopropanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carbonyl]amino]acetic acid Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1[C@H](C(=O)NCC(O)=O)CCC1 FCPBCJMDBJLGQA-AJNGGQMLSA-N 0.000 description 3
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 3
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 3
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 3
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 3
- 101800003223 Cecropin-A Proteins 0.000 description 3
- 241000672609 Escherichia coli BL21 Species 0.000 description 3
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 3
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 3
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 3
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 3
- 108010070675 Glutathione transferase Proteins 0.000 description 3
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- CNHSMSFYVARZLI-YJRXYDGGSA-N His-His-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CNHSMSFYVARZLI-YJRXYDGGSA-N 0.000 description 3
- XIGFLVCAVQQGNS-IHRRRGAJSA-N His-Pro-His Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 XIGFLVCAVQQGNS-IHRRRGAJSA-N 0.000 description 3
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 3
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 3
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 3
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 3
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 3
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 3
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 3
- QBFONMUYNSNKIX-AVGNSLFASA-N Pro-Arg-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QBFONMUYNSNKIX-AVGNSLFASA-N 0.000 description 3
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 3
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 3
- 229920002684 Sepharose Polymers 0.000 description 3
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 3
- RNFKSBPHLTZHLU-WHFBIAKZSA-N Ser-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)O RNFKSBPHLTZHLU-WHFBIAKZSA-N 0.000 description 3
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 3
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 3
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 3
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 3
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 3
- SBJCTAZFSZXWSR-AVGNSLFASA-N Val-Met-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SBJCTAZFSZXWSR-AVGNSLFASA-N 0.000 description 3
- 239000004480 active ingredient Substances 0.000 description 3
- 239000007864 aqueous solution Substances 0.000 description 3
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 239000007640 basal medium Substances 0.000 description 3
- 239000002585 base Substances 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 229910052794 bromium Inorganic materials 0.000 description 3
- HCQPHKMLKXOJSR-IRCPFGJUSA-N cecropin-a Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(N)=O)[C@@H](C)CC)C(C)C)[C@@H](C)CC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](N)CCCCN)C1=CC=CC=C1 HCQPHKMLKXOJSR-IRCPFGJUSA-N 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000012136 culture method Methods 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000001035 drying Methods 0.000 description 3
- 239000012149 elution buffer Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004108 freeze drying Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 108010040030 histidinoalanine Proteins 0.000 description 3
- 108010028295 histidylhistidine Proteins 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 150000007524 organic acids Chemical class 0.000 description 3
- 239000003960 organic solvent Substances 0.000 description 3
- 108010054442 polyalanine Proteins 0.000 description 3
- 239000002987 primer (paints) Substances 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 239000011734 sodium Substances 0.000 description 3
- 229910052708 sodium Inorganic materials 0.000 description 3
- 239000011877 solvent mixture Substances 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 239000011534 wash buffer Substances 0.000 description 3
- 108010027345 wheylin-1 peptide Proteins 0.000 description 3
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 2
- 241000590020 Achromobacter Species 0.000 description 2
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 2
- HJGZVLLLBJLXFC-LSJOCFKGSA-N Ala-His-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O HJGZVLLLBJLXFC-LSJOCFKGSA-N 0.000 description 2
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 2
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- IIQIOFVDFOLCHP-UHFFFAOYSA-N Asn-Pro-Ser-Ser Chemical compound NC(=O)CC(N)C(=O)N1CCCC1C(=O)NC(CO)C(=O)NC(CO)C(O)=O IIQIOFVDFOLCHP-UHFFFAOYSA-N 0.000 description 2
- 241000351920 Aspergillus nidulans Species 0.000 description 2
- 241000228245 Aspergillus niger Species 0.000 description 2
- 241000194107 Bacillus megaterium Species 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 description 2
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 2
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 2
- WWZKQHOCKIZLMA-UHFFFAOYSA-N Caprylic acid Natural products CCCCCCCC(O)=O WWZKQHOCKIZLMA-UHFFFAOYSA-N 0.000 description 2
- 102000011727 Caspases Human genes 0.000 description 2
- 108010076667 Caspases Proteins 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 2
- 108090000317 Chymotrypsin Proteins 0.000 description 2
- 241000186226 Corynebacterium glutamicum Species 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 102000005593 Endopeptidases Human genes 0.000 description 2
- 108010059378 Endopeptidases Proteins 0.000 description 2
- 108010013369 Enteropeptidase Proteins 0.000 description 2
- 102100029727 Enteropeptidase Human genes 0.000 description 2
- 108010019957 Escherichia coli periplasmic proteinase Proteins 0.000 description 2
- 108010074860 Factor Xa Proteins 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 2
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 2
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 2
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 2
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 2
- XAXJIUAWAFVADB-VJBMBRPKSA-N Glu-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XAXJIUAWAFVADB-VJBMBRPKSA-N 0.000 description 2
- 108010051815 Glutamyl endopeptidase Proteins 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 2
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 2
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 2
- 108060005986 Granzyme Proteins 0.000 description 2
- 102000001398 Granzyme Human genes 0.000 description 2
- ZRALSGWEFCBTJO-UHFFFAOYSA-N Guanidine Chemical class NC(N)=N ZRALSGWEFCBTJO-UHFFFAOYSA-N 0.000 description 2
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 2
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 2
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 2
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 2
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 2
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- 239000007993 MOPS buffer Substances 0.000 description 2
- DYTWOWJWJCBFLE-IHRRRGAJSA-N Met-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CNC=N1 DYTWOWJWJCBFLE-IHRRRGAJSA-N 0.000 description 2
- NQTADLQHYWFPDB-UHFFFAOYSA-N N-Hydroxysuccinimide Chemical compound ON1C(=O)CCC1=O NQTADLQHYWFPDB-UHFFFAOYSA-N 0.000 description 2
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 2
- 241000208125 Nicotiana Species 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 102000057297 Pepsin A Human genes 0.000 description 2
- 108090000284 Pepsin A Proteins 0.000 description 2
- 108010030544 Peptidyl-Lys metalloendopeptidase Proteins 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 2
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 2
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 2
- 102000056251 Prolyl Oligopeptidases Human genes 0.000 description 2
- 108700015930 Prolyl Oligopeptidases Proteins 0.000 description 2
- 241000531165 Pyrodictium abyssi Species 0.000 description 2
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 2
- 108090000190 Thrombin Proteins 0.000 description 2
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 2
- COLXBVRHSKPKIE-NYVOZVTQSA-N Trp-Trp-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O COLXBVRHSKPKIE-NYVOZVTQSA-N 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 125000002252 acyl group Chemical group 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 150000001298 alcohols Chemical class 0.000 description 2
- 150000008044 alkali metal hydroxides Chemical class 0.000 description 2
- 150000008051 alkyl sulfates Chemical class 0.000 description 2
- 125000005211 alkyl trimethyl ammonium group Chemical group 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 230000002862 amidating effect Effects 0.000 description 2
- 125000003277 amino group Chemical class 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- 235000019270 ammonium chloride Nutrition 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- GONOPSZTUGRENK-UHFFFAOYSA-N benzyl(trichloro)silane Chemical compound Cl[Si](Cl)(Cl)CC1=CC=CC=C1 GONOPSZTUGRENK-UHFFFAOYSA-N 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 125000002843 carboxylic acid group Chemical group 0.000 description 2
- 238000005341 cation exchange Methods 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 229960002376 chymotrypsin Drugs 0.000 description 2
- 238000002425 crystallisation Methods 0.000 description 2
- 230000008025 crystallization Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000000502 dialysis Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- ZJYYHGLJYGJLLN-UHFFFAOYSA-N guanidinium thiocyanate Chemical compound SC#N.NC(N)=N ZJYYHGLJYGJLLN-UHFFFAOYSA-N 0.000 description 2
- 230000002949 hemolytic effect Effects 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 230000003301 hydrolyzing effect Effects 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 2
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- VDXZNPDIRNWWCW-JFTDCZMZSA-N melittin Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(N)=O)CC1=CNC2=CC=CC=C12 VDXZNPDIRNWWCW-JFTDCZMZSA-N 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 150000007522 mineralic acids Chemical class 0.000 description 2
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 2
- FUZZWVXGSFPDMH-UHFFFAOYSA-N n-hexanoic acid Natural products CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 2
- 125000004123 n-propyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])* 0.000 description 2
- 238000006386 neutralization reaction Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 235000005985 organic acids Nutrition 0.000 description 2
- IFPHDUVGLXEIOQ-UHFFFAOYSA-N ortho-iodosylbenzoic acid Chemical compound OC(=O)C1=CC=CC=C1I=O IFPHDUVGLXEIOQ-UHFFFAOYSA-N 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 229940111202 pepsin Drugs 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229910000160 potassium phosphate Inorganic materials 0.000 description 2
- 235000011009 potassium phosphates Nutrition 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000001694 spray drying Methods 0.000 description 2
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 229960004072 thrombin Drugs 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- GVJXGCIPWAVXJP-UHFFFAOYSA-N 2,5-dioxo-1-oxoniopyrrolidine-3-sulfonate Chemical compound ON1C(=O)CC(S(O)(=O)=O)C1=O GVJXGCIPWAVXJP-UHFFFAOYSA-N 0.000 description 1
- 150000003923 2,5-pyrrolediones Chemical class 0.000 description 1
- FPQQSJJWHUJYPU-UHFFFAOYSA-N 3-(dimethylamino)propyliminomethylidene-ethylazanium;chloride Chemical compound Cl.CCN=C=NCCCN(C)C FPQQSJJWHUJYPU-UHFFFAOYSA-N 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 102000001049 Amyloid Human genes 0.000 description 1
- 108010094108 Amyloid Proteins 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- JBQORRNSZGTLCV-WDSOQIARSA-N Arg-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 JBQORRNSZGTLCV-WDSOQIARSA-N 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- ZXRQJQCXPSMNMR-XIRDDKMYSA-N Asp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N ZXRQJQCXPSMNMR-XIRDDKMYSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- LZZYPRNAOMGNLH-UHFFFAOYSA-M Cetrimonium bromide Chemical compound [Br-].CCCCCCCCCCCCCCCC[N+](C)(C)C LZZYPRNAOMGNLH-UHFFFAOYSA-M 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 208000001840 Dandruff Diseases 0.000 description 1
- 102000016942 Elastin Human genes 0.000 description 1
- 108010014258 Elastin Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 101100502848 Escherichia coli (strain K12) fkpB gene Proteins 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- ZXGLLNZQSBLQLT-SRVKXCTJSA-N Gln-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZXGLLNZQSBLQLT-SRVKXCTJSA-N 0.000 description 1
- JNVGVECJCOZHCN-DRZSPHRISA-N Gln-Phe-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O JNVGVECJCOZHCN-DRZSPHRISA-N 0.000 description 1
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 1
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 1
- YKJUITHASJAGHO-HOTGVXAUSA-N Gly-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN YKJUITHASJAGHO-HOTGVXAUSA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- NGBGZCUWFVVJKC-IRXDYDNUSA-N Gly-Tyr-Tyr Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NGBGZCUWFVVJKC-IRXDYDNUSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 1
- VTMLJMNQHKBPON-QWRGUYRKSA-N His-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 VTMLJMNQHKBPON-QWRGUYRKSA-N 0.000 description 1
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 1
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 1
- ISQOVWDWRUONJH-YESZJQIVSA-N His-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ISQOVWDWRUONJH-YESZJQIVSA-N 0.000 description 1
- 101000610640 Homo sapiens U4/U6 small nuclear ribonucleoprotein Prp3 Proteins 0.000 description 1
- 241000256025 Hyalophora Species 0.000 description 1
- 241000256023 Hyalophora cecropia Species 0.000 description 1
- KTGFOCFYOZQVRJ-ZKWXMUAHSA-N Ile-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O KTGFOCFYOZQVRJ-ZKWXMUAHSA-N 0.000 description 1
- OEQKGSPBDVKYOC-ZKWXMUAHSA-N Ile-Gly-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N OEQKGSPBDVKYOC-ZKWXMUAHSA-N 0.000 description 1
- JWBXCSQZLLIOCI-GUBZILKMSA-N Ile-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C JWBXCSQZLLIOCI-GUBZILKMSA-N 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 102000011782 Keratins Human genes 0.000 description 1
- 108010076876 Keratins Proteins 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical group 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- 125000000393 L-methionino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(SC([H])([H])[H])([H])[H] 0.000 description 1
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- 108010053229 Lysyl endopeptidase Proteins 0.000 description 1
- 241000555676 Malassezia Species 0.000 description 1
- 241000555688 Malassezia furfur Species 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108010036176 Melitten Proteins 0.000 description 1
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 1
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 1
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 102000003505 Myosin Human genes 0.000 description 1
- 108060008487 Myosin Proteins 0.000 description 1
- 241000237536 Mytilus edulis Species 0.000 description 1
- SECXISVLQFMRJM-UHFFFAOYSA-N N-Methylpyrrolidone Chemical compound CN1CCCC1=O SECXISVLQFMRJM-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 241001580565 Peachia Species 0.000 description 1
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 1
- AQSMZTIEJMZQEC-DCAQKATOSA-N Pro-His-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O AQSMZTIEJMZQEC-DCAQKATOSA-N 0.000 description 1
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 1
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 101100502849 Pseudomonas fluorescens yaaD gene Proteins 0.000 description 1
- 239000012614 Q-Sepharose Substances 0.000 description 1
- 229910003798 SPO2 Inorganic materials 0.000 description 1
- 101001110823 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) 60S ribosomal protein L6-A Proteins 0.000 description 1
- 101000712176 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) 60S ribosomal protein L6-B Proteins 0.000 description 1
- 101100434411 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ADH1 gene Proteins 0.000 description 1
- 101100478210 Schizosaccharomyces pombe (strain 972 / ATCC 24843) spo2 gene Proteins 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- WOJYIMBIKTWKJO-KKUMJFAQSA-N Ser-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CO)N WOJYIMBIKTWKJO-KKUMJFAQSA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 239000004280 Sodium formate Substances 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- 244000288561 Torulaspora delbrueckii Species 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 241000499912 Trichoderma reesei Species 0.000 description 1
- GSEJCLTVZPLZKY-UHFFFAOYSA-N Triethanolamine Chemical compound OCCN(CCO)CCO GSEJCLTVZPLZKY-UHFFFAOYSA-N 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- 108010028230 Trp-Ser- His-Pro-Gln-Phe-Glu-Lys Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- NKMFRGPKTIEXSK-ULQDDVLXSA-N Tyr-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NKMFRGPKTIEXSK-ULQDDVLXSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- 102100040374 U4/U6 small nuclear ribonucleoprotein Prp3 Human genes 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 101150102866 adc1 gene Proteins 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 125000003282 alkyl amino group Chemical group 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 230000002152 alkylating effect Effects 0.000 description 1
- 150000001370 alpha-amino acid derivatives Chemical class 0.000 description 1
- 235000008206 alpha-amino acids Nutrition 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- SWLVFNYSXGMGBS-UHFFFAOYSA-N ammonium bromide Chemical compound [NH4+].[Br-] SWLVFNYSXGMGBS-UHFFFAOYSA-N 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 125000000129 anionic group Chemical group 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 238000010256 biochemical assay Methods 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- 108091008394 cellulose binding proteins Proteins 0.000 description 1
- 239000012707 chemical precursor Substances 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 239000000701 coagulant Substances 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- BNIILDVGGAEEIG-UHFFFAOYSA-L disodium hydrogen phosphate Chemical compound [Na+].[Na+].OP([O-])([O-])=O BNIILDVGGAEEIG-UHFFFAOYSA-L 0.000 description 1
- 229910000397 disodium phosphate Inorganic materials 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 229920002549 elastin Polymers 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000004945 emulsification Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 210000003000 inclusion body Anatomy 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 239000002198 insoluble material Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 125000001972 isopentyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])C([H])([H])* 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 108010072591 lysyl-leucyl-alanyl-arginine Proteins 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 235000013310 margarine Nutrition 0.000 description 1
- 239000003264 margarine Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000009629 microbiological culture Methods 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 235000020638 mussel Nutrition 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 125000003136 n-heptyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000001280 n-hexyl group Chemical group C(CCCCC)* 0.000 description 1
- 125000000740 n-pentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000006911 nucleation Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000007530 organic bases Chemical class 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 235000006408 oxalic acid Nutrition 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 101150054557 pdxS gene Proteins 0.000 description 1
- 230000007030 peptide scission Effects 0.000 description 1
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 239000008057 potassium phosphate buffer Substances 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000009465 prokaryotic expression Effects 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010071967 protein K Proteins 0.000 description 1
- 238000000164 protein isolation Methods 0.000 description 1
- 230000007026 protein scission Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 150000003335 secondary amines Chemical class 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- HLBBKKJFGFRGMU-UHFFFAOYSA-M sodium formate Chemical compound [Na+].[O-]C=O HLBBKKJFGFRGMU-UHFFFAOYSA-M 0.000 description 1
- 235000019254 sodium formate Nutrition 0.000 description 1
- 239000012064 sodium phosphate buffer Substances 0.000 description 1
- 239000002195 soluble material Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 150000007970 thio esters Chemical class 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 238000010626 work up procedure Methods 0.000 description 1
- 150000003751 zinc Chemical class 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4723—Cationic antimicrobial peptides, e.g. defensins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/06—Preparation of peptides or proteins produced by the hydrolysis of a peptide bond, e.g. hydrolysate products
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Microbiology (AREA)
- Toxicology (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Communicable Diseases (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Oncology (AREA)
- Immunology (AREA)
- Epidemiology (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 반복되는 구조의 자기-조립 전구체 단백질, 그를 코딩하는 핵산 서열 및 발현 구조물, 및 상기 전구체 단백질을 사용함으로써 펩티드를 재조합적으로 생산하는 방법에 관한 것이다.
Description
본 발명은 반복되는 구조의(repetitive) 자기-조립 전구체 단백질, 그를 코딩하는 핵산 서열 및 발현 구조물, 및 상기 전구체 단백질을 사용함으로써 펩티드를 재조합적으로 생산하는 방법에 관한 것이다.
생물공학적 수단에 의해 펩티드를 생산하는 상이한 방법들이 공지되어 있다. 보통 미생물 숙주 세포에서 단쇄 폴리펩티드의 안정성은 낮기 때문에, 그리고 유리 펩티드는 숙주 유기체에게 독성 효과를 미칠 가능성이 있기 때문에(예를 들어, 항미생물성 펩티드), 대부분의 방법은 전구체 단백질을 정제한 후, 그로부터 펩티드가 절단되는 것인, 보다 큰 전구체 단백질을 생산하는 것을 포함한다.
안정한 전구체 단백질을 수득할 수 있는 한가지 방법은 융합 단백질에 의해 안정한 단백질과 함께 펩티드를 발현시키는 것을 포함한다. 이어지는 후속 후처리 단계에도 큰 영향을 미치는, 상기 융합 단백질의 특성은 대개 펩티드 서열과는 상관없는 융합 파트너에 의해 측정되고, 이로써 상기와 같은 특성은 조절이 쉽고, 상이한 서열을 가진 펩티드를 생산하는 데 적합하다.
WO 2008/085543에는 융합 단백질의 도움을 통해 단백질과 펩티드를 생산하는 구체적인 방법이 기술되어 있다. 이러한 융합 단백질은 원하는 펩티드 서열 이외에도, 융합 단백질이 역상 전이 양상을 보일 수 있도록 하는 융합 파트너를 포함한다. 이러한 양상은 먼저 간단하고 저렴한 방식으로 세포 내용물로부터 정제되는 융합 단백질을 포함한다. 두번째로, 펩티드를 단백질분해성 절단에 의해 제거한 후, 융합 파트너를 간단하고 저렴한 방식으로 유사하게 제거할 수 있다. 융합 단백질은 빈번하게 우수한 수율로 수득될 수 있는 반면, 전구체 단백질의 펩티드 부분은 보통 작고, 따라서, 공정 효율도 차선적이다.
또 다른 접근법은 재조합적으로 생산된 원하는 펩티드를 다중 카피로 포함하는 반복되는 구조의 전구체 단백질을 포함한다. WO 03/089455에는 항미생물 특성을 가진 원하는 펩티드 서열을 산성 절단에 의해 다량체 전구체 단백질로부터 잘라 내는 것인, 다량체 전구체 단백질을 생산하는 것이 기술되어 있다.
추가의 접근법 다수가 공개되어 있는데 (예를 들어, 문헌 ([Metlitskaya et al., Biotechnol Appl. Biochem 39; 339-345 (2004)]; [Wang & Cai Appl. Biochem and Biotechnol. 141; 203-213 (2007)])), 이러한 방법은 펩티드 서열 또는 펩티드 서열 계열이 반복되는 구조의 전구체 단백질의 도움을 통해 특정 방법에 의해서 생산될 수 있음을 입증하는 데 사용되었다. 어느 정도까지는, 원하는 펩티드 서열의 반복부 사이에 위치하는 특별한 보조 서열의 사용이 기술되어 있다. 더욱 구체적으로, 반복되는 구조의 전구체 단백질내 양이온성의 항미생물성 펩티드 서열이 숙주 세포에게 미치는 유해한 작용을 음이온성 보조 서열이 명백하게 감소시켰다고 제안된 바 있다(예를 들어, WO 00/31279 및 US 2003/0219854 참조). 이러한 반복되는 구조의 접근법에서의 전구체 단백질은 융합 단백질의 경우보다 더 높은 비율로 원하는 펩티드 서열을 가지며, 반복되는 구조의 전구체 단백질의 특성은 원하는 양이온 펩티드의 서열에 의해 더 큰 영향을 받는다.
상기의 발명자들은 효율적인 방식으로 수행될 수 있는 간편하고 저렴한 프로토콜에 따라 반복되는 구조의 전구체 단백질의 도움을 통해 임의의 펩티드 서열을 생산할 수 있는 가능성을 포함한 어떤 종래 방법에 대해서도 알지 못했다.
각종의 항미생물성 펩티드가 문헌에 기술되어 있으며, 개관에 요약되어 있다 (문헌 ([Hancock, R.E.W. and Lehrer, R. 1998 in Trends in Biotechnology, 16: 82-88]; [Hancock, R.E.W. and Sahl, H.G. 2006 in Nature Biotechnology, 24: 1551-1557])).
2개의 활성 펩티드를 조합시킨 융합 펩티드 역시 문헌에 기술되어 있다. 웨이드(Wade) 등은 히알로포라 세크로피아(Hyalophora cecropia)로부터의 세크로핀 A 및 벌독 멜리틴의 다양한 융합물의 항균 작용에 대해 보고하였다 (문헌 [Wade, D. et al ., 1992, International Journal of Peptide and Protein Research, 40: 429-436]). 신(Shin) 등은 20개 아미노산으로 구성된, 히알로포라 세크로피아로부터의 세크로핀 A 및 제노푸스 라에비스(Xenopus laevis)로부터의 마가이닌 2의 융합 펩티드의 항균 작용을 기술하였다. 세크로핀 A는 37개 아미노산으로 구성되고, 그람-음성 세균에 대해 활성을 나타내지만, 그람-양성 세균에 대한 활성보다는 낮은 활성을 나타낸다. 마가이닌 2는 23개 아미노산으로 구성되고, 세균 뿐만 아니라, 종양 세포주에 대해서도 활성을 띤다. 세크로핀 A 및 멜리틴의 융합물과 비교하여, 이 융합물은 유사한 항균 작용과 함께 대해 상당히 더 낮은 용혈능을 나타낸다 (문헌 [Shin, S.Y. Kang, J.H., Lee, M.K., Kim, S.Y., Kim, Y., Hahm, K.S., 1998, Biochemistry and Molecular Biology International, 44: 1119-1126]). US 2003/0096745 A1 및 US 6,800,727 B2는 20개 아미노산으로 구성된 상기 융합 펩티드, 및 아미노산, 특히 양으로 하전된 아미노산 및 소수성 아미노산의 치환의 결과로서 보다 양으로 하전되고 보다 소수성인 상기 융합물의 변이체를 청구한다.
1999년 신 등은 상기 세크로핀 A-마가이닌 2 융합 펩티드의 추가 개발을 기술하였다. 서열 6을 가진 펩티드는 출발 융합물과 비교하여 더 낮은 용혈능을 갖지만, 에스케리키아 콜라이(Escherichia coli) 및 바실루스 서브틸리스(Bacillus subtilis)에 대한 항균 활성은 손상되지는 않았음이 입증되었다 (문헌 [Shin et al., 1999 Journal of Peptide Research, 53: 82-90]).
본 발명의 간단한 설명
따라서, 본 발명의 목적은 반복되는 구조의 전구체 단백질의 도움을 통해, 광범위하게 적용될 수 있는 펩티드 생산 방법을 제공하는 것이었다.
이러한 목적은, 생물공학적 수단에 의한 펩티드를 생산하는 신규한 접근법을 통해 높은 비율의 원하는 펩티드 서열을 포함하고, 예측가능한 방식으로 전구체 단백질의 특성을 지배하는 보조 서열을 포함하는 반복되는 구조의 전구체 단백질을 생산함으로써 달성되었다. 상기 방법은 기본적으로 전구체 분자의 발현을 위한 조건 또는 상이한 펩티드 각각에 대하여 이어지는 후속 절차를 재확립할 필요없이도 상이한 펩티드 서열을 제조하는 데 사용될 수 있다. 추가로, 그에 대해 사용되었던 종래 방법이 비효율적이었던 펩티드도 생산할 수 있다.
첨부하는 도면에서,
도 1은 알파-나선 구조에 투영하여 아미노산 서열을 나타낸 나선형 휠을 도시한 것이다. 반복되는 구조의 전구체 단백질, A1-A7에 포함된 아미노산 서열 (A)을 원 상에 도시하였다 (B). 이러한 정렬은 알파-나선 구조로 존재하는 아미노산의 위치를 시각화한 것이다;
도 2는 산성 절단 후의 펩티드 "ZnO"의 역상 크로마토그램을 도시한 것이다;
도 3은 산성 절단 및 역상 HPLC 이후 "ZnO" 펩티드의 질량 스펙트럼을 도시한 것이다; 기술된 수치는 특정 모노아이소토픽 피크의 m/z 값을 나타낸다;
도 4는 산성 절단 및 양이온 교환 크로마토그래피 후의 펩티드 "P18"의 역상 크로마토그램을 도시한 것이다;
도 5는 산성 절단, 양이온 교환 크로마토그래피 및 역상 HPLC 이후 "P18" 펩티드의 질량 스펙트럼을 도시한 것이다; 기술된 수치는 특정 모노아이소토픽 피크의 m/z 값을 나타낸다;
도 6은 산성 절단 후의 펩티드 "Min"의 역상 크로마토그램을 도시한 것이다;
도 7은 산성 절단 및 역상 HPLC 이후 "Min" 펩티드의 질량 스펙트럼을 도시한 것이다; 기술된 수치는 특정 모노아이소토픽 피크의 m/z 값을 나타낸다;
도 8은 산성 절단 및 양이온 교환 크로마토그래피 후의 펩티드 서열 6의 역상 크로마토그램을 도시한 것이다;
도 9는 산성 절단, 양이온 교환 크로마토그래피 및 역상 HPLC 이후 서열 6 펩티드의 질량 스펙트럼을 도시한 것이다; 기술된 수치는 특정 모노아이소토픽 피크의 m/z 값을 나타낸다;
도 10은 실시예 6에 따라 수행된 아미드화 이전 및 이후의 "P18" 펩티드의 HPLC 양이온 교환 크로마토그램을 도시한 것이다; 화학적으로 합성되고 아미드화된 참조 펩티드의 크로마토그램이 비교를 위해 "P18" 펩티드 서열과 함께 제시되어 있다;
도 11은 실시예 7에 따라 수행된 아미드화 이전 및 이후의 "P18" 펩티드의 HPLC 양이온 교환 크로마토그램을 도시한 것이다; 화학적으로 합성되고 아미드화된 참조 펩티드의 크로마토그램이 비교를 위해 "P18" 펩티드 서열과 함께 제시되어 있다.
도 1은 알파-나선 구조에 투영하여 아미노산 서열을 나타낸 나선형 휠을 도시한 것이다. 반복되는 구조의 전구체 단백질, A1-A7에 포함된 아미노산 서열 (A)을 원 상에 도시하였다 (B). 이러한 정렬은 알파-나선 구조로 존재하는 아미노산의 위치를 시각화한 것이다;
도 2는 산성 절단 후의 펩티드 "ZnO"의 역상 크로마토그램을 도시한 것이다;
도 3은 산성 절단 및 역상 HPLC 이후 "ZnO" 펩티드의 질량 스펙트럼을 도시한 것이다; 기술된 수치는 특정 모노아이소토픽 피크의 m/z 값을 나타낸다;
도 4는 산성 절단 및 양이온 교환 크로마토그래피 후의 펩티드 "P18"의 역상 크로마토그램을 도시한 것이다;
도 5는 산성 절단, 양이온 교환 크로마토그래피 및 역상 HPLC 이후 "P18" 펩티드의 질량 스펙트럼을 도시한 것이다; 기술된 수치는 특정 모노아이소토픽 피크의 m/z 값을 나타낸다;
도 6은 산성 절단 후의 펩티드 "Min"의 역상 크로마토그램을 도시한 것이다;
도 7은 산성 절단 및 역상 HPLC 이후 "Min" 펩티드의 질량 스펙트럼을 도시한 것이다; 기술된 수치는 특정 모노아이소토픽 피크의 m/z 값을 나타낸다;
도 8은 산성 절단 및 양이온 교환 크로마토그래피 후의 펩티드 서열 6의 역상 크로마토그램을 도시한 것이다;
도 9는 산성 절단, 양이온 교환 크로마토그래피 및 역상 HPLC 이후 서열 6 펩티드의 질량 스펙트럼을 도시한 것이다; 기술된 수치는 특정 모노아이소토픽 피크의 m/z 값을 나타낸다;
도 10은 실시예 6에 따라 수행된 아미드화 이전 및 이후의 "P18" 펩티드의 HPLC 양이온 교환 크로마토그램을 도시한 것이다; 화학적으로 합성되고 아미드화된 참조 펩티드의 크로마토그램이 비교를 위해 "P18" 펩티드 서열과 함께 제시되어 있다;
도 11은 실시예 7에 따라 수행된 아미드화 이전 및 이후의 "P18" 펩티드의 HPLC 양이온 교환 크로마토그램을 도시한 것이다; 화학적으로 합성되고 아미드화된 참조 펩티드의 크로마토그램이 비교를 위해 "P18" 펩티드 서열과 함께 제시되어 있다.
바람직한 실시양태
본 발명은 특히 하기 실시양태에 관한 것이다:
1. 하기 일반식의 원하는 펩티드 (Pep) 요소 및 보조 펩티드 (Aux) 요소로 구성된 반복부로 이루어진, 효소적으로 및/또는 화학적으로 절단가능한 반복되는 구조의 서열을 포함하는 합성, 특히, 재조합적으로 제조된 전구체 단백질.
<일반식>
(Pep-Aux)x 또는
(Aux-Pep)x
상기 식에서, x는 >1이고,
여기서, Aux 요소는 동일하거나 상이하고, 상기 전구체 단백질에 자기-조립 특성을 부여하는 아미노산 서열 요소를 포함하고;
Pep 요소는 동일하거나 상이하고, 동일하거나 상이한 펩티드 분자의 아미노산 서열을 포함한다.
2. 제1 실시양태에 있어서, 요소 Pep 및 Aux가 서로 직접 또는 절단가능한 펩티드 서열을 통해 펩티드결합으로 연결되어 있고, 펩티드 연결이 화학적으로 또는 효소적으로 특이적으로 절단될 수 있으며, 즉, 정의된 아미노산 서열 또는 아미노산 서열 상에서 배타적으로 또는 본질적으로 절단될 수 있는 것인 전구체 단백질.
3. 제1 또는 제2 실시양태에 있어서, 실온에서 표준 조건하에, 예를 들어, 특히, 0.2 M NaOH에 의해 1시간 이내에 용해되지 못하거나, 각각 2 M 우레아 또는 1 M 구아니디늄 히드로클로라이드에 의해 10분 이내에 용해되지 못하는 안정한 비공유결합 회합물을 자발적으로, 즉, 그 스스로, 또는 유도적인 방식으로 형성할 수 있도록 하는 자기-조립 특성을 가진 전구체 단백질. 본 발명에 따른 안정한 회합물은 상기 언급한 상기 3가지 기준 중 적어도 하나를 만족하는 경우에 형성된다.
4. 제1 내지 제3 실시양태 중 어느 한 실시양태에 있어서, 적어도 하나의 Aux 요소가 자기-조립 펩티드 (SA) 요소를 포함하고, 여기서, 상기 SA 요소는 적어도 8개, 예를 들어, 8-10개, 8-12개, 8-14개, 8-16개, 8-18개 또는 8-20개의 연속 아미노산으로 구성된 적어도 하나의 서열 모티프를 포함하고, 이는 적어도 50%, 예를 들어, 50-100%, 60-90% 또는 70-80%의 알라닌 잔기, 적어도 50%, 예를 들어, 50-100%, 60-90% 또는 70-80%의 발린 잔기 또는 적어도 50%, 예를 들어, 50-100%, 60-90% 또는 70-80%의 글루타민 잔기를 포함하거나, 또는 그의 적어도 80%는 상기 잔기 중 적어도 하나로 구성되는 것이며; SA 요소가 예를 들어, 특히, 하기 서열 모티프 중 적어도 하나를 포함할 수 있는 것인 전구체 단백질.
An (모티프 1)
(GA)m (모티프 2)
Vn (모티프 3)
(VA)m (모티프 4)
(VVAA)o (모티프 5)
상기 식에서, A는 알라닌이고, G는 글리신이고, V는 발린이고, n은 정수 2 내지 12이고, m은 정수 2 내지 10이고, o은 정수 1 내지 6이며, 여기서, 더욱 특히, n = 5-10이고, m = 4-8이고, 및 o = 2-4이고, 예를 들어, n = 7-9이고, m = 6-7이고, o = 2-3이다.
상기 SA 서열은 각각의 경우 추가의 1 내지 3개의 무작위 아미노산 잔기에 의해 C- 및/또는 N-말단에서 연장될 수 있다. 적합한 N-말단 연장부의 예로는 서열 모티프 "G-," "GS-," "GAG-," "GPG-," "GPS-," "GAS-," "GQQ-," 및 "GSS-,"가 있으며; 적합한 C-말단 연장부의 예로는 서열 모티프 "-SGP," "-GGA," "-GPG," "-SGA," "-GGQ," "-GGY" 및 "-GGL"을 포함한다.
5. 제4 실시양태에 있어서, SA 요소가 아미노산 서열 중 서열 1 내지 5, 또는 서열 73으로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.
6. 제1 내지 제5 실시양태 중 어느 한 실시양태에 있어서, 적어도 하나의 Aux 펩티드가 보호 펩티드 (SU) 요소를 추가로 포함하는 것인 전구체 단백질.
7. 제6 실시양태에 있어서, SU 요소가 하전된 아미노산 잔기, 즉, (예를 들어, pH = 7에서) 전체 전하가 0이 아닌, 예를 들어, +20 내지 -20, 또는 +10 내지 -10, 또는 +5 내지 -5인 아미노산 잔기, 특히 음으로 하전된 아미노산 잔기, 예를 들어, pH = 7에서 전체 전하가 0이 아닌, 예를 들어, -1 내지 -20, 특히, - 4 내지 -10인 아미노산 잔기를 "높은 비율"로 갖는 것인 전구체 단백질.
8. 제7 실시양태에 있어서, 전구체 단백질 중의 SU 요소가 양친매성 나선 구조를 형성할 수 있는 것인 전구체 단백질.
9. 제8 실시양태에 있어서, SU 요소가 양친매성 알파-나선을 형성할 수 있는, 펩티드결합으로 연결된 적어도 7개의 아미노산으로 구성된 서열 절편을 포함하는 양친매성 펩티드이고, 여기서, 상기 나선의 아미노산 잔기는 그의 수직 투영에서 나선의 소수성 반쪽 및 친수성 반쪽으로 분리되고, 나선의 소수성 반쪽은 수직 투영에서 적어도 3개의 인접한, 예를 들어, 3 또는 4개의 동일하거나 상이한 소수성 아미노산 잔기를 포함하고, 나선의 친수성 반쪽은 수직 투영에서 적어도 3개의 인접한, 예를 들어, 3 또는 4개의 동일하거나 상이한 친수성 아미노산 잔기를 포함하는 것인 전구체 단백질.
10. 제7, 제8 또는 제9 실시양태에 있어서, SU 요소 중 하전된 아미노산 잔기의 비율이, 전구체 단백질의 전체 순전하가 pH=7에서 -10 초과 내지 +10 미만, 예를 들어, -8 초과 내지 +8 미만; -5 초과 내지 +5 미만, -2 초과 내지 +2 미만이 되도록 선택되는 것인 전구체 단백질.
11. 제7 내지 제10 실시양태 중 어느 한 실시양태에 있어서, SU 요소가 아미노산 서열 중 서열 16 내지 서열 19 및 서열 68로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.
12. 제1 내지 제11 실시양태 중 어느 한 실시양태에 있어서, Pep 요소가, 전체 전하가 양인 양이온성의 항미생물성 펩티드 서열을 포함하는 것인 전구체 단백질.
13. 제12 실시양태에 있어서, Pep 요소가 양이온성 아미노산 서열 중 서열 6 내지 서열 15, 서열 23, 서열 26 및 서열 69 내지 서열 72 또는 하기 명시되는, 상기 서열의 C-말단 및/또는 N-말단에서 변형된 형태 중 어느 것으로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.
14. 제1 내지 제5 실시양태 중 어느 한 실시양태에 있어서, Pep 펩티드가 서열 20 또는 서열 29 내지 67의 아미노산 서열 또는 하기 명시되는, 상기 서열의 C-말단 및/또는 N-말단에서 변형된 형태 중 어느 것으로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.
15. 제1 내지 제14 실시양태 중 어느 한 실시양태에 있어서, Aux 요소가 서로 독립적으로 SA, SA-SU, SU-SA, SA-SU-SA 및 SU-SA-SU의 의미 중 임의의 것을 가지며, 여기서 요소 SA 및 SU는 펩티드결합으로 서로 연결되어 있고, Aux 요소가 말단에서 펩티드결합으로, 즉, 직접 또는 절단가능한 펩티드 서열을 통해 적어도 하나의 Pep 요소에 펩티드결합으로 연결되어 있고, 여기서, 적어도 Pep 요소에의 펩티드 연결이 화학적으로 또는 효소적으로 특이적으로 절단될 수 있는 것인 전구체 단백질.
16. 제1 내지 제15 실시양태 중 어느 한 실시양태에 따른 적어도 하나의 전구체 단백질을 코딩하는 핵산 서열.
17. 제16 실시양태에 있어서, 서열 21, 24; 27; 74 및 76의 적어도 하나의 코딩 서열을 포함하는 핵산 서열.
18. 적어도 하나의 조절 핵산 서열에 작동적으로 연결된, 제16 또는 제17 실시양태에 따른 적어도 하나의 핵산 서열을 포함하는 발현 카세트.
19. 제16 및 제17 실시양태 중 어느 한 실시양태에 따른 핵산 서열, 또는 제18 실시양태에 따른 발현 카세트를 포함하는, 진핵 또는 원핵 숙주를 형질전환시키기 위한 재조합 벡터.
20. a) 제1 내지 제15 실시양태 중 어느 한 실시양태에 따른 전구체 단백질을 생산하는 단계;
b) 전구체 단백질로부터 Pep 펩티드를 제거하는 단계; 및
c) 임의로 펩티드를 효소적으로 또는 화학적으로 변형시키거나, 예를 들어, 아미드화, 에스테르화, 산화, 알킬화시키거나, 펩티드를 (예를 들어, 천연 화학적 라이게이션에 의해 또는 마이클(Michael) 첨가에 의해) 또 다른 분자에 연결시키는 단계
를 포함하며; 여기서, 예를 들어, 펩티드는 상기 펩티드의 소수성을 증가시키는 분자로 변형되고, 예를 들어, 알킬 라디칼을 포함하는 분자로 변형되고; 여기서, 상기 변형은 첨부된 실시예에서도 또한 추가로 설명되는 바와 같이, 펩티드의 임의적 정제 이전 또는 이후에 수행될 수 있는 것인, 원하는 펩티드 (Pep)를 생산하는 방법. 적합한 알킬 라디칼의 예는 C2-C16-알킬 라디칼, 예를 들어, 에틸, 이소프로필 또는 n-프로필, n-부틸, 이소부틸, sec- 또는 tert-부틸, n-펜틸 또는 이소펜틸; 또한 n-헥실, n-헵틸, n-옥틸, n-노닐, n-데실, n-운데실, n-도데실, n-트리데실, n-테트라데실, n-펩타데실 및 n-헥사데실, 및 그의 단일 또는 다중 분지형 유사체, 및 하나 이상의, 예를 들어, 1, 2 또는 3개의 할로겐 (예를 들어, F, Cl, Br), 히드록실, 메르캅토, 아미노, C1-C4-알킬아미노 치환을 가질 수 있거나, 또는 알킬 쇄에 하나 이상의, 예를 들어, 1, 2 또는 3개의 헤테로원자, 예를 들어, O 또는 N이 개재될 수 있는, 그의 비치환된 또는 치환된 변형이다. 더욱 구체적으로, C1-C4-알킬은 메틸, 에틸, 이소프로필 또는 n-프로필, n-부틸, 이소부틸, sec- 또는 tert-부틸이다.
21. 제20 실시양태에 있어서, 전구체 단백질이 제19 실시양태에 따른 적어도 하나의 벡터를 보유하는 재조합 미생물에서 생산되는 것인 방법.
22. 제21 실시양태에 있어서, 전구체 단백질이 재조합 이. 콜라이(E. coli) 균주에서 생산되는 것인 방법.
23. 제20 내지 제22 실시양태 중 어느 한 실시양태에서, 발현된 전구체 단백질을, 임의로는 상기 단백질이 안정적으로 회합된 형태로 전환된 후에, 정제하고, 화학적으로 또는 효소적으로 절단하여 원하는 펩티드 (Pep)를 유리시키는 것인 방법.
24. 하기 일반식의 원하는 펩티드 (Pep) 요소 및 보조 펩티드 (Aux') 요소로 구성된 절단가능한 서열을 포함하는 전구체 단백질.
<일반식>
(Pep-Aux')x 또는
(Aux'-Pep)x
상기 식에서, x는 >1이고,
여기서, Aux' 요소는 동일하거나 상이하고, 양친매성의 알파-나선-형성 펩티드를 포함하고, 상기 양친매성 펩티드는 양친매성 알파-나선을 형성할 수 있는, 펩티드결합으로 연결된 적어도 7개의 아미노산으로 구성된 서열 절편을 포함하고, 여기서, 상기 나선의 아미노산 잔기는 그의 수직 투영에서 나선의 소수성 반쪽 및 친수성 반쪽으로 분리되고, 나선의 소수성 반쪽은 수직 투영에서 적어도 3개의 인접한, 예를 들어, 3 또는 4개의 동일하거나 상이한 소수성 아미노산 잔기를 포함하고, 나선의 친수성 반쪽은 수직 투영에서 적어도 3개의 인접한, 예를 들어, 3 또는 4개의 동일하거나 상이한 친수성 아미노산 잔기를 포함하고;
Pep 요소는 동일하거나 상이하고, 동일하거나 상이한 펩티드 분자의 아미노산 서열을 포함한다.
25. 제24 실시양태에 있어서, Aux' 요소가 제4 또는 제5 실시양태에서 정의된 바와 같은 적어도 하나의 자기-조립 펩티드 (SA) 요소를 포함하는 것인 전구체 단백질.
26. 제24 또는 제25 실시양태에 있어서, 원하는 펩티드 (Pep)가 양이온성의 항미생물성 펩티드이고, Aux' 요소가 양친매성 알파-나선을 형성하는 음이온성 펩티드인 전구체 단백질.
27. 양친매성 펩티드가 양친매성 알파-나선을 형성할 수 있는, 펩티드결합으로 연결된 적어도 7개의 아미노산으로 구성된 서열 섹션을 포함하고, 여기서, 상기 나선의 아미노산 잔기는 그의 수직 투영에서 나선의 소수성 반쪽 및 친수성 반쪽으로 분리되고, 나선의 소수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 소수성 아미노산 잔기를 포함하고, 나선의 친수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 친수성 아미노산 잔기를 포함하는 것인, 양친매성 펩티드와는 상이한 항미생물성의 원하는 펩티드를 재조합적으로 생산하기 위한, 보호 펩티드로서의 양친매성 펩티드의 용도.
28. 제27 실시양태에 있어서, 원하는 펩티드 (Pep)가 양이온성의 항미생물성 펩티드이고, Aux' 요소가 양친매성 알파-나선을 형성하는 음이온성 펩티드인 용도.
29. 제20 내지 제22 실시양태 중 어느 한 실시양태에서, 제12 또는 제13 실시양태에 따른 전구체 단백질, 예를 들어, 서열 23 또는 서열 6에 따른 P18 펩티드 빌딩 블록을 포함하는 전구체 단백질이 생산되는 것인 방법.
30. 제29 실시양태에 있어서, 하기 후처리 단계:
- 오염 단백질은 용해시키지만, 또는 전구체 단백질 회합물은 용해시키지 못하는, 또는 본질적으로 용해시키지 못하는 용매, 예를 들어, 0.1 M 내지 1.0 M NaOH로 전구체 단백질 회합물을 세척하는 단계,
- 원하는 펩티드, 예를 들어, P18이 산-절단가능한 기를 통해 전구체 단백질에 도입되어 있는 경우, 예를 들어, 산으로 전구체 단백질을 절단하는 단계
를 포함하는 방법.
31. 제30 실시양태에 있어서, 하기 추가의 후처리 단계:
- 예를 들어, 세포 파괴 후, 보조 침전제, 예를 들어, 인산으로 전구체 단백질 회합물을 처리하는 단계;
- 크로마토그래피 방법을 사용하여 펩티드 절단 반응 혼합물을 정제하는 단계;
- 산성 용매 또는 용매 혼합물로 정제 및 건조된 펩티드를 세척하는 단계
중 적어도 하나를 포함하는 방법.
32. 제20 내지 제23 및 제29 내지 제31 실시양태 중 어느 한 실시양태에서, 하기 후처리 단계:
- 세포 파괴 후, pH = 3까지 85% 농도의 인산을 첨가하여 전구체 단백질 회합물을 처리하는 단계,
- 수산화나트륨 용액, 예를 들어, 0.4 M NaOH로 전구체 단백질 회합물을 세척하는 단계,
- 인산 또는 포름산, 예를 들어, 2% 인산으로 전구체 단백질을 절단하는 단계,
- 임의로, 건조된 펩티드를 헥산산 또는 99부의 헥산 및 1부의 아세트산의 혼합물로 세척하는 단계
를 포함하는, 서열 23의 펩티드를 생산하는 방법.
33. 제20 내지 제23 및 제29 내지 제31 실시양태 중 어느 한 실시양태에서, 하기 후처리 단계:
- 예를 들어, 5% 농도의 H3PO4에 의해 펠릿을 가수분해하거나 절단하는 단계;
- 원심분리하는 단계;
- 예를 들어, 25% NaOH를 사용하여 상청액의 pH를 약 4.0으로 조정하는 단계;
- 양이온 교환 크로마토그래피를 사용하여 상청액을 정제하는 단계;
- 예를 들어, NaOH를 용리액에 첨가하여 원하는 펩티드를 침전시키는 단계;
- 원심분리하는 단계;
- 물 중에 펠릿을 재현탁시키는 단계;
- 예를 들어, 아세트산을 첨가하여 펩티드를 용해시키는 단계;
- 동결건조시키는 단계
를 포함하는, 서열 6의 펩티드를 생산하는 방법.
34. 본 발명은 추가로 본 발명에 따른 P18 펩티드 (서열 23) 및 펩티드 서열 6 및 그의 생산 방법, 및 비늘, 특히 비듬을 치료 또는 예방하기 위한; 또는 친유성 진균, 특히 말라세지아 종(Malassezia ssp .), 특히, 말라세지아 푸르푸르(Malassezia furfur)의 성장 및/또는 활성을 억제시키기 위한 화장품 또는 제약 수단에서의 그의 용도에 관한 것이다. 이는 또한 예를 들어, 종래 국제 출원 PCT/EP2008/010912 (2008년 12월 19일 출원) (그의 개시 내용이 본원에서 명백하게 참조된다)에 기술되어 있다.
본 발명의 개별 측면에 대한 상세한 설명
1. 펩티드
"원하는 펩티드" 또는 "표적 펩티드"로도 언급될 수 있는, 본 발명에 따른 펩티드 (Pep)는 2 내지 100개, 예를 들어, 5 내지 70개, 및 특히, 7 내지 50개, 예를 들어, 10 내지 40개, 12 내지 35개, 또는 15 내지 25개의 아미노산이 펩티드 겹합에 의해 연결된 아미노산 쇄이다. 펩티드는 임의의 α-아미노산, 특히, 단백질 구성 아미노산으로 구성될 수 있다.
펩티드는 특정의 원하는 생물학적 또는 화학적 특성, 특히, 또는 약리학상 이용가능한 특성을 가질 수 있다. 그러한 특성의 예로는 항미생물 활성, 특정 표면에서의 특이적인 결합, 결정화 과정 및 입자 형성에서 핵 형성 특성, 및 결정 구조 조절, 금속 또는 금속 이온 결합, 계면활성제 특성, 유화 특성, 기포-안정화 특성, 영향력이 있는 세포 흡착이 있다.
상기 펩티드는 이들 특성 중 하나 이상을 가질 수 있다.
한 실시양태에서, 본 발명은 항미생물성 펩티드를 생산하는 방법에 관한 것이다. 상기 "항미생물성 펩티드"는 농도가 ≤ 100 μM인 항미생물 펩티드의 존재하에서는 억제되는 그람-양성 또는 그람-음성 세균 중 적어도 한가지 유형 및/또는 효모 중 적어도 한가지 유형 및/또는 섬유상 진균 중 적어도 한가지 유형 및/또는 조류 중 적어도 한가지 유형의 성장 및/또는 증식, 및/또는 상기 펩티드의 존재하에서는 파괴되는 각 유기체 세포의 성장 및/또는 증식으로 구별된다.
한 실시양태에서, 본 발명은 양이온성의 항미생물성 펩티드를 제공하는 것에 관한 것이다. 양이온성의 항미생물성 펩티드는 상기 정의된 바와 같이 항미생물 작용을 가지고, 순전하가 pH 7에서 0을 초과하는 것으로 구별된다.
이러한 종류의 양이온성 펩티드는 예를 들어, 하기 서열, 및/또는 그의 돌연변이체 또는 유도체를 포함한다:
상기 식에서,
X10은 펩티드 결합이거나, 또는 임의의 1개 또는 2개의 염기성 또는 소수성 아미노산 잔기, 또는 1개 또는 2개의 프롤린 잔기이고,
X1 내지 X9는 프롤린 이외의 임의의 염기성 또는 소수성 아미노산 잔기이며;
여기서, 전구체 단백질에 존재하는 반복되는 구조의 서열 모티프는 동일하거나 상이할 수 있다.
추가의 구체적인 실시양태에서, 본 발명은 하기 서열, 및/또는 그의 돌연변이체 또는 유도체를 포함하는 펩티드를 생산하는 것에 관한 것이다:
상기 식에서,
X1은 리신, 아르기닌 또는 페닐알라닌이고,
X2는 리신 또는 트립토판이고,
X3은 루신 또는 리신이고,
X4는 페닐알라닌 또는 루신이고,
X5는 루신 또는 리신이고,
X6은 루신 또는 리신이고,
X7은 히스티딘 또는 리신이고,
X8은 알라닌, 루신, 발린 또는 세린이고,
X9는 루신 또는 리신이고,
X11은 프롤린 또는 화학 결합이고,
X12는 프롤린 또는 화학 결합이며;
여기서, 전구체 단백질에 존재하는 반복되는 구조의 서열 모티프는 동일하거나 상이할 수 있다.
상기 서열 또는 반복되는 구조의 서열 모티프의 비제한적인 예는 서열 6, 서열 9-서열 15, 서열 23, 서열 69, 서열 71, 및/또는 그의 돌연변이체 또는 유도체이다.
다른 적합한 펩티드는 PCT/EP2008/010912 (2008년 12월 19일에 출원된, 본 출원인의 국제 출원, 이는 명백하게 참조된다)에 기술되어 있다.
2. 반복되는 구조의 전구체 단백질
본 발명에 따른 반복되는 구조의 전구체 단백질은 그의 아미노산 서열의 적어도 60%, 특히, 적어도 80%, 각 경우, 전체 서열 길이를 기준으로 하여 예를 들어, 60-99%, 70-95%, 75-85%가 (본원 하기에서 정의되는 바와 같은) 펩티드 반복부로 구성되는 것으로 구별된다. 나머지 부분은 예를 들어, 비-반복되는 구조의 펩티드, 예를 들어, 신호 펩티드, 태그 등을 포함할 수 있다.
3. 반
복부
펩티드 반복부는 본 발명에 따라 유리하게 제조된 적어도 하나의 펩티드를 포함하고, 기본적으로 하기와 같이 구조물을 형성한다:
(Pep-Aux)x 또는
(Aux-Pep)x
상기 식에서, x는 >1일 경우, Pep는 상기에서 언급한 펩티드이고, Aux는 본원에서 정의되는 바와 같다.
본 발명에 따른 반복부 (Pep-Aux, 또는 Aux-Pep)는 길이가 10-200, 예를 들어, 20-130 및/또는 30-80개의 아미노산으로 된 아미노산 서열이며, 이는 전구체 단백질 중에 복수회에 걸쳐 동일한 서열로서, 또는 적어도 70%, 예를 들어, 적어도 80% 및 특히, 적어도 약 90%의 동일성, 예를 들어, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 가진, 특정 서열의 변이로서 존재한다. 따라서, 본 발명에 따른 반복되는 구조의 전구체 단백질은 단일 아미노산 서열의, 또는 다중의 상이한 아미노산 서열의, 예를 들어, Pep 및/또는 Aux 빌딩 블록의 동일한 카피, 또는 변이를 포함할 수 있다.
또한, 임의 개수의 상기 반복부, 예를 들어, 1-100, 1-50, 또는 2-32 및 특히, 4-16개의 반복부가 반복되는 구조의 전구체 단백질 중에 함께 결합되어 있을 수 있다.
반복부 중 본 발명에 따른 펩티드의 비율은 몰질량 기준은 20%-80%, 예를 들어, 30%-70%이다. 반복부의 나머지 부분은 상기와 같이 정의되는 Aux 서열, 특히, SA 및 SU 서열, 및 임의로 Pep 빌딩 블록을 선택적으로 제거하기 위한 특이적인 절단 서열로 구성된다.
4. 보조 서열
광범위한 의미에서 보조 서열은 전구체 단백질의 발현, 안정성 및/또는 후처리를 개선시키기 위해 상기 전구체 단백질의 특성에 영향을 미치는, 본 발명에 따른 전구체 단백질 중에 존재한 아미노산 서열이다. 반복되는 구조의 전구체 단백질 중의 보조 서열은 반복부의 일부분일 수 있거나 (상기 명시된 바와 같은 Aux 빌딩 블록), 또는 예를 들어, 6 x His 태그 (HHHHHH), T7 태그 (MASMTGGQQMG), S 태그 (KETAAAKFERQHMDS), c-Myc 태그 (EQKLISEEDL), 스트렙(Strep) 태그 (WSHPQFEK) 또는 HA 태그 (YPYDVPDYA), 글루타티온 S-트랜스퍼라제, 말토스 결합 단백질, 셀룰로스 결합 단백질과 같이 전구체 단백질의 아미노 말단 또는 카르복시 말단에 부착되어 있을 수 있다. 이러한 보조 서열 등은 문헌 [Terpe; Appl Microbiol Biotechnol; 60(5): 523-33 (2003)]에 기술되어 있다. 추가로, 보조 서열 CanA (문헌 [Mai "In Vitro Untersuchungen zum extrazellulaeren Netzwerk von Pyrodictium abyssi TAG11" [In Vitro Studies of the Extracellular Network of Pyrodictium abyssi TAG11], PhD Theses, Regensburg University (1998)]) 및 yaaD (문헌 [Wohlleben Eur Biophys J, (2009) online publication])는 전구체 단백질의 아미노 말단 또는 카르복시 말단에의 부착에 유용하다.
한 실시양태에서, 전구체 단백질은 상기 전구체 단백질의 가용성에 영향을 미치는 보조 서열을 포함한다.
바람직한 실시양태에서, 보조 서열은 전구체 단백질에 "자기-조립" 특성을 부여한다. 전구체 단백질의 상기 자기-조립 특성은 이미 발현되는 동안에 추가로 요구되는 어떤 조치없이도 "자발적으로," 즉, 그 스스로 안정한 회합물을 형성하는 상기 전구체 단백질로 구별되거나, 또는 가용성 전구체 단백질의 상기와 같은 안정한 회합물의 형성이 "유도적인" 방식으로, 즉, 유발제에 의해 개시되는 것으로 구별된다. 자기-조립 특성을 가진 전구체 단백질은 간단하고 효율적인 방식으로 정제될 수 있다는 점에서 다른 전구체 단백질보다 유리하다. 이러한 종류의 회합물은 보통 배타적으로 또는 본질적으로 비공유 결합, 예를 들어, 수소 결합, 이온 및/또는 소수성 상호작용의 형성을 포함한다.
자기-조립 서열의 길이는 예를 들어, 적어도 8개의 인접 아미노산일 수 있다. 적합한 서열은, 앞서 검출된 바 있는 고분자 회합물로 조립되는 것으로 자체 공지된 단백질에 위치할 수 있다. 그러한 회합물의 예로는 아밀로이드 피브릴, 액틴 또는 미오신 필라멘트, 단백질 섬유, 예를 들어, 엘라스틴 섬유, 콜라겐 섬유, 홍합 족사, 케라틴 섬유, 또는 실크사가 있다. 자기-조립 서열을 포함하는 이러한 단백질 등은 문헌 [Scheibel, Current Opinion in Biotechnology 16; 1-7 (2005)] (이는 명백하게 참조된다)에 기재되어 있다.
코스모트로픽 염 용액이 "유발제"로서 사용될 수 있다. 일례로 본원에서 언급될 수 있는 코스모트로픽 염은 "호프마이스터(Hofmeister)" 계열에 따라, 나트륨 또는 클로라이드 이온보다 코스모트로픽 특성이 더 큰 이온 유형을 적어도 한가지 포함하는 코스모트로픽 염이다. 그러한 염의 예로는 인산칼륨 및 황산암모늄이 있다. 그러한 염 용액의 예로는 0.5 M 인산칼륨 및 0.8 M 황산암모늄이 있다.
본 발명에 따른 전구체 단백질의 안정한 회합물은, 전형적으로 다수의 응집된 단백질을 가용화시키면서, 이러한 방식으로 단백질 오염물질로부터 이를 분리시킬 수 있는 용액으로 처리하는 동안 특정 기간에 걸쳐 그의 회합된 형태를 유지하는 것으로 구별된다. 상기와 같은 용액의 예로는 염기, 산, 우레아, 염, 및 계면활성제 용액이 있다. 더욱 구체적으로, 본 발명에 따른 안정한 회합물은 알칼리 금속 수산화물, 우레아, 구아니디늄 염 또는 하전된 계면활성제, 예를 들어, 알킬트리메틸암모늄 염 또는 알킬 술페이트 용액 중에서 특정 기간에 걸쳐 불용성이다.
더욱 구체적으로, 안정한 회합물은 ≥0.2 M 수산화나트륨, ≥2 M 우레아, ≥1 M 구아니디늄 히드로클로라이드, ≥1 M 구아니디늄 티오시아네이트 또는 ≥0.1% 도데실 황산나트륨 또는 ≥0.1% 세틸트리메틸암모늄 브로마이드 용액 중에서 특정 기간에 걸쳐 불용성이다. 더욱 구체적으로, 전구체 단백질의 안정한 회합물은 상기 용액 중에서 ≥10분, 예를 들어, ≥30분 및 특히, ≥60분 동안에 걸쳐 안정하다.
특히, 실온에서 (즉, 약 20℃)에서,
a) 0.2 M NaOH에 의해 1시간 이내에 용해되지 못한다면, 및/또는
b) 2 M 우레아에 의해 10분 이내에 용해되지 못한다면, 및/또는
c) 1 M 구아니디늄 히드로클로라이드에 의해 10분 이내에 용해되지 못한다면, 안정한 회합물로서 존재한다.
추가의 구체적인 실시양태에서, 전구체 단백질은 숙주 세포가 반복되는 구조의 전구체 단백질의 효과를 손상시키지 못하게 보호하는 보조 서열 (SU)을 포함한다.
특별한 실시양태에서, 전구체 단백질은 숙주 세포가 반복되는 구조의 전구체 단백질에 존재하는 양이온성의 항미생물성 펩티드 서열의 효과를 손상시키지 못하게 보호하는 보조 서열 SU를 포함한다. 더욱 구체적으로, 이러한 보호 서열은 음으로 하전된 아미노산 (Asp, Glu)을 포함한다. 더욱 구체적으로, 보조 서열은 다수의 음으로 하전된 글루타메이트 및/또는 아스파르테이트 아미노산을 포함하며, 이로써 반복되는 구조의 전구체 단백질내에서의 그의 순전하는 pH=7에서 -10 초과 내지 +10 미만, 특히, -5 초과 내지 +5 미만, 예를 들어, -2 초과 내지 +2 미만이 된다.
추가의 특정 실시양태에서, 음으로 하전된 보호 서열은 양친매성 나선을 형성한다. 본 발명에 따른 양친매성 나선은, 1차 구조의 7개의 연속 아미노산 서열 (A1-A7)이 하기 순서: A1-A5-A2-A6-A3-A7-A4 (도 1)로 정렬된 환형 정렬에서 (즉, (나선 축을 따른) 그의 나선 투영에서 또는 상면도에서의 환형 정렬에서), 상기 원 상의 적어도 3개의 인접한 아미노산이 소수성 아미노산 (Ala, Met, Cys, Phe, Leu, Val, Ile) 또는 글리신이고, 상기 원 상의 적어도 3개의 인접한 아미노산이 친수성 아미노산 (Thr, Ser, Trp, Tyr, Pro, His, Glu, Gln, Asp, Asn, Lys, Arg) 또는 글리신일 경우에 형성된다. 이러한 환형 정렬은 또한 "나선형 휠 투영"으로서 지칭된다.
바람직한 실시양태에서, 음으로 하전된 보호 서열은 서열 16 - 서열 19의 서열 중 임의의 것에 상응한다.
5. 절단 서열
절단 서열은 본 발명에 따라 원하는 펩티드 서열 (Pep)의 상류 및 하류에 정렬된 아미노산 서열이다. 이러한 서열을 통해 Pep 빌딩 블록은 "특이적인" 절단에 의해 반복되는 구조의 전구체 단백질로부터 제거될 수 있다. 이와 관련하여, "특이적"이라는 것은 상기 절단이 본질적으로는 전구체 단백질에서, 특히, 배타적으로 하나 이상의 정의된 위치에서 일어남으로써 원하는 펩티드 또는 그의 전구체가 제거되는 것을 의미한다.
예를 들어, "전구체"는 천연의 원래 펩티드 서열 부분은 아니지만, 천연의 원래 펩티드 서열 부분의 추가 사용 및 관능성을 간섭하지 않거나, 또는 필요한 경우, 종래 화학적 또는 생화학적 방법의 사용으로 절단에 의해 제거될 수 있는 아미노산 잔기를 아미노산 잔기의 한쪽 말단 상에 또는 양쪽 말단 모두에 포함하는 펩티드 쇄로 구성될 수 있다.
절단 서열은 상기 서열에 결합하여 두 특정 아미노산 사이의 펩티드 결합을 절단하는, 단백질분해 활성을 가진 효소에 대한 특이적인 인식 서열을 통해 작용할 수 있다. Arg-C 프로테이나제, Asp-N 엔도펩티다제, 카스파제, 키모트립신, 클로스트리파인, 엔테로키나제, 인자 Xa, 글루타밀 엔도펩티다제, 그란자임 B, LysC 리실엔도펩티다제 ((아크로모박터(Achromobacter) 프로테이나제 I), LysN 펩티딜-Lys 메탈로엔도펩티다제, 펩신, 프롤린 엔도펩티다제, 프로테이나제 K, 스타필로코커스(staphylococcal) 펩티다제 I, 써모리신, 트롬빈, 트립신에 대한 인식 서열이 그 예가 된다. 상응하는 인식 서열은 예를 들어, 문헌 [Keil, "Specificity of proteolysis" p. 335 Springer-Verlag (1992)]에 기재되어 있다.
별법으로, 특정 아미노산 서열을 통해 폴리펩티드 골격은 특정 화학 물질, 예를 들어, BNPS-스카톨 (2-(2'-니트로페닐술페닐)-3-메틸-3-브로모이놀레닌), 브롬시안, 산, 히드록실아민, 요오도소벤조산, NTCB (2-니트로-5-티오시아노벤조산)에 의해 선택적으로 절단될 수 있다.
더욱 구체적으로, 사용되는 절단 서열을 통해 반복되는 구조의 전구체 단백질은 화학 물질에 의해 절단될 수 있다. 특히 적합한 절단 서열은 히드록실아민을 통해 절단될 수 있는 서열 모티프 Asn-Gly, 또는 산을 통해 절단될 수 있는 서열 모티프 Asp-Pro 또는 Asp-Xxx (Xxx는 임의의 단백질 구성 아미노산이다)를 포함한다.
6. 본 발명에 따른 서열의 추가 개발
6.1 아미노산 서열
본원에서 구체적으로 개시된 펩티드 (Pep)에 대한 서열, 및 보조 서열 (Aux, SA, SU), 반복되는 구조의 서열, 절단 서열 및 반복되는 구조의 전구체 단백질에 대한 서열 이외에도, 본 발명은 또한 그의 기능적 등가물, 기능적 유도체 및 염에 관한 것이다.
본 발명에 따라, "기능적 등가물"은 특히 상기 언급된 아미노산 서열의 적어도 하나의 서열 위치에서 구체적으로 언급한 아미노산과는 상이한 아미노산을 가지지만, 원래의 비변형된 펩티드의 것과 동일한 특성을 여전히 갖는 돌연변이체 또한 의미한다. 따라서, "기능적 등가물"은 하나 이상의 아미노산의 부가, 치환, 결실 및/또는 역전에 의해 수득될 수 있는 돌연변이체를 포함하며, 상기 변형은 이를 통해 본 발명에 따른 특성 프로파일을 가진 돌연변이체를 수득할 수 있는 한, 임의의 서열 위치에서 일어날 수 있다. 더욱 구체적으로, 기능적 등가물은 특히 돌연변이체와 비변형된 폴리펩티드 사이의 반응성 패턴이 정질적으로 일치하는 경우에도 존재한다.
상기 의미에서 "기능적 등가물"은 또한 기재된 폴리펩티드의 "전구체" 및 또한 상기 폴리펩티드의 "기능적 유도체" 및 "염"이다.
여기서, "전구체"는 원하는 생물학적 활성을 가지거나 가지지지 않는, 상기 폴리펩티드의 천연 또는 합성 전구체이다.
적합한 아미노산의 치환 예를 하기 표에서 살펴볼 수 있다:
"염"이란 표현은 본 발명의 펩티드 분자의 카르복실 기의 염, 및 아미노 기의 산 부가염 둘 모두를 의미한다. 카르복실 기의 염은 그 자체로 공지된 방식으로 제조될 수 있고, 무기 염, 예를 들어, 나트륨, 칼슘, 암모늄, 철 및 아연 염, 및 또한 유기 염기, 예를 들어, 아민, 예를 들어, 트리에탄올아민, 아르기닌, 리신, 피페리딘 등과의 염을 포함한다. 본 발명은 또한 산 부가염, 예를 들어, 염산 또는 황산과 같은 무기 산과의 염, 및 아세트산 및 옥살산과 같은 유기 산과의 염에 관한 것이다.
본 발명에 따른 폴리펩티드의 "기능적 유도체" (또는 "유도체") 또한 공지된 기법을 사용하여 기능적 아미노산 측쇄기 상에서 또는 그의 N- 또는 C-말단 상에서 생산될 수 있다. 이러한 종류의 유도체는 카르복실산 기의 지방족 에스테르, 암모니아 또는 1급 또는 2급 아민과의 반응에 의해 수득될 수 있는 카르복실산 기의 아미드; 아실 기와의 반응에 의해 제조된, 유리 아미노 기의 N-아실 유도체; 또는 아실 기와의 반응에 의해 제조된, 유리 히드록실 기의 O-아실 유도체를 포함한다. 추가로, 1 내지 5개, 예를 들어, 2, 3 또는 4개의 무작위 D- 또는 L-아미노산 잔기는 추가로 N- 및/또는 C-말단에 공유적으로 (펩티드결합에 의해) 결합될 수 있다.
6.2 핵산, 발현 구조물, 벡터 및 그를 포함하는 미생물
핵산:
본 발명은 추가로 본 발명에 따라 사용되는 펩티드 및 단백질 서열을 코딩하는 핵산 분자를 포함한다.
본원에서 언급된 모든 핵산 서열 (단일- 및 이중-가닥 DNA 및 RNA 서열, 예를 들어, cDNA 및 mRNA)은 뉴클레오티드 빌딩 블록으로부터 화학적 합성에 의해, 예를 들어, 이중 나선의 각각의 중복된 상보적 핵산 빌딩 블록의 단편 융합에 의해 그 자체로 공지된 방식으로 제조될 수 있다. 예를 들어, 올리고뉴클레오티드는 포스포아미다이트 방법에 의해 공지된 방식으로 화학적으로 합성될 수 있다 (문헌 [Voet, Voet, 2nd edition, Wiley Press New York, pages 896-897]). DNA 폴리머라제의 클레나우(Klenow) 단편의 도움으로 합성 올리고뉴클레오티드를 어닐링하고 갭을 필링하는 것, 라이게이션 반응 뿐만 아니라, 일반적인 클로닝 방법이 문헌 [Sambrook et al., (1989), Molecular Cloning: A laboratory manual, Cold Spring Harbor Laboratory Press]에 기재되어 있다.
본 발명은 본 발명에 따른 폴리펩티드 또는 단백질을 코딩하는 단리된 핵산 분자 또는 그의 생물학적으로 활성인 절편, 및 예를 들어 본 발명에 따른 코딩 핵산의 확인 또는 증폭을 위한 혼성화 프로브 또는 프라이머로서 사용될 수 있는 핵산 단편, 이 둘 모두에 관한 것이다.
본 발명에 따른 핵산 분자는 유전자의 코딩 영역의 3'- 및/또는 5' 말단으로부터의 비번역 서열을 추가로 포함할 수 있다.
"단리된" 핵산 분자는 상기 핵산의 천연 공급원에 존재하는 다른 핵산 분자로부터 제거되고, 추가로 재조합 기술에 의해 제조된 경우에는 다른 세포 물질 또는 배양 배지를 본질적으로 함유하지 않을 수 있거나, 또는 화학적으로 합성된 경우에는 화학적 전구체 또는 다른 화학 물질을 함유하지 않을 수 있다.
본 발명에 따른 핵산 분자는 표준 분자생물학적 기법 및 본 발명에 따라 제공된 서열 정보에 의해 단리될 수 있다. 예를 들어, cDNA는 혼성화 프로브로서 구체적으로 개시된 완전 서열 또는 그의 임의의 절편 중 하나, 및 표준 혼성화 기법을 사용하여 적합한 cDNA 라이브러리로부터 단리될 수 있다 (예를 들어, 문헌 [Sambrook, J., Fritsch, E.F. and Maniatis, T. Molecular Cloning: A Laboratory Manual. 2nd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989]에 기술된 바와 같다). 또한, 상기 서열에 기초하여 생성된 올리고뉴클레오티드 프라이머를 사용하여 중합효소 연쇄 반응에 의해 단리된, 개시된 서열 중 임의의 것을 포함하는 핵산 분자 또는 그의 절편이 사용될 수 있다. 이러한 방식으로 증폭된 핵산은 적합한 벡터로 클로닝될 수 있고, DNA 서열 분석에 의해 특징이 규명될 수 있다. 본 발명에 따른 올리고뉴클레오티드는 또한 표준 합성 방법에 의해, 예를 들어, DNA 합성 장치를 사용하여 제조될 수 있다.
본 발명은 추가로 구체적으로 기술된 뉴클레오티드 서열에 상보적인 핵산 분자 또는 그의 절편을 포함한다.
본 발명에 따른 뉴클레오티드 서열을 통해 다른 세포 유형 및 유기체에서 상동성 서열을 확인 및/또는 클로닝하는 데 사용될 수 있는 프로브 및 프라이머가 생성될 수 있다. 이러한 프로브 및 프라이머는 통상적으로 엄격 조건하에서 본 발명에 따른 핵산 서열의 센스 가닥 또는 상응하는 안티센스 가닥의 적어도 약 12개, 바람직하게는 적어도 약 25개, 예를 들어, 약 40개, 50 개 또는 75개의 연속 뉴클레오티드와 혼성화하는 뉴클레오티드 서열 영역을 포함한다.
본 발명은 또한 "침묵 돌연변이"를 포함하거나, 구체적으로 언급된 서열과 비교하여, 특별한 원래의 유기체 또는 숙주 유기체의 코돈 선호도에 따라 변형된 핵산 서열 뿐만 아니라, 천연적으로 발생된 변이체, 예를 들어, 스플라이스 변이체 또는 그의 대립형질 변이체를 포함한다. 본 발명은 또한 보존적 뉴클레오티드 치환 (즉, 해당 아미노산이 동일한 전하, 크기, 극성 및/또는 가용성을 가진 아미노산으로 대체되는 것)에 의해 수득될 수 있는 서열에 관한 것이다.
본 발명은 또한 서열 다형성에 기인하여 구체적으로 개시된 핵산으로부터 유도된 분자에 관한 것이다. 이러한 유전적 다형성은 자연적 변이로 인해 단일 군집내의 개체 사이에 존재할 수 있다. 이러한 자연적 변이는 통상적으로 유전자의 뉴클레오티드 서열에서 1 내지 5%의 변이를 야기한다.
본 발명은 추가로 또한 상기 언급한 코딩 서열에 혼성화되거나, 또는 그에 상보성인 핵산 서열을 포함한다. 이러한 폴리뉴클레오티드는 게놈 또는 cDNA 라이브러리를 스크리닝함으로써 발견할 수 있고, 임의로는 적합한 프라이머를 사용하여 PCR에 의해 그로부터 증폭시킬 수 있고, 이후, 예를 들어, 적합한 프로브를 사용하여 단리시킬 수 있다. 또 다른 가능성은 본 발명에 따른 폴리뉴클레오티드 또는 벡터로 적합한 미생물을 형질전환시키고, 상기 미생물을 증식시켜 상기 폴리뉴클레오티드를 증폭시킨 후, 이를 단리시키는 것이다. 추가로, 본 발명에 따른 폴리뉴클레오티드는 또한 화학적으로 합성될 수 있다.
폴리뉴클레오티드에 "혼성화"할 수 있다는 특성은 엄격한 조건하에서 비상보적인 파트너 사이에는 비특이적인 결합 반응이 발생하지 않지만, 상기 조건하에서 실제로 상보적인 서열에는 결합할 수 있는 폴리- 또는 올리고뉴클레오티드의 능력을 의미한다. 이러한 목적을 위해, 서열은 70-100%, 바람직하게 90-100% 상보적이어야 한다. 서로 특이적으로 결합할 수 있는 상보적인 서열의 특성은 예를 들어, 노던 또는 써던 블롯 기법에서, 또는 PCR 또는 RT-PCR에서 프라이머와의 결합에 사용된다. 보통 이러한 목적을 위해서는 길이가 적어도 30개 염기쌍인 올리고뉴클레오티드가 사용된다. 엄격한 조건은 예를 들어, 노던 블롯 기법의 경우, 비특이적으로 혼성화하는 cDNA 프로브 또는 올리고뉴클레오티드를 용리시키기 위해 50-70℃, 바람직하게 60-65℃의 세척액, 예를 들어, 0.1% SDS를 함유하는 0.1 x SSC 완충제 (20 x SSC: 3 M NaCl, 0.3 M 시트르산나트륨(pH 7.0) 함유)를 사용하는 것을 의미한다. 상기 언급한 바와 같이, 이러한 경우 오직 고도로 상보적인 핵산만이 서로 부착된 상태로 남게 된다. 엄격한 조건을 조정하는 것은 당업자에게 공지되어 있으며, 이는 예를 들어, 문헌 [Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6]에 기재되어 있다.
두 핵산 사이의 "동일성"은 각각의 경우에서, 전장의 핵산 전역에 걸친 뉴클레오티드의 동일성을 의미하는데, 특히 동일성은 인포맥스(Informax: 미국)로부터 입수한 벡터 NTI 슈트 7.1 소프트웨어의 도움과 함께, 클러스탈(Clustal) 방법을 적용시키고 (문헌 [(Higgins DG, Sharp PM. Fast and sensitive multiple sequence alignments on a microcomputer. Comput Appl. Biosci. 1989 Apr;5(2):151-1)]), 하기 파라미터를 설정함으로써 비교하여 계산할 수 있다.
다중 정렬 파라미터:
갭 개방 패널티 10
갭 확장 패널티 10
갭 분리 패널티 범위 8
갭 분리 패널티 오프
정렬 지연에 대한 동일성(%) 40
잔기 특이성 갭 오프
친수성 잔기 갭 오프
전이 가중치 0
쌍별 정렬 파라미터:
FAST 알고리즘 온
K-튜플(tuple) 크기 1
갭 패널티 3
윈도우 크기 5
최적 진단 횟수 5
발현 구조물 및 벡터:
본 발명은 추가로 조절 핵산 서열의 유전적 제어하에 본 발명에 따른 펩티드 또는 전구체 단백질을 코딩하는 핵산 서열을 포함하는 발현 구조물, 및 적어도 하나의 상기 발현 구조물을 포함하는 벡터에 관한 것이다. 본 발명에 따른 상기 구조물은 특정 코딩 서열의 5' 상류에 프로모터, 및 서열 3' 하류의 종결 인자, 및 임의로 각 경우에 코딩 서열에 작동가능하게 연결된 추가의 통상적 조절 요소를 포함한다. "작동가능한 연결"은 조절 요소 각각이 코딩 서열의 발현 동안 그의 기능을 의도한 대로 수행할 수 있도록 프로모터, 코딩 서열, 종결 인자, 및 임의로 추가의 조절 요소를 순차적 배열하는 것을 의미한다. 작동가능하게 연결가능한 서열의 예는 표적화 서열 및 또한 인핸서, 폴리아데닐화 신호 등이다. 추가의 조절 요소는 선별가능한 마커, 증폭 신호, 복제 기점 등을 포함한다. 적합한 조절 서열은 예를 들어, 문헌 [Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990)]에 기재되어 있다.
인공 조절 서열 이외에, 천연 조절 서열도 여전히 실제 구조 유전자의 상류에 존재할 수 있다. 이러한 천연 조절은 임의로 유전적 변형을 통해 변경될 수 있고, 이로써 유전자의 발현은 증가 또는 감소하게 된다. 그러나, 유전자 구조물은 또한 보다 단순한 구조를 가질 수 있는데, 즉, 어떤 추가의 조절 신호도 구조 유전자의 상류에 삽입되지 않고, 상기 구조물을 조절하는 천연 프로모터는 제거되지 않은 구조를 가질 수 있다. 대신, 천연 조절 서열은 조절이 더 이상 일어나지 않고, 유전자 발현은 증가 또는 감소될 수 있도록 돌연변이된다. 유전자 구조물은 핵산 서열 카피를 하나 이상 포함할 수 있다.
사용될 수 있는 프로모터의 예는 cos, tac, trp, tet, trp-tet, lpp, lac, lpp-lac, lacIq, T7, T5, T3, gal, trc, ara, SP6, 그람-음성 세균에서 유리하게 사용되는 람다-PR 또는 람다-PL 프로모터; 및 또한 그람-양성 프로모터 amy 및 SPO2, 효모 프로모터 ADC1, MFa, AC, P-60, CYC1, GAPDH 또는 식물 프로모터 CaMV/35S, SSU, OCS, lib4, usp, STLS1, B33, not 또는 유비퀴틴 프로모터 또는 파세올린 프로모터이다. 유도성 프로모터, 예를, 광- 및 특히, 온도-유도성 프로모터, 예를 들어, PrPl 프로모터를 사용하는 것이 특히 바람직하다. 기본적으로, 조절 서열을 가진 임의의 천연 프로모터가 사용될 수 있다. 추가로, 합성 프로모터 또한 유리하게 사용될 수 있다.
상기 조절 서열은 핵산 서열 및 단백질이 특정 방식으로 발현될 수 있도록 의도된다. 숙주 유기체에 따라, 이는 예를 들어, 유전자가 오직 유도 후에만 발현 또는 과다발현되거나, 또는 즉시 발현 및/또는 과다발현되는 것을 의미할 수 있다.
여기서, 조절 서열 또는 인자는 발현에 대해 유리한 영향을 미쳐 이를 증가 또는 감소시킬 수 있는 것이 바람직하다. 따라서, 조절 요소는 유리하게는, 강한 전사 신호, 예를 들어, 프로모터 및/또는 "인핸서"를 사용함으로써 전사 수준을 증진시킬 수 있다. 그러나, 또한, 예를 들어, mRNA의 안정성을 개선시켜 번역을 증진시킬 수도 있다.
발현 카세트는 적합한 프로모터를 적합한 코딩 뉴클레오티드 서열에, 종결 또는 폴리아데닐화 신호에 융합시켜 제조한다. 이러한 목적을 위해, 예를 들어, 문헌 ([T. Maniatis, E.F. Fritsch and J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989)] 및 [T.J. Silhavy, M.L. Berman and L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984)] 및 [Ausubel, F.M. et al., Current Protocols in Molecular Biology, Greene Publishing Assoc. and Wiley Interscience (1987)])에 기재된 바와 같이, 통상적 재조합 및 클로닝 기법이 사용된다.
적합한 숙주 유기체에서 재조합 핵산 구조물 또는 유전자 구조물을 발현시키기 위해서는 유전자가 숙주에서 최적으로 발현될 수 있도록 숙주-특이적 벡터 내로 삽입되는 것이 유리하다. 벡터는 당업자에게 주지되어 있고, 예를 들어, 예를 들어, 문헌 ["Cloning Vectors" (Pouwels P. H. et al., eds., Elsevier, Amsterdam-New York-Oxford, 1985)]에서 살펴볼 수 있다. 플라스미드 이외에, 벡터는 또한 당업자에게 공지된 임의의 다른 벡터, 예를 들어, 파지, 바이러스, 예를 들어, SV40, CMV, 바쿨로바이러스 및 아데노바이러스, 트랜스포존, IS 요소, 플라스미드, 코스미드, 및 선형 또는 환형 DNA를 포함하는 것으로 이해된다. 이들 벡터는 숙주 유기체에서 자동 복제될 수 있거나, 또는 염색체에 의해 복제될 수 있다.
언급될 수 있는 적합한 발현 벡터의 예는 하기와 같다:
통상적 융합 발현 벡터, 예를 들어, pGEX (파마시아 바이오테크 인코포레이티드(Pharmacia Biotech Inc); 문헌 [Smith, D.B. and Johnson, K.S. (1988) Gene 67:31-40]), pMAL (뉴 잉글랜드 바이오랩스(New England Biolabs: 메사츄세츠주 베벌리)) 및 pRIT 5 (파마시아(뉴저지주 피스카타웨이)) (여기서, 글루타티온-S-트랜스퍼라제 (GST), 말토스 E-결합 단백질 또는 단백질 A가 각각 재조합 표적 단백질에 융합됨).
비-융합 단백질 발현 벡터, 예를 들어, pTrc (문헌 [Amann et al., (1988) Gene 69:301-315]) 및 pET 11d (문헌 [Studier et al., Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, California (1990) 60-89]).
효모 에스. 세레비시아에(S. cerevisiae)에서의 발현을 위한 효모 발현 벡터, 예를 들어, pYepSec1 (문헌 [Baldari et al., (1987) Embo J. 6:229-234]), pMFa (문헌 [Kurjan and Herskowitz (1982) Cell 30:933-943]), pJRY88 (문헌 [Schultz et al., (1987) Gene 54:113-123]) 및 pYES2 (비트로겐 코포레이션(Invitrogen Corporation: 캘리포니아주 샌디에고)). 다른 진균, 예를 들어, 섬유상 진균에서 사용하기에 적합한 벡터 및 벡터를 구조화시키는 방법은 문헌 [van den Hondel, C.A.M.J.J. & Punt, P.J. (1991) "Gene transfer systems and vector development for filamentous fungi" in: Applied Molecular Genetics of Fungi, J.F. Peberdy et al., eds., pp. 1-28, Cambridge University Press: Cambridge]에 상세하게 기재된 것을 포함한다.
배양된 곤충 세포 (예를 들어, Sf9 세포)에서 단백질의 발현에 대해 이용가능한 바쿨로바이러스 벡터는 pAc 시리즈 (문헌 [Smith et al., (1983) Mol. Cell Biol. 3:2156-2165]) 및 pVL 시리즈 (문헌 [Lucklow and Summers, (1989) Virology 170:31-39])를 포함한다.
식물 발현 벡터, 문헌 ([Becker, D., Kemper, E., Schell, J. and Masterson, R. (1992) "New plant binary vectors with selectable markers located proximal to the left border," Plant Mol. Biol. 20:1195-1197]; 및 [Bevan, M.W. (1984) "Binary Agrobacterium vector for plant transformation." Nucl. Acids Res. 12:8711-8721])에 상세하게 기재된 것.
포유동물 발현 벡터, 예를 들어, pCDM8 (문헌 [Seed, B. (1987) Nature 329:840]) 및 pMT2PC (문헌 [Kaufman et al., (1987) EMBO J. 6:187-195]).
원핵 및 진핵 세포에 대한 추가의 적합한 발현 시스템은 문헌 [Sambrook, J., Fritsch, E.F. and Maniatis, T., Molecular cloning: A Laboratory Manual, 2nd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989]의 제16장 및 제17장에 기재되어 있다.
재조합 미생물
본 발명에 따른 벡터의 도움으로, 예를 들어, 본 발명에 따른 적어도 하나의 벡터로 형질전환되고, 본 발명에 따른 폴리펩티드를 생산하는데 사용될 수 있는 재조합 미생물을 제조할 수 있다. 상기 기술된 본 발명에 따른 재조합 구조물은 적합한 숙주 시스템에 도입되고 발현되는 것이 유리하다. 예를 들어, 각 발현 시스템에서 상기 핵산을 발현시키기 위해, 당업자에게 익숙한 통상적 클로닝 및 형질감염 방법, 예를 들어, 동반침전, 원형질체 융합, 전기천공, 레트로바이러스 형질감염 등을 사용하는 것이 바람직하다. 적합한 시스템은 예를 들어, 문헌 ([Current Protocols in Molecular Biology, F. Ausubel et al., Hrsg., Wiley Interscience, New York 1997], 또는 [Sambrook et al., Molecular Cloning: A Laboratory Manual. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989])에 기술되어 있다.
본 발명에 따라, 상동성 재조합 미생물 또한 생산할 수 있다. 이러한 목적을 위해, 본 발명에 따른 유전자의, 또는 임의로, 본 발명에 따른 서열을 변형, 예를 들어, 기능적으로 파괴시키기 위해 적어도 하나의 아미노산 결실, 부가 또는 치환이 도입된 코딩 서열의 적어도 하나의 절편을 포함하는 벡터("넉아웃" 벡터)를 제조한다. 도입된 서열은 예를 들어, 관련 미생물로부터의 상동체일 수 있거나, 또는 포유 동물, 효모 또는 곤충 공급원으로부터 유래될 수 있다. 별법으로, 상동성 재조합에 사용되는 벡터는, 상동성 재조합시 내인성 유전자가 또 다른 방식으로 돌연변이되거나 변형될 수 있도록, 그러나, 기능적 단백질은 여전히 코딩할 수 있도록 디자인될 수 있다 (예를 들어, 상류 조절 영역은 이들이 내인성 단백질의 발현을 변경시킬 수 있도록 변형될 수 있다). 본 발명에 따른 유전자의 변형된 절편은 상동성 재조합 벡터 내에 존재한다. 상동성 재조합을 위해 적합한 벡터의 구조는 예를 들어, 문헌 [Thomas, K.R. and Capecchi, M.R. (1987) Cell 51:503]에 기재되어 있다.
적합한 숙주 유기체는 기본적으로, 본 발명에 따른 핵산, 그의 대립형질 변이체, 그의 기능적 등가물 또는 유도체가 발현될 수 있도록 하는 임의의 유기체이다. 숙주 유기체는 예를 들어, 세균, 진균, 효모, 식물 또는 동물 세포를 의미한다.
원핵성 발현 유기체의 비제한적인 예는 에스케리키아 콜라이, 바실루스 서브틸리스, 바실루스 메가테리움(Bacillus megaterium), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 등이다. 진핵성 발현 유기체의 비제한적인 예는 효모, 예를 들어, 사카로미세스 세레비지아에(Saccharomyces cerevisiae), 피치아 파스토리스(Pichia pastoris) 등, 섬유상 진균, 예를 들어, 아스페르길루스 니거(Aspergillus niger), 아스페르길루스 오리자에(Aspergillus oryzae), 아스페르길루스 니둘란스(Aspergillus nidulans), 트리코더마 레에세이(Trichoderma reesei), 아크레모니움 크리소게눔(Acremonium chrysogenum) 등, 포유 동물 세포, 예를 들어, Hela 세포, COS 세포, CHO 세포 등, 곤충 세포, 예를 들어, Sf9 세포, MEL 세포 등, 식물 또는 식물 세포, 예를 들어, 솔라눔 튜버로숨(Solanum tuberosum), 니코티아나(Nicotiana) 등이다.
성공적으로 형질전환된 유기체는 유사하게 벡터 또는 발현 카세트에 존재하는 마커 유전자에 의해 선별될 수 있다. 이러한 마커 유전자의 예는 항생제에 대한 내성을 나타내는 유전자, 및 발색 반응을 촉매화여 형질전환된 세포를 염색시키는 효소에 대한 유전자이다. 이어서, 이들은 자동 세포 분류에 의해 선별될 수 있다. 벡터로 성공적으로 형질전환되고, 적절한 항생제 내성 유전자 (예를 들어, G418 또는 히그로마이신)를 보유하는 미생물은 상응하는 항생제를 포함하는 액체 또는 고체 배양 배지에 의해 선별될 수 있다. 세포 표면 상에 존재하는 마커 단백질은 친화성 크로마토그래피에 의해 선별용으로 사용될 수 있다.
7. 전구체 단백질 및 펩티드의 재조합 생산
본 발명에 따라 사용되는 펩티드 및 전구체 단백질은 대체로 그 자체가 공지되어 있는 방식으로 재조합적으로 생산될 수 있는데, 이러한 방법은 펩티드/전구체 단백질-생산 미생물을 배양하고, 임의로 상기 폴리펩티드의 발현을 유도하고, 상기 배양물로부터 폴리펩티드를 단리시키는 것을 포함한다. 원하는 경우, 이러한 방식으로 펩티드 및 전구체 단백질을 산업적 규모로도 생산할 수 있다.
공지된 방법에 따라 재조합 미생물을 배양하고, 발효시킬 수 있다. 예를 들어, 세균을 pH 6 내지 9의 TB 또는 LB 배지 중에서 20 내지 40℃ 온도하에 증식시킬 수 있다. 적합한 배양 조건은 예를 들어, 문헌 [T. Maniatis, E.F. Fritsch and J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989)]에 상세히 기재되어 있다.
펩티드 또는 전구체 단백질이 배양 배지로 분비되지 않은 경우, 이때는 세포를 파괴시키고, 공지의 단백질 단리 방법에 의해 용해물로부터 생성물을 회수한다. 세포는 임의로 고주파수 초음파, 고압 (예를 들어, 프렌치(French) 압력 세포에서), 삼투압, 계면활성제, 용해효소 또는 유기 용매의 작용, 균질화기, 또는 열거된 방법 중 2개 이상의 조합에 의해 파괴될 수 있다.
펩티드 또는 전구체 단백질은 공지된 크로마토그래피 방법, 예를 들어, 분자체 크로마토그래피 (겔 여과), 예를 들어, Q-세파로스 크로마토그래피, 이온 교환 크로마토그래피 및 소수성 크로마토그래피에 의해, 및 다른 통상적 방법, 예를 들어, 초미세 여과, 결정화, 염석, 투석 및 천연 겔 전기영동에 의해 정제될 수 있다. 적합한 방법은 예를 들어, 문헌 ([Cooper, F.G., Biochemische Arbeitsmethoden [original title: The Tools of Biochemistry], Verlag Walter de Gruyter, Berlin, New York] 또는 [Scopes, R., Protein Purification, Springer Verlag, New York, Heidelberg, Berlin]에 기재되어 있다.
추가로, 재조합 펩티드 또는 전구체 단백질은 특정 뉴클레오티드 서열에 의해 cDNA를 연장시키고, 이에 따라 예를 들어, 간단한 정제를 위해 사용되는, 변형된 폴리펩티드 또는 융합 단백질을 코딩하는 벡터 시스템 또는 올리고뉴클레오티드를 사용함으로써 단리될 수 있다. 이러한 유형의 적합한 변형체의 예로는 앵커(anchor)로서 작용하는 "태그," 예를 들어, 헥사-히스티딘 앵커로서 공지된 변형체, 또는 항체에 의해 항원으로서 인지될 수 있는 에피토프이다(예를 들어, 문헌 [Harlow, E. and Lane, D., 1988, Antibodies: A Laboratory Manual. Cold Spring Harbor (N.Y.) Press]에 기재). 상기 앵커는 예를 들어, 크로마토그래피 칼럼에 도입될 수 있는 고체 지지체, 예를 들어, 중합체 매트릭스에 단백질을 부착시키기 위해 사용될 수 있거나, 또는 마이크로티터 플레이트 또는 또 다른 지지체 상에서 사용될 수 있다.
동시에, 이들 앵커는 또한 단백질을 인식시키는 데 사용될 수 있다. 또한, 단백질은 통상적인 마커, 예를 들어, 형광 염료, 기질과의 반응시 검출가능한 반응 생성물을 형성하는 효소 마커, 또는 방사성 표지를 단독으로, 또는 단백질을 유도체화시키는 앵커와 조합하여 사용함으로써 인식될 수 있다.
더욱 구체적으로, 반복되는 구조의 전구체 단백질은 본 발명에 따른 반복되는 구조의 전구체 단백질을 코딩하는, 합성적으로 제조된 유전자 서열에 의해 제조된다. 합성 유전자 서열을 제조할 수 있는 가능한 방법은 문헌 [Hummerich et al., Biochemistry 43; 13604-13612 (2004)]에 기재되어 있다.
반복되는 구조의 전구체 단백질은 가용성 또는 불용성 형태로 숙주 세포에 존재할 수 있다. 이 두가지 모두의 경우에서, 세포를 파괴시킨다. 더욱 구체적으로, 1,000-1,500 bar의 고압 균질기를 수단으로 하여 파괴시킬 수 있다. 가용성의 반복되는 구조의 전구체 단백질 경우, 용해물을 60-100℃, 예를 들어, 70-90℃ 또는 75-85℃로 가열하여 대부분의 세포 단백질을 침전시키고, 적합한 분리 방법 (예를 들어, 침강 또는 여과)에 의해 반복되는 구조의 전구체 단백질로부터 제거한다. 이어서, (상기 기술된 바와 같이) 코스모트로픽 염을 첨가함으로써 반복되는 구조의 전구체 단백질을 침전시킨다. 반복되는 구조의 전구체 단백질은 상기 과정에서 안정한 회합물을 형성한다. 회합물에 따라, 첨가되는 코스모트로픽 염의 농도는 달라질 수 있고, 그 범위는 약 0.2-3 M 또는 예를 들어, 0.8-2 M이다. 최적의 농도는 단백질 화학자에게 익숙한 간단한 방법으로 결정될 수 있다.
반복되는 구조의 전구체 단백질은 또한 외부 유발제없이도 조립될 수 있다. 이러한 경우, 반복되는 구조의 전구체 단백질은 이미 숙주 세포에서 조립되어 상응하는 안정한 화합물을 제공한다. 세포 파괴 후, 적합한 분리 방법(예를 들어, 침강 또는 여과)에 의해 상기 회합물을 가용성 성분으로부터 분리한다.
세포 파괴 후, 보조 침전제를 첨가하여 회합물의 제거를 개선시킬 수 있다. 상기 보조 침전제는 회합물을 추가로 응고시켜, 그 결과, 예를 들어, 회합물을 수성 매질로부터 분리하기 위한 것과 같이, 침강에 필요한 가속도는 더 낮아지게 된다. 사용될 수 있는 보조 침전제는 산, 가성소다, 중합체 용액, 특히, 하전된 중합체 수용액이다. 보조 침전제의 예로는 인산 또는 폴리에틸렌이민 용액이 있다.
반복되는 구조의 전구체 단백질의 안정한 회합물은 추가로 정제될 수 있다. 이러한 목적을 위해, 안정한 회합물 경우에는 그 안에서 불용성이지만, 다른 오염물들의 경우에는 용해되는 용액이 정제를 위해 사용된다. 더욱 구체적으로, 염기, 산, 우레아, 염, 및 계면활성제 수용액이 사용된다. 알칼리 금속 수산화물, 우레아, 구아니디늄 염 또는 하전된 계면활성제, 예를 들어, 알킬트리메틸암모늄 염 또는 알킬 술페이트 용액을 사용하는 것이 특히 적합하다. ≥0.2 M 수산화나트륨, ≥2 M 우레아, ≥1 M 구아니디늄 히드로클로라이드, ≥1 M 구아니디늄 티오시아네이트 또는 ≥0.1% 도데실 황산나트륨 또는 ≥0.1% 세틸트리메틸암모늄 브로마이드 용액이 사용된다. 정제를 위해, 안정한 회합물을 상응하는 용액 중에 재현탁시킨 후, 간단한 분리 방법 (예를 들어, 침강 또는 여과)에 의해 상기 용액으로부터 분리한다. 이어서, 반복되는 구조의 전구체 단백질을 물로 세척하고, 당업자에게 익숙한 방법을 사용하여 건조시킨다.
반복되는 구조의 전구체 단백질로부터 펩티드를 회수하기 위해서는 이들 서열을 상기 전구체 단백질로부터 절단하고, 보조 서열로부터 분리하여야 한다. 절단은 반복되는 구조의 전구체 단백질에 존재하는 절단 서열에서 일어난다. 아미노산 쇄를 절단하는 구체적인 방법은 문헌에 기술되어 있다. 반복되는 구조의 전구체 단백질은 효소적으로 또는 화학적으로 절단될 수 있다. 아미노산 쇄를 특이적으로 절단하는 데 사용될 수 있는 효소의 예로는 Arg-C 프로테이나제, Asp-N 엔도펩티다제, 카스파제, 키모트립신, 클로스트리파인, 엔테로키나제, 인자 Xa, 글루타밀엔도 펩티다제, 그란자임 B, LysC 리실엔도펩티다제 (아크로모박터 프로테이나제 I), LysN 펩티딜-Lys 메탈로엔도펩티다제, 펩신, 프롤린 엔도펩티다제, 프로테이나제 K, 스타필로코커스 펩티다제 I, 써모리신, 트롬빈, 트립신이 있다. 아미노산 쇄를 특이적으로 절단하는 데 사용될 수 있는 화학 물질의 예로는 BNPS-스카톨 (2-(2'-니트로페닐술페닐)-3-메틸-3-브로모이놀레닌), 브롬시안, 산, 히드록실아민, 요오도소벤조산, NTCB (2-니트로-5-티오시아노벤조산)이 있다.
더욱 구체적으로, 반복되는 구조의 전구체 단백질은 화학적으로, 예를 들어, 히드록실아민 또는 산에 의한 절단에 의해서 절단된다. pKs가 0 초과 내지 5 미만, 바람직하게, 1 초과 내지 4 미만인 임의의 무기 산 또는 유기 산이 산성 절단에 적합하다. 더욱 구체적으로, 1-5% 인산 또는 1-5% 포름산이 산성 절단에 사용된다. 산성 절단 조건에 따라, 아미노산 Asp와 Pro 사이, 또는 Asp와 Xxx 사이 (Xxx는 임의의 단백질 구성 아미노산이다)에서 간단하게 절단이 일어나거나, 또는 먼저 아미노산 Asp와 Pro 사이, 또는 Asp와 Xxx 사이에서 절단이 일어난 후, 이어서, 펩티드의 아미노산 서열 중 아스파르테이트의 상류쪽 N-말단에 있는 아미노산으로부터 상기 아스파르테이트가 완전하게 절단된다.
정제된 반복되는 구조의 전구체 단백질을 사용하거나, 반복되는 구조의 전구체 단백을 포함하는 세포 분획 (예를 들어, 숙주 세포의 가용성 성분 또는 숙주 세포의 불용성 성분)을 사용하거나, 또는 반복되는 구조의 전구체 단백질을 포함하는 온전한 숙주 세포를 사용함으로써 절단을 수행할 수 있다. 절단제는 절단 후에 불활성화되어야 한다. 이러한 목적을 위한 방법은 당업자에게 공지되어 있다.
불활성화 이후, 절단 반응 혼합물은 특히 원하는 펩티드, 절단된 보조 서열 및 불활성화된 절단제를 포함한다. 상기 용액 중에서, 펩티드는 이미 그의 원하는 활성을 가지고 있을 수 있다. 보다 큰 순도를 필요로 할 경우, 절단 후, 반복되는 구조의 전구체 단백질로부터 유래된 펩티드를 보조 서열로부터 제거할 수 있다. 자기-조립 보조 서열의 이점은 상기 보조 서열이 절단 중에, 또는 그 이후에 조립될 수 있다는 사실이다. 이는 선택된 절단 조건하에서 절단 중에 자발적으로 조립될 수 있거나, 또는 상기 보조 서열의 조립을 보조하는 물질의 첨가를 통해 조립될 수 있다. 이러한 조립-촉진 물질로는 예를 들어, 호프마이스터 계열에 따라, 나트륨 또는 클로라이드 이온보다 코스모트로픽 특성이 더 큰 이온 유형을 적어도 한가지 포함하는 코스모트로픽 염이 있다. 다른 조립-촉진 물질로는 예를 들어, 산 또는 가성소다, 물과 혼화성인 유기 용매, 예를 들어, 알콜이 있다. 조립된 보조 서열은 침강 또는 여과에 의해 가용성의 유리된 펩티드로부터 제거될 수 있다. 남은 단백질 또는 펩티드 오염물질 또는 염 또는 절단시 또는 그 이후에 첨가된 다른 물질을 원하는 펩티드로부터 제거하기 위해서는 추가의 정제 단계가 필요할 수 있다. 이러한 목적을 위해, 예를 들어, 크로마토그래피 방법, 침전, 투석, 2상 추출법 및 당업자에게 익숙한 다른 방법이 사용될 수 있다.
이어서, 펩티드-함유 용액을 원하는 바와 같이 적용시키기 위해 직접 사용할 수 있거나, 또는 상기 용액을 당업자에게 익숙한 방법(예를 들어, 분무 건조, 또는 동결 건조)에 의해 건조시켜 상응하는 건조 생성물을 수득하고, 이를 사용할 수 있다.
건조시킨 후, 펩티드가 물에 용해된다면, 상기 펩티드가 그에 대해 불용성인 용매로 세척하여 펩티드로부터 제거되지 못한 오염물질을 제거할 수 있다. 유기 용매, 예를 들어, n-헥산, N-메틸피롤리돈, 또는 용매 및 산의 혼합물, 예를 들어, n-헥산 및 아세트산의 혼합물, 또는 유기 산, 예를 들어, 아세트산 또는 헥산산이 적합하다. 이러한 정제 단계를 위해, 건조된 펩티드를 적절한 용매/용매 혼합물에 재현탁시킨 후, 침강 또는 여과에 의해 다시 제거한다. 남은 용매/용매 혼합물은 건조시켜 제거할 수 있다.
절단에 의해 수득한 형태의 원하는 펩티드는 원하는 활성을 가질 수 있다. 그러나, 절단 후 펩티드를 추가로 변형시켜야 할 수도 있다. 예를 들어, 펩티드를 아미드화, 에스테르화, 산화, 알킬화시킬 수 있거나, 또는 임의 분자에 화학적으로 연결시킬 수 있다. 상기 변형에 사용될 수 있는 분자의 예로는 알콜, 알콜 시스테인 에스테르, 카르복실산, 티오에스테르 또는 말레이미드가 있다. 더욱 특히, 상기 변형에 사용되는 분자는 펩티드의 소수성을 증가시키는 것이다. 그러한 분자는 상기 정의된 바와 같이, 변형된 또는 비변형된 알킬 라디칼을 포함할 수 있다. 그러한 분자로는 바람직하게 C2-C16-, 특히, C6-C14-알킬 라디칼을 포함한다. 상응하는 방법이 당업자에게 공지되어 있다. 변형은 언제든지 수행될 수 있고: 예를 들어, 세포 파괴 직후, 전구체 단백질 정제 후, 전구체 단백질 절단 후, 또는 펩티드 정제 후에 수행될 수 있다.
원하는 정도의 순도를 가진 펩티드 용액은 직접 사용될 수 있다. 별법으로, 장기간 보관을 위해 다른 저장 방법이 적용될 수 있다. 저장 방법의 예로는 냉각, 동결, 방부제 첨가가 있다. 별법으로 펩티드를 건조시킬 수 있다. 건조 방법의 예로는 동결건조 또는 분무 건조가 있다. 이어서, 건조된 펩티드를 보관할 수 있다. 펩티드를 사용하기 위해서는 건조된 물질을 적합한 용매, 바람직하게는 수용액에 용해시킨다. 상기 수용액은 염 또는 완충 물질을 포함할 수 있거나, 또는 어떤 물질도 추가로 첨가되지 않을 수 있다.
8. 다양한 다른 일반 용어들에 관한 정의
달리 언급하지 않는 한, 구체적으로 개시된 서열, 또는 그에 "상동성"인 서열로부터 "유도된" 서열, 예를 들어, 유도된 아미노산 또는 핵산 서열은 본 발명에 따라, 출발 서열과 적어도 80% 또는 적어도 90%, 특히, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 동일한 서열을 의미한다.
실험부
본 발명에 기술된 임의의 펩티드 서열 (Pep)을 생산하는 방법의 일반적인 적용가능성은 상이한 서열 및 아미노산 조성을 가진 3가지 펩티드 (ZnO, P18, Min)를 생산하는 것에 기초하여 입증된다.
달리 언급하지 않는 한, 표준 유기 분석법 및 표준 생화학적 분석법, 및 표준 단백질 재조합 생산 방법 및 표준 미생물 배양 방법을 사용하였다.
실시예
1: 펩티드
ZnO
(서열 20) 생산
펩티드 ZnO는 공개 서열로부터 유도된 펩티드로서, 이는 산화아연 입자 형성에 영향을 준다 (문헌 [Umetsu et al., Adv. Mat. 17: 2571-75 (2005)]). 제한 엔도뉴클레아제 BamHI 및 HindIII을 사용하여 합성 유전자 ZnO4 (서열 21)를 문헌 [Hummerich et al., Biochemistry 43; 13604-13612 (2004)]에 기재되어 있는 벡터 pAZL로 클로닝하고, 상기 문헌에 기재되어 있는 프로토콜에 따라 이량체화한 후, 벡터로 pET21 (노바겐(Novagen))로 클로닝하였다. 상기 벡터 중에 연속적으로 존재하는 서열이 반복되는 구조의 전구체 단백질 ZnO8 (서열 22)을 코딩하였다. 상기 반복되는 구조의 전구체 단백질은 8개의 반복부를 포함하였는데, 이들 각각은 ZnO 펩티드 및 보조 서열로 구성된 카피를 포함하였다. 상기 보조 서열은 폴리-알라닌 서열을 포함하였고, 이는 반복되는 구조의 전구체 단백질에 자기-조립 특성을 부여하였다. 산에 의해 ZnO 펩티드가 전구체 단백질로부터 선택적으로 절단될 수 있도록 의도된 아미노산 Asp-Pro를 보조 서열과 펩티드 서열 사이에 위치시켰다. 균주 이. 콜라이 BL21 [DE3] (노바겐)에서 발현을 수행하였다.
유가 배양식 방법으로 pO2>20% 및 pH=6.8하에서 배양하고, 단백질 합성을 수행하였다.
배지:
미량 염 용액:
공급액:
기본 배지 중에서 존재하는 글리세롤이 고갈된 후에는 100 ml/h의 일정한 속도로 공급하기 시작하였다.
세균 배양물의 광학 밀도가 OD600=60에 도달한 후, 1 mM 이소프로필 β-D-티오갈락토피라노시드를 첨가하여 단백질 합성을 유도하였다. 이 시점에서 배양물의 온도를 37℃에서 30℃로 하강시켰다. 유도 후 5 h 경과하였을 때, 세포를 수거하였다.
하기 프로토콜에 따라 ZnO8을 정제하였다:
- 습식 매스 1 g당 세포 펠릿을 5 ml의 20 mM MOPS (3-(N-모르폴리노)프로판술폰산) (pH 7.0) 중에 재현탁시키고,
- 1,400 bar의 고압 균질기에서 세포를 파괴시키고,
- 30분 동안 5,000 x g로 원심분리하고,
- 30분 동안 80℃에서 상청액을 인큐베이션시키고,
- 30분 동안 5,000 x g로 원심분리하고,
- 4℃에서 밤새도록, 1.8 M 황산암모늄 (최종 농도)을 첨가하여 상청액으로부터 ZnO8을 침전시키고,
- 펠릿을 8 M 우레아로 세척하고,
- 펠릿을 물로 2회에 걸쳐 세척하고,
- 동결건조시키고,
- 동결건조된 ZnO8을 -20℃가 되게 만들었다.
각 1 ℓ의 배양 배지로부터 2.2 g의 순수한 ZnO8을 회수하였다.
절단하기 위해, 250 mg의 동결건조된 ZnO8 전구체 단백질을 5 ml의 1% 포름산 중에 재현탁시키고, 6 h 동안 90℃에서 인큐베이션시켰다. 상기 인큐베이션 기간 동안, 동결건조물이 용해되었고, 이를 통해 겔-유사 물질이 형성되었다. 실온으로 냉각시킨 후, 18,000 x g로 침강시켜 가용성 성분으로부터 겔-유사 물질을 제거하였다. 남은 용액은 2 M NaOH로 중화시켰다. 이어서, 상기 용액을 동결건조시켰다. 동결건조물은 원하는 절단 생성물과, 포름산의 중화로부터 생성된 포름산나트륨을 포함하였다.
동결건조된 생성물을 HPLC로 분석하였다: 이를 위해 생성물을 물 중에 1 mg/ml의 농도로 용해시키고, 역상 크로마토그래피 칼럼 (주피터 프로테오(Jupiter Proteo) 4.6 x 250 mm; 페노메넥스(Phenomenex))을 사용하여 분석하였다. 사용된 용리제는 물 중 0.1% 트리플루오로아세트산이었고, 선형 구배를 사용하여 이를 아세토니트릴 중 0.1% 트리플루오로아세트산으로 대체하였다. 206 nm에서 검출을 수행하였다 (도 2). 추가 분석을 위해, 주요 피크 분획을 수집하고, 그 안에 존재하는 물질을 추가로 연구하였다. N-말단 서열 분석을 통해 상기 성분이 ZnO 펩티드임을 확인하였다. 질량 분석법 (MALDI-TOF)을 통해 연구함으로써 질량이 2,002임을 확립하였고, 이는 ZnO 펩티드의 이론상의 질량과 일치하였다 (도 3). HPLC 분석을 통해 순도는 UV 활성 성분 기준으로 62%인 것으로 밝혀졌다.
실시예
2: 펩티드
P18
(서열 23) 생산
펩티드 P18은 문헌 [Shin et al., J. Peptide Res. 58:504-14 (2001)]에 기재되어 있는, 고도로 활성인 항미생물성 펩티드 서열로부터 유도된 펩티드이다. 제한 엔도뉴클레아제 BamHI 및 HindIII을 사용하여 합성 유전자 AHeAP182 (서열 24)를 문헌 [Hummerich et al., Biochemistry 43; 13604-13612 (2004)]에 기재되어 있는 벡터 pAZL로 클로닝하고, 상기 문헌에 기재되어 있는 프로토콜에 따라 이량체화한 후, 벡터로 pET21 (노바겐)로 클로닝하였다. 상기 벡터에 연속적으로 존재하는 서열이 반복되는 구조의 전구체 단백질 AHeAP184 (서열 25)를 코딩하였다. 상기 반복되는 구조의 전구체 단백질은 4개의 반복부를 포함하였는데, 이들 각각은 P18 펩티드 및 보조 서열로 구성된 카피를 포함하였다. 상기 보조 서열은 2개의 폴리-알라닌 서열을 포함하였고, 이는 반복되는 구조의 전구체 단백질에 자기-조립 특성을 부여하였다. 또한, 보조 서열은 음으로 하전된 나선형의 보호 서열을 포함하였다. 산에 의해 P18 펩티드가 전구체 단백질로부터 선택적으로 절단될 수 있도록 의도된 아미노산 Asp-Pro를 보조 서열과 P18 펩티드 서열 사이에 위치시켰다. 균주 이. 콜라이 BL21 [DE3] (노바겐)에서 발현을 수행하였다.
유가 배양식 방법으로 pO2>20% 및 pH=6.8하에서 배양하고, 단백질 합성을 수행하였다. 배지, 미량 염 용액 및 공급액은 실시예 1에 기술되어 있는 조성물을 가졌다.
기본 배지 중에서 존재하는 글리세롤이 고갈된 후에는 100 ml/h의 일정한 속도로 공급하기 시작하였다.
세균 배양물의 광학 밀도가 OD600=60에 도달한 후, 1 mM 이소프로필 β-D-티오갈락토피라노시드를 첨가하여 단백질 합성을 유도하였다. 유도 후 10 h 경과하였을 때, 30분 동안 5,000 x g로 침강시켜 세포를 수거하였다. 습식 바이오매스는 1,932 g이었다.
하기 프로토콜에 따라 습식 바이오매스를 정제하였다:
- 세포 펠릿을 재현탁시키는데; 바이오매스 각 1 g에 대해 6 g의 20 mM 인산나트륨 완충제 (pH 7.5)을 첨가하고, 철저히 혼합시키고,
- 1,500 bar의 고압 균질기에서 세포를 파괴시키고,
- pH = 3±0.5가 될 때까지 인산을 첨가하고,
- 10분 동안 23℃에서 교반하면서 인큐베이션시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- 펠릿을 재현탁시키는데; 습식 매스 1 g당 25 ml의 0.2 M NaOH를 첨가하고, 균질화시키고, 4시간 동안 23℃에서 교반하면서 인큐베이션시키고,
- 85% 농도의 H3PO4를 사용하여 pH를 8.5±0.5로 조정하여 중화시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- P18 전구체 단백질을 포함하는 세척된 봉입체로 구성된 펠릿을 가수분해시키거나, 2% 농도의 H3PO4를 사용하여 절단하였다.
절단 조건:
i. 펠릿 각 1g에 대해 5 ml의 H3PO4를 사용하고,
ii. 균질화시키고,
iii. 16시간 동안 90℃에서 진탕시키면서 인큐베이션시켰다.
- 절단 반응 혼합물을 냉각시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- 10 M NaOH를 사용하여 pH를 5.5±0.5로 조정하여 중화시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- 전도도가 10 mS/cm 미만이 될 때까지 상청액을 물로 희석시키고,
- 양이온 교환 크로마토그래피 (프락토겔(Fractogel) COO; 머크(Merck))를 통해 P18을 상청액으로부터 정제하는데; 450 mM NaCl를 사용하여 용리시키고,
- 펩티드 함유 분획을 풀링하고, 전도도가 10 mS/cm 미만이 될 때까지 물로 희석시키고,
- 양이온 교환 크로마토그래피 (프락토겔 COO; 머크)를 통해 P18을 풀링된 분획으로부터 정제하는데; 50 mM HCl을 사용하여 용리시키고,
- 용리액을 2 M NaOH로 중화시키고,
- 중화된 용액을 동결건조시켰다.
동결건조된 생성물을 HPLC로 분석하였다: 이를 위해 생성물을 물 중에 1 mg/ml의 농도로 용해시키고, 역상 크로마토그래피 칼럼 (주피터 프로테오 4.6 x 250 mm; 페노메넥스)을 사용하여 분석하였다. 사용된 용리제는 물 중 0.1% 트리플루오로아세트산이었고, 선형 구배를 사용하여 이를 아세토니트릴 중 0.1% 트리플루오로아세트산으로 대체하였다. 280 nm에서 검출을 수행하였다 (도 4). 추가 분석을 위해, 주요 피크 분획을 수집하고, 그 안에 존재하는 물질을 추가로 연구하였다. N-말단 서열 분석을 통해 상기 성분이 P18 펩티드임을 확인하였다.
질량 분석법 (MALDI-TOF)을 통해 연구함으로써 펩티드에 대한 질량이 2,512임을 확립하였고, 이는 P18 펩티드의 이론상의 질량과 일치하였다 (도 5). HPLC 분석을 통해 순도는 UV 활성 성분 기준으로 85%인 것으로 밝혀졌다. 30 g의 습식 바이오매스로부터 52 mg의 P18 펩티드를 수득하였다. 따라서, 각 1 ℓ의 발효 배양물로부터 대략 330 mg의 순수한 P18 펩티드를 회수할 수 있었다.
P18 펩티드의 활성을 조사하기 위해, 600 nm에서 측정하였을 때 배양물의 광학 밀도가 0.1인, LB 배지 (5 g/ℓ 효모 추출물; 10 g/ℓ 트립톤, 5 g/ℓ 염화나트륨) 중 이. 콜라이 B 배양물을 상이한 농도의 P18 펩티드와 함께 37℃에서 진탕시키면서 인큐베이션시켰다. 24 h 경과 후 광학 밀도를 측정함으로써 세균 성장을 모니터링하였다. 펩티드 농도 31 ppm으로부터 성장이 완전하게 억제되었다 (24 h 경과 후 600 nm에서의 광학 밀도 < 0.15). C-말단 카르복실 기를 추가로 아미드화시킴으로써 항미생물 활성을 개선시킬 수 있다. 이를 위해, 상기 카르복실 기를 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 히드로클로라이드 및 N-히드록시-술포숙신이미드로 활성화시키고, 이어서 암모니아를 첨가하여 아미드화시켰다.
실시예
3: 펩티드
Min
(서열 26) 생산
제한 엔도뉴클레아제 BamHI 및 HindIII을 사용하여 합성 유전자 AEMin4 (서열 27)를 문헌 [Hummerich et al., Biochemistry 43; 13604-13612 (2004)]에 기재되어 있는 벡터 pAZL로 클로닝하고, 상기 문헌에 기재되어 있는 프로토콜에 따라 이량체화한 후, 벡터로 pET21 (노바겐)로 클로닝하였다. 상기 벡터에 연속적으로 존재하는 서열이 반복되는 구조의 전구체 단백질 AEMin8 (서열 28)을 코딩하였다. 상기 반복되는 구조의 전구체 단백질은 8개의 반복부를 포함하였는데, 이들 각각은 Min 펩티드 및 보조 서열로 구성된 카피를 포함하였다. 상기 보조 서열은 폴리알라닌 서열을 포함하였고, 이는 반복되는 구조의 전구체 단백질에 자기-조립 특성을 부여하였다. 또한, 보조 서열은 음으로 하전된 나선형의 보호 서열을 포함하였다. 산을 사용하여 P18 펩티드가 전구체 단백질로부터 선택적으로 절단될 수 있도록 의도된 아미노산 Asp-Pro를 보조 서열과 상기 펩티드 서열 사이에 위치시켰다. 균주 이. 콜라이 BL21 [DE3] (노바겐)에서 발현을 수행하였다.
유가 배양식 방법으로 pO2>20% 및 pH=6.8하에서 배양하고, 단백질 합성을 수행하였다. 배지, 미량 염 용액 및 공급액은 실시예 1에 기술되어 있는 조성물을 가졌다.
기본 배지 중에서 존재하는 글리세롤이 고갈된 후에는 100 ml/h의 일정한 속도로 공급하기 시작하였다.
세균 배양물의 광학 밀도가 OD600=60에 도달한 후, 1 mM 이소프로필 β-D-티오갈락토피라노시드를 첨가하여 단백질 합성을 유도하였다. 이 시점에서 배양물의 온도를 37℃에서 30℃로 하강시켰다. 유도 후 5 h 경과하였을 때, 세포를 수거하였다.
하기 프로토콜에 따라 AEMin8을 정제하였다:
- 습식 매스 1 g당 세포 펠릿을 5 ml의 20 mM MOPS (3-(N-모르폴리노)프로판술폰산) (pH 7.0) 중에 재현탁시키고,
- 1,400 bar의 고압 균질기에서 세포를 파괴시키고,
- 30분 동안 5,000 x g로 원심분리하고,
- 20분 동안 80℃에서 상청액을 인큐베이션시키고,
- 30분 동안 5,000 x g로 원심분리하고,
- 4℃에서 밤새도록, 2 M 황산암모늄 (최종 농도)를 첨가하여 상청액으로부터 AEMin8을 침전시키고,
- 펠릿을 8 M 우레아로 세척하고,
- 펠릿을 물로 2회에 걸쳐 세척하고,
- 동결건조시키고,
- 동결건조된 AEMin8을 -20℃가 되게 만들었다.
배양 배지 각 1 ℓ로부터 0.4 g의 순수한 AEMin8을 회수하였다.
절단하기 위해, 250 mg의 동결건조된 AEMin8 전구체 단백질을 12.5 ml의 1% 인산 중에 재현탁시키고, 8 h 동안 90℃에서 인큐베이션시켰다. 실온으로 냉각시킨 후, 18,000 x g로 침강시켜 가용성 물질로부터 불용성 물질을 제거하였다. 남은 용액은 2 M NaOH로 중화시켰다. 이어서, 상기 용액을 동결건조시켰다. 동결건조물은 원하는 절단 생성물과, 인산의 중화로부터 생성된 인산수소나트륨을 포함하였다.
동결건조된 생성물을 HPLC로 분석하였다: 이를 위해 생성물을 물 중에 1 mg/ml의 농도로 용해시키고, 역상 크로마토그래피 칼럼 (주피터 프로테오 4.6 x 250 mm; 페노메넥스)을 사용하여 분석하였다. 사용된 용리제는 물 중 0.1% 트리플루오로아세트산이었고, 선형 구배를 사용하여 이를 아세토니트릴 중 0.1% 트리플루오로아세트산으로 대체하였다. 206 nm에서 검출을 수행하였다 (도 6). 추가 분석을 위해, 주요 피크 분획을 수집하고, 그 안에 존재하는 물질을 추가로 연구하였다. N-말단 서열 분석을 통해 상기 성분이 Min 펩티드임을 확인하였다. 질량 분석법 (MALDI-TOF)을 통해 연구함으로써 질량이 1,900임을 확립하였고, 이는 Min 펩티드의 이론상의 질량과 일치하였다 (도 7). HPLC 분석을 통해 순도는 UV 활성 성분 기준으로 68%인 것으로 밝혀졌다.
실시예
4: 펩티드
P18
(서열 23) 생산 최적화
실시예 2로부터의 펩티드 P18의 수율을 증가시키기 위해, 상이한 Aux 서열이 펩티드 수율에 미치는 영향에 대해 연구하였다. 실시예 2에 따른 pET21 벡터로 클로닝한 후, 서열 75를 가진 전구체 단백질을 코딩하는 합성 유전자 AHe2AP182 (서열 74)를 사용하였을 때, 발현율 및 총 수율은 현저하게 증가하였다. 실시예 2에 기술되어 있는 조건을 사용하여 발효를 수행하였다.
하기 프로토콜에 따라 습식 바이오매스를 정제하였다:
- 세포 펠릿을 재현탁시키는데; 바이오매스 각 1 g에 대해 6 g의 물을 첨가하고, 철저히 혼합시키고,
- 1,500 bar의 고압 균질기에서 세포를 파괴시키고,
- pH = 3±0.5가 될 때까지 인산을 첨가하고,
- 10분 동안 23℃에서 교반하면서 인큐베이션시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- 펠릿을 재현탁시키는데; 습식 매스 각 1 g에 대해 20 ml의 0.4 M NaOH를 첨가하고, 균질화시키고, 1시간 동안 23℃에서 교반하면서 인큐베이션시키고,
- 1 M 인산칼륨 완충제 (pH 6.0)을 사용하여 pH를 8.5±0.5로 조정하여 중화시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- P18 전구체 단백질을 포함하는 세척된 봉입체로 구성된 펠릿을 가수분해시키거나, 2% 농도의 H3PO4를 사용하여 절단하였다.
절단 조건:
i. 펠릿 각 1g에 대해 7 ml의 H3PO4를 사용하고,
ii. 균질화시키고,
iii. 16시간 동안 90℃에서 진탕시키면서 인큐베이션시켰다.
- 절단 반응 혼합물을 냉각시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- 25% NaOH를 사용하여 pH를 4.0±0.5로 조정하여 중화시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- 전도도가 30 mS/cm 미만이 될 때까지 상청액을 물로 희석시키고,
- 양이온 교환 크로마토그래피 (SP-세파로스 하이 퍼포먼스(SP-Sepharose High Performance); GE 헬스케어(GE Healthcare))를 통해 P18을 상청액으로부터 정제하는데; 세척 완충제는 10 mM 아세트산나트륨 완충제 (pH 4) + 450 mM NaCl이고; 용리 완충제는 10 mM 아세트산나트륨 완충제 (pH 4) + 1,100 mM NaCl이고,
- pH= 10.5±0.3이 될 때까지 25% NaOH를 용리액에 첨가하여 펩티드를 침전시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- 습식 매스 각 1 g에 대해 5 ml의 물 중에 펠릿을 재현탁시키고,
- pH= 6.0 pH= 10.5±0.5가 될 때까지 아세트산을 첨가하여 펩티드를 용해시키고,
- 동결건조시켰다.
기술된 방식으로 각 1 ℓ의 발효 배양물로부터 대략 1 g의 순수한 P18 펩티드를 회수할 수 있었다.
실시예
5: 펩티드 서열 6 생산
실시예 1 내지 4에 열거된 펩티드를 산성 절단에 의해 반복되는 구조의 전구체 단백질로부터 유도하였다. 이는 아스파르테이트와 프롤린 사이의 펩티드 결합을 가수분해하는 것을 포함하였다. 따라서, 실시예 1에서 제시한 바와 같이, 펩티드 서열은 N-말단에서는 프롤린으로 출발하여, C-말단에서는 아스파르테이트로 종결되었다. 특정 환경하에서는 실시예 2 및 3에서 제시한 바와 같이, C-말단의 아스파르테이트 또한 절단될 수 있고, 이로써 C-말단 서열을 자유롭게 선택하면서 펩티드 서열을 생산할 수 있었다.
펩티드의 N 말단이 프롤린으로 출발하는 것이 아니라, 그의 첫번째 N-말단 아미노산은 자유롭게 선택될 수 있는 것인 펩티드를 생산하는 데에도 본 발명의 방법이 또한 사용될 수 있다는 것을 입증하기 위해 서열 6을 가진 펩티드를 생산하였다. 이를 위해, 실시예 4에 따라 합성 유전자 AHe2AP182-P-G (서열 76)을 사용하여 서열 77을 가진 전구체 단백질을 생산하였다. 상기 전구체 단백질은, 오직 P18 펩티드의 N-말단 아미노산인 Pro-Gly, 및 C-말단의 Gly가 결실되어 있다는 점에서만 실시예 4의 전구체 단백질 서열 75와 상이하였다. 실시예 4에 기술되어 있는 조건하에서 클로닝 및 발효를 수행하였다.
하기 프로토콜에 따라 습식 바이오매스를 정제하였다:
- 세포 펠릿을 재현탁시키는데; 바이오매스 각 1 g에 대해 6 g의 물을 첨가하고, 철저히 혼합시키고,
- 1,500 bar의 고압 균질기에서 세포를 파괴시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- P18 전구체 단백질을 포함하는 세척된 봉입체로 구성된 펠릿을 가수분해시키거나, 5% 농도의 H3PO4를 사용하여 절단하였다.
절단 조건:
i. 펠릿 각 1g에 대해 5 ml의 H3PO4를 사용하고,
ii. 균질화시키고,
iii. 16시간 동안 90℃에서 진탕시키면서 인큐베이션시켰다.
- 절단 반응 혼합물을 냉각시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- 25% NaOH를 사용하여 pH를 4.0±0.5로 조정하여 중화시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- 전도도가 30 mS/cm 미만이 될 때까지 상청액을 물로 희석시키고,
- 양이온 교환 크로마토그래피 (SP-세파로스 하이 퍼포먼스; GE 헬스케어)를 통해 펩티드를 상청액으로부터 정제하는데; 세척 완충제는 10 mM 아세트산나트륨 완충제 (pH 4) + 450 mM NaCl이고; 용리 완충제는 10 mM 아세트산나트륨 완충제 (pH 4) + 1,100 mM NaCl이고,
- pH= 10.5±0.3이 될 때까지 25% NaOH를 용리액에 첨가하여 펩티드를 침전시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- 습식 매스 각 1 g에 대해 5 ml의 물 중에 펠릿을 재현탁시키고,
- pH= 6.0±0.5가 될 때까지 아세트산을 첨가하여 펩티드를 용해시키고,
- 동결건조시켰다.
동결건조된 생성물을 HPLC로 분석하였다: 이를 위해 생성물을 물 중에 1 mg/ml의 농도로 용해시키고, 역상 크로마토그래피 칼럼 (주피터 프로테오 4.6 x 250 mm; 페노메넥스)을 사용하여 분석하였다. 사용된 용리제는 물 중 0.1% 트리플루오로아세트산이었고, 선형 구배를 사용하여 이를 아세토니트릴 중 0.1% 트리플루오로아세트산으로 대체하였다. 280 nm에서 검출을 수행하였다 (도 8). 추가 분석을 위해, 주요 피크 분획을 수집하고, 그 안에 존재하는 물질을 추가로 연구하였다. 질량 분석법 (MALDI-TOF)을 통해 연구함으로써 질량이 2,300.6임을 밝혀냈고, 이는 서열 6 펩티드의 이론상의 질량과 일치하였다 (도 9).
실시예
6: 동결건조된 펩티드
P18
(서열 23)의
아미드화
일부 경우에서는 C 말단이 아미드화되는 것이 유리 카르복실 기일 때보다 펩티드 활성에 이로울 수 있다. 이를 입증하기 위해, 실시예 4의 동결건조된 P18 펩티드를 하기 프로토콜에 따라 아미드화하였다:
o 10 mg/ml P18 펩티드
o 30% EtOH
o 10 mM 2-(N-모르폴리노)에탄술폰산 (pH 5.0)
o 3 M 염화암모늄
o 2.5 mM N-히드록시숙신이미드
o 50 mM 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드
o 2 h 동안 RT에서 인큐베이션
o NaOH (pH 7.0)로 중화
루나(Luna) SCX 5μ 100 A 크로마토그래피 칼럼 (페노메넥스: 미국 캘리포니아주 토런스)을 사용하여 HPLC에 의해 아미드화된 샘플을 분석하였다: 사용된 용리제는 25% 아세토니트릴 중 20 mM KH2PO4 (pH 2.5)이고, 선형 구배를 사용하여 이를 20 mM KH2PO4 (pH 2.5); 25% 아세토니트릴 및 1 M KCl로 대체하였다. 280 nm에서 검출을 수행하였다 (도 10). 도 10에는 비교를 위해 화학적으로 합성되고 아미드화된 참조 펩티드와 (바켐 아게(Bachem AG: 스위스 부벤도르프)에 의해 주문 생산된) "P18" 펩티드 서열의 크로마토그램을 함께 도시하였다.
실시예 4에 기술되어 있는 바와 같이, 추가로 양이온 교환 크로마토그래피에 의해 펩티드를 정제하였다.
실시예
7: 아미드화가 통합된 펩티드
P18
(서열 23) 생산
아미드화된 P18 펩티드의 생산비 효율을 개선시키기 위해, 아미드화를 실시예 6에서와 같이, 펩티드 정제 후 수행하기보다는 후처리 방법에 통합시켰다. 이를 위해, 실시예 4에 따라 발효시켜 전구체 단백질 서열 75를 수득하고, 산성 절단에 의해 전구체 단백질로부터 펩티드를 유리시켰다.
이어서, 하기 단계를 수행하였다:
- 절단 반응 혼합물을 냉각시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- 25% NaOH를 사용하여 pH를 10.5±0.5로 조정하고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- 습식 매스 각 1 g에 대해 3 ml의 에탄올 중에 펠릿을 용해시키고,
- 원심분리하고; (희석시키면서) 상청액 중 펩티드를 확인하고,
- 하기 성분들을 혼합하고:
a. 12.5 ml의, 에탄올 중에 용해된 펩티드
b. 4.2 ml의 물
c. 400 ㎕의 500 mM 2-(N-모르폴리노)에탄술폰산을 첨가하고,
d. HCl을 사용하여 pH를 5.0으로 조정하고,
e. 2.14 g의 염화암모늄을 첨가하고,
f. 200 ㎕의 500 mM N-히드록시숙신이미드
g. 1 ml 1 MY의 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드
- 2 h 동안 RT에서 인큐베이션시키고,
- 전도도가 30 mS/cm 미만이 될 때까지 상청액을 물로 희석시키고,
- 양이온 교환 크로마토그래피 (SP-세파로스 하이 퍼포먼스; GE 헬스케어)를 통해 변형된 P18 펩티드를 정제하는데; 세척 완충제는 10 mM 아세트산나트륨 완충제 (pH 4) + 450 mM NaCl이고; 용리 완충제는 10 mM 아세트산나트륨 완충제 (pH 4) + 1,100 mM NaCl이고,
- pH= 10.5±0.3이 될 때까지 25% NaOH를 용리액에 첨가하여 펩티드를 침전시키고,
- 20분 동안 적어도 5,000 x g로 원심분리하고,
- 습식 매스 각 1 g에 대해 5 ml의 물 중에 펠릿을 재현탁시키고,
- pH= 6.0±0.5가 될 때까지 아세트산을 첨가하여 펩티드를 용해시키고,
- 동결건조시켰다.
루나 SCX 5μ 100 A 크로마토그래피 칼럼 (페노메넥스: 미국 캘리포니아주 토런스)을 사용하여 HPLC에 의해 아미드화된 샘플을 분석하였다: 사용된 용리제는 25% 아세토니트릴 중 20 mM KH2PO4 (pH 2.5)이고, 선형 구배를 사용하여 이를 20 mM KH2PO4 (pH 2.5); 25% 아세토니트릴 및 1 M KCl로 대체하였다. 280 nm에서 검출을 수행하였다 (도 11). 도 11에는 비교를 위해 화학적으로 합성되고 아미드화된 참조 펩티드와 (바켐 아게(스위스 부벤도르프)에 의해 주문 생산된) "P18" 펩티드 서열의 크로마토그램을 함께 도시하였다.
본 발명에 따른 서열에 관한 개요
상기 기술된 구체적인 Pep 아미노산 서열 이외에도, 열거된 서열은 (예를 들어, 산 절단을 위한 잔기 "DP" 사이; 또는 히드록실아민 절단을 위한 잔기 "NG" 사이에) 특이적인 절단 서열을 부가함으로 인해, 또는 상기 절단으로부터 형성되는 남은 아미노산 잔기로 인해 C-말단에서 및/또는 N-말단에서 변경될 수 있다. 임의로, 스페이서 잔기, 예를 들어, G 잔기는 또한 절단 서열과 Pep 서열 사이에 추가로 삽입될 수 있다. 본 발명에 따라 생산된 Pep 서열의 산 또는 히드록실아민 절단으로부터 형성될 수 있는, 상기 Pep 서열에 대한 하기와 같은 변경에 대해서도 특별히 언급하여야 한다:
N-말단에서: PG-, P- 또는 G-잔기 부가;
C-말단에서: GD-; GN-; G-; N- 또는 D-잔기 부가.
특히, 상기와 같은 변경은 상기 Pep 서열 중 모든 단일 서열에 적용될 수 있고, 특히, 서열 6 내지 15, 29 내지 67 및 72의 것에 적용될 수 있다.
본원에서 인용되는 문헌의 개시 내용이 명백하게 참고된다.
SEQUENCE LISTING
<110> BASF SE
<120> Recombinant production of peptides
<130> M/49358-PCT
<160> 77
<170> PatentIn version 3.3
<210> 1
<211> 14
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 1
Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro
1 5 10
<210> 2
<211> 15
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 2
Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro
1 5 10 15
<210> 3
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 3
Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro
1 5 10
<210> 4
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 4
Gly Ser Val Val Val Val Val Val Val Val Ser Gly Pro
1 5 10
<210> 5
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 5
Gly Ser Val Val Ala Ala Val Val Ala Ala Ser Gly Pro
1 5 10
<210> 6
<211> 18
<212> PRT
<213> Artificial
<220>
<223> P18 Peptide
<400> 6
Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu Ala Lys
1 5 10 15
Lys Phe
<210> 7
<211> 19
<212> PRT
<213> Artificial
<220>
<223> Sequence Motif 1
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa = basic amino acid or hydrophobic amino acid different from
Pro
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa = basic amino acid or hydrophobic amino acid different from
Pro
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = basic amino acid or hydrophobic amino acid different from
Pro
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = basic amino acid or hydrophobic amino acid different from
Pro
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa = basic amino acid or hydrophobic amino acid different from
Pro
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa = missing or is Pro or Pro-Pro
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa = basic amino acid or hydrophobic amino acid different from
Pro
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa = basic amino acid or hydrophobic amino acid different from
Pro
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa = basic amino acid or hydrophobic amino acid different from
Pro
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> Xaa = basic amino acid or hydrophobic amino acid different from
Pro
<400> 7
Xaa Xaa Lys Xaa Xaa Xaa Lys Ile Pro Xaa Lys Phe Xaa Xaa Xaa Ala
1 5 10 15
Xaa Lys Phe
<210> 8
<211> 20
<212> PRT
<213> Artificial
<220>
<223> Sequence Motif 2
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa = Lys, Arg or Phe
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa = Lys or Trp
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = Leu or Lys
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = Phe or Leu
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa = Leu or Lys
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa = Pro or missing
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa = Pro or missing
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa = Leu or Lys
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa = His or Lys
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa = Ala, Leu, Val or Ser
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> Xaa = Leu or Lys
<400> 8
Xaa Xaa Lys Xaa Xaa Xaa Lys Ile Pro Xaa Xaa Lys Phe Xaa Xaa Xaa
1 5 10 15
Ala Xaa Lys Phe
20
<210> 9
<211> 19
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 9
Lys Trp Lys Leu Phe Lys Lys Ile Pro Pro Lys Phe Leu His Leu Ala
1 5 10 15
Lys Lys Phe
<210> 10
<211> 18
<212> PRT
<213> Artificial
<220>
<223> RP18 Peptide
<400> 10
Arg Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu Ala Lys
1 5 10 15
Lys Phe
<210> 11
<211> 18
<212> PRT
<213> Artificial
<220>
<223> KKFP18 Peptide
<400> 11
Phe Lys Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Ala Ala Lys
1 5 10 15
Lys Phe
<210> 12
<211> 18
<212> PRT
<213> Artificial
<220>
<223> KKLP18 Peptide
<400> 12
Lys Trp Lys Leu Leu Lys Lys Ile Pro Lys Phe Lys Lys Leu Ala Leu
1 5 10 15
Lys Phe
<210> 13
<211> 18
<212> PRT
<213> Artificial
<220>
<223> AP18 Peptide
<400> 13
Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Ala Ala Lys
1 5 10 15
Lys Phe
<210> 14
<211> 18
<212> PRT
<213> Artificial
<220>
<223> KFLP18 Peptide
<400> 14
Lys Trp Lys Lys Phe Leu Lys Ile Pro Lys Phe Leu His Ala Ala Lys
1 5 10 15
Lys Phe
<210> 15
<211> 18
<212> PRT
<213> Artificial
<220>
<223> KLLP18 Peptide
<400> 15
Lys Trp Lys Lys Leu Leu Lys Ile Pro Lys Phe Leu His Ala Ala Lys
1 5 10 15
Lys Phe
<210> 16
<211> 14
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 16
Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe
1 5 10
<210> 17
<211> 18
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 17
Glu Trp Glu Leu Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu
1 5 10 15
Glu Phe
<210> 18
<211> 18
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 18
Glu Leu Phe Glu Glu Leu Ala Glu Phe Leu Gln Gln Leu Glu Glu Phe
1 5 10 15
Ile Glu
<210> 19
<211> 30
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 19
Leu Phe Glu Glu Leu Gln Glu Phe Leu Gln Ala Leu Glu Glu Leu Ala
1 5 10 15
Gln Phe Ala Leu Gln Phe Leu Ala Ala Phe Leu Gln Phe Ser
20 25 30
<210> 20
<211> 20
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 20
Pro Glu Ala His Val Met His Lys Val Ala Pro Arg Pro Gly Gly Gly
1 5 10 15
Ser Cys Gly Asp
20
<210> 21
<211> 456
<212> DNA
<213> Artificial
<220>
<223> Synthetic gene
<400> 21
ggatccatgg gttccagcgc tgcggcagct gcagcggctg caagtggtcc ggacccggag 60
gcacacgtta tgcacaaagt agcgccgcgt ccgggtggcg gttcttgtgg tgatccgggt 120
agctctgcgg ctgcagctgc ggctgcagct tccggtccgg acccggaagc tcacgttatg 180
cacaaggttg ctccacgccc gggcggtggc agctgcggtg atccaggcag ctctgctgcg 240
gctgcggcag cggccgcttc tggcccggac ccggaagctc acgttatgca caaagtggct 300
ccgcgtccgg gtggcggttc ctgcggcgat ccgggttctt ccgctgcagc ggctgcggcc 360
gcagcgtctg gcccggaccc ggaagcacat gttatgcata aagtagcgcc gcgtccgggc 420
ggtggctctt gcggtgaccc gggctaatga aagctt 456
<210> 22
<211> 304
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<220>
<221> MISC_FEATURE
<222> (1)..(15)
<223> T7-Tag
<400> 22
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly
1 5 10 15
Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Asp Pro Glu
20 25 30
Ala His Val Met His Lys Val Ala Pro Arg Pro Gly Gly Gly Ser Cys
35 40 45
Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly
50 55 60
Pro Asp Pro Glu Ala His Val Met His Lys Val Ala Pro Arg Pro Gly
65 70 75 80
Gly Gly Ser Cys Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala
85 90 95
Ala Ala Ser Gly Pro Asp Pro Glu Ala His Val Met His Lys Val Ala
100 105 110
Pro Arg Pro Gly Gly Gly Ser Cys Gly Asp Pro Gly Ser Ser Ala Ala
115 120 125
Ala Ala Ala Ala Ala Ala Ser Gly Pro Asp Pro Glu Ala His Val Met
130 135 140
His Lys Val Ala Pro Arg Pro Gly Gly Gly Ser Cys Gly Asp Pro Gly
145 150 155 160
Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Asp Pro Glu
165 170 175
Ala His Val Met His Lys Val Ala Pro Arg Pro Gly Gly Gly Ser Cys
180 185 190
Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly
195 200 205
Pro Asp Pro Glu Ala His Val Met His Lys Val Ala Pro Arg Pro Gly
210 215 220
Gly Gly Ser Cys Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala
225 230 235 240
Ala Ala Ser Gly Pro Asp Pro Glu Ala His Val Met His Lys Val Ala
245 250 255
Pro Arg Pro Gly Gly Gly Ser Cys Gly Asp Pro Gly Ser Ser Ala Ala
260 265 270
Ala Ala Ala Ala Ala Ala Ser Gly Pro Asp Pro Glu Ala His Val Met
275 280 285
His Lys Val Ala Pro Arg Pro Gly Gly Gly Ser Cys Gly Asp Pro Gly
290 295 300
<210> 23
<211> 21
<212> PRT
<213> Artificial
<220>
<223> P18 Peptide
<400> 23
Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu
1 5 10 15
Ala Lys Lys Phe Gly
20
<210> 24
<211> 450
<212> DNA
<213> Artificial
<220>
<223> Synthetic gene
<400> 24
ggatccatgg gctctagcgc tgcagcggca gctgccgcgg cttctggtcc gggtctgttc 60
gaagagatct ccgaattcct gcagtctctg gaagagttcg gtggcccggg ttcctctgca 120
gctgcggctg cagctgcggc aagcggccct gacccaggta aatggaaact gtttaagaaa 180
attccgaaat tcctgcatct ggctaaaaaa ttcggtgacc cgggttcttc cgctgcggct 240
gcagctgcag ctgcgtccgg tccgggtctg ttcgaagaaa tctccgaatt cctgcagtct 300
ctggaagaat tcggcggtcc gggctctagc gctgccgctg cagcggcagc ggcttccggc 360
ccggacccgg gcaaatggaa actgtttaag aaaatcccga aatttctgca tctggctaaa 420
aagttcggcg atccgggcta atgaaagctt 450
<210> 25
<211> 300
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<220>
<221> MISC_FEATURE
<222> (1)..(15)
<223> T7-Tag
<400> 25
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly
1 5 10 15
Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Leu Phe
20 25 30
Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly Pro
35 40 45
Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Asp Pro
50 55 60
Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu Ala
65 70 75 80
Lys Lys Phe Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala
85 90 95
Ala Ser Gly Pro Gly Leu Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser
100 105 110
Leu Glu Glu Phe Gly Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala
115 120 125
Ala Ala Ser Gly Pro Asp Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile
130 135 140
Pro Lys Phe Leu His Leu Ala Lys Lys Phe Gly Asp Pro Gly Ser Ser
145 150 155 160
Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Leu Phe Glu Glu
165 170 175
Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly Pro Gly Ser
180 185 190
Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Asp Pro Gly Lys
195 200 205
Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu Ala Lys Lys
210 215 220
Phe Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser
225 230 235 240
Gly Pro Gly Leu Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu
245 250 255
Glu Phe Gly Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala
260 265 270
Ser Gly Pro Asp Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys
275 280 285
Phe Leu His Leu Ala Lys Lys Phe Gly Asp Pro Gly
290 295 300
<210> 26
<211> 18
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 26
Pro Gly Glu Arg Lys Arg Leu Ile Gly Cys Ser Val Met Thr Lys Pro
1 5 10 15
Ala Gly
<210> 27
<211> 516
<212> DNA
<213> Artificial
<220>
<223> Synthetic gene
<400> 27
ggatccatgg gctcttccgc tgcagccgct gcagctgcgg ctgcatccgg tccggaggca 60
gagccggaag acccgggtga acgtaaacgt ctgatcggtt gttctgtaat gaccaaacct 120
gctggtgatc cgggctccag cgctgcggct gcggcagctg cagcggcctc tggtccggag 180
gcggaaccgg aggacccggg tgaacgtaag cgcctgatcg gctgcagcgt gatgaccaaa 240
ccggctggtg atccgggttc ttccgcggct gcagctgcgg cagctgcagc tagtggtcca 300
gaagcagaac cagaagaccc gggtgaacgt aaacgtctga ttggttgctc tgttatgact 360
aaaccggctg gtgacccggg ctcttccgcg gctgccgcgg ctgcggctgc agctagcggc 420
ccggaagctg aaccggaaga tccgggcgaa cgcaagcgtc tgatcggctg ctccgttatg 480
actaaaccgg ctggcgaccc gggctaatga aagctt 516
<210> 28
<211> 344
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<220>
<221> MISC_FEATURE
<222> (1)..(15)
<223> T7-Tag
<400> 28
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly
1 5 10 15
Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Glu Ala
20 25 30
Glu Pro Glu Asp Pro Gly Glu Arg Lys Arg Leu Ile Gly Cys Ser Val
35 40 45
Met Thr Lys Pro Ala Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala
50 55 60
Ala Ala Ala Ala Ser Gly Pro Glu Ala Glu Pro Glu Asp Pro Gly Glu
65 70 75 80
Arg Lys Arg Leu Ile Gly Cys Ser Val Met Thr Lys Pro Ala Gly Asp
85 90 95
Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro
100 105 110
Glu Ala Glu Pro Glu Asp Pro Gly Glu Arg Lys Arg Leu Ile Gly Cys
115 120 125
Ser Val Met Thr Lys Pro Ala Gly Asp Pro Gly Ser Ser Ala Ala Ala
130 135 140
Ala Ala Ala Ala Ala Ala Ser Gly Pro Glu Ala Glu Pro Glu Asp Pro
145 150 155 160
Gly Glu Arg Lys Arg Leu Ile Gly Cys Ser Val Met Thr Lys Pro Ala
165 170 175
Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser
180 185 190
Gly Pro Glu Ala Glu Pro Glu Asp Pro Gly Glu Arg Lys Arg Leu Ile
195 200 205
Gly Cys Ser Val Met Thr Lys Pro Ala Gly Asp Pro Gly Ser Ser Ala
210 215 220
Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Glu Ala Glu Pro Glu
225 230 235 240
Asp Pro Gly Glu Arg Lys Arg Leu Ile Gly Cys Ser Val Met Thr Lys
245 250 255
Pro Ala Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala
260 265 270
Ala Ser Gly Pro Glu Ala Glu Pro Glu Asp Pro Gly Glu Arg Lys Arg
275 280 285
Leu Ile Gly Cys Ser Val Met Thr Lys Pro Ala Gly Asp Pro Gly Ser
290 295 300
Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Glu Ala Glu
305 310 315 320
Pro Glu Asp Pro Gly Glu Arg Lys Arg Leu Ile Gly Cys Ser Val Met
325 330 335
Thr Lys Pro Ala Gly Asp Pro Gly
340
<210> 29
<211> 12
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 29
Asn Pro Ser Ser Leu Phe Arg Tyr Leu Pro Ser Asp
1 5 10
<210> 30
<211> 12
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 30
His Gly Gly Gly His Gly His Gly Gly Gly His Gly
1 5 10
<210> 31
<211> 12
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 31
His Tyr Pro Thr Leu Pro Leu Gly Ser Ser Thr Tyr
1 5 10
<210> 32
<211> 12
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 32
Ala Leu Ser Pro His Ser Ala Pro Leu Thr Leu Tyr
1 5 10
<210> 33
<211> 7
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 33
Ser Ala Gly Arg Leu Ser Ala
1 5
<210> 34
<211> 7
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 34
Thr Leu Pro Asn His Thr Val
1 5
<210> 35
<211> 7
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 35
His Thr Ser Lys Leu Gly Ile
1 5
<210> 36
<211> 16
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 36
Met Ser Pro His Pro His Pro Arg His His His Thr Gly Gly Gly Lys
1 5 10 15
<210> 37
<211> 17
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 37
Glu Ala His Val Met His Lys Val Ala Pro Arg Pro Gly Gly Gly Ser
1 5 10 15
Cys
<210> 38
<211> 18
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 38
Ser Ser Lys Lys Ser Gly Ser Tyr Ser Gly Ser Lys Gly Ser Arg Arg
1 5 10 15
Ile Leu
<210> 39
<211> 27
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 39
Pro Tyr Ala Tyr Met Lys Ser Arg Asp Ile Glu Ser Ala Gln Ser Asp
1 5 10 15
Glu Glu Val Glu Leu Arg Asp Ala Leu Ala Asp
20 25
<210> 40
<211> 20
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 40
Pro Gly Tyr Gly Tyr Tyr Lys Asn Arg Asn Ala Glu Pro Ala Ala Ala
1 5 10 15
Glu Ala Val Asp
20
<210> 41
<211> 20
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 41
Pro Gly Lys Ser Arg Asp Ile Glu Ser Ala Gln Ser Asp Glu Glu Val
1 5 10 15
Glu Leu Arg Asp
20
<210> 42
<211> 17
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 42
Pro Gly Lys Ser Arg Asp Ala Glu Pro Ala Ala Ala Gly Glu Glu Val
1 5 10 15
Asp
<210> 43
<211> 33
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 43
Ser Ser Lys Lys Ser Gly Ser Tyr Ser Gly Ser Lys Gly Ser Arg Arg
1 5 10 15
Ile Leu Gly Gly Gly Asn Pro Ser Ser Leu Phe Arg Tyr Leu Pro Ser
20 25 30
Asp
<210> 44
<211> 27
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 44
Met Ser Pro His Pro His Pro Arg His His His Thr Gly Gly Gly Asn
1 5 10 15
Pro Ser Ser Leu Phe Arg Tyr Leu Pro Ser Asp
20 25
<210> 45
<211> 31
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 45
Asn Pro Ser Ser Leu Phe Arg Tyr Leu Pro Ser Asp Gly Gly Gly Arg
1 5 10 15
Arg Glu Glu Trp Trp Asp Asp Arg Arg Glu Glu Trp Trp Asp Asp
20 25 30
<210> 46
<211> 27
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 46
Met Ser Pro His Pro His Pro Arg His His His Thr Gly Gly Gly His
1 5 10 15
Gly Gly Gly His Gly His Gly Gly Gly His Gly
20 25
<210> 47
<211> 33
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 47
Ser Ser Lys Lys Ser Gly Ser Tyr Ser Gly Ser Lys Gly Ser Arg Arg
1 5 10 15
Ile Leu Gly Gly Gly His Gly Gly Gly His Gly His Gly Gly Gly His
20 25 30
Gly
<210> 48
<211> 33
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 48
Ser Ser Lys Lys Ser Gly Ser Tyr Ser Gly Ser Lys Gly Ser Arg Arg
1 5 10 15
Ile Leu Gly Gly Gly His Tyr Pro Thr Leu Pro Leu Gly Ser Ser Thr
20 25 30
Tyr
<210> 49
<211> 28
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 49
Ser Ser Lys Lys Ser Gly Ser Tyr Ser Gly Ser Lys Gly Ser Arg Arg
1 5 10 15
Ile Leu Gly Gly Gly Ser Ala Gly Arg Leu Ser Ala
20 25
<210> 50
<211> 16
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 50
Arg Arg Glu Glu Trp Trp Asp Asp Arg Arg Glu Glu Trp Trp Asp Asp
1 5 10 15
<210> 51
<211> 21
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 51
Met Lys Gln Leu Ala Asp Ser Leu Met Gln Leu Ala Arg Gln Val Ser
1 5 10 15
Arg Leu Glu Ser Ala
20
<210> 52
<211> 21
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 52
Met Lys Gln Leu Ala Asp Ser Leu His Gln Leu Ala Arg Gln Val Ser
1 5 10 15
Arg Leu Glu His Ala
20
<210> 53
<211> 28
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 53
Leu Met Gln Leu Ala Arg Gln Met Lys Gln Leu Ala Asp Ser Leu Met
1 5 10 15
Gln Leu Ala Arg Gln Val Ser Arg Leu Glu Ser Ala
20 25
<210> 54
<211> 21
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 54
Met Lys Glu Leu Ala Asp Ser Leu Met Gln Leu Ala Arg Gln Val Asp
1 5 10 15
Arg Leu Glu Ser Ala
20
<210> 55
<211> 21
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 55
Met Lys Gln Leu Ala Asp Ser Leu His Gln Leu Ala His Gln Val Ser
1 5 10 15
His Leu Glu His Ala
20
<210> 56
<211> 9
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 56
Pro His Phe Arg Phe Ser Phe Ser Pro
1 5
<210> 57
<211> 9
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 57
Pro His Phe Ser Phe Ser Phe Ser Pro
1 5
<210> 58
<211> 9
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 58
Pro Ser Phe Arg Phe Ser Phe Ser Pro
1 5
<210> 59
<211> 21
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 59
Met Glu Glu Leu Ala Asp Ser Leu Glu Glu Leu Ala Arg Gln Val Glu
1 5 10 15
Glu Leu Glu Ser Ala
20
<210> 60
<211> 21
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 60
Met Lys Lys Leu Ala Asp Ser Leu Lys Lys Leu Ala Arg Gln Val Lys
1 5 10 15
Lys Leu Glu Ser Ala
20
<210> 61
<211> 9
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 61
Pro His Phe His Phe Ser Phe Ser Pro
1 5
<210> 62
<211> 9
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 62
Pro His Phe Ser Phe His Phe Ser Pro
1 5
<210> 63
<211> 21
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 63
Met Lys Gln Leu Ala Asp Ser Leu His Gln Leu Ala His Lys Val Ser
1 5 10 15
His Leu Glu His Ala
20
<210> 64
<211> 21
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 64
Glu Ile Ser Ala Leu Glu Lys Glu Ile Ser Ala Leu Glu Lys Glu Ile
1 5 10 15
Ser Ala Leu Glu Lys
20
<210> 65
<211> 21
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 65
Lys Ile Ser Ala Leu Lys Glu Lys Ile Ser Ala Leu Lys Glu Lys Ile
1 5 10 15
Ser Ala Leu Lys Glu
20
<210> 66
<211> 16
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 66
Arg Ala Asp Ala Arg Ala Asp Ala Arg Ala Asp Ala Arg Ala Asp Ala
1 5 10 15
<210> 67
<211> 21
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 67
Val Lys Val Lys Val Lys Val Lys Val Gly Pro Pro Thr Lys Val Lys
1 5 10 15
Val Lys Val Lys Val
20
<210> 68
<211> 6
<212> PRT
<213> Artificial
<220>
<223> Peptide
<400> 68
Glu Ala Glu Pro Glu Asp
1 5
<210> 69
<211> 22
<212> PRT
<213> Artificial
<220>
<223> Peptide
<400> 69
Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu
1 5 10 15
Ala Lys Lys Phe Gly Asp
20
<210> 70
<211> 19
<212> PRT
<213> Artificial
<220>
<223> Peptide
<400> 70
Pro Gly Glu Arg Lys Arg Leu Ile Gly Cys Ser Val Met Thr Lys Pro
1 5 10 15
Ala Gly Asp
<210> 71
<211> 22
<212> PRT
<213> Artificial
<220>
<223> Peptide
<400> 71
Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu
1 5 10 15
Ala Lys Lys Phe Gly Asn
20
<210> 72
<211> 15
<212> PRT
<213> Artificial
<220>
<223> Peptide
<400> 72
Glu Arg Lys Arg Leu Ile Gly Cys Ser Val Met Thr Lys Pro Ala
1 5 10 15
<210> 73
<211> 12
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 73
Gly Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro
1 5 10
<210> 74
<211> 456
<212> DNA
<213> Artificial
<220>
<223> Synthetic gene
<400> 74
ggatccatgg gcgctgcagc ggcagctgcc gcggcttctg gtccgggtga gtgggagctg 60
ttcgaagaga tcagcgaatt cctgcagtct ctggaagagt tcggtggccc gggttcctct 120
gctgctgcgg ctgcagctgc ggcaggcccg ggcgacccag gtaaatggaa actgtttaag 180
aaaattccga aattcctgca tctggctaaa aaattcggtg acccgggttc ctctgctgcg 240
gctgcagctg cagctgcgtc cggtccgggt gaatgggaac tgttcgaaga aatctccgaa 300
ttcctgcagt ctctggaaga attcggcggt ccgggcgctg ccgctgcagc ggcagcggct 360
ggtcctggcg acccgggcaa atggaaactg tttaagaaaa tcccgaaatt tctgcatctg 420
gctaaaaagt tcggcgatcc gggctaatga aagctt 456
<210> 75
<211> 304
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 75
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly
1 5 10 15
Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Glu Trp Glu Leu
20 25 30
Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly
35 40 45
Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Asp
50 55 60
Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu
65 70 75 80
Ala Lys Lys Phe Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala
85 90 95
Ala Ala Ser Gly Pro Gly Glu Trp Glu Leu Phe Glu Glu Ile Ser Glu
100 105 110
Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly Pro Gly Ala Ala Ala Ala
115 120 125
Ala Ala Ala Ala Gly Pro Gly Asp Pro Gly Lys Trp Lys Leu Phe Lys
130 135 140
Lys Ile Pro Lys Phe Leu His Leu Ala Lys Lys Phe Gly Asp Pro Gly
145 150 155 160
Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Glu Trp Glu Leu
165 170 175
Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly
180 185 190
Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Asp
195 200 205
Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu
210 215 220
Ala Lys Lys Phe Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala
225 230 235 240
Ala Ala Ser Gly Pro Gly Glu Trp Glu Leu Phe Glu Glu Ile Ser Glu
245 250 255
Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly Pro Gly Ala Ala Ala Ala
260 265 270
Ala Ala Ala Ala Gly Pro Gly Asp Pro Gly Lys Trp Lys Leu Phe Lys
275 280 285
Lys Ile Pro Lys Phe Leu His Leu Ala Lys Lys Phe Gly Asp Pro Gly
290 295 300
<210> 76
<211> 438
<212> DNA
<213> Artificial
<220>
<223> Synthetic gene
<400> 76
ggatccatgg gcgctgcagc ggcagctgcc gcggcttctg gtccgggtga gtgggagctg 60
ttcgaagaga tcagcgaatt cctgcagtct ctggaagagt tcggtggccc gggttcctct 120
gctgctgcgg ctgcagctgc ggcaggccca ggcgacaaat ggaaactgtt taagaaaatt 180
ccgaaattcc tgcatctggc taaaaaattc gacccgggtt cctctgctgc ggctgcagct 240
gcagctgcgt ccggtccggg tgaatgggaa ctgttcgaag aaatctccga attcctgcag 300
tctctggaag aattcggcgg tccgggcgct gccgctgcag cggcagcggc tggtcctggc 360
gacaaatgga aactgtttaa gaaaatcccg aaatttctgc atctggctaa aaagttcgat 420
ccgggctaat gaaagctt 438
<210> 77
<211> 278
<212> PRT
<213> Artificial
<220>
<223> Polypeptide
<400> 77
Met Gly Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Glu Trp
1 5 10 15
Glu Leu Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe
20 25 30
Gly Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro
35 40 45
Gly Asp Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu
50 55 60
Ala Lys Lys Phe Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala
65 70 75 80
Ala Ser Gly Pro Gly Glu Trp Glu Leu Phe Glu Glu Ile Ser Glu Phe
85 90 95
Leu Gln Ser Leu Glu Glu Phe Gly Gly Pro Gly Ala Ala Ala Ala Ala
100 105 110
Ala Ala Ala Gly Pro Gly Asp Lys Trp Lys Leu Phe Lys Lys Ile Pro
115 120 125
Lys Phe Leu His Leu Ala Lys Lys Phe Asp Pro Gly Ala Ala Ala Ala
130 135 140
Ala Ala Ala Ala Ser Gly Pro Gly Glu Trp Glu Leu Phe Glu Glu Ile
145 150 155 160
Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly Pro Gly Ser Ser
165 170 175
Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Asp Lys Trp Lys Leu
180 185 190
Phe Lys Lys Ile Pro Lys Phe Leu His Leu Ala Lys Lys Phe Asp Pro
195 200 205
Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Glu
210 215 220
Trp Glu Leu Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu
225 230 235 240
Phe Gly Gly Pro Gly Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly
245 250 255
Asp Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu Ala
260 265 270
Lys Lys Phe Asp Pro Gly
275
Claims (29)
- 하기 일반식의 원하는 펩티드 (Pep) 요소 및 보조 펩티드 (Aux) 요소로 구성된 절단가능한 반복 서열을 포함하는 전구체 단백질.
<일반식>
(Pep-Aux)x 또는
(Aux-Pep)x
상기 식에서, x는 >1이고,
여기서, Aux 요소는 동일하거나 상이하고, 상기 전구체 단백질에 자기-조립 특성을 부여하는 아미노산 서열 요소를 포함하고;
Pep 요소는 동일하거나 상이하고, 동일하거나 상이한 펩티드 분자의 아미노산 서열을 포함한다. - 제1항에 있어서, 요소 Pep 및 Aux가 펩티드결합으로 서로 연결되어 있고, 펩티드 연결이 화학적으로 또는 효소적으로 특이적으로 절단될 수 있는 것인 전구체 단백질.
- 제1항 또는 제2항에 있어서, 실온에서 0.2 M NaOH에 의해 1시간 이내에 용해되지 못하거나, 또는 2 M 우레아 또는 1 M 구아니디늄 히드로클로라이드에 의해 10분 이내에 용해되지 못하는 안정한 회합물을 형성하는 전구체 단백질.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 적어도 하나의 Aux 요소가 적어도 8개의 아미노산으로 구성된 적어도 하나의 서열을 포함하는 자기-조립 펩티드 (SA) 요소를 포함하며, 이는 적어도 50%의 알라닌 잔기, 적어도 50%의 발린 잔기 또는 적어도 50%의 글루타민 잔기를 포함하거나, 또는 그의 적어도 80%가 이들 잔기 중 적어도 하나로 이루어진 것인 전구체 단백질.
- 제4항에 있어서, SA 요소가 하기 서열 모티프 중 적어도 하나를 포함하는 것인 전구체 단백질.
An (모티프 1)
(GA)m (모티프 2)
Vn (모티프 3)
(VA)m (모티프 4) 및
(VVAA)o (모티프 5)
여기서, A는 알라닌이고, G는 글리신이고, V는 발린이고, n은 정수 2 내지 12이고, m은 정수 2 내지 10이고, o은 정수 1 내지 6이다. - 제4항 또는 제5항에 있어서, SA 요소가 아미노산 서열 중 서열 1 내지 5, 및 서열 73으로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 적어도 하나의 Aux 펩티드가 보호 펩티드 (SU) 요소를 추가로 포함하는 것인 전구체 단백질.
- 제7항에 있어서, SU 요소가 음으로 하전된 아미노산 잔기를 높은 비율로 갖는 것인 전구체 단백질.
- 제8항에 있어서, 전구체 단백질 중의 SU 요소가 양친매성 나선 구조를 형성할 수 있는 것인 전구체 단백질.
- 제9항에 있어서, SU 요소가, 양친매성 알파-나선을 형성할 수 있는, 펩티드결합으로 연결된 적어도 7개의 아미노산으로 구성된 서열 절편을 포함하는 양친매성 펩티드이고, 여기서, 상기 나선의 아미노산 잔기는 그의 수직 투영에서 나선의 소수성 반쪽 및 친수성 반쪽으로 분리되고, 나선의 소수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 소수성 아미노산 잔기를 가지며, 나선의 친수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 친수성 아미노산 잔기를 갖는 것인 전구체 단백질.
- 제8항 내지 제10항 중 어느 한 항에 있어서, SU 요소 중 하전된 아미노산 잔기의 비율이, 전구체 단백질의 전체 순전하가 pH=7에서 -10 초과 내지 +10 미만이 되도록 선택되는 것인 전구체 단백질.
- 제8항 내지 제11항 중 어느 한 항에 있어서, SU 요소가 아미노산 서열 중 서열 16 내지 서열 19 및 서열 68로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.
- 제1항 내지 제12항 중 어느 한 항에 있어서, Pep 요소가 양이온성의 항미생물성 펩티드 서열을 포함하는 것인 전구체 단백질.
- 제13항에 있어서, Pep 요소가 양이온성 아미노산 서열 중 서열 6 내지 서열 15, 서열 23, 서열 26 및 서열 69 내지 서열 72로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.
- 제1항 내지 제6항 중 어느 한 항에 있어서, Pep 요소가 아미노산 서열 중 서열 20 또는 서열 29 내지 67로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.
- 제1항 내지 제15항 중 어느 한 항에 있어서, Aux 요소가 서로 독립적으로 SA, SA-SU, SU-SA, SA-SU-SA 및 SU-SA-SU의 의미 중 임의의 것을 가지며, 여기서 요소 SA 및 SU는 펩티드결합으로 서로 연결되어 있고, Aux 요소가 말단에서 적어도 하나의 Pep 요소에 펩티드결합으로 연결되어 있고, Pep 요소에의 상기 펩티드 연결이 화학적으로 또는 효소적으로 특이적으로 절단될 수 있는 것인 전구체 단백질.
- 제1항 내지 제16항 중 어느 한 항에 따른 적어도 하나의 전구체 단백질을 코딩하는 핵산 서열.
- 제17항에 있어서, 서열 21, 24, 27, 74 및 76의 서열인 적어도 하나의 코딩 서열을 포함하는 핵산 서열.
- 적어도 하나의 조절 핵산 서열에 작동적으로 연결된, 제17항 또는 제18항에 따른 적어도 하나의 핵산 서열을 포함하는 발현 카세트.
- 제17항 또는 제18항에 따른 핵산 서열 또는 제19항에 따른 발현 카세트를 포함하는, 진핵 또는 원핵 숙주를 형질전환시키기 위한 재조합 벡터.
- a) 제1항 내지 제16항 중 어느 한 항에 따른 전구체 단백질을 생산하는 단계; 및
b) 전구체 단백질로부터 Pep 펩티드를 제거하는 단계
를 포함하는, 원하는 펩티드 (Pep)를 생산하는 방법. - 제21항에 있어서, 전구체 단백질이 제19항에 따른 적어도 하나의 벡터를 보유하는 재조합 미생물에서 생산되는 것인 방법.
- 제22항에 있어서, 전구체 단백질이 재조합 이. 콜라이(E. coli) 균주에서 생산되는 것인 방법.
- 제21항 내지 제23항 중 어느 한 항에 있어서, 발현된 전구체 단백질을, 임의로는 상기 단백질이 안정적으로 회합된 형태로 전환된 후에, 정제하고, 화학적으로 또는 효소적으로 절단하여 원하는 펩티드 (Pep)를 유리시키는 것인 방법.
- 하기 일반식의 원하는 펩티드 (Pep) 요소 및 보조 펩티드 (Aux') 요소로 구성된 절단가능한 서열을 포함하는 전구체 단백질.
<일반식>
(Pep-Aux')x 또는
(Aux'-Pep)x
상기 식에서, x는 >1이고,
여기서, Aux' 요소는 동일하거나 상이하고, 양친매성의 알파-나선-형성 펩티드를 포함하고, 상기 양친매성 펩티드는 양친매성 알파-나선을 형성할 수 있는, 펩티드결합으로 연결된 적어도 7개의 아미노산으로 구성된 서열 절편을 포함하고, 여기서, 상기 나선의 아미노산 잔기는 그의 수직 투영에서 나선의 소수성 반쪽 및 친수성 반쪽으로 분리되고, 나선의 소수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 소수성 아미노산 잔기를 가지며, 나선의 친수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 친수성 아미노산 잔기를 갖고;
Pep 요소는 동일하거나 상이하고, 동일하거나 상이한 펩티드 분자의 아미노산 서열을 포함한다. - 제25항에 있어서, Aux' 요소가 제4항 내지 제6항 중 어느 한 항에서 정의된 바와 같은 적어도 하나의 자기-조립 펩티드 (SA) 요소를 포함하는 것인 전구체 단백질.
- 제25항 또는 제26항에 있어서, 원하는 펩티드 (Pep)가 양이온성의 항미생물성 펩티드이고, Aux' 요소가 양친매성 알파-나선을 형성하는 음이온성 펩티드인 것인 전구체 단백질.
- 양친매성 펩티드가 양친매성 알파-나선을 형성할 수 있는, 펩티드결합으로 연결된 적어도 7개의 아미노산으로 구성된 서열 섹션을 포함하고, 여기서, 상기 나선의 아미노산 잔기는 그의 수직 투영에서 나선의 소수성 반쪽 및 친수성 반쪽으로 분리되고, 나선의 소수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 소수성 아미노산 잔기를 가지며, 나선의 친수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 친수성 아미노산 잔기를 갖는 것인, 양친매성 펩티드와는 상이한 항미생물성의 원하는 펩티드를 재조합적으로 생산하기 위한, 보호 펩티드로서의 양친매성 펩티드의 용도.
- 제28항에 있어서, 원하는 펩티드 (Pep)가 양이온성의 항미생물성 펩티드이고, Aux' 요소가 양친매성 알파-나선을 형성하는 음이온성 펩티드인 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09161837 | 2009-06-03 | ||
EP09161837.1 | 2009-06-03 | ||
PCT/EP2010/057726 WO2010139736A2 (de) | 2009-06-03 | 2010-06-02 | Rekombinante herstellung von peptiden |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147026327A Division KR101812842B1 (ko) | 2009-06-03 | 2010-06-02 | 펩티드의 재조합 생산 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120014940A true KR20120014940A (ko) | 2012-02-20 |
KR101834018B1 KR101834018B1 (ko) | 2018-03-05 |
Family
ID=43298234
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147026327A KR101812842B1 (ko) | 2009-06-03 | 2010-06-02 | 펩티드의 재조합 생산 |
KR1020127000053A KR101834018B1 (ko) | 2009-06-03 | 2010-06-02 | 펩티드의 재조합 생산 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147026327A KR101812842B1 (ko) | 2009-06-03 | 2010-06-02 | 펩티드의 재조합 생산 |
Country Status (20)
Country | Link |
---|---|
US (1) | US9481719B2 (ko) |
EP (1) | EP2437769B1 (ko) |
JP (1) | JP5730293B2 (ko) |
KR (2) | KR101812842B1 (ko) |
CN (1) | CN102724992B (ko) |
AR (1) | AR076977A1 (ko) |
AU (1) | AU2010255732B8 (ko) |
BR (1) | BRPI1011144B8 (ko) |
CA (1) | CA2763626A1 (ko) |
CL (1) | CL2011003075A1 (ko) |
CR (1) | CR20110619A (ko) |
EC (1) | ECSP12011577A (ko) |
ES (1) | ES2763168T3 (ko) |
IL (1) | IL216619A0 (ko) |
MX (1) | MX2011012906A (ko) |
NZ (2) | NZ615847A (ko) |
PE (1) | PE20121033A1 (ko) |
RU (1) | RU2548815C2 (ko) |
TW (1) | TWI429750B (ko) |
WO (1) | WO2010139736A2 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180123866A (ko) * | 2017-05-10 | 2018-11-20 | 건국대학교 산학협력단 | D-라이신 치환을 통해 항균 효과를 증진시킨 항생 펩타이드 및 이의 용도 |
KR20180123860A (ko) * | 2017-05-10 | 2018-11-20 | 건국대학교 산학협력단 | 글루탐산 치환을 통해 항균 효과를 증진시킨 항생 펩타이드 및 이의 용도 |
KR20180123869A (ko) * | 2017-05-10 | 2018-11-20 | 건국대학교 산학협력단 | D-루이신 치환을 통해 항균 효과를 증진시킨 항생 펩타이드 및 이의 용도 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006089364A1 (en) * | 2005-02-24 | 2006-08-31 | The University Of Queensland | Peptide networks |
WO2012079125A1 (en) * | 2010-12-14 | 2012-06-21 | The University Of Queensland | Designed biosurfactants, their manufacture, purification and use |
CN103740661B (zh) * | 2012-05-10 | 2015-06-03 | 江南大学 | 一种提高酶热稳定性的方法 |
CN103740659B (zh) * | 2012-05-10 | 2015-06-03 | 江南大学 | 一种提高酶热稳定性的方法 |
CN103740660B (zh) * | 2012-05-10 | 2015-08-19 | 江南大学 | 一种提高酶热稳定性的方法 |
US9976133B2 (en) | 2012-06-20 | 2018-05-22 | The Regents Of The University Of California | Synzymes |
WO2014056199A1 (zh) * | 2012-10-12 | 2014-04-17 | 清华大学 | 多肽的产生和纯化方法 |
WO2017055587A1 (de) * | 2015-10-01 | 2017-04-06 | Basf Se | Rekombinante herstellung von peptiden |
CN106496307B (zh) * | 2016-11-09 | 2019-11-01 | 湖南科技学院 | 一种新的抗菌肽及其用途 |
US11260101B2 (en) | 2017-02-28 | 2022-03-01 | Jinan University | Repair peptide for use in promoting post-traumatic tissue repair and regeneration, and application thereof |
CN108503690B (zh) * | 2017-02-28 | 2020-07-03 | 暨南大学 | 一种促进创伤后组织修复与再生的修复肽及其应用 |
WO2020048996A1 (en) | 2018-09-06 | 2020-03-12 | ETH Zürich | Self-assembling globular proteins and uses thereof |
CN111388374B (zh) * | 2020-04-11 | 2022-09-06 | 百草堂(湖北)制药有限公司 | 一种洗发露 |
CN116874613B (zh) * | 2023-09-06 | 2023-11-17 | 南京华盖制药有限公司 | 一种广谱高效的抗菌多肽aph143及其制备方法和应用 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9504761D0 (en) | 1995-03-09 | 1995-04-26 | Unilever Plc | Amphiphilic peptide and analogs thereof |
KR100263583B1 (ko) * | 1997-05-28 | 2000-08-01 | 박종헌 | 항균 펩타이드의 대량 제조방법 및 그에 유용한 플라즈미드 벡타 |
JP2002530114A (ja) * | 1998-11-20 | 2002-09-17 | マイクロロジックス バイオテック,インコーポレイテッド | 宿主細胞において抗菌カチオン性ペプチドを産生するための効率的な方法 |
US7288391B2 (en) * | 2001-06-06 | 2007-10-30 | University Of Wyoming | Expression of spider silk proteins in higher plants |
KR100438416B1 (ko) | 2001-09-19 | 2004-07-02 | 학교법인조선대학교 | Ca-ma 펩타이드의 아미노산 중 하나 또는 그 이상을치환하여 + 전극과 소수성 영역이 증가된 신규한펩타이드 및 그를 포함하는 약학적 조성물 |
PT1448595E (pt) | 2001-11-20 | 2007-02-28 | Novozymes As | Polipéptideos antimicrobianos de pseudoplectania nigrella |
US20030219854A1 (en) | 2002-03-21 | 2003-11-27 | Micrologix Biotech Inc. | Methods for producing modified anti-infective peptides |
WO2003089455A2 (en) | 2002-04-22 | 2003-10-30 | Dow Global Technologies Inc. | Low-cost production of peptides |
EP2471524A3 (en) | 2003-03-17 | 2012-12-12 | The Trustees Of The University Of Pennsylvania | Facially amphiphllic polymers and oligomers and uses thereof |
AU2005263622B2 (en) | 2004-07-22 | 2012-04-26 | Amsilk Gmbh | Recombinant spider silk proteins |
JP2009505668A (ja) | 2005-08-29 | 2009-02-12 | テヒニシェ ウニヴェルズィテート ミュンヘン | 修飾スパイダーシルクタンパク質 |
US7709227B2 (en) | 2006-01-04 | 2010-05-04 | Phasebio Pharmaceuticals, Inc. | Multimeric ELP fusion constructs |
EP1979055A2 (de) | 2006-01-20 | 2008-10-15 | Basf Se | Verwendung von protein-microbeads in der kosmetik |
AU2008279584A1 (en) * | 2007-04-27 | 2009-01-29 | Dow Global Technologies Inc. | Improved production and in vivo assembly of soluble recombinant icosahedral virus-like particles |
US8367803B2 (en) | 2007-06-20 | 2013-02-05 | Basf Se | Synthetic repetitive proteins, the production and use thereof |
KR101425331B1 (ko) * | 2007-12-21 | 2014-08-01 | 바스프 에스이 | 펩티드를 함유하는 항비듬 조성물 |
-
2010
- 2010-06-02 JP JP2012513614A patent/JP5730293B2/ja not_active Expired - Fee Related
- 2010-06-02 CN CN201080033646.XA patent/CN102724992B/zh not_active Expired - Fee Related
- 2010-06-02 WO PCT/EP2010/057726 patent/WO2010139736A2/de active Application Filing
- 2010-06-02 AU AU2010255732A patent/AU2010255732B8/en not_active Ceased
- 2010-06-02 CA CA2763626A patent/CA2763626A1/en not_active Abandoned
- 2010-06-02 KR KR1020147026327A patent/KR101812842B1/ko active IP Right Grant
- 2010-06-02 ES ES10724472T patent/ES2763168T3/es active Active
- 2010-06-02 MX MX2011012906A patent/MX2011012906A/es active IP Right Grant
- 2010-06-02 RU RU2011153757/10A patent/RU2548815C2/ru not_active IP Right Cessation
- 2010-06-02 BR BRPI1011144A patent/BRPI1011144B8/pt not_active IP Right Cessation
- 2010-06-02 US US13/375,559 patent/US9481719B2/en active Active
- 2010-06-02 PE PE2011002049A patent/PE20121033A1/es not_active Application Discontinuation
- 2010-06-02 NZ NZ615847A patent/NZ615847A/en not_active IP Right Cessation
- 2010-06-02 KR KR1020127000053A patent/KR101834018B1/ko active IP Right Grant
- 2010-06-02 EP EP10724472.5A patent/EP2437769B1/de active Active
- 2010-06-02 NZ NZ596735A patent/NZ596735A/xx not_active IP Right Cessation
- 2010-06-03 AR ARP100101974A patent/AR076977A1/es unknown
- 2010-06-03 TW TW099117988A patent/TWI429750B/zh not_active IP Right Cessation
-
2011
- 2011-11-23 CR CR20110619A patent/CR20110619A/es unknown
- 2011-11-27 IL IL216619A patent/IL216619A0/en unknown
- 2011-12-02 CL CL2011003075A patent/CL2011003075A1/es unknown
-
2012
- 2012-01-06 EC EC2012011577A patent/ECSP12011577A/es unknown
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180123866A (ko) * | 2017-05-10 | 2018-11-20 | 건국대학교 산학협력단 | D-라이신 치환을 통해 항균 효과를 증진시킨 항생 펩타이드 및 이의 용도 |
KR20180123860A (ko) * | 2017-05-10 | 2018-11-20 | 건국대학교 산학협력단 | 글루탐산 치환을 통해 항균 효과를 증진시킨 항생 펩타이드 및 이의 용도 |
KR20180123869A (ko) * | 2017-05-10 | 2018-11-20 | 건국대학교 산학협력단 | D-루이신 치환을 통해 항균 효과를 증진시킨 항생 펩타이드 및 이의 용도 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101812842B1 (ko) | 펩티드의 재조합 생산 | |
CA2674304C (en) | Methods and compositions for enhanced protein expression and purification | |
WO2008140582A2 (en) | Production of anti-microbial peptides | |
WO2013142859A2 (en) | Fusion proteins of superfolder green fluorescent protein and use thereof | |
US20140221608A1 (en) | Acid-cleavable linkers exhibiting altered rates of acid hydrolysis | |
Takagi et al. | Prismin: a new matrix protein family in the Japanese pearl oyster (Pinctada fucata) involved in prismatic layer formation | |
WO2017055587A1 (de) | Rekombinante herstellung von peptiden | |
JP2012526771A (ja) | 抗真菌性ペプチドを含有する医薬組成物 | |
Zhou et al. | TrxA mediating fusion expression of antimicrobial peptide CM4 from multiple joined genes in Escherichia coli | |
KR20170141240A (ko) | 성장 및 단백질 생성의 탈결합 | |
CN109971776B (zh) | 基于光切割基序的蛋白纯化方法 | |
JP4546089B2 (ja) | 融合タンパク質 | |
Morreale et al. | Bioprocess‐centered molecular design (BMD) for the efficient production of an interfacially active peptide | |
Su-Xia et al. | Cloning and expression of a new rat procarboxypeptidase B gene in Escherichia coli and purification of recombination carboxypeptidase B | |
WO2016049487A1 (en) | Heterologous expression of glycine n-acyltransferase proteins | |
Díaz et al. | Intein-mediated expression of cecropin in Escherichia coli | |
Greenshields et al. | Strategies for recombinant expression of small, highly disulphide-bonded, cationic antimicrobial peptides | |
KR101423713B1 (ko) | 보리 리보솜 억제 단백질을 이용한 재조합 단백질의 대량생산용 벡터 및 이를 이용한 재조합 단백질의 대량생산 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
A107 | Divisional application of patent | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
J201 | Request for trial against refusal decision | ||
J301 | Trial decision |
Free format text: TRIAL NUMBER: 2015101003853; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20150706 Effective date: 20171030 |
|
S901 | Examination by remand of revocation | ||
GRNO | Decision to grant (after opposition) | ||
GRNT | Written decision to grant |