RU2779307C2 - Способ микробиологического синтеза прохимозина быка с использованием рекомбинантного штамма Pichia pastoris, содержащего синтетический ген варианта препрохимозина с модифицированной сигнальной последовательностью секреции - Google Patents
Способ микробиологического синтеза прохимозина быка с использованием рекомбинантного штамма Pichia pastoris, содержащего синтетический ген варианта препрохимозина с модифицированной сигнальной последовательностью секреции Download PDFInfo
- Publication number
- RU2779307C2 RU2779307C2 RU2020135491A RU2020135491A RU2779307C2 RU 2779307 C2 RU2779307 C2 RU 2779307C2 RU 2020135491 A RU2020135491 A RU 2020135491A RU 2020135491 A RU2020135491 A RU 2020135491A RU 2779307 C2 RU2779307 C2 RU 2779307C2
- Authority
- RU
- Russia
- Prior art keywords
- ser
- gly
- leu
- ala
- val
- Prior art date
Links
- 241000235058 Komagataella pastoris Species 0.000 title claims abstract description 56
- 108010064037 prorennin Proteins 0.000 title claims abstract description 35
- 230000028327 secretion Effects 0.000 title claims abstract description 28
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 26
- 241000283690 Bos taurus Species 0.000 title claims abstract description 25
- 230000002194 synthesizing Effects 0.000 title abstract description 21
- 238000003786 synthesis reaction Methods 0.000 title abstract description 18
- 230000002906 microbiologic Effects 0.000 title description 7
- 230000011664 signaling Effects 0.000 title 1
- 230000014509 gene expression Effects 0.000 claims abstract description 32
- 108060000428 AOX Proteins 0.000 claims abstract description 15
- 102100010989 AOX1 Human genes 0.000 claims abstract description 15
- VBJHPXDIVMXHJU-UHFFFAOYSA-N Zeocin Chemical compound N=1C(C=2SC=C(N=2)C(=O)NCCCCN=C(N)N)CSC=1CCNC(=O)C(C(O)C)NC(=O)C(C)C(O)C(C)NC(=O)C(C(OC1C(C(O)C(O)C(CO)O1)OC1C(C(OC(N)=O)C(O)C(CO)O1)O)C=1[N]C=NC=1)NC(=O)C1=NC(C(CC(N)=O)NCC(N)C(N)=O)=NC(N)=C1C VBJHPXDIVMXHJU-UHFFFAOYSA-N 0.000 claims abstract description 9
- 108010084455 Zeocin Proteins 0.000 claims abstract description 9
- AVKUERGKIZMTKX-NJBDSQKTSA-N Ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 claims abstract description 7
- 229960000723 ampicillin Drugs 0.000 claims abstract description 7
- 230000037348 biosynthesis Effects 0.000 claims abstract description 6
- 230000003115 biocidal Effects 0.000 claims abstract description 5
- 230000035897 transcription Effects 0.000 claims abstract description 4
- 108010025188 alcohol oxidase Proteins 0.000 claims abstract 2
- 230000001580 bacterial Effects 0.000 claims abstract 2
- 102000004169 proteins and genes Human genes 0.000 abstract description 28
- 108090000623 proteins and genes Proteins 0.000 abstract description 28
- 230000000694 effects Effects 0.000 abstract description 6
- 239000000126 substance Substances 0.000 abstract 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 36
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 36
- 108090000746 Chymosin Proteins 0.000 description 33
- 229940080701 Chymosin Drugs 0.000 description 33
- 238000004519 manufacturing process Methods 0.000 description 30
- 229920001405 Coding region Polymers 0.000 description 24
- VYZAGTDAHUIRQA-WHFBIAKZSA-N L-alanyl-L-glutamic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O VYZAGTDAHUIRQA-WHFBIAKZSA-N 0.000 description 23
- 241000880493 Leptailurus serval Species 0.000 description 22
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 22
- 229920003013 deoxyribonucleic acid Polymers 0.000 description 22
- 108010015792 glycyllysine Proteins 0.000 description 22
- 235000018102 proteins Nutrition 0.000 description 22
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 20
- 210000004027 cells Anatomy 0.000 description 20
- CKHWEVXPLJBEOZ-UHFFFAOYSA-N Threoninyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)C(C)O CKHWEVXPLJBEOZ-UHFFFAOYSA-N 0.000 description 19
- 108010061238 threonyl-glycine Proteins 0.000 description 18
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 17
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 17
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 17
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 16
- KGNSGRRALVIRGR-UHFFFAOYSA-N gln-tyr Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 KGNSGRRALVIRGR-UHFFFAOYSA-N 0.000 description 16
- 108010031719 prolyl-serine Proteins 0.000 description 15
- BBIXOODYWPFNDT-CIUDSAMLSA-N Ile-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O BBIXOODYWPFNDT-CIUDSAMLSA-N 0.000 description 14
- AFWBWPCXSWUCLB-WDSKDSINSA-N Pro-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 AFWBWPCXSWUCLB-WDSKDSINSA-N 0.000 description 14
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 14
- OKKJLVBELUTLKV-UHFFFAOYSA-N methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 14
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 13
- BXLYSRPHVMCOPS-UHFFFAOYSA-N Serinyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CO BXLYSRPHVMCOPS-UHFFFAOYSA-N 0.000 description 13
- ZSXJENBJGRHKIG-UHFFFAOYSA-N Tyrosyl-Serine Chemical compound OCC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UHFFFAOYSA-N 0.000 description 13
- 239000000203 mixture Substances 0.000 description 13
- 108010090894 prolylleucine Proteins 0.000 description 13
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 12
- JQDFGZKKXBEANU-UHFFFAOYSA-N Alanyl-Cysteine Chemical compound CC(N)C(=O)NC(CS)C(O)=O JQDFGZKKXBEANU-UHFFFAOYSA-N 0.000 description 12
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 12
- 108020004705 Codon Proteins 0.000 description 12
- 102000004190 Enzymes Human genes 0.000 description 12
- 108090000790 Enzymes Proteins 0.000 description 12
- 241001506991 Komagataella phaffii GS115 Species 0.000 description 12
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 12
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 12
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 12
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 12
- 108010078144 glutaminyl-glycine Proteins 0.000 description 12
- 108010089804 glycyl-threonine Proteins 0.000 description 12
- 108010087823 glycyltyrosine Proteins 0.000 description 12
- 108010037850 glycylvaline Proteins 0.000 description 12
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 12
- 108010051242 phenylalanylserine Proteins 0.000 description 12
- 108010053725 prolylvaline Proteins 0.000 description 12
- 108010071207 serylmethionine Proteins 0.000 description 12
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 11
- UCGDDTHMMVWVMV-FSPLSTOPSA-N Ile-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(O)=O UCGDDTHMMVWVMV-FSPLSTOPSA-N 0.000 description 11
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 11
- UJTZHGHXJKIAOS-WHFBIAKZSA-N Ser-Gln Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O UJTZHGHXJKIAOS-WHFBIAKZSA-N 0.000 description 11
- 108010044940 alanylglutamine Proteins 0.000 description 11
- 108010050848 glycylleucine Proteins 0.000 description 11
- 239000002609 media Substances 0.000 description 11
- 108010020532 tyrosyl-proline Proteins 0.000 description 11
- FAQVCWVVIYYWRR-WHFBIAKZSA-N (2S)-2-[[(2S)-2,5-diamino-5-oxopentanoyl]amino]propanoic acid Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O FAQVCWVVIYYWRR-WHFBIAKZSA-N 0.000 description 10
- 241000282326 Felis catus Species 0.000 description 10
- CNPNWGHRMBQHBZ-ZKWXMUAHSA-N Ile-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O CNPNWGHRMBQHBZ-ZKWXMUAHSA-N 0.000 description 10
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 10
- 108010033725 Recombinant Proteins Proteins 0.000 description 10
- 102000007312 Recombinant Proteins Human genes 0.000 description 10
- 108010013835 arginine glutamate Proteins 0.000 description 10
- 108010049041 glutamylalanine Proteins 0.000 description 10
- OZAIFHULBGXAKX-UHFFFAOYSA-N precursor Substances N#CC(C)(C)N=NC(C)(C)C#N OZAIFHULBGXAKX-UHFFFAOYSA-N 0.000 description 10
- 108010003137 tyrosyltyrosine Proteins 0.000 description 10
- VNYDHJARLHNEGA-RYUDHWBXSA-N (2S)-1-[(2S)-2-azaniumyl-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carboxylate Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 9
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 9
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 9
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 9
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 9
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 9
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 9
- LWFWZRANSFAJDR-JSGCOSHPSA-N Trp-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 LWFWZRANSFAJDR-JSGCOSHPSA-N 0.000 description 9
- MFEVVAXTBZELLL-UHFFFAOYSA-N Tyrosyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-UHFFFAOYSA-N 0.000 description 9
- GVRKWABULJAONN-UHFFFAOYSA-N Valyl-Threonine Chemical compound CC(C)C(N)C(=O)NC(C(C)O)C(O)=O GVRKWABULJAONN-UHFFFAOYSA-N 0.000 description 9
- 108010062796 arginyllysine Proteins 0.000 description 9
- CPMKYMGGYUFOHS-FSPLSTOPSA-N Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O CPMKYMGGYUFOHS-FSPLSTOPSA-N 0.000 description 8
- NTQDELBZOMWXRS-UHFFFAOYSA-N Aspartyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(O)=O NTQDELBZOMWXRS-UHFFFAOYSA-N 0.000 description 8
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 8
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 8
- 108010093581 aspartyl-proline Proteins 0.000 description 8
- 238000010276 construction Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 8
- DXJZITDUDUPINW-UHFFFAOYSA-N γ-glutamyl-Asparagine Chemical compound NC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O DXJZITDUDUPINW-UHFFFAOYSA-N 0.000 description 8
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 7
- HXWUJJADFMXNKA-UHFFFAOYSA-N Asparaginyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(N)=O HXWUJJADFMXNKA-UHFFFAOYSA-N 0.000 description 7
- JAQGKXUEKGKTKX-HOTGVXAUSA-N L-tyrosyl-L-tyrosine Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 JAQGKXUEKGKTKX-HOTGVXAUSA-N 0.000 description 7
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 7
- STKYPAFSDFAEPH-LURJTMIESA-N gly-val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-phenylpropanoyl]amino]butanedioic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 6
- KYPMKDGKAYQCHO-RYUDHWBXSA-N (2S)-2-[[(2S)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]-4-methylsulfanylbutanoic acid Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KYPMKDGKAYQCHO-RYUDHWBXSA-N 0.000 description 6
- QXRNAOYBCYVZCD-BQBZGAKWSA-N (2S)-6-amino-2-[[(2S)-2-aminopropanoyl]amino]hexanoic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN QXRNAOYBCYVZCD-BQBZGAKWSA-N 0.000 description 6
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 6
- RDIKFPRVLJLMER-BQBZGAKWSA-N Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)N RDIKFPRVLJLMER-BQBZGAKWSA-N 0.000 description 6
- PQBHGSGQZSOLIR-RYUDHWBXSA-N Arg-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PQBHGSGQZSOLIR-RYUDHWBXSA-N 0.000 description 6
- JSLGXODUIAFWCF-UHFFFAOYSA-N Arginyl-Asparagine Chemical compound NC(N)=NCCCC(N)C(=O)NC(CC(N)=O)C(O)=O JSLGXODUIAFWCF-UHFFFAOYSA-N 0.000 description 6
- GSMPSRPMQQDRIB-WHFBIAKZSA-N Asp-Gln Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O GSMPSRPMQQDRIB-WHFBIAKZSA-N 0.000 description 6
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 6
- VGRHZPNRCLAHQA-UHFFFAOYSA-N Aspartyl-Asparagine Chemical compound OC(=O)CC(N)C(=O)NC(CC(N)=O)C(O)=O VGRHZPNRCLAHQA-UHFFFAOYSA-N 0.000 description 6
- UKGGPJNBONZZCM-WDSKDSINSA-N Aspartyl-L-proline Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 6
- ZVDPYSVOZFINEE-UHFFFAOYSA-N Aspartyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(O)=O ZVDPYSVOZFINEE-UHFFFAOYSA-N 0.000 description 6
- WXOFKRKAHJQKLT-UHFFFAOYSA-N Cysteinyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CS WXOFKRKAHJQKLT-UHFFFAOYSA-N 0.000 description 6
- 229940110715 ENZYMES FOR TREATMENT OF WOUNDS AND ULCERS Drugs 0.000 description 6
- 229940088598 Enzyme Drugs 0.000 description 6
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 6
- HHSJMSCOLJVTCX-UHFFFAOYSA-N Glutaminyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCC(N)=O HHSJMSCOLJVTCX-UHFFFAOYSA-N 0.000 description 6
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 6
- PNMUAGGSDZXTHX-BYPYZUCNSA-N Gly-Gln Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(N)=O PNMUAGGSDZXTHX-BYPYZUCNSA-N 0.000 description 6
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 6
- CTCFZNBRZBNKAX-UHFFFAOYSA-N Histidinyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 CTCFZNBRZBNKAX-UHFFFAOYSA-N 0.000 description 6
- RCFDOSNHHZGBOY-ACZMJKKPSA-N Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(O)=O RCFDOSNHHZGBOY-ACZMJKKPSA-N 0.000 description 6
- HZYHBDVRCBDJJV-HAFWLYHUSA-N Ile-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O HZYHBDVRCBDJJV-HAFWLYHUSA-N 0.000 description 6
- TWVKGYNQQAUNRN-ACZMJKKPSA-N Ile-Ser Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O TWVKGYNQQAUNRN-ACZMJKKPSA-N 0.000 description 6
- DRCKHKZYDLJYFQ-UHFFFAOYSA-N Isoleucyl-Threonine Chemical compound CCC(C)C(N)C(=O)NC(C(C)O)C(O)=O DRCKHKZYDLJYFQ-UHFFFAOYSA-N 0.000 description 6
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 6
- JYOAXOMPIXKMKK-UHFFFAOYSA-N Leucyl-Glutamine Chemical compound CC(C)CC(N)C(=O)NC(C(O)=O)CCC(N)=O JYOAXOMPIXKMKK-UHFFFAOYSA-N 0.000 description 6
- OAPNERBWQWUPTI-YUMQZZPRSA-N Lys-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O OAPNERBWQWUPTI-YUMQZZPRSA-N 0.000 description 6
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 6
- JPNRPAJITHRXRH-UHFFFAOYSA-N Lysyl-Asparagine Chemical compound NCCCCC(N)C(=O)NC(C(O)=O)CC(N)=O JPNRPAJITHRXRH-UHFFFAOYSA-N 0.000 description 6
- 108020004999 Messenger RNA Proteins 0.000 description 6
- 108010079364 N-glycylalanine Proteins 0.000 description 6
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 6
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 6
- KLAONOISLHWJEE-UHFFFAOYSA-N Phenylalanyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 KLAONOISLHWJEE-UHFFFAOYSA-N 0.000 description 6
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 6
- 229940081969 Saccharomyces cerevisiae Drugs 0.000 description 6
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfizole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 6
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 6
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 6
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 6
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 6
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 6
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 6
- OBTCMSPFOITUIJ-FSPLSTOPSA-N Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O OBTCMSPFOITUIJ-FSPLSTOPSA-N 0.000 description 6
- 108010087049 alanyl-alanyl-prolyl-valine Proteins 0.000 description 6
- 150000001413 amino acids Chemical group 0.000 description 6
- 108010038633 aspartylglutamate Proteins 0.000 description 6
- 108010047857 aspartylglycine Proteins 0.000 description 6
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 6
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 6
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 6
- 108010010147 glycylglutamine Proteins 0.000 description 6
- 108010081551 glycylphenylalanine Proteins 0.000 description 6
- 108010077515 glycylproline Proteins 0.000 description 6
- 108010025306 histidylleucine Proteins 0.000 description 6
- 108010018006 histidylserine Proteins 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 108010009298 lysylglutamic acid Proteins 0.000 description 6
- 229920002106 messenger RNA Polymers 0.000 description 6
- 108010085203 methionylmethionine Proteins 0.000 description 6
- 108010012581 phenylalanylglutamate Proteins 0.000 description 6
- 108010077112 prolyl-proline Proteins 0.000 description 6
- 108010029020 prolylglycine Proteins 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 108010051110 tyrosyl-lysine Proteins 0.000 description 6
- IOUPEELXVYPCPG-UHFFFAOYSA-N val-gly Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 6
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N (2S)-2-[[(2S)-2-[[(2S)-2-aminopropanoyl]amino]propanoyl]amino]-3-hydroxypropanoic acid Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 5
- AAKRWBIIGKPOKQ-ONGXEEELSA-N 2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 5
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 5
- MQLZLIYPFDIDMZ-UHFFFAOYSA-N Asparaginyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(N)=O MQLZLIYPFDIDMZ-UHFFFAOYSA-N 0.000 description 5
- LOJYQMFIIJVETK-WDSKDSINSA-N Gln-Gln Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LOJYQMFIIJVETK-WDSKDSINSA-N 0.000 description 5
- OWOFCNWTMWOOJJ-WDSKDSINSA-N Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OWOFCNWTMWOOJJ-WDSKDSINSA-N 0.000 description 5
- MUFXDFWAJSPHIQ-XDTLVQLUSA-N Ile-Tyr Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 MUFXDFWAJSPHIQ-XDTLVQLUSA-N 0.000 description 5
- WKXVAXOSIPTXEC-UHFFFAOYSA-N Isoleucyl-Aspartate Chemical compound CCC(C)C(N)C(=O)NC(C(O)=O)CC(O)=O WKXVAXOSIPTXEC-UHFFFAOYSA-N 0.000 description 5
- KFKWRHQBZQICHA-STQMWFEESA-N Leu-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 5
- UASDAHIAHBRZQV-YUMQZZPRSA-N Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N UASDAHIAHBRZQV-YUMQZZPRSA-N 0.000 description 5
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 5
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 5
- GJNDXQBALKCYSZ-RYUDHWBXSA-N Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 GJNDXQBALKCYSZ-RYUDHWBXSA-N 0.000 description 5
- 239000005018 casein Substances 0.000 description 5
- 235000021240 caseins Nutrition 0.000 description 5
- 235000013365 dairy product Nutrition 0.000 description 5
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 5
- RZVAJINKPMORJF-UHFFFAOYSA-N p-acetaminophenol Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 5
- 230000003248 secreting Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 239000007222 ypd medium Substances 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N 4-amino-5-[(1-carboxy-2-phenylethyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 4
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 4
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 4
- BSWHERGFUNMWGS-UHFFFAOYSA-N Aspartyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 4
- JWBXCSQZLLIOCI-GUBZILKMSA-N Ile-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C JWBXCSQZLLIOCI-GUBZILKMSA-N 0.000 description 4
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 4
- FMIIKPHLJKUXGE-GUBZILKMSA-N Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN FMIIKPHLJKUXGE-GUBZILKMSA-N 0.000 description 4
- 210000004080 Milk Anatomy 0.000 description 4
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 4
- 229920001850 Nucleic acid sequence Polymers 0.000 description 4
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 4
- SHAQGFGGJSLLHE-BQBZGAKWSA-N Pro-Gln Chemical compound NC(=O)CC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 SHAQGFGGJSLLHE-BQBZGAKWSA-N 0.000 description 4
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 4
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 4
- BWUHENPAEMNGQJ-ZDLURKLDSA-N Thr-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O BWUHENPAEMNGQJ-ZDLURKLDSA-N 0.000 description 4
- UQTNIFUCMBFWEJ-UHFFFAOYSA-N Threoninyl-Asparagine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-UHFFFAOYSA-N 0.000 description 4
- LUMXICQAOKVQOB-UHFFFAOYSA-N Threoninyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)C(C)O LUMXICQAOKVQOB-UHFFFAOYSA-N 0.000 description 4
- QZOSVNLXLSNHQK-UHFFFAOYSA-N Tyrosyl-Aspartate Chemical compound OC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UHFFFAOYSA-N 0.000 description 4
- STTYIMSDIYISRG-WDSKDSINSA-N Val-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(O)=O STTYIMSDIYISRG-WDSKDSINSA-N 0.000 description 4
- 230000004913 activation Effects 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 235000013351 cheese Nutrition 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 108010054813 diprotin B Proteins 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 235000013336 milk Nutrition 0.000 description 4
- 239000008267 milk Substances 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- PVMPDMIKUVNOBD-CIUDSAMLSA-N (3S)-3-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-[[(1S)-1-carboxy-2-hydroxyethyl]amino]-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 3
- TUTIHHSZKFBMHM-UHFFFAOYSA-N 4-amino-5-[(3-amino-1-carboxy-3-oxopropyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O TUTIHHSZKFBMHM-UHFFFAOYSA-N 0.000 description 3
- 229920001817 Agar Polymers 0.000 description 3
- BNODVYXZAAXSHW-UHFFFAOYSA-N Arginyl-Histidine Chemical compound NC(=N)NCCCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 BNODVYXZAAXSHW-UHFFFAOYSA-N 0.000 description 3
- FFMIYIMKQIMDPK-BQBZGAKWSA-N Asn-His Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 FFMIYIMKQIMDPK-BQBZGAKWSA-N 0.000 description 3
- NPDLYUOYAGBHFB-UHFFFAOYSA-N Asparaginyl-Arginine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N NPDLYUOYAGBHFB-UHFFFAOYSA-N 0.000 description 3
- IQTUDDBANZYMAR-UHFFFAOYSA-N Asparaginyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CC(N)=O IQTUDDBANZYMAR-UHFFFAOYSA-N 0.000 description 3
- FKBFDTRILNZGAI-UHFFFAOYSA-N Aspartyl-Cysteine Chemical compound OC(=O)CC(N)C(=O)NC(CS)C(O)=O FKBFDTRILNZGAI-UHFFFAOYSA-N 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 3
- 241001416153 Bos grunniens Species 0.000 description 3
- 229940041514 Candida albicans extract Drugs 0.000 description 3
- WYVKPHCYMTWUCW-UHFFFAOYSA-N Cysteinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CS WYVKPHCYMTWUCW-UHFFFAOYSA-N 0.000 description 3
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N D-Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 3
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 3
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 3
- CLSDNFWKGFJIBZ-UHFFFAOYSA-N Glutaminyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CCC(N)=O CLSDNFWKGFJIBZ-UHFFFAOYSA-N 0.000 description 3
- VHLZDSUANXBJHW-UHFFFAOYSA-N Glutaminyl-Phenylalanine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 VHLZDSUANXBJHW-UHFFFAOYSA-N 0.000 description 3
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 3
- PFMUCCYYAAFKTH-YFKPBYRVSA-N Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CN PFMUCCYYAAFKTH-YFKPBYRVSA-N 0.000 description 3
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 3
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 3
- KRBMQYPTDYSENE-BQBZGAKWSA-N His-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 KRBMQYPTDYSENE-BQBZGAKWSA-N 0.000 description 3
- FBTYOQIYBULKEH-ZFWWWQNUSA-N His-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CNC=N1 FBTYOQIYBULKEH-ZFWWWQNUSA-N 0.000 description 3
- HTOOKGDPMXSJSY-STQMWFEESA-N His-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 HTOOKGDPMXSJSY-STQMWFEESA-N 0.000 description 3
- QNBYCZTZNOVDMI-HGNGGELXSA-N Ile-His Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QNBYCZTZNOVDMI-HGNGGELXSA-N 0.000 description 3
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 3
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 3
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 3
- YSZNURNVYFUEHC-BQBZGAKWSA-N Lys-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YSZNURNVYFUEHC-BQBZGAKWSA-N 0.000 description 3
- MYTOTTSMVMWVJN-STQMWFEESA-N Lys-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MYTOTTSMVMWVJN-STQMWFEESA-N 0.000 description 3
- JHKXZYLNVJRAAJ-WDSKDSINSA-N Met-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(O)=O JHKXZYLNVJRAAJ-WDSKDSINSA-N 0.000 description 3
- QTZXSYBVOSXBEJ-WDSKDSINSA-N Met-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O QTZXSYBVOSXBEJ-WDSKDSINSA-N 0.000 description 3
- MUMXFARPYQTTSL-BQBZGAKWSA-N Met-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O MUMXFARPYQTTSL-BQBZGAKWSA-N 0.000 description 3
- ZYTPOUNUXRBYGW-YUMQZZPRSA-N Met-Met Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCSC ZYTPOUNUXRBYGW-YUMQZZPRSA-N 0.000 description 3
- DZMGFGQBRYWJOR-YUMQZZPRSA-N Met-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O DZMGFGQBRYWJOR-YUMQZZPRSA-N 0.000 description 3
- PESQCPHRXOFIPX-RYUDHWBXSA-N Met-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-RYUDHWBXSA-N 0.000 description 3
- JMEWFDUAFKVAAT-UHFFFAOYSA-N Methionyl-Asparagine Chemical compound CSCCC(N)C(=O)NC(C(O)=O)CC(N)=O JMEWFDUAFKVAAT-UHFFFAOYSA-N 0.000 description 3
- 239000001888 Peptone Substances 0.000 description 3
- 108010080698 Peptones Proteins 0.000 description 3
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 3
- GVUVRRPYYDHHGK-UHFFFAOYSA-N Prolyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C1CCCN1 GVUVRRPYYDHHGK-UHFFFAOYSA-N 0.000 description 3
- PBUXMVYWOSKHMF-WDSKDSINSA-N Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO PBUXMVYWOSKHMF-WDSKDSINSA-N 0.000 description 3
- LDEBVRIURYMKQS-UHFFFAOYSA-N Serinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CO LDEBVRIURYMKQS-UHFFFAOYSA-N 0.000 description 3
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 3
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 3
- NZCPCJCJZHKFGZ-UHFFFAOYSA-N Tryptophyl-Glutamine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CCC(N)=O)C(O)=O)=CNC2=C1 NZCPCJCJZHKFGZ-UHFFFAOYSA-N 0.000 description 3
- BMPPMAOOKQJYIP-WMZOPIPTSA-N Tyr-Trp Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C([O-])=O)C1=CC=C(O)C=C1 BMPPMAOOKQJYIP-WMZOPIPTSA-N 0.000 description 3
- XXDVDTMEVBYRPK-XPUUQOCRSA-N Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O XXDVDTMEVBYRPK-XPUUQOCRSA-N 0.000 description 3
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 230000015271 coagulation Effects 0.000 description 3
- 230000000295 complement Effects 0.000 description 3
- 230000002068 genetic Effects 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 108010036413 histidylglycine Proteins 0.000 description 3
- 239000002054 inoculum Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 235000019319 peptone Nutrition 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 108091007521 restriction endonucleases Proteins 0.000 description 3
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 239000000600 sorbitol Substances 0.000 description 3
- 230000001131 transforming Effects 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- SITLTJHOQZFJGG-XPUUQOCRSA-N α-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 3
- UKKNTTCNGZLJEX-UHFFFAOYSA-N γ-glutamyl-Serine Chemical compound NC(=O)CCC(N)C(=O)NC(CO)C(O)=O UKKNTTCNGZLJEX-UHFFFAOYSA-N 0.000 description 3
- SJPMNHCEWPTRBR-BQBZGAKWSA-N (4S)-4-amino-5-[[(2S)-4-carboxy-1-(carboxymethylamino)-1-oxobutan-2-yl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 2
- 240000005093 Ammi visnaga Species 0.000 description 2
- 235000010585 Ammi visnaga Nutrition 0.000 description 2
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 2
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 2
- VBKIFHUVGLOJKT-UHFFFAOYSA-N Asparaginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(N)=O VBKIFHUVGLOJKT-UHFFFAOYSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 102100002888 CSN3 Human genes 0.000 description 2
- 108060001966 CSN3 Proteins 0.000 description 2
- 241000282836 Camelus dromedarius Species 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 108010059378 Endopeptidases Proteins 0.000 description 2
- 102000005593 Endopeptidases Human genes 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical group OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 2
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 2
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 2
- 102000003886 Glycoproteins Human genes 0.000 description 2
- 108090000288 Glycoproteins Proteins 0.000 description 2
- 229940040461 Lipase Drugs 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- 241001661345 Moesziomyces antarcticus Species 0.000 description 2
- 108090000284 Pepsin A Proteins 0.000 description 2
- 102000035443 Peptidases Human genes 0.000 description 2
- 108091005771 Peptidases Proteins 0.000 description 2
- JWBLQDDHSDGEGR-DRZSPHRISA-N Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWBLQDDHSDGEGR-DRZSPHRISA-N 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- SBMNPABNWKXNBJ-UHFFFAOYSA-N Serinyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CO SBMNPABNWKXNBJ-UHFFFAOYSA-N 0.000 description 2
- 210000002784 Stomach Anatomy 0.000 description 2
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 2
- 241001480015 Trigonopsis variabilis Species 0.000 description 2
- AUEJLPRZGVVDNU-STQMWFEESA-N Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-STQMWFEESA-N 0.000 description 2
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 2
- VEYJKJORLPYVLO-RYUDHWBXSA-N Val-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VEYJKJORLPYVLO-RYUDHWBXSA-N 0.000 description 2
- SRBFZHDQGSBBOR-SQOUGZDYSA-N Xylose Natural products O[C@@H]1CO[C@@H](O)[C@@H](O)[C@@H]1O SRBFZHDQGSBBOR-SQOUGZDYSA-N 0.000 description 2
- 230000002378 acidificating Effects 0.000 description 2
- 238000005273 aeration Methods 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000005345 coagulation Methods 0.000 description 2
- 239000008367 deionised water Substances 0.000 description 2
- 230000001687 destabilization Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic Effects 0.000 description 2
- 238000005755 formation reaction Methods 0.000 description 2
- 239000001963 growth media Substances 0.000 description 2
- 101700002672 his-22 Proteins 0.000 description 2
- 108090001060 lipase Proteins 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 102000004882 lipase Human genes 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 108010044655 lysylproline Proteins 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000000693 micelle Substances 0.000 description 2
- 230000000813 microbial Effects 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 230000000877 morphologic Effects 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 229940111202 pepsin Drugs 0.000 description 2
- 239000003016 pheromone Substances 0.000 description 2
- 230000001402 polyadenylating Effects 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 229940108461 rennet Drugs 0.000 description 2
- 108010058314 rennet Proteins 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- 235000021246 κ-casein Nutrition 0.000 description 2
- VHJLVAABSRFDPM-UHFFFAOYSA-N 1,4-dimercaptobutane-2,3-diol Chemical compound SCC(O)C(O)CS VHJLVAABSRFDPM-UHFFFAOYSA-N 0.000 description 1
- -1 2% bactoagar Chemical compound 0.000 description 1
- DVARTQFDIMZBAA-UHFFFAOYSA-O Ammonium nitrate Chemical compound [NH4+].[O-][N+]([O-])=O DVARTQFDIMZBAA-UHFFFAOYSA-O 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- QCWJKJLNCFEVPQ-WHFBIAKZSA-N Asn-Gln Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O QCWJKJLNCFEVPQ-WHFBIAKZSA-N 0.000 description 1
- 108091005540 Aspartic proteases Proteins 0.000 description 1
- 102000035336 Aspartic proteases Human genes 0.000 description 1
- 206010009802 Coagulopathy Diseases 0.000 description 1
- 240000008966 Cynara cardunculus Species 0.000 description 1
- GZCGUPFRVQAUEE-KCDKBNATSA-N D-(+)-Galactose Natural products OC[C@@H](O)[C@H](O)[C@H](O)[C@@H](O)C=O GZCGUPFRVQAUEE-KCDKBNATSA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- 101700011961 DPOM Proteins 0.000 description 1
- 102000004674 EC 1.4.3.3 Human genes 0.000 description 1
- 108010003989 EC 1.4.3.3 Proteins 0.000 description 1
- 101710038747 EEF1A1 Proteins 0.000 description 1
- 210000002472 Endoplasmic Reticulum Anatomy 0.000 description 1
- 230000036826 Excretion Effects 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 210000001156 Gastric Mucosa Anatomy 0.000 description 1
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-N HCl Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N HEPES Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 241001099157 Komagataella Species 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 1
- RVKIPWVMZANZLI-ZFWWWQNUSA-N Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-ZFWWWQNUSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101710029649 MDV043 Proteins 0.000 description 1
- 108060004812 MFAP Proteins 0.000 description 1
- 210000004379 Membranes Anatomy 0.000 description 1
- 210000004400 Mucous Membrane Anatomy 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 241000320412 Ogataea angusta Species 0.000 description 1
- 229940049964 Oleate Drugs 0.000 description 1
- 108020005203 Oxidases Proteins 0.000 description 1
- 101700061424 POLB Proteins 0.000 description 1
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 1
- 229940024999 Proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- 102100000775 REN Human genes 0.000 description 1
- 101700054624 RF1 Proteins 0.000 description 1
- 108090000783 Renin Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- PNNNRSAQSRJVSB-BXKVDMCESA-N Rhamnose Chemical compound C[C@H](O)[C@H](O)[C@@H](O)[C@@H](O)C=O PNNNRSAQSRJVSB-BXKVDMCESA-N 0.000 description 1
- 239000000877 Sex Attractant Substances 0.000 description 1
- 102100009912 TEAD1 Human genes 0.000 description 1
- 101700066199 TEAD1 Proteins 0.000 description 1
- 101710005270 TEF1 Proteins 0.000 description 1
- 229960003487 Xylose Drugs 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000010306 acid treatment Methods 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 239000001166 ammonium sulphate Substances 0.000 description 1
- 150000001479 arabinose derivatives Chemical class 0.000 description 1
- 235000016520 artichoke thistle Nutrition 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- UIIMBOGNXHQVGW-UHFFFAOYSA-M buffer Substances [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002759 chromosomal Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000035602 clotting Effects 0.000 description 1
- 239000000701 coagulant Substances 0.000 description 1
- 230000001112 coagulant Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000000875 corresponding Effects 0.000 description 1
- 238000010192 crystallographic characterization Methods 0.000 description 1
- 239000012531 culture fluid Substances 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000002708 enhancing Effects 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002496 gastric Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- VPZXBVLAVMBEQI-VKHMYHEASA-N gly ala Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 1
- KZNQNBZMBZJQJO-YFKPBYRVSA-N gly pro Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 1
- 230000003899 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- XKUUMWKWUZRRPD-UHFFFAOYSA-N heptan-2-amine;sulfuric acid Chemical compound [O-]S([O-])(=O)=O.CCCCCC(C)[NH3+].CCCCCC(C)[NH3+] XKUUMWKWUZRRPD-UHFFFAOYSA-N 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 229910000041 hydrogen chloride Inorganic materials 0.000 description 1
- 230000003301 hydrolyzing Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 238000011031 large scale production Methods 0.000 description 1
- 230000004301 light adaptation Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000009629 microbiological culture Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- ZQPPMHVWECSIRJ-KTKRTIGZSA-M oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC([O-])=O ZQPPMHVWECSIRJ-KTKRTIGZSA-M 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 230000003287 optical Effects 0.000 description 1
- 230000001936 parietal Effects 0.000 description 1
- 235000011837 pasties Nutrition 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 230000000858 peroxisomal Effects 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000002797 proteolythic Effects 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000001105 regulatory Effects 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N α-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N β-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- XITLYYAIPBBHPX-UHFFFAOYSA-N γ-glutamyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CCC(N)=O XITLYYAIPBBHPX-UHFFFAOYSA-N 0.000 description 1
Images
Abstract
Изобретение относится к биотехнологии, а именно к рекомбинантной плазмиде, обеспечивающей биосинтез и секрецию прохимозина. Предложена рекомбинантная плазмида pSF002, обеспечивающая биосинтез и секрецию прохимозина с SEQ ID NO: 1, имеющая размер 6106 п.о. и состоящая из следующих элементов: а) AOX1 promoter - 5'-концевая область промотора алкоголь оксидазы; б) Alpha factor signal peptide - участок, кодирующий N-концевой сигнальный пептид ppMFα1D с SEQ ID NO: 12; в) последовательность гена прохимозина быка, оптимизированная для экспрессии в Pichia pastoris; г) tTEF1 transcription terminator - терминатор транскрипции; д) pUC origin - бактериальная точка начала репликации pUC; е) Amp(R) - ген Amp, обеспечивающий устойчивость к ампициллину; ж) Zeo(R) - ген BleoR устойчивости к селективному антибиотику зеоцину. Изобретение обеспечивает эффективный синтез целевого белка. 6 ил., 6 пр.
Description
Изобретение относится к области биотехнологии, а именно к генетической инженерии, и касается получения генететической конструкции для экспрессии в дрожжах Pichia pastoris - продуцента прохимозина быка, путем введения в геном штамма-реципиент синтетического гена, кодирующего вариант препрохимозина с модифицированной сигнальной последовательностью секреции в составе рекомбинантной плазмидной ДНК и разработки способа микробиологического синтеза прохимозина. Изобретение предназначено для использования в пищевой промышленности для получения молокосвертывающих ферментов.
Ферментативная коагуляция молока под действием молокосвертывающих ферментов, таких как химозин и пепсин, представляет собой один из наиболее важных процессов при приготовлении сыров. В ходе данного 2-х ступенчатого процесса химозин или пепсин атакуют κ-казеин, что приводит к дестабилизации казеиновых мицелл, которые затем агрегируют с образованием творожистого сгустка.
Химозин (сычужный фермент, ренин, EC3.4.23.4) - аспарагиновая протеаза, которая вырабатывается в слизистой оболочке четвертого отдела желудка молочных телят [1] обладает высокой молокосвертывающей активностью при низкой протеолитической активности, что обуславливает его широкое использование в молочной промышленности для производства сыра [2].
Вновь синтезируемый в клетках слизистой желудка химозин находится в виде ферментативно неактивного пре-прохимозина. В процессе экскреции N-концевой сигнальный пептид отщепляется с образованием прохимозина, содержащего про-фрагмент. Прохимозин находится, по-существу, в неактивной форме фермента, который, однако, становится активным при кислотных условиях, превращаясь в активный химозин посредством аутокаталитического удаления про-фрагмента. Эта активация осуществляется in vivo в полости желудка при соответствующих условиях pH или in vitro при кислотных условиях [1] [3].
Структурные и функциональные характеристики пре-прохимозина, прохимозина и химозина подробно исследованы. Пре-часть молекулы бычьего пре-прохимозина содержит 16 аминокислотных остатков, про-часть содержит 42 аминокислотных остатка. Активный бычий химозин содержит 323 аминокислотных остатка и представляет собой смесь двух форм, A и B, обе являются активными [3].
Фермент содержит два каталитически активных остатка аспарагиновой кислоты Asp32 и Asp215, которые катализируют селективное разрушение пептидной связи между остатками Phe105 и Met106 в составе каппа-казеина. Это сайт-специфическое расщепление приводит к дестабилизации мицелл казеина и индуцирует свертывание молока [4].
Получение рекомбинантного химозина быка с использованием микробных систем экспрессии, таких как мицелиальные грибы и дрожжи дает многочисленные преимущества по сравнению с экстракцией нативного химозина из желудка молочных телят, в частности благодаря возможности наработки гомогенного продукта в стандартизованном биопроцессе [2,5-7].
Одной из наиболее привлекательных систем гетерологичной экспрессии для продукции химозина быка и многих других практически-важных белков являются метилотрофные дрожжи P. pastoris и Hansenula polymorpha. В последние десятилетия эти микроорганизмы стали, несомненно, самой популярной и широко используемой среди низших эукариот «клеточной биофабрикой» для экспрессии рекомбинантных белков для фундаментальных и прикладных исследований. Согласно веб-платформе www.pichia.com, в этих эукариотических микроорганизмах было получено более 5000 различных рекомбинантных белков [8] с рекордными уровнями продукции (выход продукта - до 35 г с литра, в некоторых случаях). Популярность этих дрожжей обусловлена такими факторами, как доступность простых и надежных процедур высокоплотного культивирования, наличие строго регулируемых и необычайно сильных промоторов, развитой способностью этих дрожжей к секреции чужеродных белков и к осуществлению ряда характерных для эукариот пост-трансляционных модификаций, простотой генетических манипуляций, способностью к утилизации дешевых углеродных субстратов, развитой пероксисомальной системой ( [9,10]. Если ранние разработки в основном были посвящены получению технических ферментов [11], то последующее присвоение статуса GRAS положило начало широкому использованию этих дрожжей как «платформы» для получения белков медицинского назначения и ферментов для пищевой промышленности [12]. Также P. pastoris - наиболее удачный хоязин для получения целого ряда «трудных» для экспрессии белков, таких, например, как различные мембранные белки, гликопротеины [13,14]. Поэтому, в настоящее время P. pastoris принято считать «золотым стандартом» для получения на регулярной основе рекомбинантных белков для лабораторных либо промышленных целей [15].
Химозины самых различных видов млекопитающих, в том числе буйвола [16], верблюда [17], яка [18], козы [19], были успешно экспрессированы в клетках P. pastoris.
Тем не менее, из уровня техники следует, что уровень продукции рекомбинантных химозинов в P. pastoris относительно невелик по сравнению с использованными для его коммерческой продукции рекомбинантными штаммами Aspergillus [20] , и требует оптимизации.
Известно, что различия в частотах использования кодонов между кодирующими последовательностями природного гетерологичного гена и клеткой-хозяином могут снижать скорость трансляции, негативно влияя на уровни экспрессии целевых белков [21]. Также эти различия могут приводить к ошибкам в процессах посттрансляционной модификации белков, снижая стабильность белков. Оптимизацию кодонового состава проводят путем «ретрансляции» кодируюшей последовательности исходного природного гена, заменяя редкие для клетки хозяина на те, которые встречаются с высокой частотой. Таком образом проектируют ген, кодирующий белок с идентичной аминокислотной последовательностью, нуклеотидная последовательность которого лучше соответствует клетке хозяину [22]. При создании штаммов P. pastoris - продуцентов химозина, оптимизация кодонового состава позволяет в 10 раз повысить уровень продукции этого белка в клетках дрожжей, поскольку природный ген химозина быка значительно отличается по кодоновому составу от высоко-экспрессируемых генов P. pastoris [23].
Возможность эффективного получения целевого белка в секретируемом виде наряду с низким уровнем эндогенного белкового экспорта является важным технологическим преимуществом P. pastoris [24]. Наряду с природными сигнальными последовательностями секреции, ряд гетерологичных сигнальных пептидов успешно используют для секреторной экспрессии в P. pastoris [25,26]. Однако наиболее часто для этих целей используют ppMFα1 - пре-просегмент полового феромона дрожжей альфа-фактора [27]. Лидерная последовательность ppMFα1 состоит из 19-аминокислотной пре-последовательности за которой следует 67-аминокислотный просегмент с тремя сайтами гликозилирования и LysArg сайтом процессинга для Kex2 эндопептидазы [28]. Процессинг секреторной сигнальной последовательности происходит в 3 этапа: сначала пре-последовательность удаляется сигнальными пептидазами в эндоплазматическом ретикулуме, затем Kex2 эндопептидаза разрезает участок просегмента между аминокислотными остатками лизина и аргинина, а затем пептидаза Ste13 быстро удаляет остатки Glu-Ala в цистернах Гольджи [29]. Такой «двучастный» сигнальный пептид оказался достаточно эффекктивным для секреции множества чужеродных белков, однако уровень секреции варьирует достаточно значительно [30], что стимулирует попытки для увеличения эффективности секреции [10,26,31].
Одна из стратегий усиления эффективности секреции состоит в модификации сигнального пептида. Из уровня техники известно, что модифицированный ppMFα1 с делецией 3-го альфа-спирального сегмента более эффективно направляет секрецию рекомбинантных липазы Candida Antarctica и пероксидазы хрена в клетках P. pastoris [32]. Также известно, что оптимизация кодонового состава ppMFα1 с учетом наиболее часто встречающихся кодонов для P. pastoris позволяет в несколько раз повысить эффективность секреции липазы Candida Antarctica [33] .
Конструирование векторов для экспрессии гена прохимозина быка с таким вариантом сигнального пептида ранее не проводилось, также из уровня техники неизвестно, позволяет ли использование такой комбинации повысить эффективность экспрессии и секреции рекомбинантного химозина по сравнению с использованием «нативной» сигнальной последовательности.
Известен способ получения рекомбинантного proCYM с использованием рекомбинатного штамма P. pastoris, модифицированного плазмидой ppic9K::PROCHY, содержащей нативный ген прохимозина быка под контролем промотора AOX1 и сигнального пептида ppMFα1 [34]. При выращивании в колбах, наилучший из отобранных клонов обеспечивал продукцию прохимозина на уровне 4,8 Ед./мл за 120 часов культивирования при выходе биомассы 18 г сухих дрожжей с литра.
Известен также способ микробиологического синтеза прохимозина c использованием рекомбинантных штаммов P. pastoris, содержащих синтетический ген proCYM под контролем вектора pPICZα [35] с высоким выходом. Однако в данном источнике отсутствует информация о структуре синтетического гена proCYM, поэтому данный способ не подлежит сравнению с заявляемым методом.
Задача заявляемой группы изобретений - расширение арсенала способов микробиологического синтеза proCYM.
Данная цель в настоящем изобретении достигнута за счет оптимизации процессов транскрипции целевого гена CYM, трансляции синтезируемой мРНК CYM и секреции предшественника proCYM.
Для этого:
a) получен синтетический ген, кодирующий пробелок химозина быка. Кодоновый состав гена соответствует часто используемым кодонам клеток P. pastoris;
б) сконструирован ген варианта предшественника химозина белка с модифицированной сигнальной последовательностью ppMFα1;
в) сконструирована рекомбинантная ДНК, содержащая ген прохимозина в составе вектора экспрессии для P. pastoris и обеспечивающая высокий уровень метанол-индуцируемого синтеза и секреции прохимозина в клетках этих дрожжей;
г) в результате трансформации экспрессирующей плазмидой клеток штамма P. pastoris GS115 получен рекомбинантный штамм этих дрожжей, характеризующийся высоким уровнем индуцируемого синтеза и стабильной продукций proCYM. При культивировании заявляемым способом данный штамм позволяет получать целевой фермент с выходом более чем в 3 раза превышающим продукцию фермента, полученного с использованием способа - ближайшего аналога.
Процесс конструирования заявляемого штамма состоит из следующих этапов:
- дизайна и получения синтетического гена BtCYMsyn (SEQ ID No 1) кодирующего модифицированный предшественник proCYM;
- конструирования гена MaBtCYMsyn, кодирующий вариант предшественника химозина белка с модифицированной N-концевой сигнальной последовательностью ppMF1D (SEQ ID No 15);
- конструирования плазмидной ДНК pSF001, содержащей ген MaBtCYMsyn в составе вектора pVR2;
- конструирования рекомбинантного штамма дрожжей P. pastoris/pSF001, способного синтезировать proCYM;
- разработки способа микробиологического синтеза прохимозина на основе рекомбинантного штамма дрожжей P. pastoris/рSF001, сочетающего высокий уровень синтеза proCYM и способностью к его секреции.
Выбор модифицированной последовательности пре-прообласти предшественника феромона дрожжей альфа-фактора (SEQ ID No 12) в качестве сигнального пептида обусловлен тем, что такая последовательность обеспечивает в 1,4-2 раза более эффективную секрецию целевых белков по сравнению с последовательностью ppMFa1 «дикого типа» [36] .
Выбор метода получения гена BtCYMsyn с помощью олигонуклеотидного синтеза обусловлен тем, что такой подход позволяет оптимизировать кодирующую последовательность гена для наиболее эффективной трансляции и стабильности мРНК BtCYM в клетках P. pastoris, что должно приводить к значительному повышению выхода рекомбинантного proCYM.
Выбор плазмиды pVR2 в качестве основы для создания вектора экспрессии BtCYM состоит в том, что данный вектор, в отличии от известных коммерческих векторов (pPICZA,B,C, pPICZaA,B,C, pPIC9K) содержит близкую к нативной последовательность участка перед АУГ кодоном промотора АОХ1, что должно повышать эффективность трансляции целевой мРНК, а также помимо маркера устойчивости к зеоцину содержит дополнительный селективный маркер устойчивости к ампициллину, что упрощает и удешевляет процедуры конструирования векторов экспрессии на его основе [37].
Этап 1. Дизайн и конструирование синтетического гена MaBtCYMsyn.
Дизайн нуклеотидной последовательности BtCYMsyn разрабатывают на основании аминокислотной последовательности preproCYM (Номер доступа Genbank NP_851337.1). МРНК preproCYM (Номер доступа Genbank NM_180994.2) кодирует предшественник preproCYM с собственным N-концевым сигнальным пептидом, продоменом. Для обеспечения эффективной секреции proCYM в клетках дрожжей проводят замену собственного сигнального пептида preproCYM на модифицированную последовательность ppMFa1, которую состыковывают с кодирующей последовательностью proCYM.
Кодирующую последовательность гена BtCYMsyn проектируют с учетом данных о предпочтении кодонов у активно экспрессирующихся генов P. pastoris, их GC составе, попутно избегая участки, способные формировать обширные вторичные структуры мРНК, сайты преждевременного полиаденилирования и терминации трансляции, удаляя часто встречающиеся сайт рестрикции, в том числе сайты XhoI и NdeI, которыми затем фланкируют последовательность для последующего встраивания в плазмидную конструкцию. Полученную последовательность используют для синтеза ДНК BtCYM по заказу от компании TWIST Bioscience. Полученный синтетический фрагмент ДНК гена BtCYMsyn объединяют с помощью рекомбинантной ПЦР с другим синтетическим фрагментом, кодирующим вариант последовательности сигнального пептида ppMFa1.
Этап 2. Конструирование интегративной плазмиды pSF002, содержащей ген MaBtCYMsyn под контролем промотора AOX1.
Плазмиду pSF002 конструируют путем клонирования, полученного на этапе 1 фрагмента ДНК, кодирующего ген MaBtCYMsyn в вектор pVR2, разработанный для интеграции в штаммы Pichia pastoris (his 4, mut+) и предназначенный для метанол-индуцируемой экспрессии целевых белков [38]. Вектор pVR2 размером 6251 пары оснований содержит промотор АОХ1; терминатор гена CYC1 S. cerevisiae; «кассету» экспрессии гена Zeo, обеспечивающего устойчивость штаммов Е. coli и P. pastoris к зеоцину; включающую кодирующую область гена St. griseus, промотор гена TEF1 P. pastoris, терминатор гена CYC1 дрожжей, ген Amp, обеспечивающий устойчивость к ампициллину штаммов E. coli, репликон pUC.
Плазмида pSF002 размером 6106 пар оснований, наряду с генами вектора pVR2, содержит кодирующую область гена MaBtCYMsyn прохимозина быка под контролем промотора АОХ1 (Рис. 1).
Этап 3. Конструирование рекомбинантного штамма дрожжей P. pastoris, способного синтезировать секретируемый прохимозин быка, кодируемый геном MaBtCYMsyn.
В качестве штамма-реципиента используют штамм P. pastoris GS115. Компетентные клетки данного штамма трансформируют плазмидой pSF002. В результате получают рекомбинантный штамм P. pastoris, способный синтезировать и секретировать прохимозин быка.
Заявляемый штамм P. pastoris имеет следующие морфологические и физиолого-биохимические характеристики:
Морфологические признаки: при культивировании при температуре 28°С в течение 48 часов на агаризованной среде YPD следующего состава (мас.%: пептон - 2, дрожжевой экстракт - 1, глюкоза - 2, агар - 2, вода - остальное) формируются колонии светло-бежевого цвета с ровным краем, матовой поверхностью, линзовидным профилем и пастообразной консистенцией. При росте в жидкой среде YPD при 28°С в течение 24 ч культивирования - жидкость мутная, осадок белый, коагуляции не наблюдается, пристеночных пленок культура не образует. Клетки имеют овальную форму, 3-4 мкм в диаметре; почкуются; почкование истинное, многостороннее; истинного мицелия не образуют.
Физиолого-биохимические признаки: штамм является факультативным анаэробом с температурой роста - 20-33°C (оптимум - 28°C) и рН среды культивирования - 4,8-7,4 (оптимум - 6,0). В качестве источников углерода штамм может использовать глюкозу, глицерин, метанол, олеат, сорбитол, рамнозу. Не утилизирует галактозу, ксилозу, арабинозу. В качестве источников азота штамм может использовать аминокислоты, сернокислый аммоний, азотнокислый аммоний. Штамм P. pastoris синтезирует рекомбинантный секретируемый прохимозин быка.
Пример 1. Способ микробиологического синтеза прохимозина. Посевной материал, представляющий собой клетки рекомбинантного штамма-продуцента, подготавливают путем инкубации в течение 15-24 часов при температуре 29°С на среде YPD при постоянной аэрации на термостатируемой качалке (250 об/мин). Затем выросшую культуру переносят в соотношении 1:200 (по объему) в среду BMMY (мас.%: пептон - 2, дрожжевой экстракт - 1, метанол - 0,5, фосфатный буфер рН=6.6 - до 100 mM, вода - остальное) до ОД600=1.
Процесс биосинтеза ведут в колбах Эрленмейера, содержащих 20 мл среды BMMY, в течение 96 часов в ротационном шейкере-термостате (200-250 об/мин), при температуре 28°C. Каждые 24 часа проводят индукцию метанолом, путем асептического добавления 50% раствора метанола в пробирки, до конечной концентрации 0,5%. По истечении 96 часов биомассу отделяют центрифугированием. Наличие рекомбинантного прохимозина в культуральной среде определяют при энзиматического теста после активации прохимозина в составе супернатанта путем кислотной обработки. Уровень продукции прохимозина выражают в международных казеиновых единицах (IMCU/мл, МКЕ/мл). Уровень синтеза прохимозина заявляемым способом составляет не менее 15 МКЕ/мл культуральной жидкости.
Изобретение проиллюстрировано следующими фигурами графических изображений
Фиг. 1. - физическая и генетическая карты плазмиды pSF002. Обозначены положения гена MaBtCYM, индикаторных сайтов рестрикции, участков промотора AOX1, терминатора tTEF1 область начала репликации pBR322 (pBR322 origin), генов устойчивости к зеоцину, ампициллину.
Фиг. 2. - Сравнение нуклеотидных последовательностей природного гена WT_CYM и заявляемого гена BtCYM.
Фиг. 3. - Распределение частот использования кодонов вдоль кодирующих последовательностей природного и синтетического генов BtCYM.
Фиг. 4. - Распределение GC-богатых участков.
Фиг. 5. - Выравнивание N-концевых аминокислотных последовательностей предшественника CYM c нативным сигнальным пептидом ppMFα1 и варианта предшественника CYM с модифицированным сигнальным пептидом ppMFα1.
Фиг. 6. - Динамика накопления активности CYM (столбцы, основная ось Y) и прироста биомассы (график, дополнительная ось Y) штаммом P. pastoris /SF002.
При осуществлении изобретения, помимо методов, подробно раскрытых в нижеследующих примерах, используют хорошо известные специалистам методики, описанные в руководствах по молекулярной биологии и генетической инженерии [28].
Пример 2. Дизайн синтетического гена аналога proCYM
Синтетический ген BtCYMsyn получают путем оптимизации кодирующей последовательности нативного гена СYM для синтеза в P. pastoris. При дизайне аминокислотной последовательности proCYM в качестве последовательности каталитически-активного домена используют участок последовательности proCYM, включающий 42-аминокислотную прочасть и часть, соответствующую зрелому химозину. На основании выбранной аминокислотной последовательности (SEQ ID No 2) c помощью программы Eugene [22] проводят подбор последовательности ДНК кодирующей области гена с учетом наиболее часто встречающихся кодонов для Pichia pastoris, отсутствия нежелательных элементов вторичных структур, криптических стоп-кодонов и участков полиаденилирования, удаляя также нежелательные рестрикционные сайты XhoI и NdeI. Степень гомологии синтетической последовательности BtCYMSyn и природной последовательности CYM составляет 60% (Фиг. 6).
По ряду критериев спроектированная последовательность (SEQ ID No1) должна обеспечивать более эффективную экспресссию proCYM в дрожжах по сравнению с природной последовательностью.
Частота встречаемости оптимальных для Pichia pastoris в последовательности BtCYMsyn выше, чем в природной последовательности, и, соответственно, индекс адаптации кодонов для P. pastoris для последовательности BtCYMsyn составляет 0,92, а для природной последовательности – 0,61. Синтетическая последовательность характеризуется пониженным GC-содержанием, что должно снижать вероятность образования нежелательных вторичных структур мРНК, препятствующих эффективной трансляции.
Полученную последовательность используют для синтеза ДНК BtCYMsyn по заказу на фирме TWIST Bioscence путем сборки по Гибсону (g-блок).
Пример 3. Конструирование плазмиды рSF001 для экспрессии для экспрессии и секреции proCYM в P. pastoris под контролем нативного сигнального пептида ppMFα1.
Для получения вектора, содержащего вариант гена BtCYMsyn, кодирующий preproCYM c нативным сигнальным пептидом ppMFa1 под контролем промотора AOX1, объединяют кодирующую последовательность proCYM c сигнальной последовательностью ppMFα1 и полученный модифицированный ген встраивают под контроль промотора AOX1 вектора pVR2. Все стандартные генно-инженерные и микробиологические манипуляции проводят по известным методикам [39].
В качестве источника ppMFα1 используют плазмидную ДНК pPICZ(alpha)A(https://www.snapgene.com/resources/plasmid-files/?set=yeast_plasmids&plasmid=pPICZ(alpha)_A). Объединение кодирующей последовательности ppMFα1 с кодирующей последовательностью BtCYMsyn проводят с использованием метода «рекомбинантной» ПЦР. Для этого сначала на матрице на матрице g-блока BtCYMsyn получают - фрагмент №1, а на матрице плазмиды pPICZ(alpha)A получают ПЦР фрагмент №2.
Фрагмент №1, размером 1200 пн, получают с использованием праймеров CYM_F (SEQ ID №3) и СYM_R (SEQ ID №4). Праймер CYM_F комплементарен N-концевой кодируюшей последовательности proCYM гена BtCYMsyn, а праймер CYM_R - C-концевой последовательности этого гена и фланкирован сайтом SalI.
Фрагмент №2, размером 226 пн, получают с использованием праймеров MFa1F (SEQ ID №5)/ MFa1R (SEQ ID №6). Праймер MFa1F специфичен к N-концевой кодирующей последовательности ppMFa1 плазмиды pPICZ(alpha)A, а праймер MFa1R, соответственно, к C-концевой последовательности ppMFa1 (по комплементарной цепи).
Полученные с использованием высокоточной ДНК полимеразы Q5 (“New England Biolabs Inc”) фрагменты №1 и №2 выделяют из агарозного геля и используют в качестве матрицы в ПЦР реакции, которую проводят, как описано ниже:
Смесь для ПЦР (50 мкл):
25 мкл 2-кратной готовой смест для полимеразы Q5 (“New England Biolabs Inc”);
1 мкл Фрагмента 1 (20 нг/мкл);
1 мкл Фрагмента 2 (20 нг/мкл)
4 мкл 5 мкМ праймера Mfa1_F
4 мкл 5 мкМ праймера CYM_R;
15 мкл деионизованной воды
Условия проведения ПЦР (30 циклов): 98°, 3' (денатурация), 98°, 20''; 60°, 30''; 72°,1' (амплификация).
После амплификации 5 мкл ПЦР смеси анализируют электрофорезом в 1% агарозном геле и выявляют гомогенный фрагмент размером около 1,3 тпн. Фрагмент выделяют из геля, гидролизуют рестриктазами NdeI/SalI и клонируют в NdeI/XhoI вектор pVR2. Отбор клонов с нужной вставкой среди полученных ампициллин-устойчивых трансформантов штамма DH10B проводят методом ПЦР скрининга по критерию образования фрагмента размером пн с праймерами pAOX1 (SEQ ID No 7, специфичен к промотору AOX1) и ChySeq (SEQ ID No 8, специфичен к центральной части кодирующей последовательности BtCYM) Полученные «положительные» клоны секвенируют и отбирают плазмиду с вариантом гена BtCYMsyn (aBtCYMsyn,SEQ ID No 9), в котором кодирующая последовательность BtCYM слита с кодирующей последовательностью ppMFα1 и не содержит неспецифических мутаций, обусловленных ошибками ПЦР. Плазмиду, выделенную из отобранного клона, обозначают как pSF001.
Пример 4. Конструирование вектора pSF002 для экспрессии и секреции proCYM в P. pastoris под контролем модифицированного сигнального пептида ppMFα1.
Для получения вектора, содержащего вариант гена BtCYMsyn, кодирующий preproCYM c модифицированным сигнальным пептидом ppMFα1 под контролем промотора AOX1, объединяют кодирующую последовательность proCYM c сигнальной последовательностью ppMFα1D.
В качестве источника ppMFα1D используют полученный от компании TWIST Bioscience сборкой по Гибсону синтетический фрагмент ДНК mFαD (SEQ ID No 11). Объединение коидирующей последовательности ppMFα1D с кодирующей последовательностью BtCYMsyn проводят с использованием метода «рекомбинантной» ПЦР как описано в примере 2. На матрице фрагмента mFαD получают ПЦР фрагмент №3 размером 250 пн с использованием праймеров MFa1DF (SEQ ID No 13)/ MFa1DR (SEQ ID No 14) и объединяют с фрагментом №1 гена BtCYMsyn (пример 1) методом рекомбинатной ПЦР с использованием праймеров MFa1DF/CYM_R. Полученный фрагмент ДНК выделяют, гидролизуют рестриктазами NdeI/SalI и клонируют в NdeI/XhoI вектор pVR2. Отбор клонов с нужной вставкой среди полученных ампициллин-устойчивых трансформантов штамма DH10B проводят методом ПЦР скрининга как описано в примере 2. Полученные «положительные» клоны секвенируют и отбирают плазмиду с вариантом гена BtCYMsyn (MaBtCYMsyn,SEQ ID No 15), в котором кодирующая последовательность BtCYM слита с кодирующей последовательностью ppMFa1D и не содержит неспецифических мутаций, обусловленных ошибками ПЦР. В результате получают плазмиду рSF002 размером 61 п.о., включающую ген MaBtCYMsyn, кодирующий аналог proCYM (Фиг. 1).
Пример 5. Получение рекомбинантного штамма дрожжей P. pastoris GS115/pSF001 - продуцента рекомбинантного proCYM.
В качестве штамма-реципиента используют штамм P. pastoris GS115. Трансформацию проводят с использованием 5 мкг линеаризованной плазмидной ДНК, для получения которой исходную плазмиду обрабатывают эндонуклеазой рестрикции PmeI, сайт узнавания которой расположен в промоторе гена AOXI.
Культуру дрожжей штамма Pichia pastoris GS115 выращивают на среде YPD, в аэробных условиях (250 об/мин) до оптической плотности 1-2 единицы. Осадок клеток, полученный из 100 мл культуры отделяют центрифугированием при 2000 g в течение 5 минут, ресуспендируют в 10 мл буфера, содержащего 1 мМ дитиотреитол и 100 мМ HEPES, pH 8,0 затем инкубируют на шейкере в течение 30 минут при комнатной температуре и после двукратной промывки холодной деионизированной водой ресуспендируют в 1 мл 1 М сорбитола. Суспензию разделяют на аликвоты по 40 мкл. Электропорацию проводят на приборе GenePulser Xcell (Biorad) в кюветах с зазором 2 мм при 2000 В, 25 мкФ, 600 Ом. После электропорации быстро добавляют 1 мл холодной среды YPD, инкубируют 2 часа при температуре 30°С и высевают на селективную среду для отбора трансформантов. Отбор трансформантов проводят на среде YPDS/Zeo, содержащей 1% дрожжевой экстракт, 2% пептон, 2% глюкозу, 1М сорбитол, 2% бактоагар, антибиотик Зеоцин (100 мкг/мл). В результате трансформации должна происходить интеграция экспрессирующей кассеты, состоящей из гена устойчивости к зеоцину и гена BtCYMsyn, слитого с сигнальным пептидом ppMFa1 в хромосомный локус AOX1 путем гомологичной рекомбинации. Таким образом, трансформанты, выросшие на агаризованной среде с селективным антибиотиком зеоцином, генетически стабильны как в присутствии, так и в отсутствие в среде культивирования селективного антибиотика.
Скрининг отобранных через 3-5 дней инкубации при 30°С трансформантов на способность к синтезу и секреции proCYM путем культивирования в 96-луночном глубоком планшете (объем лунок по 2 мл, круглодонная форма, Сellstar) следующим образом: в лунки добавляют по 300 мкл среды BMGY, стерильной зубочисткой переносят часть колонии в лунки, при этом перекалывая этой же зубочисткой колонии на 2 чашки с YPDZeo параллельно. Плашки инкубируют при 30°С на качалке, 650 об/мин в течение 60 часов, планшет при этом накрывают 2-мя слоями стерильной марли. Добавляют по 250 мкл среды ВММY, инкубируют далее в течение 12 часов. Добавляют по 50 мкл среды ВММY через каждые последующие 24 часа. На третьи сутки индукции клетки осаждают центрифугированием при 2500xg. Супернатанты (500 мкл) переносят в чистые 96-луночные глубокие планшеты. Супернатанты полученных культур анализируют на способность к секреции proCYM. Для этого 20 мкл супернатантов отобранных с помощью многоканальной пипетки переносят в лунки стандартного 96 луночного круглодонного планшета с помощью многоканальной пипетки. Далее в каждую лунку добавляют по 5 мкл 0,5 М раствора HCl и инкубируют 2 часа при комнатной температуре. Далее к лункам добавляют по 5 мкл 0,4 М раствора NaOH и 20 мкл 0,12 М раствора ацетат натрия, рН5,5, инкубируют 2 часа при комнатной температуре.
Далее к лункам добавляют по 50 мкл прогретого до 37°С раствора 26% сухого молока в 5,5 мМ CaCl2, планшеты инкубируют при 37 градусах 5 мин, центрифугируют при 2500xg, 5 мин.
Супернатанты стряхивают, анализируют визуально объемы осадка в лунках. Отбирают штаммы, образующие осадки максимального объема.
Отобранные штаммы используют для идентификации штамма-продуцента, обладающего максимальной продуктивностью в условиях культивирования в колбах. Посевной материал выращивают путем инкубации клеток отобранных трансформантов в течение 15-24 часов при температуре 29°С на среде YPD при постоянной аэрации (250 об/мин). Подготовленный посевной материал (200 мкл) используют для инокуляции 20 мл среды YPgM и ведут процесс биосинтеза в аэробных условиях при температуре 28°С в течение 96 часов, проводя индукцию метанолом.
Уровень продукции proCYM определяют путем кислотной активации аликвот супернатантов культуральной среды. Удельную казеингидролизующую активность выражают в казеиновых единицах фермента на мл культуры штамма-продуцента при помощи метода, описанного в работе [34].
Как видно из представленных данных (Фиг. 5), общая активность фермента достигает максимума через 96 часов инкубации; при этом в отобранном таким образом наилучшем штамме P. pastoris GS115/pSF001 она составляет 12 МКЕ/мл.
Пример 6. Получение рекомбинантного штамма дрожжей P. pastoris GS115/pSF001 - продуцента рекомбинантного proCYM.
Получение устойчивых к зеоцину трансформантов штамма P. pastoris GS115 (his 4, mut+) линеаризованной по сайту PmeI плазмидой pNC002, скрининг трансформантов, обладающих максимальной продуктивностью, отбор продуцентов, способных к наиболее высокому уровню синтеза и секреции proCYM при культивировании в колбах проводят как описано в примере 3.
Уровень продукции proCYM в отобранном таким образом штамме P. pastoris GS115/pSF002 составляет 15 МКЕ/мл, что на 20% выше чем в контрольном штамме P. pastoris GS115/pSF001
Таким образом, получен рекомбинантный штамм дрожжей P. pastoris GS115/pSF002, способный к биосинтезу секретируемого прохимозина быка, кодируемого синтетическим геном предшественника химозина с модифицированной сигнальной последовательностью секреции дрожжевого феромона альфа-фактора. При культивировании заявляемым способом уровень синтеза proCYM составляет 15 МКЕ/мл, что превосходит способ-ближайший аналог более чем в 2 раза.
Источники литературы:
1. Szecsi P.B., Harboe M. Chapter 5 - Chymosin // Handbook of Proteolytic Enzymes (Third Edition). Third Edit / ed. Rawlings N.D., Salvesen G. Academic Press, 2013. P. 37-42.
2. Kumar A. et al. Chymosin and other milk coagulants: Sources and biotechnological interventions // Crit. Rev. Biotechnol. 2010. Vol. 30, № 4. P. 243-258.
3. BARKHOLT PEDERSEN V., ASBÆK CHRISTENSEN K., FOLTMANN B. Investigations on the Activation of Bovine Prochymosin // Eur. J. Biochem. 1979. Vol. 94, № 2. P. 573-580.
4. Mellor J. et al. Efficient synthesis of enzymatically active calf chymosin in Saccharomyces cerevisiae. // Gene. 1983. Vol. 24, № 1. P. 1-14.
5. Almeida C.M., Simões I. Cardoon-based rennets for cheese production // Applied Microbiology and Biotechnology. Springer Verlag, 2018. Vol. 102, № 11. P. 4675-4686.
6. Vallejo J.A. et al. Short communication: A comparative analysis of recombinant chymosins. // J. Dairy Sci. 2012. Vol. 95, № 2. P. 609-613.
7. Ogel Z.B. Microbial production of recombinant rennet: Recent developments // Microbial Cultures and Enzymes in Dairy Technology. IGI Global, 2018. P. 222-233.
8. No Title [Electronic resource]. URL: https://www.validogen.com/pichia-pastoris/overview.
9. Ahmad M. et al. Protein expression in Pichia pastoris: Recent achievements and perspectives for heterologous protein production // Applied Microbiology and Biotechnology. 2014.
10. Gasser B. et al. Pichia pastoris: protein production host and model organism for biomedical research. // Future Microbiol. 2013. Vol. 8, № 2. P. 191-208.
11. Cregg J.M. et al. Recombinant Protein Expression in Pichia pastoris // Mol. Biotechnol. 2000. Vol. 16, № 1. P. 23-52.
12. McNeil B. et al. Microbial Production of Food Ingredients, Enzymes and Nutraceuticals // Microbial Production of Food Ingredients, Enzymes and Nutraceuticals. 2013.
13. Singh S. et al. Large-scale production of membrane proteins in Pichia pastoris: The production of g protein-coupled receptors as a case study // Methods Mol. Biol. 2012.
14. Laukens B., De Visscher C., Callewaert N. Engineering yeast for producing human glycoproteins: where are we now? // Future Microbiol. England, 2015. Vol. 10, № 1. P. 21-34.
15. Bill R.M. Playing catch-up with escherichia coli: Using yeast to increase success rates in recombinant protein production experiments // Front. Microbiol. 2014.
16. Tyagi A. et al. Expression of buffalo chymosin in Pichia pastoris for application in mozzarella cheese // LWT - Food Sci. Technol. 2017.
17. Wang N. et al. Expression and characterization of camel chymosin in Pichia pastoris // Protein Expr. Purif. 2015.
18. Ersöz F., İnan M. Large-scale production of yak (Bos grunniens) chymosin A in Pichia pastoris // Protein Expr. Purif. 2019.
19. Tyagi A. et al. Functional expression of recombinant goat chymosin in Pichia pastoris bioreactor cultures: A commercially viable alternate // LWT - Food Sci. Technol. 2016.
20. Dunn-Coleman N.S. et al. Commercial Levels of Chymosin Production by Aspergillus // Bio/Technology. 1991. Vol. 9, № 10. P. 976-981.
21. Parret A.H., Besir H., Meijers R. Critical reflections on synthetic gene design for recombinant protein expression // Curr. Opin. Struct. Biol. 2016. Vol. 38. P. 155-162.
22. Gaspar P. et al. EuGene: maximizing synthetic gene design for heterologous expression // Bioinformatics. 2012. Vol. 28, № 20. P. 2683-2684.
23. Espinoza-Molina J.A. et al. Codon Optimization of the “Bos Taurus Chymosin” Gene for the Production of Recombinant Chymosin in Pichia pastoris // Mol. Biotechnol. 2016.
24. Damasceno L.M., Huang C.J., Batt C.A. Protein secretion in Pichia pastoris and advances in protein production // Applied Microbiology and Biotechnology. 2012. Vol. 93, № 1. P. 31-39.
25. Liang S. et al. Endogenous signal peptides efficiently mediate the secretion of recombinant proteins in Pichia pastoris. // Biotechnol. Lett. Netherlands, 2013. Vol. 35, № 1. P. 97-105.
26. Puxbaum V., Mattanovich D., Gasser B. Quo vadis? The challenges of recombinant protein folding and secretion in Pichia pastoris // Applied Microbiology and Biotechnology. 2015.
27. Brake A.J. et al. Alpha-factor-directed synthesis and secretion of mature foreign proteins in Saccharomyces cerevisiae. // Proc. Natl. Acad. Sci. U. S. A. 1984. Vol. 81, № 15. P. 4642-4646.
28. Dancourt J., Barlowe C. Protein sorting receptors in the early secretory pathway. // Annu. Rev. Biochem. United States, 2010. Vol. 79. P. 777-802.
29. Fuller R.S., Sterne R.E., Thorner J. Enzymes required for yeast prohormone processing. // Annu. Rev. Physiol. United States, 1988. Vol. 50. P. 345–362.
30. Delic M. et al. The secretory pathway: exploring yeast diversity. // FEMS Microbiol. Rev. 2013. Vol. 37, № 6. P. 872–914.
31. Yang Z., Zhang Z. Engineering strategies for enhanced production of protein and bio-products in Pichia pastoris: A review // Biotechnology Advances. 2018.
32. Lin-Cereghino G.P. et al. The effect of α-mating factor secretion signal mutations on recombinant protein expression in Pichia pastoris // Gene. 2013. Vol. 519, № 2. P. 311-317.
33. Ahn J. et al. Codon optimization of Saccharomyces cerevisiae mating factor alpha prepro-leader to improve recombinant protein production in Pichia pastoris // Biotechnol. Lett. Springer Netherlands, 2016. Vol. 38, № 12. P. 2137-2143.
34. Noseda D.G. et al. Cloning, expression and optimized production in a bioreactor of bovine chymosin B in Pichia (Komagataella) pastoris under AOX1 promoter // Protein Expr. Purif. 2013.
35. Espinoza-Molina J.A. et al. Codon Optimization of the “Bos Taurus Chymosin” Gene for the Production of Recombinant Chymosin in Pichia pastoris. // Mol. Biotechnol. 2016. Vol. 58, № 10. P. 657-664.
36. Lin-Cereghino G.P. et al. The effect of α-mating factor secretion signal mutations on recombinant protein expression in Pichia pastoris. // Gene. NIH Public Access, 2013. Vol. 519, № 2. P. 311-317.
37. Redo V.A., Novikova E.K., Eldarov M.A. Expression of modified oxidase of D-aminoacids of Trigonopsis variabilis in methylotrophic yeasts Pichia pastoris // Appl. Biochem. Microbiol. 2011. Vol. 47, № 1.
38. Редо В.А.., Новикова Е.К., Эльдаров М.А. Экспрессия модифицированной оксидазы D-аминокислот Trigonopsis variabilis в метилотрофных дрожжах Pichia pastoris // Прикладная биохимия и микробиология. 2011. Vol. 47, № 1. P. 39-45.
39. Sambrook J. Molecular cloning: a laboratory manual. Third edition. Cold Spring Harbor, N.Y.: Cold Spring Harbor Laboratory Press, [2001] ©2001.
--->
Аминокислотные последовательности
<110> FRC Biotechnology RAS
<120> Рекомбинантная ДНК, кодирующая вариант предшественника химозина
быка (BtCYM) с модифицированной сигнальной последовательностью
секреции препроальфафактора дрожжей Saccharmomyces cerevisiae,
рекомбинантная плазмида pCF002, обеспечивающая синтез BtCYM в
клетках Pichia pastoris и штамм Pichia pastoris GS115 /p SF002 -
продуцент рекомбинантного BtCYM
<130> 001
<160> 16
<170> PatentIn version 3.5
<210> 1
<211> 1107
<212> DNA
<213> Artificial Sequence
<220>
<223> Синтетический ген прохимозина быка
<220>
<221> CDS
<222> (1)..(1095)
<400> 1
gct gaa att act aga atc cca ttg tat aag ggt aaa tct ttg aga aag 48
Ala Glu Ile Thr Arg Ile Pro Leu Tyr Lys Gly Lys Ser Leu Arg Lys
1 5 10 15
gct ttg aaa gaa cat ggt ttg ttg gag gat ttc ttg caa aag caa caa 96
Ala Leu Lys Glu His Gly Leu Leu Glu Asp Phe Leu Gln Lys Gln Gln
20 25 30
tac ggt atc tct tct aag tac tct ggt ttc ggt gaa gtt gct tct gtt 144
Tyr Gly Ile Ser Ser Lys Tyr Ser Gly Phe Gly Glu Val Ala Ser Val
35 40 45
cca ttg act aac tac ttg gat tct caa tac ttc ggt aaa atc tac ttg 192
Pro Leu Thr Asn Tyr Leu Asp Ser Gln Tyr Phe Gly Lys Ile Tyr Leu
50 55 60
ggt act cca cct caa gag ttt act gtt ttg ttc gat act ggt tct tct 240
Gly Thr Pro Pro Gln Glu Phe Thr Val Leu Phe Asp Thr Gly Ser Ser
65 70 75 80
gat ttc tgg gtt cct tct atc tac tgt aag tct aac gct tgt aag aac 288
Asp Phe Trp Val Pro Ser Ile Tyr Cys Lys Ser Asn Ala Cys Lys Asn
85 90 95
cat caa aga ttc gat cca aga aag tct tct act ttc caa aac ttg ggt 336
His Gln Arg Phe Asp Pro Arg Lys Ser Ser Thr Phe Gln Asn Leu Gly
100 105 110
aaa cct ttg tct att cac tat ggt act ggt tct atg caa ggt att ttg 384
Lys Pro Leu Ser Ile His Tyr Gly Thr Gly Ser Met Gln Gly Ile Leu
115 120 125
ggt tac gat act gtt act gtt tct aac atc gtt gat att caa caa act 432
Gly Tyr Asp Thr Val Thr Val Ser Asn Ile Val Asp Ile Gln Gln Thr
130 135 140
gtt ggt ttg tct act caa gaa cct gga gat gtt ttt act tac gct gag 480
Val Gly Leu Ser Thr Gln Glu Pro Gly Asp Val Phe Thr Tyr Ala Glu
145 150 155 160
ttc gat ggt att ttg ggt atg gct tat cca tct ttg gct tct gaa tac 528
Phe Asp Gly Ile Leu Gly Met Ala Tyr Pro Ser Leu Ala Ser Glu Tyr
165 170 175
tct atc cct gtt ttc gat aac atg atg aac aga cat ttg gtt gct caa 576
Ser Ile Pro Val Phe Asp Asn Met Met Asn Arg His Leu Val Ala Gln
180 185 190
gat ttg ttc tct gtt tac atg gat aga aac ggt caa gag tct atg ttg 624
Asp Leu Phe Ser Val Tyr Met Asp Arg Asn Gly Gln Glu Ser Met Leu
195 200 205
act ttg ggt gct att gat cca tct tac tat act ggt tct ttg cac tgg 672
Thr Leu Gly Ala Ile Asp Pro Ser Tyr Tyr Thr Gly Ser Leu His Trp
210 215 220
gtt cct gtt act gtt caa caa tac tgg caa ttc act gtt gat tct gtt 720
Val Pro Val Thr Val Gln Gln Tyr Trp Gln Phe Thr Val Asp Ser Val
225 230 235 240
act att tct ggt gtt gtt gtt gct tgt gag ggt ggt tgt caa gct att 768
Thr Ile Ser Gly Val Val Val Ala Cys Glu Gly Gly Cys Gln Ala Ile
245 250 255
ttg gat act ggt act tct aag ttg gtt ggt cca tct tct gat atc ttg 816
Leu Asp Thr Gly Thr Ser Lys Leu Val Gly Pro Ser Ser Asp Ile Leu
260 265 270
aac atc caa caa gct att ggt gct act caa aac caa tac ggt gaa ttt 864
Asn Ile Gln Gln Ala Ile Gly Ala Thr Gln Asn Gln Tyr Gly Glu Phe
275 280 285
gat atc gat tgt gat aac ttg tct tac atg cct act gtt gtt ttc gag 912
Asp Ile Asp Cys Asp Asn Leu Ser Tyr Met Pro Thr Val Val Phe Glu
290 295 300
att aat ggt aaa atg tac cca ttg act cct tct gct tac act tct caa 960
Ile Asn Gly Lys Met Tyr Pro Leu Thr Pro Ser Ala Tyr Thr Ser Gln
305 310 315 320
gat caa ggt ttt tgt act tct ggt ttc caa tct gaa aat cac tct caa 1008
Asp Gln Gly Phe Cys Thr Ser Gly Phe Gln Ser Glu Asn His Ser Gln
325 330 335
aag tgg att ttg gga gat gtt ttt att aga gag tac tac tct gtt ttc 1056
Lys Trp Ile Leu Gly Asp Val Phe Ile Arg Glu Tyr Tyr Ser Val Phe
340 345 350
gat aga gct aac aat ttg gtt ggt ttg gct aaa gct att taagtcgaca ac 1107
Asp Arg Ala Asn Asn Leu Val Gly Leu Ala Lys Ala Ile
355 360 365
<210> 2
<211> 365
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 2
Ala Glu Ile Thr Arg Ile Pro Leu Tyr Lys Gly Lys Ser Leu Arg Lys
1 5 10 15
Ala Leu Lys Glu His Gly Leu Leu Glu Asp Phe Leu Gln Lys Gln Gln
20 25 30
Tyr Gly Ile Ser Ser Lys Tyr Ser Gly Phe Gly Glu Val Ala Ser Val
35 40 45
Pro Leu Thr Asn Tyr Leu Asp Ser Gln Tyr Phe Gly Lys Ile Tyr Leu
50 55 60
Gly Thr Pro Pro Gln Glu Phe Thr Val Leu Phe Asp Thr Gly Ser Ser
65 70 75 80
Asp Phe Trp Val Pro Ser Ile Tyr Cys Lys Ser Asn Ala Cys Lys Asn
85 90 95
His Gln Arg Phe Asp Pro Arg Lys Ser Ser Thr Phe Gln Asn Leu Gly
100 105 110
Lys Pro Leu Ser Ile His Tyr Gly Thr Gly Ser Met Gln Gly Ile Leu
115 120 125
Gly Tyr Asp Thr Val Thr Val Ser Asn Ile Val Asp Ile Gln Gln Thr
130 135 140
Val Gly Leu Ser Thr Gln Glu Pro Gly Asp Val Phe Thr Tyr Ala Glu
145 150 155 160
Phe Asp Gly Ile Leu Gly Met Ala Tyr Pro Ser Leu Ala Ser Glu Tyr
165 170 175
Ser Ile Pro Val Phe Asp Asn Met Met Asn Arg His Leu Val Ala Gln
180 185 190
Asp Leu Phe Ser Val Tyr Met Asp Arg Asn Gly Gln Glu Ser Met Leu
195 200 205
Thr Leu Gly Ala Ile Asp Pro Ser Tyr Tyr Thr Gly Ser Leu His Trp
210 215 220
Val Pro Val Thr Val Gln Gln Tyr Trp Gln Phe Thr Val Asp Ser Val
225 230 235 240
Thr Ile Ser Gly Val Val Val Ala Cys Glu Gly Gly Cys Gln Ala Ile
245 250 255
Leu Asp Thr Gly Thr Ser Lys Leu Val Gly Pro Ser Ser Asp Ile Leu
260 265 270
Asn Ile Gln Gln Ala Ile Gly Ala Thr Gln Asn Gln Tyr Gly Glu Phe
275 280 285
Asp Ile Asp Cys Asp Asn Leu Ser Tyr Met Pro Thr Val Val Phe Glu
290 295 300
Ile Asn Gly Lys Met Tyr Pro Leu Thr Pro Ser Ala Tyr Thr Ser Gln
305 310 315 320
Asp Gln Gly Phe Cys Thr Ser Gly Phe Gln Ser Glu Asn His Ser Gln
325 330 335
Lys Trp Ile Leu Gly Asp Val Phe Ile Arg Glu Tyr Tyr Ser Val Phe
340 345 350
Asp Arg Ala Asn Asn Leu Val Gly Leu Ala Lys Ala Ile
355 360 365
<210> 3
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Прямой праймер для амплификации кодирующей последовательности
гена SynCYM
<400> 3
gctgaaatta ctagaatccc a 21
<210> 4
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Обратный праймер для амплификации кодирующей последовательности
гена SynCYM
<400> 4
gttgtcgact taaatagctt tagccaaacc aacca 35
<210> 5
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Праймер для ПЦР-сборки гена aBtCYMsyn
<400> 5
catatgagat ttccttcaat ttttactg 28
<210> 6
<211> 38
<212> DNA
<213> Saccharomyces cerevisiae
<400> 6
gtaatttcag cgaattcagc ttcagcctct cttttctc 38
<210> 7
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Секвенирующий праймер промотор АОХ1
<400> 7
gactggttcc aattgacaag c 21
<210> 8
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Праймер для секвенирования гена BtCYM
<400> 8
gaacccagtg caaagaacca 20
<210> 9
<211> 1374
<212> DNA
<213> artificial sequence
<220>
<223> Synthetic Bos taurus prochymosin gene cloned in pPicZa vector
<220>
<221> CDS
<222> (1)..(1368)
<220>
<221> sig_peptide
<222> (1)..(267)
<223> Native MFa preproregion
<220>
<221> mat_peptide
<222> (268)..(1368)
<223> Prochmosin
<400> 9
atg aga ttt cct tca att ttt act gct gtt tta ttc gca gca tcc tcc 48
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
-85 -80 -75
gca tta gct gct cca gtc aac act aca aca gaa gat gaa acg gca caa 96
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
-70 -65 -60
att ccg gct gaa gct gtc atc ggt tac tca gat tta gaa ggg gat ttc 144
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
-55 -50 -45
gat gtt gct gtt ttg cca ttt tcc aac agc aca aat aac ggg tta ttg 192
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
-40 -35 -30
ttt ata aat act act att gcc agc att gct gct aaa gaa gaa ggg gta 240
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
-25 -20 -15 -10
tct ctc gag aaa aga gag gct gaa gct gaa ttc gct gaa att act aga 288
Ser Leu Glu Lys Arg Glu Ala Glu Ala Glu Phe Ala Glu Ile Thr Arg
-5 -1 1 5
atc cca ttg tat aag ggt aaa tct ttg aga aag gct ttg aaa gaa cat 336
Ile Pro Leu Tyr Lys Gly Lys Ser Leu Arg Lys Ala Leu Lys Glu His
10 15 20
ggt ttg ttg gag gat ttc ttg caa aag caa caa tac ggt atc tct tct 384
Gly Leu Leu Glu Asp Phe Leu Gln Lys Gln Gln Tyr Gly Ile Ser Ser
25 30 35
aag tac tct ggt ttc ggt gaa gtt gct tct gtt cca ttg act aac tac 432
Lys Tyr Ser Gly Phe Gly Glu Val Ala Ser Val Pro Leu Thr Asn Tyr
40 45 50 55
ttg gat tct caa tac ttc ggt aaa atc tac ttg ggt act cca cct caa 480
Leu Asp Ser Gln Tyr Phe Gly Lys Ile Tyr Leu Gly Thr Pro Pro Gln
60 65 70
gag ttt act gtt ttg ttc gat act ggt tct tct gat ttc tgg gtt cct 528
Glu Phe Thr Val Leu Phe Asp Thr Gly Ser Ser Asp Phe Trp Val Pro
75 80 85
tct atc tac tgt aag tct aac gct tgt aag aac cat caa aga ttc gat 576
Ser Ile Tyr Cys Lys Ser Asn Ala Cys Lys Asn His Gln Arg Phe Asp
90 95 100
cca aga aag tct tct act ttc caa aac ttg ggt aaa cct ttg tct att 624
Pro Arg Lys Ser Ser Thr Phe Gln Asn Leu Gly Lys Pro Leu Ser Ile
105 110 115
cac tat ggt act ggt tct atg caa ggt att ttg ggt tac gat act gtt 672
His Tyr Gly Thr Gly Ser Met Gln Gly Ile Leu Gly Tyr Asp Thr Val
120 125 130 135
act gtt tct aac atc gtt gat att caa caa act gtt ggt ttg tct act 720
Thr Val Ser Asn Ile Val Asp Ile Gln Gln Thr Val Gly Leu Ser Thr
140 145 150
caa gaa cct gga gat gtt ttt act tac gct gag ttc gat ggt att ttg 768
Gln Glu Pro Gly Asp Val Phe Thr Tyr Ala Glu Phe Asp Gly Ile Leu
155 160 165
ggt atg gct tat cca tct ttg gct tct gaa tac tct atc cct gtt ttc 816
Gly Met Ala Tyr Pro Ser Leu Ala Ser Glu Tyr Ser Ile Pro Val Phe
170 175 180
gat aac atg atg aac aga cat ttg gtt gct caa gat ttg ttc tct gtt 864
Asp Asn Met Met Asn Arg His Leu Val Ala Gln Asp Leu Phe Ser Val
185 190 195
tac atg gat aga aac ggt caa gag tct atg ttg act ttg ggt gct att 912
Tyr Met Asp Arg Asn Gly Gln Glu Ser Met Leu Thr Leu Gly Ala Ile
200 205 210 215
gat cca tct tac tat act ggt tct ttg cac tgg gtt cct gtt act gtt 960
Asp Pro Ser Tyr Tyr Thr Gly Ser Leu His Trp Val Pro Val Thr Val
220 225 230
caa caa tac tgg caa ttc act gtt gat tct gtt act att tct ggt gtt 1008
Gln Gln Tyr Trp Gln Phe Thr Val Asp Ser Val Thr Ile Ser Gly Val
235 240 245
gtt gtt gct tgt gag ggt ggt tgt caa gct att ttg gat act ggt act 1056
Val Val Ala Cys Glu Gly Gly Cys Gln Ala Ile Leu Asp Thr Gly Thr
250 255 260
tct aag ttg gtt ggt cca tct tct gat atc ttg aac atc caa caa gct 1104
Ser Lys Leu Val Gly Pro Ser Ser Asp Ile Leu Asn Ile Gln Gln Ala
265 270 275
att ggt gct act caa aac caa tac ggt gaa ttt gat atc gat tgt gat 1152
Ile Gly Ala Thr Gln Asn Gln Tyr Gly Glu Phe Asp Ile Asp Cys Asp
280 285 290 295
aac ttg tct tac atg cct act gtt gtt ttc gag att aat ggt aaa atg 1200
Asn Leu Ser Tyr Met Pro Thr Val Val Phe Glu Ile Asn Gly Lys Met
300 305 310
tac cca ttg act cct tct gct tac act tct caa gat caa ggt ttt tgt 1248
Tyr Pro Leu Thr Pro Ser Ala Tyr Thr Ser Gln Asp Gln Gly Phe Cys
315 320 325
act tct ggt ttc caa tct gaa aat cac tct caa aag tgg att ttg gga 1296
Thr Ser Gly Phe Gln Ser Glu Asn His Ser Gln Lys Trp Ile Leu Gly
330 335 340
gat gtt ttt att aga gag tac tac tct gtt ttc gat aga gct aac aat 1344
Asp Val Phe Ile Arg Glu Tyr Tyr Ser Val Phe Asp Arg Ala Asn Asn
345 350 355
ttg gtt ggt ttg gct aaa gct att taatag 1374
Leu Val Gly Leu Ala Lys Ala Ile
360 365
<210> 10
<211> 456
<212> PRT
<213> artificial sequence
<220>
<223> Synthetic Construct
<400> 10
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
-85 -80 -75
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
-70 -65 -60
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
-55 -50 -45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
-40 -35 -30
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
-25 -20 -15 -10
Ser Leu Glu Lys Arg Glu Ala Glu Ala Glu Phe Ala Glu Ile Thr Arg
-5 -1 1 5
Ile Pro Leu Tyr Lys Gly Lys Ser Leu Arg Lys Ala Leu Lys Glu His
10 15 20
Gly Leu Leu Glu Asp Phe Leu Gln Lys Gln Gln Tyr Gly Ile Ser Ser
25 30 35
Lys Tyr Ser Gly Phe Gly Glu Val Ala Ser Val Pro Leu Thr Asn Tyr
40 45 50 55
Leu Asp Ser Gln Tyr Phe Gly Lys Ile Tyr Leu Gly Thr Pro Pro Gln
60 65 70
Glu Phe Thr Val Leu Phe Asp Thr Gly Ser Ser Asp Phe Trp Val Pro
75 80 85
Ser Ile Tyr Cys Lys Ser Asn Ala Cys Lys Asn His Gln Arg Phe Asp
90 95 100
Pro Arg Lys Ser Ser Thr Phe Gln Asn Leu Gly Lys Pro Leu Ser Ile
105 110 115
His Tyr Gly Thr Gly Ser Met Gln Gly Ile Leu Gly Tyr Asp Thr Val
120 125 130 135
Thr Val Ser Asn Ile Val Asp Ile Gln Gln Thr Val Gly Leu Ser Thr
140 145 150
Gln Glu Pro Gly Asp Val Phe Thr Tyr Ala Glu Phe Asp Gly Ile Leu
155 160 165
Gly Met Ala Tyr Pro Ser Leu Ala Ser Glu Tyr Ser Ile Pro Val Phe
170 175 180
Asp Asn Met Met Asn Arg His Leu Val Ala Gln Asp Leu Phe Ser Val
185 190 195
Tyr Met Asp Arg Asn Gly Gln Glu Ser Met Leu Thr Leu Gly Ala Ile
200 205 210 215
Asp Pro Ser Tyr Tyr Thr Gly Ser Leu His Trp Val Pro Val Thr Val
220 225 230
Gln Gln Tyr Trp Gln Phe Thr Val Asp Ser Val Thr Ile Ser Gly Val
235 240 245
Val Val Ala Cys Glu Gly Gly Cys Gln Ala Ile Leu Asp Thr Gly Thr
250 255 260
Ser Lys Leu Val Gly Pro Ser Ser Asp Ile Leu Asn Ile Gln Gln Ala
265 270 275
Ile Gly Ala Thr Gln Asn Gln Tyr Gly Glu Phe Asp Ile Asp Cys Asp
280 285 290 295
Asn Leu Ser Tyr Met Pro Thr Val Val Phe Glu Ile Asn Gly Lys Met
300 305 310
Tyr Pro Leu Thr Pro Ser Ala Tyr Thr Ser Gln Asp Gln Gly Phe Cys
315 320 325
Thr Ser Gly Phe Gln Ser Glu Asn His Ser Gln Lys Trp Ile Leu Gly
330 335 340
Asp Val Phe Ile Arg Glu Tyr Tyr Ser Val Phe Asp Arg Ala Asn Asn
345 350 355
Leu Val Gly Leu Ala Lys Ala Ile
360 365
<210> 11
<211> 219
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<221> CDS
<222> (1)..(219)
<400> 11
atg aga ttc cca tct atc ttt act gcc gtt ttg ttt gct gct tcc tct 48
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
gct ttg gca gct cca gtt aac aca act act gag gat gaa act gct caa 96
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
att cct gct gag gca gtt att ggt tac tct gat ttg gaa ggt gac ttt 144
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
gat gtt gct gtc ttg cct ttc tct gcc tct att gct gcc aag gaa gag 192
Asp Val Ala Val Leu Pro Phe Ser Ala Ser Ile Ala Ala Lys Glu Glu
50 55 60
ggt gtt tct ttg gac aag aga gag gct 219
Gly Val Ser Leu Asp Lys Arg Glu Ala
65 70
<210> 12
<211> 73
<212> PRT
<213> Saccharomyces cerevisiae
<400> 12
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Ala Ser Ile Ala Ala Lys Glu Glu
50 55 60
Gly Val Ser Leu Asp Lys Arg Glu Ala
65 70
<210> 13
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Прямой праймер для ПЦР-амплификации последовательности
модифицированного сигнального пептида ppMFa1
<400> 13
gatacatatg agattcccat ctatctttac 30
<210> 14
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Обратный праймер для ПЦР-амплификации последовательности
модифицированного сигнального пептида ppMFa1
<400> 14
tgggattcta gtaatttcag cttcagcctc tctcttgtcc aaaga 45
<210> 15
<211> 1332
<212> DNA
<213> Artificial Sequence
<220>
<223> Синтетический ген химозина быка с оптимизированной для Pichia
pastoris кодирующей последовательностью
<220>
<221> CDS
<222> (4)..(1320)
<223> Препрохимозин
<220>
<221> sig_peptide
<222> (4)..(225)
<223> Модифицированный сигрнальный пептид препроальфафактора
<220>
<221> misc_feature
<222> (226)..(1320)
<223> Прохимозин
<400> 15
cat atg aga ttc cca tct atc ttt act gcc gtt ttg ttt gct gct tcc 48
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser
1 5 10 15
tct gct ttg gca gct cca gtt aac aca act act gag gat gaa act gct 96
Ser Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala
20 25 30
caa att cct gct gag gca gtt att ggt tac tct gat ttg gaa ggt gac 144
Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp
35 40 45
ttt gat gtt gct gtc ttg cct ttc tct gcc tct att gct gcc aag gaa 192
Phe Asp Val Ala Val Leu Pro Phe Ser Ala Ser Ile Ala Ala Lys Glu
50 55 60
gag ggt gtt tct ttg gac aag aga gag gct gaa gct gaa att act aga 240
Glu Gly Val Ser Leu Asp Lys Arg Glu Ala Glu Ala Glu Ile Thr Arg
65 70 75
atc cca ttg tat aag ggt aaa tct ttg aga aag gct ttg aaa gaa cat 288
Ile Pro Leu Tyr Lys Gly Lys Ser Leu Arg Lys Ala Leu Lys Glu His
80 85 90 95
ggt ttg ttg gag gat ttc ttg caa aag caa caa tac ggt atc tct tct 336
Gly Leu Leu Glu Asp Phe Leu Gln Lys Gln Gln Tyr Gly Ile Ser Ser
100 105 110
aag tac tct ggt ttc ggt gaa gtt gct tct gtt cca ttg act aac tac 384
Lys Tyr Ser Gly Phe Gly Glu Val Ala Ser Val Pro Leu Thr Asn Tyr
115 120 125
ttg gat tct caa tac ttc ggt aaa atc tac ttg ggt act cca cct caa 432
Leu Asp Ser Gln Tyr Phe Gly Lys Ile Tyr Leu Gly Thr Pro Pro Gln
130 135 140
gag ttt act gtt ttg ttc gat act ggt tct tct gat ttc tgg gtt cct 480
Glu Phe Thr Val Leu Phe Asp Thr Gly Ser Ser Asp Phe Trp Val Pro
145 150 155
tct atc tac tgt aag tct aac gct tgt aag aac cat caa aga ttc gat 528
Ser Ile Tyr Cys Lys Ser Asn Ala Cys Lys Asn His Gln Arg Phe Asp
160 165 170 175
cca aga aag tct tct act ttc caa aac ttg ggt aaa cct ttg tct att 576
Pro Arg Lys Ser Ser Thr Phe Gln Asn Leu Gly Lys Pro Leu Ser Ile
180 185 190
cac tat ggt act ggt tct atg caa ggt att ttg ggt tac gat act gtt 624
His Tyr Gly Thr Gly Ser Met Gln Gly Ile Leu Gly Tyr Asp Thr Val
195 200 205
act gtt tct aac atc gtt gat att caa caa act gtt ggt ttg tct act 672
Thr Val Ser Asn Ile Val Asp Ile Gln Gln Thr Val Gly Leu Ser Thr
210 215 220
caa gaa cct gga gat gtt ttt act tac gct gag ttc gat ggt att ttg 720
Gln Glu Pro Gly Asp Val Phe Thr Tyr Ala Glu Phe Asp Gly Ile Leu
225 230 235
ggt atg gct tat cca tct ttg gct tct gaa tac tct atc cct gtt ttc 768
Gly Met Ala Tyr Pro Ser Leu Ala Ser Glu Tyr Ser Ile Pro Val Phe
240 245 250 255
gat aac atg atg aac aga cat ttg gtt gct caa gat ttg ttc tct gtt 816
Asp Asn Met Met Asn Arg His Leu Val Ala Gln Asp Leu Phe Ser Val
260 265 270
tac atg gat aga aac ggt caa gag tct atg ttg act ttg ggt gct att 864
Tyr Met Asp Arg Asn Gly Gln Glu Ser Met Leu Thr Leu Gly Ala Ile
275 280 285
gat cca tct tac tat act ggt tct ttg cac tgg gtt cct gtt act gtt 912
Asp Pro Ser Tyr Tyr Thr Gly Ser Leu His Trp Val Pro Val Thr Val
290 295 300
caa caa tac tgg caa ttc act gtt gat tct gtt act att tct ggt gtt 960
Gln Gln Tyr Trp Gln Phe Thr Val Asp Ser Val Thr Ile Ser Gly Val
305 310 315
gtt gtt gct tgt gag ggt ggt tgt caa gct att ttg gat act ggt act 1008
Val Val Ala Cys Glu Gly Gly Cys Gln Ala Ile Leu Asp Thr Gly Thr
320 325 330 335
tct aag ttg gtt ggt cca tct tct gat atc ttg aac atc caa caa gct 1056
Ser Lys Leu Val Gly Pro Ser Ser Asp Ile Leu Asn Ile Gln Gln Ala
340 345 350
att ggt gct act caa aac caa tac ggt gaa ttt gat atc gat tgt gat 1104
Ile Gly Ala Thr Gln Asn Gln Tyr Gly Glu Phe Asp Ile Asp Cys Asp
355 360 365
aac ttg tct tac atg cct act gtt gtt ttc gag att aat ggt aaa atg 1152
Asn Leu Ser Tyr Met Pro Thr Val Val Phe Glu Ile Asn Gly Lys Met
370 375 380
tac cca ttg act cct tct gct tac act tct caa gat caa ggt ttt tgt 1200
Tyr Pro Leu Thr Pro Ser Ala Tyr Thr Ser Gln Asp Gln Gly Phe Cys
385 390 395
act tct ggt ttc caa tct gaa aat cac tct caa aag tgg att ttg gga 1248
Thr Ser Gly Phe Gln Ser Glu Asn His Ser Gln Lys Trp Ile Leu Gly
400 405 410 415
gat gtt ttt att aga gag tac tac tct gtt ttc gat aga gct aac aat 1296
Asp Val Phe Ile Arg Glu Tyr Tyr Ser Val Phe Asp Arg Ala Asn Asn
420 425 430
ttg gtt ggt ttg gct aaa gct att taagtcgaca ac 1332
Leu Val Gly Leu Ala Lys Ala Ile
435
<210> 16
<211> 439
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 16
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Ala Ser Ile Ala Ala Lys Glu Glu
50 55 60
Gly Val Ser Leu Asp Lys Arg Glu Ala Glu Ala Glu Ile Thr Arg Ile
65 70 75 80
Pro Leu Tyr Lys Gly Lys Ser Leu Arg Lys Ala Leu Lys Glu His Gly
85 90 95
Leu Leu Glu Asp Phe Leu Gln Lys Gln Gln Tyr Gly Ile Ser Ser Lys
100 105 110
Tyr Ser Gly Phe Gly Glu Val Ala Ser Val Pro Leu Thr Asn Tyr Leu
115 120 125
Asp Ser Gln Tyr Phe Gly Lys Ile Tyr Leu Gly Thr Pro Pro Gln Glu
130 135 140
Phe Thr Val Leu Phe Asp Thr Gly Ser Ser Asp Phe Trp Val Pro Ser
145 150 155 160
Ile Tyr Cys Lys Ser Asn Ala Cys Lys Asn His Gln Arg Phe Asp Pro
165 170 175
Arg Lys Ser Ser Thr Phe Gln Asn Leu Gly Lys Pro Leu Ser Ile His
180 185 190
Tyr Gly Thr Gly Ser Met Gln Gly Ile Leu Gly Tyr Asp Thr Val Thr
195 200 205
Val Ser Asn Ile Val Asp Ile Gln Gln Thr Val Gly Leu Ser Thr Gln
210 215 220
Glu Pro Gly Asp Val Phe Thr Tyr Ala Glu Phe Asp Gly Ile Leu Gly
225 230 235 240
Met Ala Tyr Pro Ser Leu Ala Ser Glu Tyr Ser Ile Pro Val Phe Asp
245 250 255
Asn Met Met Asn Arg His Leu Val Ala Gln Asp Leu Phe Ser Val Tyr
260 265 270
Met Asp Arg Asn Gly Gln Glu Ser Met Leu Thr Leu Gly Ala Ile Asp
275 280 285
Pro Ser Tyr Tyr Thr Gly Ser Leu His Trp Val Pro Val Thr Val Gln
290 295 300
Gln Tyr Trp Gln Phe Thr Val Asp Ser Val Thr Ile Ser Gly Val Val
305 310 315 320
Val Ala Cys Glu Gly Gly Cys Gln Ala Ile Leu Asp Thr Gly Thr Ser
325 330 335
Lys Leu Val Gly Pro Ser Ser Asp Ile Leu Asn Ile Gln Gln Ala Ile
340 345 350
Gly Ala Thr Gln Asn Gln Tyr Gly Glu Phe Asp Ile Asp Cys Asp Asn
355 360 365
Leu Ser Tyr Met Pro Thr Val Val Phe Glu Ile Asn Gly Lys Met Tyr
370 375 380
Pro Leu Thr Pro Ser Ala Tyr Thr Ser Gln Asp Gln Gly Phe Cys Thr
385 390 395 400
Ser Gly Phe Gln Ser Glu Asn His Ser Gln Lys Trp Ile Leu Gly Asp
405 410 415
Val Phe Ile Arg Glu Tyr Tyr Ser Val Phe Asp Arg Ala Asn Asn Leu
420 425 430
Val Gly Leu Ala Lys Ala Ile
435
<---
Claims (8)
- Рекомбинантная плазмида pSF002, обеспечивающая биосинтез и секрецию прохимозина с SEQ ID NO: 1, имеющая размер 6106 п.о. и состоящая из следующих элементов:
- а) AOX1 promoter - 5'-концевая область промотора алкоголь оксидазы;
- б) Alpha factor signal peptide - участок, кодирующий N-концевой сигнальный пептид ppMFα1D с SEQ ID NO: 12;
- в) последовательность гена прохимозина быка, оптимизированная для экспрессии в Pichia pastoris;
- г) tTEF1 transcription terminator - терминатор транскрипции;
- д) pUC origin - бактериальная точка начала репликации pUC;
- е) Amp(R) - ген Amp, обеспечивающий устойчивость к ампициллину;
- ж) Zeo(R) - ген BleoR устойчивости к селективному антибиотику зеоцину.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2020135491A RU2779307C2 (ru) | 2020-10-28 | Способ микробиологического синтеза прохимозина быка с использованием рекомбинантного штамма Pichia pastoris, содержащего синтетический ген варианта препрохимозина с модифицированной сигнальной последовательностью секреции |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2020135491A RU2779307C2 (ru) | 2020-10-28 | Способ микробиологического синтеза прохимозина быка с использованием рекомбинантного штамма Pichia pastoris, содержащего синтетический ген варианта препрохимозина с модифицированной сигнальной последовательностью секреции |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2020135491A RU2020135491A (ru) | 2022-04-28 |
RU2020135491A3 RU2020135491A3 (ru) | 2022-04-28 |
RU2779307C2 true RU2779307C2 (ru) | 2022-09-06 |
Family
ID=
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2815882C1 (ru) * | 2022-12-22 | 2024-03-25 | Федеральное государственное бюджетное учреждение "Национальный исследовательский центр "Курчатовский институт" | Трансформант Ogataea haglerorum - продуцент рекомбинантного химозина в активной форме |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101748077A (zh) * | 2008-12-11 | 2010-06-23 | 吉林省农业科学院 | 表达凝乳酶的毕赤酵母及其构建方法与应用 |
RU2670071C1 (ru) * | 2017-07-03 | 2018-10-17 | Федеральное бюджетное учреждение науки "Государственный научный центр вирусологии и биотехнологии "Вектор" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ГНЦ ВБ "Вектор" Роспотребнадзора) | Рекомбинатная плазмида pET21a-ProChym, обеспечивающая синтез химерного белка прохимозина В Bos taurus, и штамм Escherichia coli BL21(DE3)pLysE pET21a-ProChym - продуцент химерного белка прохимозина В Bos Taurus |
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101748077A (zh) * | 2008-12-11 | 2010-06-23 | 吉林省农业科学院 | 表达凝乳酶的毕赤酵母及其构建方法与应用 |
RU2670071C1 (ru) * | 2017-07-03 | 2018-10-17 | Федеральное бюджетное учреждение науки "Государственный научный центр вирусологии и биотехнологии "Вектор" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ГНЦ ВБ "Вектор" Роспотребнадзора) | Рекомбинатная плазмида pET21a-ProChym, обеспечивающая синтез химерного белка прохимозина В Bos taurus, и штамм Escherichia coli BL21(DE3)pLysE pET21a-ProChym - продуцент химерного белка прохимозина В Bos Taurus |
Non-Patent Citations (2)
Title |
---|
BARRERO J. ET AL. An improved secretion signal enhances the secretion of model proteins from Pichia pastoris. Microbial Cell Factories, 2018, 17(161):1-13. doi:10.1186/s12934-018-1009-517. * |
NOSEDA D.G. ET AL. Cloning, expression and optimized production in a bioreactor of bovine chymosin B in Pichia (Komagataella) pastoris under AOX1 promoter. Protein Expr Purif. 2013 Dec;92(2):235-44. doi: 10.1016/j.pep.2013.08.018. ESPINOZA-MOLINA J.A. ET AL. Codon Optimization of the "Bos Taurus Chymosin" Gene for the Production of Recombinant Chymosin in Pichia pastoris. Mol Biotechnol. 2016 Oct;58(10):657-664. doi: 10.1007/s12033-016-9965-7. * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2815882C1 (ru) * | 2022-12-22 | 2024-03-25 | Федеральное государственное бюджетное учреждение "Национальный исследовательский центр "Курчатовский институт" | Трансформант Ogataea haglerorum - продуцент рекомбинантного химозина в активной форме |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mohanty et al. | Bovine chymosin: Production by rDNA technology and application in cheese manufacture | |
Christensen et al. | High level expression of recombinant genes in Aspergillus oryzae | |
JP2012105652A (ja) | 酸性糖鎖減少蛋白質の製造方法および該製造された糖蛋白質 | |
US10829748B2 (en) | Mutant lipase and use thereof | |
Li et al. | Overexpression of Candida rugosa lipase Lip1 via combined strategies in Pichia pastoris | |
JP3236862B2 (ja) | アスペルギルス・ニガーのカルボキシペプチダーゼをコードする遺伝子 | |
JP2004517643A (ja) | 酵母におけるTritirachiumalbum由来の組換えプロテイナーゼKの発現 | |
RU2676321C1 (ru) | Способ получения ферментного препарата фосфолипазы А2 с применением рекомбинантного штамма-продуцента Pichia pastoris X-33/ pPICZαA-PhoA2-StV | |
RU2779307C2 (ru) | Способ микробиологического синтеза прохимозина быка с использованием рекомбинантного штамма Pichia pastoris, содержащего синтетический ген варианта препрохимозина с модифицированной сигнальной последовательностью секреции | |
US20030166149A1 (en) | Method for production of hydroxylated collagen-like compounds | |
US10196624B2 (en) | Aspartic proteases | |
KR102181315B1 (ko) | 활성 개선된 리조무코르 미에헤이 유래 변이 리파제 및 효모를 이용한 재조합 생산 방법 | |
RU2769175C1 (ru) | Способ микробиологической продукции химозина быка с использованием рекомбинантного штамма Pichia pastoris, содержащего синтетический ген варианта химозина с коэкспрессией фактора HAC1 | |
BE1008738A3 (fr) | Systeme d'expression, vecteur d'integration et cellule transformee par ce vecteur d'integration. | |
RU2729403C1 (ru) | Рекомбинантная плазмида pET32-Trex Vic, обеспечивающая синтез химерного белка прохимозина Vicugna pacos, и штамм Escherichia coli BL21(DE3)pLysE pET32-Trx Vic-продуцент химерного белка прохимозина Vicugna pacos | |
JP4756743B2 (ja) | 真菌の菌糸の成長 | |
EP1515986B1 (en) | Improved method of producing an aspartic protease in a recombinant host organism | |
WO2014187269A1 (zh) | 发酵生产二聚体化融合蛋白的方法 | |
CN111172139B (zh) | 一种小牛皱胃凝乳酶及基因与菌株和应用 | |
RU2815882C1 (ru) | Трансформант Ogataea haglerorum - продуцент рекомбинантного химозина в активной форме | |
RU2814987C1 (ru) | Способ получения дрожжей K. kurtzmanii с улучшенной способностью к усвоению сорбитола | |
RU2805486C1 (ru) | Трансформант Komagataella phaffii - продуцент рекомбинантного химозина в активной форме | |
RU2668828C1 (ru) | Рекомбинантная плазмидная ДНК pPDGFB, кодирующая полипептид со свойствами фактора роста тромбоцитов-ВВ человека, и рекомбинантный штамм метилотрофных дрожжей Pichia pastoris - продуцент полипептида со свойствами фактора роста тромбоцитов-ВВ человека | |
KR100764839B1 (ko) | Lk8 단백질 생산용 사카로마이세스 세레비지애 | |
WO2024110509A1 (en) | Improved casein secretion by non-mammalian host cells |