CN1298742C - 一种适合于高效表达的融合蛋白及其生产方法 - Google Patents
一种适合于高效表达的融合蛋白及其生产方法 Download PDFInfo
- Publication number
- CN1298742C CN1298742C CNB038017652A CN03801765A CN1298742C CN 1298742 C CN1298742 C CN 1298742C CN B038017652 A CNB038017652 A CN B038017652A CN 03801765 A CN03801765 A CN 03801765A CN 1298742 C CN1298742 C CN 1298742C
- Authority
- CN
- China
- Prior art keywords
- peptide
- gly
- fusion rotein
- ala
- gly ser
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 20
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 20
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 9
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 71
- 150000001413 amino acids Chemical class 0.000 claims abstract description 23
- 230000004927 fusion Effects 0.000 claims description 63
- 108010075254 C-Peptide Proteins 0.000 claims description 47
- 238000000034 method Methods 0.000 claims description 34
- 235000001014 amino acid Nutrition 0.000 claims description 19
- 241000235648 Pichia Species 0.000 claims description 14
- 241000894006 Bacteria Species 0.000 claims description 10
- 239000013604 expression vector Substances 0.000 claims description 10
- 230000000968 intestinal effect Effects 0.000 claims description 8
- 102000003670 Carboxypeptidase B Human genes 0.000 claims description 6
- 108090000087 Carboxypeptidase B Proteins 0.000 claims description 6
- 108020001621 Natriuretic Peptide Proteins 0.000 claims description 3
- 102000004571 Natriuretic peptide Human genes 0.000 claims description 3
- 239000000427 antigen Substances 0.000 claims description 3
- 108091007433 antigens Proteins 0.000 claims description 3
- 102000036639 antigens Human genes 0.000 claims description 3
- 208000002672 hepatitis B Diseases 0.000 claims description 3
- 239000000692 natriuretic peptide Substances 0.000 claims description 3
- -1 α-atrial Proteins 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000000746 purification Methods 0.000 abstract description 4
- 238000005520 cutting process Methods 0.000 abstract description 3
- 238000009776 industrial production Methods 0.000 abstract 1
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 42
- 102000004190 Enzymes Human genes 0.000 description 32
- 108090000790 Enzymes Proteins 0.000 description 31
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 30
- 210000004027 cell Anatomy 0.000 description 28
- 108090000623 proteins and genes Proteins 0.000 description 24
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 16
- 108010038088 glutamyl-glycyl-seryl-leucyl-glutamine Proteins 0.000 description 16
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 16
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 15
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 15
- 239000000872 buffer Substances 0.000 description 13
- 102000004169 proteins and genes Human genes 0.000 description 13
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 12
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 11
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 11
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 11
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 11
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 11
- 238000000855 fermentation Methods 0.000 description 11
- 230000004151 fermentation Effects 0.000 description 11
- 108010029020 prolylglycine Proteins 0.000 description 11
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 10
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 10
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 10
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000011144 upstream manufacturing Methods 0.000 description 10
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 9
- 244000286779 Hansenula anomala Species 0.000 description 9
- 230000001939 inductive effect Effects 0.000 description 9
- 239000000178 monomer Substances 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 8
- 235000014683 Hansenula anomala Nutrition 0.000 description 8
- 239000006052 feed supplement Substances 0.000 description 8
- 230000006698 induction Effects 0.000 description 8
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 7
- 241000588724 Escherichia coli Species 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 150000003839 salts Chemical class 0.000 description 7
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 7
- 208000007342 Diabetic Nephropathies Diseases 0.000 description 6
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 6
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 6
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 6
- 208000033679 diabetic kidney disease Diseases 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000004128 high performance liquid chromatography Methods 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- XWTNPSHCJMZAHQ-QMMMGPOBSA-N 2-[[2-[[2-[[(2s)-2-amino-4-methylpentanoyl]amino]acetyl]amino]acetyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(=O)NCC(O)=O XWTNPSHCJMZAHQ-QMMMGPOBSA-N 0.000 description 5
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 5
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 5
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 5
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 5
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 5
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 5
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 5
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 5
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 5
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 5
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- 108010079364 N-glycylalanine Proteins 0.000 description 5
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 5
- 108010047495 alanylglycine Proteins 0.000 description 5
- 206010012601 diabetes mellitus Diseases 0.000 description 5
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 108010010147 glycylglutamine Proteins 0.000 description 5
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 108010009298 lysylglutamic acid Proteins 0.000 description 5
- 238000011020 pilot scale process Methods 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 108010090894 prolylleucine Proteins 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 235000011187 glycerol Nutrition 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 235000015097 nutrients Nutrition 0.000 description 4
- 235000018102 proteins Nutrition 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 230000009182 swimming Effects 0.000 description 4
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- CSTNMMIHMYJGFR-IHRRRGAJSA-N His-His-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CN=CN1 CSTNMMIHMYJGFR-IHRRRGAJSA-N 0.000 description 3
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 3
- RXWPLVRJQNWXRQ-IHRRRGAJSA-N Met-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 RXWPLVRJQNWXRQ-IHRRRGAJSA-N 0.000 description 3
- 229930003756 Vitamin B7 Natural products 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000007853 buffer solution Substances 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 108010028295 histidylhistidine Proteins 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 239000002994 raw material Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 239000011735 vitamin B7 Substances 0.000 description 3
- 235000011912 vitamin B7 Nutrition 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 2
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- 229930195725 Mannitol Natural products 0.000 description 2
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 239000003708 ampul Substances 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 239000012228 culture supernatant Substances 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 238000010612 desalination reaction Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 238000004255 ion exchange chromatography Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 239000000594 mannitol Substances 0.000 description 2
- 235000010355 mannitol Nutrition 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 238000012856 packing Methods 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 238000012807 shake-flask culturing Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- FRXSZNDVFUDTIR-UHFFFAOYSA-N 6-methoxy-1,2,3,4-tetrahydroquinoline Chemical compound N1CCCC2=CC(OC)=CC=C21 FRXSZNDVFUDTIR-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 101000976075 Homo sapiens Insulin Proteins 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 239000012564 Q sepharose fast flow resin Substances 0.000 description 1
- 229920005654 Sephadex Polymers 0.000 description 1
- 239000012507 Sephadex™ Substances 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 1
- 239000008351 acetate buffer Substances 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 230000003078 antioxidant effect Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 210000000227 basophil cell of anterior lobe of hypophysis Anatomy 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 239000004327 boric acid Substances 0.000 description 1
- 230000023852 carbohydrate metabolic process Effects 0.000 description 1
- 235000021256 carbohydrate metabolism Nutrition 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 239000012501 chromatography medium Substances 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 208000020832 chronic kidney disease Diseases 0.000 description 1
- GVPFVAHMJGGAJG-UHFFFAOYSA-L cobalt dichloride Chemical compound [Cl-].[Cl-].[Co+2] GVPFVAHMJGGAJG-UHFFFAOYSA-L 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical group P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 201000000523 end stage renal failure Diseases 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000005227 gel permeation chromatography Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000000713 mesentery Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000012452 mother liquor Substances 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 101710135378 pH 6 antigen Proteins 0.000 description 1
- 108010091748 peptide A Proteins 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 239000008057 potassium phosphate buffer Substances 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- TVXXNOYZHKPKGW-UHFFFAOYSA-N sodium molybdate (anhydrous) Chemical compound [Na+].[Na+].[O-][Mo]([O-])(=O)=O TVXXNOYZHKPKGW-UHFFFAOYSA-N 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013112 stability test Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/62—Insulins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/74—Fusion polypeptide containing domain for protein-protein interaction containing a fusion for binding to a cell surface receptor
- C07K2319/75—Fusion polypeptide containing domain for protein-protein interaction containing a fusion for binding to a cell surface receptor containing a fusion for activation of a cell surface receptor, e.g. thrombopoeitin, NPY and other peptide hormones
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Endocrinology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Diabetes (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明提供了一种适合于高效表达的新型融合蛋白及其生产方法。该融合蛋白结构式是:A-C1-K-(B-C2-K)n-D,其中A为上游肽,C1和C2各自独立地是长度为20—40氨基酸且序列中不含Lys的短肽;K是Lys;B是接头;D是下游肽;n为3—30的整数。该融合蛋白能在宿主细胞内高效、稳定地表达。表达产品的纯化、酶切工艺简便,可以高效地生产短肽,具有很高的产业化价值。
Description
技术领域
本发明涉及了基因工程领域。更具体地,本发明涉及一种适合于高效表达的融合蛋白及其生产方法。该融合蛋白特别适合高效生产不含赖氨酸的短肽。
背景技术
毕赤酵母和大肠杆菌这两种表达系统的适合表达的产物的分子量均在5到200KD左右。对于分子量在1到5KD的短多肽,或者不能表达,或者虽能表达,但通常情况下都存在表达量偏低的问题。
此外,低分子量的短肽表达产物还存在不易进行检测的问题。对于常规的SDS-PAGE电泳来说,常用分子量标准的分子量就在14到65KD。短肽的分子量在检测范围之外(SDS-PAGE电泳凝胶的浓度最高为20%左右,此浓度下检测的分子量线性范围在10到40KD),因此容易跑出凝胶而流失,无法得到准确的检验结果。
许多常见病可用短肽进行治疗。例如,糖尿病肾病(DN)是糖尿病患者常见的慢性并发症之一,并已成为终末期肾病(ESRD)的主要原因。约35%的1型糖尿病患者和15%的2型糖尿病患者最终将发展为糖尿病肾病。胰岛素原C肽是胰岛β细胞分泌的由31个氨基酸组成的多肽。研究已表明,胰岛素原C肽具有改善糖尿病远期并发症(包括糖尿病肾病)的作用。此外,研究还表明,C肽单独应用或与胰岛素联合应用,可以减少肾小球细胞外基质积聚导致系膜扩张。C肽的这一作用是其治疗糖尿病微血管病变包括糖尿病肾病的主要机制。因此在胰岛素中等控制糖代谢情况下,联合C肽治疗可以更明显改善糖尿病肾病的发生和发展。鉴于糖尿病患者人数众多,因此C肽等短肽药物的需求是很大。
目前国际市场上短肽类药物多为化学合成,价格昂贵。因此,迫切需要工艺简单、成本低廉的大规模生产短肽的基因工程方法。
多拷贝是一种提高短肽表达水平的有效手段。构建多拷贝基因可以表达较大分子量的融合蛋白,达到高效表达和易检测的目的。
对于高效表达的多拷贝融合蛋白或其编码基因,必须处理好以下问题:(a)目的基因(或目的蛋白)的选择;(b).长度(即拷贝数);(c).连接接头,所述的连接包括融合蛋白与表达质粒的连接、目的蛋白单体之间的连接、信号肽选择等;(d).表达后的酶切等。不恰当的选择都会影响表达水平,甚至使融合蛋白不能表达。
一种常见的方法是将多拷贝的短肽与分子量较大的肽(约10-20KD)融合,从而使表达的融合蛋白能稳定地在宿主细胞中存在。这种方法的缺点是,所需的短肽在融合蛋白中所占比例较小,因此效率不够高。此外,与GST等形成的融合蛋白在纯化时多一步酶切和纯化,工艺较复杂。
另一种理想的方法是将在多拷贝的短肽的上游和下游添加长度较短的上游序列和下游序列,这样可以显著提高短肽在融合蛋白中所占比例。但是目前用这种方法的所构建的融合蛋白大多不稳定,难以获得大量的表达产物。
因此,本领域迫切需要开发一种高效、稳定表达多拷贝短肽的方法。
发明内容
本发明的目的就是提供一种高效、稳定表达多拷贝短肽的方法。
本发明的另一目的是提供有关的融合蛋白、载体和宿主细胞。
在本发明的第一方面,提供了一种融合蛋白,其结构式是:
A-C1-K-(B-C2-K)n-D
其中A为MHHHHHHRSK(SEQ ID NO:4),
C1和C2各自独立地是长度为20-40氨基酸且序列中不含Lys的短肽;
K是Lys;
B是AGSK(SEQ ID NO:5);
D是长度为3-15个氨基酸且前3个氨基酸为AGS的下游肽;n为3-30的整数。
在另一优选例中,所述的C1和C2是相同的,更佳地C1和C2都是胰岛素原C肽。
在另一优选例中,所述的C1和C2是不同的,且两者的长度相差8-10个氨基酸。
在另一优选例中,所述的C1和C2选自:胰岛素原C肽、α-人心房钠尿肽、乙肝前S1抗原肽。
在另一优选例中,所述融合蛋白具有SEQ ID NO:2或3所示的氨基酸序列。
在本发明第二方面,提供了一种DNA分子,它编码本发明上述的融合蛋白。
在本发明第三方面,提供了一种表达载体,它含有本发明上述的DNA分子。
在本发明的第四方面,提供了一种宿主细胞,它含有本发明所述的表达载体,或者在其基因组中整合有本发明所述的DNA分子。较佳地,所述的宿主细胞是毕赤酵母或大肠杆菌。
在本发明的第五方面,提供了一种融合蛋白的生产方法,包括步骤:
(a)培养本发明所述的宿主细胞,从而表达所述的融合蛋白;
(b)分离融合蛋白。
在本发明的第六方面,提供了一种生产短肽的方法,包括步骤:
(c)用胰蛋白酶和羧肽酶B酶切本发明所述的融合蛋白,产生短肽C1和C2;
(d)分离短肽C1和C2。
较佳地,在所述的方法,所述的C1和C2是相同的,都是胰岛素原C肽。
附图说明
图1.毕赤酵母表达人胰岛素原C肽融合蛋白质粒构建图。
图2.毕赤酵母表达人胰岛素原C肽融合蛋白SDS-PAGE电泳图。泳道a:分子量标准(从上到下分子量为96KD、66KD、43KD、31KD、20.1KD、14.4KD);b:空白对照;c:培液上清(C肽融合蛋白)。
图3.大肠杆菌表达人胰岛素原C肽融合蛋白SDS-PAGE电泳图(摇瓶鉴定)。泳道a、b、c、d分别表示诱导时间为0小时、1小时、2小时和3小时(其中目的蛋白含量分别是:0%,11.47%,11.88%,12.36%);e:分子量标准(从上到下分子量为96KD、66KD、43KD、31KD、20.1KD、14.4KD);
图4.毕赤酵母发酵表达人胰岛素原C肽融合蛋白SDS-PAGE电泳图。泳道a:分子量标准(从上到下分子量为96KD、66KD、43KD、31KD、20.1KD、14.4KD);b.诱导前;c-g:诱导8、16、24、32、48hr。
图5.大肠杆菌发酵表达人胰岛素原C肽融合蛋白SDS-PAGE电泳图。泳道a、b、c、d分别表示诱导时间为0小时、1小时、2小时和3小时(其中目的蛋白含量分别是:0%,24.87%,27.89%,30.33%);e:分子量标准(从上到下分子量为96KD、66KD、43KD、31KD、20.1KD、14.4KD)。
图6显示了酶切后C肽的HPLC分析结果。
图7显示了纯化后C肽的HPLC分析结果。
具体实施方式
本发明人经过广泛而深入的研究发现,在多拷贝短肽上游添加上游肽MHHHHHHRSK(SEQ ID NO:4)所形成的A-C1-K-(B-C2-K)n-D的结构结合了多种优势,可以使融合蛋白在毕赤酵母或大肠杆菌中高效表达。在此基础上完成了本发明。
融合蛋白的结构
本发明融合蛋白为非天然的形式,整个融合蛋白中各元件线性连接且结构上一般不存在二硫键,因此融合蛋白呈线形结构,没有空间折叠,易被各种蛋白酶酶切。
(i)上游肽
在本发明通式为A-C1-K-(B-C2-K)n-D的融合蛋白中,对稳定高效表达起关键作用的元件是上游肽A,即MHHHHHHRSK(SEQ ID NO:4)。它使得含多拷贝元件C1-K-(B-C2-K)n的融合蛋白不仅能够表达,而且能够稳定存在于宿主细胞中。此外,由于上游元件的很短,因此融合蛋白中目的蛋白的比例很高。
(ii)短肽
在本发明融合蛋白中,C1和C2各自独立地是长度为10-40氨基酸的短肽。由于在将融合蛋白切割为短肽时,使用针对碱性氨基酸如赖氨酸(Lys)的酶(如胰蛋白酶、羧肽酶B等),因此C1和C2的序列中不可含有碱性氨基酸如Lys和Arg。合适的例子包括胰岛素原C肽(31aa)、α-人心房钠尿肽(28aa)、乙肝前S1抗原肽(28aa)等。
C1和C2可相同,也可不同。当两者相同时,融合蛋白被切割后就形成长度为20-40氨基酸的所需的短肽,以及长度为4-15氨基酸的接头、上游肽和下游肽。由于长度不同,因此可以方便地纯化出短肽。一种优选情况是C1和C2都是胰岛素原C肽。
当C1和C2不同时,两者的长度宜相差8-10个氨基酸,以便在切割后将C1和C2分离开。当然,如果C1和C2是可以联用的两种短肽,那么就不一定需要将两者分开,此时C1和C2可以没有长度差异。
在本发明融合蛋白中,n为3-30的整数,较佳地,n为5-25的整数,更佳地为8-15的整数。此时,融合蛋白的分子量约为6-60KD,适合毕赤酵母和大肠杆菌表达系统。当然,对于其他适合表达系统,n的上限可以超过20,例如25,30,35,40甚至更高。
(iii)接头
在本发明融合蛋白中,B为接头。接头的长度通常为4-10个氨基酸。长度越短,则短肽在融合蛋白中的比例越高,而且短肽与接头的长度差越大从而更有利于分离,因此短接头更适用于本发明。此外,接头的羧基端应为Lys或Arg。一种优选的接头是AGSK(SEQ ID NO:5)。
(iv)下游肽
在本发明融合蛋白中,D是下游肽,其作用是与下游肽之前的Lys一起提供羧肽酶的酶切位点。有时,下游肽的编码序列还可提供用于克隆操作的限制性位点。
下游肽是可有可无的。当B为AGSK(SEQ ID NO:5)时,D宜为长度3-15个氨基酸,且前3个氨基酸为AGS的下游肽。合适的例子包括(但并不限于):AGSLNSLGRPRINS(SEQID NO:6)、AGSLNSP(SEQ ID NO:7)。
融合基因、载体和宿主细胞的构建
在本发明中,一旦确定了融合蛋白的序列,则融合基因、载体和宿主细胞的构建都可按常规方法进行。适用于本发明的载体和宿主细胞没有特别限制。
通常,先根据本发明融合蛋白的氨基酸序列设计出编码DNA。较佳地,可根据选用的宿主细胞如毕赤酵母或大肠杆菌,进行密码子优化。
然后,选择表达载体,如毕赤酵母系统的pPIC9或pPIC9K,或大肠杆菌系统的pET30(a)等,并且根据选定的载体,设计酶切位点。
接着,全合成所设计的融合蛋白编码序列,酶切后克隆入表达载体。
最后,用常规方法将表达载体转染毕赤酵母或转化大肠杆菌,经过抗性筛选等方法,就可获得高表达的宿主细胞。
融合蛋白的生产和纯化
对于转化的表达融合蛋白的宿主细胞,可用常规方法和条件进行培养,从而表达出融合蛋白,并用常规方法(如盐析方法、离心、分子筛层析、吸附层析、离子交换层析、HPLC等)进行分离纯化。
以毕赤酵母培养与表达为例,合适的培养基包括(但并不限于)以下培养基:
YPD平板 | 酵母提取物 | 1% |
蛋白胨 | 2% | |
葡萄糖 | 2% | |
琼脂 | 1% | |
BMGY培养基 | 酵母提取物 | 1% |
蛋白胨 | 2% | |
磷酸钾缓冲液,pH 6.0 | 100mM | |
YNB | 1.34% | |
生物素 | (4×10-5)% | |
甘油 | 1% | |
MM培养液 | YNB | 1.34% |
生物素 | (4×10-5)% | |
甲醇 | 0.5% |
一种优选的摇瓶培养条件是:挑取YPD平板上的单克隆,以BMGY为摇瓶培养液,培养至OD6002-20,加入1%浓度甲醇诱导表达,诱导24小时后,培液上清的目的蛋白浓度可达到50-200mg/L。
为了中试和大规模生产,需要对P.Pastoris工程细胞的中试表达与表达条件进行优化。中试发酵指的是发酵罐发酵。优选的生产条件如下:
1.对于培养基的选择而言,发酵罐发酵时可选择低盐培养基,也可在低盐培养基基础上进行一定更改,但所含离子成份与低盐培养基相似。
低盐发酵培养基 | H3PO4(85%储存浓度) | 26.7ml/L |
CaSO4·2H2O | 0.93g/L | |
K2SO4 | 18.2g/L | |
MgSO4 | 7.27g/L | |
KOH(固体) | 4.13g/L | |
柠檬酸钠.2H2O | 1.47g/L | |
PTM1 | 2ml/L | |
甘油 | 4%(w/v) | |
PTM1 | CuSO4.5H2O | 6g/L |
KI | 0.08g/L | |
MnSO4.H2O | 3g/L | |
钼酸钠 | 0.2g/L | |
硼酸 | 0.02g/L | |
CaSO4.2H2O | 0.5g/L | |
ZnCl2 | 20g/L | |
氯化钴 | 0.5g/L | |
FeSO4 | 65g/L | |
生物素 | 0.2g/L | |
H2SO4 | 5ml/L |
2.就温度的控制而言,发酵及诱导温度保持在25-31℃。
3.就诱导期的pH值而言,诱导期pH控制在4-8,较佳地为pH5-7。
4.就溶氧(DO)的控制而言DO控制在20-90%。溶氧的维持可以用氧气/空气混合气体的通入来解决。
5.就补料的流加而言,补料种类宜包括甘油、甲醇、葡萄糖等糖原,可单独补料或混合补料。
6.就PTM1(混合微量元素)的量:起始培养阶段PTM1的量为1-4ml/L培液,在补料阶段加入量为2-20ml/L补料。
7.就诱导期甲醇浓度而言,常规诱导浓度都可用于本发明,通常甲醇浓度控制在0.5-2%。
8.就诱导时间而言,通常为10-100小时,较佳地为20-60小时。
短肽单体的制备
本发明的融合蛋白是制备短肽单体的优良原料。经过酶切和分离,就可得到短肽单体。
通常,所用的酶是针对碱性氨基酸的酶,如胰蛋白酶、羧肽酶B等。酶切的方法可用二步法,即先酶切形成带K的短肽(如C1K或C2K),再将K切除,得到短肽单体。也可使用单步法,即用双酶混合酶切,直接获得短肽单体。
酶切的条件没有特别限制,可采用常规条件。例如
融合蛋白浓度是0.1-100mg/ml,较佳地1-50mg/ml;
酶与蛋白比例是1∶10-1∶5000,较佳地,1∶50-1∶500;
酶切温度是15-35℃,较佳地20-30℃;
酶切pH是5.0-10.0,较佳地6.0-9.0;
缓冲体系是磷酸盐缓冲液、醋酸盐缓冲液、Tris、或碳酸盐缓冲液,缓冲液浓度10-200mM;
酶切时间是1-50小时,较佳地1-10小时。
对于酶切混合物,可用常规技术(如阳离子交换层析、阴离子交换层析、凝胶过滤层析、疏水层析、反相层析、亲和层析等)纯化短肽单体。优选方法是将酶切后的样品进行离子交换层析、疏水层析和反相层析。
对于制备的短肽单体,可用常规方法将其制成相应的制剂。例如当短肽是胰岛素原C肽时,可在纯化后的原液加入适当辅料,如1-10%甘露醇(或蔗糖、乳糖等)稳定剂,同时还可添加表面活性剂、抗氧化剂等保护剂,及适当缓冲液,分装,制成C肽水溶液剂,或者冷冻抽干,制成C肽的注射用粉针剂。
本发明的主要优点在于:
i.表达量高且稳定;
ii.短肽(如人胰岛素原C肽)的产量高;
iii.制备方法简单,易纯化所以成本低;
iv.目的蛋白若用真核细胞表达系统-毕赤酵母进行表达,与哺乳动物有较强同源性,产生的毒副作用较少。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1毕赤酵母表达人胰岛素原C肽融合蛋白-工程细胞的构建方法
在本实施例中,选择C1=C2=胰岛素原C肽,n=8。
1.融合蛋白全长氨基酸序列为:
MHHHHHHRSK
EAEDLQVGQVELGGGPGAGSLQPLALEGSLQK
AGSKEAEDLQVGQVELGGGPG AGSLQPLALEGSLQK
AGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQK
AGSKEAEDLQVGQVEL GGGPGAGSLQPLALEGSLQK
AGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQK
AGSKEAEDLQV GQVELGGGPGAGSLQPLALEGSLQK
AGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQK
AGSKEA EDLQVGQVELGGGPGAGSLQPLALEGSLQK
AGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQKAGSLNSLGRPRINS(SEQ ID NO:2)
2.构建
根据SEQ ID NO:2,并根据毕赤酵母密码子偏爱性,全合成该融合蛋白的基因序列(两端加上EcoRI位点),如SEQ ID NO:1所示,其中,ORF为第25-1056位,并且在该序列下游立刻是终止密码子。
将该基因克隆到pUC19中测序验证后,用EcoRI酶切,克隆入待同样用EcoRI酶切的质粒pPIC9(Invitrogen公司)。然后,转化、整合入毕赤酵母(P.Pastoris)GS115(Invitrogen公司)的染色体,通过点杂交筛选出多拷贝整合的转化细胞,进而筛选出工程细胞(图1)。工程细胞可以是快速利用甲醇型(Mut+)或慢速利用甲醇型(Muts)。
3.表达
经过筛选,最后得到高效表达株(经检验,其基因拷贝整合数≥20个)。BMGY培养液摇瓶试验表明,诱导24小时后,培养上清目的蛋白占总蛋白50%以上,表达水平100ug/ml以上(图2)。根据其消耗甲醇的速度,判断此工程细胞株为Mut+。
实施例2毕赤酵母表达人胰岛素原C肽融合蛋白-工程细胞的构建方法
在本实施例中,选择C1=C2=胰岛素原C肽,n=11。
该与实施例1相同的方法构建第二种融合蛋白,不同点仅在于下游肽D不同。
MHHHHHHRSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQKAGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQKAGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQKAGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQKAGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQKAGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQKAGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQKAGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQKAGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQKAGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQKAGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQKAGSKEAEDLQVGQVELGGGPGAGSLQPLALEGSLQKAGSLNSP(SEQ ID NO:3)
经过筛选,也得到高效表达株(经检验,其基因拷贝整合数≥20个)。BMGY培养液摇瓶试验表明,诱导24小时后,培养上清目的蛋白占总蛋白50%以上,表达水平100ug/ml以上。根据其消耗甲醇的速度,判断此工程细胞株为Mut+。
实施例3毕赤酵母表达人胰岛素原C肽融合蛋白-工程细胞的构建方法
在本实施例中,比较了毕赤酵母表达人胰岛素原C肽融合蛋白的几种方案。
方案1是实施例1。
方案2中融合蛋白的结构是:(His)6-Lys-C肽-Lys-C肽-Lys。
方案3中融合蛋白的结构与实施例1基本相同,不同点仅在于n=4。
结果表明,方案2表达目的产物得到的量很低,难以检测出来。这表明,6His的上游肽以及连接肽的设计形成一个有利于高表达和分泌的构象。方案3得到了所需的表达蛋白。
实施例4.大肠杆菌表达人胰岛素原C肽融合蛋白-工程细胞的构建方法
选择合适的表达载体和宿主菌系统:表达载体质粒pET-30a(+)来自Novagen公司,受体菌为大肠杆菌BL21(DE3)。
实施例1中的融合蛋白基因序列经查证没有大肠杆菌特别稀有的密码子,将该基因克隆到pUC19中测序验证后,克隆入表达载体pET-30a(+)中。测序确认没有表达框改变后,转化入大肠杆菌BL21(DE3),获得工程菌。
接种确证的工程菌株于10mL LB(卡那霉素浓度为100μg/mL)培养液中,在37℃,250rpm条件下培养至OD600=0.5-1.0,此时细胞处于对数生长期;无菌条件下加入IPTG至终浓度为1mM,继续在37℃,250rpm条件下诱导表达,3小时后取样,SDS-PAGE检测,在41KD处有目的蛋白表达(图3)。
实施例5.毕赤酵母表达人胰岛素原C肽融合蛋白的中试发酵
实施例1所得的毕赤酵母工程细胞用以下方法发酵:
NBS BioFlo 3000发酵罐(5L):
1.种子液:BMGY培养基
2.发酵培养基:低盐发酵培养基
3.发酵培养阶段:
温度:30℃
pH:5.0
DO:≥30%
甲醇诱导前湿细胞重:88g/L
4.发酵诱导阶段:
温度:30℃
pH:6.5
DO:≥20%
甲醇补料中PTM1量10ml/L
甲醇诱导结束湿细胞重:257g/L
在培养阶段后期,甘油被耗尽后流加甲醇进行诱导,整个诱导过程甲醇浓度控制在0.5-1%,诱导时间20-50小时。
诱导48小时后,人胰岛素原C肽融合蛋白表达量占发酵上清液总蛋白47%,表达量达1mg/ml(用改良Lowry法测)(图4)。
实施例6大肠杆菌表达人胰岛素原C肽融合蛋白的中试发酵
实施例4所得的大肠杆菌工程细胞用以下方法发酵:
NBS BioFlo 3000发酵罐(5L):
1.种子液:LB培养基
2.发酵培养基:M9培养基(3.5L)
3.发酵培养阶段:
温度:37℃
pH:7.0
DO:80%
诱导前OD600:1.52
4.发酵诱导阶段:
温度:35℃
pH:6.5
DO:50%
葡萄糖补料中微量元素母液(PTM)的量:10ml/L
IPTG诱导结束OD600:5.72
在培养阶段后期,OD600上升到1.5左右,一次性加入IPTG进行诱导。IPTG终浓度为1mM。整个诱导过程通过流加葡萄糖补料来控制在pH在6.9到7.2范围内,诱导时间3小时。
诱导3小时后,离心,得到25.7克菌体。人胰岛素原C肽融合蛋白表达量占发酵菌体总蛋白35%,蛋白含量为1.02mg/ml(用改良Lowry法测)。目的蛋白总量为1.25克,表达量达0.357g/L发酵液(图5)。
实施例7.毕赤酵母表达人胰岛素原C肽融合蛋白—酶切
实施例5所得的毕赤酵母工程细胞表达产物上清经初步纯化,进行单步法酶切,酶切条件如下:
所用的酶:TPCK-胰蛋白酶(Sigma)、羧肽酶B(Sigma公司)
缓冲体系10mM PB(pH7.4)
C肽融合蛋白与TPCK-胰蛋白酶比例200∶1(W/W)
C肽融合蛋白与羧肽酶B比例200∶1(W/W)
酶切温度:25℃
酶切时间:6小时。
酶切得到的C肽经HPLC分析,HPLC鉴定条件如下:
C18分析柱Ф4.6*250mm
λ:230nm
缓冲液A:0.1%TFA 缓冲液B:0.08%TFA 70%乙腈
梯度: 0-5min 0%缓冲液B
5-10min 30%缓冲液B
10-30min 60%缓冲液B
30-31min 100%缓冲液B
结果如图6所示,酶切的主要产物的保留时间为27±1min,与C肽单体的保留时间相符,这表明酶切后产生了C肽单体。
实施例8.酶切产物纯化
实施例7所得的酶切产物经过纯化,具体条件如下:
层析介质:Q-Sepharose FF(Pharmacia)
缓冲液A:10mM PB缓冲液B:10mMPB+1M NaCl
梯度:0-100%缓冲液B 20柱体积
流速:60cm/h
将实施例7所得的酶切产物超滤或是透析以脱盐和去少部分杂质。然后,将此样品上样,上样完毕后用缓冲液A冲洗至UV基线平稳,而后使用线形梯度,用20CV使B%从0-100。在20%B浓度左右出现样品,分管收集。样品回收率达到60%以上,纯度达到95%以上。
由于此样品盐浓度较高,将收集的样品使用G-50 Sephadex脱盐,使用缓冲液A为缓冲液,样品回收率在90%以上,HPLC纯度在98%以上(图7)。
样品经鉴定,其序列与天然人胰岛素原C肽完全相同,证实获得的是人胰岛素原C肽。
实施例9纯化产物的制剂
对实施例8中获得的纯化后原液加入10%甘露醇,分装,冷冻抽干,制成C肽的注射用粉针剂。经稳定性试验表明,该粉针剂稳定。经活性测定表明,本发明方法制得的人胰岛素原C肽的活性与标准品相同。
工业实用性
综上所述,通过毕赤酵母等表达系统来表达本发明的融合蛋白,其优点在于:高表达、高稳定,而且制得的融合蛋白经简单酶切和分离后即可C肽等短肽单体。本发明方法使工艺复杂程度大大降低,产率得到较大提高,特别适合大规模生产C肽等短肽。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110>上海新药研究开发中心
上海新生源医药研究有限公司
上海益众生物技术有限公司
<120>一种适合于高效表达的融合蛋白及其生产方法
<130>030255
<160>7
<170>PatentIn version 3.1
<210>1
<211>1056
<212>DNA
<213>人工序列
<400>1
gaggctgaag cttacgtaga attcatgcat catcatcatc atcatagatc taaggaagct 60
gaagatttgc aagttggtca agttgaattg ggtggtgggc ccggtgctgg ttctttgcaa 120
ccattggctt tggaaggttc tttgcaaaag gctggatcta aggaagctga agatttgcaa 180
gttggtcaag ttgaattggg tggtgggccc ggtgctggtt ctttgcaacc attggctttg 240
gaaggttctt tgcaaaaggc tggatctaag gaagctgaag atttgcaagt tggtcaagtt 300
gaattgggtg gtgggcccgg tgctggttct ttgcaaccat tggctttgga aggttctttg 360
caaaaggctg gatctaagga agctgaagat ttgcaagttg gtcaagttga attgggtggt 420
gggcccggtg ctggttcttt gcaaccattg gctttggaag gttctttgca aaaggctgga 480
tctaaggaag ctgaagattt gcaagttggt caagttgaat tgggtggtgg gcccggtgct 540
ggttctttgc aaccattggc tttggaaggt tctttgcaaa aggctggatc taaggaagct 600
gaagatttgc aagttggtca agttgaattg ggtggtgggc ccggtgctgg ttctttgcaa 660
ccattggctt tggaaggttc tttgcaaaag gctggatcta aggaagctga agatttgcaa 720
gttggtcaag ttgaattggg tggtgggccc ggtgctggtt ctttgcaacc attggctttg 780
gaaggttctt tgcaaaaggc tggatctaag gaagctgaag atttgcaagt tggtcaagtt 840
gaattgggtg gtgggcccgg tgctggttct ttgcaaccat tggctttgga aggttctttg 900
caaaaggctg gatctaagga agctgaagat ttgcaagttg gtcaagttga attgggtggt 960
gggcccggtg ctggttcttt gcaaccattg gctttggaag gttctttgca aaaggctgga 1020
tccctgaatt ccctagggcg gccgcgaatt aattcg 1056
<210>2
<211>344
<212>PRT
<213>人工序列
<400>2
Met His His His His His His Arg Ser Lys Glu Ala Glu Asp Leu Gln
1 5 10 15
Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln
20 25 30
Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Ala Gly Ser Lys Glu Ala
35 40 45
Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
50 55 60
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Ala Gly
65 70 75 80
Ser Lys Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly
85 90 95
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
100 105 110
Gln Lys Ala Gly Ser Lys Glu Ala Glu Asp Leu Gln Val Gly Gln Val
115 120 125
Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu
130 135 140
Glu Gly Ser Leu Gln Lys Ala Gly Ser Lys Glu Ala Glu Asp Leu Gln
145 150 155 160
Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln
165 170 175
Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Ala Gly Ser Lys Glu Ala
180 185 190
Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
195 200 205
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Ala Gly
210 215 220
Ser Lys Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly
225 230 235 240
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
245 250 255
Gln Lys Ala Gly Ser Lys Glu Ala Glu Asp Leu Gln Val Gly Gln Val
260 265 270
Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu
275 280 285
Glu Gly Ser Leu Gln Lys Ala Gly Ser Lys Glu Ala Glu Asp Leu Gln
290 295 300
Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln
305 310 315 320
Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Ala Gly Ser Leu Asn Ser
325 330 335
Leu Gly Arg Pro Arg Ile Asn Ser
340
<210>3
<211>445
<212>PRT
<213>人工序列
<400>3
Met His His His His His His Arg Ser Lys Glu Ala Glu Asp Leu Gln
1 5 10 15
Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln
20 25 30
Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Ala Gly Ser Lys Glu Ala
35 40 45
Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
50 55 60
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Ala Gly
65 70 75 80
Ser Lys Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly
85 90 95
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
100 105 110
Gln Lys Ala Gly Ser Lys Glu Ala Glu Asp Leu Gln Val Gly Gln Val
115 120 125
Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu
130 135 140
Glu Gly Ser Leu Gln Lys Ala Gly Ser Lys Glu Ala Glu Asp Leu Gln
145 150 155 160
Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln
165 170 175
Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Ala Gly Ser Lys Glu Ala
180 185 190
Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
195 200 205
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Ala Gly
210 215 220
Ser Lys Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly
225 230 235 240
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
245 250 255
Gln Lys Ala Gly Ser Lys Glu Ala Glu Asp Leu Gln Val Gly Gln Val
260 265 270
Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu
275 280 285
Glu Gly Ser Leu Gln Lys Ala Gly Ser Lys Glu Ala Glu Asp Leu Gln
290 295 300
Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln
305 310 315 320
Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Ala Gly Ser Lys Glu Ala
325 330 335
Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
340 345 350
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Ala Gly
355 360 365
Ser Lys Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly
370 375 380
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
385 390 395 400
Gln Lys Ala Gly Ser Lys Glu Ala Glu Asp Leu Gln Val Gly Gln Val
405 410 415
Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu
420 425 430
Glu Gly Ser Leu Gln Lys Ala Gly Ser Leu Asn Ser Pro
435 440 445
<210>4
<211>10
<212>PRT
<213>人工序列
<220>
<221>MISC_FEATURE
<222>(1)..(10)
<223>上游肽
<400>4
Met His His His His His His Arg Ser Lys
1 5 10
<210>5
<211>4
<212>PRT
<213>人工序列
<220>
<221>MISC_FEATURE
<222>(1)..(4)
<223>接头
<400>5
Ala Gly Ser Lys
1
<210>6
<211>14
<212>PRT
<213>人工序列
<220>
<221>MISC_FEATURE
<222>(1)..(14)
<223>下游肽
<400>6
Ala Gly Ser Leu Asn Ser Leu Gly Arg Pro Arg Ile Asn Ser
1 5 10
<210>7
<211>7
<212>PRT
<213>人工序列
<220>
<221>MISC_FEATURE
<222>(1)..(7)
<223>下游肽
<400>7
Ala Gly Ser Leu Asn Ser Pro
1 5
Claims (11)
1.一种融合蛋白,其特征在于,其结构式是:
A-C1-K-(B-C2-K)n-D
其中A为MHHHHHHRSK(SEQ ID NO:4),
C1和C2各自独立地是长度为20-40氨基酸且序列中不含Lys的短肽;
K是Lys;
B是AGSK(SEQ ID NO:5);
D是长度为3-15个氨基酸且前3个氨基酸为AGS的下游肽;
n为3-30的整数。
2.如权利要求1所述的蛋白,其特征在于,所述的C1和C2是相同的。
3.如权利要求1所述的蛋白,其特征在于,所述的C1和C2是不同的,且两者的长度相差8-10个氨基酸。
4.如权利要求1所述的蛋白,其特征在于,所述的C1和C2选自:胰岛素原C肽、α-人心房钠尿肽、乙肝前S1抗原肽。
5.如权利要求1所述的蛋白,其特征在于,具有SEQ ID NO:2或3所示的氨基酸序列。
6.一种DNA分子,其特征在于,它编码权利要求1所述的融合蛋白。
7.一种表达载体,其特征在于,它含有权利要求6所述的DNA分子。
8.一种宿主细胞,其特征在于,它含有权利要求7所述的表达载体,或者在其基因组中整合有权利要求6所述的DNA分子。
9.如权利要求8所述的宿主细胞,其特征在于,所述的宿主细胞是毕赤酵母或大肠杆菌。
10.一种融合蛋白的生产方法,其特征在于,包括步骤:
(a)培养权利要求8所述的宿主细胞,从而表达所述的融合蛋白;
(b)分离融合蛋白。
11.一种生产短肽的方法,其特征在于,包括步骤:
(i)用胰蛋白酶和羧肽酶B酶切权利要求1所述的融合蛋白,产生短肽C1和C2;
(ii)分离短肽C1和C2。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2003/000426 WO2004106525A1 (fr) | 2003-06-03 | 2003-06-03 | Proteine de fusion pouvant etre exprimee tres efficacement et son procede de production |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1606570A CN1606570A (zh) | 2005-04-13 |
CN1298742C true CN1298742C (zh) | 2007-02-07 |
Family
ID=33480372
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB038017652A Expired - Fee Related CN1298742C (zh) | 2003-06-03 | 2003-06-03 | 一种适合于高效表达的融合蛋白及其生产方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7795384B2 (zh) |
CN (1) | CN1298742C (zh) |
AU (1) | AU2003244053A1 (zh) |
WO (1) | WO2004106525A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2003244053A1 (en) * | 2003-06-03 | 2005-01-21 | Shanghai Centre Of Research And Development Of New Drugs | A fusion protein suitable to be expressed high effectively and the production method thereof |
GB201214746D0 (en) * | 2012-08-17 | 2012-10-03 | Cancer Rec Tech Ltd | Biomolecular complexes |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993010152A1 (en) * | 1991-11-16 | 1993-05-27 | Smithkline Beecham Biologicals S.A. | HYBRID PROTEIN BETWEEN CS FROM PLASMODIUM AND HBsAG |
EP0281418B1 (en) * | 1987-03-04 | 1995-01-11 | Suntory Limited | Process for production of physiologically active peptide containing cysteine residue |
WO1997011186A1 (de) * | 1995-09-23 | 1997-03-27 | Boehringer Mannheim Gmbh | Verfahren zur herstellung von natriuretischen peptiden über streptavidin-fusionsproteine |
CN1049248C (zh) * | 1990-04-21 | 2000-02-09 | 赫彻斯特股份公司 | 用链霉菌制备外源蛋白的方法 |
WO2000017336A1 (en) * | 1998-09-19 | 2000-03-30 | Sang Jun Lee | Dna cassette encoding a multimer of a biologically active peptide and a cleavable linker attached thereto and process for preparing the biologically active peptide |
CN1350584A (zh) * | 1999-04-30 | 2002-05-22 | 伊藤火腿株式会社 | 从新的融合蛋白制造重组胰岛素的方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5210872B2 (zh) * | 1973-07-14 | 1977-03-26 | ||
US5028524A (en) * | 1987-04-24 | 1991-07-02 | Takeda Chemical Industries, Ltd. | Assay for anti-pre-S antibody |
GB9716790D0 (en) * | 1997-08-07 | 1997-10-15 | Creative Peptides Sweden Ab | Recombinant DNA molecules comprising multimeric copies of a gene sequence and expression thereof |
AU2003244053A1 (en) * | 2003-06-03 | 2005-01-21 | Shanghai Centre Of Research And Development Of New Drugs | A fusion protein suitable to be expressed high effectively and the production method thereof |
-
2003
- 2003-06-03 AU AU2003244053A patent/AU2003244053A1/en not_active Abandoned
- 2003-06-03 US US10/559,059 patent/US7795384B2/en not_active Expired - Fee Related
- 2003-06-03 CN CNB038017652A patent/CN1298742C/zh not_active Expired - Fee Related
- 2003-06-03 WO PCT/CN2003/000426 patent/WO2004106525A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0281418B1 (en) * | 1987-03-04 | 1995-01-11 | Suntory Limited | Process for production of physiologically active peptide containing cysteine residue |
CN1049248C (zh) * | 1990-04-21 | 2000-02-09 | 赫彻斯特股份公司 | 用链霉菌制备外源蛋白的方法 |
WO1993010152A1 (en) * | 1991-11-16 | 1993-05-27 | Smithkline Beecham Biologicals S.A. | HYBRID PROTEIN BETWEEN CS FROM PLASMODIUM AND HBsAG |
WO1997011186A1 (de) * | 1995-09-23 | 1997-03-27 | Boehringer Mannheim Gmbh | Verfahren zur herstellung von natriuretischen peptiden über streptavidin-fusionsproteine |
WO2000017336A1 (en) * | 1998-09-19 | 2000-03-30 | Sang Jun Lee | Dna cassette encoding a multimer of a biologically active peptide and a cleavable linker attached thereto and process for preparing the biologically active peptide |
CN1350584A (zh) * | 1999-04-30 | 2002-05-22 | 伊藤火腿株式会社 | 从新的融合蛋白制造重组胰岛素的方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2004106525A1 (fr) | 2004-12-09 |
US7795384B2 (en) | 2010-09-14 |
AU2003244053A8 (en) | 2005-01-21 |
CN1606570A (zh) | 2005-04-13 |
AU2003244053A1 (en) | 2005-01-21 |
US20080045695A1 (en) | 2008-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1132845C (zh) | 获得具有正确键合的胱氨酸键的胰岛素前体的改进的方法 | |
CN1253574C (zh) | 来自米曲霉的areA基因和其中areA基因已被修饰的真菌 | |
CN1117151C (zh) | 真菌中的核黄素生物合成 | |
CN1079836C (zh) | 通过发酵生产l-赖氨酸及l-谷氨酸的方法 | |
CN1195859C (zh) | 修饰化人源粒细胞-集落刺激因子及其制备方法 | |
CN1152955C (zh) | 生产蛋白酶的方法 | |
CN1192037C (zh) | 用于由大肠杆菌向培养基中分泌来制备Leu-水蛭素的信号序列 | |
CN1301307A (zh) | 在丝状真菌突变细胞中生产多肽的方法 | |
CN1958794A (zh) | 人肿瘤坏死因子相关凋亡诱导配体突变体编码cDNA及制备方法和应用 | |
CN1262644C (zh) | 一种腈水合酶及其编码基因与应用 | |
CN1156575C (zh) | 分泌人粒细胞集落刺激因子(g-csf)的大肠杆菌菌株 | |
CN1228447C (zh) | 一种含有人胰腺组织激肽释放酶成熟蛋白基因的重组表达载体 | |
CN1298742C (zh) | 一种适合于高效表达的融合蛋白及其生产方法 | |
CN1213402A (zh) | 表层蛋白的重组表达 | |
CN1814761A (zh) | 吡咯喹啉醌合成相关基因及其编码蛋白 | |
CN1289523C (zh) | 水稻钾、钠离子转运基因及其应用 | |
CN87101797A (zh) | 与甲醇和葡萄糖相应答的酵母菌调节区 | |
CN1626554A (zh) | 人血清白蛋白与白细胞介素2的融合蛋白及其编码基因 | |
CN1896104A (zh) | 细胞抑制因子与白蛋白的融合蛋白 | |
CN1769456A (zh) | 重组人那希力肽的生产方法 | |
CN1216989C (zh) | 一种新的青霉素g酰化酶及其应用 | |
CN1149291C (zh) | 利用来自酿酒酵母的表达载体制备重组蛋白质的方法 | |
CN100338091C (zh) | 编码新的融合蛋白的dna和通过该dna的表达来制备有用的多肽的方法 | |
CN1547610A (zh) | 用于生长激素高表达的dna及其应用 | |
CN1186448C (zh) | 重组人α胸腺素原-白介素2基因及其表达、应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070207 Termination date: 20120603 |