CN117801123B - 沃索利肽可溶性中间体、中间体制备方法及沃索利肽的制备方法 - Google Patents
沃索利肽可溶性中间体、中间体制备方法及沃索利肽的制备方法 Download PDFInfo
- Publication number
- CN117801123B CN117801123B CN202410229257.8A CN202410229257A CN117801123B CN 117801123 B CN117801123 B CN 117801123B CN 202410229257 A CN202410229257 A CN 202410229257A CN 117801123 B CN117801123 B CN 117801123B
- Authority
- CN
- China
- Prior art keywords
- suoli
- peptide
- protein
- seq
- site
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 135
- 238000002360 preparation method Methods 0.000 title claims abstract description 19
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 101
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 95
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims description 35
- 229920001184 polypeptide Polymers 0.000 claims description 32
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 26
- 239000002773 nucleotide Substances 0.000 claims description 21
- 125000003729 nucleotide group Chemical group 0.000 claims description 21
- 239000013612 plasmid Substances 0.000 claims description 17
- 239000002253 acid Substances 0.000 claims description 13
- 210000004027 cell Anatomy 0.000 claims description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 12
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 7
- 241000588724 Escherichia coli Species 0.000 claims description 6
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 abstract description 8
- 235000018102 proteins Nutrition 0.000 description 77
- 239000000543 intermediate Substances 0.000 description 33
- 235000001014 amino acid Nutrition 0.000 description 27
- 229940024606 amino acid Drugs 0.000 description 24
- 150000001413 amino acids Chemical class 0.000 description 24
- 108020001507 fusion proteins Proteins 0.000 description 24
- 102000037865 fusion proteins Human genes 0.000 description 24
- 238000003776 cleavage reaction Methods 0.000 description 20
- 230000007017 scission Effects 0.000 description 20
- 238000005520 cutting process Methods 0.000 description 16
- 102000004190 Enzymes Human genes 0.000 description 14
- 108090000790 Enzymes Proteins 0.000 description 14
- 210000003000 inclusion body Anatomy 0.000 description 14
- 230000000052 comparative effect Effects 0.000 description 13
- 238000001514 detection method Methods 0.000 description 13
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 12
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 12
- 235000003704 aspartic acid Nutrition 0.000 description 10
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 10
- 238000001962 electrophoresis Methods 0.000 description 10
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 9
- 238000000746 purification Methods 0.000 description 9
- 238000004153 renaturation Methods 0.000 description 9
- 101710118538 Protease Proteins 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 239000006228 supernatant Substances 0.000 description 8
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 108010075254 C-Peptide Proteins 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 101150045458 KEX2 gene Proteins 0.000 description 4
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 230000002209 hydrophobic effect Effects 0.000 description 4
- 238000001819 mass spectrum Methods 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 229950010005 vosoritide Drugs 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 239000003398 denaturant Substances 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 150000007523 nucleic acids Chemical group 0.000 description 3
- 239000013049 sediment Substances 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- IGYWDDBBJPSOTG-WBAGYEQSSA-N vosoritide Chemical compound CC[C@H](C)[C@@H]1NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](Cc2ccccc2)NC(=O)[C@H](CSSC[C@H](NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)O)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](C)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]4CCCN4C(=O)[C@H](Cc5cnc[nH]5)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CNC(=O)[C@@H]6CCCN6 IGYWDDBBJPSOTG-WBAGYEQSSA-N 0.000 description 3
- 108700022781 vosoritide Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 2
- 238000005903 acid hydrolysis reaction Methods 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 238000002869 basic local alignment search tool Methods 0.000 description 2
- 230000008468 bone growth Effects 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 238000012412 chemical coupling Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006862 enzymatic digestion Effects 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 229960000789 guanidine hydrochloride Drugs 0.000 description 2
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 2
- 239000012264 purified product Substances 0.000 description 2
- 230000036632 reaction speed Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 125000000998 L-alanino group Chemical group [H]N([*])[C@](C([H])([H])[H])([H])C(=O)O[H] 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 125000003290 L-leucino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 125000000393 L-methionino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(SC([H])([H])[H])([H])[H] 0.000 description 1
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 102000005431 Molecular Chaperones Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 102000002669 Small Ubiquitin-Related Modifier Proteins Human genes 0.000 description 1
- 108010043401 Small Ubiquitin-Related Modifier Proteins Proteins 0.000 description 1
- 241001052560 Thallis Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 210000004349 growth plate Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000005374 membrane filtration Methods 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000010802 sludge Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明提供了一种沃索利肽可溶性中间体、中间体制备方法及沃索利肽的制备方法。该沃索利肽可溶性中间体包括Sumo标签蛋白、可分离位点和沃索利肽。能够解决现有技术中制备沃索利肽收率低的问题,适用于药物生物合成领域。
Description
技术领域
本发明涉及药物生物合成领域,具体而言,涉及一种沃索利肽可溶性中间体、中间体制备方法及沃索利肽的制备方法。
背景技术
沃索利肽(Vosoritide)是一种肽类药物,用于治疗儿童和青少年中的骨骼短小症。该药物是一种人类生长激素类似物,作用于骨骼生长板,促进骨骼生长,从而帮助患者增加身高。
目前沃索利肽主要通过化学法偶联合成法或包涵体表达法进行制备。其中,化学偶联合成法的工艺相对复杂,且合成过程中易产生杂质,纯度和回收率相对较低。包涵体表达法虽然能够避免蛋白酶降解,但蛋白复杂的变性和复性的过程要用到大量变性剂,如尿素或盐酸胍,纯化工艺繁琐,导致最终得率低。虽然现有技术中利用多种标签对沃索利肽变体进行融合表达,但表达获得的多数融合蛋白为包涵体,变性和复性的过程要用到大量变性剂如尿素或盐酸胍,生产成本高,纯化工艺复杂,导致沃索利肽的最终得率非常低,难以满足工业生产的需求。
发明内容
本发明的主要目的在于提供一种沃索利肽可溶性中间体、中间体制备方法及沃索利肽的制备方法,以解决现有技术中制备沃索利肽收率低的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种沃索利肽可溶性中间体,该沃索利肽可溶性中间体包括Sumo标签蛋白、可分离位点和沃索利肽;Sumo标签蛋白位于可分离位点的N端方向,沃索利肽位于可分离位点的C端方向。
进一步地,分离位点包括一个天冬氨酸。
进一步地,Sumo标签蛋白包括具有SEQ ID NO:1所示氨基酸序列的多肽,或与SEQID NO:1所示的氨基酸序列具有70%以上一致性的标签蛋白;沃索利肽包括具有SEQ ID NO:2所示氨基酸序列的多肽,或与SEQ ID NO:2所示的氨基酸序列具有70%以上一致性、且含有二硫键结构的多肽;优选地,沃索利肽可溶性中间体为具有SEQ ID NO:3所示的氨基酸序列的多肽。
为了实现上述目的,根据本发明的第二个方面,提供了一种沃索利肽可溶性中间体的制备方法,该制备方法包括:构建重组质粒,重组质粒上含有5’-3’端方向顺次连接的能够表达Sumo标签蛋白的DNA序列、能够表达可分离位点的DNA序列和能够表达沃索利肽的DNA序列。
进一步地,Sumo标签蛋白包括具有SEQ ID NO:1所示的氨基酸序列的多肽,或与SEQ ID NO:1所示的氨基酸序列具有70%以上一致性、且能够促进蛋白可溶性表达的多肽;沃索利肽包括具有SEQ ID NO:2所示的氨基酸序列的多肽,或与SEQ ID NO:2所示的氨基酸序列具有70%以上一致性的多肽。
进一步地,能够表达可分离位点的DNA序列由表达一个天冬氨酸的密码子组成。
进一步地,重组质粒的基因为SEQ ID NO:4所示的核苷酸序列。
进一步地,重组质粒在宿主细胞中表达沃索利肽可溶性中间体;优选地,宿主细胞包括真核细胞或原核细胞;优选地,原核细胞包括大肠杆菌;优选地,大肠杆菌包括BL21(DE3)、Origami B(DE3)或Shuffle T7-B。
为了实现上述目的,根据本发明的第三个方面,提供了一种沃索利肽的制备方法,该制备方法包括:通过切割上述任一种沃索利肽可溶性中间体或上述任一种沃索利肽可溶性中间体的制备方法制备获得的沃索利肽可溶性中间体中的可分离位点,将Sumo标签蛋白和可分离位点序列切除,获得沃索利肽。
进一步地,切除包括:利用酸溶液在可分离位点切除Sumo标签蛋白和可分离位点,获得沃索利肽。
应用本发明的技术方案,通过提供一种包括Sumo标签蛋白、可分离位点以及沃索利肽的可溶性中间体,即一种融合蛋白,其中,Sumo标签蛋白位于可分离位点的N端方向,沃索利肽位于可分离位点的C端方向,该种融合蛋白的可溶性较好,在后续制备沃索利肽时不需通过添加蛋白变性剂和复性剂用于对沃索利肽进行变性和复性,终产物沃索利肽的收率高。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例1的表达沃索利肽可溶性中间体的菌株经诱导离心后沉淀及上清液的电泳检测结果图。
图2示出了根据本发明实施例1的含有沃索利肽可溶性中间体的粗酶液纯化后洗脱蛋白的电泳检测结果图。
图3示出了根据本发明实施例1的沃索利肽可溶性中间体中经过酸水解后产物的电泳检测结果图。
图4示出了根据本发明实施例1的沃索利肽LC-MS检测质谱结果图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。
如背景技术所提到的,现有技术对于沃索利肽的制备采用化学合成的制备方法进行制备,不仅过程复杂,成本过高,而且可能会产生消旋体,导致制备周期较长,产品的质量控制比较困难。而通过酶合成的方法对沃索利肽进行制备,通过融合蛋白进行表达时,大多表达量较低,且易形成包涵体,需要通过添加蛋白变性剂和复性剂对包涵体的错误折叠进行校正和纯化,导致制备过程复杂。在本申请中发明人尝试开发一种索利肽可溶性中间体、中间体制备方法及沃索利肽制备方法,因而提出了本申请的一系列保护方案。
在本申请第一种典型的实施方式中,提供了一种沃索利肽可溶性中间体,该沃索利肽可溶性中间体包括Sumo标签蛋白、可分离位点和沃索利肽;Sumo标签蛋白位于可分离位点的N端方向,沃索利肽位于可分离位点的C端方向。
蛋白标签(Protein tag)指的是利用基因克隆的手段,将具有特定功能的多肽、蛋白质结构域或完整的蛋白质与目标蛋白融合,以实现目标蛋白的表达纯化、检测和示踪等应用技术。Sumo(Small ubiquitin-like modifier)标签蛋白是一种小分子泛素样修饰蛋白,Sumo标签蛋白能够作为重组蛋白表达的蛋白标签和分子伴侣,用于增加目标蛋白的溶解性、稳定性和纯度。本申请通过将Sumo标签蛋白与沃索利肽进行融合表达的方法,实现了对于含有一对二硫键的多肽的高效可溶表达,提高了沃索利肽的可溶表达性。
在一种优选的实施例中,分离位点包括一个天冬氨酸。
在一种优选的实施例中,Sumo标签蛋白包括具有SEQ ID NO:1所示氨基酸序列的多肽,或与SEQ ID NO:1所示的氨基酸序列具有70%以上一致性的标签蛋白,包括但不限于75%、80%、85%、90%、95%、99%以上(比如85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99%、99.5%、99.6%、99.7%、99.8%以上,甚至99.9%以上);沃索利肽包括具有SEQ ID NO:2所示氨基酸序列的多肽,或与SEQ ID NO:2所示的氨基酸序列具有70%以上一致性、且含有二硫键结构的多肽,包括但不限于75%、80%、85%、90%、95%、99%以上(比如85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99%、99.5%、99.6%、99.7%、99.8%以上,甚至99.9%以上);优选地,沃索利肽可溶性中间体为具有SEQ IDNO:3所示氨基酸序列的多肽。
SEQ ID NO:1(Sumo标签蛋白):
HHHHHHGSLQDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQAPEDLDMEDNDIIEAHREQIGG。
SEQ ID NO:2(沃索利肽):
PGQEHPNARKYKGANKKGLSKGCFGLKLDRIGSMSGLGC。
SEQ ID NO:3(沃索利肽可溶性中间体,Sumo-D-Vos融合蛋白):
HHHHHHGSLQDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQAPEDLDMEDNDIIEAHREQIGGDPGQEHPNARKYKGANKKGLSKGCFGLKLDRIGSMSGLGC。
SEQ ID NO:3中第107位的氨基酸代表天冬氨酸酸切位点。
包涵体指的是外源基因在原核细胞中表达时,形成的由膜包裹的高密度、不溶性蛋白质颗粒,其形成与胞质内蛋白质的生成速率有关,新生成的多肽浓度高,无充足的时间进行折叠,从而易形成非结晶、无定形的蛋白质聚集体。且因沃索利肽N端为脯氨酸,此性质的氨基酸能够促进包涵体的形成,故现有方法中通常需要添加蛋白变性剂和复性剂对这些错误折叠的包涵体进行校正后复性,且需纯化后去除多余试剂后,才能够得到目标蛋白沃索利肽。而在本申请中,通过将Sumo标签与沃索利肽蛋白连接时,能够表达获得可溶性较好的融合蛋白,不会形成包涵体,故能够避免包涵体变复性的问题,且表达量较高,能够高效地促进蛋白的可溶表达,因此不需要添加蛋白的变性剂和复性剂,就能够直接制备获得沃索利肽可溶性中间体,进而通过简单的纯化步骤即可以较高的产率获得目标产物沃索利肽。
本申请中的一致性(Identity)是指氨基酸序列或核酸序列之间的“一致性”,即氨基酸序列或核酸序列中的种类相同的氨基酸残基或核苷酸的比率的总计。氨基酸序列或核酸序列的一致性可以利用BLAST(Basic Local Alignment Search Tool)、FASTA等比对程序来确定。
上述与SEQ ID NO:2所示的氨基酸序列具有70%、75%、80%、85%、90%、95%、99%以上(比如85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99%、99.5%、99.6%、99.7%、99.8%以上,甚至99.9%以上)一致性且具有相同功能的蛋白质,其活性位点、活性口袋、活性机制、蛋白结构等均和上述序列提供的蛋白质大概率相同。
如本文所用,氨基酸残基缩写如下:丙氨酸(Ala;A)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、精氨酸(Arg;R)、半胱氨酸(Cys;C)、谷氨酸(Glu;E)、谷氨酰胺(Gln;Q)、甘氨酸(Gly;G)、组氨酸(His;H)、异亮氨酸(Ile;I)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、蛋氨酸(Met;M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P),丝氨酸(Ser;S)、苏氨酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)和缬氨酸(Val;V)。
取代、替换等规则,一般情况下,哪些氨基酸性质类似,替换后的效果也类似。例如,在上述同源蛋白中,可发生保守的氨基酸替换。“保守的氨基酸替换”包括但不限于:
疏水性氨基酸(Ala、Cys、Gly、Pro、Met、Val、Ile、Leu)被其他疏水性氨基酸取代;
侧链大的疏水性氨基酸(Phe、Tyr、Trp)被其他侧链大的疏水性氨基酸取代;
侧链带正电的氨基酸(Arg、His、Lys)被其他侧链带正电的氨基酸取代;
侧链有极性不带电的氨基酸(Ser、Thr、Asn、Gln)被其他侧链有极性不带电的氨基酸取代。
本领域技术人员也可以根据现有技术中的“BLOSUM62评分矩阵”等本领域技术人员熟知的氨基酸替换规则对氨基酸进行保守替换。
现有技术中,在制备沃索利肽时,常用的具有可溶表达功能的蛋白标签包括Trx或MBP等,在使用这些蛋白标签时,容易形成包涵体,即使不产生包涵体,蛋白表达量也很低。且利用现有技术中的蛋白内切酶对该种蛋白标签以及目标肽段进行切割时,酶切效率通常较低,导致终产品多肽纯品收率低下。
在本申请中,发明人发现沃索利肽因N端脯氨酸的存在,导致多种酶切效率很低,难以通过酶切的方法将沃索利肽与标签蛋白分离。本申请中通过在Sumo标签蛋白与沃索利肽的之间引入一个天冬氨酸,与沃索利肽的第一个氨基酸脯氨酸构成D-P酸切位点,通过酸切将Sumo标签蛋白切除,实现Sumo标签蛋白与沃索利肽的高效分离,制备获得沃索利肽,制备过程简单高效,Sumo标签蛋白能帮助沃索利肽可溶性表达,天冬氨酸和脯氨酸(沃索利肽的第一个氨基酸)形成的酸切位点能够进一步提高纯化的效率和收率,使得沃索利肽的收率提高。
在本申请第二种典型的实施方式中,提供了一种沃索利肽可溶性中间体的制备方法,该制备方法包括:构建重组质粒,重组质粒上含有5’-3’端方向顺次连接的能够表达Sumo标签蛋白的DNA序列、能够表达可分离位点的DNA序列和能够表达沃索利肽的DNA序列。
在一种优选的实施例中,Sumo标签蛋白包括具有SEQ ID NO:1所示氨基酸序列的多肽,或与SEQ ID NO:1所示的氨基酸序列具有70%以上一致性、且能够促进蛋白可溶性表达的多肽;沃索利肽包括具有SEQ ID NO:2所示氨基酸序列的多肽,或与SEQ ID NO:2所示的氨基酸序列具有70%以上一致性、且能够促进蛋白可溶性表达的多肽。
在一种优选的实施例中,能够表达可分离位点的DNA序列由表达一个天冬氨酸的密码子组成。
在一种优选的实施例中,重组质粒的基因为SEQ ID NO:4的核苷酸序列。
SEQ ID NO:4:
ATGCATCATCATCATCATCATGGCAGTCTGCAAGATAGCGAAGTGAATCAAGAAGCGAAGCCAGAAGTGAAACCGGAAGTTAAACCGGAGACCCACATCAATCTGAAGGTGAGCGACGGCAGCAGCGAGATCTTCTTCAAGATCAAGAAGACGACCCCGCTGCGTCGTCTGATGGAAGCCTTCGCCAAACGCCAAGGCAAAGAAATGGACAGTCTGCGCTTTCTGTACGATGGTATCCGCATCCAAGCCGATCAAGCCCCGGAAGATCTGGACATGGAGGACAACGACATCATCGAGGCGCATCGCGAACAGATCGGCGGCGACCCGGGCCAGGAACATCCGAACGCGCGCAAATATAAAGGCGCGAACAAAAAAGGCCTGAGCAAAGGCTGCTTTGGCCTGAAACTGGATCGCATTGGCAGCATGAGCGGCCTGGGCTGCTAA。
上述SEQ ID NO:4中第1位至第324位所示的核苷酸序列即为能够表达Sumo标签蛋白的基因。
在一种优选的实施例中,重组质粒在宿主细胞中表达沃索利肽可溶性中间体;优选地,宿主细胞包括真核细胞或原核细胞;优选地,原核细胞包括大肠杆菌;优选地,大肠杆菌包括BL21(DE3)、Origami B(DE3)或Shuffle T7-B。
利用上述宿主细胞,能够在宿主细胞中进行重组质粒的复制,也能够将重组质粒上携带的DNA分子进行转录、翻译,获得大量的沃索利肽可溶性中间体。利用现有技术,对宿主细胞进行破碎、破碎后蛋白纯化或其他方式,能够获得沃索利肽可溶性中间体。该宿主细胞为非植物来源的宿主细胞。
在本申请第三种典型的实施方式中,提供了一种沃索利肽的制备方法,该制备方法包括:通过切割上述任一种沃索利肽可溶性中间体或上述任一种沃索利肽可溶性中间体的制备方法制备获得的沃索利肽中的可分离位点,将Sumo标签蛋白和可分离位点序列切除,获得沃索利肽。
在一种优选的实施例中,切除包括:利用酸溶液在可分离位点切除Sumo标签蛋白和可分离位点,获得沃索利肽。
利用酸溶液对标签蛋白进行切割,相对于酶切法成本低、反应速度快,且不受酶的活性、稳定性和纯度等因素的影响,能够通过调整酸的浓度和反应温度来控制反应速度和水解程度,反应条件相对酶切法来说更易于控制,更适用于大规模生产。
下面将结合具体的实施例来进一步详细解释本申请的有益效果。
实施例1
A.构建Sumo标签蛋白融合表达沃索利肽的基因工程菌株
将Sumo标签蛋白和目标多肽序列进行融合,于pET-28a(+)质粒中构建表达载体
1、将Sumo标签蛋白与pET-28a(+)质粒连接,构建pET-28a-Sumo载体骨架。
2、目标多肽序列如SEQ NO:2的氨基酸序列所示,在其N端引入Asp,用于后续的酸水解以去除融合标签:
将目标多肽片段与pET-28a-Sumo载体骨架经同源重组进行连接,获得重组载体pET-28a-Sumo-D-Vos(其中Vos为Vosoritide的缩写),该重组载体上的能够表达沃索利肽可溶性中间体的DNA序列为SEQ ID NO:4所示的核苷酸序列。将重组载体转化入BL21(DE3)感受态细胞(购自全式金生物技术股份有限公司,货号:CD601-02),进行单克隆测序分析,筛选出含有正确的克隆表达载体pET-28a-Sumo-D-Vos的菌种。
3、挑取3个上述菌种接种于250mL摇瓶中进行筛选,不同克隆菌泥经破碎后,离心,沉淀进行SDS-PAGE检测,通过电泳条带深浅筛选表达较好的组别,从中筛选出最终的表达菌株。取含有重组质粒的BL21(DE3)菌株4mL,接种于含400mL LB培养基的2L三角瓶,37℃200rpm振荡培养至OD600为1.0时,加入终浓度为0.2mM IPTG,25℃诱导过夜,诱导结束,离心收集菌体。通过超声破碎,收集上清,17%分离胶SDS-PAGE结果表明目标蛋白主要呈可溶表达,电泳图如图1所示,其中泳道M表示的是Marker条带,泳道1代表上清液进行电泳检测的条带,泳道2代表沉淀进行电泳检测的条带,其中,箭头指出的条带代表沉淀中的菌体包含有Sumo-D-Vos融合蛋白。
B.Sumo-D-Vosoritide纯化
1、将表达的Sumo-D-Vos的菌株,稀释至其浓度的20%后重悬,进行超声破碎(5s超声,5s间隔,30%功率),然后离心,上清过0.45μm滤膜后获得粗酶液。
2、利用亲和层析对获得的粗酶液进行纯化(AKTA系统装配5mL HisTrap HP):
滤膜过滤样品以5mL/min流速上样,然后采用结合缓冲液(50mM Tris-Hcl,200mMNaCl,pH 8.0)冲洗,直至未结合的蛋白完全被洗脱。利用缓冲液50mM Tris-Hcl,200mMNaCl,50mM咪唑,在pH 8.0的条件下,洗脱杂蛋白4个柱体积。最后在洗脱缓冲液50mM Tris-Hcl,200mM NaCl,300mM咪唑,pH=8.0条件下洗脱目标蛋白,其检测结果图如图2所示,其中泳道M表示的是Marker条带,泳道1代表洗脱下的目标蛋白进行电泳检测后的条带,箭头指出的条带代表该目标蛋白中含有Sumo-D-Vos融合蛋白。
据计算,1g湿细胞可以获得纯化的Sumo-D-Vos融合蛋白21mg(经过条件优化可以进一步提高)。Sumo-D-Vos融合蛋白的表达量如表1所示。
C.酸切移除融合标签
利用超滤置换将融合蛋白Sumo-D-Vos中的咪唑去除,加入酸切溶液(50%乙酸/30mM HCl),60℃反应20h,加入去离子水稀释3倍,利用5M NaOH将溶液中的pH至5.5(His-sumo-D等电点),离心(12000rpm,10min)收集上清。利用17% SDS-PAGE检测其切割效率,并检测是否有目标多肽生成,检测图如图3所示,其中,泳道M表示的是Marker条带,泳道1代表上清液进行电泳检测的条带图,箭头指出的条带代表该上清液中有Vosoritide产物,泳道2代表沉淀进行电泳检测的条带图。目标多肽的纯度达到80%以上。利用本实施例中的酸切的方式将融合蛋白的蛋白标签切除后的纯品收率如表2所示。
D.质谱检测多肽分子量
制备的多肽分子量采用LC-MS进行分析。
1、样品先经过HPLC 柱子分离:Agilent ZORBAX Edipse Plus C18,4.6×100mm,3.5μm,流动相A:0.1%三氟乙酸,流动相B:0.1%三氟乙酸乙腈溶液,采用梯度洗脱方式:0min10%B,9min 95%B,12min 100%B,12.1min 10%B,15min 10%B,柱温50℃,紫外检测器210nm,流速0.3mL/min。
2、经过HPLC分离后的组分采用Q Exactive HF组合型四极杆Orbitrap质谱仪,利用电喷雾离子源(Dual AJS ESI),设置为正离子模式检测,鞘气流速35arb,辅助气流速8arb,喷雾电压3800V,离子传输管温度320℃,扫描范围200~3000m/z,并通过BioPharmaFinder软件处理质谱数据。最后,沃索利肽的理论分子量为4100.8Da,质谱解析的沃索利肽分子量是4100.1,质谱图如图4所示。
对比例1
本对比例与实施例1的区别在于,本对比例中的标签蛋白为Trx(SEQ ID NO:5),蛋白内切酶酶切位点为KR(Lys-Arg),在内切酶酶切位点前还有一段连接肽序列(SEQ ID NO:13和SEQ ID NO:14),连接肽有利于蛋白内切酶与酶切位点结合。
SEQ ID NO:5(Trx标签蛋白氨基酸序列):
MHHHHHHSDKIIHLTDDSFDTDVLKADGAILVDFWAEWCGPCKMIAPILDEIADEYQGKLTVAKLNIDQNPGTAPKYGIRGIPTLLLFKNGEVAATKVGALSKGQLKEFLDANLA。
SEQ ID NO:6(Trx标签蛋白核苷酸序列):
ATGCATCATCATCATCATCATCCGAGCGTGCAAGAAGTGGAAAAACTGCTGCATGTGCTGGATCGCAACGGCGATGGCAAAGTGAGCGCGGAAGAACTGAAAGCGTTTGCGGATGATAGCAAATGCCCGCTGGATAGCAACAAAATTAAAGCGTTTATTAAAGAACATGATAAAAACAAAGATGGCAAACTGGATCTGAAAGAACTGGTGAGCATTCTGAGCAGC。
蛋白标签切除的方式为蛋白内切酶切:
本对比例中的蛋白内切酶为KEX2酶(购自碧云天生物技术公司,货号:P4229);KEX2酶与沃索利肽融合蛋白的质量比为1:40-500,优选为1:200,酶切时间16h。
KEX2酶切反应在25℃进行,具体步骤是:50 mM Tris-Hcl,200 mM NaCl,300 mM咪唑,pH 8.0纯化的Trx-(G3S)3-KR-Vos融合蛋白和KEX2质量比200:1(mg/mg),酶切16h。
酶切后乙腈沉淀法纯化目标多肽,具体步骤同实施例1。
酶切完成之后的产物,调整pH于5.7(His-MBP和His-Trx等电点),然后在反应体系加入60%的乙腈,混匀后在30℃振荡处理2 h,之后12000 rpm离心分离上清和沉淀,上清中即为沃索利肽。
本对比例中Trx-(G3S)3-KR-Vos(SEQ ID NO:7)融合蛋白表达量如表1所示;利用本对比例中的酶切的方式将融合蛋白中的蛋白标签Trx切除后的纯品收率如表2所示。
SEQ ID NO:7(Trx-(G3S)3-KR-Vos融合蛋白氨基酸序列):
MHHHHHHSDKIIHLTDDSFDTDVLKADGAILVDFWAEWCGPCKMIAPILDEIADEYQGKLTVAKLNIDQNPGTAPKYGIRGIPTLLLFKNGEVAATKVGALSKGQLKEFLDANLAGGGSGGGSGGGSKRPGQEHPNARKYKGANKKGLSKGCFGLKLDRIGSMSGLGC。
SEQ ID NO:7中第1位至第115位的氨基酸为Trx标签蛋白的氨基酸序列,第116至第127位的氨基酸为连接肽的氨基酸序列,第128至第129位的氨基酸为酶切位点的氨基酸序列。
SEQ ID NO:8(Trx-(G3S)3-KR-Vos融合蛋白核苷酸序列):
ATGCATCATCATCATCATCATCCGAGCGTGCAAGAAGTGGAAAAACTGCTGCATGTGCTGGATCGCAACGGCGATGGCAAAGTGAGCGCGGAAGAACTGAAAGCGTTTGCGGATGATAGCAAATGCCCGCTGGATAGCAACAAAATTAAAGCGTTTATTAAAGAACATGATAAAAACAAAGATGGCAAACTGGATCTGAAAGAACTGGTGAGCATTCTGAGCAGCGGTGGCGGTTCTGGCGGTGGCAGCGGCGGTGGCAGCAAACGTCCGGGCCAGGAACATCCGAACGCGCGCAAATATAAAGGCGCGAACAAAAAAGGCCTGAGCAAAGGCTGCTTTGGCCTGAAACTGGATCGCATTGGCAGCATGAGCGGCCTGGGCTGCTAA。
SEQ ID NO:8中第1位至第225位的核苷酸为Trx标签蛋白的核苷酸序列,第226位至第261位的核苷酸为连接肽的核苷酸序列,第262位至第267位的核苷酸为酶切位点的核苷酸序列。
SEQ ID NO:13(连接肽的氨基酸序列):GGGSGGGSGGGS。
SEQ ID NO:14(连接肽的核苷酸序列):GGTGGCGGTTCTGGCGGTGGCAGCGGCGGTGGCAGC。
对比例2
本对比例与对比例1的区别在于,本对比例中的标签蛋白为MBP(SEQ ID NO:9),蛋白内切酶酶切位点为KR(Lys-Arg),连接肽为SEQ ID NO:13所示的核苷酸序列,蛋白标签切除的方式和具体步骤与对比例1一致。
SEQ ID NO:9(MBP标签蛋白氨基酸序列):
MHHHHHHKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPLGAVALKSYEEELAKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQT。
SEQ ID NO:10(MBP标签蛋白核苷酸序列):
ATGCATCATCATCATCATCATCATCATCATCATCATCATAAAATCGAAGAAGGTAAACTGGTAATCTGGATTAACGGCGATAAAGGCTATAACGGTCTCGCTGAAGTCGGTAAGAAATTCGAGAAAGATACCGGAATTAAAGTCACCGTTGAGCATCCGGATAAACTGGAAGAGAAATTCCCACAGGTTGCGGCAACTGGCGATGGCCCTGACATTATCTTCTGGGCACACGACCGCTTTGGTGGCTACGCTCAATCTGGCCTGTTGGCTGAAATCACCCCGGACAAAGCGTTCCAGGACAAGCTGTATCCGTTTACCTGGGATGCCGTACGTTACAACGGCAAGCTGATTGCTTACCCGATCGCTGTTGAAGCGTTATCGCTGATTTATAACAAAGATCTGCTGCCGAACCCGCCAAAAACCTGGGAAGAGATCCCGGCGCTGGATAAAGAACTGAAAGCGAAAGGTAAGAGCGCGCTGATGTTCAACCTGCAAGAACCGTACTTCACCTGGCCGCTGATTGCTGCTGACGGGGGTTATGCGTTCAAGTATGAAAACGGCAAGTACGACATTAAAGACGTGGGCGTGGATAACGCTGGCGCGAAAGCGGGTCTGACCTTCCTGGTTGACCTGATTAAAAACAAACACATGAATGCAGACACCGATTACTCCATCGCAGAAGCTGCCTTTAATAAAGGCGAAACAGCGATGACCATCAACGGCCCGTGGGCATGGTCCAACATCGACACCAGCAAAGTGAATTATGGTGTAACGGTACTGCCGACCTTCAAGGGTCAACCATCCAAACCGTTCGTTGGCGTGCTGAGCGCAGGTATTAACGCCGCCAGTCCGAACAAAGAGCTGGCAAAAGAGTTCCTCGAAAACTATCTGCTGACTGATGAAGGTCTGGAAGCGGTTAATAAAGACAAACCGCTGGGTGCCGTAGCGCTGAAGTCTTACGAGGAAGAGTTGGCGAAAGATCCACGTATTGCCGCCACTATGGAAAACGCCCAGAAAGGTGAAATCATGCCGAACATCCCGCAGATGTCCGCTTTCTGGTATGCCGTGCGTACTGCGGTGATCAACGCCGCCAGCGGTCGTCAGACTGTCGATGAAGCCCTGAAAGACGCGCAGACT。
SEQ ID NO:11(MBP-(G3S)3-KR-Vos融合蛋白氨基酸序列):
MHHHHHHKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPLGAVALKSYEEELAKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTGGGSGGGSGGGSKRPGQEHPNARKYKGANKKGLSKGCFGLKLDRIGSMSGLGC。
SEQ ID NO:11中第1位至第373位的氨基酸为MBP标签蛋白的氨基酸序列,第374至第385位的氨基酸为连接肽的氨基酸序列,第386位至第387位的氨基酸为酶切位点的氨基酸序列。
SEQ ID NO:12(MBP-(G3S)3-KR-Vos融合蛋白核苷酸序列):
ATGCATCATCATCATCATCATCATCATCATCATCATCATAAAATCGAAGAAGGTAAACTGGTAATCTGGATTAACGGCGATAAAGGCTATAACGGTCTCGCTGAAGTCGGTAAGAAATTCGAGAAAGATACCGGAATTAAAGTCACCGTTGAGCATCCGGATAAACTGGAAGAGAAATTCCCACAGGTTGCGGCAACTGGCGATGGCCCTGACATTATCTTCTGGGCACACGACCGCTTTGGTGGCTACGCTCAATCTGGCCTGTTGGCTGAAATCACCCCGGACAAAGCGTTCCAGGACAAGCTGTATCCGTTTACCTGGGATGCCGTACGTTACAACGGCAAGCTGATTGCTTACCCGATCGCTGTTGAAGCGTTATCGCTGATTTATAACAAAGATCTGCTGCCGAACCCGCCAAAAACCTGGGAAGAGATCCCGGCGCTGGATAAAGAACTGAAAGCGAAAGGTAAGAGCGCGCTGATGTTCAACCTGCAAGAACCGTACTTCACCTGGCCGCTGATTGCTGCTGACGGGGGTTATGCGTTCAAGTATGAAAACGGCAAGTACGACATTAAAGACGTGGGCGTGGATAACGCTGGCGCGAAAGCGGGTCTGACCTTCCTGGTTGACCTGATTAAAAACAAACACATGAATGCAGACACCGATTACTCCATCGCAGAAGCTGCCTTTAATAAAGGCGAAACAGCGATGACCATCAACGGCCCGTGGGCATGGTCCAACATCGACACCAGCAAAGTGAATTATGGTGTAACGGTACTGCCGACCTTCAAGGGTCAACCATCCAAACCGTTCGTTGGCGTGCTGAGCGCAGGTATTAACGCCGCCAGTCCGAACAAAGAGCTGGCAAAAGAGTTCCTCGAAAACTATCTGCTGACTGATGAAGGTCTGGAAGCGGTTAATAAAGACAAACCGCTGGGTGCCGTAGCGCTGAAGTCTTACGAGGAAGAGTTGGCGAAAGATCCACGTATTGCCGCCACTATGGAAAACGCCCAGAAAGGTGAAATCATGCCGAACATCCCGCAGATGTCCGCTTTCTGGTATGCCGTGCGTACTGCGGTGATCAACGCCGCCAGCGGTCGTCAGACTGTCGATGAAGCCCTGAAAGACGCGCAGACTGGTGGCGGTTCTGGCGGTGGCAGCGGCGGTGGCAGCAAACGTCCGGGCCAGGAACATCCGAACGCGCGCAAATATAAAGGCGCGAACAAAAAAGGCCTGAGCAAAGGCTGCTTTGGCCTGAAACTGGATCGCATTGGCAGCATGAGCGGCCTGGGCTGCTAA。
SEQ ID NO:12中第1位至第1137位的核苷酸为MBP标签蛋白的核苷酸序列,第1138位至第1173位的核苷酸为连接肽的核苷酸序列,第1174至第1179位的核苷酸为酶切位点的核苷酸序列。
本对比例中MBP-KR-Vos融合蛋白表达量如表1所示;利用本对比例中的酶切的方式将融合蛋白中的蛋白标签MBP切除后的纯品收率如表2所示。
表1
。
表2
。
从表1和表2可知,连接有Sumo标签蛋白的沃索利肽中间体,即Sumo-D-Vos融合蛋白的表达量与其他两种融合蛋白的表达量更高。且利用酸切的切割标签蛋白的方法,使得沃索利肽的纯品收率更高,证明酸切切除标签蛋白与现有技术中常见的蛋白内切酶酶切切除标签蛋白的方法相比,切除效率高且效果好。
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:本发明通过利用Sumo标签蛋白,制备沃索利肽可溶性中间体,与现有技术中其他用于增强目标蛋白可溶性的蛋白标签相比,本申请中含有Sumo标签蛋白的沃索利肽可溶性中间体不受包涵体变复性的问题限制,不需要使用额外的试剂对包涵体进行处理,也不需进行后续工艺繁琐的纯化步骤,且表达量高,能够更为高效地可溶性表达沃索利肽。且本申请在目标蛋白沃索利肽以及Sumo标签蛋白中引入一个天冬氨酸,使其与沃索利肽N端的脯氨酸形成D-P酸切位点,简化了切除蛋白标签的步骤,与现有技术的酶切法相比成本相对较低,且更高效,能够进一步提高沃索利肽收率。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种沃索利肽可溶性中间体,其特征在于,按照从N端到C端的方向,所述沃索利肽可溶性中间体包括顺序连接的Sumo标签蛋白、可分离位点和沃索利肽;
所述沃索利肽可溶性中间体为SEQ ID NO:3所示氨基酸序列的多肽。
2.一种权利要求1所述的沃索利肽可溶性中间体的制备方法,其特征在于,所述制备方法包括:
构建重组质粒,所述重组质粒上含有5’-3’端方向顺次连接的能够表达Sumo标签蛋白的DNA序列、能够表达可分离位点的DNA序列和能够表达沃索利肽的DNA序列;
所述重组质粒在宿主细胞中表达所述沃索利肽可溶性中间体。
3.根据权利要求2中任一项所述的制备方法,其特征在于,所述重组质粒的基因为SEQID NO:4所示的核苷酸序列。
4.根据权利要求2所述的制备方法,其特征在于,所述宿主细胞包括真核细胞或原核细胞。
5.根据权利要求4所述的制备方法,其特征在于所述原核细胞包括大肠杆菌。
6.根据权利要求5所述的制备方法,其特征在于,所述大肠杆菌包括BL21(DE3)、Origami B(DE3)或Shuffle T7-B。
7.一种沃索利肽的制备方法,其特征在于,所述制备方法包括:
通过切割权利要求1中所述沃索利肽可溶性中间体或利用权利要求2-6中任一项所述的沃索利肽可溶性中间体的制备方法制备获得的所述沃索利肽可溶性中间体中的可分离位点,将所述Sumo标签蛋白和可分离位点序列切除,获得所述沃索利肽;
所述切除包括:利用酸溶液在所述可分离位点切除所述Sumo标签蛋白和可分离位点,获得所述沃索利肽。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410229257.8A CN117801123B (zh) | 2024-02-29 | 2024-02-29 | 沃索利肽可溶性中间体、中间体制备方法及沃索利肽的制备方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410229257.8A CN117801123B (zh) | 2024-02-29 | 2024-02-29 | 沃索利肽可溶性中间体、中间体制备方法及沃索利肽的制备方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117801123A CN117801123A (zh) | 2024-04-02 |
CN117801123B true CN117801123B (zh) | 2024-05-03 |
Family
ID=90425879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410229257.8A Active CN117801123B (zh) | 2024-02-29 | 2024-02-29 | 沃索利肽可溶性中间体、中间体制备方法及沃索利肽的制备方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117801123B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108780088A (zh) * | 2015-11-06 | 2018-11-09 | 维蒂卡实验室公司 | 在伴侣动物中检测炎症标志物和治疗炎性病症的方法 |
CN110498849A (zh) * | 2019-09-16 | 2019-11-26 | 南京迪维奥医药科技有限公司 | 一种索玛鲁肽主肽链及其制备方法 |
CN112500465A (zh) * | 2020-12-01 | 2021-03-16 | 大连理工大学 | 一种sumo化修饰捕获探针的合成方法及应用 |
CN113025598A (zh) * | 2021-01-25 | 2021-06-25 | 上海宝维医药技术有限公司 | 一种利用sumo融合表达系统制备重组肝素酶iii的方法及其所制备的sumo_肝素酶iii融合蛋白 |
CN114456254A (zh) * | 2021-12-29 | 2022-05-10 | 江苏诺泰澳赛诺生物制药股份有限公司 | 一种C型利钠肽类似物Vosoritide的合成方法 |
WO2023283657A1 (en) * | 2021-07-09 | 2023-01-12 | Biomarin Pharmaceutical Inc. | C-type natriuretic peptide variants to treat skeletal dysplasia in children |
-
2024
- 2024-02-29 CN CN202410229257.8A patent/CN117801123B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108780088A (zh) * | 2015-11-06 | 2018-11-09 | 维蒂卡实验室公司 | 在伴侣动物中检测炎症标志物和治疗炎性病症的方法 |
CN110498849A (zh) * | 2019-09-16 | 2019-11-26 | 南京迪维奥医药科技有限公司 | 一种索玛鲁肽主肽链及其制备方法 |
CN112500465A (zh) * | 2020-12-01 | 2021-03-16 | 大连理工大学 | 一种sumo化修饰捕获探针的合成方法及应用 |
CN113025598A (zh) * | 2021-01-25 | 2021-06-25 | 上海宝维医药技术有限公司 | 一种利用sumo融合表达系统制备重组肝素酶iii的方法及其所制备的sumo_肝素酶iii融合蛋白 |
WO2023283657A1 (en) * | 2021-07-09 | 2023-01-12 | Biomarin Pharmaceutical Inc. | C-type natriuretic peptide variants to treat skeletal dysplasia in children |
CN114456254A (zh) * | 2021-12-29 | 2022-05-10 | 江苏诺泰澳赛诺生物制药股份有限公司 | 一种C型利钠肽类似物Vosoritide的合成方法 |
Non-Patent Citations (1)
Title |
---|
SUMO在蛋白表达中的应用;汪小杰;毛若雨;张勇;滕达;王秀敏;王建华;;生物技术通报;20131016(第10期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117801123A (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9200306B2 (en) | Methods for production and purification of polypeptides | |
WO2022241831A1 (zh) | 多肽的制备方法 | |
US20220372074A1 (en) | Production and Purification Method for Polypeptide | |
CN113549144A (zh) | 一种特立帕肽hPTH(1-34)的生产和纯化方法 | |
JP4088584B2 (ja) | 融合タンパク質から目的タンパク質を分離する方法。 | |
CN117801123B (zh) | 沃索利肽可溶性中间体、中间体制备方法及沃索利肽的制备方法 | |
CN111718417B (zh) | 含有荧光蛋白片段的融合蛋白及其用途 | |
CN109136209B (zh) | 肠激酶轻链突变体及其应用 | |
CN107629129B (zh) | 生产和纯化多肽的方法 | |
JP2021511785A (ja) | 組換えポリペプチド生産用n末端融合パートナーおよびこれを用いた組換えポリペプチドの生産方法 | |
US8530217B2 (en) | Processing of peptides and proteins | |
KR102064810B1 (ko) | 재조합 폴리펩타이드 생산용 n-말단 융합 파트너 및 이를 이용하여 재조합 폴리펩타이드를 생산하는 방법 | |
CN110540601B (zh) | 重组PLB-hEGF融合蛋白及其应用 | |
CN117802138A (zh) | 利那洛肽可溶性中间体和利那洛肽的制备方法 | |
US9580488B2 (en) | Fusion tags and expression vector system for the expression of human parathyroid hormone (rhPTH) | |
EP3373954A2 (en) | Methods of producing and purifying matrix-binding fusion proteins by ion-exchange chromatography | |
CN113493780A (zh) | 一种利用sumo融合表达系统制备重组肝素酶ii的方法及其所制备的sumo_肝素酶ii融合蛋白 | |
JP4870574B2 (ja) | ペプチドおよびタンパク質のプロセシング | |
CN116041451B (zh) | 一种内含肽变体及其在生物法制备蓝铜胜肽中的应用 | |
CN116355932B (zh) | 重组载体和制备μ-芋螺毒素的方法 | |
CN117964708A (zh) | 一种内含肽及其突变体的应用 | |
CN114381471A (zh) | 一种辅助蛋白在重组蛋白生产中的应用及融合表达系统 | |
KR20210079235A (ko) | Whep 도메인 융합에 의한 목적 단백질의 수용성 증진 방법 | |
CN117362401A (zh) | 一种牛病毒性腹泻病毒n蛋白及其作为自我切割蛋白的应用 | |
CN115927281A (zh) | Ssp DnaB内含肽及其在表达分离透皮肽中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |