CN113773398B - 一种德谷胰岛素衍生物及其应用 - Google Patents
一种德谷胰岛素衍生物及其应用 Download PDFInfo
- Publication number
- CN113773398B CN113773398B CN202010524886.5A CN202010524886A CN113773398B CN 113773398 B CN113773398 B CN 113773398B CN 202010524886 A CN202010524886 A CN 202010524886A CN 113773398 B CN113773398 B CN 113773398B
- Authority
- CN
- China
- Prior art keywords
- insulin
- seq
- fusion protein
- chain
- boc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000004026 insulin derivative Substances 0.000 title abstract description 11
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical class N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 claims abstract description 312
- 102000004877 Insulin Human genes 0.000 claims abstract description 153
- 108090001061 Insulin Proteins 0.000 claims abstract description 153
- 229940125396 insulin Drugs 0.000 claims abstract description 149
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 85
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 85
- 238000000034 method Methods 0.000 claims abstract description 76
- 108010043121 Green Fluorescent Proteins Proteins 0.000 claims abstract description 27
- 102000004144 Green Fluorescent Proteins Human genes 0.000 claims abstract description 27
- 239000005090 green fluorescent protein Substances 0.000 claims abstract description 27
- 230000012846 protein folding Effects 0.000 claims abstract description 25
- 239000012634 fragment Substances 0.000 claims abstract description 21
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 41
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 37
- 210000004027 cell Anatomy 0.000 claims description 32
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 claims description 29
- 241000700124 Octodon degus Species 0.000 claims description 29
- 239000002243 precursor Substances 0.000 claims description 26
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Chemical group NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 25
- 108091033319 polynucleotide Proteins 0.000 claims description 23
- 102000040430 polynucleotide Human genes 0.000 claims description 23
- 239000002157 polynucleotide Substances 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 19
- 238000003776 cleavage reaction Methods 0.000 claims description 17
- 230000007017 scission Effects 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 16
- 239000004472 Lysine Chemical group 0.000 claims description 11
- 238000001976 enzyme digestion Methods 0.000 claims description 11
- 241000894006 Bacteria Species 0.000 claims description 9
- 108010075254 C-Peptide Proteins 0.000 claims description 8
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 7
- 239000004475 Arginine Substances 0.000 claims description 5
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 5
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 claims description 4
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 claims description 4
- 230000009748 deglutition Effects 0.000 claims description 3
- 238000009472 formulation Methods 0.000 claims description 3
- 210000000349 chromosome Anatomy 0.000 claims description 2
- 239000003937 drug carrier Substances 0.000 claims description 2
- 239000013022 formulation composition Substances 0.000 claims description 2
- 239000008194 pharmaceutical composition Substances 0.000 claims description 2
- 108090000623 proteins and genes Proteins 0.000 abstract description 26
- 102000004169 proteins and genes Human genes 0.000 abstract description 15
- 238000002360 preparation method Methods 0.000 abstract description 10
- 230000004071 biological effect Effects 0.000 abstract description 4
- 108091005804 Peptidases Proteins 0.000 abstract description 3
- 239000004365 Protease Substances 0.000 abstract description 3
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 abstract 1
- RTZKZFJDLAIYFH-UHFFFAOYSA-N ether Substances CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 31
- 229920001184 polypeptide Polymers 0.000 description 30
- 102000004196 processed proteins & peptides Human genes 0.000 description 30
- 239000013612 plasmid Substances 0.000 description 18
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 17
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 description 16
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 14
- 239000013604 expression vector Substances 0.000 description 13
- 150000001413 amino acids Chemical class 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 12
- 150000001875 compounds Chemical class 0.000 description 12
- 210000003000 inclusion body Anatomy 0.000 description 12
- 239000000243 solution Substances 0.000 description 12
- 125000001033 ether group Chemical group 0.000 description 11
- 238000000855 fermentation Methods 0.000 description 11
- 230000004151 fermentation Effects 0.000 description 11
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 10
- 239000003208 petroleum Substances 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 9
- -1 Fmoc modified insulin Chemical class 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 238000004153 renaturation Methods 0.000 description 8
- 238000006467 substitution reaction Methods 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 7
- 239000007787 solid Substances 0.000 description 7
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 6
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 6
- 229940125782 compound 2 Drugs 0.000 description 6
- 229940126214 compound 3 Drugs 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 125000006239 protecting group Chemical group 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- WMSUFWLPZLCIHP-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 9h-fluoren-9-ylmethyl carbonate Chemical compound C12=CC=CC=C2C2=CC=CC=C2C1COC(=O)ON1C(=O)CCC1=O WMSUFWLPZLCIHP-UHFFFAOYSA-N 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 210000003527 eukaryotic cell Anatomy 0.000 description 5
- 239000012046 mixed solvent Substances 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 102000004142 Trypsin Human genes 0.000 description 4
- 108090000631 Trypsin Proteins 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 229940125904 compound 1 Drugs 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 230000001276 controlling effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 239000011259 mixed solution Substances 0.000 description 4
- 238000010188 recombinant method Methods 0.000 description 4
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 4
- 239000012588 trypsin Substances 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 3
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 3
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 3
- QGZKDVFQNNGYKY-UHFFFAOYSA-N ammonia Natural products N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 239000007853 buffer solution Substances 0.000 description 3
- 229940125898 compound 5 Drugs 0.000 description 3
- 206010012601 diabetes mellitus Diseases 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 238000010828 elution Methods 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 239000012535 impurity Substances 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 238000003756 stirring Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 description 2
- 102000003670 Carboxypeptidase B Human genes 0.000 description 2
- 108090000087 Carboxypeptidase B Proteins 0.000 description 2
- 102000005367 Carboxypeptidases Human genes 0.000 description 2
- 108010006303 Carboxypeptidases Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 2
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 2
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 2
- 101000976075 Homo sapiens Insulin Proteins 0.000 description 2
- VQUCKIAECLVLAD-SVSWQMSJSA-N Ile-Cys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VQUCKIAECLVLAD-SVSWQMSJSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 2
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 2
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 2
- 102000016261 Long-Acting Insulin Human genes 0.000 description 2
- 108010092217 Long-Acting Insulin Proteins 0.000 description 2
- 229940100066 Long-acting insulin Drugs 0.000 description 2
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 2
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- KLOZTPOXVVRVAQ-DZKIICNBSA-N Tyr-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KLOZTPOXVVRVAQ-DZKIICNBSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 230000001684 chronic effect Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- PAFZNILMFXTMIY-UHFFFAOYSA-N cyclohexylamine Chemical compound NC1CCCCC1 PAFZNILMFXTMIY-UHFFFAOYSA-N 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000000945 filler Substances 0.000 description 2
- IRXSLJNXXZKURP-UHFFFAOYSA-N fluorenylmethyloxycarbonyl chloride Chemical compound C1=CC=C2C(COC(=O)Cl)C3=CC=CC=C3C2=C1 IRXSLJNXXZKURP-UHFFFAOYSA-N 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 239000013049 sediment Substances 0.000 description 2
- 238000007086 side reaction Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000010254 subcutaneous injection Methods 0.000 description 2
- 239000007929 subcutaneous injection Substances 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- ZGYICYBLPGRURT-UHFFFAOYSA-N tri(propan-2-yl)silicon Chemical compound CC(C)[Si](C(C)C)C(C)C ZGYICYBLPGRURT-UHFFFAOYSA-N 0.000 description 2
- 108700004896 tripeptide FEG Proteins 0.000 description 2
- 238000000108 ultra-filtration Methods 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 1
- FAAHJOLJYDXKKU-ZHDGNLTBSA-N (2s)-6-amino-2-[[(2s)-1-[(2s,3r)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-hydroxybutanoyl]pyrrolidine-2-carbonyl]amino]hexanoic acid Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)CN)C1=CC=C(O)C=C1 FAAHJOLJYDXKKU-ZHDGNLTBSA-N 0.000 description 1
- RYHBNJHYFVUHQT-UHFFFAOYSA-N 1,4-Dioxane Chemical compound C1COCCO1 RYHBNJHYFVUHQT-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 1
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- PTNFNTOBUDWHNZ-GUBZILKMSA-N Asn-Arg-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O PTNFNTOBUDWHNZ-GUBZILKMSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 1
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 1
- YNQMEIJEWSHOEO-SRVKXCTJSA-N Asn-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YNQMEIJEWSHOEO-SRVKXCTJSA-N 0.000 description 1
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- 101000798396 Bacillus licheniformis Phenylalanine racemase [ATP hydrolyzing] Proteins 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102000001189 Cyclic Peptides Human genes 0.000 description 1
- 108010069514 Cyclic Peptides Proteins 0.000 description 1
- KOHBWQDSVCARMI-BWBBJGPYSA-N Cys-Cys-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KOHBWQDSVCARMI-BWBBJGPYSA-N 0.000 description 1
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 1
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 1
- WTXCNOPZMQRTNN-BWBBJGPYSA-N Cys-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)O WTXCNOPZMQRTNN-BWBBJGPYSA-N 0.000 description 1
- NAPULYCVEVVFRB-HEIBUPTGSA-N Cys-Thr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CS NAPULYCVEVVFRB-HEIBUPTGSA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- ZGTMUACCHSMWAC-UHFFFAOYSA-L EDTA disodium salt (anhydrous) Chemical compound [Na+].[Na+].OC(=O)CN(CC([O-])=O)CCN(CC(O)=O)CC([O-])=O ZGTMUACCHSMWAC-UHFFFAOYSA-L 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- GNDJOCGXGLNCKY-ACZMJKKPSA-N Gln-Cys-Cys Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O GNDJOCGXGLNCKY-ACZMJKKPSA-N 0.000 description 1
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 1
- XMVLTPMCUJTJQP-FXQIFTODSA-N Glu-Gln-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N XMVLTPMCUJTJQP-FXQIFTODSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- YVYVMJNUENBOOL-KBIXCLLPSA-N Glu-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N YVYVMJNUENBOOL-KBIXCLLPSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 1
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- IGBBXBFSLKRHJB-BZSNNMDCSA-N His-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 IGBBXBFSLKRHJB-BZSNNMDCSA-N 0.000 description 1
- YXASFUBDSDAXQD-UWVGGRQHSA-N His-Met-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O YXASFUBDSDAXQD-UWVGGRQHSA-N 0.000 description 1
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- DURWCDDDAWVPOP-JBDRJPRFSA-N Ile-Cys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N DURWCDDDAWVPOP-JBDRJPRFSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- FYZPCMFQCNBYCY-WIWKJPBBSA-N Insulin degludec Chemical compound CC[C@H](C)[C@H](NC(=O)CN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H]1CSSC[C@@H]2NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CSSC[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc3c[nH]cn3)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)Cc3ccccc3)C(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](Cc3c[nH]cn3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](Cc3ccc(O)cc3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC2=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccc(O)cc2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCCNC(=O)CC[C@H](NC(=O)CCCCCCCCCCCCCCC(O)=O)C(O)=O)C(O)=O)NC1=O)[C@@H](C)O)[C@@H](C)CC FYZPCMFQCNBYCY-WIWKJPBBSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- LEVWYRKDKASIDU-IMJSIDKUSA-N L-cystine Chemical compound [O-]C(=O)[C@@H]([NH3+])CSSC[C@H]([NH3+])C([O-])=O LEVWYRKDKASIDU-IMJSIDKUSA-N 0.000 description 1
- 239000004158 L-cystine Substances 0.000 description 1
- 235000019393 L-cystine Nutrition 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 1
- 102000017737 Lysine-tRNA Ligase Human genes 0.000 description 1
- 108010092041 Lysine-tRNA Ligase Proteins 0.000 description 1
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 101710118186 Neomycin resistance protein Proteins 0.000 description 1
- BZQFBWGGLXLEPQ-UHFFFAOYSA-N O-phosphoryl-L-serine Natural products OC(=O)C(N)COP(O)(O)=O BZQFBWGGLXLEPQ-UHFFFAOYSA-N 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 244000131316 Panax pseudoginseng Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 1
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 1
- KIQUCMUULDXTAZ-HJOGWXRNSA-N Phe-Tyr-Tyr Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O KIQUCMUULDXTAZ-HJOGWXRNSA-N 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- RTXKJFWHEBTABY-IHPCNDPISA-N Ser-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CO)N RTXKJFWHEBTABY-IHPCNDPISA-N 0.000 description 1
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- CJEHCEOXPLASCK-MEYUZBJRSA-N Thr-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=C(O)C=C1 CJEHCEOXPLASCK-MEYUZBJRSA-N 0.000 description 1
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- XBWKCYFGRXKWGO-SRVKXCTJSA-N Tyr-Cys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XBWKCYFGRXKWGO-SRVKXCTJSA-N 0.000 description 1
- QUILOGWWLXMSAT-IHRRRGAJSA-N Tyr-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QUILOGWWLXMSAT-IHRRRGAJSA-N 0.000 description 1
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 1
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 1
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 229960003067 cystine Drugs 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- KZNICNPSHKQLFF-UHFFFAOYSA-N dihydromaleimide Natural products O=C1CCC(=O)N1 KZNICNPSHKQLFF-UHFFFAOYSA-N 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 150000004665 fatty acids Chemical group 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 230000014726 immortalization of host cell Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229910017053 inorganic salt Inorganic materials 0.000 description 1
- 102000023879 insulin binding proteins Human genes 0.000 description 1
- 108091008406 insulin binding proteins Proteins 0.000 description 1
- 229960002869 insulin glargine Drugs 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 230000004630 mental health Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- USRGIUJOYOXOQJ-GBXIJSLDSA-N phosphothreonine Chemical compound OP(=O)(O)O[C@H](C)[C@H](N)C(O)=O USRGIUJOYOXOQJ-GBXIJSLDSA-N 0.000 description 1
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- HNJBEVLQSNELDL-UHFFFAOYSA-N pyrrolidin-2-one Chemical compound O=C1CCCN1 HNJBEVLQSNELDL-UHFFFAOYSA-N 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 239000012265 solid product Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 229960002317 succinimide Drugs 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 229940026454 tresiba Drugs 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P5/00—Drugs for disorders of the endocrine system
- A61P5/48—Drugs for disorders of the endocrine system of the pancreatic hormones
- A61P5/50—Drugs for disorders of the endocrine system of the pancreatic hormones for increasing or potentiating the activity of insulin
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/62—Insulins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/001—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof by chemical synthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/503—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from viruses
- C12N9/506—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from viruses derived from RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/22—Cysteine endopeptidases (3.4.22)
- C12Y304/22044—Nuclear-inclusion-a endopeptidase (3.4.22.44)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/60—Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/55—Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups
Abstract
本发明提供了一种德谷胰岛素衍生物及其制备方法。具体地,本发明提供了包含绿色荧光蛋白折叠单元和德谷胰岛素或其活性片段的融合蛋白。本发明的融合蛋白表达量显著提高,融合蛋白中的德谷胰岛素蛋白折叠正确,具有生物活性。并且,本发明融合蛋白中的绿色荧光蛋白折叠单元可以被蛋白酶消化成小片段,和目的蛋白相比分子量差别大,容易分离。本发明还提供了利用该融合蛋白制备德谷胰岛素的方法及制备中间体。
Description
技术领域
本发明涉及生物医药领域,更具体地涉及一种德谷胰岛素衍生物及其应用。
背景技术
糖尿病是全球范围内威胁人类健康的一大疾病。在中国,随着人民生活方式的改变和老龄化进程的加快,糖尿病的患病率呈快速上升趋势。糖尿病的急慢性并发症,尤其是慢性并发症累计多个器官,致残、致死率高,严重影响患者的身心健康,并给个人、家庭和社会带来沉重的负担。
由丹麦诺和诺德公司研制的重组德谷胰岛素注射液“Tresiba”是一种新型的长效胰岛素类似物。2013年1月得到欧盟批准,应用于I型和II型糖尿病患者的治疗。德谷胰岛素其结构特点为通过一个L-γ-Glu连接子将重组人胰岛素(去B链30位苏氨酸)的B链29位赖氨酸侧链εNH2基与修饰剂16碳脂肪二酸偶联而成。此设计提供一种独特的延长作用时间的机制。该种胰岛素类似物具有作用时间超长、变异性小、能够和速效胰岛素形成复方制剂等优点,皮下注射后会形成六聚体结构,此结构可作为一个存储库缓慢释放德谷胰岛素单体,这些单体能够缓慢并持续的被吸收利用。
国内外关于德谷胰岛素制备的报道很多,一般是通过一种基因重组技术得到德谷胰岛素主链(主链),再通过液相合成方法连接tBuO-Pal-Glu(OSu)-OtBu物质得到德谷胰岛素,由于德谷胰岛素主链处于未保护的状态,在连接过程中侧链容易接在N末端氨基上,从而产生杂质,导致纯化困难和收率较低的问题,工艺较复杂。
因此,本领域技术人员致力于开发新的、更长效的胰岛素衍生物。
发明内容
本发明的目的在于提供一种德谷胰岛素衍生物及其应用。
在本发明的第一方面,提供了一种德谷胰岛素前体融合蛋白,从N端到C端具有式III所示的结构:
A-FP-TEV-R-G (III)
式中,
“-”代表肽键;
A为无或前导肽,
FP为绿色荧光蛋白折叠单元,
TEV为第一酶切位点,较佳地为TEV酶酶切位点;
R为用于酶切的精氨酸或赖氨酸;
G为德谷胰岛素或其活性片段;
其中,所述的绿色荧光蛋白折叠单元包含2-6个选自下组的β-折叠单元:
β-折叠单元 | 氨基酸序列 |
u1 | VPILVELDGDVNG(SEQ ID NO:11) |
u2 | HKFSVRGEGEGDAT(SEQ ID NO:12) |
u3 | KLTLKFICTT(SEQ ID NO:13) |
u4 | YVQERTISFKD(SEQ ID NO:14) |
u5 | TYKTRAEVKFEGD(SEQ ID NO:15) |
u6 | TLVNRIELKGIDF(SEQ ID NO:16) |
u7 | HNVYITADKQ(SEQ ID NO:17) |
u8 | GIKANFKIRHNVED(SEQ ID NO:18) |
u9 | VQLADHYQQNTPIG(SEQ ID NO:19) |
u10 | HYLSTQSVLSKD(SEQ ID NO:20) |
u11 | HMVLLEFVTAAGI(SEQ ID NO:21)。 |
在另一优选例中,所述的绿色荧光蛋白折叠单元为u2-u3、u4-u5、u1-u2-u3、u3-u4-u5或u4-u5-u6。
在另一优选例中,所述的G为Boc修饰的德谷胰岛素前体,具有式IV所示的结构:
其具有式IV所示的结构:
GB-X-GA (IV)
式中,
“-”代表肽键;
GB为第29位Boc修饰的德谷胰岛素B链,氨基酸序列如SEQ ID NO:2所示,
X为连接肽,较佳地,所述连接肽的氨基酸序列为R、RR、RRR,或如SEQ ID NO:4-7所示;
GA为德谷胰岛素A链,氨基酸序列如SEQ ID NO:3所示。
在另一优选例中,所述的绿色荧光蛋白折叠单元为u3-u4-u5。
在另一优选例中,所述的绿色荧光蛋白折叠单元的氨基酸序列如SEQ ID NO:9所示。
在另一优选例中,所述的德谷胰岛素前体融合蛋白的氨基酸序列如SEQ ID NO:1所示。
在另一优选例中,所述GB的第29位赖氨酸为Nε-(叔丁氧羰基)-赖氨酸。
在另一优选例中,所述德谷胰岛素主链中包含的德谷胰岛素B链不包含侧链。
在另一优选例中,所述GB不包含侧链。
在本发明的第二方面,提供了一种德谷胰岛素主链融合蛋白,所述的德谷胰岛素融合蛋白从N端到C端具有式I所示的结构:
A-FP-TEV-R-D (I)
式中,
“-”代表肽键;
A为无或前导肽,
FP为绿色荧光蛋白折叠单元;
TEV为第一酶切位点,较佳地为TEV酶酶切位点(如序列ENLYFQG所示,SEQ ID NO:10);
R为用于酶切的精氨酸或赖氨酸;
D为Boc修饰的德谷胰岛素主链,具有式II所示的结构:
式中,
“║”代表二硫键;
GA为德谷胰岛素A链,氨基酸序列如SEQ ID NO:3所示,
X为无或为连接肽;
GB为第29位Boc修饰的德谷胰岛素B链,氨基酸序列如SEQ ID NO:2所示;
其中,所述的绿色荧光蛋白折叠单元包含2-6个选自下组的β-折叠单元:
β-折叠单元 | 氨基酸序列 |
u1 | VPILVELDGDVNG(SEQ ID NO:11) |
u2 | HKFSVRGEGEGDAT(SEQ ID NO:12) |
u3 | KLTLKFICTT(SEQ ID NO:13) |
u4 | YVQERTISFKD(SEQ ID NO:14) |
u5 | TYKTRAEVKFEGD(SEQ ID NO:15) |
u6 | TLVNRIELKGIDF(SEQ ID NO:16) |
u7 | HNVYITADKQ(SEQ ID NO:17) |
u8 | GIKANFKIRHNVED(SEQ ID NO:18) |
u9 | VQLADHYQQNTPIG(SEQ ID NO:19) |
u10 | HYLSTQSVLSKD(SEQ ID NO:20) |
u11 | HMVLLEFVTAAGI(SEQ ID NO:21)。 |
在另一优选例中,所述的R用于胰蛋白酶酶切和羧肽酶酶切。
在另一优选例中,所述德谷胰岛素B链的C端通过连接肽与德谷胰岛素A链的N端相连。
在另一优选例中,所述连接肽的氨基酸序列为R、RR、RRR,或如SEQ ID NO:4-7所示(RRGSKR,RRAAKR,RRYPGDVKR或RREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKR)。
在另一优选例中,所述德谷胰岛素B链第7位与A链第7位(A7-B7)、B链第19位与A链第20位(A20-B19)之间形成链间二硫键。
在另一优选例中,所述德谷胰岛素A链第6位与A链第11位(A6-A11)之间形成链内二硫键。
在另一优选例中,所述的绿色荧光蛋白折叠单元为u2-u3、u4-u5、u1-u2-u3、u3-u4-u5或u4-u5-u6。
在另一优选例中,所述的绿色荧光蛋白折叠单元为u3-u4-u5。
在另一优选例中,所述的Boc修饰的德谷胰岛素主链包含A链和B链,且A链和B链通过链间二硫键相连,较佳地通过两对。
在另一优选例中,所述的A链包含链内二硫键。
在另一优选例中,所述前导肽的序列如SEQ ID NO:8所示。
在本发明的第三方面,提供了一种Boc修饰的德谷胰岛素前体,具有式IV所示的结构:
GB-X-GA (IV)
式中,
“-”代表肽键;
GB为第29位Boc修饰的德谷胰岛素B链,氨基酸序列如SEQ ID NO:2所示,
X为连接肽,较佳地,所述连接肽的氨基酸序列为R、RR、RRR,或如SEQ ID NO:4-7所示;
GA为德谷胰岛素A链,氨基酸序列如SEQ ID NO:3所示。
在本发明的第四方面,提供了一种Boc修饰的德谷胰岛素主链,具有式II所示的结构:
式中,
“║”代表二硫键;
GA为德谷胰岛素A链,氨基酸序列如SEQ ID NO:3所示,
GB为德谷胰岛素B链,氨基酸序列如SEQ ID NO:2所示,且所述B链的第29位为Nε-(叔丁氧羰基)-赖氨酸。
在本发明的第五方面,提供了一种Boc修饰和Fmoc修饰的德谷胰岛素主链,具有式II所示的结构:
式中,
“║”代表二硫键;
GA为德谷胰岛素A链,氨基酸序列如SEQ ID NO:3所示,
GB为德谷胰岛素B链,氨基酸序列如SEQ ID NO:2所示,且所述B链的第29位为Nε-(叔丁氧羰基)-赖氨酸;
并且所述A链和B链的N端均被Fmoc修饰。
在另一优选例中,所述的Fmoc为芴甲氧羰基。
在本发明的第六方面,提供了一种Fmoc修饰的德谷胰岛素主链,具有式II所示的结构:
式中,
“║”代表二硫键;
GA为德谷胰岛素A链,氨基酸序列如SEQ ID NO:3所示,
GB为德谷胰岛素B链,氨基酸序列如SEQ ID NO:2所示;
并且所述A链和B链的N端均被Fmoc修饰。
在另一优选例中,所述的Fmoc为芴甲氧羰基。
在本发明的第七方面,提供了一种制备德谷胰岛素的方法,其特征在于,所述方法包括步骤:
(A)利用重组菌进行发酵,制备德谷胰岛素前体融合蛋白,
(B)利用所述的德谷胰岛素前体融合蛋白,制备德谷胰岛素,
其中,所述的德谷胰岛素前体融合蛋白如本发明第一方面所述。
在另一优选例中,所述的步骤(B)还包括步骤:
(ia)从所述重组菌的发酵液中分离获得德谷胰岛素前体融合蛋白包涵体,对所述的包涵体进行变复性后,获得德谷胰岛素主链融合蛋白;
(ib)对所述的德谷胰岛素主链融合蛋白进行酶切处理,从而获得Boc修饰的德谷胰岛素主链;
(ii)对所述的Boc修饰的德谷胰岛素主链进行Fmoc修饰,从而制得Fmoc和Boc修饰的德谷胰岛素主链;
(iii)对所述的Fmoc和Boc修饰的德谷胰岛素主链进行脱Boc处理,从而获得脱Boc的德谷胰岛素主链;
(iv)将所述脱Boc的德谷胰岛素主链与德谷胰岛素侧链进行反应,从而制得Fmoc修饰的德谷胰岛素;和
(v)对所述的Fmoc修饰的德谷胰岛素进行脱Fmoc与侧链脱tBu处理,从而制得德谷胰岛素。
在另一优选例中,在步骤(ib)中,利用胰蛋白酶和羧肽酶B进行酶切处理。
在另一优选例中,所述的Boc修饰的德谷胰岛素主链如本发明第四方面所述。
在另一优选例中,所述的Fmoc修饰是对德谷胰岛素B链和A链的N端进行修饰。
在另一优选例中,所述的德谷胰岛素侧链如下所示:
在另一优选例中,在步骤(ii)中,加入Fmoc-Osu、DIPEA(N,N-二异丙基乙胺)和DMF(N,N-二甲基甲酰胺),从而进行Fmoc修饰。
在另一优选例中,加入的Fmoc-OSu、DIPEA与Boc修饰的德谷胰岛素主链的摩尔比为(3-6):(10-14):(0.8-1.2),较佳地为(3.5-5.5):(11-13):(0.8-1.2)。
在另一优选例中,在步骤(ii)和步骤(iii)之间,还包括对制得的Fmoc和Boc修饰的德谷胰岛素主链进行纯化的步骤,较佳地,利用甲叔醚/石油醚混合液进行纯化。
在另一优选例中,在步骤(iii)中,还包括步骤:
(a)加入TFA(三氟乙酸)的混合液,低温搅拌,进行脱Boc处理,制得脱Boc产物;
(b)对脱Boc产物进行纯化处理,较佳地利用甲叔醚/石油醚混合液进行纯化,从而获得固体脱Boc产物,即脱Boc的德谷胰岛素主链。
在另一优选例中,在步骤(iv)中,在DIPEA存在下,在室温下进行所述反应。
在另一优选例中,在步骤(iv)中,在DMF中进行所述反应。
在另一优选例中,所述脱Boc的德谷胰岛素主链、德谷胰岛素侧链和DIPEA的摩尔比为(0.8-1.2):(2-5):(4-10),较佳地为1:2.5:12。
在另一优选例中,在步骤(v)中,加入含有哌啶的DMF溶液,进行脱Fmoc处理,从而制得所述的德谷胰岛素。
在另一优选例中,在步骤(v)中,包括对制得的德谷胰岛素进行纯化的步骤。
在另一优选例中,所述Boc修饰的德谷胰岛素主链利用基因重组技术制备。
在另一优选例中,在步骤(ib)之后,还包括两步纯化步骤。
在另一优选例中,在步骤(ib)中,所述德谷胰岛素融合蛋白与胰蛋白酶的质量比为1:3000-1:10000。
在另一优选例中,在步骤(ib)中,德谷胰岛素融合蛋白与羧肽酶的质量比为1:5000-1:15000。
在另一优选例中,所述的重组菌中包含或整合有表达德谷胰岛素前体融合蛋白的表达盒。
在另一优选例中,所述的方法如下:
在另一优选例中,所述方法包括步骤:
(i)提供本发明第二方面所述的德谷胰岛素主链融合蛋白,酶切获得化合物1;
(ii)对化合物1进行Fmoc修饰,从而制得化合物2;
(iii)对所述的化合物2进行脱Boc处理,从而制得化合物3;
(iv)将化合物3与德谷胰岛素侧链进行反应,从而制得化合物4;和
(v)对化合物4进行脱Fmoc与侧链脱tBu处理,从而制得化合物6所示的德谷胰岛素。
在本发明的第七方面,提供了一种德谷胰岛素制剂,所述的德谷胰岛素制剂使用本发明第六方面所述的方法制备。
在另一优选例中,制得的德谷胰岛素具有生物活性。
本发明的第八方面,提供了一种分离的多核苷酸,所述多核苷酸编码本发明第一方面所述的德谷胰岛素前体融合蛋白、本发明第二方面所述的德谷胰岛素主链融合蛋白、本发明第三方面所述的德谷胰岛素前体、或本发明第四、五、六方面所述的德谷胰岛素主链。
本发明的第九方面,提供了一种载体,所述载体包括本发明第八方面所述的多核苷酸。
在另一优选例中,所述的载体选自下组:DNA、RNA、质粒、慢病毒载体、腺病毒载体、逆转录病毒载体、转座子、或其组合。
本发明的第十方面,提供了一种宿主细胞,所述的宿主细胞含有本发明第九方面所述的载体、或染色体中整合有外源的本发明第八方面所述的多核苷酸。
在另一优选例中,所述的宿主细胞为大肠杆菌、枯草芽孢杆菌、酵母细胞、昆虫细胞、哺乳动物细胞或其组合。
本发明的第十一方面,提供了一种制剂或药物组合物,所述制剂或药物组合物包含本发明第一方面所述的德谷胰岛素前体融合蛋白、本发明第二方面所述的德谷胰岛素主链融合蛋白、本发明第三方面所述的德谷胰岛素前体、或本发明第四、五、六方面所述的德谷胰岛素主链,以及药学上可接受的载体。
附图说明
图1显示了质粒pBAD-FP-TEV-R-Insulin(DesB30,Lys29Boc)图谱。
图2显示了质粒pEvol-pylRs-pylT图谱。
图3显示了包涵体变复性后Boc-德谷胰岛素主链融合蛋白的SDS-PAGE电泳图。
图4显示了Boc-德谷胰岛素主链反相纯化收集液的HPLC检测图谱。
图5显示了本发明的德谷胰岛素精纯最终产物的HPLC检测图谱。
具体实施方式
本发明人经过广泛而深入地研究,发现了一种德谷胰岛素衍生物及其制备方法。具体地,本发明提供了包含绿色荧光蛋白折叠单元和德谷胰岛素或其活性片段的融合蛋白。本发明的融合蛋白表达量显著提高,融合蛋白中的德谷胰岛素蛋白折叠正确,具有生物活性。并且,本发明融合蛋白中的绿色荧光蛋白折叠单元可以被蛋白酶消化成小片段,和目的蛋白相比分子量差别大,容易分离。本发明还提供了利用该融合蛋白制备德谷胰岛素的方法及制备中间体。在此基础上完成了本发明。
德谷胰岛素
德谷胰岛素是一种新型的长效胰岛素类似物。2013年1月得到欧盟批准,应用于I型和II型糖尿病患者的治疗。德谷胰岛素其结构特点为通过一个L-γ-Glu连接子将重组人胰岛素(去B链30位苏氨酸)的B链29位赖氨酸侧链ε-NH2基与修饰剂16碳脂肪二酸偶联而成。此设计提供一种独特的延长作用时间的机制。该种胰岛素类似物具有作用时间超长、变异性小、能够和速效胰岛素形成复方制剂等优点,皮下注射后会形成六聚体结构,此结构可作为一个存储库缓慢释放德谷胰岛素单体,这些单体能够缓慢并持续的被吸收利用。
德谷胰岛素表达质粒的构建
合成带有目的基因的FP-TEV-R-Insulin(DesB30,Lys29Boc)片段,片段两端具有限制性内切酶NcoⅠ和XhoⅠ的识别位点。该序列进行了密码子优化,可以实现功能蛋白在大肠杆菌中的高水平表达。表达后使用限制性内切酶NcoⅠ和XhoⅠ酶切表达载体“pBAD/His A(KanaR)”和含有“FP-TEV-R-Insulin(DesB30,Lys29Boc)”目的基因的质粒,酶切产物通过琼脂糖电泳进行分离,再使用琼脂糖凝胶DNA回收试剂盒进行提取,最后使用T4 DNA连接酶将两个DNA片段连接起来。将所述连接产物以化学法转化至大肠杆菌Top10细胞,将所述转化的细胞培养在含有50μg/mL卡那霉素的LB琼脂培养基(10g/L酵母蛋白胨,5g/L酵母浸粉,10g/L NaCl,1.5%琼脂)上过夜。挑取3个活菌落,在5mL含有50μg/mL卡那霉素的液体LB培养基(10g/L酵母蛋白胨,5g/L酵母浸粉,10g/L NaCl)中过夜培养,使用质粒小量提取试剂盒进行质粒提取。然后,将所述提取的质粒使用测序寡核苷酸引物5’-ATGCCATAGCATTTTTATCC-3’进行测序,以确认正确插入。最终得到的质粒被命名为“pBAD-FP-TEV-R-Insulin(DesB30,Lys29Boc)”。
融合蛋白
利用绿色荧光蛋白折叠单元,本发明构建了两种融合蛋白,即本发明第一方面所述的包含单链德谷胰岛素的德谷胰岛素前体融合蛋白和本发明第二方面所述的包含双链德谷胰岛素的德谷胰岛素主链融合蛋白。事实上,本发明的两种融合蛋白的保护范围可能部分重叠,例如融合蛋白中包含的双链形式的德谷胰岛素,其B链的C端也可以连接肽与A链的N端相连,也可以被认定为包含链内二硫键的单链。
本发明的融合蛋白中包含的绿色荧光蛋白折叠单元FP包含2-6个,较佳地2-3个选自下组的β-折叠单元:
氨基酸序列 | |
u1 | VPILVELDGDVNG(SEQ ID NO:11) |
u2 | HKFSVRGEGEGDAT(SEQ ID NO:12) |
u3 | KLTLKFICTT(SEQ ID NO:13) |
u4 | YVQERTISFKD(SEQ ID NO:14) |
u5 | TYKTRAEVKFEGD(SEQ ID NO:15) |
u6 | TLVNRIELKGIDF(SEQ ID NO:16) |
u7 | HNVYITADKQ(SEQ ID NO:17) |
u8 | GIKANFKIRHNVED(SEQ ID NO:18) |
u9 | VQLADHYQQNTPIG(SEQ ID NO:19) |
u10 | HYLSTQSVLSKD(SEQ ID NO:20) |
u11 | HMVLLEFVTAAGI(SEQ ID NO:21)。 |
在另一优选例中,所述的绿色荧光蛋白折叠单元FP可以选自:u8、u9、u2-u3、u4-u5、u8-u9、u1-u2-u3、u2-u3-u4、u3-u4-u5、u5-u6-u7、u8-u9-u10、u9-u10-u11、u3-u5-u7、u3-u4-u6、u4-u7-u10、u6-u8-u10、u1-u2-u3-u4、u2-u3-u4-u5、u3-u4-u3-u4、u3-u5-u7-u9、u5-u6-u7-u8、u1-u3-u7-u9、u2-u2-u7-u8、u7-u2-u5-u11、u3-u4-u7-u10、u1-I-u2、u1-I-u5、u2-I-u4、u3-I-u8、u5-I-u6、或u10-I-u11。
在另一优选例中,所述的绿色荧光蛋白折叠单元为u3-u4-u5。
在另一优选例中,本发明的融合蛋白具有下式所示的结构:
A-FP-TEV-R-G
式中,
“-”代表肽键;
A为无或前导肽,
FP为绿色荧光蛋白折叠单元,
TEV为酶切位点,较佳地为TEV酶酶切位点(序列为ENLYFQG,SEQ ID NO:4);
R为酶切位点;
G为Boc修饰的德谷胰岛素前体,G具有下式所示的结构:
(B1F~B29Boc-K)-X-(A1G~A21N)
式中,
X为连接肽,较佳地,所述连接肽的氨基酸序列为R、RR、RRR,或如SEQ ID NO:4-7所示(RRGSKR,RRAAKR,RRYPGDVKR或RREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKR)。
如本文所用,术语“融合蛋白”还包括具有上述活性的变异形式。这些变异形式包括(但并不限于):1-3个(通常为1-2个,更佳地1个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加或缺失一个或数个(通常为3个以内,较佳地为2个以内,更佳地为1个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加或缺失一个或数个氨基酸通常也不会改变蛋白质的结构和功能。此外,所述术语还包括单体和多聚体形式的本发明多肽。该术语还包括线性以及非线性的多肽(如环肽)。
本发明还包括上述融合蛋白的活性片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明融合蛋白的功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或几个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合于此多肽序列而形成的多肽(与前导序列、分泌序列或6His等标签序列融合而形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
一类优选的活性衍生物指与本发明的氨基酸序列相比,有至多3个,较佳地至多2个,更佳地至多1个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表A进行氨基酸替换而产生。
表A
最初的残基 | 代表性的取代 | 优选的取代 |
Ala(A) | Val;Leu;Ile | Val |
Arg(R) | Lys;Gln;Asn | Lys |
Asn(N) | Gln;His;Lys;Arg | Gln |
Asp(D) | Glu | Glu |
Cys(C) | Ser | Ser |
Gln(Q) | Asn | Asn |
Glu(E) | Asp | Asp |
Gly(G) | Pro;Ala | Ala |
His(H) | Asn;Gln;Lys;Arg | Arg |
Ile(I) | Leu;Val;Met;Ala;Phe | Leu |
Leu(L) | Ile;Val;Met;Ala;Phe | Ile |
Lys(K) | Arg;Gln;Asn | Arg |
Met(M) | Leu;Phe;Ile | Leu |
Phe(F) | Leu;Val;Ile;Ala;Tyr | Leu |
Pro(P) | Ala | Ala |
Ser(S) | Thr | Thr |
Thr(T) | Ser | Ser |
Trp(W) | Tyr;Phe | Tyr |
Tyr(Y) | Trp;Phe;Thr;Ser | Phe |
Val(V) | Ile;Leu;Met;Phe;Ala | Leu |
本发明还提供本发明融合蛋白的类似物。这些类似物与本发明的多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
此外,还可以对本发明融合蛋白进行修饰。修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
术语“编码本发明融合蛋白的多核苷酸”可以是包括编码本发明融合蛋白的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或融合蛋白的片段、类似物和衍生物。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的融合蛋白的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件(或严紧条件)下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。
本发明的融合蛋白和多核苷酸优选以分离的形式提供,更佳地,被纯化至均质。
本发明多核苷酸全长序列通常可以通过PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。
应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的多核苷酸。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
表达载体
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或本发明融合蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的融合蛋白。一般来说有以下步骤:
(1).用本发明的编码本发明融合蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,编码融合蛋白的多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含本发明融合蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母、植物细胞(如人参细胞)。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
Fmoc修饰
在生物医药领域中,多肽的用途越来越大,氨基酸是合成多肽技术的基本原料,氨基酸都含有α-氨基和羧基,有些还含有侧链活泼基团,如:羟基、氨基、胍基和杂环等,因此,氨基和侧链活泼基团在接肽反应中都需要保护起来,合成多肽后再脱去保护基团,否者会发生氨基酸的错接和许多副反应。
芴甲氧羰基(Fmoc)为碱敏感保护基,能在浓氨水或二氧六环-甲醇-4N Na OH(30:9:1)以及哌啶、乙醇胺、环己胺、1,4-二氧六环、吡咯烷酮等氨类的50%二氯甲烷溶液中脱去。
在碳酸钠或碳酸氢钠等弱碱性条件下,一般用Fmoc-Cl或Fmoc-OSu引入Fmoc保护基。相对Fmoc-Cl来说,Fmoc-OSu更容易控制反应条件,且副反应较少。Fmoc具有很强的紫外吸收,最大吸收波长为267nm(ε18950),290nm(ε5280),301nm(ε6200),因此可用紫外吸收来检测,给仪器自动多肽合成带来许多方便。再者可与大范围的溶剂、试剂相兼容,机械稳定性高,可用多种载体和多种活化方式等。因此当今多肽合成中最常用的就是Fmoc保护基团。
Fmoc-OSu(芴甲氧羰酰琥珀酰亚胺)
德谷胰岛素侧链
tBuO-Pal-Glu(OSu)-OtBu为德谷胰岛素侧链。
德谷胰岛素的制备,是先利用基因重组技术得到29位Boc保护赖氨酸的德谷胰岛素主链,再连接德谷胰岛素侧链tBuO-Pal-Glu(OSu)-OtBu,从而得到德谷胰岛素。
德谷胰岛素的的制备
本发明的提供了德谷胰岛素合成路线如下所示,从Boc-德谷胰岛素主链(化合物1)制备Fmoc修饰的化合物2,化合物2脱Boc保护后得化合物3,化合物3与活化德谷胰岛素侧链tBuO-Pal-Glu(OSu)-OtBu反应,得到化合物4,再经脱去Fmoc反应得到化合物5,侧链脱除tBu保护基,最后得到化合物6德谷胰岛素。
具体地,本发明提供一种制备德谷胰岛素的方法,所述方法包括步骤:
(i)提供一Boc修饰的德谷胰岛素主链;
(ii)对所述的Boc修饰的德谷胰岛素主链进行Fmoc修饰,从而制得Fmoc和Boc修饰的德谷胰岛素主链;
(iii)对所述的Fmoc和Boc修饰的德谷胰岛素主链进行脱Boc处理,并将其与德谷胰岛素侧链进行反应,从而制得Fmoc修饰的德谷胰岛素;和
(iv)对所述的Fmoc修饰的德谷胰岛素进行脱Fmoc与侧链脱tBu处理,从而制得德谷胰岛素。
本发明的主要优点包括:
(1)本发明直接利用生物合成的方式生产Boc修饰的德谷胰岛素主链,不需要采用稀释、超滤换液等方法去除发酵液上清中过量的无机盐。其次,在制备目的肽过程中无需溴化氰裂解、氧化亚硫酸盐解以及相关纯化步骤。
(2)在本发明的方法中,融合蛋白中包含德谷胰岛素主链的比重高(融合比增加),融合蛋白中FP或A-FP包含精氨酸、赖氨酸,可以被蛋白酶消化成小片段,和目的蛋白相比分子量差别大,容易分离,使用层析柱分离Boc-德谷胰岛素主链或类似物前体,一步收率在70%以上,比常规方法高3倍,并且能除去绝大部分色素,Boc-德谷胰岛素主链的产量约1.5-1.8g/L。本发明的合成工艺步骤简化了三分之二以上,降低了工艺时间和设备投资成本。
(3)由于29位Boc-赖氨酸的保护,本发明可以直接利用与Fmoc保护的正交反应,合成德谷胰岛素。
(4)本发明的方法合成的德谷胰岛素无N端脂肪酸酰化的杂质,利于下游纯化,降低成本。
(5)与固相合成相比,本发明的方法不会产生消旋的杂质多肽,并且不需使用大量的修饰氨基酸,不使用大量的有机试剂,对环境污染小,成本更低。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。
实施例1德谷胰岛素表达菌株的构建及表达
德谷胰岛素表达载体的构建参照专利申请号201910210102.9中实施例的记载。将融合蛋白FP-TEV-R-Insulin(DesB30,Lys29Boc)的DNA片段,克隆至表达载体质粒pBAD/HisA(购自NTCC公司,卡那霉素抗性)的araBAD启动子下游NcoI-XhoI位点,得到质粒pBAD-FP-TEV-R-Insulin(DesB30,Lys29Boc)。质粒图谱如图1所示。
再将pylRs的DNA序列,克隆至表达载体质粒pEvol-pBpF(购自NTCC公司,氯霉素抗性)的araBAD启动子下游SpeI-SalI位点,同时在proK启动子下游,以PCR方法插入赖氨酰-tRNA合成酶的tRNA(pylTcua)的DNA序列。该质粒命名为pEvol-pylRs-pylT。质粒图谱如图2所示。
将构建的质粒pBAD-FP-TEV-R-Insulin(DesB30,Lys29Boc)和pEvol-pylRs-pylT共同转化至大肠杆菌TOP10菌株,筛选获得表达德谷胰岛素主链融合蛋白FP-TEV-R-Insulin(DesB30,Lys29Boc)的重组大肠杆菌菌株。
MVSKGEELFTGVKLTLKFICTTYVQERTISFKDTYKTRAEVKFEGDENLYFQGRFVNQHLCGSHLVEALYLVCGERGFFYTPK(Boc)RGIVEQCCTSICSLYQLENYCN(SEQ ID NO:1)
配制种子液培养基,接种,经过两级培养制得二级种子液,培养20h,OD600达到180左右,发酵结束,得到约3L发酵液,离心得到约150g/L的湿菌体。发酵液离心后,加入破碎缓冲液,利用高压均质机破菌两次,离心后加入一定浓度吐温80和EDTA-2Na等洗涤,接着水洗一次,离心收集沉淀得到包涵体。每升发酵液最终可获得约40g湿重包涵体,包涵体中包含的为德谷胰岛素前体融合蛋白。
实施例2Boc-德谷胰岛素前体包涵体的变复性及酶切
向实施例1所得包涵体中以重量体积比1:10(m/v)的比例加入7.5-9.0mol/L尿素溶解液,室温搅拌溶解,控制包涵体溶解液总蛋白浓度为10-25mg/mL,NaOH调节pH至11.0-11.8,加入β-巯基乙醇搅拌均匀。将包涵体溶解液滴加至含有0.2-1.0mmol/L L-胱氨酸的复性缓冲液中,使包涵体溶解液稀释5-10倍复性,维持融合蛋白复性液pH值在10.5-11.8,温度控制在4-8℃,复性时间为10-20h,复性率60%以上(电泳检测见图3),得到德谷胰岛素A链和德谷胰岛素B链间包含二硫键的德谷胰岛素主链融合蛋白。
取Boc-德谷胰岛素主链融合蛋白复性液,调节pH至8.0-9.5,按1:3000-1:10000加入重组胰蛋白酶,1:5000-1:15000加入重组羧肽酶B,15-25℃下酶切20-40h,最终获得Boc-德谷胰岛素主链,酶切率高于70%。
实施例3Boc-德谷胰岛素主链的初步纯化
超滤去除酶切液中的不溶混合物,根据蛋白质等电点差异,采用阴离子交换层析技术对实施例2获得的Boc-德谷胰岛素主链进行初步纯化,以去除大部分杂质,控制Boc-德谷胰岛素主链与填料结合载量低于50mg/mL,梯度洗脱收集Boc-德谷胰岛素主链,粗纯后Boc-德谷胰岛素主链纯度达70%以上,收率大于85%。
实施例4Boc-德谷胰岛素主链的反相层析
实施例3获得的Boc-德谷胰岛素主链溶液,进行反相层析分离纯化。以含有三氟乙酸的水溶液作为流动相A;以含有三氟乙酸的乙腈溶液作为流动相B。Boc-德谷胰岛素主链与填料结合,控制Boc-德谷胰岛素主链上样量<10mg/mL,梯度洗脱,收集Boc-德谷胰岛素主链。实验结果显示,反相层析收集的Boc-德谷胰岛素主链纯度≥90%(HPLC检测图见图4),收率大于60%。
实施例5利用Boc-德谷胰岛素主链制备德谷胰岛素
取实施例4得到的Boc-德谷胰岛素主链化合物1干燥品(本例中投料摩尔比以30mg为例),按照表1的比例加入Fmoc-Osu、DIPEA及DMF,pH7.5-8.5条件下反应8-12小时,制得Fmoc和Boc保护的德谷胰岛素主链。然后向反应体系中加入冷的甲叔醚/石油醚混合溶剂,将固体沉淀离心分离,用甲叔醚和石油醚混合溶剂洗涤沉淀2-3次,获得Fmoc保护的化合物2:DiFmoc-Insulin(DesB30,Lys29Boc)。
表1投料的摩尔比
Boc-德谷胰岛素主链 | Fmoc-OSu | DIPEA | DMF | |
当量或体积 | 1.0eq | 5eq | 12eq | 1V |
取化合物2,加入TFA溶液,低温搅拌0.5-2.0h,向反应混合物中加入冷的甲叔醚和石油醚的混合溶液,沉降离心。固体用甲叔醚洗涤2-3次,干燥,获得脱除Boc的固体化合物3:DiFmoc-Insulin(DesB30,Lys29 NH2)。
取Boc脱除后的化合物3,溶于DMF溶液,加入12eq的DIPEA,在pH8.0-9.0条件下加入2.5eq的侧链化合物tBuO-Pal-Glu(OSu)-OtBu,将反应混合物在室温下温和搅拌2-3小时。反应结束后加入冷的甲叔醚/石油醚混合溶剂沉淀出固体产物,洗涤2-3次,干燥,获得白色的化合物4:DiFmoc-Insulin(tBuO-Pal-Glu-(Lys29NH)-OtBu,DesB30)。
取化合物4,加入含有20%哌啶的DMF溶液,室温反应0.5-2.0h。接着在反应体系中内加入甲叔醚和石油醚的混合溶液沉淀产物,固体离心用甲叔醚和石油醚洗涤3-5次,干燥,得到脱除Fmoc后的化合物5:Insulin(tBuO-Pal-Glu-(Lys29NH)-OtBu,DesB30)。
取脱除Fmoc后的化合物5,加入TFA(三氟乙酸)、TIS(三异丙基硅烷)及DCM(二氯甲烷)的混合溶液,室温震荡反应2-4h,脱除侧链tBu保护基,在反应体系内加入10-20倍体积的冷的甲叔醚和石油醚混合溶剂,沉淀离心,固体用甲叔醚和石油醚混合溶剂洗涤3次以上,抽干,最终获得德谷胰岛素。
合成后的德谷胰岛素经过两步高压反相层析,最终获得纯度大于99%的德谷胰岛素(见图5)。
对比例
采用实施例1类似的方法进行融合蛋白表达菌株的构建及表达,其区别仅在于用于表达的融合蛋白的氨基酸序列如SEQ ID NO:22所示。
MKKLLFAIPLVVPFYSHSTMELEICSWYHMGIRSFLEQKLISEEDLNSAVDRFVNQHLCGSHLVEALYLVCGERGFFYTPK(Boc)RGIVEQCCTSICSLYQLENYCN(SEQ ID NO:22)
上述融合蛋白中,包含德谷胰岛素B链和A链,同时还包含gⅢ信号肽。
结果显示,培养20h,OD600达到140左右,发酵结束,得到约3L发酵液,离心得到约105g/L的湿菌体。发酵液离心后,加入破碎缓冲液,利用高压均质机破菌两次,并离心收集沉淀得到包涵体。每升发酵液最终可获得约30g湿重包涵体,包涵体中包含的为德谷胰岛素融合蛋白。
上述结果表明,与常规结构融合蛋白的表达相比,本发明的融合蛋白表达量显著提高,并且融合蛋白中的德谷胰岛素蛋白折叠正确,具有生物活性。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 宁波鲲鹏生物科技有限公司
<120> 一种德谷胰岛素衍生物及其应用
<130> P2019-1942
<160> 22
<170> SIPOSequenceListing 1.0
<210> 1
<211> 105
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Lys Leu Thr Leu
1 5 10 15
Lys Phe Ile Cys Thr Thr Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys
20 25 30
Asp Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Glu Asn
35 40 45
Leu Tyr Phe Gln Gly Arg Phe Val Asn Gln His Leu Cys Gly Ser His
50 55 60
Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr
65 70 75 80
Thr Pro Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser
85 90 95
Leu Tyr Gln Leu Glu Asn Tyr Cys Asn
100 105
<210> 2
<211> 29
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
20 25
<210> 3
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
1 5 10 15
Glu Asn Tyr Cys Asn
20
<210> 4
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Arg Arg Gly Ser Lys Arg
1 5
<210> 5
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 5
Arg Arg Ala Ala Lys Arg
1 5
<210> 6
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Arg Arg Tyr Pro Gly Asp Val Lys Arg
1 5
<210> 7
<211> 35
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly
1 5 10 15
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
20 25 30
Gln Lys Arg
35
<210> 8
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 8
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val
1 5 10
<210> 9
<211> 34
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 9
Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Tyr Val Gln Glu Arg Thr
1 5 10 15
Ile Ser Phe Lys Asp Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu
20 25 30
Gly Asp
<210> 10
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 10
Glu Asn Leu Tyr Phe Gln Gly
1 5
<210> 11
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 11
Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly
1 5 10
<210> 12
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 12
His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr
1 5 10
<210> 13
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 13
Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr
1 5 10
<210> 14
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 14
Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp
1 5 10
<210> 15
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 15
Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp
1 5 10
<210> 16
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 16
Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe
1 5 10
<210> 17
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 17
His Asn Val Tyr Ile Thr Ala Asp Lys Gln
1 5 10
<210> 18
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 18
Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp
1 5 10
<210> 19
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 19
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly
1 5 10
<210> 20
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 20
His Tyr Leu Ser Thr Gln Ser Val Leu Ser Lys Asp
1 5 10
<210> 21
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 21
His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile
1 5 10
<210> 22
<211> 103
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 22
Met Lys Lys Leu Leu Phe Ala Ile Pro Leu Val Val Pro Phe Tyr Ser
1 5 10 15
His Ser Thr Met Glu Leu Glu Ile Cys Ser Trp Tyr His Met Gly Ile
20 25 30
Arg Ser Phe Leu Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser
35 40 45
Ala Val Asp Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val
50 55 60
Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro
65 70 75 80
Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr
85 90 95
Gln Leu Glu Asn Tyr Cys Asn
100
Claims (16)
1.一种德谷胰岛素前体融合蛋白,其特征在于,从N端到C端具有式III所示的结构:
A-FP-TEV-R-G (III)
式中,
“-”代表肽键;
A为无或前导肽,
FP为绿色荧光蛋白折叠单元,
TEV为第一酶切位点;
R为用于酶切的精氨酸或赖氨酸;
G为德谷胰岛素主链或其活性片段;
其中,所述的绿色荧光蛋白折叠单元为2-3个选自下组的β-折叠单元:
并且所述的绿色荧光蛋白折叠单元选自:u2-u3、u4-u5、u1-u2-u3、u3-u4-u5或u4-u5-u6。
2. 如权利要求1所述的融合蛋白,其特征在于,所述的G为Boc修饰的德谷胰岛素前体,具有式IV所示的结构:
GB-X-GA (IV)
式中,
“-”代表肽键;
GB为第29位Boc修饰的德谷胰岛素B链,氨基酸序列如SEQ ID NO: 2所示,
X为连接肽;
GA为德谷胰岛素A链,氨基酸序列如SEQ ID NO: 3所示。
3. 如权利要求1所述的融合蛋白,其特征在于,所述的德谷胰岛素前体融合蛋白的氨基酸序列如SEQ ID NO: 1所示。
4.如权利要求1所述的融合蛋白,其特征在于,所述TEV为TEV酶酶切位点。
5. 一种德谷胰岛素主链融合蛋白,其特征在于,从N端到C端具有式I所示的结构:
A-FP-TEV-R-D (I)
式中,
“-”代表肽键;
A为无或前导肽,
FP为绿色荧光蛋白折叠单元;
TEV为第一酶切位点;
R为用于酶切的精氨酸或赖氨酸;
D为Boc修饰的德谷胰岛素主链,具有式II所示的结构:
“║”代表二硫键;
GA为德谷胰岛素A链,氨基酸序列如SEQ ID NO: 3所示,
X为无或为连接肽;
GB为第29位Boc修饰的德谷胰岛素B链,氨基酸序列如SEQ ID NO: 2所示;
其中,所述的绿色荧光蛋白折叠单元为2-3个选自下组的β-折叠单元:
并且所述的绿色荧光蛋白折叠单元选自:u2-u3、u4-u5、u1-u2-u3、u3-u4-u5或u4-u5-u6。
6.如权利要求5所述的德谷胰岛素主链融合蛋白,其特征在于,所述的绿色荧光蛋白折叠单元为u3-u4-u5。
7.如权利要求5所述的德谷胰岛素主链融合蛋白,其特征在于,所述TEV为TEV酶酶切位点。
8.一种制备Boc修饰的德谷胰岛素前体的方法,其特征在于,所述方法包括步骤:
(i) 利用重组菌进行发酵,制备权利要求1所述的融合蛋白;
(ii) 对所述融合蛋白进行酶切,从而获得Boc修饰的德谷胰岛素前体,所述Boc修饰的德谷胰岛素前体具有式IV所示的结构:
GB-X-GA (IV)
式中,
“-”代表肽键;
GB为第29位Boc修饰的德谷胰岛素B链,氨基酸序列如SEQ ID NO: 2所示,
X为连接肽;
GA为德谷胰岛素A链,氨基酸序列如SEQ ID NO: 3所示。
9. 如权利要求8所述的方法,其特征在于,所述连接肽的氨基酸序列为R、RR、RRR,或如SEQ ID NO: 4-7所示。
10.一种制备Boc修饰的德谷胰岛素主链的方法,其特征在于,包括步骤:
(i) 利用重组菌进行发酵,制备权利要求1所述的融合蛋白;
(ii) 对所述融合蛋白进行酶切,从而获得Boc修饰的德谷胰岛素主链,
所述Boc修饰的德谷胰岛素主链具有式II所示的结构:
GA
║
GB (II)
式中,
“║”代表二硫键;
GA为德谷胰岛素A链,氨基酸序列如SEQ ID NO: 3所示,
GB为德谷胰岛素B链,氨基酸序列如SEQ ID NO: 2所示,且所述B链的第29位赖氨酸为Nε-(叔丁氧羰基)-赖氨酸。
11.如权利要求10所述的方法,其特征在于,所述A链和B链的N端均被Fmoc修饰。
12.一种制备Fmoc修饰的德谷胰岛素主链的方法,其特征在于,包括步骤:
(i) 利用重组菌进行发酵,制备权利要求1所述的融合蛋白;
(ii) 对所述融合蛋白进行酶切,从而获得Fmoc修饰的德谷胰岛素主链,所述Fmoc修饰的德谷胰岛素主链具有式II所示的结构:
GA
║
GB (II)
式中,
“║”代表二硫键;
GA为德谷胰岛素A链,氨基酸序列如SEQ ID NO: 3所示,
GB为德谷胰岛素B链,氨基酸序列如SEQ ID NO: 2所示;
并且所述A链和B链的N端均被Fmoc修饰。
13.一种分离的多核苷酸,其特征在于,所述多核苷酸编码权利要求1所述的德谷胰岛素前体融合蛋白,权利要求5所述的德谷胰岛素主链融合蛋白。
14.一种载体,其特征在于,所述载体包括权利要求13所述的多核苷酸。
15.一种宿主细胞,其特征在于,所述的宿主细胞含有权利要求14所述的载体、或染色体中整合有外源的权利要求13所述的多核苷酸。
16.一种制剂或药物组合物,所述制剂或药物组合物包含权利要求1所述的德谷胰岛素前体融合蛋白、权利要求5所述的德谷胰岛素主链融合蛋白,以及药学上可接受的载体。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010524886.5A CN113773398B (zh) | 2020-06-10 | 2020-06-10 | 一种德谷胰岛素衍生物及其应用 |
BR112022025334A BR112022025334A2 (pt) | 2020-06-10 | 2021-06-10 | Derivado de insulina degludeca, método de preparação do mesmo, e uso do mesmo |
US18/000,986 US20230127875A1 (en) | 2020-06-10 | 2021-06-10 | Insulin degludec derivative, preparation method therefor, and application thereof |
JP2022576376A JP2023531168A (ja) | 2020-06-10 | 2021-06-10 | インスリンデグルデク誘導体およびその製造方法と使用 |
EP21821084.7A EP4166573A1 (en) | 2020-06-10 | 2021-06-10 | Insulin degludec derivative, preparation method therefor, and application thereof |
PCT/CN2021/099493 WO2021249505A1 (zh) | 2020-06-10 | 2021-06-10 | 一种德谷胰岛素衍生物及其制备方法和应用 |
CN202180041116.8A CN115708413A (zh) | 2020-06-10 | 2021-06-10 | 一种德谷胰岛素衍生物及其制备方法和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010524886.5A CN113773398B (zh) | 2020-06-10 | 2020-06-10 | 一种德谷胰岛素衍生物及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113773398A CN113773398A (zh) | 2021-12-10 |
CN113773398B true CN113773398B (zh) | 2023-05-23 |
Family
ID=78834815
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010524886.5A Active CN113773398B (zh) | 2020-06-10 | 2020-06-10 | 一种德谷胰岛素衍生物及其应用 |
CN202180041116.8A Pending CN115708413A (zh) | 2020-06-10 | 2021-06-10 | 一种德谷胰岛素衍生物及其制备方法和应用 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180041116.8A Pending CN115708413A (zh) | 2020-06-10 | 2021-06-10 | 一种德谷胰岛素衍生物及其制备方法和应用 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230127875A1 (zh) |
EP (1) | EP4166573A1 (zh) |
JP (1) | JP2023531168A (zh) |
CN (2) | CN113773398B (zh) |
BR (1) | BR112022025334A2 (zh) |
WO (1) | WO2021249505A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116425884B (zh) * | 2023-03-09 | 2024-04-26 | 北京惠之衡生物科技有限公司 | 一种德谷胰岛素的纯化及制备方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102504022A (zh) * | 2011-11-30 | 2012-06-20 | 苏州元基生物技术有限公司 | 含有保护赖氨酸的胰岛素原及使用其制备胰岛素的方法 |
CN102628072A (zh) * | 2012-03-20 | 2012-08-08 | 甘李药业有限公司 | 一种胰岛素的制备方法 |
CN104619726A (zh) * | 2012-03-23 | 2015-05-13 | 苏州鲲鹏生物技术有限公司 | 由超折叠绿色荧光蛋白构成的融合蛋白及其用途 |
CN104892749A (zh) * | 2015-06-16 | 2015-09-09 | 珠海联邦制药股份有限公司 | 一种德谷胰岛素结晶的制备方法及应用 |
CN105820233A (zh) * | 2015-01-04 | 2016-08-03 | 甘李药业股份有限公司 | 一种胰岛素衍生物的制备方法 |
CN109295067A (zh) * | 2018-10-26 | 2019-02-01 | 吉林津升制药有限公司 | 一种密码子优化的德谷胰岛素前体基因及其表达方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK134189D0 (da) * | 1989-03-20 | 1989-03-20 | Nordisk Gentofte | Insulinforbindelser |
KR20140104994A (ko) * | 2011-12-15 | 2014-08-29 | 샹하이 헨그루이 파마수티컬 컴퍼니 리미티드 | 인간 인슐린 유사체 및 이의 아실화 유도체 |
CN111718417B (zh) * | 2019-03-19 | 2022-10-14 | 宁波鲲鹏生物科技有限公司 | 含有荧光蛋白片段的融合蛋白及其用途 |
-
2020
- 2020-06-10 CN CN202010524886.5A patent/CN113773398B/zh active Active
-
2021
- 2021-06-10 WO PCT/CN2021/099493 patent/WO2021249505A1/zh unknown
- 2021-06-10 BR BR112022025334A patent/BR112022025334A2/pt unknown
- 2021-06-10 JP JP2022576376A patent/JP2023531168A/ja active Pending
- 2021-06-10 CN CN202180041116.8A patent/CN115708413A/zh active Pending
- 2021-06-10 EP EP21821084.7A patent/EP4166573A1/en not_active Withdrawn
- 2021-06-10 US US18/000,986 patent/US20230127875A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102504022A (zh) * | 2011-11-30 | 2012-06-20 | 苏州元基生物技术有限公司 | 含有保护赖氨酸的胰岛素原及使用其制备胰岛素的方法 |
CN102628072A (zh) * | 2012-03-20 | 2012-08-08 | 甘李药业有限公司 | 一种胰岛素的制备方法 |
CN104619726A (zh) * | 2012-03-23 | 2015-05-13 | 苏州鲲鹏生物技术有限公司 | 由超折叠绿色荧光蛋白构成的融合蛋白及其用途 |
CN105820233A (zh) * | 2015-01-04 | 2016-08-03 | 甘李药业股份有限公司 | 一种胰岛素衍生物的制备方法 |
CN104892749A (zh) * | 2015-06-16 | 2015-09-09 | 珠海联邦制药股份有限公司 | 一种德谷胰岛素结晶的制备方法及应用 |
CN109295067A (zh) * | 2018-10-26 | 2019-02-01 | 吉林津升制药有限公司 | 一种密码子优化的德谷胰岛素前体基因及其表达方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113773398A (zh) | 2021-12-10 |
BR112022025334A2 (pt) | 2023-03-07 |
EP4166573A1 (en) | 2023-04-19 |
WO2021249505A1 (zh) | 2021-12-16 |
JP2023531168A (ja) | 2023-07-21 |
US20230127875A1 (en) | 2023-04-27 |
CN115708413A (zh) | 2023-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4166575A1 (en) | Semaglutide derivative, and preparation method therefor and application thereof | |
CN113801233B (zh) | 一种索玛鲁肽的制备方法 | |
WO2021147869A1 (zh) | 利拉鲁肽衍生物及其制备方法 | |
CN113773398B (zh) | 一种德谷胰岛素衍生物及其应用 | |
EP3950719A1 (en) | Fusion protein containing fluorescent protein fragments and uses thereof | |
CN113801234B (zh) | 一种索玛鲁肽衍生物及其应用 | |
CN113773397B (zh) | 一种德谷胰岛素的制备方法 | |
CN113773399B (zh) | 一种甘精胰岛素衍生物及其应用 | |
CN113773392B (zh) | 一种甘精胰岛素的制备方法 | |
CN113801235A (zh) | 一种赖脯胰岛素衍生物及其应用 | |
CN113801236A (zh) | 一种赖脯胰岛素的制备方法 | |
CN114057886B (zh) | 一种索玛鲁肽衍生物及其制备方法 | |
CN113773400B (zh) | 一种门冬胰岛素衍生物及其应用 | |
CN113773391B (zh) | 一种门冬胰岛素的制备方法 | |
CN113773396A (zh) | 一种地特胰岛素衍生物及其应用 | |
CN113773395A (zh) | 一种地特胰岛素的制备方法 | |
CN114075295A (zh) | 一种Boc-人胰岛素融合蛋白包涵体的高效复性液及其复性方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A DeGu insulin derivative and its application Effective date of registration: 20230928 Granted publication date: 20230523 Pledgee: Huishang Bank Co.,Ltd. Ningbo Yuyao Branch Pledgor: Ningbo Kunpeng Biotechnology Co.,Ltd. Registration number: Y2023980059983 |