CN105308067A - 制备成熟胰岛素多肽的方法 - Google Patents
制备成熟胰岛素多肽的方法 Download PDFInfo
- Publication number
- CN105308067A CN105308067A CN201480032597.6A CN201480032597A CN105308067A CN 105308067 A CN105308067 A CN 105308067A CN 201480032597 A CN201480032597 A CN 201480032597A CN 105308067 A CN105308067 A CN 105308067A
- Authority
- CN
- China
- Prior art keywords
- insulin
- human
- precursor
- analogue
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 108090001061 Insulin Proteins 0.000 title claims description 194
- 102000004877 Insulin Human genes 0.000 title claims description 193
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 claims abstract description 115
- 239000002243 precursor Substances 0.000 claims abstract description 94
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 15
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 claims description 351
- 229940125396 insulin Drugs 0.000 claims description 165
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 88
- 229950004152 insulin human Drugs 0.000 claims description 85
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 69
- 125000000539 amino acid group Chemical group 0.000 claims description 59
- 230000002538 fungal effect Effects 0.000 claims description 44
- 108091033319 polynucleotide Proteins 0.000 claims description 15
- 239000002157 polynucleotide Substances 0.000 claims description 15
- 102000040430 polynucleotide Human genes 0.000 claims description 15
- 238000012239 gene modification Methods 0.000 claims description 14
- 230000005017 genetic modification Effects 0.000 claims description 14
- 235000013617 genetically modified food Nutrition 0.000 claims description 14
- 101100043108 Schizosaccharomyces pombe (strain 972 / ATCC 24843) spb1 gene Proteins 0.000 claims description 12
- 101150036326 PMT2 gene Proteins 0.000 claims description 11
- 101150092906 pmt1 gene Proteins 0.000 claims description 11
- 101100241858 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) OAC1 gene Proteins 0.000 claims description 10
- 239000013604 expression vector Substances 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 5
- 244000286779 Hansenula anomala Species 0.000 claims description 4
- 235000014683 Hansenula anomala Nutrition 0.000 claims description 4
- 241000235058 Komagataella pastoris Species 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 2
- 108010075254 C-Peptide Proteins 0.000 abstract description 46
- 241000233866 Fungi Species 0.000 abstract description 15
- 101000976075 Homo sapiens Insulin Proteins 0.000 abstract description 11
- 210000004027 cell Anatomy 0.000 description 72
- VOUAQYXWVJDEQY-QENPJCQMSA-N 33017-11-7 Chemical group OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)NCC(=O)NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N1[C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)CCC1 VOUAQYXWVJDEQY-QENPJCQMSA-N 0.000 description 46
- 235000001014 amino acid Nutrition 0.000 description 34
- 108090000765 processed proteins & peptides Proteins 0.000 description 34
- 229940024606 amino acid Drugs 0.000 description 27
- 150000001413 amino acids Chemical class 0.000 description 27
- 239000004026 insulin derivative Substances 0.000 description 26
- 108090000623 proteins and genes Proteins 0.000 description 22
- 239000013612 plasmid Substances 0.000 description 20
- 230000004989 O-glycosylation Effects 0.000 description 19
- 108020004414 DNA Proteins 0.000 description 18
- 238000006206 glycosylation reaction Methods 0.000 description 17
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 15
- 230000015572 biosynthetic process Effects 0.000 description 15
- 230000013595 glycosylation Effects 0.000 description 15
- 102000004196 processed proteins & peptides Human genes 0.000 description 15
- 238000003786 synthesis reaction Methods 0.000 description 15
- 238000003752 polymerase chain reaction Methods 0.000 description 14
- 238000000855 fermentation Methods 0.000 description 13
- 230000004151 fermentation Effects 0.000 description 13
- 230000001580 bacterial effect Effects 0.000 description 12
- 230000004927 fusion Effects 0.000 description 12
- 108091005804 Peptidases Proteins 0.000 description 11
- 102000035195 Peptidases Human genes 0.000 description 11
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 10
- 125000003275 alpha amino acid group Chemical group 0.000 description 10
- 108091034117 Oligonucleotide Proteins 0.000 description 9
- 108010076504 Protein Sorting Signals Proteins 0.000 description 9
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 9
- 229910052739 hydrogen Inorganic materials 0.000 description 9
- 229960004717 insulin aspart Drugs 0.000 description 9
- VOMXSOIBEJBQNF-UTTRGDHVSA-N novorapid Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 VOMXSOIBEJBQNF-UTTRGDHVSA-N 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 235000018102 proteins Nutrition 0.000 description 9
- 102000004169 proteins and genes Human genes 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 241000590035 Achromobacter lyticus Species 0.000 description 8
- -1 Gly insulin analog Chemical class 0.000 description 8
- 241000235648 Pichia Species 0.000 description 8
- MEIRRNXMZYDVDW-MQQKCMAXSA-N (2E,4E)-2,4-hexadien-1-ol Chemical compound C\C=C\C=C\CO MEIRRNXMZYDVDW-MQQKCMAXSA-N 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 7
- 239000004365 Protease Substances 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 229920001184 polypeptide Polymers 0.000 description 7
- 229910052700 potassium Inorganic materials 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 229940088598 enzyme Drugs 0.000 description 6
- 230000000968 intestinal effect Effects 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 125000003729 nucleotide group Chemical group 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 235000019419 proteases Nutrition 0.000 description 6
- 108010090613 Human Regular Insulin Proteins 0.000 description 5
- 102000013266 Human Regular Insulin Human genes 0.000 description 5
- 241000235649 Kluyveromyces Species 0.000 description 5
- 206010036618 Premenstrual syndrome Diseases 0.000 description 5
- 239000003242 anti bacterial agent Substances 0.000 description 5
- 229940088710 antibiotic agent Drugs 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000002255 enzymatic effect Effects 0.000 description 5
- 239000013613 expression plasmid Substances 0.000 description 5
- 238000013467 fragmentation Methods 0.000 description 5
- 238000006062 fragmentation reaction Methods 0.000 description 5
- 229940038563 human regular insulin Drugs 0.000 description 5
- 239000012535 impurity Substances 0.000 description 5
- 125000000311 mannosyl group Chemical group C1([C@@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 210000005253 yeast cell Anatomy 0.000 description 5
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 4
- 102000004357 Transferases Human genes 0.000 description 4
- 108090000992 Transferases Proteins 0.000 description 4
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical group C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 4
- 241000235013 Yarrowia Species 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 239000012228 culture supernatant Substances 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 229910052731 fluorine Inorganic materials 0.000 description 4
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 244000005700 microbiome Species 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 238000010561 standard procedure Methods 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- 229910052721 tungsten Inorganic materials 0.000 description 4
- 229910052727 yttrium Inorganic materials 0.000 description 4
- 229920001817 Agar Polymers 0.000 description 3
- 241000228245 Aspergillus niger Species 0.000 description 3
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 3
- 101000801742 Homo sapiens Triosephosphate isomerase Proteins 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- 241000233654 Oomycetes Species 0.000 description 3
- 241000235343 Saccharomycetales Species 0.000 description 3
- 241000235346 Schizosaccharomyces Species 0.000 description 3
- 101150032817 TPI1 gene Proteins 0.000 description 3
- 102100033598 Triosephosphate isomerase Human genes 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 108090000637 alpha-Amylases Proteins 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 238000011210 chromatographic step Methods 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 230000002797 proteolythic effect Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000004007 reversed phase HPLC Methods 0.000 description 3
- 229940081969 saccharomyces cerevisiae Drugs 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- ALYNCZNDIQEVRV-UHFFFAOYSA-N 4-aminobenzoic acid Chemical compound NC1=CC=C(C(O)=O)C=C1 ALYNCZNDIQEVRV-UHFFFAOYSA-N 0.000 description 2
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 2
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 241000235349 Ascomycota Species 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 2
- 241000194108 Bacillus licheniformis Species 0.000 description 2
- 108010023063 Bacto-peptone Proteins 0.000 description 2
- 241000221198 Basidiomycota Species 0.000 description 2
- 239000002028 Biomass Substances 0.000 description 2
- 101100408676 Caenorhabditis elegans pmt-1 gene Proteins 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 241000233652 Chytridiomycota Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 241000221199 Cryptococcus <basidiomycete yeast> Species 0.000 description 2
- 241000235646 Cyberlindnera jadinii Species 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 241000223218 Fusarium Species 0.000 description 2
- 241000178290 Geotrichum fermentans Species 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 241000223198 Humicola Species 0.000 description 2
- 108010057186 Insulin Glargine Proteins 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- COCFEDIXXNGUNL-RFKWWTKHSA-N Insulin glargine Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(=O)NCC(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 COCFEDIXXNGUNL-RFKWWTKHSA-N 0.000 description 2
- 244000285963 Kluyveromyces fragilis Species 0.000 description 2
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical group NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 2
- 241000235395 Mucor Species 0.000 description 2
- 241000226677 Myceliophthora Species 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 2
- 101150086142 PMT4 gene Proteins 0.000 description 2
- 241000228143 Penicillium Species 0.000 description 2
- 108010076181 Proinsulin Proteins 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 101710118538 Protease Proteins 0.000 description 2
- 241000235403 Rhizomucor miehei Species 0.000 description 2
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 2
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 2
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 2
- 241001123227 Saccharomyces pastorianus Species 0.000 description 2
- 241000235344 Saccharomycetaceae Species 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- 241000187432 Streptomyces coelicolor Species 0.000 description 2
- 241001494489 Thielavia Species 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 241001149964 Tolypocladium Species 0.000 description 2
- 241000223259 Trichoderma Species 0.000 description 2
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 241000235015 Yarrowia lipolytica Species 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- 125000001931 aliphatic group Chemical group 0.000 description 2
- 102000004139 alpha-Amylases Human genes 0.000 description 2
- 229940024171 alpha-amylase Drugs 0.000 description 2
- 125000003368 amide group Chemical group 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- KLOHDWPABZXLGI-YWUHCJSESA-M ampicillin sodium Chemical group [Na+].C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C([O-])=O)(C)C)=CC=CC=C1 KLOHDWPABZXLGI-YWUHCJSESA-M 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000004087 circulation Effects 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- WNRQPCUGRUFHED-DETKDSODSA-N humalog Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 WNRQPCUGRUFHED-DETKDSODSA-N 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 229960002869 insulin glargine Drugs 0.000 description 2
- 229960002068 insulin lispro Drugs 0.000 description 2
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 102220092852 rs754853086 Human genes 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 239000002195 soluble material Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 229960002898 threonine Drugs 0.000 description 2
- 229910021654 trace metal Inorganic materials 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 239000003643 water by type Substances 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 1
- QOOQLKSEGVNYLA-UHFFFAOYSA-N 1-$l^{1}-oxidanylbutane Chemical group CCCC[O] QOOQLKSEGVNYLA-UHFFFAOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- 239000004382 Amylase Substances 0.000 description 1
- 108010065511 Amylases Proteins 0.000 description 1
- 102000013142 Amylases Human genes 0.000 description 1
- 108010079054 Amyloid beta-Protein Precursor Proteins 0.000 description 1
- 102000014303 Amyloid beta-Protein Precursor Human genes 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 108010037870 Anthranilate Synthase Proteins 0.000 description 1
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 1
- 101710082738 Aspartic protease 3 Proteins 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 1
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000003910 Baronia <angiosperm> Species 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 241000335423 Blastomyces Species 0.000 description 1
- 241000235172 Bullera Species 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 101000898643 Candida albicans Vacuolar aspartic protease Proteins 0.000 description 1
- 241000222128 Candida maltosa Species 0.000 description 1
- 101000898783 Candida tropicalis Candidapepsin Proteins 0.000 description 1
- 208000036086 Chromosome Duplication Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 101000898784 Cryphonectria parasitica Endothiapepsin Proteins 0.000 description 1
- 241000490729 Cryptococcaceae Species 0.000 description 1
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 108010059378 Endopeptidases Proteins 0.000 description 1
- 102000005593 Endopeptidases Human genes 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 238000004252 FT/ICR mass spectrometry Methods 0.000 description 1
- 241000221207 Filobasidium Species 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 239000005905 Hydrolysed protein Substances 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108010073961 Insulin Aspart Proteins 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 241000221479 Leucosporidium Species 0.000 description 1
- 108010036940 Levansucrase Proteins 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 241000235042 Millerozyma farinosa Species 0.000 description 1
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 239000006057 Non-nutritive feed additive Substances 0.000 description 1
- 241000320412 Ogataea angusta Species 0.000 description 1
- 241001452677 Ogataea methanolica Species 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102000015731 Peptide Hormones Human genes 0.000 description 1
- 108010038988 Peptide Hormones Proteins 0.000 description 1
- 241001489192 Pichia kluyveri Species 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 101000933133 Rhizopus niveus Rhizopuspepsin-1 Proteins 0.000 description 1
- 101000910082 Rhizopus niveus Rhizopuspepsin-2 Proteins 0.000 description 1
- 101000910079 Rhizopus niveus Rhizopuspepsin-3 Proteins 0.000 description 1
- 101000910086 Rhizopus niveus Rhizopuspepsin-4 Proteins 0.000 description 1
- 101000910088 Rhizopus niveus Rhizopuspepsin-5 Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000223252 Rhodotorula Species 0.000 description 1
- 101000898773 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Saccharopepsin Proteins 0.000 description 1
- 101900084120 Saccharomyces cerevisiae Triosephosphate isomerase Proteins 0.000 description 1
- 241000204893 Saccharomyces douglasii Species 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 241000582914 Saccharomyces uvarum Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 101900104102 Schizosaccharomyces pombe Triosephosphate isomerase Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 101800001707 Spacer peptide Proteins 0.000 description 1
- 241000228389 Sporidiobolus Species 0.000 description 1
- 241000222068 Sporobolomyces <Sporidiobolaceae> Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 101150033985 TPI gene Proteins 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 244000301083 Ustilago maydis Species 0.000 description 1
- 235000015919 Ustilago maydis Nutrition 0.000 description 1
- 101500022170 Ustilago maydis (strain 521 / FGSC 9021) Rep1-3 Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- LPQOADBMXVRBNX-UHFFFAOYSA-N ac1ldcw0 Chemical compound Cl.C1CN(C)CCN1C1=C(F)C=C2C(=O)C(C(O)=O)=CN3CCSC1=C32 LPQOADBMXVRBNX-UHFFFAOYSA-N 0.000 description 1
- 108010048241 acetamidase Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000005903 acid hydrolysis reaction Methods 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 108010045649 agarase Proteins 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 229960000510 ammonia Drugs 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 235000019418 amylase Nutrition 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 238000012865 aseptic processing Methods 0.000 description 1
- 230000003305 autocrine Effects 0.000 description 1
- 210000000227 basophil cell of anterior lobe of hypophysis Anatomy 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 150000007516 brønsted-lowry acids Chemical class 0.000 description 1
- 150000007528 brønsted-lowry bases Chemical class 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 235000013877 carbamide Nutrition 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- OEYIOHPDSNJKLS-UHFFFAOYSA-N choline Chemical compound C[N+](C)(C)CCO OEYIOHPDSNJKLS-UHFFFAOYSA-N 0.000 description 1
- 229960001231 choline Drugs 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000013530 defoamer Substances 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 229960000304 folic acid Drugs 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 108700004813 glycosylated insulin Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000002386 leaching Methods 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 229960003511 macrogol Drugs 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 238000001465 metallisation Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 230000005405 multipole Effects 0.000 description 1
- KIALCSMRIHRFPL-UHFFFAOYSA-N n-(2,5-diphenylpyrazol-3-yl)-4-nitrobenzamide Chemical compound C1=CC([N+](=O)[O-])=CC=C1C(=O)NC1=CC(C=2C=CC=CC=2)=NN1C1=CC=CC=C1 KIALCSMRIHRFPL-UHFFFAOYSA-N 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 229960003512 nicotinic acid Drugs 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229940014662 pantothenate Drugs 0.000 description 1
- 235000019161 pantothenic acid Nutrition 0.000 description 1
- 239000011713 pantothenic acid Substances 0.000 description 1
- 229940049547 paraxin Drugs 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 150000003016 phosphoric acids Chemical class 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 101150054232 pyrG gene Proteins 0.000 description 1
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 1
- 235000008160 pyridoxine Nutrition 0.000 description 1
- 239000011677 pyridoxine Substances 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 235000019192 riboflavin Nutrition 0.000 description 1
- 229960002477 riboflavin Drugs 0.000 description 1
- 239000002151 riboflavin Substances 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 210000004739 secretory vesicle Anatomy 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- OFVLGDICTFRJMM-WESIUVDSSA-N tetracycline Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O OFVLGDICTFRJMM-WESIUVDSSA-N 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940045136 urea Drugs 0.000 description 1
- 230000004304 visual acuity Effects 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/62—Insulins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/62—Insulins
- C07K14/625—Extraction from natural sources
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biochemistry (AREA)
- Genetics & Genomics (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Endocrinology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Diabetes (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明涉及制备成熟人胰岛素或其类似物的改善的方法,即通过培养包含编码人胰岛素或其类似物的前体的DNA序列的真菌细胞,所述前体包含小的连接肽。
Description
技术背景
本发明涉及制备成熟胰岛素多肽的重组蛋白表达和蛋白化学。
背景
胰岛素是在胰岛β细胞中产生的多肽激素。有活性的胰岛素分子是由通过两个二硫键相连的B-链和A-链组成的双链分子。胰岛素以结构为B-C-A的前体分子胰岛素原形式合成,其中C-肽链将B-链的C-末端氨基酸残基与A-链的N-末端氨基酸残基相连。成熟的双链胰岛素通过在位于与A-链和B-链的接点处的碱性氨基酸残基对处体内切割C-肽而形成。A-链和B-链通过分别位于A7和B7以及A20和B19 Cys残基之间的两个二硫键保持在一起。此外,生物学活性的胰岛素分子在A6和A11位Cys残基之间有一个内部二硫键。
已经描述了在基因修饰宿主细胞例如大肠杆菌和酵母中生产胰岛素及其前体的许多方法。在大多数酵母工艺中,具有或天然C-肽或修饰的C-肽的胰岛素前体被表达和从酵母细胞中分泌出来。WO90/10075公开了具有C-肽AAK的胰岛素前体。WO01/49742公开了具有包含芳族氨基酸残基的C-肽的胰岛素前体。WO02/079251公开了具有包含Gly残基的C-肽的胰岛素前体。WO02/079250公开了具有包含Pro残基的C-肽的胰岛素前体。WO02/100887公开了具有包含糖基化位点的C-肽的胰岛素前体。WO2008/037735公开了具有包含kex2p切割位点的C-肽的胰岛素前体。WO2011/099028公开了降低在毕赤酵母(Pichia sp)中产生的胰岛素或胰岛素类似物前体分子的O-糖基化水平的方法。
如果没有直接获得成熟胰岛素或胰岛素类似物产物,则在一个或多个后续的体外酶促步骤中通过切割C-肽和可能的N-末端延伸而获得。这些酶促步骤是耗时的,常常是昂贵的,并且具有引入额外相关杂质(即类似成熟的胰岛素多肽的杂质)的风险。胰岛素多肽的酵母表达的另一个挑战是胰岛素多肽的O-糖基化。O-糖基化胰岛素多肽也是相关杂质。对于所有相关杂质而言相同的是,它们在技术上难以除去,并由此在商业纯化工艺中除去花费多。这是因为需要额外的纯化步骤,通常是色谱步骤,或需要在经济上不利的条件下操作色谱步骤。相关杂质的结果是,这样的色谱步骤可能在较长周期内、较低的柱载量、或甚至较低的收率下操作。
在制药工业中胰岛素产品越来越多地由胰岛素多肽的衍生物构成并且这类药物产品越来越多地用于非注射递送。因此,胰岛素市场已经变成竞争性市场并变为每一剂需要更多胰岛素多肽的产品,所以需要成本上更有效的工艺用于制备胰岛素多肽。
因此,需要在工业生产工艺中通过真菌制备人胰岛素或其类似物,其胰岛素前体分子具有减少的O-糖基化。也需要具有胰岛素前体的较高收率并且可通过有效和简单的工艺使得胰岛素前体顺从于C-肽的蛋白水解切除的工业生产工艺。
概述
本发明提供新的连接肽(C-肽),当其在转化的微生物、尤其是酵母中表达时,赋予胰岛素前体分子的高收率。新的连接肽当在真菌例如酵母中表达时也促进通常低水平的O-糖基化。在具有降低O-糖基化能力的真菌菌株中表达新的胰岛素前体进一步降低了所表达的O-糖基化的胰岛素前体的比例。这类胰岛素前体随后可通过一个或多个合适的、公知的转化步骤而转化为人胰岛素、desB30人胰岛素、其它胰岛素类似物或某些胰岛素衍生物。
依据本发明的第一方面,提供了制备成熟人胰岛素或其类似物的方法,即通过培养包含编码人胰岛素或其类似物的前体的DNA序列的真菌细胞,所述前体具有序列Z-B-X-Y-A,其中
- Z是任选的延伸序列,
- B是人胰岛素或其类似物的B-链,
- X是选自以下的序列:X1M、EA、AE、AD、DA和AP,其中X1是包含1-3个氨基酸残基的序列,
- Y是K或R,和
- A是人胰岛素或其类似物的A-链。
依据本发明第二方面,提供了包含序列Z-B-X-Y-A的胰岛素前体,其中
- Z是任选的延伸序列,
- B是人胰岛素或其类似物的B-链,
- X是选自以下的序列:X1M、EA、AE、AD、DA和AP,其中X1是包含1-3个氨基酸残基的序列,
- Y是K或R,和
- A是人胰岛素或其类似物的A-链。
依据本发明第三方面,提供了在真菌细胞中表达期间降低人胰岛素或人胰岛素类似物的前体的O-糖基化的方法,所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下,培养包含编码人胰岛素或其类似物的前体的DNA序列的真菌细胞,所述前体具有序列Z-B-X-Y-A,其中
- Z是任选的延伸序列,
- B是人胰岛素或其类似物的B-链,
- X是选自以下的序列:X1M、EA、AE、AD、DA和AP,其中X1是包含1-3个氨基酸残基的序列,
- Y是K或R,和
- A是人胰岛素或其类似物的A-链。
依据本发明第四方面,提供了在真菌细胞中表达期间增加人胰岛素或人胰岛素类似物的前体的收率的方法,所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下,培养包含编码人胰岛素或其类似物的前体的DNA序列的真菌细胞,所述前体具有序列Z-B-X-Y-A,其中
- Z是任选的延伸序列,
- B是人胰岛素或其类似物的B-链,
- X是选自以下的序列:X1M、EA、AE、AD、DA和AP,其中X1是包含1-3个氨基酸残基的序列,
- Y是K或R,和
- A是人胰岛素或其类似物的A-链。
本发明的方法提供了优于先前描述的通过培养真菌细胞制备成熟人胰岛素或其类似物的方法的许多优势。例如,已经发现本发明的胰岛素前体在真菌中以非常高的收率表达。已经惊奇地发现新的胰岛素前体也导致低量的O-糖基化胰岛素前体形式的相关杂质。进一步发现,通过使用不同的蛋白甘露糖基转移酶敲除菌株,可将低量的O-糖基化胰岛素前体甚至进一步降低达2-4倍。因此,目标是提供在真菌中展现高表达水平的胰岛素前体以及所表达的胰岛素前体具有低水平的O-糖基化。由于,惊奇地发现同时可通过选择胰岛素前体中的C-肽以及通过使用PMT调节的菌株二者降低O-糖基化水平,高表达收率仍然是重要的。
降低O-糖基化允许优化上游发酵工艺以及同时优化下游转化和纯化工艺,其中任何O-糖基化形式最终必须被除去。本发明的胰岛素前体此外通过蛋白酶切割而促进有效成熟,所述蛋白酶例如水解无色杆菌(Acromobacter
lyticus)蛋白酶(ALP)。因此,发酵收率、O-糖基化和ALP切割的这种组合优化的结果允许明显更高的发酵收率,明显更高的纯化柱载量,和甚至从目前使用的工艺中取消了纯化步骤以及流线型(streamlined)ALP切割反应步骤。所得全工艺因此增加了生产工厂的能力,同时降低了生产胰岛素多肽所需的原材料的量。这两种结果都促使胰岛素多肽成本下降。
用作表达人胰岛素或人胰岛素类似物的前体的宿主细胞的真菌细胞可以携带降低其O-糖基化能力的至少一个遗传修饰。本发明的连接肽X-Y,导致从真菌细胞中分泌出来的胰岛素前体的低O-糖基化。然而,对于一些C-肽,通过在具有降低O-糖基化的能力的真菌细胞中表达,得到甚至更低水平的O-糖基化。在一个实施方案中,所述降低真菌细胞O-糖基化能力的遗传修饰是在PMT1或PMT2的基因内的至少一个遗传修饰。
在本发明的一个实施方案中,在序列Z-B-X-Y-A 中的连接肽X-Y是X1M-Y,其中X1是包含1-3个氨基酸残基的序列。因此,一方面本发明涉及胰岛素前体,其包含可从A链和B链上切割下来的连接肽(X-Y)和包含至少一个M和使得A-链和连接肽之间的肽键能够被切割的切割位点,其中一个M是紧接在所述切割位点的N-末端。
本发明的另一方面涉及胰岛素前体,其包含可从A链和B链上切割下来的并由3-5个氨基酸残基组成的连接肽(C-肽),所述3-5个氨基酸残基其中至少一个是M残基。
本发明也涉及多核苷酸序列,其编码要求保护的胰岛素前体。再一方面本发明涉及含有所述多核苷酸序列的载体和含有所述多核苷酸序列或载体的宿主细胞。
附图简述
图1显示pAK1119酿酒酵母(S.cerevisiae)表达质粒,其表达α*-前导序列(无BglII-位点) (SEQ ID NO:1)-EEGEPK(SEQ ID NO:2)-胰岛素前体融合蛋白。
图2显示pAK1119 DNA表达盒的核苷酸序列(SEQ ID NO:5)和所编码的融合蛋白(pAK1119的α*-前导序列-EEGEPK-胰岛素前体(SEQ ID NO:6)的推定的氨基酸。
图3显示pAK3768酿酒酵母表达质粒,其表达α2-前导序列-EEGEPK-B(1-29)-AlaXLys-A(1-21)前体。
图4显示pAK3768 DNA表达盒的核苷酸序列(SEQ ID NO:9)和所编码的融合蛋白(pAK3768的α2-前导序列-EEGEPK-胰岛素前体(SEQ ID NO:10)的推定的氨基酸。
图5显示pAK4053酿酒酵母表达质粒,其表达TA39-前导序列-EEGEPK-B(1-29)-AlaMetLys-A(1-21)前体。
图6显示pAK4053 DNA表达盒的核苷酸序列(SEQ ID NO:11)和所编码的融合蛋白(pAK4053的TA39-前导序列-EEGEPK-胰岛素前体(SEQ ID NO:12))的推定的氨基酸。
描述
依据本发明第一方面,提供了制备成熟人胰岛素或其类似物的方法,即通过培养包含编码人胰岛素或其类似物的前体的DNA序列的真菌细胞,所述前体具有序列Z-B-X-Y-A,其中
- Z是任选的延伸序列,
-.B是人胰岛素或其类似物的B-链,
-.X是选自以下的序列:X1M、EA、AE、AD、DA和AP,其中X1是包含1-3个氨基酸残基的序列,
- Y是K或R,和
- A是人胰岛素或其类似物的A-链。
本文使用的术语“胰岛素类似物”是指修饰的人胰岛素,其中胰岛素的一个或多个氨基酸残基已被其它氨基酸残基取代和/或其中一个或多个氨基酸残基已从胰岛素上缺失和/或其中一个或多个氨基酸残基已经添加和/或插入到胰岛素。相比人胰岛素,胰岛素类似物通常会包含不超过大约7个突变、更通常不超过5个和甚至更通常最多3个突变。在一个实施方案中,相比人胰岛素,胰岛素类似物包含小于10个氨基酸修饰(取代、缺失、添加(包括插入)及其任何组合),或者相比人胰岛素,小于9、8、7、6、5、4、3、2或1个修饰。
胰岛素分子中的修饰表示为链(A或B)、位置和取代氨基酸残基的氨基酸残基的单字母编码。此处的术语如“A1”、“A2”和“A3”等分别是指在胰岛素的A链中(自N-末端开始计数)的位置1、2和3等的氨基酸。同样,术语例如B1、B2和B3等分别是指在胰岛素的B链中(自N-末端开始计数)的位置1、2和3等的氨基酸。使用氨基酸的单字母编码,术语如A21A、B28K和B29P是指A21位置的氨基酸是A,位置28和29的氨基酸分别是赖氨酸和脯氨酸。
因此,例如,B28K,B29P人胰岛素是人胰岛素类似物,其中B链中的位置28的氨基酸被赖氨酸取代,B链中的位置29的氨基酸被脯氨酸取代,A链是A(1-21)。
“desB30”或“B(1-29)”是指缺乏B30氨基酸的天然胰岛素B链,B(1-30),“A(1-21)”是指天然胰岛素A链。
在此术语“A(0)”或“B(0)”分别是指A1或B1的N-末端的氨基酸位置。术语A(-1)或B(-1)分别是指A(0)或B(0)的N-末端的头一个氨基酸位置。因此A(-2)和B(-2)分别是指A(-1)和B(-1)的N-末端的氨基酸位置,A(-3)和B(-3)分别是指A(-2)和B(-2)的N-末端的氨基酸位置,等等。术语A22或B31分别是指A21或B30的C-末端的氨基酸位置。术语A23或B32分别是指A22或B31的C-末端的头一个氨基酸位置。因此A24和B33分别是指A23和B32的C-末端的氨基酸位置,等等。
在本发明的一个实施方案中所述胰岛素前体是人胰岛素前体,即在序列Z-B-X-Y-A 中,A 是 A(1-21)和B 是 B(1-30)。在另一实施方案中所述胰岛素前体是desB30人胰岛素前体,即A 是 A(1-21)和B 是 B(1-29)。在本发明的再一个实施方案中所述胰岛素前体具有这样的结构:其中选择A和B,使得所述胰岛素前体是B28D人胰岛素(aspart)、B28K,B29P人胰岛素(lispro)、B3K,B29E人胰岛素(glulisine)、或A21G,B31R,B32R人胰岛素(glargine)的前体。
在此,术语“氨基酸残基”是这样的氨基酸:在形式上,从该氨基酸的羧基上已经去除羟基和/或在形式上,从该氨基酸的氨基上已经去除氢原子。在本文本中,依据IUPAC命名法,根据氨基酸残基的三字母缩写或其单字母缩写来提及氨基酸残基。例如,Gly和G都是指氨基酸残基甘氨酸,Lys和K都是指氨基酸残基赖氨酸。
胰岛素类似物的实例是这样的:其中B链位置28的Pro被Asp、Lys、Leu、Val、或Ala取代和/或位置B29的Lys被Pro、Glu或Asp取代。此外,位置B3的Asn可被Thr、Lys、Gln、Glu或Asp取代。位置A21的氨基酸残基可被Gly取代。也可将一个或多个氨基酸添加到A-链和/或B-链的C-末端,例如Lys。位置B1的氨基酸可以被Glu取代。位置B16的氨基酸可以被Glu或His取代。胰岛素类似物的另外的实例是缺失类似物,例如,人胰岛素中的B30氨基酸已缺失的类似物(desB30人胰岛素),人胰岛素中的B1氨基酸已缺失的胰岛素类似物(desB1人胰岛素)、desB28-B30人胰岛素和desB27人胰岛素。A-链和/或B-链具有N-末端延伸的胰岛素类似物,和A-链和/或B-链具有C-末端延伸例如两个精氨酸残基添加到B-链C-末端的胰岛素类似物,也是胰岛素类似物的实例。另外的实例是包含上述突变组合的胰岛素类似物。其中位置A14的氨基酸是Asn、Gln、Glu、Arg、Asp、Gly或His,位置B25的氨基酸是His,并且任选进一步包含一个或多个额外突变的胰岛素类似物,是胰岛素类似物的另外的实例。其中位置A21的氨基酸残基是Gly的人胰岛素的胰岛素类似物和其中胰岛素类似物在C-末端进一步延伸两个精氨酸残基的人胰岛素的胰岛素类似物,也是胰岛素类似物的实例。
本文使用的“胰岛素衍生物”意图是指天然发生的胰岛素或经化学修饰的胰岛素类似物,所述化学修饰例如通过在胰岛素主链的一个或多个位置引入侧链或通过氧化或通过还原胰岛素中的氨基酸残基的基团或通过使游离氨基或羟基酰基化。胰岛素衍生物的非限制性实例是例如,Nε B29-十四酰基des(B30)人胰岛素、Nε B29-石胆酸酰基-γ-谷酰基des(B30)人胰岛素、Nε B29–(Nα-(HOOC(CH2)14CO)-γ-Glu)des(B30)人胰岛素和Nε B29–(Nα-(HOOC(CH2)16CO)-γ-Glu)des(B30)人胰岛素。
本文使用的“胰岛素前体”意图是指单链多肽,其可通过一个或多个后续化学和/或酶促过程而被转化为人胰岛素或其类似物。
“连接肽”或“C-肽”是指单链胰岛素原分子的B-C-A多肽序列的连接部分“C”。在人胰岛素链中,C-肽连接B链的位置30和A链的位置1并且长度为35个氨基酸残基。较小C-肽的非限制性实例是例如AAK、AAR和DKAAK。
本文使用的“成熟人胰岛素或其类似物”意图是指具有胰岛素活性和正确氨基酸残基组成和与天然胰岛素分子的相同的结构构象的双链胰岛素,即在位置A7-B7、A20–B19和A6-A11之间具有二硫键。因此,包含C-肽的人胰岛素或其类似物的前体会至少切除C-肽,以合格成为成熟人胰岛素或其类似物。成熟人胰岛素或其类似物的非限制性实例是人胰岛素、DesB30人胰岛素和B3K,B29E人胰岛素。
本发明特征在于连接B-链C-末端和A-链N-末端的新的C-肽,其通过在真菌细胞中表达而增加收率。评价增加的收率,即通过经产培养上清液(spent
culture supernatant)中存在的胰岛素前体浓度相对于来自使用已知C-肽的发酵的经产培养上清液中存在的胰岛素前体浓度。
在本发明的一个实施方案中,序列Z-B-X-Y-A中的X选自EA、AE、AD、DA和AP。
在本发明的另一实施方案中X是X1M,其中X1是包含1-3个氨基酸残基的氨基酸序列。X1可以由1个氨基酸残基、2个氨基酸残基或3个氨基酸残基组成。优选地,X1中的所有氨基酸残基选自具有是直链或支链脂族的侧链和具有羟基、羧基或酰胺基的侧链的氨基酸残基。在一个实施方案中X1选自D、SDD和A。在另一实施方案中X1选自D、SDD、A、T、GD、TD、SD、ADD、DDA、N、S、GN、TS、DD、GT、GA、AD、GS、Q、ND、STD、DA、TN、SGD、TT、M、L、R、V、GDD、DTD、ST、I、TA、DGD、K、H、SS、TGD、E、TDD、G、AGD、AA、SA和AS。在另一实施方案中X1选自D、SDD、A、T、GD、TD、SD、ADD、DDA和N。在还一个实施方案中X1选自S、GN、TS、DD、GT、GA、AD、GS、Q、ND、STD、DA、TN、SGD、TT、M、L、R和V。在另一实施方案中X1选自GDD、DTD、ST、I、TA、DGD、K、H、SS、TGD、E、TDD、G、AGD、AA、SA和AS。在还一个实施方案中X1不包含为P的氨基酸残基。在还一个实施方案中X1不包含为C的氨基酸残基。在还一个实施方案中X1不包含选自H、Y、W和F的氨基酸残基。在还一个实施方案中X1不包含选自K和R的氨基酸残基。在还一个实施方案中X1不包含选自P、C、K、R、H、Y、W和F的氨基酸残基。因此,在一个实施方案中X1中存在的所有氨基酸选自G、A、V、L、I、M、Q、N、E、D、S和T。
在另一实施方案中X选自EA、AE、AD、DA和AP。
在另一实施方案中序列Z-B-X-Y-A 中的Y是K。在真菌细胞中的表达也允许Y是R。
在再一实施方案中序列Z-B-X-Y-A 中的X-Y选自SDDMK、DMK和AMK。在另一实施方案中序列Z-B-X-Y-A 中的X-Y选自SDDMK、SDMK、DMK和AMK。在还一个实施方案中序列Z-B-X-Y-A 中的X-Y选自SDDMR、SDMR、DMR和AMR。
在再一实施方案中序列Z-B-X-Y-A中的X-Y是DMK和选择A和B ,使得所述胰岛素前体是B28D人胰岛素的前体(aspart),即A 是 A(1-21)和B是28D-B(1-29)。在再一实施方案中序列Z-B-X-Y-A中的X-Y是 AMK和选择A和B,使得所述胰岛素前体是B28D人胰岛素的前体(aspart),即A 是 A(1-21)和B是28D-B(1-29)。
本发明的胰岛素前体在序列Z-B-X-Y-A 中可包含任选的延伸序列Z。在一个实施方案中Z不存在,即所述胰岛素前体具有序列B-X-Y-A。在另一实施方案中Z具有序列Z1PK,其中Z1是具有0-10个氨基酸残基的序列。在一个实施方案中Z是EEGEPK。在另一实施方案中Z选自EEAEPK、EEAEAEPK、EEAEAPK和EEAEAEAPK。
本文使用的“POT”意图是指粟酒裂殖酵母(Schizosaccharomyces
pombe)磷酸丙糖异构酶基因。本文使用的“TPI1”意图是指酿酒酵母磷酸丙糖异构酶基因。
本文使用的“前导序列”意图是指由前肽(pre-peptide)(信号肽)和原肽(pro-peptide)组成的氨基酸序列。前导序列的非限制性实例是例如酿酒酵母α-因子信号前导序列和用于酵母的合成前导序列,描述于WO95/34666。
本文使用的“前肽”意图是指信号肽,其在蛋白前体形式中以N-末端序列的形式存在。信号肽的功能是允许异源蛋白容易转运到内质网中。信号肽在该过程中通常被切除。信号肽对于产生所述蛋白的真菌生物体而言可以是异源或同源的。可与本发明DNA构建体一起使用的许多信号肽包括酵母天冬氨酸蛋白酶3 (YAP3)信号肽或任何功能类似物(Egel-Mitani等人(1990) YEAST 6:127-137和US
5,726,038)和MFα1基因的α-因子信号(Thorner (1981),载于The Molecular Biology of the Yeast Saccharomyces
cerevisiae, Strathern等人, 编辑., 页数143-180, Cold
Spring Harbor Laboratory, NY和US 4,870,00)。
本文使用的“原肽”意图是指多肽序列,其功能允许将所表达的多肽从内质网导向高尔基体并进一步导向分泌小泡,以分泌到培养基中(即,多肽穿过细胞壁或至少穿过细胞膜向酵母细胞的细胞周质间隙输出)。原肽可以是酵母α-因子原肽,参见US
4,546,082和4,870,008。或者,原肽可以是合成的原肽,也就是说在自然界不存在的原肽。合适的合成的原肽是以下文献中公开的那些:US
5,395,922;5,795,746;5,162,498和WO 98/32867。原肽优选会在C端含有肽链内切酶加工位点,例如Lys-Arg序列或其任何功能类似物。
可通过已建立的标准方法合成性地制备本发明的多核苷酸序列,所述方法例如Beaucage等人(1981) Tetrahedron Letters 22:1859-1869描述的亚磷酰胺(phosphoamidite)方法,或Matthes等人(1984) EMBO
Journal 3:801-805描述的方法。依据亚磷酰胺方法,合成寡核苷酸,例如,在自动化DNA合成仪中,纯化,双链化并连接而形成合成的DNA构建体。制备DNA构建体的一种方式是通过聚合酶链式反应(PCR)。
本发明的多核苷酸序列也可以是混合基因组、cDNA和合成来源的。例如,可将编码前导序列肽的基因组或cDNA序列连接到编码A链和B链的基因组或cDNA序列,此后可在位点上修饰该DNA序列,即按照公知的程序,通过插入编码所需氨基酸序列的合成寡核苷酸,用于同源重组,或优选地通过PCR,使用合适的寡核苷酸产生所需序列。
本发明包括这样的载体,其在所选的微生物或宿主细胞中能够复制并且其携带编码本发明的胰岛素前体或胰岛素前体类似物的多核苷酸序列。重组载体可以是自主复制载体,即以染色体外实体形式存在的载体,其复制独立于染色体复制,例如质粒,染色体外元件、小染色体、或人工染色体。载体可含有任何用于确保自我复制的元件。或者,载体可以是这样的载体:当将其引入宿主细胞时,其整合到基因组中并与其整合入的染色体一起复制。此外,可以使用单个载体或质粒或两个或更多个载体或质粒,其共同含有有待引入宿主细胞基因组的总DNA或转座子。载体可以是线性的或闭合环状的质粒并且优选会含有允许将载体稳定整合到宿主细胞基因组中或允许载体在细胞中独立于基因组自主复制的元件。
在一个优选的实施方案中,重组表达载体能够在酵母中复制。使载体能够在酵母中复制的序列的实例是酵母质粒2μ复制基因REP 1-3和复制起点。
本发明的载体优选地含有一个或多个选择标志物,其允许容易选择转化的细胞。选择标志物是这样的基因,其产物提供杀生物剂或病毒抗性、重金属抗性、向营养缺陷型提供原养型等。细菌选择标志物的实例是枯草芽孢杆菌(Bacillus
subtilis)或地衣芽孢杆菌(Bacillus licheniformis)的dal基因,或赋予抗生素抗性的标志物,所述抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。用于丝状真菌宿主细胞的选择标志物包括amdS (乙酰胺酶)、argB (鸟氨酸氨甲酰基转移酶)、pyrG (乳清酸核苷-5’-磷酸脱羧酶)和trpC (邻氨基苯甲酸合酶)。用于酵母宿主细胞的合适标志物的实例是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于酵母的优选的选择标志物是粟酒裂殖酵母TPI基因(Russell (1985) Gene 40:125-130)。
载体中,多核苷酸序列与适宜的启动子序列操作性连接。该启动子可以是在所选的宿主细胞中显示转录活性的任何核酸序列,包括突变的、截短的和杂交的启动子,而且可获自编码与宿主细胞同源或异源的胞外或胞内多肽的基因。
用于指导在细菌宿主细胞中转录的合适的启动子的实例是得自以下的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA) 、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL) 、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)麦芽糖淀粉酶基因(amyM) 、解淀粉芽孢杆菌(Bacillus
amyloliquefaciens) α-淀粉酶基因(amyQ)和地衣芽孢杆菌青霉素酶基因(penP)。用于指导在丝状真菌宿主细胞中的转录的合适的启动子的实例是得自以下基因的启动子:米曲霉(AspergilIus
oryzae)TAKA淀粉酶、米赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶和黑曲霉酸稳定α-淀粉酶。在酵母宿主中,有用的启动子的实例是酿酒酵母MFα1、TPI1、ADH、TDH3或PGK启动子。
本发明的多核苷酸构建体一般也会与合适的终止子操作性连接。在酵母中,合适的终止子是TPI1终止子(Alber等人(1982) J. Mol.
Appl. Genet. 1:419-434)。
分别用于连接本发明的多核苷酸序列、启动子和终止子,并将它们插入合适的含有酵母复制所需信息的酵母载体中的程序,是本领域技术人员周知的。可以理解,所述载体可以通过如下构建:首先制备含有编码本发明的胰岛素前体或胰岛素前体类似物的完整DNA序列的DNA构建体,然后将该片段插入合适的表达载体,或者序贯地插入含有单独元件(例如信号、原肽、小C-肽、A链和B链)的遗传信息的DNA片段,接着连接。
本发明也涉及重组宿主细胞,其包含编码本发明的胰岛素前体或胰岛素前体类似物的多核苷酸序列。将包含这类多核苷酸序列的载体引入宿主细胞,使得该载体作为染色体整合体或作为自我复制的染色体外载体而维持。
本文使用的“宿主细胞”意图是指用于表达目标多肽的微生物。宿主细胞包括亲本细胞的因复制期间发生突变所致与亲本细胞不相同的任何后代。
本发明合适的宿主细胞是真菌细胞。本文使用的“真菌”意图包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如Hawksworth等人, 载于 Ainsworth and
Bisby ’ s Dictionary of
The Fungi, 第8版, 1995, CAB International, University Press, Cambridge,
UK所定义) 以及卵菌门(Oomycota)
(如Hawksworth等人,
1995, 同上, 页数171中引用的)和所有有丝分裂孢子真菌(Hawksworth等人, 1995, 同上)。
在一个实施方案中所述宿主细胞是酵母细胞。本文使用的“酵母”包括产子囊酵母(内孢霉目(Endomycetales))、产担孢子(basidiosporogenous)酵母和属于半知菌的酵母(芽生菌属(Blastomycetes))。产子囊酵母分为蚀精霉科(Spermophthoraceae)和酵母科(Saccharomycetaceae)。后者包含四个亚科,裂殖酵母亚科(Schizosaccharomycoideae)(例如,粟酒裂殖酵母属(Schizosaccharomyces))、拿逊酵母亚科(Nadsonioideae)、脂酵母亚科(Lipomycoideae)和多极出芽酵母亚科(Saccharomycoideae)(例如,毕赤氏酵母属(Pichia)、克鲁维氏酵母属(Kluyveromyces)和酵母属(Saccharomyces))。产担孢子酵母包括白冬孢酵母属(Leucosporidim)、红冬孢属(Rhodosporidium)、锁掷酵母属(Sporidiobolus)、线黑粉酵母属(Filobasidium)和线黑粉菌属(Filobasidiella)。属于半知菌的酵母分作两个科,掷孢酵母科(Sporobolomycetaceae)(例如,Sorobolomyces和布氏掷孢酵母属(Bullera))和隐球菌科(Cryptococcaceae)(例如,假丝酵母属(Candida))。由于酵母分类将来可能发生变化,所以为了本发明的目的,酵母应按照Biology and
Activities of Yeast (Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.编辑,Soc.App. Bacteriol.Symposium Series No.9,1980)所述的进行定义。酵母的生物学和酵母遗传学操作是本领域周知的(参见例如,Biochemistry and Genetics of Yeast,Bacil,M.,Horecker,B.J.和Stopani,A.O.M. 编辑,第2版,1987;The Yeasts,Rose,A.H.,和Harrison,J.S.编辑,第2版, 1987;以及The Molecular
Biology of the Yeast Saccharomyces,Strathern等编辑,1981)。
用于本发明的工艺的酵母宿主细胞可以是任何合适的酵母生物体,其在培养时产生大量的本发明的胰岛素前体和胰岛素前体类似物。
合适的酵母生物体的实例是选自以下物种的细胞的菌株:假丝酵母属(Candida)、克鲁维氏酵母属(Kluyveromyces)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、毕赤氏酵母属(Pichia)、汉逊氏酵母属(Hansenula)和耶罗威亚酵母属(Yarrowia)。在一个实施方案中,酵母宿主细胞选自卡氏酵母(Saccharomyces
carlsbergensis)、酿酒酵母(Saccharomyces
cerevisiae)、糖化酵母(Saccharomyces
diastaticus)、道格拉氏酵母(Saccharomyces
douglasii)、克鲁维酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、卵形酵母(Saccharomyces oviformis)、粟酒裂殖酵母(Schizosaccharomyces pombe)、葡萄汁酵母(Sacchoromyces uvarum)、克鲁维毕赤酵母(Pichia kluyveri)、解脂耶罗威亚酵母(Yarrowia lipolytica)、产朊假丝酵母(Candida utilis)、可可假丝酵母(Candida cacaoi)和发酵地霉(Geotrichum fermentans)。其它可用的酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)、脆壁克鲁维酵母(Kluyveromyces fragilis)、多形汉逊氏酵母(Hansenula polymorpha)、巴斯德毕赤酵母(Pichia pastoris)、解脂耶罗威亚酵母(Yarrowia lipolytica)、粟酒裂殖酵母(Schizosaccharomyces pombe)、玉米黑粉菌(Ustilgo maylis)、麦芽糖假丝酵母(Candida
maltose)、季也蒙氏毕赤酵母(Pichia guillermondii)和甲醇毕赤酵母(Pichia methanoliol)(参看Gleeson等人, J. Gen.
Microbiol.132, 1986,第3459-3465页;US 4,882,279和US
4,879,231)。酵母细胞转化可以例如以本来已知的方式通过原生质体形成、随后转化而实现。
在一个实施方案中所述宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门亚部的所有丝状形式(由Hawksworth等人,1995,同上,所定义)。丝状真菌宿主细胞可选自支顶孢属(Acremonium)、曲霉属(Aspergillus)、镰孢属(Fusarium)、腐质霉属(Humicola)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、链孢霉属(Neurospora)、青霉属(Penicillium)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)和木霉属(Trichoderma)。
用于表达胰岛素前体的宿主细胞优选地是不含任何功能性抗生素抗性基因的细胞。尽管这样的抗生素抗性基因在例如大肠杆菌中的起始克隆步骤中有用,但可通过周知的程序使抗生素抗性基因无功能或从宿主细胞中移除,所述程序参见例如WO
00/04172。
本文使用的“培养基”意图是指培养宿主细胞、即支持真菌的生长和产物形成的液体溶液。真菌的合适培养基是例如YPD或如WO2008/037735中所述。培养基含有至少一种碳源、一种或几种氮源、必需的盐(包括钾、钠、镁、磷酸盐和硫酸盐的盐)、痕量金属、水溶性维生素和加工助剂(包括但不限于消泡剂、蛋白酶抑制剂、稳定剂、配体和诱导剂)。典型的碳源是例如单糖或双糖。典型的氮源是例如氨、尿素、氨基酸、酵母提取物、玉米浸出液以及完全和部分水解蛋白。典型的痕量金属是例如Fe、Zn、Mn、Cu、Mo和H3BO3。典型的水溶性维生素是例如生物素、泛酸盐、烟酸、硫胺素、对氨基苯甲酸、胆碱、吡哆醇、叶酸、核黄素和抗坏血酸。
本文使用的“发酵”意图是指用于繁殖浸泡在液体培养基中的微生物的无菌工艺。发酵优选地是在无菌的搅拌罐中进行,所述搅拌罐具有补给管线,用于添加压缩的无菌气体,所述气体由空气、氧气和氨气组成但不限于这些。发酵罐可具有传感器和装置,以监测pH、温度、压力、搅拌速率、溶解氧水平、液体含量、泡沫水平、加料速率和添加酸和碱的速率。此外,发酵罐可以装备有光学装置,以监测细胞密度水平、代谢物和产物浓度,无论其理化形式如何。
发酵期间产生的所需产物作为可溶性胞外材料或者作为呈可溶性材料或不可溶材料(包括聚集材料)形式的胞内材料存在。发酵工艺通常在罐中进行,罐的工作体积范围在100 mL至200.000 L。发酵工艺可以以分批工艺、补料-分批工艺、重复补料-分批工艺或连续工艺来操作。
可通过常规程序从培养基中回收所分泌的胰岛素前体或胰岛素类似物前体(其重要部分会以正确加工形式存在于培养基中),所述常规程序包括通过离心从培养基中分离酵母细胞,通过离子交换基质或通过反相吸收基质来过滤或捕获人胰岛素或其类似物的前体,通过盐例如硫酸铵的方式沉淀上清液或滤液中的蛋白质组分,接着通过各种色谱程序(例如离子交换色谱、亲和力色谱等)来纯化。
可以表达具有N-末端氨基酸残基延伸的本发明的人胰岛素或其类似物的前体,如美国专利号5,395,922和欧洲专利号765,395A所述。已发现在发酵期间,所述延伸稳定地连接到本发明的人胰岛素或其类似物的前体,针对酵母蛋白酶例如DPAP的蛋白水解活性而保护胰岛素前体或胰岛素前体类似物的N-末端。人胰岛素或其类似物的前体上的N-末端延伸的存在,在化学加工该蛋白期间也可起到N-末端氨基的保护作用,即它可充当BOC (叔丁基-氧基羰基)或类似保护基的替代物。可通过对碱性氨基酸(例如Lys)具有特异性的蛋白水解酶的方式,从回收的胰岛素前体或胰岛素前体类似物上除去N-末端延伸,使得在Lys残基上切掉末端延伸。这类蛋白水解酶的实例是胰蛋白酶和水解无色杆菌(Achromobacter
lyticus)蛋白酶。
分泌到培养基中和回收之后,本发明的胰岛素前体或胰岛素前体类似物会经历多种体外程序,以去除可能的N-末端延伸序列和C-肽,以得到胰岛素或所需的胰岛素类似物。这类方法包括在L-苏氨酸酯存在下通过胰蛋白酶或水解无色杆菌蛋白酶的酶促转化,接着通过以下文献所述的碱水解或酸水解将胰岛素或胰岛素类似物的苏氨酸酯转化为胰岛素或胰岛素类似物:美国专利说明书号4,343,898或4,916,212或研究披露, September
1994/487,所述文献的公开内容通过引用结合到本文中。
如下所述,构建具有合成的C-肽的胰岛素前体或胰岛素前体类似物(实施例1)。
通过PCR构建含有编码要求保护的胰岛素前体或胰岛素类似物前体的多核苷酸序列的酿酒酵母表达质粒并用于转化酿酒酵母宿主细胞。测量表达产物例如胰岛素类似物的量,作为yAK1220中的相关对照表达水平的百分率,所述对照即具有α前导序列的前体EEAEAEAPK-(B(1-29)-AAK-A(1-21)。本发明的新的C-肽增加收率至多达300%并且它们导致O-糖基化水平的普遍减少。另外,包含新的C-肽的胰岛素前体表现出经例如水解无色杆菌蛋白酶所致的良好的C-肽切除。
当用于切割本发明的胰岛素前体时,可以通过如下的简单测定来确定水解无色杆菌蛋白酶的切割效率:将合适的胰岛素前体水溶液在有利于无色杆菌蛋白酶的pH和温度下孵育并随时间而从反应混合物中取回样品。一旦将样品取回,就将酶活性失活。在收集了覆盖目标时间跨度的所有样品之后,通过例如HPLC分析确定相应的成熟胰岛素多肽的浓度。将成熟胰岛素多肽浓度绘制成时间函数,将表明反应进程。比较在相同条件下切割的不同胰岛素前体的这样的反应轨迹,会允许将胰岛素前体按照经水解无色杆菌蛋白酶作用所致的成熟能力来排序。类似的程序可用于其它蛋白酶,其可选择用于将胰岛素前体转化为相应的成熟胰岛素多肽。
本发明的新的C-肽在真菌细胞中表达期间也表现出人胰岛素或其类似物的前体的降低的O-糖基化。同样,本发明的人胰岛素或其类似物的前体可以用于在真菌细胞中制备成熟人胰岛素或其类似物的改善的方法。在真菌细胞中表达具有降低O-糖基化能力的本发明的人胰岛素或其类似物的前体可以维持所述前体的改善的收率,而同时甚至进一步降低在表达期间为O-糖基化的所述前体分子的部分。
蛋白O-甘露糖基转移酶(PMTs)起始O-甘露糖基聚糖的装配,这是真菌中的必要的蛋白修饰。PMTs在真菌中是保守的,PMT家族按照系统发生学分类为PMT1、PMT2和PMT4亚家族,其在蛋白底物特异性上是不同的。蛋白O-甘露糖基转移酶Pmt1p和Pmt2p催化酵母内质网中的蛋白质中的丝氨酸和苏氨酸残基的O-糖基化,即通过从Dolichyl phosphate-D-甘露糖中转移甘露糖基残基(Gentzsch等人, FEBS Lett 1995, 18, 页数128-130)。在酿酒酵母以及在许多其它真菌中,PMT家族高度冗余,只有PMT1/PMT2和PMT4亚家族成员的同时缺失才是致死的(Girrbach和Strahl, J. Biol. Chem. 2003, 278, 页数12554-62)。US 5,714,377描述了这样的真菌细胞,其具有从PMT1/PMT2修饰中降低的O-糖基化能力并仍然具有活力并在工业发酵条件下显示良好生长特性。
通过以下非限制性实施方案进一步描述了本发明:
1. 一种包含序列Z-B-X-Y-A的胰岛素前体,其中
- Z是任选的延伸序列,
- B是人胰岛素或其类似物的B-链,
- X是选自以下的序列:X1M、EA、AE、AD、DA、AP、AW和LA,其中X1是包含1-3个氨基酸残基的序列,
- Y是K或R,和
- A是人胰岛素或其类似物的A-链。
2. 实施方案1的胰岛素前体,其中X是选自以下的序列:X1M、EA、AE、AD、DA和AP,其中X1是包含1-3个氨基酸残基的序列。
3. 实施方案1-2中任一项的胰岛素前体,其中X是X1M。
4. 实施方案3的胰岛素前体,其中X1选自D、SDD、A、T、GD、TD、SD、ADD、DDA、N、S、GN、TS、DD、GT、GA、AD、GS、Q、ND、STD、DA、TN、SGD、TT、M、L、R、V、GDD、DTD、ST、I、TA、DGD、K、H、SS、TGD、E、TDD、G、AGD、AA、SA和AS。
5. 实施方案1-4中任一项的胰岛素前体,其中X1选自D、SDD、A、T、GD、TD、SD、ADD、DDA和N。
6. 实施方案5的胰岛素前体,其中X1选自D、SDD和A。
7. 实施方案1-4中任一项的胰岛素前体,其中X1选自S、GN、TS、DD、GT、GA、AD、GS、Q、ND、STD、DA、TN、SGD、TT、M、L、R和V。
8. 实施方案1-4中任一项的胰岛素前体,其中X1选自GDD、DTD、ST、I、TA、DGD、K、H、SS、TGD、E、TDD、G、AGD、AA、SA和AS。
9. 实施方案1-8中任一项的胰岛素前体,其中X1中的所有氨基酸残基选自具有是直链或支链脂族的侧链和具有羟基、羧基或酰胺基的侧链的氨基酸残基。
10. 实施方案1-9中任一项的胰岛素前体,其中X1不包含为P的氨基酸残基。
11. 实施方案1-10中任一项的胰岛素前体,其中X1不包含为C的氨基酸残基。
12. 实施方案1-11中任一项的胰岛素前体,其中X1不包含选自H、Y、W和F的氨基酸残基。
13. 实施方案1-12中任一项的胰岛素前体,其中X1不包含选自K和R的氨基酸残基。
14. 实施方案1-13中任一项的胰岛素前体,其中X1不包含选自P、C、K、R、H、Y、W和F的氨基酸残基。
15. 实施方案1-14中任一项的胰岛素前体,其中X1中的所有氨基酸残基选自G、A、V、L、I、M、Q、N、E、D、S和T。
16. 实施方案1-2中任一项的胰岛素前体,其中X选自EA、AE、AD、DA、AP、AW和LA。
17. 实施方案16的胰岛素前体,其中X选自EA、AE、AD、DA和AP。
18. 实施方案1-15中任一项的胰岛素前体,其中X1由1个氨基酸残基组成。
19. 实施方案1-15中任一项的胰岛素前体,其中X1由2个氨基酸残基组成。
20. 实施方案1-15中任一项的胰岛素前体,其中X1由3个氨基酸残基组成。
21. 实施方案1-20中任一项的胰岛素前体,其中Y是K。
22. 实施方案1-20中任一项的胰岛素前体,其中Y是R。
23. 实施方案1-21中任一项的胰岛素前体,其中X-Y选自AMK、DMK、SDDMK和SDMK。
24. 实施方案1-20中任一项的胰岛素前体,其中X-Y选自AMR、DMR、SDDMR和SDMR。
25. 实施方案1-24中任一项的胰岛素前体,其是人胰岛素前体,即A是A(1-21)和B是B(1-30)。
26. 实施方案1-24中任一项的胰岛素前体,其是desB30人胰岛素前体,即A是A(1-21)和B是B(1-29)。
27. 实施方案1-24中任一项的胰岛素前体,其中选择A和B,使得所述胰岛素前体是B28D人胰岛素(aspart)、B28K,B29P人胰岛素(lispro)、B3K,B29E人胰岛素(glulisine)、或A21G,B31R,B32R人胰岛素(glargine)。
28. 实施方案1-27中任一项的胰岛素前体,其中Z不存在。
29. 实施方案1-27中任一项的胰岛素前体,其中Z是由大约3至大约20个氨基酸残基组成的肽。
30. 实施方案29的胰岛素前体,其中Z是由大约5至大约15个氨基酸残基组成的肽。
31. 实施方案1-27和29-30中任一项的胰岛素前体,其中Z的C-末端是EPK或APK。
32. 实施方案1-27和29-30中任一项的胰岛素前体,其中Z具有序列Z1PK,其中Z1是具有0-10个氨基酸残基的序列。
33. 实施方案32的胰岛素前体,其中Z1包含至少2个为E的氨基酸残基。
34. 实施方案32-33中任一项的胰岛素前体,其中Z1包含至少2个为A的氨基酸残基。
35. 实施方案32-34中任一项的胰岛素前体,其中Z1包含至少一个为EA的亚序列。
36. 实施方案29的胰岛素前体,其中Z是EEGEPK。
37. 实施方案29的胰岛素前体,其中Z选自EEAEPK、EEAEAEPK、EEAEAPK和EEAEAEAPK。
38. 制备成熟人胰岛素或其类似物的方法,所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下,培养包含编码实施方案1-37中任一项的人胰岛素或其类似物的前体的DNA序列的真菌细胞;和(ii)分离所表达的前体。
39. 在真菌细胞中表达期间降低人胰岛素或人胰岛素类似物的前体的O-糖基化的方法,所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下,培养包含编码实施方案1-37中任一项的人胰岛素或其类似物的前体的DNA序列的真菌细胞。
40. 在真菌细胞中表达期间增加人胰岛素或人胰岛素类似物的前体的收率的方法,所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下,培养包含编码实施方案1-37中任一项的人胰岛素或其类似物的前体的DNA序列的真菌细胞。
41. 实施方案38-40中任一项的方法,其中所述真菌细胞携带降低其O-糖基化能力的至少一个遗传修饰。
42. 实施方案41的方法,其中所述真菌细胞携带至少一个遗传修饰,该遗传修饰与α前导序列一起表达时,相比携带相应的未经修饰的基因的真菌细胞,通过蛋白O-甘露糖基转移酶1 (PMT1)降低其des-B30人胰岛素前体EEAEAEAPK-B(1-29)-AAK-A(1-21)的O-糖基化的能力。
43. 实施方案41的方法,其中所述真菌细胞携带至少一个遗传修饰,该遗传修饰与α前导序列一起表达时,相比携带相应的未经修饰的基因的真菌细胞,通过蛋白O-甘露糖基转移酶2 (PMT2)降低其des-B30人胰岛素前体EEAEAEAPK-B(1-29)-AAK-A(1-21)的O-糖基化的能力。
44. 实施方案41-43中任一项的方法,其中所述O-糖基化的能力降低至少2倍。
45. 实施方案41-44中任一项的方法,其中所述O-糖基化的能力降低至少4倍。
46. 实施方案41-45中任一项的方法,其中所述至少一个遗传修饰位于PMT1或PMT2的编码区内。
47. 实施方案41-45中任一项的方法,其中所述真菌细胞携带在PMT1或PMT2的基因内的至少一个遗传修饰,该遗传修饰降低其O-糖基化的能力。
48. 实施方案41-45中任一项的方法,其中所述至少一个遗传修饰位于负责或涉及PMT1或PMT2的表达和/或转录调节的区域内。
49. 实施方案41-48中任一项的方法,其中所述真菌细胞中的PMT1基因和PMT2基因都缺失。
50. 实施方案38-49中任一项的方法,其中编码人胰岛素或人胰岛素类似物的前体的所述DNA序列包含前导序列。
51. 实施方案50的方法,其中所述前导序列选自α-因子信号前导序列、α2、α4、LA19和TA39。
52. 实施方案38-51中任一项的方法,其中所述真菌细胞是酵母。
53. 实施方案52的方法,其中所述酵母是酿酒酵母。
54. 实施方案52的方法,其中所述酵母是巴斯德毕赤酵母。
55. 实施方案52的方法,其中所述酵母是多形汉逊氏酵母。
56. 多核苷酸序列,其编码实施方案1-37中任一项的人胰岛素或人胰岛素类似物的前体。
57. 表达载体,其包含实施方案56的多核苷酸序列。
58. 宿主细胞,其被实施方案57的载体转化。
在以下实施例中进一步详细描述了本发明,所述实施例不意图以任何方式限制要求保护的本发明的范围。附图被认为是本发明的说明书和描述的不可或缺的部分。所引用的所有参考文献都通过全文引用具体地结合到本文中。
实施例
通用程序
表达质粒
所有表达质粒都是C-POT型,类似于EP171,142中描述的那些。这些是基于2μ的表达载体,其特征在于包含粟酒裂殖酵母丙糖磷酸异构酶基因(POT)用于在酿酒酵母中的质粒选择和稳定化。这些质粒还包含酿酒酵母丙糖磷酸异构酶启动子和终止子(图1)。这些序列类似于质粒pKFN1003(描述于WO 90/10075)中的相应序列,所有序列除了以下之外:1) 编码前导序列和胰岛素产物的融合蛋白的EcoRI-Xbal片段的序列,和2) 已引入的沉默突变,导致表达载体中的2μ-区中的NcoI-位点的去除。为了促进不同融合蛋白的克隆,编码MFα1前-原前导序列的DNA序列已被改变以并入NcoI位点(参见图2)并被称为MFα1*前-原前导序列。因此NcoI-Xbal片段被编码目标胰岛素构建体的NcoI-Xbal片段简单地替代。可使用合成的寡核苷酸和PCR,依据标准技术合成这样的NcoI-Xbal片段。除了α-前导序列,其它前导序列也可以使用,如以下实施例所述。
酵母转化
通过转化宿主菌株酿酒酵母菌株MT663制备酵母转化体。酵母菌株MT663 (MATa/MATα
pep4-3/pep4-3 HIS4/his4 △tpi1::LEU2/△tpi1::LEU2 Cir')与申请WO
92/11378关联,保藏于Deutsche Sammlung von Mikroorganismen
und Zellkulturen,保藏号为DSM 6278。
MT663在YPGGE (1%细菌用酵母提取物(Bacto yeast
extract),2%细菌用蛋白胨(Bacto
peptone),2%半乳糖,1%
EtOH, 2%甘油)上生长至在600nm处OD为0.2。通过离心收获100ml培养物,用10ml水洗涤,再次离心并重悬于10ml含有1 M山梨醇、25mM Na2EDTA pH = 8.0和6.7 mg/ml二硫苏糖醇的溶液中。该悬浮液在30℃孵育15分钟,离心,并将细胞重悬于10ml含有1.2 M山梨醇、10mM Na2EDTA、0.1M柠檬酸钠,pH 05.8和2mg NovozymC3234的溶液中。将悬浮液在30℃孵育30分钟,通过离心收集细胞,在10 ml 1.2M山梨醇和10 ml
CAS (1.2 M山梨醇,10 mM CaCl2,10 mM Tris HCl (Tris=三(羟甲基)-氨基甲烷) pH=7.5)中洗涤,并重悬于2 ml CAS中。为进行转化,将1 ml CAS-悬浮的细胞与约0.1 μg质粒DNA混合,在室温下放置15分钟。加入1 ml (20%聚乙二醇4000,10 mM CaCl2,10 mM Tris HCl,pH=7.5),并将混合物在室温下再放置30分钟。离心混合物,将沉淀重悬于0.1 ml SOS (1.2 M山梨醇,50%
YPGGE, 6.7 mM CaCl2)中并于30℃孵育2小时。之后离心悬浮液并将沉淀重悬于0.5ml的1.2 M山梨醇中。之后,于52℃加入6 ml上层琼脂(Sherman等人,(1982),Methods in Yeast
Genetics,Cold Spring Harbor Laboratory的SC培养基(含有2%葡萄糖加2.5%琼脂)),并将悬浮液倒入含有相同的琼脂固化的含山梨醇培养基的平板顶部。
酵母发酵
在30°C将转化了表达质粒的酿酒酵母菌株MT663在YPD培养基中培养72小时。
糖基化水平的定量
使用LC-MS系统界面Waters
Acquity UPLC系统(Waters, Milford, MA, USA)确定培养上清液中的胰岛素前体的糖基化水平,所述系统由自动进样器(型号Acq-SM)、泵(型号Acq-BSM)、柱温箱(型号Acq-SM)和带有LTQ Orbitrap XL (Thermo Fisher, Waltham, MA, USA)的检测器(型号Acq-TUV)组成。使用在0.1%甲酸中的乙腈线性梯度(0 min 12%乙腈, 10 min 15%乙腈, 27
min 40%乙腈, 27.5 min 90%乙腈),使用CSH C18柱(Waters, 1x150 mm),流速0.1
ml/min,在45°C实现RP-HPLC分离。按照制造商的说明书调整和操作LTQ
Orbitrap,以正模式,用ESI源(源电压为4000 V, 毛细管温度为325 °C, 鞘气流为40, 辅助气流为10和吹扫气流为2)。使用分辨率为30000的全FTMS扫描(m/z=900-2000)以采集数据。
将酵母培养物离心(5000 rpm, 5 min),直接或在用水解无色杆菌蛋白酶处理后通过LC-MS分析上清液。在去卷积(deconvolution)后获得O-糖基化水平,作为与o-糖基化胰岛素种类的质量(单-o-糖基化种类M+162 Da)对应的强度和与非糖基化种类的质量(M)对应的强度的比例并表示为百分率。该方法用于获得单-o-糖基化以及多-o-糖基化产物的水平。
实施例
1
使用标准条件下的PCR(Sambrook等人(1989) Molecular Cloning, Cold Spring Harbor Laboratory
Press)和E.H.F.聚合酶(Boehringer
Mannheim GmbH, Sandhoefer Strasse 116, Mannheim, Germany)下,构建编码融合蛋白(由胰岛素前体和由前肽(信号肽)和原肽组成的前导序列组成)的合成基因。分离所得DNA片段并用内切酶消化,使用QIAquick Gel
Extraction试剂盒(QIAGEN, Hilden, Germany)纯化。使用用于DNA连接的标准方法,通过CaCl2
方法进行大肠杆菌转化(Sambrook等人(1989),同上)。使用Manual
Perfectprep Plasmid 96 Vac试剂盒(5 PRIME,
Hamburg, Germany和Gaithersburg,
USA)和epMotion 5075 VAC (自动移液系统), Eppendorf, Hamburg, Germany)从转化的大肠杆菌细胞中纯化质粒。通过eurofins MWG/operon (Ebersberg, Germany),使用纯化的双链质粒DNA作为模板,确定核苷酸序列。用于PCR的寡核苷酸引物得自DNA technology (Århus, Denmark)。
通过α-前导序列或TA39前导序列促进了胰岛素前体的分泌(Kjeldsen等人,
1999. Biotechnol. Appl. Biochem 29, 79-86),然而各种已知酵母前导序列可以使用。
如图1和2所示,根据酿酒酵母-大肠杆菌穿梭POT质粒(美国专利5,871,957)构建表达α*-前导序列(无BglII-位点) (SEQ ID
NO:1)-EEGEPK (SEQ ID NO:2 ) -胰岛素前体融合蛋白的pAK1119酿酒酵母表达质粒。在图1中前导序列-前体指示编码前导序列-胰岛素前体融合蛋白的融合蛋白表达盒;TPI-PROMOTER是酿酒酵母TPI1启动子,TPI-TERMINATOR是酿酒酵母TPI1终止子;TPI-POMBE指示粟酒裂殖酵母POT基因,其用于在酿酒酵母中选择;ORIGIN指示源自2µm质粒的酿酒酵母复制起点;AMP-R指示β-内酰胺酶基因,其赋予针对氨苄青霉素的抗性,有助于大肠杆菌中选择;和ORIGIN-PBR322指示大肠杆菌复制起点。
通过PCR,使用合适的寡核苷酸为引物,产生编码具有不同的小C-肽的前导序列和胰岛素前体的许多融合蛋白的DNA,如下所述。使用标准方法将编码前导序列-胰岛素前体-融合蛋白的DNA片段亚克隆入CPOT表达载体,呈以下构象:前导序列-Lys-Arg-间隔区-胰岛素前体,其中Lys-Arg是潜在的二元内切蛋白酶加工位点,间隔区是N-末端延伸。为了优化酿酒酵母Kex2内切蛋白酶对融合蛋白的加工,将编码间隔区肽(N-末端延伸)的DNA例如EEGEPK (SEQ ID
NO:2),插入到编码前导序列和胰岛素前体的DNA之间(Kjeldsen,等人1999b.
J. Biotechnology, 75, 195-208)。然而,间隔区肽的存在并非强制性的。胰岛素前体以具有连接LysB29和GlyA1的小C-肽的单链N-末端延伸的胰岛素前体的形式分泌。在胰岛素前体的纯化以及N-末端延伸和小C-肽经蛋白水解去除后,可通过酶介导的转肽作用将氨基酸ThrB30加入LysB29,产生人胰岛素(Markussen,等人(1987)载于“Peptides 1986” (Theodoropoulos, D., Ed.), 页数189-194, Walter de Gruyter & Co., Berlin.)。
通过编码小C-肽中的氨基酸的一个或多个密码子的随机化,进行合成的小C-肽的开发。合成的小C-肽的特征通常在于在C-端的酶促加工位点(Lys),其允许经酶促除去合成的小C-肽。使用掺杂的寡核苷酸进行随机化,所述掺杂的寡核苷酸在合成的小C-肽的一个或多个位置上引入密码子变异。一般将用于PCR的两个引物(寡核苷酸)之一掺杂。用于PCR产生具有随机化的合成的小C-肽的前导序列-胰岛素前体、用于产生具有通式Ala-Xaa-Lys (AXK)的合成的小C-肽的寡核苷酸对的实例如下:
引物A (引入BglII-位点):
5’-ATACAGGAATTCCATTCAAGATCTGTTCAAACAAGAAGA-3’ (SEQ ID NO: 3)
引物B:
5’-AATCTTAGTTTCTAGACTAGTTGCAGTAGTTTTCCAATTGGTACAAGGAGCAGATGGAGGTACAGCATTGTTCGACAATACCCTTMNNAGCCTTAGGAGTGTAGAA
–3’ (SEQ ID NO:4)
N=ACTG
M=AC
聚合酶链式反应。通常按如下所示进行PCR:5 µl引物A (20 pmol/µl)、5 µl引物B (20 pmol/µl)、10 µl 10X PCR缓冲液、8 µl
dNTP混合物、0.75 µl E.H.F.酶、1 µl pAK1119质粒作为模板(大约0.2 μg DNA)和70.25 µl蒸馏水。
一般进行12循环,一个循环一般是95° C 45秒;48° C 1分钟;72° C 1.5分钟。随后将PCR混合物上样到2%琼脂糖凝胶上并使用标准技术进行电泳。将所得DNA片段从琼脂糖凝胶上切下来并通过QIAquick Gel Extraction试剂盒分离。
图2显示pAK1119 DNA表达盒的核苷酸序列(SEQ ID NO:5),其用作PCR的模板和所编码的融合蛋白(pAK1119的α*-前导序列-EEGEPK-胰岛素前体(SEQ ID NO:6)的推定的氨基酸。
将纯化的PCR DNA片段溶于缓冲液EB (10mM Tris
HCl pH 8.5,在QIAquick Gel Extraction试剂盒中提供)并依据标准技术用合适的限制内切酶(例如Bgl II和Xba I)消化。BglII-XbaI DNA片段经历琼脂糖电泳并使用QIAquick
Gel Extraction试剂盒来纯化。
使用T4 DNA连接酶和标准条件,将经消化和分离的DNA片段与合适的载体(例如CPOT型的)连接在一起。将连接混合物随后转化入感受态大肠杆菌菌株,然后用氨苄青霉素抗性来选择。使用Manual Perfectprep Plasmid 96 Vac试剂盒和epMotion 5075 VAC (自动化移液系统)分离来自所得大肠杆菌的质粒。
质粒随后用于转化合适的酿酒酵母宿主菌株例如MT663 (MATa/MAT α pep4-3/pep4-3 HIS4/his4 tpi1::LEU2/tpi1::LEU2
Cir+)。让单独的经转化的酿酒酵母克隆在液体培养基中生长,通过RP-HPLC确定分泌到培养基上清液中的胰岛素前体的量。然后确定来自分泌增加量的胰岛素前体的酿酒酵母克隆的表达质粒的编码合成的小C-肽的DNA序列。随后,经鉴定的合成的小C-肽序列可经历另一轮随机优化。
实施例
2-84
通过实施例1所述的方法产生本发明的胰岛素前体和表达构建体。表1显示胰岛素前体和相应的生产收率(表示为对照YAK1220的百分率)和O-糖基化水平。发酵全在5 ml YPD中在30°C进行72 h。通过培养上清液的RP-HPLC确定胰岛素前体的收率,并相对于对照菌株的收率表示,所述对照菌株表达前导序列-胰岛素前体融合蛋白,其中B29残基通过小C-肽Ala-Ala-Lys连接到A1残基。YAP3是YAP3信号序列。
新产生的胰岛素前体的一个实例是pAK3768。序列EEGEPK
(SEQ ID NO:2)是B-链的N-末端延伸和α2是前-原-序列
MRFPSIFTAVLFAASSALAAPVNTTTEDETAQIPAEAVIGYSDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVSMAKR
(SEQ ID NO:7)。
另一实例是pAK4053,其中TA39是前-原-序列MKLKTVRSAVLSSLFASQVLGQPIDDTESNTTSVNLMADDTESRFATNTTLAGGLDVVNLISMAKR
(SEQ ID NO:8)。
用于实施例的另外的前导序列是具有NcoI-位点的α-前导序列(SEQ ID NO:13)和具有BglII-位点的α4-前导序列(SEQ ID NO:14)。
表1列举了胰岛素前体和用于发酵以产生所述胰岛素前体的表达构建体。各构建体都已经历两次或三次独立发酵和分析,在单次实验中仅进行了数量非常有限的发酵。
表 1. 胰岛素前体和用于在酿酒酵母MT663中表达的表达构建体的列表,包括前体收率和前体的糖基化程度。
实施例
85.
通过实施例2-84中所述的相同方法,制备和测试了另外的胰岛素前体和表达构建体。
表2列举了胰岛素前体和用于发酵以产生所述胰岛素前体的表达构建体。在该表中也列举了对于各构建体,通过两次或三次发酵所确定的收率和糖基化水平。
表 2. 参考胰岛素前体和用于在酿酒酵母MT663中表达的表达构建体的列表,包括前体收率和前体的糖基化程度。
实施例 | 前导序列 | 延伸 | C- 肽 | 胰岛素前体 | 收率 | 糖基化 |
(X-Y 序列 ) | 相对于 YAK1220 | % | ||||
YAK1220 | α | EEAEAEAPK | AAK | HIPdesB30 | 1,00 | 0,6 |
85A | α | 无 | ALK | HIPdesB30 | 0,21 | |
85B | α | EEGEPK | AMDK | HIPdesB30 | 0,49 | |
85C | α | EEGEPK | AMIK | HIPdesB30 | 0,05 | |
85D | α | EEGEPK | AMTK | HIPdesB30 | 0,19 | |
85E | α | EEGEPK | AMVK | HIPdesB30 | 0,08 | |
85F | α2 | EEGEPK | AFK | HIPdesB30 | 0,91 | 0,7 |
85G | α2 | EEGEPK | AGK | HIPdesB30 | 0,75 | 1,6 |
85H | α2 | EEGEPK | AKK | HIPdesB30 | 0,93 | 2,5 |
85I | α2 | EEGEPK | ANK | HIPdesB30 | 1,04 | 2,1 |
85J | α2 | EEGEPK | FAK | HIPdesB30 | 0,31 | 0,9 |
85K | α2 | EEGEPK | GAK | HIPdesB30 | 0,80 | 1,1 |
85L | α2 | EEGEPK | IAK | HIPdesB30 | 0,85 | 0,8 |
85M | α2 | EEGEPK | PAK | HIPdesB30 | 0,24 | 3,3 |
85N | α2 | EEGEPK | RAK | HIPdesB30 | 0,64 | 1,4 |
85O | α2 | EEGEPK | SAK | HIPdesB30 | 0,81 | 1,3 |
85P | α2 | EEGEPK | WAK | HIPdesB30 | 0,12 | 0,3 |
85Q | LA19 | EEAEPK | AAK | HIPdesB30 | 1,30 | 1.21 |
85R | TA39 | DDGDPR | DGR | HIPdesB30 | 0,77 | 1.39 |
85S | α | DDGDPR | DGR | HIPdesB30 | 0,79 | 0.84 |
85T | TA57 | EEGEPR | EPR | HIPdesB30 | 1,39 | 2.18 |
85U | α | EEGEPR | EPR | HIPdesB30 | 1,59 | 1.22 |
85V | TA39 | EEGEPR | EPR | HIPdesB30 | 2,47 | 1.03 |
实施例
86-97.
为了评价序列Z-B-X-Y-A中的Y是K或R的效果,通过实施例2-84中所述的相同方法制备和测试了许多胰岛素前体和表达构建体。
表3列举了胰岛素前体和用于发酵以产生所述胰岛素前体的表达构建体。在该表中也列举了对于各构建体,通过两次或三次发酵所确定的收率。观察到对于具有结构Z-B-X-Y-A的人胰岛素前体,收率处于任何X-序列的相同水平,无论Y-序列是K (赖氨酸)或R (精氨酸)。
表 3. 人胰岛素前体和用于在酿酒酵母MT663中表达的表达构建体的列表,包括前体收率。
实施例 | 前导序列 | 延伸 | 胰岛素前体 | C- 肽(X-Y 序列 ) | 相对于 YAK1220 的收率 |
YAK1220 | α | EEAEAEAPK | HIPdesB30 | AAK | 1.00 |
86 | α | EEGEPK | HIPdesB30 | AMK | 1.81 |
87 | α | EEGEPK | HIPdesB30 | AMR | 1.40 |
88 | α | EEGEPK | HIPdesB30 | DMK | 2.25 |
89 | α | EEGEPK | HIPdesB30 | DMR | 1.92 |
90 | α | EEGEPK | HIPdesB30 | SDDMK | 2.52 |
91 | α | EEGEPK | HIPdesB30 | SDDMR | 2.42 |
表4列举了胰岛素aspart前体和用于发酵以产生所述胰岛素aspart前体的表达构建体。在该表中也列举了对于各构建体,通过两次或三次发酵所确定的相对于人胰岛素前体的收率。观察到对于具有结构Z-B-X-Y-A的胰岛素aspart前体,收率是处于任何X-序列的相同水平,无论Y-序列是K (赖氨酸)或R (精氨酸)。注意,胰岛素aspart前体的收率是针对“参考”人胰岛素前体而标准化的,因此解释了相对收率小于1.0。
表 4. 胰岛素aspart前体和用于在酿酒酵母MT663中表达的表达构建体的列表,包括前体收率。
实施例 | 前导序列 | 延伸 | 胰岛素前体 | C- 肽 | 收率 |
(X-Y 序列 ) | 相对于 YAK1220 | ||||
YAK1220 | α | EEAEAEAPK | HIPdesB30 | AAK | 1.00 |
92 | α | EEGEPK | IPdesB30*[B28D] | AMK | 0.37 |
93 | α | EEGEPK | IPdesB30*[B28D] | AMR | 0.34 |
94 | α | EEGEPK | IPdesB30*[B28D] | DMK | 0.38 |
95 | α | EEGEPK | IPdesB30*[B28D] | DMR | 0.42 |
96 | α | EEGEPK | IPdesB30*[B28D] | SDDMK | 0.26 |
97 | α | EEGEPK | IPdesB30*[B28D] | SDDMR | 0.24 |
实施例
98-103.
如实施例2中所述,通过在酵母菌株(其中通过常规酵母遗传学方法已经破坏了PMT1或PMT2的基因)中表达,测试胰岛素前体的O-糖基化水平,并与酵母菌株MT663中表达的胰岛素前体相比较。
依据实施例1的程序制备表达构建体,并依据实施例2-84中所述的程序进行发酵和O-糖基化分析。
在实施例98中表达的具有DMK作为C-肽的胰岛素前体,相比例如表1中的YAK1220构建体(0.6%),表现出相当低水平的0.29% O-糖基化。实施例99和100证明在Δpmt1以及在Δpmt2菌株中的十分相同的胰岛素前体的表达甚至进一步降低了O-糖基化水平,从野生型菌株的0.37%分别降低到两个蛋白甘露糖基转移酶敲除菌株中的0.17%和0.13%。因此,通过在两个不同的蛋白甘露糖基转移酶敲除菌株中表达,胰岛素前体的O-糖基化降低了2.2至2.9倍。具有SDMK C-肽的其它胰岛素前体也得到相同结论,尽管在此在Δpmt1菌株中O-糖基化的降低是3.0倍,而在Δpmt2菌株中是2.4倍。
表 5. 在酿酒酵母MT663
(wt)和蛋白甘露糖基转移酶敲除菌株中表达的不同的胰岛素前体的O-糖基化程度的比较
。
Claims (15)
1. 一种包含序列Z-B-X-Y-A的胰岛素前体,其中
- Z是任选的延伸序列,
- B是人胰岛素或其类似物的B-链,
- X是选自以下的序列:X1M、EA、AE、AD、DA和AP,其中X1是包含1-3个氨基酸残基的序列,
- Y是K或R,和
- A是人胰岛素或其类似物的A-链。
2. 权利要求1的胰岛素前体,其中X是X1M。
3. 权利要求2的胰岛素前体,其中X1中的所有氨基酸残基选自G、A、V、L、I、M、Q、N、E、D、S和T。
4. 权利要求2-3中任一项的胰岛素前体,其中X1选自D、SDD和A。
5. 权利要求1的胰岛素前体,其中X选自EA、AE、AD、DA和AP。
6. 权利要求1-5中任一项的胰岛素前体,其中Y是K。
7. 权利要求1-6中任一项的胰岛素前体,其是人胰岛素或DesB30-人胰岛素的前体,即A是A(1-21)和B是B(1-30)或B(1-29)。
8. 制备成熟人胰岛素或其类似物的方法,所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下,培养包含编码权利要求1-7中任一项的人胰岛素或其类似物的前体的DNA序列的真菌细胞;和(ii)分离所表达的前体。
9. 在真菌细胞中表达期间降低人胰岛素或人胰岛素类似物的前体的O-糖基化的方法,所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下,培养包含编码权利要求1-7中任一项的人胰岛素或其类似物的前体的DNA序列的真菌细胞。
10. 在真菌细胞中表达期间增加人胰岛素或人胰岛素类似物的前体的收率的方法,所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下,培养包含编码权利要求1-7中任一项的人胰岛素或其类似物的前体的DNA序列的真菌细胞。
11. 权利要求8-10中任一项的方法,其中所述真菌细胞携带在PMT1或PMT2的基因内的至少一个遗传修饰,这降低其O-糖基化的能力。
12. 权利要求8-11中任一项的方法,其中所述真菌细胞是酵母。
13. 权利要求12的方法,其中所述酵母选自酿酒酵母、巴斯德毕赤酵母和多形汉逊氏酵母。
14. 表达载体,其包含编码权利要求1-7中任一项的人胰岛素或人胰岛素类似物的前体的多核苷酸序列。
15. 宿主细胞,其被权利要求14的载体转化。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13171029.5 | 2013-06-07 | ||
EP13171029 | 2013-06-07 | ||
US201361833613P | 2013-06-11 | 2013-06-11 | |
US61/833613 | 2013-06-11 | ||
PCT/EP2014/061812 WO2014195452A1 (en) | 2013-06-07 | 2014-06-06 | Method for making mature insulin polypeptides |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105308067A true CN105308067A (zh) | 2016-02-03 |
CN105308067B CN105308067B (zh) | 2020-07-24 |
Family
ID=48570007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480032597.6A Active CN105308067B (zh) | 2013-06-07 | 2014-06-06 | 制备成熟胰岛素多肽的方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20160115216A1 (zh) |
EP (1) | EP3004156A1 (zh) |
JP (1) | JP2016521701A (zh) |
CN (1) | CN105308067B (zh) |
WO (1) | WO2014195452A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109851667A (zh) * | 2018-12-29 | 2019-06-07 | 江苏万邦医药科技有限公司 | 一种德谷胰岛素前体的纯化方法 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL3016970T3 (pl) | 2013-07-04 | 2019-09-30 | Glykos Finland Oy | Komórki grzybów nitkowatych z niedoborem O-mannozylotransferazy i sposoby ich zastosowania |
SG11201700446XA (en) | 2014-07-21 | 2017-02-27 | Glykos Finland Oy | Production of glycoproteins with mammalian-like n-glycans in filamentous fungi |
KR102007930B1 (ko) | 2014-12-31 | 2019-08-06 | 주식회사 엘지화학 | 재조합 당단백질의 글리코실화 조절 방법 |
JP6983075B2 (ja) | 2015-06-02 | 2021-12-17 | ノヴォ ノルディスク アー/エス | 極性の組換え延長部を有するインスリン |
MA43348A (fr) | 2015-10-01 | 2018-08-08 | Novo Nordisk As | Conjugués de protéines |
KR20170123849A (ko) | 2016-04-29 | 2017-11-09 | 주식회사유한양행 | Ccl3 변이체를 포함하는 융합 단백질 및 이의 용도 |
EP3606560A2 (en) | 2017-04-05 | 2020-02-12 | Novo Nordisk A/S | Oligomer extended insulin-fc conjugates |
KR20210102347A (ko) | 2018-12-11 | 2021-08-19 | 사노피 | 인슐린 수용체 결합 친화성이 감소된 인슐린 유사체 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005047508A1 (en) * | 2003-11-14 | 2005-05-26 | Novo Nordisk A/S | Processes for making acylated insulin |
CN100432104C (zh) * | 1999-12-29 | 2008-11-12 | 诺沃挪第克公司 | 用于生产胰岛素前体和胰岛素前体类似物的方法 |
CN103003438A (zh) * | 2010-02-10 | 2013-03-27 | 拜康有限公司 | 减少蛋白质糖基化的方法和过程及其蛋白质 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US487000A (en) | 1892-11-29 | Shirt | ||
IE50892B1 (en) | 1980-02-11 | 1986-08-06 | Novo Industri As | Process for preparing insulin esters |
US4546082A (en) | 1982-06-17 | 1985-10-08 | Regents Of The Univ. Of California | E. coli/Saccharomyces cerevisiae plasmid cloning vector containing the alpha-factor gene for secretion and processing of hybrid proteins |
US4870008A (en) | 1983-08-12 | 1989-09-26 | Chiron Corporation | Secretory expression in eukaryotes |
US5871957A (en) | 1984-05-25 | 1999-02-16 | Zymogenetics, Inc. | Stable DNA constructs |
AU600885B2 (en) | 1984-05-25 | 1990-08-30 | Zymogenetics Inc. | Stable DNA constructs |
DK58285D0 (da) | 1984-05-30 | 1985-02-08 | Novo Industri As | Peptider samt fremstilling og anvendelse deraf |
US4879231A (en) | 1984-10-30 | 1989-11-07 | Phillips Petroleum Company | Transformation of yeasts of the genus pichia |
US4882279A (en) | 1985-10-25 | 1989-11-21 | Phillips Petroleum Company | Site selective genomic modification of yeast of the genus pichia |
DK463887D0 (da) | 1987-09-07 | 1987-09-07 | Novo Industri As | Gaerleader |
DK105489D0 (da) | 1989-03-03 | 1989-03-03 | Novo Nordisk As | Polypeptid |
DK300090D0 (da) | 1990-12-19 | 1990-12-19 | Novo Nordisk As | Fremgangsmaade til fremstilling af leadersekvenser |
DE4244915C2 (de) | 1992-08-14 | 1998-12-03 | Widmar Prof Dr Tanner | DNA-Moleküle codierend Proteine, die an der O-Glykosylierung von Proteinen beteiligt sind |
DK82893D0 (da) | 1993-07-08 | 1993-07-08 | Novo Nordisk As | Peptid |
US5639642A (en) | 1994-06-16 | 1997-06-17 | Novo Nordisk A/S | Synthetic leader peptide sequences |
IL114160A (en) | 1994-06-17 | 2006-12-31 | Novo Nordisk As | Dna constructs encoding heterologous proteins and processes for the heterologous protein production in yeast |
JP2001527387A (ja) | 1997-01-24 | 2001-12-25 | ノボ ノルディスク アクティーゼルスカブ | 合成リーダーペプチド配列 |
BR9912106B1 (pt) | 1998-07-16 | 2012-09-04 | processo para fazer um polipeptìdeo ou proteìna desejados em uma cepa de levedura saccharomyces. | |
WO2002079251A2 (en) | 2001-04-02 | 2002-10-10 | Novo Nordisk A/S | Method for making human insulin precursors |
JP4855640B2 (ja) | 2001-04-02 | 2012-01-18 | ノヴォ ノルディスク アー/エス | インシュリン前駆体及びその調製方法 |
AU2002316807A1 (en) | 2001-06-08 | 2002-12-23 | Novo Nordisk A/S | Method for making insulin precursors and insulin precursor analogs |
ES2464282T3 (es) | 2006-09-27 | 2014-06-02 | Novo Nordisk A/S | Método para preparar polipéptidos de insulina madura |
-
2014
- 2014-06-06 JP JP2016517616A patent/JP2016521701A/ja not_active Withdrawn
- 2014-06-06 WO PCT/EP2014/061812 patent/WO2014195452A1/en active Application Filing
- 2014-06-06 CN CN201480032597.6A patent/CN105308067B/zh active Active
- 2014-06-06 EP EP14730821.7A patent/EP3004156A1/en not_active Withdrawn
- 2014-06-06 US US14/895,741 patent/US20160115216A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100432104C (zh) * | 1999-12-29 | 2008-11-12 | 诺沃挪第克公司 | 用于生产胰岛素前体和胰岛素前体类似物的方法 |
WO2005047508A1 (en) * | 2003-11-14 | 2005-05-26 | Novo Nordisk A/S | Processes for making acylated insulin |
CN103003438A (zh) * | 2010-02-10 | 2013-03-27 | 拜康有限公司 | 减少蛋白质糖基化的方法和过程及其蛋白质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109851667A (zh) * | 2018-12-29 | 2019-06-07 | 江苏万邦医药科技有限公司 | 一种德谷胰岛素前体的纯化方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2014195452A1 (en) | 2014-12-11 |
CN105308067B (zh) | 2020-07-24 |
US20160115216A1 (en) | 2016-04-28 |
JP2016521701A (ja) | 2016-07-25 |
EP3004156A1 (en) | 2016-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105308067A (zh) | 制备成熟胰岛素多肽的方法 | |
JP5503968B2 (ja) | 成熟インスリンポリペプチドの作製方法 | |
CN101243190B (zh) | 制备成熟胰岛素多肽的方法 | |
CA1340772C (en) | Expression and secretion of heterologous protiens in yeast employing truncated alpha-factor leader sequences | |
JP4773023B2 (ja) | インスリン前駆体及びインスリン前駆体類似体の製造方法 | |
WO2005047508A1 (en) | Processes for making acylated insulin | |
US20220194995A1 (en) | Mating factor alpha pro-peptide variants | |
JP4795599B2 (ja) | 酵母において改良された発酵収率を有するインスリン前駆体及びインスリン前駆体類似体の製造方法 | |
JP2013255513A (ja) | 活性化カルボキシペプチダーゼの製造方法 | |
CA2357072C (en) | Expression of a human insulin precursor in p. pastoris |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |