CN105308067A

CN105308067A - 制备成熟胰岛素多肽的方法

Info

Publication number: CN105308067A
Application number: CN201480032597.6A
Authority: CN
Inventors: F.胡巴勒克; A.F.佩特斯森; T.B.克杰德森; A.S.安德森
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2013-06-07
Filing date: 2014-06-06
Publication date: 2016-02-03
Anticipated expiration: 2034-06-06
Also published as: WO2014195452A1; CN105308067B; US20160115216A1; JP2016521701A; EP3004156A1

Abstract

本发明涉及制备成熟人胰岛素或其类似物的改善的方法，即通过培养包含编码人胰岛素或其类似物的前体的DNA序列的真菌细胞，所述前体包含小的连接肽。

Description

制备成熟胰岛素多肽的方法

技术背景

本发明涉及制备成熟胰岛素多肽的重组蛋白表达和蛋白化学。

背景

胰岛素是在胰岛β细胞中产生的多肽激素。有活性的胰岛素分子是由通过两个二硫键相连的B-链和A-链组成的双链分子。胰岛素以结构为B-C-A的前体分子胰岛素原形式合成，其中C-肽链将B-链的C-末端氨基酸残基与A-链的N-末端氨基酸残基相连。成熟的双链胰岛素通过在位于与A-链和B-链的接点处的碱性氨基酸残基对处体内切割C-肽而形成。A-链和B-链通过分别位于A7和B7以及A20和B19 Cys残基之间的两个二硫键保持在一起。此外，生物学活性的胰岛素分子在A6和A11位Cys残基之间有一个内部二硫键。

已经描述了在基因修饰宿主细胞例如大肠杆菌和酵母中生产胰岛素及其前体的许多方法。在大多数酵母工艺中，具有或天然C-肽或修饰的C-肽的胰岛素前体被表达和从酵母细胞中分泌出来。WO90/10075公开了具有C-肽AAK的胰岛素前体。WO01/49742公开了具有包含芳族氨基酸残基的C-肽的胰岛素前体。WO02/079251公开了具有包含Gly残基的C-肽的胰岛素前体。WO02/079250公开了具有包含Pro残基的C-肽的胰岛素前体。WO02/100887公开了具有包含糖基化位点的C-肽的胰岛素前体。WO2008/037735公开了具有包含kex2p切割位点的C-肽的胰岛素前体。WO2011/099028公开了降低在毕赤酵母(Pichia sp)中产生的胰岛素或胰岛素类似物前体分子的O-糖基化水平的方法。

如果没有直接获得成熟胰岛素或胰岛素类似物产物，则在一个或多个后续的体外酶促步骤中通过切割C-肽和可能的N-末端延伸而获得。这些酶促步骤是耗时的，常常是昂贵的，并且具有引入额外相关杂质(即类似成熟的胰岛素多肽的杂质)的风险。胰岛素多肽的酵母表达的另一个挑战是胰岛素多肽的O-糖基化。O-糖基化胰岛素多肽也是相关杂质。对于所有相关杂质而言相同的是，它们在技术上难以除去，并由此在商业纯化工艺中除去花费多。这是因为需要额外的纯化步骤，通常是色谱步骤，或需要在经济上不利的条件下操作色谱步骤。相关杂质的结果是，这样的色谱步骤可能在较长周期内、较低的柱载量、或甚至较低的收率下操作。

在制药工业中胰岛素产品越来越多地由胰岛素多肽的衍生物构成并且这类药物产品越来越多地用于非注射递送。因此，胰岛素市场已经变成竞争性市场并变为每一剂需要更多胰岛素多肽的产品，所以需要成本上更有效的工艺用于制备胰岛素多肽。

因此，需要在工业生产工艺中通过真菌制备人胰岛素或其类似物，其胰岛素前体分子具有减少的O-糖基化。也需要具有胰岛素前体的较高收率并且可通过有效和简单的工艺使得胰岛素前体顺从于C-肽的蛋白水解切除的工业生产工艺。

概述

本发明提供新的连接肽(C-肽)，当其在转化的微生物、尤其是酵母中表达时，赋予胰岛素前体分子的高收率。新的连接肽当在真菌例如酵母中表达时也促进通常低水平的O-糖基化。在具有降低O-糖基化能力的真菌菌株中表达新的胰岛素前体进一步降低了所表达的O-糖基化的胰岛素前体的比例。这类胰岛素前体随后可通过一个或多个合适的、公知的转化步骤而转化为人胰岛素、desB30人胰岛素、其它胰岛素类似物或某些胰岛素衍生物。

依据本发明的第一方面，提供了制备成熟人胰岛素或其类似物的方法，即通过培养包含编码人胰岛素或其类似物的前体的DNA序列的真菌细胞，所述前体具有序列Z-B-X-Y-A，其中

- Z是任选的延伸序列，

- B是人胰岛素或其类似物的B-链，

- X是选自以下的序列：X₁M、EA、AE、AD、DA和AP，其中X₁是包含1-3个氨基酸残基的序列，

- Y是K或R，和

- A是人胰岛素或其类似物的A-链。

依据本发明第二方面，提供了包含序列Z-B-X-Y-A的胰岛素前体，其中

- Z是任选的延伸序列，

- B是人胰岛素或其类似物的B-链，

- Y是K或R，和

- A是人胰岛素或其类似物的A-链。

依据本发明第三方面，提供了在真菌细胞中表达期间降低人胰岛素或人胰岛素类似物的前体的O-糖基化的方法，所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下，培养包含编码人胰岛素或其类似物的前体的DNA序列的真菌细胞，所述前体具有序列Z-B-X-Y-A，其中

- Z是任选的延伸序列，

- B是人胰岛素或其类似物的B-链，

- Y是K或R，和

- A是人胰岛素或其类似物的A-链。

依据本发明第四方面，提供了在真菌细胞中表达期间增加人胰岛素或人胰岛素类似物的前体的收率的方法，所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下，培养包含编码人胰岛素或其类似物的前体的DNA序列的真菌细胞，所述前体具有序列Z-B-X-Y-A，其中

- Z是任选的延伸序列，

- B是人胰岛素或其类似物的B-链，

- Y是K或R，和

- A是人胰岛素或其类似物的A-链。

本发明的方法提供了优于先前描述的通过培养真菌细胞制备成熟人胰岛素或其类似物的方法的许多优势。例如，已经发现本发明的胰岛素前体在真菌中以非常高的收率表达。已经惊奇地发现新的胰岛素前体也导致低量的O-糖基化胰岛素前体形式的相关杂质。进一步发现，通过使用不同的蛋白甘露糖基转移酶敲除菌株，可将低量的O-糖基化胰岛素前体甚至进一步降低达2-4倍。因此，目标是提供在真菌中展现高表达水平的胰岛素前体以及所表达的胰岛素前体具有低水平的O-糖基化。由于，惊奇地发现同时可通过选择胰岛素前体中的C-肽以及通过使用PMT调节的菌株二者降低O-糖基化水平，高表达收率仍然是重要的。

降低O-糖基化允许优化上游发酵工艺以及同时优化下游转化和纯化工艺，其中任何O-糖基化形式最终必须被除去。本发明的胰岛素前体此外通过蛋白酶切割而促进有效成熟，所述蛋白酶例如水解无色杆菌(Acromobacter lyticus)蛋白酶(ALP)。因此，发酵收率、O-糖基化和ALP切割的这种组合优化的结果允许明显更高的发酵收率，明显更高的纯化柱载量，和甚至从目前使用的工艺中取消了纯化步骤以及流线型（streamlined）ALP切割反应步骤。所得全工艺因此增加了生产工厂的能力，同时降低了生产胰岛素多肽所需的原材料的量。这两种结果都促使胰岛素多肽成本下降。

用作表达人胰岛素或人胰岛素类似物的前体的宿主细胞的真菌细胞可以携带降低其O-糖基化能力的至少一个遗传修饰。本发明的连接肽X-Y，导致从真菌细胞中分泌出来的胰岛素前体的低O-糖基化。然而，对于一些C-肽，通过在具有降低O-糖基化的能力的真菌细胞中表达，得到甚至更低水平的O-糖基化。在一个实施方案中，所述降低真菌细胞O-糖基化能力的遗传修饰是在PMT1或PMT2的基因内的至少一个遗传修饰。

在本发明的一个实施方案中，在序列Z-B-X-Y-A 中的连接肽X-Y是X₁M-Y，其中X₁是包含1-3个氨基酸残基的序列。因此，一方面本发明涉及胰岛素前体，其包含可从A链和B链上切割下来的连接肽(X-Y)和包含至少一个M和使得A-链和连接肽之间的肽键能够被切割的切割位点，其中一个M是紧接在所述切割位点的N-末端。

本发明的另一方面涉及胰岛素前体，其包含可从A链和B链上切割下来的并由3-5个氨基酸残基组成的连接肽(C-肽)，所述3-5个氨基酸残基其中至少一个是M残基。

本发明也涉及多核苷酸序列，其编码要求保护的胰岛素前体。再一方面本发明涉及含有所述多核苷酸序列的载体和含有所述多核苷酸序列或载体的宿主细胞。

附图简述

图1显示pAK1119酿酒酵母(S.cerevisiae)表达质粒，其表达α*-前导序列(无BglII-位点) (SEQ ID NO:1)-EEGEPK(SEQ ID NO:2)-胰岛素前体融合蛋白。

图2显示pAK1119 DNA表达盒的核苷酸序列(SEQ ID NO:5)和所编码的融合蛋白(pAK1119的α*-前导序列-EEGEPK-胰岛素前体(SEQ ID NO:6)的推定的氨基酸。

图3显示pAK3768酿酒酵母表达质粒，其表达α2-前导序列-EEGEPK-B(1-29)-AlaXLys-A(1-21)前体。

图4显示pAK3768 DNA表达盒的核苷酸序列(SEQ ID NO:9)和所编码的融合蛋白(pAK3768的α2-前导序列-EEGEPK-胰岛素前体(SEQ ID NO:10)的推定的氨基酸。

图5显示pAK4053酿酒酵母表达质粒，其表达TA39-前导序列-EEGEPK-B(1-29)-AlaMetLys-A(1-21)前体。

图6显示pAK4053 DNA表达盒的核苷酸序列(SEQ ID NO:11)和所编码的融合蛋白(pAK4053的TA39-前导序列-EEGEPK-胰岛素前体(SEQ ID NO:12))的推定的氨基酸。

描述

依据本发明第一方面，提供了制备成熟人胰岛素或其类似物的方法，即通过培养包含编码人胰岛素或其类似物的前体的DNA序列的真菌细胞，所述前体具有序列Z-B-X-Y-A，其中

- Z是任选的延伸序列，

-.B是人胰岛素或其类似物的B-链，

-.X是选自以下的序列：X₁M、EA、AE、AD、DA和AP，其中X₁是包含1-3个氨基酸残基的序列，

- Y是K或R，和

- A是人胰岛素或其类似物的A-链。

本文使用的术语“胰岛素类似物”是指修饰的人胰岛素，其中胰岛素的一个或多个氨基酸残基已被其它氨基酸残基取代和/或其中一个或多个氨基酸残基已从胰岛素上缺失和/或其中一个或多个氨基酸残基已经添加和/或插入到胰岛素。相比人胰岛素，胰岛素类似物通常会包含不超过大约7个突变、更通常不超过5个和甚至更通常最多3个突变。在一个实施方案中，相比人胰岛素，胰岛素类似物包含小于10个氨基酸修饰(取代、缺失、添加(包括插入)及其任何组合)，或者相比人胰岛素，小于9、8、7、6、5、4、3、2或1个修饰。

胰岛素分子中的修饰表示为链(A或B)、位置和取代氨基酸残基的氨基酸残基的单字母编码。此处的术语如“A1”、“A2”和“A3”等分别是指在胰岛素的A链中(自N-末端开始计数)的位置1、2和3等的氨基酸。同样，术语例如B1、B2和B3等分别是指在胰岛素的B链中(自N-末端开始计数)的位置1、2和3等的氨基酸。使用氨基酸的单字母编码，术语如A21A、B28K和B29P是指A21位置的氨基酸是A，位置28和29的氨基酸分别是赖氨酸和脯氨酸。

因此，例如，B28K,B29P人胰岛素是人胰岛素类似物，其中B链中的位置28的氨基酸被赖氨酸取代，B链中的位置29的氨基酸被脯氨酸取代，A链是A(1-21)。

“desB30”或“B(1-29)”是指缺乏B30氨基酸的天然胰岛素B链，B(1-30)，“A(1-21)”是指天然胰岛素A链。

在此术语“A(0)”或“B(0)”分别是指A1或B1的N-末端的氨基酸位置。术语A(-1)或B(-1)分别是指A(0)或B(0)的N-末端的头一个氨基酸位置。因此A(-2)和B(-2)分别是指A(-1)和B(-1)的N-末端的氨基酸位置，A(-3)和B(-3)分别是指A(-2)和B(-2)的N-末端的氨基酸位置，等等。术语A22或B31分别是指A21或B30的C-末端的氨基酸位置。术语A23或B32分别是指A22或B31的C-末端的头一个氨基酸位置。因此A24和B33分别是指A23和B32的C-末端的氨基酸位置，等等。

在本发明的一个实施方案中所述胰岛素前体是人胰岛素前体，即在序列Z-B-X-Y-A 中，A 是 A(1-21)和B 是 B(1-30)。在另一实施方案中所述胰岛素前体是desB30人胰岛素前体，即A 是 A(1-21)和B 是 B(1-29)。在本发明的再一个实施方案中所述胰岛素前体具有这样的结构：其中选择A和B，使得所述胰岛素前体是B28D人胰岛素(aspart)、B28K,B29P人胰岛素(lispro)、B3K,B29E人胰岛素(glulisine)、或A21G,B31R,B32R人胰岛素(glargine)的前体。

在此，术语“氨基酸残基”是这样的氨基酸：在形式上，从该氨基酸的羧基上已经去除羟基和/或在形式上，从该氨基酸的氨基上已经去除氢原子。在本文本中，依据IUPAC命名法，根据氨基酸残基的三字母缩写或其单字母缩写来提及氨基酸残基。例如，Gly和G都是指氨基酸残基甘氨酸，Lys和K都是指氨基酸残基赖氨酸。

胰岛素类似物的实例是这样的：其中B链位置28的Pro被Asp、Lys、Leu、Val、或Ala取代和/或位置B29的Lys被Pro、Glu或Asp取代。此外，位置B3的Asn可被Thr、Lys、Gln、Glu或Asp取代。位置A21的氨基酸残基可被Gly取代。也可将一个或多个氨基酸添加到A-链和/或B-链的C-末端，例如Lys。位置B1的氨基酸可以被Glu取代。位置B16的氨基酸可以被Glu或His取代。胰岛素类似物的另外的实例是缺失类似物，例如，人胰岛素中的B30氨基酸已缺失的类似物(desB30人胰岛素)，人胰岛素中的B1氨基酸已缺失的胰岛素类似物(desB1人胰岛素)、desB28-B30人胰岛素和desB27人胰岛素。A-链和/或B-链具有N-末端延伸的胰岛素类似物，和A-链和/或B-链具有C-末端延伸例如两个精氨酸残基添加到B-链C-末端的胰岛素类似物，也是胰岛素类似物的实例。另外的实例是包含上述突变组合的胰岛素类似物。其中位置A14的氨基酸是Asn、Gln、Glu、Arg、Asp、Gly或His，位置B25的氨基酸是His，并且任选进一步包含一个或多个额外突变的胰岛素类似物，是胰岛素类似物的另外的实例。其中位置A21的氨基酸残基是Gly的人胰岛素的胰岛素类似物和其中胰岛素类似物在C-末端进一步延伸两个精氨酸残基的人胰岛素的胰岛素类似物，也是胰岛素类似物的实例。

本文使用的“胰岛素衍生物”意图是指天然发生的胰岛素或经化学修饰的胰岛素类似物，所述化学修饰例如通过在胰岛素主链的一个或多个位置引入侧链或通过氧化或通过还原胰岛素中的氨基酸残基的基团或通过使游离氨基或羟基酰基化。胰岛素衍生物的非限制性实例是例如，N^ε ^B29-十四酰基des(B30)人胰岛素、N^ε ^B29-石胆酸酰基-γ-谷酰基des(B30)人胰岛素、N^ε ^B29–(N^α-(HOOC(CH₂)₁₄CO)-γ-Glu)des(B30)人胰岛素和N^ε ^B29–(N^α-(HOOC(CH₂)₁₆CO)-γ-Glu)des(B30)人胰岛素。

本文使用的“胰岛素前体”意图是指单链多肽，其可通过一个或多个后续化学和/或酶促过程而被转化为人胰岛素或其类似物。

“连接肽”或“C-肽”是指单链胰岛素原分子的B-C-A多肽序列的连接部分“C”。在人胰岛素链中，C-肽连接B链的位置30和A链的位置1并且长度为35个氨基酸残基。较小C-肽的非限制性实例是例如AAK、AAR和DKAAK。

本文使用的“成熟人胰岛素或其类似物”意图是指具有胰岛素活性和正确氨基酸残基组成和与天然胰岛素分子的相同的结构构象的双链胰岛素，即在位置A7-B7、A20–B19和A6-A11之间具有二硫键。因此，包含C-肽的人胰岛素或其类似物的前体会至少切除C-肽，以合格成为成熟人胰岛素或其类似物。成熟人胰岛素或其类似物的非限制性实例是人胰岛素、DesB30人胰岛素和B3K,B29E人胰岛素。

本发明特征在于连接B-链C-末端和A-链N-末端的新的C-肽，其通过在真菌细胞中表达而增加收率。评价增加的收率，即通过经产培养上清液（spent culture supernatant）中存在的胰岛素前体浓度相对于来自使用已知C-肽的发酵的经产培养上清液中存在的胰岛素前体浓度。

在本发明的一个实施方案中，序列Z-B-X-Y-A中的X选自EA、AE、AD、DA和AP。

在本发明的另一实施方案中X是X₁M，其中X₁是包含1-3个氨基酸残基的氨基酸序列。X₁可以由1个氨基酸残基、2个氨基酸残基或3个氨基酸残基组成。优选地，X₁中的所有氨基酸残基选自具有是直链或支链脂族的侧链和具有羟基、羧基或酰胺基的侧链的氨基酸残基。在一个实施方案中X₁选自D、SDD和A。在另一实施方案中X₁选自D、SDD、A、T、GD、TD、SD、ADD、DDA、N、S、GN、TS、DD、GT、GA、AD、GS、Q、ND、STD、DA、TN、SGD、TT、M、L、R、V、GDD、DTD、ST、I、TA、DGD、K、H、SS、TGD、E、TDD、G、AGD、AA、SA和AS。在另一实施方案中X₁选自D、SDD、A、T、GD、TD、SD、ADD、DDA和N。在还一个实施方案中X₁选自S、GN、TS、DD、GT、GA、AD、GS、Q、ND、STD、DA、TN、SGD、TT、M、L、R和V。在另一实施方案中X₁选自GDD、DTD、ST、I、TA、DGD、K、H、SS、TGD、E、TDD、G、AGD、AA、SA和AS。在还一个实施方案中X₁不包含为P的氨基酸残基。在还一个实施方案中X₁不包含为C的氨基酸残基。在还一个实施方案中X₁不包含选自H、Y、W和F的氨基酸残基。在还一个实施方案中X₁不包含选自K和R的氨基酸残基。在还一个实施方案中X₁不包含选自P、C、K、R、H、Y、W和F的氨基酸残基。因此，在一个实施方案中X₁中存在的所有氨基酸选自G、A、V、L、I、M、Q、N、E、D、S和T。

在另一实施方案中X选自EA、AE、AD、DA和AP。

在另一实施方案中序列Z-B-X-Y-A 中的Y是K。在真菌细胞中的表达也允许Y是R。

在再一实施方案中序列Z-B-X-Y-A 中的X-Y选自SDDMK、DMK和AMK。在另一实施方案中序列Z-B-X-Y-A 中的X-Y选自SDDMK、SDMK、DMK和AMK。在还一个实施方案中序列Z-B-X-Y-A 中的X-Y选自SDDMR、SDMR、DMR和AMR。

在再一实施方案中序列Z-B-X-Y-A中的X-Y是DMK和选择A和B ，使得所述胰岛素前体是B28D人胰岛素的前体(aspart)，即A 是 A(1-21)和B是28D-B(1-29)。在再一实施方案中序列Z-B-X-Y-A中的X-Y是 AMK和选择A和B，使得所述胰岛素前体是B28D人胰岛素的前体(aspart)，即A 是 A(1-21)和B是28D-B(1-29)。

本发明的胰岛素前体在序列Z-B-X-Y-A 中可包含任选的延伸序列Z。在一个实施方案中Z不存在，即所述胰岛素前体具有序列B-X-Y-A。在另一实施方案中Z具有序列Z₁PK，其中Z₁是具有0-10个氨基酸残基的序列。在一个实施方案中Z是EEGEPK。在另一实施方案中Z选自EEAEPK、EEAEAEPK、EEAEAPK和EEAEAEAPK。

本文使用的“POT”意图是指粟酒裂殖酵母(Schizosaccharomyces pombe)磷酸丙糖异构酶基因。本文使用的“TPI1”意图是指酿酒酵母磷酸丙糖异构酶基因。

本文使用的“前导序列”意图是指由前肽(pre-peptide)(信号肽)和原肽(pro-peptide)组成的氨基酸序列。前导序列的非限制性实例是例如酿酒酵母α-因子信号前导序列和用于酵母的合成前导序列，描述于WO95/34666。

本文使用的“前肽”意图是指信号肽，其在蛋白前体形式中以N-末端序列的形式存在。信号肽的功能是允许异源蛋白容易转运到内质网中。信号肽在该过程中通常被切除。信号肽对于产生所述蛋白的真菌生物体而言可以是异源或同源的。可与本发明DNA构建体一起使用的许多信号肽包括酵母天冬氨酸蛋白酶3 (YAP3)信号肽或任何功能类似物(Egel-Mitani等人(1990) YEAST 6:127-137和US 5,726,038)和MFα1基因的α-因子信号(Thorner (1981)，载于The Molecular Biology of the Yeast Saccharomyces cerevisiae, Strathern等人, 编辑., 页数143-180, Cold Spring Harbor Laboratory, NY和US 4,870,00)。

本文使用的“原肽”意图是指多肽序列，其功能允许将所表达的多肽从内质网导向高尔基体并进一步导向分泌小泡，以分泌到培养基中(即，多肽穿过细胞壁或至少穿过细胞膜向酵母细胞的细胞周质间隙输出)。原肽可以是酵母α-因子原肽，参见US 4,546,082和4,870,008。或者，原肽可以是合成的原肽，也就是说在自然界不存在的原肽。合适的合成的原肽是以下文献中公开的那些：US 5,395,922；5,795,746；5,162,498和WO 98/32867。原肽优选会在C端含有肽链内切酶加工位点，例如Lys-Arg序列或其任何功能类似物。

可通过已建立的标准方法合成性地制备本发明的多核苷酸序列，所述方法例如Beaucage等人(1981) Tetrahedron Letters 22:1859-1869描述的亚磷酰胺(phosphoamidite)方法，或Matthes等人(1984) EMBO Journal 3:801-805描述的方法。依据亚磷酰胺方法，合成寡核苷酸，例如，在自动化DNA合成仪中，纯化，双链化并连接而形成合成的DNA构建体。制备DNA构建体的一种方式是通过聚合酶链式反应(PCR)。

本发明的多核苷酸序列也可以是混合基因组、cDNA和合成来源的。例如，可将编码前导序列肽的基因组或cDNA序列连接到编码A链和B链的基因组或cDNA序列，此后可在位点上修饰该DNA序列，即按照公知的程序，通过插入编码所需氨基酸序列的合成寡核苷酸，用于同源重组，或优选地通过PCR，使用合适的寡核苷酸产生所需序列。

本发明包括这样的载体，其在所选的微生物或宿主细胞中能够复制并且其携带编码本发明的胰岛素前体或胰岛素前体类似物的多核苷酸序列。重组载体可以是自主复制载体，即以染色体外实体形式存在的载体，其复制独立于染色体复制，例如质粒，染色体外元件、小染色体、或人工染色体。载体可含有任何用于确保自我复制的元件。或者，载体可以是这样的载体：当将其引入宿主细胞时，其整合到基因组中并与其整合入的染色体一起复制。此外，可以使用单个载体或质粒或两个或更多个载体或质粒，其共同含有有待引入宿主细胞基因组的总DNA或转座子。载体可以是线性的或闭合环状的质粒并且优选会含有允许将载体稳定整合到宿主细胞基因组中或允许载体在细胞中独立于基因组自主复制的元件。

在一个优选的实施方案中，重组表达载体能够在酵母中复制。使载体能够在酵母中复制的序列的实例是酵母质粒2μ复制基因REP 1-3和复制起点。

本发明的载体优选地含有一个或多个选择标志物，其允许容易选择转化的细胞。选择标志物是这样的基因，其产物提供杀生物剂或病毒抗性、重金属抗性、向营养缺陷型提供原养型等。细菌选择标志物的实例是枯草芽孢杆菌（Bacillus subtilis）或地衣芽孢杆菌(Bacillus licheniformis)的dal基因，或赋予抗生素抗性的标志物，所述抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。用于丝状真菌宿主细胞的选择标志物包括amdS (乙酰胺酶)、argB (鸟氨酸氨甲酰基转移酶)、pyrG (乳清酸核苷-5’-磷酸脱羧酶)和trpC (邻氨基苯甲酸合酶)。用于酵母宿主细胞的合适标志物的实例是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于酵母的优选的选择标志物是粟酒裂殖酵母TPI基因(Russell (1985) Gene 40:125-130)。

载体中，多核苷酸序列与适宜的启动子序列操作性连接。该启动子可以是在所选的宿主细胞中显示转录活性的任何核酸序列，包括突变的、截短的和杂交的启动子，而且可获自编码与宿主细胞同源或异源的胞外或胞内多肽的基因。

用于指导在细菌宿主细胞中转录的合适的启动子的实例是得自以下的启动子：大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA) 、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL) 、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)麦芽糖淀粉酶基因(amyM) 、解淀粉芽孢杆菌(Bacillus amyloliquefaciens) α-淀粉酶基因(amyQ)和地衣芽孢杆菌青霉素酶基因(penP)。用于指导在丝状真菌宿主细胞中的转录的合适的启动子的实例是得自以下基因的启动子：米曲霉(AspergilIus oryzae)TAKA淀粉酶、米赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶和黑曲霉酸稳定α-淀粉酶。在酵母宿主中，有用的启动子的实例是酿酒酵母MFα1、TPI1、ADH、TDH3或PGK启动子。

本发明的多核苷酸构建体一般也会与合适的终止子操作性连接。在酵母中，合适的终止子是TPI1终止子(Alber等人(1982) J. Mol. Appl. Genet. 1:419-434)。

分别用于连接本发明的多核苷酸序列、启动子和终止子，并将它们插入合适的含有酵母复制所需信息的酵母载体中的程序，是本领域技术人员周知的。可以理解，所述载体可以通过如下构建：首先制备含有编码本发明的胰岛素前体或胰岛素前体类似物的完整DNA序列的DNA构建体，然后将该片段插入合适的表达载体，或者序贯地插入含有单独元件(例如信号、原肽、小C-肽、A链和B链)的遗传信息的DNA片段，接着连接。

本发明也涉及重组宿主细胞，其包含编码本发明的胰岛素前体或胰岛素前体类似物的多核苷酸序列。将包含这类多核苷酸序列的载体引入宿主细胞，使得该载体作为染色体整合体或作为自我复制的染色体外载体而维持。

本文使用的“宿主细胞”意图是指用于表达目标多肽的微生物。宿主细胞包括亲本细胞的因复制期间发生突变所致与亲本细胞不相同的任何后代。

本发明合适的宿主细胞是真菌细胞。本文使用的“真菌”意图包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如Hawksworth等人, 载于 Ainsworth and Bisby ’ s Dictionary of The Fungi, 第8版, 1995, CAB International, University Press, Cambridge, UK所定义) 以及卵菌门(Oomycota) (如Hawksworth等人, 1995, 同上, 页数171中引用的)和所有有丝分裂孢子真菌(Hawksworth等人, 1995, 同上)。

在一个实施方案中所述宿主细胞是酵母细胞。本文使用的“酵母”包括产子囊酵母(内孢霉目(Endomycetales))、产担孢子(basidiosporogenous)酵母和属于半知菌的酵母(芽生菌属(Blastomycetes))。产子囊酵母分为蚀精霉科(Spermophthoraceae)和酵母科(Saccharomycetaceae)。后者包含四个亚科，裂殖酵母亚科(Schizosaccharomycoideae)(例如，粟酒裂殖酵母属(Schizosaccharomyces))、拿逊酵母亚科(Nadsonioideae)、脂酵母亚科(Lipomycoideae)和多极出芽酵母亚科(Saccharomycoideae)(例如，毕赤氏酵母属(Pichia)、克鲁维氏酵母属(Kluyveromyces)和酵母属(Saccharomyces))。产担孢子酵母包括白冬孢酵母属（Leucosporidim）、红冬孢属(Rhodosporidium)、锁掷酵母属(Sporidiobolus)、线黑粉酵母属(Filobasidium)和线黑粉菌属(Filobasidiella)。属于半知菌的酵母分作两个科，掷孢酵母科(Sporobolomycetaceae)(例如，Sorobolomyces和布氏掷孢酵母属(Bullera))和隐球菌科(Cryptococcaceae)(例如，假丝酵母属(Candida))。由于酵母分类将来可能发生变化，所以为了本发明的目的，酵母应按照Biology and Activities of Yeast (Skinner，F.A.，Passmore，S.M.，和Davenport，R.R.编辑，Soc.App. Bacteriol.Symposium Series No.9，1980)所述的进行定义。酵母的生物学和酵母遗传学操作是本领域周知的(参见例如，Biochemistry and Genetics of Yeast，Bacil，M.，Horecker，B.J.和Stopani，A.O.M. 编辑，第2版，1987；The Yeasts，Rose，A.H.，和Harrison，J.S.编辑，第2版， 1987；以及The Molecular Biology of the Yeast Saccharomyces，Strathern等编辑，1981)。

用于本发明的工艺的酵母宿主细胞可以是任何合适的酵母生物体，其在培养时产生大量的本发明的胰岛素前体和胰岛素前体类似物。

合适的酵母生物体的实例是选自以下物种的细胞的菌株：假丝酵母属(Candida)、克鲁维氏酵母属(Kluyveromyces)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、毕赤氏酵母属(Pichia)、汉逊氏酵母属(Hansenula)和耶罗威亚酵母属(Yarrowia)。在一个实施方案中，酵母宿主细胞选自卡氏酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母（Saccharomyces douglasii）、克鲁维酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、卵形酵母(Saccharomyces oviformis)、粟酒裂殖酵母(Schizosaccharomyces pombe)、葡萄汁酵母(Sacchoromyces uvarum)、克鲁维毕赤酵母(Pichia kluyveri)、解脂耶罗威亚酵母(Yarrowia lipolytica)、产朊假丝酵母(Candida utilis)、可可假丝酵母(Candida cacaoi)和发酵地霉(Geotrichum fermentans)。其它可用的酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)、脆壁克鲁维酵母(Kluyveromyces fragilis)、多形汉逊氏酵母(Hansenula polymorpha)、巴斯德毕赤酵母(Pichia pastoris)、解脂耶罗威亚酵母(Yarrowia lipolytica)、粟酒裂殖酵母(Schizosaccharomyces pombe)、玉米黑粉菌（Ustilgo maylis）、麦芽糖假丝酵母(Candida maltose)、季也蒙氏毕赤酵母(Pichia guillermondii)和甲醇毕赤酵母(Pichia methanoliol)(参看Gleeson等人, J. Gen. Microbiol.132, 1986，第3459-3465页；US 4,882,279和US 4,879,231)。酵母细胞转化可以例如以本来已知的方式通过原生质体形成、随后转化而实现。

在一个实施方案中所述宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门亚部的所有丝状形式(由Hawksworth等人，1995，同上，所定义)。丝状真菌宿主细胞可选自支顶孢属(Acremonium)、曲霉属(Aspergillus)、镰孢属(Fusarium)、腐质霉属(Humicola)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、链孢霉属(Neurospora)、青霉属(Penicillium)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)和木霉属(Trichoderma)。

用于表达胰岛素前体的宿主细胞优选地是不含任何功能性抗生素抗性基因的细胞。尽管这样的抗生素抗性基因在例如大肠杆菌中的起始克隆步骤中有用，但可通过周知的程序使抗生素抗性基因无功能或从宿主细胞中移除，所述程序参见例如WO 00/04172。

本文使用的“培养基”意图是指培养宿主细胞、即支持真菌的生长和产物形成的液体溶液。真菌的合适培养基是例如YPD或如WO2008/037735中所述。培养基含有至少一种碳源、一种或几种氮源、必需的盐(包括钾、钠、镁、磷酸盐和硫酸盐的盐)、痕量金属、水溶性维生素和加工助剂(包括但不限于消泡剂、蛋白酶抑制剂、稳定剂、配体和诱导剂)。典型的碳源是例如单糖或双糖。典型的氮源是例如氨、尿素、氨基酸、酵母提取物、玉米浸出液以及完全和部分水解蛋白。典型的痕量金属是例如Fe、Zn、Mn、Cu、Mo和H₃BO₃。典型的水溶性维生素是例如生物素、泛酸盐、烟酸、硫胺素、对氨基苯甲酸、胆碱、吡哆醇、叶酸、核黄素和抗坏血酸。

本文使用的“发酵”意图是指用于繁殖浸泡在液体培养基中的微生物的无菌工艺。发酵优选地是在无菌的搅拌罐中进行，所述搅拌罐具有补给管线，用于添加压缩的无菌气体，所述气体由空气、氧气和氨气组成但不限于这些。发酵罐可具有传感器和装置，以监测pH、温度、压力、搅拌速率、溶解氧水平、液体含量、泡沫水平、加料速率和添加酸和碱的速率。此外，发酵罐可以装备有光学装置，以监测细胞密度水平、代谢物和产物浓度，无论其理化形式如何。

发酵期间产生的所需产物作为可溶性胞外材料或者作为呈可溶性材料或不可溶材料(包括聚集材料)形式的胞内材料存在。发酵工艺通常在罐中进行，罐的工作体积范围在100 mL至200.000 L。发酵工艺可以以分批工艺、补料-分批工艺、重复补料-分批工艺或连续工艺来操作。

可通过常规程序从培养基中回收所分泌的胰岛素前体或胰岛素类似物前体(其重要部分会以正确加工形式存在于培养基中)，所述常规程序包括通过离心从培养基中分离酵母细胞，通过离子交换基质或通过反相吸收基质来过滤或捕获人胰岛素或其类似物的前体，通过盐例如硫酸铵的方式沉淀上清液或滤液中的蛋白质组分，接着通过各种色谱程序(例如离子交换色谱、亲和力色谱等)来纯化。

可以表达具有N-末端氨基酸残基延伸的本发明的人胰岛素或其类似物的前体，如美国专利号5,395,922和欧洲专利号765,395A所述。已发现在发酵期间，所述延伸稳定地连接到本发明的人胰岛素或其类似物的前体，针对酵母蛋白酶例如DPAP的蛋白水解活性而保护胰岛素前体或胰岛素前体类似物的N-末端。人胰岛素或其类似物的前体上的N-末端延伸的存在，在化学加工该蛋白期间也可起到N-末端氨基的保护作用，即它可充当BOC (叔丁基-氧基羰基)或类似保护基的替代物。可通过对碱性氨基酸(例如Lys)具有特异性的蛋白水解酶的方式，从回收的胰岛素前体或胰岛素前体类似物上除去N-末端延伸，使得在Lys残基上切掉末端延伸。这类蛋白水解酶的实例是胰蛋白酶和水解无色杆菌(Achromobacter lyticus)蛋白酶。

分泌到培养基中和回收之后，本发明的胰岛素前体或胰岛素前体类似物会经历多种体外程序，以去除可能的N-末端延伸序列和C-肽，以得到胰岛素或所需的胰岛素类似物。这类方法包括在L-苏氨酸酯存在下通过胰蛋白酶或水解无色杆菌蛋白酶的酶促转化，接着通过以下文献所述的碱水解或酸水解将胰岛素或胰岛素类似物的苏氨酸酯转化为胰岛素或胰岛素类似物：美国专利说明书号4,343,898或4,916,212或研究披露, September 1994/487，所述文献的公开内容通过引用结合到本文中。

如下所述，构建具有合成的C-肽的胰岛素前体或胰岛素前体类似物(实施例1)。

通过PCR构建含有编码要求保护的胰岛素前体或胰岛素类似物前体的多核苷酸序列的酿酒酵母表达质粒并用于转化酿酒酵母宿主细胞。测量表达产物例如胰岛素类似物的量，作为yAK1220中的相关对照表达水平的百分率，所述对照即具有α前导序列的前体EEAEAEAPK-(B(1-29)-AAK-A(1-21)。本发明的新的C-肽增加收率至多达300%并且它们导致O-糖基化水平的普遍减少。另外，包含新的C-肽的胰岛素前体表现出经例如水解无色杆菌蛋白酶所致的良好的C-肽切除。

当用于切割本发明的胰岛素前体时，可以通过如下的简单测定来确定水解无色杆菌蛋白酶的切割效率：将合适的胰岛素前体水溶液在有利于无色杆菌蛋白酶的pH和温度下孵育并随时间而从反应混合物中取回样品。一旦将样品取回，就将酶活性失活。在收集了覆盖目标时间跨度的所有样品之后，通过例如HPLC分析确定相应的成熟胰岛素多肽的浓度。将成熟胰岛素多肽浓度绘制成时间函数，将表明反应进程。比较在相同条件下切割的不同胰岛素前体的这样的反应轨迹，会允许将胰岛素前体按照经水解无色杆菌蛋白酶作用所致的成熟能力来排序。类似的程序可用于其它蛋白酶，其可选择用于将胰岛素前体转化为相应的成熟胰岛素多肽。

本发明的新的C-肽在真菌细胞中表达期间也表现出人胰岛素或其类似物的前体的降低的O-糖基化。同样，本发明的人胰岛素或其类似物的前体可以用于在真菌细胞中制备成熟人胰岛素或其类似物的改善的方法。在真菌细胞中表达具有降低O-糖基化能力的本发明的人胰岛素或其类似物的前体可以维持所述前体的改善的收率，而同时甚至进一步降低在表达期间为O-糖基化的所述前体分子的部分。

蛋白O-甘露糖基转移酶(PMTs)起始O-甘露糖基聚糖的装配，这是真菌中的必要的蛋白修饰。PMTs在真菌中是保守的，PMT家族按照系统发生学分类为PMT1、PMT2和PMT4亚家族，其在蛋白底物特异性上是不同的。蛋白O-甘露糖基转移酶Pmt1p和Pmt2p催化酵母内质网中的蛋白质中的丝氨酸和苏氨酸残基的O-糖基化，即通过从Dolichyl phosphate-D-甘露糖中转移甘露糖基残基(Gentzsch等人, FEBS Lett 1995, 18, 页数128-130)。在酿酒酵母以及在许多其它真菌中，PMT家族高度冗余，只有PMT1/PMT2和PMT4亚家族成员的同时缺失才是致死的(Girrbach和Strahl, J. Biol. Chem. 2003, 278, 页数12554-62)。US 5,714,377描述了这样的真菌细胞，其具有从PMT1/PMT2修饰中降低的O-糖基化能力并仍然具有活力并在工业发酵条件下显示良好生长特性。

通过以下非限制性实施方案进一步描述了本发明：

1. 一种包含序列Z-B-X-Y-A的胰岛素前体，其中

- Z是任选的延伸序列，

- B是人胰岛素或其类似物的B-链，

- X是选自以下的序列：X₁M、EA、AE、AD、DA、AP、AW和LA，其中X₁是包含1-3个氨基酸残基的序列，

- Y是K或R，和

- A是人胰岛素或其类似物的A-链。

2. 实施方案1的胰岛素前体，其中X是选自以下的序列：X₁M、EA、AE、AD、DA和AP，其中X₁是包含1-3个氨基酸残基的序列。

3. 实施方案1-2中任一项的胰岛素前体，其中X是X₁M。

4. 实施方案3的胰岛素前体，其中X₁选自D、SDD、A、T、GD、TD、SD、ADD、DDA、N、S、GN、TS、DD、GT、GA、AD、GS、Q、ND、STD、DA、TN、SGD、TT、M、L、R、V、GDD、DTD、ST、I、TA、DGD、K、H、SS、TGD、E、TDD、G、AGD、AA、SA和AS。

5. 实施方案1-4中任一项的胰岛素前体，其中X₁选自D、SDD、A、T、GD、TD、SD、ADD、DDA和N。

6. 实施方案5的胰岛素前体，其中X₁选自D、SDD和A。

7. 实施方案1-4中任一项的胰岛素前体，其中X₁选自S、GN、TS、DD、GT、GA、AD、GS、Q、ND、STD、DA、TN、SGD、TT、M、L、R和V。

8. 实施方案1-4中任一项的胰岛素前体，其中X₁选自GDD、DTD、ST、I、TA、DGD、K、H、SS、TGD、E、TDD、G、AGD、AA、SA和AS。

9. 实施方案1-8中任一项的胰岛素前体，其中X₁中的所有氨基酸残基选自具有是直链或支链脂族的侧链和具有羟基、羧基或酰胺基的侧链的氨基酸残基。

10. 实施方案1-9中任一项的胰岛素前体，其中X₁不包含为P的氨基酸残基。

11. 实施方案1-10中任一项的胰岛素前体，其中X₁不包含为C的氨基酸残基。

12. 实施方案1-11中任一项的胰岛素前体，其中X₁不包含选自H、Y、W和F的氨基酸残基。

13. 实施方案1-12中任一项的胰岛素前体，其中X₁不包含选自K和R的氨基酸残基。

14. 实施方案1-13中任一项的胰岛素前体，其中X₁不包含选自P、C、K、R、H、Y、W和F的氨基酸残基。

15. 实施方案1-14中任一项的胰岛素前体，其中X₁中的所有氨基酸残基选自G、A、V、L、I、M、Q、N、E、D、S和T。

16. 实施方案1-2中任一项的胰岛素前体，其中X选自EA、AE、AD、DA、AP、AW和LA。

17. 实施方案16的胰岛素前体，其中X选自EA、AE、AD、DA和AP。

18. 实施方案1-15中任一项的胰岛素前体，其中X₁由1个氨基酸残基组成。

19. 实施方案1-15中任一项的胰岛素前体，其中X₁由2个氨基酸残基组成。

20. 实施方案1-15中任一项的胰岛素前体，其中X₁由3个氨基酸残基组成。

21. 实施方案1-20中任一项的胰岛素前体，其中Y是K。

22. 实施方案1-20中任一项的胰岛素前体，其中Y是R。

23. 实施方案1-21中任一项的胰岛素前体，其中X-Y选自AMK、DMK、SDDMK和SDMK。

24. 实施方案1-20中任一项的胰岛素前体，其中X-Y选自AMR、DMR、SDDMR和SDMR。

25. 实施方案1-24中任一项的胰岛素前体，其是人胰岛素前体，即A是A(1-21)和B是B(1-30)。

26. 实施方案1-24中任一项的胰岛素前体，其是desB30人胰岛素前体，即A是A(1-21)和B是B(1-29)。

27. 实施方案1-24中任一项的胰岛素前体，其中选择A和B，使得所述胰岛素前体是B28D人胰岛素(aspart)、B28K,B29P人胰岛素(lispro)、B3K,B29E人胰岛素(glulisine)、或A21G,B31R,B32R人胰岛素(glargine)。

28. 实施方案1-27中任一项的胰岛素前体，其中Z不存在。

29. 实施方案1-27中任一项的胰岛素前体，其中Z是由大约3至大约20个氨基酸残基组成的肽。

30. 实施方案29的胰岛素前体，其中Z是由大约5至大约15个氨基酸残基组成的肽。

31. 实施方案1-27和29-30中任一项的胰岛素前体，其中Z的C-末端是EPK或APK。

32. 实施方案1-27和29-30中任一项的胰岛素前体，其中Z具有序列Z₁PK，其中Z₁是具有0-10个氨基酸残基的序列。

33. 实施方案32的胰岛素前体，其中Z₁包含至少2个为E的氨基酸残基。

34. 实施方案32-33中任一项的胰岛素前体，其中Z₁包含至少2个为A的氨基酸残基。

35. 实施方案32-34中任一项的胰岛素前体，其中Z₁包含至少一个为EA的亚序列。

36. 实施方案29的胰岛素前体，其中Z是EEGEPK。

37. 实施方案29的胰岛素前体，其中Z选自EEAEPK、EEAEAEPK、EEAEAPK和EEAEAEAPK。

38. 制备成熟人胰岛素或其类似物的方法，所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下，培养包含编码实施方案1-37中任一项的人胰岛素或其类似物的前体的DNA序列的真菌细胞；和(ii)分离所表达的前体。

39. 在真菌细胞中表达期间降低人胰岛素或人胰岛素类似物的前体的O-糖基化的方法，所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下，培养包含编码实施方案1-37中任一项的人胰岛素或其类似物的前体的DNA序列的真菌细胞。

40. 在真菌细胞中表达期间增加人胰岛素或人胰岛素类似物的前体的收率的方法，所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下，培养包含编码实施方案1-37中任一项的人胰岛素或其类似物的前体的DNA序列的真菌细胞。

41. 实施方案38-40中任一项的方法，其中所述真菌细胞携带降低其O-糖基化能力的至少一个遗传修饰。

42. 实施方案41的方法，其中所述真菌细胞携带至少一个遗传修饰，该遗传修饰与α前导序列一起表达时，相比携带相应的未经修饰的基因的真菌细胞，通过蛋白O-甘露糖基转移酶1 (PMT1)降低其des-B30人胰岛素前体EEAEAEAPK-B(1-29)-AAK-A(1-21)的O-糖基化的能力。

43. 实施方案41的方法，其中所述真菌细胞携带至少一个遗传修饰，该遗传修饰与α前导序列一起表达时，相比携带相应的未经修饰的基因的真菌细胞，通过蛋白O-甘露糖基转移酶2 (PMT2)降低其des-B30人胰岛素前体EEAEAEAPK-B(1-29)-AAK-A(1-21)的O-糖基化的能力。

44. 实施方案41-43中任一项的方法，其中所述O-糖基化的能力降低至少2倍。

45. 实施方案41-44中任一项的方法，其中所述O-糖基化的能力降低至少4倍。

46. 实施方案41-45中任一项的方法，其中所述至少一个遗传修饰位于PMT1或PMT2的编码区内。

47. 实施方案41-45中任一项的方法，其中所述真菌细胞携带在PMT1或PMT2的基因内的至少一个遗传修饰，该遗传修饰降低其O-糖基化的能力。

48. 实施方案41-45中任一项的方法，其中所述至少一个遗传修饰位于负责或涉及PMT1或PMT2的表达和/或转录调节的区域内。

49. 实施方案41-48中任一项的方法，其中所述真菌细胞中的PMT1基因和PMT2基因都缺失。

50. 实施方案38-49中任一项的方法，其中编码人胰岛素或人胰岛素类似物的前体的所述DNA序列包含前导序列。

51. 实施方案50的方法，其中所述前导序列选自α-因子信号前导序列、α2、α4、LA19和TA39。

52. 实施方案38-51中任一项的方法，其中所述真菌细胞是酵母。

53. 实施方案52的方法，其中所述酵母是酿酒酵母。

54. 实施方案52的方法，其中所述酵母是巴斯德毕赤酵母。

55. 实施方案52的方法，其中所述酵母是多形汉逊氏酵母。

56. 多核苷酸序列，其编码实施方案1-37中任一项的人胰岛素或人胰岛素类似物的前体。

57. 表达载体，其包含实施方案56的多核苷酸序列。

58. 宿主细胞，其被实施方案57的载体转化。

在以下实施例中进一步详细描述了本发明，所述实施例不意图以任何方式限制要求保护的本发明的范围。附图被认为是本发明的说明书和描述的不可或缺的部分。所引用的所有参考文献都通过全文引用具体地结合到本文中。

实施例

通用程序

表达质粒

所有表达质粒都是C-POT型，类似于EP171,142中描述的那些。这些是基于2μ的表达载体，其特征在于包含粟酒裂殖酵母丙糖磷酸异构酶基因(POT)用于在酿酒酵母中的质粒选择和稳定化。这些质粒还包含酿酒酵母丙糖磷酸异构酶启动子和终止子(图1)。这些序列类似于质粒pKFN1003(描述于WO 90/10075)中的相应序列，所有序列除了以下之外：1) 编码前导序列和胰岛素产物的融合蛋白的EcoRI-Xbal片段的序列，和2) 已引入的沉默突变，导致表达载体中的2μ-区中的NcoI-位点的去除。为了促进不同融合蛋白的克隆，编码MFα1前-原前导序列的DNA序列已被改变以并入NcoI位点(参见图2)并被称为MFα1*前-原前导序列。因此NcoI-Xbal片段被编码目标胰岛素构建体的NcoI-Xbal片段简单地替代。可使用合成的寡核苷酸和PCR，依据标准技术合成这样的NcoI-Xbal片段。除了α-前导序列，其它前导序列也可以使用，如以下实施例所述。

酵母转化

通过转化宿主菌株酿酒酵母菌株MT663制备酵母转化体。酵母菌株MT663 (MATa/MATα pep4-3/pep4-3 HIS4/his4 △tpi1::LEU2/△tpi1::LEU2 Cir')与申请WO 92/11378关联，保藏于Deutsche Sammlung von Mikroorganismen und Zellkulturen，保藏号为DSM 6278。

MT663在YPGGE (1％细菌用酵母提取物（Bacto yeast extract），2％细菌用蛋白胨(Bacto peptone)，2％半乳糖，1% EtOH, 2%甘油)上生长至在600nm处OD为0.2。通过离心收获100ml培养物，用10ml水洗涤，再次离心并重悬于10ml含有1 M山梨醇、25mM Na₂EDTA pH = 8.0和6.7 mg/ml二硫苏糖醇的溶液中。该悬浮液在30℃孵育15分钟，离心，并将细胞重悬于10ml含有1.2 M山梨醇、10mM Na₂EDTA、0.1M柠檬酸钠，pH 05.8和2mg NovozymC3234的溶液中。将悬浮液在30℃孵育30分钟，通过离心收集细胞，在10 ml 1.2M山梨醇和10 ml CAS (1.2 M山梨醇，10 mM CaCl₂，10 mM Tris HCl (Tris＝三(羟甲基）-氨基甲烷) pH＝7.5)中洗涤，并重悬于2 ml CAS中。为进行转化，将1 ml CAS-悬浮的细胞与约0.1 μg质粒DNA混合，在室温下放置15分钟。加入1 ml (20％聚乙二醇4000，10 mM CaCl₂，10 mM Tris HCl，pH＝7.5)，并将混合物在室温下再放置30分钟。离心混合物，将沉淀重悬于0.1 ml SOS (1.2 M山梨醇，50% YPGGE, 6.7 mM CaCl₂)中并于30℃孵育2小时。之后离心悬浮液并将沉淀重悬于0.5ml的1.2 M山梨醇中。之后，于52℃加入6 ml上层琼脂(Sherman等人，(1982)，Methods in Yeast Genetics，Cold Spring Harbor Laboratory的SC培养基(含有2%葡萄糖加2.5％琼脂))，并将悬浮液倒入含有相同的琼脂固化的含山梨醇培养基的平板顶部。

酵母发酵

在30°C将转化了表达质粒的酿酒酵母菌株MT663在YPD培养基中培养72小时。

糖基化水平的定量

使用LC-MS系统界面Waters Acquity UPLC系统(Waters, Milford, MA, USA)确定培养上清液中的胰岛素前体的糖基化水平，所述系统由自动进样器(型号Acq-SM)、泵(型号Acq-BSM)、柱温箱(型号Acq-SM)和带有LTQ Orbitrap XL (Thermo Fisher, Waltham, MA, USA)的检测器(型号Acq-TUV)组成。使用在0.1%甲酸中的乙腈线性梯度(0 min 12%乙腈, 10 min 15%乙腈, 27 min 40%乙腈, 27.5 min 90%乙腈)，使用CSH C18柱(Waters, 1x150 mm)，流速0.1 ml/min，在45°C实现RP-HPLC分离。按照制造商的说明书调整和操作LTQ Orbitrap，以正模式，用ESI源(源电压为4000 V, 毛细管温度为325 °C, 鞘气流为40, 辅助气流为10和吹扫气流为2)。使用分辨率为30000的全FTMS扫描(m/z=900-2000)以采集数据。

将酵母培养物离心(5000 rpm, 5 min)，直接或在用水解无色杆菌蛋白酶处理后通过LC-MS分析上清液。在去卷积(deconvolution)后获得O-糖基化水平，作为与o-糖基化胰岛素种类的质量(单-o-糖基化种类M+162 Da)对应的强度和与非糖基化种类的质量(M)对应的强度的比例并表示为百分率。该方法用于获得单-o-糖基化以及多-o-糖基化产物的水平。

实施例 1

使用标准条件下的PCR(Sambrook等人(1989) Molecular Cloning, Cold Spring Harbor Laboratory Press)和E.H.F.聚合酶(Boehringer Mannheim GmbH, Sandhoefer Strasse 116, Mannheim, Germany)下，构建编码融合蛋白(由胰岛素前体和由前肽(信号肽)和原肽组成的前导序列组成)的合成基因。分离所得DNA片段并用内切酶消化，使用QIAquick Gel Extraction试剂盒(QIAGEN, Hilden, Germany)纯化。使用用于DNA连接的标准方法，通过CaCl₂ 方法进行大肠杆菌转化(Sambrook等人(1989)，同上)。使用Manual Perfectprep Plasmid 96 Vac试剂盒(5 PRIME, Hamburg, Germany和Gaithersburg, USA)和epMotion 5075 VAC (自动移液系统), Eppendorf, Hamburg, Germany)从转化的大肠杆菌细胞中纯化质粒。通过eurofins MWG/operon (Ebersberg, Germany)，使用纯化的双链质粒DNA作为模板，确定核苷酸序列。用于PCR的寡核苷酸引物得自DNA technology (Århus, Denmark)。

通过α-前导序列或TA39前导序列促进了胰岛素前体的分泌(Kjeldsen等人, 1999. Biotechnol. Appl. Biochem 29, 79-86)，然而各种已知酵母前导序列可以使用。

如图1和2所示，根据酿酒酵母-大肠杆菌穿梭POT质粒(美国专利5,871,957)构建表达α*-前导序列(无BglII-位点) (SEQ ID NO:1)-EEGEPK (SEQ ID NO:2 ) -胰岛素前体融合蛋白的pAK1119酿酒酵母表达质粒。在图1中前导序列-前体指示编码前导序列-胰岛素前体融合蛋白的融合蛋白表达盒；TPI-PROMOTER是酿酒酵母TPI1启动子，TPI-TERMINATOR是酿酒酵母TPI1终止子；TPI-POMBE指示粟酒裂殖酵母POT基因，其用于在酿酒酵母中选择；ORIGIN指示源自2µm质粒的酿酒酵母复制起点；AMP-R指示β-内酰胺酶基因，其赋予针对氨苄青霉素的抗性，有助于大肠杆菌中选择；和ORIGIN-PBR322指示大肠杆菌复制起点。

通过PCR，使用合适的寡核苷酸为引物，产生编码具有不同的小C-肽的前导序列和胰岛素前体的许多融合蛋白的DNA，如下所述。使用标准方法将编码前导序列-胰岛素前体-融合蛋白的DNA片段亚克隆入CPOT表达载体，呈以下构象：前导序列-Lys-Arg-间隔区-胰岛素前体，其中Lys-Arg是潜在的二元内切蛋白酶加工位点，间隔区是N-末端延伸。为了优化酿酒酵母Kex2内切蛋白酶对融合蛋白的加工，将编码间隔区肽(N-末端延伸)的DNA例如EEGEPK (SEQ ID NO:2)，插入到编码前导序列和胰岛素前体的DNA之间(Kjeldsen,等人1999b. J. Biotechnology, 75, 195-208)。然而，间隔区肽的存在并非强制性的。胰岛素前体以具有连接Lys^B29和Gly^A1的小C-肽的单链N-末端延伸的胰岛素前体的形式分泌。在胰岛素前体的纯化以及N-末端延伸和小C-肽经蛋白水解去除后，可通过酶介导的转肽作用将氨基酸Thr^B30加入Lys^B29，产生人胰岛素(Markussen,等人(1987)载于“Peptides 1986” (Theodoropoulos, D., Ed.), 页数189-194, Walter de Gruyter & Co., Berlin.)。

通过编码小C-肽中的氨基酸的一个或多个密码子的随机化，进行合成的小C-肽的开发。合成的小C-肽的特征通常在于在C-端的酶促加工位点(Lys)，其允许经酶促除去合成的小C-肽。使用掺杂的寡核苷酸进行随机化，所述掺杂的寡核苷酸在合成的小C-肽的一个或多个位置上引入密码子变异。一般将用于PCR的两个引物(寡核苷酸)之一掺杂。用于PCR产生具有随机化的合成的小C-肽的前导序列-胰岛素前体、用于产生具有通式Ala-Xaa-Lys (AXK)的合成的小C-肽的寡核苷酸对的实例如下：

引物A (引入BglII-位点):

5’-ATACAGGAATTCCATTCAAGATCTGTTCAAACAAGAAGA-3’ (SEQ ID NO: 3)

引物B:

5’-AATCTTAGTTTCTAGACTAGTTGCAGTAGTTTTCCAATTGGTACAAGGAGCAGATGGAGGTACAGCATTGTTCGACAATACCCTTMNNAGCCTTAGGAGTGTAGAA –3’ (SEQ ID NO:4)

N=ACTG

M=AC

聚合酶链式反应。通常按如下所示进行PCR：5 µl引物A (20 pmol/µl)、5 µl引物B (20 pmol/µl)、10 µl 10X PCR缓冲液、8 µl dNTP混合物、0.75 µl E.H.F.酶、1 µl pAK1119质粒作为模板(大约0.2 μg DNA)和70.25 µl蒸馏水。

一般进行12循环，一个循环一般是95° C 45秒；48° C 1分钟；72° C 1.5分钟。随后将PCR混合物上样到2%琼脂糖凝胶上并使用标准技术进行电泳。将所得DNA片段从琼脂糖凝胶上切下来并通过QIAquick Gel Extraction试剂盒分离。

图2显示pAK1119 DNA表达盒的核苷酸序列(SEQ ID NO:5)，其用作PCR的模板和所编码的融合蛋白(pAK1119的α*-前导序列-EEGEPK-胰岛素前体(SEQ ID NO:6)的推定的氨基酸。

将纯化的PCR DNA片段溶于缓冲液EB (10mM Tris HCl pH 8.5，在QIAquick Gel Extraction试剂盒中提供)并依据标准技术用合适的限制内切酶(例如Bgl II和Xba I)消化。BglII-XbaI DNA片段经历琼脂糖电泳并使用QIAquick Gel Extraction试剂盒来纯化。

使用T4 DNA连接酶和标准条件，将经消化和分离的DNA片段与合适的载体(例如CPOT型的)连接在一起。将连接混合物随后转化入感受态大肠杆菌菌株，然后用氨苄青霉素抗性来选择。使用Manual Perfectprep Plasmid 96 Vac试剂盒和epMotion 5075 VAC (自动化移液系统)分离来自所得大肠杆菌的质粒。

质粒随后用于转化合适的酿酒酵母宿主菌株例如MT663 (MATa/MAT α pep4-3/pep4-3 HIS4/his4 tpi1::LEU2/tpi1::LEU2 Cir⁺)。让单独的经转化的酿酒酵母克隆在液体培养基中生长，通过RP-HPLC确定分泌到培养基上清液中的胰岛素前体的量。然后确定来自分泌增加量的胰岛素前体的酿酒酵母克隆的表达质粒的编码合成的小C-肽的DNA序列。随后，经鉴定的合成的小C-肽序列可经历另一轮随机优化。

实施例 2-84

通过实施例1所述的方法产生本发明的胰岛素前体和表达构建体。表1显示胰岛素前体和相应的生产收率(表示为对照YAK1220的百分率)和O-糖基化水平。发酵全在5 ml YPD中在30°C进行72 h。通过培养上清液的RP-HPLC确定胰岛素前体的收率，并相对于对照菌株的收率表示，所述对照菌株表达前导序列-胰岛素前体融合蛋白，其中B29残基通过小C-肽Ala-Ala-Lys连接到A1残基。YAP3是YAP3信号序列。

新产生的胰岛素前体的一个实例是pAK3768。序列EEGEPK (SEQ ID NO:2)是B-链的N-末端延伸和α2是前-原-序列

MRFPSIFTAVLFAASSALAAPVNTTTEDETAQIPAEAVIGYSDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVSMAKR (SEQ ID NO:7)。

另一实例是pAK4053，其中TA39是前-原-序列MKLKTVRSAVLSSLFASQVLGQPIDDTESNTTSVNLMADDTESRFATNTTLAGGLDVVNLISMAKR (SEQ ID NO:8)。

用于实施例的另外的前导序列是具有NcoI-位点的α-前导序列(SEQ ID NO:13)和具有BglII-位点的α4-前导序列(SEQ ID NO:14)。

表1列举了胰岛素前体和用于发酵以产生所述胰岛素前体的表达构建体。各构建体都已经历两次或三次独立发酵和分析，在单次实验中仅进行了数量非常有限的发酵。

表 1. 胰岛素前体和用于在酿酒酵母MT663中表达的表达构建体的列表，包括前体收率和前体的糖基化程度。

实施例 85.

通过实施例2-84中所述的相同方法，制备和测试了另外的胰岛素前体和表达构建体。

表2列举了胰岛素前体和用于发酵以产生所述胰岛素前体的表达构建体。在该表中也列举了对于各构建体，通过两次或三次发酵所确定的收率和糖基化水平。

表 2. 参考胰岛素前体和用于在酿酒酵母MT663中表达的表达构建体的列表，包括前体收率和前体的糖基化程度。

实施例

前导序列

延伸

C- 肽

胰岛素前体

收率

糖基化

(X-Y 序列 )

相对于 YAK1220

%

YAK1220

α

EEAEAEAPK

AAK

HIPdesB30

1,00

0,6

85A

α

无

ALK

HIPdesB30

0,21

85B

α

EEGEPK

AMDK

HIPdesB30

0,49

85C

α

EEGEPK

AMIK

HIPdesB30

0,05

85D

α

EEGEPK

AMTK

HIPdesB30

0,19

85E

α

EEGEPK

AMVK

HIPdesB30

0,08

85F

α2

EEGEPK

AFK

HIPdesB30

0,91

0,7

85G

α2

EEGEPK

AGK

HIPdesB30

0,75

1,6

85H

α2

EEGEPK

AKK

HIPdesB30

0,93

2,5

85I

α2

EEGEPK

ANK

HIPdesB30

1,04

2,1

85J

α2

EEGEPK

FAK

HIPdesB30

0,31

0,9

85K

α2

EEGEPK

GAK

HIPdesB30

0,80

1,1

85L

α2

EEGEPK

IAK

HIPdesB30

0,85

0,8

85M

α2

EEGEPK

PAK

HIPdesB30

0,24

3,3

85N

α2

EEGEPK

RAK

HIPdesB30

0,64

1,4

85O

α2

EEGEPK

SAK

HIPdesB30

0,81

1,3

85P

α2

EEGEPK

WAK

HIPdesB30

0,12

0,3

85Q

LA19

EEAEPK

AAK

HIPdesB30

1,30

1.21

85R

TA39

DDGDPR

DGR

HIPdesB30

0,77

1.39

85S

α

DDGDPR

DGR

HIPdesB30

0,79

0.84

85T

TA57

EEGEPR

EPR

HIPdesB30

1,39

2.18

85U

α

EEGEPR

EPR

HIPdesB30

1,59

1.22

85V

TA39

EEGEPR

EPR

HIPdesB30

2,47

1.03

实施例 86-97.

为了评价序列Z-B-X-Y-A中的Y是K或R的效果，通过实施例2-84中所述的相同方法制备和测试了许多胰岛素前体和表达构建体。

表3列举了胰岛素前体和用于发酵以产生所述胰岛素前体的表达构建体。在该表中也列举了对于各构建体，通过两次或三次发酵所确定的收率。观察到对于具有结构Z-B-X-Y-A的人胰岛素前体，收率处于任何X-序列的相同水平，无论Y-序列是K (赖氨酸)或R (精氨酸)。

表 3. 人胰岛素前体和用于在酿酒酵母MT663中表达的表达构建体的列表，包括前体收率。

实施例	前导序列	延伸	胰岛素前体	C- 肽(X-Y 序列 )	相对于 YAK1220 的收率
						YAK1220	α	EEAEAEAPK	HIPdesB30	AAK	1.00
86	α	EEGEPK	HIPdesB30	AMK	1.81
						87	α	EEGEPK	HIPdesB30	AMR	1.40
88	α	EEGEPK	HIPdesB30	DMK	2.25
						89	α	EEGEPK	HIPdesB30	DMR	1.92
90	α	EEGEPK	HIPdesB30	SDDMK	2.52
						91	α	EEGEPK	HIPdesB30	SDDMR	2.42

表4列举了胰岛素aspart前体和用于发酵以产生所述胰岛素aspart前体的表达构建体。在该表中也列举了对于各构建体，通过两次或三次发酵所确定的相对于人胰岛素前体的收率。观察到对于具有结构Z-B-X-Y-A的胰岛素aspart前体，收率是处于任何X-序列的相同水平，无论Y-序列是K (赖氨酸)或R (精氨酸)。注意，胰岛素aspart前体的收率是针对“参考”人胰岛素前体而标准化的，因此解释了相对收率小于1.0。

表 4. 胰岛素aspart前体和用于在酿酒酵母MT663中表达的表达构建体的列表，包括前体收率。

实施例	前导序列	延伸	胰岛素前体	C- 肽	收率
										(X-Y 序列 )	相对于 YAK1220
YAK1220	α	EEAEAEAPK	HIPdesB30	AAK	1.00
						92	α	EEGEPK	IPdesB30*[B28D]	AMK	0.37
93	α	EEGEPK	IPdesB30*[B28D]	AMR	0.34
						94	α	EEGEPK	IPdesB30*[B28D]	DMK	0.38
95	α	EEGEPK	IPdesB30*[B28D]	DMR	0.42
						96	α	EEGEPK	IPdesB30*[B28D]	SDDMK	0.26
97	α	EEGEPK	IPdesB30*[B28D]	SDDMR	0.24

实施例 98-103.

如实施例2中所述，通过在酵母菌株(其中通过常规酵母遗传学方法已经破坏了PMT1或PMT2的基因)中表达，测试胰岛素前体的O-糖基化水平，并与酵母菌株MT663中表达的胰岛素前体相比较。

依据实施例1的程序制备表达构建体，并依据实施例2-84中所述的程序进行发酵和O-糖基化分析。

在实施例98中表达的具有DMK作为C-肽的胰岛素前体，相比例如表1中的YAK1220构建体(0.6%)，表现出相当低水平的0.29% O-糖基化。实施例99和100证明在Δpmt1以及在Δpmt2菌株中的十分相同的胰岛素前体的表达甚至进一步降低了O-糖基化水平，从野生型菌株的0.37%分别降低到两个蛋白甘露糖基转移酶敲除菌株中的0.17%和0.13%。因此，通过在两个不同的蛋白甘露糖基转移酶敲除菌株中表达，胰岛素前体的O-糖基化降低了2.2至2.9倍。具有SDMK C-肽的其它胰岛素前体也得到相同结论，尽管在此在Δpmt1菌株中O-糖基化的降低是3.0倍，而在Δpmt2菌株中是2.4倍。

表 5. 在酿酒酵母MT663 (wt)和蛋白甘露糖基转移酶敲除菌株中表达的不同的胰岛素前体的O-糖基化程度的比较

。

Claims

1. 一种包含序列Z-B-X-Y-A的胰岛素前体，其中

- Z是任选的延伸序列，

- B是人胰岛素或其类似物的B-链，

- Y是K或R，和

- A是人胰岛素或其类似物的A-链。

2. 权利要求1的胰岛素前体，其中X是X₁M。

3. 权利要求2的胰岛素前体，其中X₁中的所有氨基酸残基选自G、A、V、L、I、M、Q、N、E、D、S和T。

4. 权利要求2-3中任一项的胰岛素前体，其中X₁选自D、SDD和A。

5. 权利要求1的胰岛素前体，其中X选自EA、AE、AD、DA和AP。

6. 权利要求1-5中任一项的胰岛素前体，其中Y是K。

7. 权利要求1-6中任一项的胰岛素前体，其是人胰岛素或DesB30-人胰岛素的前体，即A是A(1-21)和B是B(1-30)或B(1-29)。

8. 制备成熟人胰岛素或其类似物的方法，所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下，培养包含编码权利要求1-7中任一项的人胰岛素或其类似物的前体的DNA序列的真菌细胞；和(ii)分离所表达的前体。

9. 在真菌细胞中表达期间降低人胰岛素或人胰岛素类似物的前体的O-糖基化的方法，所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下，培养包含编码权利要求1-7中任一项的人胰岛素或其类似物的前体的DNA序列的真菌细胞。

10. 在真菌细胞中表达期间增加人胰岛素或人胰岛素类似物的前体的收率的方法，所述方法包括(i)在表达所述人胰岛素或人胰岛素类似物的前体的合适培养条件下，培养包含编码权利要求1-7中任一项的人胰岛素或其类似物的前体的DNA序列的真菌细胞。

11. 权利要求8-10中任一项的方法，其中所述真菌细胞携带在PMT1或PMT2的基因内的至少一个遗传修饰，这降低其O-糖基化的能力。

12. 权利要求8-11中任一项的方法，其中所述真菌细胞是酵母。

13. 权利要求12的方法，其中所述酵母选自酿酒酵母、巴斯德毕赤酵母和多形汉逊氏酵母。

14. 表达载体，其包含编码权利要求1-7中任一项的人胰岛素或人胰岛素类似物的前体的多核苷酸序列。

15. 宿主细胞，其被权利要求14的载体转化。