CN1558912A - 生产酰化多肽的方法 - Google Patents

生产酰化多肽的方法 Download PDF

Info

Publication number
CN1558912A
CN1558912A CNA028187261A CN02818726A CN1558912A CN 1558912 A CN1558912 A CN 1558912A CN A028187261 A CNA028187261 A CN A028187261A CN 02818726 A CN02818726 A CN 02818726A CN 1558912 A CN1558912 A CN 1558912A
Authority
CN
China
Prior art keywords
glu
lys
ala
seq
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA028187261A
Other languages
English (en)
Inventor
伊凡·德尔斯
珀·鲍尔施米特
�������ɭ
简·马库森
伊布·乔纳森
-
米奇·埃格尔-米塔尼
��B��л����ɭ
托马斯·B·谢尔德森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN1558912A publication Critical patent/CN1558912A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/107General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides
    • C07K1/1072General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides by covalent attachment of residues or functional groups
    • C07K1/1077General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides by covalent attachment of residues or functional groups by covalent attachment of residues other than amino acids or peptide residues, e.g. sugars, polyols, fatty acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/08Linear peptides containing only normal peptide links having 12 to 20 amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/006General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length of peptides containing derivatised side chain amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/605Glucagons

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Zoology (AREA)
  • Toxicology (AREA)
  • Endocrinology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及一种在转化的宿主细胞中,通过表达目的多肽的前体分子,并在随后的体外步骤中使该前体分子酰化而生产多肽的方法。本发明还涉及要求保护的方法中所采用的DNA序列,载体和转化的宿主细胞。此外,本发明还涉及目的多肽的一些前体和一些酰化方法。本发明提供了优选在特定的赖氨酸ε-氨基基团中被酰化的多肽的生产方法。

Description

生产酰化多肽的方法
技术领域
本发明涉及一种生产多肽的方法,其在转化宿主细胞中表达目的多肽的前体分子,并在随后体外步骤中在Lys切割位点酰化然后剪切。本发明还涉及要求保护的方法所采用的DNA序列,载体和转化的宿主细胞。本发明还涉及目的多肽的一些前体和一些酰化方法。
背景技术
重组DNA技术使在微生物和其他宿主细胞中表达外源(异源)多肽成为可能。在酵母异源多肽表达系统中,用含有编码目的多肽的DNA序列的合适表达载体转化酵母细胞在许多种多肽中获得成功,例如胰岛素和胰岛素前体,胰高血糖素,胰高血糖素样肽和其类似物。
然而,在重组宿主中表达限制大小的蛋白质或多肽的常见问题是,宿主生物产生的蛋白水解酶对表达产物的蛋白水解。
因此,分离得到的产物为具有不同长度氨基酸链的多种目的多肽的混合物。采用酵母生产异源多肽中遇到的另一问题为产量低,推测是由于在细胞内和细胞质膜上,该多肽的内部位点发生异常的蛋白水解加工。酵母中含有许多用于加工酵母蛋白的蛋白酶,例如在二元取代(dibasic)的氨基酸序列的C-末端侧进行剪切的Kex2p和Yps1p,以及能消化经Kex2p内切蛋白水解性消化后剩余的一元取代(basic)氨基酸残基的羧肽酶Kex1p,和在X-Ala或X-Pro剪切的Ste13p或Dap2p。
一些多肽,例如具有约10到约100个氨基酸链、不含或含很少二硫键和/或富含一元取代氨基酸的多肽,例如β-内啡肽,胰高血糖素和胰高血糖素样肽,在转化的宿主细胞中表达时,对细胞内和细胞外蛋白水解性降解十分敏感,这是由于其短链的开放性和非二硫键稳定的结构产生不均一产物,该产物可能在N-末端和C-末端被蛋白水解性和内切蛋白水解性降解。
此外,如果表达产物的N-末端包含内源酶的切割位点,则由宿主细胞产生的酶对表达的多肽的N-末端切割可造成具有正确N-末端的目的产物量下降。例如,酵母中的Ste13p在X-Ala或X-Pro切割,其中X可以是任何氨基酸残基。因此,N-末端第二位残基为Ala或Pro的那些多肽,能在N-末端发生剪切,回收的多肽产物可以是不同降解产物的混合物,使回收过程复杂化并降低了总产量。
此外,不含或含较少三级结构和含少量α-螺旋的小分子多肽容易形成彼此堆积的β-折叠,和在大规模生产的发酵期间和后续的分离和纯化步骤中形成原纤维(fibril)。原纤维的形成可造成不必要的沉淀从而损失了目的产物。通过在高pH进行处理可能防止原纤维的形成。然而,这种碱性处理对产物十分不利,可以导致不需要的D-氨基酸残基的形成。
人GLP-1为一长37个氨基酸残基的肽,来源于由回肠末端,胰腺,和脑部L-细胞合成的前原胰高血糖素。对前原胰高血糖素进行处理而产生GLP-1(7-36)酰胺,GLP-1(7-37),和GLP-2的事件主要发生在L-细胞中。GLP-1和GLP-2的N-末端第二位氨基酸残基均为Ala,因此,当在宿主生物例如酵母中表达时容易在N-末端发生剪切。
在天然产生的肽或其类似物中导入亲脂性酰基基团能产生酰化的多肽,它们相对于天然肽或未修饰的类似物具有延伸的侧基序列(protractedprofile)。专利WO98/08871中和专利WO 98/08872中公开和证实了这种现象,其中第一个专利公开了对GLP-1及其类似物的酰化过程,第二个专利则公开了对GLP-2及其类似物的酰化过程。
当酰化的前体分子中含有Lys切割位点时,则应该避免对Lys切割位点的酰化,因为这样的酰化会妨碍随后的剪切。如下文所述,本发明中的方法将解决该问题。
发明简述
在最广义的方面,本发明涉及一种在转化宿主细胞中生产多肽的方法,包括表达目的多肽的前体分子,所述前体分子包括N-末端的延伸序列,其使表达的前体分子优先酰化,防止了该分子在宿主细胞内或培养基中被蛋白水解降解。此外,前体分子容易纯化且不容易形成原纤维,因而允许在大规模操作中选择后续的分离和纯化步骤时更能变通。
一方面,本发明涉及一种生产多肽的方法,所述多肽包括至少1个在ε-氨基基团被酰化的赖氨酸残基,所述方法包括如下步骤:
(i)在适于表达目的多肽前体分子的条件下,培养包含编码该多肽前体分子的多核苷酸序列的宿主细胞,所述前体分子包含目的多肽和N-末端延伸序列,所述延伸序列能从目的多肽的赖氨酸切割位点被剪切;
(ii)从培养基中分离所表达的前体分子;
(iii)优选酰化目的多肽中至少一个赖氨酸的ε-氨基基团,且不酰化N-末端延伸序列的Lys-切割位点的ε-氨基基团;
(iv)通过酶切从酰化的前体分子上除去N-末端延伸序列;和
(v)采用合适的方式分离酰化多肽。
发明详述
N-末端延伸序列通常最长达15个氨基酸,也可为3-15;3-12;3-10;3-9;3-8;3-7;3-6;或3-5个氨基酸长。N-末端延伸序列中的氨基酸基于多种目的选择:1)防止或最小化N-末端延伸序列的C-末端Lys切割位点的酰化;2)保护表达的前体分子不被内切蛋白水解降解;和3)防止在大规模生产的发酵期间和后续处理步骤如分离和纯化步骤中因形成原纤维而导致沉淀。此外,必须选择N-末端延伸序列的两端的氨基酸残基,从而保证从目的多肽C-末端(在Lys切割位点处)有效切除N-末端延伸序列,和在酵母细胞中,在N-末端剪切从而释放可能的上游序列例如前-序列或前-原序列,这些序列旨在保证表达的多肽从宿主细胞中运转出去和转运至培养基中。最后,N-末端延伸序列可作为标记用于纯化目的。
本发明的一实施方案中涉及一种方法,其中N-末端延伸序列的1个或多个氨基酸残基能与该多肽N-末端的1个或多个氨基酸残基一起形成一金属离子复合物结合位点。
包含金属离子结合位点的N-末端延伸序列可以从白蛋白的N-末端衍生。Cu+2结合位点的例子为牛(Asp-Thr-His-Lys,SEQ ID NO:34)和人(Asp-Ala-His-Lys,SEQ ID NO:35)血清蛋白的N-末端(Peters,T.;All aboutAlbumin,Academic Press,USA(1996)p121-123),这些序列可以用作N-末端延伸序列而与培养基中和酰化步骤(iii)中的重金属离子如Cu++产生协同作用。
包含金属离子结合位点的N-末端延伸序列还可以来自Zn-结合位点,尤其是一些金属内肽酶EC 3.4.24-中的这类位点。
在一实施方案中,N-末端延伸序列包含至少1个组氨酸残基。N-末端延伸序列中的组氨酸残基通常位于距赖氨酸切割位点1-4个残基之处。
包括至少1个组氨酸残基的N-末端延伸序列的例子为:Glu-Glu-Ala-His-Lys(SEQ ID NO:1);Glu-(Glu-Ala)2-His-Lys(SEQ ID NO:2);Glu-(Glu-Ala)3-His-Lys(SEQ ID NO:3);Glu-Glu-Gly-His-Lys(SEQ ID NO:4);Glu-His-Pro-Lys(SEQ ID NO:5);Glu-Glu-Gly-Glu-Pro-Lys(SEQ ID NO:6);Glu-Glu-His-Cys-Lys(SEQ ID NO:7);Glu-Glu-His-His-Lys(SEQ ID NO:8);Glu-His-His-His-Lys(SEQ ID NO:9);Glu-His-Ala-His-Lys(SEQ ID NO:10);Glu-Gly-Ala-His-Lys(SEQ ID NO:11);Glu-His-Gly-His-Gly-Lys(SEQ IDNO:12);Glu-Glu-Ala-His-Glu-Leu-Lys(SEQ ID NO:13);Glu-Glu-Ala-His-Glu-Ile-Lys(SEQ ID NO:14);Glu-Glu-Ala-His-Glu-Val-Lys(SEQ ID NO:15);Glu-Glu-Ala-His-Glu-Met-Lys(SEQ ID NO:16);Glu-Glu-Ala-His-Glu-Phe-Lys(SEQ ID NO:l7);Glu-Glu-Ala-His-Glu-Tyr-Lys(SEQ ID NO:18);Glu-Glu-Ala-His-Glu-Trp-Lys(SEQ ID NO:19);Gln-Asp-Ala-His-Lys(SEQ ID NO:24);Glu-Glu-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:30);Asp-Thr-His-Lys(SEQID NO:34);Glu-His-His-Gly-His-Gly-Lys(SEQ ID NO:36);Asp-Ser-His-Lys(SEQ ID NO:37);Gln-Asp-Thr-His-Lys(SEQ ID NO:38);Glu-Ala-Glu-Ala-Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:39);Glu-Ala-Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:40);Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:41);Trp-His-Trp-Leu-Lys(SEQ ID NO:42);Glu-Glu-Trp-His-Trp-Leu-Lys(SEQ IDNO:43);Glu-Glu-Glu-Ala-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:44);Glu-Ala-Gln-Asp-Ala-His-Lys(SEQ ID NO:47);Glu-Ala-Glu-Ala-Gln-Asp-Ala-His-Lys(SEQ ID NO:48);和Glu-Ala-Glu-Ala-Glu-Ala-Gln-Asp-Ala-His-Lys(SEQID NO:49)。
本发明的另一实施方案中涉及一种方法,其中前体分子的N-末端延伸序列包括至少1个能与该多肽N-末端赖氨酸切割位点形成盐桥(离子键)的氨基酸残基。
在该实施方案中,N-末端延伸序列通常包含至少1个Glu或Asp,位于距赖氨酸切割位点1到5个残基之处。在一这样的实施方案中,N-末端延伸序列包括Glu-Glu-序列。包括Glu残基的N-末端延伸序列的实例为Glu-Glu-Ala-Glu-Lys(SEQ ID NO:45);Glu-Glu-Gly-Glu-Pro-Lys(SEQ ID NO:46)和Glu-Glu-Lys。在该实施方案中,N-末端延伸序列还可形成α-螺旋。
同时具有标记功能和形成盐桥功能的N-末端延伸序列来自已知能与Ca+2结合的牛胰蛋白酶原中的肠激酶位点。因此适用于本发明方法的N-末端延伸序列为Asp-Asp-Asp-Asp-Lys(SEQ ID NO:26)。
能形成α-螺旋的N-末端延伸序列通常包括一含有两极性氨基酸和非极性氨基酸的序列,如Zhu等,Protein Science 2,384-394(1993)所述。这种序列的例子为:Glu-Glu-Ala-Gla-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:29),Glu-Glu-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:30);Leu-Asp-Gly-Arg-Leu-Glu-Ala-Leu-Lys(SEQ ID NO:31);Glu-Glu-Leu-Asp-Gly-Arg-Leu-Glu-Ala-Leu-Lys(SEQ ID NO:32);Glu-Glu-Leu-Asp-Ala-Arg-Leu-Glu-Ala-Leu-Lys(SEQ ID NO:33);Glu-Glu-Trp-His-Trp-Leu-Lys(SEQ ID NO:43);和Glu-Glu-Glu-Ala-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:44)。
在该实施方案中,N-末端延伸序列还可以包括一真核N-糖基化位点N-X-S或N-X-T,其中X可以为除了Pro外的任何氨基酸残基。包含糖基化位点的N-末端延伸序列可以为Glu-Glu-Gly-Asn-Thr-Thr-Pro-Lys(SEQ IDNO:20),Glu-Glu-Gly-Asn-Glu-Thr-Glu-Pro-Lys(SEQ ID NO:21),GlGlu-Gly-Asn-Asp-Thr-Glu-Pro-Lys(SEQ ID NO:22)和Glu-Glu-Gly-Asn-Thr-Thr-Glu-Pro-Lys(SEQ ID NO:23)。
在另一实施方案中,本发明涉及一种方法,其中目的多肽的N-末端对蛋白水解降解敏感,且N-末端延伸序列防止或最小化这种蛋白水解降解。这种多肽的特征可在于其N-末端第二位氨基酸残基为Ala,Ser,Pro或Gly残基。
在另一实施方案中,所述多肽的N-末端氨基酸残基为His或Tyr。
在更具体的实施方案中,N-末端延伸序列具有通式
Xn------X1-Lys
其中Lys为切割位点,Xn------X1为2-14个氨基酸残基的肽序列,其能防止或最小化Lys切割位点中的游离ε-氨基基团在上述步骤(iii)中的酰化。Xn------X1还可保护表达的目的多肽不被内切蛋白水解降解,并防止在发酵期间和后续分离和纯化步骤中N-末端延伸的分子形成原纤维而引起沉淀。还可选择Xn------X1中的氨基酸残基,以便在N-末端延伸序列的C-末端处(Lys)获得最优剪切。此外,通过选择延伸序列的N-末端氨基酸残基,使酵母细胞中在KEX切割位点(Lys,Arg)切割上游信号-前导-序列被优化。理论上说,Xn------X1中的氨基酸残基可以为除了Lys外的任何氨基酸残基,只要该肽序列满足至少一个目的,附带条件为至少一个X为His或Glu或Asp,且该延伸序列的N-末端第二个氨基酸残基优选不为Ala或Pro。
在一实施方案中Xn------X1长为2-12个氨基酸残基。在另一实施方案中Xn------X1长为2-10;2-9;2-8;2-7;2-6;或2-5个氨基酸残基。
在另一实施方案中,Xn------X1包含2-8个氨基酸残基,它们选自His;Glu;Ala;Asp;Gly;和Pro。
在另一实施方案中,Xn------X1包含4-10个氨基酸残基,它们选自Glu;Asp;Ala;His;Trp;Tyr;Ile;Val;Met;和Phe。
在另一实施方案中,Xn------X1包含5-8个氨基酸残基,它们选自Glu;Asp;Gly;Asn;Thr;Ser;和Pro。
在所有实施方案中,Glu和/或Asp优选作为延伸序列的N-末端第一和第二个氨基酸残基,从而保证在此末端的Kex2p切割位点产生正确的切割,使上游前-序列或前-原-序列脱离。此外,一个或更多的位于N-末端延伸序列的N-末端的Glu和/或Asp残基将保护最终的目的多肽的N-末端不在发酵阶段发生体内降解。
Xn------X1-Lys序列的例子为:Glu-Glu-Ala-His-Lys(SEQ ID NO:1);Glu-(Glu-Ala)2-His-Lys(SEQ ID NO:2);Glu-(Glu-Ala)3-His-Lys(SEQ ID NO:3);Glu-Glu-Gly-His-Lys(SEQ ID NO:4);Glu-His-Pro-Lys(SEQ ID NO:5);Glu-Glu-Gly-Glu-Pro-Lys(SEQ ID NO:6);Glu-Glu-His-Cys-Lys(SEQ ID NO:7);Glu-Glu-His-His-Lys(SEQ ID NO:8);Glu-His-His-His-Lys(SEQ ID NO:9);Glu-His-Ala-His-Lys(SEQ ID NO:10);Glu-Gly-Ala-His-Lys(SEQ ID NO:11);Glu-His-Gly-His-Gly-Lys(SEQ ID NO:12);Glu-Glu-Ala-His-Glu-Leu-Lys(SEQ ID NO:13);Glu-Glu-Ala-His-Glu-ile-Lys(SEQ ID NO:14);Glu-Glu-Ala-His-Glu-Val-Lys(SEQ ID NO:15);Glu-Glu-Ala-His-Glu-Met-Lys(SEQ ID NO:16);Glu-Glu-Ala-His-Glu-Phe-Lys(SEQ ID NO:17);Glu-Glu-Ala-His-Glu-Tyr-Lys(SEQ ID NO:18);Glu-Glu-Ala-His-Glu-Trp-Lys(SEQ ID NO:19);Glu-Glu-Gly-Asn-Thr-Thr-Pro-Lys(SEQ ID NO:20);Glu-Glu-Gly-Asn-Glu-Thr-Glu-Pro-Lys(SEQ ID NO:21),Glu-Glu-Gly-Asn-Asp-Thr-Glu-Pro-Lys(SEQID NO:22);Glu-Glu-Gly-Asn-Thr-Thr-Glu-Pro-Lys(SEQ ID NO:23);Gln-Asp-Ala-His-Lys(SEQ ID NO:24);Glu-Glu-Lys;Asp-Asp-Asp-Asp-Lys(SEQ IDNO:26);Glu-Glu-Ala-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:29);Glu-Glu-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:30);Leu-Asp-Gly-Arg-Leu-Glu-Ala-Leu-Lys(SEQ ID NO:31);Glu-Glu-Leu-Asp-Gly-Arg-Leu-Glu-Ala-Leu-Lys(SEQ ID NO:32);Glu-Glu-Leu-Asp-Ala-Arg-Leu-Glu-Ala-Leu-Lys(SEQ ID NO:33);Asp-Thr-His-Lys(SEQ ID NO:34);Asp-Ala-His-Lys(SEQID NO:35);Glu-His-His-Gly-His-Gly-Lys(SEQ ID NO:36);Asp-Ser-His-Lys(SEQ ID NO:37);Gln-Asp-Thr-His-Lys(SEQ ID NO:38);Glu-Ala-Glu-Ala-Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:39);Glu-Ala-Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:40);Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:41);Trp-His-Trp-Leu-Lys(SEQ ID NO:42);Glu-Glu-Trp-His-Trp-Leu-Lys(SEQID NO:43);Glu-Glu-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQID NO:44);Glu-Glu-Ala-Glu-Lys(SEQ ID NO:45);Glu-Glu-Gly-Glu-Pro-Lys(SEQ ID NO:46);Glu-Ala-Gln-Asp-Ala-His-Lys(SEQ ID NO:47);Glu-Ala-Glu-Ala-Gln-Asp-Ala-His-Lys(SEQ ID NO:48);Glu-Ala-Glu-Ala-Glu-Ala-Gln-Asp-Ala-His-Lys(SEQ ID NO:49);
在另一实施方案中,N-末端延伸序列具有Asp-X-His-Lys(SEQ ID NO:50),其中X为Ala,Thr或Ser。序列Asp-X-His-Lys构成了重金属离子白蛋白结合位点。
在另一实施方案中,N-末端延伸序列具有His-Z1-Z2-Lys(SEQ ID NO:51),其中Z1为Glu;Asp;Asn;Gln;Ser;Thr;Gly;Leu;Ile;Val;Met;Phe或Tyr,Z2为Leu;Ile;Val;Met;Phe;Tyr;Trp或Cys。在一实施方案中Z1为Glu或Asp。His-Z1-Z2-Lys序列与目的多肽的N-末端His残基一起构成了类似于一些金属内肽酶中的Zn-结合位点的金属结合位点,例如Glu-Glu-Ala-His-Glu-Leu-Lys(SEQ ID NO:13);Glu-Glu-Ala-His-Glu-Ile-Lys(SEQ ID NO:14);Glu-Glu-Ala-His-Glu-Val-Lys (SEQ ID NO:15);Glu-Glu-Ala-His-Glu-Met-Lys(SEQ ID NO:16);Glu-Glu-Ala-His-Glu-Phe-Lys(SEQ ID NO:17);Glu-Glu-Ala-His-Glu-Tyr-Lys (SEQ ID NO:18);和Glu-Glu-Ala-His-Glu-Trp-Lys(SEQ ID NO:19)。
研究发现,在发酵过程中,N-末端延伸序列稳定的附于本发明的前体分子上,保护该前体分子的N-末端免遭酵母蛋白酶,例如Ste13p或Dap2p,的蛋白水解作用。
通过特异性裂解Lys的蛋白水解酶,可从回收的酰化前体分子上除去N-末端延伸序列。这种蛋白水解酶的实例为胰蛋白酶或水解无色杆菌(Achromobacter lyticus)蛋白酶1。
根据另一方面,本发明涉及目的多肽的多肽前体,该多肽前体具有通式
N-末端延伸序列---Lys-Z3-Z4-*多肽*
其中,Lys为切割位点,N-末端延伸序列具有如上文所述2-14氨基酸残基,Z3为目的多肽的N-末端氨基酸残基,可以为His或Tyr;Z4为目的多肽N-末端的第二个氨基酸残基,可以为Ala,Ser或Gly;*多肽*为目的多肽余下的序列。
在本发明的一具体实施方案中,*多肽*为GLP-1或GLP-2的相关部分。
有证据表明,在天然肽或其类似物中导入亲脂性酰基基团,可以得到相对于天然肽或未修饰的类似物具有延伸的侧基序列的酰化多肽。专利WO98/08871中和专利WO 98/08872中公开和证实了这种现象,其中第一个专利公开了对GLP-1及其类似物的酰化过程,第二个专利则公开了对GLP-2及其类似物的酰化过程。亲脂基团可以按照WO 98/08871所述,借助单肽或二肽间隔臂来导入。可选的,亲脂性基团也可以按照WO 00/55119所述借助α-氨基-α,ω-二羧酸基团来导入。
本发明多肽前体分子包括至少两个带有自由ε-氨基基团的赖氨酸基团,即赖氨酸切割残基,和至少一个位于目的多肽中的赖氨酸残基。如果包括赖氨酸切割位点在内的所有赖氨酸残基都被酰化,则不可能在随后将N-末端延伸序列从目的多肽序列上剪切下来。因此表达带有N-末端延伸序列的目的多肽的目的之一为防止或最小化对赖氨酸切割位点的游离ε-氨基基团的酰化。前体分子可以因此优选在目的赖氨酸残基处被酰化,所述残基在GLP-1中即为第26位的赖氨酸。经过酰化后,酰化的前体分子能通过如上文所述合适的酶切方式进行酶切,并将酰化的目的多肽分离出。
酰化步骤(iii)可以在pH7到12的条件下进行。在具体实施方案中,pH可以为8-11.5或9.0-10.5,已证明pH约9.5-10.5时有效。温度介于负5℃和35℃间,通常介于0℃到20℃或15℃到30℃间。
在本发明一个实施方案中,酰化作用是在存在二价金属离子,例如Cu2+,Fe2+,Ni2+,Co2+,Zn2+,Mg2+,Mn2+和Ca2+的条件下发生的。然而,三价金属离子,例如Co3+同样对本发明的目的有效。
根据更进一步的方面,本发明涉及一种编码所述多肽前体的多核苷酸序列和含有这种多核苷酸序列的载体和转化的宿主细胞。
定义
术语“优选酰化”是指一种酰化过程,其中酰化作用发生在分子的一个或多个优选位点,其程度比同一分子中的其他位点明显的高。因此,发生在优选位置的酰化作用占总酰化作用的至少50%,优选为至少80%,最优选为90-100%。在本发明的方法中,应尽可能避免或最小化对N-末端延伸序列中赖氨酸切割位点的ε-氨基基团的酰化,因为该位点的酰化将妨碍随后将N-末端延伸序列从最终目的产物上切除,从而导致产量下降。
术语“N-末端延伸序列”是指附于目的多肽N-末端氨基酸残基上的,可除去的多肽序列。N-末端延伸序列长度为2-15个氨基酸残基,且包含Lys作为C-末端氨基酸残基,用于从目的多肽上切除。如上文所述,N-末端延伸序列用于保护表达的融合多肽免遭宿主细胞内的蛋白水解降解。此外,据信N-末端延伸序列中的赖氨酸切割位点ε-氨基基团的酰化,可以通过在酰化过程中封闭该Lys残基而得以防止或最小化。
术语“目的多肽”是指从前体分子上切除N-末端延伸序列后获得的最终多肽。该术语即包括了酰化的所述多肽,又包括了未酰化的所述多肽。术语“N-末端延伸序列”包括组成从目的多肽的N-末端切割N-末端延伸序列所需的切割位点的赖氨酸残基。应当这样理解,不论Lys-基团是作为N-末端延伸序列的C-末端氨基酸,还是作为N-末端延伸序列的组成部分,所述Lys-残基直接连接到目的多肽的N-末端氨基酸残基上,并构成切割位点。在Lys-残基处发生的切割(步骤iv)优选通过特异性裂解Lys的蛋白水解酶来实现。这种蛋白水解酶的例子为胰蛋白酶或水解无色杆菌蛋白酶(ALP)。
目的多肽的一个例子为GLP-1,氨基酸序列由Schmidt等(Diabetologia 28704-707(1985)所公开(give i.a.)。虽然GLP-1(7-37)及其类似物由于其令人感兴趣的药学特性而在近年来吸引了很多关注,但是目前对这些分子的结构知之甚少。Thorton等描述了GLP-1在微团(micelles)中的二级结构(Biochemistry33 3532-3539(1994)),但是在普通溶液中GLP-1被认为是非常柔韧(flexible)的分子。
一种简单的命名方式用于描述该肽的片段和类似物。因此,举例来说,Gly8GLP-1(7-37)是指通过缺失GLP-1(1-37)片段1-6位的氨基酸残基,并用Gly取代第8位的天然氨基酸残基Ala而获得的GLp-1片段。类似的,Lys26(Nε-十四酰)-GLP-1(7-37)是指GLP-1(7-37)位于26位的Lys残基的ε-氨基基团被十四酰基化后的序列。
目的多肽的其他例子为GLP-2和胰高血糖素,二者都为GRF(生长激素释放因子)家族中N-末端具有His或Tyr,且相邻位置具有Ser,Ala或Gly的多肽,vide Adelhorst K.等,The Journal of Biological Chemistry(1994)p6275-6278)。
“POT”为粟酒裂殖酵母(Schizosaccharomyces pombe)丙糖磷酸异构酶基因,而“TPI1”为酿酒酵母丙糖磷酸异构酶基因。
“纤维化”是指所谓的“原纤维(fibril)”的形成过程。“原纤维”是一种被广泛认识和描述的现象,它由反向平行的β-折叠构成。如果不采用非常苛刻的化学条件处理,例如采用pH约12的碱处理,则象GLP这样的具有较少α-螺旋结构,和非常柔韧以及较少三级结构的分子很容易容易聚集,从而产生沉淀并降低产率。
“前导序列”是指由前-肽(信号肽)和原肽组成的氨基酸序列。
术语“信号肽”是指作为前体蛋白N-末端的前-肽。信号肽的功能是帮助异源蛋白转运至内质网。在转运过程中信号肽通常被剪切掉。信号肽允许异源蛋白较容易地转位到内质网中。信号肽通常在该过程中被切除。所述信号肽可以是酵母产生的蛋白的同源或异源蛋白。许多信号肽可以与发明的DNA构建物一起使用,其中包括:YPS1信号肽(正式名称为YAP3信号肽)或其任何功能类似物(Egel-Mitani等(1990)YEAST 6:127-137;US 5,726,038),和MFα1基因的α-因子信号(Thomer(1981) The Molecular Biology of the Yeast Saccharomvces cerevisiae,Strathern等编,pp143-180,Cold Spring HarborLaboratory,N Y;US 4,870,00)。
术语“原肽”是指一种多肽序列,其能使表达的多肽从内质网转运至高尔基体进而转运到分泌泡,以便分泌至培养基中(即,使所述多肽跨过细胞壁或至少穿过细胞膜到达酵母细胞的周质空间中)。原肽可以是酵母α-因子原肽,参见US 4,546,082和4,870,008。此外,原肽可以是合成的原肽,即自然界不存在的原肽。合适的合成原肽在US 5,395,922,5,795,746,5,162,498和WO 98/32867中公开。该原肽优选在其C-末端含有内肽酶加工位点,例如Lys-Arg序列或其任何功能类似物。
本发明中的多核苷酸序列可以采用已建立的标准方法合成,例如Beaucage等(1981)Tetrahedron Letters 22:1859-1869中所述膦酰胺(phosphoramidite)法,或Matthes等(1984)EMBO Journal 3:801-805中所述方法。根据膦酰胺法,采用例如自动DNA合成仪合成寡核苷酸,纯化,双链华,并连接形成合成的DNA构建物。目前制备DNA构建物的优选方法为聚合酶链式反应(PCR)。
本发明的多核苷酸序列还可以为基因组来源,cDNA来源,和合成来源的混合物。举例来说,编码前导肽的基因组序列或cDNA序列可以与编码本发明前体分子的基因组序列或cDNA序列连接;接着,可以通过插入合成寡核苷酸而对该DNA序列进行修饰,该寡核苷酸编码用于同源重组的目的氨基酸序列,可以采用已知的方法或优选采用合适的寡核苷酸通过PCR方法合成目的序列。
本发明还包括能在所选的微生物或宿主细胞内复制,且携带有编码本发明前体分子的多核苷酸序列的载体。重组载体可以为自主复制载体,即以染色体外实体形式存在的载体,其复制独立于染色体复制,例如,质粒,染色体外元件,微型染色体,或人工染色体。所述载体可以含有任何保证自我复制的元件。可选的,载体可以为这样的一种载体,当导入宿主细胞时,整合至基因组并与其所整合的染色体一起复制。此外,单个载体或质粒或者两个或更多的载体或质粒(总体上含有待导入宿主细胞基因组的总DNA),或转座子都可采用。载体可以是线性或闭合环状质粒形式,优选含有允许载体稳定插入宿主细胞基因组的元件或允许载体独立于细胞基因组自主复制的元件。
在优选实施方案中,重组表达载体能在酵母中复制。能使载体在酵母中复制的序列的例子为酵母质粒2um复制基因REP 1-3及复制起点。
本发明的载体优选包含一个或多个选择性标记,其可以允许容易地筛选转化的细胞。一种选择性标记是这样的基因:其产物提供了对杀生物剂或病毒的抗性、对重金属的抗性、使原养型向营养缺陷型转变,等。细菌选择性标记的例子为枯草芽孢杆菌(Bacillus subtilis)或地衣芽孢杆菌(Bacilluslicheniformis)的dal基因,或赋予抗生素抗性的标记,例如,氨苄青霉素,卡那霉素,氯霉素或四环素抗性。丝状真菌宿主细胞中采用的选择标记包括amdS(乙酰胺酶),argB(鸟氨酸氨甲酰转移酶),pyrG(乳清酸核苷-5’-磷酸脱羧酶)和trpC(邻氨基苯甲酸合成酶)。酵母宿主细胞合适的标记为ADE2,HIS3,LEU2,LYS2,MET3,TRP1,和URA3。优选酵母选择标记为粟酒裂殖酵母TPI基因(Russell(1985)Gene 40:125-130)。
在载体中,多核苷酸序列与合适的启动子序列可操纵相连。启动子序列可以为任何在所选宿主细胞中显示转录活性的序列,包括突变的,截短的,和杂合的启动子,也可来自编码同源或异源于宿主细胞的细胞外或细胞内多肽的基因。
指导细菌宿主细胞中转录的合适启动子的例子有来自如下的启动子:大肠杆菌lac操纵子,蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA),枯草芽孢杆菌果聚糖蔗糖酶基因(sacB),地衣芽孢杆菌α-淀粉酶基因(amyL),嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)产麦芽糖淀粉酶基因(amyM),解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ),和地衣芽孢杆菌青霉素酶基因(penP)。指导丝状真菌宿主细胞中转录的适当启动子的实例,是从编码米曲霉TAKA淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α淀粉酶、黑曲霉酸稳定性α淀粉酶的基因中得到的启动子。在酵母宿主中,有用的启动子为酿酒酵母MFα1,TPI,ADHm Gal或PGK启动子。
本发明的多核苷酸构建物通常还与合适的终止子可操纵相连。酵母中,合适的终止子为TPI终止子(Alber等(1982)J.Mol.Appl.Genet.1:419-434),或CYC1终止子。
用于将本发明多核苷酸序列与启动子和终止子分别连接,并将其插入带有在所选宿主细胞中复制所必需信息的合适载体的方法为本领域技术人员熟知。应理解,可以采用首先制备含有编码本发明前体分子的整个DNA序列的DNA构建体,然后将该片段插入合适的表达载体的方法来构建载体,也可以采用按顺序插入含有单个元件遗传信息的DNA片段然后再连接的方法来构建载体。
本发明还涉及重组宿主细胞,其包括编码本发明前体分子的多核苷酸序列。将含有这种多核苷酸序列的载体导入宿主细胞,使该载体以染色体整合体的形式,或以自我复制的染色体外载体的形式存在,如前所述。术语“宿主细胞”包含由于复制期间的突变而不同于亲本细胞的任何子代细胞。宿主细胞可以是原核或真核细胞。有用的原核细胞为细菌细胞,例如格兰氏阳性细菌,包括芽孢杆菌属(Bacillus)和链霉菌属(Streptomyces)细胞,或格兰氏阴性细菌,例如大肠杆菌和假单胞菌细胞。真核细胞可以是哺乳动物,昆虫,植物,或真菌的细胞。在一个实施方案中,宿主细胞是酵母细胞。用于本发明方法的酵母可以是任何合适的酵母,它们在培养中产生大量的上述前体分子。合适的酵母选自如下酵母菌株:酿酒酵母,克鲁维糖酵母(Saccharomyceskluyve),粟酒裂殖酵母,葡萄汁糖酵母(Sacchoromyce suvarum),乳克鲁维酵母(Kluyveromyces lactis),多形汉逊酵母(Hansenula polymorpha),巴斯德毕赤酵母(Pichia pastors),甲醇毕赤酵母(Pichia methanolica),克鲁维毕赤酵母(Pichia kluyveri),Yarrowia lipolytica,假丝酵母(Candida sp.),产朊假丝酵母(Candida utilis),可可假丝酵母(Candida cacaoi),地霉(Geotrichum sp.),和发酵地霉(Geotrichum fermentans)。
酵母细胞的转化可以,例如通过原生质形成,然后按照本身已知的方式进行转化来实现。培养细胞所采用的培养基可以是任何合适酵母生长的传统培养基。然后,本发明的分泌的前体分子可以采用传统的方法从培养基中回收,所述方法包括通过离心从培养基中分离酵母细胞,通过离子交换基质或反相吸收基质过滤或捕捉前体分子,从上清中沉淀蛋白质组分或利用盐(如硫酸铵)过滤,随后通过各种层析方法,例如,离子交换层析法,亲和层析法,等等来纯化。
本文中,“类似物”用于指亲本肽的一个或多个氨基酸残基被其他的氨基酸残基所取代,和/或亲本肽的一个或多个氨基酸残基缺失,和/或一个或多个氨基酸残基加入亲本肽,所获得的肽。这种加入可以发生在亲本肽的N-末端和/或C-末端。
本文中的术语“衍生物”是指亲本肽的一个或多个氨基酸残基被化学修饰后产生的肽段,例如,通过烷基化,酰化,酯形成或酰胺形成。
氨基酸残基即可以采用单个字母表示也可采用三个字母来表示。
附图简介
图1显示了pKV304质粒,包含了在TPI启动子和终止子调控下的编码Arg34GLP-1(7~37)的DNA序列和MFα prepro序列。该质粒为制备表达本发明的前体分子的质粒的出发质粒。
实施例
实施例1
表达N-末端延伸型Arg34GLP-1(7~37)
宿主菌ME1719为二倍体菌株,其具有缺乏两种天冬氨酰蛋白酶(YPS1和PEP4)活性的表型,YPS1(以前称为YAP3)切割一元取代或二元取代氨基酸残基的C-末端(Egel-Mitani等,YEAST 6:127-137,1990),PEP4是空泡蛋白酶A,它激活其他蛋白酶,例如:蛋白酶B,羧肽酶Y,氨肽酶1,RNA酶,碱性磷酸酶,acid threhalase和外聚磷酸酶。此外,丙糖磷酸异构酶基因(TPI)遭破坏,这种表型使生长在含葡萄糖的培养基中的转化子有可能利用葡萄糖。ME1719的遗传背景为MAT a/αΔyps1∷ura3/Δyps1∷URA3 pep4-3/pep4-3Δtpi∷LEU2/Δtpi∷LEU2 leu2/leu2 Δura3/Δura3。
含有N-末端延伸型Arg34GLP-1(7~37)的表达质粒如下制备:质粒pKV304含有编码Arg34GLP-1(7~37)的DNA,其不含N-末端延伸序列,采用EagI+NcoI或EagI+Asp718来消化该质粒,经琼脂糖电泳和GeneCleanTMIII纯化,分别分离得到1.4kb和10kb的片段。相应于Arg34GLP-1(7~37)的各种N-末端延伸序列、并含有NcoI和Asp718切割位点的寡核苷酸衔接子用上述方法纯化。连接1.4kb片段(EagI+NcoI),10kb片段(EagI+Asp718)和针对N-末端延伸型Arg34GLP-1(7~37)所设计的衔接子片段(NcoI+Asp718),然后转化至大肠杆菌菌株MT172中,对质粒DNA进行测序,验证正确的N-末端延伸型Arg34GLP-1(7~37)
然后将质粒DNA转化到酵母菌株ME1719中,在MUPD选择性培养板上经两轮分离得到酵母转化子。30℃,5ml MUPD培养基中培养酵母细胞3天,采用HPLC和MALDI-MS(基质协同激光解析/离子化质谱,MatrixAssisted Laser Desorption/Inonisation Mass Spectrometry)对培养上清液进行分析。MUPD培养基组成如下:25g酵母提取物(Bacto),5g KH2PO4,1.5gMgSO4·7H2O,用经过离子交换的水补足1升,采用5N H2SO4调pH至6.0,然后在121℃高压灭菌20分钟。对浓度为50%w/v的30g葡萄糖单独高压灭菌,然后在无菌条件下加入。
表1显示不同GLP-1前体及其与无N-末端延伸的对照组相比的产量
                                  表1
        延伸序列          多肽 与对照相比的产量%
无(对照组)     Arg34GLP-1(7~37)        100
EEK     Arg34GLP-1(7~37)        206
EEAEK(SEQ ID NO:45)     Arg34GLP-1(7~37)        217
HK     Arg34GLP-1(7~37)        63
E(EA)HK(SEQ ID NO:1)     Arg34GLP-1(7~37)        233
E(EA)2HK(SEQ ID NO:2)     Arg34GLP-1(7~37)        208
E(EA)3HK(SEQ ID NO:3)     Arg34GLP-1(7~37)        223
EEGHK(SEQ ID NO:4)     Arg34GLP-1(7~37)        171
EHPK(SEQ ID NO:5)     Arg34GLP-1(7~37)        132
EEGEPK(SEQ ID NO:6)     Arg34GLP-1(7~37)        211
EEHCK(SEQ ID NO:7)     Arg34GLP-1(7~37)        58
EEHHK(SEQ ID NO:8)     Arg34GLP-1(7~37)        125
EHHHK(SEQ ID NO:9)     Arg34GLP-1(7~37)        72
EHAHK(SEQ ID NO:10)     Arg34GIP-1(7~37)        76
EGAHK(SEQ ID NO:11)     Arg34GLP-1(7~37)        97
EHGHGK(SEQ ID NO:12)     Arg34GLP-1(7~37)        73
EEAHELK(SEQ ID NO:13)     Arg34GLP-1(7~37)        220
EEAHEIK(SEQ ID NO:14)     Arg34GLP-1(7~37)        128
EEAHEVK(SEQ ID NO:15)     Arg34GLP-1(7~37)        217
EEAHEMK(SEQ ID NO:16)     Arg34GLP-1(7~37)        232
EEAHEFK(SEQ ID NO:17)     Arg34GLP-1(7~37)        226
EEAHEYK(SEQ ID NO:18)     Arg34GLP-1(7~37)        200
EEAHEWK(SEQ ID NO:19)     Arg34GLP-1(7~37)        200
EEGNTTPK(SEQ ID NO:20)     Arg34GLP-1(7~37)        216
EEGNETEPK(SEQ ID NO:21)     Arg34GLP-1(7~37)        145
EEGNDTEPK(SEQ ID NO:22)     Arg34GLP-1(7~37)        175
EEGNTTEPK(SEQ ID NO:23)     Arg34GLP-1(7~37)        31*
QDAHK(SEQ ID NO:24)     Arg34GLP-1(7~37)        55
QDTAK(SEQ ID NO:25)   Arg34GLP-1(7~37)     66
DDDDK(SEQ ID NO:26)   Arg34GLP-1(7~37)     190
EAEAWHWLK(SEQ ID NO:27)   Arg34GLP-1(7~37)     36
EAEAEAWHWLK(SEQ ID NO:28)   Arg34GLP-1(7~37)     34
EEAEAWHWLK(SEQ ID NO:29)   Arg34GLP-1(7~37)     20
EEEAWHWLK(SEQ ID NO:30)   Arg34GLP-1(7~37)     n.d.
LDGRLEALK(SEQ ID NO:31)   Arg34GLP-1(7~37)     58
EELDGRLEALK(SEQ ID NO:32)   Arg34GLP-1(7~37)     211
EELDARLEALK(SEQ ID NO:33)   Arg34GLP-1(7~37)     239
*产物主要被超糖基化
实施例2
EEAHK(SEQ ID NO:1)-Arg34GLP-1(7~37)在有或无二价或三价金属离子时的酰化
根据实施例1描述的方法生产GLP-1类似物。采用离心的方法澄清发酵液,将2620ml上清液稀释至7900ml,将pH调节到3.1。最终传导率为4.9mS/cm。2.6×100cm的柱装填100ml Pharmacia Streamline SP Code no.17-0993-05,根据供应商所推荐的方法,用0.025M柠檬酸盐缓冲液,pH 3.1平衡和流化(Pharmacia目录18-1124-26,膨胀胶吸附,原理和方法),随后采用0.5M Tris碱以0.5ml/min的流速洗脱。含有GLP1类似物的级分用0.010M Tris,0.015MNa2SO4,pH 7.4中的CH3CN梯度(H2SO4稀释)经分析型RP-HPLC来鉴定。汇总的样品体积为100ml,其中含有361mg的GLP-1类似物,纯度为72.4%。采用制备型RP-HPLC对样品进一步纯化。缓冲液体系的组成是:缓冲液-A:0.010M Tris,0.015M Na2SO4,和20%乙醇v/v,pH7.5,用H2SO4稀释;缓冲液-B:70%乙醇。将对应于90mg GLP1类似物的等份试样加样于HPLC柱(250×20)mm,该柱装填了Nucleosil 300,7μm,C4(来自Macherey-Nagel,D)并且已用10%B平衡,样品用总量720ml中从10%B至90%B的线性梯度,以6ml/分钟的流速进行洗脱。洗脱物通过214nm和276nm监测。汇总含有GLP1类似物的样品,用1倍体积的水稀释,调整至pH 5.0,冷到4℃。通过离心和冻干分离出沉淀。收获286mg,最终纯度为98.0%。
取出10mg纯化后的类似物对GLP-1类似物进行酰化。将样品溶于0.5ml0.05M Na2CO3中,并在15℃保温。将Glu(ONSU)N-十六酰甲基酯溶于0.5mlCH3CN中并加入上述类似物溶液中。取样,加入反应试剂,反应15到30分钟,最后采用淬火缓冲液终止反应。向样品中加入淬火缓冲液,用20%v/v乙醇稀释,通过分析型RP-HPLC进行分析。在有二价金属离子时进行酰化反应:先加入适量的0.1M的金属离子溶液,再加入氨基酸酰化试剂。相应的调整Na2CO3缓冲液的体积。在实验中使用乙酸锌,以Zn2+作为金属离子。
在有Zn2+时优化EEAHK(SEQ ID NO:1)-Arg34GLP-1(7~37)-Lys26γ-GIu-十六酰的酰化
添加2个以上当量(equivalent)的Zn2+伴有样品沉淀。但将2当量Zn2+与过量酰化试剂一起用于酰化时,产量提高。因此,获得52%的产量和7%的脱酰胺酰化产物,分别优于无Zn2+时42.4%的产量和5.1%的脱酰胺产物。
结果示于如下的表2和表3。
                            表2
在pH10.2,50%CH3CN中,用1.3当量的Glu(ONSU)N-十六酰甲基酯使
                    EEAHK(SEQ ID NO:1)-Arg34GLP-1(7~37)酰化
反应GLP-1   0分钟         15分钟GLP-1  产物         30分钟GLP-1    产物         30分钟停止GLP-1  产物
0.0当量Zn2+   98.%   36.2%   41.4%   35.5%   42.4%*   36.1%   45.2%
0.5当量Zn2+   98.3%   30.2%   42.9%   32.6%   41.7%
1.0当量Zn2+   99.5%   33.8%   38.6%   34.8%   34.6%
1.5当量Zn2+   99.3%   30.7%   36.3%   29.2%   35.5%   31.7%   34.2%
2.0当量Zn2+   99.2%   28.1%   44.3%   22.9%   46.8%   30.0%   42.8%
2.5当量Zn2+   99.3%   25.0%   39.8%   21.3%   46.6%   22.5%   45.0%
*%在该合成过程中产生了5.1%的脱酰胺产物
                            表3
在pH10.2,50%CH3CN中,用2当量和3当量的Glu(ONSU)N-十六酰甲基
  酯以及2当量的Zn2+使EEAHK(SEQ ID NO:1)-Arg34GLP-1(7~37)酰化
反应酰化试剂   0分钟         15分钟GLP-1  产物         30分钟GLP-1    产物       30分钟停止GLP-1  产物
2当量酰化试剂   98.5%   16.9%   37.8%   11.6%   39.0%   12.9%   38.4%
3当量酰化试剂   98.3%   6.0%   35.7%   3.8%   33.2%
2当量Zn2+2当量酰化试剂   98.1%   27.8%   52.0%   16.4%   52.0%*   19.9%   46.1%
2当量Zn2+3当量酰化试剂   98.6%   13.2%   36.6%   15.8%   38.4%   13.2%   41.6%
*%  在该合成过程中产生了7.0%的脱酰胺产物
在有Zn2+时合成Arg34GLP-1(7~37)-Lys26γ-GIu-十六酰基
在有2当量Zn2+时,添加2当量酰化试剂,使EEAHK(SEQ IDNO:1)-Arg34GLP-1(7~37)酰化15分钟。如上文所述。取总体积15μm的样品加样于采用TFA/CH3CN/H2O缓冲体系的分析型RP-HPLC柱上。对应于57μg的纯化产物代表了46%的合成总量。将产物干燥,随后在0℃溶于0.025ml0.1m NaOH中,保温20分钟。经甲基酯水解后,向样品中加入15μl 0.1m HCl和5μl 0.1mTris.HCl,用pH试纸测得pH约为8-9。然后向样品中加入10μlCH3CN,和1μl 1mg/ml水解无色杆菌蛋白酶I(EC 3.4.21.50),室温培养30分钟。取总量为10μl的样品加样于上述RP-HPLC系统中,对相当于66.2%的3个最明显峰进行鉴定,发现其与目的产物相同。结果示于下表4中。
                                   表4
 峰 MW理论值 MW实测值            身份(identity)    产量
 峰1     -  无信号 GLP-1类似物    8.5%
 峰2  3749.29  3748.41 Arg34GLP-1(7~37)-Lys26γ-GIu-十六酰基    66.2%
 峰3  3749.29  3761.8 GLP-1的未知衍生物    19.6%
实施例3
对EEAEK(SEQ ID NO:45)-Arg34GLP-1(7~37)的酰化和ALP-处理
GLP-1前体EEAEK(SEQ ID NO:43)-Arg34GLP-1(7~37)分子用上述方法在酵母中表达,将发酵上清的离子强度调至7,通过与SP Sepharose Fast FlowXL(Amersham Pharmacia)阳离子柱结合来回收产物。前体分子用0-100%梯度的50mM甲酸+1M NaCl-50mM甲酸溶液洗脱。10个柱体积后,用2个柱体积的50mM甲酸洗脱,之后用3.5个柱体积的0.5M甘氨酸,pH 9洗脱。采用MALDI-MS分析各级分,然后鉴定前体分子汇集物。将这些汇集物加样于反相HPLC a ZORBAX 300SB-CN柱(9.4×250mm)中。用缓冲液B(0.1%TFA/80%乙醇)在缓冲液A(0.1%TFA)中的30-70%梯度进行洗脱。采用UV-模式和MALDI-MS鉴定各级分。收集汇总,将乙醇经真空蒸发,将产物冻干。
将5mg冻干的前体EEAEK(SEQ ID NO:45)-Arg34GLP-1(7~37)在室温溶于350μl水和700μl NMP(N-甲基-吡咯烷酮-2)中,在0时加入4当量的N-十六酰-/-谷氨酸-α-叔丁基酯-γ-琥珀酰亚氨酯。用EDIPA(乙基二异丙胺)将pH调节为9.5,并通过加入EDIPA使pH保持在9.5。反应60分钟后,通过加入208μl 1%对羟苯苷氨酸(glycin)水溶液使反应停止。对反应混合物的分析表明,24%为未反应产物。61%为在Lys26位点单酰化的产物,8%为在Lys26位点和N-末端氨基基团处发生二酰化的产物,7%为在Lys6位点和Lys26位点发生二酰化的产物。用ALP按照已知技术处理赖氨酸切割位点,将单酰化和二酰化分子转化为单酰化Arg34GLP-1(7~37)(69%)。结果通过HPLC和MALDI-MS验证。
实施例4
EELDARLEALK(SEQ ID NO:33)-Arg34GLP-1(1~37),EEAHEYK(SEQID NO:18)-Arg34GLP-1(1~37)和DDDDK(SEQID NO:26)-Arg34GLP-1(1~37)的酰化和切割
GLP-1前体EELDARLEALK(SEQ ID NO:33)-Arg34GLP-1(1~37),EEAHEYK(SEQ ID NO:18)-Arg34GLP-1(1~37)和DDDDK(SEQ ID NO:26)-Arg34GLP-1(1~37)按照实施例3所述在酵母细胞中表达并进行纯化。
采用实施例3所述方法进行酰化。加入1.3当量的十六酰-/-谷氨酸-α-叔丁基酯-γ-琥珀酰亚氨酯。HPLC和MALDI-MS分析表明,在所有例子中,通过直接在酰化混合物中用ALP水解,得到约15-30%的未反应物质和约20%的二酰化产物(Lys6,Lys26)。结果示于表5中。
                         表5
仅单酰化的N-末端延伸型Lys26-GLP1和二酰化的N-末端延伸型
                    Lys6,Lys26-GLP1的峰
           延伸    %单酰化Lys26    %二酰化Lys6,Lys26**
DDDDK(SEQ IDNO:26)         80             20
EELDARLEALK(SEQ ID NO:33)         76             24
EEAHEYK(SEQ ID NO:18)         76             24
**N-末端延伸型(未切割)
序列表
序列表
<110>  诺沃挪第克公司(Novo Nordisk A/S)
       米奇.埃格尔-米塔尼(Egel-Mitani,Michi)
       珀.鲍尔施密特(Balscmidt,Per)
       简.马库森(Markussen,Jan)
       伊凡.德尔斯(Diers,Ivan)
       托马斯.B.谢尔德森(Borglum Kjeldsen,Thomas)
       伊布.乔纳森(Jonassen,Ib)
<120>  生产酰化多肽的方法
<130>  6289.204-WO
<160>  51
<170>  PatentIn version 3.1
<210>  1
<211>  5
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  1
Glu Glu Ala His Lys
1               5
<210>  2
<211>  7
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  2
Glu Glu Ala Glu Ala His Lys
1               5
<210>  3
<211>  9
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  3
Glu Glu Ala Glu Ala Glu Ala His Lys
1               5
<210>  4
<211>  5
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  4
Glu Glu Gly His Lys
1               5
<210>  5
<211>  4
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  5
Glu His Pro Lys
1
<210>  6
<211>  6
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  6
Glu Glu Gly Glu Pro Lys
1               5
<210>  7
<211>  5
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  7
Glu Glu His Cys Lys
1               5
<210>  8
<211>  5
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  8
Glu Glu His His Lys
1               5
<210>  9
<211>  5
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  9
Glu His His His Lys
1               5
<210>  10
<211>  5
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  10
Glu His Ala His Lys
1               5
<210>  11
<211>  5
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  11
Glu Gly Ala His Lys
1               5
<210>  12
<211>  6
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  12
Glu His Gly His Gly Lys
1               5
<210>  13
<211>  7
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  13
Glu Glu Ala His Glu Leu Lys
1               5
<210>  14
<211>  7
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  14
Glu Glu Ala His Glu Ile Lys
1               5
<210>  15
<211>  7
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  15
Glu Glu Ala His Glu Val Lys
1               5
<210>  16
<211>  7
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  16
Glu Glu Ala His Glu Met Lys
1               5
<210>  17
<211>  7
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  17
Glu Glu Ala His Glu Phe Lys
1               5
<210>  18
<211>  7
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  18
Glu Glu Ala His Glu Tyr Lys
1               5
<210>  19
<211>  7
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  19
Glu Glu Ala His Glu Trp Lys
1               5
<210>  20
<211>  8
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  20
Glu Glu Gly Asn Thr Thr Pro Lys
1               5
<210>  21
<211>  9
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  21
Glu Glu Gly Asn Glu Thr Glu Pro Lys
1               5
<210>  22
<211>  9
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  22
Glu Glu Gly Asn Asp Thr Glu Pro Lys
1               5
<210>  23
<211>  9
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  23
Glu Glu Gly Asn Thr Thr Glu Pro Lys
1               5
<210>  24
<211>  5
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  24
Gln Asp Ala His Lys
1               5
<210>  25
<211>  5
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  25
Gln Asp Thr Ala Lys
1               5
<210>  26
<211>  5
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  26
Asp Asp Asp Asp Lys
1               5
<210>  27
<211>  9
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  27
Glu Ala Glu Ala Trp His Trp Leu Lys
1               5
<210>  28
<211>  11
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  28
Glu Ala Glu Ala Glu Ala Trp His Trp Leu Lys
1               5                   10
<210>  29
<211>  10
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  29
Glu Glu Ala Glu Ala Trp His Trp Leu Lys
1               5                   10
<210>  30
<211>  9
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  30
Glu Glu Glu Ala Trp His Trp Leu Lys
1               5
<210>  31
<211>  9
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  31
Leu Asp Gly Arg Leu Glu Ala Leu Lys
1               5
<210>  32
<211>  11
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  32
Glu Glu Leu Asp Gly Arg Leu Glu Ala Leu Lys
1               5                   10
<210>  33
<211>  11
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  33
Glu Glu Leu Asp Ala Arg Leu Glu Ala Leu Lys
1               5                   10
<210>  34
<211>  4
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  34
Asp Thr His Lys
1
<210>  35
<211>  4
<212>  PRT
<213>  人工序列
<220>
<223>  人工肽
<400>  35
Asp Ala His Lys
1
<210>  36
<211>  7
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  36
Glu His His Gly His Gly Lys
1               5
<210>  37
<211>  4
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  37
Asp Ser His Lys
1
<210>  38
<211>  5
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  38
Gln Asp Thr His Lys
1               5
<210>  39
<211>  11
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  39
Glu Ala Glu Ala Glu Ala Gln Asp Thr His Lys
1               5                   10
<210>  40
<211>  9
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  40
Glu Ala Glu Ala Gln Asp Thr His Lys
1               5
<210>  41
<211>  7
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  41
Glu Ala Gln Asp Thr His Lys
1               5
<210>  42
<211>  5
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  42
Trp His Trp Leu Lys
1               5
<210>  43
<211>  7
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  43
Glu Glu Trp His Trp Leu Lys
1               5
<210>  44
<211>  11
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  44
Glu Glu Glu Ala Glu Ala Trp His Trp Leu Lys
1               5                   10
<210>  45
<211>  5
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  45
Glu Glu Ala Glu Lys
1               5
<210>  46
<211>  6
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  46
Glu Glu Gly Glu Pro Lys
1               5
<210>  47
<211>  7
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  47
Glu Ala Gln Asp Ala His Lys
1               5
<210>  48
<211>  9
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  48
Glu Ala Glu Ala Gln Asp Ala His Lys
1               5
<210>  49
<211>  11
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<400>  49
Glu Ala Glu Ala Glu Ala Gln Asp Ala His Lys
1               5                   10
<210>  50
<211>  4
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<220>
<221>  misc_feature
<222>  (1)..(4)
<223>  Xaa可以是Ala,Thr或Ser
<400>  50
Asp Xaa His Lys
1
<210>  51
<211>  4
<212>  PRT
<213>  人工序列
<220>
<223>  合成肽序列
<220>
<221>  misc_feature
<222>  (1)..(2)
<223>  Xaa可以是Glu,Asp,Asn,Gln,Thr,Gly,Leu,Ile,Val,Met,Phe
       或Tyr
<220>
<221>  misc_feature
<222>  (2)..(3)
<223>  Xaa可以是Leu,Ile,Val,Met,Phe,Tyr,Trp或Cys
<400>  51
His Xaa Xaa Lys
1

Claims (63)

1.产生多肽的方法,所述多肽有至少一个赖氨酸残基的ε-氨基基团被酰化,所述方法包括如下步骤:
(i)在适合表达所述多肽的前体分子的条件下,培养包含编码所述前体分子的多核苷酸序列的宿主细胞,所述前体分子包括目的多肽和N-末端延伸序列,所述N-末端延伸序列能从目的多肽的赖氨酸切割位点被切割;
(ii)从培养基中分离所表达的前体分子;
(iii)优选酰化目的多肽中至少一个赖氨酸残基的ε-氨基基团,且不酰化N-末端延伸序列中赖氨酸切割位点的ε-氨基基团;
(iv)采用酶切方法从酰化的前体分子上除去N-末端延伸序列;和
(v)采用合适的方法分离酰化的多肽。
2.权利要求1的方法,所述N-末端延伸序列长度为最多15个氨基酸。
3.权利要求1的方法,所述N-末端延伸序列长度为3-15;3-12;310;3-9;3-8;3-7;3-6或3-5个氨基酸。
4.权利要求1的方法,所述多肽为单乙酰取代的。
5.权利要求1的方法,所述N-末端延伸序列中的一个或多个氨基酸残基能与所述多肽N-末端的一个或多个氨基酸残基一起构成金属离子复合物结合位点。
6.权利要求5的方法,所述N-末端延伸序列包括来自猪或人血清白蛋白的N-末端的金属离子结合位点。
7.权利要求5的方法,所述N-末端延伸序列包括来自金属内肽酶Zn结合位点的金属离子结合位点。
8.权利要求1的方法,所述前体分子的N-末端延伸序列包括至少一个带负电荷的氨基酸残基,它能与所述多肽N-末端的赖氨酸切割位点形成盐桥。
9.权利要求8的方法,所述N-末端延伸序列能形成α-螺旋。
10.权利要求1的方法,其中N-末端延伸序列包含来自胰蛋白酶原的Ca+2结合肠激酶位点。
11.权利要求8的方法,其中N-末端延伸序列包括真核N-糖基化位点。
12.权利要求1-11的方法,所述目的多肽对在其N-末端进行的蛋白水解降解敏感,所述N-末端延伸序列能防止或最小化这种蛋白水解降解。
13.权利要求1的方法,所述目的多肽N-末端的第二个氨基酸残基为Ala或Pro。
14.权利要求13的方法,所述目的多肽N-末端氨基酸残基为His。
15.权利要求1的方法,所述N-末端延伸序列含有至少一个组氨酸残基。
16.权利要求15的方法,所述存在于N-末端延伸序列中的一个或多个组氨酸残基位于离赖氨酸切割位点有1-4个氨基酸残基的位置上。
17.权利要求15的方法,所述N-末端延伸序列选自如下组的序列:
Glu-Glu-Ala-His-Lys(SEQ ID NO:1);Glu-(Glu-Ala)2-His-Lys(SEQ IDNO:2);Glu-(Glu-Ala)3-His-Lys(SEQ ID NO:3);Glu-Glu-Gly-His-Lys(SEQ IDNO:4);Glu-His-Pro-Lys(SEQ ID NO:5);Glu-Glu-Gly-Glu-Pro-Lys(SEQ IDNO:6);Glu-Glu-His-Cys-Lys(SEQ ID NO:7);Glu-Glu-His-His-Lys(SEQ IDNO:8);Glu-His-His-His-Lys(SEQ ID NO:9);Glu-His-Ala-His-Lys(SEQ IDNO:10);Glu-Gly-Ala-His-Lys(SEQ ID NO:11);Glu-His-Gly-His-Gly-Lys(SEQ ID NO:12);Glu-Glu-Ala-His-Glu-Leu-Lys(SEQ ID NO:13);Glu-Glu-Ala-His-Glu-Ile-Lys(SEQ ID NO:14);Glu-Glu-Ala-His-Glu-Val-Lys(SEQ IDNO:15);Glu-Glu-Ala-His-Glu-Met-Lys(SEQ ID NO:16);Glu-Glu-Ala-His-Glu-Phe-Lys(SEQ ID NO:17);Glu-Glu-Ala-His-Glu-Tyr-Lys(SEQ ID NO:18);Glu-Glu-Ala-His-Glu-Trp-Lys(SEQ ID NO:19);Gln-Asp-Ala-His-Lys(SEQID NO:24);Glu-Glu-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:30);Asp-Thr-His-Lys(SEQ ID NO:34);Glu-His-His-Gly-His-Gly-Lys(SEQ ID NO:36);Asp-Ser-His-Lys(SEQ ID NO:37);Gln-Asp-Thr-His-Lys(SEQ ID NO:38);Glu-Ala-Glu-Ala-Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:39);Glu-Ala-Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:40);Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:41);Trp-His-Trp-Leu-Lys(SEQ ID NO:42);Glu-Glu-Trp-His-Trp-Leu-Lys(SEQ ID NO:43);Glu-Glu-Glu-Ala-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:44);Glu-Ala-Gln-Asp-Ala-His-Lys(SEQ ID NO:47);Glu-Ala-Glu-Ala-Gln-Asp-Ala-His-Lys(SEQ ID NO:48);或Glu-Ala-Glu-Ala-Glu-Ala-Gln-Asp-Ala-His-Lys(SEQID NO:49)。
18.权利要求8的方法,所述N-末端延伸序列含有至少一个Glu或Asp。
19.权利要求18的方法,所述Glu或Asp残基位于离赖氨酸切割位点1至5个残基的位置上。
20.权利要求18的方法,所述N-末端延伸序列包括Glu-Glu-序列。
21.权利要求18的方法,所述N-末端延伸序列为Glu-Glu-Ala-Glu-Lys,SEQ ID NO:45;Glu-Glu-Gly-Glu-Pro-Lys,SEQ ID NO:46和Glu-Glu-Lys。
22.权利要求9的方法,所述N-末端延伸序列选自如下组的序列:
Glu-Glu-Ala-Gla-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:29),Glu-Glu-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:30);Leu-Asp-Gly-Arg-Leu-Glu-Ala-Leu-Lys(SEQ ID NO:31);Glu-Glu-Leu-Asp-Gly-Arg-Leu-Glu-Ala-Leu-Lys(SEQ ID NO:32);Glu-Glu-Leu-Asp-Ala-Arg-Leu-Glu-Ala-Leu-Lys(SEQ IDNO:33);Glu-Glu-Trp-His-Trp-Leu-Lys(SEQ ID NO:43);或Glu-Glu-Glu-Ala-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:44)。
23.权利要求11的方法,所述N-末端延伸序列选自如下组的序列:
Glu-Glu-Gly-Asn-Thr-Thr-Pro-Lys(SEQ ID NO:20),Glu-Glu-Gly-AsGlu-Thr-Glu-Pro-Lys(SEQ ID NO:21),Glu-Glu-Gly-Asn-Asp-Thr-Glu-Pro-Lys(SEQ ID NO:22)或Glu-Glu-Gly-Asn-Thr-Thr-Glu-Pro-Lys(SEQIDNO:23)。
24.权利要求10的方法,所述N-末端延伸序列包括Asp-Asp-Asp-Asp-Lys(SEQ ID NO:26)。
25.权利要求1的方法,所述N-末端延伸序列的通式为:
Xn------X1-Lys
其中Lys为切割位点,Xn------X1为2-14个氨基酸残基的肽序列,其能防止或最小化Lys切割位点的游离ε-氨基基团在权利要求1所述步骤(iii)中的酰化,还能保护所表达的前体多肽不被内切蛋白水解性降解,附带条件是X不为Lys,且至少一个X为His或Glu或Asp。
26.权利要求25的方法,所述Xn------X1长为2-12个氨基酸残基。在另一实施方案中Xn------X1长为2-10;2-9;2-8;2-7;2-6;或2-5个氨基酸残基。
27.权利要求25的方法,所述Xn------X1包含2-8个氨基酸残基,它们选自His;Glu;Ala;Asp;Gly;和Pro。
28.权利要求25的方法,所述Xn------X1包含4-10个氨基酸残基,它们选自Glu;Asp;Ala;His;Trp;Tyr;Ile;Val;Met;和Phe。
29.权利要求25的方法,所述Xn------X1包含5-8个氨基酸残基,它们选自Glu;Asp;Gly;Asn;Thr;Ser;和Pro。
30.权利要求25的方法,所述N-末端延伸序列的N-末端的第一个和第二个X选自Glu或Asp。
31.权利要求25的方法,所述Xn------X1选自如下序列:
Glu-Glu-Ala-His-Lys(SEQ ID NO:1);Glu-(Glu-Ala)2-His-Lys(SEQ ID NO:2);Glu-(Glu-Ala)3-His-Lys(SEQ ID NO:3);Glu-Glu-Gly-His-Lys(SEQ ID NO:4);Glu-His-Pro-Lys(SEQ ID NO:5);Glu-Glu-Gly-Glu-Pro-Lys(SEQ ID NO:6);Glu-Glu-His-Cys-Lys(SEQ ID NO:7);Glu-Glu-His-His-Lys(SEQ ID NO:8);Glu-His-His-His-Lys(SEQ ID NO:9);Glu-His-Ala-His-Lys(SEQ ID NO:10);Glu-Gly-Ala-His-Lys(SEQ ID NO:11);Glu-His-Gly-His-Gly-Lys(SEQ IDNO:12);Glu-Glu-Ala-His-Glu-Leu-Lys(SEQ ID NO:13);Glu-Glu-Ala-His-Glu-ile-Lys(SEQ ID NO:14);Glu-Glu-Ala-His-Glu-Val-Lys(SEQ ID NO:15);Glu-Glu-Ala-His-Glu-Met-Lys(SEQ ID NO:16);Glu-Glu-Ala-His-Glu-Phe-Lys(SEQ ID NO:17);Glu-Glu-Ala-His-Glu-Tyr-Lys(SEQ ID NO:18);Glu-Glu-Ala-His-Glu-Trp-Lys(SEQ ID NO:19);Glu-Glu-Gly-Asn-Thr-Thr-Pro-Lys(SEQ ID NO:20);Glu-Glu-Gly-Asn-Glu-Thr-Glu-Pro-Lys(SEQ ID NO:21),Glu-Glu-Gly-Asn-Asp-Thr-Glu-Pro-Lys(SEQ ID NO:22);Glu-Glu-Gly-Asn-Thr-Thr-Glu-Pro-Lys(SEQ ID NO:23);Gln-Asp-Ala-His-Lys(SEQ ID NO:24);Glu-Glu-Lys;Asp-Asp-Asp-Asp-Lys(SEQ ID NO:26);Glu-Glu-Ala-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:29);Glu-Glu-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQ ID NO:30);Leu-Asp-Gly-Arg-Leu-Glu-Ala-Leu-Lys(SEQ IDNO:31);Glu-Glu-Leu-Asp-Gly-Arg-Leu-Glu-Ala-Leu-Lys(SEQ ID NO:32);Glu-Glu-Leu-Asp-Ala-Arg-Leu-Glu-Ala-Leu-Lys(SEQ ID NO:33);Asp-Thr-His-Lys(SEQ ID NO:34);Asp-Ala-His-Lys(SEQ ID NO:35);Glu-His-His-Gly-His-Gly-Lys(SEQ ID NO:36);Asp-Ser-His-Lys(SEQ ID NO:37);Gln-Asp-Thr-His-Lys(SEQ ID NO:38);Glu-Ala-Glu-Ala-Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:39);Glu-Ala-Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:40);Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:41);Trp-His-Trp-Leu-Lys(SEQID NO:42);Glu-Glu-Trp-His-Trp-Leu-Lys(SEQ ID NO:43);Glu-Glu-Glu-Ala-Trp-His-Trp-Leu-Lys(SEQID NO:44);Glu-Glu-Ala-Glu-Lys(SEQ ID NO:45);Glu-Glu-Gly-Glu-Pro-Lys(SEQ ID NO:46);Glu-Ala-Gln-Asp-Ala-His-Lys(SEQ ID NO:47);Glu-Ala-Glu-Ala-Gln-Asp-Ala-His-Lys(SEQ ID NO:48);Glu-Ala-Glu-Ala-Glu-Ala-Gln-Asp-Ala-His-Lys(SEQ IDNO:49)。
32.权利要求7的方法,所述N-末端延伸序列包括His-Z1-Z2-Lys(SEQ IDNO:51)序列,其中Z1为Glu;Asp;Asn;Gln;Ser;Thr;Gly;Leu;Ile;Val;Met;Phe或Tyr,Z2为Leu;Ile;Val;Met;Phe;Tyr;Trp或Cys。
33.权利要求32的方法,所述Z1为Glu或Asp,Z2为Leu;Ile;Val;Met;Phe,Tyr,Trp或Cys。
34.权利要求6的方法,所述N-末端延伸序列包括Asp-X-His-Lys(SEQID NO:50)序列,其中X为Ala,Thr或Ser。
35.权利要求34的方法,所述N-末端延伸序列包括Asp-Thr-His-Lys(SEQ ID NO:34)或Asp-Ala-His-Lys(SEQ ID NO:35)。
36.权利要求35的方法,所述N-末端延伸序列选自如下序列:
Gln-Asp-Thr-His-Lys(SEQ ID NO:38);Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:41);Glu-Ala-Glu-Ala-Gln-Asp-Thr-His-Lys(SEQ ID NO:40);Glu-Ala-Glu-Ala-Glu-Ala-Gln-Asp-Thr-His-Lys(SEQID NO:39);Gln-Asp-Ala-His-Lys(SEQ ID NO:24);Glu-AlGln-Asp-Ala-His-Lys(SEQ ID NO:47);Glu-Ala-Glu-Ala-Gln-Asp-Ala-His-Lys(SEQ ID NO:48);或Glu-Ala-Glu-Ala-Glu-Ala-Gln-Asp-Ala-His-Lys(SEQ ID NO:49)。
37.权利要求1的方法,所述目的多肽属于GRF(生长激素释放因子)家族中N-末端为His或Tyr,且相邻位置为Ala或Gly的多肽。
38.权利要求37的方法,所述目的多肽为GLP-1或GLP-2或GLP-1或GLP2的类似物或衍生物。
39.权利要求37的方法,所述多肽为在Lys26和Lys34位点酰化的GLP-1(7- 37)
40.权利要求37的方法,所述GLP-1类似物为在Lys26位点酰化的Arg34GLP1(7-37)
41.权利要求1的方法,所述步骤(iv)中的酶切反应是采用赖氨酸内肽酶,例如水解无色杆菌蛋白酶I来实现的。
42.权利要求1的方法,所述宿主细胞为酵母细胞。
43.权利要求42的方法,所述酵母细胞为酿酒酵母细胞。
44.权利要求43的方法,所述酵母细胞为ΔYPS1细胞。
45.权利要求1的方法,所述酰化步骤(iii)是在有机溶剂中或在有机溶剂和水的混合物中、在有金属离子的条件下进行的。
46.权利要求45的方法,所述金属离子为Zn,Cu,Co,Ni,Fe,Mg,Mn或Ca。
47.权利要求45的方法,所述有机溶剂为CH3CN或NMP(N-甲基-吡咯烷酮)。
48.权利要求45的方法,所述酰化步骤是在pH7至12之间进行的。
49.权利要求47的方法,所述pH在8至11.5之间或9.0至10.5之间。
50.权利要求45的方法,所述酰化步骤的反应温度为负5℃至35℃之间。
51.权利要求50的方法,所述温度为15℃至25℃之间。
52.目的多肽的多肽前体,具有通式
N-末端延伸序列-Lys-Z3-Z4-*多肽*
所述Lys为切割位点,N-末端延伸序列具有2-14个氨基酸残基,其能防止或最小化Lys切割位点的酰化,并在发酵过程中保护该多肽前体不被蛋白水解性降解;Z3为His或Tyr,并且是目的多肽的N-末端氨基酸残基;Z4是紧接目的多肽N-末端的氨基酸残基,为Ala,Ser或Gly;*多肽*为目的多肽余下的序列。
53.权利要求52的多肽前体,所述N-末端序列能与该多肽N-末端的一个或多个氨基酸残基一起构成金属离子复合物结合位点。
54.权利要求52的多肽前体,所述N-末端延伸序列包括来自白蛋白N-末端的金属离子结合位点。
55.权利要求52所述多肽前体,所述N-末端延伸序列包括来自金属内肽酶Zn结合位点的金属离子结合位点。
56.权利要求52的多肽前体,所述N-末端延伸序列包括至少一个能与赖氨酸切割位点形成盐桥的氨基酸残基。
57.权利要求56的多肽前体,所述N-末端延伸序列能形成能形成α-螺旋。
58.权利要求56的多肽前体,所述N-末端延伸序列包括真核糖基化位点。
59.权利要求52的多肽前体,所述N-末端延伸序列包括至少一个组氨酸残基。
60.权利要求52的多肽前体,所述N-末端延伸序列包括至少一个Glu或Asp。
61.权利要求60的多肽前体,所述目的多肽为GLP-1或GLP-2或者GLP-1或GLP2的类似物或衍生物。
62.权利要求61的多肽前体,所述多肽为在Lys26和Lys34位点酰化的GLP-1(7-37)
63.权利要求61的多肽前体,所述GLP-1类似物为在Lys26位点酰化的Arg34GLP1(7-37)
CNA028187261A 2001-07-24 2002-07-18 生产酰化多肽的方法 Pending CN1558912A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DKPA200101141 2001-07-24
DKPA200101141 2001-07-24

Publications (1)

Publication Number Publication Date
CN1558912A true CN1558912A (zh) 2004-12-29

Family

ID=8160637

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA028187261A Pending CN1558912A (zh) 2001-07-24 2002-07-18 生产酰化多肽的方法

Country Status (15)

Country Link
EP (1) EP1421103B1 (zh)
JP (1) JP4386722B2 (zh)
KR (1) KR20040019361A (zh)
CN (1) CN1558912A (zh)
AT (1) ATE411337T1 (zh)
AU (1) AU2002355161A1 (zh)
BR (1) BR0211346A (zh)
CA (1) CA2452735A1 (zh)
DE (1) DE60229403D1 (zh)
ES (1) ES2316588T3 (zh)
HU (1) HUP0500057A3 (zh)
IL (1) IL159623A0 (zh)
PL (1) PL367687A1 (zh)
RU (1) RU2004105155A (zh)
WO (1) WO2003010186A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105154498A (zh) * 2007-12-28 2015-12-16 诺沃—诺迪斯克有限公司 Glp-1类似物的半重组制备法
CN107881187A (zh) * 2017-11-20 2018-04-06 珠海联邦制药股份有限公司 将大肠杆菌表达的融合蛋白转化为利拉鲁肽的制备方法及应用

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005047508A1 (en) 2003-11-14 2005-05-26 Novo Nordisk A/S Processes for making acylated insulin
US8637647B2 (en) 2008-09-12 2014-01-28 Novo Nordisk A/S Method of acylating a peptide or protein
CN111187760B (zh) * 2020-02-10 2022-09-13 中国海洋大学 一种具有酰基转移功能的酶及其应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6011007A (en) * 1993-09-17 2000-01-04 Novo Nordisk A/S Acylated insulin
US5646242A (en) * 1994-11-17 1997-07-08 Eli Lilly And Company Selective acylation of epsilon-amino groups
US5905140A (en) * 1996-07-11 1999-05-18 Novo Nordisk A/S, Novo Alle Selective acylation method
DE69735242T2 (de) * 1996-12-20 2006-09-21 Novo Nordisk A/S N-terminal verlängerte proteine exprimiert in hefe
CN1344248A (zh) * 1999-03-17 2002-04-10 诺沃挪第克公司 肽的酰化方法和新酰化剂

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105154498A (zh) * 2007-12-28 2015-12-16 诺沃—诺迪斯克有限公司 Glp-1类似物的半重组制备法
CN107881187A (zh) * 2017-11-20 2018-04-06 珠海联邦制药股份有限公司 将大肠杆菌表达的融合蛋白转化为利拉鲁肽的制备方法及应用

Also Published As

Publication number Publication date
HUP0500057A3 (en) 2006-01-30
CA2452735A1 (en) 2003-02-06
WO2003010186A2 (en) 2003-02-06
ES2316588T3 (es) 2009-04-16
PL367687A1 (en) 2005-03-07
ATE411337T1 (de) 2008-10-15
JP2005504527A (ja) 2005-02-17
EP1421103A2 (en) 2004-05-26
JP4386722B2 (ja) 2009-12-16
BR0211346A (pt) 2004-09-21
KR20040019361A (ko) 2004-03-05
IL159623A0 (en) 2004-06-01
DE60229403D1 (de) 2008-11-27
WO2003010186A3 (en) 2004-03-25
EP1421103B1 (en) 2008-10-15
RU2004105155A (ru) 2005-04-20
HUP0500057A2 (hu) 2005-04-28
AU2002355161A1 (en) 2003-02-17

Similar Documents

Publication Publication Date Title
CN1115413C (zh) 合成前导肽序列
CN1231595C (zh) 通过分子伴侣的共分泌制备天然折叠的和分泌的蛋白质的方法
CN1198837C (zh) 组织纤溶酶原激活物(tPA)的纯化
CN1198937C (zh) 利用辅助肽制造肽的方法
CN1132845C (zh) 获得具有正确键合的胱氨酸键的胰岛素前体的改进的方法
CN1158305C (zh) 增强了锌结合力的胰岛素衍生物
CN1099801A (zh) 甲状旁腺素类似物,它们的生产方法和含有它们的药物组合物
CN1529757A (zh) 用于向细菌培养物上清液中分泌目的蛋白质的融合蛋白质
CN1703421A (zh) 降低peg化蛋白的聚集体水平的方法
CN1852983A (zh) 蛋白质从酵母的分泌
CN1195859C (zh) 修饰化人源粒细胞-集落刺激因子及其制备方法
CN1158303C (zh) 去除n-末端蛋氨酸的方法
CN1192037C (zh) 用于由大肠杆菌向培养基中分泌来制备Leu-水蛭素的信号序列
CN1160465C (zh) 其中areA、pepC和/或pepE基因已被灭活的真菌
CN1216988C (zh) 分泌型Kex衍生物的制造方法
CN1969041A (zh) 用于生产多肽的信号肽
CN1231594C (zh) 天然折叠和分泌型蛋白质的制备方法
CN1153831C (zh) 编码神经酰胺糖内切酶激活物的基因
CN1681930A (zh) 具有包含fivsi基序的信号序列的多肽以及编码该基序的寡核苷酸
CN1509336A (zh) 肽的制备方法
CN1216901C (zh) 使用加工酶的嵌合蛋白质的切断方法
CN1213146C (zh) 从新的融合蛋白制造重组胰岛素的方法
CN1558912A (zh) 生产酰化多肽的方法
CN1701119A (zh) 增加宿主细胞重组多肽产量的方法
CN1311074C (zh) 重组表达的羧肽酶b及其纯化

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication