CN104136459A - 减少1->2读框移位的方法 - Google Patents

减少1->2读框移位的方法 Download PDF

Info

Publication number
CN104136459A
CN104136459A CN201380011005.8A CN201380011005A CN104136459A CN 104136459 A CN104136459 A CN 104136459A CN 201380011005 A CN201380011005 A CN 201380011005A CN 104136459 A CN104136459 A CN 104136459A
Authority
CN
China
Prior art keywords
polypeptide
seq
oligonucleotide
coding
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380011005.8A
Other languages
English (en)
Inventor
阿德尔伯特·格罗斯曼
弗里德里克·黑塞
E·科佩茨基
维尔马·劳
克里斯蒂安·尚茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of CN104136459A publication Critical patent/CN104136459A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/775Apolipopeptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression

Abstract

本文报道了一种重组生产包含二肽AR的多肽的方法,其特征在于所述方法包括从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收多肽,从而生产所述多肽,其中包含在所述多肽中的二肽AR由寡核苷酸gca cgt,或寡核苷酸gcg cgt,或寡核苷酸gcc cgt编码。

Description

减少1->2读框移位的方法
本发明属于重组多肽生产领域。本文报道了一种重组生产具有减少的副产物含量的多肽的方法,其中通过修饰在翻译或转录过程中减少移码(frameshift)的编码核酸实现副产物含量的减少。
发明背景
蛋白质在现今的医用组合中发挥重要作用。对于人的应用,每种药用物质必须满足不同的标准。为了保证生物药剂对人的安全性,尤其必须将会引起严重危害的核酸,病毒,和宿主细胞蛋白质移除。为了满足质量管理规格标准(regulatory specification),一个或更多个纯化步骤必须按照制造工艺。
可以例如通过原核细胞(比如大肠杆菌)生产重组多肽。重组生产的多肽占原核细胞的多肽含量的大多数并且经常在原核细胞内沉积为不溶的聚集体,即为所谓的包涵体。为了分离重组多肽,必须将细胞破碎并且必须在从细胞碎片分离包涵体之后将包含在包涵体中的重组多肽溶解。对于增溶离液剂,使用比如脲或盐酸胍。为了切开二硫键,尤其在碱性条件下加入还原剂,比如二硫赤藓醇,二硫苏糖醇,或β-巯基乙醇。溶解聚集的多肽之后,必须将重组多肽的对于生物活性至关重要的球状结构重建。在该所谓的复性过程中,例如通过针对合适的缓冲液透析(缓慢)降低还原剂的浓度,其允许变性的多肽重折叠为其生物活性结构。复性后,纯化重组多肽到对于预期用途可接受的纯度。例如,对于作为治疗性蛋白质的使用,必须建立大于90%的纯度。
重组生产的多肽通常伴有来自生产细胞的核酸,内毒素,和/或多肽。除了宿主细胞来源的副产物,在粗制多肽制备物中还存在多肽来源的副产物。除了别的以外,可以存在研究的多肽的截短的变体。
在WO 95/25786中,报道了在细菌表达系统中生产人载脂蛋白A1。
发明概述
已经发现,编码二肽AR的寡核苷酸可以是在编码包含二肽AR的多肽的核酸的翻译或转录过程中1->2移码的点。由于移码的出现,产生具有不编码的氨基酸序列的无义多肽。
因此,已经发现,包含在编码更大多肽的核酸中的编码二肽AR的寡核苷酸应该选自寡核苷酸gca cgt(SEQ ID NO:03),gcg cgt(SEQ ID NO:04),和gcc cgt(SEQ ID NO:05)。已经发现,编码所述二肽AR的寡核苷酸中的第四个核苷酸不应该是‘a’。
如本文报道的一个方面是重组生产包含所述二肽AR(SEQ ID NO:06)的多肽的方法,其特征在于所述方法包括以下步骤:
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽,
其中包含在编码所述多肽的核酸中的编码所述二肽AR的寡核苷酸在第四位具有核苷酸‘c’。
因此,作为一个方面,本文报道了,重组生产包含二肽AR(SEQ IDNO:06)的多肽的方法,其特征在于所述方法包括以下步骤:
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽,
其中包含在所述多肽中的二肽AR由寡核苷酸gca cgt(SEQ ID NO:03),或寡核苷酸gcg cgt(SEQ ID NO:04),或寡核苷酸gcc cgt(SEQ IDNO:05)编码。
如本文报道的一个方面是在包含二肽AR(SEQ ID NO:06)的多肽的生产中减少由1->2移码导致的副产物形成的方法,其特征在于所述方法包括以下步骤:
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽,
其中编码包含在编码所述多肽的核酸中的二肽AR的寡核苷酸在第四位具有核苷酸‘c’。
因此,作为一个方面,本发明报道了在包含二肽AR(SEQ ID NO:06)的多肽的重组生产中减少由1->2移码导致的副产物形成的方法,其特征在于所述方法包括以下步骤:
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽,
其中包含在所述多肽中的二肽AR由寡核苷酸gca cgt(SEQ ID NO:03),或寡核苷酸gcg cgt(SEQ ID NO:04),或寡核苷酸gcc cgt(SEQ IDNO:05)编码。
在如之前报道的所有方面的一个实施方案中,所述二肽AR是所有二肽AR。
在如本文报道的所有方面的一个实施方案中,所述二肽AR是氨基酸序列中最后的二肽AR。
如本文报道的一个方面是重组生产包含二肽AR(SEQ ID NO:06)的SEQ ID NO:09或SEQ ID NO:11的载脂蛋白A-I的方法,其特征在于所述方法包括以下步骤:
-从包含编码SEQ ID NO:09或SEQ ID NO:11的载脂蛋白A-I的核酸的细胞或包含编码SEQ ID NO:09或SEQ ID NO:11的载脂蛋白A-I的核酸的细胞的培养物的培养基回收所述载脂蛋白A-I并从而生产所述载脂蛋白A-I,
其中包含在编码所述载脂蛋白A-I的核酸中的编码最后的二肽AR的寡核苷酸在第四位具有核苷酸‘c’。
因此,作为一个方面,本发明报道了重组生产包含二肽AR(SEQ IDNO:06)的SEQ ID NO:09或SEQ ID NO:11的载脂蛋白A-I的方法,其特征在于所述方法包括以下步骤:
-从包含编码SEQ ID NO:09或SEQ ID NO:11的载脂蛋白A-I的核酸的细胞或包含编码SEQ ID NO:09或SEQ ID NO:11的载脂蛋白A-I的核酸的细胞的培养物的培养基回收所述载脂蛋白A-I并从而生产所述载脂蛋白,
其中包含在所述载脂蛋白A-I氨基酸序列中的最后的二肽AR由寡核苷酸gca cgt(SEQ ID NO:03),或寡核苷酸gcg cgt(SEQ ID NO:04),或寡核苷酸gcc cgt(SEQ ID NO:05)编码。
如本文报道的一个方面是编码在其氨基酸序列中包含二肽AR的多肽的核酸,其中所述二肽AR由寡核苷酸gca cgt(SEQ ID NO:03),或寡核苷酸gcg cgt(SEQ ID NO:04),或寡核苷酸gcc cgt(SEQ ID NO:05)编码。
如本文报道的一个方面是包含如本文报道的核酸的细胞。
如本文报道的一个方面是寡核苷酸gca cgt(SEQ ID NO:03),或寡核苷酸gcg cgt(SEQ ID NO:04),或寡核苷酸gcc cgt(SEQ ID NO:05)用于编码包含在多肽中的二肽AR的用途。
以下具体说明如本文报道的所有方面的实施方案。
在一个实施方案中,所述二肽AR由寡核苷酸gca cgt(SEQ ID NO:03)编码。
在一个实施方案中,所述二肽AR由寡核苷酸gcg cgt(SEQ ID NO:04)编码。
在一个实施方案中,所述二肽AR由寡核苷酸gcc cgt(SEQ ID NO:05)编码。
在一个实施方案中,所述多肽包含约50个氨基酸残基至约500个氨基酸残基。在一个实施方案中,所述多肽包含约100个氨基酸残基至约400个氨基酸残基。在一个实施方案中,所述多肽包含约250氨基酸残基至约350氨基酸残基。
在一个实施方案中,所述细胞是原核细胞。在一个实施方案中,所述原核细胞是大肠杆菌(E.coli)细胞,或芽胞杆菌(Bacillus)细胞。
在一个实施方案中,所述细胞是真核细胞。在一个实施方案中,所述细胞是CHO细胞,或HEK细胞,或BHK细胞,或NS0细胞,或SP2/0细胞,或酵母细胞。
在一个实施方案中,所述多肽是异源多聚多肽。在一个实施方案中,所述多肽是抗体或抗体片段。
在一个实施方案中,所述多肽是同源多聚多肽。在一个实施方案中,所述多肽是同源二聚体或同源三聚体。
在一个实施方案中,所述多肽是人载脂蛋白A-I或具有人载脂蛋白A-I的生物活性的其变体。在一个实施方案中,所述载脂蛋白A-I变体具有选自SEQ ID NO:09至SEQ ID NO:14的组的氨基酸序列。
在一个实施方案中,所述多肽是具有SEQ ID NO:09或SEQ ID NO:11的氨基酸序列的人载脂蛋白A-I。
发明详述
定义:
术语″氨基酸″指羧基α-氨基酸类,其可以直接或以前体的形式由核酸编码。个体氨基酸被由三个核苷酸组成的核酸(所谓密码子或碱基三联体)编码。每个氨基酸由至少一个密码子编码。由不同密码子编码相同氨基酸被称为“遗传密码的简并”。术语”氨基酸”指天然存在的羧基α-氨基酸并且包括丙氨酸(三字母代码:ala,单字母代码:A),精氨酸(arg,R),天冬酰胺(asn,N),天冬氨酸(asp,D),半胱氨酸(cys,C),谷氨酰胺(gln,Q),谷氨酸(glu,E),甘氨酸(gly,G),组氨酸(his,H),异亮氨酸(ile,I),亮氨酸(leu,L),赖氨酸(lys,K),甲硫氨酸(met,M),苯丙氨酸(phe,F),脯氨酸(pro,P),丝氨酸(ser,S),苏氨酸(thr,T),色氨酸(trp,W),酪氨酸(tyr,Y),和缬氨酸(val,V)。
术语″载脂蛋白A-I″指具有蛋白质-脂质和蛋白质-蛋白质相互作用性质的,两亲的,螺旋多肽。载脂蛋白A-I由肝和小肠合成为267个氨基酸残基的前载脂蛋白原(prepro-apolipoprotein),其以载脂蛋白原(pro-apolipoprotein)分泌,所述载脂蛋白原被切割为具有243个氨基酸残基的成熟多肽。载脂蛋白A-I由6至8个不同氨基酸重复(每个由被接头部分(常常是脯氨酸)分开的22个氨基酸残基组成)组成,并且在一些情况下由通过一些残基构成的区段组成。在GenPept数据库入口(database entry)NM-000039或数据库入口X00566;GenBank NP-000030.1(gi 4557321)中报道了代表性的人载脂蛋白A-I氨基酸序列。存在人载脂蛋白A-I(SEQID NO:07)的天然存在的变体,比如P27H,P27R,P28R,R34L,G50R,L84R,D113E,A-A119D,D127N,K131的缺失,K131M,W132R,E133K,R151C(氨基酸残基151从Arg改变为Cys,载脂蛋白A-I-Paris),E160K,E163G,P167R,L168R,E171V,P189R,R197C(氨基酸残基173从Arg改变为Cys,载脂蛋白A-I-Milano)和E222K。还包括的是具有保守氨基酸修饰的变体。
术语“密码子”指由编码限定的氨基酸的三个核苷酸组成的寡核苷酸。由于遗传密码的简并性,一些氨基酸由多于一种密码子编码。这些编码相同氨基酸的不同密码子在个体宿主细胞中具有不同的相对使用频率。因此,特定氨基酸可以由一组不同的密码子编码。同样地,多肽的氨基酸序列可以由不同核酸编码。因此,特定氨基酸可以由一组不同的密码子编码,其中这些密码子中的每个具有给定的宿主细胞中的使用频率。
表:大肠杆菌密码子使用(密码子|编码的氨基酸|使用频率[%])
保守取代显示在以下″优选的取代″标题下的表中。在以下″代表性的取代″标题下的表中并且如在下文关于氨基酸侧链类型进一步描述的提供另外更多的取代的改变。
非保守取代需要将这些类型中的一种的成员交换为另一种类型。
术语″保守氨基酸修饰″指不影响或改变多肽的特性的氨基酸序列的修饰。可以通过本领域已知的标准技术,比如位点定向的诱变和PCR-介导的诱变引入修饰。保守氨基酸修饰包括其中氨基酸残基被具有类似侧链的氨基酸残基替代的修饰。本领域中已经限定了具有类似侧链的氨基酸残基家族。这些家族包括具有碱性侧链(例如赖氨酸,精氨酸,组氨酸),酸性侧链(例如天冬氨酸,谷氨酸),不带电极性侧链(例如甘氨酸,天冬酰胺,谷氨酰胺,丝氨酸,苏氨酸,酪氨酸,半胱氨酸,色氨酸),非极性侧链(例如丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,苯丙氨酸,甲硫氨酸),β-分枝侧链(例如苏氨酸,缬氨酸,异亮氨酸),和芳香侧链(例如酪氨酸,苯丙氨酸,色氨酸,组氨酸)的氨基酸。
术语“多肽的变体”指氨基酸序列以多达十个,在一个实施方案中从约两个至约五个,添加,缺失,和/或取代不同于“母体”多肽的氨基酸序列的多肽。可以通过基于如由Riechmann,L.,等人,Nature 332(1988)323-327,和Queen,C.,等人,Proc.Natl.Acad.Sci.USA 86(1989)10029-10033描述的分子模型的诱变进行氨基酸序列修饰。
可以使用公知的算法,比如BLOSUM 30,BLOSUM 40,BLOSUM 45,BLOSUM 50,BLOSUM 55,BLOSUM 60,BLOSUM 62,BLOSUM 65,BLOSUM 70,BLOSUM 75,BLOSUM 80,BLOSUM 85,或BLOSUM 90计算不同氨基酸序列的同源性和同一性。在一个实施方案中,所述算法是BLOSUM 30。
交替使用术语″宿主细胞″,″宿主细胞系″,和″宿主细胞培养物″并且指已引入外源核酸的细胞,包括此种细胞的子代。宿主细胞包括″转化体″和″转化的细胞,″其包括原代转化的细胞和从中来源的不考虑传代数量的子代。子代核酸含量可以不与亲代细胞完全相同,但可以包含突变。具有与在最初转化的细胞中筛选或选择的相同功能或生物活性突变的子代包括在本文中。
术语“核酸”和“核酸序列”指由个体核苷酸(还称为碱基)‘a’,‘c’,‘g’,和‘t’(或RNA中的‘u’)组成的聚合分子,即DNA,RNA,或其修饰物。该多核苷酸分子可以是天然存在的多核苷酸分子或合成的多核苷酸分子或一种或更多种天然存在的多核苷酸分子与一种或更多种合成的多核苷酸分子的组合。该定义还包括的是其中一个或更多个核苷酸被改变(例如通过诱变),缺失,或添加的天然存在的多核苷酸分子。核酸可以是分离的,或整合入另一条核酸,例如整合入表达盒,质粒,或宿主细胞的染色体。核酸以其由个体核苷酸组成的核酸序列为特征。术语“寡核苷酸”指由至多10个个体核苷酸(也成为碱基)′a′,′c′,′g′,和′t′(或RNA中的′u′)组成的聚合分子。
对于本领域技术人员来说,将例如多肽的氨基酸序列转变为编码该氨基酸序列的相应的核酸序列的工艺和方法是公知的。因此,核酸以其由个体核苷酸组成的核酸序列为特征并且类似地以由此编码的多肽的氨基酸序列表征。
有关参考多肽序列的“百分数(%)氨基酸序列同一性″定义为经比对序列和引入缺口(如果需要)以获得最大百分数序列同一性,和不考虑任何保守取代作为序列同一性的部分之后,候选序列中与参考多肽序列中氨基酸残基的相同的氨基酸残基的百分数。可以以不同方式实现为了确定百分数氨基酸序列同一性的目的的比对,所述方式在本领域技术内,例如,使用公众可获得的计算机软件,比如BLAST,BLAST-2,ALIGN或Megalign(DNASTAR)软件。本领域熟练技术人员可以确定用于比对序列的合适参数,包括获得跨被比较序列的全长的最大比对所需的任何算法。然而,为了本文的目的,使用序列比较计算机程序ALIGN-2产生%氨基酸序列同一性值。ALIGN-2序列比较计算机程序由Genentech,Inc.创作,并且已将原代码与用户文献资料提交美国版权局,Washington D.C.,20559,其中其在美国版权登记号TXU510087下登记。ALIGN-2程序可从Genentech,Inc.,South San Francisco,California由公众获得,或可以从源代码编辑。应该将ALIGN-2程序编辑用于在UNIX操作系统(包括数字的UNIX V4.0D)上使用。所有序列比较参数由ALIGN-2程序设定并且不改变。
在将ALIGN-2用于氨基酸序列比较的情况下,如下计算给定氨基酸序列A相对(to)、与(with)、或针对(against)给定氨基酸序列B(其可以备选地叙述为相对(to)、与(with)、或针对(against)给定氨基酸序列B具有或包含某一%氨基酸序列同一性的给定氨基酸序列A)的%氨基酸序列同一性:
100乘以分数X/Y
其中X是通过序列比对程序ALIGN-2中的A和B的程序比对得分为相同匹配的氨基酸残基的数量,并且其中Y是B中氨基酸残基的总数量。将理解其中氨基酸序列A的长度与氨基酸序列B的长度不相等,A相对B的%氨基酸序列同一性将不等于B相对A的%氨基酸序列同一性。除非另有特别说明,否则如在紧接的上一段中使用ALIGN-2计算机程序获得本文使用所有%氨基酸序列同一性值。
术语″重组多肽″和“重组生产的多肽”指通过重组方法制备,表达或产生的多肽,比如分离自宿主细胞,比如大肠杆菌,NS0,BHK,或CHO细胞的多肽。
术语″取代″指改变母体核酸中一个特定核苷酸以获得取代的/改变的核酸。
如本文报道的方法:
例如在Ausubel,F.M.(编辑),Current Protocols in Molecular Biology,卷I至III(1997),Wiley and Sons;Sambrook,J.,等人,Molecular Cloning:ALaboratory Manual,第二版,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.(1989);Morrison,S.L,等人,Proc.Natl.Acad.Sci.USA81(1984)6851-6855;US 5,202,238和US 5,204,244中描述了用于进行本发明的,本领域技术人员已知的方法和技术。
已经发现,包含在编码包含二肽AR的多肽的核酸内的编码二肽AR的寡核苷酸可以是编码包含二肽AR的多肽的核酸的转录或翻译过程中1->2移码(突变)的点。由于具有非编码的氨基酸序列的移码多肽的出现,最可能产生无义或截短的氨基酸序列。
更详细地,已经发现依赖于包含在编码更大的(即至少50个氨基酸残基)多肽的核酸内的编码二肽AR的寡核苷酸,寡核苷酸的转录或翻译过程中的1->2移码以不同频率发生(参见下表)。
表.
编码AR二肽的寡核苷酸 1→2移码发生
gcg agg(SEQ ID NO:01)
gcg aga(SEQ ID NO:02) 30%
gca cgt(SEQ ID NO:03) 低于检测极限
gcg cgt(SEQ ID NO:04) 低于检测极限
gcc cgt(SEQ ID NO:05) 低于检测极限
因此,如本文报道的一个方面是重组生产包含二肽AR(SEQ ID NO:06)的多肽的方法,其特征在于所述方法包括以下步骤:
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽,
其中包含在所述多肽中的二肽AR由寡核苷酸gca cgt(SEQ ID NO:03),或寡核苷酸gcg cgt(SEQ ID NO:04),或寡核苷酸gcc cgt(SEQ IDNO:05)编码。
因此,如本文报道的一个方面是重组生产包含二肽AR(SEQ ID NO:06)的多肽的方法,其特征在于所述方法包括以下步骤:
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽,
其中包含在编码所述多肽的核酸中的编码二肽AR的寡核苷酸在第四位具有核苷酸‘c’。
在一个实施方案中,编码所述二肽AR的寡核苷酸包含编码氨基酸A的密码子(选自gct,gcc,gca和gcg的密码子)和编码氨基酸R的密码子(选自cgt,cgc,cga和cgg的密码子)。
在一个实施方案中,编码所述二肽AR的寡核苷酸选自包含寡核苷酸gct cgt,gct cgc,gct cga,gct cgg,gcc cgt,gcc cgc,gcc cga,gcc cgg,gca cgt,gca cgc,gca cga,gca cgg,gcg cgt,gcg cgc,gcg cga,和gcg cgg的组。
在一个实施方案中,编码所述二肽AR的寡核苷酸选自包含寡核苷酸gca cgt(SEQ ID NO:03),gcg cgt(SEQ ID NO:04),和gcc cgt(SEQ ID NO:05)的组。
在一个实施方案中,所述方法包括以下步骤:
-提供包含编码所述多肽的核酸的细胞,
-培养所述细胞(在适于表达所述多肽的条件下),
-从细胞或培养基回收所述多肽。
-任选地以一个或更多个层析步骤纯化生产的多肽。
在一个实施方案中,通过在编码二肽AR的寡核苷酸gcg agg(SEQ IDNO:01),或寡核苷酸gcg aga(SEQ ID NO:02)中取代二至三个核苷酸以获得寡核苷酸gca cgt(SEQ ID NO:03),或寡核苷酸gcg cgt(SEQ ID NO:04),或寡核苷酸gcc cgt(SEQ ID NO:05),来获得包含编码二肽AR的寡核苷酸gca cgt(SEQ ID NO:03),或寡核苷酸gcg cgt(SEQ ID NO:04),或寡核苷酸gcc cgt(SEQ ID NO:05)的编码所述多肽的核酸。
在一个实施方案中,以一至五个层析步骤纯化生产的多肽。在一个实施方案中,以二至四个层析步骤纯化生产的多肽。在一个实施方案中,以三个层析步骤纯化生产的多肽。
一般的层析方法和其用途对于本领域技术人员来说是已知的。参见例如,Chromatography,第5版,Part A:Fundamentals and Techniques,Heftmann,E.(编辑),Elsevier Science Publishing Company,纽约(1992);AdvancedChromatographic and Electromigration Methods in Biosciences,Deyl,Z.(编辑),Elsevier Science BV,Amsterdam,荷兰(1998);Chromatography Today,Poole,C.F,和Poole,S.K.,Elsevier Science Publishing Company,纽约(1991);Scopes,Protein Purification:Principles and Practice(1982);Sambrook,J.,等人(编辑),Molecular Cloning:A Laboratory Manual,第二版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989);或CurrentProtocols in Molecular Biology,Ausubel,FM.,等人(编辑),John Wiley&Sons,Inc.,纽约(1997)。
如本文报道的一个方面是编码在其氨基酸序列中包含二肽AR的多肽的核酸,其中所述二肽AR由寡核苷酸gca cgt(SEQ ID NO:03),或寡核苷酸gcg cgt(SEQ ID NO:04),或寡核苷酸gcc cgt(SEQ ID NO:05)编码。
如本文报道的一个方面是包含如本文报道的核酸的细胞。
如本文报道的一个方面是寡核苷酸gca cgt(SEQ ID NO:03),或寡核苷酸gcg cgt(SEQ ID NO:04),或寡核苷酸gcc cgt(SEQ ID NO:05)用于编码包含在多肽中的二肽AR的用途。
如本文报道的一个方面是在包含二肽AR的多肽的重组生产过程中减少副产物形成的方法,所述方法包括以下步骤:
-在编码多肽的核酸中,取代编码二肽AR的寡核苷酸gcg agg(SEQID NO:01),或寡核苷酸gcg aga(SEQ ID NO:02)中的二至三个核苷酸以获得寡核苷酸gca cgt(SEQ ID NO:03),或寡核苷酸gcg cgt(SEQ ID NO:04),或寡核苷酸gcc cgt(SEQ ID NO:05),从而产生取代的编码多肽的核酸,和
-从包含编码所述多肽的取代的核酸的细胞或包含编码所述多肽的取代的核酸的细胞的培养物的培养基回收所述多肽并从而在包含二肽AR的多肽的重组生产过程中减少副产物形成。
如本文报道的一个方面是增加重组生产的包含二肽AR的多肽的表达的方法,所述方法包含以下步骤:
-在编码多肽的核酸中,取代编码二肽AR的寡核苷酸gcg agg(SEQID NO:01),或寡核苷酸gcg aga(SEQ ID NO:02)中的二至三个核苷酸以获得寡核苷酸gca cgt(SEQ ID NO:03),或寡核苷酸gcg cgt(SEQ ID NO:04),或寡核苷酸gcc cgt(SEQ ID NO:05),从而产生取代的编码多肽的核酸,并且
-从包含编码多肽的取代的核酸的细胞或包含编码多肽的取代的核酸的细胞的培养物的培养基回收所述多肽并从而增加包含二肽AR的多肽的表达。
在一个实施方案中,所述方法包含以下进一步步骤中的一个或更多个:
-提供包含二肽AR的多肽的氨基酸序列或编码核酸,和/或
-用编码所述多肽的取代的核酸转染细胞,和/或
-培养转染有取代的核酸的细胞(在适于表达所述多肽的条件下),和/或
-从细胞或培养基回收所述多肽,和/或
-任选地以一个或更多个层析步骤纯化生产的多肽。
在一个实施方案中以一至五个层析步骤纯化生产的多肽。在一个实施方案中,以二至四个层析步骤纯化生产的多肽。在一个实施方案中,以三个层析步骤纯化生产的多肽。
以下以在原核细胞中生产的重组多肽,即在大肠杆菌中生产的四连蛋白-载脂蛋白A-I融合多肽举例证明如本文报道的方法。
四连蛋白-载脂蛋白A-I融合多肽包含(在N-末端至C-末端方向)人四连蛋白三聚化结构元件和野生型人载脂蛋白A-I。人四连蛋白三聚化结构元件的氨基酸序列可以截短前9个氨基酸,这样,以位置10的异亮氨酸残基(天然存在的截短位点)起始。作为该截短的结果,位置4的苏氨酸残基的O-糖基化位点被删除。四连蛋白三聚化结构元件和人载脂蛋白A-I间的五个氨基酸残基SLKGS(SEQ ID NO:08)被移除。
为了改善的表达和纯化,可以构建包含N-末端纯化标签,例如六组氨酸-标签,和用于移除纯化标签的蛋白酶切割位点的构建体。在一个实施方案中,所述蛋白酶是IgA蛋白酶,并且所述蛋白酶切割位点是IgA蛋白酶切割位点。作为蛋白酶的特异切割的结果,蛋白酶切割位点的一些氨基酸残基保留在多肽的N-末端,即在IgA蛋白酶切割位点的情况下,两个氨基酸残基-如第一丙氨酸或甘氨酸或丝氨酸或苏氨酸和如第二脯氨酸-被保留在多肽,例如四连蛋白-载脂蛋白A-I融合多肽的N-末端。
四连蛋白三聚化结构元件提供允许形成四连蛋白-载脂蛋白A-I同源三聚体的结构域,所述同源三聚体通过每个个体四连蛋白-载脂蛋白A-I单体之间的非共价相互作用构成。
在一个实施方案中,所述载脂蛋白A-I融合多肽是包含保守氨基酸取代的变体。
在一个实施方案中,所述四连蛋白-载脂蛋白A-I融合多肽包含表达和纯化标签,并具有以下氨基酸序列
CDLPQTHSLGSHHHHHHGSVVAPPAPIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ(SEQ ID NO:09).
在一个实施方案中,所述四连蛋白-载脂蛋白A-I融合多肽(IVN)具有以下氨基酸序列
IVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ(SEQ ID NO:10).
因此,在一个实施方案中,所述四连蛋白-载脂蛋白A-I融合多肽(PIVN)具有以下氨基酸序列
PIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ(SEQ ID NO:11).
在一个实施方案中,所述四连蛋白-载脂蛋白A-I融合多肽(XPIVN)具有以下氨基酸序列
(G,S,T)PIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ(SEQ ID NO:12).
因此,在一个实施方案中,所述四连蛋白-载脂蛋白A-I融合多肽(APIVN)具有以下氨基酸序列
APIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ(SEQ ID NO:13).
在一个实施方案中,所述包含六组氨酸标签的四连蛋白-载脂蛋白A-I融合多肽(XIVN)具有以下氨基酸序列
HHHHHHXIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ(SEQ IDNO:14),
其中X可以是以下氨基酸序列中的任一个:A,G,S,P,AP,GP,SP,PP,GSAP(SEQ IDNO:15),GSGP(SEQ ID NO:16),GSSP(SEQ IDNO:17),GSPP(SEQ ID NO:18),GGGS(SEQ ID NO:19),GGGGS(SEQ IDNO:20),GGGSGGGS(SEQ ID NO:21),GGGGSGGGGS(SEQ ID NO:22),GGGSGGGSGGGS(SEQ ID NO:23),GGGGSGGGGSGGGGS(SEQ IDNO:24),GGGSAP(SEQ ID NO:25),GGGSGP(SEQ ID NO:26),GGGSSP(SEQ ID NO:27),GGGSPP(SEQ ID NO:28),GGGGSAP(SEQ ID NO:29),GGGGSGP(SEQ ID NO:30),GGGGSSP(SEQ ID NO:31),GGGGSPP(SEQ IDNO:32),GGGSGGGSAP(SEQ ID NO:33),GGGSGGGSGP(SEQ ID NO:34),GGGSGGGSSP(SEQ ID NO:35),GGGSGGGSPP(SEQ ID NO:36),GGGSGGGSGGGSAP(SEQ ID NO:37),GGGSGGGSGGGSGP(SEQ IDNO:38),GGGSGGGSGGGSSP(SEQ ID NO:39),GGGSGGGSGGGSPP(SEQID NO:40),GGGGSAP(SEQ ID NO:41),GGGGSGP(SEQ ID NO:42),GGGGSSP(SEQ ID NO:43),GGGGSPP(SEQ ID NO:44),GGGGSGGGGSAP(SEQ ID NO:45),GGGGSGGGGSGP(SEQ ID NO:46),GGGGSGGGGSSP(SEQ ID NO:47),GGGGSGGGGSPP(SEQ ID NO:48),GGGGSGGGGSGGGGSAP(SEQ ID NO:49),GGGGSGGGGSGGGGSGP(SEQID NO:50),GGGGSGGGGSGGGGSSP(SEQ ID NO:51),和GGGGSGGGGSGGGGSPP(SEQ ID NO:52).
必须指出的是,如果多肽在大肠杆菌菌株中重组生产,N-末端甲硫氨酸残基通常不被大肠杆菌蛋白酶有效切除。因此,N-末端甲硫氨酸残基部分存在于生产的多肽中。
在大肠杆菌中重组生产SEQ ID NO:09的四连蛋白-载脂蛋白A-I融合多肽。可以检测到主要的副产物。
在IgA蛋白酶切割之后,通过Edmann测序和Lys-C肽图谱分析(peptide mapping)(LC-ESI-MS/MS),检测N-末端氨基酸序列。序列对应于四连蛋白-载脂蛋白A-I融合多肽的N-末端氨基酸序列(APIVNAKKDVVN=SEQ ID NO:13的氨基酸残基1-12)。
通过自上而下(top-down)MS,不能检测对应于SEQ ID NO:13的全长C-末端氨基酸片段。可以发现SEQ ID NO:13的残基1至105的片段。
通过Lys-C肽图谱分析(LC-ESI-MS/MS),也不能检测C-末端肽。可以观察到来自SEQ ID NO:13的氨基酸残基1至224的所有肽。
因此,从编码核酸的偏离发生在SEQ ID NO:13的从残基225至残基230的氨基酸范围内。
已经发现自目的氨基酸序列的偏离发生在编码具有SEQ ID NO:09的氨基酸序列的四连蛋白-载脂蛋白A-I融合多肽的核酸的位置760的核苷酸‘a’(对应于SEQ ID NO:09的氨基酸位置254),其在转录或翻译过程中不被处理。
偏离发生在编码二肽AR的寡核苷酸的以核苷酸‘a’起始的密码子处(参见图1)。二肽AR存在于SEQ ID NO:09的氨基酸序列的4个位置,即在位置196-197处,在位置218-219处,在位置242-243处,和在位置253-254处。如上文概述的,对于AR二肽,仅在SEQ ID NO:09的位置253-254观察到由于1->2移码导致的副产物的形成。这更加出人意料,因为在从SEQ ID NO:09的位置215至位置219的区域(在总共5个氨基酸残基内包含3个精氨酸残基并且也包含二肽AR)中,不能检测到1->2移码。
如在下表中显示的编码SEQ ID NO:09中的个体二肽AR。
表.
二肽AR的位置 编码核酸序列
196-197 gca cgt
218-219 gca cgt
242-243 gcg cgt
253-254 gcg agg
因此,已经发现包含在编码更大多肽的核酸中的编码二肽AR的寡核苷酸应该选自寡核苷酸gca cgt(SEQ ID NO:03),gcg cgt(SEQ ID NO:04),和gcc cgt(SEQ ID NO:05)。已经发现编码二肽AR的寡核苷酸中的第四个核苷酸不应该是‘a’。
提供以下实施例,序列表和图以帮助理解本发明,其真正范围列于所附的权利要求中。人们理解,可以在不偏离本发明的精神的情况下,在所列出的工序中进行修饰。
序列表描述
SEQ ID NO:01寡核苷酸gcg agg。
SEQ ID NO:02寡核苷酸gcg aga。
SEQ ID NO:03寡核苷酸gca cgt。
SEQ ID NO:04寡核苷酸gcg cgt。
SEQ ID NO:05寡核苷酸gcc cgt。
SEQ ID NO:06二肽AR。
SEQ ID NO:07人载脂蛋白A-I。
SEQ ID NO:08移除的SLKGS多肽。
SEQ ID NO:09包含表达和纯化标签的四连蛋白-载脂蛋白A-I融合多肽。
SEQ ID NO:10四连蛋白-载脂蛋白A-I融合多肽(IVN)。
SEQ ID NO:11四连蛋白-载脂蛋白A-I融合多肽(PIVN)。
SEQ ID NO:12四连蛋白-载脂蛋白A-I融合多肽(XPIVN)。
SEQ ID NO:13四连蛋白-载脂蛋白A-I融合多肽(APIVN)。
SEQ ID NO:14包含六组氨酸标签的四连蛋白-载脂蛋白A-I融合多肽(XIVN)。
SEQ ID NO:15至52接头多肽。
SEQ ID NO:53主要副产物的C-末端氨基酸序列。
SEQ ID NO:54干扰素片段。
SEQ ID NO:55六组氨酸标签。
SEQ ID NO:56IgA蛋白酶切割位点。
附图描述
图1编码四连蛋白-载脂蛋白融合多肽的核酸中核苷酸a760的缺失(Deletion)或遗漏(skipping)导致1->2移码和翻译过程在下一密码子的立即终止。
材料和方法
蛋白质确定:
通过使用基于氨基酸序列计算的摩尔消光系数确定280nm处的光密度(OD),确定蛋白质浓度。
重组DNA技术:
如在Sambrook,J.,等人,Molecular cloning:A laboratory manual,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,New York 1989描述的使用标准方法操作DNA。根据制造商的使用说明使用分子生物学试剂。
实施例1
大肠杆菌表达质粒的制备和描述
通过重组方法制备四连蛋白-载脂蛋白A-I融合多肽。以N-末端至C-末端方向表达的融合多肽的氨基酸序列如下:
-氨基酸甲硫氨酸(M),
-具有CDLPQTHSL(SEQ ID NO:54)的氨基酸序列的干扰素序列片段,
-GS接头,
-具有HHHHHH(SEQ ID NO:55)的氨基酸序列的六组氨酸标签,
-GS接头,
-具有VVAPPAP(SEQ ID NO:56)的氨基酸序列的IgA蛋白酶切割位点,和
-具有SEQ ID NO:10的氨基酸序列的四连蛋白-载脂蛋白A-I。
如上文描述的四连蛋白-载脂蛋白A-I融合多肽为前体多肽,使用IgA蛋白酶的体外酶切割从所述前体多肽释放最终四连蛋白-载脂蛋白A-I融合多肽。
用已知的重组方法和技术,通过将合适的核酸片段连接组装编码所述前体多肽的融合基因。通过DNA测序验证通过化学合成制备的核酸序列。如下制备用于生产编码SEQ ID NO:09的融合多肽的SEQ ID NO:10的四连蛋白-载脂蛋白A-I融合多肽的表达质粒。
制备大肠杆菌表达质粒:
质粒4980(4980-pBRori-URA3-LACI-SAC)是用于在大肠杆菌中表达核心链霉亲和素的表达质粒。其通过将源自质粒1966(1966-pBRori-URA3-LACI-T-重复;在EP-B 1422237中报道的)的3142bp长的EcoRI/CelII-载体片段与435bp长的编码核心链霉亲和素的EcoRI/CelII-片段连接产生。
核心链霉亲和素大肠杆菌表达质粒包含以下元件:
-来自载体pBR322的用于在大肠杆菌中复制的复制起点(根据Sutcliffe,G.,等人,Quant.Biol.43(1979)77-90,对应于bp位置2517-3160),
-酿酒酵母(Saccharomyces cerevisiae)的编码乳清苷5’-磷酸脱羧酶的URA3基因(Rose,M.,等人,Gene 29(1984)113-124),其允许通过补充大肠杆菌pyrF突变株(尿嘧啶营养缺陷型)进行质粒选择,
-核心链霉亲和素表达盒,所述表达盒包含
-T5杂合启动子(根据Bujard,H,等人,Methods.Enzymol.155(1987)416-433和Stueber,D.,等人,Immunol.Methods IV(1990)121-152的T5-PN25/03/04杂合启动子),其包括根据Stueber,D.,等人(见前)的合成的核糖体结合位点,
-核心链霉亲和素基因,
-两个源自噬菌体的转录终止子,λ-T0终止子(Schwarz,E.,等人,Nature 272(1978)410-414)和fd-终止子(Beck,E.和Zink,B.,Gene 1-3(1981)35-58),
-来自大肠杆菌的lacI抑制子基因(Farabaugh,PJ.,Nature 274(1978)765-769)。
通过使用单侧的(singular flanking)EcoRI和CelII限制性内切酶切割位点从载体4980切除核心链霉亲和素结构基因并将侧面连接有编码所述前体多肽的核酸的EcoRII/CelII限制性位点插入3142bp长的EcoRI/CelII-4980载体片段中制备用于表达四连蛋白-载脂蛋白A-I前体多肽的最终表达质粒。
实施例2
四连蛋白-载脂蛋白A-I的表达
为了表达所述融合蛋白,使用了通过补充大肠杆菌营养缺陷型(PyrF)能够进行无抗生素质粒选择的大肠杆菌宿主/载体系统(参见EP 0972838和US 6,291,245)。
用表达质粒p(IFN-His6-IgA-四连蛋白-载脂蛋白A-I)通过电穿孔转化大肠杆菌K12株CSPZ-2(leuB,proC,trpE,th-1,ΔpyrF)。将转化的大肠杆菌细胞首先在琼脂平板上于37℃生长。
发酵方案1:
为了预发酵,使用补充以约1g/l L-亮氨酸,约1g/l L-脯氨酸和约1mg/l硫胺-HCl的根据Sambrook等人(Molecular Cloning:A Laboratorymanual,Cold Spring Harbor Laboratory Press;第2版(1989年12月)的M9培养基。
为了预发酵,用得自初级种子库安瓿的2ml接种具有隔板的1000ml锥形烧瓶中的300ml的M9-培养基。在旋转摇床上在37℃进行培养13个小时,直到获得1-3的光密度(578nm)。
为了发酵,使用根据Riesenberg,等人的分批(batch)培养基(Riesenberg,D.,等人,J.Biotechnol.20(1991)17-27):27.6g/l葡萄糖*H2O,13.3g/l KH2PO4,4.0g/l(NH4)2HPO4,1.7g/l柠檬酸盐,1.2g/l MgSO4*7H2O,60mg/l柠檬酸铁(III),2.5mg/l CoCl2*6H2O,15mg/l MnCl2*4H2O,1.5mg/l CuCl2*2H2O,3mg/l H3BO3,2.5mg/l Na2MoO4*2H2O,8mg/lZn(CH3COO)2*2H2O,8.4mg/l Titriplex III,1.3ml/l Synperonic 10%消泡剂。将所述分批培养基分别补充以5.4mg/l硫胺-HCl和1.2g/l L-亮氨酸和L-脯氨酸。补料(feed)1溶液包含补充以19.7g/l MgSO4*7H2O的700g/l葡萄糖。用于pH调节的碱性溶液为分别补充以50g/l L-亮氨酸和50g/l L-脯氨酸的12.5%(w/v)NH3水溶液。将所有组分溶解于去离子水中。
在10l Biostat C DCU3发酵罐(Sartorius,Melsungen,德国)中进行发酵。以6.4l无菌发酵分批培养基加上300ml来自预发酵的接种物起始,在37℃,pH 6.9±0.2,500mbar和10l/min的通气速率进行分批发酵。在初始补充的葡萄糖用尽后,将温度改变至28℃并且进入发酵补料分批(fed-bach)模式。这里,通过加入补料1与不断增加的搅拌速度(在10小时内从550rpm至1000rpm和16小时内从1000rpm至1400rpm)和通气速率(10小时内从10l/min至16l/min和在5小时内从16l/min至20l/minin)联合将溶解的氧(pO2)的相对值保持在50%(DO-stat,参见例如Shay,L.K.,等人,J.Indus.Microbiol.Biotechnol.2(1987)79-85)。当在约8小时的培养后pH达到更低的调节极限(6.70)时,由加入碱性溶液引起补充以另外的氨基酸。通过在光密度70时加入1mM IPTG诱导重组治疗性蛋白的表达。
在发酵的最后,以加热步骤(在收获之前将发酵罐中的全部培养液加热至50℃达1或2小时)将细胞质的和可溶表达的四连蛋白-载脂蛋白A-I转换至不溶的蛋白质聚集体(所谓的包涵体)(参见例如EP-B 1 486 571)。之后,以无逆流离心机(flow-through centrifuge)离心发酵罐的内含物(13,000rpm,13l/h)并且将收获的生物质储存在-20℃,直到进一步处理。仅在不溶的细胞碎片部分发现不溶的蛋白质聚集体(所谓的包涵体(IBs))形式的合成的四连蛋白-载脂蛋白A-I前体蛋白质。
以SDS-聚丙烯酰胺凝胶电泳分析取自发酵罐的样品(一个为诱导前的并且其它的为诱导蛋白表达后的特定时间点的)。从每个样品,将相同量的细胞(OD=5)重悬在5mL PBS缓冲液中,并于冰上通过超声破碎。随后离心100μL的各个悬液(15,000rpm,5分钟)并且回收各个上清并转移至分开的小瓶。这是为了对可溶的和不溶的表达的靶蛋白质间进行区分。对于各个上清(=可溶的)部分,加入300μL SDS上样缓冲液并且对于各个沉淀(=不溶的)部分,加入400μL SDS上样缓冲液(Laemmli,U.K.,Nature 227(1970)680-685)。在震荡条件下于95℃加热样品15分钟以溶解和还原样品中的所有蛋白质。在冷却至室温之后,将5μL各个样品转移至4-20%TGX Criterion Stain Free聚丙烯酰胺凝胶(Bio-Rad)。此外,将5μl分子量标准(Precision Plus蛋白质标准,Bio-Rad)和3个量(0.3μl,0.6μl和0.9μl)的具有已知产物蛋白质浓度(0.1μg/μl)的定量标准置于胶上。
在200V运行电泳60分钟并且之后将凝胶转移至GelDOC EZ成像仪(Bio-Rad)并且用UV辐射处理5分钟。使用Image Lab分析软件(Bio-Rad)分析凝胶图像。以三个标准,用>0.99的相关系数计算线性回归曲线并且由此计算原样品中靶蛋白的浓度。
发酵方案2:
为了预发酵,使用补充以约1g/l L-亮氨酸,约1g/l L-脯氨酸和约1mg/l硫胺-HCl的根据Sambrook等人(Molecular Cloning:A Laboratorymanual,Cold Spring Harbor Laboratory Press;第2版(1989年12月)的M9培养基。
为了预发酵,从琼脂平板或用得自初级种子库安瓿的1-2ml接种具有隔板的1000ml锥形烧瓶中的300ml改良的M9-培养基。在旋转摇床上在37℃进行培养13个小时,直到获得1-3的光密度(578nm)。
为了发酵和高产率表达四连蛋白-载脂蛋白A-I,使用以下分批培养基和补料:
8.85g/l葡萄糖,63.5g/l酵母提取物,2.2g/l NH4Cl,1.94g/l L-亮氨酸,2.91g/l L-脯氨酸,0.74g/l L-甲硫氨酸,17.3g/l KH2PO4*H2O,2.02g/lMgSO4*7H2O,25.8mg/l硫胺-HCl,1.0ml/l Synperonic 10%消泡剂。补料1溶液包含333g/l酵母提取物和333g/l 85%-甘油,各补充以1.67g/l L-甲硫氨酸和5g/l L-亮氨酸和L-脯氨酸。补料2为600g/l L-脯氨酸溶液。用于pH调节的碱性溶液为10%(w/v)KOH溶液并且使用75%葡萄糖溶液作为酸。将所有组分溶解于去离子水。
在10l Biostat C DCU3发酵罐(Sartorius,Melsungen,Germany)中进行发酵。以5.15l无菌发酵分批培养基加上300ml来自预发酵的接种物起始,在25℃,pH 6.7±0.2,300mbar和10l/min的通气速率进行补料分批发酵。在初始补充的葡萄糖耗尽之前,培养物达到光密度15(578nm)并且当以70g/h开始补料1时,发酵进入补料分批分批模式。监控培养物中的葡萄糖浓度,在避免葡萄糖积聚和保持pH接近6.9的调节上限的同时增加补料1至150g/h的最大值。在50的光密度(578nm),以10ml/h的连续补料速率起始补料2。通过平行增加搅拌速度(500rpm至1500rpm),通气速率(从10l/min至20l/min)和压力(从300mbar至500mbar)将溶解的氧(pO2)的相对值保持大于50%。通过在90的光密度加入1mM IPTG诱导重组治疗性蛋白的表达。
用SDS-聚丙烯酰胺凝胶电泳分析取自发酵罐的七个样品(一个是诱导前的并且其它的是在诱导蛋白质表达后的特定时间点的)。从每个样品将相同量的细胞(OD=5)重悬在5mL PBS缓冲液中并于冰上通过超声破碎。随后将100μL的各个悬液离心(15,000rpm,5分钟)并回收各个上清并转移至分开的小瓶。这是为了将可溶的和不溶的表达的靶蛋白间相区别。对于各个上清(=可溶的)部分,加入300μL SDS上样缓冲液并且对于各个沉淀(=不溶的)部分,加入200μL SDS上样缓冲液(Laemmli,U.K.,Nature 227(1970)680-685)。在震荡条件下于95℃加热样品15分钟以溶解和还原样品中的所有蛋白质。在冷却至室温之后,将5μL各个样品转移至10%Bis-Tris聚丙烯酰胺凝胶(Novagen)。此外,将5μl分子量标准(Precision Plus蛋白质标准,Bio-Rad)和3个量(0.3μl,0.6μl和0.9μl)的具有已知产物蛋白质浓度(0.1μg/μl)的定量标准置于胶上。
在200V运行电泳35分钟并随后将凝胶用考马斯亮蓝R染料染色,用加热的水脱色并转移至光密度计以数字化(GS710,Bio-Rad)。使用QuantityOne 1-D分析软件(Bio-Rad)分析凝胶图像。以三个标准,用>0.98的相关系数计算线性回归曲线并且由此计算原样品中靶蛋白的浓度。
在发酵的最后,以加热步骤(在收获之前将发酵罐中的全部培养液加热至50℃达1或2小时)将细胞质的和可溶表达的四连蛋白-载脂蛋白A-I转换至不溶的蛋白质聚集体(所谓的包涵体)(参见例如EP-B 1 486 571)。加热步骤后,仅在不溶的细胞碎片部分发现IBs形式的合成的四连蛋白-载脂蛋白A-I前体蛋白质。
将发酵罐的内含物冷却至4-8℃,以无逆流离心机(flow-throughcentrifuge)离心发酵罐的内含物(13,000rpm,13l/h)并且将收获的生物质储存在-20℃,直到进一步处理。收获的生物质总产量依赖于表达的构建体范围在39g/l和90g/l干燥物质之间。
实施例3
四连蛋白-载脂蛋白A-I的制备
通过将收获的细菌细胞重悬于磷酸钾缓冲溶液(0.1M,补充以1mMMgSO4,pH 6.5)进行包涵体制备。加入DNAse后,通过在900bar的压力匀浆破碎细胞。将包含1.5M NaCl的缓冲溶液加入匀浆的细胞悬液。在以25%(w/v)HCl将pH值调节至5.0后,在进一步离心步骤后获得最终的包涵体浆。于-20℃将浆储存在一次性、无菌塑料袋中,直到进一步处理。
将11.75g包涵体在235ml 6M盐酸胍,50mM Tris,1mM DTT,pH8.0中溶解3.5小时。离心后,将溶解物(solubilisate)上样于在50mM Tris,1M NaCl,8M脲,pH 8.0中平衡的NiNTA柱(Qiagen)上。之后将柱用50mM Tris,6M盐酸胍,pH 8.0冲洗,然后以50mM Tris,8M脲,pH 8.0和50mM Tris,60%异丙醇(5个循环)交替洗涤,最后的步骤为50mM Tris,8M脲,pH 8.0。以在50mM Tris,0.5M NaCl,8M脲,pH 7.0开始至50mM Tris,0.5M NaCl,8M脲,pH 3.0的pH梯度进行洗脱。汇集峰级分并针对100mM Tris,100mM NaCl,pH 7.8透析。
用IgA蛋白酶的切割以1∶2000w/w(IgA蛋白酶∶蛋白质)的比例RT进行24h。针对25mM乙酸钠,1mM Tris,pH 4.5透析该溶液。加入脲至8M的终浓度。将该蛋白溶液加载在用缓冲液25mM乙酸钠,1mM Tris,8M脲,pH 4.5平衡的SP-琼脂糖(GE)上并且以至25mM乙酸钠,1mMTris,0.3M NaCl,8M脲,pH 4.5的梯度洗脱。根据SDS-PAGE汇集级分并针对50mM Tris,250mM NaCl,pH 7.5透析。
实施例4
四连蛋白-载脂蛋白A-I融合多肽的分析
将来自NiNTA(Qiagen)和SP-琼脂糖(TM)(GE)纯化柱的汇集体或级分脱盐并通过电喷雾电离质谱(ESI-MS)分析。
通过使用以交联葡聚糖(Sephadex)G25超细填料(AmershamBioscience 17-0851-01)内部填充的HR5/20柱(0.7x 22cm,AmershamBioscience)的尺寸排阻层析和以流速为1ml/min的40%乙腈,2%甲酸的等度洗脱进行脱机脱盐。在280nm波长监控信号,并手动收集四连蛋白-载脂蛋白融合多肽洗脱峰。
在装有Triversa NanoMate源系统(Advion,Ithaka,USA)的Q-Star EliteQTOF质谱仪(Applied Biosystems(ABI),Darmstadt,德国)上,使用分离电位(declustering potential)50和聚焦电位(focusing potential)200进行监控片段的存在的ESI-MS。以范围为700至2000的m/z每5秒记录15次扫描。
使用两个软件包,Analyst(Applied Biosystems(ABI),Darmstadt,德国)和MassAnalyzer(内部开发的软件平台)分析ESI-MS数据。手动核对质谱中带有由各自的编码AR二肽的寡核苷酸处的移码导致的蛋白质片段的分子量的信号的存在(与全长融合多肽的预期分子量相比较的-6269Da的Δ)。

Claims (8)

1.一种在包含二肽AR(SEQ ID NO:06)的多肽的生产中减少由1->2移码导致的副产物形成的方法,其特征在于所述方法包括以下步骤:
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽,从而生产所述多肽,
其中包含在编码所述多肽的核酸中的编码所述二肽AR的寡核苷酸在第四位具有核苷酸‘c’。
2.一种在包含二肽AR(SEQ ID NO:06)的多肽的重组生产中减少由1->2移码导致的副产物形成的方法,其特征在于所述方法包含以下步骤:
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽,从而生产所述多肽,
其中包含在所述多肽中的二肽AR由寡核苷酸gca cgt(SEQ ID NO:03),或寡核苷酸gcg cgt(SEQ ID NO:04),或寡核苷酸gcc cgt(SEQ IDNO:05)编码。
3.根据权利要求1所述的方法,其特征在于包含在所述多肽中的二肽AR由寡核苷酸gca cgt,或寡核苷酸gcg cgt,或寡核苷酸gcc cgt编码。
4.根据权利要求1至3任一项所述的方法,其特征在于所述细胞是原核细胞。
5.根据权利要求1至3任一项所述的方法,其特征在于所述原核细胞是大肠杆菌细胞。
6.根据权利要求1至5任一项所述的方法,其特征在于所述多肽是载脂蛋白A-I,或具有载脂蛋白A-I活性的其变体,或具有载脂蛋白A-I活性的其融合多肽。
7.根据权利要求6所述的方法,其特征在于所述多肽具有选自包含SEQ ID NO:09至SEQ ID NO:14的组的氨基酸序列。
8.根据权利要求1至7任一项所述的方法,其特征在于所述多肽具有SEQ ID NO:09或SEQ ID NO:11的氨基酸序列。
CN201380011005.8A 2012-02-29 2013-02-22 减少1->2读框移位的方法 Pending CN104136459A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP12157512 2012-02-29
EP12157512.0 2012-02-29
EP12162810 2012-04-02
EP12162810.1 2012-04-02
PCT/EP2013/053547 WO2013127700A1 (en) 2012-02-29 2013-02-22 Method for reduction of 1->2 reading frame shifts

Publications (1)

Publication Number Publication Date
CN104136459A true CN104136459A (zh) 2014-11-05

Family

ID=47780043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380011005.8A Pending CN104136459A (zh) 2012-02-29 2013-02-22 减少1->2读框移位的方法

Country Status (11)

Country Link
US (1) US9487576B2 (zh)
EP (1) EP2820040A1 (zh)
JP (1) JP2015513400A (zh)
KR (1) KR20140135716A (zh)
CN (1) CN104136459A (zh)
BR (1) BR112014020747A2 (zh)
CA (1) CA2860735A1 (zh)
HK (1) HK1198480A1 (zh)
MX (1) MX2014010082A (zh)
RU (1) RU2014137621A (zh)
WO (1) WO2013127700A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2014108240A (ru) 2011-08-25 2015-09-27 Ф. Хоффманн-Ля Рош Аг Укороченный тетранектин-аполипопротеин а-i гибридный белок, содержащая его липидная частица и их применения
EP3350201B1 (en) 2015-09-18 2022-02-16 Agrivida, Inc. Engineered phytases and methods of using the same

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995025786A1 (en) * 1994-03-21 1995-09-28 American Cyanamid Company Production of human apolipoprotein a1 in a bacterial expression system

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5204244A (en) 1987-10-27 1993-04-20 Oncogen Production of chimeric antibodies by homologous recombination
US5202238A (en) 1987-10-27 1993-04-13 Oncogen Production of chimeric antibodies by homologous recombination
US6291245B1 (en) 1998-07-15 2001-09-18 Roche Diagnostics Gmbh Host-vector system
EP0972838B1 (en) 1998-07-15 2004-09-15 Roche Diagnostics GmbH Escherichia coli host/vector system based on antibiotic-free selection by complementation of an auxotrophy
CA2443365C (en) 2002-11-19 2010-01-12 F. Hoffmann-La Roche Ag Methods for the recombinant production of antifusogenic peptides
EP1486571B1 (en) 2003-06-12 2005-12-14 F. Hoffmann-La Roche Ag Method for the recombinant production of polypeptides
WO2011143362A1 (en) * 2010-05-11 2011-11-17 Esperion Therapeutics, Inc. Dimeric oxidation-resistant apolipoprotein a1 variants

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995025786A1 (en) * 1994-03-21 1995-09-28 American Cyanamid Company Production of human apolipoprotein a1 in a bacterial expression system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GREEN: "Characterization of the mechanical unfolding of RNA rseudoknots", 《JOURNAL OF MOLECULAR BIOLOGY》 *

Also Published As

Publication number Publication date
JP2015513400A (ja) 2015-05-14
HK1198480A1 (zh) 2015-05-08
MX2014010082A (es) 2014-09-16
KR20140135716A (ko) 2014-11-26
EP2820040A1 (en) 2015-01-07
RU2014137621A (ru) 2016-04-20
BR112014020747A2 (pt) 2017-07-04
US9487576B2 (en) 2016-11-08
US20150056656A1 (en) 2015-02-26
WO2013127700A1 (en) 2013-09-06
CA2860735A1 (en) 2013-09-06

Similar Documents

Publication Publication Date Title
US20220290202A1 (en) Aminoacyl-trna synthetase efficiently introducing lysine derivatives
US20220170030A1 (en) Aminoacyl-trna synthetase for efficiently introducing lysine derivative in protein
CN111117977B (zh) 一种重组多肽连接酶原及其制备、激活方法与应用
MX2013001536A (es) Construccion de expresion procariotica.
JP2003504069A (ja) ヒト顆粒球コロニー刺激因子修飾体およびその生産方法
CN104136459A (zh) 减少1->2读框移位的方法
US7771970B2 (en) Process for preparation of polypeptides of interest from fusion polypeptides
CN104136460A (zh) 减少1->3读框移位的方法
AU2013234860B2 (en) Method of producing a recombinant peptide
KR102064810B1 (ko) 재조합 폴리펩타이드 생산용 n-말단 융합 파트너 및 이를 이용하여 재조합 폴리펩타이드를 생산하는 방법
JP2007501622A (ja) 組換えポリペプチドを精製するための方法
Murasugi et al. Efficient production of recombinant human pleiotrophin in yeast, Pichia pastoris
KR101364864B1 (ko) 인간 적혈구 형성 자극인자 발현 벡터 및 이를 이용한 인간 적혈구 형성 자극인자의 생산방법
KR102017542B1 (ko) 융합 폴리펩타이드를 이용하여 글루카곤 유사 펩타이드-2 또는 이의 유사체를 생산하는 방법
CN107217069B (zh) 原核表达载体及rbFGF-2表达方法与工程菌和应用
KR102017540B1 (ko) 융합 폴리펩타이드를 이용하여 글루카곤 유사 펩타이드-1 또는 이의 유사체를 생산하는 방법
EP2912173B1 (en) Process for preparation and purification of recombinant human oncostatin m protein
CN109153985B (zh) 转化体、以及转铁蛋白的制造方法
WO2019187691A1 (ja) コラゲナーゼ活性を有するポリペプチド及びその製造方法
Chakraborty et al. Overexpression and purification of recombinant eel calcitonin and its phylogenetic analysis
WO2013076657A1 (en) Map fusion protein
JPH07165792A (ja) 精製された蛋白質
JP2004236621A (ja) コートタンパク質遺伝子及びファージベクター

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1198480

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141105

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1198480

Country of ref document: HK