CN101679489B - 增加细菌内多肽表达的修饰的分泌系统 - Google Patents
增加细菌内多肽表达的修饰的分泌系统 Download PDFInfo
- Publication number
- CN101679489B CN101679489B CN200880014188.8A CN200880014188A CN101679489B CN 101679489 B CN101679489 B CN 101679489B CN 200880014188 A CN200880014188 A CN 200880014188A CN 101679489 B CN101679489 B CN 101679489B
- Authority
- CN
- China
- Prior art keywords
- secg
- host cell
- brachymemma
- bacillus
- bacterial host
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明提供了改变宿主细胞中所需多肽产量的方法。特别的,本发明提供了编码截短的SecG蛋白质的多核苷酸,所述蛋白质能够有利于细菌宿主细胞(例如芽胞杆菌属(Bacillus)物种)对所需蛋白酶的分泌,以及含有所述多核苷酸的表达载体和宿主细胞。
Description
交叉引用相关的申请
该申请要求于2007年5月10日提交申请的USSN 60/928,875的优先权,其通过引用全文并入到本文中。
发明领域
本发明提供了改变宿主细胞中所需多肽产量的方法。特别的,本发明提供了编码截短的SecG蛋白质的多核苷酸,所述蛋白质能够有利于细菌宿主细胞(例如芽胞杆菌属物种)对所需蛋白酶的分泌,以及含有所述多核苷酸的表达载体和宿主细胞。
背景
革兰氏阳性微生物,例如芽胞杆菌属的成员,部分由于其可以将它们发酵产物分泌到培养基中的能力,而可用于大规模的工业发酵。分泌蛋白质跨过细胞膜和细胞壁输出,然后释放到外部培养基中。多肽向周质空间或培养基中的分泌是工业发酵中需要认真考虑的重要课题。
微生物对异源多肽的分泌是工业中普遍使用的技术。典型的,可以用编码目标异源多肽的核酸转化细胞。然后,这些转化的细胞可以表达目标异源多肽,从而大量的分泌多肽。该技术可用于生产比天然生成的多肽多得多的大量多肽。上述表达的多肽具有多种工业应用,包括治疗性和农业用途,以及在食品、化妆品、清洁组合物、动物饲料等中的用途。本领域需要提供能够分泌异源多肽的宿主。
发明概述
本发明提供了改变宿主细胞内所需多肽的产量的方法。特别地,本发明提供了编码截短的SecG蛋白质的多核苷酸,所述蛋白质能够有利于细菌宿主细胞(例如芽胞杆菌属物种)对所需蛋白酶的分泌,以及含有所述多核苷酸的表达载体和宿主细胞。
本发明至少部分的基于这样的发现,所述发现是异源多肽在细菌多肽分泌系统内的分泌涉及一些蛋白质,可以修饰这些蛋白质并且仍然保持其功能,例如,可以截短、突变或缺失一些蛋白质,且仍然保持或者甚至增加了它们有利于多肽分泌的能力。因此,本发明教导的内容提供了能够有利于细菌宿主系统分泌所需多肽的多肽,包括该多肽的编码多核苷酸。此外,本发明教导的内容还提供了在细菌系统中利用这些多肽来产生异源多肽的方法。
在一个实施方案中,发明提供了分离的异源多肽,其编码异源的截短SecG,其能够有利于细菌宿主细胞分泌所需多肽。在一些实施方案中,用异源多核苷酸替换了细菌宿主细胞的内源性SecG的编码基因,在其它实施方案中,异源多核苷酸补充了(complement)细菌宿主细胞的内源性SecG的编码基因。在其它实施方案中,编码截短SecG的异源多肽与SEQ IDNO:11的截短SecG具有至少约50%同一性。在一些实施方案中,截短SecG包括全长异源SecG的区域,在一些实施方案中,所述区域包括全长SecG多肽的N-端前39个氨基酸。在其它一些实施方案中,截短SecG包括所述SecG的第一个跨膜结构域。在另一个实施方案中,发明提供了编码异源的截短SecG的分离的异源多核苷酸,所述异源截短SecG包括SEQ IDNO:1-9的SecG中任一个的前39个氨基酸,并能够有利于细菌宿主细胞分泌所需多肽。在其它实施方案中,发明的SecG是细菌SecG。发明涵盖了来自芽孢杆菌属物种或土芽孢杆菌属(Geobacillus)的SecG蛋白。
在另一个实施方案中,发明提供了表达载体,所述载体包含编码异源的截短SecG的分离的异源多核苷酸,其能够有利于细菌宿主细胞分泌所需多肽。
在另一个实施方案中,发明提供了编码异源的截短SecG的多肽,其由分离的异源多核苷酸编码,并能够有利于细菌宿主细胞分泌所需多肽。
另一个实施方案中,发明提供了在细菌宿主细胞中生产所需多肽的方法,包括(a)在所述细菌宿主细胞中表达异源SecG多肽,和(b)生产所述所需多肽。在一个实施方案中,异源SecG由截短的基因编码,所述基因替换了宿主细胞内的内源性SecG基因。在另一个实施方案中,异源SecG由全长基因编码,所述全长基因替换了宿主细胞内的内源性SecG基因。在另一个实施方案中,异源SecG是截短的多肽,包括选自SEQ IDNO:1-9的全长氨基酸序列的前39个氨基酸。在一些实施方案中,截短的SecG只包含一个跨膜区域。在另一个实施方案中,发明提供了在细菌宿主细胞中,生产与SEQ ID NO:26的碱性丝氨酸蛋白酶至少80%同一的细菌碱性丝氨酸蛋白酶的方法,包括(a)在所述细菌宿主细胞中表达异源SecG多肽,和(b)生产细菌碱性丝氨酸蛋白酶。在一些实施方案中,细菌宿主细胞不表达内源性SecG蛋白,而在其它实施方案中,宿主细胞表达内源性SecG。在其它实施方案中,与不表达异源性SecG的相应宿主细胞生产的所需多肽的量相比,异源性SecG能够增加宿主细胞生产的所需多肽的量。在一些实施方案中,发明提供了在细菌宿主细胞中生产所需多肽的方法,包括(a)在所述细菌宿主细胞中表达异源SecG多肽,和(b)生产所述所需多肽,还包括回收所述所需多肽。在一些实施方案中,所需多肽和异源性SecG源自第一菌株,其中第一菌株不同于宿主细胞。在一些实施方案中,第一菌株是克劳氏芽孢杆菌(Bacillus clausii),宿主细胞是枯草芽孢杆菌(B.subtilis)。在其它实施方案中,删除了所述宿主细胞内的内源性SecG基因。在另一个实施方案中,发明提供了包含编码异源性SecG的多核苷酸的细菌宿主细胞,其中,与不表达异源性SecG的相应宿主细胞的所需多肽的分泌相比,异源性SecG能够增加宿主细胞对所需多肽的分泌。在一个实施方案中,细菌宿主细胞是芽孢杆菌属的宿主细胞。在另一个实施方案中,细菌宿主细胞是枯草芽孢杆菌宿主细胞。在另一个实施方案中,细菌宿主细胞分泌的所需蛋白质是酶。在一些实施方案中,酶是丝氨酸蛋白酶。在其它实施方案中,所需多肽选自SEQ ID NO:25-29、36和28的蛋白酶,或其变体。在一些实施方案中,宿主细胞的内源性SecG基因被删除。在其它实施方案中,所述细胞的内源性SecG基因由编码异源SecG的异源secG基因补充。在其它实施方案中,由编码所述异源SecG的异源secG基因替换了所述细胞的内源secG基因。在一些实施方案中,异源SecG是截短的,而在其它实施方案中,异源SecG是全长SecG。
下文叙述了本发明教导内容的上述和其他特征。
附图简述
本领域技术人员可以理解,附图仅用于示例的目的。附图并非意在以任何方式限制本发明教导内容的范围。
图1显示了与不包含截短的克劳氏芽孢杆菌secG基因的对照宿主细胞(JS1009)中的Properase产量相比,枯草芽孢杆菌宿主细胞(JS1015)的Properase产量的增加,其中编码克劳氏芽孢杆菌的截短SecG的多核苷酸(SEQ ID NO:12)被整合到枯草芽孢杆菌的染色体中,以补充内源的枯草芽孢杆菌secG。
图2显示了大肠杆菌SecG的拓扑学模型(Satoh等人,Biochemistry42:7434-7441(2003))。
图3显示,来自克劳氏芽孢杆菌的截短SecG(SEQ ID NO:11)对枯草芽孢杆菌宿主细胞的蛋白酶V049(也称为Puramax;SEQ ID NO:26)产量的影响,在所述宿主细胞中截短的克劳氏芽孢杆菌secG基因替换了(CF375)内源性枯草芽孢杆菌基因,或补充了所述内源基因(CF371);以及全长克劳氏芽孢杆菌SecG(SEQ ID NO:10)对枯草芽孢杆菌宿主细胞的蛋白酶V049产量的影响,在所述宿主细胞中全长的克劳氏芽孢杆菌secG基因替换了(CF379)内源性枯草芽孢杆菌基因,上述结果是与表达V049的枯草芽孢杆菌宿主细胞的V049产量比较的,其中该宿主细胞不含有截短的或全长的克劳氏芽孢杆菌secG基因(CF363)。使用0.01%(v/v)接种物来起始细胞生长。
图4显示,表达来自克劳氏芽孢杆菌的截短SecG(SEQ ID NO:12)对枯草芽孢杆菌宿主细胞的蛋白酶Properase(SEQ ID NO:29)产量的影响,在所述宿主细胞中截短的克劳氏芽孢杆菌secG基因替换了(CF378)内源性枯草芽孢杆菌基因,或补充了所述内源基因(CF374);以及全长克劳氏芽孢杆菌SecG(SEQ ID NO:10)对枯草芽孢杆菌宿主细胞的蛋白酶Properase产量的影响,在所述宿主细胞中全长的克劳氏芽孢杆菌secG基因替换了(CF380)内源性枯草芽孢杆菌secG基因,上述结果是与表达Properase的枯草芽孢杆菌宿主细胞的Properase产量比较的,其中该宿主细胞不含有截短的或全长的克劳氏芽孢杆菌secG基因(CF381)。利用0.01%(V/V)接种物起始细胞生长。
图5显示,当用5%接种物起始细胞生长时,图3中描述的影响。
图6显示,来自克劳氏芽孢杆菌的截短SecG(SEQ ID NO:11)对枯草芽孢杆菌宿主细胞的突变蛋白酶V049-E33Q产量的影响,在所述宿主细胞中截短的克劳氏芽孢杆菌secG基因替换了(CF376)内源性枯草芽孢杆菌基因,或补充了所述内源基因(CF372);上述结果是与表达V049-E33Q(CF365)和V049(CF363)的枯草芽孢杆菌宿主细胞的V049-E33Q产量比较的,其中该宿主细胞不含有截短的克劳氏芽孢杆菌secG基因。
图7显示,来自克劳氏芽孢杆菌的截短SecG(SEQ ID NO:11)对枯草芽孢杆菌宿主细胞的突变蛋白酶V049-E33R产量的影响,在所述宿主细胞中截短的克劳氏芽孢杆菌secG基因替换了(CF377)内源性枯草芽孢杆菌基因,或补充了所述内源基因(CF373);上述结果是与表达V049-E33R(CF366)和V049(CF363)的枯草芽孢杆菌宿主细胞的V049-E33R产量比较的,其中该宿主细胞不含有截短的克劳氏芽孢杆菌secG基因。
图8显示,转化到枯草芽孢杆菌中的构建体的图,所述构建体用来自克劳氏芽孢杆菌的secG基因替换内源性枯草芽孢杆菌secG基因。
图9显示,与在枯草芽孢杆菌宿主(CF363)中的V049产量相比,删除内源性枯草芽孢杆菌secG基因对V049(CF396)产量的影响,前者中没有缺失内源性secG基因。
发明的详细描述
本发明提供了改变宿主细胞中所需多肽产量的方法。特别的,本发明提供了编码全长和截短的SecG蛋白质的多核苷酸,所述蛋白质能够有利于细菌宿主细胞(例如芽胞杆菌属物种)对所需蛋白酶的分泌,以及含有所述多核苷酸的表达载体和宿主细胞。
本发明的教导内容将通过参考文献详细的描述,仅使用下列定义和实例。本文中除非另外定义,本文中使用的所有的科学和技术术语都具有本发明所属领域的普通技术人员普遍理解的相同含义。数字范围包括定义所述范围的数值。本文提供的标题不是对各方面或实施方案的限制,其可以参考作为整体的说明书。因此,通过整体参考说明书可以更全面的定义下文定义的术语。
除非另外指出,本发明的实践涉及在分子生物学、微生物学、蛋白质纯化、蛋白质工程化、蛋白质和DNA测序,以及重组DNA领域的通常使用的常规技术,这在本领域的范围内。此类技术是本领域技术人员已知的,并描述在多本文件和参考书中(参见例如,Sambrook等人,“MolecularCloning:A Laboratory Manual”,第2版(冷泉港),[1989];和Ausubel等人,“Current Protocols in Molecular Biology”[1987])。本文上下文中提及的所有专利、专利申请、文献和出版物,都通过引用明确的整合到本文中。
除非另外指出,本文中使用的所有科技术语都具有本发明所属领域的普通技术人员普遍理解的相同含义。例如,Singleton和Sainsbury,Dictionary of Microbiology and Molecular Biology,第2版,John Wiley和Sons,NY(1994);和Hale和Markham,The Harper Collins Dictionary ofBiology,Harper Perennial,NY(1991),为本领域技术人员提供了本发明中使用的大部分术语的常规字典。虽然在本发明的实践中可以使用与本文描述的相似或等价的任何方法和材料,但是本文描述了优选的方法和材料。因此,通过整体参考说明书,可以更全面的描述下文定义的术语。此外,如本文中使用的,除非上下文清楚的指出,单数形式“一”、“一个”和“某个”包括了复数形式。数值范围包括了定义范围的数值。除非另外指出,核酸都按5’至3’方向由左至右书写;氨基酸序列都按氨基至羧基端方向由左至右书写。可以理解,本发明不限于所描述的特定方法学、规程和试剂,其可以根据本领域技术人员使用的背景而变化。
本说明书全文中给出的每个数值上限都意在包括每个更小的数值限定,就如同本文明确的书写了上述较小的数值限定。本说明书全文中给出的每个数值下限都意在包括每个更大的数值限定,就如同本文明确的书写了上述较大的数值限定。本说明书全文中给出的每个数值范围都将包括落入上述较宽数值范围内的每个较窄的数值范围,就如同本文明确的书写了上述较窄的数值范围。
此外,本文提供的标题不是发明的各方面或实施方案的限制,其可以作为对说明书的整体参考。因此,通过整体参考说明书,可以更全面的定义下文定义的术语。但是,为了帮助理解发明,一些术语定义如下。
定义
本文中使用的术语“多肽”指由通过肽键连接的氨基酸残基单链组成的化合物。本文中使用的术语“蛋白质”可与术语“多肽”互换的使用。
术语“核酸”和“多核苷酸”可互换的使用,涵盖了DNA、RNA、cDNA、单链或双链,及其化学修饰物。由于遗传密码是简并的,因此可以使用一种以上的密码子编码特定的氨基酸,本发明涵盖了编码特定氨基酸序列的所有多核苷酸。
当术语“重组”用于表示细胞、核酸、蛋白质或载体时,表示已经通过引入异源核酸或蛋白质,或改变天然的核酸或蛋白质来修饰了所述细胞、核酸、蛋白质或载体,或者所述细胞是源于上述修饰的细胞。因此,例如重组细胞表达在天然类型(非重组)的细胞中没有发现的核酸或多肽,或者表达天然基因,所述天然基因否则是异常表达的、低表达的、过表达的或完全不表达。
如本文中使用的,术语“基因”意指在生产多肽链中涉及的DNA片段,可以或可以不包括在编码区之前和之后的区域,例如5’非翻译(5’UTR)或“前导”序列,和3’UTR或“尾随”序列,以及位于单个编码片段(外显子)之间的间插序列(内含子)。
如本文中使用的,术语“天然基因”指天然发现的具有其自身调控序列的基因。“嵌合基因”指不是天然基因的任何基因,包括天然发现不在一起的调控和编码序列。因此,嵌合基因可以包括来自不同来源的调控序列和编码序列,或来自相同来源但以不同于天然发现的方式排列的调控序列和编码序列。在一些实施方案中,嵌合基因是与不是其天然启动子的启动子有效连接的内源基因。
如本文中使用的,术语“内源基因”指位于生物基因组的天然位置上的天然基因。“外源”或“异源”基因指通常在宿主生物体中未发现的基因,但其通过基因转移被引入宿主生物体中。外来基因可以包括插入到非天然生物体中的天然基因或嵌合基因。“转基因”是已通过转化程序被引入到基因组中的基因。
如本文中使用的,“融合核酸”包括有效的连接在一起的两种或多种核酸。核酸可以是DNA(基因组的和cDNA都包括在内),或者RNA,或RNA和DNA的杂合体。编码全部或部分多肽序列的核酸可用于构建融合核酸序列。在一些实施方案中,使用编码全长多肽的核酸。在一些实施方案中,可以使用编码部分多肽的核酸。
术语“嵌合多肽”和“融合多肽”在本文中可互换的使用,指包括至少两个分离的且不同区域的蛋白质,所述区域可以或可以不源自相同的蛋白质。例如,与目标蛋白质连接的信号肽可以定义为嵌合多肽或嵌合蛋白,其中信号肽不是通常与目标蛋白质连接的信号肽。
如本文中使用的,术语“启动子”指具有指导下游基因转录的功能的核酸序列。在待表达靶基因的宿主细胞中,启动子通常是合适的。对于表达给定的基因,启动子和其他转录和翻译调控核酸序列(也定义为“控制序列”)是必需的。一般而言,转录和翻译调控序列包括但不限于,启动子序列、核糖体结合位点、转录起始和终止序列,翻译起始和终止序列,以及增强子或激活子序列。
如本文中使用的,术语“有效的连接”意指转录和翻译调控核酸相对于编码序列位于这样的位置,所述位置可以起始转录。通常,这意指启动子和转录起始或开始序列位于编码区的5’。转录和翻译调控核酸通常对用于表达蛋白质的宿主细胞是合适的。本领域已知可用于多种宿主细胞的多种类型的合适表达载体,和合适的调控序列。
如本文中使用的,术语“表达”指基于基因的核酸序列生产多肽的过程。该过程包括转录和翻译。
涉及目标蛋白质(例如,蛋白酶)的术语“生产”和“分泌”,涵盖了全长蛋白酶的加工步骤,包括:去除已知在蛋白质分泌过程中发生的信号肽;去除前原区(pro region),这产生活性成熟形态的酶且已知在成熟过程中发生(Wang等人,Biochemistry 37:3165-3171(1998);Power等人,Proc Natl Acad Sci USA 83:3096-3100(1986));和蛋白酶转移到宿主细胞外部。
涉及蛋白酶的术语“加工”或“处理”指全长蛋白质(例如,蛋白酶)经历成为活性成熟的酶的成熟过程。
如本文中使用的,术语“染色体整合”指进入的序列被引入到宿主细胞染色体中的过程。转化DNA的同源区与染色体的同源区进行排列。然后,在双交换中进入序列取代了位于同源框之间的序列(即,同源重组)。在本发明的一些实施方案中,DNA构建体的灭活染色体片段的同源部分与芽孢杆菌属染色体的内在染色体区的侧翼同源区进行排列。然后,内在的染色体区在双交换中被DNA构建体删除(即,同源重组)。删除的区域可以同时用不同的进入染色体区替换。
“同源重组”意指两个DNA分子或成对染色体在相同或几乎相同的核苷酸序列的位置上交换DNA片段。
涉及内源基因或蛋白质(例如,secG基因)的术语“替换”或“被替换”,在本文中指这样的过程,通过所述过程宿主细胞的内源性secG基因不再表达,因其被异源性多核苷酸替换,其中,所述异源多核苷酸表达异源secG。
如本文中使用的,“使补充”、“补充作用(complementation)”或“补充(complenting)”可互换的使用,指两个等位基因对表型的贡献。术语在本文中指编码内源性SecG的天然或内源多核苷酸,以及编码异源SecG的异源多核苷酸(完整的或以其片段的形式)存在于相同的菌株中,天然的或通过整合的方法位于染色体上,或者由多拷贝质粒携带。因此,在一些实施方案中,细菌宿主细胞包括编码异源SecG的异源多核苷酸,其补充了编码内源SecG的内源多核苷酸,导致细菌宿主细胞包含两种编码SecG蛋白的多核苷酸。在一些实施方案中,内源和异源的Sec蛋白都是全长SecG蛋白。在其它实施方案中,异源SecG是截短的SecG蛋白。
术语“%同源性”在本文中与术语“%同一性”可互换的使用,指当用序列比对程序比对时,核酸或氨基酸序列之间核酸或氨基酸序列相同的水平。例如,如本文中使用的,80%同源性意指与通过定义的算法确定的80%序列同一性相同的对象,因此,给定序列的同源物在一定长度的给定序列上,具有大于80%的序列同一性。序列同一性的示例性水平包括但不限于与给定序列约50、约60、约65、约70、约75、约80、约85、约90、约95、约98、约99%或更高的序列同一性。利用本领域已知的标准技术确定同源性(参见例如,Smith和Waterman,Adv Appl Math,2:482,1981;Needleman和Wunsch,J MoI Biol,48:443,1970;Pearson和Lipman,ProcNatl Acad Sci USA,85:2444,1988;程序例如威斯康辛遗传学软件包(Wisconsin Genetics Software Package)中的GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,Madison,Wl;和Devereux等人,Nucl Acid Res,12:387-395,1984)。
有效算法的一个实例是PILEUP。PILEUP从一组相关序列中,利用渐进的成对比对法创建多重序列比对。它还可以绘制树状图,显示用于创建比对的成簇关系。PILEUP利用了Feng和Doolittle的渐进比对方法(Feng和Doolittle,J MoI Evol,35:351-360,1987)的简化版。该方法与Higgins和Sharp(Higgins和Sharp,CABIOS 5:151-153,1989)描述的相似。有效的PILEUP参数包括缺省的空位权重3.00,缺省的空位长度权重0.10,和加权的末端空位。
有效算法的另一个实例是Altschul等人描述的BLAST算法(Altschul等人,J Mol Biol,215:403-410,1990;和Karlin等人,Proc Natl Acad SciUSA,90:5873-5787,1993)。特别有效的BLAST程序是WU-BLAST-2程序(参见,Altschul等人,Meth Enzymol,266:460-480,1996)。WU-BLAST-2程序使用一些检索参数,大部分设定为缺省值。可调节的参数设定为下列值:重叠间隔=1,重叠分数=0.125,字符阈(T)=11。HSP S和HSP S2参数是动态值,根据特定序列的组成和检索目标序列所针对的特定数据库的组成,由程序自身确定。然而,可以调整值来增加灵敏度。%氨基酸序列同一性值是通过将匹配相同的残基数除以在比对区域中“较长”序列的残基总数来确定的。“较长”序列是在比对区域(忽略了WU-Blast-2为了使比对分数最大化而引入的空位)具有最多实际残基的序列。
因此,“百分比(%)核酸或氨基酸序列同一性”定义为候选序列中与起始序列(即,目标序列)的核苷酸或氨基酸残基相同的核苷酸残基的百分比;“百分比氨基酸序列相似性”定义为候选序列中与起始序列(即,目标序列)的氨基酸残基相同的氨基酸残基的百分比。优选的方法利用WU-BLAST-2的BLASTN模块,设定缺省参数,其中重叠间隔和重叠分数分别设定为1和0.125。
如本文中使用的,“芽孢杆菌属物种”包括本领域技术人员已知的,“芽孢杆菌”属中的所有物种,包括但不限于枯草芽孢杆菌(B.subtilis)、地衣芽孢杆菌(B.licheniformis)、迟缓芽胞杆菌(B.lentus)、短芽孢杆菌(B.brevis)、嗜热脂肪芽胞杆菌(B.stearothermophilus)、嗜碱芽孢杆菌(B.alkalophilus)、解淀粉芽胞杆菌(B.amyloliquefaciens)、克劳氏芽孢杆菌(B.clausii)、极端耐碱芽孢杆菌(B.halodurans)、巨大芽胞杆菌(B.megaterium)、凝固芽胞杆菌(B.coagulans)、环状芽胞杆菌(B.circulans)、灿烂芽胞杆菌(B.lautus)和苏云金芽孢杆菌(B.thuringiensis)。认识到芽孢杆菌属不断经历分类重组。因此,所述属意在包括已经经过重新分类的物种,包括但不限于此类生物,例如嗜热脂肪芽胞杆菌,现名为“嗜热脂肪土芽胞杆菌(Geobacillus stearothermophilus)”。在存在氧气的条件下产生耐受性的内生孢子,这被认为是芽孢杆菌属的决定性特征,但是该特征也用于目前命名的脂环酸杆菌属(Alicyclobacillus)、双芽孢杆菌鼠(Amphibacillus)、硫胺素芽孢杆菌属(Aneurinibacillus)、厌氧芽孢杆菌属(Anoxybacillus)、短芽胞杆菌属(Brevibacillus)、丝状芽胞杆菌属(Filobacillus)、薄壁芽胞杆菌属(Graciliacillus)、喜盐芽孢杆菌属(Halobacillus)、类芽孢杆菌属(Paenibacillus)、需盐芽孢杆菌属(Salibacillus)、热杆菌属(Thermobacillus)、解脲芽孢杆菌属(Ureibacillus)和枝芽胞杆菌属(Virgibacillus)。
“天然发生的”或“野生型”指蛋白酶或编码蛋白酶的多核苷酸,所述蛋白酶具有未修饰的、与天然发现的相同的氨基酸序列。天然发生的酶包括天然的酶,这些酶天然的表达或存在于特定微生物中。野生型或天然发生的序列指变体来源的序列。野生型序列可以编码同源的或异源的蛋白质。
如本文中使用的,术语“异源蛋白质”指不是天然存在于宿主细胞内的蛋白质或多肽。相似的,“异源多核苷酸”指不天然存在于宿主细胞内的多核苷酸。
如本文中使用的,“同源蛋白质”或“内源蛋白质”指细胞内内在的或天然的存在的蛋白质或多肽。相似的,“同源多核苷酸”或“内源多核苷酸”指细胞内内在的或天然的存在的多核苷酸。
如本文中使用的,术语“PCR产物”、“PCR片段”和“扩增产物”指在结束两轮或多轮的变性、退火和延伸的PCR步骤后,所获得的化合物的混合物。这些术语涵盖了扩增一种或多种靶序列的一个或多个片段的情况。
如本文中使用的,术语“引物”指这样的寡核苷酸,其不论是从纯化的限制性酶切消化中天然发生的,还是人工合成的,当处于与引入的核酸链互补的引物延伸产物的合成条件下时(即,在存在核苷酸和引发剂例如DNA聚合酶的条件下,和合适的温度和pH),能够作为合成起始位点。引物优选的是单链,具有最大的扩增效率,但可选的可以是双链。如果是双链,在用于制备延伸产物前首先处理引物以分离它的链。优选的,引物是寡聚脱氧核糖核苷酸。引物必须足够长,在存在引发剂的条件下触发延伸产物的合成。引物的准确长度取决于多种因子,包括温度、引物来源和使用的方法。
相关的(和衍生的)蛋白质包括“变体蛋白质”。在一些优选的实施方案中,变体蛋白质在少数氨基酸残基上不同于亲本蛋白或前体蛋白并且彼此也不同。如本文中使用的,“变体”指通过向C-端和/或N-端添加一个或多个氨基酸,在氨基酸序列的一个或多个不同的位点上取代一个或多个氨基酸,在蛋白质的一端或两端或氨基酸序列的一个或多个位点缺失一个或多个氨基酸,和/或在氨基酸序列的一个或多个位点插入一个或多个氨基酸,而与其相应的野生型蛋白质不同的前体蛋白。在本发明的上下文中,通过克劳氏芽孢杆菌蛋白酶V049(SEQ ID NO:26)来示例变体蛋白质,其是天然发生的蛋白质Maxacal(SEQ ID NO:25)的变体。在一些优选的实施方案中,变体蛋白质在少数氨基酸残基上不同于亲本蛋白或前体蛋白并且彼此也不同。不同的氨基酸残基的数量可以是一个或多个,优选的1、2、3、4、5、10、15、20、30、40、50或更多个氨基酸残基。在一些优选的实施方案中,变体之间不同氨基酸的数量是在1和10之间。在一些特别优选的实施方案中,相关的蛋白质和特定的变体蛋白之间包括至少约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%、约97%、约98%或约99%的氨基酸序列同一性。此外,本文中使用的相关蛋白质或变体蛋白指在一些显著的区域与另一种相关蛋白质或亲本蛋白不同的蛋白质。例如,在一些实施方案中,变体蛋白质具有1、2、3、4、5或10个不同于亲本蛋白质的相应显著区。
如本文中使用的,术语“载体”指设计用于向一种或多种细胞类型中引入核酸的多核苷酸构建体。载体包括克隆载体、表达载体、穿梭载体、质粒、盒等。
如本文中使用的,术语“表达载体”指能够在外源细胞中掺入和表达异源DNA片段的载体。多种原核和真核表达载体是可商购的。
如本文中使用的,术语“DNA构建体”、“转化DNA”和“表达载体”可互换的使用,指用于将序列引入宿主细胞或生物体中的DNA。DNA可以是通过PCR或任何本领域技术人员已知的其它合适的技术在体外产生的,例如利用Sambrook等人描述的标准分子生物学方法。此外,表达构建体的DNA可以是人工的,例如化学合成的。可以将DNA构建体、转化DNA或重组表达盒掺入到质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。通常,表达载体、DNA构建体或转化DNA的重组表达盒部分包括待被转录的核酸序列和启动子等。在一些实施方案中,表达载体具有在宿主细胞内掺入和表达异源DNA片段的能力。
在将核酸序列插入到细胞内的语境中,术语“引入”意指“转染”或“转化”或“转导”,包括涉及核酸序列掺入到真核或原核细胞中,其中核酸序列可以被掺入到细胞的基因组中(例如,染色体、质粒、质体或线粒体DNA),转化为自发复制子或瞬时表达(例如,转染的mRNA)。
术语“宿主细胞”意指已经引入了载体,或染色体整合的表达盒,或整合的PCR片段的细胞,支持表达构建体的复制和/或转录,或转录和翻译(表达)。
“相应的宿主细胞”是这样的宿主细胞,所述细胞中没有引入载体,或染色体整合的表达盒,或整合的PCR片段,且不支持宿主细胞的表达构建体的复制和/或转录,或转录和翻译(表达)。“相应的宿主细胞”是宿主细胞的参照细胞。
术语“信号序列”指位于蛋白质N-末端部分的氨基酸序列,其有利于成熟形态的蛋白质分泌到细胞外。成熟形态的胞外蛋白质缺乏在分泌过程中被切除的信号序列。在一些实施方案中,信号序列是源自芽孢杆菌属的sec-依赖性信号肽。
术语“回收”、“分离”和“分开的”在本文中可互换的使用,指蛋白质、细胞、核酸、氨基酸等去除了至少一种与其天然相关联的组分。
如本文中使用的,术语“杂合体”指这样的序列(例如分泌因子),其含有源自两种或多种直系同源物的序列。因此,“杂合基因”或“杂合蛋白质”分别是这样的基因或蛋白质,其中两种或多种片段序列1)分别源自两个或多个不同基因或蛋白质,2)源自来自两个或多个不同生物体的基因或蛋白质,或上述来源的组合。例如,杂合基因或蛋白质可以包括来自相同或不同微生物体的两个或多个片段,例如细菌菌株如芽孢杆菌菌株或土芽孢杆菌菌株。
如本文中使用的,术语“蛋白酶”和“蛋白水解活性”指这样的蛋白质或肽,其表现出水解肽或具有肽连接的底物的活性。存在多种普遍已知的程序用于测量蛋白水解活性(Kalisz,″Microbial Proteinases,″In:Fiechter编著,Advances in Biochemical Engineering/Biotechnology,[1988])。例如,可以通过比较测定确定蛋白水解活性,所述测定分析所产生的蛋白酶水解商购底物的能力。可用于此类蛋白酶或蛋白水解活性分析的示例性底物包括但不限于二甲基酪蛋白(Sigma C-9801)、牛胶原蛋白(Sigma C-9879)、牛弹性蛋白(Sigma E-1625),和牛角蛋白(ICNBiomedical 902111)。利用这些底物的比色测定是本领域普遍已知的(参见例如,WO 99/34011和美国专利号6,376,450,两者均通过引用整合到本文中)。AAPF测定(参见例如,Del Mar等人,Anal.Biochem.,99:316-320[1979])也可用于确定蛋白酶的产量。该测定测量酶水解可溶性合成底物琥珀酰-丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-对硝基苯胺(succinyl-alanine-alanine-proline-phenylalanine-p-nitroanilide)(sAAPF-pNA)而释放对硝基苯胺的速率。在分光光度计的410nm处测量水解反应产生黄色的速率,与活性酶浓度成比例。
如本文中使用的,“直系同源物”和“直系同源基因”指从共同的先祖基因通过物种形成进化而来的,位于不同物种中的基因。一般而言,直系同源物在进化过程中保持了相同的功能。
“所需多肽”或“目标多肽”指待被宿主细胞表达和分泌的蛋白质/多肽。目标蛋白质可以是任何到目前为止认为可以在原核和/或真核细胞中表达的蛋白质。在一个实施方案中,目标蛋白质通过宿主细胞使用的分泌相关蛋白或系统转移,包括包含信号肽的蛋白质。所需多肽可以是对宿主同源或异源的。在一些实施方案中,所需多肽是分泌多肽,特别是选自淀粉分解酶、蛋白水解酶、溶细胞酶、氧化还原酶和植物壁降解酶的酶。在其它实施方案中,这些酶包括淀粉酶、蛋白酶、木聚糖酶、脂肪酶、漆酶、酚氧化酶、氧化酶、角质酶(cutinase)、纤维素酶、半纤维素酶、酯酶、过氧化物酶、过氧化氢酶、葡萄糖氧化酶、植酸酶、果胶酶、葡糖苷酶、异构酶、转移酶、半乳糖苷酶和几丁质酶。在其它实施方案中,所需多肽是激素、生长因子、受体、疫苗、抗体等。但是本发明并非意在限定于任何特定的蛋白质/多肽,在一些最优选的实施方案中,所需多肽是蛋白酶。
本发明教导的内容是基于这样的发现,即多肽在细菌分泌系统内的分泌涉及一些蛋白质,可以修饰这些蛋白质并且不消除分泌复合体的分泌功能。在一些实施方案中,可以截短、突变或缺失一些分泌蛋白,同时保持或者甚至增加了其有利于多肽分泌的能力。因此,本发明提供了对于促进细菌系统分泌所需多肽有用的细菌宿主系统和多肽及其编码多核苷酸。此外,本发明教导的内容还提供了利用上述细菌宿主系统和多肽来产生所需多肽(例如,异源多肽)的方法。在一些实施方案中,截短的分泌蛋白SecG增加所需蛋白质的产量。
在一些方面,本发明教导的内容提供了编码截短的SecG的多核苷酸。根据本发明的教导,截短的SecG可以是全长SecG的任何片段,例如,能够有利于细菌宿主细胞分泌所需多肽。在一些实施方案中,本发明教导的内容提供的截短的SecG具有利于细菌宿主细胞分泌所需多肽的活性或能够有利于细菌宿主细胞分泌所需多肽,所述细菌宿主细胞含有全长内源性SecG、截短或突变的内源性SecG,或不含有任何部分的内源性SecG。在一些实施方案中,本发明提供的截短的SecG包括一个或多个区域,例如来自一种或多种全长SecG的连续或不连续的区域。在一些实施方案中,本发明提供的截短的SecG包括全长野生型SecG的区域。在一些实施方案中,其包括全长的变体、修饰或突变的SecG的区域。
在一些实施方案中,截短的SecG包括全长SecG的区域,所述全长SecG选自:克劳氏芽孢杆菌、枯草芽孢杆菌、地衣芽孢杆菌、嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)、迟缓芽胞杆菌、大肠杆菌(Escherichia coli)或解淀粉芽胞杆菌的SecG。在一些实施方案中,截短的SecG包括任何示例性全长SecG的区域,例如SEQ ID NO:1-SEQ IDNO:9。
嗜热脱氮土芽胞杆菌(Geobacillus thermodenitrificans)NG80-2的氨基酸序列(登录号:YP_001127090)
MHALLVTLLVIVSIALIAIVLLQSGRSAGLSGAITGGAEQLFGKQKARGLDAVFQRVTVVLAILYFVLTILVAYVQPS(SEQ ID NO:1)
威氏利斯特氏菌(Listeria welshimeri)血清变型6b str.SLCC5334的氨基酸序列(登录号:YP_850596)
MSTVLTVLLIIVSVLLITVIILQPGKSAGLSGAISGGAEQLFGKQKARGLELILHRTTIVLSVVFFVILIALAYFVQ(SEQ ID NO:2)
地衣芽孢杆菌(Bacillus licheniformis)ATCC 14580(DSM 13)的氨基酸序列(登录号:YP_080735)
MAAFLTVLLVIVSIVLIVVVLLQSGKSAGLSGAISGGAEQLFGKQKARGLDLILHRMTVVLTVLFFFLTIALAYFV(SEQ ID NO:3)
枯草芽孢杆菌枯草亚种(Bacillus subtilis subsp.subtilis)str.168的氨基酸序列(登录号:NP_391243)
MHAVLITLLVIVSIALIIVVLLQSSKSAGLSGAISGGAEQLFGKQKARGLDLILHRITVVLAVLFFVLTIALAYIL(SEQ ID NO:4)
植物乳杆菌(Lactobacillus plantarum)WCFS1的氨基酸序列(登录号:NP_784540)
MYNLLLTLILVVSVLIIIAVMMQPSKTNDAMSSLTGGADDLFAKQKPRGFEAFMQKVTVVLGIAFFILALALAWYSSK(SEQ ID NO:5)
干酪乳杆菌(Lactobacillus casei)ATCC 334的氨基酸序列(登录号:YP_806214)
MQSLLTTFLVIDSILIVIATLMQPSKQQDALSALSGGATDLFGKTKSRGFEAFMEKVTVALGVIFFGLAIALVYLEAH(SEQ ID NO:6)
金黄色葡萄球菌金黄亚种(Staphylococcus aureus subsp.aureus)MRSA252的氨基酸序列(登录号:YP_040260)
MHTFLIVLLIIDCIALITVVLLQEGKSSGFSGAISGGAEQLFGKQKQRGVDLFLNRLTIILSILFFVLMICISYLGM(SEQ ID NO:7)
大肠杆菌K12的氨基酸序列(登录号:NP_417642)
MYEALLVVFLIVAIGLVGLIMLQQGKGADMGASFGAGASATLFGSSGSGNFMTRMTALLATLFFIISLVLGNINSNKTNKGSEWENLSAPAKTEQTQPAAPAKPTSDIPN(SEQ ID NO:8)
在其它实施方案中,截短的SecG包括SEQ ID NO:9的克劳氏芽孢杆菌全长SecG的区域。能够有利于细菌宿主细胞分泌所需蛋白质的截短SecG区域包含N-端氨基酸序列,其跨越第一跨膜结构域。在其它实施方案中,截短的SecG具有SEQ ID NO:11。
克劳氏芽孢杆菌全长SecG的氨基酸序列
MQLFLMIALIIVSVLLVAVVLLQPGRSSGLSGAITGGAEQLLGKQKARGLDAVLHRATIVLAVLFFILTGLNAYFL(SEQ ID NO:9)
克劳氏芽孢杆菌截短SecG的氨基酸序列
MQLFLMIALIIVSVLLVAVVLLQPGRSSGLSGAITGGAE(SEQ ID NO:11)
在一些实施方案中,截短的SecG包括全长SecG的区域,所述全长SecG来自任何生物体,其具有与克劳氏芽孢杆菌、枯草芽孢杆菌、地衣芽孢杆菌、嗜热脂肪土芽胞杆菌、迟缓芽胞杆菌、大肠杆菌或解淀粉芽胞杆菌的SecG相同或基本相同的氨基酸序列,例如,至少约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%、约98%或约99%的同一性。在其它实施方案中,截短的SecG共享与来自克劳氏芽孢杆菌、枯草芽孢杆菌、地衣芽孢杆菌、嗜热脂土芽胞杆菌、迟缓芽胞杆菌、大肠杆菌或解淀粉芽胞杆菌的SecG序列具有至少约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%、约98%或约99%的相似性的氨基酸序列。在其它实施方案中,截短的SecG与SEQ ID NO:11的截短的SecG至少50%同一。
在一些实施方案中,截短的SecG包括全长野生型或全长变体细菌SecG的区域。全长SecG可以来自任何已知的或新发现的细菌菌株,例如与细菌系统中多肽分泌通路相关的。在一些实施方案中,细菌SecG是芽孢杆菌属SecG。全长SecG来源的细菌菌株的实例包括但不限于,不动杆菌属(Acinetobacter)、根癌土壤杆菌(Agrobacterium tumefaciens)、固氮弧菌属(Azoarcus)、炭疽芽胞杆菌(Bacillus anthracis)、克劳氏芽孢杆菌(Bacillus clausii)、地衣芽孢杆菌(Bacillus licheniformis)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、枯草芽孢杆菌、迟缓芽孢杆菌(Bacillus lentus)、极端耐碱芽孢杆菌(Bacillus halodurans)、长双歧杆菌(Bifidobacteriumlongum)、蚜虫巴克纳氏菌(Buchneraaphidicola)、Campestris、空肠弯曲杆菌(Campylobacter jejuni)、产气荚膜梭状芽胞杆菌(Clostridium perfringens)、大肠杆菌、胡萝卜软腐欧文氏菌(Erwinia carotovora)、土拉热弗朗西丝氏菌(Francisellatularensis)、流感嗜血杆菌(Haemophilus influenzae)、幽门螺杆菌(Helicobacter pylori)、结核分枝杆菌(Mycobacterium tuberculosis)、脑膜炎奈瑟氏菌(Neisseria meningitides)、绿脓假单胞菌(Pseudomonasaeruginosa)、原绿球藻(Prochlorococcus marinus)、肺炎链球菌(Streptococcus pneumoniae)、肠沙门氏菌(Salmonella enterica)、沙雷菌(Shewanella oneidensis)、肠沙门氏菌(Salmonella enterica)、鼠伤寒沙门氏菌(Salmonella typhimurium)、表皮葡萄球菌(Staphylococcusepidermidis)、金黄色葡萄球菌(Staphylococcus aureus)、弗氏志贺氏菌(Shigella flexneri)、天蓝色链霉菌(Streptomyces coelicolor)、浅青紫链霉菌(Streptomyces lividans)、Tropheryma whipplei、土拉菌(Tularensis)、Temecula、Thermosynechococcus elongates、Thermococcuskodakarensis、地毯草黄单胞菌(Xanthomonas axonopodis)、野油菜黄单胞菌(Xanthomonas campestris)、苛养木杆菌(Xylella fastidiosa)和鼠疫耶尔森氏菌(Yersinia pestis)。
在一些实施方案中,截短的SecG是克劳氏芽孢杆菌SecG。
在一些实施方案中,截短的SecG通常包括至少最少数量的氨基酸残基,使其可以有利于例如部分多肽分泌通路,或者直接或间接的功能性作用于所需多肽的分泌。在一些实施方案中,截短的SecG包括全长SecG的至少30、31、32、33、34、35、36、37、38或39个氨基酸。在一些实施方案中,全长SecG是野生型SecG。在其它实施方案中,全长SecG是变体SecG。在一些实施方案中,截短的SecG包括全长SecG的N-端区域的前至少30、31、32、33、34、35、36、37、38或前39个氨基酸。
在一些实施方案中,截短的SecG包括全长的天然或变体SecG的至少一个区域或结构域。在一些实施方案中,截短的SecG包括至少一个跨膜区域。在一些实施方案中,截短的SecG只包括一个跨膜区域。在一些实施方案中,跨膜区域对应全长SecG的N-端跨膜片段。
在一些实施方案中,截短的SecG可以或可以不与一种或多种“分泌相关蛋白”相互作用。在一些实施方案中,截短的SecG与一种或多种分泌相关蛋白相互作用。在一些实施方案中,截短的SecG不与一种或多种分泌相关蛋白相互作用。术语“分泌相关蛋白”在本文中通常指在目标蛋白质从宿主细胞中分泌时涉及的蛋白质。分泌相关蛋白可以帮助新生(即,在合成过程中或刚结束合成时)蛋白质正确折叠,蛋白质从胞内向胞外环境的移动(例如,通过细胞质到细胞膜,和/或跨过细胞膜/细胞壁至胞外环境等),正确的加工等。可以认为在蛋白质移动的任何方面涉及的蛋白质都具有分泌相关活性或功能,所述移动为所述蛋白质被胞内合成直到出现在细胞膜的外表面。此类蛋白质的实例包括但不限于,帮助新生的目标蛋白实现正确的折叠构象所涉及的蛋白质,或来自Sec通路的蛋白质。术语“分泌相关蛋白”、“分泌相关因子”和“分泌因子”在本文中可互换的使用。
在一些实施方案中,发明提供了编码“杂合”截短SecG的多核苷酸。杂合的截短SecG包含多余一种全长SecG的区域。此类杂合的截短SecG包含来自第一种全长SecG的区域和来自第二种全长SecG的区域。第一或第二种全长SecG可以是野生型SecG或变体SecG。在一些实施方案中,第一或第二种全长SecG是细菌的,例如芽孢杆菌属的SecG。
在一些实施方案中,截短的SecG是杂合的截短SecG,其包含两个区域,所述区域包括来自两种不同细菌菌株(第一和第二菌株)的全长SecG的区域。在一些实施方案中,第一菌株是克劳氏芽孢杆菌,第二菌株是枯草芽孢杆菌。在一些实施方案中,第一菌株和第二菌株包括但不限于地衣芽孢杆菌和枯草芽孢杆菌;嗜热脂肪土芽胞杆菌和枯草芽孢杆菌;嗜热脂肪土芽胞杆菌和地衣芽孢杆菌;克劳氏芽孢杆菌和地衣芽孢杆菌;迟缓芽孢杆菌和枯草芽孢杆菌;大肠杆菌和枯草芽孢杆菌;解淀粉芽孢杆菌和枯草芽孢杆菌;解淀粉芽孢杆菌和地衣芽孢杆菌。在一些实施方案中,杂合的截短SecG的N-端区域包含来自克劳氏芽孢杆菌SecG的区域,杂合的截短SecG的C-端区域包含来自枯草芽孢杆菌SecG的区域。
一般而言,与不含有截短的SecG的细菌宿主细胞的所需多肽的产量相比,本发明教导的截短的SecG增加了所需多肽的产量。在一些实施方案中,与不含有截短的SecG的细菌宿主细胞的所需多肽的产量相比,截短的SecG增加了所需多肽的产量至少约20%、约30%、约40%、约50%、约60%、约70%、约75%、约80%、约85%、约90%、约95%、约100%、约125%、约150%、约175%、约200%或约250%。在一些实施方案中,含有截短的SecG的细菌宿主细胞包含内源性SecG。在其它实施方案中,删除了细菌宿主细胞的内源性SecG基因。在其它实施方案中,用异源的全长SecG基因替换了细菌宿主细胞的内源性SecG基因。在其它实施方案中,用异源的截短SecG基因替换了细菌宿主细胞的内源性SecG基因。
在一些实施方案中,截短的SecG含有来自野生型或变体全长SecG的区域,且与含有全长SecG的细菌宿主细胞对所需多肽的分泌相比,增加了所需多肽的分泌。在一些实施方案中,与含有全长SecG的细菌宿主细胞的所需多肽的分泌相比,截短的SecG增加了所需多肽的分泌至少约20%、约30%、约40%、约50%、约60%、约70%、约75%、约80%、约85%、约90%、约95%、约100%、约125%、约150%、约175%、约200%或约250%。
在其它一些实施方案中,发明提供了含有上述多核苷酸以及由上述多核苷酸编码的多肽的表达载体,例如细菌表达载体,和宿主细胞。具有合适的启动子、选择标记等的合适载体,例如细菌表达载体,是本领域技术人员已知的。在一些实施方案中,表达载体包括aprE基因的aprE启动子,其天然的转录枯草芽孢杆菌的枯草杆菌蛋白酶。在一些实施方案中,宿主细胞包括aprE启动子,其是野生型aprE启动子TGGGTCTACTAAAATATTATTCCATCTATTACAATAAATTCACAGA(SEQ ID NO:39;美国专利申请公开号20030148461)。在其它实施方案中,宿主细胞包括枯草芽孢杆菌aprE启动子的突变体。在一些实施方案中,发明提供了芽孢杆菌属宿主细胞,其含有突变的aprE启动子,所述启动子有效的连接了编码目标蛋白质的多核苷酸序列。因此,发明涵盖了从突变的aprE启动子表达目标蛋白的宿主细胞。突变的aprE启动子的实例是具有序列
TGGGTC TTGACA AATATTATTCCATCTAT TACAAT AAATTCACAGA(SEQ ID NO:40)的突变aprE启动子,其描述在美国专利申请公开号20030148461中。
在一些实施方案中,细菌宿主细胞包括编码异源SecG的多核苷酸,所述异源SecG能够有利于宿主细胞分泌所需蛋白质。在一些实施方案中,宿主细胞包括编码异源SecG的多核苷酸,所述异源SecG与不表达异源SecG的相应宿主细胞对相同所需蛋白质的产量相比,能够增加所需蛋白质的产量。在一些实施方案中,异源SecG是全长SecG。在其它实施方案中,异源SecG是截短的SecG。
包含本发明教导的多核苷酸的宿主细胞可以是任何宿主细胞,其中必需有利于所需多肽的分泌。在一些实施方案中,宿主细胞是细菌细胞。在一些实施方案中,宿主细胞是芽孢杆菌属或土芽胞杆菌属细胞。宿主细胞的实例包括但不限于,不动杆菌属(Acinetobacter)、根癌土壤杆菌(Agrobacterium tumefaciens)、固氮弧菌属(Azoarcus)、炭疽芽胞杆菌(Bacillus anthracis)、克劳氏芽孢杆菌(Bacillus clausii)、地衣芽孢杆菌(Bacillus licheniformis)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、枯草芽孢杆菌、迟缓芽孢杆菌(Bacillus lentus)、极端耐碱芽孢杆菌(Bacillus halodurans)、长双歧杆菌(Bifidobacteriumlongum)、蚜虫巴克纳氏菌(Buchnera aphidicola)、Campestris、空肠弯曲杆菌(Campylobacter jejuni)、产气荚膜梭状芽胞杆菌(Clostridiumperfringens)、大肠杆菌、胡萝卜软腐欧文氏菌(Erwinia carotovora)、土拉热弗朗西丝氏菌(Francisella tularensis)、流感嗜血杆菌(Haemophilusinfluenzae)、幽门螺杆菌(Helicobacter pylori)、结核分枝杆菌(Mycobacterium tuberculosis)、脑膜炎奈瑟氏菌(Neisseriameningitides)、绿脓假单胞菌(Pseudomonas aeruginosa)、原绿球藻(Prochlorococcus marinus)、肺炎链球菌(Streptococcus pneumoniae)、肠沙门氏菌(Salmonella enterica)、沙雷菌(Shewanella oneidensis)、肠沙门氏菌(Salmonella enterica)、鼠伤寒沙门氏菌(Salmonellatyphimurium)、表皮葡萄球菌(Staphylococcus epidermidis)、金黄色葡萄球菌(Staphylococcus aureus)、弗氏志贺氏菌(Shigella flexneri)、天蓝色链霉菌(Streptomyces coelicolor)、浅青紫链霉菌(Streptomyceslividans)、Tropheryma whipplei、土拉菌(Tularensis)、Temecula、Thermosynechococcus elongates、Thermococcus kodakarensis、地毯草黄单胞菌(Xanthomonas axonopodis)、野油菜黄单胞菌(Xanthomonascampestris)、苛养木杆菌(Xylella fastidiosa)和鼠疫耶尔森氏菌(Yersiniapestis)宿主细胞。
在一些实施方案中,目标芽孢杆菌属菌株是嗜碱性芽孢杆菌属。已知多种嗜碱性芽孢杆菌(参见例如,美国专利号5,217,878;和Aunstrup等人,Proc IV IFS:Ferment.Tech.Today,299-305[1972])。另一种类型的特别感兴趣的芽孢杆菌菌株是工业芽孢杆菌菌株的细胞。工业芽孢杆菌菌株的实例包括但不限于,地衣芽孢杆菌、迟缓芽胞杆菌、枯草芽孢杆菌、克劳氏芽孢杆菌和解淀粉芽胞杆菌。在其它实施方案中,芽孢杆菌宿主菌株选自地衣芽孢杆菌、枯草芽孢杆菌、迟缓芽胞杆菌、短芽孢杆菌、嗜热脂肪芽胞杆菌、嗜碱芽孢杆菌、解淀粉芽胞杆菌、凝固芽胞杆菌、环状芽胞杆菌、灿烂芽胞杆菌、短小芽胞杆菌(B.pumilus)、苏云金芽孢杆菌和巨大芽胞杆菌,以及属于芽孢杆菌属的其他生物体。在一些实施方案中,宿主细胞是枯草芽孢杆菌细胞。
在一些实施方案中,工业宿主菌株选自芽孢杆菌属物种的非重组菌株,天然发生的芽孢杆菌属菌株的突变体,和重组的芽孢杆菌属宿主菌株。优选的,宿主菌株是重组的宿主菌株,其中编码目标多肽的多核苷酸已经先引入了宿主内。更优选的宿主菌株是枯草芽孢杆菌宿主菌株,特别是重组的枯草芽孢杆菌宿主菌株。多种枯草芽孢杆菌菌株是已知的,并适合用于本发明(参见例如,1A6(ATCC 39085)、168(1A01)、SB19、W23、Ts85、B637、PB1753至PB1758、PB3360、JH642、1A243(ATCC 39,087)、ATCC21332、ATCC 6051、MI113、DE100(ATCC 39,094)、GX4931、PBT 110和PEP 211菌株;Hoch等人,Genetics,73:215-228[1973];U.S.Pat.No.4,450,235;U.S.Pat.No.4,302,544;EP 0134048)。枯草芽孢杆菌作为表达宿主使用是本领域普遍已知的(参见Palva等人,Gene,19:81-87[1982];Fahnestock和Fischer,J.Bacteriol.,165:796-804[1986];和Wang等人,Gene 69:39-47[1988])。
特别感兴趣的宿主细胞是生产工业蛋白酶的芽孢杆菌菌株的细胞。通过利用这些菌株,利用本发明提供的异源SecG蛋白,进一步提高了蛋白酶生产的高效率。生产工业蛋白酶的芽孢杆菌菌株提供了特别优选的表达宿主。在一些实施方案中,在本发明中使用这些菌株进一步增加了蛋白酶产量。如上所述,芽孢杆菌属物种一般分泌两种常规类型的蛋白酶,称为中性(或“金属蛋白酶”)和碱性(或“丝氨酸”)蛋白酶。在一些实施方案中,蛋白酶是克劳氏芽孢杆菌蛋白酶,例如SEQ ID NO:25-29、36和38的蛋白酶。其它蛋白酶包括多种类型的芽孢杆菌属枯草杆菌蛋白酶,它们已经过鉴定和测序,例如枯草杆菌蛋白酶168、枯草杆菌蛋白酶BPN’、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶DY、枯草杆菌蛋白酶147、枯草杆菌蛋白酶309(参见例如,EP 414279B;WO 89/06279;和Stahl等人,J.Bacteriol.,159:811-818[1984])、迟缓芽孢杆菌枯草杆菌蛋白酶和克劳氏芽孢杆菌枯草杆菌蛋白酶(J C van der Laan,G Gerritse,L JMulleners,R A van der Hoek和W J Quax.Appl Environ Microbiol.57:901-909[1991])。
在本发明的一些实施方案中,芽孢杆菌宿主菌株生产突变的(例如,变体)蛋白酶。多种参考文献提供了变体蛋白酶和参照的实例(参见例如,WO 99/20770;WO 99/20726;WO 99/20769;WO 89/06279;RE 34,606;美国专利号4,914,031;美国专利号4,980,288;美国专利号5,208,158;美国专利号5,310,675;美国专利号5,336,611;美国专利号5,399,283;美国专利号5,441,882;美国专利号5,482,849;美国专利号5,631,217;美国专利号5,665,587;美国专利号5,700,676;美国专利号5,741,694;美国专利号5,858,757;美国专利号5,880,080;美国专利号6,197,567;和美国专利号6,218,165)。
在一些其他的实施方案中,发明提供了细菌宿主细胞,其中内源性SecG基因是缺失的、部分截短的或突变的。在一些实施方案中,本发明教导的内容提供了细菌细胞,其中SecG启动子含有一个或多个突变。在一些实施方案中,本发明教导的内容提供了细菌细胞,其中内源性全长SecG基因被整体删除,例如通过重组或任何其它适合敲除的方法。在其它实施方案中,通过异源secG基因补充宿主细胞的内源基因。在其它实施方案中,通过异源secG基因替换了宿主细胞的内源基因。在其它一些实施方案中,本发明教导的内容提供了细菌细胞,其中如上述将内源性全长SecG部分的截短成本发明教导的内容所提供的截短SecG。
在一些实施方案中,本发明教导的内容提供了细菌细胞,其中内源性SecG基因含有一个或多个突变。这些突变的实例包括:在天然、全长secG基因的编码区引入一个或多个终止密码子的任何突变,修饰SecG蛋白的结构的任何突变,特别是其与细胞膜相互作用的结构构象,修饰SecG与sec相关分泌通路有关的功能的任何突变,干扰或修饰SecG与一种或多种组分(例如,secY、secA、secE、secF、secD、ftsY、SRP复合体、sec-依赖性分泌通路或机制的蛋白质)相互作用的任何突变,降低内源性secG基因转录或翻译的任何突变,直接或间接修饰secG蛋白的转录后或翻译后加工,从而修饰其功能或活性(例如在多肽分泌中的活性)的任何突变。
在一些实施方案中,本发明教导的内容提供了含有化合物或实体的细菌细胞,例如降低secG基因转录和/或翻译,或降低SecG的活性或功能的反义核酸(例如,其与细胞膜相互作用或在多肽分泌中的活性或功能)。
在一些实施方案中,本发明教导的内容提供了细菌细胞,其中的启动子具有一个或多个突变,其中SecG的相对量与野生型细胞相比是降低的。这些突变的实例包括:抑制或降低内源性secG基因转录或翻译的任何突变。
在一些实施方案中,本发明教导的内容提供了表达具有一个或多个突变的多核苷酸的细菌细胞,所述突变如本发明上述教导的内容所描述的,其中细菌细胞的内源性secG是部分或全部删除的。
不希望受任何特定技术解释的约束,本发明教导的发现是如上述具有降低活性的SecG(例如,截短的、突变的、缺失的等)的细菌细胞,与含有野生型SecG的细菌细胞相比,能够提供相同或更高水平的蛋白质分泌。
在一些实施方案中,与其中没有删除内源性secG基因的细菌细胞相比,或与其中没有通过编码天然、截短的SecG的多核苷酸替换内源性secG基因的细菌细胞相比,本发明教导的细菌细胞分泌所需多肽的量与之相等,或增加。在一些实施方案中,与含有全长内源性SecG的细菌细胞的所需多肽的分泌相比,所需多肽的分泌增加了至少20%、约30%、约40%、约50%、约60%、约70%、约75%、约80%、约85%、约90%、约95%、约100%、约125%、约150%、约175%、约200%或约250%。本发明教导的细菌细胞可以是任何分泌所需多肽的细菌细胞。在一些实施方案中,如上述,细菌细胞是芽孢杆菌或土芽孢杆菌细胞。在其它实施方案中,细菌细胞是枯草芽孢杆菌细胞。
本发明教导的内容还提供了在宿主细胞中生产所需多肽的方法。在一些实施方案中,方法包括表达所需多肽和异源性SecG。在其它实施方案中,方法包括在宿主细胞内表达所需多肽和截短的异源性SecG。方法的宿主细胞和截短的SecG如上所述。在一些实施方案中,宿主细胞培养在培养基中,所需多肽分泌至培养基中。合适的培养基、培养条件和从培养基中分离所分泌的所需多肽的方法依赖多种因素,包括但不限于,宿主细胞株、所需多肽的性质等。选择合适培养基、培养条件和分离所分泌的所需多肽的方法是本领域技术人员已知的。
在一些实施方案中,宿主细胞还表达内源性SecG,而异源性SecG被称为“补充”内源SecG。在一些实施方案中,宿主细胞的(内源)SecG被上述多核苷酸编码的截短的SecG替换。
在一些实施方案中,所需多肽来自第一菌株,截短的SecG含有来自相同菌株的全长SecG的区域。在一些实施方案中,所需多肽和截短的SecG来自不同于宿主菌株的细菌菌株,在所述宿主菌株中进行所需多肽的分泌。在一些实施方案中,所需多肽和截短的SecG都来自克劳氏芽孢杆菌,宿主细胞是枯草芽孢杆菌。
所需多肽可以是细菌宿主细胞可以分泌的任何多肽。在一些实施方案中,所需多肽是蛋白酶或淀粉酶。在一些实施方案中,所需多肽是来自Maxacal/GG36家族的蛋白酶。在一些实施方案中,所需多肽是碱性丝氨酸蛋白酶。在一些实施方案中,所需多肽是来自嗜碱性芽孢杆菌的碱性蛋白酶,所述嗜碱性芽孢杆菌例如克劳氏芽孢杆菌或极端耐碱芽孢杆菌,或来自迟缓芽孢杆菌。在一些实施方案中,所需蛋白质是任何碱性蛋白酶的变体,更特别地是来自克劳氏芽孢杆菌或迟缓芽孢杆菌的碱性丝氨酸蛋白酶的变体。在一些实施方案中,所需多肽是淀粉酶、淀粉酶变体和更常见的任何分泌性酶。
在一些实施方案中,本发明教导的内容还提供了在细菌细胞中生产所需多肽的方法。方法包括在本发明教导内容提供的细菌细胞内表达所需多肽,所述细菌细胞例如已经删除、突变、截短了内源性secG基因的细菌细胞等。如上所述,所需多肽可以是细菌细胞可以分泌的任何多肽,例如蛋白酶。
还可以根据下列实施例进一步理解本发明教导的各方面,但其不应视为限制了本发明教导内容的范围。在不脱离本发明教导内容的条件下,多种材料和方法的修饰对本领域技术人员都是显而易见的。
实施例
提供下列实施例用于证实和进一步示例一些优选的实施方案和本发明的方面,其不被视为限制其范围。
在下列实验性公开中,使用了下列缩写:cpm(氯霉素);ppm(百万分之);M(摩尔(molar));mM(毫摩尔);μM(微摩尔);nM(钠摩尔);mol(摩尔(mole));mmol(毫摩尔);μmol(微摩尔);nmol(钠摩尔);gm(克);mg(毫克);μg(微克);pg(皮克);L(升);ml和mL(毫升);μl和μL(微升);cm(厘米);mm(毫米);μm(微米);nm(纳米);U(单位);V(伏特);MW(分子量);sec(秒);min(s)(分钟);h(s)和hr(s)(小时);℃(摄氏度);QS(足量);ND(未完成);NA(不适用);rpm(每分钟转数);H2O(水);dH2O(去离子水);HCl(盐酸);aa(氨基酸);bp(碱基对);kb(千碱基对);kD(千道尔顿);cDNA(拷贝或互补DNA);DNA(脱氧核糖核酸);ssDNA(单链DNA);dsDNA(双链DNA);dNTP(脱氧核糖核苷三磷酸);RNA(核糖核酸);MgCI2(氯化镁);NaCl(氯化钠);w/v(重量体积比);v/v(体积体积比);g(重力);OD(光密度);Dulbecco磷酸缓冲的溶液(DPBS);OD280(280nm的光密度);OD600(600nm的光密度);A405(405nm处的吸光度);PAGE(聚丙烯酰胺凝胶电泳);PBS(磷酸缓冲的盐溶液[150mM NaCl,10mM磷酸钠缓冲液,pH 7.2]);PBST(PBS+0.25%-20);PEG(聚乙二醇);PCR(聚合酶链式反应);SDS(十二烷基硫酸钠);Tris(三(羟甲基)氨基甲烷);HEPES(N-[2-羟乙基]哌嗪-N-[2-乙磺酸]);HBS(HEPES缓冲的盐溶液);SDS(十二烷基硫酸钠);bME,BME和βME(β-巯基乙醇或2-巯基乙醇);Tris-HCl(三(羟甲基)氨基甲烷-盐酸盐);Tricine(N-[三-(羟甲基)-甲基]-甘氨酸);DMSO(二甲亚砜);Taq(嗜热水生菌(Thermus aquaticus)DNA聚合酶);Klenow(DNA聚合酶I大(Klenow)片段);rpm(每分钟转数);EGTA(乙二醇-双(β-氨基乙醚)N,N,N′,N′-四乙酸);EDTA(乙二胺四乙酸);bla(β-内酰胺酶或氨苄青霉素-抗性基因);DNA2.0(DNA2.0,Menlo Park,CA);ATCC(美国典型培养物保藏中心(American Type Culture Collection),Rockville,MD);Gibco/BRL(Gibco/BRL,Grand Island,NY);Sigma(Sigma Chemical Co.,St.Louis,MO);Pharmacia(Pharmacia Biotech,Pisacataway,NJ);NCBI(国家生物技术信息中心(National Center for Biotechnology Information)。
实施例1
克劳氏芽孢杆菌全长SecG的表达对枯草芽孢杆菌宿主细胞的
Properase产量的影响
实施该实验用于检测在枯草芽孢杆菌中表达克劳氏芽孢杆菌SecG是否可以增加枯草芽孢杆菌宿主细胞对克劳氏芽孢杆菌蛋白质的分泌。
该实施例描述了实施这样的实验,来确定表达异源性克劳氏芽孢杆菌SecG基因对枯草芽孢杆菌宿主细胞生产克劳氏芽孢杆菌丝氨酸蛋白酶Properase(SEQ ID NO:29)的影响,在所述宿主细胞中编码克劳氏芽孢杆菌的基因补充内源性枯草芽孢杆菌SecG的表达。
为了与枯草芽孢杆菌染色体的整合,将克劳氏芽孢杆菌SecG(SecGC)在枯草芽孢杆菌SecG(SecGS)的上下游区域之间装配成融合体。首先,通过PCR从枯草芽孢杆菌菌株BG2942的染色体DNA中扩增SecGS上游区域的1000个碱基对。利用下列引物扩增区域,同时在5’端添加AvaI限制性位点,在3’端添加用于PCR融合的突出端。
JS#56:F AvaI-1kb上游SecGS
GGCGCGCCCGGGGAGGATCTTTTTTACTATGATTTCG(SEQ ID NO:13)
JS#53:R枯草芽孢杆菌1kb上游/SecGC融合
TGCGATCATCAAAAACAGCTGCATCCCATACACCTCCAGACTCA(SEQ ID NO:14)
相似的,通过PCR从染色体DNA中扩增SecGC下游区域的1000个碱基对,从而在5’末端掺入用于PCR融合的突出端,在3’端掺入SacI限制性位点。
JS#54:F SecGC/枯草芽孢杆菌1kb下游融合
GGGTTAAATGCGTATTTCCTATAAGGCGGCAATGTTTGTATAA(SEQ ID NO:15)
JS#17:R SacI-1kb下游SecGS
GCGCGGAGCTCGCTTCCGTAATATTTAACATCTCC(S EQ ID NO:16)
通过PCR从克劳氏芽孢杆菌菌株PB92的染色体DNA中扩增克劳氏芽孢杆菌secG。下列引物掺入5’突出端和3’突出端用于融合PCT。
JS#52:F枯草芽胞杆菌1kb上游/SecGC融合
TGAGTCTGGAGGTGTATGGGATGCAGCTGTTTTTGATGATCGCA(SEQ ID NO:17)
JS#55:R SecGC/枯草芽孢杆菌1kb下游融合
TTATACAAACATTGCCGCCTTATAGGAAATACGCATTTAACCC(SEQ ID NO:18)
然后,利用引物JS#56和JS#55,通过PCR将枯草芽孢杆菌上游PCR片段与克劳氏芽孢杆菌secG融合。最后,将该上游-secG PCR片段通过PCR与枯草芽孢杆菌下游PCR片段融合,利用引物JS#56和JS#17。最终的融合产物是上游-secGC-下游。
用AvaI和SacI消化该secGC融合产物,并连接到也用AvaI和SacI消化的pUC19spcR载体中。连接混合物经过滚环复制(RCA),将RCA产物转化到BG2942中,在100μg/ml壮观霉素上对其进行选择。secGC和质粒DNA通过单交换整合到枯草芽孢杆菌secG基因座处。该菌株名为JS1003。用来自Properase表达菌株GICC3147的染色体DNA转化JS1003,在100μg/ml壮观霉素和5μg/ml氯霉素上选择转化体。在25μg/ml氯霉素中扩增菌株,命名为JS1015。GICC3147是源自BGSEC94的菌株,含有的Properase编码基因携带有W7G和E57G突变。
用来自GICC3147的染色体DNA转化BG2942来生成对照菌株。在5μg/ml氯霉素上选择转化体,进一步在25μg/ml氯霉素中扩增菌株。该对照菌株命名为JS1009。
通过测定分泌蛋白酶对底物的活性,来确定JS1015和JS1009菌株分泌的Properase的水平,所述底物是琥珀酰-L-Ala-L-Ala-L-Pro-L-Phe-对硝基苯胺(AAPF)。对硝基苯胺的水解和释放导致405nm/分钟吸光度的改变(Estell等人,J Biol Chem.,260:6518-6521(1985)),通过405nm/min的吸光度的增加,随着所述增加测量修饰的蛋白酶的产量。利用SofmaxPro软件进行测量,特定的条件设定为:类型:动力学;减少(Reduction):Vmax点(读最佳15/28点);Lm1:405nm;时间:5分钟;间隔:11秒。将枯草芽孢杆菌培养物各10微升用100uI的Tris缓冲液(所述缓冲液含有10mM Tris+0.005%-80,pH 8.6);和25ul的100mg/mlAAPF稀释。计算每种克劳氏芽孢杆菌蛋白酶的相对活性,根据分泌的蛋白酶的活性来确定SecG对克劳氏芽孢杆菌蛋白酶产量的影响。
图1提供了结果,显示在枯草芽孢杆菌宿主细胞中表达全长克劳氏芽孢杆菌SecG(通过用克劳氏芽孢杆菌secG基因补充枯草芽孢杆菌宿主细胞的内源性secG基因)(JS1015),与不含有克劳氏芽孢杆菌secG基因的对照JS1009枯草芽孢杆菌宿主细胞的Properase产量相比,令人惊讶的导致更高产量的Properase。对已经引入到枯草芽孢杆菌染色体中的克劳氏芽孢杆菌secG基因测序,揭示了其含有与全长SecG蛋白(SEQ ID NO:9)位置40相对应处的终止密码子,因此编码截短的SecG,其含有全长77个氨基酸的SecG蛋白的前N-端39个氨基酸(SEQ ID NO:11)。根据SecG蛋白的拓扑学,例如如图2显示,截短的SecG只涵盖了一个跨膜结构域。
因此,数据表示,在表达目标蛋白质(例如,蛋白酶)的宿主细胞中表达截短的异源SecG,导致表达异源性截短SecG的宿主细胞中目标蛋白质的产量增加。
如下所述,确定截短的SecG(SEQ ID NO:11)和全长SecG(SEQ IDNO:9)对枯草芽孢杆菌宿主细胞中的其它蛋白酶产量的影响。
实施例2构建示例性宿主菌株
该实施例描述了用于产生细菌宿主菌株的方法,所述菌株中保留或删除了内源性secG基因,或被全长或截短的异源性secG基因替换,或被全长或截短的异源性secG基因补充。
如下所述,如表1概括的,产生了3组枯草芽孢杆菌宿主菌株,
表1枯草芽孢杆菌菌株
菌株名称 | 描述-枯草芽孢杆菌细胞包含: |
组A | |
CF368 | SecG截短的(终止密码子40)补充内源SecG |
CF369 | SecG截短的(终止密码子40)替换内源SecG |
CF370 | SecG全长替换内源SecG |
CF385 | 内源SecG缺失 |
组B | |
CF363 | V049(AA SEQ ID NO:26:PNT SEQ ID NO:31) |
CF365 | V049-E33Q(AA SEQ IDNO:27:PNT SEQ ID NO:32) |
CF366 | V049-E33R(AA SEQ IDNO:28:PNT SEQ ID NO:33) |
CF381 | Properase(AA SEQ ID NO:29:PNT SEQ ID NO:34) |
组C | |
CF371:368X363 | SecG截短的/补充/V049 |
CF372:365X368 | SecG截短的/补充/V049-E33Q |
CF373:366X368 | SecG截短的/补充/V049-E33R |
CF374:368X381 | SecG截短的/补充/Properase |
CF375:369X363 | SecG截短的/替换/V049 |
CF376:365X369 | SecGSecG截短的/替换/V049-E33Q |
CF377:366X369 | SecG截短的/替换/V049-E33R |
CF378:369X381 | SecG截短的/替换/Properase |
CF379:370X363 | SecG全长/替换/V049 |
CF380:370X381 | SecG全长/替换/Properase |
CF396:395X363 | 内源SecG缺失/Properase |
*截短的SecG源自全长的克劳氏芽孢杆菌SecG(SEQ ID NO:9),具有SEQ ID NO:11的氨基酸序列,由SEQ ID NO:12的多核苷酸序列编码。
从A组菌株的各枯草芽孢杆菌细胞中提取染色体DNA,转化到B组菌株的枯草芽孢杆菌细胞中,根据表1所示的交换,产生C组的枯草芽孢杆菌菌株。
I.构建A菌株
(1)构建含有整合质粒的枯草芽孢杆菌宿主菌株,所述质粒表达编码
截短的克劳氏芽孢杆菌SecG的多核苷酸,补充A组的枯草芽孢杆菌SecG
的表达(CF368株)
利用下列引物,从公众可获得的野生型实验室菌株,已知为I168的枯草芽孢杆菌中扩增DNA片段,所述菌株含有在枯草芽孢杆菌SecG基因上游1Kb区域的片段:
JS 56(正向)枯草芽孢杆菌SecG上游区域起始AvaI:
GGCGCGCCCGGGGAGGATCTTTTTTACTATGATTTCG SEQ ID:13)
JS 53(反向)枯草芽孢杆菌SecG上游区域终止(与克劳氏芽孢杆菌SecG 5’融合):
TGCGATCATCAAAAACAGCTGCATCCCATACACCTCCAGACTCA(SEQ ID NO:14)
从已知为PB92(US 7,247,450)的菌株中扩增克劳氏芽孢杆菌secG基因,利用以下引物:
JS 52(正向)克劳氏芽孢杆菌SecG起始(与枯草芽孢杆菌SecG上游融合):
TGAGTCTGGAGGTGTATGGGATGCAGCTGTTTTTGATGATCGCA(SEQ ID NO:17)
JS 55(反向)克劳氏芽孢杆菌SecG终止(与枯草芽孢杆菌SecG下游融合):
TTATACAAACATTGCCGCCTTATAGGAAATACGCATTTAACCC(SEQ ID NO:18)
另一个片段含有位于枯草芽孢杆菌SecG下游的1Kb区域,利用下列引物从相同的PCR片段中对所述片段进行扩增:
JS 54(正向)枯草芽孢杆菌SecG下游起始(克劳氏芽孢杆菌secG基因末端的融合引物):
GGGTTAAATGCGTATTTCCTATAAGGCGGCAATGTTTGTATAA(SEQ IDNO:15)
JS 17(反向)枯草芽孢杆菌SecG下游终止SacI:
GCGCGGAGCTCGCTTCCGTAATATTTAACATCTCC(SEQ ID NO:16)
利用下列引物和PCR将片段融合至一起:
JS 56(正向)枯草芽孢杆菌SecG上游区域起始AvaI:
GGCGCGCCCGGGGAGGATCTTTTTTACTATGATTTCG SEQ ID:13)
JS 17(反向)枯草芽孢杆菌SecG下游终止SacI:
GCGCGGAGCTCGCTTCCGTAATATTTAACATCTCC(SEQ ID NO:16)
用AvaI/SacI消化获得的片段,并连接到也用AvaI/SacI消化的、详细描述的载体pUC19中。之前载体已经经过修饰,即将壮观霉素抗性基因连接到BamHI位点中。
将获得的名为pJS3的质粒,转化到枯草芽孢杆菌实验室菌株BG2942(ΔnprE,degUHy32)中,后者已经是处于感受态的。利用单交换事件将质粒整合到枯草芽孢杆菌SecG基因座中,保持枯草芽孢杆菌SecG的完整性。在LA+100μg/mL壮观霉素上选择获得的菌株。挑选转化体,并划线在LA+100μg/mL壮观霉素上,选择单菌落,在LB+μg/mL壮观霉素中生长,直到达到OD 600为1,然后,制备冷冻的甘油储液,储存在-80℃。该菌株命名为JS1003。
(2)构建枯草芽孢杆菌宿主,其中克劳氏芽孢杆菌的截短的SecG替换了枯草芽孢杆菌(全长的)SecG(CF369)A组
利用下列引物,从名为JS1003(见上述)的枯草芽孢杆菌菌株中扩增含有secG启动子的枯草芽孢杆菌secG基因上游1Kb的片段:
JS 56(正向)枯草芽孢杆菌SecG上游区域起始:
GGCGCGCCCGGGGAGGATCTTTTTTACTATGATTTCG(SEQ ID NO:13)
JS 53(反向)枯草芽孢杆菌SecG上游终止(与克劳氏芽孢杆菌SecG融合的引物):
TGCGATCATCAAAAACAGCTGCATCCCATACACCTCCAGACTCA(SEQ ID NO:14)
利用下列引物,从已知为JS1003的菌株中扩增克劳氏芽孢杆菌secG基因:
JS 52(正向)克劳氏芽孢杆菌secG基因起始(与枯草芽孢杆菌SecG上游融合的引物):
TGAGTCTGGAGGTGTATGGGATGCAGCTGTTTTTGATGATCGCA(SEQ ID NO:17)
JS 68(反向)克劳氏芽孢杆菌SecG终止(lox spec融合引物):
GGATCCAGCTTATCGATACCGTCGATTATAGGAAATACGCATTTAACCCT(SEQ IDNO:19)
壮观霉素抗性基因的侧翼是lox位点,将所述基因从已经预先利用下列引物测序的质粒中扩增:
JS67(正向)lox-spec-lox起始(克劳氏芽孢杆菌SecG末端的融合引物)
AGGGTTAAATGCGTATTTCCTATAATCGACGGTATCGATAAGCTGGATCC(SEQ IDNO:20)
JS70(反向)lox-spec-lox终止(枯草芽孢杆菌SecG下游的融合引物)
CATCAGACCTTATACAAACATTGCCGGCCTAGGATGCATATGGCGGCCGC(SEQ IDNO:21)
利用下列引物从已知为JS1003的菌株中,扩增位于枯草芽孢杆菌secG基因下游的含有终止子的1Kb片段:
JS69(正向)枯草芽孢杆菌SecG下游起始(与lox-spec-lox融合)
GCGGCCGCCATATGCATCCTAGGCCGGCAATGTTTGTATAAGGTCTGATG(SEQ IDNO:22)
JS 17(反向)枯草芽孢杆菌SecG下游区域的终止:
GCGCGGAGCTCGCTTCCGTAATATTTAACATCTCC(SEQ ID NO:17)
利用下列引物和融合PCR(Ho等人,1989)将片段融合至一起:
利用引物JS 56和JS 68将JS 56/JS 53片段和JS 52/JS68融合。
利用引物JS 67和JS 17将JS 67/JS 70片段和JS 69/JS17融合。
利用引物JS 56和JS 17将上述片段融合。
图8中描述了获得的PCR融合体,其显示克劳氏芽孢杆菌的截短的SecG现在位于枯草芽孢杆菌secG启动子的下游,含有1Kb上游片段。
通过双交换事件,将该PCR片段直接转化到枯草芽孢杆菌宿主中,其整合到secG基因座中,替换了现有的枯草芽孢杆菌secG基因。从菌株菌落中产生PCR片段并测序。测序显示在位置40的终止密码子,其是由CAG突变成TAG而产生的。
(3)构建枯草芽孢杆菌宿主,其中全长克劳氏芽孢杆菌SecG替换了
枯草芽孢杆菌(全长的)SecG(CF370)A组
根据上述产生CF369的方法产生CF370菌株,不同之处在于使用编码克劳氏芽孢杆菌的全长SecG的多核苷酸序列作为模板扩增全长SecG。
(4)构建枯草芽孢杆菌宿主菌株,其中删除了SecG基因(CF395)组
A
利用下列引物,从已知为JS1003(见上述)的枯草芽孢杆菌菌株中扩增含有secG启动子的枯草芽孢杆菌secG基因上游1Kb的片段:
JS 56(正向)枯草芽孢杆菌SecG上游区域起始:
GGCGCGCCCGGGGAGGATCTTTTTTACTATGATTTCG(S EQ ID NO:13)
CF 07-17(反向)枯草芽孢杆菌SecG上游终止(与lox-spec-lox融合):
CAGCTTATCGATACCGTCGACCCATACACCTCCAGACTCAC(SEQ ID NO:23)
利用下列引物,从上述已知为CF375的菌株中扩增壮观霉素抗性基因,所述抗性基因侧翼具有lox位点,其与枯草芽孢杆菌SecG下游片段融合:
CF 07-16(正向)SecG上游3’与lox-spec-lox融合:
GTGAGTCTGGAGGTGTATGGGTCGACGGTATCGATAAGCTG(SEQ ID NO:24)
JS 17(反向)枯草芽孢杆菌SecG下游区域终止:
GCGCGGAGCTCGCTTCCGTAATATTTAACATCTCC(SEQ ID NO:16)
利用下列引物和融合PCR(Ho等人,1989)将片段融合至一起:
JS 56(正向)枯草芽孢杆菌SecG上游区域起始:
GGCGCGCCCGGGGAGGATCTTTTTTACTATGATTTCG(SEQ ID NO:13)
JS 17(反向)枯草芽孢杆菌SecG下游区域终止:
GCGCGGAGCTCGCTTCCGTAATATTTAACATCTCC(SEQ ID NO:16)
将该PCR片段直接转化到已知为BGSEC94(degU(Hy),oppA-)的枯草芽孢杆菌宿主菌株中,其中通过双交换事件,将所述片段整合到SecG基因座中,替换现有的枯草芽孢杆菌secG基因。
该宿主被制备为感受态的,并转化了来自一些枯草芽孢杆菌菌株的染色体DNA,所述菌株表达V049(Puramax)、具有E33Q或E33R突变的V049,或Properase,它们被整合在aprE启动子下。
II.B组菌株的构建:表述碱性蛋白酶V049、V049-E33Q、V049-E33R
或Properase之一的菌株
枯草芽孢杆菌菌株CF363、CF365、CF366和CF381是通过用整合载体转化已知为BGSEC94的枯草芽孢杆菌产生的,所述整合载体含有表达盒,所述表达盒包含枯草芽孢杆菌碱性蛋白酶(aprE)基因启动子、与克劳氏芽孢杆菌碱性丝氨酸蛋白酶信号肽的第9个密码子融合的枯草芽孢杆菌aprE信号肽的前8个密码子,以及编码以下蛋白质之一的基因:V049(wt前序列)(氨基酸序列SEQ ID NO:26;多核苷酸序列SEQ ID NO:31)、V049-E33Q(前序列突变)(氨基酸序列SEQ ID NO:27;多核苷酸序列SEQ ID NO:32)、V049-E33R(前序列突变)(AA SEQ ID NO:28;多核苷酸序列SEQ ID NO:33),和Properase(氨基酸序列SEQ ID NO:29;PNT SEQ ID NO:34)
将表达盒和氯霉素乙酰转移酶(catH,CAT)一起从质粒中作为NotI片段消化出来,自身连接,形成非复制型V049-catH DNA环。在连接混合物中实施滚环复制(TempliPhiTM DNA扩增试剂盒,Amersham)。为了提高转化频率,首先使用滚环复制转化高转化的感受态菌株BGSEC94comK。将转化物涂板在Luria琼脂(LA)+5μg/ml氯霉素(具有1.6%脱脂乳)的平板上,选择最独立的转化体,在具有1.6%脱脂乳的LA+5μg/mlcmp平板上划线成单菌落。选择一个单菌落,在Luria肉汤(LB)+5μg/mlcmp中生长过夜。中间菌株含有正确的蛋白酶-CAT表达盒,其被整合在染色体aprE基因座中。从该单一培养物提取染色体DNA。将该DNA转化到枯草芽孢杆菌菌株BGSEC94中。将转化体涂板在具有1.6%脱脂乳的LA+5μg/ml cmp上,并在25μg/ml cmp中进一步扩增菌株。制备冷冻的甘油储液。对每种V049、V049 E33Q/R和Properase重复该程序。
将小瓶环(loop of the vial)在具有LA+25μg/ml cmp的平板上划线。挑选一个单菌落,在Luria肉汤(LB)+5μg/ml cmp中生长过夜。从该单一培养物提取染色体DNA。将该DNA转化到上述SecG宿主菌株中。
III.构建C组菌株(其中用A组菌株与B组菌株杂交)
参见上表:将来自B组各个菌株的染色体DNA转化到A组的不同SecG菌株中,如表1所述。在100μg/ml壮观霉素和5μg/ml cmp中进行选择。菌株扩增至25μg/ml cmp,为每种菌株制备甘油小瓶,冷冻在-80℃。
实施例3
SecG和蛋白酶V049(SEQ ID NO:26)和Properase(SEQ ID NO:29)的产量
该实施例描述了下述实验,通过实施所述实验确定表达克劳氏芽孢杆菌的全长(SEQ ID NO:9)或截短的SecG(SEQ ID NO:11),对蛋白酶V049(SEQ ID NO:26)和Properase(SEQ ID NO:29)的产量的影响。
摇瓶实验数据#1:
在含有25μg/mL氯霉素(cmp)的LB平板上分离菌株CF363、CF371、CF375和CF379(扩增蛋白酶基因),将它们使用FNII修饰的摇瓶培养基进行摇瓶生长。使用0.01%接种物。在24、41和48小时采样,如实施例1所述确定蛋白酶产量。计算每种克劳氏芽孢杆菌蛋白酶的相对活性,根据分泌的蛋白酶活性确定SecG对克劳氏芽孢杆菌蛋白酶产量的影响。
图3显示了以补充方式表达的截短SecG(CF371),或者表达并替换内源性SecG的截短SecG(CF375)的表达对蛋白酶V049产量的影响、以及表达全长SecG同时替换内源性SecG对蛋白酶V049产量的影响。这些数据是与对照菌株CF363的V049产量对比得出的。
数据显示,在用截短的克劳氏芽孢杆菌SecG替换内源性secG的枯草芽孢杆菌细胞中,获得了显著的V049产量增长。与对照菌株CF363的产量相比,在用全长的克劳氏芽孢杆菌SecG基因替换内源性secG的枯草芽孢杆菌细胞中,也表现出V049的产量增长。
相似的,检测了SecG对CF381、CF374、CF 378和CF380菌株的Properase产量的影响。
图4显示了结果。数据显示,用截短的克劳氏芽孢杆菌SecG替换内源性secG的枯草芽孢杆菌细胞(菌株CF378)产生了更大水平的Properase,其大于用截短的克劳氏芽孢杆菌SecG补充内源性secG的细胞(CF374);大于用全长的克劳氏芽孢杆菌SecG替换内源性secG的细胞;并且大于CF381对照菌株(图4)。
摇瓶实验数据#2:
如上述,用相同的菌株重复摇瓶实验,使用5%接种物。测量18、24、40和48小时采集样品的蛋白酶活性。图5显示了第2次摇瓶实验的结果,其中V049在SecG菌株CF371、CF 375和CF389中表达。与菌株CF371和CF379,以及CF363对照菌株相比,菌株CF375,其中内源性secG基因被编码截短的克劳氏芽孢杆菌SecG的基因(SEQ ID NO:11)替换,再次产生了最高水平的蛋白酶。
实施例4
SecG和蛋白酶变体V049-E33Q(SEQ ID NO:27)和V049-E33R(SEQID NO:28)的产量
在含有25ug/mL cmp的LB平板上分离生产蛋白酶V049-E33Q(SEQID NO:36)和V049-E33R(SEQ ID NO:28)的菌株,及其相关对照(CF363)(扩增蛋白酶基因),如上述使用FNII修饰的摇瓶培养基进行摇瓶生长。使用5%接种物。在24、41和48小时采样,通过测定分泌的蛋白酶对底物的活性来确定蛋白酶产量,所述底物是琥珀酰-L-Ala-L-Ala-L-Pro-L-Phe-对硝基苯胺(AAPF)。
显示SecG对变体V049-E33Q(SEQ ID NO:27)产量的影响的数据如图6所示。数据显示,用截短的克劳氏芽孢杆菌SecG替换内源性secG的枯草芽孢杆菌细胞(菌株CF376)产生了更大水平的V049-E33Q,大于用截短的克劳氏芽孢杆菌SecG补充内源性secG的细胞(CF372);大于CF365和CF363对照菌株的V049-E33Q产量(图6)。
显示SecG对变体V049-E33R(SEQ ID NO:28)产量的影响的数据如图7所示。数据显示,用截短的克劳氏芽孢杆菌SecG基因替换内源性secG基因的枯草芽孢杆菌细胞(菌株CF377)产生了更大水平的V049-E33R,大于用截短的克劳氏芽孢杆菌SecG补充内源性secG的细胞(CF373);大于CF366和CF363对照菌株的V049-E33R的产量(图7)。
综上所述,这些数据表示,与不表达截短的SecG的相应对照菌株的蛋白酶产量相比,不论是野生型还是其变体蛋白酶(即,V049和变体V049-E33Q和V049-E33R),表达截短的SecG,都导致每种蛋白酶产量的最大增加。
实施例5
在表达V049的枯草芽孢杆菌菌株中缺失secG
产生全部删除secG基因的枯草芽孢杆菌菌株(CF395)(参见实施例2)。将来自枯草芽孢杆菌菌株的染色体DNA转化到宿主菌株CF395中,形成菌株CF396,其中,所述枯草芽孢杆菌菌株表达克劳氏芽孢杆菌的已知为V049或Puramax的碱性丝氨酸蛋白酶变体(CF363)(参见实施例2)。使用该规程在摇瓶中培养CF363和CF396:
用来自LA+25ug/mL cmp平板的单菌落接种5ml的LB+25μg/mLcmp,生长至1.0的OD600,然后将1ml该培养物接种到含有25ml FNII修饰的摇瓶培养基的摇瓶中。摇瓶在37℃,250rpm孵育48小时,在18、24、41和48小时的时间点移出样品。
如图9所示,来自已经删除内源性secG基因的枯草芽孢杆菌宿主细胞(CF396)的V049蛋白酶的分泌,大于来自未删除内源性secG基因的枯草芽孢杆菌宿主(CF363)。
因此,在已经移除内源性secG基因的宿主菌株中异源蛋白酶V049的产量,大于从未删除天然(内源性)secG基因的宿主菌株中获得的量。
实施例6宿主菌株生产的示例性蛋白酶的DNA和氨基酸序列
截短的克劳氏芽孢杆菌SecG的DNA序列(SEQ ID NO:12)
atgcagctgtttttgatgatcgcattaattattgtttctgtcctcttagtcgctgtcgttcttttgcagccaggtcgcagctctgggttatcgggcgccattactggaggggcagagagttgctaggaaaacaaaaagcgcgcgggcttgatgcggtattgcatcgagcaacaatcgtacttgctgttttgttttttattttgacagggttaaatgcgtatttcctataa
粗体、下划线的“t”是导致在位置40产生终止密码子的突变碱基。在野生型secG中是“c”。
截短的克劳氏芽孢杆菌SecG的氨基酸序列(SEQ ID NO:11)
MQLFLMIALIIVSVLLVAVVLLQPGRSSGLSGAITGGAE
克劳氏芽孢杆菌SecG的全长DNA序列(SEQ ID NO:10)
atgcagctgtttttgatgatcgcattaattattgtttctgtcctcttagtcgctgtcgttcttttgcagccaggtcgcagctctgggttatcgggcgccattactggaggggcagagagttgctaggaaaacaaaaagcgcgcgggcttgatgcggtattgcatcgagcaacaatcgtacttgctgttttgttttttattttgacagggttaaatgcgtatttcctataa
克劳氏芽孢杆菌SecG的全长氨基酸序列(SEQ ID NO:9)
MQLFLMIALIIVSVLLVAVVLLQPGRSSGLSGAITGGAEQLLGKQKARGLDAVLHRATIVLAVLFFILTGLNAYFL
全长Maxacal蛋白酶的氨基酸系列(SEQ ID NO:25)
AQSVPWGISRVQAPA
AHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNS
IGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAV
NSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGV
NVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLY
GSGLVNAEAATR
全长Puramax(V049)蛋白酶的氨基酸系列(SEQ ID NO:26)
AQSVPWGISRVQAPA
AHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNS
IGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAV
NSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGV
NVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLY
GSGLVNAEAATR
全长V049-E33Q的氨基酸系列(SEQ ID NO:27)
AQSVPWGISRVQAPA
AHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNS
IGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAV
NSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGV
NVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLY
GSGLVNAEAATR
全长V049-E33R的氨基酸系列(SEQ ID NO:28)
AQSVPWGISRVQAPA
AHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNS
IGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAV
NSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGV
NVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLY
GSGLVNAEAATR
Properase蛋白酶的氨基酸序列(SEQ ID NO:29)
AQSVPWGISRVQAPA
AHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNS
IGVLGVAPNAELYAVKVLGASGGGSNSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQA
VNSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPG
VNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNL
YGSGLVNAEAATR
全长Maxacal蛋白酶的DNA序列(SEQ ID NO:30)
gcgcaatcagtgccatggggaattagccgtgtgcaagccccagctgcccataaccgtggattgacaggttctggtgta
aaagttgctgtcctcgatacaggtatttccactcatccagacttaaatattcgtggtggcgctagctttgtaccagggaaccatcca
ctcaagatggaatgggcatggcacgcatgtggctgggacgattgctgctttaaacaattcgattggcgttcttggcgtagcaccg
aacgcggaactatacgctgttaaagtattaggggcgagcggttcaggttcggtcagctcgattgcccaaggattggaatgggca
gggaacaatggcatgcacgttgctaatttgagtttaggaagcccttcgccaagtgccacacttgagcaagctgttaatagcgcga
cttctagaggcgttcttgttgtagcggcatctgggaattcaggtgcaggctcaatcagctatccggcccgttatgcgaacgcaatgg
cagtcggagctactgaccaaaacaacaaccgcgccagcttttcacagtatggcgcagggcttgacattgtcgcaccaggtgtaa
acgtgcagagcacatacccaggttcaacgtatgccagcttaaacggtacatcgatggctactcctcatgttgcaggtgcagcagc
ccttgttaaacaaaagaacccatcttggtccaatgtacaaatccgcaatcatctaaagaatacggcaacgagcttaggaagcac
gaacttgtatggaagcggacttgtcaatgcagaagcggcaacacgctaa
全长Puramax(V049)蛋白酶的DNA序列(SEQ ID NO:31)
gcgcaatcggtaccatggggaattagccgtgtgcaagccccagctgcccataaccgtggattgacaggttctggtgta
aaagttgctgtcctcgatacaggtatttccactcatccagacttaaatattcgtggtggcgctagctttgtaccaggggaaccatcca
ctcaagatgggaatgggcatggcacgcatgtggctgggacgattgctgctttaaacaattcgattggcgttcttggcgtagcaccg
aacgcggaactatacgctgttaaagtattaggggcgagcggttcaggttcggtcagctcgattgcccaaggattggaatgggca
gggaacaatgttatgcacgttgctaatttgagtttaggactgcaggcaccaagtgccacacttgagcaagctgttaatagcgcgac
ttctagaggcgttcttgttgtagcggcatctgggaattcaggtgcaggctcaatcagctatccggcccgttatgcgaacgcaatggc
agtcggagctactgaccaaaacaacaaccgcgccagcttttcacagtatggcgcagggcttgacattgtcgcaccaggtgtaaa
cgtgcagagcacatacccaggttcaacgtatgccagcttaaacggtacatcgatggctactcctcatgttgcaggtgcagcagcc
cttgttaaacaaaagaacccatcttggtccaatgtacaaatccgcaatcatctaaagaatacggcaacgagcttaggaagcacg
aacttgtatggaagcggacttgtcaatgcagaagcggcaacacgt
全长V049-E33Q蛋白酶的DNA序列(SEQ ID NO:32)
gcgcaatcggtaccatgggaattagccgtgtgcaagccccagctgcccataaccgtgattgacaggttctggtgta
aaagttgctgtcctcgatacaggtatttccactcatccagacttaaatattcgtggtggcgctagctttgtaccaggggaaccatcca
ctcaagatgggaatgggcatggcacgcatgtggctgggacgattgctgctttaaacaattcgattggcgttcttggcgtagcaccg
aacgcggaactatacgctgttaaagtattaggggcgagcggttcaggttcggtcagctcgattgcccaaggattggaatgggca
gggaacaatgttatgcacgttgctaatttgagtttaggactgcaggcaccaagtgccacacttgagcaagctgttaatagcgcgac
ttctagaggcgttcttgttgtagcggcatctgggaattcaggtgcaggctcaatcagctatccggcccgttatgcgaacgcaatggc
agtcggagctactgaccaaaacaacaaccgcgccagcttttcacagtatggcgcagggcttgacattgtcgcaccaggtgtaaa
cgtgcagagcacatacccaggttcaacgtatgccagcttaaacggtacatcgatggctactcctcatgttgcaggtgcagcagcc
cttgttaaacaaaagaacccatcttggtccaatgtacaaatccgcaatcatctaaagaatacggcaacgagcttaggaagcacg
aacttgtatggaagcggacttgtcaatgcagaagcggcaacacgt
全长V049-E33R蛋白酶的DNA序列(SEQ ID NO:33)
gcgcaatcggtaccatggggaattagccgtgtgcaagccccagctgcccataaccgtggattgacaggttctggtgta
aaagttgctgtcctcgatacaggtatttccactcatccagacttaaatattcgtggtgcgctagctttgtaccaggggaaccatcca
ctcaagatgggaatgggcatggcacgcatgtggctgggacgattgctgctttaaacaattcgattggcgttcttggcgtagcaccg
aacgcggaactatacgctgttaaagtattaggggcgagcggttcaggttcggtcagctcgattgcccaaggattggaatgggca
gggaacaatgttatgcacgttgctaatttgagtttaggactgcaggcaccaagtgccacacttgagcaagctgttaatagcgcgac
ttctagaggcgttcttgttgtagcggcatctgggaattcaggtgcaggctcaatcagctatccggcccgttatgcgaacgcaatggc
agtcggagctactgaccaaaacaacaaccgcgccagcttttcacagtatggcgcagggcttgacattgtcgcaccaggtgtaaa
cgtgcagagcacatacccaggttcaacgtatgccagcttaaacggtacatcgatggctactcctcatgttgcaggtgcagcagcc
cttgttaaacaaaagaacccatcttggtccaatgtacaaatccgcaatcatctaaagaatacggcaacgagcttaggaagcacg
aacttgtatggaagcggacttgtcaatgcagaagcggcaacacgt
Properase蛋白酶的DNA序列(SEQ ID NO:34)
gcgcaatcggtaccatggggaattagccgtgtgcaagccccagctgcccataaccgtggattgacaggttctggtgta
aaagttgctgtcctcgatacaggtatttccactcatccagacttaaatattcgtggtggcgctagctttgtaccaggggaaccatcca
ctcaagatgggaatgggcatggcacgcatgtggctgggacgattgctgctttaaacaattcgattggcgttcttggcgtagcaccg
aacgcggaactatacgctgttaaagtattaggggcgagcggtggcggttcgaacagctcgattgcccaaggattggaatgggc
agggaacaatggcatgcacgttgctaatttgagtttaggaagcccttcgccaagtgccacacttgagcaagctgttaatagcgcg
acttctagaggcgttcttgttgtagcggcatctgggaattcaggtgcaggctcaatcagctatccggcccgttatgcgaacgcaatg
gcagtcggagctactgaccaaaacaacaaccgcgccagcttttcacagtatggcgcagggcttgacattgtcgcaccaggtgta
aacgtgcagagcacatacccaggttcaacgtatgccagcttaaacggtacatcgatggctactcctcatgttgcaggtgcagcag
cccttgttaaacaaaagaacccatcttggtccaatgtacaaatccgcaatcatctaaagaatacggcaacgagcttaggaagca
cgaacttgtatggaagcggacttgtcaatgcagaagcggcaacacgctaa
对于上述蛋白酶,与信号肽对应的多核苷酸和相应的氨基酸序列用斜体字显示,粗体显示了前区(pro-region),下划线是成熟蛋白酶的序列。
具有E33Q的V049变体前序列的DNA序列(SEQ ID NO:35)
gctgaagaagcaaaacaaaaatatttaattggctttaatgagcaggaagctgtcagtgagtttgtagaacaagtagaggcaaatgacgaggtcgccattctctctgaggaagaggaagtcgaaattgaattgcttcatgaatttgaaacgattcctgttttatccgttgagttaagcccagaagatgtggacgcgcttgaactcgatccagcgatttcttatattgaagaggatgcagaagtaacgacaatg
具有E33Q的V049变体前序列的氨基酸序列(SEQ ID NO:36)
AEEAKQKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM
具有E33R的V049变体前序列的DNA序列(SEQ ID NO:37)
gctgaagaagcaaaacgcaaatatttaattggctttaatgagcaggaagctgtcagtgagtttgtagaacaagtagaggcaaatgacgaggtcgccattctctctgaggaagaggaagtcgaaattgaattgcttcatgaatttgaaacgattcctgttttatccgttgagttaagcccagaagatgtggacgcgcttgaactcgatccagcgatttcttatattgaagaggatgcagaagtaacgacaatg
具有E33R的V049变体前序列的氨基酸序列(SEQ ID NO:38)
AEEAKRKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM
本文中引用的所有参考文献和公开出版物都通过引用全文整合到本文中。
应该注意到具有执行本发明的替换方式。因此,本实施方案认为是示例性的,而非限制性的,发明不受本文给出的细节的限制,可以在所附权利要求的范围和等价体内进行修饰。
Claims (19)
1.枯草芽胞杆菌细菌宿主细胞,其包含编码来自芽孢杆菌属物种的异源截短的SecG的异源多核苷酸,其中所述异源截短的SecG的氨基酸序列如SEQ ID NO:11所示,其中与不表达所述异源截短的SecG的相应细菌宿主细胞对所需的分泌多肽的分泌相比,所述细菌宿主细胞中所述异源截短的SecG的表达能够增加所述细菌宿主细胞对所述所需的分泌多肽的分泌。
2.权利要求1的细菌宿主细胞,其中所述异源多核苷酸替换了所述细菌宿主细胞的内源SecG的编码基因。
3.权利要求1的细菌宿主细胞,其中所述异源多核苷酸补充了所述细菌宿主细胞的内源SecG的编码基因。
4.权利要求1的细菌宿主细胞,其中所述截短的SecG包含全长SecG多肽的N-端前39个氨基酸。
5.权利要求1的细菌宿主细胞,其中所述截短的SecG来自克劳氏芽孢杆菌。
6.在枯草芽孢杆菌细菌宿主细胞中生产所需的分泌多肽的方法,其包括:
(a)在所述细菌宿主细胞中表达来自芽孢杆菌属物种的异源截短的SecG多肽,其中所述异源截短的SecG的氨基酸序列如SEQ ID NO:11所示,和
(b)生产所述所需的分泌多肽,其中,与不表达所述异源截短的SecG的相应细菌宿主细胞生产的所述所需多肽的量相比,所述异源截短的SecG能够增加所述细菌宿主细胞产生的所述所需的分泌多肽的量。
7.权利要求6的方法,其中所述异源截短的SecG是由替换了所述宿主细胞的内源SecG基因的截短的基因编码的。
8.权利要求6的方法,其中所述异源截短SecG多肽包含全长SecG多肽的前39个氨基酸。
9.权利要求6的方法,其中所述所需的分泌多肽是细菌的碱性丝氨酸蛋白酶。
10.权利要求9的方法,其中所述细菌的碱性丝氨酸蛋白酶是SEQ IDNO:26的碱性丝氨酸蛋白酶。
11.权利要求6的方法,其中所述细菌宿主细胞不表达内源SecG蛋白质。
12.权利要求6的方法,其中所述细菌宿主细胞表达内源SecG。
13.权利要求6的方法,其还包括回收所述所需的分泌多肽。
14.权利要求6的方法,其中所述截短的SecG来自克劳氏芽孢杆菌。
15.权利要求6的方法,其中缺失了所述细菌宿主细胞的内源SecG基因。
16.权利要求1的细菌宿主细胞,其中所述所需的分泌多肽是酶。
17.权利要求16的细菌宿主细胞,其中所述酶是丝氨酸蛋白酶。
18.权利要求1的细菌宿主细胞,其中所述所需的分泌多肽选自SEQID NO:25-29、36和38的蛋白酶。
19.权利要求1的细菌宿主细胞,其中缺失了所述细菌宿主细胞的内源SecG基因。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US92887507P | 2007-05-10 | 2007-05-10 | |
US60/928,875 | 2007-05-10 | ||
PCT/US2008/063418 WO2008141281A1 (en) | 2007-05-10 | 2008-05-12 | A modified secretion system to increase expression of polypeptides in bacteria |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101679489A CN101679489A (zh) | 2010-03-24 |
CN101679489B true CN101679489B (zh) | 2014-05-28 |
Family
ID=39791456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880014188.8A Active CN101679489B (zh) | 2007-05-10 | 2008-05-12 | 增加细菌内多肽表达的修饰的分泌系统 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8343735B2 (zh) |
EP (2) | EP2460823B1 (zh) |
CN (1) | CN101679489B (zh) |
AT (1) | ATE550348T1 (zh) |
DK (2) | DK2460823T3 (zh) |
WO (1) | WO2008141281A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2100947A1 (en) | 2008-03-14 | 2009-09-16 | The Procter and Gamble Company | Automatic dishwashing detergent composition |
CN105238801A (zh) * | 2009-04-24 | 2016-01-13 | 丹尼斯科美国公司 | 具有修饰的原区的蛋白酶 |
US9265819B2 (en) * | 2011-09-21 | 2016-02-23 | St. Jude Children's Research Hospital | Live, attenuated Streptococcus pneumoniae strain and vaccine for protection against pneumococcal disease |
CN103013960A (zh) * | 2012-12-21 | 2013-04-03 | 青岛蔚蓝生物集团有限公司 | 一种碱性蛋白酶及其重组表达工程菌 |
WO2023225459A2 (en) | 2022-05-14 | 2023-11-23 | Novozymes A/S | Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections |
CN114395577A (zh) * | 2022-01-06 | 2022-04-26 | 上海应用技术大学 | 一种基因工程菌的制备方法、基因工程菌及重组壳聚糖酶 |
CN116162140A (zh) * | 2022-07-19 | 2023-05-26 | 四川大学华西医院 | 一种幽门螺杆菌重组抗原蛋白SecG及其制备方法与应用 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4302544A (en) | 1979-10-15 | 1981-11-24 | University Of Rochester | Asporogenous mutant of B. subtilis for use as host component of HV1 system |
US4450235A (en) | 1982-04-21 | 1984-05-22 | Cpc International Inc. | Asporogenic mutant of bacillus subtilis useful as a host in a host-vector system |
US5310675A (en) | 1983-06-24 | 1994-05-10 | Genencor, Inc. | Procaryotic carbonyl hydrolases |
US4760025A (en) | 1984-05-29 | 1988-07-26 | Genencor, Inc. | Modified enzymes and methods for making same |
NZ208806A (en) | 1983-07-06 | 1988-07-28 | Gist Brocades Nv | Genetic engineering of industrial microorganism species: readily-transformable host used as intermediate in transfer of dna to the industrial species; plasmids |
US5700676A (en) * | 1984-05-29 | 1997-12-23 | Genencor International Inc. | Modified subtilisins having amino acid alterations |
EP0254735B2 (en) | 1986-01-15 | 1998-06-17 | Amgen Inc. | METHOD FOR PRODUCTION OF THERMALLY STABLE AND pH STABLE SUBTILISIN ANALOGS |
US4980288A (en) * | 1986-02-12 | 1990-12-25 | Genex Corporation | Subtilisin with increased thermal stability |
GB8608194D0 (en) | 1986-04-03 | 1986-05-08 | Massey Ferguson Services Nv | Valve control system |
WO1988006624A2 (en) | 1987-02-27 | 1988-09-07 | Gist-Brocades N.V. | Molecular cloning and expression of genes encoding proteolytic enzymes |
US4914031A (en) * | 1987-04-10 | 1990-04-03 | Amgen, Inc. | Subtilisin analogs |
DK6488D0 (da) | 1988-01-07 | 1988-01-07 | Novo Industri As | Enzymer |
PT89702B (pt) * | 1988-02-11 | 1994-04-29 | Gist Brocades Nv | Processo para a preparacao de novos enzimas proteoliticos e de detergentes que os contem |
US5665587A (en) | 1989-06-26 | 1997-09-09 | Novo Nordisk A/S | Modified subtilisins and detergent compositions containing same |
DK97190D0 (da) | 1990-04-19 | 1990-04-19 | Novo Nordisk As | Oxidationsstabile detergentenzymer |
US5482849A (en) | 1990-12-21 | 1996-01-09 | Novo Nordisk A/S | Subtilisin mutants |
DE69226182T2 (de) | 1991-05-01 | 1999-01-21 | Novo Nordisk A/S, Bagsvaerd | Stabilisierte enzyme und waschmittelzusammensetzungen |
DE4411223A1 (de) | 1994-03-31 | 1995-10-05 | Solvay Enzymes Gmbh & Co Kg | Verwendung alkalischer Proteasen in gewerblichen Textilwaschverfahren |
US20030157642A1 (en) * | 1997-07-15 | 2003-08-21 | Caldwell Robert M. | Increasing production of proteins in gram-positive microorganisms |
MA25044A1 (fr) | 1997-10-23 | 2000-10-01 | Procter & Gamble | Compositions de lavage contenant des variants de proteases multisubstituees. |
AU2207099A (en) | 1997-12-24 | 1999-07-19 | Genencor International, Inc. | An improved method of assaying for a preferred enzyme and/or preferred detergentcomposition |
US6835550B1 (en) * | 1998-04-15 | 2004-12-28 | Genencor International, Inc. | Mutant proteins having lower allergenic response in humans and methods for constructing, identifying and producing such proteins |
US6376450B1 (en) * | 1998-10-23 | 2002-04-23 | Chanchal Kumar Ghosh | Cleaning compositions containing multiply-substituted protease variants |
US6509185B1 (en) | 2000-01-07 | 2003-01-21 | Genencor International, Inc. | Mutant aprE promotor |
US7247450B2 (en) | 2002-02-08 | 2007-07-24 | Genencor International, Inc. | Secretion, transcription and sporulation genes in Bacillus clausii |
-
2008
- 2008-05-12 EP EP12157805.8A patent/EP2460823B1/en active Active
- 2008-05-12 WO PCT/US2008/063418 patent/WO2008141281A1/en active Application Filing
- 2008-05-12 US US12/598,182 patent/US8343735B2/en active Active
- 2008-05-12 CN CN200880014188.8A patent/CN101679489B/zh active Active
- 2008-05-12 DK DK12157805.8T patent/DK2460823T3/da active
- 2008-05-12 EP EP08780652A patent/EP2152732B1/en active Active
- 2008-05-12 AT AT08780652T patent/ATE550348T1/de active
- 2008-05-12 DK DK08780652.7T patent/DK2152732T3/da active
-
2012
- 2012-10-15 US US13/652,107 patent/US8623630B2/en active Active
Non-Patent Citations (3)
Title |
---|
Bost Sandrine et al.Both transmembrane domains of SecG contribute to signal sequence recognition by the Escherichia coli protein export machinery.《Molecular Microbiology》.2000,第38卷(第3期),575-587. * |
Bost Sandrine et al.Prl mutations in the Escherichia coli secG gene.《Journal of Biological Chemistry》.1997,第272卷(第7期),4087-4093. * |
Swaving Jelto et al.Preprotein translocation by a hybrid translocase composed of Escherichia coli and Bacillus Subtilis subunits.《Journal of Bacteriology》.1999,第181卷(第22期),7021-7026. * |
Also Published As
Publication number | Publication date |
---|---|
US20100184137A1 (en) | 2010-07-22 |
ATE550348T1 (de) | 2012-04-15 |
US20130102052A1 (en) | 2013-04-25 |
US8343735B2 (en) | 2013-01-01 |
EP2460823A1 (en) | 2012-06-06 |
US8623630B2 (en) | 2014-01-07 |
CN101679489A (zh) | 2010-03-24 |
DK2152732T3 (da) | 2012-06-04 |
EP2152732A1 (en) | 2010-02-17 |
DK2460823T3 (da) | 2014-05-05 |
WO2008141281A1 (en) | 2008-11-20 |
EP2460823B1 (en) | 2014-02-26 |
EP2152732B1 (en) | 2012-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101903519B (zh) | 杆菌中增强的蛋白质生产 | |
CN107922934A (zh) | 具有经修饰的前肽区域的蛋白酶 | |
US9593320B2 (en) | Proteases with modified pro regions | |
CN101679489B (zh) | 增加细菌内多肽表达的修饰的分泌系统 | |
CN102803290B (zh) | 用于增加蛋白质产生的芽孢杆菌属菌株 | |
US9523088B2 (en) | Modified proteases | |
JP5852568B2 (ja) | 修飾されたプレ‐プロ領域を有するプロテアーゼ | |
US20060057674A1 (en) | Translocating enzyme as a selection marker | |
CN107250371B (zh) | 增强的蛋白质表达 | |
CN114630895A (zh) | 用于增加地衣芽孢杆菌中蛋白质生产的组合物和方法 | |
JP6585602B2 (ja) | タンパク質発現の増大 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |