CN110072997A

CN110072997A - 具有蛋白酶活性的多肽和编码其的多核苷酸

Info

Publication number: CN110072997A
Application number: CN201780060772.6A
Authority: CN
Inventors: J.马修斯; K.詹森
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2016-11-23
Filing date: 2017-11-21
Publication date: 2019-07-30
Also published as: WO2018098124A1; CA3039809A1; US20190367952A1; EP3545086A1

Abstract

本发明涉及具有蛋白酶活性的多肽和编码这些多肽的多核苷酸。本发明还涉及包含这些多核苷酸的核酸构建体、载体和宿主细胞，以及产生和使用这些多肽的方法。

Description

具有蛋白酶活性的多肽和编码其的多核苷酸

序列表的引用

本申请包含处于计算机可读形式的序列表，将其通过引用结合在本文中。

技术领域

背景技术

发酵产物(例如乙醇)典型地是通过以下过程产生的：首先在干磨或湿磨过程中研磨含淀粉材料，然后使用酶将材料降解成可发酵糖，并且最后使用发酵生物将糖直接或间接转化为所希望的发酵产物。例如通过从其他液体和/或固体分离所希望的发酵产物的蒸馏，从发酵醪(通常被称为“啤酒醪液”)中回收液体发酵产物。剩余部分称为“全酒糟”。例如通过离心将全酒糟脱水并且分离为固相和液相。固相称为“湿饼”(或“湿谷物”)，并且液相(上清液)称为“酒糟水”。湿饼和酒糟水分别含有约35％和7％固体。将脱水的湿饼干燥以提供“干酒糟(Distillers Dried Grains)”(DDG)，用作动物饲料中的营养素。典型地蒸发酒糟水，以提供冷凝物和浆料或可替代地可以作为“反流(backset)”被直接再循环至浆料槽。冷凝物可以在排放前送往甲烷转化器或者可以被再循环至浆料槽。可以将浆体共混入DDG或在干燥前添加至湿饼中，以产生DDGS(含可溶物的干酒糟)。

WO 2012/088303(诺维信公司(Novozymes))披露了在从4.5至5.0范围的pH，在从80℃至90℃范围的温度，使用在pH 4.5、85℃、0.12mM CaCl₂下具有至少10的T1/2(min)的α-淀粉酶和具有超过20％的热稳定性值(确定为在80℃/70℃的相对活性)的蛋白酶的组合，通过液化含淀粉材料随后进行糖化和发酵来生产发酵产物的方法。

WO 2013/082486(诺维信公司)披露了在从高于5.0-7.0之间范围的pH，在高于初始糊化温度的温度，使用α-淀粉酶、具有超过20％的热稳定性值(确定为在80℃/70℃的相对活性)的蛋白酶、以及任选地产碳水化合物源的酶，通过液化含淀粉材料随后进行糖化和发酵来生产发酵产物的方法。使用来自强烈火球菌(Pyrococcus furiosus)(PfuS)的蛋白酶示例该方法。

WO 2014/209800(诺维信公司)披露了在高于初始糊化温度的温度，使用α-淀粉酶和高剂量的PfuS蛋白酶，通过液化含淀粉材料来生产发酵产物的方法。

越来越多的乙醇厂从作为副产物的酒糟水和/或浆体中提取油，供生物柴油生产或其他生物可再生产品中使用。发酵产物生产过程中的油回收/提取的大量工作已经集中在改善酒糟水中油的可提取性。油的有效去除通常通过己烷提取来完成。然而，己烷提取的使用由于需要高资金投入而未见广泛应用。因此，已经开发了改善从发酵产物生产过程进行油提取的其他方法。

WO 2011/126897(诺维信公司)披露了通过以下来回收油的方法：用α-淀粉酶将含淀粉材料转化为糊精；用产碳水化合物源的酶进行糖化以形成糖；使用发酵生物来发酵这些糖；其中发酵培养基包含半纤维素酶；蒸馏发酵产物，以形成全酒糟；将全酒糟分离为酒糟水和湿饼；并且从酒糟水回收油。发酵培养基可以进一步包含蛋白酶。

WO 2016/196202披露了来自高温球菌属(Thermococcus)的S8蛋白酶用于乙醇方法中。

本发明的一个目的是提供用于增加可从发酵产物生产过程中回收的油的量的改善方法，并且提供用于由含淀粉材料生产发酵产物(例如乙醇)的方法，这些方法相比于常规方法可以提供较高的发酵产物产量或其他优点。

发明内容

本发明涉及具有蛋白酶活性的多肽，该多肽选自由以下组成的组：

(a)多肽，该多肽与SEQ ID NO:2的成熟多肽具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性；

(b)多肽，该多肽由以下多核苷酸编码，该多核苷酸在非常高严格条件下与(i)SEQID NO:1的成熟多肽编码序列，(ii)(i)或(ii)的全长互补序列杂交；

(c)多肽，该多肽由以下多核苷酸编码，该多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％序列同一性；和

(d)(a)、(b)或(c)的多肽的片段，该片段具有蛋白酶活性。

本发明还涉及编码本发明的多肽的多核苷酸；包含这些多核苷酸的核酸构建体、重组表达载体、重组宿主细胞；以及产生这些多肽的方法。

本发明进一步涉及用于液化含淀粉材料的方法，该方法包括在至少α-淀粉酶和S8A减硫高温球菌(Thermococcus thioreducens)蛋白酶的存在下，在高于初始糊化温度的温度，液化该含淀粉材料。在另外的方面，本发明涉及由含淀粉材料生产发酵产物的方法，该方法包括以下步骤：a)在至少以下酶的存在下，在高于初始糊化温度的温度，液化该含淀粉材料：α-淀粉酶；和减硫高温球菌S8A蛋白酶；b)使用葡糖淀粉酶进行糖化；c)使用发酵生物进行发酵。

本发明进一步涉及从发酵产物生产中回收油的方法，该方法包括以下步骤：a)在至少以下酶的存在下，在高于初始糊化温度的温度，液化该含淀粉材料：α-淀粉酶；和本发明的减硫高温球菌S8A蛋白酶；b)使用葡糖淀粉酶进行糖化；c)使用发酵生物进行发酵；d)回收该发酵产物以形成全酒糟；e)将该全酒糟分离为酒糟水和湿饼；f)任选地将该酒糟水浓缩为浆体；其中从以下各项中回收油：在该方法的步骤a)之后液化的含淀粉材料；和/或该方法的发酵步骤c)的下游。

本发明进一步涉及酶组合物，该酶组合物包含本发明的减硫高温球菌S8A蛋白酶。

在仍另外的方面，本发明涉及减硫高温球菌S8A蛋白酶在液化含淀粉材料中的用途。

定义

S8A蛋白酶：术语“S8A蛋白酶”意指属于亚家族A的S8蛋白酶。枯草杆菌蛋白酶(EC3.4.21.62)是亚家族S8A中的一个亚组，然而，来自减硫高温球菌的本发明S8A蛋白酶是一种枯草杆菌蛋白酶样蛋白酶，其尚未被包括在IUBMB分类系统中。根据本发明的S8A蛋白酶水解底物Suc-Ala-Ala-Pro-Phe-pNA。对硝基苯胺(pNA)的释放导致在405nm处的吸光度增加，并且与酶活性成比例。

在一个方面，本发明的这些多肽具有SEQ ID NO:2的成熟多肽的至少20％，例如至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％或至少100％的蛋白酶活性。在一个实施例中，蛋白酶活性可以通过如实例2中披露的动力学Suc-AAPF-pNA测定来确定。

等位基因变体：术语“等位基因变体”意指占据相同染色体基因座的基因的两种或更多种替代形式的任一种。等位基因变异通过突变而自然产生，并且可以导致群体内部的多态性。基因突变可以是沉默的(所编码的多肽无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。

催化结构域：术语“催化结构域”意指酶的含有该酶的催化机构的区域。

cDNA：术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。初始的初级RNA转录物是mRNA的前体，其在呈现为成熟的剪接的mRNA之前要通过一系列的步骤(包括剪接)进行加工。

编码序列：术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由可读框确定，该可读框以起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可为基因组DNA、cDNA、合成DNA或其组合。

控制序列：术语“控制序列”意指表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即，来自相同基因)或外源的(即，来自不同基因)，或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导序列、多聚腺苷酸化序列、前肽序列、启动子、信号肽序列、和转录终止子。最少，控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的特异性限制性酶切位点的目的，这些控制序列可以提供有多个接头。

表达：术语“表达”包括涉及多肽产生的任何步骤，包括但不限于：转录、转录后修饰、翻译、翻译后修饰、以及分泌。

表达载体：术语“表达载体”意指直链或环状DNA分子，其包含编码多肽的多核苷酸并且可操作地连接至提供用于其表达的控制序列。

片段：术语“片段”意指具有从成熟多肽或结构域的氨基和/或羧基端缺失的一个或多个(例如，若干个)氨基酸的多肽；其中该片段具有蛋白酶活性。在一个方面，一个片段包含至少320个氨基酸残基(例如，SEQ ID NO:2的氨基酸102至422)。

宿主细胞：术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不完全相同的任何亲本细胞子代。

分离的：术语“分离的”意指处于自然界中不存在的形式或环境中的一种物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质，(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质，该物质至少部分地从与其性质相关的一种或多种或所有天然存在的成分中去除；(3)相对于自然界中发现的物质通过人工修饰的任何物质；或(4)通过相对于与其天然相关的其他组分增加物质的量而修饰的任何物质(例如，宿主细胞中的重组产生；编码该物质的基因的多个拷贝；以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。分离的物质可以存在于发酵液样品中；例如宿主细胞可以经遗传修饰以表达本发明的多肽。来自该宿主细胞的发酵液将包含分离的多肽。

成熟多肽：术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。在一个方面，该成熟多肽是SEQ ID NO:2的氨基酸102至422。SEQ ID NO:2的氨基酸1至25是信号肽。氨基酸26至101是前肽。

在本领域中已知的是，宿主细胞可以产生由相同多核苷酸表达的两种或多种不同的成熟多肽(即，具有不同的C-末端和/或N-末端氨基酸)的混合物。在本领域中还已知的是，不同的宿主细胞以不同的方式加工多肽，且因此表达多核苷酸的一种宿主细胞当与表达相同多核苷酸的另一种宿主细胞相比时可产生不同的成熟多肽(例如，具有不同的C-末端和/或N-末端氨基酸)。如实例部分所示，通过纯化蛋白酶的MS-EDMAN数据确认N-末端。

成熟多肽编码序列：术语“成熟多肽编码序列”意指编码具有蛋白酶活性的成熟多肽的多核苷酸。在一个方面，成熟多肽编码序列是SEQ ID NO:1的核苷酸304至1266。

核酸构建体：术语“核酸构建体”意指单-链或双链的核酸分子，该核酸分子是从天然存在的基因中分离的，或以本来不存在于自然界中的方式被修饰成包含核酸的区段，或是合成的，该核酸分子包含一个或多个控制序列。

可操作地连接：术语“可操作地连接”意指如下的构型，在该构型中，控制序列被放置在相对于多核苷酸的编码序列适当的位置处，使得该控制序列引导该编码序列的表达。

序列同一性：两个氨基酸序列之间或两个核苷酸序列之间的关联度通过参数“序列同一性”来描述。

出于本发明的目的，使用如在EMBOSS软件包(EMBOSS：欧洲分子生物学开放软件包(The European Molecular Biology Open Software Suite),Rice等人,2000,TrendsGenet.[遗传学趋势]16:276-277)(优选版本5.0.0或更新版本)的尼德尔(Needle)程序中所实施的尼德尔-翁施(Needleman-Wunsch)算法(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)确定两个氨基酸序列之间的序列同一性。使用的参数是空位开放罚分10、空位延伸罚分0.5、以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用尼德尔(Needle)标记的“最长同一性”的输出(使用-nobrief选项获得)作为同一性百分比并且如下计算：

(同一的残基x 100)/(比对长度-比对中的空位总数)

出于本发明的目的，使用如在EMBOSS软件包(EMBOSS：欧洲分子生物学开放软件包(EMBOSS:The European Molecular Biology Open Software Suite)，Rice等人,2000，同上)(优选版本5.0.0或更新版本)的尼德尔程序中所实施的尼德尔-翁施算法(Needleman和Wunsch,1970，同上)确定两个脱氧核糖核苷酸序列之间的序列同一性。使用的参数是空位开放罚分10，空位延伸罚分0.5，以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用尼德尔标记的“最长同一性”的输出(使用-nobrief选项获得)作为同一性百分比并且如下计算：

(同一的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)

严格条件：术语“非常低严格条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25％甲酰胺中预杂交和杂交12至24小时。最后在45℃使用2X SSC、0.2％SDS将运载体材料洗涤三次，每次15分钟。

术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25％甲酰胺中预杂交和杂交12至24小时。最后在50℃使用2X SSC、0.2％SDS将运载体材料洗涤三次，每次15分钟。

术语“中严格条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35％甲酰胺中预杂交和杂交12至24小时。最后在55℃使用2X SSC、0.2％SDS将运载体材料洗涤三次，每次15分钟。

术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35％甲酰胺中预杂交和杂交12至24小时。最后在60℃使用2X SSC、0.2％SDS将运载体材料洗涤三次，每次15分钟。

术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50％甲酰胺中预杂交和杂交12至24小时。最后在65℃使用2X SSC、0.2％SDS将运载体材料洗涤三次，每次15分钟。

术语“非常高严格条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50％甲酰胺中预杂交和杂交12至24小时。最后在70℃使用2X SSC、0.2％SDS将运载体材料洗涤三次，每次15分钟。

子序列：术语“子序列”意指具有从成熟多肽编码序列的5'端和/或3'端缺失的一个或多个(例如，若干个)核苷酸的多核苷酸；其中该子序列编码具有蛋白酶活性的片段。

变体：术语“变体”意指具有蛋白酶活性的、在一个或多个(例如，若干个)位置处包含改变(即，取代、插入和/或缺失)的多肽。取代意指用不同的氨基酸替代占用某一位置的氨基酸；缺失意指去除占用某一位置的氨基酸；并且插入意指在邻接并且紧随占用某一位置的氨基酸之后添加氨基酸。在描述变体中，以下所述的命名法适于方便参考。采用了已接受的IUPAC单字母或三字母的氨基酸缩写。

取代对于氨基酸取代，使用以下命名法：原始氨基酸、位置、被取代的氨基酸。因此，将在位置226处的苏氨酸被丙氨酸取代表示为“Thr226Ala”或“T226A”。多个突变由加号(“+”)分开，例如“Gly205Arg+Ser411Phe”或“G205R+S411F”代表在位置205和位置411处的甘氨酸(G)和丝氨酸(S)分别被精氨酸(R)和苯丙氨酸(F)取代。

缺失对于氨基酸缺失，使用以下命名法：原有氨基酸、位置、^*。因此，将在位置195处的甘氨酸的缺失表示为“Gly195*”或“G195*”。多个缺失由加号(“+”)分开，例如，“Gly195*+Ser411*”或“G195*+S411*”。

插入对于氨基酸插入，使用以下命名法：原始氨基酸、位置、原始氨基酸、插入的氨基酸。因此，将在位置195处的甘氨酸之后插入赖氨酸表示为“Gly195GlyLys”或“G195GK”。将多个氨基酸的插入表示为[原始氨基酸、位置、原始氨基酸、插入的氨基酸#1、插入的氨基酸#2；等]。例如，将在位置195处的甘氨酸之后插入赖氨酸和丙氨酸表示为“Gly195GlyLysAla”或“G195GKA”。

多种改变。包含多种改变的变体由加号(“+”)分开，例如，“Arg170Tyr+Gly195Glu”或“R170Y+G195E”代表在位置170和位置195处的精氨酸和甘氨酸分别被酪氨酸和谷氨酸取代。

不同改变。在可以于一个位置处引入不同改变的情况下，不同的改变由逗号分开，例如，“Arg170Tyr,Glu”代表用酪氨酸或谷氨酸取代在位置170处的精氨酸。因此，“Tyr167Gly,Ala+Arg170Gly,Ala”表示以下变体：

“Tyr167Gly+Arg170Gly”、“Tyr167Gly+Arg170Ala”、“Tyr167Ala+Arg170Gly”、和“Tyr167Ala+Arg170Ala”。

具体实施方式

具有蛋白酶活性的多肽

在一个实施例中，本发明涉及与SEQ ID NO:2的成熟多肽具有至少80％、至少85％、至少90％、95％、至少96％、至少97％、至少98％、至少99％、或100％序列同一性的多肽，该多肽具有蛋白酶活性。在一个方面，这些多肽与SEQ ID NO:2的成熟多肽相差多达10个(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸。

在一个具体的实施例中，本发明涉及与SEQ ID NO:2的成熟多肽具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性的多肽，并且其中该多肽具有SEQ ID NO:2的成熟多肽的至少75％的蛋白酶活性。

在一个具体的实施例中，本发明涉及与SEQ ID NO:2的成熟多肽具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性的多肽，并且其中该多肽具有SEQ ID NO:2的成熟多肽的至少80％的蛋白酶活性。

在一个具体的实施例中，本发明涉及与SEQ ID NO:2的成熟多肽具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性的多肽，并且其中该多肽具有SEQ ID NO:2的成熟多肽的至少85％的蛋白酶活性。

在一个具体的实施例中，本发明涉及与SEQ ID NO:2的成熟多肽具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性的多肽，并且其中该多肽具有SEQ ID NO:2的成熟多肽的至少90％的蛋白酶活性。

在一个具体的实施例中，本发明涉及与SEQ ID NO:2的成熟多肽具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性的多肽，并且其中该多肽具有SEQ ID NO:2的成熟多肽的至少95％的蛋白酶活性。

在一个具体的实施例中，本发明涉及与SEQ ID NO:2的成熟多肽具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性的多肽，并且其中该多肽具有SEQ ID NO:2的成熟多肽的至少96％的蛋白酶活性。

在一个具体的实施例中，本发明涉及与SEQ ID NO:2的成熟多肽具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性的多肽，并且其中该多肽具有SEQ ID NO:2的成熟多肽的至少97％的蛋白酶活性。

在一个具体的实施例中，本发明涉及与SEQ ID NO:2的成熟多肽具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性的多肽，并且其中该多肽具有SEQ ID NO:2的成熟多肽的至少98％的蛋白酶活性。

在一个具体的实施例中，本发明涉及与SEQ ID NO:2的成熟多肽具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性的多肽，并且其中该多肽具有SEQ ID NO:2的成熟多肽的至少99％的蛋白酶活性。

SEQ ID NO:1的多核苷酸或其子序列，以及SEQ ID NO:2的多肽或其片段可根据本领域熟知的方法用于设计核酸探针以鉴定和克隆来自不同属或种的株系的、编码具有蛋白酶活性的多肽的DNA。特别地，可以遵循标准DNA印迹程序，使用此类探针来与感兴趣的细胞的基因组DNA或cDNA杂交，以便鉴定和分离其中的相应基因。此类探针可明显短于完整序列，但是长度应为至少15，如至少25、至少35、或至少70个核苷酸。优选地，该核酸探针长度为至少100个核苷酸，例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。DNA和RNA探针两者都可使用。典型地将探针进行标记(例如，用³²P、³H、³⁵S、生物素、或抗生物素蛋白)，用于检测相应的基因。此类探针涵盖于本发明中。

可以筛选从此类其他菌株制备的基因组DNA或cDNA文库的与上述探针杂交并编码具有蛋白酶活性的多肽的DNA。来自此类其他菌株的基因组DNA或其他DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳或其他分离技术来分离。可将来自文库的DNA或分离的DNA转移到并固定在硝化纤维素或其他合适的运载体材料上。为了鉴定与SEQ ID NO:1或其子序列杂交的克隆或DNA，在DNA印迹中使用运载体材料。

出于本发明的目的，杂交表示多核苷酸与对应于以下的标记的核酸探针杂交：(i)SEQ ID NO:1；(ii)SEQ ID NO:1的成熟多肽编码序列；(iii)其全长互补序列；或(iv)其子序列；杂交是在非常低的至非常高的严格条件下进行。可以使用例如X-射线胶片或本领域已知的任何其他检测手段来检测在这些条件下核酸探针杂交的分子。

在一个方面，核酸探针是SEQ ID NO:1的核苷酸1至1266。在另一个方面，核酸探针是编码以下的多核苷酸：SEQ ID NO:2的多肽；其成熟多肽；或其片段。在另一个方面，核酸探针是SEQ ID NO:1。

在另一个实施例中，本发明涉及具有蛋白酶活性的多肽，该多肽由以下多核苷酸编码，该多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少80％，如至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％序列同一性。在另外的实施例中，该多肽已经被分离。

在另一个实施例中，本发明涉及在一个或多个(例如，若干个)位置处包含取代、缺失、和/或插入的SEQ ID NO：2的成熟多肽的变体。在一个实施例中，引入SEQ ID NO:2的成熟多肽中的氨基酸取代、缺失和/或插入的数目多达10个，例如1、2、3、4、5、6、7、8、9或10个。这些氨基酸改变可以具有微小性质，即，不会显著地影响蛋白质的折叠和/或活性的保守氨基酸取代或插入；典型地为1-30个氨基酸的小缺失；小的氨基-末端或羧基末端延伸，例如氨基末端的甲硫氨酸残基；多达20-25个残基的小接头肽；或小的延伸，其通过改变净电荷或另一官能(例如聚组氨酸段、抗原表位或结合结构域)来促进纯化。

保守取代的实例是在下组之内：碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸)。通常不会改变比活性的氨基酸取代是本领域已知的并且例如由H.Neurath和R.L.Hill,1979,于The Proteins[蛋白质],Academic Press[学术出版社]，纽约中描述。常见取代为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。

可以根据本领域中已知的程序，例如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science[科学]244:1081-1085)来鉴定多肽中的必需氨基酸。在后一项技术中，在该分子中的每个残基处引入单个丙氨酸突变，并且测试所得分子的蛋白酶活性以鉴定对于该分子的活性关键的氨基酸残基。还参见，Hilton等人,1996,J.Biol.Chem.[生物化学杂志]271:4699-4708。酶或其他生物学相互作用的活性部位还可通过对结构的物理分析来确定，如由下述技术确定：核磁共振、晶体学(crystallography)、电子衍射、或光亲和标记，连同对推定的接触位点(contract site)氨基酸进行突变。参见，例如，de Vos等人,1992,Science[科学]255:306-312；Smith等人,1992,J.Mol.Biol.[分子生物学杂志]224:899-904；Wlodaver等人,1992,FEBS Lett.[欧洲生化学会联合会快报]309:59-64。还可以从与相关多肽的比对来推断必需氨基酸的身份。

使用已知的诱变、重组和/或改组方法、随后进行相关的筛选程序可以做出单或多氨基酸取代、缺失和/或插入并对其进行测试，这些相关的筛选程序例如由Reidhaar-Olson和Sauer,1988,Science[科学]241:53-57；Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2152-2156；WO 95/17413；或WO 95/22625中披露的那些。其他可以使用的方法包括易错PCR、噬菌体展示(例如Lowman等人,1991,Biochemistry[生物化学]30:10832-10837；美国专利号5,223,409；WO 92/06204)以及区域定向诱变(Derbyshire等人,1986,Gene[基因]46:145；Ner等人,1988,DNA 7:127)。

诱变/改组方法可以与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等人,1999,Nature Biotechnology[自然生物技术]17:893-896)。可从宿主细胞回收编码活性多肽的诱变的DNA分子，并使用本领域的标准方法快速测序。这些方法允许快速确定多肽中各个氨基酸残基的重要性。

该多肽可以是杂合多肽，其中一种多肽的区域在另一种多肽的区域的N-末端或C-末端处融合。

该多肽可以是融合多肽或可切割的融合多肽，其中另一个多肽在本发明多肽的N-末端或C-末端处融合。通过将编码另一种多肽的多核苷酸融合于本发明的多核苷酸来产生融合多肽。用于产生融合多肽的技术是本领域已知的，且包括连接编码多肽的编码序列使得它们符合读框，而且融合多肽的表达处于一个或多个相同的启动子和终止子的控制之下。还可以使用内含肽技术构建融合多肽，其中在翻译后产生融合多肽(Cooper等人,1993,EMBO J.[欧洲分子生物学学会杂志]12:2575-2583；Dawson等人,1994,Science[科学]266:776-779)。

融合多肽可以进一步包含两种多肽之间的切割位点。在融合蛋白分泌之时，该位点被切割，从而释放出这两种多肽。切割位点的实例包括但不限于在以下文献中披露的位点：Martin等人,2003,J.Ind.Microbiol.Biotechnol.[工业微生物生物技术杂志]3:568-576；Svetina等人,2000,J.Biotechnol.[生物技术杂志]76:245-251；Rasmussen-Wilson等人,1997,Appl.Environ.Microbiol.[应用与环境微生物学]63:3488-3493；Ward等人,1995,Biotechnology[生物技术]13:498-503；和Contreras等人,1991,Biotechnology[生物技术]9:378-381；Eaton等人,1986,Biochemistry[生物化学]25:505-512；Collins-Racie等人,1995，Biotechnology[生物技术]13:982-987；Carter等人,1989,Proteins[蛋白质]；Structure,Function,and Genetics[结构、功能以及遗传学]6:240-248；以及Stevens,2003,Drug Discovery World[世界药物发现]4:35-48。具有蛋白酶活性的多肽的来源

可以从高温球菌属的微生物获得本发明的具有蛋白酶活性的多肽。

在另一个方面，该多肽是减硫高温球菌多肽。

这些物种的菌株可容易地在许多培养物保藏中心为公众所获得，如美国典型培养物保藏中心(American Type Culture Collection，ATCC)、德国微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH，DSMZ)、荷兰菌种保藏中心(Centraalbureau Voor Schimmelcultures，CBS)以及美国农业研究服务专利培养物保藏中心北方地区研究中心(Agricultural Research Service Patent CultureCollection,Northern Regional Research Center，NRRL)。

可以使用以上提到的探针从其他来源，包括从自然界(例如，土壤、堆肥、水等)分离的微生物或直接从天然材料(例如，土壤、堆肥、水等)获得的DNA样品鉴定和获得该多肽。用于从天然生境中直接分离微生物和DNA的技术是本领域熟知的。然后可以通过类似地筛选另一微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码该多肽的多核苷酸。一旦已经用一种或多种探针检测到编码多肽的多核苷酸，则可以通过利用本领域普通技术人员已知的技术(参见例如，Sambrook等人,1989，同上)分离或克隆多核苷酸。

多核苷酸

本发明还涉及编码本发明的多肽的多核苷酸，如本文中所述。在一个实施例中，编码本发明的多肽的多核苷酸已经被分离。

用于分离或克隆多核苷酸的技术是本领域已知的且包括从基因组DNA或cDNA或其组合进行分离。可以例如通过使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特征的克隆DNA片段，实现从基因组DNA克隆多核苷酸。参见例如，Innis等人,1990,PCR:AGuide to Methods and Application[PCR：方法和应用指南],AcademicPress[学术出版社],纽约。可以使用其他核酸扩增程序如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。这些多核苷酸可以克隆自高温球菌尤其是减硫高温球菌的菌株或相关生物，并且因此，例如可以是该多核苷酸多肽编码区的等位基因变体或物种变体。

核酸构建体

本发明还涉及核酸构建体，其包含可操作地连接至一个或多个控制序列的本发明的多核苷酸，在与控制序列相容的条件下，该一个或多个控制序列指导该编码序列在合适的宿主细胞中的表达。

在一个具体的实施例中，至少一种控制序列与编码本发明的变体的多核苷酸是异源的。因此，该核酸构建体在自然界中是不可见的。

可用许多方式操作多核苷酸以提供多肽的表达。取决于表达载体，在多核苷酸插入载体之前对其进行操作可以是希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。

该控制序列可为启动子，即，被宿主细胞识别用于表达编码本发明的多肽的多核苷酸的多核苷酸。该启动子包含转录控制序列，其介导该多肽的表达。该启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸，包括变体、截短型及杂合型启动子，并且可以从编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。

用于在细菌宿主细胞中指导本发明核酸构建体的转录的合适的启动子的实例是从以下基因中获得的启动子：解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(Agaisse和Lereclus,1994,Molecular Microbiology[分子微生物学]13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon等人,1988,基因69:301-315)、天蓝链霉菌琼脂水解酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等人,1978,Natl.Acad.Sci.USA[美国国家科学院院刊]75:3727-3731)以及tac启动子(DeBoer等人,1983,Natl.Acad.Sci.USA[美国国家科学院院刊]80:21-25)。其他启动子描述于Gilbert等人,1980,Scientific American[科学美国人]242:74-94的“Useful proteinsfrom recombinant bacteria[来自重组细菌的有用蛋白质]”；和在Sambrook等人,1989,同上。串联启动子的实例披露于WO 99/43835中。

控制序列也可为由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接到编码该多肽的多核苷酸的3'-末端。在宿主细胞中有功能的任何终止子可用于本发明中。

细菌宿主细胞的优选终止子从针对以下的基因获得：克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)、和大肠杆菌核糖体RNA(rrnB)。

控制序列还可以是在启动子下游并且在基因编码序列上游的mRNA稳定子区域，它增加该基因的表达。

合适的mRNA稳定子区的实例从以下获得：苏云金芽孢杆菌cryIIIA基因(WO 94/25612)和枯草芽孢杆菌SP82基因(Hue等人,1995,Journal of Bacteriology[细菌学杂志]177:3465-3471)。

控制序列也可以是前导序列，即对宿主细胞翻译很重要的mRNA的非翻译区域。该前导序列可操作地连接至编码该多肽的多核苷酸的5’-末端。可以使用在宿主细胞中有功能的任何前导序列。

控制序列也可为编码与多肽的N-末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5’-端可固有地包含在翻译阅读框中与编码多肽的编码序列的区段天然地连接的信号肽编码序列。可替代地，编码序列的5'-端可包含对于编码序列为外源的信号肽编码序列。在编码序列天然地不包含信号肽编码序列的情况下，可能需要外源信号肽编码序列。可替代地，外源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而，可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。

用于细菌宿主细胞的有效信号肽编码序列是从芽孢杆菌NCIB 11837生麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA的基因获得的信号肽编码序列。另外的信号肽由Simonen和Palva,1993,Microbiological Reviews[微生物评论]57:109-137描述。

控制序列也可以是编码位于多肽N-末端处的前肽的前肽编码序列。所得的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下的基因获得：枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。

在信号肽序列和前肽序列两者都存在的情况下，该前肽序列位于紧邻多肽的N-末端且该信号肽序列位于紧邻该前肽序列的N-末端。

表达载体

本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。多个核苷酸和控制序列可连接在一起以产生重组表达载体，其可包括一个或多个便利的限制位点以允许编码该多肽的多核苷酸在此类位点处的插入或取代。在一个具体的实施例中，至少一种控制序列与本发明的多核苷酸是异源的。可替代地，可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中而表达该多核苷酸。在产生该表达载体时，该编码序列位于该载体中，这样使得该编码序列与该用于表达的适当控制序列可操作地连接。

重组表达载体可以是可以方便地经受重组DNA程序并且可以引起多核苷酸表达的任何载体(例如，质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性或闭合环状质粒。

载体可以是自主复制载体，即作为染色体外实体存在的载体，其复制独立于染色体复制，例如质粒、染色体外元件、微染色体或人工染色体。载体可以包含用于确保自我复制的任何手段。可替代地，载体可以是这样的载体，当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。此外，可以使用单独的载体或质粒或两个或更多个载体或质粒，其共同包含待引入宿主细胞基因组的总DNA，或可以使用转座子。

载体优选地包含允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标志。选择性标志是一种基因，其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养型等。

细菌选择性标志的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因、或赋予抗生素抗性(如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素、或四环素抗性)的标志。

选择性标志可以是如WO 2010/039889中所述的双选择性标志系统。在一个方面，双选择性标志是hph-tk双选择性标志系统。

载体优选地包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。

对于整合到该宿主细胞基因组中，该载体可以依靠编码该多肽的多核苷酸序列或用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地，该载体可包含用于指导通过同源重组而整合入宿主细胞基因组中的染色体中的精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性，整合元件应当包含足够数目的核酸，如100至10,000个碱基对、400至10,000个碱基对和800至10,000个碱基对，该核酸与对应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外，整合元件可以是非编码或编码的多核苷酸。另一方面，载体可以通过非同源重组整合入宿主细胞的基因组中。

为了自主复制，载体还可以另外包含复制起点，该复制起点使得载体在讨论中的宿主细胞中自主复制成为可能。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。

细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、和pACYC184的复制起点，以及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060、和pAMβ1的复制起点。

可将本发明多核苷酸的多于一个拷贝插入宿主细胞以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包括与该多核苷酸一起的可扩增的选择性标志基因可以获得多核苷酸的增加的拷贝数目，其中通过在适当的选择性试剂的存在下培养细胞可以选择含有选择性标志基因的经扩增的拷贝以及由此该多核苷酸的另外的拷贝的细胞。

用于连接以上所述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见例如，Sambrook等人，1989，见上文)。宿主细胞

本发明还涉及重组宿主细胞，这些宿主细胞包含可操作地连接至一个或多个控制序列的本发明的多核苷酸，该一个或多个控制序列指导本发明的多肽的产生。在一个实施例中，该一种或多种控制序列与本发明的多核苷酸是异源的。将包含多核苷酸的构建体或载体引入宿主细胞中，这样使得该构建体或载体作为染色体整合体或作为自主复制的染色体外载体维持，如较早前所述。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不完全相同的任何亲本细胞子代。宿主细胞的选择将在很大程度上取决于编码该多肽的基因及其来源。

该宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞，例如原核细胞或真核细胞。

原核宿主细胞可以是任何革兰氏阳性细菌。革兰氏阳性细菌包括但不限于：芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、大洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属、链球菌属、以及链霉菌属。革兰氏阴性细菌包括但不限于弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单孢菌属、沙门氏菌属和脲原体属。

细菌宿主细胞可以是任何芽孢杆菌属细胞，包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌细胞。

将DNA引入芽孢杆菌属细胞中可以通过以下来实现：原生质体转化(参见，例如，Chang和Cohen，1979，Mol.Gen.Genet.[分子遗传学与基因组学]168:111-115)、感受态细胞转化(参见例如，Young和Spizizen,1961，J.Bacteriol.[细菌学杂志]81:823-829；或Dubnau和Davidoff-Abelson，1971，J.Mol.Biol.[分子生物学杂志]56:209-221)、电穿孔(参见例如，Shigekawa和Dower，1988，Biotechniques[生物技术]6:742-751)或接合(参见例如，Koehler和Thorne，1987，J.Bacteriol.[细菌学杂志]169:5271-5278)。将DNA引入大肠杆菌细胞中可以通过以下来实现：原生质体转化(参见例如，Hanahan，1983，J.Mol.Biol.[分子生物学杂志]166:557-580)或电穿孔(参见例如，Dower等人，1988，Nucleic AcidsRes.[核酸研究]16:6127-6145)。将DNA引入链霉菌属细胞中可以通过以下来实现：原生质体转化、电穿孔(参见例如，Gong等人,2004,Folia Microbiol.(Praha)[叶线形微生物学(布拉格)]49:399-405)、接合(参见例如，Mazodier等人,1989,J.Bacteriol.[细菌学杂志]171:3583-3585)、或转导(参见例如，Burke等人，2001,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]98:6289-6294)。将DNA引入假单孢菌属细胞中可以通过以下来实现：电穿孔(参见例如，Choi等人,2006,J.Microbiol.Methods[微生物学方法杂志]64:391-397)或接合(参见例如，Pinedo和Smets,2005,Appl.Environ.Microbiol.[应用与环境微生物学]71:51-57)。将DNA引入链球菌属细胞中可以通过以下来实现：天然感受态(naturalcompetence)(参见例如，Perry和Kuramitsu,1981,Infect.Immun.[感染与免疫]32:1295-1297)、原生质体转化(参见，例如，Catt和Jollick，1991，Microbios[微生物学]68:189-207)、电穿孔(参见，例如，Buckley等人，1999，Appl.Environ.Microbiol.[应用与环境微生物学]65:3800-3804)、或接合(参见，例如，Clewell，1981，Microbiol.Rev.[微生物学评论]45:409-436)。然而，可以使用本领域中已知的将DNA引入宿主细胞中的任何方法。

产生方法

本发明还涉及产生本发明的多肽的方法，这些方法包括(a)在有益于产生该多肽的条件下培养细胞，该细胞以其野生型形式产生该多肽；和任选地(b)回收该多肽。在一个方面，该细胞是减硫高温球菌细胞，特别是DSM14981。

本发明还涉及产生本发明的多肽的方法，这些方法包括(a)在有益于产生该多肽的条件下培养本发明的重组宿主细胞；和任选地(b)回收该多肽。

宿主细胞是在适合使用本领域已知的方法产生多肽的营养培养基中培养的。例如，可以通过摇瓶培养、或在实验室或工业发酵器中小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)培养细胞，该培养在合适的培养基中并且在允许表达和/或分离多肽的条件下进行。使用本领域中已知的程序，培养发生在包含碳和氮来源及无机盐的合适的营养培养基中。合适的培养基可从商业供应商获得或可以根据公开的组成(例如，在美国典型培养物保藏中心的目录中)制备。如果多肽被分泌到该营养培养基中，那么可以直接从该培养基中回收该多肽。如果多肽不进行分泌，那么其可以从细胞裂解液中进行回收。

可以使用本领域已知的方法来回收多肽。例如，可通过常规方法，包括但不限于，收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀，从营养培养基回收多肽。在一个方面，回收包含多肽的发酵液。

可以通过本领域已知的多种程序纯化多肽以获得基本上纯的多肽，这些程序包括但不限于：色谱法(例如，离子交换、亲和、疏水、色谱聚焦和尺寸排阻)、电泳程序(例如，制备型等电聚焦)、差示溶解度(例如，硫酸铵沉淀)、SDS-PAGE、或提取(参见例如，ProteinPurification[蛋白质纯化],Janson和Ryden编辑,VCH Publishers[VCH出版公司],纽约,1989)。

在一个替代性方面，不回收多肽，而是将表达该多肽的本发明的宿主细胞用作多肽的来源。

发酵液配制品或细胞组合物

本发明还涉及包含本发明的多肽的发酵液配制品或细胞组合物。该发酵液产物进一步包含在发酵过程中使用的另外的成分，例如像细胞(包括含有编码本发明的多肽的基因的宿主细胞，这些宿主细胞用于产生感兴趣的多肽)、细胞碎片、生物质、发酵培养基和/或发酵产物。在一些实施例中，该组合物是含有一种或多种有机酸、杀灭的细胞和/或细胞碎片以及培养基的细胞杀灭的全培养液。

如本文使用的术语“发酵液”是指由细胞发酵产生的、不经历或经历最少的回收和/或纯化的制剂。例如，当微生物培养物在允许蛋白质合成(例如，由宿主细胞表达酶)并且将蛋白质分泌到细胞培养基中的碳限制条件下孵育生长到饱和时，产生发酵液。该发酵液可以含有在发酵结束时得到的发酵材料的未分级的或分级的内容物。典型地，该发酵液是未分级的并且包含用过的培养基以及例如通过离心去除微生物细胞(例如，丝状真菌细胞)之后存在的细胞碎片。在一些实施例中，该发酵液含有用过的细胞培养基、胞外酶以及有活力的和/或无活力的微生物细胞。

在一个实施例中，该发酵液配制品和细胞组合物包含第一有机酸组分(包含至少一种1-5个碳的有机酸和/或其盐)和第二有机酸组分(包含至少一种6个或更多个碳的有机酸和/或其盐)。在一个具体实施例中，该第一有机酸组分是乙酸、甲酸、丙酸、其盐，或前述中的两种或更多种的混合物；并且该第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、其盐，或前述中的两种或更多种的混合物。

在一个方面，该组合物含有一种或多种有机酸，并且任选地进一步含有杀灭的细胞和/或细胞碎片。在一个实施例中，从细胞杀灭的全培养液中去除这些杀灭的细胞和/或细胞碎片，以提供不含这些组分的组合物。

这些发酵液配制品或细胞组合物可以进一步包含防腐剂和/或抗微生物(例如，抑菌)剂，包括但不限于山梨醇、氯化钠、山梨酸钾、以及本领域已知的其他试剂。

该细胞杀灭的全培养液或组合物可以含有在发酵结束时得到的发酵材料的未分级的内容物。典型地，该细胞杀灭的全培养液或组合物包含用过的培养基以及在微生物细胞(例如，丝状真菌细胞)生长至饱和、在碳限制条件下孵育以允许蛋白合成之后存在的细胞碎片。在一些实施例中，该细胞杀灭的全培养液或组合物含有用过的细胞培养基、胞外酶和杀灭的丝状真菌细胞。在一些实施例中，可以使用本领域已知的方法来使细胞杀灭的全培养液或组合物中存在的微生物细胞透性化和/或裂解。

如本文所述的全培养液或细胞组合物通常是液体，但是可以含有不溶性组分，如杀灭的细胞、细胞碎片、培养基组分和/或一种或多种不溶性酶。在一些实施例中，可以去除不溶性组分以提供澄清的液体组合物。

本发明的全培养液配制品和细胞组合物可以通过WO 90/15861或WO2010/096673中所述的方法来产生。

酶组合物

本发明还涉及包含本发明的多肽的组合物。

这些组合物可以包含本发明的蛋白酶作为主要酶组分，例如单组分组合物。可替代地，组合物可以包含多种酶活性，如选自由以下组成的组的一种或多种(例如，若干种)酶：α-淀粉酶、葡糖淀粉酶、β-淀粉酶、支链淀粉酶。

组合物可以根据本领域已知的方法制备并且可以呈液体或干燥组合物的形式。可以根据本领域已知的方法稳定组合物。

下面给出了本发明的组合物的优选的用途的实例。

本发明的酶组合物包含适用于本发明的方法中液化步骤的α-淀粉酶和减硫高温球菌S8A蛋白酶。

在一个具体的实施例中，本发明涉及一种酶组合物，该酶组合物包含：

α-淀粉酶和减硫高温球菌S8A蛋白酶，特别是与SEQ ID NO:2的

成熟多肽具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％序列同一性的蛋白酶。

在一个优选的实施例中，α-淀粉酶与蛋白酶之间的比率在1:1和1:50之间(微克α-淀粉酶:微克蛋白酶)的范围内，更特别地在1:3和1:40之间，例如约1:4(微克α-淀粉酶:微克蛋白酶)的范围内。

在一个优选的实施例中，本发明的酶组合物包含葡糖淀粉酶，并且α-淀粉酶与葡糖淀粉酶之间的比率在1:1和1:10之间，例如约1:2(微克α-淀粉酶:微克葡糖淀粉酶)。

α-淀粉酶优选地是细菌酸稳定的α-淀粉酶。特别地，α-淀粉酶来自微小杆菌属物种或芽孢杆菌属物种(例如像嗜热脂肪芽孢杆菌或地衣芽孢杆菌)。

在一个实施例中，该α-淀粉酶来自芽孢杆菌属，如嗜热脂肪芽孢杆菌菌株，特别是嗜热脂肪芽孢杆菌α-淀粉酶的变体，如WO 99/019467中的SEQ ID NO:3或本文的SEQ IDNO:4中所示的α-淀粉酶。

在一个实施例中，该嗜热脂肪芽孢杆菌α-淀粉酶或其变体是截短的，优选地截短以具有约491个氨基酸，例如从480-495个氨基酸。

在一个实施例中，嗜热脂肪芽孢杆菌α-淀粉酶在从位置179至位置182的范围内的两个位置处，如在位置I181+G182、R179+G180、G180+I181、R179+I181或G180+G182，优选I181+G182处具有缺失，和任选地N193F取代(使用SEQ ID NO:4进行编号)。

在一个实施例中，该嗜热脂肪芽孢杆菌α-淀粉酶在位置S242处具有取代，优选S242Q取代。

在一个实施例中，该嗜热脂肪芽孢杆菌α-淀粉酶在位置E188处具有取代，优选E188P取代。

在一个实施例中，α-淀粉酶选自嗜热脂肪芽孢杆菌α-淀粉酶变体的组，该变体除在从位置179至位置182的区域中的双缺失(特别是I181*+G182*)和任选地N193F之外还具有以下突变：

-V59A+Q89R+G112D+E129V+K177L+R179E+K220P+N224L+Q254S；
	-V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L+Q254S；
-V59A+Q89R+E129V+K177L+R179E+K220P+N224L+Q254S+D269E+D281N；
	-V59A+Q89R+E129V+K177L+R179E+K220P+N224L+Q254S+I270L；
-V59A+Q89R+E129V+K177L+R179E+K220P+N224L+Q254S+H274K；
	-V59A+Q89R+E129V+K177L+R179E+K220P+N224L+Q254S+Y276F；
-V59A+E129V+R157Y+K177L+R179E+K220P+N224L+S242Q+Q254S；
	-V59A+E129V+K177L+R179E+H208Y+K220P+N224L+S242Q+Q254S；
-59A+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S；
	-V59A+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+H274K；
-V59A+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+Y276F；
	-V59A+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+D281N；
-V59A+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+M284T；
	-V59A+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+G416V；
-V59A+E129V+K177L+R179E+K220P+N224L+Q254S；
	-V59A+E129V+K177L+R179E+K220P+N224L+Q254S+M284T；
-A91L+M96I+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S；
	-E129V+K177L+R179E；
-E129V+K177L+R179E+K220P+N224L+S242Q+Q254S；
	-E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+Y276F+L427M；
-E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+M284T；
	-E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+N376+I377；
-E129V+K177L+R179E+K220P+N224L+Q254S；
	-E129V+K177L+R179E+K220P+N224L+Q254S+M284T；
-E129V+K177L+R179E+S242Q；
	-E129V+K177L+R179V+K220P+N224L+S242Q+Q254S；
-K220P+N224L+S242Q+Q254S；
	-M284V；
-V59A Q89R+E129V+K177L+R179E+Q254S+M284V。

在一个实施例中，该α-淀粉酶选自嗜热脂肪芽孢杆菌α-淀粉酶变体的组，该变体具有以下突变：

-I181*+G182*+N193F+E129V+K177L+R179E；

-I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L+Q254S；

-I181*+G182*+N193F+V59AQ89R+E129V+K177L+R179E+Q254S+M284V；和

-I181*+G182*+N193F+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S(使用SEQID NO:4进行编号)。

在一个实施例中，该α-淀粉酶变体与SEQ ID NO:4的多肽具有至少75％的同一性，优选至少80％，更优选至少85％，更优选至少90％，更优选至少91％，更优选至少92％，甚至更优选至少93％，最优选至少94％，并且甚至最优选至少95％，如甚至至少96％、至少97％、至少98％、至少99％，但小于100％的同一性。

在一个优选的实施例中，本发明的酶组合物包含减硫高温球菌S8A蛋白酶，该蛋白酶与SEQ ID NO:2的氨基酸102至422具有至少80％，如至少85％，如至少90％，如至少95％，如至少96％，如至少97％，如至少98％，如至少99％、或至少100％的同一性。

在一个实施例中，该酶组合物进一步包含葡糖淀粉酶。

在一个实施例中，该葡糖淀粉酶源自青霉属菌株，尤其是如WO2011/127802中的SEQ ID NO:2披露的草酸青霉菌菌株。

在一个实施例中，该葡糖淀粉酶与WO 2011/127802中的SEQ ID NO:2的成熟多肽具有至少80％，更优选至少85％，更优选至少90％，更优选至少91％，更优选至少92％，甚至更优选至少93％，最优选至少94％，并且甚至最优选至少95％，如甚至至少96％、至少97％、至少98％、至少99％或100％的同一性。

在一个实施例中，该葡糖淀粉酶是如本文WO 2011/127802中的SEQ ID NO:2披露的草酸青霉菌葡糖淀粉酶的、具有K79V取代的变体，例如WO2013/053801中披露的变体。

在一个实施例中，该葡糖淀粉酶是草酸青霉菌葡糖淀粉酶，该草酸青霉菌葡糖淀粉酶具有K79V取代，并且进一步具有以下取代中的一个：

-P11F+T65A+Q327F

-P2N+P4S+P11F+T65A+Q327F。

在一个实施例中，该组合物进一步包含支链淀粉酶。

在一个实施例中，本发明的组合物包含嗜热脂肪芽孢杆菌α-淀粉酶和减硫高温球菌S8A蛋白酶。在一个实施例中，α-淀粉酶与蛋白酶之间的比率在从1:1和1:50(微克α-淀粉酶:微克蛋白酶)的范围内。

在一个实施例中，α-淀粉酶与蛋白酶之间的比率在1:3和1:40之间，例如约1:4(微克α-淀粉酶:微克蛋白酶)的范围内。

在一个实施例中，α-淀粉酶与葡糖淀粉酶之间的比率在1:1和1:10之间，例如约1:2(微克α-淀粉酶:微克葡糖淀粉酶)。

本发明的方法

本发明涉及从发酵产物生产过程中回收油的方法，以及用于由含淀粉材料生产发酵产物的方法。

诸位发明人已经发现，当在液化中结合α-淀粉酶和来自减硫高温球菌的蛋白酶时，在用于由含淀粉材料生产发酵产物的方法中可以获得增加的乙醇产量。因此，在一个方面，本发明涉及用于液化含淀粉材料的方法，该方法包括在至少α-淀粉酶和本发明的S8A减硫高温球菌蛋白酶的存在下，在高于初始糊化温度的温度，液化该含淀粉材料。

还发现本发明的乙醇方法可以在SSF中减少或不添加氮源(例如尿素)来有效的运行。

生产本发明的发酵产物的方法

在一个具体的方面，本发明涉及用于由含淀粉材料生产发酵产物的方法，这些方法包括以下步骤：

a)在至少以下酶的存在下，在高于初始糊化温度的温度，液化该含淀粉材料：

-α-淀粉酶；和

-来自减硫高温球菌的S8A蛋白酶；

b)使用葡糖淀粉酶进行糖化；

c)使用发酵生物进行发酵。

在一个实施例中，该发酵产物是在发酵之后回收。在一个优选的实施例中，该发酵产物是在发酵之后回收，例如通过蒸馏。在一个实施例中，该发酵产物是醇，优选乙醇，尤其是燃料乙醇、饮用乙醇和/或工业乙醇。

本发明的回收/提取油的方法

在另一个具体方面，本发明涉及从发酵产物生产过程中回收油的方法，该方法包括以下步骤：

-α-淀粉酶；和

-来自减硫高温球菌的S8A蛋白酶；

b)使用葡糖淀粉酶进行糖化；

c)使用发酵生物进行发酵。

d)回收该发酵产物以形成全酒糟；

e)将该全酒糟分离为酒糟水和湿饼；

f)任选地将该酒糟水浓缩为浆体；

其中从以下各项中回收油：

-在步骤a)之后液化的含淀粉材料；和/或

-发酵步骤c)的下游。

在一个实施例中，在液化含淀粉材料期间和/或之后回收/提取该油。在一个实施例中，从全酒糟中回收该油。在一个实施例中，从酒糟水中回收该油。在一个实施例中，从浆体中回收该油。

在本发明的方法的一个优选的实施例中，糖化和发酵同时进行。

在一个优选的实施例中，在步骤a)-c)中，例如在糖化步骤b)、或发酵步骤c)或同时糖化和发酵(SSF)期间，没有氮化合物(例如尿素)存在和/或没有添加氮化合物(例如尿素)。

在一个实施例中，在步骤a)-c)中，例如在糖化步骤b)或发酵步骤c)或同时糖化和发酵(SSF)期间，存在和/或添加10-1,000ppm，如50-800ppm、如100-600ppm、如200-500ppm氮化合物(优选尿素)。

在一个实施例中，在液化步骤a)中存在和/或添加在0.5至100微克之间的减硫高温球菌S8A蛋白酶/克DS(干固体)。在一个实施例中，在液化步骤a)中存在和/或添加在1至50微克之间的减硫高温球菌S8A蛋白酶/克DS(干固体)。在一个实施例中，在液化步骤a)中存在和/或添加在2至40微克之间的减硫高温球菌S8A蛋白酶/克DS。在一个实施例中，在液化步骤a)中存在和/或添加在4至25微克之间的减硫高温球菌S8A蛋白酶/克DS。在一个实施例中，在液化步骤a)中存在和/或添加在5至20微克之间的减硫高温球菌S8A蛋白酶/克DS。在一个实施例中，在液化步骤a)中存在和/或添加约或大于1微克的减硫高温球菌S8A蛋白酶/克DS。在一个实施例中，在液化步骤a)中存在和/或添加约或大于2微克的减硫高温球菌S8A蛋白酶/克DS。在一个实施例中，在液化步骤a)中存在和/或添加约或大于5微克的减硫高温球菌S8A蛋白酶/克DS。

在液化中存在的和/或添加的α-淀粉酶

在本发明的方法(即，油回收方法和发酵产物生产过程)中，液化步骤a)期间所添加的α-淀粉酶可以是任何α-淀粉酶。

优选地是细菌α-淀粉酶，其在液化过程中使用的温度下典型地是稳定的。

在一个实施例中，α-淀粉酶来自微小杆菌属或芽孢杆菌属的菌株。

在一个优选的实施例中，α-淀粉酶来自嗜热脂肪芽孢杆菌的菌株，如在WO 99/019467中所示的SEQ ID NO:3或在本文的SEQ ID NO:4中所示的序列。在一个实施例中，α-淀粉酶是在本文的SEQ ID NO:4中所示的嗜热脂肪芽孢杆菌α-淀粉酶，如与本文的SEQ IDNO:4具有至少80％，如至少85％、如至少90％、如至少95％、如至少96％、如至少97％、如至少98％、如至少99％的同一性的嗜热脂肪芽孢杆菌α-淀粉酶。

在一个实施例中，嗜热脂肪芽孢杆菌α-淀粉酶或其变体是截短的，优选地在C-末端，优选地截短以具有约491个氨基酸，如从480至495个氨基酸。

-V59A+Q89R+G112D+E129V+K177L+R179E+K220P+N224L+Q254S；
	-V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L+Q254S；
-V59A+Q89R+E129V+K177L+R179E+K220P+N224L+Q254S+D269E+D281N；
	-V59A+Q89R+E129V+K177L+R179E+K220P+N224L+Q254S+I270L；
-V59A+Q89R+E129V+K177L+R179E+K220P+N224L+Q254S+H274K；
	-V59A+Q89R+E129V+K177L+R179E+K220P+N224L+Q254S+Y276F；
-V59A+E129V+R157Y+K177L+R179E+K220P+N224L+S242Q+Q254S；
	-V59A+E129V+K177L+R179E+H208Y+K220P+N224L+S242Q+Q254S；
-59A+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S；
	-V59A+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+H274K；
-V59A+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+Y276F；
	-V59A+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+D281N；
-V59A+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+M284T；
	-V59A+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+G416V；
-V59A+E129V+K177L+R179E+K220P+N224L+Q254S；
	-V59A+E129V+K177L+R179E+K220P+N224L+Q254S+M284T；
-A91L+M96I+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S；
	-E129V+K177L+R179E；
-E129V+K177L+R179E+K220P+N224L+S242Q+Q254S；
	-E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+Y276F+L427M；
-E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+M284T；
	-E129V+K177L+R179E+K220P+N224L+S242Q+Q254S+N376+I377；
-E129V+K177L+R179E+K220P+N224L+Q254S；
	-E129V+K177L+R179E+K220P+N224L+Q254S+M284T；
-E129V+K177L+R179E+S242Q；
	-E129V+K177L+R179V+K220P+N224L+S242Q+Q254S；
-K220P+N224L+S242Q+Q254S；
	-M284V；
-V59AQ89R+E129V+K177L+R179E+Q254S+M284V。

在一个优选的实施例中，α-淀粉酶选自嗜热脂肪芽孢杆菌α-淀粉酶变体的组：

-I181*+G182*+N193F+E129V+K177L+R179E；

-I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L+Q254S；

-I181*+G182*+N193F+V59AQ89R+E129V+K177L+R179E+Q254S+M284V；和

根据本发明，α-淀粉酶变体与本文的SEQ ID NO:4的多肽具有至少80％，更优选至少85％，更优选至少90％，更优选至少91％，更优选至少92％，甚至更优选至少93％，最优选至少94％，并且甚至最优选至少95％，如甚至至少96％、至少97％、至少98％、至少99％，但小于100％的同一性。

根据本发明，α-淀粉酶能以0.1至100微克/克DS，如0.5至50微克/克DS、如1至25微克/克DS、如1至10微克/克DS、如2至5微克/克DS的浓度存在和/或添加。

在一个实施例中，在液化中存在和/或添加从1至50微克，特别地是从2至40微克，特别地是从4至25微克，特别地是从5至20微克减硫高温球菌S8A蛋白酶/克DS，并且在液化中存在和/或添加从1至10微克嗜热脂肪芽孢杆菌α-淀粉酶。

在一个实施例中，该减硫高温球菌蛋白酶选自：

a)多肽，该多肽包含SEQ ID NO:2的氨基酸102至422或由其组成；

b)多肽，该多肽与SEQ ID NO:2的氨基酸102至422具有至少80％、至少85、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％序列同一性。

在液化中存在的和/或添加的葡糖淀粉酶

在一个实施例中，在本发明的方法(即，油回收方法和发酵产物生产过程)中的液化步骤a)中，存在和/或添加葡糖淀粉酶。

在一个优选的实施例中，在液化步骤a)中存在的和/或添加的葡糖淀粉酶源自青霉属菌株，尤其是如WO 2011/127802中的SEQ ID NO:2披露的草酸青霉菌菌株。

在一个实施例中，该葡糖淀粉酶与WO 2011/127802中的SEQ ID NO:2中所示的成熟多肽具有至少80％，更优选至少85％，更优选至少90％，更优选至少91％，更优选至少92％，甚至更优选至少93％，最优选至少94％，并且甚至最优选至少95％，如甚至至少96％、至少97％、至少98％、至少99％或100％的同一性。

在一个优选的实施例中，该葡糖淀粉酶是WO 2011/127802中的SEQ ID NO:2所示的、具有K79V取代的草酸青霉菌葡糖淀粉酶，如WO 2013/053801中披露的变体。

在一个优选的实施例中，在液化中存在的和/或添加的葡糖淀粉酶是草酸青霉菌葡糖淀粉酶，该草酸青霉菌葡糖淀粉酶具有K79V取代并且优选进一步具有以下取代中的一个：

-P11F+T65A+Q327F；

-P2N+P4S+P11F+T65A+Q327F。

在一个实施例中，葡糖淀粉酶变体与WO 2011/127802中的SEQ ID NO:2的多肽的成熟部分或本文的SEQ ID NO:10具有至少75％的同一性，优选至少80％，更优选至少85％，更优选至少90％，更优选至少91％，更优选至少92％，甚至更优选至少93％，最优选至少94％，并且甚至最优选至少95％，如甚至至少96％、至少97％、至少98％、至少99％，但小于100％的同一性。

该葡糖淀粉酶能以从0.1至100微克EP/g，如0.5至50微克EP/g，如1至25微克EP/g，如2至12微克EP/g DS的量添加。

在糖化和/或发酵中存在的和/或添加的葡糖淀粉酶

在本发明的方法(即，油回收方法和发酵产物生产过程)中，在糖化和/或发酵，优选同时糖化和发酵(SSF)中，存在和/或添加葡糖淀粉酶。

在一个实施例中，在糖化和/或发酵中存在的和/或添加的葡糖淀粉酶是真菌来源的，优选地来自曲霉属的菌株，优选黑曲霉、泡盛曲霉或米曲霉；或木霉属的菌株，优选里氏木霉；或篮状菌属的菌株，优选埃默森篮状菌；或栓菌属的菌株，优选瓣环栓菌(T.cingulata)；或密孔菌属的菌株；或粘褶菌属的菌株，如篱边粘褶菌或密粘褶菌；或黑层孔属(Nigrofomes)的菌株。

在一个实施例中，葡糖淀粉酶是源自篮状菌属，如埃默森篮状菌的菌株，如在本文的SEQ ID NO:5中所示的菌株。

在一个实施例中，该葡糖淀粉酶选自由以下组成的组：

(i)包含本文的SEQ ID NO:5的多肽的葡糖淀粉酶；

(ii)包含以下氨基酸序列的葡糖淀粉酶，该氨基酸序列与本文的SEQ ID NO:5的多肽具有至少60％、至少70％，如至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的同一性。

在一个实施例中，该葡糖淀粉酶是源自栓菌属，如瓣环栓菌的菌株，如在本文的SEQ ID NO:6中所示的菌株。

在一个实施例中，该葡糖淀粉酶选自由以下组成的组：

(i)包含本文的SEQ ID NO:6的多肽的葡糖淀粉酶；

(ii)包含以下氨基酸序列的葡糖淀粉酶，该氨基酸序列与本文的SEQ ID NO:6的多肽具有至少60％、至少70％，如至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的同一性。

在一个实施例中，该葡糖淀粉酶是源自密孔菌属的菌株，特别是描述于WO 2011/066576中的血红密孔菌的菌株(SEQ ID NO 2、4或6)，如示WO2011/066576中的SEQ ID NO:4中所示的菌株。

在一个实施例中，葡糖淀粉酶是源自粘褶菌属的菌株，如篱边粘褶菌或密粘褶菌的菌株，特别是如在WO 2011/068803中描述的粘褶菌属的菌株(SEQ ID NO:2、4、6、8、10、12、14或16)。在一个优选的实施例中，该葡糖淀粉酶是在WO 2011/068803中的SEQ ID NO:2或本文的SEQ ID NO:6中所示的篱边粘褶菌。

在一个优选的实施例中，葡糖淀粉酶源自篱边粘褶菌，如在本文的SEQ ID NO:6中所示的篱边粘褶菌。在一个实施例中，该葡糖淀粉酶选自由以下组成的组：

(i)包含本文的SEQ ID NO:6的多肽的葡糖淀粉酶；

在另一个实施例中，葡糖淀粉酶源自密粘褶菌，如在本文的SEQ ID NO:7中所示的密粘褶菌。在一个实施例中，该葡糖淀粉酶选自由以下组成的组：

(i)包含本文的SEQ ID NO:7的多肽的葡糖淀粉酶；

(ii)包含以下氨基酸序列的葡糖淀粉酶，该氨基酸序列与本文的SEQ ID NO:7的多肽具有至少60％、至少70％，如至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的同一性。

在一个实施例中，该葡糖淀粉酶源自黑层孔属(Nigrofomes)的菌株，特别是披露于WO 2012/064351中的黑层孔属物种的菌株。

在一个实施例中，该葡糖淀粉酶能以如下量添加到糖化和/或发酵中：0.0001至20AGU/g DS，优选0.001至10AGU/g DS，尤其是在0.01至5AGU/g DS之间，如0.1至2AGU/gDS。

包含葡糖淀粉酶的可商购组合物包括AMG 200L；AMG 300L；SAN^TMSUPER、SAN^TMEXTRA L、SPIRIZYME^TMPLUS、SPIRIZYME^TMFUEL、SPIRIZYME^TMB4U、SPIRIZYME^TMULTRA、SPIRIZYME^TMEXCEL和AMG^TME(来自诺维信公司(Novozymes A/S))；OPTIDEX^TM300、GC480、GC417(来自杜邦公司(DuPont.))；AMIGASE^TM和AMIGASE^TMPLUS(来自帝斯曼公司(DSM))；G-ZYME^TMG900、G-ZYME^TM和G990ZR(来自杜邦公司)。

根据本发明的一个优选的实施例，在糖化和/或发酵中，葡糖淀粉酶是与α-淀粉酶相结合存在的和/或添加的。下面描述了合适的α-淀粉酶的实例。

在糖化和/或发酵中存在和/或添加的α-淀粉酶

在一个实施例中，在本发明的方法中，在糖化和/或发酵中存在和/或添加α-淀粉酶。在一个优选的实施例中，α-淀粉酶是真菌或细菌起源的。在一个优选的实施例中，α-淀粉酶是真菌酸稳定的α-淀粉酶。真菌酸性稳定的α-淀粉酶是在3.0至7.0的pH范围内，并且优选地在3.5至6.5的pH范围内具有活性的α-淀粉酶，包括在约4.0、4.5、5.0、5.5、和6.0的pH时的活性。

在一个优选的实施例中，在糖化和/或发酵中存在的和/或添加的α-淀粉酶源自根毛霉属的菌株，优选菌株微小根毛霉，如在WO 2013/006756的SEQ ID NO:3中所示的菌株，如具有黑曲霉接头和淀粉结合结构域的微小根毛霉α-淀粉酶杂合体，如在本文的SEQ IDNO:8中所示的杂合体或其变体。

在一个实施例中，在糖化和/或发酵中存在的和/或添加的α-淀粉酶选自由以下组成的组：

(i)包含本文的SEQ ID NO:8的多肽的α-淀粉酶；

(ii)包含以下氨基酸序列的α-淀粉酶，该氨基酸序列与本文的SEQ ID NO:8的多肽具有至少60％、至少70％，如至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的同一性。

在一个优选的实施例中，该α-淀粉酶是在SEQ ID NO:8中所示的具有以下取代或取代的组合中的至少一个的α-淀粉酶的变体：D165M；Y141W；Y141R；K136F；K192R；P224A；P224R；S123H+Y141W；G20S+Y141W；A76G+Y141W；G128D+Y141W；G128D+D143N；P219C+Y141W；N142D+D143N；Y141W+K192R；Y141W+D143N；Y141W+N383R；Y141W+P219C+A265C；Y141W+N142D+D143N；Y141W+K192R V410A；G128D+Y141W+D143N；Y141W+D143N+P219C；Y141W+D143N+K192R；G128D+D143N+K192R；Y141W+D143N+K192R+P219C；G128D+Y141W+D143N+K192R；或G128D+Y141W+D143N+K192R+P219C(使用SEQ ID NO:8进行编号)。

在一个实施例中，源自具有黑曲霉葡糖淀粉酶接头和淀粉结合结构域(SBD)的微小根毛霉的α-淀粉酶，优选如本文的SEQ ID NO:8披露的，优选具有一个或多个以下取代：G128D、D143N，优选G128D+D143N(使用SEQ ID NO:8进行编号)。

在一个实施例中，在糖化和/或发酵中存在的和/或添加的α-淀粉酶变体与本文的SEQ ID NO:8的多肽具有至少75％的同一性，优选至少80％，更优选至少85％，更优选至少90％，更优选至少91％，更优选至少92％，甚至更优选至少93％，最优选至少94％，并且甚至最优选至少95％，如甚至至少96％、至少97％、至少98％、至少99％，但小于100％的同一性。

在一个优选的实施例中，在糖化和/或发酵期间存在的和/或添加的葡糖淀粉酶与α-淀粉酶之间的比率优选地可以在500:1至1:1，如从250:1至1:1、如从100:1至1:1、如从100:2至100:50、如从100:3至100:70的范围内。

在液化和/或糖化和/或发酵中存在的和/或添加的支链淀粉酶。

在液化步骤a)和/或糖化步骤b)或发酵步骤c)或同时糖化和发酵期间可以存在和/或添加支链淀粉酶。

支链淀粉酶(E.C.3.2.1.41，支链淀粉6-葡聚糖-水解酶)是去分支酶，其特征在于它们在例如分枝淀粉和支链淀粉中水解α-1,6-糖苷键的能力。

根据本发明考虑的支链淀粉酶包括来自美国专利号4,560,651(特此通过引用结合)中披露的淀粉脱支芽孢杆菌(Bacillus amyloderamificans)的支链淀粉酶、如WO 01/51620(特此通过引用结合)中的SEQ ID NO:2披露的支链淀粉酶、如WO 01/151620(特此通过引用结合)中的SEQ ID NO:4披露的脱支芽孢杆菌(Bacillus deramificans)的支链淀粉酶，以及来自如WO01/51620中的SEQ ID NO:6披露的嗜酸性支链淀粉芽孢杆菌的支链淀粉酶，以及还有描述于FEMS Mic.Let.[FEMS微生物学通讯](1994)115,97-106中的支链淀粉酶。

根据本发明，该支链淀粉酶能以有效量添加，包括约0.0001至10mg酶蛋白/克DS的优选量，优选0.0001至0.10mg酶蛋白/克DS，更优选0.0001至0.010mg酶蛋白/克DS。支链淀粉酶活性可以确定为NPUN。用于确定NPUN的测定法描述于下文的“材料与方法”-部分中。

合适的可商购支链淀粉酶产品包括PROMOZYME D、PROMOZYME^TMD2(诺维信公司，丹麦)、OPTIMAX L-300(杰能科公司(Genencor Int.)，美国)、以及AMANO 8(安能满公司(Amano)，日本)。

本发明的方法的另外方面

在液化步骤a)之前，本发明的方法(包括提取/回收油的方法和用于生产发酵产物的方法)可以包括以下步骤：

i)优选地通过干磨来减小该含淀粉材料的粒度；

ii)形成包含该含淀粉材料和水的浆料。

在一个实施例中，至少50％，优选至少70％，更优选至少80％，尤其是至少90％的含淀粉材料适合通过具有#6筛网的筛子。

在一个实施例中，液化期间的pH是在高于4.5至6.5之间，如4.5至5.0、如约4.8，或在5.0至6.2之间的pH，如5.0至6.0，如在5.0至5.5之间，如约5.2、如约5.4、如约5.6、如约5.8。

在一个实施例中，液化期间的温度高于初始糊化温度，优选在从70℃至100℃的范围内，如在75℃至95℃之间、如在75℃至90℃之间，优选在80℃至90℃之间，尤其是约85℃。

在一个实施例中，在步骤a)中的液化之前进行喷射蒸煮步骤。在一个实施例中，喷射蒸煮是在110℃至145℃之间，优选120℃至140℃，如125℃至135℃，优选约130℃的温度进行约1至15分钟，优选约3至10分钟，尤其是约5分钟。

在一个优选的实施例中，糖化和发酵顺序进行或同时进行。

在一个实施例中，糖化是在从20℃至75℃，优选从40℃至70℃，如约60℃的温度，并且在4和5之间的pH进行。

在一个实施例中，发酵、或同时糖化和发酵(SSF)在从25℃至40℃，如从28℃至35℃、如从30℃至34℃，优选约32℃的温度进行。在一个实施例中，发酵进行6至120小时，特别是24至96小时。

在一个优选的实施例中，该发酵产物是在发酵之后回收，例如通过蒸馏。

在一个实施例中，该发酵产物是醇，优选乙醇，尤其是燃料乙醇、饮用乙醇和/或工业乙醇。

在一个实施例中，含淀粉起始材料是全谷物。在一个实施例中，含淀粉材料选自玉米、小麦、大麦、黑麦、蜀黍、西米、木薯、树薯、木薯淀粉、高粱、稻以及马铃薯的组。

在一个实施例中，发酵生物是酵母，优选酵母属的菌株，尤其是酿酒酵母的菌株。

在一个实施例中，步骤(a)中的温度高于初始糊化温度，如在80℃至90℃之间的温度，如约85℃。

在一个实施例中，本发明的方法在糖化步骤b)之前进一步包括预糖化步骤，该预糖化步骤在30℃至65℃之间的温度进行40至90分钟。在一个实施例中，糖化是在从20℃至75℃，优选从40℃至70℃，如约60℃的温度，并且在4和5之间的pH进行。在一个实施例中，发酵步骤c)或同时糖化和发酵(SSF)(即，步骤b)和c))在从25℃至40℃，如从28℃至35℃、如从30℃至34℃，优选约32℃的温度进行。在一个实施例中，发酵步骤c)或同时糖化和发酵(SSF)(即，步骤b)和c))进行6至120小时，特别是24至96小时。

在一个实施例中，步骤e)中的分离是通过离心(优选倾滗式离心机)、过滤，优选使用压滤机、螺旋压榨机、板框压榨机、重力浓缩机或脱水机进行。

在一个实施例中，发酵产物是通过蒸馏回收。

发酵培养基

进行发酵的环境通常称为“发酵培养基(fermentation media或fermentationmedium)”。发酵培养基包括发酵底物，即被发酵生物代谢的碳水化合物源。根据本发明，发酵培养基可以包含用于一种或多种发酵生物的一种或多种营养素和生长刺激剂。营养素和生长刺激剂在发酵领域中广泛使用，且包括氮源如氨；尿素、维生素和矿物质或其组合。

发酵生物

术语“发酵生物”是指适用于发酵过程中并且能够生产所希望的发酵产物的任何生物，包括细菌和真菌生物，尤其是酵母。尤其合适的发酵生物能够使糖(如葡萄糖或麦芽糖)直接或间接发酵成(即，转化成)所希望的发酵产物(如乙醇)。发酵生物的实例包括真菌生物，如酵母。优选的酵母包括酵母属物种的菌株，特别是酿酒酵母。

在发酵(如SSF)期间，有活力的发酵生物的合适的浓度在本领域是熟知的，或可以由本领域的技术人员容易地确定。在一个实施例中，将发酵生物(如乙醇发酵酵母(例如，酿酒酵母))添加至发酵培养基中，使得每mL的发酵培养基的有活力的发酵生物(如酵母)计数在从10⁵至10¹²，优选从10⁷至10¹⁰的范围内，尤其是约5x10⁷个。

可商购的酵母的实例包括例如RED STAR^TM和ETHANOL RED^TM酵母(可获得自富酶泰斯公司/乐斯福公司(Fermentis/Lesaffre)，美国)、FALI(可获得自弗莱希曼酵母公司(Fleischmann’s Yeast)，美国)、SUPERSTART和THERMOSACC^TM新鲜酵母(可获得自乙醇技术公司(Ethanol Technology)，威斯康星州，美国)、BIOFERM AFT和XR(可获得自NABC-北美生物制品公司(North American Bioproducts Corporation)，佐治亚州，美国)、GERT STRAND(可获得自格特·斯特兰德公司(Gert Strand AB)，瑞典)以及FERMIOL(可获得自帝斯曼特殊产品公司(DSM Specialties))。

含淀粉材料

根据本发明可以使用任何合适的含淀粉材料。通常基于所希望的发酵产物来选择起始材料。适用于本发明的方法中的含淀粉材料的实例包括全谷物、玉米、小麦、大麦、黑麦、蜀黍、西米、木薯、木薯淀粉、高粱、稻、豌豆、豆类或甜薯或其混合物或者由其衍生的淀粉，或谷类。还考虑了糯型(waxy type)与非糯型(non-waxy type)的玉米与大麦。在一个优选的实施例中，用于根据本发明的乙醇生产的含淀粉材料是玉米或小麦。

发酵产物

术语“发酵产物”意指通过包括使用发酵生物进行的发酵步骤在内的方法生产的产物。根据本发明考虑的发酵产物包括醇(例如，乙醇、甲醇、丁醇；多元醇如甘油、山梨醇和肌醇)；有机酸(例如，柠檬酸、乙酸、衣康酸、乳酸、琥珀酸、葡糖酸)；酮(例如，丙酮)；氨基酸(例如，谷氨酸)；气体(例如，H₂和CO₂)；抗生素(例如，青霉素和四环素)；酶；维生素(例如，核黄素、B₁₂、β-胡萝卜素)；和激素。在一个优选的实施例中，发酵产物是乙醇，例如，燃料乙醇；饮用乙醇，即中性饮用酒精；或用于消费性醇工业(例如，啤酒和酒)、乳品工业(例如，发酵的乳制品)、皮革工业和烟草工业的工业乙醇或产物。优选的啤酒类型包含爱尔啤酒(ale)、烈性黑啤酒(stout)、波特啤酒(porter)、拉格啤酒(lager)、苦啤酒(bitter)、麦芽酒(maltliquor)、低麦芽啤酒(happoushu)、高醇啤酒、低醇啤酒、低热量啤酒或清淡啤酒。优选地，本发明的方法是用于生产醇，如乙醇。根据本发明获得的发酵产物(如乙醇)可以用作典型地与汽油共混的燃料。然而，在乙醇的情况下，它还可以用作饮用乙醇。

发酵产物的回收

发酵或SSF之后，可以将发酵产物与发酵培养基分开。可以蒸馏浆料以提取所希望的发酵产物(例如，乙醇)。可替代地，可以通过微滤或膜过滤技术从发酵培养基中提取所希望的发酵产物。还可以通过汽提或本领域熟知的其他方法来回收发酵产物。

油的回收

根据本发明，在液化期间和/或之后，从该全酒糟中，从该酒糟水中，或从该浆体中回收油。可以通过提取回收油。在一个实施例中，通过己烷提取回收油。还可以使用本领域熟知的其他油回收技术。

在以下编号的实施例中进一步定义本发明：

1.一种多肽，该多肽具有蛋白酶活性，该多肽选自由以下组成的组：

(d)(a)、(b)或(c)的多肽的片段，该片段具有蛋白酶活性。

2.如实施例1所述的多肽，该多肽与SEQ ID NO:2的成熟多肽具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

3.如实施例1或2所述的多肽，该多肽由以下多核苷酸编码，该多核苷酸在非常高严格条件下与(i)SEQ ID NO:1的成熟多肽编码序列，或(ii)(i)的全长互补序列杂交。

4.如实施例1-3中任一项所述的多肽，该多肽由以下多核苷酸编码，该多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

5.如实施例1-4中任一项所述的多肽，该多肽包含SEQ ID NO:2或SEQ ID NO:2的成熟多肽或由其组成。

6.如实施例5所述的多肽，其中该成熟多肽是SEQ ID NO:2的氨基酸102至422。

7.如实施例1-6中任一项所述的多肽，该多肽是SEQ ID NO:2的成熟多肽的变体，该变体在一个或多个(若干)位置处包括取代、缺失、和/或插入。

8.如实施例1所述的多肽，该多肽是SEQ ID NO:2的片段，其中该片段具有蛋白酶活性。

9.一种多核苷酸，该多核苷酸编码如实施例1-8中任一项所述的多肽。

10.一种核酸构建体或重组表达载体，该核酸构建体或重组表达载体包含如实施例9所述的多核苷酸，该多核苷酸可操作地连接至指导该多肽在表达宿主中的产生的一个或多个异源控制序列。

11.一种重组宿主细胞，该重组宿主细胞包含如实施例9所述的多核苷酸，该多核苷酸可操作地连接至指导该多肽的产生的一个或多个异源控制序列。

12.一种组合物，该组合物包含如实施例1-8中任一项所述的多肽。

13.一种产生如实施例1-8中任一项所述的多肽的方法，该方法包括：

(a)在有益于产生该多肽的条件下培养细胞，该细胞以其野生型形式产生该多肽；和

(b)任选地回收该多肽。

14.一种产生具有蛋白酶活性的多肽的方法，该方法包括：

(a)在有益于产生该多肽的条件下培养如实施例11所述的宿主细胞；和(b)任选地回收该多肽。

15.一种用于液化含淀粉材料的方法，该方法包括在至少α-淀粉酶和如实施例1-8中任一项所述的S8A减硫高温球菌蛋白酶的存在下，在高于初始糊化温度的温度，液化该含淀粉材料。

16.一种用于由含淀粉材料生产发酵产物的方法，该方法包括以下步骤：

-α-淀粉酶；和

-S8A减硫高温球菌蛋白酶；

b)使用葡糖淀粉酶进行糖化；

c)使用发酵生物进行发酵。

17.一种从如实施例16所披露的方法中回收油的方法，该方法进一步包括如下步骤：

d)回收该发酵产物以形成全酒糟；

e)将该全酒糟分离为酒糟水和湿饼；

f)任选地将该酒糟水浓缩为浆体；

其中从以下各项中回收油：

-在如实施例15所披露的方法的步骤a)之后液化的含淀粉材料；和/或

-如实施例15所披露的方法的发酵步骤c)的下游。

18.如实施例17所述的方法，其中在液化含淀粉材料期间和/或之后回收油。

19.如实施例18所述的方法，其中从该全酒糟中回收油。

20.如实施例17中任一项所述的方法，其中从该酒糟水中回收油。

21.如实施例17所述的方法，其中从该浆体中回收油。

22.如实施例16-21中任一项所述的方法，其中糖化和发酵同时进行。

23.如实施例16-22中任一项所述的方法，其中在步骤a)-c)中，例如在糖化步骤b)、发酵步骤c)或同时糖化和发酵(SSF)期间，没有氮化合物存在和/或没有添加氮化合物。

24.如实施例16-22中任一项所述的方法，其中在步骤a)-c)中，例如在糖化步骤b)或发酵步骤c)、或同时糖化和发酵(SSF)中存在和/或添加10至1,000ppm，如50至800ppm、如100至600ppm、如200-500ppm的氮化合物，优选尿素。

25.如实施例15-24中任一项所述的方法，其中在步骤a)中的该α-淀粉酶来自芽孢杆菌属，例如嗜热脂肪芽孢杆菌菌株，特别是嗜热脂肪芽孢杆菌α-淀粉酶的变体，如SEQ IDNO:4中所示的α-淀粉酶。

26.如实施例25所述的方法，其中该嗜热脂肪芽孢杆菌α-淀粉酶或其变体是截短的，优选地截短以具有约491个氨基酸，如从480至495个氨基酸。

27.如实施例25或26中任一项所述的方法，其中该嗜热脂肪芽孢杆菌α-淀粉酶在从位置179至位置182的范围内的两个位置处，如在位置I181+G182、R179+G180、G180+I181、R179+I181或G180+G182，优选I181+G182处具有缺失，和任选地N193F取代，(使用SEQ IDNO:4进行编号)。

28.如实施例25-27中任一项所述的方法，其中该嗜热脂肪芽孢杆菌α-淀粉酶在位置S242处具有取代，优选S242Q取代。

29.如实施例25-28中任一项所述的方法，其中该嗜热脂肪芽孢杆菌α-淀粉酶在位置E188处具有取代，优选E188P取代。

30.如实施例25-29中任一项所述的方法，其中该α-淀粉酶选自嗜热脂肪芽孢杆菌α-淀粉酶变体的组，这些变体除I181*+G182*以及任选地N193F之外具有以下突变：

31.如实施例25-30中任一项所述的方法，其中该α-淀粉酶选自嗜热脂肪芽孢杆菌α-淀粉酶变体的组：

-I181*+G182*+N193F+E129V+K177L+R179E；

-I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L+Q254S；

-I181*+G182*+N193F+V59AQ89R+E129V+K177L+R179E+Q254S+M284V；和

32.如实施例25-31中任一项所述的方法，其中该α-淀粉酶变体与SEQ ID NO:4的多肽具有至少75％的同一性，优选至少80％，更优选至少85％，更优选至少90％，更优选至少91％，更优选至少92％，甚至更优选至少93％，最优选至少94％，并且甚至最优选至少95％，如甚至至少96％、至少97％、至少98％、至少99％，但小于100％的同一性。

33.如实施例25-32中任一项所述的方法，其中该α-淀粉酶以0.1至100微克/克DS，如0.5至50微克/克DS、如1至25微克/克DS、如1至10微克/克DS、如2至5微克/克DS的浓度存在和/或添加。

34.如实施例15-33中任一项所述的方法，其中在液化中存在和/或添加从1至50微克、特别地是从2至40微克、特别地是从4-25微克、特别地是从5至20微克减硫高温球菌S8A蛋白酶/克DS。

35.如实施例15-34中任一项所述的方法，其中该减硫高温球菌蛋白酶选自：

a)多肽，该多肽包含SEQ ID NO:2的氨基酸102至422或由其组成；

36.如实施例16-35中任一项所述的方法，进一步地，其中在糖化步骤b)和/或发酵步骤c)中存在的和/或添加的该葡糖淀粉酶是真菌起源的，优选地来自曲霉属的菌株，优选黑曲霉、泡盛曲霉或米曲霉；或木霉属的菌株，优选里氏木霉；或篮状菌属的菌株，优选埃默森篮状菌；或栓菌属的菌株，优选瓣环栓菌；或密孔菌属的菌株；或粘褶菌属的菌株，如篱边粘褶菌或密粘褶菌；或黑层孔属的菌株。

37.如实施例36所述的方法，其中该葡糖淀粉酶源自埃默森篮状菌，如在本文的SEQ ID NO:5中所示的埃默森篮状菌。

38.如实施例37所述的方法，其中该葡糖淀粉酶选自由以下组成的组：

(i)包含SEQ ID NO:5的多肽的葡糖淀粉酶；

(ii)包含以下氨基酸序列的葡糖淀粉酶，该氨基酸序列与SEQ ID NO:5的多肽具有至少60％、至少70％，如至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的同一性。

39.如实施例36所述的方法，其中该葡糖淀粉酶源自篱边粘褶菌，如在SEQ ID NO:6中所示的篱边粘褶菌。

40.如实施例39所述的方法，其中该葡糖淀粉酶选自由以下组成的组：

(i)包含SEQ ID NO:6的多肽的葡糖淀粉酶；

(ii)包含以下氨基酸序列的葡糖淀粉酶，该氨基酸序列与SEQ ID NO:6的多肽具有至少60％、至少70％，例如至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的同一性。

41.如实施例36所述的方法，其中该葡糖淀粉酶源自密粘褶菌，如在SEQ ID NO:7中所示的密粘褶菌。

42.如实施例41所述的方法，其中该葡糖淀粉酶选自由以下组成的组：(i)包含SEQID NO:7的多肽的葡糖淀粉酶；

(ii)包含以下氨基酸序列的葡糖淀粉酶，该氨基酸序列与SEQ ID NO:7的多肽具有至少60％、至少70％，如至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的同一性。

43.如实施例16-42中任一项所述的方法，其中该葡糖淀粉酶是在糖化和/或发酵过程中与α-淀粉酶结合存在的。

44.如实施例43所述的方法，其中在糖化和/或发酵中存在的该α-淀粉酶是真菌或细菌起源的。

45.如实施例43或44所述的方法，其中在糖化和/或发酵中存在的和/或添加的该α-淀粉酶源自根毛霉属的菌株，优选菌株微小根毛霉，如具有黑曲霉接头和淀粉结合结构域的微小根毛霉α-淀粉酶杂合体，如在SEQ ID NO:8中所示的杂合体。

46.如实施例45所述的方法，其中在糖化和/或发酵中存在的该α-淀粉酶选自由以下组成的组：

(i)包含SEQ ID NO:8的多肽的α-淀粉酶；

(ii)包含以下氨基酸序列的α-淀粉酶，该氨基酸序列与SEQ ID NO:8的多肽具有至少60％、至少70％，如至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的同一性。

47.如实施例44-46中任一项所述的方法，其中该α-淀粉酶源自具有黑曲霉葡糖淀粉酶接头和淀粉结合域(SBD)的微小根毛霉，优选如SEQ ID NO:8披露的，优选具有以下取代中的一个或多个：G128D、D143N，优选G128D+D143N(使用SEQ ID NO:8进行编号)。

48.如实施例16-47中任一项所述的方法，该方法在液化步骤a)之前进一步包括以下步骤：

i)优选地通过干磨来减小该含淀粉材料的粒度；

ii)形成包含该含淀粉材料和水的浆料。

49.如实施例16-48中任一项所述的方法，其中至少50％，优选至少70％，更优选至少80％，尤其是至少90％的含淀粉材料适合通过具有#6筛网的筛子。

50.如实施例15-49中任一项所述的方法，其中液化中的pH在高于4.5至6.5之间，如约4.8，或在5.0至6.2之间的pH，如5.0至6.0，如在5.0至5.5之间，如约5.2、如约5.4、如约5.6、如约5.8。

51.如实施例51-50中任一项所述的方法，其中液化中的温度高于初始糊化温度，如在从70℃至100℃的范围内，如在75℃至95℃之间、如在75℃至90℃之间，优选在80℃至90℃之间，尤其是约85℃。

52.如实施例15-51中任一项所述的方法，其中在步骤a)中的液化之前进行喷射蒸煮步骤。

53.如实施例52所述的方法，其中该喷射蒸煮是在110℃至145℃之间，优选120℃至140℃，如125℃至135℃，优选约130℃的温度进行约1至15分钟，优选约3至10分钟，尤其是约5分钟。

54.如实施例16-53中任一项所述的方法，其中糖化是在从20℃至75℃，优选从40℃至70℃，如约60℃的温度，并且在4和5之间的pH下进行。

55.如实施例16-54中任一项所述的方法，其中发酵或同时糖化和发酵(SSF)在从25℃至40℃，如从28℃至35℃、如从30℃至34℃，优选约32℃的温度进行。

56.如实施例16-55中任一项所述的方法，其中该发酵产物是在发酵之后例如通过蒸馏回收。

57.如实施例16-56中任一项所述的方法，其中该发酵产物是醇，优选乙醇，尤其是燃料乙醇、饮用乙醇和/或工业乙醇。

58.如实施例16-57中任一项所述的方法，其中该含淀粉起始材料是全谷物。

59.如实施例16-58中任一项所述的方法，其中该含淀粉材料源自玉米、小麦、大麦、黑麦、蜀黍、西米、木薯、树薯、木薯淀粉、高粱、稻或马铃薯。

60.如实施例16-59中任一项所述的方法，其中该发酵生物是酵母，优选酵母属的菌株，尤其是酿酒酵母的菌株。

61.如实施例15-60中任一项所述的方法，其中在液化中α-淀粉酶与蛋白酶之间的比率在1:1和1:50(微克α-淀粉酶:微克蛋白酶)之间的范围内，例如在1:3和1:40之间，例如约1:4(微克α-淀粉酶:微克蛋白酶)。

62.一种酶组合物，该酶组合物包含α-淀粉酶和减硫高温球菌S8A蛋白酶，优选地如实施例1-8所述的多肽。

63.如实施例62所述的酶组合物，其中α-淀粉酶与蛋白酶之间的比率在1:1和1:50(微克α-淀粉酶:微克蛋白酶)之间的范围内，例如在1:3和1:40之间，例如约1:4(微克α-淀粉酶:微克蛋白酶)。

64.如实施例62-64中任一项所述的酶组合物，其中该酶组合物包含葡糖淀粉酶，并且α-淀粉酶与葡糖淀粉酶之间的比率在1:1和1:10之间，例如约1:2(微克α-淀粉酶:微克葡糖淀粉酶)。

65.如实施例62-64中任一项所述的酶组合物，其中该α-淀粉酶是细菌α-淀粉酶，特别地是源自芽孢杆菌或微小杆菌物种，例如像地衣芽孢杆菌或嗜热脂肪芽孢杆菌的细菌α-淀粉酶。

66.如实施例62-65中任一项所述的酶组合物，其中该α-淀粉酶来自嗜热脂肪芽孢杆菌的菌株，特别是嗜热脂肪芽孢杆菌α-淀粉酶的变体，如在SEQ ID NO:4中所示的α-淀粉酶。

67.如实施例62-66中任一项所述的酶组合物，其中该嗜热脂肪芽孢杆菌α-淀粉酶或其变体是截短的，优选地截短以具有约491个氨基酸，如从480-495个氨基酸。

68.如实施例62-67中任一项所述的酶组合物，其中该嗜热脂肪芽孢杆菌α-淀粉酶在从位置179至位置182的范围内的两个位置处，如在位置I181+G182、R179+G180、G180+I181、R179+I181或G180+G182，优选I181+G182处具有缺失，和任选地N193F取代，(使用SEQID NO:4进行编号)。

69.如实施例62-68中任一项所述的酶组合物，其中该嗜热脂肪芽孢杆菌α-淀粉酶在位置S242处具有取代，优选S242Q取代。

70.如实施例62-69中任一项所述的酶组合物，其中该嗜热脂肪芽孢杆菌α-淀粉酶在位置E188处具有取代，优选E188P取代。

71.如实施例62-70中任一项所述的酶组合物，其中该α-淀粉酶选自嗜热脂肪芽孢杆菌α-淀粉酶变体的组，这些变体除缺失I181*+G182*以及任选地N193F之外具有以下突变：

72.如实施例62-71中任一项所述的酶组合物，其中该α-淀粉酶选自具有以下突变的嗜热脂肪芽孢杆菌α-淀粉酶变体的组：

-I181*+G182*+N193F+E129V+K177L+R179E；

-I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L+Q254S；

-I181*+G182*+N193F+V59A Q89R+E129V+K177L+R179E+Q254S+M284V；和

73.如实施例62-72中任一项所述的酶组合物，其中该α-淀粉酶变体与SEQ ID NO:4的多肽具有至少85％，更优选至少90％，更优选至少91％，更优选至少92％，甚至更优选至少93％，最优选至少94％，并且甚至最优选至少95％，如甚至至少96％、至少97％、至少98％、至少99％，但小于100％的同一性。

74.如实施例62-73中任一项所述的酶组合物，其中该减硫高温球菌S8A蛋白酶与SEQ ID NO:2的氨基酸102至422具有至少80％，如至少85％，如至少90％，如至少95％，如至少96％，如至少97％，如至少98％，如至少99％的同一性。

75.如实施例60所述的方法，其中该酵母细胞表达葡糖淀粉酶，例如如实施例36-42所述的葡糖淀粉酶。

76.如实施例15-60所述的方法，其中在液化中存在或添加葡糖淀粉酶。

77.如实施例76所述的方法，其中在液化中存在的和/或添加的葡糖淀粉酶是草酸青霉菌葡糖淀粉酶，该草酸青霉菌葡糖淀粉酶具有K79V取代(使用SEQ ID NO:10进行编号)，并且进一步具有以下取代的组合中的一个：

-P11F+T65A+Q327F；或

-P2N+P4S+P11F+T65A+Q327F(使用SEQ ID NO:10进行编号)，并且其中该葡糖淀粉酶与SEQ ID NO:10的多肽具有至少75％的同一性，优选至少80％，更优选至少85％，更优选至少90％，更优选至少91％，更优选至少92％，甚至更优选至少93％，最优选至少94％，并且甚至最优选至少95％，如甚至至少96％、至少97％、至少98％、至少99％，但小于100％的同一性。

78.减硫高温球菌S8A蛋白酶在液化含淀粉材料中的用途。

79.如实施例78所述的用途，其中该减硫高温球菌S8A蛋白酶与SEQ ID NO:2的氨基酸102至422具有至少80％，如至少85％，如至少90％，如至少95％，如至少96％，如至少97％，如至少98％，如至少99％的同一性。

本发明进一步通过以下实例进行描述。

实例

在实例中使用的酶和酵母：

α-淀粉酶BE369(AA369)：本文中披露为SEQ ID NO:4并且其进一步具有以下突变的嗜热脂肪芽孢杆菌α-淀粉酶：I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+Q254S+M284V，截短至491个氨基酸(使用SEQ ID NO:4进行编号)。

葡糖淀粉酶PoAMG：草酸青霉菌葡糖淀粉酶的成熟部分，如WO 2011/127802中的SEQ ID NO:2披露的以及本文中显示的SEQ ID NO:10。

葡糖淀粉酶PoAMG498(GA498)：具有以下突变的草酸青霉菌葡糖淀粉酶变体：K79V+P2N+P4S+P11F+T65A+Q327F(使用SEQ ID NO:10进行编号)。

葡糖淀粉酶X：包含以下的共混物：如WO 99/28448中的SEQ ID NO:34(本文中的SEQ ID NO:5)披露的埃默森篮状菌葡糖淀粉酶、如WO 06/69289中的SEQ ID NO:2(本文中的SEQ ID NO:9)披露的瓣环栓菌葡糖淀粉酶、以及本文中的SEQ ID NO:8披露的具有黑曲霉葡糖淀粉酶接头和淀粉结合结构域(SBD)的微小根毛霉α-淀粉酶，其具有以下取代：G128D+D143N(使用SEQ ID NO:8进行编号)(以AGU:AGU:FAU-F表示的活性比为约28:7:1)。

酵母：来自美国富酶泰斯公司(Fermentis)的ETHANOL RED^TM。

测定

蛋白酶测定

1)动力学Suc-AAPF-pNA测定：

pNA底物：Suc-AAPF-pNA(巴亨公司(Bachem)L-1400)。

温度：室温(25℃)

测定缓冲液：100mM琥珀酸，100mM HEPES，100mM CHES，100mM CABS，1mM CaCl₂，150mM KCl，0.01％Triton X-100，用HCl或NaOH调节至pH值2.0、3.0、4.0、5.0、6.0、7.0、8.0、9.0、10.0、和11.0。

将20μl蛋白酶(稀释于0.01％Triton X-100中)与100μl测定缓冲液混合。通过添加100μl pNA底物(50mg，溶解在1.0ml DMSO中，并进一步地用0.01％Triton X-100稀释45倍)开始进行测定。监测OD₄₀₅的增加作为蛋白酶活性的量度。

2)端点Suc-AAPF-pNA AK测定：

pNA底物：Suc-AAPF-pNA(巴亨公司(Bachem)L-1400)。

温度：受控的(测定温度)。

测定缓冲液：100mM琥珀酸，100mM HEPES，100mM CHES，100mM CABS，1mM CaCl₂，150mM KCl，0.01％Triton X-100，pH 9.0。

将200μl pNA底物(50mg，溶解在1.0ml DMSO中，并进一步地用测定缓冲液稀释45倍)用移液管移至艾本德管(Eppendorf)中并置于冰上。添加20μl蛋白酶样品(稀释于0.01％Triton X-100中)。通过将艾本德管转移至设置为测定温度的艾本德恒温混匀仪中来启动测定。将管在艾本德恒温混匀仪上在最高振摇速率(1400rpm)下孵育15分钟。通过转移管返回至冰浴并添加600μl 500mM琥珀酸/NaOH(pH 3.5)来停止孵育。通过涡旋混合艾本德管后，将200μl混合物转移至微量滴定板中。读取OD₄₀₅作为蛋白酶活性的量度。在测定中包括空白缓冲液(buffer blind)(代替酶)。

实例1：来自减硫高温球菌DSM 14981的S8蛋白酶1的克隆与表达

基因

S8蛋白酶多肽编码序列的基因组DNA序列克隆自注释为减硫高温球菌DSM 14981的古细菌菌株。基因组DNA序列和推导的氨基酸序列分别在SEQ ID NO:1和SEQ ID NO:2中示出。

表达克隆

编码S8蛋白酶1多肽(SEQ ID NO 1)的1269bp基因作为Strings^Tm线性DNA片段订购自赛默飞世尔科技公司(Thermo Fisher Scientific)。将5’和3’区域与Strings^Tm DNA线性片段融合以允许其在SOE-PCR中直接使用。编码减硫高温球菌DSM 14981的S8蛋白酶1多肽的线性DNA片段通过SOE-PCR与调节元件和同源区域融合以重组到枯草芽孢杆菌基因组中。线性整合构建体是SOE-PCR融合产物(Horton,R.M.，Hunt,H.D.，Ho,S.N.，Pullen,J.K.以及Pease,L.R.(1989)，Engineering hybrid genes withoutthe use of restriction enzymes,gene splicing by overlap extension[不使用限制酶，通过重叠延伸的基因剪接的工程化杂种基因]Gene[基因]77:61-68)，该融合产物由两个枯草芽孢杆菌染色体区域之间的基因连同强启动子与氯霉素抗性标志的融合制备。SOEPCR方法也描述于专利申请WO2003095658中。

在三联启动子系统(如WO 99/43835中所述)的控制下表达该基因，该启动子系统由包含稳定化序列的地衣芽孢杆菌α-淀粉酶基因(amyL)启动子、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)启动子和苏云金芽孢杆菌cryIIIA启动子组成。该SOE-PCR产物被转化进枯草芽孢杆菌中并且在染色体上通过同源重组将其整合到果胶裂解酶位点中。随后将包含该整合表达构建体的重组枯草芽孢杆菌克隆在液体培养基中进行生长。将培养液离心(20000x g，20min)并且将上清液小心地与沉淀物滗析分开，并用于酶的纯化。

实例2：来自减硫高温球菌的S8蛋白酶1的纯化和表征

来自减硫高温球菌的S8蛋白酶1的纯化

将培养液离心(20000x g，20min)并且将上清液小心地与沉淀物滗析分开。将上清液通过耐洁(Nalgene)0.2μm过滤装置过滤以便除去剩余的芽孢杆菌宿主细胞。将固体(NH₄)₂SO₄添加至0.2μm滤液中达到1.0M(NH₄)₂SO₄的最终浓度，并且将该酶溶液施加至在50mM H₃BO₃、10mM MES、2mM CaCl₂、1.0M(NH₄)₂SO₄、pH 6.0中平衡的苯基-琼脂糖FF(高取代)柱(来自通用电气医疗集团(GE Healthcare))上。在用平衡缓冲液充分洗涤柱之后，将蛋白酶用线性梯度在平衡缓冲液与75％(50mM H₃BO₃，10mM MES，2mM CaCl₂，pH 6.0)+25％异丙醇之间经三个柱体积进行洗脱。分析来自柱的级分针对蛋白酶活性(使用在pH 9的动力学Suc-AAPF-pNA测定)，并且合并蛋白酶活性峰。将来自苯基-琼脂糖柱的合并物转移至G25Sephadex柱(来自通用电气医疗集团)上的10mM Tris/HCl、1mM CaCl₂、pH 9.0中，并将G25转移酶应用于在10mM Tris/HCl、1mM CaCl₂、pH 9.0中平衡的Q-琼脂糖FF柱(来自通用电气医疗集团)。在将柱用平衡缓冲液充分地洗涤之后，将蛋白酶用在平衡缓冲液与10mMTris/HCl、1mM CaCl₂、750mM NaCl、pH 9.0之间的线性梯度经五个柱体积洗脱。分析来自柱的级分的蛋白酶活性(使用在pH 9下的动力学Suc-AAPF-pNA测定)，并且将活性级分合并并用脱矿质水稀释10倍。将该稀释的蛋白酶合并物施加到SOURCE 30Q柱(来自通用电气医疗集团)上，该柱以10mM Tris/HCl、1mM CaCl₂(pH 9.0)平衡。在将柱用平衡缓冲液充分地洗涤之后，将蛋白酶用在平衡缓冲液与10mM Tris/HCl、1mM CaCl₂、750mM NaCl、pH 9.0之间的线性梯度经五个柱体积洗脱。分析来自柱的级分的蛋白酶活性(使用在pH 9下的动力学Suc-AAPF-pNA测定)，并且通过SDS-PAGE进一步分析活性级分。将级分(在考马斯染色的SDS-PAGE凝胶上有约37kDa的一条主要带)合并。合并物是纯化的制剂并且用于进一步表征。

来自减硫高温球菌的S8蛋白酶1的表征

使用动力学Suc-AAPF-pNA测定来获得来自减硫高温球菌的S8蛋白酶1的pH-活性曲线和pH-稳定性曲线。对于pH-稳定性曲线，将蛋白酶在不同测定缓冲液中稀释10倍以达到这些缓冲液的pH值并且然后在37℃孵育2小时。孵育之后，通过稀释于pH 9.0测定缓冲液中，使该蛋白酶孵育的pH转至pH 9.0，之后对残余活性进行测定。使用端点Suc-AAPF-pNA测定以获得在pH 9.0下的温度-活性曲线。

结果示于下表1-3中。对于表1，活性相对于酶的最佳pH。对于表2，活性是相对于样品的残余活性，将这些样品保持在稳定条件(5℃，pH 9.0)下。对于表3，活性相对于酶在pH9.0的最佳温度。

表1：pH活性曲线

表2：pH-稳定性曲线(在37℃2小时之后的残余活性)

表3：在pH 9.0下的温度活性曲线

来自减硫高温球菌的S8蛋白酶1的其他特征

抑制剂：PMSF。

确定N-末端序列的测定开始于SEQ ID NO:2中的位置102。

如通过SDS-PAGE确定的相对分子量约是M_r＝37kDa。

通过完整分子量分析确定的观察到的分子量是33153.3Da。

将成熟序列(来自EDMAN N-末端测序数据和完整MS数据)确定为SEQ ID NO:2的氨基酸102至422。

来自这一成熟序列的计算的分子量是33152.3Da。

实例3：通过差示扫描量热法确定Td。

通过差示扫描量热法(DSC)使用VP-毛细管差示扫描量热仪(微量热公司(MicroCal Inc.)，皮斯卡特维(Piscataway)，新泽西州，美国)，确定S8蛋白酶1和来自强烈火球菌(本文注释为PfuS)的参比丝氨酸蛋白酶(如SEQ ID NO:3披露的)的热稳定性。将用PfuS作为参比，因为它先前已示出具有良好的热稳定性并且适用于含淀粉材料的液化(WO2012/088303)。在200K/小时的恒定的程序化加热速率下，在加热缓冲液(50mM乙酸盐缓冲液，pH 4.5，2mM CaCl₂)中的酶溶液(约0.5mg/ml)后获得的热分析图(Cp对T)中，热变性温度Td(℃)取自变性峰(主要的吸热峰)的顶端。将样品溶液和参比溶液(约0.2ml)从10℃的储存条件下装载到量热仪中(参比溶液：不含酶的缓冲液)，并且在20℃热预平衡20分钟，随后从20℃至100℃进行DSC扫描。以约+/-1℃的精确度确定变性温度。在这些条件下获得的S8蛋白酶1和PfuS的Td总结于表4中。

表4：通过差示扫描量热法确定Td

样品	Td
		S8蛋白酶1	112.2℃
PfuS	90.4℃+96.5℃

实例4：玉米面筋水解产物

将含有约30％(w/v)干固体(DS)的玉米湿面筋在15mM乙酸盐缓冲液(pH 5)中稀释至5％(w/v)DS并搅拌直至完全溶解。将100ml 5％(w/v)DS(相当于5g DS)转移到具有三个挡板的500ml摇瓶中，并且每g DS添加500μg蛋白酶。将样品在设定为125rpm的旋转台上在50℃孵育24小时。在24小时长的孵育后，将玉米面筋水解产物通过0.45μm过滤器过滤，并添加苯基甲磺酰氟至最终浓度为500μM。然后将玉米面筋水解产物进行如下所述的游离氨基酸分析。表5总结了玉米面筋水解产物中蛋白酶释放的游离氨基酸的总量。

游离氨基酸分析

首先在3kDa滤膜上洗涤样品，并收集含有游离氨基酸的贯流物。使用WatersAccQ-Tag Ultra方法通过柱前衍生进行氨基酸分析。简而言之，将氨基酸通过AccQ-TagUltra试剂衍生化并用反相UPLC(沃特斯公司(Waters Corp.)，米尔福德(Milford)，马萨诸塞州)分离，并且基于UV吸光度定量衍生物。

表5：玉米面筋水解产物中的总游离氨基酸

实例5：减硫高温球菌蛋白酶用于乙醇生产的用途

测试本发明的成熟蛋白酶(SEQ ID NO:2的氨基酸102至422)，用于对玉米粉浆料的常规乙醇方法中，包括液化步骤，随后是同时糖化和发酵。

液化：将全玉米粉、酒糟水和自来水的七个浆体制备成目标是32.50％干固体(DS)的120g的总重量；将酒糟水以30％反流重量/浆料重量共混。初始浆料pH约为5.2并且用45％w/v氢氧化钾或40％v/v硫酸调节为5.0。将固定剂量的α-淀粉酶BE369(2.1μg EP/gDS)和葡糖淀粉酶Po AMG498(4.5μg EP/g DS)施加到所有的浆体上并且与如下的来自嗜热高温球菌(Thermococcus litoralis)(Tl)的S8蛋白酶(SEQ ID NO:11)或来自减硫高温球菌(Tt)的S8蛋白酶(SEQ ID NO:2的氨基酸102至422)合并以评估液化期间的蛋白酶处理效果：

对照：α-淀粉酶BE369+葡糖淀粉酶PoAMG498

α-淀粉酶BE369+葡糖淀粉酶PoAMG498+0.5μg/g DS Tl蛋白酶

α-淀粉酶BE369+葡糖淀粉酶PoAMG498+1μg/g DS Tl蛋白酶

α-淀粉酶BE369+葡糖淀粉酶PoAMG498+3μg/g DS Tl蛋白酶

α-淀粉酶BE369+葡糖淀粉酶PoAMG498+0.5μg/g DS Tt蛋白酶

α-淀粉酶BE369+葡糖淀粉酶PoAMG498+1μg/g DS Tt蛋白酶

α-淀粉酶BE369+葡糖淀粉酶PoAMG498+3μg/g DS Tt蛋白酶

向每个罐中添加水和酶，并且然后在装入Labomat之前密封每个罐并且充分混合。在设置为以下条件的Labomat中孵育所有样品：以5℃/min斜升，15分钟斜升至80℃，保持1min，以1℃/min斜升至85℃并且保持103min，40rpm向左持续30秒并且向右持续30秒。一旦完成液化，在进行发酵之前，将所有的罐在冰浴中冷却约20分钟。

同时糖化和发酵(SSF)：将青霉素添加至每个醪液中至最终浓度为3ppm并且调节pH至5.0。接下来，将该醪液的部分转移到试管中。用1/64”钻头钻所有的试管，以允许CO释放。将尿素添加到管的一半中至浓度为500ppm。此外，在所有处理中如保证尿素与无尿素醪液包含相等固体所需要的，通过添加水来保持等量固体。通过添加葡糖淀粉酶X(0.60AGU/gDS)、水和再水化的酵母来启动发酵。通过将5.5g的ETHANOL RED^TM混合到100mL的32℃自来水中持续至少15分钟并且每个试管给予100μl进行酵母再水化。

HPLC分析：HPLC分析使用与Bio-Rad HPX-87H离子排阻柱(300mm x 7.8mm)和Bio-Rad阳离子H保护柱(Bio-Rad Cation H guard cartridge)结合的Agilent 1100/1200。流动相是0.6ml/min流速的0.005M硫酸和处理过的样品，其中柱和RI检波器分别温度为65℃和55℃。在54小时后通过每个处理舍弃3个管进行发酵取样。将每个管通过用50μl的40％v/v H₂SO₄失活、涡旋、以1460×g离心10分钟，并且通过0.45μm沃特曼PP过滤器(Whatman PPfilter)过滤进行处理。在HPLC分析之前和期间将样品储存在4℃。该方法使用针对DP4+、DP3、DP2、葡萄糖、果糖、乙酸、乳酸、甘油以及乙醇(％w/v)的校准标准品对分析物进行定量。使用四点校准(包括来源)进行定量。

获得的乙醇产量示于下表6和7中。

表6.用于氮受限的(无尿素)发酵的最终乙醇

处理	蛋白酶剂量(μg/g DS)	EtOH(％w/v)
			BE369+PoAMG(对照)	0	11.272
对照+Tl	0.5	12.0768
			对照+Tl	1	12.6484
对照+Tl	3	13.2986
			对照+Tt	0.5	12.3314
对照+Tt	1	12.8282
			对照+Tt	3	13.4724

表7用于基于尿素(500ppm)的发酵的最终乙醇

处理	蛋白酶剂量(μg/g DS)	EtOH(％w/v)
			BE369+PoAMG(对照)	0	13.489
对照+Tl	0.5	13.5632
			对照+Tl	1	13.524
对照+Tl	3	13.5262
			对照+Tt	0.5	13.6232
对照+Tt	1	13.547
			对照+Tt	3	13.5976

实例6：减硫高温球菌蛋白酶用于乙醇生产的用途

液化：将全玉米粉、酒糟水和自来水的浆体制备成目标是32.50％干固体(DS)的120g的总重量；将酒糟水以30％反流重量/浆料重量共混。初始浆料pH约为5.2并且用45％w/v氢氧化钾或40％v/v硫酸调节为5.0。将固定剂量的α-淀粉酶BE369(2.1μg EP/g DS)施加到所有的浆体上并且与如下的来自嗜热高温球菌(Tl)的S8蛋白酶(SEQ ID NO:11)或来自减硫高温球菌的S8蛋白酶(SEQ ID NO:2的氨基酸102至422)合并以评估液化期间的蛋白酶处理效果：

对照：α-淀粉酶BE369

α-淀粉酶BE369+0.5μg/g DS Tl蛋白酶

α-淀粉酶BE369+1μg/g DS Tl蛋白酶

α-淀粉酶BE369+3μg/g DS Tl蛋白酶

α-淀粉酶BE369+15μg/g DS Tl蛋白酶

α-淀粉酶BE369+0.5μg/g DS Tt蛋白酶

α-淀粉酶BE369+1μg/g DS Tt蛋白酶

α-淀粉酶BE369+3μg/g DS Tt蛋白酶

α-淀粉酶BE369+15μg/g DS Tt蛋白酶

获得的乙醇产量示于下表8和9中。

表8.用于氮受限的(无尿素)发酵的最终乙醇

表9.用于基于尿素(500ppm)的发酵的最终乙醇

实例7：减硫高温球菌蛋白酶用于乙醇生产的用途

液化：将全玉米粉、酒糟水和自来水的浆体制备成目标是32.50％干固体(DS)的120g的总重量；将酒糟水以30％反流重量/浆料重量共混。初始浆料pH约为5.2并且用45％w/v氢氧化钾或40％v/v硫酸调节为5.0。将固定剂量的α-淀粉酶BE369(2.1μg EP/g DS)施加到所有的浆体上并且与如下的来自嗜热高温球菌的S8蛋白酶(SEQ ID NO:11)或来自减硫高温球菌的S8蛋白酶(SEQ ID NO:2的氨基酸102至422)合并以评估液化期间的蛋白酶处理效果：

对照：α-淀粉酶

α-淀粉酶BE369+0.5μg/g DS Tl蛋白酶

α-淀粉酶BE369+5.0μg/g DS Tl蛋白酶

α-淀粉酶BE369+5.0μg/g DS Tt蛋白酶

获得的乙醇产量示于下表中。

表10.用于氮受限的(无尿素)发酵的最终乙醇

表11.用于基于尿素(500ppm)的发酵的最终乙醇

序列表

<110> 诺维信公司（Novozymes A/S）

<120> 具有蛋白酶活性的多肽和编码其的多核苷酸

<130> 14255-WO-PCT

<160> 11

<170> PatentIn版本3.5

<210> 1

<211> 1269

<212> DNA

<213> 减硫高温球菌（Thermococcus thioreducens）

<400> 1

atgggcagga aggatataac aattgctcta gtggccctga ttgtgctttc ccttttaggg 60

gttccagcga cggcagaaaa gcctgagctt gttagagtga tagtgcacgt ggacagggga 120

cacttcaaca cggcagacgt tgccacgata ggcggccacg ttgtttatca gtttaagctg 180

atagacgcgg tagtagtgga agtgccttca acagccgtgg gaaggctcaa gaagcttccg 240

ggagtcaaaa tggtagagtt tgaccacaag gcgaggatac ttgccgggcc accctcctgg 300

ctcggaggtg gacagccttc ccagcagatt ccgtggggaa tcagcagagt cagagccccg 360

gatgtatggg gcataaccga tggctctgga ggtgttattg aggtcgccgt tcttgatact 420

ggggttgact acgaccatcc ggatctggct ggtaatatag catggtgtgt tagcactctc 480

cggggcaggg ttacaacaaa tccagcccag tgtaaagacc agaatggtca tgggacacat 540

gttataggga caatagccgc gctcaacaat gacatcggcg ttgttggtgt tgctcccggg 600

gttgaaatat actccatcag ggttctggat gcaagcggga gcggttccta cagcgatata 660

gccatcggaa tcgaacaggc cctccttggc cccgatggaa ttctcgacaa ggacggcgac 720

gggataatcg tcggcgaccc ggacgacgat gccgcagaag ttataagcat gtccctcgga 780

ggcccaacgg acgaccagta tctccacgac atgattatca cggcatacaa ctacggtgtg 840

gttatagtgg cagcgagcgg caacgaggga gcttccagtc ccagctatcc cgccgcatat 900

cctgaggtca tagccgttgg tgcgagtgat gtaaacgatc agatcgcttc ctggagcaac 960

agacagccag aagttagtgc tccgggcgtt gacattctaa gcacctaccc ggacgacacc 1020

tacgagaccc tcagcggaac cagcatggca acgccacacg tcagcggtgt ggttgctctc 1080

atacaggcgg cctactacaa caagtacggc aaggttctcc cggttggaac cttcgacgac 1140

atgggaacca acaccgtcag gggaatcctc cacgttacgg ccgatgacct tggggacgct 1200

ggctgggaca tatactacgg ctacggaata gtccgggcag acttagccgt tcaggcggcc 1260

atcggctaa 1269

<210> 2

<211> 422

<212> PRT

<213> 减硫高温球菌（Thermococcus thioreducens）

<400> 2

Met Gly Arg Lys Asp Ile Thr Ile Ala Leu Val Ala Leu Ile Val Leu

1 5 10 15

Ser Leu Leu Gly Val Pro Ala Thr Ala Glu Lys Pro Glu Leu Val Arg

20 25 30

Val Ile Val His Val Asp Arg Gly His Phe Asn Thr Ala Asp Val Ala

35 40 45

Thr Ile Gly Gly His Val Val Tyr Gln Phe Lys Leu Ile Asp Ala Val

50 55 60

Val Val Glu Val Pro Ser Thr Ala Val Gly Arg Leu Lys Lys Leu Pro

65 70 75 80

Gly Val Lys Met Val Glu Phe Asp His Lys Ala Arg Ile Leu Ala Gly

85 90 95

Pro Pro Ser Trp Leu Gly Gly Gly Gln Pro Ser Gln Gln Ile Pro Trp

100 105 110

Gly Ile Ser Arg Val Arg Ala Pro Asp Val Trp Gly Ile Thr Asp Gly

115 120 125

Ser Gly Gly Val Ile Glu Val Ala Val Leu Asp Thr Gly Val Asp Tyr

130 135 140

Asp His Pro Asp Leu Ala Gly Asn Ile Ala Trp Cys Val Ser Thr Leu

145 150 155 160

Arg Gly Arg Val Thr Thr Asn Pro Ala Gln Cys Lys Asp Gln Asn Gly

165 170 175

His Gly Thr His Val Ile Gly Thr Ile Ala Ala Leu Asn Asn Asp Ile

180 185 190

Gly Val Val Gly Val Ala Pro Gly Val Glu Ile Tyr Ser Ile Arg Val

195 200 205

Leu Asp Ala Ser Gly Ser Gly Ser Tyr Ser Asp Ile Ala Ile Gly Ile

210 215 220

Glu Gln Ala Leu Leu Gly Pro Asp Gly Ile Leu Asp Lys Asp Gly Asp

225 230 235 240

Gly Ile Ile Val Gly Asp Pro Asp Asp Asp Ala Ala Glu Val Ile Ser

245 250 255

Met Ser Leu Gly Gly Pro Thr Asp Asp Gln Tyr Leu His Asp Met Ile

260 265 270

Ile Thr Ala Tyr Asn Tyr Gly Val Val Ile Val Ala Ala Ser Gly Asn

275 280 285

Glu Gly Ala Ser Ser Pro Ser Tyr Pro Ala Ala Tyr Pro Glu Val Ile

290 295 300

Ala Val Gly Ala Ser Asp Val Asn Asp Gln Ile Ala Ser Trp Ser Asn

305 310 315 320

Arg Gln Pro Glu Val Ser Ala Pro Gly Val Asp Ile Leu Ser Thr Tyr

325 330 335

Pro Asp Asp Thr Tyr Glu Thr Leu Ser Gly Thr Ser Met Ala Thr Pro

340 345 350

His Val Ser Gly Val Val Ala Leu Ile Gln Ala Ala Tyr Tyr Asn Lys

355 360 365

Tyr Gly Lys Val Leu Pro Val Gly Thr Phe Asp Asp Met Gly Thr Asn

370 375 380

Thr Val Arg Gly Ile Leu His Val Thr Ala Asp Asp Leu Gly Asp Ala

385 390 395 400

Gly Trp Asp Ile Tyr Tyr Gly Tyr Gly Ile Val Arg Ala Asp Leu Ala

405 410 415

Val Gln Ala Ala Ile Gly

420

<210> 3

<211> 412

<212> PRT

<213> 强烈火球菌（Pyrococcus furiosus）

<400> 3

Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala Thr

1 5 10 15

Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile Gly Ile

20 25 30

Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln Gly Lys Val

35 40 45

Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr Pro Tyr Asp Asp

50 55 60

His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly Thr Gly Ala

65 70 75 80

Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly Ala Lys Leu Ala

85 90 95

Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly Ser Ile Ser Thr Ile

100 105 110

Ile Lys Gly Val Glu Trp Ala Val Asp Asn Lys Asp Lys Tyr Gly Ile

115 120 125

Lys Val Ile Asn Leu Ser Leu Gly Ser Ser Gln Ser Ser Asp Gly Thr

130 135 140

Asp Ala Leu Ser Gln Ala Val Asn Ala Ala Trp Asp Ala Gly Leu Val

145 150 155 160

Val Val Val Ala Ala Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly

165 170 175

Ser Pro Ala Ala Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys

180 185 190

Tyr Asp Val Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly

195 200 205

Arg Leu Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala

210 215 220

Arg Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr

225 230 235 240

Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile Ala

245 250 255

Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys

260 265 270

Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp Glu Ile Ala

275 280 285

Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr Lys Ala Ile Asn

290 295 300

Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly Tyr Val Ala Asn Lys

305 310 315 320

Gly Ser Gln Thr His Gln Phe Val Ile Ser Gly Ala Ser Phe Val Thr

325 330 335

Ala Thr Leu Tyr Trp Asp Asn Ala Asn Ser Asp Leu Asp Leu Tyr Leu

340 345 350

Tyr Asp Pro Asn Gly Asn Gln Val Asp Tyr Ser Tyr Thr Ala Tyr Tyr

355 360 365

Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro Thr Asp Gly Thr Trp Thr

370 375 380

Ile Lys Val Val Ser Tyr Ser Gly Ser Ala Asn Tyr Gln Val Asp Val

385 390 395 400

Val Ser Asp Gly Ser Leu Ser Gln Pro Gly Ser Ser

405 410

<210> 4

<211> 515

<212> PRT

<213> 嗜热脂肪芽孢杆菌

<400> 4

Ala Ala Pro Phe Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Leu

1 5 10 15

Pro Asp Asp Gly Thr Leu Trp Thr Lys Val Ala Asn Glu Ala Asn Asn

20 25 30

Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys

35 40 45

Gly Thr Ser Arg Ser Asp Val Gly Tyr Gly Val Tyr Asp Leu Tyr Asp

50 55 60

Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr

65 70 75 80

Lys Ala Gln Tyr Leu Gln Ala Ile Gln Ala Ala His Ala Ala Gly Met

85 90 95

Gln Val Tyr Ala Asp Val Val Phe Asp His Lys Gly Gly Ala Asp Gly

100 105 110

Thr Glu Trp Val Asp Ala Val Glu Val Asn Pro Ser Asp Arg Asn Gln

115 120 125

Glu Ile Ser Gly Thr Tyr Gln Ile Gln Ala Trp Thr Lys Phe Asp Phe

130 135 140

Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His

145 150 155 160

Phe Asp Gly Val Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr

165 170 175

Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Val Asp Thr Glu

180 185 190

Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His

195 200 205

Pro Glu Val Val Thr Glu Leu Lys Asn Trp Gly Lys Trp Tyr Val Asn

210 215 220

Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys

225 230 235 240

Phe Ser Phe Phe Pro Asp Trp Leu Ser Tyr Val Arg Ser Gln Thr Gly

245 250 255

Lys Pro Leu Phe Thr Val Gly Glu Tyr Trp Ser Tyr Asp Ile Asn Lys

260 265 270

Leu His Asn Tyr Ile Thr Lys Thr Asn Gly Thr Met Ser Leu Phe Asp

275 280 285

Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Ala

290 295 300

Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gln Pro

305 310 315 320

Thr Leu Ala Val Thr Phe Val Asp Asn His Asp Thr Glu Pro Gly Gln

325 330 335

Ala Leu Gln Ser Trp Val Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala

340 345 350

Phe Ile Leu Thr Arg Gln Glu Gly Tyr Pro Cys Val Phe Tyr Gly Asp

355 360 365

Tyr Tyr Gly Ile Pro Gln Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile

370 375 380

Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gln His

385 390 395 400

Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Val

405 410 415

Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro

420 425 430

Gly Gly Ser Lys Trp Met Tyr Val Gly Lys Gln His Ala Gly Lys Val

435 440 445

Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Val Thr Ile Asn Ser

450 455 460

Asp Gly Trp Gly Glu Phe Lys Val Asn Gly Gly Ser Val Ser Val Trp

465 470 475 480

Val Pro Arg Lys Thr Thr Val Ser Thr Ile Ala Arg Pro Ile Thr Thr

485 490 495

Arg Pro Trp Thr Gly Glu Phe Val Arg Trp Thr Glu Pro Arg Leu Val

500 505 510

Ala Trp Pro

515

<210> 5

<211> 591

<212> PRT

<213> 埃默森篮状菌

<400> 5

Ala Thr Gly Ser Leu Asp Ser Phe Leu Ala Thr Glu Thr Pro Ile Ala

1 5 10 15

Leu Gln Gly Val Leu Asn Asn Ile Gly Pro Asn Gly Ala Asp Val Ala

20 25 30

Gly Ala Ser Ala Gly Ile Val Val Ala Ser Pro Ser Arg Ser Asp Pro

35 40 45

Asn Tyr Phe Tyr Ser Trp Thr Arg Asp Ala Ala Leu Thr Ala Lys Tyr

50 55 60

Leu Val Asp Ala Phe Ile Ala Gly Asn Lys Asp Leu Glu Gln Thr Ile

65 70 75 80

Gln Gln Tyr Ile Ser Ala Gln Ala Lys Val Gln Thr Ile Ser Asn Pro

85 90 95

Ser Gly Asp Leu Ser Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn Val

100 105 110

Asn Glu Thr Ala Phe Thr Gly Pro Trp Gly Arg Pro Gln Arg Asp Gly

115 120 125

Pro Ala Leu Arg Ala Thr Ala Leu Ile Ala Tyr Ala Asn Tyr Leu Ile

130 135 140

Asp Asn Gly Glu Ala Ser Thr Ala Asp Glu Ile Ile Trp Pro Ile Val

145 150 155 160

Gln Asn Asp Leu Ser Tyr Ile Thr Gln Tyr Trp Asn Ser Ser Thr Phe

165 170 175

Asp Leu Trp Glu Glu Val Glu Gly Ser Ser Phe Phe Thr Thr Ala Val

180 185 190

Gln His Arg Ala Leu Val Glu Gly Asn Ala Leu Ala Thr Arg Leu Asn

195 200 205

His Thr Cys Ser Asn Cys Val Ser Gln Ala Pro Gln Val Leu Cys Phe

210 215 220

Leu Gln Ser Tyr Trp Thr Gly Ser Tyr Val Leu Ala Asn Phe Gly Gly

225 230 235 240

Ser Gly Arg Ser Gly Lys Asp Val Asn Ser Ile Leu Gly Ser Ile His

245 250 255

Thr Phe Asp Pro Ala Gly Gly Cys Asp Asp Ser Thr Phe Gln Pro Cys

260 265 270

Ser Ala Arg Ala Leu Ala Asn His Lys Val Val Thr Asp Ser Phe Arg

275 280 285

Ser Ile Tyr Ala Ile Asn Ser Gly Ile Ala Glu Gly Ser Ala Val Ala

290 295 300

Val Gly Arg Tyr Pro Glu Asp Val Tyr Gln Gly Gly Asn Pro Trp Tyr

305 310 315 320

Leu Ala Thr Ala Ala Ala Ala Glu Gln Leu Tyr Asp Ala Ile Tyr Gln

325 330 335

Trp Lys Lys Ile Gly Ser Ile Ser Ile Thr Asp Val Ser Leu Pro Phe

340 345 350

Phe Gln Asp Ile Tyr Pro Ser Ala Ala Val Gly Thr Tyr Asn Ser Gly

355 360 365

Ser Thr Thr Phe Asn Asp Ile Ile Ser Ala Val Gln Thr Tyr Gly Asp

370 375 380

Gly Tyr Leu Ser Ile Val Glu Lys Tyr Thr Pro Ser Asp Gly Ser Leu

385 390 395 400

Thr Glu Gln Phe Ser Arg Thr Asp Gly Thr Pro Leu Ser Ala Ser Ala

405 410 415

Leu Thr Trp Ser Tyr Ala Ser Leu Leu Thr Ala Ser Ala Arg Arg Gln

420 425 430

Ser Val Val Pro Ala Ser Trp Gly Glu Ser Ser Ala Ser Ser Val Pro

435 440 445

Ala Val Cys Ser Ala Thr Ser Ala Thr Gly Pro Tyr Ser Thr Ala Thr

450 455 460

Asn Thr Val Trp Pro Ser Ser Gly Ser Gly Ser Ser Thr Thr Thr Ser

465 470 475 480

Ser Ala Pro Cys Thr Thr Pro Thr Ser Val Ala Val Thr Phe Asp Glu

485 490 495

Ile Val Ser Thr Ser Tyr Gly Glu Thr Ile Tyr Leu Ala Gly Ser Ile

500 505 510

Pro Glu Leu Gly Asn Trp Ser Thr Ala Ser Ala Ile Pro Leu Arg Ala

515 520 525

Asp Ala Tyr Thr Asn Ser Asn Pro Leu Trp Tyr Val Thr Val Asn Leu

530 535 540

Pro Pro Gly Thr Ser Phe Glu Tyr Lys Phe Phe Lys Asn Gln Thr Asp

545 550 555 560

Gly Thr Ile Val Trp Glu Asp Asp Pro Asn Arg Ser Tyr Thr Val Pro

565 570 575

Ala Tyr Cys Gly Gln Thr Thr Ala Ile Leu Asp Asp Ser Trp Gln

580 585 590

<210> 6

<211> 556

<212> PRT

<213> 篱边粘褶菌

<400> 6

Gln Ser Val Asp Ser Tyr Val Ser Ser Glu Gly Pro Ile Ala Lys Ala

1 5 10 15

Gly Val Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly Ala

20 25 30

Ser Ala Gly Val Val Val Ala Ser Pro Ser Thr Ser Asp Pro Asp Tyr

35 40 45

Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu Ile

50 55 60

Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Thr Leu

65 70 75 80

Ile Asp Asp Phe Val Thr Ala Glu Ala Asn Leu Gln Gln Val Ser Asn

85 90 95

Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn

100 105 110

Val Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg Asp

115 120 125

Gly Pro Ala Leu Arg Ser Thr Ala Leu Ile Thr Tyr Gly Asn Trp Leu

130 135 140

Leu Ser Asn Gly Asn Thr Ser Tyr Val Thr Ser Asn Leu Trp Pro Ile

145 150 155 160

Ile Gln Asn Asp Leu Gly Tyr Val Val Ser Tyr Trp Asn Gln Ser Thr

165 170 175

Tyr Asp Leu Trp Glu Glu Val Asp Ser Ser Ser Phe Phe Thr Thr Ala

180 185 190

Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Ala Ile

195 200 205

Gly Gln Thr Ser Gln Val Ser Ser Tyr Thr Thr Gln Ala Asp Asn Leu

210 215 220

Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Ser Gly Gly Tyr Ile Thr

225 230 235 240

Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu Leu

245 250 255

Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Ala Thr

260 265 270

Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr Val

275 280 285

Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Val Ala Ser Asn

290 295 300

Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Gln Gly Gly

305 310 315 320

Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr Asp

325 330 335

Ala Leu Asn Val Trp Glu Ser Gln Gly Ser Leu Glu Val Thr Ser Thr

340 345 350

Ser Leu Ala Phe Phe Gln Gln Phe Ser Ser Gly Val Thr Ala Gly Thr

355 360 365

Tyr Ser Ser Ser Ser Ser Thr Tyr Ser Thr Leu Thr Ser Ala Ile Lys

370 375 380

Asn Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Lys Tyr Thr Pro Ser

385 390 395 400

Asn Gly Gly Leu Ala Glu Gln Tyr Ser Lys Ser Asp Gly Ser Pro Leu

405 410 415

Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala Phe

420 425 430

Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Ala Gly Leu

435 440 445

Thr Val Pro Ser Ser Cys Ser Gly Asn Ser Gly Gly Pro Thr Val Ala

450 455 460

Val Thr Phe Asn Val Asn Ala Glu Thr Val Trp Gly Glu Asn Ile Tyr

465 470 475 480

Leu Thr Gly Ser Val Asp Ala Leu Glu Asn Trp Ser Ala Asp Asn Ala

485 490 495

Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ile Thr Val Asn

500 505 510

Leu Pro Ala Ser Thr Ala Ile Glu Tyr Lys Tyr Ile Arg Lys Asn Asn

515 520 525

Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile Thr Thr Pro

530 535 540

Ala Ser Gly Ser Thr Thr Glu Asn Asp Thr Trp Arg

545 550 555

<210> 7

<211> 559

<212> PRT

<213> 密粘褶菌

<400> 7

Gln Ser Val Asp Ser Tyr Val Gly Ser Glu Gly Pro Ile Ala Lys Ala

1 5 10 15

Gly Val Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly Ala

20 25 30

Ala Ala Gly Val Val Val Ala Ser Pro Ser Lys Ser Asp Pro Asp Tyr

35 40 45

Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu Ile

50 55 60

Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Ser Leu

65 70 75 80

Ile Asp Ser Phe Val Ile Ala Glu Ala Asn Ile Gln Gln Val Ser Asn

85 90 95

Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn

100 105 110

Val Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg Asp

115 120 125

Gly Pro Ala Leu Arg Ala Thr Ala Leu Ile Thr Tyr Gly Asn Trp Leu

130 135 140

Leu Ser Asn Gly Asn Thr Thr Trp Val Thr Ser Thr Leu Trp Pro Ile

145 150 155 160

Ile Gln Asn Asp Leu Asn Tyr Val Val Gln Tyr Trp Asn Gln Thr Thr

165 170 175

Phe Asp Leu Trp Glu Glu Val Asn Ser Ser Ser Phe Phe Thr Thr Ala

180 185 190

Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Lys Ile

195 200 205

Gly Gln Thr Ser Ser Val Ser Ser Tyr Thr Thr Gln Ala Ala Asn Leu

210 215 220

Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Ser Gly Tyr Ile Thr

225 230 235 240

Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu Leu

245 250 255

Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Thr Thr

260 265 270

Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr Val

275 280 285

Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Ile Ala Ser Asn

290 295 300

Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Gln Gly Gly

305 310 315 320

Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr Asp

325 330 335

Ala Leu Asn Val Trp Ala Ala Gln Gly Ser Leu Asn Val Thr Ser Ile

340 345 350

Ser Leu Pro Phe Phe Gln Gln Phe Ser Ser Ser Val Thr Ala Gly Thr

355 360 365

Tyr Ala Ser Ser Ser Thr Thr Tyr Thr Thr Leu Thr Ser Ala Ile Lys

370 375 380

Ser Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Gln Tyr Thr Pro Ser

385 390 395 400

Asn Gly Gly Leu Ala Glu Gln Phe Ser Arg Ser Asn Gly Ala Pro Val

405 410 415

Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala Phe

420 425 430

Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Val Gly Leu

435 440 445

Thr Val Pro Thr Ser Cys Ser Ser Asn Ser Gly Gly Gly Gly Gly Ser

450 455 460

Thr Val Ala Val Thr Phe Asn Val Asn Ala Gln Thr Val Trp Gly Glu

465 470 475 480

Asn Ile Tyr Ile Thr Gly Ser Val Asp Ala Leu Ser Asn Trp Ser Pro

485 490 495

Asp Asn Ala Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ile

500 505 510

Thr Val Asn Leu Pro Ala Ser Thr Ala Ile Gln Tyr Lys Tyr Ile Arg

515 520 525

Lys Asn Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile

530 535 540

Thr Thr Pro Ala Ser Gly Ser Val Thr Glu Asn Asp Thr Trp Arg

545 550 555

<210> 8

<211> 583

<212> PRT

<213> 人工

<220>

<223> 杂合α-淀粉酶，其包含来自融合至接头的微小根毛霉α-淀粉酶催化结构域和来自黑曲霉葡糖淀粉酶的淀粉结合结构域

<400> 8

Ala Thr Ser Asp Asp Trp Lys Gly Lys Ala Ile Tyr Gln Leu Leu Thr

1 5 10 15

Asp Arg Phe Gly Arg Ala Asp Asp Ser Thr Ser Asn Cys Ser Asn Leu

20 25 30

Ser Asn Tyr Cys Gly Gly Thr Tyr Glu Gly Ile Thr Lys His Leu Asp

35 40 45

Tyr Ile Ser Gly Met Gly Phe Asp Ala Ile Trp Ile Ser Pro Ile Pro

50 55 60

Lys Asn Ser Asp Gly Gly Tyr His Gly Tyr Trp Ala Thr Asp Phe Tyr

65 70 75 80

Gln Leu Asn Ser Asn Phe Gly Asp Glu Ser Gln Leu Lys Ala Leu Ile

85 90 95

Gln Ala Ala His Glu Arg Asp Met Tyr Val Met Leu Asp Val Val Ala

100 105 110

Asn His Ala Gly Pro Thr Ser Asn Gly Tyr Ser Gly Tyr Thr Phe Gly

115 120 125

Asp Ala Ser Leu Tyr His Pro Lys Cys Thr Ile Asp Tyr Asn Asp Gln

130 135 140

Thr Ser Ile Glu Gln Cys Trp Val Ala Asp Glu Leu Pro Asp Ile Asp

145 150 155 160

Thr Glu Asn Ser Asp Asn Val Ala Ile Leu Asn Asp Ile Val Ser Gly

165 170 175

Trp Val Gly Asn Tyr Ser Phe Asp Gly Ile Arg Ile Asp Thr Val Lys

180 185 190

His Ile Arg Lys Asp Phe Trp Thr Gly Tyr Ala Glu Ala Ala Gly Val

195 200 205

Phe Ala Thr Gly Glu Val Phe Asn Gly Asp Pro Ala Tyr Val Gly Pro

210 215 220

Tyr Gln Lys Tyr Leu Pro Ser Leu Ile Asn Tyr Pro Met Tyr Tyr Ala

225 230 235 240

Leu Asn Asp Val Phe Val Ser Lys Ser Lys Gly Phe Ser Arg Ile Ser

245 250 255

Glu Met Leu Gly Ser Asn Arg Asn Ala Phe Glu Asp Thr Ser Val Leu

260 265 270

Thr Thr Phe Val Asp Asn His Asp Asn Pro Arg Phe Leu Asn Ser Gln

275 280 285

Ser Asp Lys Ala Leu Phe Lys Asn Ala Leu Thr Tyr Val Leu Leu Gly

290 295 300

Glu Gly Ile Pro Ile Val Tyr Tyr Gly Ser Glu Gln Gly Phe Ser Gly

305 310 315 320

Gly Ala Asp Pro Ala Asn Arg Glu Val Leu Trp Thr Thr Asn Tyr Asp

325 330 335

Thr Ser Ser Asp Leu Tyr Gln Phe Ile Lys Thr Val Asn Ser Val Arg

340 345 350

Met Lys Ser Asn Lys Ala Val Tyr Met Asp Ile Tyr Val Gly Asp Asn

355 360 365

Ala Tyr Ala Phe Lys His Gly Asp Ala Leu Val Val Leu Asn Asn Tyr

370 375 380

Gly Ser Gly Ser Thr Asn Gln Val Ser Phe Ser Val Ser Gly Lys Phe

385 390 395 400

Asp Ser Gly Ala Ser Leu Met Asp Ile Val Ser Asn Ile Thr Thr Thr

405 410 415

Val Ser Ser Asp Gly Thr Val Thr Phe Asn Leu Lys Asp Gly Leu Pro

420 425 430

Ala Ile Phe Thr Ser Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Pro

435 440 445

Thr Gly Ser Gly Ser Val Thr Ser Thr Ser Lys Thr Thr Ala Thr Ala

450 455 460

Ser Lys Thr Ser Thr Ser Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr

465 470 475 480

Ala Val Ala Val Thr Phe Asp Leu Thr Ala Thr Thr Thr Tyr Gly Glu

485 490 495

Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln Leu Gly Asp Trp Glu Thr

500 505 510

Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys Tyr Thr Ser Ser Asp Pro

515 520 525

Leu Trp Tyr Val Thr Val Thr Leu Pro Ala Gly Glu Ser Phe Glu Tyr

530 535 540

Lys Phe Ile Arg Ile Glu Ser Asp Asp Ser Val Glu Trp Glu Ser Asp

545 550 555 560

Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala Cys Gly Thr Ser Thr Ala

565 570 575

Thr Val Thr Asp Thr Trp Arg

580

<210> 9

<211> 556

<212> PRT

<213> 瓣环栓菌

<400> 9

Gln Ser Ser Ala Ala Asp Ala Tyr Val Ala Ser Glu Ser Pro Ile Ala

1 5 10 15

Lys Ala Gly Val Leu Ala Asn Ile Gly Pro Ser Gly Ser Lys Ser Asn

20 25 30

Gly Ala Lys Ala Gly Ile Val Ile Ala Ser Pro Ser Thr Ser Asn Pro

35 40 45

Asn Tyr Leu Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ala

50 55 60

Leu Ile Asp Gln Phe Thr Thr Gly Glu Asp Thr Ser Leu Arg Thr Leu

65 70 75 80

Ile Asp Glu Phe Thr Ser Ala Glu Ala Ile Leu Gln Gln Val Pro Asn

85 90 95

Pro Ser Gly Thr Val Ser Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn

100 105 110

Ile Asp Glu Thr Ala Phe Thr Asp Ala Trp Gly Arg Pro Gln Arg Asp

115 120 125

Gly Pro Ala Leu Arg Ala Thr Ala Ile Ile Thr Tyr Ala Asn Trp Leu

130 135 140

Leu Asp Asn Lys Asn Thr Thr Tyr Val Thr Asn Thr Leu Trp Pro Ile

145 150 155 160

Ile Lys Leu Asp Leu Asp Tyr Val Ala Ser Asn Trp Asn Gln Ser Thr

165 170 175

Phe Asp Leu Trp Glu Glu Ile Asn Ser Ser Ser Phe Phe Thr Thr Ala

180 185 190

Val Gln His Arg Ala Leu Arg Glu Gly Ala Thr Phe Ala Asn Arg Ile

195 200 205

Gly Gln Thr Ser Val Val Ser Gly Tyr Thr Thr Gln Ala Asn Asn Leu

210 215 220

Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Gly Gly Tyr Ile Thr

225 230 235 240

Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Val Leu

245 250 255

Thr Ser Ile His Thr Phe Asp Pro Ala Ala Gly Cys Asp Ala Val Thr

260 265 270

Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr Val

275 280 285

Asp Ala Phe Arg Ser Ile Tyr Ser Ile Asn Ser Gly Ile Ala Ser Asn

290 295 300

Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Met Gly Gly

305 310 315 320

Asn Pro Trp Tyr Leu Thr Thr Ser Ala Val Ala Glu Gln Leu Tyr Asp

325 330 335

Ala Leu Ile Val Trp Asn Lys Leu Gly Ala Leu Asn Val Thr Ser Thr

340 345 350

Ser Leu Pro Phe Phe Gln Gln Phe Ser Ser Gly Val Thr Val Gly Thr

355 360 365

Tyr Ala Ser Ser Ser Ser Thr Phe Lys Thr Leu Thr Ser Ala Ile Lys

370 375 380

Thr Phe Ala Asp Gly Phe Leu Ala Val Asn Ala Lys Tyr Thr Pro Ser

385 390 395 400

Asn Gly Gly Leu Ala Glu Gln Tyr Ser Arg Ser Asn Gly Ser Pro Val

405 410 415

Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ala Ala Leu Thr Ser Phe

420 425 430

Ala Ala Arg Ser Gly Lys Thr Tyr Ala Ser Trp Gly Ala Ala Gly Leu

435 440 445

Thr Val Pro Thr Thr Cys Ser Gly Ser Gly Gly Ala Gly Thr Val Ala

450 455 460

Val Thr Phe Asn Val Gln Ala Thr Thr Val Phe Gly Glu Asn Ile Tyr

465 470 475 480

Ile Thr Gly Ser Val Pro Ala Leu Gln Asn Trp Ser Pro Asp Asn Ala

485 490 495

Leu Ile Leu Ser Ala Ala Asn Tyr Pro Thr Trp Ser Ile Thr Val Asn

500 505 510

Leu Pro Ala Ser Thr Thr Ile Glu Tyr Lys Tyr Ile Arg Lys Phe Asn

515 520 525

Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile Thr Thr Pro

530 535 540

Ala Ser Gly Thr Phe Thr Gln Asn Asp Thr Trp Arg

545 550 555

<210> 10

<211> 595

<212> PRT

<213> 草酸青霉菌

<400> 10

Arg Pro Asp Pro Lys Gly Gly Asn Leu Thr Pro Phe Ile His Lys Glu

1 5 10 15

Gly Glu Arg Ser Leu Gln Gly Ile Leu Asp Asn Leu Gly Gly Arg Gly

20 25 30

Lys Lys Thr Pro Gly Thr Ala Ala Gly Leu Phe Ile Ala Ser Pro Asn

35 40 45

Thr Glu Asn Pro Asn Tyr Tyr Tyr Thr Trp Thr Arg Asp Ser Ala Leu

50 55 60

Thr Ala Lys Cys Leu Ile Asp Leu Phe Glu Asp Ser Arg Ala Lys Phe

65 70 75 80

Pro Ile Asp Arg Lys Tyr Leu Glu Thr Gly Ile Arg Asp Tyr Lys Ser

85 90 95

Ser Gln Ala Ile Leu Gln Ser Val Ser Asn Pro Ser Gly Thr Leu Lys

100 105 110

Asp Gly Ser Gly Leu Gly Glu Pro Lys Phe Glu Ile Asp Leu Asn Pro

115 120 125

Phe Ser Gly Ala Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala Leu Arg

130 135 140

Ala Thr Ala Met Ile Thr Tyr Ala Asn Tyr Leu Ile Ser His Gly Gln

145 150 155 160

Lys Ser Asp Val Ser Gln Val Met Trp Pro Ile Ile Ala Asn Asp Leu

165 170 175

Ala Tyr Val Gly Gln Tyr Trp Asn Asn Thr Gly Phe Asp Leu Trp Glu

180 185 190

Glu Val Asp Gly Ser Ser Phe Phe Thr Ile Ala Val Gln His Arg Ala

195 200 205

Leu Val Glu Gly Ser Gln Leu Ala Lys Lys Leu Gly Lys Ser Cys Asp

210 215 220

Ala Cys Asp Ser Gln Pro Pro Gln Ile Leu Cys Phe Leu Gln Ser Phe

225 230 235 240

Trp Asn Gly Lys Tyr Ile Thr Ser Asn Ile Asn Thr Gln Ala Ser Arg

245 250 255

Ser Gly Ile Asp Leu Asp Ser Val Leu Gly Ser Ile His Thr Phe Asp

260 265 270

Pro Glu Ala Ala Cys Asp Asp Ala Thr Phe Gln Pro Cys Ser Ala Arg

275 280 285

Ala Leu Ala Asn His Lys Val Tyr Val Asp Ser Phe Arg Ser Ile Tyr

290 295 300

Lys Ile Asn Ala Gly Leu Ala Glu Gly Ser Ala Ala Asn Val Gly Arg

305 310 315 320

Tyr Pro Glu Asp Val Tyr Gln Gly Gly Asn Pro Trp Tyr Leu Ala Thr

325 330 335

Leu Gly Ala Ser Glu Leu Leu Tyr Asp Ala Leu Tyr Gln Trp Asp Arg

340 345 350

Leu Gly Lys Leu Glu Val Ser Glu Thr Ser Leu Ser Phe Phe Lys Asp

355 360 365

Phe Asp Ala Thr Val Lys Ile Gly Ser Tyr Ser Arg Asn Ser Lys Thr

370 375 380

Tyr Lys Lys Leu Thr Gln Ser Ile Lys Ser Tyr Ala Asp Gly Phe Ile

385 390 395 400

Gln Leu Val Gln Gln Tyr Thr Pro Ser Asn Gly Ser Leu Ala Glu Gln

405 410 415

Tyr Asp Arg Asn Thr Ala Ala Pro Leu Ser Ala Asn Asp Leu Thr Trp

420 425 430

Ser Phe Ala Ser Phe Leu Thr Ala Thr Gln Arg Arg Asp Ala Val Val

435 440 445

Pro Pro Ser Trp Gly Ala Lys Ser Ala Asn Lys Val Pro Thr Thr Cys

450 455 460

Ser Ala Ser Pro Val Val Gly Thr Tyr Lys Ala Pro Thr Ala Thr Phe

465 470 475 480

Ser Ser Lys Thr Lys Cys Val Pro Ala Lys Asp Ile Val Pro Ile Thr

485 490 495

Phe Tyr Leu Ile Glu Asn Thr Tyr Tyr Gly Glu Asn Val Phe Met Ser

500 505 510

Gly Asn Ile Thr Ala Leu Gly Asn Trp Asp Ala Lys Lys Gly Phe Pro

515 520 525

Leu Thr Ala Asn Leu Tyr Thr Gln Asp Gln Asn Leu Trp Phe Ala Ser

530 535 540

Val Glu Phe Ile Pro Ala Gly Thr Pro Phe Glu Tyr Lys Tyr Tyr Lys

545 550 555 560

Val Glu Pro Asn Gly Asp Ile Thr Trp Glu Lys Gly Pro Asn Arg Val

565 570 575

Phe Val Ala Pro Thr Gly Cys Pro Val Gln Pro His Ser Asn Asp Val

580 585 590

Trp Gln Phe

595

<210> 11

<211> 424

<212> PRT

<213> 嗜热高温球菌

<400> 11

Met Glu Phe Asn Lys Val Phe Ser Leu Leu Leu Val Phe Val Val Leu

1 5 10 15

Gly Ala Thr Ala Gly Ile Val Gly Ala Val Ser Ala Glu Lys Val Arg

20 25 30

Val Ile Ile Thr Ile Asp Lys Asp Phe Asn Glu Asn Ser Val Phe Ala

35 40 45

Leu Gly Gly Asn Val Val Ala Arg Gly Lys Val Phe Pro Ile Val Ile

50 55 60

Ala Glu Leu Ser Pro Arg Ala Val Glu Arg Leu Lys Asn Ala Lys Gly

65 70 75 80

Val Val Arg Val Glu Tyr Asp Ala Glu Val Gln Val Leu Lys Gly Lys

85 90 95

Ser Pro Gly Ala Gly Lys Pro Lys Pro Ser Gln Pro Ala Gln Thr Ile

100 105 110

Pro Trp Gly Ile Glu Arg Ile Lys Ala Pro Asp Val Trp Ser Ile Thr

115 120 125

Asp Gly Ser Ser Ser Gly Val Ile Glu Val Ala Ile Leu Asp Thr Gly

130 135 140

Ile Asp Tyr Asp His Pro Asp Leu Ala Ala Asn Leu Ala Trp Gly Val

145 150 155 160

Ser Val Leu Arg Gly Lys Val Ser Thr Lys Pro Lys Asp Tyr Lys Asp

165 170 175

Gln Asn Gly His Gly Thr His Val Ala Gly Thr Val Ala Ala Leu Asn

180 185 190

Asn Asp Ile Gly Val Val Gly Val Ala Pro Ala Val Glu Ile Tyr Ala

195 200 205

Val Arg Val Leu Asp Ala Ser Gly Arg Gly Ser Tyr Ser Asp Ile Ile

210 215 220

Leu Gly Ile Glu Gln Ala Leu Leu Gly Pro Asp Gly Val Leu Asp Ser

225 230 235 240

Asp Gly Asp Gly Ile Ile Val Gly Asp Pro Asp Asp Asp Ala Ala Glu

245 250 255

Val Ile Ser Met Ser Leu Gly Gly Leu Ser Asp Val Gln Ala Phe His

260 265 270

Asp Ala Ile Ile Glu Ala Tyr Asn Tyr Gly Val Val Ile Val Ala Ala

275 280 285

Ser Gly Asn Glu Gly Ala Ser Ser Pro Ser Tyr Pro Ala Ala Tyr Pro

290 295 300

Glu Val Ile Ala Val Gly Ala Thr Asp Val Asn Asp Gln Val Pro Trp

305 310 315 320

Trp Ser Asn Arg Gly Val Glu Val Ser Ala Pro Gly Val Asp Val Leu

325 330 335

Ser Thr Tyr Pro Asp Asp Ser Tyr Glu Thr Leu Ser Gly Thr Ser Met

340 345 350

Ala Thr Pro His Val Ser Gly Val Val Ala Leu Ile Gln Ala Ala Tyr

355 360 365

Tyr Asn Lys Tyr Gly Ser Val Leu Pro Val Gly Thr Phe Asp Asp Asn

370 375 380

Thr Met Ser Thr Val Arg Gly Ile Leu His Ile Thr Ala Asp Asp Leu

385 390 395 400

Gly Ser Ser Gly Trp Asp Ala Asp Tyr Gly Tyr Gly Ile Val Arg Ala

405 410 415

Asp Leu Ala Val Gln Ala Val Asn

420

Claims

(b)多肽，该多肽由以下多核苷酸编码，该多核苷酸在非常高严格条件下与(i)SEQ IDNO:1的成熟多肽编码序列，(ii)(i)或(ii)的全长互补序列杂交；

(c)多肽，该多肽由以下多核苷酸编码，该多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％序列同一性；

(d)(a)、(b)、(c)或(d)的多肽的片段，该片段具有蛋白酶活性。

2.如权利要求1所述的多肽，其中该成熟多肽是SEQ ID NO:2的氨基酸102至422。

3.一种多核苷酸，该多核苷酸编码如权利要求1-2中任一项所述的多肽。

4.一种核酸构建体或重组表达载体，该核酸构建体或重组表达载体包含如权利要求3所述的多核苷酸，该多核苷酸可操作地连接至指导该多肽在表达宿主中的产生的一个或多个异源控制序列。

5.一种重组宿主细胞，该重组宿主细胞包含如权利要求3所述的多核苷酸，该多核苷酸可操作地连接至指导该多肽的产生的一个或多个异源控制序列。

6.一种产生具有蛋白酶活性的多肽的方法，该方法包括(a)在有益于产生该多肽的条件下培养如权利要求5所述的宿主细胞，和(b)任选地回收该多肽。

7.一种用于液化含淀粉材料的方法，该方法包括在至少α-淀粉酶和S8A减硫高温球菌蛋白酶的存在下，在高于初始糊化温度的温度，液化该含淀粉材料。

8.一种用于由含淀粉材料生产发酵产物的方法，该方法包括以下步骤：

-α-淀粉酶；和

-S8A减硫高温球菌蛋白酶；

b)使用葡糖淀粉酶进行糖化；

c)使用发酵生物进行发酵。

9.一种通过如权利要求8所述的方法从发酵产物生产中回收油的方法，该方法进一步包括以下步骤：

d)回收该发酵产物以形成全酒糟；

e)将该全酒糟分离为酒糟水和湿饼；

f)任选地将该酒糟水浓缩为浆体；

其中从以下各项中回收油：

-在如权利要求8所述的方法的步骤a)之后液化的含淀粉材料；和/或

-如权利要求8所述的方法的发酵步骤c)的下游。

10.如权利要求8-9中任一项所述的方法，其中在液化中存在和/或添加从1至50微克、特别地是从2至40微克、特别地是从4至25微克、特别地是从5至20微克减硫高温球菌S8A蛋白酶/克DS。

11.如权利要求8-10中任一项所述的方法，其中该减硫高温球菌蛋白酶选自：

a)多肽，该多肽包含SEQ ID NO:2的氨基酸102至422或由其组成；或

12.如实施例8-11中任一项所述的方法，其中该发酵产物是醇，优选乙醇，尤其是燃料乙醇、饮用乙醇和/或工业乙醇。

13.一种酶组合物，该酶组合物包含如权利要求1-2中任一项所述的S8A蛋白酶。

14.如权利要求13所述的酶组合物，该酶组合物进一步包含α-淀粉酶。

15.减硫高温球菌S8A蛋白酶在液化含淀粉材料中的用途。