CN101035898A

CN101035898A - 具有肌醇六磷酸酶活性的多肽和编码它的多核苷酸

Info

Publication number: CN101035898A
Application number: CNA2005800338182A
Authority: CN
Inventors: 莫尼卡·塔卡米娅; 卡斯滕·肖霍尔姆
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2004-10-04
Filing date: 2005-10-04
Publication date: 2007-09-12

Abstract

本发明涉及来源于无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)、Citrobacter gillenii的柠檬酸细菌肌醇六磷酸酶和有关的肌醇六磷酸酶。肌醇六磷酸酶属于酸性组氨酸磷酸酶家族，具有酸稳定性，预期具有高比活性。本发明也涉及相应的DNA、生产该肌醇六磷酸酶的重组和野生型方式，以及其用途，特别是在动物饲料中的用途。

Description

具有肌醇六磷酸酶活性的多肽和编码它的多核苷酸

发明背景

发明领域

本发明涉及具有肌醇六磷酸酶活性的分离的多肽和编码该多肽的分离的多核苷酸。多肽与来源于无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)和Citrobacter gillenii的柠檬酸细菌属(Citrobacter)肌醇六磷酸酶有关，他们的氨基酸序列在附加的序列表显示为SEQ ID NOs：4和6。发明也涉及包含多核苷酸的核酸构建体、载体和宿主细胞，以及生产和使用该多肽的方法，特别是在动物饲料中使用多肽。

相关技术描述

肌醇六磷酸酶(phytase)是公知的酶，他们具有添加到动物食品，包括人食品中的优点。已经从许多来源，包括许多真菌和细菌菌株中分离出肌醇六磷酸酶。

已知大肠杆菌的酸性组氨酸磷酸酶appA和其他革兰氏阴性细菌肌醇六磷酸酶具有高比活性。

Kim等在Biotechnology Letters 25：1231-1234，2003中报道了布氏柠檬酸杆菌(Citrobacter braakii)YH-15生产胞内肌醇六磷酸酶的情况。KR-2004-A-045267和WO-2004/085638中以SEQ ID NO：7公开了来自保藏号为KCCM 10427的布氏柠檬酸杆菌(Citrobacter braakii)YH-15的肌醇六磷酸酶的氨基酸序列。WO-2004/085638的公开日是2004年7月10日，即是在本申请的第一个优先权日之后公开的。

提供具有肌醇六磷酸酶活性的可选择的多肽和编码该多肽的多核苷酸是本发明的一目的。本发明的多肽优选具有被改变的特性，更优选具有改进的特性，例如不同的底物特异性、更高的比活性(specific activity)、增加的稳定性(例如酸稳定性、热稳定性和/或蛋白酶稳定性，特别是胃蛋白酶稳定性)、改变的pH最适条件(例如，更低或更高的pH最适条件)，和/或在动物饲料中改善的性能(例如，改善的肌醇六磷酸盐的释放和/或降解)。

发明概述

本发明涉及从由：(a)具有与(i)SEQ ID NO：2的氨基酸1-409、(ii)SEQID NO：2的成熟多肽部分、(iii)SEQ ID NO：4的氨基酸1-410、(iv)SEQ IDNO：4的成熟多肽部分、(v)SEQ ID NO：6的氨基酸1-414、和/或(vi)SEQ IDNO：6的成熟多肽部分有至少75％同一性的氨基酸序列的多肽；(b)至少在中等严谨条件下与(i)SEQ ID NO：1的核苷酸67-1293、(ii)SEQ ID NO：1的成熟多肽编码部分、(iii)SEQ ID NO：3的核苷酸67-1296、(iv)SEQ ID NO：3的成熟多肽编码部分、(v)SEQ ID NO：5的核苷酸67-1308、(vi)SEQ ID NO：5的成熟多肽编码部分、和/或(vii)(i)、(ii)、(iii)、(iv)、(v)或(vi)任何一项的互补链杂交的多核苷酸编码的多肽；(c)包含一个或多个氨基酸保守取代、缺失和/或插入的(a)(i)-(a)(vi)的任何一个多肽的变体；和(d)(a)(i)-(a)(vi)的任何一个多肽的片段组成的组中选择出来的具有肌醇六磷酸酶活性的多肽。

本发明也涉及编码具有肌醇六磷酸酶活性的多肽的分离的多核苷酸，其选自：(a)编码具有与(i)SEQ ID NO：2的氨基酸1-409、(ii) SEQ ID NO：4的氨基酸1-410、和/或(iii)SEQ ID NO：6的氨基酸1-414中的任何一个有至少75％同一性的氨基酸序列的多肽的多核苷酸；(b)与(i)SEQ ID NO：1的核苷酸67-1293、(ii)SEQ ID NO：3的核苷酸67-1296、和/或(iii)SEQ ID NO：5的氨基酸67-1308中的任何一个有至少75％同一性的多核苷酸；(c)至少在中等严谨条件下与(i)SEQ ID NO：1的核苷酸67-1293、(ii)SEQ ID NO：1的成熟多肽编码部分、(iii)SEQ ID NO：3的核苷酸67-1296、(iv)SEQ ID NO：3的成熟多肽编码部分、(v)SEQ ID NO：5的核苷酸67-1308、(vi)SEQ ID NO：5的成熟多肽编码部分、和/或(vii)(i)、(ii)、(iii)、(iv)、(v)或(vi)任何一项的互补链杂交的多核苷酸。

本发明也涉及包含该多核苷酸的核酸构建体、重组表达载体和重组宿主细胞。

本发明也涉及生产这种具有肌醇六磷酸酶活性的多肽的方法，包括(a)在有助于生产这种多肽的条件下培养包含含有编码该多肽的多核苷酸的核酸构建体的重组宿主细胞；和(b)回收多肽。

本发明也涉及在动物饲料，以及包含该多肽的动物饲料和动物饲料添加剂组合物中使用本发明的多肽的方法。

本发明更进一步地涉及包含操作性地与编码信号肽的核苷酸序列相连的编码蛋白质的基因的核酸构建体，其中信号肽由(i)SEQ ID NO：1的核苷酸1-66，(ii)SEQ ID NO：3的核苷酸1-66，或(iii)SEQ ID NO：5的核苷酸1-66组成，基因与核苷酸序列异源。

定义

肌醇六磷酸酶活性：在本发明的上下文中具有肌醇六磷酸酶活性的多肽(肌醇六磷酸酶)是催化肌醇六磷酸盐(肌醇六磷酸盐(myo-inositol hexakis-phosphate))水解成(1)肌醇和/或(2)它的单、二、三、四和/或五磷酸盐和(3)无机磷酸盐的酶。

互联网上的ENZYME网址(http://www.expasy.ch/enzyme/)是酶术语有关信息的贮藏处。它主要以国际生物化学和分子生物联合会(IUB-MB)学术委员会(Nomenclature Committee)的推荐为基础，描述了已经提供EC(酶委员会)编号的每种酶的特性(Bairoch A.The ENZYME database，2000，Nucleic Acids Res 28：304-305)。也可见参见来自NC-IUBMB，1992的酶术语手册。

根据ENZYME网址可知三种不同类型的肌醇六磷酸酶已经已知。3-肌醇六磷酸酶(肌醇六磷酸盐(myo-inositol hexaphosphate)3-磷酸水解酶，EC3.1.3.8)、6-肌醇六磷酸酶(肌醇六磷酸盐6-磷酸水解酶，EC3.1.3.26)，和5-肌醇六磷酸酶(EC3.1.3.72)。对本发明来说，上述所有类型的肌醇六磷酸酶都包含在肌醇六磷酸酶的定义中。

在特定实施方案中，本发明的肌醇六磷酸酶属于包含大肠杆菌pH2.5酸性磷酸酶(基因appA)和真菌肌醇六磷酸酶，例如泡盛曲霉(Aspergillusawamorii)肌醇六磷酸酶A和B(EC：3.1.3.8)(基因phyA和phyB)的酸性组氨酸磷酸酶家族。组氨酸酸性磷酸酶共有两个序列相似区域，每个区域都以保守的组氨酸残基为中心。这两个组氨酸可能与酶的催化机制有关。第一个组氨酸位于N-末端部分，形成磷-组氨酸中间物，而第二个组氨酸位于C末端部分，可能作为质子供体起作用。

在更进一步的特定实施方案中，本发明的肌醇六磷酸酶具有保守的活性部位基序，即R-H-G-X-R-X-P，其中X指任一氨基酸(参见SEQ ID NO：2的氨基酸16-22，SEQ ID NO：4的氨基酸16-22和SEQ ID NO：6的氨基酸16-22)。

在本发明中以FYT为单位确定肌醇六磷酸酶的活性，一个FYT是每分钟，在下列条件下：pH5.5；温度37℃；底物：浓度为0.0050mol/l的肌醇六磷酸钠(C₆H₆O₂₄P₆Na₁₂)下释放1微摩尔无机正磷酸盐的酶含量。适当的肌醇六磷酸酶测定是WO00/20569的实施例1中描述的FYT和FTU测定。FTU用于确定饲料和预混合料(premix)中的肌醇六磷酸酶活性。也可以利用此处实施例4中的肌醇六磷酸酶测定确定肌醇六磷酸酶活性。

通过在各种不同的pH值，用浓度预先确定的底物和固定的孵育温度孵育肌醇六磷酸酶来确定本发明多肽的pH最适条件。从肌醇六磷酸酶活性对pH的图表确定pH-最适条件。在特定实施方案中使用了FYT测定，即底物是5mM肌醇六磷酸钠，反应温度为37℃，利用适当的缓冲液，确定各个不同的pH值，例如pH2-12的范围内以FYT单位计的活性。100mM琥珀酸、100mM HEPES、100mM CHES、100mM CABS、1mM CaCl₂、150mM KCl、用HCl或NaOH将pH值调节为2.0、2.5、3.0、3.5、4.0、5.0、6.0、7.0、8.0、9.0、10.0、11.0和12.0的0.01％Triton X-100。在另一个特定实施方案中使用了实施例4中的肌醇六磷酸酶测定，即底物是溶于具有目的pH值的缓冲液(例如上述的缓冲液)中的0.5mM，优选5mM的肌醇六磷酸钠，通过与钼酸盐/铁的络合作用和750nm处的光密度测量确定可溶的磷酸盐。Blind：混合20ul样品、100ul底物和120ul显色试剂(color reagent)，37℃孵育5分钟，在750nm处测量OD_Blind。样品：混合20ul样品、100ul底物，37℃孵育30分钟，添加120ul显色试剂，37℃孵育5分钟，在750nm处测量OD_样品。测量的肌醇六磷酸酶的活性为OD＝OD_样品-OD_Blind。相对低的pH-最适条件指低于pH5.0，例如低于pH4.5、4.0、3.5、3.0、2.5，甚至低于2.0的pH-最适条件。相对高的pH-最适条件指高于pH5.0，例如高于pH5.5、6.0、6.5、7.0、7.5、8.0、8.5，甚至高于9.0的pH-最适条件。

分离的多肽：这里使用的术语″分离的多肽″指通过SDS-PAGE确定时，纯度为至少20％，优选至少40％，更优选至少60％，甚至更加优选至少80％，最优选至少90％，甚至最优选至少95％的多肽。

基本上纯的多肽：术语″基本上纯的多肽(substantially purepolypeptide)″在这里表示按重量计算包含最多10％、优选最多8％、更优选最多6％、更优选最多5％、更优选最多4％、最多3％、更加优选最多2％、最优选最多1％，甚至最优选最多0.5％的与多肽天然关联的(nativelyassociated)其他多肽材料的多肽制剂。因此基本上纯的多肽优选是制品中存在按总多肽材料重量计算，纯度为至少92％，优选为至少94％，更优选为至少95％，更优选为至少96％，更优选为至少96％，更优选为至少97％，更优选为至少98％、甚至更加优选为至少99％，最优选为至少99.5％，甚至最优选为100％的多肽。

本发明的多肽优选是基本上纯的形式。特别优选″本质上(essentially)纯的形式″的多肽，即本质上不含与多肽天然关联的其他多肽材料的多肽制品。例如，通过利用众所周知的重组方法或通过典型的提纯法制备多肽可以实现这一目的。

在这里，术语″基本上纯的多肽″与术语″分离的多肽″和″分离形式的多肽″同义。

同一性：用参数″同一性″来描述两个氨基酸序列或两个核苷酸序列之间的相关联关系。

在本发明中，通过程序″align″来确定两个氨基酸序列，以及两个核苷酸序列之间的同一性程度，″align″是可用于蛋白质和DNA比对的Needleman-Wunsch比对(即总体比对)。默认得分模型(matrix)BLOSUM50和默认同一性模型分别用于蛋白质和DNA比对。蛋白质比对时缺口(gap)中的第一个残基计罚分-12，DNA比对时计罚分-16。蛋白质比对时缺口中的附加残基计罚分-2，DNA比对时计罚分-4。

″Align″是FASTA程序包版本v20u6的一部分(参见W.R.Pearson and D.J.Lipman(1988)，″Improved Tools for Biological Sequence Analysis″，PNAS85：2444-2448和W.R.Pearson(1990)″Rapid and Sensitive SequenceComparison with FASTP and FASTA，″Methods in Enzymology 183：63-98)。FASTA蛋白质比对使用对缺口大小没有限制的Smith-Waterman算法(参见″Smith-Waterman algorithm″，T.F.Smith and M.S.Waterman(1981)J.Mol.Biol.147：195-197)。

Needleman，S.B.and Wunsch，C.D.，(1970)，Journal of Molecular Biology，48：443-453中描述了Needleman-Wunsch算法，Myers and W.Miller在″Optimal Alignments in Linear Space″CABIOS(生命科学中的计算机应用)(1988)4：11-17中描述了align程序。

也可以按照如下描述确定靶(或样品或测试)序列和规定序列(例如SEQID NO：2的氨基酸1-409)之间的同一性程度：利用程序″align″比对序列。确定比对中完全匹配的数目(″N-完全-匹配″)(完全匹配指比对时相同位置有相同的氨基酸残基，在比对中通常被指定为″|″)。确定规定序列的长度(氨基酸残基数目)(″N-规定(N-specified)″，在上述实施方案中＝411)。″N-完全匹配″和″N-规定″之间的比例计算为同一性程度(为了转化成百分比同一性，可以乘以100)。

在可选择的实施方案中，也可以按照如下描述确定靶(或样品或测试)序列和规定序列(例如SEQ ID NO：2的氨基酸1-409)之间的同一性程度：利用程序″align″比对这两个序列。确定比对中完全匹配的数目(″N-完全-匹配″)(完全匹配指比对时相同位置有相同的氨基酸残基，在比对中通常被指定为″|″)。并确定两个比对序列的共有长度，即比对重叠部分的氨基酸总数(″N-重叠″)。″N-完全匹配″和″N-重叠(N-overlap)″之间的比例计算为同一性程度(为了转化成百分比同一性，可以乘以100)。在一个实施方案中，如果有缺口，N-重叠包括比对产生的追踪和导向缺口。在另一个实施方案中，如果有缺口，N-重叠排除了比对产生的追踪(trailing)和导向缺口(leading gaps)。

在另一个可选择的实施方案中，也可以按照如下描述确定靶(或样品或测试)序列和规定序列(例如SEQ ID NO：2的氨基酸1-409)之间的同一性程度：利用程序″align″比对序列。确定比对中完全匹配的数目(″N-完全-匹配″)(完全匹配指比对时相同位置有相同的氨基酸残基，在比对中通常被指定为″|″)。确定目标序列的长度(氨基酸残基数目)(″N-靶″)。″N-完全匹配″和″N-靶″之间的比例计算为同一性程度(为了转化成百分比同一性，可以乘以100)。

重叠优选是规定序列(specified sequence)的至少20％(上文限定的″N-重叠″除以规定序列的氨基酸数目(″N-规定″)并乘以100)，更优选是至少25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％或至少95％。这意味着当样品序列与规定序列进行比对时，规定序列至少20％(优选25-95％)的氨基酸包含在重叠中。

在可选择的方案中，重叠是靶(或样品或测试)序列的至少20％(上文限定的″N-重叠″除以上文限定的″N-靶″并乘以100)，更优选是至少25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％或至少95％。这意味着当与规定序列进行比对时，目标序列至少20％(优选25-95％)的氨基酸包含在重叠中。

多肽片段：术语″多肽片段″在这里限定为在SEQ ID NO：2、SEQ IDNO：4、SEQ ID NO：6或这些序列中任何同源序列的成熟肽部分的氨基和/或羧基末端缺失一个或多个氨基酸的多肽，其中片段具有肌醇六磷酸酶活性。在特定的实施方案中，片段包含至少350、360、370、380、390、400、405或至少410个氨基酸残基。

子序列：术语″子序列″在这里限定为在SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5或这些序列中任何一个的同源序列的成熟肽编码部分的5′和/或3′末端缺失一个或多个核苷酸的核苷酸序列，其中子序列编码具有肌醇六磷酸酶活性的多肽片段。在特定的实施方案中，子序列包含至少1050、1080、1110、1140、1170、1200、1215或至少1230个核苷酸。

等位基因变体：术语″等位基因变体″在此处表示基因的两种或更多种可选择形式中的任何一种，其占据相同的染色体位点。等位基因变异由天然的突变引起，在群体中会产生多态性。基因突变可以是沉默突变(编码的多肽没有变化)或者可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。

基本上纯的多核苷酸：这里使用的术语″基本上纯的多核苷酸″指不含其他外来核苷酸或不需要的核苷酸，以适合于在遗传工程蛋白质生产系统中使用的形式存在的多核苷酸制品。因此，基本上纯的多核苷酸按重量计算包含最多10％、优选最多8％、更优选最多6％、更优选最多5％、更优选最多4％、更优选最多3％、更加优选最多2％、最优选最多1％，甚至最优选最多0.5％的与多核苷酸天然关联的其他多核苷酸物质。但是，基本上纯的多核苷酸可以包括天然存在的5′和3′非翻译区，例如启动子和终止子。基本上纯的多核苷酸优选是按重量计算纯度为至少90％，优选为至少92％，优选为至少94％，更优选为至少95％，更优选为至少96％，更优选为至少97％，更加优选为至少98％、最优选为至少99％，甚至最优选为至少99.5％的多核苷酸。本发明的多核苷酸优选是基本上纯的形式。这里公开的多核苷酸特别优选是″本质上纯的形式(essentially pure form)″，即本质上(essentially)不含与多核苷酸天然关联的其他多核苷酸物质的多核苷酸制品。在这里，术语″基本上纯的多核苷酸″与术语″分离的多核苷酸″和″分离形式的多核苷酸″同义。多核苷酸可以是基因组、cDNA、RNA、半合成来源，合成来源或他们的任何组合。

核酸构建体：这里使用的术语″核酸构建体″指分离自天然存在基因或以不存在于自然界的方式修饰的包含核酸片段的单链或双链核酸分子。当核酸构建体包含表达本发明的编码序列需要的控制序列时，术语核酸构建体与术语″表达盒″同义。

控制序列：术语″控制序列″在这里限定为包括编码本发明的多肽的多核苷酸表达必需的或对表达有利的所有组件。每个控制序列可能是编码多肽的核苷酸序列与生俱来的或与编码多肽的核苷酸序列异源。这种控制序列包括，但不局限于引导序列，多腺苷酸化序列，前肽序列，启动子，信号肽序列和转录终止子。控制序列至少包括启动子转录和翻译终止信号。可以用接头来提供控制序列，这样可以引入特异的限制性内切位点，便于将控制序列与编码多肽的核苷酸序列的编码区连接。

操作性连接：术语″操作性连接″在这里表示为控制序列位于多核苷酸序列的编码序列的相对适当的位置，从而使控制序列能指导多肽编码序列表达的构型。

编码序列：这里使用的术语″编码序列″指直接规定它的蛋白质产物的氨基酸序列的核苷酸序列。通常通过开放阅读框确定编码序列的界线，通过开始于ATG起始密码子或替换的起始密码子，例如GTG和TTG。编码序列可以是DNA、cDNA或重组核苷酸序列。

成熟多肽部分：这里使用的术语″成熟多肽部分″或″成熟肽部分″指包含编码多肽的多核苷酸作为它的部分遗传物质(equipment)的细胞分泌的多肽部分。换句话说，成熟多肽部分指在信号肽部分实现了指导编码的多肽进入细胞分泌路径后，切除信号肽部分保留的多肽部分。SEQ ID NO：2、SEQ ID NO：4和SEQ ID NO：6的预计的信号肽部分是它们的氨基酸-22到-1，这意味着SEQ ID NO：2、4和6的预计的成熟多肽部分分别相当于氨基酸1-409、1-410和1-414。但是从宿主细胞到宿主细胞有可能会发生一些轻微的变异，因此优选表达的成熟多肽部分。

成熟多肽编码部分：这里使用的术语″成熟多肽编码部分″或″成熟多肽编码序列″指编码多肽的多核苷酸的编码成熟多肽部分的那部分。例如，SEQID NO：1、SEQ ID NO：3和SEQ ID NO：5的预计的成熟多肽编码部分分别相当于它们的核苷酸67-1293、67-1296和67-1308(分别编码SEQ ID NO：2的氨基酸1-409、SEQ ID NO：4的氨基酸1-410和SEQ ID NO：6的氨基酸1-414)。

表达：术语″表达″包括涉及生产多肽的任何步骤，包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。

表达载体：术语″表达载体″在这里限定为包含编码本发明的多肽的多核苷酸的线性或环状DNA分子，其中多核苷酸操作性地与供其表达的附加核苷酸连接。

宿主细胞：这里使用的术语″宿主细胞″包括对用包含本发明的多核苷酸的核酸构建体进行的转化、转染、转导等易感的任何细胞类型。

修饰：术语″修饰″在这里指由SEQ ID NO：2的氨基酸1-409、SEQ IDNO：4的氨基酸1-410、SEQ ID NO：6的氨基酸1-414组成的多肽的任何化学修饰，以及编码这些多肽的DNA的遗传操作。修饰可以是氨基酸的取代、缺失和/或插入，以及氨基酸侧链的替换。

人工变体：这里使用的术语″人工变体″指表达SEQ ID NO：1、SEQ IDNO：3或SEQ ID NO：5的修饰的核苷酸序列的生物体产生的具有肌醇六磷酸酶活性的多肽。通过人工干预修饰SEQ ID NOs：1、3和5中公开的核苷酸序列可以获取修饰的核苷酸序列。

发明详述

具有肌醇六磷酸酶活性的多肽

第一方面，本发明涉及具有与SEQ ID NO：2的氨基酸1-409、SEQ IDNO：4的氨基酸1-410或SEQ ID NO：6的氨基酸1-414(即成熟多肽)有至少75％同一性的氨基酸序列的有肌醇六磷酸酶活性的分离多肽(在下文中称为″同源多肽″)。在特定实施方案中，同一性程度是至少76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或至少99％。

在其他特定实施方案中，同源多肽具有与SEQ ID NO：2的氨基酸1-409、SEQ ID NO：4的氨基酸1-410和SEQ ID NO：6的氨基酸1-414中的任何一个相差二十、十八、十六、十四、十二、十个、八个、六个、五个、四个、三个、两个或一个氨基酸的氨基酸序列。

在可选择的实施方案中，与SEQ ID NO：2的氨基酸1-409、SEQ ID NO：4的氨基酸1-410或SEQ ID NO：6的氨基酸1-414(即成熟多肽)的同一性程度是至少60、62、65、66、68、70、71、72、73或至少74％。

在特定实施方案中，本发明的多肽包含SEQ ID NOs：2、4或6的氨基酸序列或其等位基因变体；或其具有肌醇六磷酸酶活性的片段。在更进一步的特定实施方案中，多肽包含SEQ ID NO：2的氨基酸1-409、SEQ ID NO：4的氨基酸1-410或SEQ ID NO：6的氨基酸1-414或其等位基因变体；或其具有肌醇六磷酸酶活性的片段。

第二方面，本发明涉及具有肌醇六磷酸酶活性的由在至少中等严谨条件下，优选中等严谨条件下与(i)SEQ ID NO：1的核苷酸67-1293、SEQ IDNO：3的核苷酸67-1296或SEQ ID NO：5的核苷酸67-1308；(ii)SEQ ID NOs：1、3或5的成熟多肽编码部分；和/或(iii)(i)、(ii)任何一项的互补链；和/或(iv)(i)、(ii)或(iii)的子序列杂交的多核苷酸编码的分离多肽(J.Sambrook，E.F.Fritsch，and T.Maniatus，1989，Molecular Cloning，A Laboratory Manual，2d edition，Cold Spring Harbor，New York)。SEQ ID NO：1、3或5的子序列包含至少100个连续的核苷酸，或者优选包含至少200个连续的核苷酸。而且，子序列可以编码具有肌醇六磷酸酶活性的多肽片段。

在特定实施方案中，杂交可以发生在至少中等-高，至少高或至少很高的严谨条件下；优选发生在中等-高，高或很高的严谨条件下。

在可选择的实施方案中，可在很低或低严谨条件下实施杂交。

SEQ ID NO：1、3或5的核苷酸序列，这些序列中的任何序列的子序列，以及SEQ ID NO：2、4或6的氨基酸序列可以用来设计核酸探针，利用本领域众所周知的方法，可以用设计的核酸探针从不同属或种的菌株中鉴定和克隆编码具有肌醇六磷酸酶活性的多肽的DNA。特别地，为了鉴定和分离目的属或种的对应基因，可按照标准的Southern印迹方法将这种探针与目的属或种的基因组或cDNA进行杂交。这种探针可大大短于全长序列，但其长度应该是至少14，优选至少25，更优选至少35，最优选至少70个核苷酸。但是这种核酸探针的长度优选是至少100个核苷酸。例如：这核酸探针的长度可以是至少200个核苷酸、优选是至少300个核苷酸、更优选是至少400个核苷酸、最优选是至少500个核苷酸。可以使用更长的探针，例如，长度是至少600个核苷酸、优选是至少700个核苷酸、更优选是至少800个核苷酸、最优选是至少900个核苷酸的核酸探针。DNA和RNA探针都可以使用。为了检测对应基因，典型地需要对探针进行标记(例如：用³²P、³H、³⁵S、生物素或抗生物素蛋白进行标记)。这种探针也包括在本发明的范围内。

因此可以筛选从其他的这种生物体中制备的基因组DNA库中的与如上所述的探针杂交的编码具有肌醇六磷酸酶活性的多肽的DNA。通过琼脂糖或聚丙烯酰胺凝胶电泳，或其他的分离技术可以分离来自其他这种生物体的基因组DNA或其他DNA。来自库的DNA或分离的DNA可以转移并固定到硝酸纤维或其他合适的载体材料上。为了鉴定与SEQ ID NO：1、3或5，或这些序列中任何一个序列的子序列同源的克隆或DNA，可以在Southern印迹中使用载体材料。

在本发明中，杂交表明核苷酸序列在很低到很高的严谨条件下与标记的核酸探针杂交，其中核酸探针相应于SEQ ID NO：1、3和/或5显示的核苷酸序列，他们的互补链或子序列。可以使用X线胶片检测在这些条件下与核酸探针杂交的分子。

在特定实施方案中，核酸探针是SEQ ID NOs：1、3、5或7-18中的任何一个。在另一个特定实施方案中，核酸探针是SEQ ID NO：1、3或5的核苷酸67-450、核苷酸450-900或核苷酸900-1293的互补链。在更进一步的特定实施方案中，核酸探针是编码SEQ ID NO：2、4或6的多肽或这些多肽中任何一个的子序列的多核苷酸序列。在更进一步的特定实施方案中，核酸探针是SEQ ID NO：1、SEQ ID NO：3或SEQ ID NO：5，特别是他们的成熟多肽编码区。

对长度为至少100个核苷酸的长探针来说，极低-很高严谨条件被定义为按照标准Southern印迹程序于42℃在5X SSPE、0.3％SDS、200ug/ml的剪切和变性的鲑鱼精DNA和甲酰胺中进行预杂交和杂交，其进行最佳12-24个小时，其中极低和低严谨条件的甲酰胺浓度为25％，中等和中-高严谨条件的甲酰胺浓度为35％，高和很高严谨条件的甲酰胺浓度为50％。

对长度为至少100个核苷酸的长探针来说，最后用2X SSC、0.2％SDS在至少45℃(极低严谨条件)、更优选至少50℃(低严谨条件)、更优选至少55℃(中等严谨条件)、更优选至少60℃(中等-高严谨条件)、甚至更优选至少65℃(高严谨条件)、最优选至少70℃(很高的严谨条件)的条件下洗涤载体材料三次，每次15分钟。

对长度为大约15-70个核苷酸的短探针来说，严谨条件被定义为在低于计算的T_m大约5-10℃的条件下，遵循标准的Southern印迹步骤，在0.9MNaCl、0.09M Tris-HCl pH7.6、6mM EDTA、0.5％NP-40、1X Denhardt′s溶液、1mM焦磷酸钠、1mM磷酸二氢钠(sodium monobasic phosphate)、0.1mM ATP和0.2mg酵母RNA/ml中进行预杂交，杂交和杂交后洗涤，其中T_m是依照Bolton和McCarthy(1962，Proceedings of the National Academy ofSciences USA 48：1390)进行计算的。

对长度为大约15-70个核苷酸的短探针来说，在6X SCC加0.1％SDS中洗涤载体一次，洗涤15分钟，并利用6X SSC在低于计算的T_m 5-10℃的条件下洗涤两次，每次15分钟。

在包含盐的杂交条件下，有效的T_m是控制探针和滤膜(filter)结合的DNA之间成功杂交需要的同一性程度的温度。利用下面的分子式确定各种严谨条件下两个DNAs之间杂交需要的同一性程度可以确定有效的T_m。

有效的T_m＝81.5+16.6(log M[Na⁺])+0.41(％G+C)-0.72(％甲酰胺)

(参见www.ndsu.nodak.edu/instruct/mcclean/plsc731/dna/dna6.htm)

″G+C″指探针中G和T核苷酸的含量。例如，中等严谨条件下甲酰胺是35％，5X SSPE的Na⁺浓度是0.75M。

第三方面，本发明涉及具有肌醇六磷酸酶活性和下列物理化学特性(对基本上纯的多肽进行的分析)的分离的多肽：

(i)高比活性，例如，对肌醇六磷酸的比活性为大肠杆菌appA比活性的至少50％(SPTREMBL：Q8GN88)，优选以每毫克肌醇六磷酸酶蛋白质的FYT单位来计量比活性；

(ii)酸稳定性；例如

(a)37℃，在pH2.2的甘氨酸/盐酸缓冲液中孵育过夜后的剩余活性是(relative to)37℃，在pH7.0的HEPES缓冲液中孵育过夜后的残余活性的至少60％、优选至少65％、至少70％，或至少75％；

(b)37℃，在pH3.0的甘氨酸/盐酸缓冲液中孵育过夜后的剩余活性是37℃，在pH7.0的HEPES缓冲液中孵育过夜后的残余活性的至少80％、优选至少85％、至少90％，或至少95％；和/或

(c)在温度为25、30、35或37℃，优选为37℃，pH为2.2、2.4、2.5、2.6、2.8、3.0、3.2、3.4或3.5，优选pH为2.2或3.0的甘氨酸/盐酸缓冲液中孵育2小时后剩余的肌醇六磷酸酶活性与大肠杆菌appA(SPTREMBL：Q8GN88)的剩余活性相比为至少50％；

(iii)热稳定性，例如，在pH为5.5和温度为55、60、65、70、75、80、85或95℃，优选70℃的条件下孵育0.5、1、1.5或2小时，优选0.5小时后剩余的肌醇六磷酸酶活性与大肠杆菌appA(SPTREMBL：Q8GN88)的剩余活性相比为至少50％；

(iv)蛋白酶稳定性，例如，存在0.1mg/ml的胃蛋白酶时，在温度为20、25、30、35或37℃，优选37℃和pH为5.5的条件下孵育0.5、1、1.5或2小时，优选1小时后剩余的肌醇六磷酸酶活性与大肠杆菌appA(SPTREMBL：Q8GN88)的剩余活性相比为至少50％；和/或

(v)利用上文中描述的FYT测定和/或实施例4中的测定确定的pH-最适条件低于pH5.0，例如低于pH4.5、4.0、3.5、3.0、2.5，甚至低于pH2.0。

在涉及上述(i)的特定实施方案中，比活性是大肠杆菌appA比活性的至少60、70、80、90、100、110、120、130、140，或者至少150％。在涉及上述(ii)-(iv)的特定实施方案中，剩余活性是大肠杆菌appA剩余活性的至少60、70、80、90、100、110、120、130、140，或者至少150％，或者对实施方案(ii)(a)和(ii)(b)来说，其是相对于pH7.0的剩余活性。

第四方面，本发明涉及包含SEQ ID NO：2、4、6或他们的任何成熟多肽的一个或更多个氨基酸的保守取代、缺失和/或插入的人工变体。插入可以发生在分子内，和/或分子的N和/或C末端，当插入发生在末端时也被称为延伸。优选的氨基酸变化是次要(minor)性质的变化，即保守氨基酸替换；小的缺失，典型地缺失1到大约30个氨基酸；小的氨基或羧基末端的延伸，例如氨基末端的甲硫氨酸残基；达到大约20-25个残基的小连接肽；或通过改变净电荷促进纯化或产生另外功能的小延伸，例如多聚组氨酸带(tract)、抗原表位或结合域-换句话说就是不显著影响蛋白质折叠和/或蛋白质活性的变化。

保守替换的实例发生在碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)群组内。

保守替换的其他实例是用非标准氨基酸(例如，4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)替换20个标准氨基酸。保守替换也可以包括对非遗传密码编码的氨基酸和非天然氨基的替换。″非天然氨基酸″是蛋白质合成后已经被修饰的氨基酸，和/或他们的侧链具有不同于标准氨基酸侧链的化学结构。可以化学合成非天然氨基酸，优选从市场上购买，非天然氨基酸包括六氢吡啶羧酸、噻唑烷羧酸、脱氢脯氨酸、3-和4-甲基脯氨酸和3，3-二甲基脯氨酸。

或者，氨基酸变化可以是这种具有改变多肽理化性质特性的变化。例如：氨基酸变化可以改善多肽热稳定性、改变底物特异性和pH最适条件等等。

可以依照本领域已知的方法，例如定位诱变或丙氨酸扫描诱变(Cunningham and Wells，1989，Science 244：1081-1085)鉴定亲代多肽中的必需氨基酸。在近来的技术中，在分子的每个残基处引入单个丙氨酸突变，测定得到的突变分子的生物活性(即肌醇六磷酸酶活性)以鉴定对该分子的活性重要的氨基酸残基。也可参见Hilton et al.，1996，J.Biol.Chem.271：4699-4708。也可以通过诸如核磁共振、晶体学、电子衍射或光亲和性标记这样的技术确定的物理结构分析结合推定的接触部位的氨基酸突变来确定酶的活性部位或其他的生物学相互作用。参见，例如de Vos et al.，1992，Science 255：306-312；Smith et al.，1992，J.Mol.Biol.224：899-904；Wlodaveret al.，1992，FEBS Lett.309：59-64。也可以通过与本发明的多肽有关的多肽的同一性分析推定必需氨基酸的同一性。

利用已知的诱变、重组和/或改组方法，以及随后的相关筛选程序，例如Reidhaar-Olson and Sauer，1988，Science 241：53-57；Bowie and Sauer，1989，Proc.Natl.Acad.Sci.USA 86：2152-2156；WO 95/17413或WO 95/22625公开的方法可以制备和测试单个或多个氨基酸替换。可以使用的其他方法包括易错PCR、噬菌体展示(例如，Lowman et al.，1991，Biochem.30：10832-10837；美国专利No.5,223,409；WO 92/06204)和区域定向诱变(Derbyshire et al.，1986，Gene 46：145；Ner et al.，1988，DNA 7：127)。

诱变/改组方法可以与高通量自动筛选方法组合以检测宿主细胞表达的克隆的诱变处理的多肽的活性。可以从宿主细胞中回收编码活性多肽的诱变处理的DNA分子并利用本领域的标准方法对其进行快速测序。这些方法允许快速确定目的多肽中个体氨基酸残基的重要性，而且这适用于结构未知的多肽。

SEQ ID NO：2的氨基酸序列1-409、SEQ ID NO：4的氨基酸序列1-410、SEQ ID NO：6的氨基酸序列1-414中的氨基酸替换(优选保守替换)、缺失和/或插入的总数是最多10个，优选最多9个，更优选最多8个，更优选最多7个，更优选最多6个，更优选最多5个，更优选最多4个，更加优选最多3个，最优选2个，甚至最优选1个。

SEQ ID NO：2的氨基酸1-409、SEQ ID NO：4的氨基酸1-410、SEQ IDNO：6的氨基酸1-414中的氨基酸替换、缺失和/或插入的总数是10个，优选9个，更优选8个，更优选7个，更优选最多6个，更优选最多5个，更优选4个，更加优选3个，最优选2个，甚至最优选1个。或者，SEQ IDNO：2的氨基酸序列1-409、SEQ ID NO：4的氨基酸序列1-410、SEQ ID NO：6的氨基酸序列1-414中的氨基酸替换(优选保守替换)、缺失和/或插入的总数是最多50、45、40、35、30、25、20、19、18、17、16、15、14、13、12或最多11个。

在具体实施方案中，本发明的多肽是设计的暴露给动物，包括人时能引起降低的免疫反应的低过敏性变体。术语免疫反应被理解为暴露给多肽的动物的免疫系统的任何反应。一种免疫反应是导致暴露动物IgE水平增加的变态反应。可以利用本领域已知的技术制备低变应原(allergenic)变体。例如，可以用遮蔽参与免疫反应的多肽部分或表位的聚合物部分结合多肽。与聚合物的结合涉及参照例如，WO96/17929，WO98/30682，WO98/35026和/或WO99/00489的描述在体外将聚合物化学偶合到多肽上。结合可以另外或可选地涉及体内将聚合物偶合到多肽上。通过用基因工程手段操纵编码多肽的核苷酸序列、插入编码多肽中附加糖基化位点的共有序列和在能糖基化多肽的宿主中表达多肽，例如，参见WO00/26354可以实现这种结合。提供低过敏性变体的另一种方法是采用基因工程方法操纵编码多肽的核苷酸序列促使多肽自身寡聚体化，产生的多肽单体可以遮蔽(shield)其他多肽单体的表位，从而能够降低寡聚物的抗原性。例如，在WO96/16177中描述了这种产物和他们的制备过程。通过多种方法，例如WO00/26230和WO01/83559中描述的噬菌体展示方法或EP561907中描述的随机法可以鉴定参与免疫反应的表位。一旦鉴定出表位，就可以通过已知的基因操作技术，例如定位诱变(参见，例如WO00/26230、WO00/26354和/或WO00/22103)改变多肽的氨基酸序列以产生免疫特性改变的多肽，和/或可以在充分接近表位的位置结合聚合物使聚合物遮蔽表位。

具有肌醇六磷酸酶活性的多肽的来源

可以从任何属的微生物中获得本发明的多肽。对本发明来说，这里使用的与约定来源有关的术语″从...获得(obtain from)″指通过该来源或已经插入该来源的核苷酸序列的菌株产生核苷酸序列编码的多肽。在优选方案中，从给定来源获得的多肽被分泌到细胞外。

本发明的多肽可以是细菌多肽。例如：该多肽可以是革兰氏阳性细菌多肽，例如，芽孢杆菌属(Bacillus)多肽或链霉菌属(Streptomyces)多肽或革兰氏阴性细菌多肽，例如，大肠杆菌(Escherichia coli)、耶尔森氏菌属(Yersinia)、克雷伯氏菌属(Klebsiella)、柠檬酸细菌属(Citrobacter)或假单胞菌属(Pseudomonas)多肽。在特定实施方案中，多肽源自于Proteobacteria，例如Gammaproteobacteria，例如Enterobacteriales，例如Enterobacteriaceae。

在特定的方面中，来源于Enterobacteriaceae的多肽是柠檬酸细菌属多肽，例如例如无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)、布氏柠檬酸杆菌(Citrobacter braakii)、法氏柠檬酸杆菌(Citrobacter farmeri)、弗氏柠檬酸杆菌(Citrobacter freundii)、Citrobacter gillenii、中间柠檬酸细菌(Citrobacter intermedius)、差异柠檬酸杆菌(Citrobacter koseri)、Citrobactermurliniae、Citrobacter rodentium、塞氏柠檬酸杆菌(Citrobacter sedlakii)、魏氏柠檬酸杆菌(Citrobacter werkmanii)、杨氏柠檬酸杆菌(Citrobacter youngae)或柠檬酸细菌属种多肽。

在更优选的方案中，多肽是Citrobacter gillenii多肽，最优选是Citrobactergillenii DSM 13694多肽，例如SEQ ID NO：4的多肽。具体菌株公众可以从德意志微生物和细胞培养物保藏中心(Deutsche Sammlung vonMIkroorganismen und Zellkulturen)(DSM)获得。

在另一个更优选的方案中，多肽是无丙二酸柠檬酸杆菌(Citrobacteramalonaticus)多肽，最优选是无丙二酸柠檬酸杆菌(Citrobacteramalonaticus)ATCC 25405或无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25407多肽，例如SEQ ID NO：6的多肽。这些具体菌株公众可以从美国典型培养物保藏中心ATCC获得。

本发明的多肽也可以是真菌多肽，例如，酵母多肽或丝状真菌多肽。

公众很容易从许多菌种保藏单位，例如美国典型培养物保藏中心(American Type Culture Collection)(ATCC)，德意志微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH)(DSM)，真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构保藏中心(Agricultural Research Service Patent CultureCollection，Northern Regional Research Regional Research Center)(NRRL)获得上述微生物菌株。

而且，可以利用上述探针，从包括分离自自然界(例如，土壤、堆肥、水等等)的微生物的其他来源中鉴定和获得这种多肽。从天然生长环境中分离微生物的技术在本领域为大家熟知。然后通过相似的方法筛选另一个微生物的基因组或cDNA库可以获得多核苷酸。一旦用探针检测到编码多肽的多核苷酸序列，就可以利用本领域普通技术人员熟知的技术(参见，例如，Sambrook et al.，1989，上文)分离或克隆多核苷酸。

本发明的多肽也包括其中另一个多肽融合在该多肽或其片段的N末端或C末端的融合多肽或可切割融合多肽。通过将编码另一个多肽的核苷酸序列(或其部分)与本发明的核苷酸序列(或其部分)融合可以制备融合多肽。制备融合多肽的技术在本领域是已知的，包括连接编码多肽的编码序列，这样编码序列就处在阅读框中，融合多肽的表达也受相同启动子和终止子的控制。

多核苷酸

本发明也涉及具有编码本发明的多肽的核苷酸序列的分离的多核苷酸。在优选方案中，核苷酸序列在SEQ ID NO：1、3或5中列出。在另一个优选方案中，核苷酸序列是SEQ ID NO：1、3或5的成熟多肽编码区。本发明也包括因为遗传密码的简并性编码具有SEQ ID NO：2、4或6的氨基酸序列的多肽或这些序列中任何的成熟多肽的分别不同于SEQ ID NO：1、3和5的核苷酸序列。本发明也涉及SEQ ID NO：1、3和5的分别编码SEQ ID NO：2、4或6的具有肌醇六磷酸酶活性的片段的子序列。

本发明也涉及在SEQ ID NO：1、3或5的成熟多肽编码序列中包含至少一个突变的多核苷酸突变体，其中核苷酸序列突变体编码分别由SEQ IDNO：2或4的氨基酸1-409或SEQ ID NO：6的氨基酸1-414组成的多肽。

用于分离或克隆编码多肽的多核苷酸的技术在本领域已经已知，该技术包括从基因组DNA分离、从cDNA制备或他们的组合。例如，通过利用众所周知的聚合酶链反应(PCR)或检测具有共用结构特点的DNA克隆片段的表达库的抗体筛选可以实现从这种基因组DNA中克隆本发明的多核苷酸的目的。例如：参见Innis et al.，1990，PCR：A Guide to Methods and Application，Academic Press，New York。可以使用其他核酸扩增方法，例如连接酶链反应(LCR)、连接活化转录(LAT)和核苷酸序列依赖的扩增(NASBA)。可以从柠檬酸属细菌菌株，或另一种生物体或相关生物体中克隆多核苷酸，因此得到的多核苷酸可以是，例如该核苷酸序列的多肽编码区域的等位基因变体或种变体。

本发明也涉及具有与SEQ ID NO：1、3或5的成熟多肽编码序列(即分别是他们的核苷酸67-1293、67-1296和67-1308)有至少75％同一性的编码具有肌醇六磷酸酶活性的多肽的核苷酸序列的多核苷酸。在特定实施方案中，同一性程度是至少大约76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％。在可选择的实施方案中，同一性程度是至少61％、或至少62％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％或至少74％。

编码本发明的多肽的核苷酸序列的修饰对合成与该多肽基本相似的多肽可能是必需的。术语与该多肽″基本相似″指多肽的非天然发生形式。这些多肽可以在一些加工方式上不同于分离自天然来源的多肽，例如，在比活性、热稳定性、pH最适条件等方面不同的人工变体。以SEQ ID NO：1、3或5的多肽编码区域呈递的核苷酸序列，例如其子序列为基础，和/或通过引入不产生另一个氨基酸序列的核苷酸序列编码的多肽，但相当于为产生该多肽而设计的宿主生物体密码子用法的核苷酸替换，或者通过引入产生不同氨基酸序列的核苷酸替换可以构建变体序列。核苷酸取代的一般说明可以参见，例如Ford et al.，1991，Protein Expression and Purification 2：95-107。

在分子功能关键区外发生的仍然产生活性多肽的这种替换对本领域熟练技术人员来说是显而易见的。依照本领域已知的方法，例如定位诱变或丙氨酸扫描诱变(参见，例如，Cunningham and Wells，1989，Science 2441081-1085)可以鉴定维持本发明的分离多核苷酸编码的多肽的活性必需的优选不经受替换的氨基酸残基。丙氨酸扫描诱变技术是在分子的每个带正电荷的残基处引入突变，测定得到的突变分子的肌醇六磷酸酶活性以鉴定对该分子的活性重要的氨基酸残基。也可以通过象核磁共振分析、晶体照相术或光亲和性标记这样的技术确定的三维结构分析来确定底物多肽相互作用位点(参见，例如de Vos et al.，1992，Science 255：306-312；Smith et al.，1992，J.Mol.Biol.224：899-904；Wlodaver et al.，1992，FEBS Lett.309：59-64)。

本发明也涉及在中等严谨条件下，更优选中-高严谨条件下，更加优选高严谨条件下，最优选非常高的严谨条件下与(i)SEQ ID NO：1的核苷酸67-1293、SEQ ID NO：3的核苷酸67-1296或SEQ ID NO：5的核苷酸67-1308；(ii)SEQ ID NO：1、3或5的成熟多肽编码部分；和/或(iii)(i)和/或(ii)中任何一项的互补链；或这里限定的等位基因变体和子序列(Sambrook etal.，1989，supra)杂交的编码本发明的多肽的分离的多核苷酸。在可选择的实施方案中，可在很低或低严谨条件下实施杂交。

本发明也涉及通过(a)在极低、低、中等、中-高、高或很高的严谨条件下与(i)SEQ ID NO：1的核苷酸67-1293、SEQ ID NO：3的核苷酸67-1296或SEQ ID NO：5的核苷酸67-1308；(ii)SEQ ID NOs：1、3或5的成熟多肽编码部分；和/或(iii)(i)和/或(ii)中任何一项的互补链杂交；和(b)分离杂交的编码具有肌醇六磷酸酶活性的多肽的多核苷酸获得或可获得的分离的多核苷酸。

核酸构建体

本发明也涉及包含操作性地与一个或多个控制序列相连的本发明的分离的多核苷酸的核酸构建体，其中控制序列指导编码序列在控制序列相容的条件下在适当的宿主细胞中表达。

可以用多种方式操纵编码本发明的多肽的分离的多核苷酸，为多肽表达作准备。将多核苷酸序列插入到载体之前操纵多核苷酸序列可能是合乎需要的或必需的，这取决于表达载体。利用重组DNA方法修饰多核苷酸序列的技术为本领域熟知。

控制序列可以是适当的启动子序列，即被表达编码本发明的多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列包含介导多肽表达的转录控制序列。启动子可以是在选择的宿主细胞中显示出转录活性的任何核苷酸序列，包括突变的、截短的和杂种启动子，可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因中获得启动子。

指导本发明的核酸构建体转录，尤其是在细菌宿主细胞中转录的适当启动子的例子有：得自大肠杆菌(E.coli)乳糖(lac)操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核生物β-内酰胺酶基因(Villa-Kamaroff等，1978，Proceedings of the NationalAcademy of Sciences USA 75：3727-3731)的启动子、以及tac启动子(DeBoer等，1983，Proceedings of the National Academy of Sciences USA 80：21-25)。其它启动子描述于“Useful proteins from recombinant bacteria”ScientificAmerican，1980，242：74-94；以及Sambrook等，1989，文献同上。

指导本发明的核酸构建体在丝状真菌宿主细胞中转录的适当启动子的例子有：得自米曲霉(Aspergillus oryzae)TAKA淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶、Fusarium venenatum淀粉葡萄糖苷酶(WO00/5 6900)、Fusarium venenatum Daria(WO00/5 6900)、Fusarium venenatum Quinn(WO00/56900)、尖孢镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO96/00787)、Trichoderma reesiβ-葡糖苷酶、Trichoderma reesei纤维二糖水解酶(cellobiohydrolase)I、Trichoderma reesei葡聚糖内切酶I、Trichoderma reesei葡聚糖内切酶II、Trichoderma reesei葡聚糖内切酶III、Trichoderma reesei葡聚糖内切酶IV、Trichoderma reesei葡聚糖内切酶V、Trichoderma reesei木聚糖酶I、Trichoderma reesei木聚糖酶II、Trichoderma reeseiβ-木糖苷酶基因中获得的启动子和NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的启动子的杂种)；以及突变的、截短的和他们的杂种启动子。

在酵母宿主中有用的启动子是从酿酒酵母烯醇酶(ENO-1)，酿酒酵母半乳糖激酶(GAL1)，酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1，ADH2/GAP)，酿酒酵母磷酸丙糖异构酶(TPI)，酿酒酵母metallothionine(CUP1)和酿酒酵母3-磷酸甘油酸(phosphoglycerate)激酶和巴斯德毕赤氏酵母(Pichia pastoris)醇氧化酶(AOX1)基因中获得的。Romanos etal.，1992，Yeast 8：423-488中描述了适合于酵母宿主细胞的其他有用的启动子。

控制序列也可以是适当的被宿主细胞识别后能终止转录的转录终止序列。终止序列操作性地与编码多肽的核苷酸序列的3′末端相连。在选择的宿主细胞中有功能的任何终止子都可以用于本发明。

对于丝状真菌宿主细胞，优选的终止子得自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、黑曲霉α-葡糖苷酶和尖孢镰孢胰蛋白酶样蛋白酶的基因。

对于酵母宿主细胞，优选的终止子得自酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因。其它用于酵母宿主细胞的终止子描述于Romanos等，1992，文献同上。

控制序列也可以适当的前导序列，前导序列是对宿主细胞进行的翻译很重要的mRNA非翻译区。前导序列操作性地与编码多肽的核苷酸序列的5′末端相连。在选择的宿主细胞中有功能的任何前导序列都可以用于本发明。

适合于丝状真菌宿主细胞的前导序列是从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶基因中获得的。

适合于酵母宿主细胞的适当的前导序列是从酿酒酵母烯醇酶(ENO-1)、酿酒酵母3磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)基因中获得的。

控制序列也可以是操作性地与核苷酸序列的3′末端相连的多腺苷酸化序列，转录时，该序列会作为添加多聚腺苷残基到转录的mRNA上的信号被宿主细胞识别。在选择的宿主细胞中有功能的任何多腺苷酸化序列都可以用于本发明。

适合于丝状真菌宿主细胞的多腺苷酸化序列优选是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶基因中获得的。

Guo and Sherman，1995，Molecular Cellular Biology 15：5983-5990中描述了适合于酵母宿主细胞的有用的多腺苷酸化序列。

控制序列也可以是编码与多肽的氨基末端相连的氨基酸序列和指导编码的多肽进入细胞分泌路径的信号肽编码区。核苷酸序列的编码序列的5′端可以固有地包含在翻译阅读框中天然地与编码分泌多肽的编码区片段连接的信号肽编码区。换句话说，编码序列的5′端可以包含与编码序列异源的信号肽编码区。当编码序列天然地不包含信号肽编码区时，可能需要外来的信号肽编码区。换句话说，外来的信号肽编码区可以简单地替换天然的信号肽编码区以增加多肽的分泌。但是，在本发明中可以使用指导表达的多肽进入选择的宿主细胞的分泌路径的任何信号肽编码区。

适合于细菌宿主细胞的有效的信号肽编码区是从芽孢杆菌属NCIB11837生麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA基因中获得的信号肽编码区。Simonen and Palva，1993，Microbiological Reviews 57：109-137中描述了更进一步的信号肽。

适合于丝状真菌宿主细胞的有效的信号肽编码区是从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米赫根毛霉天冬氨酸蛋白酶、Humicola insolens纤维素酶和Humicola lanuginosa脂肪酶基因中获得的信号肽编码区。

适合于酵母宿主细胞的有用的信号肽是从酿酒酵母α因子和酿酒酵母转化酶基因中获得的。上文的Romanos et al.，1992和Xiong等在Journal ofApplied Microbiology 2005，98，418-428中描述了其他有用的信号肽编码区。

在优选方案中，信号肽编码区是分别编码SEQ ID NO：2、4和6的氨基酸1-22的SEQ ID NO：1、3或5的核苷酸1-66。

控制序列也可以是编码位于多肽氨基末端的氨基酸序列的前肽编码区。合成的多肽被称为原肽或前肽(或者有时被称为酶原)。前肽通常是非活性的，通过从前多肽上催化切割或自身催化切割除去前肽，可以将前多肽转变为成熟的有活性的多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、米赫根毛霉天冬氨酸蛋白酶和Myceliophthora thermophila漆酶(WO95/33836)基因中获得前肽编码区。

当信号肽和前肽区都存在于多肽的氨基末端时，前肽区紧靠着多肽的氨基末端，信号肽区紧靠着前肽的氨基末端。

添加允许相对于宿主细胞的生长调节多肽表达的调节序列也可能是合乎需要的。调节系统的实例是那些使基因响应化学或物理刺激开始或停止表达的调节系统，其中刺激包括存在调节化合物。原核生物系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中可以使用ADH2系统或GAL1系统。在丝状真菌中，TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子可以用作调节序列。调节序列的其他实例是那些允许基因扩增的序列。

表达载体

本发明也涉及包含本发明的多核苷酸、启动子，以及转录和翻译终止信号的重组表达载体。可以将如上所述的各种核酸和控制序列连接在一起产生包含一个或多个方便的限制性内切位点的重组表达载体，其中限制性内切位点允许在该位点插入或替换编码多肽的核苷酸序列。换句话说，通过将核苷酸序列或包含该序列的核酸构建体插入到适当的表达载体中可以表达本发明的核苷酸序列。构建表达载体时，编码序列位于载体中以便使编码序列操作性地与适当的表达控制序列连接。

重组表达载体可以是能方便地经受重组DNA过程和使核苷酸序列表达的任何载体(例如，质粒或病毒)。载体的选择典型地取决于载体与载体被插入其中的宿主细胞的相容性。载体可以是线性质粒或闭合环状质粒。

载体可以是自主复制载体，即作为染色体外实体，例如质粒，染色体外元件，微型染色体或人工染色体存在的载体，这种载体的复制不依赖于染色体复制。载体可以包含任何保证自我复制的工具。换句话说，载体可以是被引入宿主细胞时，能被整合到基因组中并与已经整合它的染色体一起复制的载体。而且，可以使用单个载体或质粒，或者使用共同包含被引入宿主细胞基因组的总DNA的两个或更多个载体或质粒，或转座子。

条件必需基因可以作为非抗生素选择标记。细菌的条件必需非抗生素选择标记的非限制性实例有在缺少D丙氨酸的条件下进行培养时才需要的来自枯草芽孢杆菌、地衣芽孢杆菌或其他芽孢杆菌的dal基因。因此当细胞在存在半乳糖的条件下生长或在产生半乳糖的培养基中生长时，参与UDP半乳糖循环(turnover of UDP-galactose)的酶编码基因可以作为细胞中的条件必需标记起作用。这种基因的非限制性实例有来自枯草芽孢杆菌或地衣芽孢杆菌的UTP-依赖性磷酸化酶(EC2.7.7.10)、UDP-葡萄糖-依赖型尿苷酰转移酶(uridylyltransferase)(EC2.7.7.12)或UDP-半乳糖差向异构酶(EC5.1.3.2)的基因。在含有作为唯一碳源的木糖的基本培养基中生长的细胞中，诸如芽孢杆菌的xylA的木糖异构酶基因也可用作为选择标记。在含有作为唯一碳源的葡糖酸/盐的基本培养基中生长的细胞中，对于利用葡糖酸/盐(gluconate)、gntK和gntP必需的基因也可用作为选择标记。条件必需基因的其它例子为本领域已知。抗生素选择标记赋予对这样的抗生素，如氨苄青霉素、卡那霉素、氯霉素、红霉素、四环素、新霉素、潮霉素或氨甲喋呤以抗生素抗性。

对于酵母宿主细胞，适当的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于，amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5’-磷酸脱羧酶)、sC(硫酸腺苷转移酶)、trpC(邻氨基苯甲酸合成酶)及其等价物。优选用于曲霉细胞的是构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyceshygroscopicus)的bar基因。

本发明的载体优选包含一个或多个允许容易选择转化细胞的可选择标记。可选择标记是其产物提供杀生物剂抗性或病毒抗性，重金属抗性和营养缺陷原养型(prototrophy to auxotrophs)等等的基因。

细菌的可选择标记的实例有来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因，或者是赋予抗生素抗性，例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。

本发明的载体优选包含允许载体整合到宿主细胞基因组中或者允许载体在细胞中不依赖于基因组自主复制的元件。

为了整合到宿主细胞基因组中，载体可以依靠编码多肽的多核苷酸序列或载体的任何其他元件通过同源重组或非同源重组整合到基因组中。换句话说，载体可以包含指导在染色体的精确位置通过同源重组整合到宿主细胞的基因组中的附加核苷酸序列。为了增加在精确位置整合的可能性，整合元件应该优选包含足量的核酸，例如100-10,000个碱基对，优选400-10,000个碱基对，最优选800-10,000个碱基对，其中核酸与对应的目标序列具有高度的同一性以增加同源重组的概率。整合元件可以是与宿主细胞基因组中的目标序列同源的任何序列。而且，整合元件可以是非编码或编码核苷酸序列。另一方面，可以通过非同源重组将载体整合到宿主细胞的基因组中。

为了进行自主复制，载体可以更进一步地包含使载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的调节自主复制的任何质粒复制基因。术语″复制起点″或″质粒复制物″(plasmidreplicator)在这里限定为使质粒或载体能够在体内复制的核苷酸序列。

细菌复制起点的实例有允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点和允许在芽孢杆菌属中复制的pUB110、pE194、pTA1060和pAMβ1。

供酵母宿主细胞用的复制起点的实例有复制的2微米起点、ARS1、ARS4、ARS1和CEN3的组合，以及ARS4和CEN6的组合。

对丝状真菌细胞有用的复制起点的实例有AMA1和ANS1(Gems et al.，1991，Gene 98：61-67；Cullen et al.，1987，Nucleic Acids Research 15：9163-9175；WO00/24883)。依照WO00/24883中公开的方法可以实现分离AMA1基因和构建包含该基因的质粒或载体的目的。

可以将本发明一个拷贝以上的多核苷酸插入宿主细胞以增加基因产物的产生。通过将序列的至少一个附加拷贝整合到宿主细胞基因组中，或者通过用包含扩增拷贝的可选择标记基因的细胞中的多核苷酸包括可扩增的选择标记基因可以实现多核苷酸拷贝数的增加，这样通过在存在适当选择试剂的情况下培养细胞就可以选择出多核苷酸的附加拷贝。

用来连接如上所述的元件以构建本发明重组表达载体的过程为本领域熟练技术人员熟知(例如，参见Sambrook et al.，1989，上文)。

宿主细胞

本发明也涉及包含本发明的多核苷酸的重组宿主细胞，在重组生产多肽时可以方便地使用这些重组宿主细胞。包含本发明的多核苷酸的载体被引入宿主细胞，这样就可以依照以前的描述将载体作为染色体整合体或自我复制的染色体外载体来维持。术语″宿主细胞″包括亲代细胞的任何由于复制期间发生的突变而不同于亲代细胞的子代。宿主细胞的选择很大程度上取决于编码该多肽的基因和其来源。

宿主细胞可以是单细胞微生物，例如原核生物，或非单细胞微生物，例如真核生物。

有用的单细胞微生物有细菌细胞，例如包括，但不局限于芽孢杆菌细胞，例如嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状杆菌(Bacilluscirculans)、Bacillus clausii、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)和苏云金杆菌细胞(Bacillus thuringiensis)的革兰氏阳性细菌。或链霉菌属细胞，如浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)，或革兰氏阴性菌，例如大肠杆菌和假单胞菌属的菌种。在一个优选的实施方案中，细菌宿主细胞是迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另一个优选的实施方案中，芽孢杆菌属细胞是嗜碱的芽孢杆菌。

通过使用下述方法可将载体导入细菌宿主细胞，所述方法如原生质体转化(参见如，Chang和Cohen，1979，Molecular General Genetics 168：111-115)、使用感受态细胞(参见如，Young和Spizizin，1961，Journal ofBacteriology 81：823-829或Dubnau和Davidoff-Abelson，1971，Journal ofMolecular Biology 56：209-221)、电穿孔(参见如，Shigekawa和Dower，1988，Biotechniques 6：742-751)、或接合(参见如，Koehler和Thorne，1987，Journalof Bacteriology 169：5771-5278)。

宿主细胞也可以是真核生物，例如哺乳动物、昆虫、植物或真菌细胞。

在优选方案中，宿主细胞是真菌细胞。在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如Hawksworth等，在Ainsworth和Bisby’s Dictionary of TheFungi，第8版，1995，CAB International，University Press，Cambridge，UK中所定义的)以及卵菌门(Oomycota)(如Hawksworth等，1995，文献同上，第171页中所提及的)以及所有有丝分裂孢子(mitosporic)真菌(Hawksworth等，1995，文献同上)。

在更优选的方面，真菌宿主细胞是酵母细胞。在此使用的“酵母”包括产子囊酵母(ascosporogenous)(内孢霉目(Endomycetales))、产担子孢子囊酵母(basidiosporogenous)和属于半知菌(芽孢纲(Blastomycetes))的酵母。由于酵母的分类将来可能会有所变化，对本发明而言，应按照Biology and Activities ofYeast(Skinner，F.A.，Passmore，S.M.，和Davenport，R.R.，编，Soc.App.Bacteriol.Symposium Series No.9，1980)中所述的定义酵母。

在更加优选方案中，酵母宿主细胞可以是念珠菌属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、糖酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或Yarrowia细胞。

在最优选的的方案中，酵母宿主细胞是巴斯德毕赤氏酵母(Pichiapastoris)、Pichia methanolica、卡尔斯伯糖酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化糖酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、Saccharomyces kluyveri、Saccharomyces norbensis或卵形糖酵母(Saccharomyces oviformis)细胞。在另一个最优选的方案中，酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另一个最优选的方案中，酵母宿主细胞是Yarrowia lipolytica细胞。

真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)(如Hawksworth等，1995，文献同上所定义的)所有丝状形式的亚类。丝状真菌特征在于通常由几丁质、纤维素、葡聚糖、脱乙酰壳多糖、甘露聚糖、以及其它复合多糖组成的菌丝体壁。营养生长依靠菌丝延长，且碳分解代谢是专性需氧的。相反，诸如酿酒酵母的酵母的营养生长通过单细胞原植体的芽殖进行，且碳分解代谢可以是发酵的。

在一甚至更优选的方面中，丝状真菌宿主细胞的例子是不限于支顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管菌属(Bjerkandera)、Ceriporiopsis、鬼伞属(Coprinus)、采绒革盖菌(Coriolus)、隐球菌属(Cryptococcus)、Filobasidium、镰孢霉属(Fusarium)、腐质霉属(Humicola)、Magnaporthe、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、Neocallimastix、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、Phanerochaete、Phlebia、Piromyces、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、耐热子囊菌(Thermoascus)、梭孢壳属(Thielavia)、Tolypocladium、Trametes或木霉属(Trichoderma)细胞。

在最优选的方案中，丝状真菌宿主细胞是泡盛曲霉(Aspergillusawamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)或米曲霉(Aspergillus oryzae)细胞。在另一个最优选的方案中，丝状真菌宿主细胞是杆孢状镰孢(Fusarium bactridioides)、Fusariumcerealis、Fusarium crookwellense，大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢(Fusariumoxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum细胞。在另一个最优选的方面中，丝状真菌宿主细胞为黑刺烟管菌(Bjerkanderaadusta)、Ceriporiopsis aneirina、Ceriporiopsis aneirina、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、Ceriporiopsis subvermispora、Coprinus cinereus、Coriolushirsutus、Humicola insolens、Humicola lanuginosa、米赫毛霉(Mucor miehei)、Myceliophthora thermophila、粗糙链孢霉(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、Phanerochaete chrysosporium、辐射射脉菌(Phlebia radiata)、Pleurotus eryngii、Thielavia terrestris、Trametes villosa、Trametes versicolor、Trichoderma harzianum、康氏木霉(Trichoderma koningii)、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉(Trichodermaviride)菌株细胞。

可通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身已知的方式来转化真菌细胞。用于转化曲霉属宿主细胞的适当方法描述于EP 238 023和Yelton等，1984，Proceedings of the National Academy ofSciences USA 81：1470-1474中。用于转化镰刀霉(Fusarium)菌种宿主细胞的适当方法描述于Malardier等，1989，Gene 78：147-156和WO96/00787中。可使用Becker和Guarente，在Abelson，J.N.和Simon，M.I.，编，Guide to YeastGenetics and Molecular Biology，Methods in Enzymology，Volume 194，pp182-187，Academic Press，Inc.，New York；Ito等，1983，Journal of Bacteriology153：163；和Hinnen等，1978，Proceedings of the National Academy of SciencesUSA 75：1920中描述的方法转化酵母细胞。

生产方法

本发明也涉及生产本发明的多肽的方法，包含(a)在有助于产生多肽的条件下培养细胞，其野生型形式能够产生所述多肽；和(b)回收多肽。细胞优选是柠檬酸细菌属的细胞，更优选是Citrobacter gillenii或无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)。

本发明也涉及生产本发明的多肽的方法，包含(a)在有助于生产多肽的条件下培养宿主细胞；和(b)回收多肽。

本发明也涉及生产本发明的多肽的方法，包含(a)在有助于生产多肽的条件下培养宿主细胞，其中宿主细胞包含在SEQ ID NO：1、3或5的成熟多肽编码区中包含至少一个突变的核苷酸序列突变体，其中突变核苷酸序列编码分别由SEQ ID NO：2或4的氨基酸1-409或SEQ ID NO：6的氨基酸1-414组成的多肽；和(b)回收多肽。

在本发明的生产方法中，可以利用本领域众所周知的生产方法在适合于生产多肽的营养培养基中培养细胞。例如：可以通过摇瓶培养，以及在允许表达多肽和/或分离多肽的条件下，在适当的培养基中，在实验室或工业发酵罐中完成的小规模或大规模发酵(连续不断的发酵、分批发酵、分级-分批发酵或固态发酵)来培养细胞。使用本领域已知的方法，在包含碳源，氮源和无机盐的合适的营养培养基中可以进行培养。合适的培养基购自商品供应商或可以按照公布的组成(例如在American Type Culture Collection的产品目录中)制备。如果多肽被分泌到营养培养基中，就可以直接从培养基中回收多肽。如果多肽没有被分泌，可以从细胞溶解产物中回收多肽。

利用本领域已知的特异性针对多肽的方法可以检测多肽。这些检测方法可以包括使用特异的抗体、形成多肽产物或多肽底物消失。例如：可以用多肽测定来确定这里描述的多肽的活性。

可以利用本领域已知的方法回收产生的多肽。例如，通过包括但不限于离心、过滤、抽提、喷雾干燥、蒸发或沉淀的常规程序可以从营养培养基中回收多肽。

可以通过本领域公知的各种操作步骤纯化本发明的多肽，包括，但不限于色谱法(例如离子交换、疏水、色谱聚焦和大小排阻)、电泳操作步骤(例如制备型等电位焦距)、差别溶解(例如硫酸铵沉淀)、SDS-PAGE或提取(例如，参见Protein Purification，J.-C.Janson和Lars Ryden，editors，VCHPublishers，New York，1989)。典型的纯化方案可以包括离心、细菌过滤(germfiltration)、硫酸铵沉淀(例如，利用80％饱和的硫酸铵)、离心、将沉淀再悬浮在缓冲液A(例如，50mM醋酸钠、1.5M硫酸铵pH4.5)、过滤、疏水性相互作用色谱法(Phenyl Toyopearl，用缓冲液A装载，用缓冲液B(50mM醋酸钠pH4.5)洗脱)和阳离子交换色谱法(SP-琼脂糖凝胶、用10mM的pH4.0的柠檬酸钠装载，用线性的盐梯度(10mM柠檬酸钠pH4.0+1M NaCl)洗脱)。

转基因植物

本发明也涉及已经用编码具有本发明的肌醇六磷酸酶活性的多肽的核苷酸序列转化的转基因植物、植物部分或植物细胞，转化是为了使转基因植物、植物部分或植物细胞能表达和产生可回收量的多肽。可以从植物或植物部分中回收多肽。或者，包含重组多肽的植物或植物部分可以用来改善食品或饲料的品质，例如改善营养价值、风味(palatability)和流变性质，或者可以用来破坏抗营养因子(antinutritive factor)。

在特定实施方案中，多肽靶向种子中胚乳储藏液泡(endosperm storagevaculoes)。用适当的信号肽可以合成作为前体的这种多肽，参见Horvath et alin PNAS，Feb.15，2000，vol.97，no.4，p.1914-1919。

转基因植物可以为双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草类/禾本科(grasses)，例如草地早熟禾(meadow grass)(蓝草(blue grass)，早熟禾属(Poa))，饲用牧草(forage grass)，例如羊茅属(Festuca)、黑麦草属(Lolium)、寒地型牧草(temperate grass)，例如Agrostis，和谷类，例如小麦、燕麦、黑麦、大麦、稻、高粱、triticale(小麦(triticum))和黑麦(Secale)的稳定杂种和玉蜀黍(玉米)。双子叶植物植物的实例有烟草、豆类(legumes)，例如向日葵(Helianthus)、棉花(Gossypium)、羽扇豆(lupin)、马铃薯、甜菜(sugarbeet)、豌豆、菜豆和大豆，和十字花科植物(十字花科(Brassicaceae)科)，例如花椰菜、油菜籽(rape seed)、和紧密相关的模型生物拟南芥(Arabidopsisthaliana)以及十字花科植物(Brassicaceae家族)，例如菜花、菜籽(rape seed)和密切相关的模型生物体拟南芥(Arabidopsis thaliana)。美国专利no.5,689,054和美国专利no.6,111,168中描述的低肌醇六磷酸植物是工程化植物实例。

植物部分的实例为茎、愈伤组织、叶、根、果实、种子和根茎类以及包括这些部分的各组织，例如表皮、叶肉、薄壁组织、维管组织、分生组织。将具体的植物细胞小室，诸如叶绿体、质外体、线粒体、液泡、过氧化物酶体和细胞质也认为是植物部分。此外，任意的植物细胞，无论是否为组织来源，均被认为是植物部分。同样，也认为诸如分离以有利于本发明应用的具体组织和细胞是植物部分，例如胚、胚乳、糊粉和种皮。

本发明范围内还包括这类植物、植物部分和植物细胞的子代。

可以按照本领域公知的方法构建表达本发明多肽的转基因植物或植物细胞。简言之，通过将编码本发明多肽的一种或多种表达构建体掺入植物宿主基因组并且使所得修饰的植物或植物细胞繁殖成转基因植物或植物细胞来构建植物或植物细胞。

表达构建体便利地为包括编码本发明多肽的核酸序列的核酸构建体，所述的核酸可操作地与表达所选择的植物或植物部分中的核酸序列所需的合适的调节序列连接。此外，该表达构建体可以包括用于鉴定已经整合入了所述表达构建体的宿主细胞的选择标记和将该构建体导入所述植物所必需的DNA序列(后者依赖于使用的DNA导入方法)。

例如，基于当需要、如果需要表达和需要如何表达来确定调节序列的选择，诸如启动子和终止子序列和任选的信号或转运序列。例如，编码本发明多肽的基因表达可以为组成型或诱导型的，或可以为发育、阶段或组织特异性的，并且基因产物可以靶向于具体组织或植物部分，诸如种子或叶。例如，调节序列描述在Tague等，1988，Plant Physiology 86：506中。

为了进行组成型表达，可以使用35S-CaMV(Franck等，1980，Cell 21：285-294)，玉米泛蛋白1(Christensen AH，Sharrock RA and Quail 1992.Maizepolyubiquitin genes：structure，thermal perturbation of expression and transcriptsplicing，and promoter activity following transfer to protoplasts byelectroporation)、或稻肌动蛋白启动子(Plant Mo.Biol.18，675-689.；Zhang W，McElroy D.and Wu R 1991，Analysis of rice Act1 5′region activity in transgenicrice plants.Plant Cell 3，1155-1165)。例如，器官-特异性启动子可以为来自贮存库组织，诸如种子、马铃薯根茎类和果实(Edwards & Coruzzi，1990，Ann.Rev.Genet.24：275-303)或来自代谢库组织，诸如分生组织(Ito等，1994，PlantMol.Biol.24：863-878)的启动子；种子特异性启动子，诸如来自稻的谷蛋白、醇溶蛋白、球蛋白或清蛋白启动子(Wu等，1998，Plant and Cell Physiology 39：885-889)；来自豆球蛋白B4和来自蚕豆(Vicia faba)的未知种子蛋白基因的蚕豆启动子(Conrad等，1998，Journal of Plant Physiology 152：708-711)；来自种子油体蛋白的启动子(Chen等，1998，Plant and Cell Physiology 39：935-941)；来自欧洲油菜(Brassica napus)的储存蛋白napA启动子或任意其它本领域中公知的，例如如WO91/14772中所述的种子特异性启动子。此外，启动子可以为叶特异性启动子，诸如来自稻米或番茄的rbcs启动子(Kyozuka等，1993，Plant Physiology 102：991-1000；小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra和Higgins，1994，Plant Molecular Biology 26：85-93)或来自水稻的aldP基因启动子(Kagaya等，1995，Molecular和General Genetics 248：668-674)；或伤口诱导型启动子，诸如马铃薯pin2启动子(Xu等，1993，PlantMolecular Biology 22：573-588)。同样，启动子可以通过非生物性处理，诸如温度、干旱或盐浓度改变而成为诱导型的或通过活化启动子的外部施用的物质诱导，所述的外部施用的物质例如为乙醇、雌激素、植物激素，诸如乙烯、脱落酸和赤霉酸和/或重金属。

启动子增强子元件也可以用于本发明多肽在植物中的高度表达。例如，启动子增强子元件可以为置于启动子与编码本发明多肽的核苷酸序列之间的内含子。例如，Xu等，1993，文献同上中披露了第一内含子在强化表达的水稻肌动蛋白1基因中的应用。

更进一步地可以依据植物品种优化密码子用法以改善表达(参见上文提到的Horvath et al)。

可以从可获得的现有技术中挑选表达构建体的可选择标记基因和任何其他部分。

可以根据本领域已知的常规方法，包括农杆菌介导的转化、病毒介导的转化、显微注射、粒子轰击、生物射弹转化和电穿孔将核酸构建体掺入植物基因组(Gasser等，1990，Science 244：1293：Potrykus，1990，Bio/Technology 8：535：Shimamoto等，1989，Nature 338：274)。

目前，根癌土壤杆菌(Agrobacterium tumefaciens)-介导的基因转移为用于生产转基因双子叶植物而的选择方法(就综述而言，参见Hooykas和Schilperoort，1992，Plant Molecular Biology 19：15-38)并且还可以用于转化单子叶植物，不过，其它转化方法通常用于这些植物。目前，为生产转基因单子叶植物而选择的方法为对胚愈伤组织或发育的胚进行粒子轰击(用转化的DNA包被的微观金或钨粒子)(Christou，1992，Plant Journal 2：275-281：Shimamoto，1994，Current Opinion Biotechnology 5：158-162：Vasil等，1992，Bio/Technology 10：667-674)。用于单子叶植物转化的备选方法基于如Omirulleh等在1993，Plant Molecular Biology 21：415-428中所述的原生质体转化。

在转化后，选择掺入了所述表达载体的转化体并且按照本领域众所周知的方法将其再生成完整植物。通常设计转化操作步骤以便通过使用例如与两种单独的T-DNA构建体共转化或用特异性重组酶对选择基因进行位点特异性切除在再生过程中或在以下的子代中对选择基因进行选择性淘汰。

本发明也涉及生产本发明的多肽的方法，包含(a)在有助于生产多肽的条件下培养包含编码本发明的具有肌醇六磷酸酶活性的多肽的核酸序列的转基因植物或植物细胞；和(b)回收多肽。

转基因动物

本发明也涉及转基因非人动物，以及其产物或元件，产物实例有体液，例如乳液和血液、器官、肉和动物细胞。在哺乳动物细胞中表达蛋白质的技术在本领域是已知的，例如，参见蛋白质表达手册(handbook ProteinExpression)：A Practical Approach，Higgins和Hames(eds)，牛津大学出版社(1999)，以及该系列中与基因转录、RNA处理和翻译后处理有关的其他三本手册。一般说来，为了制备转基因动物，可以用编码本发明的具有肌醇六磷酸酶活性的多肽的核酸序列转化所选择动物的选定细胞以表达和生产多肽。可以从动物中回收多肽，例如从雌性动物的乳液中回收多肽，或者为了有益于动物本身，例如协助动物消化，也可以表达该多肽。动物实例有下文的动物饲料部分提到的动物。

为了产生用于从动物乳液中回收多肽的转基因动物，可以使用包含适当乳蛋白质启动子和编码该多肽的基因的转基因表达载体将编码多肽的基因插入到所讨论动物的授精卵中。转基因表达载体被通过显微注射到授精卵中，优选被永久整合到染色体中。一旦卵开始生长和分裂，就可以将有能力的胚植入到代孕母亲中，并鉴定携带转基因的动物。然后可以通过常规繁殖方法繁殖得到的动物。从动物的乳液中纯化多肽，可以参见Meade，H.M.et al(1999)：Expression of recombinant proteins in the milk of transgenicanimals，Gene expression systems：Using nature for the art of expression.J.M.Fernandez and J.P.Hoeffler(eds.)，Academic Press。

在可替换的方案中，为了产生在体细胞和/或生殖细胞中携带有包括含有编码多肽的转基因的异源转基因构建体的核酸序列的转基因非人动物，转基因可以操作性地与该多肽的唾液腺特异表达第一调节序列相连。

组合物和用途

在更进一步的方案中，本发明涉及包含本发明的多肽的组合物，以及使用这些组合物的方法。

可以依照本领域已知的方法制备多肽组合物，制备的多肽组合物可以是液体形式的组合物或干燥组合物。例如，多肽组合物可以是颗粒或微粒形式。可以依照本领域已知的方法，稳定包含在组合物中的多肽。

本发明的肌醇六磷酸酶在任何工业中都可以用来降解例如，肌醇六磷酸/酯(phytate)、肌醇六磷酸(phytic acid)、和/或肌醇的单、二、三、四和/或五磷酸盐。已经公知这些化合物的磷酸盐部分螯合有二价和三价阳离子，例如金属离子、营养必需的钙、铁、锌和镁离子，以及微量矿物锰、铜和钼。此外，肌醇六磷酸在一定程度上也可以通过静电作用结合蛋白质。

因此，本发明的多肽的优选用途是用于动物饲料制品(包括人食品)中或这种制品的添加剂中。

在特定实施方案中，本发明的多肽可以用来改善动物饲料的营养价值。改善动物饲料(包括人食品)营养价值的非限制性实例有：改善饲料的可消化性；促进动物生长；改善饲料的利用性；改善蛋白质的生物利用度；增加可消化磷酸盐的水平；改善肌醇六磷酸的释放和/或降解；改善微量矿物质的生物利用度；改善大分子矿物质的生物利用度；消除添加补充的磷酸盐、微量矿物质和/或大分子矿物质的需要；和/或改善蛋壳质量。因此提高了饲料的营养价值，而且也可以改善动物的增长率和/或体重增加和/或饲料转化率(即摄取的饲料重量/增加的体重)。

而且，本发明的多肽可用于降低粪(manure)中的肌醇六磷酸水平。

动物、动物饲料和动物饲料添加剂

术语动物包括所有动物，包括人类。动物实例有非反刍动物和反刍动物。反刍动物包括如绵羊、山羊、马和牛，例如，肉牛、奶牛和小牛的动物。在特定实施方案中，动物是非反刍动物。非反刍动物包括单胃动物，例如猪或猪类(包括但不限于小猪、正在成长的猪和母猪)；家禽，例如火鸡、鸭和小鸡(包括但不是限于肉用仔鸡，蛋鸡)；小牛；鱼(包括但不是限于鲑鱼、鳟鱼、罗非鱼、鲶鱼和鲤鱼)；和甲壳动物(包括但不是限于虾和对虾)。

术语饲料或饲料成分(composition)指适合被动物摄取或为被动物摄取而设计的任何化合物、制品、混合物或组合物。

依照本发明的用途，可以在饮食之前、之后或同时给动物饲喂本发明的多肽。优选后者。

在特定实施方案中，添加到饲料中的多肽或包含在饲料添加剂中的多肽是基本上纯的多肽形式。在特定实施方案中，已经明确限定这一点。术语″明确限定″指用分子排阻色谱确定时，肌醇六磷酸酶制品的纯度为至少50％。在其他特定实施方案，用这种方法确定的肌醇六磷酸酶制品的纯度为至少60、70、80、85、88、90、92、94或至少95％。

基本上纯的多肽制品和/或明确限定的多肽制品是有利的。例如，以准确剂量将基本上没有其他干扰多肽或其他污染多肽的多肽添加到饲料中相对更容易。术语准确剂量特别指获得一致和恒定结果的目标和基于预期效果优化剂量的能力。

但是，在动物饲料中使用的本发明的肌醇六磷酸酶多肽不必是纯肌醇六磷酸酶多肽；它可以包括其他多肽，在这种情况下可以将其称为肌醇六磷酸酶制品。

肌醇六磷酸酶制品可以(a)直接添加到饲料中(或者在蛋白质治疗过程中直接使用)；或(b)可用于产生一种或多种中间组合物，例如随后被添加到饲料中(或用于治疗过程)的饲料添加剂或预混合料。不论是依照上述的(a)，还是(b)进行使用，如上所述的纯度都指原始多肽制品的纯度。

利用重组生产方式可特别获得纯度为该数量级的多肽制品，但是当用传统发酵方法生产该多肽时，不能这么容易地获得该数量级的多肽制品，而且批间差异更高。

毫无疑问，多肽可以与其他多肽混合。

可以以任何形式将该多肽添加到饲料中，添加的多肽可以是相对纯的多肽，或者可以是与计划添加到动物饲料中的其他成分混合的混合物，即动物饲料添加剂的形式，例如所谓的动物饲料前混合物。

在更进一步的方案中，本发明涉及在动物饲料，例如动物饲料和动物饲料添加剂，例如预混合料中使用的组合物。

除本发明的多肽以外，本发明的动物饲料添加剂可以包含至少一种脂溶性维生素，和/或至少一种水溶性维生素、和/或至少一种微量矿物质。饲料添加剂也可以包含至少一种大分子矿物质。

更进一步地，饲料添加剂组分可以随意地是着色剂，例如类胡萝卜素，比如β-胡萝卜素、虾青素和叶黄素(lutein)；芳香族化合物；稳定剂；抗菌肽；多不饱和脂肪酸；活性氧产生物质；和/或至少一种从肌醇六磷酸酶(EC3.1.3.8或3.1.3.26)；木聚糖酶(EC3.2.1.8)；半乳聚糖酶(EC3.2.1.89)；α-半乳糖苷酶(EC3.2.1.22)；蛋白酶(EC3.4-.-)、磷脂酶A1(EC3.1.1.32)；磷脂酶A2(EC3.1.1.4)；溶血磷脂酶(EC3.1.1.5)；磷脂酶C(3.1.4.3)；磷脂酶D(EC3.1.4.4)；淀粉酶，例如，α淀粉酶(EC3.2.1.1)；和/或β-葡聚糖酶(EC3.2.1.4或者EC3.2.1.6)中选择出来的其他多肽。

在特定实施方案中，明确限定了这些其他多肽(就象上文限定肌醇六磷酸酶制品一样)。

在特别优选的实施方案中，本发明的具有相对低的pH最适条件的肌醇六磷酸酶可以与至少一种具有更高pH最适条件的肌醇六磷酸酶组合。具有更高pH最适条件的肌醇六磷酸酶的优选实例有芽孢杆菌属肌醇六磷酸酶，例如来自地衣芽孢杆菌和枯草芽孢杆菌的肌醇六磷酸酶，以及其具有肌醇六磷酸酶活性的衍生物、变体或片段。

本发明的肌醇六磷酸酶也可以与其他的肌醇六磷酸酶，例如子囊菌(ascomycete)肌醇六磷酸酶，例如曲霉肌醇六磷酸酶，例如来源于无花果曲霉(Aspergillus ficuum)、黑曲霉或泡盛曲霉的肌醇六磷酸酶；或担子菌(basidiomycete)肌醇六磷酸酶，例如来源于Peniophora lycii、Agrocybepediades、Trametes pubescens或Paxillus involutus的肌醇六磷酸酶；或其具有肌醇六磷酸酶活性的衍生物、片段或变体组合。

因此，在用于本发明的动物饲料的优选实施方案和用于本发明的动物饲料添加剂和动物饲料的优选实施方案中，本发明的肌醇六磷酸酶可以与这些肌醇六磷酸酶组合。

上述子囊菌和担子菌肌醇六磷酸酶，特别是来源于Peniophora lycii的RONOZYME P肌醇六磷酸酶，以及其衍生物、变体和片段也可以与芽孢杆菌属肌醇六磷酸酶，特别是地衣芽孢杆菌肌醇六磷酸酶，以及其衍生物、片段和变体组合以特别用于动物饲料中。

抗微生物肽(AMP′s)的实例是CAP18、Leucocin A、Tritrpticin、protegrin-1、Thanatin、防卫素(Defensin)、Lactoferrin、Lactoferricin和Ovispirin，例如Novispirin(Robert Lehrer，2000)、Plectasins、和抑制素(Statins)，包括在WO03/044049和WO03/048148中公开的化合物和多肽，以及上述保持抗微生物活性的肽的变体或片段。

抗真菌多肽(AFP′s)的实例是巨大曲霉(Aspergillus giganteus)，和黑曲霉(Aspergillus niger)肽，以及保持抗真菌活性的其变体和片段，如在WO94/01459和WO02/090384中所公开的。

多聚不饱和脂肪酸的实例是C18、C20和C22多聚不饱和脂肪酸，例如花生四烯酸、二十二碳六烯酸(docosohexaenoic acid)、二十碳五烯酸(eicosapentaenoic acid)和γ-亚油酸。

产生活性氧物质类的实例是例如过硼酸盐、过硫酸盐、或过碳酸盐的化学试剂；和例如氧化酶、加氧酶或合成酶的多肽。

通常脂溶或水溶性的维生素，以及微量矿物质形成将加入饲料的所谓预混合料的部分，而通常将大量矿物质单独加入饲料。任何这些组合物的类型，在富集本发明蛋白酶时，是本发明的动物饲料添加剂。

在特定的实施方案中，本发明的动物饲料添加剂预期包括(或如必须包括时规定)在动物的日常饮食中，或以0.01至10.0％；更具体为0.05至5.0％；或0.2至1.0％的水平喂饲(％是指每100g饲料的g添加剂)。这特别地用于预混合料。

以下是这些成分实例的非排它列表：

脂溶性维生素的实例有维生素A、维生素D3、维生素E和维生素K，例如维生素K3。

水溶性维生素的实例有维生素B12、生物素和胆碱、维生素B1、维生素B2、维生素B6、烟酸、叶酸和泛酸(panthothenate)，例如D-泛酸钙(Ca-D-panthothenate)。

微量无机物的实例有锰、锌、铁、铜、碘、硒和钴。

大分子矿物质的实例有钙、磷和钠。

这些成分的营养需要量(以家禽和仔猪/猪例证)如WO01/58275的表A所列。营养需要量是指在日常饮食中应以指明的浓度提供这些成分。

可选的，本发明的动物饲料添加剂包括WO01/58275的表A中列举的至少一种单独成分。在本文中，至少一种意味着任何一种、一种或多种、一种或2、或3、或4种等直到所有的13种、或直到所有的15种单独成分。更具体地说，这个至少一种单一成分包括在本发明的添加剂中，其在饲料浓度中呈现的数量是在表A的第4栏、第5栏、或第6栏指明的范围内。

本发明也涉及动物饲料组合物。动物饲料组合物或日常饮食具有相对高含量的蛋白质。可如WO01/58275的表B中第2-3栏所指明的表征家禽和猪的调养饲料。可如该表B的第4栏中所指明的表征鱼饮食饲料。此外这种鱼饮食饲料通常具有200-310g/kg含量的粗脂肪。

WO01/58275对应US09/779334，其包含在本文作为参考。

本发明所述的动物饲料组合物具有50-800g/kg含量的粗蛋白，而且包括至少一种在此所要求保护的蛋白酶变体。

此外，或可选的(关于如上所述的粗蛋白含量)，本发明的动物饲料组合物具有10-30MJ/kg的可代谢能量含量；和/或0.1-200g/kg的钙含量；和/或0.1-200g/kg的有效磷含量；和/或0.1-100g/kg的甲硫氨酸含量；和/或0.1-150g/kg的甲硫氨酸加半胱氨酸含量；和/或0.5-50g/kg的赖氨酸含量。

在特定的实施方案中，代谢能量、粗蛋白、钙、磷、甲硫氨酸、甲硫氨酸加半胱氨酸、和/或赖氨酸的含量是在WO01/58275表B中第2、3、4或5中任何一项的范围内(R.2-5)。

通过将氮(N)乘以因子6.25来计算粗蛋白，即粗蛋白(g/kg)＝N(g/kg)×6.25。通过Kjeldahl定氮法(A.O.A.C.，1984，Official Methods ofAnalysis第14版，Association of Official Analytical Chemists，Washington DC)确定含氮量。

可根据NRC出版物Nutrient requirements in swine，第9修订版，1988，subcommittee on swine nutrition，committee on animal nutrition，board ofagriculture，national research council.National Academy Press，华盛顿，D.C.，第2-6页，和用于家禽饲料-原料的能量值欧洲表，Spelderholt centre forpoultry research and extension，7361 DA Beekbergen，荷兰，Grafisch bedrijfPonsen & looijen bv，Wageningen.ISBN 90-71463-12-5来计算可代谢能量。

根据例如Veevoedertabel 1997，gegevens over chemische samenstelling，verteerbaarheid en voederwaarde van voedermiddelen，Central Veevoederbureau，Runderweg 6，8219 pk Lelystad.ISBN 90-72839-13-7的饲料表来计算完全的动物调养饲料中的饮食性钙、有效磷和氨基酸含量。

具体的实施方案中，本发明的动物饲料组合物含有至少一种蛋白。所述蛋白可以是动物蛋白，诸如肉和骨类粉，和/或鱼粉(fish meal)；或在具体实施方案中，其可以是植物蛋白质。术语植物蛋白是指包括至少一种衍生自或起源于植物的蛋白质，包括修饰的蛋白质和蛋白质-衍生物的任何化合物、组合物、制剂或混合物。在特定的实施方案中，植物蛋白的蛋白质含量是至少10、20、30、40、50、或60％(w/w)。

植物蛋白可衍生自植物蛋白来源，例如豆类和谷类，例如来自豆科(Fabaceae)(Leguminosae)、十字花科、藜科(Chenopodiaceae)、和禾本科(Poaceae)植物的材料，例如大豆粗粉、羽扇豆粗粉和油菜籽粉。

在特定的实施方案中，植物蛋白来源是来自一种或多种豆科植物，例如大豆、羽扇豆、豌豆或菜豆的材料。

在另一个特定的实施方案中，植物蛋白来源是来自一种或多种藜科植物，例如甜菜、制糖甜菜(sugar beet)、菠菜或奎藜籽(quinoa)的材料。

植物蛋白来源的其它实例是油菜籽，葵花籽，棉花籽和卷心菜。

大豆是优选的植物蛋白来源。

植物蛋白来源的其它实例是谷类，例如大麦、小麦、黑麦、燕麦、王蜀黍(玉米)、稻(rice)，triticale，和高粱。

在更进一步的特定实施方案中，本发明的动物饲料组合物包含0-80％的玉米；和/或0-80％的高粱；和/或0-70％的小麦；和/或0-70％的大麦；和/或0-30％的燕麦；和/或0-40％的大豆粉；和/或0-25％的鱼粉；0-25％肉和骨粉；和/或0-20％的乳清。

可将动物膳食(diet)制备成例如粉料(mash feed)(非颗粒)或颗粒(pelleted)饲料。一般地，混合碾磨的饲料-原料并且根据所述种属的规格加入足够数量的必需维生素和矿物质。可加入固体的酶或液体酶制剂。例如，一般在混合步骤前或在混合期间加入固体酶制剂；而一般在造粒(pelleting)步骤后加入液体多肽制剂。也可将多肽掺入到饲料添加剂或预混合料中。

膳食中的最终酶浓度是在每kg膳食0.01-200mg多肽蛋白的范围内，例如在每kg动物膳食5-30mg多肽蛋白的范围内。

毫无疑问，应施用有效量的本发明的肌醇六磷酸酶，即足以改善饲料增溶作用和/或营养价值的量。目前考虑施用含量为如下数量(剂量范围)中的一个或多个的多肽：0.01-200；0.01-100；0.5-100；1-50；5-100；10-100；0.05-50或0.10-10，所有这些范围都是每公斤饲料中以毫克记的肌醇六磷酸酶多肽蛋白质(百万分之一)。

为了确定每公斤饲料中肌醇六磷酸酶多肽蛋白质的毫克数，可以从饲料成分中纯化肌醇六磷酸酶，并利用相关的测定确定纯化的肌醇六磷酸酶的比活性。也可以利用相同的测定同样地确定饲料成分的肌醇六磷酸酶活性，并以这两个测定为基础计算每公斤饲料中以毫克记的肌醇六磷酸酶多肽蛋白质的剂量。

相同的原则也适用于确定饲料添加剂中肌醇六磷酸酶多肽蛋白质的毫克数。毫无疑问，如果可以获得用于制备饲料添加剂或饲料的肌醇六磷酸酶样品，那么可由此样品确定比活性(不需要从饲料成分或添加剂中纯化肌醇六磷酸酶)。

信号肽

本发明也涉及包含与SEQ ID NO：1、3或5的核苷酸1-66组成的第一核苷酸序列操作性相连的蛋白质编码基因的核酸构建体，其中SEQ ID NO：1、3或5的核苷酸1-66组成的第一核苷酸序列分别编码由SEQ ID NO：2、4或6的氨基酸1-22组成的信号肽，而且蛋白质编码基因与第一核苷酸序列异源。

本发明也涉及包含这种核酸构建体的重组表达载体和重组宿主细胞。

本发明也涉及生产蛋白质的的方法，包含(a)在有助于生产该蛋白质的的条件下培养这种重组宿主细胞；和(b)回收蛋白质。

第一核苷酸序列可以单独通过其他的控制序列或与其他的控制序列组合操作性地与异源基因相连。上文描述了这种其他的控制序列。

蛋白质可以是宿主细胞与生俱来的或者与宿主细胞异源。术语″蛋白质″在这里并不涉及编码产物的具体长度，因此它包括肽、寡肽和蛋白质。术语蛋白质也包括组合形成编码产物的两个或更多个多肽。蛋白质也包括包含从至少两个不同的蛋白质获得的部分或完全多肽序列的组合的杂种多肽，其中一种或多种蛋白质可以是宿主细胞与生俱来的或者与宿主细胞异源。蛋白质可以更进一步地包括上述蛋白质和杂化蛋白的天然发生的等位基因变异和加工设计的变异。

蛋白质优选是激素或其变体、多肽、受体或其部分、抗体或其部分或者受体。在更优选的方案中，蛋白质是氧化还原酶、转移酶、水解酶、裂解酶、异构酶或连接酶。在更加优选的方案中，蛋白质氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶(cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α半乳糖苷酶、β半乳糖苷酶、葡糖淀粉酶、α葡糖苷酶、β葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、mutanase、氧化酶、果胶溶解多肽(pectinolytic polypeptide)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解多肽、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。

可以从任何原核生物、真核生物或其他来源中获取该基因。

下列实施例更进一步地描述了本发明，不应认为实施例是限制本发明的范围。

实施例

实施例1：克隆Citrobacter gillenii肌醇六磷酸酶

对下列酸性组氨酸磷酸酶进行多重比对：大肠杆菌appA(SPTREMBL：Q8GN88)、Klebsiella terrigenaphyk(SPTREMBL：Q7WSY1)，以及YersiniapestisCO92(SPTREMBL：Q8ZFP6)。以共有序列为基础设计两个简并的寡核苷酸引物：

5′-CGC GTG GTG ATT GTG TCC MGN CAY GGN GT-3′(SEQ ID NO：7，正向引物)

5′-C CAG GTT GGT ATC ATG GCC NGC DAT RAA-3′(SEQ ID NO：8，反向引物)

引物用于在45、48和50℃的退火温度通过PCR筛选许多细菌种属。

在Citrobacter gillenii DSM 13694中鉴定到形式为900bp DNA片段的部分肌醇六磷酸酶基因。

PCR片段被克隆到pEZSeq钝端克隆试剂盒(来自Lucigen Corporation的目录号40501-1，2120 West Greenview Dr.，Ste 9，Middleton，WI 53562，US)。首先，用PCRTerminator末端修复试剂盒(PCRTerminator End Repair Kit)(是pEZSeq钝端克隆试剂盒的一部分)处理PCR片段，PCRTerminator末端修复试剂盒包含已经优化的能在任何种类的PCR产物上产生钝的5′磷酸化末端的具有酶活性的混合物。克隆到pEZSeq载体中以后，可以利用两个特异的载体引物对克隆进行测序。核苷酸序列的翻译证实克隆的DNA片段是肌醇六磷酸酶基因的一部分。

为了获得该基因的全长核苷酸序列，使用了设计的能捕获未知目标位点的DNA Walking SpeedUp试剂盒(DWSK-V102 from Seegene，Inc.，2nd Fl.，Myungji Bldg.，142-21，Samsung-dong，Kangnam-gu，Seoul，135-090，Korea)。为了实现这一目的，设计了4个特异的寡核苷酸和该试剂盒一起使用。

TSP1N：5′-AGACTTCCGCCAGCCCG-3′(SEQ ID NO：9)

TSP1C：5′-AAGCAGCTGGGCAGTCTGC-3′(SEQ ID NO：10)

TSP2N：5′-AAGCGGCGTGAACTTTGTCGG-3′(SEQ ID NO：

11)TSP2C：5′-ATGGGGACTGGCTTCAACCCTG-3′(SEQ ID NO：12)

来自Citrobacter gillenii DSM 13694的编码肌醇六磷酸酶的全长核苷酸序列为序列表显示的SEQ ID NO：3，编码的对应氨基酸序列为SEQ ID NO：4。预计SEQ ID NOs：2和4的开始的22个氨基酸是信号肽(通过信号PV3.0进行预计)。SEQ ID NO：1是包含下列13个替换：T99G、C102G、C105T、C108G、A109T、G110C、T111C、T117C、C975T、A989C、T991(-)、C992(-)、A1005(-)的SEQ ID NO：3的变体。SEQ ID NO：4是包含下列5个替换：N330T、I331K、S332R、A334(-)、L335I的SEQ ID NO：2的变体。

该Citrobacter gillenii DSM 13694肌醇六磷酸酶基因被克隆到没有融合标记的pET-30a(+)大肠杆菌表达载体中(来自Novagen的目录号69909，从Bie & Berntsen A/S，7 Sandbaekvej，DK-2610 Roedovre，Denmark可买到)。在该系统中，通过提供在大肠杆菌BL21 star(DE)的pLysS宿主菌株中T7 RNA聚合酶来源(来自Novagen的目录号69388，从Bie & Berntsen可买到)诱导该基因的表达，其中大肠杆菌BL21star(DE)的pLysS宿主菌株包含在lacUV5启动子控制下的T7 RNA聚合酶基因的染色体拷贝。通过添加乳糖到培养基中可以实现对靶基因的诱导。乳糖将结合阻遏物，从而导致它从操纵子上解离以允许从启动子开始转录。

为了表达肌醇六磷酸酶基因，转化的大肠杆菌菌株的单个集落被转移到不允许表达T7 RNA聚合酶的非诱导培养基(包含葡萄糖作为唯一的碳源)中进行接种培养。使用包含空pET-30(+)载体的大肠杆菌(BL21star(DE)pLysS)作为阴性对照。将小等分(大约150微升)的接种培养物转移到包含乳糖作为唯一碳源的细颈瓶里。37℃以300rpm的转速振摇培养诱导培养物过夜。

离心收获细胞并通过SDS-PAGE分析15微升等分的上清液。10微升超精确蛋白质标准样品(Precision Plus protein standard)(目录号161-0363，市场上从Bio-Rad Laboratories Headquarters，1000 Alfred Nobel Drive，Hercules，CA 94547，US可买到)作为分子量(MW)标记。在来自重组大肠杆菌菌株的上清液中鉴定到MW为大约50kDa的清晰条带，但在阴性对照中没有鉴定到。

溶解收获的细胞小丸，并且也通过如上所述的SDS-PAGE分析溶解的胞内部分。在MW 50kDa处也出现了条带。

这是表明重组肌醇六磷酸酶蛋白质被部分分泌到培养基中的证据。但是，大量的酶仍然保留在胞内部分。

通过使用实施例4的测定确认上清液和胞内部分的肌醇六磷酸酶活性。

实施例2：制备Citrobacter gillenii肌醇六磷酸酶制品

30℃在添加了0.1％(w/w)肌醇六磷酸钠的LB培养基(25g LB Bouillon，Merck 0285，离子交换水1000ml)中摇振(225rpm)生长Citrobacter gilleniiDSM 13694过夜。离心(4000rpm，60min)收获细胞，弃去上清液。将细胞小丸再悬浮在有100mg/ml溶菌酶的两体积蒸馏水中，37℃孵育过夜使细胞溶解。离心溶解的细胞(4000rpm，2h)，保留上清液并用它进行酸稳定性分析。

实施例3：Citrobacter gillenii肌醇六磷酸酶的耐酸性

实施例2中获得的50微升溶解产物与pH值分别为2.2、3.0(甘氨酸/盐酸)和7.0(HEPES)的50微升的100mM的缓冲液混合。37℃孵育样品过夜，利用实施例4中描述的分析方法分析剩余的肌醇六磷酸酶活性。以吸光度表示的剩余的肌醇六磷酸酶活性显示在下表1中。而且，计算了该活性相对pH7的剩余活性的百分比。

表1

在一定的pH条件下孵育后的剩余活性[OD]	pH2.2	pH2.2相对于pH7.0的百分比	pH3.0	pH3.0相对于pH7.0的百分比	pH7.0	pH7.0相对于pH7.0的百分比
在一定的pH条件下孵育后的剩余活性[OD]	pH2.2	pH2.2相对于pH7.0的百分比	pH3.0	pH3.0相对于pH7.0的百分比	pH7.0	pH7.0相对于pH7.0的百分比	菌株：
CitrobactergilleniiDSM13694	0.07	81	0.10	116	0.09	100	菌株：

实施例4：肌醇六磷酸酶测定

基于与钼酸盐/铁的络合作用确定可溶解的磷酸盐和对微量滴定板中的蓝色进行的光度测量来进行测定。

底物是溶解在0.1M醋酸盐缓冲液中的pH＝5.5的0.5mM的肌醇六磷酸钠(Sigma，P-8810)。在特定实施方案中，底物浓度是5mM。

按照如下描述制备显色试剂：1％的钼酸铵(Merck 1181，(NH₄)₆Mo₇O₂₄，4H₂O)溶于3.2％的硫酸(Merck 731)中。1.1g硫酸亚铁(Merck 3965)溶于15ml上述的钼酸盐试剂中，并添加10ml 0.5M的硫酸。每天新鲜配制，保藏在黑暗中。

Blind：混合20ul样品、100ul底物和120ul显色试剂，37℃孵育5分钟，在750nm处测量OD_Blind。

样品：混合20ul样品、100ul底物，37℃孵育30分钟，添加120ul显色试剂，37℃孵育5分钟，在750nm处测量OD_样品。

OD＝OD_样品-OD_Blind。

实施例5：无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)肌醇六磷酸酶的克隆

对下列酸性组氨酸磷酸酶进行多重比对：大肠杆菌appA(SPTREMBL：Q8GN88)、Klebsiella terrigena)phyk(SPTREMBL：Q7WSY1)，以及YersiniapestisCO92(SPTREMBL：Q8ZFP6)。以共有序列为基础设计两个简并的寡核苷酸引物：

5′-CGC GTG GTG ATT GTG TCC MGN CAY GGN GT-3′(SEQ IDNO：13，正向引物)

5′-C CAG GTT GGT ATC ATG GCC NGC DAT RAA-3′(SEQ ID NO：14，反向引物)。

在无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25405和无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25407中鉴定到形式为900bpDNA片段的部分肌醇六磷酸酶基因。PCR片段被克隆到pEZSeq钝端克隆试剂盒(来自Lucigen Corporation的目录号40501-1，2120 West Greenview Dr.，Ste 9，Middleton，WI 53562，US)。首先，用PCRTerminator末端修复试剂盒(PCRTerminator End Repair Kit)(是pEZSeq钝端克隆试剂盒的一部分)处理PCR片段，PCRTerminator末端修复试剂盒包含已经优化的能在任何种类的PCR产物上产生钝的5′磷酸化末端的具有多肽活性的混合物。克隆到pEZSeq载体中以后，可以利用两个特异的载体引物对克隆进行测序。核苷酸序列的翻译证实克隆的DNA片段是肌醇六磷酸酶基因的一部分。

例如：为了获得来自无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25407的肌醇六磷酸酶基因的N-末端和C末端序列，使用了寡核苷酸TSP1N/TSP2N和TSP1C/TSP2C：

TSP1N：5′-TTT ACG AGT GCG CTG ATC GG-3′(SEQ ID NO：15)

TSP2N：5′-ATA ACT GCC ACC TGT TCT GGT GAC G-3′(SEQ ID NO：16)

TSP1C：5′-ACT CAG GGT TTC TGC GGA TAC C-3′(SEQ ID NO：17)

TSP2C：5′-AAT GCC AGA GGT TGC GTG GGG-3′(SEQ ID NO：18)

编码来自无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25407的肌醇六磷酸酶的全长核苷酸序列为序列表显示的SEQ ID NO：5，编码的对应氨基酸序列为SEQ ID NO：6。预计SEQ ID NO：6起始的22个氨基酸是信号肽(通过Signal P V3.0进行预计)。来自无丙二酸柠檬酸杆菌(Citrobacteramalonaticus)ATCC 25405的肌醇六磷酸酶具有如SEQ ID NO：6显示的氨基酸序列正好相同的序列，对应的核苷酸序列与来自SEQ ID NO：5的核苷酸序列仅仅相差三个核苷酸，即T78C、C118T和T120G，相差的这三个核苷酸都是不产生任何不同氨基酸的沉默变化。

该无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25407肌醇六磷酸酶基因被克隆到没有融合标记的pET-30a(+)大肠杆菌表达载体中(来自Novagen的目录号69909，从Bie & Berntsen A/S，7 Sandbaekvej，DK-2610Roedovre，Denmark可买到)。在这个系统中，通过提供在大肠杆菌BL21star(DE)的pLysS宿主菌株中的T7RNA聚合酶来源(来自Novagen的目录号69388，从Bie & Berntsen可买到)诱导该基因的表达，其中大肠杆菌BL21star(DE)的pLysS宿主菌株包含在lacUV5启动子控制下的T7RNA聚合酶基因的染色体拷贝。通过添加乳糖到培养基中可以实现对靶基因的诱导。乳糖将结合阻遏物，从而导致它从操纵子上解离以允许从启动子开始转录。

这是表明重组肌醇六磷酸酶蛋白质被部分分泌到培养基中的证据。但是，大量的多肽仍然保留在胞内部分。

实施例6：制备无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)肌醇六磷酸酶制品

30℃在添加了0.1％(w/w)肌醇六磷酸钠的LB培养基(25g LBBouillon，Merck 0285，离子交换水1000ml)中摇振(225rpm)生长无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25405过夜。离心(4000rpm，60min)收获细胞，弃去上清液。将细胞小丸再悬浮在含有100mg/ml溶菌酶的两体积蒸馏水中，在37℃孵育过夜使细胞裂解。离心裂解的细胞(4000rpm，2h)，保留上清液并用它进行酸稳定性分析。

实施例7：无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)肌醇六磷酸酶的酸稳定性

实施例2中获得的50微升裂解产物与pH值分别为2.2、3.0(甘氨酸/盐酸)和7.0(HEPES)的50微升的100mM的缓冲液混合。37℃孵育样品过夜，利用实施例4中描述的分析方法分析剩余的肌醇六磷酸酶活性。以吸光度表示的剩余的肌醇六磷酸酶活性显示在下表1中。而且，计算了该活性占pH7的剩余活性的百分比。

表1

在一定的pH条件下孵育后的剩余活性[OD]：	pH2.2	pH2.2相对于pH7.0的百分比	pH3.0	pH3.0相对于pH7.0的百分比	pH7.0	pH7.0相对于pH7.0的百分比
在一定的pH条件下孵育后的剩余活性[OD]：	pH2.2	pH2.2相对于pH7.0的百分比	pH3.0	pH3.0相对于pH7.0的百分比	pH7.0	pH7.0相对于pH7.0的百分比	菌株：
无丙二酸柠檬酸杆菌(Citrobacteramalonaticus)ATCC 25405	0.12	78	0.14	100	0.14	100	菌株：

特定的实施方案

以下是本发明附加的特定实施方案：

I.具有肌醇六磷酸酶活性的分离的多肽，选自由(a)具有与(i)SEQ ID NO：2的氨基酸1-409、(ii)SEQ ID NO：2的成熟多肽部分、(iii)SEQ ID NO：4的氨基酸1-410、和/或(iv)SEQ ID NO：4的成熟多肽部分中的任何一个有至少72％同一性的氨基酸序列的多肽；(b)至少在中等严谨条件下与(i)SEQID NO：1的核苷酸67-1293、(ii)SEQ ID NO：1的成熟多肽编码部分、(iii)SEQ ID NO：3的核苷酸67-1296、(iv)SEQ ID NO：3的成熟多肽编码部分、和/或(v)(i)、(ii)、(iii)或(iv)任何一项的互补链杂交的多核苷酸编码的多肽；(c)包含一个或多个氨基酸保守替换、缺失和/或插入的(a)(i)-(a)(iv)的任何一个多肽的变体；和(d)(a)(i)-(a)(iv)的任何一个多肽的片段组成的群组。

II.包含编码I的多肽的核苷酸序列的分离的多核苷酸。

III.编码具有肌醇六磷酸酶活性的多肽的分离的多核苷酸，选自由：(a)编码具有与SEQ ID NO：2的氨基酸1-409、SEQ ID NO：4的氨基酸1-410有至少72％同一性的氨基酸序列的多肽的多核苷酸；(b)与SEQ ID NO：1的核苷酸67-1293或SEQ ID NO：3的核苷酸67-1296有至少72％同一性的多核苷酸；和(c)至少在中等严谨条件下与(i)SEQ ID NO：1的核苷酸67-1293、(ii)SEQ ID NO：1的成熟多肽编码部分、(iii)SEQ ID NO：3的核苷酸67-1296、(iv)SEQ ID NO：3的成熟多肽编码部分、和/或(v)(i)、(ii)、(iii)或(iv)任何一项的互补链杂交的多核苷酸组成的组。

IV.II和III中任何一项的分离的多核苷酸，在SEQ ID NO：1或SEQ IDNO：3的成熟多肽编码序列中具有至少一个突变，其中核苷酸序列突变体编码包含SEQ ID NO：2的氨基酸1-409或SEQ ID NO：4的氨基酸1-410的多肽。

V.含II-IV中任何一项的多核苷酸的核酸构建体，其中多核苷酸操作性地与一个或多个指导表达宿主产生多肽的控制序列相连。

VI.包含V的核酸构建体的重组表达载体。

VII.包含V的核酸构建体的重组宿主细胞。

VIII.生产I的多肽的方法，包含(a)在有助于生产多肽的条件下培养其野生型能产生多肽的细胞；和(b)回收多肽。

IX.生产I的多肽的方法，包含(a)在有助于生产多肽的条件下培养包含核酸构建体的重组宿主细胞，其中核酸构建体包含编码该多肽的核苷酸序列；和(b)回收多肽。

X.已经用编码I的多肽的多核苷酸转化的转基因植物、植物部分或植物细胞。

XI.能表达I的多肽的转基因非人动物，以及其产物或元件。

XII.I的至少一种多肽在动物饲料中的用途。

XIII.I的至少一种多肽在制备用于动物饲料的组合物中的用途。

XIV.改善动物饲料营养价值的方法，其中I的至少一种多肽被添加到饲料中。

XV.动物饲料添加剂，包含(a)权利要求1的至少一种多肽；和(b)至少一种脂溶性维生素，(c)至少一种水溶性维生素、和/或(d)至少一种微量矿物质。

XVI.XV的动物饲料添加剂，更进一步地包含至少一种淀粉酶、至少一种附加的肌醇六磷酸酶、至少一种木聚糖酶、至少一种半乳聚糖酶、至少一种α-半乳糖苷酶、至少一种蛋白酶、至少一种磷脂酶和/或至少一种β-葡聚糖酶。

XVII.XVI的动物饲料添加剂，其中附加的肌醇六磷酸酶的pH最适条件比具有SEQ ID NO：2的氨基酸1-409或SEQ ID NO：4的氨基酸1-410的氨基酸序列的多肽的pH最适条件高。

XVIII.粗蛋白含量为50-800g/kg的包含I的至少一种多肽的动物饲料组合物。

XXI.具有肌醇六磷酸酶活性的分离的多肽，选自由(a)具有与(i)SEQ IDNO：6的氨基酸1-414、和/或(ii)SEQ ID NO：6的成熟多肽部分有至少70％同一性的氨基酸序列的多肽；(b)至少在中等严谨条件下与(i)SEQ ID NO：5的核苷酸67-1308、(ii)SEQ ID NO：5的成熟多肽编码部分、和/或(iii)(i)、(ii)或(iii)任何一项的互补链杂交的多核苷酸编码的多肽；(c)包含一个或多个氨基酸保守替换、缺失和/或插入的(a)(i)-(a)(ii)的任何一个多肽的变体；和(d)(a)(i)-(a)(ii)的任何一个多肽的片段组成的组。

XXII.包含编码XXI的多肽的核苷酸序列的分离的多核苷酸。

XXIII.编码具有肌醇六磷酸酶活性的多肽的分离的多核苷酸，选自由：(a)编码具有与SEQ ID NO：6的氨基酸1-414有至少70％同一性的氨基酸序列的多肽的多核苷酸；(b)与SEQ ID NO：5的核苷酸67-1308有至少71％同一性的多核苷酸；和(c)至少在中等严谨条件下与(i)SEQ ID NO：5的核苷酸67-1308、(ii)SEQ ID NO：5的成熟多肽编码部分、和/或(iii)(i)、(ii)或(iii)任何一项的互补链杂交的多核苷酸组成的组。

XXIV.XXII和XXIII任何一项的分离的多核苷酸，在SEQ ID NO：5的成熟多肽编码序列中有至少一个突变，其中核苷酸序列突变体编码包含SEQ ID NO：6的氨基酸1-414的多肽。

XXV.包含XXII-XXIV中任何一项的多核苷酸的核酸构建体，其中多核苷酸操作性地与一个或多个指导表达宿主产生多肽的控制序列相连。

XXVI.包含XXV的核酸构建体的重组表达载体。

XXVII.包含XXV的核酸构建体的重组宿主细胞。

XXIIX.生产XXI的多肽的方法，包含(a)在有助于生产多肽的条件下培养其野生型能产生该多肽的细胞；和(b)回收多肽。

XXIX.生产XXI的多肽的方法，包含(a)在有助于生产多肽的条件下培养包含核酸构建体的重组宿主细胞，其中核酸构建体包含编码该多肽的核苷酸序列；和(b)回收多肽。

XXX.已经用编码XXI的多肽的多核苷酸转化的转基因植物、植物部分或植物细胞。

XXXI.能表达XXI的多肽的转基因非人动物，以及其产物或元件。

XXXII.XXI的至少一种多肽在动物饲料中的用途。

XXXIII.XXI的至少一种多肽在制备用于动物饲料的组合物中的用途。

XXXIV.改善动物饲料营养价值的方法，其中XXI的至少一种多肽被添加到饲料中。

XXXV.动物饲料添加剂，包含(a)XXI的至少一种多肽；和(b)至少一种脂溶性维生素，(c)至少一种水溶性维生素、和/或(d)至少一种微量矿物质。

XXXVI.XXXV的动物饲料添加剂，更进一步地包含至少一种淀粉酶、至少一种附加的肌醇六磷酸酶、至少一种木聚糖酶、至少一种半乳聚糖酶、至少一种α-半乳糖苷酶、至少一种蛋白酶、至少一种磷脂酶和/或至少一种β-葡聚糖酶。

XXXVII.XXXVI的动物饲料添加剂，其中附加的肌醇六磷酸酶的pH最适条件比具有SEQ ID NO：6的氨基酸1-414的氨基酸序列的多肽的pH最适条件高。

XXXIIX.粗蛋白含量为50-800g/kg的包含XXI的至少一种多肽的动物饲料组合物。

本发明在这里描述和要求保护的内容并不限于这里公开的特定方案，因为这些方案只是用于解释说明本发明的几个方案。规定任何等效方案都在本发明的范围内。实际上，在上述内容的基础上，这里显示和描述的方案之外的各种修饰对本领域熟练技术人员来说都是很明显的。这种修饰也在附加的权利要求的范围内。在发生冲突的情况下，本发明中包含定义的公开内容将起控制作用。

这里引用的各种参考文献的公开内容全部引入作为参考。

序列表

<110>诺维信公司(Novozymes A/S)

<120>具有肌醇六磷酸酶活性的多肽和编码它的多核苷酸

<130>10676.504-WO

<160>18

<170>PatentIn version 3.3

<210>1

<211>1296

<212>DNA

<213>人工的

<220>

<223>SEQ ID NO：3的变体

(T99G+C102G+C105T+C108G+A109T+G110C+T111C+T117C+C975T+A989C+T991(-)

+C992(-)+A1005(-))

<220>

<221>CDS

<222>(1)..(1293)

<220>

<221>mat_peptide

<222>(67)..(1293)

<400>1

atg agt aca ctg atc att cgt tta ttg ttc tta acg att ata ttg gcc 48

Met Ser Thr Leu Ile Ile Arg Leu Leu Phe Leu Thr Ile Ile Leu Ala

-20 -15 -10

cct gtt tca tta cgc gcc gat gaa cag agc gga atg cag ctt gag cgt 96

Pro Val Ser Leu Arg Ala Asp Glu Gln Ser Gly Met Gln Leu Glu Arg

-5 -1 1 5 10

gtg gtg att gtg tcc cgt cac ggc gtc agg gca ccg aca aag ttc acg 144

Val Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Phe Thr

15 20 25

ccg ctt atg cag caa gtc act ccc gac cgc tgg ccg caa tgg gac gtt 192

Pro Leu Met Gln Gln Val Thr Pro Asp Arg Trp Pro Gln Trp Asp Val

30 35 40

cct ctg ggg tgg ttg act cct cgc ggc ggg gca ctc att act gag tta 240

Pro Leu Gly Trp Leu Thr Pro Arg Gly Gly Ala Leu Ile Thr Glu Leu

45 50 55

gga cgg tat caa cgt tta cgc ctg gcg gac aaa ggt ctg ctg gat aat 288

Gly Arg Tyr Gln Arg Leu Arg Leu Ala Asp Lys Gly Leu Leu Asp Asn

60 65 70

aaa acg tgt cca acg gca ggg cag gtc gcg gtc att gcc gat agc gat 336

Lys Thr Cys Pro Thr Ala Gly Gln Val Ala Val Ile Ala Asp Ser Asp

75 80 85 90

caa cgt acc cgt aaa acg ggt gaa gca ttc ctg gca gga ctg gct ccg 384

Gln Arg Thr Arg Lys Thr Gly Glu Ala Phe Leu Ala Gly Leu Ala Pro

95 100 105

gaa tgt aaa gta cag gtt tat tat caa caa gat aag tca aaa tct gat 432

Glu Cys Lys Val Gln Val Tyr Tyr Gln Gln Asp Lys Ser Lys Ser Asp

110 115 120

ccc ctt ttt aat ccc atc aag gcg ggg cgg tgt tcg ctg aac aca tcg 480

Pro Leu Phe Asn Pro Ile Lys Ala Gly Arg Cys Ser Leu Asn Thr Ser

125 130 135

cag gtg aaa gag gcc atc ctg acc cgg gct ggc gga agt ctt gat gag 528

Gln Val Lys Glu Ala Ile Leu Thr Arg Ala Gly Gly Ser Leu Asp Glu

140 145 150

tac acg cgc cac tac caa ccc gca ttt caa gcc ctg gaa cgg gtg tta 576

Tyr Thr Arg His Tyr Gln Pro Ala Phe Gln Ala Leu Glu Arg Val Leu

155 160 165 170

aat ttc tcc cag tca gaa aag tgt caa gca gct ggg cag tct gca cag 624

Asn Phe Ser Gln Ser Glu Lys Cys Gln Ala Ala Gly Gln Ser Ala Gln

175 180 185

tgt acg cta acc gac gtc tta cct gct gaa ctc aag gtc tct cca gaa 672

Cys Thr Leu Thr Asp Val Leu Pro Ala Glu Leu Lys Val Ser Pro Glu

190 195 200

aat ata tcg ttg tca ggc tca tgg gga ctg gct tca acc ctg acg gaa 720

Asn Ile Ser Leu Ser Gly Ser Trp Gly Leu Ala Ser Thr Leu Thr Glu

205 210 215

atc ttc ctg ctg caa caa gca caa ggg atg tcg cag gtg gcc tgg ggg 768

Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Ser Gln Val Ala Trp Gly

220 225 230

cgt att cat ggc gat aaa gaa tgg cgt aca tta tta agt ctg cac aat 816

Arg Ile His Gly Asp Lys Glu Trp Arg Thr Leu Leu Ser Leu His Asn

235 240 245 250

gcg cag ttt gac ctt ctg cag aaa acc ccg gag gtt gcc cgt agc agg 864

Ala Gln Phe Asp Leu Leu Gln Lys Thr Pro Glu Val Ala Arg Ser Arg

255 260 265

gcc aca ccg tta ctt gat ttg ata cgt aca gca ctc gta aca cag ggg 912

Ala Thr Pro Leu Leu Asp Leu Ile Arg Thr Ala Leu Val Thr Gln Gly

270 275 280

gca aca gaa aat aaa tac gca att cag ttg ccc gtc tct ttg ttg ttt 960

Ala Thr Glu Asn Lys Tyr Ala Ile Gln Leu Pro Val Ser Leu Leu Phe

285 290 295

att gcg ggg cat gat acc aat ctt gcc act aag cgg ggc att ggc ctt 1008

Ile Ala Gly His Asp Thr Asn Leu Ala Thr Lys Arg Gly Ile Gly Leu

300 305 310

aac gtg ttt ctg ccc ggt cag cca gat aat acg ccg ccg ggt gga gag 1056

Asn Val Phe Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu

315 320 325 330

ttt gtt ttc gaa agg tgg aaa cgg gtc agc gat cat tct gat tgg gtg 1104

Phe Val Phe Glu Arg Trp Lys Arg Val Ser Asp His Ser Asp Trp Val

335 340 345

cag gtt tct ttt atg tat cag aca ttg cag gaa atg cgt gat atg caa 1152

Gln Val Ser Phe Met Tyr Gln Thr Leu Gln Glu Met Arg Asp Met Gln

350 355 360

cct ttg tcg ttg caa tcg cct ccc gga aaa att gtg ctg ccc tta gcg 1200

Pro Leu Ser Leu Gln Ser Pro Pro Gly Lys Ile Val Leu Pro Leu Ala

365 370 375

gcc tgc gat gag aaa aat acg cag gga atg tgc tca tta aaa aat ttt 1248

Ala Cys Asp Glu Lys Asn Thr Gln Gly Met Cys Ser Leu Lys Asn Phe

380 385 390

tct gca ctg att gat tcc gtt cgc gtg tcc gaa tgt gct gag aaa taa 1296

Ser Ala Leu Ile Asp Ser Val Arg Val Ser Glu Cys Ala Glu Lys

395 400 405

<210>2

<211>431

<212>PRT

<213>人工的

<220>

<223>合成构建体

<400>2

Met Ser Thr Leu Ile Ile Arg Leu Leu Phe Leu Thr Ile Ile Leu Ala

-20 -15 -10

Pro Val Ser Leu Arg Ala Asp Glu Gln Ser Gly Met Gln Leu Glu Arg

-5 -1 1 5 10

Val Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Phe Thr

15 20 25

Pro Leu Met Gln Gln Val Thr Pro Asp Arg Trp Pro Gln Trp Asp Val

30 35 40

Pro Leu Gly Trp Leu Thr Pro Arg Gly Gly Ala Leu Ile Thr Glu Leu

45 50 55

Gly Arg Tyr Gln Arg Leu Arg Leu Ala Asp Lys Gly Leu Leu Asp Asn

60 65 70

Lys Thr Cys Pro Thr Ala Gly Gln Val Ala Val Ile Ala Asp Ser Asp

75 80 85 90

Gln Arg Thr Arg Lys Thr Gly Glu Ala Phe Leu Ala Gly Leu Ala Pro

95 100 105

Glu Cys Lys Val Gln Val Tyr Tyr Gln Gln Asp Lys Ser Lys Ser Asp

110 115 120

Pro Leu Phe Asn Pro Ile Lys Ala Gly Arg Cys Ser Leu Asn Thr Ser

125 130 135

Gln Val Lys Glu Ala Ile Leu Thr Arg Ala Gly Gly Ser Leu Asp Glu

140 145 150

Tyr Thr Arg His Tyr Gln Pro Ala Phe Gln Ala Leu Glu Arg Val Leu

155 160 165 170

Asn Phe Ser Gln Ser Glu Lys Cys Gln Ala Ala Gly Gln Ser Ala Gln

175 180 185

Cys Thr Leu Thr Asp Val Leu Pro Ala Glu Leu Lys Val Ser Pro Glu

190 195 200

Asn Ile Ser Leu Ser Gly Ser Trp Gly Leu Ala Ser Thr Leu Thr Glu

205 210 215

Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Ser Gln Val Ala Trp Gly

220 225 230

Arg Ile His Gly Asp Lys Glu Trp Arg Thr Leu Leu Ser Leu His Asn

235 240 245 250

Ala Gln Phe Asp Leu Leu Gln Lys Thr Pro Glu Val Ala Arg Ser Arg

255 260 265

Ala Thr Pro Leu Leu Asp Leu Ile Arg Thr Ala Leu Val Thr Gln Gly

270 275 280

Ala Thr Glu Asn Lys Tyr Ala Ile Gln Leu Pro Val Ser Leu Leu Phe

285 290 295

Ile Ala Gly His Asp Thr Asn Leu Ala Thr Lys Arg Gly Ile Gly Leu

300 305 310

Asn Val Phe Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu

315 320 325 330

Phe Val Phe Glu Arg Trp Lys Arg Val Ser Asp His Ser Asp Trp Val

335 340 345

Gln Val Ser Phe Met Tyr Gln Thr Leu Gln Glu Met Arg Asp Met Gln

350 355 360

Pro Leu Ser Leu Gln Ser Pro Pro Gly Lys Ile Val Leu Pro Leu Ala

365 370 375

Ala Cys Asp Glu Lys Asn Thr Gln Gly Met Cys Ser Leu Lys Asn Phe

380 385 390

Ser Ala Leu Ile Asp Ser Val Arg Val Ser Glu Cys Ala Glu Lys

395 400 405

<210>3

<211>1296

<212>DNA

<213>Citrobacter gillenii DSM 13694

<220>

<221>CDS

<222>(1)..(1296)

<220>

<221>mat_peptide

<222>(67)..(1296)

<400>3

atg agt aca ctg atc att cgt tta ttg ttc tta acg att ata ttg gcc 48

Met Ser Thr Leu Ile Ile Arg Leu Leu Phe Leu Thr Ile Ile Leu Ala

-20 -15 -10

cct gtt tca tta cgc gcc gat gaa cag agc gga atg cag ctt gag cgt 96

Pro Val Ser Leu Arg Ala Asp Glu Gln Ser Gly Met Gln Leu Glu Arg

-5 -1 1 5 10

gtt gtc atc gtc agt cgt cat ggc gtc agg gca ccg aca aag ttc acg 144

Val Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Phe Thr

15 20 25

ccg ctt atg cag caa gtc act ccc gac cgc tgg ccg caa tgg gac gtt 192

Pro Leu Met Gln Gln Val Thr Pro Asp Arg Trp Pro Gln Trp Asp Val

30 35 40

cct ctg ggg tgg ttg act cct cgc ggc ggg gca ctc att act gag tta 240

Pro Leu Gly Trp Leu Thr Pro Arg Gly Gly Ala Leu Ile Thr Glu Leu

45 50 55

gga cgg tat caa cgt tta cgc ctg gcg gac aaa ggt ctg ctg gat aat 288

Gly Arg Tyr Gln Arg Leu Arg Leu Ala Asp Lys Gly Leu Leu Asp Asn

60 65 70

aaa acg tgt cca acg gca ggg cag gtc gcg gtc att gcc gat agc gat 336

Lys Thr Cys Pro Thr Ala Gly Gln Val Ala Val Ile Ala Asp Ser Asp

75 80 85 90

caa cgt acc cgt aaa acg ggt gaa gca ttc ctg gca gga ctg gct ccg 384

Gln Arg Thr Arg Lys Thr Gly Glu Ala Phe Leu Ala Gly Leu Ala Pro

95 100 105

gaa tgt aaa gta cag gtt tat tat caa caa gat aag tca aaa tct gat 432

Glu Cys Lys Val Gln Val Tyr Tyr Gln Gln Asp Lys Ser Lys Ser Asp

110 115 120

ccc ctt ttt aat ccc atc aag gcg ggg cgg tgt tcg ctg aac aca tcg 480

Pro Leu Phe Asn Pro Ile Lys Ala Gly Arg Cys Ser Leu Asn Thr Ser

125 130 135

cag gtg aaa gag gcc atc ctg acc cgg gct ggc gga agt ctt gat gag 528

Gln Val Lys Glu Ala Ile Leu Thr Arg Ala Gly Gly Ser Leu Asp Glu

140 145 150

tac acg cgc cac tac caa ccc gca ttt caa gcc ctg gaa cgg gtg tta 576

Tyr Thr Arg His Tyr Gln Pro Ala Phe Gln Ala Leu Glu Arg Val Leu

155 160 165 170

aat ttc tcc cag tca gaa aag tgt caa gca gct ggg cag tct gca cag 624

Asn Phe Ser Gln Ser Glu Lys Cys Gln Ala Ala Gly Gln Ser Ala Gln

175 180 185

tgt acg cta acc gac gtc tta cct gct gaa ctc aag gtc tct cca gaa 672

Cys Thr Leu Thr Asp Val Leu Pro Ala Glu Leu Lys Val Ser Pro Glu

190 195 200

aat ata tcg ttg tca ggc tca tgg gga ctg gct tca acc ctg acg gaa 720

Asn Ile Ser Leu Ser Gly Ser Trp Gly Leu Ala Ser Thr Leu Thr Glu

205 210 215

atc ttc ctg ctg caa caa gca caa ggg atg tcg cag gtg gcc tgg ggg 768

Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Ser Gln Val Ala Trp Gly

220 225 230

cgt att cat ggc gat aaa gaa tgg cgt aca tta tta agt ctg cac aat 816

Arg Ile His Gly Asp Lys Glu Trp Arg Thr Leu Leu Ser Leu His Asn

235 240 245 250

gcg cag ttt gac ctt ctg cag aaa acc ccg gag gtt gcc cgt agc agg 864

Ala Gln Phe Asp Leu Leu Gln Lys Thr Pro Glu Val Ala Arg Ser Arg

255 260 265

gcc aca ccg tta ctt gat ttg ata cgt aca gca ctc gta aca cag ggg 912

Ala Thr Pro Leu Leu Asp Leu Ile Arg Thr Ala Leu Val Thr Gln Gly

270 275 280

gca aca gaa aat aaa tac gca att cag ttg ccc gtc tct ttg ttg ttt 960

Ala Thr Glu Asn Lys Tyr Ala Ile Gln Leu Pro Val Ser Leu Leu Phe

285 290 295

att gcg ggg cat gac acc aat ctt gcc aat atc agc ggg gca tta ggc 1008

Ile Ala Gly His Asp Thr Asn Leu Ala Asn Ile Ser Gly Ala Leu Gly

300 305 310

ctt aac gtg ttt ctg ccc ggt cag cca gat aat acg ccg ccg ggt gga 1056

Leu Asn Val Phe Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly

315 320 325 330

gag ttt gtt ttc gaa agg tgg aaa cgg gtc agc gat cat tct gat tgg 1104

Glu Phe Val Phe Glu Arg Trp Lys Arg Val Ser Asp His Ser Asp Trp

335 340 345

gtg cag gtt tct ttt atg tat cag aca ttg cag gaa atg cgt gat atg 1152

Val Gln Val Ser Phe Met Tyr Gln Thr Leu Gln Glu Met Arg Asp Met

350 355 360

caa cct ttg tcg ttg caa tcg cct ccc gga aaa att gtg ctg ccc tta 1200

Gln Pro Leu Ser Leu Gln Ser Pro Pro Gly Lys Ile Val Leu Pro Leu

365 370 375

gcg gcc tgc gat gag aaa aat acg cag gga atg tgc tca tta aaa aat 1248

Ala Ala Cys Asp Glu Lys Asn Thr Gln Gly Met Cys Ser Leu Lys Asn

380 385 390

ttt tct gca ctg att gat tcc gtt cgc gtg tcc gaa tgt gct gag aaa 1296

Phe Ser Ala Leu Ile Asp Ser Val Arg Val Ser Glu Cys Ala Glu Lys

395 400 405 410

<210>4

<211>432

<212>PRT

<213>Citrobacter gillenii DSM 13694

<400>4

Met Ser Thr Leu Ile Ile Arg Leu Leu Phe Leu Thr Ile Ile Leu Ala

-20 -15 -10

Pro Val Ser Leu Arg Ala Asp Glu Gln Ser Gly Met Gln Leu Glu Arg

-5 -1 1 5 10

Val Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Phe Thr

15 20 25

Pro Leu Met Gln Gln Val Thr Pro Asp Arg Trp Pro Gln Trp Asp Val

30 35 40

Pro Leu Gly Trp Leu Thr Pro Arg Gly Gly Ala Leu Ile Thr Glu Leu

45 50 55

Gly Arg Tyr Gln Arg Leu Arg Leu Ala Asp Lys Gly Leu Leu Asp Asn

60 65 70

Lys Thr Cys Pro Thr Ala Gly Gln Val Ala Val Ile Ala Asp Ser Asp

75 80 85 90

Gln Arg Thr Arg Lys Thr Gly Glu Ala Phe Leu Ala Gly Leu Ala Pro

95 100 105

Glu Cys Lys Val Gln Val Tyr Tyr Gln Gln Asp Lys Ser Lys Ser Asp

110 115 120

Pro Leu Phe Asn Pro Ile Lys Ala Gly Arg Cys Ser Leu Asn Thr Ser

125 130 135

Gln Val Lys Glu Ala Ile Leu Thr Arg Ala Gly Gly Ser Leu Asp Glu

140 145 150

Tyr Thr Arg His Tyr Gln Pro Ala Phe Gln Ala Leu Glu Arg Val Leu

155 160 165 170

Asn Phe Ser Gln Ser Glu Lys Cys Gln Ala Ala Gly Gln Ser Ala Gln

175 180 185

Cys Thr Leu Thr Asp Val Leu Pro Ala Glu Leu Lys Val Ser Pro Glu

190 195 200

Asn Ile Ser Leu Ser Gly Ser Trp Gly Leu Ala Ser Thr Leu Thr Glu

205 210 215

Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Ser Gln Val Ala Trp Gly

220 225 230

Arg Ile His Gly Asp Lys Glu Trp Arg Thr Leu Leu Ser Leu His Asn

235 240 245 250

Ala Gln Phe Asp Leu Leu Gln Lys Thr Pro Glu Val Ala Arg Ser Arg

255 260 265

Ala Thr Pro Leu Leu Asp Leu Ile Arg Thr Ala Leu Val Thr Gln Gly

270 275 280

Ala Thr Glu Asn Lys Tyr Ala Ile Gln Leu Pro Val Ser Leu Leu Phe

285 290 295

Ile Ala Gly His Asp Thr Asn Leu Ala Asn Ile Ser Gly Ala Leu Gly

300 305 310

Leu Asn Val Phe Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly

315 320 325 330

Glu Phe Val Phe Glu Arg Trp Lys Arg Val Ser Asp His Ser Asp Trp

335 340 345

Val Gln Val Ser Phe Met Tyr Gln Thr Leu Gln Glu Met Arg Asp Met

350 355 360

Gln Pro Leu Ser Leu Gln Ser Pro Pro Gly Lys Ile Val Leu Pro Leu

365 370 375

Ala Ala Cys Asp Glu Lys Asn Thr Gln Gly Met Cys Ser Leu Lys Asn

380 385 390

Phe Ser Ala Leu Ile Asp Ser Val Arg Val Ser Glu Cys Ala Glu Lys

395 400 405 410

<210>5

<211>1311

<212>DNA

<213>无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25407

<220>

<221>CDS

<222>(1)..(1308)

<220>

<221>mat_peptide

<222>(67)..(1308)

<400>5

atg aat acg cta ctt ttt cga tta ata atg ttt ata ttc atg ttt ggt 48

Met Asn Thr Leu Leu Phe Arg Leu Ile Met Phe Ile Phe Met Phe Gly

-20 -15 -10

tct ttc cca tta cag gcg gaa gtg cca gat gac atg aag ctt gaa cga 96

Ser Phe Pro Leu Gln Ala Glu Val Pro Asp Asp Met Lys Leu Glu Arg

-5 -1 1 5 10

gtt gtg ata gta agt cgc cac ggt gta aga gca cca aca aag ttc acc 144

Val Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Phe Thr

15 20 25

cca ttg atg cag gaa atc aca cct tac cat tgg ccg caa tgg gat gtt 192

Pro Leu Met Gln Glu Ile Thr Pro Tyr His Trp Pro Gln Trp Asp Val

30 35 40

ccc ctg ggc tgg ttg acg gct cgg ggt ggt gag ctc gtc acc gaa atg 240

Pro Leu Gly Trp Leu Thr Ala Arg Gly Gly Glu Leu Val Thr Glu Met

45 50 55

gga cga tat caa caa aaa gta tta atc gat aac ggc gtt ctg gaa agt 288

Gly Arg Tyr Gln Gln Lys Val Leu Ile Asp Asn Gly Val Leu Glu Ser

60 65 70

aat gta tgt ccg tca cca gaa cag gtg gca gtt att gcc gat acc gat 336

Asn Val Cys Pro Ser Pro Glu Gln Val Ala Val Ile Ala Asp Thr Asp

75 80 85 90

cag cgc act cgt aaa acc ggt gag gca ttt ctg gct gga ttt gcg ccg 384

Gln Arg Thr Arg Lys Thr Gly Glu Ala Phe Leu Ala Gly Phe Ala Pro

95 100 105

gga tgt aaa aat aag gtt cat tat caa aaa gat cac gat aaa aaa gat 432

Gly Cys Lys Asn Lys Val His Tyr Gln Lys Asp His Asp Lys Lys Asp

110 115 120

cct ctt ttt aat cca gta aaa atg ggg gtg tgc gct ttt aat gta caa 480

Pro Leu Phe Asn Pro Val Lys Met Gly Val Cys Ala Phe Asn Val Gln

125 130 135

aaa act cag gaa gcg att ctg aca cgt gcg gaa gga aac att gaa cgg 528

Lys Thr Gln Glu Ala Ile Leu Thr Arg Ala Glu Gly Asn Ile Glu Arg

140 145 150

tac act cag cgt tat gac tct gca ttc cgt act ctg gaa cag gtt ctc 576

Tyr Thr Gln Arg Tyr Asp Ser Ala Phe Arg Thr Leu Glu Gln Val Leu

155 160 165 170

aat ttc tcc cgg tca gca gca tgc cga tca gca agc cag tct ggt tgc 624

Asn Phe Ser Arg Ser Ala Ala Cys Arg Ser Ala Ser Gln Ser Gly Cys

175 180 185

acg cta cca gga acc tta cct tca gaa ctc agg gtt tct gcg gat acc 672

Thr Leu Pro Gly Thr Leu Pro Ser Glu Leu Arg Val Ser Ala Asp Thr

190 195 200

gtt tcc tta tct ggc gcg tgg agt ctt tct tcc atg ctg acg gaa ata 720

Val Ser Leu Ser Gly Ala Trp Ser Leu Ser Ser Met Leu Thr Glu Ile

205 210 215

ttt cta ttg caa gag gcg cag gga atg cca gag gtt gcg tgg ggg cga 768

Phe Leu Leu Gln Glu Ala Gln Gly Met Pro Glu Val Ala Trp Gly Arg

220 225 230

att cat ggg gag aaa gaa tgg aca gcg tta tta agt ctg cat aat gct 816

Ile His Gly Glu Lys Glu Trp Thr Ala Leu Leu Ser Leu His Asn Ala

235 240 245 250

cag ttt gac ctt ttg caa aga act ccc gaa gtt gcc cgc agc aga gca 864

Gln Phe Asp Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala

255 260 265

aca cca tta ctc gat ttg atc agc gaa gca tta gtg agt aat ggg tca 912

Thr Pro Leu Leu Asp Leu Ile Ser Glu Ala Leu Val Ser Asn Gly Ser

270 275 280

aca gaa aat cat tac gga att aaa tta ccc gtc tca tta ttg ttt att 960

Thr Glu Asn His Tyr Gly Ile Lys Leu Pro Val Ser Leu Leu Phe Ile

285 290 295

gct ggt cat gat acc aat ctt gca aat ctc agt ggg gta ttt gat ctt 1008

Ala Gly His Asp Thr Asn Leu Ala Asn Leu Ser Gly Val Phe Asp Leu

300 305 310

aac tgg tct cta cct ggg cag cca gat aat aca cct cct ggc ggg gag 1056

Asn Trp Ser Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu

315 320 325 330

ctg gtt ttc gaa aga tgg acg cga gtg agt gat aac act gac tgg att 1104

Leu Val Phe Glu Arg Trp Thr Arg Val Ser Asp Asn Thr Asp Trp Ile

335 340 345

caa att tcg ttt gtt tat cag act ctt caa caa atg cgt aag ttt aaa 1152

Gln Ile Ser Phe Val Tyr Gln Thr Leu Gln Gln Met Arg Lys Phe Lys

350 355 360

cct ttt tca tct tcg tct ctc cca aac aag att gtg ctt acg ttg ccc 1200

Pro Phe Ser Ser Ser Ser Leu Pro Asn Lys Ile Val Leu Thr Leu Pro

365 370 375

tct tgc cag gat aaa aat cct gag ggt atg tgt cca tta aag cat ttt 1248

Ser Cys Gln Asp Lys Asn Pro Glu Gly Met Cys Pro Leu Lys His Phe

380 385 390

att gac att gtg cag aca gca cgt att cca caa tgt gca gtg atg gct 1296

Ile Asp Ile Val Gln Thr Ala Arg Ile Pro Gln Cys Ala Val Met Ala

395 400 405 410

gat gta aac cgt taa 1311

Asp Val Asn Arg

<210>6

<211>436

<212>PRT

<213>无丙二酸柠檬酸杆菌ATCC 25407

<400>6

Met Asn Thr Leu Leu Phe Arg Leu Ile Met Phe Ile Phe Met Phe Gly

-20 -15 -10

Ser Phe Pro Leu Gln Ala Glu Val Pro Asp Asp Met Lys Leu Glu Arg

-5 -1 1 5 10

Val Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Phe Thr

15 20 25

Pro Leu Met Gln Glu Ile Thr Pro Tyr His Trp Pro Gln Trp Asp Val

30 35 40

Pro Leu Gly Trp Leu Thr Ala Arg Gly Gly Glu Leu Val Thr Glu Met

45 50 55

Gly Arg Tyr Gln Gln Lys Val Leu Ile Asp Asn Gly Val Leu Glu Ser

60 65 70

Asn Val Cys Pro Ser Pro Glu Gln Val Ala Val Ile Ala Asp Thr Asp

75 80 85 90

Gln Arg Thr Arg Lys Thr Gly Glu Ala Phe Leu Ala Gly Phe Ala Pro

95 100 105

Gly Cys Lys Asn Lys Val His Tyr Gln Lys Asp His Asp Lys Lys Asp

110 115 120

Pro Leu Phe Asn Pro Val Lys Met Gly Val Cys Ala Phe Asn Val Gln

125 130 135

Lys Thr Gln Glu Ala Ile Leu Thr Arg Ala Glu Gly Asn Ile Glu Arg

140 145 150

Tyr Thr Gln Arg Tyr Asp Ser Ala Phe Arg Thr Leu Glu Gln Val Leu

155 160 165 170

Asn Phe Ser Arg Ser Ala Ala Cys Arg Ser Ala Ser Gln Ser Gly Cys

175 180 185

Thr Leu Pro Gly Thr Leu Pro Ser Glu Leu Arg Val Ser Ala Asp Thr

190 195 200

Val Ser Leu Ser Gly Ala Trp Ser Leu Ser Ser Met Leu Thr Glu Ile

205 210 215

Phe Leu Leu Gln Glu Ala Gln Gly Met Pro Glu Val Ala Trp Gly Arg

220 225 230

Ile His Gly Glu Lys Glu Trp Thr Ala Leu Leu Ser Leu His Asn Ala

235 240 245 250

Gln Phe Asp Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala

255 260 265

Thr Pro Leu Leu Asp Leu Ile Ser Glu Ala Leu Val Ser Asn Gly Ser

270 275 280

Thr Glu Asn His Tyr Gly Ile Lys Leu Pro Val Ser Leu Leu Phe Ile

285 290 295

Ala Gly His Asp Thr Asn Leu Ala Asn Leu Ser Gly Val Phe Asp Leu

300 305 310

Asn Trp Ser Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu

315 320 325 330

Leu Val Phe Glu Arg Trp Thr Arg Val Ser Asp Asn Thr Asp Trp Ile

335 340 345

Gln Ile Ser Phe Val Tyr Gln Thr Leu Gln Gln Met Arg Lys Phe Lys

350 355 360

Pro Phe Ser Ser Ser Ser Leu Pro Asn Lys Ile Val Leu Thr Leu Pro

365 370 375

Ser Cys Gln Asp Lys Asn Pro Glu Gly Met Cys Pro Leu Lys His Phe

380 385 390

Ile Asp Ile Val Gln Thr Ala Arg Ile Pro Gln Cys Ala Val Met Ala

395 400 405 410

Asp Val Asn Arg

<210>7

<211>29

<212>DNA

<213>人工的

<220>

<223>引物

<220>

<221>misc_feature

<222>(19)..(19)

<223>m是A，或C

<220>

<221>misc_feature

<222>(21)..(21)

<223>n是a，c，g，或t

<220>

<221>misc_feature

<222>(24)..(24)

<223>y是C，或T

<220>

<221>misc_feature

<222>(27)..(27)

<223>n是a，c，g，或t

<400>7

cgcgtggtga ttgtgtccmg ncayggngt 29

<210>8

<211>28

<212>DNA

<213>人工的

<220>

<223>引物

<220>

<221>misc_feature

<222>(20)..(20)

<223>n是a，c，g，或t

<220>

<221>misc_feature

<222>(23)..(23)

<223>d是A，G，或T

<220>

<221>misc_feature

<222>(26)..(26)

<223>r是A，或G

<400>8

ccaggttggt atcatggccn gcdatraa 28

<210>9

<211>17

<212>DNA

<213>人工的

<220>

<223>引物

<400>9

agacttccgc cagcccg 17

<210>10

<211>19

<212>DNA

<213>人工的

<220>

<223>引物

<400>10

aagcagctgg gcagtctgc 19

<210>11

<211>21

<212>DNA

<213>人工的

<220>

<223>引物

<400>11

aagcggcgtg aactttgtcg g 21

<210>12

<211>22

<212>DNA

<213>人工的

<220>

<223>引物

<400>12

atggggactg gcttcaaccc tg 22

<210>13

<211>29

<212>DNA

<213>人工的

<220>

<223>引物

<220>

<221>misc_feature

<222>(19)..(19)

<223>m是A，或C

<220>

<221>misc_feature

<222>(21)..(21)

<223>n是a，c，g，或t

<220>

<221>misc_feature

<222>(24)..(24)

<223>y是C，或T

<220>

<221>misc_feature

<222>(27)..(27)

<223>n是a，c，g，或t

<400>13

cgcgtggtga ttgtgtccmg ncayggngt 29

<210>14

<211>28

<212>DNA

<213>人工的

<220>

<223>引物

<220>

<221>misc_feature

<222>(20)..(20)

<223>n是a，c，g，或t

<220>

<221>misc_feature

<222>(23)..(23)

<223>d是A，G，或T

<220>

<221>misc_feature

<222>(26)..(26)

<223>r是A，或G

<400>14

ccaggttggt atcatggccn gcdatraa 28

<210>15

<211>20

<212>DNA

<213>人工的

<220>

<223>引物

<400>15

tttacgagtg cgctgatcgg 20

<210>16

<211>25

<212>DNA

<213>人工的

<220>

<223>引物

<400>16

ataactgcca cctgttctgg tgacg 25

<210>17

<211>22

<212>DNA

<213>人工的

<220>

<223>引物

<400>17

actcagggtt tctgcggata cc 22

<210>18

<211>21

<212>DNA

<213>人工的

<220>

<223>引物

<400>18

aatgccagag gttgcgtggg g 21

Claims

1.具有肌醇六磷酸酶活性的分离的多肽，选自下组：

(a)具有氨基酸序列的多肽，所述氨基酸序列与(i)SEQ ID NO：2的氨基酸1-409、(ii)SEQ ID NO：2的成熟多肽部分、(iii)SEQ ID NO：4的氨基酸1-410、(iv)SEQ ID NO：4的成熟多肽部分、(v)SEQ ID NO：6的氨基酸1-414、和/或(vi)SEQ ID NO：6的成熟多肽部分有至少75％同一性；

(b)由多核苷酸编码的多肽，所述多核苷酸在至少中等严谨条件下与(i)SEQ ID NO：1的核苷酸67-1293、(ii)SEQ ID NO：1的成熟多肽编码部分、(iii)SEQ ID NO：3的核苷酸67-1296、(iv)SEQ ID NO：3的成熟多肽编码部分、(v)SEQ ID NO：5的核苷酸67-1308、(vi)SEQ ID NO：5的成熟多肽编码部分、和/或(vii)(i)、(ii)、(iii)、(iv)、(v)或(vi)任何一项的互补链杂交；

(c)(a)(i)-(a)(vi)任何一个多肽的变体，其包含一个或多个氨基酸缺失、插入和/或保守取代；和

(d)(a)(i)-(a)(vi)的任何一个多肽的片段。

2.分离的多核苷酸，其包含编码权利要求1的多肽的核苷酸序列。

3.编码具有肌醇六磷酸酶活性的多肽的分离的多核苷酸，选自：

(a)编码多肽的多核苷酸，所述多肽具有的氨基酸序列与(i)SEQ ID NO：2的氨基酸1-409、(ii)SEQ ID NO：4的氨基酸1-410和/或(iii)SEQ ID NO：6的氨基酸1-414中的任何一个有至少75％的同一性；

(b)与(i)SEQ ID NO：1的核苷酸67-1293、(ii)SEQ ID NO：3的核苷酸67-1296、和/或(iii)SEQ ID NO：5的核苷酸67-1308中的任何一个有至少75％同一性的多核苷酸；

(c)多核苷酸，其在至少中等严谨条件下与(i)SEQ ID NO：1的核苷酸67-1293、(ii)SEQ ID NO：1的成熟多肽编码部分、(iii)SEQ ID NO：3的核苷酸67-1296、(iv)SEQ ID NO：3的成熟多肽编码部分、(v)SEQ ID NO：5的核苷酸67-1308、(vi)SEQ ID NO：5的成熟多肽编码部分、和/或(vii)(i)、(ii)、(iii)、(iv)、(v)或(vi)任何一项的互补链杂交。

4.权利要求2和3中任何一项的分离的多核苷酸，在SEQ ID NO：1、SEQID NO：3或SEQ ID NO：5的成熟多肽编码序列中具有至少一个突变，其中突变体核苷酸序列编码包含SEQ ID NO：2的氨基酸1-409、SEQ ID NO：4的氨基酸1-410或SEQ ID NO：6的氨基酸1-414的多肽。

5.包含权利要求2-4中任何一项的多核苷酸的核酸构建体，所述多核苷酸可操作地与一个或多个控制序列相连，所述控制序列指导表达宿主产生多肽。

6.包含权利要求5的核酸构建体的重组表达载体。

7.包含权利要求5的核酸构建体的重组宿主细胞。

8.生产权利要求1的多肽的方法，包含(a)在有助于生产多肽的条件下培养其野生型能产生该多肽的细胞；和(b)回收多肽。

9.生产权利要求1的多肽的方法，包含(a)在有助于生产多肽的条件下培养包含核酸构建体的重组宿主细胞，所述核酸构建体包含编码该多肽的核苷酸序列；和(b)回收多肽。

10.已经用编码权利要求1的多肽的多核苷酸转化的转基因植物、植物部分或植物细胞。

11.能表达权利要求1的多肽的转基因非人动物，或产物或其元件。

12.权利要求1的至少一种多肽在动物饲料中的用途。

13.权利要求1的至少一种多肽在制备用于动物饲料的组合物中的用途。

14.改善动物饲料营养价值的方法，其中将权利要求1的至少一种多肽添加到饲料中。

15.动物饲料添加剂，包含(a)权利要求1的至少一种多肽；和(b)至少一种脂溶性维生素，(c)至少一种水溶性维生素、和/或(d)至少一种痕量矿物质。

16.权利要求15的动物饲料添加剂，更进一步地包含至少一种淀粉酶、至少一种附加的肌醇六磷酸酶、至少一种木聚糖酶、至少一种半乳聚糖酶、至少一种α-半乳糖苷酶、至少一种蛋白酶、至少一种磷脂酶和/或至少一种β-葡聚糖酶。

17.动物饲料组合物，其具有粗蛋白含量为50-800g/kg并包含权利要求1的至少一种多肽。