CN106795504A

CN106795504A - 木葡聚糖内糖基转移酶变体以及编码其的多核苷酸

Info

Publication number: CN106795504A
Application number: CN201580054541.5A
Authority: CN
Inventors: D·赫尔德
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2014-08-20
Filing date: 2015-08-20
Publication date: 2017-05-31
Also published as: EP3183339A1; WO2016028999A1; US20170267980A1

Abstract

本发明涉及木葡聚糖内糖基转移酶变体。本发明还涉及编码这些变体的多核苷酸，包含这些多核苷酸的核酸构建体、载体和宿主细胞；以及使用这些变体的方法。

Description

木葡聚糖内糖基转移酶变体以及编码其的多核苷酸

参照序列表

本申请包含计算机可读形式的序列表，将其通过引用结合在此。

发明背景

发明领域

本发明涉及木葡聚糖内糖基转移酶变体、编码这些变体的多核苷酸、产生这些变体的方法以及使用这些变体的方法。

相关领域描述

木葡聚糖内糖基转移酶(XET)是一种催化木葡聚糖(植物细胞壁的结构多糖)的内切-转糖基作用的酶。该酶存在于大多数植物中，并且具体地是陆生植物。已经从双子叶植物和单子叶植物中提取出XET。

还没有在工业微生物中实现商业相关水平的木葡聚糖内糖基转移酶的异源表达。在本领域中，对改进木葡聚糖内糖基转移酶在工业重要微生物中的表达存在需要。

本发明提供了与其亲本相比具有增加的表达产量的木葡聚糖内糖基转移酶变体。

发明概述

本发明涉及分离的木葡聚糖内糖基转移酶变体，这些变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个(例如，若干个)位置处的取代，其中这些变体具有木葡聚糖内糖基转移酶活性。

本发明还涉及编码这些变体的分离的多核苷酸，包含这些多核苷酸的核酸构建体、载体和宿主细胞，以及产生这些变体的方法。

本发明还涉及用于获得这些变体的方法和增加木葡聚糖内糖基转移酶的表达产量的方法。

本发明进一步涉及包括这些变体的组合物。

附图简要说明

图1示出了pMMar27的限制性图谱。

图2示出了pEvFz1的限制性图谱。

图3示出了pDLHD0006的限制性图谱。

图4示出了pDLHD0044的限制性图谱。

图5示出了pDau571的限制性图谱。

图6示出了pDLHD0075的限制性图谱。

图7示出了pDLHD0095的限制性图谱。

定义

等位基因变体：术语“等位基因变体”意指占用同一染色体位点的一种基因的两个或更多个替代形式中的任一者。等位基因变异由突变天然产生，并且可以导致群体内多态性。基因突变可以是沉默的(在所编码的多肽中没有改变)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。

cDNA：术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录本是mRNA的前体，其在呈现为成熟的剪接的mRNA之前要经一系列的步骤进行加工，包括剪接。

编码序列：术语“编码序列”意指直接指明变体的氨基酸序列的多核苷酸。编码序列的边界一般由一个开放阅读框架决定，该开放阅读框架从一个起始密码子(如ATG、GTG或TTG)开始并且以一个终止密码子(如TAA、TAG或TGA)结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。

控制序列：术语“控制序列”意指对于表达编码本发明的变体的多核苷酸所必需的核酸序列。每个控制序列对于编码该变体的多核苷酸来说可以是原生的(即，来自相同基因)或外源的(即，来自不同基因)，或相对于彼此是原生的或外源的。这些调控序列包括但不局限于前导子、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少，控制序列包括启动子，以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码变体的多核苷酸的编码区连接的特异性限制酶切位点的目的，这些控制序列可以提供有多个接头。

表达：术语“表达”包括涉及变体产生的任何步骤，包括但不限于，转录、转录后修饰、翻译、翻译后修饰以及分泌。

表达载体：术语“表达载体”意指线性或环状DNA分子，该分子包括编码变体的多核苷酸并且该多核苷酸可操作地与提供用于其表达的控制序列相连接。

片段：术语“片段”意指具有从成熟多肽的氨基和/或羧基末端缺失一个或多个(例如，数个)的氨基酸的多肽；其中该片段具有木葡聚糖内糖基转移酶活性。在一个方面中，片段包含成熟多肽的至少85％、至少90％、或至少95％的氨基酸残基。

宿主细胞：术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。

改进的特性：术语“改进的特性”意指与变体相关的与亲本相比得到改进的特征。在本发明中，改进的特性是相对于亲本，变体的增加的表达产量。

增加的表达产量：术语“增加的表达产量”意指相对于在相同的培养条件下，培养每升表达亲本基因的相同的宿主细胞产生的分泌的活性酶的量(g)，来自培养每升表达变体基因的宿主细胞的培养基的分泌的活性酶的更高量(g)。在一个方面中，与亲本酶相比，该变体具有至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加的表达产量。

分离的：术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质，(2)包括但不限于任何酶、变体、核酸、蛋白、肽或辅因子的任何物质，该物质至少部分地从与其本质相关的一种或多种或所有天然存在的成分中去除；(3)相对于天然发现的物质通过人工修饰的任何物质；或(4)通过增加该物质相对于与其天然相关的其他组分的量而修饰的任何物质(例如，宿主细胞中的重组体产生；编码该物质的基因的多个拷贝；以及使用比编码该物质的基因天然相关的启动子强的启动子)。

成熟多肽：术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。在一个方面中，基于预测SEQID NO:2的氨基酸1至20是信号肽的SignalP 3.0程序(本特森(Bendtsen)等人，2004，分子生物学杂志(J.Mol.Biol.)340:783-795)，该成熟多肽是SEQ ID NO:2的氨基酸21至292。在另一个方面中，基于预测SEQ ID NO:4的氨基酸1至27是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:4的氨基酸28至287。在另一个方面中，基于预测SEQ ID NO:6的氨基酸1至22是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:6的氨基酸23至294。在另一个方面中，基于预测SEQ ID NO:8的氨基酸1至24是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:8的氨基酸25至297。在另一个方面中，基于预测SEQ ID NO:10的氨基酸1至22是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:10的氨基酸23至294。在另一个方面中，基于预测SEQ ID NO:12的氨基酸1至26是信号肽的SignalP 3.0程序，该成熟多肽是SEQID NO:12的氨基酸27至285。在另一个方面中，基于预测SEQ ID NO:14的氨基酸1至22是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:14的氨基酸23至323。在另一个方面中，基于预测SEQ ID NO:16的氨基酸1至28是信号肽的SignalP 3.0程序，该成熟多肽是SEQ IDNO:16的氨基酸29至299。在另一个方面中，基于预测SEQ ID NO:18的氨基酸1至24是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:18的氨基酸25至275。在另一个方面中，基于预测SEQ ID NO:20的氨基酸1至18是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:20的氨基酸19至330。在另一个方面中，基于预测SEQ ID NO:22的氨基酸1至24是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:22的氨基酸25至297。在另一个方面中，基于预测SEQ ID NO:24的氨基酸1至24是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:24的氨基酸25至288。在另一个方面中，基于预测SEQ ID NO:26的氨基酸1至24是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:26的氨基酸25至311。在另一个方面中，基于预测SEQ ID NO:28的氨基酸1至28是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:28的氨基酸29至291。在另一个方面中，基于预测SEQ ID NO:30的氨基酸1至25是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:30的氨基酸26至280。在另一个方面中，基于预测SEQ ID NO:32的氨基酸1至21是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:32的氨基酸22至290。在另一个方面中，基于预测SEQ ID NO:34的氨基酸1至30是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:34的氨基酸31至302。在另一个方面中，基于预测SEQ ID NO:36的氨基酸1至27是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:36的氨基酸28至291。在另一个方面中，基于预测SEQ ID NO:38的氨基酸1至29是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:38的氨基酸30至299。在另一个方面中，基于预测SEQ ID NO:40的氨基酸1至26是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:40的氨基酸27至290。在另一个方面中，基于预测SEQ ID NO:42的氨基酸1至28是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:42的氨基酸29至304。在另一个方面中，基于预测SEQ ID NO:44的氨基酸1至21是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:44的氨基酸22至292。在另一个方面中，基于预测SEQ ID NO:46的氨基酸1至30是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:46的氨基酸31至283。在另一个方面中，基于预测SEQ ID NO:48的氨基酸1至22是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:48的氨基酸23至283。在另一个方面中，基于预测SEQ ID NO:50的氨基酸1至28是信号肽的SignalP 3.0程序，该成熟多肽是SEQ ID NO:50的氨基酸29至290。

本领域已知，宿主细胞可以产生由同一多核苷酸表达的两种或更多种不同成熟多肽(即，具有不同C-末端和/或N-末端氨基酸)的混合物。本领域还已知，不同的宿主细胞不同地加工多肽，并且因此一个表达多核苷酸的宿主细胞当与另一个表达相同多核苷酸的宿主细胞相比时可以产生不同的成熟多肽(例如，具有不同的C-末端和/或N-末端氨基酸)。

成熟多肽编码序列：术语“成熟多肽编码序列”意指编码具有木葡聚糖内糖基转移酶活性的成熟多肽的多核苷酸。在一个方面中，基于预测SEQ ID NO:1的核苷酸1至60编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:1的核苷酸61至876。在另一个方面中，基于预测SEQ ID NO:3的核苷酸1至81编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:3的核苷酸82至861。在另一个方面中，基于预测SEQ ID NO:5的核苷酸1至66编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:5的核苷酸67至882。在另一个方面中，基于预测SEQ ID NO:7的核苷酸1至72编码信号肽的SignalP3.0程序，该成熟多肽编码序列是SEQ ID NO:7的核苷酸73至891。在另一个方面中，基于预测SEQ ID NO:9的核苷酸1至66编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQID NO:9的核苷酸67至882。在另一个方面中，基于预测SEQ ID NO:11的核苷酸1至78编码信号肽的SignalP3.0程序，该成熟多肽编码序列是SEQ ID NO:11的核苷酸79至855。在另一个方面中，基于预测SEQ ID NO:13的核苷酸1至66编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:13的核苷酸67至969。在另一个方面中，基于预测SEQ ID NO:15的核苷酸1至84编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:15的核苷酸85至897。在另一个方面中，基于预测SEQ ID NO:17的核苷酸1至72编码信号肽的SignalP3.0程序，该成熟多肽编码序列是SEQ ID NO:17的核苷酸73至825。在另一个方面中，基于预测SEQ ID NO:19的核苷酸1至54编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:19的核苷酸55至990。在另一个方面中，基于预测SEQ ID NO:21的核苷酸1至72编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:21的核苷酸73至891。在另一个方面中，基于预测SEQ ID NO:23的核苷酸1至72编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:23的核苷酸73至864。在另一个方面中，基于预测SEQ IDNO:25的核苷酸1至72编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:25的核苷酸73至933。在另一个方面中，基于预测SEQ ID NO:27的核苷酸1至84编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:27的核苷酸85至873。在另一个方面中，基于预测SEQ ID NO:29的核苷酸1至75编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:29的核苷酸76至840。在另一个方面中，基于预测SEQ ID NO:31的核苷酸1至63编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:31的核苷酸64至870。在另一个方面中，基于预测SEQ ID NO:33的核苷酸1至90编码信号肽的SignalP3.0程序，该成熟多肽编码序列是SEQ ID NO:33的核苷酸91至906。在另一个方面中，基于预测SEQ ID NO:35的核苷酸1至81编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:35的核苷酸82至873。在另一个方面中，基于预测SEQ ID NO:37的核苷酸1至87编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:37的核苷酸88至897。在另一个方面中，基于预测SEQ ID NO:39的核苷酸1至78编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:39的核苷酸79至870。在另一个方面中，基于预测SEQ ID NO:41的核苷酸1至84编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQID NO:41的核苷酸85至912。在另一个方面中，基于预测SEQ ID NO:43的核苷酸1至63编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:43的核苷酸64至876。在另一个方面中，基于预测SEQ ID NO:45的核苷酸1至90编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:45的核苷酸91至849。在另一个方面中，基于预测SEQ ID NO:47的核苷酸1至66编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:47的核苷酸67至849。在另一个方面中，基于预测SEQ ID NO:49的核苷酸1至84编码信号肽的SignalP 3.0程序，该成熟多肽编码序列是SEQ ID NO:49的核苷酸85至870。在以上各方面中，术语“成熟多肽编码序列”应理解成包括基因组DNA序列的cDNA序列或cDNA序列的基因组DNA序列。

突变体：术语“突变体”意指编码变体的多核苷酸。

核酸构建体：术语“核酸构建体”意指单-链或双链的核酸分子，该核酸分子是从天然存在的基因中分离的，或以本来不存在于自然界中的方式被修饰成包含核酸的区段，或是合成的，该核酸分子包括一个或多个控制序列。

可操作地连接：术语“可操作地连接”意指如下的构造，其中，控制序列相对于多核苷酸的编码序列安置在适当位置，从而使得该控制序列指导该编码序列的表达。

亲本或亲本木葡聚糖内糖基转移酶：术语“亲本”或“亲本木葡聚糖内糖基转移酶”意指在一个或多个(例如，若干个)位置对木葡聚糖内糖基转移酶进行改变，即取代、插入和/或缺失，以产生本发明的木葡聚糖内糖基转移酶变体。该亲本可以是天然存在的(野生型)多肽或其变体或片段。

序列一致性：用参数“序列一致性”来描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。

出于本发明的目的，使用如在EMBOSS包(EMBOSS：欧洲分子生物学开放软件套件(The European Molecular Biology Open Software Suite)，赖斯(Rice)等人，2000，遗传学趋势(Trends Genet.)16:276-277)(优选5.0.0版或更新版本)的尼德尔(Needle)程序中所实施的尼德尔曼-翁施(Needleman-Wunsch)算法(尼德尔曼(Needleman)和翁施(Wunsch)，1970，分子生物学杂志(J.Mol.Biol.)48:443-453)来确定两个氨基酸序列之间的序列一致性。使用的参数是空位开放罚分10、空位扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记为“最高同一性(longest identity)”的输出结果(使用-nobrief选项获得)作为同一性百分比，并计算如下：

(相同残基x 100)/(比对的长度-在比对中的空位总数)。

出于本发明的目的，使用如在EMBOSS包(EMBOSS：欧洲分子生物学开放软件套件，赖斯等人，2000，同上)(优选5.0.0版或更新版本)的尼德尔程序中所实施的尼德尔曼-翁施算法(尼德尔曼和翁施，1970，同上)来确定两个脱氧核糖核苷酸序列之间的序列一致性。使用的参数是空位开放罚分10、空位扩展罚分0.5，以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用Needle标记为“最高同一性(longest identity)”的输出结果(使用-nobrief选项获得)作为同一性百分比，并计算如下：

(一致的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)

严格条件：术语“非常低严格条件”是指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃下在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25％甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2％SDS，在45℃下洗涤三次，每次15分钟。

术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃下在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25％甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2％SDS，在50℃下洗涤三次，每次15分钟。

对于至少100个核苷酸长度的探针，术语“中严格性条件”意指按照标准DNA印迹程序在42℃在5X SSPE、0.3％SDS、200微克/ml剪切和变性的鲑精DNA和35％甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2％SDS，在55℃下洗涤三次，每次15分钟。

术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃下在5X SSPE、0.3％SDS、200微克/毫升剪切并变性的鲑鱼精子DNA以及35％甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2％SDS，在60℃下洗涤三次，每次15分钟。

术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃下在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑精DNA和50％甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2％SDS，在65℃下洗涤三次，每次15分钟。

术语“非常高严格条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃下在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50％甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2％SDS，在70℃下洗涤三次，每次15分钟。

子序列：术语“子序列”意指缺失成熟多肽编码序列的5'和/或3'端的一个或多个(例如，若干个)核苷酸的多核苷酸；其中该子序列编码具有木葡聚糖内糖基转移酶活性的片段。在一个方面中，子序列包含成熟多肽编码序列的至少85％、至少90％、或至少95％的核苷酸。

变体：术语“变体”意指在一个或多个(例如，若干个)位置包括改变(即，取代、插入和/或缺失)的具有木葡聚糖内糖基转移酶活性的多肽。取代意指占据一个位置的氨基酸由不同的氨基酸代替；缺失意指除去占据一个位置的氨基酸；以及插入意指在占据一个位置的氨基酸的毗邻处和紧邻处添加一个氨基酸。本发明的变体具有亲本的木葡聚糖内糖基转移酶活性的至少20％，例如至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、或至少100％。

野生型木葡聚糖内糖基转移酶：术语“野生型”木葡聚糖内糖基转移酶意指由天然存在的有机体(如在自然界中发现的植物、细菌、酵母或丝状真菌)表达的木葡聚糖内糖基转移酶。

木葡聚糖内糖基转移酶：术语“木葡聚糖内糖基转移酶”意指木葡聚糖：木葡聚糖内糖基转移酶(EC 2.4.1.207)，该酶催化木葡聚糖骨架中β-(1→4)键的裂解，并且转移该木葡聚糖基区段到受体非还原末端葡萄糖残基的O-4上，该受体可以是木葡聚糖或木葡聚糖的寡糖。木葡聚糖内糖基转移酶又称木葡聚糖内糖基转移酶/水解酶或内切木葡聚糖转移酶。一些木聚糖内糖基转移酶可以具有不同活性，这些活性包括木葡聚糖和甘露聚糖内糖基转移酶活性。例如，来自成熟的木瓜水果的木聚糖内糖基转移酶可以使用杂木聚糖，如小麦阿拉伯糖基木聚糖、桦木葡糖醛酸木聚糖、及其他作为供体分子。这些木聚糖可能与木葡聚糖发挥类似的作用，同时成本便宜很多，因为它们可以，例如，从纸浆厂废液和/或未来生物质生物炼制中提取。

通过本领域中的那些技术人员，使用任何以下方法，可以评估木葡聚糖内糖基转移酶活性。在木葡聚糖内糖基转移酶的存在下，通过用摩尔过量的木葡聚糖低聚物孵育木葡聚糖聚合物时，木葡聚糖聚合物的平均分子量的减少可以通过液相层析(苏鲁瓦(Sulova)等人，2003，植物生理生化(Plant Physiol.Biochem.)41:431-437)或通过乙醇沉淀(山中(Yaanaka)等人，2000，食品胶体(Food Hydrocolloids)14:125-128)，随后通过重量或纤维素结合分析(弗里(Fry)等人，1992，生物化学杂志(Biochem.J.)282:821-828)来确定，或可以在碱性条件下通过与碘结合在比色上来进行评估(苏鲁瓦(Sulova)等人，1995，分析生物化学(Analytical Biochemistry)229:80-85)。

变体命名规则

出于本发明的目的，披露于SEQ ID NO:2中的全长木葡聚糖内糖基转移酶被用来确定在另一个木葡聚糖内糖基转移酶内的相应氨基酸残基。将另一种木葡聚糖内糖基转移酶的氨基酸序列与在SEQ ID NO:2中披露的全长多肽比对，并且基于比对，使用尼德曼-翁施算法(尼德尔曼和翁施，1970，分子生物学杂志48:443-453)如在EMBOSS软件包(EMBOSS：欧洲分子生物学开放软件包，赖斯等人，2000，遗传学趋势16:276-277)的尼德尔程序，优选地5.0.0版或更新版本中所执行的，确定与SEQ ID NO:2的全长多肽中的任何氨基酸残基相应的氨基酸位置编号。使用的参数是空位开放罚分10、空位扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。氨基酸位置的编号是基于SEQ ID NO:2的全长多肽(例如，包括信号肽)，其中位置1是信号肽的第一个氨基酸(即，Met)并且位置21(即，Ala)是SEQID NO:2的成熟多肽的第一个位置。

另一种木葡聚糖内糖基转移酶中对应的氨基酸残基的鉴定可以通过使用若干计算机程序使用其对应的缺省参数比对多个多肽序列来确定，这些计算机程序包括但不限于MUSCLE(通过对数期望值的多序列比较；3.5版或更新版本；埃德加(Edgar)，2004，核酸研究(Nucleic Acids Research)32:1792-2797)；MAFTT(6.857版或更新版本；加藤(Katoh)和库玛(Kuma)，2002，核酸研究30:3059-3066；加藤等人，2005，核酸研究33:511-518；加藤和朝都(Toh)，2007，生物信息学(Bioinformatics)23:372-374；加藤等人，2009，分子生物学中的方法(Methods in Molecular Biology)537:39-64；加藤和朝都，2010，生物信息学(Bioinformatics)26:1899-1900)；以及采用ClustalW的EMBOSS EMMA(1.83版或更新版本；汤普森(Thompson)等人，1994，核酸研究(Nucleic Acids Research)22:4673-4680)。

当另一种木葡聚糖内糖基转移酶与SEQ ID NO:2的全长多肽相背离，这样使得传统的基于序列的比较无法检测它们的相互关系时(林达尔(Lindahl)和埃洛氟松(Elofsson)，2000，分子生物学杂志295:613-615)，可以使用其他成对序列比较算法。在基于序列的搜索中的更大灵敏度可以使用搜索程序来获得，这些搜索程序利用多肽家族的概率表示(特征曲线)来搜索数据库。例如，PSI-BLAST程序通过迭代数据库搜索过程来产生多个谱，并且能够检测远距离同源物(阿特休尔(Atschul)等人，1997，《核酸研究》25:3389-3402)。如果多肽的家族或超家族在蛋白结构数据库中具有一个或多个代表，则可以实现甚至更大的灵敏度。程序如GenTHREADER(琼斯(Jones)，1999，分子生物学杂志(J.Mol.Biol.)287:797-815；麦古芬(McGuffin)和琼斯，2003，生物信息学(Bioinformatics)19:874-881)利用来自不同来源(PSI-BLAST、二级结构预测、结构比对谱以及溶剂化势)的信息作为预测查询序列的结构折叠的神经网络的输入。类似地，高夫(Gough)等人，2000，分子生物学杂志(J.Mol.Biol.)313:903-919的方法可以用于比对未知结构的序列与存在于SCOP数据库中的超家族模型。这些比对进而可以用于产生多肽的同源性模型，并且使用出于该目的而开发的多种工具可以评定此类模型的准确度。

对于已知结构的蛋白，若干工具和资源可用于检索并产生结构比对。例如，蛋白的SCOP超家族已经在结构上进行比对，并且那些比对是可访问的并且可下载的。可以使用多种算法如距离比对矩阵(奥尔姆(Holm)和桑德(Sander)，1998，蛋白质(Proteins)33:88-96)或组合延伸(辛迪亚洛夫(Shindyalov)和伯恩(Bourne)，1998，蛋白质工程(ProteinEngineering)11:739-747)比对两种或更多种蛋白质结构，并且这些算法的实施可以另外用于查询具有感兴趣结构的结构数据库，以便发现可能的结构同源物(例如，奥尔姆和帕克(Park)，2000，生物信息学(Bioinformatics)16:566-567)。

在描述本发明的变体中，以下所述的命名法适于方便参考。采用了已接受的IUPAC单个字母和三字母的氨基酸缩写。

取代。对于氨基酸取代，使用以下命名法：初始氨基酸、位置、取代氨基酸。因此，在位置226处的苏氨酸被丙氨酸取代表示为“Thr226Ala”或者“T226A”。多个突变由加号(“+”)分开，例如“Gly205Arg+Ser411Phe”或“G205R+S411F”代表分别在位置205和位置411处甘氨酸(G)被精氨酸(R)取代，并且丝氨酸(S)被苯丙氨酸(F)取代。

缺失。对于氨基酸缺失，使用以下命名法：初始氨基酸、位置、^*。因此，在位置195处的甘氨酸缺失表示为“Gly195^*”或“G195^*”。多个缺失由加号(“+”)分开，例如“Gly195^*+Ser411^*”或“G195^*+S411^*”。

插入。对于氨基酸插入，使用以下命名法：初始氨基酸、位置、初始氨基酸、插入氨基酸。因此，在位置195处的甘氨酸之后插入赖氨酸被表示为“Gly195GlyLys”或“G195GK”。多个氨基酸的插入被表示为[初始氨基酸，位置，初始氨基酸，插入氨基酸#1、插入氨基酸#2；等]。例如，在位置195处的甘氨酸之后插入赖氨酸和丙氨酸被表示为“Gly195GlyLysAla”或“G195GKA”。

在此类情况下，通过将小写字母添加至在所插入的一个或多个氨基酸残基之前的氨基酸残基的位置编号中来对所插入的一个或多个氨基酸残基进行编号。在以上实例中，该序列因此将是：

亲本：	变体：
		195	195 195a 195b
G	G-K-A

多种改变。包括多种改变的变体由加号(“+”)分开，例如“Arg170Tyr+Gly195Glu”或者“R170Y+G195E”代表在位置170和位置195处的精氨酸和甘氨酸分别被酪氨酸和谷氨酸取代。

不同改变。可以在一个位置上引入不同的改变时，这些不同的改变由逗号分开，例如“Arg170Tyr,Glu”代表在位置170上的精氨酸被酪氨酸或谷氨酸取代。因此，“Tyr167Gly,Ala+Arg170Gly,Ala”表示以下变体：

“Tyr167Gly+Arg170Gly”、“Tyr167Gly+Arg170Ala”、“Tyr167Ala+Arg170Gly”、和“Tyr167Ala+Arg170Ala”。

发明详述

变体

在一个实施例中，这些变体与亲本木葡聚糖内糖基转移酶的氨基酸序列具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％、但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:2的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:4的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:6的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:8的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:10的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:12的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:14的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:16的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:18的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:20的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:22的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:24的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:26的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:28的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:30的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:32的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:34的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:36的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:38的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:40的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:42的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:44的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:46的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:48的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在另一个实施例中，这些变体与SEQ ID NO:50的成熟多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

在一个方面中，在本发明的变体中的取代数目是1至17个，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个取代。

在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个(例如，若干个)位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的两个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的三个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的四个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的五个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的六个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的七个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的八个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的九个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十一个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十二个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十三个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十四个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十五个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十六个位置处的取代。在另一个方面中，变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的各个位置处的取代。

在另一个方面中，该变体包括与位置10相对应的位置处的取代或由其组成。在另一个方面中，与位置10相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代，优选被Ala取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代I10A或由其组成。

在另一个方面中，该变体包括与位置30相对应的位置处的取代或由其组成。在另一个方面中，与位置30相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被Glu取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代P30E或由其组成。

在另一个方面中，该变体包括与位置40相对应的位置处的取代或由其组成。在另一个方面中，与位置40相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被Gly取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代A40G或由其组成。

在另一个方面中，该变体包括与位置51相对应的位置处的取代或由其组成。在另一个方面中，与位置51相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被Thr取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代S51T或由其组成。

在另一个方面中，该变体包括与位置53相对应的位置处的取代或由其组成。在另一个方面中，与位置53相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被Ala或Val取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代I53A,V或由其组成。

在另一个方面中，该变体包括与位置60相对应的位置处的取代或由其组成。在另一个方面中，与位置60相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被Ser取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代Y60S或由其组成。

在另一个方面中，该变体包括与位置99相对应的位置处的取代或由其组成。在另一个方面中，与位置99相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被Glu或Asn取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代T99E,N或由其组成。

在另一个方面中，该变体包括与位置102相对应的位置处的取代或由其组成。在另一个方面中，与位置102相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被Gly取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代E102G或由其组成。

在另一个方面中，该变体包括与位置117相对应的位置处的取代或由其组成。在另一个方面中，与位置117相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被Glu取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代Q117E或由其组成。

在另一个方面中，该变体包括与位置130相对应的位置处的取代或由其组成。在另一个方面中，与位置130相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被Arg取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代K130R或由其组成。

在另一个方面中，该变体包括与位置136相对应的位置处的取代或由其组成。在另一个方面中，与位置136相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被Trp取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代R136W或由其组成。

在另一个方面中，该变体包括与位置157相对应的位置处的取代或由其组成。在另一个方面中，与位置157相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被His取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代Y157H或由其组成。

在另一个方面中，该变体包括与位置162相对应的位置处的取代或由其组成。在另一个方面中，与位置162相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被Cys取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代Y162C或由其组成。

在另一个方面中，该变体包括与位置175相对应的位置处的取代或由其组成。在另一个方面中，与位置175相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代，优选被Ser、Gly、或Gln取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代N175S,G,Q或由其组成。

在另一个方面中，该变体包括与位置183相对应的位置处的取代或由其组成。在另一个方面中，与位置183相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被Ile取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代F183I或由其组成。

在另一个方面中，该变体包括与位置254相对应的位置处的取代或由其组成。在另一个方面中，与位置254相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代，优选被Glu取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代A254E或由其组成。

在另一个方面中，该变体包括与位置280相对应的位置处的取代或由其组成。在另一个方面中，与位置280相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代，优选被Gly或Glu取代。在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代S280G,E或由其组成。

在以上各方面中，该变体在包括与作为亲本的其他木葡聚糖内糖基转移酶中的SEQ ID NO:2的全长多肽相对应的位置处的上述一个或多个取代或由其组成。

在以下各方面中，该变体包括与其他木葡聚糖内糖基转移酶中的SEQ ID NO:2的全长多肽相对应的位置处的或SEQ ID NO:2的全长多肽的位置处的下述一个或多个取代或由其组成。

在另一个方面中，该变体包括选自下组的一个或多个(例如，若干个)取代或由其组成，该组由以下各项组成：I10A；P30E；A40G；S51T；I53A,V；Y60S；T99E,N；E102G；Q117E；K103R；R136W；Y157H；Y162C；N175S,G,Q；F183I；A254E；以及S280G,E。

在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代A40G+N175S或由其组成。

在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代A40G+F183I或由其组成。

在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代N175G+S280G或由其组成。

在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代A40G+I53A+N175S或由其组成。

在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代A40G+N175S+F183I或由其组成。

在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代I10A+I53A+E102G或由其组成。

在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代A40G+E102G+Q117E或由其组成。

在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代N175Q+A254E+S280E或由其组成。

在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代P30E+S51T+Y60S+T99N或由其组成。

在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代A40G+T99E+E102G+K130R或由其组成。

在另一个方面中，该变体包括SEQ ID NO:2的全长多肽的取代I53V+R136W+Y157H+Y162C+N175S或由其组成。

这些变体可以进一步在一个或多个(例如，若干个)其他位置处包括一个或多个另外的改变，例如，取代、插入或缺失。

氨基酸改变可以具有次要性质，即不显著影响蛋白质的折叠和/或活性的保守氨基酸取代或插入；典型地1-30个氨基酸的小缺失；小的氨基-或羧基末端延伸，如氨基末端蛋氨酸残基；至多20-25个残基的小接头肽；或通过改变净电荷或另一功能来促进纯化的小延伸，如多组氨酸序列、抗原性表位或结合结构域。

保守取代的实例在下组之内：碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸以及甲硫氨酸)。一般不会改变比活性的氨基酸取代是本领域已知的并且例如由H.诺伊拉特(Neurath)和R.L.希尔(Hill)，1979，在蛋白质(The Proteins)，学术出版社(Academic Press)，纽约中描述。常见取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、以及Asp/Gly。

可替代地，氨基酸变化是这样一种性质，使得多肽的理化性质被改变。例如，氨基酸改变可以改进多肽的热稳定性、改变底物特异性、改变最适pH等。

可以根据本领域已知的方法，如定点诱变或丙氨酸扫描诱变鉴定多肽中的必需氨基酸(康宁汉(Cunningham)和韦尔斯(Wells)，1989，科学(Science)244:1081-1085)。在后一项技术中，在该分子中的每个残基处引入单个丙氨酸突变，并且测试所得突变体分子的木葡聚糖内糖基转移酶活性以鉴定对于该分子的活性至关重要的氨基酸残基。还参见希尔顿(Hilton)等人，1996，生物化学杂志(J.Biol.Chem.)271:4699-4708。酶或其他生物学相互作用的活性部位还可通过对结构的物理分析来确定，如由下述技术确定：核磁共振、晶体学(crystallography)、电子衍射、或光亲和标记，连同对推定的接触位点(contract site)氨基酸进行突变。参见，例如德沃斯(de Vos)等人，1992，科学(Science)255:306-312；史密斯(Smith)等人，1992，分子生物学杂志(J.Mol.Biol.)224:899-904；乌乐达维尔(Wlodaver)等人，1992，欧洲生物化学学会联盟通讯(FEBS Lett.)309:59-64。也可以从与相关多肽的比对推断必需氨基酸的身份。在SEQ ID NO:2的氨基酸21至292的序列中的必需活性位点氨基酸位于位置105、107、和109。

本发明还涉及增加木葡聚糖内糖基转移酶的表达产量的方法，该方法包括在与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、和280相对应的一个或多个位置处将取代引入亲本木葡聚糖内糖基转移酶中以产生变体，其中该变体的表达产量相对于亲本是增加的；并任选地回收该变体。

在一个实施例中，与亲本酶相比，该变体具有至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加的表达产量。

亲本木葡聚糖内糖基转移酶

该亲本木葡聚糖内糖基转移酶可以是(a)与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽具有至少60％序列一致性的多肽；(b)由以下多核苷酸编码的多肽，该多核苷酸在低严格条件下与(i)SEQID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列，或(ii)(i)的全长互补体杂交；或(c)由以下多核苷酸编码的多肽，该多核苷酸与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列具有至少60％序列一致性。

在一个实施例中，该亲本与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％序列一致性，这些成熟多肽具有木葡聚糖内糖基转移酶活性。在另一个实施例中，该亲本的氨基酸序列与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽相差多达10个氨基酸，例如1、2、3、4、6、6、7、8、9或10个。

在另一个实施例中，该亲本包括SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的氨基酸序列或由其组成。在另一个实施例中，该亲本包括SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽或由其组成。

在另一个实施例中，该亲本是SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽的片段，该片段包含该亲本的至少85％，例如至少90％和至少95％的氨基酸残基。

在另一个实施例中，该亲本是SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽的等位基因变体。

在另一个实施例中，该亲本由如下的多核苷酸编码，该多核苷酸在非常低严格条件、低严格条件、中严格条件、中-高严格条件、高严格条件或非常高严格条件下与(i)SEQID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列，或(ii)(i)的全长互补体杂交(萨拉布鲁克(Sambrook)等人，1989，分子克隆实验指南(Molecular Cloning:A Laboratory Manual)，第二版，冷泉港(ColdSpring Harbor)，纽约)。

SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的多核苷酸或其子序列，连同SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48或50的多肽或其片段可被用于设计核酸探针以根据本领域熟知的方法来鉴定并克隆编码来自不同属或种的亲本的DNA。具体而言，可以根据标准DNA印迹程序，使用这类探针与感兴趣的细胞的基因组DNA或cDNA杂交，以便鉴定和分离其中的对应基因。此类探针可以明显短于完整序列，但是长度应为至少15，例如至少25、至少35、或至少70个核苷酸。优选地，核酸探针具有至少100个核苷酸长度，例如至少200个核苷酸长度、至少300个核苷酸长度、至少400个核苷酸长度、至少500个核苷酸长度、至少600个核苷酸长度、至少700个核苷酸长度、至少800个核苷酸长度、或至少900个核苷酸长度。DNA和RNA探针二者均可使用。典型地将探针进行标记(例如，用³²P、³H、³⁵S、生物素、或抗生物素蛋白)，以检测相应的基因。本发明涵盖此类探针。

可以针对与上文所述的探针杂交并编码亲本的DNA来筛选由这类其他属或种制备的基因组DNA或cDNA文库。可以通过琼脂糖或聚丙烯酰胺凝胶电泳，或通过其他分离技术分离基因组或其他DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素或其他适合的载体材料并且固定于其上。为了鉴定与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49或其子序列杂交的克隆或DNA，将载体材料用于DNA印迹中。

出于本发明的目的，杂交指示该多核苷酸在非常低到非常高严格度条件下和与以下各项相对应的标记的核酸探针杂交：(i)1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49；(ii)其成熟多肽编码序列；(iii)其全长互补体；或(iv)其子序列。可以使用例如X-射线胶片或本领域已知的任何其他检测手段来检测在这些条件下核酸探针杂交的分子。

在一个方面中，该核酸探针是SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列。在另一个方面中，该核酸探针是编码SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的多肽；其成熟多肽；或其片段的多核苷酸。在另一个方面中，该核酸探针是SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49。

在另一个实施例中，该亲本由以下多核苷酸编码，该多核苷酸与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％序列一致性。

该亲本可以是一种杂合多肽(嵌合体)，其中该亲本的一个区域被另一个多肽的区域替换。

该亲本可以是一种融合多肽或可切割的融合多肽，其中另一个多肽融合在该亲本的N-末端或C-末端处。通过将编码另一种多肽的多核苷酸与本发明多核苷酸融合而产生融合多肽。用于产生融合多肽的技术是本领域已知的，并且包括连接编码多肽的编码序列，使得它们在框内，并且融合多肽的表达处于相同的启动子和终止子的控制之下。也可以使用内含肽技术构建融合多肽，其中以翻译后方式产生融合多肽(库珀(Cooper)等人，1993，欧洲分子生物学学会杂志(EMBO J.)12:2575-2583；道森(Dawson)等人，1994，科学(Science)266:776-779)。

融合多肽可以进一步包括两种多肽之间的切割位点。在融合蛋白分泌之时，该位点被切割，从而释放出这两种多肽。切割位点的实例包括但不限于在如下文献中披露的位点：马丁(Martin)等人，2003，工业微生物学生物技术杂志(J.Ind.Microbiol.Biotechnol.)3:568-576；Svetina等人，2000，生物技术杂志(J.Biotechnol.)76:245-251；拉斯马森-威尔逊(Rasmussen-Wilson)等人，1997，应用与环境微生物学(Appl.Environ.Microbiol.)63:3488-3493；沃德(Ward)等人，1995，生物技术(Biotechnology)13:498-503；以及孔特雷拉斯(Contreras)等人，1991，生物技术9:378-381；伊顿(Eaton)等人，1986，生物化学(Biochemistry)25:505-512；Collins-Racie等人，1995，生物技术13:982-987；卡特(Carter)等人，1989，蛋白质：结构、功能和遗传学(Proteins:Structure,Function,and Genetics)6:240-248；和史蒂文斯(Stevens)，2003，世界药物发现(Drug Discovery World)4:35-48。

该亲本可以从任何属的植物获得。出于本发明的目的，如在此结合给定的来源使用的术语“从……获得(或获得自)”应意指由多核苷酸编码的亲本是由该来源产生的。在一个方面中，该亲本是胞外分泌的。

该亲本可以是任何植物木葡聚糖内糖基转移酶。在一个实施例中，该亲本是从豆科(同义词：豆科(Leguminosae和Papilionaceae))的子叶中获得，优选地菜豆属，具体地，绿豆。优选的单子叶植物是非禾本科的单子叶植物和百合的单子叶植物。木葡聚糖内糖基转移酶还可以从苔藓和苔类中来提取，如在弗里(Fry)等人，1992，生物化学杂志(Biochem.J.)282:821-828中所描述的。例如，该木葡聚糖内糖基转移酶可以从子叶中获得，即，双子叶植物或单子叶植物，具体地是选自下组的双子叶植物，该组由以下各项组成：花椰菜、大豆、番茄、马铃薯、油菜、向日葵、棉花、以及烟草，或选自下组的单子叶植物，该组由以下各项组成：小麦、水稻、玉米和甘蔗。参见，例如，WO 2003/033813和WO 97/023683。

在另一个实施例中，该亲本从以下种获得：拟南芥属(Arabidopsis)、番木瓜属(Carica)、香瓜属(Cucumis)、胡萝卜属(Daucus)、羊茅属(Festuca)、大豆属(Glycine)、大麦属(Hordeum)、番茄属(Lycopersicon)、苜蓿属(Medicago)、稻属(Oryza)、杨属(Populus)、慈菇属(Sagittaria)、高粱属(Sorghum)、豇豆属(Vigna)、或玉蜀黍属(Zea)。

在另一个实施例中，该亲本从拟南芥、番木瓜、黄瓜、野胡萝卜、草地羊茅、大豆、大麦、番茄、蒺藜状苜蓿、水稻、欧洲山杨、矮慈姑(Sagittaria pygmaea)、双色高粱、红豆(Vigna angularis)、或玉米(Zea mays)获得。

在另一个实施例中，该亲本是拟南芥(GENESEQP:AOE11231、GENESEQP:AOE93420、GENESEQP:BAL03414、GENESEQP:BAL03622、或GENESEQP:AWK95154)；番木瓜(GENESEQP:AZR75725)；黄瓜(GENESEQP:AZV66490)；野胡萝卜(GENESEQP:AZV66139)；草地羊茅(GENESEQP:AZR80321)；大豆(GENESEQP:AWK95154或GENESEQP:AYF92062)；大麦(GENESEQP:AZR85056、GENESEQP:AQY12558、GENESEQP:AQY12559、或GENESEQP:AWK95180)；番茄(GENESEQP:ATZ45232)；蒺藜状苜蓿(GENESEQP:ATZ48025)；水稻(GENESEQP:ATZ42485、GENESEQP:ATZ57524、或GENESEQP:AZR76430)；欧洲山杨(GENESEQP:AWK95036)；矮慈菇(GENESEQP:AZV66468)；双色高粱(GENESEQP:BAO79623或GENESEQP:BAO79007)；红豆(GENESEQP:ATZ61320)；或玉蜀黍(GENESEQP:AWK94916)木葡聚糖内糖基转移酶，其中将这些登录号以其全部内容结合在此。

可以通过筛选基因组DNA或cDNA文库或混合的DNA样品来获得编码亲本的多核苷酸。一旦已经用一个或多个探针检测到编码亲本的多核苷酸，则可以通过利用对本领域的普通技术人员来说已知的技术来分离或克隆该多核苷酸(参见，例如，萨拉布鲁克(Sambrook)等人，1989，见上文)。

变体的制备

本发明还涉及用于获得木葡聚糖内糖基转移酶变体的方法，该方法包括：(a)将与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个(例如，若干个)位置处的取代引入亲本木葡聚糖内糖基转移酶，其中该变体具有木葡聚糖内糖基转移酶活性，并且任选地(b)回收该变体。

可以使用本领域已知的任何诱变程序来制备这些变体，如定点诱变、位点饱和诱变、合成基因构建、半合成基因构建、随机诱变、改组等。

定点诱变是在编码该亲本的多核苷酸中的一个或多个限定位点处引入一个或多个(例如，若干个)突变的技术。

通过使用涉及包含所希望的突变的寡核苷酸引物的PCR可以体外实现定点诱变。也可以通过盒式诱变进行体外定点诱变，所述盒式诱变涉及由限制酶在包括编码亲本的多核苷酸的质粒中的位点处切割并且随后将包含突变的寡核苷酸连接在多核苷酸中。通常，消化该质粒与该寡核苷酸的限制酶是相同的，以允许该质粒的粘性末端以及插入片段彼此连接。参见，例如谢勒(Scherer)和戴维斯(Davis)，1979，美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)76:4949-4955；和巴顿(Barton)等人，1990，核酸研究(NucleicAcids Res.)18:7349-4966。

还可以通过本领域已知的方法体内实现定点诱变。参见，例如，美国专利申请公开号2004/0171154；斯托西(Storici)等人，2001，自然生物技术(Nature Biotechnol.)19:773-776；凯伦(Kren)等人，1998，自然医学(Nat.Med.)4:285-290；以及卡里萨诺(Calissano)和曼奇诺(Macino)，1996，真菌遗传学通讯(Fungal Genet.Newslett.)43:15-16。

在本发明中可以使用任何定点诱变程序。存在可用于制备变体的很多可商购的试剂盒。

位点饱和诱变在一个或多个(例如，若干个)特定位置处将多肽编码序列系统性地替代为编码全部19个氨基酸的序列(帕里克(Parikh)和松村(Matsumura)，2005，分子生物学杂志(J.Mol.Biol.)352:621-628)。

合成基因构建需要体外合成设计的多核苷酸分子以编码感兴趣的多肽。基因合成可以利用多种技术来进行，如由田(Tian)等人(2004，自然(Nature)432:1050-1054)所述的基于多路微芯片的技术、以及其中在光可编程的微流芯片上合成并组装寡核苷酸的类似技术。

通过组合合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组的多个方面来实现半合成基因构建。半合成构建典型地是利用合成的多核苷酸片段的过程结合PCR技术。因此，基因的限定的区域可以从头合成，而其他区域可以使用位点特异性诱变引物来扩增，而还有其他区域可以经受易错PCR或非易错PCR扩增。然后可以对多核苷酸子序列进行改组。

可以做出单个或多个氨基酸取代、缺失和/或插入并且使用已知的诱变、重组和/或改组方法进行测试，随后进行有关筛选程序，如由里德哈尔-奥尔森(Reidhaar-Olson)和萨奥尔(Sauer)，1988，科学(Science)241:53-57；博维(Bowie)和萨奥尔，1989，美国科学院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156；WO 95/17413；或WO 95/22625所披露的那些。可以使用的其他方法包括易错PCR、噬菌体展示(例如，罗曼(Lowman)等人，1991，生物化学(Biochemistry)30:10832-10837；美国专利号5,223,409；WO 92/06204)和区域定向诱变(德比舍尔(Derbyshire)等人，1986，基因(Gene)46:145；Ner等人，1988，DNA 7:127)。

诱变/改组方法可以与高通量自动化筛选方法组合以检测由宿主细胞表达的克隆的诱变多肽的活性(奈斯(Ness)等人，1999，自然生物技术(Nature Biotechnology)17:893-896)。编码活性多肽的诱变的DNA分子可以回收自宿主细胞，并且使用本领域的标准方法对其进行迅速测序。这些方法允许迅速确定多肽中单个氨基酸残基的重要性。

多核苷酸

本发明还涉及编码本发明的变体的分离的多核苷酸。

核酸构建体

本发明还涉及包括编码本发明的变体的、可操作地连接至一个或多个控制序列上的多核苷酸的核酸构建体，该一个或多个控制序列在与控制序列相容的条件下指导编码序列在适合的宿主细胞中的表达。

可以按多种方式来操纵该多核苷酸以提供变体的表达。取决于表达载体，在其插入载体以前操纵多核苷酸可以是希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。

该控制序列可以是一个启动子，即，被宿主细胞识别以对编码本发明的变体的多核苷酸进行表达的一种多核苷酸。启动子包含介导该变体的表达的转录控制序列。启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸，包括突变型、截短型及杂合型启动子，并且可以是由编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。

在丝状真菌宿主细胞中，用于指导本发明的核酸构建体的转录的适合启动子的实例是从以下各项的基因获得的启动子：构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖孢镰刀菌胰蛋白酶-样蛋白酶(WO 96/00787)、镶片镰孢菌淀粉葡糖苷酶(WO 00/56900)、镶片镰孢菌Daria(达莉亚)(WO 00/56900)、镶片镰孢菌Quinn(奎恩)(WO 00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶，以及里氏木霉翻译延伸因子，连同NA2-tpi启动子(来自编码中性α-淀粉酶的曲霉属基因的修饰的启动子，其中已经用来自编码丙糖磷酸异构酶的曲霉属基因的未翻译的前导子替换未翻译的前导子；非限制性实例包括来自编码中性α-淀粉酶的黑曲霉基因的修饰的启动子，其中已经用来自编码丙糖磷酸异构酶的构巢曲霉或米曲霉基因的未翻译的前导子替换未翻译的前导子)；及其突变型、截短型及杂合型启动子。其他启动子在美国专利号6,011,147中描述。

在酵母宿主中，从针对以下各项的基因获得有用的启动子：酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1，ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶。在罗马诺斯(Romanos)等人，1992，酵母(Yeast)8:423-488中描述了酵母宿主细胞的其他有用启动子。

控制序列也可以是由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接至编码该变体的多核苷酸的3'-末端。在宿主细胞中有功能的任何终止子可以用于本发明中。

用于丝状真菌宿主细胞的优选终止子是从以下各项的基因获得：构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。

酵母宿主细胞的优选终止子从针对以下各项的基因获得：酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。在罗马诺斯(Romanos)等人，1992，上文中描述了酵母宿主细胞的其他有用终止子。

该控制序列也可以是前导子，该前导子是对宿主细胞翻译重要的mRNA的非翻译区。该前导子可操作地连接至编码该变体的多核苷酸的5'-末端。可以使用在宿主细胞中有功能的任何前导子。

从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因获得用于丝状真菌宿主细胞的优选前导子用于丝状真菌宿主细胞的优选前导子。

从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母醹-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因获得用于酵母宿主细胞的合适的前导子。

控制序列也可以是多聚腺苷化序列，一种与多核苷酸3’-末端可操作地连接并在转录时由宿主细胞识别为向转录的mRNA添加聚腺苷酸残基的信号序列。可以使用在宿主细胞中起作用的任何聚腺苷酸化序列。

用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下各项的基因获得：构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖镰孢胰蛋白酶样蛋白酶。

对于酵母宿主细胞有用的聚腺苷酸化序列在郭(Guo)和谢尔曼(Sherman)，1995，分子细胞生物学(Mol.Cellular Biol.)15:5983-5990中得以描述。

该控制序列还可以是信号肽编码区，编码与变体的N-端连接的信号肽，并且引导该变体进入细胞的分泌通路。该多核苷酸的编码序列的5’-端可以固有地包含信号肽编码序列，该信号肽编码序列在翻译阅读框中与编码该变体的编码序列的区段天然地连接在一起。可替代地，编码序列5’-端可以包含对于该编码序列是外源的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下，可能需要外源信号肽编码序列。可替代地，外源信号肽编码序列可以简单地置换天然信号肽编码序列，以便增加变体的分泌。然而，可以使用指导表达的变体进入宿主细胞的分泌通路的任何信号肽编码序列。

用于丝状真菌宿主细胞的有效信号肽编码序列是从黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶的基因获得的信号肽编码序列。

从酿酒酵母α-因子和酿酒酵母转化酶的基因获得用于酵母宿主细胞的有用信号肽。其他的有用的信号肽编码序列由罗曼诺斯(Romanos)等人(1992，上文)描述。

该控制序列还可以是编码位于变体的N-末端处的前肽的前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下各项的基因获得：嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。

在信号肽序列和前肽序列二者都存在的情况下，该前肽序列定位成紧邻该变体的N-末端并且该信号肽序列定位成紧邻该前肽序列的N-末端。

还令人希望的可以是添加相对于宿主细胞的生长来调节该变体的表达的调节序列。调节序列的实例是使得基因的表达响应于化学或物理刺激(包括调控化合物的存在)而开启或关闭的那些序列。在酵母中，可以使用ADH2系统或GAL1系统。在丝状真菌中，可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中，这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下，编码该变体的多核苷酸将可操作地连接至该调节序列。

表达载体

本发明还涉及包括编码本发明的变体的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。不同的核苷酸和控制序列可以连接在一起以产生重组表达载体，这一重组表达载体可以包括一个或多个便利的限制酶切位点以允许在这些位点处插入或取代编码该变体的多核苷酸。可替代地，可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中而表达该多核苷酸。在产生该表达载体时，该编码序列位于该载体中，这样使得该编码序列与该供表达的适当控制序列可操作地连接。

重组表达载体可以是任何载体(例如，质粒或病毒)，其能够方便地进行重组DNA程序，并且能够引起多核苷酸的表达。典型地，载体的选择将取决于载体与向其中待引入载体的宿主细胞的相容性。该载体可以是线性的或闭合的环状质粒。

该载体可以是自主复制载体，即，作为染色体外实体存在的载体，其复制独立于染色体复制，例如，质粒、染色体外元件、微染色体或人工染色体。该载体可以包含任何用以保证自我复制的要素。可替代地，该载体可以是这样载体，当它被引入该宿主细胞中时，被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外，可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同包含待引入到宿主细胞的基因组中的总DNA)或转座子。

该载体优选包含一个或多个允许方便地选择转化细胞、转染细胞、转导细胞等细胞的选择性标记。选择性标记是这样一种基因，该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型等。

用于酵母宿主细胞的适合标记包括，但不限于，ADE2、HIS3、LEU2、LYS2、MET3、TRP1、和URA3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于，adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶)、连同其等效物。优选地用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。在木霉属细胞中优选使用的是adeA、adeB、amdS、hph以及pyrG基因。

选择性标记可以是如在WO 2010/039889中描述的双选择性标记系统。在一个方面中，双选择性标记是hph-tk双选择性标记系统。

载体优选包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。

对于整合到该宿主细胞基因组中，该载体可以依靠编码该变体的多核苷酸序列或者用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地，该载体可以包含用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置的另外的多核苷酸。为了增加在精确位置整合的可能性，这些整合元件应包含足够数量的核酸，例如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对，这些碱基对与对应的靶序列具有高度的序列一致性以提高同源重组的可能性。这些整合元件可以是与宿主细胞的基因组内的靶序列同源的任何序列。此外，这些整合元件可以是非编码多核苷酸或编码多核苷酸。在另一个方面，该载体可以通过非同源重组整合到宿主细胞的基因组中。

对于自主复制，该载体可以进一步包括使该载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。

用于在酵母宿主细胞中使用的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1与CEN3的组合、以及ARS4与CEN6的组合。

在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(格姆斯(Gems)等人，1991，基因(Gene)98:61-67；卡伦(Cullen)等人，1987，核酸研究(Nucleic Acids Res.)15:9163-9175；WO 00/24883)。AMA1基因的分离和包括该基因的质粒或载体的构建可以根据披露于WO00/24883中的方法完成。

可以将本发明的多核苷酸的多于一个的拷贝插入到一个宿主细胞中以增加变体的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或通过包括一个与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目，其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。

用于连接以上所描述的元件以构建重组表达载体的程序是本领域的普通技术人员熟知的(参见，例如，萨姆布鲁克(Sambrook)等人，1989，见上文)。

宿主细胞

本发明还涉及重组宿主细胞，这些重组宿主细胞包括编码本发明的变体的、可操作地连接至一个或多个控制序列的多核苷酸，该一个或多个控制序列指导本发明的变体的产生。将包括多核苷酸的构建体或载体引入宿主细胞中，这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体，如早前所述。术语“宿主细胞”涵盖由于复制过程中发生的突变与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上将取决于编码该变体的基因及其来源。

宿主细胞可以是真核生物，如哺乳动物、昆虫、植物或真菌细胞。

该宿主细胞可以是真菌细胞。如在此所用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如霍克斯沃思(Hawksworth)等人定义，引自：安斯沃斯(Ainsworth)和比斯比(Bisby)的真菌大词典(Dictionary of The Fungi)，第8版，1995，国际CAB，大学出版社(University Press)，剑桥(Cambridge)，英国)。

真菌宿主细胞可以是酵母细胞。如在此使用的“酵母”包括产子嚢酵母(内孢霉目)、产担子酵母和属于半知菌类(芽孢纲)的酵母。由于酵母的分类可能在将来变化，为了本发明的目的，酵母应当如酵母的生物学与活性(Biology and Activities of Yeast)(斯金纳(Skinner)，帕斯莫尔(Passmore)和达文波特(Davenport)编著，应用细菌学学会专题论文集系列9(Soc.App.Bacteriol.Symposium Series No.9)，1980)所描述那样定义。

酵母宿主细胞可以是假丝酵母属细胞、汉逊酵母属细胞、克鲁维酵母属细胞、毕赤酵母属细胞、酵母菌属细胞、裂殖酵母或耶罗维亚酵母属细胞、如乳酸克鲁维酵母细胞、卡氏酵母细胞、酿酒酵母细胞、糖化酵母细胞、道格拉斯酵母(Saccharomyces douglasii)细胞、克鲁弗酵母细胞、诺地酵母细胞、卵形酵母细胞或解脂耶罗维亚酵母细胞。

真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)亚类的所有丝状形式(如霍克斯沃思等人，1995，上文定义)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸，而碳分解代谢是专性需氧的。相反，酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding)，而碳分解代谢可以是发酵的。

丝状真菌宿主细胞可以是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属(Magnaporthe)、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。

例如，丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、埃默森篮状菌、土生梭孢霉、长域毛栓菌(Trametesvillosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。

可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的适合程序在EP 238023和约尔顿(Yelton)等人，1984，美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474以及科里蒂森(Christensen)等人，1988，生物/技术(Bio/Technology)6:1419-1422中描述。用于转化镰刀菌属物种的适合方法在马拉迪耶(Malardier)等人，1989，基因(Gene)78:147-156和WO 96/00787中描述。可以使用由如以下文献描述的程序转化酵母：贝克尔(Becker)和瓜伦特(Guarente)，在阿贝尔森(Abelson)，J.N.和西蒙(Simon)，M.I.编，酵母遗传学与分子生物学指南，酶学方法(Guide to Yeast Genetics and Molecular Biology,Methodsin Enzymology)，第194卷，第182-187页，学术出版社有限公司(Academic Press,Inc.)，纽约；伊藤(Ito)等人，1983，细菌学杂志(J.Bacteriol.)153:163；以及哈尼恩(Hinnen)等人，1978，美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)75:1920。

产生方法

本发明还涉及产生变体的方法，这些方法包括(a)在有助于该变体的产生的条件下培养本发明的重组宿主细胞；并且任选地(b)回收该变体。

使用本领域已知的方法在适合于产生该变体的一种营养培养基中培养这些宿主细胞。例如，可以通过摇瓶培养，或者在适合的培养基中并在允许该变体表达和/或分离的条件下在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批给料发酵或固态发酵)来培养该细胞。该培养是使用本领域中已知的程序，在适合的营养培养基中发生，该培养基包括碳和氮来源及无机盐。适合的培养基从商业供应商可获得或可以根据公开的组成(例如，在美国典型培养物保藏中心的目录中)制备。如果该变体被分泌到该营养培养基中，则该变体可直接从该培养基中回收。如果该变体没有分泌，则它可从细胞裂解液中回收。

可以使用本领域已知的对木葡聚糖内糖基转移酶特异的方法检测这些变体。这些检测方法包括但不局限于，特异性抗体的使用、酶产物的形成或酶底物的消失。例如，酶测定法可用于确定如在此所述的变体的活性。

该变体可以使用本领域已知的方法回收。例如，可以通过多种常规程序从该营养培养基中回收该变体，这些常规程序包括但不局限于收集、离心、过滤、萃取、喷雾干燥、蒸发、或沉淀。在一个方面中，回收整个发酵液。

可以通过本领域中已知的多种程序来纯化变体以获得基本上纯的变体，这些程序包括但不限于色谱法(例如，离子交换色谱、亲和色谱、疏水作用色谱、色谱聚焦、以及尺寸排阻色谱)、电泳程序(例如，制备型等电点聚焦)、差别溶解度(例如，硫酸铵沉淀)、SDS-PAGE、或萃取(参见，例如，蛋白质纯化(Protein Purification)，詹森(Janson)和赖登(Ryden)编辑，VCH出版社(VCH Publishers)，纽约，1989)。

发酵液配制品或细胞组合物

本发明还涉及包含本发明的变体的发酵液配制品或细胞组合物。发酵液产物进一步包括在发酵过程中使用的另外的成分，例如像，细胞(包括包含编码本发明的变体的基因的宿主细胞，这些宿主细胞被用于产生感兴趣的变体)、细胞碎片、生物质、发酵介质和/或发酵产物。在一些实施例中，该组合物是包含一种或多种有机酸、杀灭的细胞和/或细胞碎片以及培养基的细胞杀灭的全培养液。

如在此使用的术语“发酵液”是指由细胞发酵产生、不经历或经历最低限的回收和/或纯化的制剂。例如，当微生物培养物生长至饱和，在碳限制条件下孵育以允许蛋白质合成(例如，由宿主细胞进行酶的表达)并且分泌到细胞培养基中时，产生发酵液。发酵液可以包含在发酵结束时得到的发酵材料的未分级的或分级的内容物。典型地，发酵液是未分级的并且包括用过的培养基以及例如通过离心去除微生物细胞(例如，丝状真菌细胞)之后存在的细胞碎片。在一些实施例中，发酵液包含用过的细胞培养基、胞外酶以及有活力的和/或无活力的微生物细胞。

在一个实施例中，该发酵液配制品和细胞组合物包括第一有机酸组分(包括至少一种1-5碳的有机酸和/或其盐)以及第二有机酸组分(包括至少一种6碳或更多碳的有机酸和/或其盐)。在具体实施例中，该第一有机酸组分是乙酸、甲酸、丙酸、其盐，或前述两种或更多种的混合物；并且该第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、其盐，或前述两种或更多种的混合物。

在另一个实施例中，该组合物包含一种或多种有机酸，并且任选地进一步包含杀灭的细胞和/或细胞碎片。在一个实施例中，从细胞杀灭的全培养液中去除这些杀灭的细胞和/或细胞碎片，以提供不含这些组分的组合物。

这些发酵液配制品或细胞组合物可以进一步包括防腐剂和/或抗微生物(例如，抑菌)剂，包括但不限于山梨醇、氯化钠、山梨酸钾、以及本领域中已知的其他试剂。

这些发酵液配制品或细胞组合物可以进一步包括多种酶活性，如选自下组的一种或多种(例如，若干种)酶，该组由以下各项组成：水解酶、异构酶、连接酶、裂解酶、氧化还原酶以及转移酶。

该细胞杀灭的全培养液或组合物可以包含在发酵结束时得到的发酵材料的未分级的内容物。典型地，该细胞杀灭的全培养液或组合物包含用过的培养基以及在微生物细胞(例如，丝状真菌细胞)生长至饱和、在碳限制条件下孵育以允许蛋白合成之后存在的细胞碎片。在一些实施例中，该细胞杀灭的全培养液或组合物包含用过的细胞培养基、胞外酶和杀灭的丝状真菌细胞。在一些实施例中，可以使用本领域已知的方法来使细胞杀灭的全培养液或组合物中存在的微生物细胞透性化和/或裂解。

如在此描述的全培养液或细胞组合物典型地是液体，但是可以包含不溶性组分，例如杀灭的细胞、细胞碎片、培养基组分和/或一种或多种不溶性酶。在一些实施例中，可以去除不溶性组分以提供澄清的液体组合物。

本发明的全液配制品和细胞组合物可以通过WO 90/15861或WO2010/096673中所描述的方法来产生。

酶组合物

本发明还涉及包括本发明的一种变体的组合物。优选地，这些组合物富含这种变体。术语“富含”指示该组合物的木葡聚糖内糖基转移酶活性已经增加，例如，富集因子为至少1.1。

这些组合物可以包括本发明的一种变体作为主要酶组分，例如一种单组分组合物。可替代地，这些组合物可以包括多种酶活性，如选自下组的一种或多种(例如，若干种)酶，该组由以下各项组成：水解酶、异构酶、连接酶、裂解酶、氧化还原酶、以及转移酶。

这些组合物可以根据本领域已知的方法制备，并可以是液体或干燥组合物的形式。可以根据本领域中已知的方法稳定这些组合物。

下文中给出本发明的组合物的优选用途的实例。组合物的剂量以及组合物使用的其他条件可以根据本领域已知的方法来确定。

用途

本发明的这些变体可以用于根据WO 97/23683为纤维素材料(如织物或纸和纸浆产品)提供改进的强度和/或形状保持和/或抗皱特性的工艺中。

本发明的这些变体还可以用于洗衣和/或织物和/或颜色护理组合物中，以根据WO2001/07556针对纤维素纤维刷新和/或恢复改进的拉伸强度，增强的抗皱、抗起球和抗缩水特性。

通过以下实例进一步对本发明进行描述，但不应将其理解为对本发明范围的限制。

实例

培养基和溶液

LB板由以下各项构成：10g的胰蛋白胨、5g的酵母提取物、5g的NaCl、15g的细菌琼脂(bacteriological agar)、以及加至1升的去离子水。

LB培养基由以下各项构成：10g的胰蛋白胨、5g的酵母提取物、5g的NaCl、以及加至1升的去离子水。

基本培养基琼脂板由以下各项构成：342.3g的蔗糖、10g的葡萄糖、4g的MgSO₄·7H₂0、6g的NaNO₃、0.52g的KCl、1.52g的KH₂PO₄、0.04mg的Na₂B₄O₇·10H₂O、0.4mg的CuSO₄·5H₂O、1.2mg的FeSO₄·7H₂O、0.7mg的MnSO₄·2H₂O、0.8mg的Na₂MoO₄·2H₂O、10mg的ZnSO₄·7H₂O、500mg的柠檬酸、4mg的D-生物素、20g的纯净琼脂、以及加至1升的去离子水。

合成的、缺少尿苷的确定成分培养基由以下各项构成：18mg的腺嘌呤半硫酸盐、76mg的丙氨酸、76mg的精氨酸盐酸盐、76mg的天冬酰胺一水合物、76mg的天门冬氨酸、76mg的半胱氨酸盐酸盐一水合物、76mg的谷氨酸单钠盐、76mg的谷氨酰胺、76mg的甘氨酸、76mg的组氨酸、myo-76mg的肌醇、76mg的异亮氨酸、380mg的亮氨酸、76mg的赖氨酸单盐酸盐、76mg的蛋氨酸、8mg的对-氨基苯甲酸钾盐、76mg的苯丙氨酸、76mg的脯氨酸、76mg的丝氨酸、76mg的苏氨酸、76mg的色氨酸、76mg的酪氨酸二钠盐、76mg的缬氨酸、以及加至1升的去离子水。

YP+2％葡萄糖培养基由以下各项构成：10g的酵母提取物、20g的蛋白胨、20g的葡萄糖、以及加至1升的去离子水。

YP+2％麦芽糊精培养基由以下各项构成：10g的酵母提取物、20g的蛋白胨、20g的麦芽糊精、以及加至1升的去离子水。

2X YT+氨比西林平板由16g的胰蛋白胨，10g的酵母提取物，5g的氯化钠，15g的细菌琼脂，和加至1升的去离子水组成。在高压蒸汽处理的培养基回火到55℃后，添加1ml的100mg/ml的氨比西林。

TAE缓冲液由以下各项构成：4.84g的Tris碱、1.14ml的冰醋酸、2ml的0.5M EDTA(pH 8.0)、并且去离子水补足至1升。

TBE缓冲液由以下各项构成：10.8g的Tris碱、5.5g硼酸、4ml的0.5M EDTA(pH8.0)、以及加至1升的去离子水。

实例1：碘比色法测定来确定木葡聚糖内糖基转移酶活性

木葡聚糖内糖基转移酶活性使用由布洛瓦(Sulova)等人，1995，分析生物化学(Analytical Biochemistry)229:80-85中描述的碘比色测定的修改版本进行测定。对于每个反应，5μl的罗望子木葡聚糖(麦格酶国际公司，布雷，英国)(5mg/ml在水中)与20μl的木葡聚糖低聚物(麦格酶国际公司，布雷，英国)(5mg/ml在水中)和10μl的400mM柠檬酸钠pH5.5合并，并且分散到96孔板中。反应通过添加5μl的液体培养液至每个孔中启动，并且在37℃孵育板10分钟。反应通过添加200μl的由14％(w/v)Na₂SO₄、0.2％KI、0.1M HCl和0.5％I₂构成的溶液猝灭，并且在黑暗中孵育30分钟，然后在M5分光光度计(Molecular Devices公司，桑尼维尔，加利福尼亚州，美国)中在620nm测量吸光度。

实例2：荧光素异硫氰酸酯标记的木葡聚糖的产生

根据由周(Zhou)等人，2006，生物催化与生物转化(Biocatalysis andBiotransformation)24:107-120所描述的程序，通过木葡聚糖低聚物的还原端的还原氨化，随后在100mM碳酸氢钠(pH 9.0)中在室温下将XGO的氨基基团结合到荧光素异硫氰酸酯异构体I(西格玛奥德里奇(Sigma Aldrich)，圣路易斯，密苏里州，美国)24小时，来产生荧光素异硫氰酸酯标记的木葡聚糖低聚物(FITC-XGO)。将结合反应产物在真空中浓缩干燥，溶解于0.5ml的去离子水，并且通过硅胶层析进行纯化，该硅胶层析用从100:0:0.04至70:30:1梯度的乙腈:水:乙酸作为流动相进行洗脱。通过蒸发该缓冲液、溶解于D₂O(西格玛奥德里奇，圣路易斯，密苏里州，美国)，并且使用Varian400MHz MercuryVx(安捷伦(Agilent)，圣克拉拉，加利福尼亚州，美国)通过¹H NMR分析来确认纯度和产物同一性。在-20℃下在黑暗中，储存干燥的FITC-XGO，并且在解冻过程中干燥。

一mg的FITC-XGOs与在200μl反应中的每ml的20mM柠檬酸钠pH 5.0的1mg的罗望子木葡聚糖(麦格酶公司，布雷，英国)和18mg的VaXET16一起孵育至少30分钟。合并样品混合物并且通过添加冰冷的乙醇至80％(v/v)的终浓度进行沉淀，并且在4℃下孵育过夜。沉淀的荧光素异硫氰酸标记木葡聚糖(FITC-XG)通过使用LEGENDTMRT加离心机(赛默飞世尔科技公司(Thermo Scientific)，沃尔瑟姆，马萨诸塞州，美国)在3000rpm离心，倾析掉乙醇进行回收，并且在室温下干燥24小时。将FITC-XG溶解在最小体积的去离子水中直到溶解并储存在-20℃。将冷冻的FITC-XG解冻并且冻干过夜。将冻干粉末溶解在5000μl的去离子水中并且通过在488nm的吸光度定量。

按以下方式制备大规模批次的FITC-XG。在去离子水中制备每ml溶液7.9mg的FITC-XGO。彻底混合四十ml的10mg的罗望子木葡聚糖(麦格酶公司，布雷，英国)/ml的去离子水、452ml的7.9mg的FITC-XGO/ml的去离子水、2ml的400mM柠檬酸钠(pH 5.5)、和1.2ml的1.4mg的VaXET16/ml的20mM柠檬酸钠(pH 5.5)，并且在室温下孵育过夜。在过夜孵育后，通过添加冰冷的乙醇至终体积110ml来沉淀FITC-XG，彻底混合，并且在4℃下整夜孵育。用水洗涤沉淀的FITC-XG，并且然后转移到圆底烧瓶(Erlenmeyer bulb)中。通过使用EZ-2Elite蒸发器(SP Scientific/Genevac公司，斯通里奇，纽约，美国)蒸发4小时来去除残余的水和乙醇。将干燥的样品溶解于水中，并且用去离子水将体积调整到48ml，以产生，在所希望的100kDa的平均分子量下，5mg/ml的最终FITC-XG浓度。

实例3：荧光偏振测定以确定木葡聚糖内糖基转移活性

使用以下测定来确定木葡聚糖内糖基转移活性。如在实例2中所描述的制备200μl的反应，该反应包含1mg的罗望子木葡聚糖/ml、0.01mg/ml FITC-XGO，并且将10μl的适当稀释的XET在25℃下在不透明96孔微量滴定板中的20mM柠檬酸钠(pH 5.5)中孵育10分钟。在这个时间段，以顶级阅读方向，用490nm的激发波长、520nm的发射波长、激发路径中495截止滤波器、高精度(100次读取)、和中光电倍增管的灵敏度，使用M5酶标仪(分子器件公司(Molecular Devices)，森尼维耳市，加利福尼亚州，美国)连续监测荧光偏振。将荧光XGO以XET依赖性掺入非荧光XG中导致随着时间增加荧光偏振。使用偏振时间进程曲线的线性区域的斜率来确定该活性。

实例4：质粒pMMar27的构建

构建质粒pMMar27，用于表达酵母中的土生梭孢壳霉Cel6A纤维二糖水解酶II。该质粒产生自酵母表达载体的谱系：质粒pMMar27构建自质粒pBM175b；质粒pBM175b构建自质粒pBM143b(WO 2008/008950)和质粒pJLin201；并且质粒pJLin201构建自pBM143b。

除紧邻pBM143b中疏棉状嗜热丝孢菌脂肪酶变体基因的下游的Xba I位点突变为独特的NheI位点以外，质粒pJLin201与pBM143b相同。使用II XL定点诱变试剂盒(Stratagenee公司，拉荷亚，加利福尼亚州，美国)将pBM143b中的Xba I序列(TCTAGA)变为Nhe I序列(gCTAGc)。以下示出了用来突变该位点的引物。

引物999551(正义)：

5’-ACATGTCTTTGATAAgCTAGcGGGCCGCATCATGTA-3’(SEQ ID NO:52)

引物999552(反义)：

5’-TACATGATGCGGCCCgCTAGcTTATCAAAGACATGT-3’(SEQ ID NO:53)

小写代表突变的核苷酸。

最终体积为50μl的PCR由以下各项构成：125ng的以上每种引物、20ng的pBM143b、1X反应缓冲液(Stratagene公司，拉荷亚，加利福尼亚州，美国)、3μl的(Stratagene公司，拉荷亚，加利福尼亚州，美国)、1μl的dNTP混合物、以及1μl的2.5单元/ml Pfu Ultra HF DNA聚合酶(Stratagene公司，拉荷亚，加利福尼亚州，美国)。使用热循环仪(Eppendorf AG公司，汉堡，德国)仪进行该反应，程序为1个循环，在95℃下，持续1分钟；18个循环，每个循环在95℃下持续50秒，60℃持续50秒，和68℃持续6分钟6秒；以及1个循环，在68℃下，持续7分钟。在PCR反应后，将该管置于冰上2分钟。向PCR中直接添加一微升的Dpn I(普洛麦格公司(Promega)，菲奇堡，威斯康辛州，美国)，并且在37℃下孵育1小时。根据制造商的说明，使用2μl体积的DpnI消化的反应来转化大肠杆菌XL10高效感受态细胞(Stratagene公司，拉荷亚，加利福尼亚州，美国)。在2X YT加氨比西林板上对大肠杆菌转化体进行选择。使用9600(凯杰公司，巴伦西亚，加利福尼亚州，美国)将质粒DNA从转化体中的若干种分离。通过限制性酶切和测序分析来确认具有所希望的Nhe I变化的一个质粒，并且指定为质粒pJLin201。为了消除由定点突变引入的可能的PCR错误，通过将包含Nhe I位点的片段克隆回质粒pBM143b中来构建质粒pBM175b。简言之，将质粒pJLin201用Nde I和MluI进行消化，并且将得到的片段克隆到之前用相同的酶使用快速连接试剂盒(罗氏诊断公司(Roche Diagnostics Corporation)，印第安纳波利斯，印第安纳州，美国)消化的pBM143b中。简言之，将7μl的Nde I/Mlu I消化的pJLin201片段和1μl的消化的pBM143b与2μl的5XDNA稀释液(罗氏诊断公司，印第安纳波利斯，印第安纳州，美国)、10μl的2X T4DNA连接缓冲液(罗氏诊断公司，印第安纳波利斯，印第安纳州，美国)、和1μl的T4DNA连接酶(罗氏诊断公司，印第安纳波利斯，印第安纳州，美国)进行混合，并且在室温下孵育15分钟。将2微升的连接转化到XL1-蓝亚克隆-级感受态细胞(Stratagene公司，拉荷亚，加利福尼亚州，美国)细胞并且散布于2X YT加氨比西林板上。使用9600从若干转化体中纯化质粒DNA，并使用3130XL遗传分析仪(应用生物系统公司(Applied Biosystems)，福斯特城，加利福尼亚州，美国)通过DNA测序进行分析，以鉴定包含所希望的构巢曲菌pyrG插入物的质粒。将一个具有预期的DNA序列的质粒指定为pBM175b。

质粒pMMar27构建自pBM175b和具有设计用于插入所消化pBM175b的突出端的土生梭孢壳霉Cel6A纤维二糖水解酶II的扩增的基因。在CUP I启动子的控制下包含疏棉状嗜热丝孢菌脂肪酶变体基因的质粒pBM175b包含独特的Hind III和Nhe I位点，来去除脂肪酶基因。将质粒pBM175b用这些限制性内切酶进行消化，以去除脂肪酶基因。在消化后，将空载体通过使用TBE缓冲液的1.0％琼脂糖凝胶电泳进行分离，其中将大约5,215bp的片段从凝胶切离，并且使用凝胶提取试剂盒(凯杰公司，巴伦西亚，加利福尼亚州，美国)进行提取。连接反应(20μl)由1X缓冲液(BD生物科学公司(BDBiosciences)，帕洛阿尔托(Palo Alto)，加利福尼亚州，美国)，1X BSA(BD生物科学公司，帕洛阿尔托(Palo Alto)，加利福尼亚州，美国)，1μl酶(1:10稀释)(BD生物科学公司，帕洛阿尔托(Palo Alto)，加利福尼亚州，美国)，用Hind III和Nhe I消化的99ngpBM175b，和36ng的纯化的土生梭孢壳霉Cel6A纤维二糖水解酶II PCR产物。将该反应在室温下孵育30分钟。将2μl体积的反应转化到大肠杆菌高效感受态细胞(Stratagene公司，拉荷亚，加利福尼亚州，美国)中。在每ml补充有100μg的氨比西林的LB平板上选择转化体。挑选一种菌落，其包含插入pBM175b载体替代脂肪酶基因产生pMMar27的土生梭孢壳霉Cel6A(图1)。所选择的质粒在从起始密码子的位置228处包含PCR错误，TCT代替TCC，但是导致中的土生梭孢壳霉Cel6A纤维二糖水解酶II的沉默变化。

实例5：pEvFz1表达载体的构建

表达载体pEvFz1是通过修饰pBM120a(美国专利8,263,824)来进行构建，以包括NA2/NA2-tpi启动子、黑曲霉淀粉葡糖苷酶终止子序列(AMG终止子)、和作为选择性标志物的构巢曲霉乳清酸核苷-5’磷酸脱羧酶基因(pyrG)。

通过该将构巢曲霉pyrG基因从pAlLo2(WO 2004/099228)克隆到pBM120a中来产生质粒pEvFz1。将质粒pBM120a和pAlLo2用Nsi I在37℃下消化过夜。将所得4176bp线性pBM120a载体片段和来自pAlLo2的1479bp pyrG基因插入片段各自使用TAE缓冲液通过0.7％琼脂糖凝胶电泳纯化，从凝胶切离，并使用凝胶提取试剂盒进行提取。

使用QUICK LIGATIONTM试剂盒(新英格兰生物实验室，贝弗利，马萨诸塞州，美国)将1479bp pyrG基因插入片段连接至Nsi I消化的pBM120a片段。连接反应由以下构成：1XQUICK LIGATIONTM反应缓冲液(新英格兰生物实验室，贝弗利，马萨诸塞州，美国)、50ng的Nsi I消化的pBM120a载体、54ng的1479bp Nsi I消化的pyrG基因插入物、以及1μl的T4DNA连接酶，总体积为20μl。将连接混合物在37℃下孵育15分钟，随后在50℃下孵育15分钟，并且然后放置在冰上。

将1μl的连接混合物转化到ONETOP10化学感受大肠杆菌细胞(英杰公司，卡尔斯巴德，加利福尼亚州，美国)中。在2X YT加氨比西林板上对转化体进行选择。使用9600从若干转化体中纯化质粒DNA，并使用3130XL遗传分析仪通过DNA测序进行分析，以鉴定包含所希望的构巢曲菌pyrG插入物的质粒。将一个具有预期的DNA序列的质粒指定为pEvFz1(图2)。

实例6：构建作为酵母/大肠杆菌/米曲霉穿梭载体的质粒pDLHD0006

使用酵母重组克隆，将质粒pDLHD0006构建为基本载体，以使得米曲霉表达盒文库建立。通过使用酵母重组克隆(表1)合并三种DNA片段来产生质粒pDLHD0006：包含大肠杆菌pUC复制起点、大肠杆菌β-内酰胺酶(ampR)选择性标志物、URA3酵母选择性标志物、和来自pMMar27(实例4)的酵母2微米复制起点的片段1；包含NA2-tpi启动子(来自编码黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸异构酶的基因的启动子的杂合体)、疏棉状嗜热丝孢菌脂肪酶开放阅读框(ORF)、和来自pJaL1262(WO 2013/178674)的黑曲霉葡糖糖化酶终止子的片段2；和来自pEvFz1(实例3)的包含构巢曲霉pyrG选择标志物的片段5。

表I.

pDLHD0006	PCR含量	PCR模板
			片段1	大肠杆菌ori/AmpR/URA/2微米(4.1kb)	pMMar27
片段2	NA2-tpi PR/脂肪酶/Tamg(4.5kb)	pJaL1262
			片段3	来自pEvFz1的pyrG基因(1.7kb)	pEvFz1

使用以下所示的引物613017(正义)和613018(反义)扩增片段1。设计引物613017包含与片段3(小写)具有序列同源性的侧翼区，并且设计引物613018包含与片段2(小写)具有序列同源性的侧翼区以使得酵母在这三个PCR片段之间重组克隆。

引物613017(正义)：

ttaatcgccttgcagcacaCCGCTTCCTCGCTCACTGACTC(SEQ ID NO:54)

引物613018(反义)：

acaataaccctgataaatgcGGAACAACACTCAACCCTATCTCGGTC(SEQ ID NO:55)

片段1在反应中通过PCR来扩增，该反应由10ng的质粒pMMar27、0.5μl的DNA聚合酶(新英格兰生物实验室公司，伊普斯威奇，马萨诸塞州，美国)、20pmol的引物613017、20pmol的引物613018、1μl的10mM dNTP、10μl的5XHF缓冲液(新英格兰生物实验室公司，伊普斯威奇，马萨诸塞州，美国)、和35.5μl的水构成。该反应在热循环仪中孵育，程序为1个循环，在98℃下持续30秒；以及30个循环，每个循环在98℃下持续10秒，在60℃下持续10秒，以及在72℃下持续1.5分钟。将得到的4.1kb PCR产物(片段1)直接使用用于与以下片段2和3的酵母重组。

使用以下所示的引物613019(正义)和613020(反义)扩增片段2。设计引物613019包含与片段1(小写)具有序列同源性的侧翼区，并且设计引物613020包含与片段3(小写)具有序列同源性的侧翼区以使得酵母在这三个PCR片段之间重组克隆。

613019(正义)：

agatagggttgagtgttgttccGCATTTATCAGGGTTATTGTCTCATGAGCGG(SEQ ID NO:56)

613020(反义)：

ttctacacgaaggaaagagGAGGAGAGAGTTGAACCTGGACG(SEQ ID NO:57)

片段2在反应中通过PCR来扩增，该反应由10ng的质粒pJaL1262、0.5μl的DNA聚合酶、20pmol的引物613019、20pmol的引物613020、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。在热循环仪中孵育该反应，程序为1个循环，在98℃下，持续30秒；30个循环，每个循环在98℃持续10秒，60℃持续10秒，以及72℃持续2分钟；以及20℃保持。将得到的4.5kb PCR产物(片段2)直接使用用于与以上片段1和以下片段3的酵母重组。

使用以下所示的引物613022(正义)和613021(反义)扩增片段3。设计引物613021包含与片段2(小写)具有序列同源性的侧翼区，并且设计引物613022包含与片段1(小写)具有序列同源性的侧翼区以使得酵母在这三个PCR片段之间重组克隆。

引物613022(正义)：

aggttcaactctctcctcCTCTTTCCTTCGTGTAGAAGACCAGACAG(SEQ ID NO:58)

引物613021(反义)：

tcagtgagcgaggaagcggTGTGCTGCAAGGCGATTAAGTTGG(SEQ ID NO:59)

片段3在反应中通过PCR来扩增，该反应由10ng的质粒pEvFz1(实例5)、0.5μl的DNA聚合酶、20pmol的引物613021、20pmol的引物613022、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。在热循环仪中孵育该反应，程序为1个循环，在98℃下，持续30秒；30个循环，每个循环在98℃持续10秒，60℃持续10秒，以及72℃持续2分钟；以及20℃保持。将得到的1.7kb PCR产物(片段3)直接使用用于与以上片段1和2的酵母重组。

使用基于酵母同源性的重组克隆，使用以下程序来合并三个PCR片段。将三种PCR片段的每种的20μl等分试样与来自鲑鱼睾丸的100μg的单链脱氧核糖核酸(西格玛奥德里奇，圣路易斯，密苏里州，美国)、100μl的菌株YNG318的感受态酵母细胞(酿酒酵母ATCC208973)、和600μl的PLATE缓冲液(西格玛奥德里奇，圣路易斯，密苏里州，美国)合并，并且混合。将反应在30℃下以200rpm振荡孵育30分钟。然后将该反应在42℃下在没有振荡的情况下继续15分钟。将这些细胞通过在5,000x g下离心1分钟进行沉淀，并且弃去上清液。将细胞球粒悬浮于200μl的高压蒸汽处理的水中，并且分在两个包含合成的所定义的培养基缺少尿苷的琼脂平板，并且在30℃下孵育3天。将这些酵母菌落使用1ml的高压蒸汽处理的水从平板中分离。将这些细胞通过在13,000x g下离心30秒进行沉淀，并且将100μl等分试样的玻璃珠添加到该管中。将细胞和珠混合物悬浮在250μl的P1缓冲液(凯杰公司，巴伦西亚，加利福尼亚州，美国)中，并且然后涡旋1分钟来裂解这些细胞。使用旋转迷你制备型试剂盒(凯杰公司(QIAGEN Inc.)，巴伦西亚，加利福尼亚州，美国)，将质粒DNA进行纯化。根据制造商的说明书，然后将3μl等分试样的质粒DNA转化到大肠杆菌ONE TOP10电转化感受态细胞(英杰公司，卡尔斯巴德，加利福尼亚州，美国)中。将50μl的转化细胞散布于每ml补充有100μg氨比西林的LB板上，并且在37℃下孵育过夜。将转化体各自挑入每ml补充有100μg的氨比西林的3ml的LB培养基中，并且在37℃下在250rpm的振荡下生长过夜。使用旋转迷你制备型试剂盒从菌落中纯化质粒DNA。将使用3130XL遗传分析仪的DNA测序用来确认指定为pDLHD0006的最终质粒中三种片段中的每种的存在(图3)。

实例7：用于野生型红豆木葡聚糖内糖基转移酶16(VaXET16)在米曲霉中表达的pDLH0044的构建

野生型VaXET16cDNA经密码子优化并合成用于在米曲霉中表达。构建质粒pDLHD0044以在米曲霉中多拷贝表达密码子优化的VaXET16基因。使用无缝克隆和装配试剂盒(英杰公司，卡尔斯巴德，加利福尼亚州，美国)合并这两种DNA片段来生成质粒pDLHD0044：包含载体pMA中提供的来自的VaXET16合成基因和与片段2同源的侧翼序列的片段1，以及由载体pDLHD0006的反向PCR产物组成的片段2，该载体pDLHD0006包含大肠杆菌pUC复制起点、大肠杆菌β-内酰胺酶(ampR)选择性标记、URA3酵母选择性标记、酵母2微米复制起点、NA2-tpi启动子、黑曲霉淀粉葡糖苷酶终止子序列(AMG终止子)和构巢曲霉乳清苷-5'-磷酸脱羧酶基因(pyrG)作为选择性标记。

使用以下所示的引物614603(正义)和引物614605(反义)扩增片段1。这些引物被设计成包含与片段2同源的序列的侧翼区(小写)，用于无连接克隆。

引物614603(正义)：

ttcctcaatcctctatatacacaactggccATGGGCTCGTCCCTCTGGAC(SEQ ID NO:60)

引物614605(反义)：

agctcgctagagtcgacctaGATGTCCCTATCGCGTGTACACTCG(SEQ ID NO:61)

片段1在反应中通过PCR来扩增，该反应由10ng的pMA-VaXET16、0.5μl的DNA聚合酶、20pmol的引物614603、20pmol的引物614605、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育，程序为1个循环，在98℃下持续30秒；以及30个循环，每个循环在98℃下持续10秒，在60℃下持续10秒，以及在72℃下持续60秒。将所得0.9kb PCR产物(片段1)用1μl的Dpn I进行处理，以去除质粒模板DNA。直接添加Dpn I至PCR管中，充分混合，并且在37℃下孵育60分钟。

使用以下所示的引物614604(正义)和引物613247(反义)扩增片段2。

引物614604(正义)：

taggtcgactctagcgagctcgagatc(SEQ ID NO:62)

引物613247(反义)：

catggccagttgtgtatatagaggattgaggaaggaagag(SEQ ID NO:63)

片段2在反应中通过PCR来扩增，该反应由10ng的pDLHD0006、0.5μl的DNA聚合酶、20pmol的引物614604、20pmol的引物613247、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育，程序为1个循环，在98℃下持续30秒；以及30个循环，每个循环在98℃下持续10秒，在60℃下持续10秒，以及在72℃下持续4分钟。将所得7.3kb PCR产物(片段2)用1μl的Dpn I进行处理，以去除质粒模板DNA。直接添加Dpn I至PCR管中，充分混合，并且在37℃下孵育60分钟。

使用无缝克隆和装配试剂盒，将以下程序用于合并两个PCR片段。将PCR片段中的每一种的5μl等分试样添加至微量离心管中，然后添加4μl的水、4μl的5X反应缓冲液(英杰公司，卡尔斯巴德，加利福尼亚州，美国)、和2μl的10X酶混合物(英杰公司，卡尔斯巴德，加利福尼亚州，美国)。将该反应在室温下孵育30分钟。根据制造商的说明书，然后将3μl等分试样的该反应混合物转化到大肠杆菌ONETOP10电转化感受态细胞中。将50μl的转化细胞散布于每ml补充有100μg氨比西林的2X YT板上，并且在37℃下孵育过夜。将转化体各自挑入每ml补充有100μg的氨比西林的3ml的LB培养基中，并且在37℃下在250rpm的振荡下生长过夜。使用旋转迷你制备型试剂盒从菌落中纯化质粒DNA。将使用3130XL遗传分析仪的DNA测序用来确认指定为质粒pDLHD0044的最终质粒中三个片段中的每个的存在(图4)。

实例8：野生型红豆木葡聚糖内糖基转移酶16(VaXET16)的克隆，用于在米曲霉中表达

将密码子优化的野生型VaXET16cDNA(实例7)通过酵母重组克隆克隆，克隆到酿酒酵母/米曲霉Flp/FRT穿梭载体中，生成载体pDLHD0075。

表达载体pDLHD0075被构建为包含大肠杆菌pUC复制起点、大肠杆菌β-内酰胺酶(ampR)可选择标记、URA3酵母可选择标记、酵母2微米复制起点、NA2-tpi启动子、密码子优化飞VaXET16开放阅读框(ORF；DNA序列为SEQ ID NO:51并且推导的氨基酸序列为SEQ IDNO:2)、黑曲霉葡糖淀粉酶终止子、构巢曲霉pyrG选择标记、米曲霉TEF1启动子和米曲霉NIAD终止子之间的酿酒酵母2μm翻转酶ORF、和酿酒酵母2μm翻转酶识别目标FRT-F和FRT-F3。

质粒pDLHD0075通过使用酵母重组克隆合并四个DNA片段而生成：片段1包含翻转酶表达盒、FRT-F3、和来自pDau571(图5；SEQ ID NO:64)的AMG终止子、以及与片段4和2同源的侧翼序列。片段2包含大肠杆菌pUC复制起点、大肠杆菌β-内酰胺酶(ampR)选择标记、URA3酵母选择标记、来自pDLHD0044的酵母2微米复制原点、和与片段1和3同源的侧翼序列。片段3包含所述NA2-tpi启动子、来自pDLHD0044的VaXET16密码子优化基因、和与片段2和4同源的侧翼序列。片段4包含黑曲霉淀粉葡萄糖苷酶终止子序列(AMG终止子)和作为来自pDau571的可选择标记的构巢曲霉乳清苷-5’-磷酸脱羧酶基因(pyrG)，以及与片段3和1同源的侧翼序列。

使用以下所示的引物615726(正义)和引物615728(反义)扩增片段1。这些引物被设计成包含分别与片段4和2同源的序列的侧翼区(小写)，用于PCR片段之间的无连接克隆。

引物615726(正义)：

accgggaggaaggctggaaaGCTTACGAGAAAAGAGTTGGACTTTGAGGG(SEQ ID NO:65)

引物615728(反义)：

tgagcgaggaagcggAAGAGCGCCCAATACGCAAACCGCC(SEQ ID NO:66)

片段1在反应中通过PCR来扩增，该反应由10ng的pDau571、0.5μl的DNA聚合酶、20pmol的引物615726、20pmol的引物615728、1μl的10mM dNTPs、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育，程序为1个循环，在98℃下持续30秒；以及30个循环，每个循环在98℃下持续10秒，在60℃下持续10秒，以及在72℃下持续120秒。将所得3.3kb PCR产物(片段1)用1μl的Dpn I进行处理，以去除质粒模板DNA。直接添加Dpn I至PCR管中，充分混合，并且在37℃下孵育60分钟。

使用以下所示的引物615729(正义)和引物615731(反义)扩增片段2。这些引物被设计成包含分别与片段1和3同源的序列的侧翼区(小写)，用于PCR片段之间的无连接克隆。

引物615729(正义)：

tgcgtattgggcgctcttCCGCTTCCTCGCTCACTGACTC(SEQ ID NO:67)

引物615731(反义)：

tatactttctagagaataggaactcggaataggaacttcaaGGAACAACACTCAACCCTATCTCGGTC(SEQ ID NO:68)

片段2在反应中通过PCR来扩增，该反应由10ng的pDLHD0044、0.5μl的DNA聚合酶、20pmol的引物615729、20pmol的引物615731、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育，程序为1个循环，在98℃下持续30秒；以及30个循环，每个循环在98℃下持续10秒，在60℃下持续10秒，以及在72℃下持续120秒。将所得4.2kb PCR产物(片段2)用1μl的Dpn I进行处理，以去除质粒模板DNA。直接添加Dpn I至PCR管中，充分混合，并且在37℃下孵育60分钟。

使用以下所示的引物615730(正义)和引物615611(反义)扩增片段3。这些引物被设计成包含分别与片段2和4同源的序列的侧翼区(小写)，用于PCR片段之间的无连接克隆。

引物615730(正义)：

tccgagttcctattctctagaaagtataggaacttcGCATTTATCAGGGTTATTGTCTCATGAGCGG(SEQ ID NO:69)

引物615611(反义)：

tctagatctcgagtcaGATGTCCCTATCGCGTGTACACTCG(SEQ ID NO:70)

片段3在反应中通过PCR来扩增，该反应由10ng的pDLHD0044、0.5μl的DNA聚合酶、20pmol的引物615730、20pmol的引物615611、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育，程序为1个循环，在98℃下持续30秒；以及30个循环，每个循环在98℃下持续10秒，在60℃下持续10秒，以及在72℃下持续120秒。将所得1.7kb PCR产物(片段3)用1μl的Dpn I进行处理，以去除质粒模板DNA。直接添加Dpn I至PCR管中，充分混合，并且在37℃下孵育60分钟。

使用以下所示的引物615610(正义)和引物615727(反义)扩增片段4。这些引物被设计成包含分别与片段3和1同源的序列的侧翼区(小写)，用于PCR片段之间的无连接克隆。

引物615610(正义)：

acacgcgatagggacatcTGACTCGAGATCTAGAGGGTGACTGAC(SEQ ID NO:71)

引物615727(反义)：

aactcttttctcgtaagcTTTCCAGCCTTCCTCCCGGTAC(SEQ ID NO:72)

片段4在反应中通过PCR来扩增，该反应由10ng的pDau571、0.5μl的DNA聚合酶、20pmol的引物615610、20pmol的引物615727、1μl的10mM dNTPs、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育，程序为1个循环，在98℃下持续30秒；以及30个循环，每个循环在98℃下持续10秒，在60℃下持续10秒，以及在72℃下持续120秒。将所得1.9kb PCR产物(片段4)用1μl的Dpn I进行处理，以去除质粒模板DNA。直接添加Dpn I至PCR管中，充分混合，并且在37℃下孵育60分钟。

使用基于酵母同源性的重组克隆，使用以下程序来合并四个PCR片段。将PCR片段的每种的10μl等分试样与来自鲑鱼睾丸的100μg的单链脱氧核糖核酸(西格玛奥德里奇，圣路易斯，密苏里州，美国)、100μl的菌株YNG318的感受态酵母细胞(酿酒酵母ATCC 208973)、和600μl的PLATE缓冲液(西格玛奥德里奇，圣路易斯，密苏里州，美国)合并，并且混合。将反应在30℃下以200rpm振荡孵育30分钟。然后将该反应在42℃下在没有振荡的情况下继续15分钟。将这些细胞通过在5,000x g下离心1分钟进行沉淀，并且弃去上清液。将细胞球粒悬浮于200μl的高压蒸汽处理的水中，并且分在两个包含合成的所定义的培养基缺少尿苷的琼脂平板，并且在30℃下孵育3天。将这些酵母菌落使用1ml的高压蒸汽处理的水从平板中分离。将这些细胞通过在13,000x g下离心30秒进行沉淀，并且将100μl等分试样的玻璃珠添加到该管中。将细胞和珠混合物悬浮在250μl的P1缓冲液(凯杰公司，巴伦西亚，加利福尼亚州，美国)中，并且然后涡旋1分钟来裂解这些细胞。使用旋转迷你制备型试剂盒纯化质粒DNA。根据制造商的说明，然后将3μl等分试样的质粒DNA转化到大肠杆菌ONETOP10电转化感受态细胞中。将50μl的转化细胞散布于每ml补充有100μg氨比西林的2X YT板上，并且在37℃下孵育过夜。将转化体各自挑入每ml补充有100μg的氨比西林的3ml的LB培养基中，并且在37℃下在250rpm的振荡下生长过夜。使用旋转迷你制备型试剂盒从菌落中纯化质粒DNA。将使用3130XL遗传分析仪的DNA测序用来确认指定为质粒pDLHD0075的最终质粒中三个片段中的每个的存在(图6)。

实例9：在米曲霉菌株JaL1394中野生型红豆木葡聚糖内糖基转移酶16(VaXET16)以单拷贝表达的确认

使用利用酿酒酵母2μm质粒翻转酶识别靶标(FRT)和重组酶(Flp)系统以产生高效率单拷贝靶向转化系统的米曲霉菌株JaL1394(WO2012/160093)用于筛选基因变体文库。酿酒酵母的Flp-FRT系统是位点特异性重组系统，其可用于将感兴趣的DNA插入感兴趣的宿主有机体的基因组中的已知位置。米曲霉菌株JaL1394先前已被工程化为在AmyB基因座中拥有FRT-F和FRT-F3翻转酶识别靶序列，其中AmyB ORF已经缺失。

用包含密码子优化的VaXET16基因的质粒pDLHD0075转化米曲霉JaL1394。将来自米曲霉JaL1394的大约10⁷个孢子接种于500ml摇瓶中的补充有10mM尿苷的100ml的YP+2％葡萄糖培养基中，并且在28℃和110rpm下孵育过夜。将10ml的过夜培养物在125ml无菌真空过滤器中过滤，并且将菌丝用50ml的0.7M KCl-20mM CaCl₂洗涤两次。将剩余液体通过真空过滤去除，留下垫在滤器上。将菌丝体再悬浮于10ml的0.7M KCl-20mM CaCl₂中，并且转移到无菌125ml摇瓶中，该摇瓶包含20mg的200G(诺维信瑞士股份公司(Novozymes Switzerland AG)，Neumatt，瑞士)/ml和0.2mg的几丁质酶(西格玛奥德里奇，圣路易斯，密苏里州，美国)/ml(在10ml的0.7M KCl-20mM CaCl₂中)。将该混合物在37℃和100rpm下孵育30-90分钟，直到从菌丝体中产生原生质体。将该原生质体混合物通过衬有(Calbiochem公司，圣迭哥，加利福尼亚州，美国)的无菌漏斗进行过滤，到无菌50ml塑料离心管中，以除去菌丝体碎片。将在上的碎片彻底地用0.7MKCl-20mM CaCl₂进行洗涤并且在2500rpm下，在20℃-23℃下，离心10分钟。去除该上清液，并且将原生质体球粒再悬浮于20ml的1M山梨醇-10mM CaCl₂-10mM Tris-HCl(pH 6.5)中。将该步骤重复两次，并且将最终的原生质体球粒再悬浮于1M山梨醇-10mM CaCl₂-10mMTris-HCl(pH 6.5)中，以获得2x 10⁷/ml的最终原生质体浓度。

通过添加两μg的pDLHD0075至无菌12ml塑料离心管的底部来转化原生质体。将一百μl的原生质体添加至管中，随后添加在10mM CaCl₂-10mM Tris-HCl(pH 6.5)中的300μl的60％PEG-4000。将该管用手轻轻混合，并且在37℃下孵育30分钟。将添加五ml的1M山梨糖醇-10mM CaCl₂-10mM Tris-HCl(pH 6.5)添加到该转化中，并且将该混合物转移到150mm基本培养基琼脂平板上。将转化板在37℃下孵育直到转化体出现。

挑出单个转化体到新基本培养基琼脂平板，并且在37℃下培养4天，直到转化体形成孢子。新鲜孢子转移到48孔深孔板，这些板包含2ml的YP+2％麦芽糊精培养基，覆盖有可透气密封件，并且在没有振荡下在28℃下生长4天。在4天生长后，将每个转化体的培养基针对根据实例1的木葡聚糖内糖基转移酶活性并且针对木葡聚糖内糖基转移酶表达通过SDS-PAGE来测定。

活性测定展示，这些转化体产生活性木葡聚糖内糖基转移酶。

使用8％-16％无染色SDS-PAGE凝胶(伯乐实验室有限公司，赫拉克勒斯，加利福尼亚州，美国)进行SDS-PAGE，并且用无染色成像仪(伯乐实验室有限公司，赫拉克勒斯，加利福尼亚州，美国)进行凝胶成像。SDS-PAGE揭示了大约32kDa的野生型VaXET16带。

实例10：红豆木葡聚糖内糖基转移酶16(VaXET16)的改进的表达变体的构建和鉴定

VaXET16基因突变体文库通过位点饱和诱变构建。将VaXET16基因的突变体文库(文库的每个片段包括突变体VaXET16基因+构巢曲霉乳清苷-5’-磷酸脱羧酶pyrG选择标记与FRT-F和FRT-F3翻转酶识别靶序列)与一μg的编码米曲霉TEF1启动子和米曲霉niaD基因终止子之间的酿酒酵母2μm翻转酶ORF的载体pDLHD0095(图7)一起转化到如实例9中所述的米曲霉JaL1394的原生质体中。37℃下在基本培养基琼脂平板上原生质体恢复4天后，挑出单个菌落至包含2ml的YP+2％麦芽糖糊精培养基的48孔深孔板中，覆盖有透气密封，并且在没有振荡下在28℃下生长4天。在液体培养基生长4天后，如在实例1中所述测定木葡聚糖内糖基转移酶活性，并且更高活性变体被打分为表达命中。

孢子纯化单个突变体菌株，并且如上所述再次培养以产生新鲜培养液，用于使用密码子优化基因，相对于表达野生型VaXET16的米曲霉JaL1394菌株进行再次测试。如在实例9中所述，通过SDS-PAGE分析培养液，用于增加木葡聚糖内糖基转移酶蛋白产物的生产。

十一个表征的变体在来自48孔深孔板培养的4天培养液中，优于亲本基因的表达产量的相对改进在下表II中示出。相同的培养液的SDS-PAGE分析展示所有变体的优于野生型VaXET的增加强度的VaXET带，这与在活性测定中观察到的相对改进很好地相关。野生型VaXET及其变体的SDS-PAGE带为32kDa，除包含N175S突变的变体由于另外的糖基化具有大约37kDa的带。

表II.

实例11：米曲霉中红豆木葡聚糖内糖基转移酶16变体(VaXET16)基因的改进的表达的发酵规模确认

发酵工艺被用来相对于野生型VaXET16，表达VaXET16变体、A40G+I53A+N175S和A40G+F183I。

摇瓶培养基由以下构成：50g的蔗糖、10g的KH₂PO₄、0.5g的CaCl₂、2g的MgSO₄·7H₂O、2g的K₂SO₄、2g的尿素、10g的酵母提取物、2g的柠檬酸、0.5ml的痕量金属溶液、以及去离子水补足至1升。痕量金属溶液由以下构成：13.8g的FeSO₄·7H₂O、14.3g的ZnSO₄·7H₂O、8.5g的MnSO₄·H₂O、2.5g的CuSO₄·5H₂O、3g的柠檬酸、以及去离子水补足至1升。

将一百ml的摇瓶培养基添加至500ml摇瓶。用7ml的0.01％80与从固体平板培养刮下的孢子与一起接种摇瓶，并且在轨道摇床上以200rpm在34℃下孵育24小时。将50ml的烧瓶培养液用于接种3升发酵容器。

每升分批发酵培养基(Fermentation batch medium)由以下构成：10g的酵母提取物、24g的蔗糖、5g的(NH₄)₂SO₄、2g的KH₂PO₄、0.5g的CaCl₂·2H₂O、2g的MgSO₄.7H₂O、1g的柠檬酸、2g的K₂SO₄、0.5ml的止泡剂、和0.5ml的痕量金属溶液。每升痕量金属溶液由以下构成：13.8g的FeSO₄·7H₂O、14.3g的ZnSO₄·7H₂O、8.5g的MnSO₄·H₂O、2.5g的CuSO₄·5H₂O，和3g的柠檬酸。发酵补料培养基(fermentation feed medium)由麦芽糖构成。

将总计1.8升的发酵分批培养基添加到三升玻璃套发酵器中。发酵补料培养基以0到8.0g/l/hr的速度给予。将发酵容器维持在34℃的温度，pH控制在6.1+/-0.1的设定点。将空气以1vvm的速率添加到容器中，并用以1100rpm旋转的Rushton叶轮搅拌培养液。在发酵运行的第2、3、4、5、6和7天取样，并且在3000x g离心以去除生物质。将上清液过滤灭菌，并且在-20℃下储存。

通过荧光偏振测定(实例3)并且通过SDS-PAGE分析(实例9)，相对于野生型密码子优化基因，确定VaXET16变体表达水平。

相对于野生型VaXET16，对于两个变体的7天培养液，优于亲本基因，产量相对改进在下表III中示出。按比野生型VaXET16 3.1X更大的量产生变体A40G+I53A+N175S，而按比野生型VaXET16 1.2X更大的量产生变体A40G+F183I。相同的培养液的SDS-PAGE分析示出两个变体的优于野生型VaXET的增加强度的VaXET带这与在活性测定中观察到的相对改进很好地相关。在第2、3、4、5、6、和7天所取的样品的SDS-PAGE分析示出VaXET的增加的生产，并且各变体日益增强，其中在第7天最强。

表III.

本发明通过以下编号的段落来进一步说明：

[1]一种木葡聚糖内糖基转移酶变体，该变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个位置处的取代，其中该变体具有木葡聚糖内糖基转移酶活性，并且其中该变体与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽序列具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少95％、至少96％、至少97％、至少98％、或至少99％、但小于100％序列一致性。

[2]如段落1所述的变体，该变体是亲本木葡聚糖内糖基转移酶的变体，其中该亲本选自下组，该组由以下各项组成：

(a)一种多肽，该多肽与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽具有至少60％序列一致性；

(b)由一种多核苷酸编码的多肽，该多核苷酸在至少低严格条件下与(i)SEQ IDNO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列，或(ii)(i)的全长互补体杂交；

(c)由一种多核苷酸编码的多肽，该多核苷酸与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列具有至少60％一致性；以及

(d)SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽的片段，该片段具有木葡聚糖内糖基转移酶活性。

[3]如段落2所述的变体，其中该亲本木葡聚糖内糖基转移酶与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽具有至少60％，例如，至少65％、至少70％、至少60％、至少80％、至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列一致性。

[4]如段落2或3所述的变体，其中该亲本木葡聚糖内糖基转移酶由以下多核苷酸编码，该多核苷酸在低严格条件下、中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与(i)SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列或者(ii)(i)的全长互补体杂交。

[5]如段落2-4中任一项所述的变体，其中该亲本木葡聚糖内糖基转移酶由以下多核苷酸编码，该多核苷酸与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列具有至少60％，例如，至少65％、至少70％、至少60％、至少80％、至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％序列一致性。

[6]如段落2-5中任一项所述的变体，其中该亲本木葡聚糖内糖基转移酶包括SEQID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽或由其组成。

[7]如段落2-6中任一项所述的变体，其中该亲本木葡聚糖内糖基转移酶是SEQ IDNO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽的一个片段，其中该片段具有木葡聚糖内糖基转移酶活性。

[8]如段落2-7中任一项所述的变体，该变体与该亲本木葡聚糖内糖基转移酶的氨基酸序列具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

[9]如段落1-8中任一项所述的变体，其中该变体由亲本的至少85％、至少90％、或至少95％的氨基酸组成。

[10]如段落1-9中任一项所述的变体，其中取代的数目是1-17个，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个取代。

[11]如段落1-10中任一项所述的变体，该变体包括与位置10相对应的位置处的一个取代。

[12]如段落11所述的变体，其中该取代是用Ala进行的。

[13]如段落1-12中任一项所述的变体，该变体包括与位置30相对应的位置处的一个取代。

[14]如段落13所述的变体，其中该取代是用Glu进行的。

[15]如段落1-14中任一项所述的变体，该变体包括与位置40相对应的位置处的一个取代。

[16]如段落15所述的变体，其中该取代是用Gly进行的。

[17]如段落1-16中任一项所述的变体，该变体包括与位置51相对应的位置处的一个取代。

[18]如段落17所述的变体，其中该取代是用Thr进行的。

[19]如段落1-18中任一项所述的变体，该变体包括与位置53相对应的位置处的一个取代。

[20]如段落19所述的变体，其中该取代是用Ala或Val进行的。

[21]如段落1-20中任一项所述的变体，该变体包括与位置60相对应的位置处的一个取代。

[22]如段落21所述的变体，其中该取代是用Ser进行的。

[23]如段落1-22中任一项所述的变体，该变体包括与位置99相对应的位置处的一个取代。

[24]如段落23所述的变体，其中该取代是用Glu或Asn进行的。

[25]如段落1-24中任一项所述的变体，该变体包括与位置102相对应的位置处的一个取代。

[26]如段落25所述的变体，其中该取代是用Gly进行的。

[27]如段落1-26中任一项所述的变体，该变体包括与位置117相对应的位置处的一个取代。

[28]如段落27所述的变体，其中该取代是用Glu进行的。

[29]如段落1-28中任一项所述的变体，该变体包括与位置130相对应的位置处的一个取代。

[30]如段落29所述的变体，其中该取代是用Arg进行的。

[31]如段落1-30中任一项所述的变体，该变体包括与位置136相对应的位置处的一个取代。

[32]如段落31所述的变体，其中该取代是用Trp进行的。

[33]如段落1-32中任一项所述的变体，该变体包括与位置157相对应的位置处的一个取代。

[34]如段落33所述的变体，其中该取代是用His进行的。

[35]如段落1-34中任一项所述的变体，该变体包括与位置162相对应的位置处的一个取代。

[36]如段落35所述的变体，其中该取代是用Cys进行的。

[37]如段落1-36中任一项所述的变体，该变体包括与位置175相对应的位置处的一个取代。

[38]如段落37所述的变体，其中该取代是用Ser、Gly或Gln进行的。

[39]如段落1-38中任一项所述的变体，该变体包括与位置183相对应的位置处的一个取代。

[40]如段落39所述的变体，其中该取代是用Ile进行的。

[41]如段落1-40中任一项所述的变体，该变体包括与位置254相对应的位置处的一个取代。

[42]如段落41所述的变体，其中该取代是用Glu进行的。

[43]如段落1-42中任一项所述的变体，该变体包括与位置280相对应的位置处的一个取代。

[44]如段落43所述的变体，其中该取代是用Gly或Glu进行的。

[45]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的两个位置处的取代。

[46]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的三个位置处的取代。

[47]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的四个位置处的取代。

[48]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的五个位置处的取代。

[49]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的六个位置处的取代。

[50]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的七个位置处的取代。

[51]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的八个位置处的取代。

[52]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的九个位置处的取代。

[53]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的十个位置处的取代。

[54]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280的中的任一个相对应十一个位置处的取代。

[55]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的十二个位置处的取代。

[56]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的十三个位置处的取代。

[57]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的十四个位置处的取代。

[58]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的十五个位置处的取代。

[59]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280相对应的十六个位置处的取代。

[60]如段落1-44中任一项所述的变体，该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280相对应的各个位置处的取代。

[61]如段落1-60中任一项所述的变体，该变体包括选自下组的一个或多个取代，该组由以下各项组成：I10A；P30E；A40G；S51T；I53A,V；Y60S；T99E,N；E102G；Q117E；K130R；R136W；Y157H；Y162C；N175S,G,Q；F183I；A254E；以及S280G,E。

[62]如段落61所述的变体，该变体包括A40G+N175S或由其组成。

[63]如段落61所述的变体，该变体包括A40G+F183I或由其组成。

[64]如段落61所述的变体，该变体包括N175G+S280G或由其组成。

[65]如段落61所述的变体，该变体包括A40G+I53A+N175S或由其组成。

[66]如段落61所述的变体，该变体包括A40G+N175S+F183I或由其组成。

[67]如段落61所述的变体，该变体包括取代I10A+I53A+E102G或由其组成。

[68]如段落61所述的变体，该变体包括A40G+E102G+Q117E或由其组成。

[69]如段落61所述的变体，该变体包括N175Q+A254E+S280E或由其组成。

[70]如段落61所述的变体，该变体包括P30E+S51T+Y60S+T99N或由其组成。

[71]如段落61所述的变体，该变体包括A40G+T99E+E102G+K130R或由其组成。

[72]如段落61所述的变体，该变体包括I53V+R136W+Y157H+Y162C+N175S或由其组成。

[73]如段落1-72中任一项所述的变体，该变体相对于该亲本具有增加的表达产量。

[74]如段落1-73中任一项所述的变体，其中相对于该亲本，该变体的表达产量是至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加。

[75]一种编码如段落1-74中任一项所述的变体的分离的多核苷酸。

[76]一种核酸构建体，其包含如段落75所述的多核苷酸。

[77]一种表达载体，其包括如段落75所述的多核苷酸。

[78]一种重组宿主细胞，其包含如段落75所述的多核苷酸。

[79]一种产生木葡聚糖内糖基转移酶变体的方法，该方法包括：在适合于该变体表达的条件下培养如段落78所述的重组宿主细胞；以及

[80]如段落79所述的方法，该方法进一步包括回收该变体。

[81]一种用于获得木葡聚糖内糖基转移酶变体的方法，该方法包括将与SEQ IDNO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个位置处的取代引入亲本木葡聚糖内糖基转移酶，其中该变体具有木葡聚糖内糖基转移酶活性。

[82]如段落81所述的方法，该方法进一步包括回收该变体。

[83]一种增加木葡聚糖内糖基转移酶的表达产量的方法，该方法包括将与SEQ IDNO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个位置处的取代引入亲本木葡聚糖内糖基转移酶，其中该变体的表达产量相对于亲本是增加的。

[84]如段落83所述的方法，其中相对于该亲本，该变体的表达产量是至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加。

[85]如段落84或85所述的方法，该方法进一步包括回收该变体。

[86]一种酶组合物，包括如段落1-74中任一项所述的变体。

[87]一种全培养液配制品或细胞培养组合物，包括如段落1-74中任一项所述的变体。

[88]如段落1-74中任一项所述的变体的用途。

在此描述并且要求保护的本发明不局限于在此披露的特定方面的范围，因为这些方面旨在作为本发明若干方面的说明。预期任何等效方面都处于本发明的范围内。实际上，除在此所示和描述的那些之外，本发明的不同修改对于本领域普通技术人员而言从前述描述将变得清楚。这样的修改也旨在落入所附权利要求的范围内。在有冲突的情况下，以包括定义的本披露为准。

序列表

<110> 诺维信公司（Novozymes A/S）

赫尔德（Held）, 丹尼尔（Daniel）

<120> 木葡聚糖内糖基转移酶变体以及编码其的多核苷酸

<130> 12915-WO-PCT

<150> US 62/039,744

<151> 2014-08-20

<160> 72

<170> PatentIn版本3.5

<210> 1

<211> 876

<212> DNA

<213> 红豆（Vigna angularis）

<400> 1

atgggttctt ctttgtggac ttgtctgatt ctgttatcac tggcttctgc ttctttcgct 60

gccaacccaa gaactccaat tgatgtacca tttggcagaa actatgtgcc tacttgggcc 120

tttgatcata tcaaatatct caatggaggt tctgagattc agcttcatct cgataagtac 180

actggtactg gattccagtc caaagggtca tacttgtttg gtcacttcag catgtacata 240

aaattggttc ctggtgattc agctggcaca gtcactgctt tctatttatc gtccacaaac 300

gcagaacatg atgaaataga cttcgagttc ttgggaaaca gaactgggca accatacatt 360

ttacaaacaa atgtgttcac cggaggcaaa ggtgacagag agcagagaat ctacctctgg 420

tttgacccta cgactcaata ccacagatat tcagtgctat ggaacatgta ccagattgta 480

ttctatgtgg atgactaccc aataagggtg ttcaagaaca gcaatgactt gggagtgaag 540

ttccccttca atcaaccaat gaaaatatac aacagtttgt ggaatgcaga tgactgggct 600

acaaggggtg gtttggagaa aacagattgg tccaaagccc ccttcatagc ctcttacaag 660

ggcttccaca ttgatgggtg tgaggcctca gtgaatgcca agttctgtga cacacaaggc 720

aagaggtggt gggatcaacc agagtttcgt gaccttgatg ctgctcagtg gcaaaaactg 780

gcttgggtac gcaacaaata caccatctac aactactgca ctgatcgcaa acgctactct 840

caagtccctc cagagtgcac cagagaccgt gacatt 876

<210> 2

<211> 292

<212> PRT

<213> 红豆（Vigna angularis）

<400> 2

Met Gly Ser Ser Leu Trp Thr Cys Leu Ile Leu Leu Ser Leu Ala Ser

1 5 10 15

Ala Ser Phe Ala Ala Asn Pro Arg Thr Pro Ile Asp Val Pro Phe Gly

20 25 30

Arg Asn Tyr Val Pro Thr Trp Ala Phe Asp His Ile Lys Tyr Leu Asn

35 40 45

Gly Gly Ser Glu Ile Gln Leu His Leu Asp Lys Tyr Thr Gly Thr Gly

50 55 60

Phe Gln Ser Lys Gly Ser Tyr Leu Phe Gly His Phe Ser Met Tyr Ile

65 70 75 80

Lys Leu Val Pro Gly Asp Ser Ala Gly Thr Val Thr Ala Phe Tyr Leu

85 90 95

Ser Ser Thr Asn Ala Glu His Asp Glu Ile Asp Phe Glu Phe Leu Gly

100 105 110

Asn Arg Thr Gly Gln Pro Tyr Ile Leu Gln Thr Asn Val Phe Thr Gly

115 120 125

Gly Lys Gly Asp Arg Glu Gln Arg Ile Tyr Leu Trp Phe Asp Pro Thr

130 135 140

Thr Gln Tyr His Arg Tyr Ser Val Leu Trp Asn Met Tyr Gln Ile Val

145 150 155 160

Phe Tyr Val Asp Asp Tyr Pro Ile Arg Val Phe Lys Asn Ser Asn Asp

165 170 175

Leu Gly Val Lys Phe Pro Phe Asn Gln Pro Met Lys Ile Tyr Asn Ser

180 185 190

Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly Leu Glu Lys Thr

195 200 205

Asp Trp Ser Lys Ala Pro Phe Ile Ala Ser Tyr Lys Gly Phe His Ile

210 215 220

Asp Gly Cys Glu Ala Ser Val Asn Ala Lys Phe Cys Asp Thr Gln Gly

225 230 235 240

Lys Arg Trp Trp Asp Gln Pro Glu Phe Arg Asp Leu Asp Ala Ala Gln

245 250 255

Trp Gln Lys Leu Ala Trp Val Arg Asn Lys Tyr Thr Ile Tyr Asn Tyr

260 265 270

Cys Thr Asp Arg Lys Arg Tyr Ser Gln Val Pro Pro Glu Cys Thr Arg

275 280 285

Asp Arg Asp Ile

290

<210> 3

<211> 861

<212> DNA

<213> 拟南芥（Arabidopsis thaliana）

<400> 3

atggcgtgtt tcgcaaccaa acagcctctg ttgttgtctc tcctccttgc cattggcttc 60

tttgtggtgg ctgcatctgc cggaaacttc tatgagagct ttgatatcac ttggggtaat 120

ggtcgtgcca acatattcga gaatggacag cttctcactt gtactcttga caaggtctcc 180

ggctcaggtt ttcaatccaa gaaggagtac ttgtttggta agatcgacat gaagctcaag 240

cttgtcgctg gaaactctgc tggcaccgtc accgcctact acctatcgtc aaaaggcacg 300

gcatgggatg agattgactt cgagtttttg ggaaatcgca caggacatcc ttacactatc 360

cacaccaatg tgttcaccgg aggtaaaggc gaccgtgaga tgcagttccg tctctggttc 420

gatcccactg cggatttcca cacctacacc gtccactgga accctgttaa catcatcttc 480

cttgtggatg ggatcccaat tcgggtgttc aagaacaacg agaaaaatgg ggtggcttac 540

cctaagaacc agccgatgag gatatactca agcctttggg aagccgatga ctgggctaca 600

gaaggcggtc gcgtgaagat cgactggagc aacgcaccat tcaaggcctc ttacagaaac 660

ttcaacgacc aaagctcatg cagcaggaca tcaagctcaa aatgggtgac ttgcgagcca 720

aacagcaact cgtggatgtg gacgactctc aatcctgccc agtacggaaa aatgatgtgg 780

gtgcaacgag acttcatgat ctacaactat tgtaccgatt ttaagagatt ccctcaaggc 840

ctccccaagg agtgtaaact t 861

<210> 4

<211> 287

<212> PRT

<213> 拟南芥（Arabidopsis thaliana）

<400> 4

Met Ala Cys Phe Ala Thr Lys Gln Pro Leu Leu Leu Ser Leu Leu Leu

1 5 10 15

Ala Ile Gly Phe Phe Val Val Ala Ala Ser Ala Gly Asn Phe Tyr Glu

20 25 30

Ser Phe Asp Ile Thr Trp Gly Asn Gly Arg Ala Asn Ile Phe Glu Asn

35 40 45

Gly Gln Leu Leu Thr Cys Thr Leu Asp Lys Val Ser Gly Ser Gly Phe

50 55 60

Gln Ser Lys Lys Glu Tyr Leu Phe Gly Lys Ile Asp Met Lys Leu Lys

65 70 75 80

Leu Val Ala Gly Asn Ser Ala Gly Thr Val Thr Ala Tyr Tyr Leu Ser

85 90 95

Ser Lys Gly Thr Ala Trp Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn

100 105 110

Arg Thr Gly His Pro Tyr Thr Ile His Thr Asn Val Phe Thr Gly Gly

115 120 125

Lys Gly Asp Arg Glu Met Gln Phe Arg Leu Trp Phe Asp Pro Thr Ala

130 135 140

Asp Phe His Thr Tyr Thr Val His Trp Asn Pro Val Asn Ile Ile Phe

145 150 155 160

Leu Val Asp Gly Ile Pro Ile Arg Val Phe Lys Asn Asn Glu Lys Asn

165 170 175

Gly Val Ala Tyr Pro Lys Asn Gln Pro Met Arg Ile Tyr Ser Ser Leu

180 185 190

Trp Glu Ala Asp Asp Trp Ala Thr Glu Gly Gly Arg Val Lys Ile Asp

195 200 205

Trp Ser Asn Ala Pro Phe Lys Ala Ser Tyr Arg Asn Phe Asn Asp Gln

210 215 220

Ser Ser Cys Ser Arg Thr Ser Ser Ser Lys Trp Val Thr Cys Glu Pro

225 230 235 240

Asn Ser Asn Ser Trp Met Trp Thr Thr Leu Asn Pro Ala Gln Tyr Gly

245 250 255

Lys Met Met Trp Val Gln Arg Asp Phe Met Ile Tyr Asn Tyr Cys Thr

260 265 270

Asp Phe Lys Arg Phe Pro Gln Gly Leu Pro Lys Glu Cys Lys Leu

275 280 285

<210> 5

<211> 882

<212> DNA

<213> 欧洲山杨（Populus tremula） x 美洲山杨（Populus tremuloides）

<400> 5

atggctgctg cttatccgtg gactttgttt cttggcatgc tggttatggt atctggaaca 60

atgggagctg ccctgaggaa gccagtggat gtggcgttcg gtaggaacta tgttcctaca 120

tgggcttttg accacattaa gtacttcaat ggaggcaatg agattcagct gcacttggat 180

aaatacacag gtactggttt ccaatcaaaa ggttcatact tatttggcca tttcagtatg 240

caaatgaagt tggttcctgg tgactcagct ggaacagtca ctgctttcta tctatcctca 300

caaaactcgg agcatgacga gatagacttt gagttcttag gaaacaggac tggccagccc 360

tacattttgc agacaaatgt tttcacagga ggcaaggggg atagagaaca gaggatttac 420

ctctggtttg acccaaccaa ggaattccac tactattctg tcctctggaa catgtacatg 480

atagtgttcc tcgtggatga cgtgccaatc agagtgttca agaactgcaa agatttggga 540

gttaagtttc cattcaacca gccaatgaag atctactcaa gcctatggaa tgccgatgat 600

tgggctacca ggggtggact cgagaagaca gactggtcca aggcaccgtt cattgcctcc 660

tacaggagct tccacataga tgggtgcgag gcctccgtgg aagccaagtt ctgcgccaca 720

cagggtgcta gatggtggga ccagaaggag ttccaagatc tggatgcctt ccagtacagg 780

aggctcagct gggtccgcca gaaatatacc atctacaatt actgcactga tagatcaaga 840

tacccttcaa tgcccccaga atgcaagaga gacagagaca ta 882

<210> 6

<211> 294

<212> PRT

<213> 欧洲山杨（Populus tremula） x 美洲山杨（Populus tremuloides）

<400> 6

Met Ala Ala Ala Tyr Pro Trp Thr Leu Phe Leu Gly Met Leu Val Met

1 5 10 15

Val Ser Gly Thr Met Gly Ala Ala Leu Arg Lys Pro Val Asp Val Ala

20 25 30

Phe Gly Arg Asn Tyr Val Pro Thr Trp Ala Phe Asp His Ile Lys Tyr

35 40 45

Phe Asn Gly Gly Asn Glu Ile Gln Leu His Leu Asp Lys Tyr Thr Gly

50 55 60

Thr Gly Phe Gln Ser Lys Gly Ser Tyr Leu Phe Gly His Phe Ser Met

65 70 75 80

Gln Met Lys Leu Val Pro Gly Asp Ser Ala Gly Thr Val Thr Ala Phe

85 90 95

Tyr Leu Ser Ser Gln Asn Ser Glu His Asp Glu Ile Asp Phe Glu Phe

100 105 110

Leu Gly Asn Arg Thr Gly Gln Pro Tyr Ile Leu Gln Thr Asn Val Phe

115 120 125

Thr Gly Gly Lys Gly Asp Arg Glu Gln Arg Ile Tyr Leu Trp Phe Asp

130 135 140

Pro Thr Lys Glu Phe His Tyr Tyr Ser Val Leu Trp Asn Met Tyr Met

145 150 155 160

Ile Val Phe Leu Val Asp Asp Val Pro Ile Arg Val Phe Lys Asn Cys

165 170 175

Lys Asp Leu Gly Val Lys Phe Pro Phe Asn Gln Pro Met Lys Ile Tyr

180 185 190

Ser Ser Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly Leu Glu

195 200 205

Lys Thr Asp Trp Ser Lys Ala Pro Phe Ile Ala Ser Tyr Arg Ser Phe

210 215 220

His Ile Asp Gly Cys Glu Ala Ser Val Glu Ala Lys Phe Cys Ala Thr

225 230 235 240

Gln Gly Ala Arg Trp Trp Asp Gln Lys Glu Phe Gln Asp Leu Asp Ala

245 250 255

Phe Gln Tyr Arg Arg Leu Ser Trp Val Arg Gln Lys Tyr Thr Ile Tyr

260 265 270

Asn Tyr Cys Thr Asp Arg Ser Arg Tyr Pro Ser Met Pro Pro Glu Cys

275 280 285

Lys Arg Asp Arg Asp Ile

290

<210> 7

<211> 891

<212> DNA

<213> 玉蜀黍（Zea mays）

<400> 7

atggcgacgg cgcggtggct gcaggttgcc gccatggcgg tggcgctgct ggcggagtgg 60

gcgacggcgg cggcgcctcg gaagcccgtg gacgtgccgt tccagaagaa ctacgtgccg 120

acgtgggcgc aggaccacat ccactacatc gacggcgggc gggaggtgca gctgtacctg 180

gacaagtcca ccggcacggg cttccagacg cggggctcct acctcttcgg ccacttcagc 240

atgcacatga agctcgtcgg cggcgactcc gcgggcaccg tcacggcctt ctacctgtcg 300

tcgcagaact cggagcacga cgagatcgac ttcgagttcc tgggcaaccg gacggggcag 360

ccctacatcc tgcagaccaa cgtgttcacc ggcggcaagg gcgaccgcga gcagcggatc 420

tacctctggt tcgaccccac caaggagtac cactcctact ccgtcctctg gaacctctac 480

atgatcgcgt tcttcgtgga cgacgtgccg atccgggtgt tcaagaacac gagcgccgac 540

ctgggcgtgc ggtacccgtt cagccagccg atgaagctct actccagcct gtggaacgcc 600

gacgactggg cgacccgcgg cgggcgcgag aagacggact ggtccaacgc gcccttcgtc 660

gcctcctacc gcggcttcca cgtcgacggc tgcgaggcct ccgcggaggc gcgcttctgc 720

gccacccagg gcgcgcgctg gtgggaccag ccggagttca gggacctcga cgccgcgcag 780

taccgccgcc tggccgaggt caggcgccgc tacaccatct acaactactg caccgatcgc 840

gaccgctacg gcgccgccgt gccgcccgag tgcgcccgcg accgcgacgt c 891

<210> 8

<211> 297

<212> PRT

<213> 玉蜀黍（Zea mays）

<400> 8

Met Ala Thr Ala Arg Trp Leu Gln Val Ala Ala Met Ala Val Ala Leu

1 5 10 15

Leu Ala Glu Trp Ala Thr Ala Ala Ala Pro Arg Lys Pro Val Asp Val

20 25 30

Pro Phe Gln Lys Asn Tyr Val Pro Thr Trp Ala Gln Asp His Ile His

35 40 45

Tyr Ile Asp Gly Gly Arg Glu Val Gln Leu Tyr Leu Asp Lys Ser Thr

50 55 60

Gly Thr Gly Phe Gln Thr Arg Gly Ser Tyr Leu Phe Gly His Phe Ser

65 70 75 80

Met His Met Lys Leu Val Gly Gly Asp Ser Ala Gly Thr Val Thr Ala

85 90 95

Phe Tyr Leu Ser Ser Gln Asn Ser Glu His Asp Glu Ile Asp Phe Glu

100 105 110

Phe Leu Gly Asn Arg Thr Gly Gln Pro Tyr Ile Leu Gln Thr Asn Val

115 120 125

Phe Thr Gly Gly Lys Gly Asp Arg Glu Gln Arg Ile Tyr Leu Trp Phe

130 135 140

Asp Pro Thr Lys Glu Tyr His Ser Tyr Ser Val Leu Trp Asn Leu Tyr

145 150 155 160

Met Ile Ala Phe Phe Val Asp Asp Val Pro Ile Arg Val Phe Lys Asn

165 170 175

Thr Ser Ala Asp Leu Gly Val Arg Tyr Pro Phe Ser Gln Pro Met Lys

180 185 190

Leu Tyr Ser Ser Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly

195 200 205

Arg Glu Lys Thr Asp Trp Ser Asn Ala Pro Phe Val Ala Ser Tyr Arg

210 215 220

Gly Phe His Val Asp Gly Cys Glu Ala Ser Ala Glu Ala Arg Phe Cys

225 230 235 240

Ala Thr Gln Gly Ala Arg Trp Trp Asp Gln Pro Glu Phe Arg Asp Leu

245 250 255

Asp Ala Ala Gln Tyr Arg Arg Leu Ala Glu Val Arg Arg Arg Tyr Thr

260 265 270

Ile Tyr Asn Tyr Cys Thr Asp Arg Asp Arg Tyr Gly Ala Ala Val Pro

275 280 285

Pro Glu Cys Ala Arg Asp Arg Asp Val

290 295

<210> 9

<211> 882

<212> DNA

<213> 大麦（Hordeum vulgare）

<400> 9

atgaaggcta ccgcgggggc cctcctcgcc gtggtggcca cggtgctact gcgaggcatc 60

gcggcagcgc cgccccggaa gccggtggac gtgccattcg agaagaacta cgtcccgaca 120

tgggcggagg accacatcca ctacgtgaac ggcggacggg aggtgcagct gtccctcgac 180

aagaccaccg gcactggctt ccagacccgg ggctcctacc tcttcggcca cttcagcatg 240

cacatcaagc tcgtcggcgg cgactccgcc ggcacagtca ccgccttcta cctgtcgtcg 300

cagaactcgg agcacgacga gatcgacttc gagttcttgg ggaacaggac ggggcagccg 360

tacatcctgc agacgaacgt gttctccggc gggaagggcg accgggaaca gaggatctac 420

ctctggttcg acccaaccaa ggactaccac tcctactccg tcctctggaa cctctacatg 480

atcgcgttct ttgtggacga cacgccgatc cgggtgttca agaacagcaa ggacctcggc 540

gtgcggtacc ccttcgacca gcctatgaag ctctactcga gcctgtggaa cgcggacgac 600

tgggcgactc ggggagggcg ggagaagacg gactggtcca aggcgccctt cgtcgcctcc 660

taccggggct tccacgtcga cggctgcgag gcgtcggcgg aggccaagtt gtgcgccacc 720

cagggcgccc gctggtggga tcagcccgag ttccaggacc tggacgccgc gcagtaccgc 780

cgcctcgcct gggtcaggaa ggagcacacc atctacaact actgcacaga ccgcgaacga 840

tacgccgcca tgtcgcccga gtgcaaacgc gaccgcgacg tc 882

<210> 10

<211> 294

<212> PRT

<213> 大麦（Hordeum vulgare）

<400> 10

Met Lys Ala Thr Ala Gly Ala Leu Leu Ala Val Val Ala Thr Val Leu

1 5 10 15

Leu Arg Gly Ile Ala Ala Ala Pro Pro Arg Lys Pro Val Asp Val Pro

20 25 30

Phe Glu Lys Asn Tyr Val Pro Thr Trp Ala Glu Asp His Ile His Tyr

35 40 45

Val Asn Gly Gly Arg Glu Val Gln Leu Ser Leu Asp Lys Thr Thr Gly

50 55 60

Thr Gly Phe Gln Thr Arg Gly Ser Tyr Leu Phe Gly His Phe Ser Met

65 70 75 80

His Ile Lys Leu Val Gly Gly Asp Ser Ala Gly Thr Val Thr Ala Phe

85 90 95

Tyr Leu Ser Ser Gln Asn Ser Glu His Asp Glu Ile Asp Phe Glu Phe

100 105 110

Leu Gly Asn Arg Thr Gly Gln Pro Tyr Ile Leu Gln Thr Asn Val Phe

115 120 125

Ser Gly Gly Lys Gly Asp Arg Glu Gln Arg Ile Tyr Leu Trp Phe Asp

130 135 140

Pro Thr Lys Asp Tyr His Ser Tyr Ser Val Leu Trp Asn Leu Tyr Met

145 150 155 160

Ile Ala Phe Phe Val Asp Asp Thr Pro Ile Arg Val Phe Lys Asn Ser

165 170 175

Lys Asp Leu Gly Val Arg Tyr Pro Phe Asp Gln Pro Met Lys Leu Tyr

180 185 190

Ser Ser Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly Arg Glu

195 200 205

Lys Thr Asp Trp Ser Lys Ala Pro Phe Val Ala Ser Tyr Arg Gly Phe

210 215 220

His Val Asp Gly Cys Glu Ala Ser Ala Glu Ala Lys Leu Cys Ala Thr

225 230 235 240

Gln Gly Ala Arg Trp Trp Asp Gln Pro Glu Phe Gln Asp Leu Asp Ala

245 250 255

Ala Gln Tyr Arg Arg Leu Ala Trp Val Arg Lys Glu His Thr Ile Tyr

260 265 270

Asn Tyr Cys Thr Asp Arg Glu Arg Tyr Ala Ala Met Ser Pro Glu Cys

275 280 285

Lys Arg Asp Arg Asp Val

290

<210> 11

<211> 855

<212> DNA

<213> 大麦（Hordeum vulgare）

<400> 11

atggcgtccg gtcccagtag aacagtcccg tgctctgtgc tgccactgct gctgctgctc 60

gccggcgtgg cccgcgcggc cggcaacttc taccaggacg tggacatcac gtggggcgac 120

gggcgcggca agatcctcgg cggcggcgac ctcctcacgc tgtcgctcga cagggcctcc 180

ggctccgggt tccagtccaa gaaccagtac ctgtacggcc gcttcgacat gcagatcaag 240

ctcgtccccg gcgactccgc cggcaccgtc gccactttct acctgtcgtc gcaggggtcg 300

gcgcacgacg agatcgactt cgagttcctg ggcaacgcga gcgggcagcc ctacacggtg 360

cacaccaacg tgtacagcca gggcaagggc ggccgggagc agcagttccg catgtggttc 420

gaccccaccg ccgacttcca cacctactcc gtcctctgga accccacaca catcctgttc 480

tacgtggacg ggacgccgat acgggagcac cgcaaccggg aggcggcgac gggggttccc 540

tacctgcgga gccaggcgat gagggtgtac gcgagcgtgt gggacgcgga agagtgggcg 600

acgcagggcg ggcgggtgag gacggactgg tcgcgggcgc cgttcgtggc gtcgtacaag 660

gggctcgccg cgagcgggtg cgcgtcgcag gacgcggcgg cgtgcgccaa ctccaacggc 720

gcgtggatgt accaggagct ggacgccacg gcgttggacc gcctccagtg ggtgcagaag 780

aactacatga tctacaacta ctgcacggac acgtggaggt tcaaggacgg cgccccgccc 840

gagtgcgcca gcaag 855

<210> 12

<211> 285

<212> PRT

<213> 大麦（Hordeum vulgare）

<400> 12

Met Ala Ser Gly Pro Ser Arg Thr Val Pro Cys Ser Val Leu Pro Leu

1 5 10 15

Leu Leu Leu Leu Ala Gly Val Ala Arg Ala Ala Gly Asn Phe Tyr Gln

20 25 30

Asp Val Asp Ile Thr Trp Gly Asp Gly Arg Gly Lys Ile Leu Gly Gly

35 40 45

Gly Asp Leu Leu Thr Leu Ser Leu Asp Arg Ala Ser Gly Ser Gly Phe

50 55 60

Gln Ser Lys Asn Gln Tyr Leu Tyr Gly Arg Phe Asp Met Gln Ile Lys

65 70 75 80

Leu Val Pro Gly Asp Ser Ala Gly Thr Val Ala Thr Phe Tyr Leu Ser

85 90 95

Ser Gln Gly Ser Ala His Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn

100 105 110

Ala Ser Gly Gln Pro Tyr Thr Val His Thr Asn Val Tyr Ser Gln Gly

115 120 125

Lys Gly Gly Arg Glu Gln Gln Phe Arg Met Trp Phe Asp Pro Thr Ala

130 135 140

Asp Phe His Thr Tyr Ser Val Leu Trp Asn Pro Thr His Ile Leu Phe

145 150 155 160

Tyr Val Asp Gly Thr Pro Ile Arg Glu His Arg Asn Arg Glu Ala Ala

165 170 175

Thr Gly Val Pro Tyr Leu Arg Ser Gln Ala Met Arg Val Tyr Ala Ser

180 185 190

Val Trp Asp Ala Glu Glu Trp Ala Thr Gln Gly Gly Arg Val Arg Thr

195 200 205

Asp Trp Ser Arg Ala Pro Phe Val Ala Ser Tyr Lys Gly Leu Ala Ala

210 215 220

Ser Gly Cys Ala Ser Gln Asp Ala Ala Ala Cys Ala Asn Ser Asn Gly

225 230 235 240

Ala Trp Met Tyr Gln Glu Leu Asp Ala Thr Ala Leu Asp Arg Leu Gln

245 250 255

Trp Val Gln Lys Asn Tyr Met Ile Tyr Asn Tyr Cys Thr Asp Thr Trp

260 265 270

Arg Phe Lys Asp Gly Ala Pro Pro Glu Cys Ala Ser Lys

275 280 285

<210> 13

<211> 969

<212> DNA

<213> 大麦（Hordeum vulgare）

<400> 13

atggcagcag ccagcgctct tctcatggct gctctcgcgg tcttcgccgt ggccgccgcc 60

gcggcgctgg acacgtcgcc ggtgccgttc gacgccgggt acgcgcctct cttcggcggc 120

gacaacctcg tccggtcggc ggacggccgg agcgtcacgc tcaagctgga ccgatacacc 180

gggtctgggt tcgtgtcaaa gtcggcctac cgccatggct tcttcggcgc ttccattaag 240

ctgcccggcg actataccgc cggcgtcgtc gtcgccttct acctatcgaa ctgggacgag 300

taccccaaga accacgacga gctggacttc gagctgctgg gcaaccggcg cggccacggc 360

tggcgtgtcc agaccaacat gtacggcaac ggcagcaccg cccgcggccg agaggagcgt 420

taccatctcc ccgtcgaacc taccgtcacc ggcgtccacc gctatgccat tgcctggacc 480

cccaacaaca tcgtcttcta cctcgacggc gttcccatcc gtgaggttgt ccgcgttccc 540

tccatgggcg gcgacttccc ctccaagccc atgtccgtgt acgccaccat ctgggacggc 600

tccgcctggg cgaccgacgg cggcaagtac aaggtcgact acgcctacgc gcccttcgct 660

gccgagtttt ccgacctcgt cctgagcggc tgcggcgcgg gcaacgtcgc cgaccccgag 720

gggtgccagg tcgacctgct cacgcacgac gtcgcagtca tggcaccggc caagcgcgcc 780

gccatgagag ggttccgcga gcagcaccta acctacacgg cgtgccgcga cagggtgcga 840

tacaagacca ccgtcttccc cgagtgtgac gacctcgccg acggcgactc cagcttccac 900

ctctgggggg agtccaagaa gaggcgccgc cggtcgtcct cgccgctgca gtactcttcc 960

agcatgcag 969

<210> 14

<211> 323

<212> PRT

<213> 大麦（Hordeum vulgare）

<400> 14

Met Ala Ala Ala Ser Ala Leu Leu Met Ala Ala Leu Ala Val Phe Ala

1 5 10 15

Val Ala Ala Ala Ala Ala Leu Asp Thr Ser Pro Val Pro Phe Asp Ala

20 25 30

Gly Tyr Ala Pro Leu Phe Gly Gly Asp Asn Leu Val Arg Ser Ala Asp

35 40 45

Gly Arg Ser Val Thr Leu Lys Leu Asp Arg Tyr Thr Gly Ser Gly Phe

50 55 60

Val Ser Lys Ser Ala Tyr Arg His Gly Phe Phe Gly Ala Ser Ile Lys

65 70 75 80

Leu Pro Gly Asp Tyr Thr Ala Gly Val Val Val Ala Phe Tyr Leu Ser

85 90 95

Asn Trp Asp Glu Tyr Pro Lys Asn His Asp Glu Leu Asp Phe Glu Leu

100 105 110

Leu Gly Asn Arg Arg Gly His Gly Trp Arg Val Gln Thr Asn Met Tyr

115 120 125

Gly Asn Gly Ser Thr Ala Arg Gly Arg Glu Glu Arg Tyr His Leu Pro

130 135 140

Val Glu Pro Thr Val Thr Gly Val His Arg Tyr Ala Ile Ala Trp Thr

145 150 155 160

Pro Asn Asn Ile Val Phe Tyr Leu Asp Gly Val Pro Ile Arg Glu Val

165 170 175

Val Arg Val Pro Ser Met Gly Gly Asp Phe Pro Ser Lys Pro Met Ser

180 185 190

Val Tyr Ala Thr Ile Trp Asp Gly Ser Ala Trp Ala Thr Asp Gly Gly

195 200 205

Lys Tyr Lys Val Asp Tyr Ala Tyr Ala Pro Phe Ala Ala Glu Phe Ser

210 215 220

Asp Leu Val Leu Ser Gly Cys Gly Ala Gly Asn Val Ala Asp Pro Glu

225 230 235 240

Gly Cys Gln Val Asp Leu Leu Thr His Asp Val Ala Val Met Ala Pro

245 250 255

Ala Lys Arg Ala Ala Met Arg Gly Phe Arg Glu Gln His Leu Thr Tyr

260 265 270

Thr Ala Cys Arg Asp Arg Val Arg Tyr Lys Thr Thr Val Phe Pro Glu

275 280 285

Cys Asp Asp Leu Ala Asp Gly Asp Ser Ser Phe His Leu Trp Gly Glu

290 295 300

Ser Lys Lys Arg Arg Arg Arg Ser Ser Ser Pro Leu Gln Tyr Ser Ser

305 310 315 320

Ser Met Gln

<210> 15

<211> 897

<212> DNA

<213> 水稻（Oryza sativa）

<400> 15

atgcgtggtg gcgcctctct ccggttgagg tggccggcgg ctctcgtcgc cgtcgtagct 60

gcggcagtga cggcggcggc ggcggcgggg catggcgacc acaatttcca ccgggacttt 120

gacgccgtgt gggggaaggg caatgcgagg ttccgggacg gcgggcggat ggtggagctg 180

acgctggacg agcagacggg ggcgcggctg cagtccaagg agcggttctt gtttgggagg 240

ttcgatctcg agatcaagct cgtcagggga gagtctgcag ggaccatcac ttccttctat 300

atctgcagcg gcggcgcgcg gcacgacgag gtggacttcg agttcctggg caacgtgagc 360

ggcgagccgt acctgctgca caccaacatc ttcagcgacg gcaagggcga gcgtgagcag 420

cagttcgtgc tctggttcga ccccaccgcc gacttccaca cctactccat cctctggaac 480

ccacacaaca tcatactgta cattgacggg acgccgatca gggtgttcaa gaacaacgag 540

gcgtacgggg tgccattccc gacgcggcag ccagtgcacg tgttcgccag catctggaac 600

gcggaggagt gggcgacgca gggcggccgc gtcaagacgg actggtcgcg cgcgccgttc 660

gtcgccacgt accgccgcta caacgtctcc aacgcctgcg tctgggacgc cgccggcgcc 720

ggcgcctccc ggtgcgccgg cggcggcggc gggtggatga ggcggaggat ggactggtgg 780

agctggatga cgctcaactg ggtgcggatg aactacatgg cctacgacta ctgcgccgac 840

aggaagcgat tcccgcaccg tttccccgcc gagtgcatca tccccatcgg tagaacg 897

<210> 16

<211> 299

<212> PRT

<213> 水稻（Oryza sativa）

<400> 16

Met Arg Gly Gly Ala Ser Leu Arg Leu Arg Trp Pro Ala Ala Leu Val

1 5 10 15

Ala Val Val Ala Ala Ala Val Thr Ala Ala Ala Ala Ala Gly His Gly

20 25 30

Asp His Asn Phe His Arg Asp Phe Asp Ala Val Trp Gly Lys Gly Asn

35 40 45

Ala Arg Phe Arg Asp Gly Gly Arg Met Val Glu Leu Thr Leu Asp Glu

50 55 60

Gln Thr Gly Ala Arg Leu Gln Ser Lys Glu Arg Phe Leu Phe Gly Arg

65 70 75 80

Phe Asp Leu Glu Ile Lys Leu Val Arg Gly Glu Ser Ala Gly Thr Ile

85 90 95

Thr Ser Phe Tyr Ile Cys Ser Gly Gly Ala Arg His Asp Glu Val Asp

100 105 110

Phe Glu Phe Leu Gly Asn Val Ser Gly Glu Pro Tyr Leu Leu His Thr

115 120 125

Asn Ile Phe Ser Asp Gly Lys Gly Glu Arg Glu Gln Gln Phe Val Leu

130 135 140

Trp Phe Asp Pro Thr Ala Asp Phe His Thr Tyr Ser Ile Leu Trp Asn

145 150 155 160

Pro His Asn Ile Ile Leu Tyr Ile Asp Gly Thr Pro Ile Arg Val Phe

165 170 175

Lys Asn Asn Glu Ala Tyr Gly Val Pro Phe Pro Thr Arg Gln Pro Val

180 185 190

His Val Phe Ala Ser Ile Trp Asn Ala Glu Glu Trp Ala Thr Gln Gly

195 200 205

Gly Arg Val Lys Thr Asp Trp Ser Arg Ala Pro Phe Val Ala Thr Tyr

210 215 220

Arg Arg Tyr Asn Val Ser Asn Ala Cys Val Trp Asp Ala Ala Gly Ala

225 230 235 240

Gly Ala Ser Arg Cys Ala Gly Gly Gly Gly Gly Trp Met Arg Arg Arg

245 250 255

Met Asp Trp Trp Ser Trp Met Thr Leu Asn Trp Val Arg Met Asn Tyr

260 265 270

Met Ala Tyr Asp Tyr Cys Ala Asp Arg Lys Arg Phe Pro His Arg Phe

275 280 285

Pro Ala Glu Cys Ile Ile Pro Ile Gly Arg Thr

290 295

<210> 17

<211> 825

<212> DNA

<213> 番茄（Lycopersicon esculentum）

<400> 17

atgatcaaaa catcaagttg tatatttact ttctttcttc taatatgttt cttcgtagtg 60

gtggcttttg gtggtacttt cgaccaagaa tttgatgtta catggggtta tgggagggtg 120

aaaatactcg aaaacgggca acttcttact ctttccctcg atagaagttc tggctctgga 180

tttaagtcta aacaacaata tatgtttgca aagattgaca tgaagatcaa acttgtccct 240

ggtaattctg ctggcaccgc tactacatac tatttatctt cggtggggtc agctcatgat 300

gagattgact ttgagtttct tgggaatgta agtggagaac catatactct tcatacaaat 360

gtgtatgcac aaggcaaggg agatagagag caacaatttc atctttggtt tgaccctact 420

aaggatttcc acacctactc tattctttgg aatcctcgaa atatcatatt tttggtagat 480

gggacaccaa taagacaata caagaatctt gaagcaacaa atggaatacc ttacccaaag 540

aaccaaccaa tgtggttata ctcaagttta tggaatgctg aggaatgggc aacaagaggt 600

ggccttgtaa ggactgattg gagtaaagcc ccttttattg cttcttatag aaacttcaat 660

gcccaaactt ccaagaatcc cacagccaat tcttggttaa ctcaatcatt ggacaatgtt 720

gggttaacaa ggatgaaatg ggtgcaaaag aactatatga tatacaatta ttgcactgat 780

actaaacgtt tccctcaagg gttccctcat gaatgcactc taaat 825

<210> 18

<211> 275

<212> PRT

<213> 番茄（Lycopersicon esculentum）

<400> 18

Met Ile Lys Thr Ser Ser Cys Ile Phe Thr Phe Phe Leu Leu Ile Cys

1 5 10 15

Phe Phe Val Val Val Ala Phe Gly Gly Thr Phe Asp Gln Glu Phe Asp

20 25 30

Val Thr Trp Gly Tyr Gly Arg Val Lys Ile Leu Glu Asn Gly Gln Leu

35 40 45

Leu Thr Leu Ser Leu Asp Arg Ser Ser Gly Ser Gly Phe Lys Ser Lys

50 55 60

Gln Gln Tyr Met Phe Ala Lys Ile Asp Met Lys Ile Lys Leu Val Pro

65 70 75 80

Gly Asn Ser Ala Gly Thr Ala Thr Thr Tyr Tyr Leu Ser Ser Val Gly

85 90 95

Ser Ala His Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn Val Ser Gly

100 105 110

Glu Pro Tyr Thr Leu His Thr Asn Val Tyr Ala Gln Gly Lys Gly Asp

115 120 125

Arg Glu Gln Gln Phe His Leu Trp Phe Asp Pro Thr Lys Asp Phe His

130 135 140

Thr Tyr Ser Ile Leu Trp Asn Pro Arg Asn Ile Ile Phe Leu Val Asp

145 150 155 160

Gly Thr Pro Ile Arg Gln Tyr Lys Asn Leu Glu Ala Thr Asn Gly Ile

165 170 175

Pro Tyr Pro Lys Asn Gln Pro Met Trp Leu Tyr Ser Ser Leu Trp Asn

180 185 190

Ala Glu Glu Trp Ala Thr Arg Gly Gly Leu Val Arg Thr Asp Trp Ser

195 200 205

Lys Ala Pro Phe Ile Ala Ser Tyr Arg Asn Phe Asn Ala Gln Thr Ser

210 215 220

Lys Asn Pro Thr Ala Asn Ser Trp Leu Thr Gln Ser Leu Asp Asn Val

225 230 235 240

Gly Leu Thr Arg Met Lys Trp Val Gln Lys Asn Tyr Met Ile Tyr Asn

245 250 255

Tyr Cys Thr Asp Thr Lys Arg Phe Pro Gln Gly Phe Pro His Glu Cys

260 265 270

Thr Leu Asn

275

<210> 19

<211> 990

<212> DNA

<213> 胡萝卜（Daucus carota）

<400> 19

atggtgaact tgtatgtgaa tttgtttgta atgtgttctg ttgttgtttt ggctcatggg 60

tcatcaagaa atcttccaat tgtttcattt gaagaagggt actcacagct ctttggtgat 120

agtaatctca tgattcttca agatggaaaa tcagctcacc tttctcttga tgaaagaaca 180

ggctctggat ttgtatctca tgacctctat aaacatggat tctttagtgc ttcaattaag 240

ttaccagcag attacacagc tggggtggtt gttgcattct atatgtcgaa tgtagacatg 300

tttgcaaaga accatgatga gattgatttt gagtttttgg ggaatattag aggcaaagag 360

tggagacttc agaccaatgt ttatggaaat ggaagcacag gtgcaggcag agaagaaaga 420

tacggtctct ggtttgaccc ttctgatgat tttcatcagt acagtatatt gtggagcaaa 480

gatagaatta tcttttacat agacaatgtt cctataagag aggtcaagaa gacagaagca 540

atgggtgggg acttcccttc caagccaatg agcttgtatg ctactatttg ggatggatct 600

aattgggcta caaatggagg taaatacaag gtcaattata aatattcccc ttacattgcc 660

gagttctccg atttcgtgct tcacggttgt gccgttgatc ccatcgagat gtcgacctca 720

tgtgatactg cgcccaagtc tcaatctgtt cctacaggta caacaaaaga aagtagaact 780

aaaatgcaga acctgaggaa aaaatacatg cagtactcct attgttatga tacaactcga 840

taccaggttc caccttctga gtgtgtaatc gatccacttg agtccgagag acttagagga 900

ttcgacccgg taacatttgg tacaagccac cgcgggcatg gtaaaagaca tcacaaccgc 960

cgatcatacc gtcatggaat aaactctgtt 990

<210> 20

<211> 330

<212> PRT

<213> 胡萝卜（Daucus carota）

<400> 20

Met Val Asn Leu Tyr Val Asn Leu Phe Val Met Cys Ser Val Val Val

1 5 10 15

Leu Ala His Gly Ser Ser Arg Asn Leu Pro Ile Val Ser Phe Glu Glu

20 25 30

Gly Tyr Ser Gln Leu Phe Gly Asp Ser Asn Leu Met Ile Leu Gln Asp

35 40 45

Gly Lys Ser Ala His Leu Ser Leu Asp Glu Arg Thr Gly Ser Gly Phe

50 55 60

Val Ser His Asp Leu Tyr Lys His Gly Phe Phe Ser Ala Ser Ile Lys

65 70 75 80

Leu Pro Ala Asp Tyr Thr Ala Gly Val Val Val Ala Phe Tyr Met Ser

85 90 95

Asn Val Asp Met Phe Ala Lys Asn His Asp Glu Ile Asp Phe Glu Phe

100 105 110

Leu Gly Asn Ile Arg Gly Lys Glu Trp Arg Leu Gln Thr Asn Val Tyr

115 120 125

Gly Asn Gly Ser Thr Gly Ala Gly Arg Glu Glu Arg Tyr Gly Leu Trp

130 135 140

Phe Asp Pro Ser Asp Asp Phe His Gln Tyr Ser Ile Leu Trp Ser Lys

145 150 155 160

Asp Arg Ile Ile Phe Tyr Ile Asp Asn Val Pro Ile Arg Glu Val Lys

165 170 175

Lys Thr Glu Ala Met Gly Gly Asp Phe Pro Ser Lys Pro Met Ser Leu

180 185 190

Tyr Ala Thr Ile Trp Asp Gly Ser Asn Trp Ala Thr Asn Gly Gly Lys

195 200 205

Tyr Lys Val Asn Tyr Lys Tyr Ser Pro Tyr Ile Ala Glu Phe Ser Asp

210 215 220

Phe Val Leu His Gly Cys Ala Val Asp Pro Ile Glu Met Ser Thr Ser

225 230 235 240

Cys Asp Thr Ala Pro Lys Ser Gln Ser Val Pro Thr Gly Thr Thr Lys

245 250 255

Glu Ser Arg Thr Lys Met Gln Asn Leu Arg Lys Lys Tyr Met Gln Tyr

260 265 270

Ser Tyr Cys Tyr Asp Thr Thr Arg Tyr Gln Val Pro Pro Ser Glu Cys

275 280 285

Val Ile Asp Pro Leu Glu Ser Glu Arg Leu Arg Gly Phe Asp Pro Val

290 295 300

Thr Phe Gly Thr Ser His Arg Gly His Gly Lys Arg His His Asn Arg

305 310 315 320

Arg Ser Tyr Arg His Gly Ile Asn Ser Val

325 330

<210> 21

<211> 891

<212> DNA

<213> 番木瓜（Carica papaya）

<400> 21

atggcaaagc ttagttgtgt gttaatggct ccactactat tctcttttct gctcattctc 60

atggtttctt ctcagggtcc tccctcacca gggtactatc ctacatccag attcccgtct 120

ttaggttttg atcaaggatt cagaaatcgt tggggtcctc agcaccagag agtagaacag 180

ggtgtcctaa caatctggct tgattctacc tcaggaagtg ggttcaaatc acttcataca 240

tatcaatctg gttattttgg agctgccatt aaacttcaac ccggttatac tgctggagta 300

attacatctt tctatctttc aaataatgaa gattatccag gaaatcatga tgaaattgac 360

attgaatttc tgggtacaac tccaggggaa ccctacactt tgcagacaaa tgttttcata 420

agaggaagtg gagatagaaa tatcgtcggc agggaagtca aatttcatct ctggtttgat 480

ccaacacaag acttccataa ctatgctatt ctctggaccc caagtgagat cgtatttttt 540

gtggatgatg tgcctattcg gaggtatcca aggaagagtg atgccacatt tcccttaaga 600

accatgtggg tttatgggtc aatttgggat gcttcatctt gggctactga cgatggaaaa 660

tacaaagctg actaccaata ccaacccttt gttggtaggt ataagaattt caaaatagcc 720

gcgtgcagag ccgacgggca agcttcctgt aggccccctt ctgtgtctcc atctggcttt 780

ggcgtgttga gcccacaaca agaatcggcc atggaatggg cacagagaaa ttctttggtt 840

tataactatt gtttagaccc taagagagat cataccccaa cgcccgagtg t 891

<210> 22

<211> 297

<212> PRT

<213> 番木瓜（Carica papaya）

<400> 22

Met Ala Lys Leu Ser Cys Val Leu Met Ala Pro Leu Leu Phe Ser Phe

1 5 10 15

Leu Leu Ile Leu Met Val Ser Ser Gln Gly Pro Pro Ser Pro Gly Tyr

20 25 30

Tyr Pro Thr Ser Arg Phe Pro Ser Leu Gly Phe Asp Gln Gly Phe Arg

35 40 45

Asn Arg Trp Gly Pro Gln His Gln Arg Val Glu Gln Gly Val Leu Thr

50 55 60

Ile Trp Leu Asp Ser Thr Ser Gly Ser Gly Phe Lys Ser Leu His Thr

65 70 75 80

Tyr Gln Ser Gly Tyr Phe Gly Ala Ala Ile Lys Leu Gln Pro Gly Tyr

85 90 95

Thr Ala Gly Val Ile Thr Ser Phe Tyr Leu Ser Asn Asn Glu Asp Tyr

100 105 110

Pro Gly Asn His Asp Glu Ile Asp Ile Glu Phe Leu Gly Thr Thr Pro

115 120 125

Gly Glu Pro Tyr Thr Leu Gln Thr Asn Val Phe Ile Arg Gly Ser Gly

130 135 140

Asp Arg Asn Ile Val Gly Arg Glu Val Lys Phe His Leu Trp Phe Asp

145 150 155 160

Pro Thr Gln Asp Phe His Asn Tyr Ala Ile Leu Trp Thr Pro Ser Glu

165 170 175

Ile Val Phe Phe Val Asp Asp Val Pro Ile Arg Arg Tyr Pro Arg Lys

180 185 190

Ser Asp Ala Thr Phe Pro Leu Arg Thr Met Trp Val Tyr Gly Ser Ile

195 200 205

Trp Asp Ala Ser Ser Trp Ala Thr Asp Asp Gly Lys Tyr Lys Ala Asp

210 215 220

Tyr Gln Tyr Gln Pro Phe Val Gly Arg Tyr Lys Asn Phe Lys Ile Ala

225 230 235 240

Ala Cys Arg Ala Asp Gly Gln Ala Ser Cys Arg Pro Pro Ser Val Ser

245 250 255

Pro Ser Gly Phe Gly Val Leu Ser Pro Gln Gln Glu Ser Ala Met Glu

260 265 270

Trp Ala Gln Arg Asn Ser Leu Val Tyr Asn Tyr Cys Leu Asp Pro Lys

275 280 285

Arg Asp His Thr Pro Thr Pro Glu Cys

290 295

<210> 23

<211> 864

<212> DNA

<213> 草地羊茅（Festuca pratensis）

<400> 23

atggggaagc ctgcagcgtt gattccggtg ctagctcttc ttgcctgctt ggcttttggg 60

cttgtgtccg gcggcaactt caacgacgat tgcgacgcga cctgggagcc ccagaactgc 120

tgggtttatg atgctggcaa tagcctctcc ctcgccctcg tcagcaactc ctcaggctcg 180

atgatccggt ccaagaggca gttcatcttt gggaccgtct ccacatggat ccaagcttcg 240

tcaagggcaa ctcttgcccg gcaccgtcac aacatattac ctatcctcgg cggagacaat 300

catgacgaaa tcgacttcga gttcctgggg aacgagaccg gacagcccta caccctgcac 360

accaacgtct acgccgacgg cgtcggcaac aaggagatgc agttcgtgcc ctggttcgac 420

cccaccggcg gttaccacaa gtacaccatc tcctggacgc cctgcatgat cgtctggtac 480

gtcgacgacc tccccatccg ggtcttccgc aattaccgcc agagcaacgg cgtggccttc 540

ccgacgagcc gccccatgta cgcctactcc agcatctggt ccgccgacga ctgggccacg 600

cagggcggcc gcgtcaagac cgactggacc cacgcgccct tcgtcgccaa ctaccacggc 660

atcgacctcg acatctgcga gtgctacggc ggcgactgca tctacggctg cgccggcgcc 720

tacggccagc cctactgcgg cgggctcacc gacgagcagc gctggaagat gcagtgggta 780

caggagagat acaggatcta cgactactgc gtggactaca aggacggcaa ggtgcccggc 840

gtcgagtgca gcctgcccca gtac 864

<210> 24

<211> 288

<212> PRT

<213> 草地羊茅（Festuca pratensis）

<400> 24

Met Gly Lys Pro Ala Ala Leu Ile Pro Val Leu Ala Leu Leu Ala Cys

1 5 10 15

Leu Ala Phe Gly Leu Val Ser Gly Gly Asn Phe Asn Asp Asp Cys Asp

20 25 30

Ala Thr Trp Glu Pro Gln Asn Cys Trp Val Tyr Asp Ala Gly Asn Ser

35 40 45

Leu Ser Leu Ala Leu Val Ser Asn Ser Ser Gly Ser Met Ile Arg Ser

50 55 60

Lys Arg Gln Phe Ile Phe Gly Thr Val Ser Thr Trp Ile Gln Ala Ser

65 70 75 80

Ser Arg Ala Thr Leu Ala Arg His Arg His Asn Ile Leu Pro Ile Leu

85 90 95

Gly Gly Asp Asn His Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn Glu

100 105 110

Thr Gly Gln Pro Tyr Thr Leu His Thr Asn Val Tyr Ala Asp Gly Val

115 120 125

Gly Asn Lys Glu Met Gln Phe Val Pro Trp Phe Asp Pro Thr Gly Gly

130 135 140

Tyr His Lys Tyr Thr Ile Ser Trp Thr Pro Cys Met Ile Val Trp Tyr

145 150 155 160

Val Asp Asp Leu Pro Ile Arg Val Phe Arg Asn Tyr Arg Gln Ser Asn

165 170 175

Gly Val Ala Phe Pro Thr Ser Arg Pro Met Tyr Ala Tyr Ser Ser Ile

180 185 190

Trp Ser Ala Asp Asp Trp Ala Thr Gln Gly Gly Arg Val Lys Thr Asp

195 200 205

Trp Thr His Ala Pro Phe Val Ala Asn Tyr His Gly Ile Asp Leu Asp

210 215 220

Ile Cys Glu Cys Tyr Gly Gly Asp Cys Ile Tyr Gly Cys Ala Gly Ala

225 230 235 240

Tyr Gly Gln Pro Tyr Cys Gly Gly Leu Thr Asp Glu Gln Arg Trp Lys

245 250 255

Met Gln Trp Val Gln Glu Arg Tyr Arg Ile Tyr Asp Tyr Cys Val Asp

260 265 270

Tyr Lys Asp Gly Lys Val Pro Gly Val Glu Cys Ser Leu Pro Gln Tyr

275 280 285

<210> 25

<211> 933

<212> DNA

<213> 水稻（Oryza sativa）

<400> 25

atggcgaagg ctctcctcgc cgtcgtcgtc gtcgccgtgg cggcggtgct cgagctgggg 60

ctcgtcggag ccaacttcca ggatcagtgt gacatcacgt gggagccaca gaacgccaag 120

atgacggagg gaggagacca cctcacgctc tcccttgtca gcaactcctc tggttgtatg 180

ctccggacca agaagcagtt catctacggc agcgtgtcga ctcgcatcca gcttgtgaag 240

ggcaactcgg ccggcaccgt caccacctac tacacatcgt ccatcggcga caaacacgac 300

gagatcgact tcgagttcct gggcaactcc agcggcctcc cctacacctt ccacaccaac 360

gtcttcgccg acggcgtcgg cagccgcgag atgcagttcc gcccctggtt cgaccccacc 420

gacggctacc acaactacac catcttctgg aacccctgca tgatcgtgtg gttcgtggac 480

agcatcccaa tcagggtgtt ccggaaccac gagaaggaag gggtgccgtt cccgacaaag 540

cggccgatgt acgccttctc cagcatctgg gcggcggagg attgggccac gcagggtggc 600

cgcgtcaaga cggactggac caaggcccct ttcgtcgccg agtaccgtga catcggcctc 660

aacatctgtg agtgccccgg ctcaggctct ggctccagct ccagcttcag ctccagctcc 720

agctctacct ccggcgatgc cgaggaccca gcgtgcgcgc agcggtgcgc gacgtcggac 780

cactggtacg cggcggaggg gctgtgccag ctgagcgaca agcagctgcg gcagatgaag 840

gcggtgcagc tgggctacac catctacgac tactgcgccg acgcccaggc caagggacgc 900

cccgtgccgc cggagtgcag catgccgcag tac 933

<210> 26

<211> 311

<212> PRT

<213> 水稻（Oryza sativa）

<400> 26

Met Ala Lys Ala Leu Leu Ala Val Val Val Val Ala Val Ala Ala Val

1 5 10 15

Leu Glu Leu Gly Leu Val Gly Ala Asn Phe Gln Asp Gln Cys Asp Ile

20 25 30

Thr Trp Glu Pro Gln Asn Ala Lys Met Thr Glu Gly Gly Asp His Leu

35 40 45

Thr Leu Ser Leu Val Ser Asn Ser Ser Gly Cys Met Leu Arg Thr Lys

50 55 60

Lys Gln Phe Ile Tyr Gly Ser Val Ser Thr Arg Ile Gln Leu Val Lys

65 70 75 80

Gly Asn Ser Ala Gly Thr Val Thr Thr Tyr Tyr Thr Ser Ser Ile Gly

85 90 95

Asp Lys His Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn Ser Ser Gly

100 105 110

Leu Pro Tyr Thr Phe His Thr Asn Val Phe Ala Asp Gly Val Gly Ser

115 120 125

Arg Glu Met Gln Phe Arg Pro Trp Phe Asp Pro Thr Asp Gly Tyr His

130 135 140

Asn Tyr Thr Ile Phe Trp Asn Pro Cys Met Ile Val Trp Phe Val Asp

145 150 155 160

Ser Ile Pro Ile Arg Val Phe Arg Asn His Glu Lys Glu Gly Val Pro

165 170 175

Phe Pro Thr Lys Arg Pro Met Tyr Ala Phe Ser Ser Ile Trp Ala Ala

180 185 190

Glu Asp Trp Ala Thr Gln Gly Gly Arg Val Lys Thr Asp Trp Thr Lys

195 200 205

Ala Pro Phe Val Ala Glu Tyr Arg Asp Ile Gly Leu Asn Ile Cys Glu

210 215 220

Cys Pro Gly Ser Gly Ser Gly Ser Ser Ser Ser Phe Ser Ser Ser Ser

225 230 235 240

Ser Ser Thr Ser Gly Asp Ala Glu Asp Pro Ala Cys Ala Gln Arg Cys

245 250 255

Ala Thr Ser Asp His Trp Tyr Ala Ala Glu Gly Leu Cys Gln Leu Ser

260 265 270

Asp Lys Gln Leu Arg Gln Met Lys Ala Val Gln Leu Gly Tyr Thr Ile

275 280 285

Tyr Asp Tyr Cys Ala Asp Ala Gln Ala Lys Gly Arg Pro Val Pro Pro

290 295 300

Glu Cys Ser Met Pro Gln Tyr

305 310

<210> 27

<211> 873

<212> DNA

<213> 高粱（Sorghum bicolor）

<400> 27

atggcgcggc cggcggcgtg gactccgcct gctctgtcgc tcgcggtcgc cgtcctctgc 60

ctcgtcggcc ggtccacctc cgcggagttc tggctcgacg agttcaccac ggacggcgac 120

gtccgcaaag actacgacgg ttctggccgg caggtggcgt cgctggtcct cgaccagagt 180

tctggcgctg gcttcaactc cacccgcaag tacctcttcg gcgagttcag cgtcgagatg 240

aagctcgtcg ccggcaactc cgccggcact gtcacctcct tctacctgac gtccggcgag 300

ggcgacgagc acgacgagat cgacatggag ttcatgggca actccagcgg gtcgccgacg 360

gtgctcaaca ccaacgtgtg ggccagcggc gacggcaaga aggagcacca gttctacctg 420

tggttcgacc cggccgccga cttccacaag tacaagatca cctggaacga caagaacatc 480

atcttccagg tggacgacgt gacggtgcgc gtcttcaagc gctacgccga cctgccgtac 540

ccgagctcca agcccatggc ggtgcacgcc acgctgtggg acggcagcta ctgggccacc 600

gagaagggca aggtgcccat cgactggtcc cgcgcgccct tcgtcgtctc ctaccgagca 660

tacacggcca acgcctgcgc cgtcggcggc ggcggcgggg gctcgtcgtc gtcgtgcccc 720

gacgccgccg gtgggaacga gtggatggac aggcagcccg acgacaccga ccggctcacc 780

gtggagtggg cgcgccggaa ctgcttgcag tacaactact gcgaggacgg gtggcgcttc 840

ccgcaggggt tccccggcga gtgcgcccgc aac 873

<210> 28

<211> 291

<212> PRT

<213> 高粱（Sorghum bicolor）

<400> 28

Met Ala Arg Pro Ala Ala Trp Thr Pro Pro Ala Leu Ser Leu Ala Val

1 5 10 15

Ala Val Leu Cys Leu Val Gly Arg Ser Thr Ser Ala Glu Phe Trp Leu

20 25 30

Asp Glu Phe Thr Thr Asp Gly Asp Val Arg Lys Asp Tyr Asp Gly Ser

35 40 45

Gly Arg Gln Val Ala Ser Leu Val Leu Asp Gln Ser Ser Gly Ala Gly

50 55 60

Phe Asn Ser Thr Arg Lys Tyr Leu Phe Gly Glu Phe Ser Val Glu Met

65 70 75 80

Lys Leu Val Ala Gly Asn Ser Ala Gly Thr Val Thr Ser Phe Tyr Leu

85 90 95

Thr Ser Gly Glu Gly Asp Glu His Asp Glu Ile Asp Met Glu Phe Met

100 105 110

Gly Asn Ser Ser Gly Ser Pro Thr Val Leu Asn Thr Asn Val Trp Ala

115 120 125

Ser Gly Asp Gly Lys Lys Glu His Gln Phe Tyr Leu Trp Phe Asp Pro

130 135 140

Ala Ala Asp Phe His Lys Tyr Lys Ile Thr Trp Asn Asp Lys Asn Ile

145 150 155 160

Ile Phe Gln Val Asp Asp Val Thr Val Arg Val Phe Lys Arg Tyr Ala

165 170 175

Asp Leu Pro Tyr Pro Ser Ser Lys Pro Met Ala Val His Ala Thr Leu

180 185 190

Trp Asp Gly Ser Tyr Trp Ala Thr Glu Lys Gly Lys Val Pro Ile Asp

195 200 205

Trp Ser Arg Ala Pro Phe Val Val Ser Tyr Arg Ala Tyr Thr Ala Asn

210 215 220

Ala Cys Ala Val Gly Gly Gly Gly Gly Gly Ser Ser Ser Ser Cys Pro

225 230 235 240

Asp Ala Ala Gly Gly Asn Glu Trp Met Asp Arg Gln Pro Asp Asp Thr

245 250 255

Asp Arg Leu Thr Val Glu Trp Ala Arg Arg Asn Cys Leu Gln Tyr Asn

260 265 270

Tyr Cys Glu Asp Gly Trp Arg Phe Pro Gln Gly Phe Pro Gly Glu Cys

275 280 285

Ala Arg Asn

290

<210> 29

<211> 840

<212> DNA

<213> 高粱（Sorghum bicolor）

<400> 29

atggcgcggc ggtctctggc ccttctgctc gcgtcgtcgc tggccctcgt gatgatggcg 60

gccgtcgcgt cggcggactc gtggctctac gagaagttca gcacggacgg caccgtccgc 120

accaactacg acgagtccgg cgcgcaggtg gcgatgctca acctcgaccg cagctccggc 180

gccggcttca actccaagga gcagtacctc tacggccagt tcagcgtcca gatgaagctc 240

atccccggca actccgccgg caccgtctcc tgcttctacc tttcttctgg cgacggcgac 300

gggcatgacg agatcgacat ggagttcatg ggcaacgcca cggggcagcc ggtggtgctc 360

aacacaaacg tgtgggccaa cggcgacggc aagaaggagc accagttcga cctgtggttc 420

gacccggccg ccgactacca cacctacacc atcatctgga acccgaccaa catcctcttc 480

aaggtggacg acaacgtgat ccgcgtcttc aagcgctacg ccgacctggc ctacccgagc 540

tccaagccca tgacgctgca cgccacgctg tgggacggca gctactgggc caccgagaag 600

ggcaaggtgc ccatcgactg gtccggcgcg cccttcgtcg tctcctacaa aggctactcc 660

gccgacgcct gcgtcagcgg cggcgcctgc gccgccggca gcggcgcgtg gatgaacaag 720

cagcctgaca gcgccgagtg gggcaccgtc aagtgggccg agagcaacta catgcgctac 780

aactactgcg acgacggctg gaggttcccg caggggctgc cggcggagtg cagccgcagc 840

<210> 30

<211> 280

<212> PRT

<213> 高粱（Sorghum bicolor）

<400> 30

Met Ala Arg Arg Ser Leu Ala Leu Leu Leu Ala Ser Ser Leu Ala Leu

1 5 10 15

Val Met Met Ala Ala Val Ala Ser Ala Asp Ser Trp Leu Tyr Glu Lys

20 25 30

Phe Ser Thr Asp Gly Thr Val Arg Thr Asn Tyr Asp Glu Ser Gly Ala

35 40 45

Gln Val Ala Met Leu Asn Leu Asp Arg Ser Ser Gly Ala Gly Phe Asn

50 55 60

Ser Lys Glu Gln Tyr Leu Tyr Gly Gln Phe Ser Val Gln Met Lys Leu

65 70 75 80

Ile Pro Gly Asn Ser Ala Gly Thr Val Ser Cys Phe Tyr Leu Ser Ser

85 90 95

Gly Asp Gly Asp Gly His Asp Glu Ile Asp Met Glu Phe Met Gly Asn

100 105 110

Ala Thr Gly Gln Pro Val Val Leu Asn Thr Asn Val Trp Ala Asn Gly

115 120 125

Asp Gly Lys Lys Glu His Gln Phe Asp Leu Trp Phe Asp Pro Ala Ala

130 135 140

Asp Tyr His Thr Tyr Thr Ile Ile Trp Asn Pro Thr Asn Ile Leu Phe

145 150 155 160

Lys Val Asp Asp Asn Val Ile Arg Val Phe Lys Arg Tyr Ala Asp Leu

165 170 175

Ala Tyr Pro Ser Ser Lys Pro Met Thr Leu His Ala Thr Leu Trp Asp

180 185 190

Gly Ser Tyr Trp Ala Thr Glu Lys Gly Lys Val Pro Ile Asp Trp Ser

195 200 205

Gly Ala Pro Phe Val Val Ser Tyr Lys Gly Tyr Ser Ala Asp Ala Cys

210 215 220

Val Ser Gly Gly Ala Cys Ala Ala Gly Ser Gly Ala Trp Met Asn Lys

225 230 235 240

Gln Pro Asp Ser Ala Glu Trp Gly Thr Val Lys Trp Ala Glu Ser Asn

245 250 255

Tyr Met Arg Tyr Asn Tyr Cys Asp Asp Gly Trp Arg Phe Pro Gln Gly

260 265 270

Leu Pro Ala Glu Cys Ser Arg Ser

275 280

<210> 31

<211> 870

<212> DNA

<213> 拟南芥（Arabidopsis thaliana）

<400> 31

atggactata tgagaatctt tagtgttttt gtagtaacgt tatggatcat aagggttgat 60

gctagggttt tcggaggacg aggaatcgaa aaatttgtaa ctttcggtca gaattatatt 120

gttacgtggg gacaaagtca tgtttctaca ctccattctg gcgaagaagt tgatctttac 180

atggatcaat cttcaggtgg tgggttcgaa tccaaggacg cctacggatc aggtctcttt 240

gaaatgagaa tcaaagtgcc ttcaggaaat actggcggca tcgtcaccgc tttttacttg 300

acgtcgaaag gaggtggtca cgacgagatt gacttcgagt ttctagggaa caacaacgga 360

aaaccggtaa cgttacagac aaatctgttt ctaaatggag aaggaaacag agaagagagg 420

tttttgcttt ggttcaatcc aaccaaacac taccacactt atgggcttct ttggaaccct 480

taccaaattg tgttttacgt ggacaacatc ccaataagag tatacaaaaa cgaaaacggc 540

gtaagttatc catcaaagcc tatgcaagtc gaggctagtc tctggaacgg tgacgattgg 600

gcgactgatg gtggtcggac taaggttaac tggtcatact ctcctttcat tgcacatttc 660

cgagacttcg ccttatccgg ctgcaacata gatggtcgga gtaataatgt cggcgcttgt 720

gaatcctcca actactggtg gaatgcaggc aactatcaaa gattaagcgg aaacgaacag 780

aaactttatg aacatgtgag gagcaagtac atgaactatg actattgtac tgatcgctct 840

aagtaccaaa ctcctcctag agaatgttat 870

<210> 32

<211> 290

<212> PRT

<213> 拟南芥（Arabidopsis thaliana）

<400> 32

Met Asp Tyr Met Arg Ile Phe Ser Val Phe Val Val Thr Leu Trp Ile

1 5 10 15

Ile Arg Val Asp Ala Arg Val Phe Gly Gly Arg Gly Ile Glu Lys Phe

20 25 30

Val Thr Phe Gly Gln Asn Tyr Ile Val Thr Trp Gly Gln Ser His Val

35 40 45

Ser Thr Leu His Ser Gly Glu Glu Val Asp Leu Tyr Met Asp Gln Ser

50 55 60

Ser Gly Gly Gly Phe Glu Ser Lys Asp Ala Tyr Gly Ser Gly Leu Phe

65 70 75 80

Glu Met Arg Ile Lys Val Pro Ser Gly Asn Thr Gly Gly Ile Val Thr

85 90 95

Ala Phe Tyr Leu Thr Ser Lys Gly Gly Gly His Asp Glu Ile Asp Phe

100 105 110

Glu Phe Leu Gly Asn Asn Asn Gly Lys Pro Val Thr Leu Gln Thr Asn

115 120 125

Leu Phe Leu Asn Gly Glu Gly Asn Arg Glu Glu Arg Phe Leu Leu Trp

130 135 140

Phe Asn Pro Thr Lys His Tyr His Thr Tyr Gly Leu Leu Trp Asn Pro

145 150 155 160

Tyr Gln Ile Val Phe Tyr Val Asp Asn Ile Pro Ile Arg Val Tyr Lys

165 170 175

Asn Glu Asn Gly Val Ser Tyr Pro Ser Lys Pro Met Gln Val Glu Ala

180 185 190

Ser Leu Trp Asn Gly Asp Asp Trp Ala Thr Asp Gly Gly Arg Thr Lys

195 200 205

Val Asn Trp Ser Tyr Ser Pro Phe Ile Ala His Phe Arg Asp Phe Ala

210 215 220

Leu Ser Gly Cys Asn Ile Asp Gly Arg Ser Asn Asn Val Gly Ala Cys

225 230 235 240

Glu Ser Ser Asn Tyr Trp Trp Asn Ala Gly Asn Tyr Gln Arg Leu Ser

245 250 255

Gly Asn Glu Gln Lys Leu Tyr Glu His Val Arg Ser Lys Tyr Met Asn

260 265 270

Tyr Asp Tyr Cys Thr Asp Arg Ser Lys Tyr Gln Thr Pro Pro Arg Glu

275 280 285

Cys Tyr

290

<210> 33

<211> 906

<212> DNA

<213> 大豆（Glycine max）

<400> 33

atggatgcaa gggcatcatc ttcttcaatg tccatgattc ttttcattac agctattgtg 60

gctgcagctt attttcattc atcagaagca gctgtgtcaa aaggatcttt tgaggacaat 120

ttcagcataa tgtggtctga ggaccatttt actacctcta aagatggaca gatctggtat 180

ctctcactag acaaagacac aggatgtggg tttcaaacaa aacaacgcta cagattcggg 240

tggttcagta tgaagctgaa gttggtagca ggtgactctg caggtgttgt gacagcttat 300

tatatgtgct cagaaaatgg tgcagggccg gagagggatg agcttgattt tgagtttttg 360

ggaaacagaa ctggggagcc ttatttgatt cagactaatg tgtacaagaa tgggactgga 420

gggcgtgaga tgaggcatat gctatggttt gaccccacag aggactacca cacttattcc 480

attctctgga acaaccacca gatagtgttt tttgtggata gagttccagt gagggtgttc 540

aagaacaatg gggaaccaaa caacttcttc ccgaatgaga agcccatgta cttgttctcc 600

agcatatgga atgcagatga gtgggccaca agaggtgggc ttgagaagac aaactggaaa 660

ttagccccat ttgtgtcatc ctacaaagac ttcagtgtgg atggttgcca gtgggaagac 720

ccataccctg cctgtgtctc aaccacaacc aaaaattggt gggatcagta tgatgcttgg 780

cacctttctg atgatcagaa aaaggattat gcttgggttc agaggaacct tgttatctat 840

gactactgcc aggattctgc acgttatcca actaccccag aggagtgttc attgagtcca 900

tgggat 906

<210> 34

<211> 302

<212> PRT

<213> 大豆（Glycine max）

<400> 34

Met Asp Ala Arg Ala Ser Ser Ser Ser Met Ser Met Ile Leu Phe Ile

1 5 10 15

Thr Ala Ile Val Ala Ala Ala Tyr Phe His Ser Ser Glu Ala Ala Val

20 25 30

Ser Lys Gly Ser Phe Glu Asp Asn Phe Ser Ile Met Trp Ser Glu Asp

35 40 45

His Phe Thr Thr Ser Lys Asp Gly Gln Ile Trp Tyr Leu Ser Leu Asp

50 55 60

Lys Asp Thr Gly Cys Gly Phe Gln Thr Lys Gln Arg Tyr Arg Phe Gly

65 70 75 80

Trp Phe Ser Met Lys Leu Lys Leu Val Ala Gly Asp Ser Ala Gly Val

85 90 95

Val Thr Ala Tyr Tyr Met Cys Ser Glu Asn Gly Ala Gly Pro Glu Arg

100 105 110

Asp Glu Leu Asp Phe Glu Phe Leu Gly Asn Arg Thr Gly Glu Pro Tyr

115 120 125

Leu Ile Gln Thr Asn Val Tyr Lys Asn Gly Thr Gly Gly Arg Glu Met

130 135 140

Arg His Met Leu Trp Phe Asp Pro Thr Glu Asp Tyr His Thr Tyr Ser

145 150 155 160

Ile Leu Trp Asn Asn His Gln Ile Val Phe Phe Val Asp Arg Val Pro

165 170 175

Val Arg Val Phe Lys Asn Asn Gly Glu Pro Asn Asn Phe Phe Pro Asn

180 185 190

Glu Lys Pro Met Tyr Leu Phe Ser Ser Ile Trp Asn Ala Asp Glu Trp

195 200 205

Ala Thr Arg Gly Gly Leu Glu Lys Thr Asn Trp Lys Leu Ala Pro Phe

210 215 220

Val Ser Ser Tyr Lys Asp Phe Ser Val Asp Gly Cys Gln Trp Glu Asp

225 230 235 240

Pro Tyr Pro Ala Cys Val Ser Thr Thr Thr Lys Asn Trp Trp Asp Gln

245 250 255

Tyr Asp Ala Trp His Leu Ser Asp Asp Gln Lys Lys Asp Tyr Ala Trp

260 265 270

Val Gln Arg Asn Leu Val Ile Tyr Asp Tyr Cys Gln Asp Ser Ala Arg

275 280 285

Tyr Pro Thr Thr Pro Glu Glu Cys Ser Leu Ser Pro Trp Asp

290 295 300

<210> 35

<211> 873

<212> DNA

<213> 蒺藜状苜蓿（Medicago truncatula）

<400> 35

atggccatat tttacccctt taaaaacaat ggtgtctttt ttatgttgtt attgtggatt 60

gtcgtatcat ctgtttgggg aagaccagca acttttaatc aagattttca tgtcacgtgg 120

tcagaacccc atatcaagca aattgatcaa ggcagaacta tccaacttac cctagaccaa 180

ggctctggtt gcgggtttgc atcaaaggtg aagtatttgt ttggtcgtgt aagcatgaag 240

atcaaacttg tccctggaga ttctgctggt actgttactg cattttatat gaactctgac 300

actgacagtg tacgtgatga gttggatttt gagttcttgg gaaaccgtac tggacaacct 360

tacacagttc aaacaaacat ttatgctcat ggaaagggtg atagagaaca aagagttaat 420

ctttggtttg atccttctgc tgatttccac acttactcca ttctttggaa tcatcaccat 480

attgtgttct acgttgatga agttcccatt agagtataca agaacaatga agcaaaaggg 540

ataccatacc ccaaaatgca agccatggga gtattttcaa cattatggga agctgataat 600

tgggcaacaa gaggtggatt agagaaaatt aattggagta aagcaccttt ttatgcttat 660

tacaaggatt ttgatattga aggatgtgca atttcaggac ccaatacatg ttccactaac 720

cccaaaaatt ggtggggagg ggttgaatat caagctttta gtgccattga agctagaagg 780

tataggtggg tttgtatgaa ccatgtgatc tatgattatt gtcaagataa atcaaggtac 840

ccaatgaccc cacatgagtg tctttcaggc att 873

<210> 36

<211> 291

<212> PRT

<213> 蒺藜状苜蓿（Medicago truncatula）

<400> 36

Met Ala Ile Phe Tyr Pro Phe Lys Asn Asn Gly Val Phe Phe Met Leu

1 5 10 15

Leu Leu Trp Ile Val Val Ser Ser Val Trp Gly Arg Pro Ala Thr Phe

20 25 30

Asn Gln Asp Phe His Val Thr Trp Ser Glu Pro His Ile Lys Gln Ile

35 40 45

Asp Gln Gly Arg Thr Ile Gln Leu Thr Leu Asp Gln Gly Ser Gly Cys

50 55 60

Gly Phe Ala Ser Lys Val Lys Tyr Leu Phe Gly Arg Val Ser Met Lys

65 70 75 80

Ile Lys Leu Val Pro Gly Asp Ser Ala Gly Thr Val Thr Ala Phe Tyr

85 90 95

Met Asn Ser Asp Thr Asp Ser Val Arg Asp Glu Leu Asp Phe Glu Phe

100 105 110

Leu Gly Asn Arg Thr Gly Gln Pro Tyr Thr Val Gln Thr Asn Ile Tyr

115 120 125

Ala His Gly Lys Gly Asp Arg Glu Gln Arg Val Asn Leu Trp Phe Asp

130 135 140

Pro Ser Ala Asp Phe His Thr Tyr Ser Ile Leu Trp Asn His His His

145 150 155 160

Ile Val Phe Tyr Val Asp Glu Val Pro Ile Arg Val Tyr Lys Asn Asn

165 170 175

Glu Ala Lys Gly Ile Pro Tyr Pro Lys Met Gln Ala Met Gly Val Phe

180 185 190

Ser Thr Leu Trp Glu Ala Asp Asn Trp Ala Thr Arg Gly Gly Leu Glu

195 200 205

Lys Ile Asn Trp Ser Lys Ala Pro Phe Tyr Ala Tyr Tyr Lys Asp Phe

210 215 220

Asp Ile Glu Gly Cys Ala Ile Ser Gly Pro Asn Thr Cys Ser Thr Asn

225 230 235 240

Pro Lys Asn Trp Trp Gly Gly Val Glu Tyr Gln Ala Phe Ser Ala Ile

245 250 255

Glu Ala Arg Arg Tyr Arg Trp Val Cys Met Asn His Val Ile Tyr Asp

260 265 270

Tyr Cys Gln Asp Lys Ser Arg Tyr Pro Met Thr Pro His Glu Cys Leu

275 280 285

Ser Gly Ile

290

<210> 37

<211> 897

<212> DNA

<213> 拟南芥（Arabidopsis thaliana）

<400> 37

atgactctaa taaatcgctc aaaaccattt gtacttctcg taggcttctc aattatctca 60

agtttgctat tatgggtctc acaagcttcc gttgtttcat caggagattt taacaaagac 120

ttctttgtga catggtctcc tacccacgtt aacacctcca atgatggtcg atcaagaacc 180

cttaaactcg atcaagaatc tggagcttct ttttcttcca ttcagacgtt cttgttcggc 240

caaatagata tgaagatcaa acttatccgt ggaagttctc aaggaaccgt ggttgcttat 300

tatatgtcct cagatcagcc taaccgggat gagattgact ttgagttcct cggaaacgtt 360

aatgggcagc cttacattct ccagacaaat gtctatgccg agggacttga taaccgcgaa 420

gaaaggatcc atctctggtt cgacccagcc aaggactttc acacttactc tatcttgtgg 480

aacattcacc aaattgtatt tatggtggat cagattccga taaggttgta tagaaaccat 540

ggggagaaag gcgtagccta cccaaggttg caacctatga gtgtacaggc gagtctatgg 600

aacggtgaga gctgggctac gcgcggtgga catgacaaga ttgattggtc aaagggtcca 660

tttgtggctt cctttgggga ttacaagata gacgcttgta tttggatagg caatacaagt 720

ttttgtaatg gagagagcac tgaaaactgg tggaacaaga atgagttcag ttctttgaca 780

agagtgcaaa agagatggtt taaatgggtg agaaaatatc acttgattta tgattattgc 840

caagattatg gaaggttcaa taacaagcta ccgaaggaat gttctcttcc taaatat 897

<210> 38

<211> 299

<212> PRT

<213> 拟南芥（Arabidopsis thaliana）

<400> 38

Met Thr Leu Ile Asn Arg Ser Lys Pro Phe Val Leu Leu Val Gly Phe

1 5 10 15

Ser Ile Ile Ser Ser Leu Leu Leu Trp Val Ser Gln Ala Ser Val Val

20 25 30

Ser Ser Gly Asp Phe Asn Lys Asp Phe Phe Val Thr Trp Ser Pro Thr

35 40 45

His Val Asn Thr Ser Asn Asp Gly Arg Ser Arg Thr Leu Lys Leu Asp

50 55 60

Gln Glu Ser Gly Ala Ser Phe Ser Ser Ile Gln Thr Phe Leu Phe Gly

65 70 75 80

Gln Ile Asp Met Lys Ile Lys Leu Ile Arg Gly Ser Ser Gln Gly Thr

85 90 95

Val Val Ala Tyr Tyr Met Ser Ser Asp Gln Pro Asn Arg Asp Glu Ile

100 105 110

Asp Phe Glu Phe Leu Gly Asn Val Asn Gly Gln Pro Tyr Ile Leu Gln

115 120 125

Thr Asn Val Tyr Ala Glu Gly Leu Asp Asn Arg Glu Glu Arg Ile His

130 135 140

Leu Trp Phe Asp Pro Ala Lys Asp Phe His Thr Tyr Ser Ile Leu Trp

145 150 155 160

Asn Ile His Gln Ile Val Phe Met Val Asp Gln Ile Pro Ile Arg Leu

165 170 175

Tyr Arg Asn His Gly Glu Lys Gly Val Ala Tyr Pro Arg Leu Gln Pro

180 185 190

Met Ser Val Gln Ala Ser Leu Trp Asn Gly Glu Ser Trp Ala Thr Arg

195 200 205

Gly Gly His Asp Lys Ile Asp Trp Ser Lys Gly Pro Phe Val Ala Ser

210 215 220

Phe Gly Asp Tyr Lys Ile Asp Ala Cys Ile Trp Ile Gly Asn Thr Ser

225 230 235 240

Phe Cys Asn Gly Glu Ser Thr Glu Asn Trp Trp Asn Lys Asn Glu Phe

245 250 255

Ser Ser Leu Thr Arg Val Gln Lys Arg Trp Phe Lys Trp Val Arg Lys

260 265 270

Tyr His Leu Ile Tyr Asp Tyr Cys Gln Asp Tyr Gly Arg Phe Asn Asn

275 280 285

Lys Leu Pro Lys Glu Cys Ser Leu Pro Lys Tyr

290 295

<210> 39

<211> 870

<212> DNA

<213> 拟南芥（Arabidopsis thaliana）

<400> 39

atggtcggta tggatttgtt caaatgtgta atgatgataa tggtgttggt tgtctcttgt 60

ggtgaagctg tttctggagc taagttcgat gagctttatc ggtcaagctg ggctatggat 120

cattgtgtca acgaaggcga agtcacaaaa ctcaagcttg acaattactc tggagctggg 180

tttgaatcaa gaagcaaata cttgtttggt aaagtctcta tccagattaa gcttgttgag 240

ggtgattcag caggaacagt cactgctttc tacatgtctt cagatggtcc gaaccacaac 300

gaattcgatt ttgagttctt agggaacact accggcgagc cttacatagt ccagaccaat 360

atctacgtga acggagttgg aaacagagaa caaagactca acctttggtt cgatcccacc 420

actgagtttc acacttactc aatcctctgg agtaaacgca gtgttgtatt catggtagac 480

gaaacaccga ttcgagttca gaagaatctt gaagagaaag gtatcccatt tgctaaagat 540

caagcaatgg gtgtttacag ctccatttgg aatgcagatg attgggctac acaaggaggt 600

cttgttaaaa ctgattggag tcacgctcct ttcgttgctt cttacaaaga attccaaatc 660

gatgcatgtg agattccaac aactactgat ctaagcaagt gtaatggaga ccagaagttt 720

tggtgggatg aaccaactgt ctctgagctt agccttcatc agaatcatca gcttatttgg 780

gttcgagcta atcatatgat ttatgattat tgttttgatg ctactaggtt tcctgttact 840

cctcttgagt gccaacatca tcgtcatttg 870

<210> 40

<211> 290

<212> PRT

<213> 拟南芥（Arabidopsis thaliana）

<400> 40

Met Val Gly Met Asp Leu Phe Lys Cys Val Met Met Ile Met Val Leu

1 5 10 15

Val Val Ser Cys Gly Glu Ala Val Ser Gly Ala Lys Phe Asp Glu Leu

20 25 30

Tyr Arg Ser Ser Trp Ala Met Asp His Cys Val Asn Glu Gly Glu Val

35 40 45

Thr Lys Leu Lys Leu Asp Asn Tyr Ser Gly Ala Gly Phe Glu Ser Arg

50 55 60

Ser Lys Tyr Leu Phe Gly Lys Val Ser Ile Gln Ile Lys Leu Val Glu

65 70 75 80

Gly Asp Ser Ala Gly Thr Val Thr Ala Phe Tyr Met Ser Ser Asp Gly

85 90 95

Pro Asn His Asn Glu Phe Asp Phe Glu Phe Leu Gly Asn Thr Thr Gly

100 105 110

Glu Pro Tyr Ile Val Gln Thr Asn Ile Tyr Val Asn Gly Val Gly Asn

115 120 125

Arg Glu Gln Arg Leu Asn Leu Trp Phe Asp Pro Thr Thr Glu Phe His

130 135 140

Thr Tyr Ser Ile Leu Trp Ser Lys Arg Ser Val Val Phe Met Val Asp

145 150 155 160

Glu Thr Pro Ile Arg Val Gln Lys Asn Leu Glu Glu Lys Gly Ile Pro

165 170 175

Phe Ala Lys Asp Gln Ala Met Gly Val Tyr Ser Ser Ile Trp Asn Ala

180 185 190

Asp Asp Trp Ala Thr Gln Gly Gly Leu Val Lys Thr Asp Trp Ser His

195 200 205

Ala Pro Phe Val Ala Ser Tyr Lys Glu Phe Gln Ile Asp Ala Cys Glu

210 215 220

Ile Pro Thr Thr Thr Asp Leu Ser Lys Cys Asn Gly Asp Gln Lys Phe

225 230 235 240

Trp Trp Asp Glu Pro Thr Val Ser Glu Leu Ser Leu His Gln Asn His

245 250 255

Gln Leu Ile Trp Val Arg Ala Asn His Met Ile Tyr Asp Tyr Cys Phe

260 265 270

Asp Ala Thr Arg Phe Pro Val Thr Pro Leu Glu Cys Gln His His Arg

275 280 285

His Leu

290

<210> 41

<211> 912

<212> DNA

<213> 矮慈姑（Sagittaria pygmaea）

<400> 41

atggctctcc gaccgtcttt acataaacag ttcgctctcc tagtggcagc gtctgtgctg 60

gccttttgct gctcggcagc aggccgcagc gtcggcctcg ccccggcctc gccctccagc 120

ttcaacaacg atttcgacat cacctggggt gatggccggg ggaagatcct aaacaacggc 180

cagctcctca gcctctccct ggacaaaacc tccggctcag ggtttcaatc taaaaaccag 240

tacctctttg gcaacatcga catgcaactg aagctcgtcc ccggcaactc ggctggaacg 300

gtcaccgcct attacctatc ctcacagggc cctacccacg acgagatcga ctttgagttc 360

ctcgggaacg tctccggcca gccctacacc ctgcacacca acgttttctc ccaggggaaa 420

ggcaacaggg agcaacagtt ccggctttgg ttcgacccca ccaaggactt ccacacctat 480

tcgatcctct ggaaccccag ccacatcgtc ttctacgtcg acggcacccc catcagagac 540

ttccgcaata acgaggccag aggagttccc ttccccaagg cccagccgat gcggatctat 600

tccagtcttt ggaacgccga cgactgggct acccaaggag gccggatcaa gacagactgg 660

acgcaggcgc cattcacggc gtcctacagg ggattcaagg cggacgcatg tgccgttgga 720

tcaactggat cctcctccaa atgcgccgcc ttgcagacca ccgccggcaa caccaactgg 780

tggatccggc aggagctcga tgccaccggc caggagcgca tgcgctgggt gcagcgcaac 840

cacatgatct acaactactg cacagacgtc aaccgcttcc ctcaggggtt acccactgag 900

tgctccgttg cc 912

<210> 42

<211> 304

<212> PRT

<213> 矮慈姑（Sagittaria pygmaea）

<400> 42

Met Ala Leu Arg Pro Ser Leu His Lys Gln Phe Ala Leu Leu Val Ala

1 5 10 15

Ala Ser Val Leu Ala Phe Cys Cys Ser Ala Ala Gly Arg Ser Val Gly

20 25 30

Leu Ala Pro Ala Ser Pro Ser Ser Phe Asn Asn Asp Phe Asp Ile Thr

35 40 45

Trp Gly Asp Gly Arg Gly Lys Ile Leu Asn Asn Gly Gln Leu Leu Ser

50 55 60

Leu Ser Leu Asp Lys Thr Ser Gly Ser Gly Phe Gln Ser Lys Asn Gln

65 70 75 80

Tyr Leu Phe Gly Asn Ile Asp Met Gln Leu Lys Leu Val Pro Gly Asn

85 90 95

Ser Ala Gly Thr Val Thr Ala Tyr Tyr Leu Ser Ser Gln Gly Pro Thr

100 105 110

His Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn Val Ser Gly Gln Pro

115 120 125

Tyr Thr Leu His Thr Asn Val Phe Ser Gln Gly Lys Gly Asn Arg Glu

130 135 140

Gln Gln Phe Arg Leu Trp Phe Asp Pro Thr Lys Asp Phe His Thr Tyr

145 150 155 160

Ser Ile Leu Trp Asn Pro Ser His Ile Val Phe Tyr Val Asp Gly Thr

165 170 175

Pro Ile Arg Asp Phe Arg Asn Asn Glu Ala Arg Gly Val Pro Phe Pro

180 185 190

Lys Ala Gln Pro Met Arg Ile Tyr Ser Ser Leu Trp Asn Ala Asp Asp

195 200 205

Trp Ala Thr Gln Gly Gly Arg Ile Lys Thr Asp Trp Thr Gln Ala Pro

210 215 220

Phe Thr Ala Ser Tyr Arg Gly Phe Lys Ala Asp Ala Cys Ala Val Gly

225 230 235 240

Ser Thr Gly Ser Ser Ser Lys Cys Ala Ala Leu Gln Thr Thr Ala Gly

245 250 255

Asn Thr Asn Trp Trp Ile Arg Gln Glu Leu Asp Ala Thr Gly Gln Glu

260 265 270

Arg Met Arg Trp Val Gln Arg Asn His Met Ile Tyr Asn Tyr Cys Thr

275 280 285

Asp Val Asn Arg Phe Pro Gln Gly Leu Pro Thr Glu Cys Ser Val Ala

290 295 300

<210> 43

<211> 876

<212> DNA

<213> 大麦（Hordeum vulgare）

<400> 43

atggctcgca tgggggcgtc ggtgctggtg atcctgctcg cctcttgtgc cctggcggcg 60

gcgagcttcg acaaggagtt cgacgttacc tggggtgacg ggcgcggcaa gatcctcaac 120

aatggccagc tgctgatgct ggggctggac aaggtctccg gctccgggtt ccagtccaag 180

cgcgagtacc tcttcggcaa gatcgacatg cagctcaagc tcgtccccgg caactccgcc 240

ggcaccgtca ccgcatatta cctgtcgtcg cagggtccga cgcacgacga gatcgacttc 300

gagttcctgg gcaacgtcac cggcgagcca tacacgctgc acaccaacgt gttcacgcag 360

gggcagggcc agcgggagca gcagttccgc ctctggttcg atcctaccaa cgacttccac 420

acctactcca tcctctggaa cccgaagcac atcatcttct tggttgacga catgccgatc 480

agggacttca ggaacatgga gggaaagggg atcgccttcc ccaagaacca gcctatgcgg 540

ctgtactcca gcctctggaa cgccgacgac tgggcgacac agggtggccg cgtcaagacc 600

gactggtccc acgctccgtt ttccgcctcc taccgcggct tcaaggccga cgcgtgcgtg 660

gtgaccgtag gtggccggcc gcgctgcggc gccagcatcg gcacggacgc ggccccaggg 720

accggcggcg cggccgcggt cggcgactgg tacaaccaag agctggatct tacgcggcag 780

cagcgcatgc gttgggtgca gagcaattac atgatctaca actactgcac tgaccccaag 840

cgcgtcgcca agggcgtccc tgccgagtgc tccatg 876

<210> 44

<211> 292

<212> PRT

<213> 大麦（Hordeum vulgare）

<400> 44

Met Ala Arg Met Gly Ala Ser Val Leu Val Ile Leu Leu Ala Ser Cys

1 5 10 15

Ala Leu Ala Ala Ala Ser Phe Asp Lys Glu Phe Asp Val Thr Trp Gly

20 25 30

Asp Gly Arg Gly Lys Ile Leu Asn Asn Gly Gln Leu Leu Met Leu Gly

35 40 45

Leu Asp Lys Val Ser Gly Ser Gly Phe Gln Ser Lys Arg Glu Tyr Leu

50 55 60

Phe Gly Lys Ile Asp Met Gln Leu Lys Leu Val Pro Gly Asn Ser Ala

65 70 75 80

Gly Thr Val Thr Ala Tyr Tyr Leu Ser Ser Gln Gly Pro Thr His Asp

85 90 95

Glu Ile Asp Phe Glu Phe Leu Gly Asn Val Thr Gly Glu Pro Tyr Thr

100 105 110

Leu His Thr Asn Val Phe Thr Gln Gly Gln Gly Gln Arg Glu Gln Gln

115 120 125

Phe Arg Leu Trp Phe Asp Pro Thr Asn Asp Phe His Thr Tyr Ser Ile

130 135 140

Leu Trp Asn Pro Lys His Ile Ile Phe Leu Val Asp Asp Met Pro Ile

145 150 155 160

Arg Asp Phe Arg Asn Met Glu Gly Lys Gly Ile Ala Phe Pro Lys Asn

165 170 175

Gln Pro Met Arg Leu Tyr Ser Ser Leu Trp Asn Ala Asp Asp Trp Ala

180 185 190

Thr Gln Gly Gly Arg Val Lys Thr Asp Trp Ser His Ala Pro Phe Ser

195 200 205

Ala Ser Tyr Arg Gly Phe Lys Ala Asp Ala Cys Val Val Thr Val Gly

210 215 220

Gly Arg Pro Arg Cys Gly Ala Ser Ile Gly Thr Asp Ala Ala Pro Gly

225 230 235 240

Thr Gly Gly Ala Ala Ala Val Gly Asp Trp Tyr Asn Gln Glu Leu Asp

245 250 255

Leu Thr Arg Gln Gln Arg Met Arg Trp Val Gln Ser Asn Tyr Met Ile

260 265 270

Tyr Asn Tyr Cys Thr Asp Pro Lys Arg Val Ala Lys Gly Val Pro Ala

275 280 285

Glu Cys Ser Met

290

<210> 45

<211> 849

<212> DNA

<213> 大豆（Glycine max）

<400> 45

atggctccta gttctgctca caacaatggg ttctatgtgc ttatgctagt tgggatagtg 60

gttagcacta tggttgctac ctgtgctggt agcttctacc aagactttga tctaacatgg 120

ggtggtgacc gtgctaagat attcaatggt ggccagcttc tatcactttc cctagacaaa 180

gtctctggct ctggcttcaa atcaaagaaa gaatacctat ttgggaggat tgatatgcag 240

ctcaagctcg ttgccggcaa ctctgctggc actgtcactg cttactactt gtcatcccaa 300

gggccaacac atgatgagat tgatttcgag tttttgggaa acctaagtgg ggacccttat 360

attctccaca caaacatctt cacccaaggc aaaggcaaca gggagcaaca gttctatctc 420

tggttcgacc ccaccagaaa cttccacact tactctatca tttggaagcc ccagcacatc 480

atattcttgg ttgataacac acccataagg gtattcaaga atgctgaacc tcttggtgtt 540

ccttttccaa agaaccagcc catgagaatc tattctagcc tctggaatgc tgatgactgg 600

gccaccagag gaggattggt gaaaactgat tggtccaaag caccctttac agcatactac 660

cgcaatttca aggccattga gttctcatcc aagtcttcca tttcaaattc tggggctgaa 720

tatgaggcaa atgagcttga tgcttatagc agaagaagac tgagatgggt tcagaagtac 780

ttcatgatct ataactactg cagtgatctc aagcgattcc cacaaggtct tcctgctgaa 840

tgtaaacgt 849

<210> 46

<211> 283

<212> PRT

<213> 大豆（Glycine max）

<400> 46

Met Ala Pro Ser Ser Ala His Asn Asn Gly Phe Tyr Val Leu Met Leu

1 5 10 15

Val Gly Ile Val Val Ser Thr Met Val Ala Thr Cys Ala Gly Ser Phe

20 25 30

Tyr Gln Asp Phe Asp Leu Thr Trp Gly Gly Asp Arg Ala Lys Ile Phe

35 40 45

Asn Gly Gly Gln Leu Leu Ser Leu Ser Leu Asp Lys Val Ser Gly Ser

50 55 60

Gly Phe Lys Ser Lys Lys Glu Tyr Leu Phe Gly Arg Ile Asp Met Gln

65 70 75 80

Leu Lys Leu Val Ala Gly Asn Ser Ala Gly Thr Val Thr Ala Tyr Tyr

85 90 95

Leu Ser Ser Gln Gly Pro Thr His Asp Glu Ile Asp Phe Glu Phe Leu

100 105 110

Gly Asn Leu Ser Gly Asp Pro Tyr Ile Leu His Thr Asn Ile Phe Thr

115 120 125

Gln Gly Lys Gly Asn Arg Glu Gln Gln Phe Tyr Leu Trp Phe Asp Pro

130 135 140

Thr Arg Asn Phe His Thr Tyr Ser Ile Ile Trp Lys Pro Gln His Ile

145 150 155 160

Ile Phe Leu Val Asp Asn Thr Pro Ile Arg Val Phe Lys Asn Ala Glu

165 170 175

Pro Leu Gly Val Pro Phe Pro Lys Asn Gln Pro Met Arg Ile Tyr Ser

180 185 190

Ser Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly Leu Val Lys

195 200 205

Thr Asp Trp Ser Lys Ala Pro Phe Thr Ala Tyr Tyr Arg Asn Phe Lys

210 215 220

Ala Ile Glu Phe Ser Ser Lys Ser Ser Ile Ser Asn Ser Gly Ala Glu

225 230 235 240

Tyr Glu Ala Asn Glu Leu Asp Ala Tyr Ser Arg Arg Arg Leu Arg Trp

245 250 255

Val Gln Lys Tyr Phe Met Ile Tyr Asn Tyr Cys Ser Asp Leu Lys Arg

260 265 270

Phe Pro Gln Gly Leu Pro Ala Glu Cys Lys Arg

275 280

<210> 47

<211> 849

<212> DNA

<213> 黄瓜（Cucumis sativus）

<400> 47

atggcttcca caactctgtt tctcacgctt cttttctctg cttccctaat tgccatctct 60

tcggctaact tcaaccaaga ttttcaaatc acttggggag atggtcgagc aaagattctc 120

aacaatggtg aacttctaac tctgtccctt gacaaggcct ctggctctgg cttccagtct 180

caaaacgagt acttgtttgg aaagattgat atgcaactca agcttgtggc tggcaattct 240

gctggcactg tcactgctta ttatttgtct tcgaaaggat ctacatggga tgagattgac 300

tttgagttct tggggaattt gagtggtgac ccttacactc tccataccaa tgtgtttagc 360

caagggaaag gcaacagaga acaacagttc catctttggt ttgaccccac tgctgatttc 420

cacacctatt ccattctttg gaaccccaat cgtattatat tttcggtgga cggtactccg 480

ataagagaat tcaagaactg ggaatcgaac ggcgtgccat ttccgaagga ccagccaatg 540

agaatatact cgagcttatg gaacgcggac gattgggcaa caagaggagg gctggtgaag 600

acggactgga caaaggctcc tttcactgct tcctacaaaa acttcaaagc cgaagcctgc 660

gtttggtccg gggggaaatc ttcttgcagc ccctcgccgg cggggtcgag caactcatgg 720

ctgtcccaag agatggactc tgcaagtcaa gagagactaa aatgggtgca aaagaattat 780

atgatttaca actattgtac ggacaccaag aggtttcctc aaggcctccc tacagagtgc 840

aacttgcca 849

<210> 48

<211> 283

<212> PRT

<213> 黄瓜（Cucumis sativus）

<400> 48

Met Ala Ser Thr Thr Leu Phe Leu Thr Leu Leu Phe Ser Ala Ser Leu

1 5 10 15

Ile Ala Ile Ser Ser Ala Asn Phe Asn Gln Asp Phe Gln Ile Thr Trp

20 25 30

Gly Asp Gly Arg Ala Lys Ile Leu Asn Asn Gly Glu Leu Leu Thr Leu

35 40 45

Ser Leu Asp Lys Ala Ser Gly Ser Gly Phe Gln Ser Gln Asn Glu Tyr

50 55 60

Leu Phe Gly Lys Ile Asp Met Gln Leu Lys Leu Val Ala Gly Asn Ser

65 70 75 80

Ala Gly Thr Val Thr Ala Tyr Tyr Leu Ser Ser Lys Gly Ser Thr Trp

85 90 95

Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn Leu Ser Gly Asp Pro Tyr

100 105 110

Thr Leu His Thr Asn Val Phe Ser Gln Gly Lys Gly Asn Arg Glu Gln

115 120 125

Gln Phe His Leu Trp Phe Asp Pro Thr Ala Asp Phe His Thr Tyr Ser

130 135 140

Ile Leu Trp Asn Pro Asn Arg Ile Ile Phe Ser Val Asp Gly Thr Pro

145 150 155 160

Ile Arg Glu Phe Lys Asn Trp Glu Ser Asn Gly Val Pro Phe Pro Lys

165 170 175

Asp Gln Pro Met Arg Ile Tyr Ser Ser Leu Trp Asn Ala Asp Asp Trp

180 185 190

Ala Thr Arg Gly Gly Leu Val Lys Thr Asp Trp Thr Lys Ala Pro Phe

195 200 205

Thr Ala Ser Tyr Lys Asn Phe Lys Ala Glu Ala Cys Val Trp Ser Gly

210 215 220

Gly Lys Ser Ser Cys Ser Pro Ser Pro Ala Gly Ser Ser Asn Ser Trp

225 230 235 240

Leu Ser Gln Glu Met Asp Ser Ala Ser Gln Glu Arg Leu Lys Trp Val

245 250 255

Gln Lys Asn Tyr Met Ile Tyr Asn Tyr Cys Thr Asp Thr Lys Arg Phe

260 265 270

Pro Gln Gly Leu Pro Thr Glu Cys Asn Leu Pro

275 280

<210> 49

<211> 870

<212> DNA

<213> 水稻（Oryza sativa）

<400> 49

atggggcaac ctagggctca actcctaccc tccatgtcca tggcagcttt gtatctcatc 60

ctagccacct ccccagtaat cagcgacatg accgacagcc ttgacatgct gtggggcaat 120

acacaggtgc tctatgacag cactggccac caaattgtat cactgtccct tgaccgctgg 180

actacttctg cattccgctc aaagactaag tatctctttg cgaggattga catggacatc 240

aagcttgttg ccaaggactc agccggcact gtcaccacat tatatatgat aactgagggg 300

ctgtgggaca tacatgatga gattgatctc gagttcttgg ggaacaccac cggtgagccc 360

tacaccttgc acactaacat ctatgccaga ggaacaggtg gccgagaaaa gcagtaccgg 420

ctttggtttg atccaacaga agacttccat acctacacca tcatctggaa cccgcagatg 480

atcttaatac ttgttgatgg cacaccaatt cggcagatga agaatcagct aaggaatgat 540

atacccttcc cgctatatca accaatgagg ctgtacgcca gcatctggga tgccgatgac 600

tgggcaacgc agggtgggcg tatcaaaacc gactggtctc aagcaccatt taccgcattc 660

ttccggaact accaagctaa cgcctgcatt ccgtacaaaa ctgcctggat ttgcagccaa 720

gggtctaatg acagcagctg gtttacccag gatttggatg aggaagggaa gcagaaactt 780

aaggacgtag atgataacta caagatttat gattactgca ctgactcaag gaggtaccca 840

aatgggtatc ccccagagtg cgggtcacag 870

<210> 50

<211> 290

<212> PRT

<213> 水稻（Oryza sativa）

<400> 50

Met Gly Gln Pro Arg Ala Gln Leu Leu Pro Ser Met Ser Met Ala Ala

1 5 10 15

Leu Tyr Leu Ile Leu Ala Thr Ser Pro Val Ile Ser Asp Met Thr Asp

20 25 30

Ser Leu Asp Met Leu Trp Gly Asn Thr Gln Val Leu Tyr Asp Ser Thr

35 40 45

Gly His Gln Ile Val Ser Leu Ser Leu Asp Arg Trp Thr Thr Ser Ala

50 55 60

Phe Arg Ser Lys Thr Lys Tyr Leu Phe Ala Arg Ile Asp Met Asp Ile

65 70 75 80

Lys Leu Val Ala Lys Asp Ser Ala Gly Thr Val Thr Thr Leu Tyr Met

85 90 95

Ile Thr Glu Gly Leu Trp Asp Ile His Asp Glu Ile Asp Leu Glu Phe

100 105 110

Leu Gly Asn Thr Thr Gly Glu Pro Tyr Thr Leu His Thr Asn Ile Tyr

115 120 125

Ala Arg Gly Thr Gly Gly Arg Glu Lys Gln Tyr Arg Leu Trp Phe Asp

130 135 140

Pro Thr Glu Asp Phe His Thr Tyr Thr Ile Ile Trp Asn Pro Gln Met

145 150 155 160

Ile Leu Ile Leu Val Asp Gly Thr Pro Ile Arg Gln Met Lys Asn Gln

165 170 175

Leu Arg Asn Asp Ile Pro Phe Pro Leu Tyr Gln Pro Met Arg Leu Tyr

180 185 190

Ala Ser Ile Trp Asp Ala Asp Asp Trp Ala Thr Gln Gly Gly Arg Ile

195 200 205

Lys Thr Asp Trp Ser Gln Ala Pro Phe Thr Ala Phe Phe Arg Asn Tyr

210 215 220

Gln Ala Asn Ala Cys Ile Pro Tyr Lys Thr Ala Trp Ile Cys Ser Gln

225 230 235 240

Gly Ser Asn Asp Ser Ser Trp Phe Thr Gln Asp Leu Asp Glu Glu Gly

245 250 255

Lys Gln Lys Leu Lys Asp Val Asp Asp Asn Tyr Lys Ile Tyr Asp Tyr

260 265 270

Cys Thr Asp Ser Arg Arg Tyr Pro Asn Gly Tyr Pro Pro Glu Cys Gly

275 280 285

Ser Gln

290

<210> 51

<211> 876

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA序列

<400> 51

atgggctcgt ccctctggac ttgtttgatc ctcctctcct tggcatcggc atccttcgca 60

gcgaaccctc gaactccgat cgatgtgcct ttcggacgga actacgtgcc gacatgggca 120

ttcgaccaca ttaagtattt gaacggaggc tcggagatcc agttgcatct cgacaagtac 180

accggcactg gtttccagtc gaagggctcc tacttgttcg gacatttctc catgtacatc 240

aaattggtgc ctggtgactc ggcaggaact gtcaccgcat tctacctctc gtcgacaaac 300

gcagagcatg acgaaatcga cttcgagttc ctcggcaaca ggacaggaca gccgtacatc 360

ctccagacca acgtcttcac aggaggcaaa ggtgatcggg aacagcggat ctacttgtgg 420

ttcgatccca caacccagta ccataggtac tcggtgctct ggaacatgta tcagatcgtc 480

ttctacgtcg acgattatcc gatccgagtg ttcaagaact ccaacgactt gggcgtcaaa 540

ttccccttca accagcccat gaagatttac aactcgttgt ggaacgccga cgattgggca 600

accaggggtg gtctcgagaa gacagattgg tcgaaagcac ctttcatcgc gtcgtacaag 660

ggtttccaca tcgacggatg tgaagcctcc gtgaacgcca agttctgtga cacccagggc 720

aaacgatggt gggatcagcc ggaattccgg gatttggatg cagcccagtg gcagaagctc 780

gcgtgggtca ggaacaagta caccatctat aactactgta ccgatcggaa acgatattcg 840

caggtgcctc ccgagtgtac acgcgatagg gacatc 876

<210> 52

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 52

acatgtcttt gataagctag cgggccgcat catgta 36

<210> 53

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 53

tacatgatgc ggcccgctag cttatcaaag acatgt 36

<210> 54

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 54

ttaatcgcct tgcagcacac cgcttcctcg ctcactgact c 41

<210> 55

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 55

acaataaccc tgataaatgc ggaacaacac tcaaccctat ctcggtc 47

<210> 56

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 56

agatagggtt gagtgttgtt ccgcatttat cagggttatt gtctcatgag cgg 53

<210> 57

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 57

ttctacacga aggaaagagg aggagagagt tgaacctgga cg 42

<210> 58

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 58

aggttcaact ctctcctcct ctttccttcg tgtagaagac cagacag 47

<210> 59

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 59

tcagtgagcg aggaagcggt gtgctgcaag gcgattaagt tgg 43

<210> 60

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 60

ttcctcaatc ctctatatac acaactggcc atgggctcgt ccctctggac 50

<210> 61

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 61

agctcgctag agtcgaccta gatgtcccta tcgcgtgtac actcg 45

<210> 62

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 62

taggtcgact ctagcgagct cgagatc 27

<210> 63

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 63

catggccagt tgtgtatata gaggattgag gaaggaagag 40

<210> 64

<211> 11101

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA序列

<400> 64

ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttca gtacccgggt 60

ataagctagc ttccgttaaa ttgccgtcgt cagccgttaa attaccgatt aatcccgata 120

aatttccgag atctccgtta aattgccgtt cgcagccgtt aaattaccgg ggacgaccga 180

taaatttccg cgatgaattc atggtgtttt gatcatttta aatttttata tggcgggtgg 240

tgggcaactc gcttgcgcgg gcaactcgct taccgattac gttagggctg atatttacgt 300

aaaaatcgtc aagggatgca agaccaaacc gttaaatttc cggagtcaac agcatccaag 360

cccaagtcct tcacggagaa accccagcgt ccacatcacg agcgaaggac cacctctagg 420

catcggacgc accatccaat tagaagcagc aaagcgaaac agcccaagaa aaaggtcggc 480

ccgtcggcct tttctgcaac gctgatcacg ggcagcgatc caaccaacac cctccagagt 540

gactaggggc ggaaatttat cgggattaat ttccactcaa ccacaaatca cagtcgtccc 600

cggtaattta acggctgcag acggcaattt aacggcttct gcgaatcgct tggattcccc 660

gcccctggcc gtagagctta aagtatgtcc cttgtcgatg cgatgtatca caacatataa 720

atactggcaa gggatgccat gcttggagtt tccaactcaa tttacctcta tccacacttc 780

tcttccttcc tcaatcctct atatacacaa ctggggatcc accatgttct cggcaggcca 840

caagattaag ggtacagtcg tcctcatgcc taaaaacgag ttggaagtga accccgatgg 900

ctccgcagtc gataacctca acgcattcct cggacgttcg gtgtcgctcc agctcatctc 960

cgcgaccaaa gccgacgccc acggtaaggg aaaggtgggc aaggacacgt tcttggaagg 1020

tatcaacact tcgctcccta ccttgggagc aggagagtcc gcattcaaca ttcacttcga 1080

gtgggacggt tcgatgggca ttcccggagc gttctatatc aagaactata tgcaggtgga 1140

gttcttcttg aagtccttga ccttggaggc aatctcgaac cagggtacca tccgtttcgt 1200

gtgtaactcg tgggtctaca acaccaagct ctacaaatcc gtgcggatct tcttcgcgaa 1260

ccacacttac gtcccttcgg agacacctgc ccctttggtg tcgtaccgcg aggaggaatt 1320

gaagtccctc cgtggtaacg gtactggaga aaggaaggag tatgatagga tctacgacta 1380

cgacgtctat aacgatttgg gtaaccccga caaatcggaa aagttggcac gtcctgtgtt 1440

gggaggctcc tccaccttcc cctaccctcg acgcggccgc acgggacgcg gtcccactgt 1500

caccgatccg aacacagaga agcagggcga agtcttctac gtgcccaggg acgaaaacct 1560

cggccacttg aagtcgaagg atgcattgga gattggaacc aagtccctct cccagatcgt 1620

ccagcctgca ttcgaatcgg cgttcgattt gaaatcgacg cccatcgagt tccactcgtt 1680

ccaggacgtc catgacttgt atgaaggtgg tatcaaattg cctcgggacg tcatctccac 1740

cattatcccc ctccccgtga tcaaggaatt gtaccgcacc gacggccagc atattctcaa 1800

attcccccag ccgcacgtcg tccaggtctc gcagtccgca tggatgacag atgaggaatt 1860

cgcgagggaa atgattgcag gtgtcaaccc gtgtgtcatc cgaggcttgg aggagttccc 1920

tcctaagtcc aacctcgatc ctgccatcta tggagaccag tcctccaaga ttacagccga 1980

ttccctcgat ctcgacggtt atactatgga tgaagcactc ggttccaggc gattgttcat 2040

gctcgattat catgatatct tcatgcccta tgtgcgccag atcaaccagt tgaactcggc 2100

aaaaacatat gcaacgagga cgatcctctt cctccgagaa gacggcacac tcaagcctgt 2160

ggcaatcgag ctctcgctcc cccattccgc aggcgatctc tccgcagccg tgtcgcaggt 2220

ggtgttgcct gcaaaagaag gagtggagtc gaccatctgg ctcttggcca aagcatatgt 2280

gattgtgaac gattcctgtt atcaccagct catgtcgcat tggctcaaca ctcacgcggc 2340

aatggaaccc ttcgtgatcg ccacgcaccg gcacctctcg gtgctccacc cgatctacaa 2400

gctcctcact ccccactacc gtaacaacat gaacattaac gccttggcac ggcagtcgtt 2460

gatcaacgcg aacggcatca ttgagacaac gttcctcccc tccaagtact ccgtcgaaat 2520

gtcgtccgca gtctacaaaa actgggtctt caccgaccag gcgttgcctg ccgacttgat 2580

caaacgaggc gtcgcaatca aagatccctc cactcctcat ggcgtccgcc tcttgatcga 2640

ggactacccc tacgcagcgg acggattgga aatctgggca gccatcaaga cctgggtgca 2700

ggaatacgtc cctttgtact atgcgaggga cgatgatgtc aaaaacgact cggaactcca 2760

gcattggtgg aaggaggcag tggaaaaggg ccatggagat ctcaaggata aaccctggtg 2820

gcctaagctc cagaccttgg aggacctcgt cgaagtgtgt ttgatcatta tctggatcgc 2880

atccgcgttg catgcagccg tgaacttcgg acagtatccc tatggaggcc tcatcatgaa 2940

ccgtcccacc gcatccagga ggctcctccc cgaaaaagga acacccgaat acgaagaaat 3000

gatcaacaac cacgaaaagg catacctccg gaccatcact tccaaactcc cgaccttgat 3060

ctcgctctcc gtgatcgaga ttttgtcgac acatgcgtcg gacgaggtct atttgggtca 3120

gcgggataac ccgcactgga catccgattc caaggccctc caggcgttcc agaagttcgg 3180

caacaagctc aaggagatcg aggagaaact cgtgaggcgg aacaacgacc cttccctcca 3240

gggaaaccgg ttgggacctg tccagctccc gtatacgttg ctctacccct cctcggaaga 3300

aggcctcact ttcaggggta tccccaactc gatttccatc tgactcgaga tctagagggt 3360

gactgacacc tggcggtaga caatcaatcc atttcgctat agttaaagga tggggatgag 3420

ggcaattggt tatatgatca tgtatgtagt gggtgtgcat aatagtagtg aaatggaagc 3480

caagtcatgt gattgtaatc gaccgacgga attgaggata tccggaaata cagacaccgt 3540

gaaagccatg gtctttcctt cgtgtagaag accagacaga cagtccctga tttacccttg 3600

cacaaagcac tagaaaatta gcattccatc cttctctgct tgctctgctg atatcactgt 3660

cattcaatgc atagccatga gctcatctta gatccaagca cgtaattcca tagccgaggt 3720

ccacagtgga gcagcaacat tccccatcat tgctttcccc aggggcctcc caacgactaa 3780

atcaagagta tatctctacc gtccaataga tcgtcttcgc ttcaaaatct ttgacaattc 3840

caagagggtc cccatccatc aaacccagtt caataatagc cgagatgcat ggtggagtca 3900

attaggcagt attgctggaa tgtcggggcc agttggccgg gtggtcattg gccgcctgtg 3960

atgccatctg ccactaaatc cgatcattga tccaccgccc acgaggcgcg tctttgcttt 4020

ttgcgcggcg tccaggttca actctctctt aattaaatag cgacaagccg aacggcaccg 4080

gcaggtacaa tggttcgctg tacttgcttg cgcaagcggg tctttgggga ttgagcgcat 4140

ttggtgttgc aaaggatttg atgtaaatgt agtcgacatc ttagcacaga ggggagagtt 4200

gataaaatgt ggtctgtttg aatgatagtc gggttcgtga cctatattcg tgatagtgga 4260

gataggtctg cgcctatctt atcgggccgg agcaaaaatt ccaccgcagc ggggtgagtt 4320

ttcgttatac agccatccca cttccagctt caaattgtca gtttaatcca gcccaattca 4380

atcattggag aaccggtttt atgtcttcga agtcccacct cccctacgca attcgcgcaa 4440

ccaaccatcc caacccttta acatctaaac tcttctccat cgccgaggag aagaaaacca 4500

acgtcaccgt ctccgcagac gttactactt ccgccgagct cctcgatctt gctgaccgcc 4560

taggccccta tatcgcagtt ctgaaaaccc acatcgacat cctcaccgat ctcaccccgt 4620

cgaccctttc ctcgctccaa tccctcgcga caaagcacaa cttcctcatc tttgaggacc 4680

gcaagttcat cgacatcggc aacaccgtgc aaaagcagta ccacggtggc gctctccgca 4740

tctccgaatg ggcacacatc atcaactgcg ccatcctgcc gggcgaaggg atcgtcgagg 4800

ccctcgcaca gacaaccaag tctcctgact ttaaagacgc gaatcaacga ggtctcctga 4860

ttcttgccga gatgacgagt aagggatctc ttgcgacagg ggagtacacg gcacgctcgg 4920

ttgagtacgc gcggaagtat aaggggtttg tgatgggatt cgtgagtaca agggcgttga 4980

gtgaggtgct gcccgaacag aaagaggaga gcgaggattt tgtcgtcttt acgactgggg 5040

tgaatctgtc ggataagggg gataagctgg ggcagcagta tcagacacct gggtcggcgg 5100

ttgggcgagg tgcggacttt atcattgcgg gtaggggcat ctataaggcg gacgatccag 5160

tcgaggcggt tcagaggtac cgggaggaag gctggaaagc ttacgagaaa agagttggac 5220

tttgagggtg actgacacct ggcggtagac aatcaatcca tttcgctata gttaaaggat 5280

ggggatgagg gcaattggtt atatgatcat gtatgtagtg ggtgtgcata atagtagtga 5340

aatggaagcc aagtcatgtg attgtaatcg accgacggaa ttgaggatat ccggaaatac 5400

agacaccgtg aaagccatgg tctttccttc gtgtagaaga ccagacagac agtccctgat 5460

ttacccttgc acaaagcact agaaaattag cattccatcc ttctctgctt gctctgctga 5520

tatcactgtc attcaatgca tagccatgag ctcatcttag atccaagcac gtaattccat 5580

agccgaggtc cacagtggag cagcaacatt ccccatcatt gctttcccca ggggcctccc 5640

aacgactaaa tcaagagtat atctctaccg tccaatagat cgtcttcgct tcaaaatctt 5700

tgacaattcc aagagggtcc ccatccatca aacccagttc aataatagcc gagatgcatg 5760

gtggagtcaa ttaggcagta ttgctggaat gtcggggcca gttggccggg tggtcattgg 5820

ccgcctgtga tgccatctgc cactaaatcc gatcattgat ccaccgccca cgaggcgcgt 5880

ctttgctttt tgcgcggcgt ccaggttcaa ctctctcctc taggttgaag ttcctattcc 5940

gagttcctat tcttcaaata gtataggaac ttcaactagc tagtgcatgc gtacgatttt 6000

gacatttgct ccattgtcga ggatggatgg aacgagcggc gtgcgccacg aaagtgaggc 6060

tattgcctat cagctctttg ctacattccg gaaacaaaca tccctttttg tgaattatct 6120

acgcaactta gatggcgtga acgcatcttc aaagtctttc ggcaggtccg gcacgacttt 6180

tgcatccaga gaagcgccta catgtgtatt cgaccacctc ctagcgcgct tggatatgag 6240

gaaatattac tgagagtcga aaacaagctc caccgcacca gctcttcttg gagttttata 6300

ttaaagaata ttcccagctc gttgtattat tctttttcta ccgtgctaat gtatcaagga 6360

ctttggtacc tattaacgtt attattcgtg tgctattccc aaacataacc ctgtatatgt 6420

ttcgaacgcc gttatgaccc atgtcttaca tactcattaa gtcattccct tggataatct 6480

cgactcagat gcggcggttg atgtaggagg agaggtaatc gaggacctcc tgggagatga 6540

tgccgttcca ggcggggtag cggatggagc cctcggcgga gcccttgagc tgctcgatat 6600

gctgccactc ctcgatgggg ttggtctcat ccttgagggc gatcatctcc ttggagatgg 6660

gatcgtaggc gtagtagcgg gagactagtg cgaagtaatg atcggggatg gcggtgatct 6720

gatgggtgta ggtggtgcgg gcgacggcgg aggcgcgctt atcggaccag ttgccgacga 6780

cgttggtgag ctcggtgagg cccttcatgg agaggaagga ggtcatgaga tggcggccga 6840

tatgggactt ggggccgttc ttgatggcga agatggagta gggggcgttc ttcttgaggg 6900

ccttgttgta ggagcggacg aggttatcct tgaggagctg gtactcctgc ttgttggagg 6960

aggagttgcc ggtgcggttg acgcgcttga ggacgggctc ggagttgcgg aggaactcat 7020

cgaggtagac gaggggatcg atgcggccgc gggcggagaa gaagtagata tggcgggaga 7080

cggaggtctt ggtctcggtg acgaggcact ggatgatgac gccgaggtac ttgttctgga 7140

cgagcttgaa ggacttggga tcgacgttct tgatatcgga gaagcggccg cagttgatga 7200

aggtggcgag gaagaggaac tggtagaggg tcttggtctt ggtgaagcgg gaggtgtact 7260

cgaaggagtt gaggatcttc tcggtgatct cccagatgga ctcgccctcg gagaggaggg 7320

ccttgagcat cttcttggaa tgggagttgc ccttatcggc ctcctcggag gactcgaact 7380

ggagctggag ggaggagacg atatcggtga tatcggactg atgcttctgg ccgtagtagg 7440

ggatgatggt gaactcccag gcggggatga gcttcttgag ggaggcctcc aggatggtgg 7500

ccttctgggt cttgtacttg aactggaggg acttgttgac gatatcgaag gagagggagt 7560

tggagatgat ggtgttgtag gacatgaagg tggcgcgctt gatggcggtg ccgttatggg 7620

tgatcatcca gcagaggtag gtgagctcgg cggcgcagag ggcgatcttc tcgccggagg 7680

ggcgctcgaa gcgctcgacg aactggcgga cgaggacctt ggggggggtc ttgcagagga 7740

tatcgaactg gggcatggtg ctcagatact acggctgatc gcgtagaggt actgagcaaa 7800

acagatgtca gtaaggagaa gagttgaatg aatggaagaa gagtaggaaa ggaggtatgg 7860

gggaaagata tacgtactga tgcggacgaa gagagaaaga aggaaaaaag ttgtgggagg 7920

ggaaggaggg ggaatcctta tatggagggg caagcgagaa ggcgaattag tgggcgggct 7980

taagccctcg accgccgccc ttatcattgg acatggaggg gtaatgcccc caccacgcat 8040

gtgcgggacc gacgcagaat ctgcacggcg gagtctcttc cagactgttg acttttgggc 8100

gatgactctt gttgctgcgg ccttttgggt acaccaacct cgttgatctt gtttccttgg 8160

ttctctttcg ctcggagacc cgaccatgac cccaccatca gtcactatcc tgcctcgtcg 8220

ataaaaattt tttcttccct ctgattgtta catagtatgt ttccaccttt ccggtggatt 8280

tcggacagtc aaactgggca tcaacgcagt ggtgggctgc ttcgtttgct gcgtgttgta 8340

cttgtttgca tttgaacccc gcggtcgttc gagtccttaa ttggtccgct cccggtcaac 8400

acccaagcag ctgtggcccg gccgagtggc gcctgtctgg tccacagtaa gcttggcgta 8460

atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 8520

acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 8580

aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 8640

atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 8700

gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 8760

ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 8820

aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 8880

ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 8940

aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 9000

gaccctgccg cttaccggat acctgtccgc ctttttccct tcgggaagcg tggcgctttc 9060

tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 9120

tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 9180

gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 9240

cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 9300

cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 9360

agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 9420

caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 9480

ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 9540

aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 9600

tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 9660

agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 9720

gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 9780

accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 9840

tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 9900

tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 9960

acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 10020

atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 10080

aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 10140

tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 10200

agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 10260

gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 10320

ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 10380

atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 10440

tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 10500

tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 10560

tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 10620

cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 10680

ctttcgtctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga 10740

gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc 10800

agcgggtgtt ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact 10860

gagagtgcac catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat 10920

caggcgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc 10980

ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac 11040

gccagggttt tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac 11100

c 11101

<210> 65

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 65

accgggagga aggctggaaa gcttacgaga aaagagttgg actttgaggg 50

<210> 66

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 66

tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 40

<210> 67

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 67

tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 40

<210> 68

<211> 68

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 68

tatactttct agagaatagg aactcggaat aggaacttca aggaacaaca ctcaacccta 60

tctcggtc 68

<210> 69

<211> 67

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 69

tccgagttcc tattctctag aaagtatagg aacttcgcat ttatcagggt tattgtctca 60

tgagcgg 67

<210> 70

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 70

tctagatctc gagtcagatg tccctatcgc gtgtacactc g 41

<210> 71

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 71

acacgcgata gggacatctg actcgagatc tagagggtga ctgac 45

<210> 72

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 人工DNA引物

<400> 72

aactcttttc tcgtaagctt tccagccttc ctcccggtac 40

Claims

1.一种木葡聚糖内糖基转移酶变体，该变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个位置处的取代，其中该变体具有木葡聚糖内糖基转移酶活性，并且其中该变体与SEQ IDNO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽序列具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少95％、至少96％、至少97％、至少98％、或至少99％、但小于100％序列一致性。

2.如权利要求1所述的变体，该变体是亲本木葡聚糖内糖基转移酶的变体，其中该亲本选自下组，该组由以下各项组成：

(a)一种多肽，该多肽与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽具有至少60％，例如，至少65％、至少70％、至少60％、至少80％、至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列一致性；

(b)一种由以下多核苷酸编码的多肽，该多核苷酸在低严格条件下、中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与(i)SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列或者(ii)(i)的全长互补体杂交；

(c)一种由以下多核苷酸编码的多肽，该多核苷酸与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列具有至少60％，例如，至少65％、至少70％、至少60％、至少80％、至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列一致性；以及

3.如权利要求2所述的变体，该变体与该亲本木葡聚糖内糖基转移酶的氨基酸序列具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％序列一致性。

4.如权利要求1-3中任一项所述的变体，其中取代的数目是1-17个，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个取代。

5.如权利要求1-4中任一项所述的变体，该变体包括选自下组的一个或多个取代，该组由以下各项组成：I10A；P30E；A40G；S51T；I53A,V；Y60S；T99E,N；E102G；Q117E；K130R；R136W；Y157H；Y162C；N175S,G,Q；F183I；A254E；以及S280G,E。

6.如权利要求5所述的变体，该变体包括A40G+N175S；A40G+F183I；N175G+S280G；A40G+I53A+N175S；A40G+N175S+F183I；I10A+I53A+E102G；A40G+E102G+Q117E；N175Q+A254E+S280E；P30E+S51T+Y60S+T99N；A40G+T99E+E102G+K130R；或I53V+R136W+Y157H+Y162C+N175S或由其组成。

7.如权利要求1-6中任一项所述的变体，该变体相对于该亲本具有增加的表达产量，其中相对于该亲本，该变体的表达产量是至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加。

8.一种编码如权利要求1-7中任一项所述的变体的分离的多核苷酸。

9.一种核酸构建体或表达载体，包含如权利要求8所述的多核苷酸。

10.一种重组宿主细胞，其包含如权利要求8所述的多核苷酸。

11.一种产生木葡聚糖内糖基转移酶变体的方法，该方法包括：

(a)在适合于表达该变体的条件下培养如权利要求10所述的重组宿主细胞；并且任选地

(b)回收该变体。

12.一种用于获得木葡聚糖内糖基转移酶变体的方法，该方法包括将与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个位置处的取代引入亲本木葡聚糖内糖基转移酶，其中该变体具有木葡聚糖内糖基转移酶活性；并且任选地回收该变体。

13.一种增加木葡聚糖内糖基转移酶的表达产量的方法，该方法包括将与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个位置处的取代引入亲本木葡聚糖内糖基转移酶以产生变体，其中该变体的表达产量相对于亲本是增加的；并且任选地回收该变体。

14.如权利要求12或13所述的方法，其中取代的数目是1-17个，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个取代。

15.如权利要求12-14中任一项所述的方法，其中该变体包括选自下组的一个或多个取代，该组由以下各项组成：I10A；P30E；A40G；S51T；I53A,V；Y60S；T99E,N；E102G；Q117E；K130R；R136W；Y157H；Y162C；N175S,G,Q；F183I；A254E；以及S280G,E。

16.如权利要求12-15中任一项所述的方法，其中该变体包括A40G+N175S；A40G+F183I；N175G+S280G；A40G+I53A+N175S；A40G+N175S+F183I；I10A+I53A+E102G；A40G+E102G+Q117E；N175Q+A254E+S280E；P30E+S51T+Y60S+T99N；A40G+T99E+E102G+K130R；或I53V+R136W+Y157H+Y162C+N175S或由其组成。

17.如权利要求13-16中任一项所述的方法，其中相对于该亲本，该变体的表达产量是至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加。

18.一种酶组合物，包括如权利要求1-7中任一项所述的变体。

19.一种全培养液配制品或细胞培养组合物，包括如权利要求1-7中任一项所述的变体。

20.如权利要求1-7中任一项所述的变体的用途。