CN102712681B

CN102712681B - 内含肽修饰酶及其制备和工业用途

Info

Publication number: CN102712681B
Application number: CN201080060601.1A
Authority: CN
Inventors: B·沈; G·拉扎尔; H·德拉维加; P·莱萨德; M·R·莱布; J·阿普加
Original assignee: Agrivida Inc
Current assignee: Agrivida Inc
Priority date: 2009-11-06
Filing date: 2010-11-05
Publication date: 2016-07-06
Anticipated expiration: 2030-11-05
Also published as: US9303250B2; US20130247251A1; US20160186157A1; WO2011057163A2; US8420387B2; CN102712681A; WO2011057163A3; CN102712682A; CN102712682B; US10196623B2; UA115022C2; WO2011057101A1; WO2011057101A4; BR112012010744A2; BR112012010744B1; US20110111442A1

Abstract

提供了内含肽修饰蛋白、编码内含肽修饰蛋白的分离核酸、内含肽修饰蛋白的片段、编码内含肽修饰蛋白片段的分离核酸、含有前述物质的转基因植物，以及对内含肽修饰蛋白上的抗原表位进行识别的抗体。

Description

内含肽修饰酶及其制备和工业用途

本申请是2009年11月6日递交的美国专利申请No.12/590,444的部分连续申请，通过引用将该申请全部内容与本文结合。

与本申请同时电子提交的以“序列表”为标题的序列表，通过引用将其全部内容并入本文，该序列表创建于2010年11月5日，大小为7,617,396字节。

技术领域

本发明涉及对蛋白活性进行控制。

背景技术

许多蛋白都具有有用的特性，但在特定情况下，蛋白也会变得难以利用。例如，水解酶具有重要的工业应用和农业应用，但它们在一些表达宿主内的表达和产生可能又与不需要的表型效果相关。细胞壁降解酶，包括纤维素酶、木聚糖酶、木质素酶、酯酶、过氧化物酶及其它水解酶，在植物内表达时常常会与植物的生长、生理学表现和农艺表现上的不利影响相关。木聚糖酶是能催化β-1,4-木聚糖的水解的酶：β-1,4-木聚糖是植物细胞壁内所含半纤维素中的直链多糖成分。纤维素酶是能催化纤维素、各种聚合度的纤维素种类和纤维二糖内所含的以β-1,4-D-糖苷键连接的葡萄糖聚合物发生内部水解或端部水解的酶。基于上述活性，木聚糖酶或纤维素酶在植物内的表达可能导致非期望的植物成分的降解。一些酶也可能由于其水解活性而在微生物宿主内低表达。

发明内容

一方面，本发明涉及一种分离蛋白，该分离蛋白具有与选自由SEQIDNOS:2059-2089所组成的组中的序列具有至少90%的同一性的氨基酸序列。

一方面，本发明涉及一种分离核酸，该分离核酸具有编码氨基酸序列的核苷酸序列，该氨基酸序列与选自由SEQIDNOS：2059-2089所组成的组中的序列至少具有90%的同一性。

一方面，本发明涉及一种转基因植物，该转基因植物含有分离蛋白，所述分离蛋白的氨基酸序列与选自由SEQIDNOS:2059-2089所组成的组中的序列至少具有90%的同一性。

一方面，本发明涉及一种分离的氨基酸序列，该分离的氨基酸序列所含的连续氨基酸序列与蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个、10-600个，或10-658个连续氨基酸残基具有至少90%的同一性，所述蛋白具有SEQIDNOS:2059-2089中任意一个的序列。所述蛋白具有内含肽序列、酶序列、上游内含肽-外显肽接头、下游内含肽-外显肽接头和至少一种有关SEQIDNO:111或SEQIDNO::91中至少一个的氨基酸改变。所述分离的氨基酸序列具有上游内含肽-外显肽接头、下游内含肽-外显肽接头中的至少一种，或至少一种有关SEQIDNO:111或SEQIDNO:91中至少一个的氨基酸改变中的一种或多种。

一方面，本发明涉及一种抗体，该抗体识别分离的氨基酸序列上的抗原表位，该分离的氨基酸序列所含的连续氨基酸序列与蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个、10-600个，或10-658个连续氨基酸残基具有至少90%的同一性，所述蛋白具有SEQIDNOS:2059-2089中任意一个的序列。所述蛋白具有内含肽序列、酶序列、上游内含肽-外显肽接头、下游内含肽-外显肽接头和至少一种有关SEQIDNO:111或SEQIDNO:91中至少一个的氨基酸改变。所述分离的氨基酸序列具有上游内含肽-外显肽接头、下游内含肽-外显肽接头中的至少一种，或至少一种有关SEQIDNO:111或SEQIDNO:91中至少一个的氨基酸改变中的一种或多种。

一方面，本发明涉及一种分离的核酸，该核酸具有编码连续氨基酸序列的序列，所述连续氨基酸序列与蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个、10-600个，或10-658个连续氨基酸残基具有至少90%的同一性，所述蛋白具有SEQIDNOS:2059-2089中的任意序列。所述蛋白具有内含肽序列、酶序列、上游内含肽-外显肽接头、下游内含肽-外显肽接头和至少一种有关SEQIDNO:111或SEQIDNO:91中至少一个的氨基酸改变。所述分离核酸编码上游内含肽-外显肽接头、下游内含肽接头中的至少一种，或至少一种有关SEQIDNO:111或SEQIDNO:91中至少一个的氨基酸改变中的一种或多种。

附图说明

结合附图阅读将能更好地理解下文中对优选实施方式进行的具体描述。出于阐释本发明的目的，附图所示为本发明优选的实施方式。但是，应当理解的是，本发明不限于所展示的精确安排和手段。图中：

图1显示了在远离蛋白活性位点处的内含肽插入位点。菱形表示插入位点，方形表示未插入内含肽的其它C/S/T位点。

图2A显示了一种植物表达载体，将其命名为pAG2005（SEQIDNO:1）。

图2B显示了更详细的pAG2005（SEQIDNO:1）。

图3A-3L显示了针对Tth内含肽修饰的P77853的蛋白质印迹数据，其中，内含肽插入在P77853酶中的丝氨酸158处（S158）或苏氨酸134（T134）处。在部分图3A-3L中，遮住了部分蛋白质印迹来突出特定的泳道组。泳道上方示出了针对各个样品的琼脂平板表型。所述琼脂平板表型用“SW”代表转化表型（switcherphenotype），TSP代表温敏转化剪接表型（temperaturesensitiveswitchersplicerphenotype），P代表许可表型（permissivephenotype）。每幅图3A-3L中的NIC代表内含肽修饰蛋白中的N-外显肽、内含肽和C-外显肽；NC代表含有N-外显肽和C-外显肽的剪接蛋白。

图3A显示了反映P77853-Tth-S158-2蛋白（SEQIDNO:1672）的蛋白质印迹，该蛋白在37℃（系列2，左泳道）或55℃（系列2，右泳道）下进行了4小时的预热处理。同时该图还显示了含有空载体对照（VCT）蛋白和野生型P77853蛋白（P77）的泳道，以相同的方式对这两种蛋白进行预热处理。

图3B显示了反映P77853-Tth-S158-4蛋白（SEQIDNO:1673）的蛋白质印迹，该蛋白在37℃（系列4，左泳道）或55℃（系列4，右泳道）下进行了4小时的预热处理。同时该图还显示了含有空载体对照（VCT）蛋白和野生型P77853蛋白（P77）的泳道，以相同的方式对这两种蛋白进行预热处理。

图3C显示了反映P77853-Tth-S158-7蛋白（SEQIDNO:1674）的蛋白质印迹，该蛋白在37℃（系列7，左泳道）或55℃（系列7，中泳道）下进行了4小时的预热处理，并在70℃（系列7，右泳道）下进行了1小时的预热处理。同时该图还显示了含有空载体对照（VCT）蛋白和野生型P77853蛋白（P77）的泳道。

图3D显示了反映P77853-Tth-S158-19蛋白（SEQIDNO:1675）的蛋白质印迹，该蛋白在37℃（系列19，左泳道）或55℃（系列19，中泳道）下进行了4小时的预热处理，并在70℃（系列19，左泳道）下进行了1小时的预热处理。同时该图还显示了含有空载体对照（VCT）蛋白和野生型P77853蛋白（P77）的泳道。

图3E显示了反映P77853-Tth-S158-20蛋白（SEQIDNO:1676）的蛋白质印迹，该蛋白在37℃（系列20，左泳道）或55℃（系列20，中泳道）下进行了4小时的预热处理，并在70℃（系列20，右泳道）下进行了1小时的预热处理。同时该图还显示了含有空载体对照（VCT）蛋白和野生型P77853蛋白（P77）的泳道。

图3F显示了反映P77853-Tth-S158-21蛋白（SEQIDNO:1677）的蛋白质印迹，该蛋白在37℃（系列21，左泳道）或70℃（系列21，右泳道）下进行了1小时的预热处理。同时该图还显示了含有空载体对照（VCT）蛋白和野生型P77853蛋白（P77）的泳道，以相同的方式对这两种蛋白进行预热处理。

图3G显示了反映P77853-Tth-S158-25蛋白（SEQIDNO:1678）的蛋白质印迹，该蛋白在37℃（系列25，左泳道）或70℃（系列25，右泳道）下进行了1小时的预热处理。同时该图还显示了含有空载体对照（VCT）蛋白和野生型P77853蛋白（P77）的泳道，以相同的方式对这两种蛋白进行预热处理。

图3H显示了反映P77853-Tth-S158-38蛋白（SEQIDNO:1679）的蛋白质印迹，该蛋白在37℃（系列38，左泳道）或55℃（系列38，右泳道）下进行了4小时的预热处理。同时该图还显示了含有空载体对照（VCT）蛋白和野生型P77853蛋白（P77）的泳道，以相同的方式对这两种蛋白进行预热处理。

图3I显示了反映P77853-Tth-S158-39蛋白（SEQIDNO:1680）的蛋白质印迹，该蛋白在37℃（系列39，左泳道）或55℃（系列39，中泳道）下进行了4小时的预热处理，并在70℃（系列39，右泳道）下进行了1小时的预热处理。同时该图还显示了含有空载体对照（VCT）蛋白和野生型P77853蛋白（P77）的泳道。

图3J显示了反映P77853-Tth-S158-42蛋白（SEQIDNO:1681）的蛋白质印迹，该蛋白在37℃（系列42，左泳道）或55℃（系列42，中泳道）下进行了4小时的预热处理，并在70℃（系列42，右泳道）下进行了1小时的预热处理。同时该图还显示了含有空载体对照蛋白和野生型P77853蛋白（P77）的泳道。

图3K显示了反映P77853-Tth-S158-138蛋白（SEQIDNO:1691）的蛋白质印迹，该蛋白在37℃（系列42，左泳道）或59℃（左泳道数起第二条）下进行了4小时的预热处理。同时该图还显示了含有空载体对照蛋白和野生型P77853蛋白（P77853）的泳道。

图3L显示了反映P77853-Tth-T134-1蛋白（SEQIDNO:1629）（系列1）、P77853-Tth-T134-2蛋白（SEQIDNO:1630）（系列2）、P77853-Tth-T134-3蛋白（SEQIDNO:1631）（系列3）、P77853-Tth-T134-9蛋白（SEQIDNO:1632）（系列9）、P77853-Tth-T134-91蛋白（SEQIDNO:1644）（系列91）、P77853-Tth-T134-48蛋白（SEQIDNO:1638）（系列48）、P77853-Tth-T134-80蛋白（SEQIDNO:1640）（系列80）和P77853-Tth-T134-95蛋白（SEQIDNO:1645）（系列95）的蛋白质印迹，这些蛋白在37℃（前述每个系列的左泳道）和70℃（前述每个系列的游泳道）下进行了1小时的预热处理。同时该图还显示了含有空载体对照（VCT）蛋白和野生型P77853蛋白（P77）的泳道，以相同的方式对这两种蛋白进行预热处理。将各个蛋白表型列于其对应的泳道上方。

图4A-4C显示了针对S158Tth内含肽修饰的P77853木聚糖酶突变体的蛋白质印迹分析。

图4A显示了针对S158-19Tth内含肽修饰的P77853木聚糖酶（SEQIDNO:1675）的蛋白质印迹分析。将蛋白样品在59℃下进行不同时间的培养（0小时、1小时、2小时、3小时、4小时和6小时）。空载体（V）和野生型P77853对照样品按分子量梯度显示在最右侧。灰色标出的中间区域遮盖了含有其它样品的泳道。

图4B显示了针对S158-30-103Tth内含肽修饰的P77853木聚糖酶（SEQIDNO:1701）的蛋白质印迹分析。如图所示地，使蛋白样品在37℃、50℃、59℃和65℃下进行不同时间的培养（1小时、2小时、3小时、4小时和6小时）。空载体（V）和野生型P77853对照样品按分子量梯度显示在最右侧。

图4C显示了针对T134-100-101Tth内含肽修饰的P77853木聚糖酶（SEQIDNO:1711）的蛋白质印迹分析。如图所示，将蛋白样品在37℃、50℃、59℃和65℃下进行不同时间的培养（1小时、2小时、4小时、6小时和17小时）。空载体（V）和野生型P77853对照样品按分子量梯度显示在最右侧。

图5显示了在酵母细胞中表达和分泌内含肽修饰蛋白，例如来源于解纤维热酸菌（Acidothermuscellulolyticus）的内切葡聚糖酶的质粒载体；。

图6显示了对能表达P07981（在里氏木霉（Trichodermareesei）中的内切葡聚糖酶EG-1）、P54583或白蛋白（作为阴性对照）的毕赤酵母株（Pichia）进行的活性分析。

图7显示了对酿酒酵母（S.cerevisiae）中P54583的分泌进行的平板分析。

图8显示了P54583在不同pH水平及不同温度下的活性。

图9显示了P54583在不同时间点及不同温度下的活性。

图10显示了P54583的PNP-C分析。

图11显示了用微晶纤维素对P54583进行的提纯。

图12显示了野生型P54583的蛋白质印迹检测。

图13显示了P54583中的候选内含肽插入点。

图14显示了对内含肽修饰的内切葡聚糖酶进行编码的基因的装配策略（assemblystrategy）。

图15显示了针对内含肽修饰的内切葡聚糖酶在不同温度处理下作出反应行为的评分。

图16显示了针对内含肽修饰的内切葡聚糖酶的活性分析。

图17显示了针对多种内含肽修饰的P54583蛋白的蛋白质印迹分析。

图18A-C显示了产生诱变处理文库（mutangenizedlibraries）的易错PCR（errorpronePCR）。

图19显示了缺陷内含肽（crippledintein）对P54583酶活性的影响。

图20显示了在不同温度的预温育下的酶活性恢复。

图21显示了P54583在不同温度下进行预温育后的酶活性恢复，该P54583携带有位于S237位点的微小内含肽。

图22显示了预温育时间和内含肽修饰的内切葡聚糖酶的活化。每个系列（1、2、3和4）中从左至右连续的条形代表进行了0小时、2小时、4小时、6小时和10小时预温育。

图23显示了针对内含肽修饰的内切葡聚糖酶文库的高通量内切葡聚糖酶分析结果。

图24显示了经诱变处理后的内含肽修饰的内切葡聚糖酶文库筛选。

图25显示了对经诱变处理后的内含肽修饰的内切葡聚糖酶文库中的候选者进行的重复活性分析。

图26显示了内含肽修饰的内切葡聚糖酶的热诱导酶活性，该内含肽修饰的内切葡聚糖酶携带有位于Tth内含肽中R51位点的突变。

图26A总结了针对使用4-甲基伞形酮-纤二糖苷（4-methylumbelliferylcellobioside）的实施例11a的克隆体的活性分析结果。

图27显示了内切葡聚糖酶的系统树。

图28显示了表达和分泌内含肽修饰蛋白的质粒载体；例如，酵母中表达和分泌来源于白蚁的内切葡聚糖酶的质粒载体。

图29显示了表达空表达载体（emptyexpressionvector）、编码NtEG的表达载体、编码不含天然信号肽（nativesignalpeptide）的NtEG突变体的表达载体的酵母。

图30显示了NtEG及不含天然信号肽的NtEG突变体在一定范围的温度下的内切葡聚糖酶活性。

图31显示了不含天然信号肽的NtEG突变体和P54583在一定范围的pH下的内切葡聚糖酶活性。

图32显示了不含天然信号肽的NtEG突变体在具有或不具有组氨酸标签情况下的内切葡聚糖酶活性。

图33显示了能编码内含肽修饰的NtEG内切葡聚糖酶的基因的装配策略。

图34显示了酵母细胞酶活性的时间进程，该酵母细胞能对内含肽修饰的白蚁酶切葡聚糖酶进行表达。

图35显示了λII载体中的表达盒。

具体实施方式

除非另有说明，本文使用的技术和科技术语具有本发明所属领域技术人员公知的意义。本文实施方式中的方法可以与本领域技术人员已知的其它筛选和应用方法进行替换或结合。“至少一种”短语之后跟随有一种或多种项目清单，例如“A、B或C”，表示A、B或C中的任意一个或它们的任意组合。

本文中使用的“外显肽”指的是内含肽修饰蛋白中不属于内含肽的部分。

本文中使用的“氨基末端外显肽（aminoterminalextein）”、“N-末端外显肽”或“N-外显肽”具有相同的意思，指的是位于内含肽N-末端残基之前的外显肽。在装配的内含肽修饰蛋白中，将氨基末端外显肽、N-末端外显肽或N-外显肽的羧基端融合到内含肽的氨基端上。

本文使用的“羧基末端外显肽”、“C-末端外显肽”或“C-外显肽”具有相同的意思，指的是位于内含肽C-末端残基之后的外显肽。在装配的内含肽修饰蛋白中，将羧基末端外显肽、C-末端外显肽或C-外显肽的氨基端融合到内含肽的羧基端上。

本文使用的“靶蛋白”是其中插入了内含肽的蛋白，或者是将要插入内含肽的候选者。插入内含肽之前，可以根据将要进行插入的位点将靶蛋白的各个部分称为外显肽、氨基末端外显肽或羧基末端外显肽。

“靶蛋白”可以是酶，因此术语“靶酶”表示这样的“靶蛋白”：该靶蛋白是一种酶。

本文使用的“许可型”或“P”指的是这样的内含肽修饰：其中，内含肽修饰蛋白在插入内含肽后保持了功能，或者将内含肽从蛋白质中切开或剪接出来后，剩下了具有功能的外显肽或连接蛋白。

本文中使用的“非许可型”或“NP”指的是这样的内含肽修饰，其中，内含肽修饰蛋白在插入内含肽后具有减弱了的功能。

本文使用的“热敏”指的是这样的内含肽修饰：其中，内含肽修饰蛋白在暴露在一定温度或一定范围的温度下时具有更强的功能，或者将内含肽从蛋白质中剪接出来后，剩下了在暴露在一定温度或一定范围的温度下时具有更强的功能的外显肽或连接蛋白。

本文中使用的“转化”指的是内含肽修饰蛋白响应物理或化学条件的改变而发生的活性变化。能产生“转化”或“转化子（switcher）”内含肽修饰蛋白的内含肽修饰在条件发生改变前是非许可型，在条件发生改变后成为许可型。转化可以在存在内含肽、内含肽从外显肽上切开、或内含肽发生切开且外显肽发生连接时产生。

本文中的“热敏转化剪接”或“TSP”指的是这样的内含肽修饰蛋白：其中，内含肽对诱导温度或诱导温度范围作出应答发生剪接。所述内含肽修饰蛋白可以在暴露于非诱导温度或诱导温度范围之外的温度之前时是非许可型，当暴露在于诱导温度或诱导温度范围之后为许可型。

本文中使用的“分离核酸”、“分离多核苷酸”、“分离寡核苷酸”、“分离DNA”或“分离RNA”指的是从产生它们的生物中，或者从经常与其有关的天然存在的基因组、地点、或分子中分离出来的，或者通过合成工艺制得的核酸、多核苷酸、寡核苷酸、DNA或RNA。

本文中使用的“分离蛋白”、“分离多肽”、“分离寡肽”或“分离肽”指的是从产生它们的生物中，或者从经常与其有关的天然存在的地点或分子中分离出来的，或者通过合成工艺制得的蛋白、多肽、寡肽或肽。

本文中使用的“变体”指的是保持了与原始序列相同或基本相似的生物活性的分子。所述变体可以是来自相同或不同的物种，或者是基于天然分子或优先分子（priormolecule）合成的序列。

本文中提到的核酸、核苷酸序列、蛋白质或氨基酸序列可以是分离的、提纯的、化学合成的、或通过重组DNA技术制得。上述方法均为本领域所公知。

本文中使用的“可操作地连接”指的是两个或更多个生物分子或部分的一个或多个生物分子中在彼此相关的结构中的关系，使所述生物分子的正常功能得以发挥。涉及核苷酸序列时，“可操作地连接”指的是两个或更多个核酸序列通过酶的连接作用或其它方式在彼此相关的结构中的关系，使所述序列的正常功能得以发挥。例如，如果编码前序列或分泌前导区的核苷酸序列能表达为参与多肽分泌的前蛋白，则该核苷酸序列是可操作地连接到多肽的核苷酸序列中的；如果启动子或增强子能影响编码序列的转录，则该启动子或增强子是可操作地连接到所述编码序列上的；如果核糖体结合位点的位置有利于翻译编码序列，则该核糖体结合位点可操作地连接到所述编码序列上。

提供了具有可控活性的分离蛋白、能编码所述分离蛋白的分离核酸、测定内含肽插入位点的方法以及控制蛋白活性的方法。可以将所述蛋白或核酸提供在植物、微生物和其它生物内。通过控制作用，可以将一种或多种蛋白或核酸用于燃料、纤维、生面、化学制品、糖类、织物、浆料、纸张、人类食物或动物饲料的制造。优选地，表达宿主的一种或多种的生长、生理或其它性能特征不会轻易受到所述蛋白或核酸的干扰。待受控蛋白可以是一种酶，也可以是任意种类的蛋白，包括非酶、结构蛋白或激素。

使用内含肽是一种控制蛋白活性的方法，这种控制允许内含肽修饰蛋白以预定义的活性水平进行表达。内含肽是能够自切割和自连接的多肽。将同时具备自切割和自连接的属性总称为“自剪接”或“剪接”。内含肽从蛋白中切割出来，并对其所切割的蛋白序列（外显肽）的连接作用进行介导，从而对该蛋白进行剪接。内含肽可以插入蛋白序列内部或与蛋白末端融合。蛋白中的内含肽插入物可以通过这种方式来对蛋白进行控制：产生的蛋白在内含肽存在时具有一种活性，当内含肽被切割或剪接后该蛋白具有另一种活性。在某些情况下，通过不同诱导条件中的一种或多种能对内含肽剪接反应进行控制。当通常情况下对宿主有害的活性被降低后，内含肽就可以保护表达宿主不受到蛋白对生长、生理学或产量造成的不利影响。对蛋白进行表达后，可以通过使被修饰的蛋白暴露在能诱发内含肽剪接的反应条件中来改变蛋白活性。剪接后产生的蛋白可能具有更强的活性。在一种实施方式中，内含肽修饰在低温下是非许可型而在较高温度下是许可型，因此内含肽修饰蛋白会在温度从低温向较高温度变化时发生转化。但是，在一些实施方式中，经过切割和/或连接的酶具有较低的活性。能编码内含肽修饰蛋白的核酸可以是在植物中进行表达的最佳密码子。可以用本发明实施方式的内含肽进行修饰的靶蛋白包括但不限于细胞壁降解酶、木素纤维素降解酶、木聚糖酶和纤维素酶。本文公开的全部蛋白都可以作为进行内含肽修饰的靶蛋白。

可以用选自由Mth内含肽、Psp-Pol内含肽、微小Psp-Pol（mPsp-Pol）内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽、微小Tth内含肽，或它们的衍生物所组成的组中的内含肽对靶蛋白进行修饰。Mth内含肽、Psp-Pol内含肽、微小Psp-Pol内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽和微小Tth（mTth）内含肽可以分别含有SEQIDNOS:2、3、4-87、88、89、90、91和92-103所示的序列。但内含肽也可以有其它来源，或者是被修饰的天然内含肽形式。

提供了分离的内含肽修饰的木聚糖酶。发生内含肽切割或内含肽剪接之前和之后的内含肽修饰的木聚糖酶的实施方式具有不同的活性。在一种实施方式中，通过将内含肽修饰的木聚糖酶暴露在诱导条件下来诱发内含肽的切割或剪接。所述诱导条件可以是提高温度，但不仅限于此。提高的温度可以是但不限于50-70℃的范围，包括50℃和70℃的温度，或者是在上述范围内任意两个整数温度之间的子区间。所提高的温度可以大于或等于在25-70℃内以整数递增的温度。所提高的温度可以大于或等于50℃、55℃、59.9℃、60℃、65℃或70℃。编码内含肽修饰的木聚糖酶的核酸是优选但非必要的为在植物中进行表达而进行了密码子优化的。在一种实施方式中，可以使内含肽修饰的木聚糖酶在转基因植物中进行表达。

提供了分离的内含肽修饰的纤维素酶。发生内含肽切割或内含肽剪接之前和之后的内含肽修饰的纤维素酶的实施方式具有不同的活性。在一种实施方式中，通过将内含肽修饰的纤维素酶暴露在诱导条件下来诱发内含肽的切割或剪接。所述诱导条件可以是提高温度，但不仅限于此。提高的温度可以是但不限于50-70℃的范围，包括50℃和70℃的温度，或者是在上述范围内任意两个整数温度之间的子区间。所提高的温度可以大于或等于在25-70℃内以整数递增的温度。所提高的温度可以大于或等于45℃、50℃、55℃、60℃、62℃或65℃。编码内含肽修饰的纤维素酶的核酸是优选但非必要的为在植物中进行表达而进行了密码子优化的。在一种实施方式中，可以使内含肽修饰的纤维素酶在转基因植物中进行表达。

可以作为靶蛋白的木聚糖酶包括但不限于来自嗜热网球菌（Dictyoglomusthermophilum）的β-1,4-木聚糖酶229B（登录号为P77853，SEQIDNO:104）、来自热纤梭菌（Clostridiumthermocellum）的内-1,4-β-木聚糖酶（登录号为P51584，SEQIDNO:105）、来自芽孢杆菌（Bacillussp.）NG-27的碱性耐热内木聚糖酶前驱体（登录号为O30700，SEQIDNO:106），来自疏棉状嗜热丝孢菌（Thermomyceslanuginosus）的内-1,4-β-木聚糖酶（登录号为O43097，SEQIDNO:107）和来自粪堆梭菌（Clostridiumstercorarium）的耐热胞外木聚糖酶（celloxylanase）（登录号为P40942，SEQIDNO:108）。可以用一种或多种不同的内含肽对木聚糖酶进行修饰，包括但不限于选自由Mth内含肽、Psp-Pol内含肽、微小Psp-Pol内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽、微小Tth内含肽或它们的衍生物所组成的组中的至少一种。在一种实施方式中，所述Mth内含肽、Psp-Pol内含肽、微小Psp-Pol内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽、或微小Tth内含肽的分别具有SEQIDNOS:2、3、4-87、88、89、90、91、或92-103所示的序列。可以在木聚糖酶内多个候选位点中的一个或多个位点上插入一个或多个内含肽。

可以作为靶蛋白的纤维素酶包括但不限于热纤梭菌celK(ClostridiumthermocellumcelK）纤维素酶（登录号为O68438（SEQIDNO:109））、褐色热单胞菌celB（ThermomonosporafuscacelB）纤维素酶（登录号为P26222（SEQIDNO:110））、来自解纤维热酸菌（Acidothermuscellulolyticus）的Ace1内切葡聚糖酶E1（登录号为P54583（SEQIDNO:111））以及高山象白蚁（Nasutitermestakasagoensis）NtEG纤维素酶（登录号为O77044（SEQIDNO:112））。可以用一种或多种不同的内含肽对纤维素酶进行修饰，所述内含肽包括但不限于选自由Mth内含肽、Psp-Pol内含肽、微小Psp-Pol内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽、微小Tth内含肽或它们的衍生物所组成的组中的至少一种。在一种实施方式中，所述Mth内含肽、Psp-Pol内含肽、微小Psp-Pol内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽、或微小Tth内含肽的分别具有SEQIDNOS:2、3、4-87、88、89、90、91、或92-103所示的序列。可以在纤维素酶内多个候选位点中的一个或多个位点上插入一个或多个内含肽。

可以通过标准分子生物学技术制备内含肽修饰蛋白，然后进行筛选。可以使内含肽、靶蛋白或内含肽修饰蛋白发生突变，然后进行筛选。可用的筛选系统包括λ噬菌体、酵母或其它允许蛋白产生和/或能测试该蛋白的物理和/或功能特性的表达系统。可以将候选者从内含肽修饰蛋白或突变内含肽修饰蛋白群中分离出来，并进一步进行分析。进一步进行的分析可以包括DNA测序、功能分析法、结构分析、酶活性分析和监测活性、结构发生的变化，或者对诱导条件作出应答而发生的剪接。

诱导条件可以包括将内含肽修饰蛋白暴露在变化的物理或化学条件发生中，例如但不限于温度、pH、剪接抑制剂的浓度、配体浓度、光、盐条件和压力方面的改变。可以通过对天然内含肽或突变内含肽进行的筛选来测定诱导条件。此外，也可以从能适应所期待的诱导条件下生活的生物中获得内含肽。例如，可以从嗜冷菌（psychrophile）、中温菌或嗜热菌（例如，骑行纳古菌（Nanoarchaeumequitans）、深海火球菌（Pyrococcusabyssi）或火球菌（Pyrococcussp.））中分离出温度诱导型内含肽；可以从嗜酸菌、嗜碱菌或嗜中性菌（例如，火球菌、结核分枝杆菌（Mycobacteriumtuberculosis）、酿酒酵母（Saccharomycescerevisiae））中分离出pH诱导型内含肽；同时可以从嗜盐菌中分离出盐诱导型内含肽。还对化学诱导或化学抑制的内含肽进行了确认。作为化学诱导或化学抑制的内含肽的非限制性实例，从酿酒酵母中分离出来的液泡ATP酶亚基（VMA）内含肽通过暴露在DTT、NH₂OH或半胱氨酸中而发生了诱导性的切割；存在Zn²⁺的时候，从分枝杆菌（Mycobacterium）中分离出来的内含肽和从酵母菌属（Saccharomyces）中分离出来的其它内含肽呈现出受抑制的剪接。可以通过撤去抑制条件来对受抑制的内含肽进行诱导。可以使天然内含肽发生突变并对其进行筛选，以测定在期望诱导条件下可诱导的内含肽中是否产生了突变。可以在内含肽修饰蛋白中提供上述任意来源的内含肽。

可以通过实验测定内含肽的插入位点。为了测定插入位点是否允许进行内含肽剪接，可以使用本领域已知的方法构造和克隆内含肽-蛋白融合基因、使该内含肽修饰蛋白得到表达，并测试内含肽修饰蛋白自发地或在诱导条件下发生剪接的能力。

为了避免将任何额外的氨基酸引入蛋白中，并可能由此使蛋白功能或活性发生改变的情况，可以将蛋白质中存在的天然半胱氨酸、丝氨酸和苏氨酸筛选为潜在的内含肽插入位点。插入后，可以在以改变蛋白功能为目的的内含肽切割和/或连接之前和之后对蛋白进行测试。

通过在新接头位点引入半胱氨酸、丝氨酸或苏氨酸可以将内含肽插入到蛋白中任意位置。可以通过对蛋白内的氨基酸进行取代反应或者通过插入半胱氨酸、丝氨酸或苏氨酸来引入半胱氨酸、丝氨酸或苏氨酸。在新接头位点处插入内含肽时，该内含肽的羧基端将与羧基外显肽氨基端的第一氨基酸发生融合。如果引入的半胱氨酸、丝氨酸或苏氨酸在蛋白内的位置能促进内含肽的插入，那么在随后的剪接反应中将该氨基酸留在所述蛋白内。剪接反应后留在成熟蛋白中的引入氨基酸可能对蛋白的功能或活性产生干扰，因此人们需要对经这种剪接反应后得到含有引入氨基酸的所有蛋白的功能和活性进行证实。本领域已知通过功能分析法来对所有已被赋予了功能的蛋白的功能进行测定。

鉴于许多蛋白中含有多个半胱氨酸、丝氨酸和苏氨酸，因此希望对那些经测试能进行内含肽剪接的插入位点进行等级排序，或者甚至对这些插入位点的数量进行限制。可以用三个特点来预测内含肽插入位点是：A）支持向量机（supportvectormachine，SVM）所描述的局部序列，B）插入位点到活性位点残基的距离，以及C）插入位点与局部二级结构的邻近程度（例如，在α-螺旋结构或β-片状结构端部处或附近）。在一种实施方式中，使用局部序列和到活性位点的距离来缩小推荐插入位点的选择范围，而二级结构元件信息则能用于对相似的插入位点进行优选。

A）局部序列

可使用SVM法来对内含肽插入位点进行预测或评价。可以由已知的天然内含肽插入位点装配成合适的已知内含肽插入位点训练组（训练组）。可以在Perler，F.B.（2002），InBase，TheInteinDatabase(内含肽数据库)，Nuc.AcidsRes.30:383-384中记载的NEBinbase数据库中找到用于该目的的已知内含肽插入位点序列，通过引用该文献全部记载而将其整体与本文结合。优选地，训练组内含肽插入位点具有SEQIDNOS:1233-1512的序列。用于上述目的的蛋白序列的一种来源是NCBI数据库，也可以使用其它的来源。含有对应于SEQIDNOS:1233-1512训练组内含肽插入位点的内含肽的蛋白分别具有SEQIDNOS:393-672序列。基于内含肽序列（SEQIDNOS:113-392）和含内含肽的蛋白序列（SEQIDNOS:393-672），可以将各个含内含肽的蛋白的外显肽序列从每个内含肽序列中分离出来。SEQIDNOS:393-672蛋白序列中的N-外显肽分别以SEQIDNOS:673-952表示，而SEQIDNOS:393-672蛋白序列中的C-外显肽分别以SEQIDNOS:953-1232表示。为了SVM序列预测的生成，对N-外显肽及C-外显肽中的含有插入位点X和环绕X的序列的盒（cassette）进行测定。优选地，被分析的序列包括环绕X的-3号到+2号（总计6个氨基酸，编号为-3、-2、-1、0、1、2）的氨基酸盒（NNNXNN序列中，X为0号氨基酸）。下面以NNNXNN盒作为SVM模型进行描述。如果采用了NNNXNN以外的盒，则根据本文的描述可以显然得知需要对SVM进行修改。

用下面的等式将盒换算成向量V：

V=[位点_-3位点_-2位点_-1位点₀位点₊₁位点₊₂]

其中，

位点_i=[aa_iALAaa_iARG…aa_iTRPaa_iTYR]

如果位点i存在氨基酸型N时，aaiN=1；否则，N=0。这将6个氨基酸的盒序列换算成1×120的向量。将用于含有内含肽的SEQIDNOS:393-672蛋白的插入位点盒分别提供在SEQIDNOS:1233-1512中。将这一组插入位点盒的向量用作真阳性对照组来训练SVM。在每个具有真阳性的蛋白中，同时还从N-外显肽序列和C-外显肽序列中选择3个在X（0）处具有半胱氨酸、苏氨酸和丝氨酸（本文中称为“C/T/S”）但不含内含肽插入无的随机NNNXNN盒（优选来自序列SEQIDNOS:673-1232）作为真阴性。然后对来自外显肽序列的真阴性组进行编译。被选择的真阴性可以来自与真阳性插入位点相同的蛋白，并在X处具有与真阳性相同的残基类型。

在整套内含肽插入位点序列上对用来预测内含肽插入位点的总SVM进行训练，同时除去全部相同的序列。这可以通过执行多种不同方法或程序中的任何一种来进行。一种可以用来预测内含肽插入位点的SVM程序为SVM_lightV6.02（2008年8月14日），该程序可商购自ThorstenJoachimsWeichgutLLC，Ithaca，NY，通过引用其全部内容将其与本文结合。同时参见ThorstenJoachims的“产生大量SVM学习实践”（Makinglarge-ScaleSVMLearningPractical）。在Kernel法中进行了改进——支持向量学习，B.Scholkopf和C.Burges和A.Smola（编译），MIT-出版社，1999，通过引用其全部内容将其与本文结合。简而言之，SVMlightV6.02是上述提到的Joachims1999出版物（该出版物解释了与大量问题有关的较大训练组的困难）的支持向量机训练法的实践。通过以高效方式选择工作组变量，将算法构建在在解决上述问题的分解策略的基础上。通过SVMlightV6.02采用了线性核（linearkernel）和设定至1的成本因素，从而使阳性组和阴性组中的差错具有同等重要性。

为了测试该方法的正确性，可以选择较小组的插入位点盒按照下面的方法进行训练和测试：1）随机选择m组具有单一序列的真阳性训练组插入位点（在一种实施方式中，m为1-250，所述序列选自SEQIDNOS:1233-1512）；2）针对每个真阳性插入位点，从同一个含内含肽蛋白（在一种实施方式中，SEQIDNOS:673-1232）中与所述真阳性插入位点有关的外显肽中随机选择三个对应的真阴性盒，其中，真阴性插入位点具有相同的中心氨基酸X但不含有内含肽插入物，和3）可以将步骤1）组内未被选择的余下其它单一序列选为测试组（例如，SEQIDNOS:1233-1512中余下的序列）。接着，采用与进行总量预测的相同方法来对支持向量进行训练，然后用这些支持向量对测试组进行评分，所述支持向量包括已知插入位点盒——以正值表示，和选自在0位具有半胱氨酸、苏氨酸或丝氨酸的外显肽（SEQIDNOS:673-1232）的全部其它非插入位点盒——以负值表示。

然后将对每个蛋白的大量位点进行的评分进行比较，并根据其分值将插入位点进行分级。为了得到用于比较的基度（metric），可以为每个内含肽插入位点指定一个数值，该数值是通过将SVM评分低于插入位点（L）的位点数量除以测试组中全部位点数量减去1（(Nn）之后计算得到的比值，或表示为L/Nn。结果为1的基度意味着插入位点的数量大于全部其它位点的数量，而结果为0的基度则意味着插入位点的数量小于全部其它位点的数量。可以将上述过程在各个不同大小的训练组中重复进行25次，其中，每次过程都是基于SEQIDNOS:1233-1512中的插入位点盒进行的随机选择之上，而相应的真阴性插入位点对应地选自待训练和测试的SEQIDNOS:673-1232中。下表1显示了使用上述训练和测试程序的针对已知内含肽插入位点的基度。表1中针对已知内含肽插入位点的平均基度以及各个不同大小训练组的标准偏差是建立在优选实施方式的基础上的，该优选实施方式包括选自SEQIDNOS:673-1512的训练和测试组序列。对于大小为25个或更多的训练组来说，内含肽插入位点的平均值为0.75个基度。由此具有150个插入位点盒的训练组的p值大约为10^-10显示出统计学上的显著性。基于局部序列的特征，可以通过SVM对任意靶蛋白的潜在内含肽插入物位点进行筛选，进而对能用来调整靶蛋白活性的插入位点进行预测。在一种实施方式中，选择等级为0.75或更高的候选插入位点作为插入内含肽的位点。

表1

训练组大小	平均基度	标准偏差	SV数量
				1	0.57	0.068	3
25	0.73	0.032	75
				50	0.74	0.031	150
75	0.75	0.045	225
				100	0.75	0.048	300
125	0.77	0.054	375
				150	0.75	0.052	450
175	0.77	0.062	52511 -->
				200	0.76	0.071	600
225	0.77	0.070	675
				250	0.86	0.133	750

优选的NNNXNN内含肽插入无盒组包括含有以下序列的组：GGKCGG、GGKSGG、GGKTGG、PGATSP、PGATVP、GAKSLG、PGATSL，PGASPL，PGATGP，AQRSLG，NQPSIV，NQASIV，PNMSSA，GNHSSG，PSHSAY，SLMSSC，TNTSNY，IDTSRN，PSTSAY，QIKSLG，FETCNY，AVLSVN，LVYSAH，AGYSSA，MWGTLR，LSASSY，FAQTQI，GGRSFV，SFVCGF，GFGSNP，NPPTRP，HHRSSS，HRSSSC，RSSSCP，DWNTFN，TFNSPD，DDRSDY，EVATDY，NQVTEL，SSVTFW，LRESVW，RFHTLV，DLSSVT，DNHTWL，DYNTEV，LDVSLY，HYNSIV，ADLSSV，NIITEL，GHQTHI，MRNSPW，RFHTLV，DYNTDD，DKYSWL，LDMSIY，HNQTPT，DIKSWD，WGISDK，SGATDL，YYYSWW，SWWSDG，NFGTYD，GKTTRV，NAPSID，GTQTFD，QYWSVR，IVATEG，GYFSSG，NGNSYL，YGWTRN，YDPSSG，LGKTTR，YFSSGY，IDHTDS，SWSTNE，HTDSWS，NEITIN，DSWSTN，LDQSYV，EDPTIT，SYVTGY，PWGSNS，GSNSFI，TPGSGG，TNYSHP，DGMSYL，PQKCYI，DLISLM，LMSSCM，AGSSQA，AGHSAW，GIATNT，ATNTSN，CDPSGR，PQGTWF，VIDTSR，QGLTSL，SGQSAL，NGDSYW，SGDTGG，GVQSYN，LVYSAH，EFGTTL，FQWTFW，TFWSWN，NPDSGD，GYQSSG，IVESWG，GWSTNP，NLGTID，TGNTTM，NGNSYL，YGWSTN，YQSSGS、SNASGT或DGGTYD（分别是SEQIDNOS:1513-1628）。

B）插入位点到活性位点残基的距离

虽然将蛋白内任意点的内含肽插入物都列入了考虑，但是可以选择靠近蛋白活性位点的内含肽插入位点。通过图1所示内容可以发现，在活性位点25埃以内的内含肽插入位点比超出该范围的内含肽插入位点更普遍。图1中，通过对i）插入位点中最接近活性位点的氨基酸的原子到ii）活性位点中最接近插入位点氨基酸的原子进行测量得到插入位点和活性位点之间的距离。可以将内含肽插入到离活性位点距离小于或等于25埃、24埃、23埃、22埃、21埃、20埃、19埃、18埃、17埃、16埃、15埃、14埃、13埃、12埃、11埃、10埃、9埃、8埃、7埃、6埃、5埃、4埃、3埃、2埃、或1埃的位置处。在一种实施方式中，内含肽插入位点位于离靶蛋白活性位点10埃或更近的位置。本文中使用的“10埃以内”指的是10埃或更近的距离。插入位点也可以是远离蛋白中一级结构或二级结构中的活性位点，这可以通过直接距离（而非氨基酸或二级结构界标的数量）来对距离进行测量。可以通过参考已出版的数据或晶体学、核磁共振或同源模型来获得蛋白的特性以插入位点残基到活性位点的距离。可以使用缺省参数通过Swissprot（SWISS-MODELandtheSwiss-PdbViewer：Anenvironmentforcomparativeproteinmodeling.Guex，N.andPeitsch，M.C.（1997）Electrophoresis18，2714-2723，通过引用该文献全部记载而将其整体与本文结合）来构建同源模型。参考有关特异性蛋白的文献，或者使用以下文献中描述的对活性位点的位置的注释可以对活性位点残基进行：NCBIgenPent文件（数据库来源为国家生物技术信息中心。DavidL.Wheeler、TanyaBarrett、DennisA.Benson、StephenH.Bryant、KathiCanese、VyacheslavChetvernin、DeannaM.Church、MichaelDiCuccio、RonEdgar、ScottFederhen、LewisY.Geer、YuriKapustin、OlegKhovayko、DavidLandsman、DavidJ.Lipman、ThomasL.Madden、DonnaR.Maglott、JamesOstell、VadimMiller、KimD.Pruitt、GregoryD.Schuler、EdwinSequeira、StevenT.Sherry、KarlSirotkin、AlexandreSouvorov、GrigoryStarchenko、RomanL.Tatusov、TatianaA.Tatusova、LukasWagner、andEugeneYaschenko（2007）Nucl.AcidsRes.200735：D5-D12，通过引用该文献全部记载而将其整体与本文结合）、催化位点图谱数据库（TheCatalyticSiteAtlas:aresourceofcatalyticsitesandresiduesidentifiedinenzymesusingstructuraldata）。CraigT.Porter、GailJ.BartlettandJanetM.Thornton（2004）Nucl.Acids.Res.32:D129-D133；AnalysisofCatalyticResiduesinEnzymeActiveSites.GailJ.Bartlett、CraigT.Porter、NeeraBorkakotiandJanetM.Thornton（2002）JMolBiol324:105-121；UsingaLibraryofStructuralTemplatestoRecogniseCatalyticSitesandExploretheirEvolutioninHomologousFamilies.JamesW.Torrance、GailJ.Bartlett、CraigT.Porter、JanetM.Thornton（2005）JMolBiol.347:565-81，通过引用上述文献全部记载而将其整体与本文结合），以及有关活性位点信息的其它来源。同时还考虑了在其它蛋白位点处或附近的内含肽插入物（例如但不限于异构影响因子位点）。在其它蛋白位点处或附近的插入位点与其它位点的距离可以小于或等于25埃、24埃、23埃、22埃、21埃、20埃、19埃、18埃、17埃、16埃、15埃、14埃、13埃、12埃、11埃、10埃、9埃、8埃、7埃、6埃、5埃、4埃、3埃、2埃或1埃，但不仅限于此。

C）插入位点与局部二级结构的邻近程度

内含肽插入位点可以产生在任意类型的局部二级结构中。在一种实施方式中，内含肽插入位点位于环-β-片状接头或α-螺旋接头附近。本文中使用的“附近”指的是插入位点位于从环-β-片状接头或α-螺旋接头始的10个氨基酸以内。本文中使用的插入位点“位于从环-β-片状接头或α-螺旋接头始的10个氨基酸内”表示的是插入位点位于离环-β-片状接头或α-螺旋接头距离为10个氨基酸、9个氨基酸、8个氨基酸、7个氨基酸、6个氨基酸、5个氨基酸、4个氨基酸、3个氨基酸、2个氨基酸或1个氨基酸的氨基酸之前，或者插入位点位于环-β-片状接头或α-螺旋接头第10个氨基酸、第9个氨基酸、第8个氨基酸、第7个氨基酸、第6个氨基酸、第5个氨基酸、第4个氨基酸、第3个氨基酸、第2个氨基酸或第1个氨基酸之前。可以将内含肽插入在环-β-片状接头的2个氨基酸内，或将其插入到环-α-螺旋接头的2个氨基酸内。本文中使用的“在2个氨基酸内”表示将内含肽插入到离环-β-片状接头或环-α-螺旋接头2个氨基酸或1个氨基酸的氨基酸之前，或者将内含肽插入到环-β-片状接头或环-α-螺旋接头第2个氨基酸或第1个氨基酸之前。其它可以插入内含肽的二级结构包括但不限于，在β-片状结构中部处或附近、在α-螺旋结构中部处或附近，在环的中部处或附近。

内含肽插入位点预测小结

基于A）通过SVM描述的局部序列、B）插入位点到活性位点残基的距离和C）插入位点与局部二级结构（例如，环-β-片状接头或环-α-螺旋接头）的邻近程度中的一种或多种，可以对能用来预测蛋白活性的内含肽插入位点进行预测，然后通过实验对其进行测试。可以使用SVM模型对能够将蛋白活性控制在平均水平全部位点中前25%的插入位点进行预测。内含肽插入位点可以在活性位点残基处，或者离活性位点10埃以内范围内。内含肽插入位点的局部二级结构可以在具有β-片状结构或α-螺旋螺旋结构的环形接头处或附近。

预测插入位点后，可以用内含肽对蛋白进行修饰并对其进行筛选。筛选的方法可以包括功能分析法，进而测定内含肽修饰蛋白是否具有许可型、非许可型、条件敏感许可型、热敏许可型或转化表型。筛选的方法还可以包括物理分析，从而能够进行构造使或暴露到诱导条件下后，对内含肽修饰蛋白内的内含肽是否被剪接、切割，或保留在该内含肽修饰蛋白内进行测定。用蛋白质印迹可以用来测定内含肽修饰蛋白中的内含肽是否被剪接、切割或保留在该内含肽修饰蛋白内。功能分析和物理分析的组合可以用来测定内含肽修饰蛋白是否为条件敏感转化剪接型（condition-sensitiveswitchersplicer）。功能分析和物理分析的组合可以通过构造蛋白、将其暴露在诱导温度下、和进行功能分析和物理分析的方法，来测定内含肽修饰蛋白是否为热敏转化剪接型。

通过在任何C/S/T位置前插入内含肽的方法，可以在不进行预测的前提下构造内含肽修饰蛋白。所述C/S/T位置可以是天然的，也可以是引入的。

内含肽修饰蛋白编码序列可以发生突变。这种突变可以发生在内含肽编码序列、外显肽编码序列或它们的组合之上。随后构建出突变的内含肽修饰蛋白，并用功能和/或物理分析对其进行筛选。

在一种实施方式中，提供了一种分离蛋白，该分离蛋白的序列与含有选自由SEQIDNOS:1629-1784和2059-2089所组成的组中任意一种序列的蛋白至少具有70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性。在一种实施方式中，与其所对应的SEQIDNOS:1629-1784和2059-2089氨基酸序列的同一性低于100%的一种或多种蛋白是所参照的蛋白或氨基酸的变体。在一种实施方式中，提供了分离蛋白、分离多肽、分离寡肽、或分离肽，与含有SEQIDNOS:1629-1784和2059-2089中任意序列的蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个、10-600个、10-700个、10-800个、10-900个或10至全部氨基酸相比，所述分离蛋白、分离多肽、分离寡肽、或分离肽与含有SEQIDNOS:1629-1784和2059-2089中任意序列的蛋白具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性。这一序列长度分布列表包括了SEQIDNOS:1629-1784和2059-2089中每一个完整长度的蛋白，以及该列表中每一个长度较短的蛋白，乃至所含氨基酸不足900的蛋白。例如，具有453个氨基酸的序列可以采用6个、10-50个、10-100个、10-150个、10-300个、10-400个和10至全部氨基酸的长度。文中提及的氨基酸序列长度的范围包括在该范围内的每一个氨基酸序列的长度（端点也包含在内）。提及的氨基酸长度可以始于参考序列中任意的独立位置，只要在该独立位置之后具有足够的符合所述长度的氨基酸即可。对于具有1000或更多个氨基酸的序列来说，可以通过增加10-100N个氨基酸来扩大序列长度的范围，其中N=10或更大的整数。通过Smith-Waterman算法可以对同一性进行测量（SmithTF，WatermanMS（1981），“IdentificationofCommonMolecularSubsequences”，JournalofMolecularBiology147：195-197，通过引用其全部内容将其与本文结合）。所含氨基酸序列短于SEQIDNOS:1629-1784和2059-2089中任意一种的完整长度的肽、寡肽或多肽可以用于多种用途，包括但不限于产生抗体来检测内含肽修饰蛋白或其片段。所述抗体可以用来检测内含肽修饰蛋白或其片段是否在植物、植物组织、植物细胞或植物的亚细胞区域或者亚细胞区室中得到了表达。一种实施方式提供了对分离的氨基酸序列上的抗原表位进行识别的抗体，所述分离的氨基酸序列与含有SEQIDNOS:1629-1784和2059-2089中任意序列的蛋白中6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个、10-600个、10-700个、10-800个、10-900个或10至全部的连续氨基酸残基具有至少90%的同一性。

本领域技术人员可以理解的是，可以通过保守氨基酸取代反应得到上述蛋白或氨基酸序列的变体，并提供任意上述具有保守氨基酸改变的序列的变体作为其它的实施方式。本发明的实施方式还包括了具有上述任意序列但不含有合成或非天然产生的氨基酸类似物（和/或肽键）。保守氨基酸取代反应可以是这样的氨基酸取代反应，该反应不会使多肽中发生氨基酸取代反应处的相对电荷或大小特征发生改变。一些情况下，氨基酸采用一下的专用标准的单字母密码（onelettercode）：丙氨酸（A）、丝氨酸（S）、苏氨酸（T）、天冬氨酸（D）、谷氨酸（E）、天冬酰胺（N）、谷氨酰胺（Q）、精氨酸（R）、赖氨酸（K）、异亮氨酸（I）、亮氨酸（L）、蛋氨酸（M）、缬氨酸（V）、苯丙氨酸（F）、酪氨酸（Y）、色氨酸（W）、脯氨酸（P）、甘氨酸（G）、组氨酸（H）、半胱氨酸（C）。“疏水性氨基酸”指的是A、L、I、V、P、F、W和M；“极性氨基酸”指的是G、S、T、Y、C、N和Q；“带电氨基酸”指的是D、E、H、K和R。保守氨基酸取代反应还包括对蛋白活性不产生关键作用的氨基酸所进行的氨基酸取代反应，或者用具有相似特性（例如，酸性、碱性、带正电或带负电、极性或非极性、疏水性、带电性等等）的其它氨基酸对氨基酸进行取代反应，因此对关键氨基酸（criticalaminoacid）进行的取代反应不会使活性发生显著的改变。以下六组均含有能互相用作保守氨基酸取代物的氨基酸：1）丙氨酸（A）、丝氨酸（S）、苏氨酸（T）；2）天冬氨酸（D）、谷氨酸（E）；3）天冬酰胺（N）、谷氨酰胺（Q）；4）精氨酸（R）、赖氨酸（K）；5）异亮氨酸（I）、亮氨酸（L）、蛋氨酸（M）、缬氨酸（V）；和6）苯丙氨酸（F）、酪氨酸（Y）、色氨酸（W）。本领域技术人员可以理解的是，可以作为保守取代物的不仅限于上面确认的取代物。比如说，在一些情况下，可以将所有带电氨基酸（无论带有正电还是负电）视为能互相使用的保守取代物。此外，个体取代反应，能改变、增加或删除已编码序列中的单个氨基酸或小部分氨基酸的缺失或插入作用也可以作为保守氨基酸取代反应。提供了具有相似功能的氨基酸的保守氨基酸取代物表格是本领域公知的，同时对其中本领域已知的传统氨基酸改变进行了考虑。本发明的实施方式中还提出了编码分离蛋白的核酸中的保守核苷酸取代物。保守核苷酸取代物包括但不限于能对已编码氨基酸序列中的保守氨基酸取代物产生影响的那些。此外，可以通过用用于一种氨基酸的密码子用同一氨基酸中不同密码子进行取代的方法，来在基因序列中产生退化的保守核苷酸取代物。

可以根据本领域技术人员已知的用来制备或改变多肽序列及其编码核酸序列的方法来制备分离蛋白、分离多肽、分离寡肽或分离肽，以及它们的变体，例如可以从普通分子生物学文献中获知的内容，例如分子克隆：实验室手册（LaboratoryManual），J.Sambrook等人编辑，第二版，ColdSpringHarborLaboratory出版社，ColdSpringHarbor，N.Y.（1989）或分子生物学实验室指南（CurrentProtocolsinMolecularBiology），F.M.Ausubel等人编辑，JohnWiley&Sons，有限公司，纽约，通过引用这些文献全部记载而将其整体与本文结合。所述分离蛋白、分离多肽、分离寡肽或分离肽可以含有天然氨基酸、天然氨基酸类食物或合成氨基酸类似物。

在一种实施方式中，提供了分离核酸或与其互补的分离核酸，其所含的序列编码的氨基酸序列与含有SEQIDNOS:1629-1784和2059-2089中任意一种序列的蛋白具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性。在一种实施方式中，编码的氨基酸序列与参考序列的同一性低于100%的核酸能够对该参考序列的变体进行编码。在一种实施方式中，提供了分离核酸、分离多核苷酸、或分离寡核苷酸，与含有SEQIDNOS:1629-1784和2059-2089中任意序列的蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个、10-600个、10-700个、10-800个、10-900个或10至全部氨基酸相比，所述分离核酸、分离多核苷酸、分离寡核苷酸所含有的序列编码的氨基酸序列与含有SEQIDNOS:1629-1784和2059-2089中任意序列的蛋白具有至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性。在一种实施方式中提供了所述分离核酸、分离多核苷酸或分离寡核苷酸的互补物。这一序列长度分布列表包括了SEQIDNOS:1629-1784和2059-2089中每一个完整长度的蛋白，和该列表中的每一个长度较短的蛋白，乃至所含氨基酸不足900的蛋白。例如，具有453个氨基酸的序列可以采用6个、10-50个、10-100个、10-150个、10-300个、10-400个和10至全部氨基酸的长度。针对具有1000或更多个氨基酸的序列来说，可以通过增加10-100N个氨基酸来扩大序列长度的范围，其中N=10或更大的整数。通过Smith-Waterman算法可以对同一性进行测量（SmithTF，WatermanMS（1981），“对普通分子子序列的识别（IdentificationofCommonMolecularSubsequences）”，JournalofMolecularBiology147：195-197，通过引用其全部内容将其与本文结合）。

在一种实施方式中提供了一种分离核酸，该分离核酸中的序列与含有SEQIDNOS:1785-1923和2052-2058中任意序列的核酸或其互补物发生杂交。在一种实施方式中，杂交反应的条件可以是低严格度的。在一种实施方式中，杂交反应的条件可以是中等严格度的。在一种实施方式中，杂交反应的条件可以是高严格度的。进行杂交的方案以及对杂交方案进行优化的方法的实例在下面的书籍中进行了描述：分子克隆，T.Maniatis、E.F.Fritsch和J.Sambrook，ColdSpringHarborLaboratory，1982；以及或分子生物学实验室指南，F.M.Ausubel，R.Brent，R.E.Kingston，D.D.Moore，J.G.Seidman，J.A.Smith，K.Struhl，第一卷，JohnWiley&Sons，2000，通过引用这些文献的全部内容将其与本文结合。在实施例（而非限制性）的方式中，中等严格度的杂交反应的条件包括以下：在68℃下将含有DNA的滤膜在含有6X的SSC（Amresco公司，Solon，OH）、0.5%的SDS（Amersco公司，Solon，OH），5X的登哈特（Denhardt’s）溶液（Amersco，公司，Solon，OH)，和100μg/mL的变性鲑鱼精DNA（Invitrogen生命技术公司，Carlsbad，CA)的溶液中进行2-4小时的预处理。在每平方厘米的膜上使用约0.2mL的预处理溶液。对溶液作出下列调整后，在该溶液中进行杂交反应：使用0.01M的EDTA（Amersco公司，Solon，OH），100μg/ml的鲑鱼精DNA和5-20×10⁶每分钟技术（cpm）的³²P-标记的或荧光标记的探针。使滤膜在68℃的杂交反应混合物中培养16-20小时，然后在室温（25±5℃）下用含有2X的SSC和0.1%的SDS溶液洗涤15分钟，同时伴随有轻度振荡。用含有0.1X的SSC和0.5%的SDS的溶液来替换洗液，在68℃下再次进行2小时的培养，同时伴随有轻度振荡。将滤膜进行吸印干燥（blotteddry）和曝光，以在成像器中或者通过自放射显影法进行显像。如有必要，将滤膜进行3次洗涤和再曝光后进行显像。在实施例（而非限制性）的方式中，低严格度表示采用了低温度进行杂交反应的杂交条件，例如37-60℃的温度。在实施例（而非限制性）的方式中，除了采用了高温度（例如，超过68℃的杂交反应温度），高严格度表示的杂交条件与上述相同。

在一种实施方式中，可以将编码至少部分的SEQIDNOS:1629-1784和2059-2089中任意氨基酸序列的分离核酸、分离多核苷酸或分离寡核苷酸用作杂交反应的探针或引物。在一种事实方式中，可以使用所述分离核酸、分离多核苷酸或分离寡核苷酸的互补物作为杂交反应的探针或引物。在一种实施方式中，可以将含有SEQIDNOS:1785-1923和2052-2058中一种序列或与该序列互补的分离核酸、分离多核苷酸或分离寡核苷酸用作杂交反应的探针或引物。此处的分离核酸、分离多核苷酸或分离寡核苷酸的长度可以但不限于10-100个核苷酸、10-90个核苷酸、10-80个核苷酸、10-70个核苷酸、10-60个核苷酸、10-50个核苷酸、10-40个核苷酸、10-35个核苷酸、10-30个核苷酸、10-25个核苷酸、10-20个核苷酸或10-15个核苷酸，或者是20-30个核苷酸，或25个核苷酸。在此提到了核苷酸序列的范围包括在这个范围内的各种长度的核苷酸序列（端点也包含在内）。提及的核苷酸长度可以始于参考序列中任意的独立位置，只要在该独立位置之后具有足够的符合所述长度的核苷酸即可。在一种实施方式中，杂交反应的探针或引物和具有与作为探针或引物的核酸相同长度的核酸有85-100%、90-100%、91-100%、92-100%、93-100%、94-100%、95-100%、96-100%、97-100%、98-100%、99-100%或100%的互补，且所述杂交反应的探针或引物含有的序列选自编码SEQIDNOS:1629-1784和2059-2089蛋白之一的核酸或该核酸的互补物的范围内的与所述探针或引物长度对应的核苷酸。在一种实施方式中，杂交反应的探针或引物在其长度方向上与具有相应长度的编码SEQIDNOS:1629-1784和2059-2089序列之一的核酸或其互补物进行杂交。在一种实施方式中，杂交反应可以在低严格度条件下进行。在一种实施方式中，杂交反应可以在中等严格度条件下进行。在一种实施方式中，杂交反应可以在高严格度条件下进行。

本发明实施方式中的分离核酸、分离多核苷酸或分离寡核苷酸可以包括天然核苷酸、天然核苷酸类似物、或合成核苷酸类似物。本发明实施方式中的核酸、多核苷酸或寡核苷酸可以是任意类型的核酸，包括脱氧核糖核酸（DNA）、核糖核酸（RNA）、或肽核酸（PNA）。列出的SEQIDNOS:1785-1923为DNA序列，还将SEQIDNOS:1785-1923中的U用T代替后的RNA序列考虑作为本发明实施方式的核酸。

虽然本发明实施方式中可以使用未标记的杂交反应探针或引物，但可以通过检测的方式对杂交反应的探针或引物进行标记，并可以用来对核酸进行检测、测序或合成核酸。示例性的标记包括但不限于放射性核元件、吸光的化学部分、染料和荧光部分。所述标记可以是荧光部分，例如6-羧基荧光素（FAM）、6-羧基-4,7,2’,7’-四氯荧光素（TET）、罗丹明、JOE（2,7-二甲氧基-4,5-二氯-6-羧基荧光素）、HEX（六氯-6-羧基荧光素）或VIC。

在一种实施方式中，将适于在所期望的宿主内进行表达的表达构建体（expressionconstruct）中提供编码内含肽修饰蛋白、内含肽修饰蛋白变体或内含肽修饰蛋白片段的分离核酸、分离多核苷酸或分离寡核苷酸。内含肽修饰蛋白片段可以包括保持了内含肽修饰蛋白活性的部分内含肽修饰蛋白。但是所述片段还可以具有其它的用途，例如能够起到产生抗体的抗原的作用，该抗体随后能用来测定内含肽修饰蛋白或其片段在植物、植物组织、植物细胞或植物的亚细胞区域或亚细胞区室内，或者被从这些地方提取出来。核酸含有的序列能编码这样的氨基酸序列：该氨基酸序列与含有SEQIDNOS:1629-1784和2059-2089任一序列的蛋白具有70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性。在表达构建体内的内含肽修饰蛋白编码核酸片段可以对这样的氨基酸序列进行编码：与含有SEQIDNOS:1629-1784和2059-2089中任一序列的蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个、10-600个、10-700个、10-800个、10-900个或10至全部氨基酸相比，该氨基酸序列与SEQIDNOS:1629-1784和2059-2089中任一氨基酸序列具有75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性。这一序列长度分布列表包括了SEQIDNOS:1629-1784和2059-2089中每一个完整长度的蛋白，和该列表中的每一个长度较短的蛋白，乃至那些所含氨基酸不足900的蛋白。例如，具有453个氨基酸的序列可以采用6个、10-50个、10-100个、10-150个、10-300个、10-400个和10至全部氨基酸的长度。针对具有1000个或更多个氨基酸的序列来说，可以通过增加10-100N个氨基酸来扩大序列长度的范围，其中N=10或更大的整数。所述核酸可以包括与含有SEQIDNOS:1785-1923和2052-2058中之一序列的核酸或其互补物进行杂交的序列。在一种实施方式中，杂交反应可以在中等严格度条件下进行。在一种实施方式中，杂交反应可以在低严格度条件下进行。在一种实施方式中，杂交反应可以在高严格度条件下进行。

所述表达构建体可以是任何能在适当宿主内对内含肽修饰蛋白或其片段进行表达的合适的表达构建体。该表达构建体的一种实施方式为pAG2005（SEQIDNO:1），或者是与SEQIDNO:1序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相似度的任何表达构建体。在一种优选的实施方式中，在pAG2005中提供编码前述任意蛋白或其片段的核酸。可以在水稻泛素启动子的控制下，将核酸克隆到pAG2005中的KpnI和EcoRI位点。

分离核酸、分离多核苷酸或分离寡核苷酸在表达构建体内可以是针对表达宿主而进行密码子优化的。密码子优化可以是但不限于针对植物的密码子优化。密码子优化可以是针对但不限于柳枝稷（switchgrass）、玉米、芒草（miscanthus）、高粱、甘蔗、小麦或水稻的。

含有一个或多个核酸、多核苷酸或寡核苷酸的用于表达构建体的宿主可以是植物。该植物可以是单子叶植物。所述单子叶植物可以是但不限于柳枝稷、玉米、芒草、高粱、甘蔗、小麦或水稻。前述植物可以是双子叶植物。所述双子叶植物可以是但不限于大豆、油菜、杨树、柳树或油菜籽。表达构建体可以是pAG2005（SEQIDNO:1），已示于图2A-2B中。表达构建体中的核酸能够可操作地连接到启动子上。所述启动子可以控制内含肽修饰蛋白或其片段的表达，启动子可以是但不限于植物泛素启动子系统、玉米泛素启动子、缺少一个或多个热休克元件的改性玉米泛素启动子、水稻泛素启动子、水稻肌动蛋白1启动子、水稻肌动蛋白2启动子、γ-玉米蛋白启动子、谷蛋白启动子、玉米PR-1启动子、玉米乙醇脱氢酶1启动子、CaMV19S启动子、CaMV35S启动子、35S-增强mas（甘露碱合成酶基因）启动子、35S最小化启动子、拟南芥PR-1启动子、烟草PR-la启动子、胭脂氨酸合成酶（opalinesynthase）启动子、大豆热休克启动子、章鱼碱合成酶启动子、甘露碱合成酶启动子、合成启动子、乙醇诱导启动子、四环素诱导启动子、类固醇诱导启动子、激素诱导启动子、基于蜕皮激素受体的启动子、酵母铜反应（yeastcopperresponsive）启动子、金属硫蛋白启动子、热调解启动子、冷诱导启动子、土豆α-淀粉酶启动子、光调解启动子、玉米叶绿素a/b启动子、暗激活和光激活的Cab启动子、组织特异性的启动子、根启动子、种子特异性启动子或组成型启动子。启动子可以是组成型启动子或诱导型启动子，也可以是水稻泛素启动子、玉米泛素启动子、γ-玉米蛋白启动子、谷蛋白启动子或水稻肌动蛋白启动子。可以将核酸提供在与玉米泛素启动子可操作地链接的pAG2005中，并可以将表达构建体提供在柳枝稷、玉米、芒草、高粱、甘蔗、小麦或水稻内。可以在水稻泛素启动子的控制下，将核酸克隆到pAG2005中的KpnI和EcoRI位点。在一种实施方式中，如果任意上述表达构建体中的核酸能对与SEQIDNOS:1629-1784和2059-2089中任一具有低于100%同一性的氨基酸序列进行编码，它所编码的是该氨基酸序列的变体。

参见图2A-2B，pAG2005（SEQIDNO:1）包括具有第一内含子的水稻（Oryzasativa）泛素3基因启动子（OsUbi3启动子，12-2094核苷酸）、对用来选择转化体的磷酸甘露糖异构酶进行编码的序列（PMI，2104-3279核苷酸）、左T-DNA边界（LB，3674-3698核苷酸）、ColE1复制起点（Ori，6970核苷酸）、右T-DNA边界（RB，9717-9741核苷酸），具有第一内含子的二号OsUbi3启动子（9948-12015核苷酸）以及Nos终止子（12035-12310核苷酸），其中的核苷酸数字是从驱动PMI的OsUbi3启动子的5’端开始，相对于EcoRI序列内的1号核苷酸进行的编号。

在一种实施方式中，向转基因植物中提供一种或多种本发明的分离核酸、分离多核苷酸、分离寡核苷酸和/或表达构建体。可以通过土壤杆菌（Agrobacterium）介导的转化或本领域已知的其它合适的方法来将所述分离核酸、分离多核苷酸、分离寡核苷酸和/或表达构建体引入植物中。土壤杆菌介导的向未成熟玉米胚芽中的转化过程可以按照Negrotto等人，（2000）PlantCellReports19:798-803中描述的进行，通过引用该文献全部记载而将其整体与本文结合。

本发明的实施方式还包括突变内含肽，其用途可以包括但不局限于对蛋白质进行修饰。所述突变内含肽包括但不限于那些与含有SEQIDNOS:92-103中任一序列的蛋白，或者SEQIDNOS:1675、1678-1681、1689、1691、1700-1708和1710中任一所含的任意内含肽相比，具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性的突变内含肽。实施方式还包括对突变内含肽进行编码的核酸，所述突变内含肽包括但不限于那些与含有SEQIDNOS:92-103中任一序列的蛋白，或者SEQIDNOS:1675、1678-1681、1689、1691、1700-1708和1710中任一所含的任意内含肽相比，具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性的突变内含肽。实施方式还包括对突变内含肽进行编码的核酸，其中所述核酸与编码含有SEQIDNOS:92-103中任一序列的蛋白、或SEQIDNOS:1675、1678-1681、1689、1691、1700-1708和1710中任一所含的任意内含肽的核酸或其互补物发生杂交。在一种实施方式中，杂交反应可以在低严格度条件下进行。在一种实施方式中，杂交反应可以在中等严格度条件下进行。在一种实施方式中，杂交反应可以在高严格度条件下进行。可以诱导突变内含肽从其所插入的蛋白上发生切割和/或剪接。诱导条件可以包括将内含肽暴露在变化的物理条件或化学条件中，例如但不限于温度、pH、剪接抑制剂的浓度、配体浓度、光、盐条件和压力方面的改变。所述诱导条件可以是提高温度，但不仅限于此。提高的温度可以是但不限于50-70℃的范围，包括50℃和70℃的温度。所提高的温度可以大于或等于在25-70℃内以整数递增的温度。所提高的温度可以大于或等于50℃、55℃、59.9℃、60℃、65℃或70℃。可以使用这样的内含肽对蛋白、酶、纤维素酶或木聚糖酶进行修饰：该内含肽与含有SEQIDNOS:2、3、4-103、113-392中序列的蛋白，或与SEQIDNOS:1675、1678-1681、1689、1691、1700-1708和1710中任一所含有的任意一种内含肽相比，具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性，可以使用这种内含肽来对蛋白、酶、纤维素酶或木聚糖酶进行修饰。可以使用这样的核酸从核酸水平上来对蛋白、酶、纤维素酶或木聚糖酶进行修饰：该核酸与编码SEQIDNOS:92-103，或SEQIDNOS:1675、1678-1681、1689、1691、1700-1708和1710中任一所含的内含肽的任意一种的核酸或其互补物发生杂交。可以通过将SEQIDNOS:1675、1678-1681、1689、1691、1700-1708和1710中各个内含肽序列与SEQIDNO:91的Tth内含肽序列比较后得到上述序列中的内含肽序列。

按照上文的描述，实施方式包括这样的氨基酸序列，其中，与含有SEQIDNOS:1629-1784和2059-2089中任意序列的蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个、10-600个、10-700个、10-800个、10-900个或10至全部氨基酸相比，一个所述序列与含有SEQIDNOS:1629-1784和2059-2089中任意序列的蛋白具有至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性。实施方式包括编码所述氨基酸序列的核酸，以及识别位于所述氨基酸序列上的抗原表位的抗体。短于完整长度的氨基酸序列可以从对应于所截取长度的氨基酸的SEQIDNOS:1629-1784和2059-2089序列之一上的任意位置进行选择。可以从具有上游内含肽-外显肽接头的SEQIDNOS:1629-1784和2059-2089任一序列中的一部分上择短于完整长度的氨基酸序列，在其中任意两个相邻位置处，所述上游内含肽-外显肽接头的N-外显肽上具有C-末端残基，且内含肽上具有N-末端残基。举例来说，SEQIDNOS:2059-2089序列中的236-237位置分别是各个序列的N-外显肽的C-末端残基和内含肽的N-末端残基，因此选自SEQIDNOS:2059-2089中任一序列中的短于完整长度的氨基酸序列可以使236-237残基包含在所截取长度范围内的任意两个位置上。可以从具有下游内含肽-外显肽接头的SEQIDNOS:1629-1784和2059-2089任一序列中的一部分上选择短于完整长度的氨基酸序列，在其中任意两个相邻位置处，所述下游内含肽-外显肽接头的内含肽上具有C-末端残基，且C-外显肽上具有N-末端残基。举例来说，SEQIDNOS:2059-2089序列中的372-373位置分别是各个序列的内含肽的C-末端残基和C-外显肽的N-末端残基，因此选自SEQIDNOS:2059-2089中任一序列中的短于完整长度的氨基酸序列可以使616-617残基包含在所截取长度范围内的任意两个位置上。可以从SEQIDNOS:1629-1784和2059-2089任一序列中的一部分上选择短于完整长度的氨基酸序列，其中，在被选择部分内的位置上，含有至少一种不同于天然内含肽或天然蛋白序列的氨基酸。举例来说，下面的序列含有相对于碱基序列（SEQIDNOS:2059）的突变（以序列ID后加“/AAi#AAj”表示）：SEQIDNOS1:

2060/P325V；SEQIDNO：2061/E312I；SEQIDNO：2062/L320R；SEQIDNO：2063/L145I；SEQIDNO：2063/G323V；SEQIDNO：2063/A656V；SEQIDNO：2064/A350R；SEQIDNO：2065/P346V；SEQIDNO：2066/L234A；SEQIDNO：2066/A656V；SEQIDNO：2067/N232K；SEQIDNO：2067/A656V；SEQIDNO：2068/E335K；SEQIDNO：2068/W338Y；SEQIDNO：2069/N232K；SEQIDNO：2069/A656V；SEQIDNO：2070/V235S；SEQIDNO：2070/A656V；SEQIDNO：2071/R233G；SEQIDNO：2071/A656V；SEQIDNO：2072/L337R；SEQIDNO：2072/A656V；SEQIDNO：2073/N232K；SEQIDNO：2073/A656V；SEQIDNO：2074/N232C；SEQIDNO：2074/A656V；SEQIDNO：2075/N232L；SEQIDNO：2075/A656V；SEQIDNO：2076/L234G；SEQIDNO：2076/A656V；SEQIDNO：2077/N232S；SEQIDNO：2077/A656V；SEQIDNO：2078/N232W；SEQIDNO：2078/A656V；SEQIDNO：2079/R233L；SEQIDNO：2079/A656V；SEQIDNO：2080/N232V；SEQIDNO：2080/A656V；SEQIDNO：2081/R233S；SEQIDNO：2081/A656V；SEQIDNO：2082/N232M；SEQIDNO：2082/A656V；SEQIDNO：2083/N232A；SEQIDNO：2083/A656V；SEQIDNO：2084/N232V；SEQIDNO：2084/A656V；SEQIDNO：2085/L337M；SEQIDNO：2086/N232S；SEQIDNO：2086/A656V；SEQIDNO：2087/V235G；SEQIDNO：2087/A656V；SEQIDNO：2088/D339V；SEQIDNO：2089/L145I；SEQIDNO：2089/G323V；andSEQIDNOS:2089/A656V。选自SEQIDNOS:2060-2089任一序列中的短于完整长度的氨基酸序列中，可以含有一种或多种有关上述SEQIDNO:2059的氨基酸改变。类似地，可以从本发明任意其他序列中选择短于完整长度的氨基酸序列，所述任意其他序列中含有一种或多种有关天然内含肽或天然酶的氨基酸改变。如果所选择的短于完整长度的氨基酸序列含有不止一个氨基酸改变，则氨基酸改变彼此之间的相对位置可以保持不变。然而，上述一种或多种氨基酸改变也可以存在于短于完整长度氨基酸序列被截取的长度内的任何位置。本文提供的核酸能编码任一短于完整长度的氨基酸序列。本文提供的核酸可以为上文描述的任何长度，包括编码上游内含肽-外显肽接头、下游内含肽-外显肽接头或在内含肽修饰蛋白序列相对于天然蛋白或天然内含肽序列发生的改变中的至少一种。本文提供的抗体能对任一短于完整长度氨基酸序列上抗原表位进行识别。所述抗原表位可以包括上游内含肽-外显肽接头、下游内含肽-外显肽结构、在短于完整长度氨基酸序列中的有关天然内含肽或天然蛋白序列、或在短于完整长度氨基酸序列中的任意其它序列的一种或多种改变。

本发明中任一实施方式都可以用一种或多种其它本发明实施方式中的一个或多个元件进行补充。

实施例——下文提供了非限制性的实施例来对具体的实施方式进行阐述。可以通过一个或多个来自下面实施例（一个或多个）的细节来对全部的实施方式进行完善。

实施例1——对内含肽插入位点的预测。使用A）通过SVM预测的局部序列、B）插入位点到活性位点残基的距离，或C）插入位点与局部二级结构（例如，α-螺旋结构或β-片状结构）的邻近程度能够对下列木聚糖酶和纤维素酶中的插入位点进行预测：芽孢杆菌NG-27木聚糖酶（登录号为O30700（SEQIDNO:106））；粪堆梭菌xynB木聚糖酶（登录号为P40942（SEQIDNO:108））；疏棉状嗜热丝孢菌xynA木聚糖酶（登录号为O43097（SEQIDNO:107））；嗜热网球菌xynB木聚糖酶（登录号为P77853（SEQIDNO:104））；热纤梭菌celK纤维素酶（登录号为O68438（SEQIDNO:109））；褐色热单胞菌celB纤维素酶（登录号为P26222（SEQIDNO:110））；解纤维热酸菌纤维素酶（登录号为P54583（SEQIDNO:111））；以及高山象白蚁纤维素酶（登录号为O77044（SEQIDNO:112））。对这些木聚糖酶和纤维素酶中的每一个来说，基于C/T/S残基中的任意原子与活性位点任意残基中的任意原子之间的最短距离计算酶中各个C/T/S位点与活性位点之间的距离。接着，得到每个NNNXNN局部序列盒（其中X为C/T/S）的SVM评分。按照上文的描述，用SEQIDNOS:1233-1512的内含肽插入物盒序列对SVM进行训练和使用。通过以下对SVM的正确性进行测试：1）随机选择m组具有单一序列的真阳性训练组插入位点，所述单一序列选自SEQIDNOS:1233-1512中含内含肽蛋白的文库；2）含有3个来自外显肽序列（真阳性插入盒从此中选出（SEQIDNOS:673-1232））的其它随机盒的真阴性；3）将SEQIDNOS:1233-1512的内含肽插入位点盒中余下的其它序列作为真阳性测试组，其中，对已知的内含肽插入位点进行过滤以除去训练组中的序列；和4）测试组中的真阴性选自外显肽序列（SEQIDNOS:673-1232）中的其它C/S/T位点。训练组中的每一个真阴性含有与对应真阳性相同的中心氨基酸X，但在该真阴性氨基酸位置处不含有内含肽插入物。

对在10埃以或更近距离内且/或SVM评分大于0的位点进行进一步的分析。将那些在SVM评分方面具有较高得分但距离超过20埃的位点进行排除。接着，对全部候选位点的二级结构进行测定，并且优先选择位于环-(α-螺旋结构或β-片状结构)接头处的位点。位于长表面环上未直接与活性位点相邻的位点，或者在蛋白中心的位点也被排除。据此预测的插入位点列于下表2中。

表2

实施例2——对木聚糖酶进行克隆、表达和活性分析。将野生型木聚糖酶进行克隆，从而在λ噬菌体和大肠杆菌（E.coli）筛选系统中进行表达。在具有或不具有一个连接到编码序列羧基端（下文称为“C-末端”）的6组氨酸标记的情况下，对编码9个木聚糖酶的核酸进行PCR扩增。这些木聚糖酶是未培养细菌GH11木聚糖酶（登录号为EU591743（SEQIDNO:1924））、芽孢杆菌NG-27木聚糖酶（登录号为O30700（SEQIDNO:106））、疏棉状嗜热丝孢菌xynA木聚糖酶（登录号为O43097（SEQIDNO:107））、粪堆梭菌xynA木聚糖酶（登录号为P33558（SEQIDNO:1925））、热纤梭菌xynY木聚糖酶（登录号为P51584（SEQIDNO:105））、嗜热网球菌xynB木聚糖酶（登录号为P77853（SEQIDNO:104））、粪堆梭菌xynB木聚糖酶（登录号为P40942（SEQIDNO:108））、菊欧文氏菌（Erwiniachrysanthemi）木聚糖酶（登录号为Q46961（SEQIDNO:1926））和热袍菌（Thermotogasp.xynA）xynA木聚糖酶（登录号为Q60044（SEQIDNO:1927））。使PCR产物经过EcoRI/XhoI酶切（37℃，1小时）、柱纯化（MinElutePCR提纯试剂盒，Qiagen），并连接（在4℃下进行至少40小时，或者在12℃下进行至少12小时）到预先进行了酶切的λII载体（Stratagene）中。λII载体中的表达盒在图35中示出，其目标基因以灰色方框表示。将酶基因连接到预先进行了酶切的载体上后，用噬菌体包装提取物（phagepackagingextract，Stratagene）将含有酶基因的载体包装到λ噬菌体中（室温下进行2小时）。用重组噬菌体感染XL1-BlueMRF’大肠杆菌细胞（Stratagene），然后将其析出在含有0.2%的AZCL-木聚糖底物（Megazyme）的NZY琼脂平板上（在-cDNAGigapackIIIGoldCloning试剂盒中进行了描述，Stratagene）。每升NZY琼脂平板含有10g的NZ胺（酪蛋白水解物）、5g的NaCl、2g的MgSO₄*7H₂O、5g的酵母提取物和15g的琼脂，用NaOH将pH调至7.5，按照商家（Stratagene）的说明在高压釜中进行灭菌。AZCL-木聚糖底物（Megazyme）含有天青精交联的木聚糖，它在水解后能释放染料呈现出蓝色。在37℃下进行整夜培养后，目测平板上的噬菌斑内部和周围产生的蓝色。基于水解AZCL-木聚糖底物进而在噬菌斑内部和周围产生蓝色的能力，将木聚糖酶活性评分为有活性或无活性。通过PCR证实选出的斑中含有目标木聚糖酶基因，并重新析出在含有0.2%的AZCL-木聚糖的NZY琼脂平板上，来验证噬菌斑中的木聚糖酶的酶活性。

将每个表达木聚糖酶的噬菌体分离物在XL1-BlueMRF’大肠杆菌细胞中进行扩增，从而得到高滴度的噬菌体裂解液，在存在异丙基β-D-1-硫代半乳糖苷（IPTG，不含二噁烷，99%纯度；购自ResearchProductsInternational公司）的情况下用XL1-BlueMRF’大肠杆菌细胞（Stratagene）进行二次感染的过程中使用上述噬菌体裂解液，以诱发木聚糖酶的表达。将等份的裂解液至于从4-70℃的不同温度下进行最多4小时的培育，然后在4℃下冷却至少2个小时。用试剂盒（Invitrogen^TM）或通过将AZCL-木聚糖底物添加至0.2%并在37℃或70℃下进行4小时培育的方法来测量各个裂解液中的木聚糖酶活性。

在含AZCL-木聚糖的NZY琼脂平板上和通过液相分析来对木聚糖酶活性进行比较。在添加了AZCL-木聚糖底物的NZY琼脂平板上，具有或不具有C-末端His-标签的P77853显示出具有最强活性，接下来是P51584、O43097和O30700。在全部的实例中，6His-标签至少对木聚糖酶活性产生了一定的抑制作用。

实施例3——将内含肽插入木聚糖酶内。通过PCR途径将多个内含肽插入表2中列出的预测位点的子集中。首先，通过PCR（Phusion^TMTaq聚合酶（NewEnglandBiolabs），遵照操作手册进行）分别产生3段DNA：来自木聚糖酶的“N”（代表氨基末端或N-外显肽片段）和“C”（代表羧基末端或C-外显肽片段），以及表示内含肽的“I”（代表内含肽）。对内含肽片段I进行扩增，这样I与木聚糖酶PCR片段N上的C-末端具有20个核苷酸的重叠部分，并与C木聚糖酶PCR片段C上的N-末端有20个核苷酸的重叠区域。随后通过两步PCR（Accumprime^TMTaq聚合酶Pfx（Invitrogen））将N、I和C片段组装为编码内含肽修饰酶的相邻基因。本文中使用的“NIC”指的是木聚糖酶DNA片段的N-末端与期望的内含肽发生了融合，该期望中，内含肽与木聚糖酶DNA片段的C-末端也发生了融合。虽然“NIC”在本实施例上下文中表示内含肽修饰的木聚糖酶，“NIC”也可以表示任意内含肽修饰蛋白中的M-外显肽、内含肽和C-外显肽连续序列。针对不同构造采用了遵照以下格式的命名习惯：（靶酶）-（内含肽）-（插入位点）-（突变体编号）；例如，可以将在S158处插入P77853中的Tth内含肽命名为P77853-Tth-S158。类似地，将在T134处插入P77853中的Tth内含肽命名为P77853-Tth-T134。然后在连接号后加入每个内含肽修饰酶中的突变体；例如P77853-Tth-S158-1、P77853-Tth-S158-2、P77853-Tth-S158-3、P77853-Tth-S158-4等。

通常来说，进行NIC组装的第一步中，在主混合（mastermix）中使用N、I和C编码核酸各100ng，主混合中含有1×缓冲PCR反应缓冲液、200μΜ的各个dNTP、和1单位的PfxTaq聚合酶/12.5μL，在95℃下进行一次2分钟的循环，接着进行5次3步加热循环：95℃下进行2分钟，45℃下进行1分钟和68℃下进行2分钟（使用较长基因时改为3分钟），接着在68℃下进行15分钟的最终的PCR延伸。第二步是对NIC进行扩增，其中，用0.15μΜ的引物对含有组装NIC的主混合进行PCR扩增，所述引物与组装NIC的DNA的5’端和3’端发生杂交。第二步中的加热循环在95℃下进行1个2分钟的循环，接着进行27个3步加热循环：95℃下进行20秒，58℃下进行30秒和68℃下进行3分钟，然后在68℃下进行15分钟的最终的PCR延伸。

进行上面实施例2中描述的步骤后，用QIAquick凝胶回收试剂盒（QIAquickGelExtractionKit，Qiagen）对按照上述方法制得的组装NIC基因进行凝胶提纯，并用EcoRI和XhoI（NewEnglandBiolab）进行酶切，再通过QIAquick凝胶回收试剂盒（Qiagen）进行凝胶纯化，用预先进行了切割的λII载体（Stratagene）进行连接。

将产物放在含0.2%的AZCL-木聚糖底物的NZY琼脂平板上，在37℃下进行整夜培养后，对菌斑的木聚糖酶活性进行评分。然后将上述平板在37-70℃的温度下进行最多4小时的培养后，再次对各个菌斑的木聚糖酶活性进行评分。以整夜培养和二次培养之后进行的活性评分为基础，将各个菌斑归入不同的表型。在37℃下进行整夜培养后即出现蓝色的菌斑，在升高温度下进行二次培养后仍然具有蓝色，将这种菌斑评定为许可型。在37℃下进行整夜培养后没有出现蓝色的不活泼的菌斑，在升高温度环境下进行第二次培养后确实出现了蓝色，将这种菌斑评定为转化型。将在37℃下进行整夜培养和在提高温度的环境下进行二次培养后依然没有活性的菌斑评定为非许可型。以内含肽修饰的木聚糖酶（在特定位点上含有内含肽）在琼脂平板上的表型为基础，将各个内含肽插入物划分为许可型（内含肽插入物不会对蛋白功能产生干扰，或者内含肽在37℃下进行整夜培养的过程中发生了剪接）、非许可型（内含肽插入物在全部测试条件下都对蛋白功能造成了干扰）或转化型（在高温下进行4小时培养后才能观察到木聚糖活性，而在37℃下进行整夜培养之后却没有观察到活性）。

对应于各个插入位点从平板上挑选出菌斑，遵照操作手册说明（Stratagene）将其切成噬菌粒。简而言之，将λII载体设计成能进行简单有效的或体内切除，然后对λ载体内全部的克隆插入物进行重新环化（recirculization），形成含有克隆插入物的噬菌粒。为了将克隆插入物切成噬菌粒，将分离出来的菌斑转移到无菌微型离心试管内，该微型离心试管内含有500μL的SM缓冲液（Stratagene）和20μL的氯仿。搅动试管以使噬菌体颗粒释放到SM缓冲液中。将离心试管在室温下培养至少1个小时，或者在4℃下培养整夜。进行培养之后，将预先制好的XL1-BlueMRF’（Stratagene）和SOLR^TM（Stratagene）细胞在1000×g下进行数分钟的离心作用。将得到的团块物用25ml的MgSO₄进行再悬浮直到得到OD₆₀₀等于1.0（8×10⁸个细胞/ml）的10mMMgSO₄。将细胞进行再悬浮后，将OD₆₀₀为1.0的200μL的XL1-BlueMRF’细胞，250μL所期望的分离噬菌体液（phagestock）（含有>1×10⁵个噬菌体颗粒）和1μL的（Stratagene）辅助噬菌体（>1×10⁶pfu/μL）加入15mL的聚丙烯试管中。将该聚丙烯试管在37℃下培养15分钟以允许噬菌体附着到细胞上。培养后，加入3mL的含有添加物的LB肉汤，一边摇晃一边将混合物在37℃下培养2.5-3小时。然后将混合物在65-70℃下加热20分中以使λ噬菌体颗粒和细胞发生裂解。在发生裂解之后，将试管放在1000×g下进行10分钟的离心，从而将细胞碎片压成丸状。将上清液倾析到另一个无菌试管内。该上清液中含有的离体噬菌粒为丝状噬菌体颗粒。为了使离体噬菌粒析出，将200μl新生长的SOLR^TM细胞（OD₆₀₀=1.0）与100μl噬菌体上清液在1.5ml的微型离心试管中进行混合。将混合物在37℃下培养15分钟，然后将200μL的细胞混合物倒在LB-氨苄西林琼脂平板（100μg/mL）上，并在37℃下培养整夜。获得的菌落中含有离体噬菌粒。各个噬菌粒含有耐氨苄西林标记物以支持其在含氨苄西林的培养基中的生长。通过PCR和DNA测序进行证实后，可以将噬菌粒克隆体在自诱导培养基中（本文中称为AIM，可商购自Novagen，商品名为OvernightExpress^TMInstantTBMedium）培养整夜。用FastBreak^TM裂解缓冲液（Promega）使细胞发生裂解，并通过蛋白质印迹对其剪接作用进行测定。

NZY琼脂平板上的内含肽修饰的木聚糖酶的菌斑表型进行测定，并通过改良的蛋白质印迹操作（在下面实施例5中进行描述）对前体积累和成熟木聚糖酶积累进行分析。Psp-pol内含肽（SEQIDNO:3）插入P77853内的S112处（SEQIDNO:1696）和S124处（SEQIDNO:1697），这两个是实施例1（上文）中被预测为插入位点的位置。对这些位置的菌斑表型进行评分：S112为许可型而S124为非许可型。在蛋白质印迹中，S112处积累了一定量的内含肽修饰的木聚糖酶前体和一定量的成熟木聚糖酶。S124积累的主要是内含肽修饰的木聚糖酶前体。除了这些预测位点之外，Psp-pol内含肽还可以插入多个其它位点。在所测试的其它位点之中，在S63（SEQIDNO:1692）、S86（SEQIDNO:1694）、S95（SEQIDNO:1695）和S178（SEQIDNO:1698）处插入Psp-pol内含肽后产生的菌斑被评定为转化表型。进行蛋白质印迹时，在这些位点处在未加热时积累了内含肽修饰的木聚糖酶前体，将噬菌体裂解液在70℃下进行热处理后，该位点处积累了内含肽修饰的木聚糖酶前体和成熟的木聚糖酶。

Tag内含肽（SEQIDNO:90）插入P77853内的S112处、T113处、S124处、T134处、T145处、S158处和T199，这是实施例1（上文）中被预测为插入位点的位置。根据其表型对表达含有Tag内含肽的P77853内含肽修饰的木聚糖酶的菌斑进行评分：S112（非许可型）、T113（非许可型）、S124（非许可型）、T134（许可型）、T145（转化型）、S158（非许可型）和T199（非许可型）。Tag内含肽修饰的木聚糖酶前体在S112、T113、S124、T134、T145、S158和T199插入处发生积累；但是仅T145和T199处积累了成熟的木聚糖酶。通过其它插入位点上的蛋白质印迹可以观察到其它的切割产物。

Tth内含肽（SEQIDNO:90）插入P7853木聚糖酶内的S112处、T113处、S124处、T134处、T145处、S158处和T199处，这是实施例1（上文）预测的插入位点的位置。将这些位置的菌斑表型评定为下：S112（许可型）、S124（转化型）、T113（非许可型）、T134（转化型）、S158（转化型）、T145（非许可型）和T199（非许可型）。在蛋白质印迹中，在S112处、S124处、T113处、T134处、S158处、T145处和T199处检测到积累了一定量的内含肽修饰的木聚糖酶前体。在S112处、S124处、T113处、S158处和T145处的蛋白质印迹中检测到了成熟的木聚糖酶。

微小Psp-Pol内含肽mPspM1L4（SEQIDNO:7）和mPspM5L5（SEQIDNO:36）P7853木聚糖酶内的S112插入位点处，这是实施例1（上文）预测的插入位点的位置。当从S112处插入时，将表达含有mPspM1L4或mPspM5L5的内含肽修饰的木聚糖酶P77853的菌斑评定为非许可表型，并且不对其进行蛋白质印迹分析。类似地，微小Psp-Pol内含肽中的mPspM1L4（SEQIDNO:7）、mPspM1L7（SEQIDNO:10）、mPspM2L5（SEQIDNO:15）、mPspM4L3（SEQIDNO:27）、mPspM5L2（SEQIDNO:33）、mPspM5L5（SEQIDNO:36）和mPspM7L3（SEQIDNO:48）插入P77853木聚糖酶内的S67处时，产生的是非许可型菌斑表型。与此相反的是，这些内含肽（mPspM1L4（SEQIDNO:7）、mPspM1L7（SEQIDNO:10）、mPspM2L5（SEQIDNO:15）、mPspM4L3（SEQIDNO:27）、mPspM5L2（SEQIDNO:33）、mPspM5L5（SEQIDNO:36）和mPspM7L3（SEQIDNO:48））插入P77853木聚糖酶内地S95和S178处时，产生的是许可型菌斑。

Psp-Pol内含肽（SEQIDNO:3）插入O30700木聚糖酶内的S215处、T314处和S357处，这是实施例1（上文）预测的插入位点的位置。在这些位置处插入的Psp-Pol内含肽的菌斑表型在S215和S314处被评定为非许可型，在S357处被评定为许可型。相反地，微小Psp-Pol内含肽mPspM1L4（SEQIDNO:7）和mPspM3L5（SEQIDNO:22）插入在相同的位点，但S314被评定为许可型，而S214和S357被评定为非许可型。

Tth内含肽（SEQIDNO:91）插入O30700木聚糖酶内的S95处、T137处、S215处、T250处、S358处、S314处和S357处，这是实施例1（上文）预测的插入位点的位置。对插入了Tth内含肽的O30700木聚糖酶进行表达的噬菌体的菌斑表型评定如下：S95许可型）、T137（非许可型）、S215（非许可型）、T250（非许可型）、S314（许可型）、S357（非许可型）和S358（许可型）。

将Mth内含肽（SEQIDNO:2）和Tag内含肽（SEQIDNO:90）分别通过独立的实验融合到O30700木聚糖酶的C-末端上，从而使生成的内含肽修饰蛋白在经过37℃的整夜培养后具有活性，这表示将C-末端与Mth内含肽和Tag内含肽进行融合后可以得到O30700的许可型。

Tth内含肽（SEQIDNO:91）插入O43097木聚糖酶内的S47处、S50处、S103处、T111处、T126处、S130处、T134处、T151处、T152处、S158处、T164处、S170处、T208处、S213处和S214，这是实施例1（上文）预测的插入位点的位置。对表达Tth内含肽修饰的O43097木聚糖酶的噬菌斑的表型评定如下：S47（许可型）、T134（非许可型）、T151（非许可型）、T152（非许可型）、S158（非许可型）、T164（非许可型）、S170（非许可型）、T208（非许可型）、S213（许可型）、S214（许可型）。在蛋白质印迹分析中，在S47、S50、S103、T111、S130、T164、S213和S214的插入位点处观察到Tth内含肽修饰的O43097木聚糖酶前体，在S47、S50、S103、S213和S214的插入位点处观察到成熟的O43097木聚糖酶。不对这样的噬菌体裂解液进行蛋白质印迹分析：该噬菌体裂解液来自在T126、T134、T152、S158处对Tth内含肽修饰的O43097木聚糖酶进行表达的噬菌体。

通过上文可以发现，在根据本文的方法基础上预测的插入位点处插入内含肽可以得到具有转化表型的内含肽修饰蛋白。但该方法发同时还产生了许可型候选者（可能发生了切割或剪接）或非许可型候选者（没有发生切割或剪接）。在通过本发明的方法找到的位点之外处插入的内含肽可以获得转化表型。但本发明的方法使具有较大可能产生转化表型的候选池得到了丰富。

实施例4——对内含肽修饰酶进行诱变。本领域中存在多种不同的蛋白诱变方法，作为一种非限制性的实例，按下文所描述采用不同的具体策略来产生内含肽修饰酶的变体。

使用（Stratagene）诱变试剂盒在木聚糖酶、内含肽修饰的木聚糖酶或上述实施例中的内含肽中产生随机突变。每次使用对模板DNA进行扩增时，有一定可能在新合成的DNA中发生突变。实践中，可以通过改变模板DNA用量以及PCR循环的次数获得突变率。本文中的诱变PCR操作最优选为：对整个盒或内含肽编码部分进行修饰时，每个内含肽中产生1-2个氨基酸突变。

为了实现整体盒的诱变，遵照操作手册，用II随机诱变试剂盒（Stratagene）用M13正向引物和反相引物对5μg的噬菌粒NICDNA进行10次PCR扩增循环。简单来说，将5μg的待诱变处理的噬菌粒NICDNA与1×缓冲PCR反应缓冲液、200μΜ的各个dNTP、0.15μΜ的引物（与NICDNA的端部互补）以及2.5单位的IIDNA聚合酶进行混合，最终体积为50μL，然后在95℃下进行一次2分钟的循环，接着进行10次3步热循环：95℃下进行20秒，58℃下进行30秒和68℃下进行3分钟（1分钟/千个模板碱基），接着在68℃下进行15分钟的最终PCR延伸。在扩增步骤后进行10次PCR循环，通过使用常规的Taq聚合酶对用于每个诱变的NICDNA引物进行克隆。由此产生的诱变NICDNA文库后，用QIAquick凝胶回收试剂盒进行凝胶提纯、用EcoRI和XhoI（NewEnglandBiolab）进行酶切、用MinElutePCR提纯试剂盒（Qiagen）进行柱纯化、连接到II载体（Stratagene）、按前文的描述包装到λ噬菌体内，然后根据前文的描述将其析出在NZY琼脂平板上。

为对内含肽进行诱变，遵照操作手册通过II诱变试剂盒（Stratagene）用内含肽端部特异性引物对5μg的编码内含肽的质粒DNA进行10次PCR扩增循环。简单来说，将5μg的待诱变处理的内含肽DNA与1×缓冲PCR反应缓冲液、200μΜ的各个dNTP、0.15μΜ的内含肽端部特异性引物和2.5单位的IIDNA聚合酶进行混合，最终体积为50μL，然后在95℃下进行一次2分钟的循环，接着进行10次3步热循环：95℃下进行20秒，58℃下进行30秒和68℃下进行3分钟，接着在68℃下进行15分钟的最终PCR延伸。由此产生的诱变内含肽文库后，用QIAquick凝胶回收试剂盒进行凝胶提纯。使用常规的Taq聚合酶通过PCR产生木聚糖酶的N-末端片段和C-末端片段（N和C）。使用上文提到的PCR操作将具有野生型N和C的NICDNA和经诱变处理的内含肽文库I组装起来，并将其克隆到II载体上，从而能够按照前文描述地在NZY琼脂平板上对文库进行筛选。

为对内含肽进行诱变，还生成了合成的Tth内含肽（(SEQIDNO:91)诱变文库。将该文库设计成在Tth内含肽的每个位置上至少发生一次独立的氨基酸取代反应。设计完成后，通过Genscript来合成文库。使用常规的Taq聚合酶通过PCR产生木聚糖酶的N-末端片段和C-末端片段（N和C）。使用上文提到的PCR操作将具有野生型N和C的NICDNA和合成的诱变Tth内含肽文库I组装起来，并克隆以进行文库筛选。

通过下面的操作产生以下诱变文库：

1、整个盒的诱变文库，其中，含有插入P77853内的S67位点处的微小PspPol内含肽mPspM1L4的盒发生了诱变；

2、内含肽诱变文库，其中，发生了诱变的微小PspPol内含肽mPspM1L4插入P77853内的S67位点处；

3、内含肽诱变文库，其中，发生了诱变的微小PspPol内含肽mPspM1L4、mPspM2L5、mPspM3L5、mPspM4L3、mPspM5L5、mPspM5L2和mPspM7L3的混合物插入P77853内的S67位点处；

4、内含肽诱变文库，其中，发生了诱变的微小PspPol内含肽mPspM5L5插入P77853内的S112位点处；

5、整个盒的诱变文库，其中，含有插入P77853内的T134位点处的Tth内含肽的盒发生了诱变；

6、内含肽诱变文库，其中，发生了诱变的Tth插入P77853内的T134位点处；

7、内含肽诱变文库，其中，发生了诱变的Tth插入P77853内的S158位点处；和

8、内含肽诱变文库，其中，发生了诱变的微小PspPol内含肽mPspM3L5插入O30700内的S106、S215、S295、S314、S357或S358位点处。

实施例5——对内含肽修饰酶文库的筛选。对发生了诱变的文库进行筛选，将候选者进行分离、纯化和验证。用一系列稀释度的SM缓冲液（通过以下制备SM缓冲液：将5.8g的NaCl、2.0g的MgSO₄*7H₂O、50.0mL的1MTris-HCl（pH7.5）、5.0mL的2%（重量/体积（w/v）的明胶定容至1升，然后在高压釜中进行灭菌）对单个文库进行滴定以测量效价（菌斑形成单位或pfu/μL），并使其析出在NZY平板上。对于被评定为非许可表型的插入位点，例如在P77853的S67处和S112处，或者在O30700中多个位点处插入的微小PspPol内含肽mPspM1L4，用高密度噬菌体效价进行筛选。用500μL的XL1-BlueMRF’细胞（OD₆₀₀=0.5）使高达10000pfu析出在15cm的平板上。对源于具有转化表型的内含肽修饰酶文库（例如，通过在P77853的T134和S158位点插入Tth内含肽得到的文库）来说，对2000pfu/平板进行筛选以获得该文库。

使每个文库析出在琼脂平板上，并在37℃下培养整夜。将具有蓝晕的菌斑标记为许可表型突变。然后使平板经历系列热处理（50℃下处理，然后在70℃处理2小时）来诱导对候选噬菌斑进行表达的表型。挑选出独立菌斑，并将其分散到500uL的SM缓冲液中。制备一系列稀释度的SM缓冲液，将其用来感染XLl-BlueMRF’细胞，随后使该细胞在NZY平板上析出。随后将平板在37℃下培养整夜，接着在70℃下培养2个小时。在上述两个温度下进行培养后，对菌斑表型进行证实。

将超过500个内含肽修饰的P77853木聚糖酶候选者进行分离、提纯和并验证其表型。在它们之中，约100个候选者含有位于S67位点的微小PspPol内含肽插入物、70个含有位于S112位点的M5L5内含肽插入物，250个含有位于T134位点的Tth内含肽插入物，并有75个含有位于位点S158的Tth内含肽插入物。对O30700木聚糖酶中约50个选择对象进行菌斑提纯、表型确认并通过PCR进行验证。

根据上文描述的操作，将经证实表型的候选者个体切成噬菌粒。通过酶法对绝大多数的候选者进行分析。通过蛋白质印迹分析（剪接）和DNA序列分析对表现出热敏转化活性的候选者进行分析。

按下面步骤进行针对木聚糖酶活性的酶法：1）将含有离体噬菌粒的单菌落接种到培养物上，使该培养物在添加了100mg/L的氨苄西林（AMP，购自Sigma）的1mL的路尼亚肉汤（LuriaBroth，LB，通过以下方法制得：将10g的NaCl、10g的细菌用胰蛋白胨和5g的细菌-酵母提取物混合定容至1升，然后用5N的NaOH将pH调解为7.0，随后在高压釜中进行杀菌）中，在37℃和300RPM的条件下生长一整夜。2）将50μ1的细胞转移到5mL的OvernightExpress^TMInstantTB培养基（在本文中也被称为自诱导培养基或AIM，可商购自Novagen）上，并在37℃和250RPM的条件下生长一整夜。3）将培养物在3000RPM下离心15分钟。4）除去上清液，并使细胞颗粒再悬浮在裂解缓冲液中（该裂解缓冲液中含有1×FastBreakLysisBuffer^TM（Promega）、200mM的磷酸钠（pH6.5），和0.2μ1/mL的DNA酶）。5）将裂解液进行完全混合，并用200mM的磷酸钠（pH6.5）中制备1：10稀释度的裂解液。和6）用100μ1的各个稀释度对样品进行活性分析，叔叔样品或者暴露在剪接诱导条件（例如加热预处理）中，或者未暴露在诱导条件中。

在进行预处理（PT）的分析中，将裂解液样品分成相同体积的等份，将这些等份在37℃或55℃下处理4小时后在冰上进行冷却。然后，加入20μ10.2%的细磨AZCL底物后使样品进行充分混合。以允许在37℃下进行至少1个小时的反应，但有时会延长至进行整晚的反应。根据内含肽修饰酶及其各自的成熟酶不同，反应时间、反应温度、反应条件及反应底物都可能不同。

在不进行预处理（NPT）的分析中，将样品分成具有相同体积的等份，然后与20μ10.2%的细磨AZCL底物进行混合。允许在37℃和70℃下进行最多6个小时的反应。根据内含肽修饰酶及其各自的成熟酶不同，反应时间、反应温度、反应条件及反应底物都可能不同。

在进行预处理（PT）或不进行预处理（NPT）的分析中，反应时间完成之后，对样品进行搅拌然后在4000RPM下进行7分钟离心作用。在每个样品中取50μ1的上清液来测量590nm下的吸光值，该指标表示样品中的酶或内含肽修饰酶具有多高的活性。可以在ThermoScientific分光光度计上，或在BioTekSynergy^TM多模型酶标仪上用96孔或384孔圆底分析板对吸光值进行测量。如有必要，将样品再次进行离心以确保未将细胞碎片选入在内，并在需要时用200mM的磷酸钠（pH6.5）制备5×或10×稀释液。

按下面内容进行针对候选内含肽修饰酶突变体的蛋白质印迹分析：1）使5ml的AIM培养物在30℃和250RPM的条件下生长整夜，然后在3000RPM下对其离心15分钟。2）除去上清液和并将成团的细胞再悬浮于200μ1的裂解缓冲液中（参见上文）。3）使裂解液混合充分后，用1×磷酸缓冲溶液（按照以下制备PBS：将137mmol的NaCl、2.7mmol的KCl、4.3mmol的Na₂HPO₄和1.47mmol的KH₂PO₄混合并定容至1升，用2N的NaOH调节pH至7.4，用0.22微米的滤膜对溶液进行无菌过滤）制备1：50稀释度的裂解液，而余下没有使用的样品存储在-20℃下（根据表达水平和活性不同，可能需要更高的稀释度）。4）对各个稀释度来说，从各稀释度中取50μ1转移到无菌离心试管或PCR试管内，并在37℃或59℃下加热处理4小时（该体积可以根据需要而做出改变，但推荐最少为15-25μl）。5）加入同等体积的2×负载缓冲（2×负载缓冲液中含有62.5mM的Tris-Cl（pH6.8）、6M的尿素、10%的甘油、2%的SDS、0.0125%溴酚蓝和5%的BME）；6）用相同体积的尿素（将待用凝胶的数量乘以20μl（针对18孔凝胶（Biorad）），或将待用凝胶的数量乘以15（针对26孔凝胶（Biorad）可以计算出梯度的体积）来制备生物素酰化梯度（Biotinylatedladder）。7）将样品进行充分搅拌，然后装载到凝胶（针对18孔Biorad凝胶，装载30μ1的样品；而针对26孔Biorad凝胶，装载20μ1的样品）上。8）使凝胶在150-175V下运行1小时后解体。10）使凝胶在1×的Transfer（Towbin）缓冲液（25mM的Tris碱、192mM的甘氨酸和20%的甲醇）中浸泡15分钟。11）组装Whatman-PVDF（用甲醇浸渍）-凝胶-Whatman夹层结构，在电压为15V，电流小于600mA下进行1小时电印迹的方法来转移样品。12）将印迹移至封闭液中，该封闭液中含有2%的BSA的TBST溶液（50mM的Tris-HCl、150mM的NaCl、0.1%的吐温-20）。13）在4℃下将印迹保存在封闭液中整晚。14）对封闭液进行倾析，并加入第一抗体溶液（1%的BSA在TBST中的溶液，其中含有1：2000的能对检测到的酶和内含肽修饰酶进行识别的第一抗体。15）用TBST对印迹进行5次洗涤，每次5分钟。16）加入第二抗体溶液（1%的牛血清白蛋白（BSA）在TBST中的溶液，其中具有1：20000的辣根过氧化物酶（HRP）抗生素和1：5000的HRP抗兔二抗（HRPantirabbitsecondary）），并用TBST对印迹进行5次洗涤，每次5分钟。将印迹浸泡在20μ1的WestPico化学荧光底物（Pierce）中5分钟，在化学设定中以20×每分钟间隔进行连续拍照，并在G:Box^TM凝胶成像系统（Syngene）中进行显影。

采用本领域常规方法进行DNA测序。

从文库（1）（位于P77853的S67位点处微小pspPol内含肽mPspM1L4，其盒发生了诱变）产生了约40个候选者，通过蛋白质印迹和DNA测序对其进行分析。进行测序的候选者中，超过50%的候选者在C-外显肽上具有终止密码子，恰好位于底物结合域和催化结构域之间的连接序列上或在其之后。整个盒上的突变将会产生大量的候选者，其中切去顶端的P77853蛋白在S67插入位点处不含完整的糖类结合域。虽然在少数候选者（m25，m30）中观察到了经剪接的成熟木聚糖酶，但更多的候选者（如m3）仅仅有切割产物。

内含肽诱变在产生氨基酸取代物方面具有更高的效率。在所测的诱变PCR条件下，在P77853的S67位点和S112两个位点处能观察到的微小pspPol候选者的平均数为4个。这些突变会引发大多数微小pspPol候选者中的前体切割而非内含肽剪接。

Tth内含肽使NZY琼脂平板上的内含肽修饰的木聚糖酶P77853在酶法中表现出热敏性，并能在蛋白质印迹中使剪接产物发生积累。在该结果的基础上，进一步对Tth内含肽修饰的木聚糖酶候选者特征进行描述。

为了对多个候选者的热敏转化活性和剪接活性进行准确的测量，对这些候选者的最佳转化条件（温度和时间）进行测定。首先，对部分候选者进行测试，以得到加热预处理诱导条件对木聚糖酶活性的影响。测试采用的一系列温度（30℃、37℃、45℃、55℃、70℃）和时间（0.5小时、l小时、2小时、3小时、4小时、6小时和20小时）中，发现在55℃下处理4小时是最佳的。以小得多的增量在55℃温度周围对多个候选者进行4小时的测试。采用所述条件进行测试时，发现59℃是针对所有Tth候选者的最佳温度。

图3A-3L显示了针对Tth内含肽修饰的P77853的蛋白质印迹数据，其中，内含肽插入在P77853酶中的丝氨酸158处（S158）或苏氨酸134（T134）处。泳道上方示出了针对各个样品的琼脂平板表型。所述琼脂平板表型用“SW”代表转化表型，TSP代表热敏转化剪接表型，P代表许可表型。

图3A显示了反映P77853-Tth-S158-2蛋白（SEQIDNO:1672）的蛋白质印迹，该蛋白在琼脂平板分析中显示为转化表型。图3B显示了反映P77853-Tth-S158-4蛋白（SEQIDNO:1673）的蛋白质印迹，该蛋白在琼脂平板分析中也显示为转化表型。图3C显示了反映P77853-Tth-S158-7蛋白（SEQIDNO:1674）的蛋白质印迹，该蛋白在琼脂平板分析中也显示为转化表型。图3D显示了反映P77853-Tth-S158-19蛋白（SEQIDNO:1675）的蛋白质印迹，该蛋白显示为热敏转化剪接表型。图3E显示了反映P77853-Tth-S158-20蛋白（SEQIDNO:1676）的蛋白质印迹，该蛋白在琼脂平板分析中显示为许可表型。图3F显示了反映P77853-Tth-S158-21蛋白（SEQIDNO:1677）的蛋白质印迹，该蛋白在琼脂平板分析中显示为转化表型。图3G显示了反映P77853-Tth-S158-25蛋白（SEQIDNO:1678）的蛋白质印迹，该蛋白显示为热敏转化剪接表型。图3H显示了反映P77853-Tth-S158-38蛋白（SEQIDNO:1679）的蛋白质印迹，该蛋白显示为热敏转化剪接表型。图3I显示了反映P77853-Tth-S158-39蛋白（SEQIDNO:1680）的蛋白质印迹，该蛋白显示为热敏转化剪接表型。图3J显示了反映P77853-Tth-S158-42蛋白（SEQIDNO:1681）的蛋白质印迹，该蛋白显示为热敏转化剪接表型。图3K显示了反映P77853-Tth-S158-138蛋白（SEQIDNO:1691）的蛋白质印迹，该蛋白显示为热敏转化剪接表型。

根据图3A-3L中的酶法数据和蛋白质印迹数据，在55-70℃的温度下进行4小时的培养能提高内含肽剪接在多数Tth内含肽修饰的P77853木聚糖酶候选者中的发生。

对在蛋白质印迹中具有增加的内含肽剪接的T134候选者进行液相分析测试，在37℃下进行预处理或在59℃下预处理（PT）4小时后，在37℃下与底物进行12小时的反应。可选择地，在不对这些候选者进行预处理（NPT）的情况下，在37℃或70℃下进行5小时的反应。将结果制表列于下表3中。通过测量染料从标记底物中的释放（在590nm波长下用分光光度计或酶标仪进行测量）来对活性进行定量分析，该结果以任意吸光度单位表示。在59℃栏中插入的百分数表示的是将59℃PT与37℃PT相比之后的活性倍率变化，计算为倍率变化=([(59℃PT之后的活性)/(37℃PT之后的活性)]-1)×100。ND表示未确定。

表3

内含肽修饰的P77853木聚糖酶中产生的其它T134插入位点包含在SEQIDNOS:1711-1712中。

采用上文描述的预处理分析（PT）对转化曲线进行分析，从而对大肠杆菌SOLRTM细胞（Stratagene）中的具有超过300个Tth内含肽修饰的P77853木聚糖酶候选者的使温度诱导型木聚糖酶发生再激活。收集在进行或不进行预测处理时，所有样品的木聚糖酶活性数据各两份。进行预热处理时，样品中的一组在37℃下培养4小时，另一种在59℃下培养4小时。将这些样品在冰上进行冷却后，加入AZCL-木聚糖底物，将混合物置于37℃下最多12小时的时间。在没有进行预热的另外两组中，直接向样品中加入AZCL-木聚糖底物，并置于37℃下进行5个小时的反应。针对TthS158P77853木聚糖酶的结果列于下表1中。虽然通常在59℃下进行了预热的样品往往常具有更高的活性，但是全部Tth内含肽修饰的P77853木聚糖酶候选者中，有近1/3的证实在37℃时和在59℃进行预热处理后的活性存在至少2倍的差异（增加）。换而言之，37℃测得的活性通常是在59℃进行预热处理后的样品活性的两倍，高于在37℃下进行预热处理后的样品活性的两倍。进一步对候选者的蛋白质印迹进行分析。将通过酶标仪在590nm波长处进行测量的结果以以任意吸光度单位表示为活性。59℃栏中附加的百分数表示的是将59℃PT与37℃PT相比之后的活性变化，计算为倍率变化百分比=([(59℃PT之后的活性)/(PT前的活性)]-1)×100%。ND表示未测到。

表4

内含肽修饰的P77853木聚糖酶中产生的其它S158插入位点包含在SEQIDNOS:1700-1710中。

进行剪接时间过程分析（timecoursesplicingassay），并在蛋白质印迹中对上表中具有T134插入部位或S158插入部位的每一个内含肽修饰的P77853候选者样品中的剪接进行确认。图4A显示了针对S158-19样品的剪接时间过程分析。将蛋白提取物在59℃下培养6个小时，在第0个小时、第1个小时、第2个小时、第3个小时、第4个小时和第6个小时的时候取出样品（如图4A所标）。图4A右侧显示了空表达载体对照和野生P77853阳性对照，以及分子量标准。对于能够使蛋白前体积累至较高水平的Tth内含肽修饰的P77853木聚糖酶候选者S158-19来说，内含肽修饰酶前体水平的降低直接关系到剪接后的成熟蛋白的积累过程。对样品进行59℃的热处理时，经剪接的成熟木聚糖酶的积累过程在4小时的时候达到顶峰。但对59℃下发生的剪接进行6小时的观察。观察到，在50-59℃温度处发生剪接。随着培养时间的增加，NICTth内含肽修饰的P77853-S158-19的数量下降，同时P77853的数量却有增加，这说明在59℃培养过程中，内含肽剪接也随着时间进程而增加。类似地，图4B显示了针对S158-30-103Tth内含肽修饰的P77853木聚糖酶（SEQIDNO:1701）的蛋白质印迹分析。如图4B所示地，使蛋白样品在37℃、50℃、59℃和65℃下进行不同时间的培养（1小时、2小时、3小时、4小时和6小时）。空载体和野生型P77853对照样品按分子量梯度显示在最右侧。从图4B可以看出，随着时间和温度的增加，形成的成熟P77853酶（NC）也在增加，而Tth内含肽修饰的S158-30-103P77853木聚糖酶（NIC）却发生了下降。类似地，图4C显示了针对T134-100-101Tth内含肽修饰的P77853木聚糖酶（SEQIDNO:1711）的蛋白质印迹分析。在37℃、50℃、59℃和65℃下进行不同时间的培养（1小时、2小时、4小时、6小时和17小时）。空载体和野生型P77853对照样品按分子量梯度显示在最右侧。从图4C可以看出，随着时间和温度的增加，形成的野生型P77853（NC）也在增加，而Tth内含肽修饰的S158-30-103P77853木聚糖酶（NIC）的数量却发生了下降，这说明内含肽剪接增加了。本图显示随着时间和温度的增加，形成的P77853也在增加，而Tth内含肽修饰的S158-30-103P77853木聚糖酶的数量却发生了下降，这说明内含肽剪接增加了。

与上述基于活性的预处理分析（该分析能对进行预热处理的酶再活化过程提供定量分析）不同的是，以蛋白质印迹为基础的剪接分析的优势在于，能提供剪接的可视证明。对在预处理分析中表现较好的约90个内含肽修饰酶候选者进行蛋白质印迹分析。建立了针对每个被分析的候选者的剪接剖面（splicingprofile）。剪接剖面包括前体水平、前体稳定性、经剪接的成熟蛋白水平以及切割产物水平中的每一个在两个温度（通常选自室温、25℃、37℃、50℃、55℃、59℃、65℃或其它期望的温度）下的分布。对于一些内含肽修饰蛋白来说，在加热预处理过程中随时间取出部分样品进行蛋白质印迹分析，进而对剪接动力学进行研究。

按照下面的描述，对一些内含肽修饰酶中能够增强内含肽转化和剪接（DNA序列数据）的发生在氨基酸上的突变进行确认。通过单一靶蛋白、单一内含肽和单一插入位点产生的限定作用，这些突变对特定内含肽修饰酶具有特异性。

将来自Tth内含肽修饰的P77853木聚糖酶候选者中的转化候选者和TSP候选者，和在蛋白质印迹分析中证实发生剪接的Tth内含肽修饰的P77853木聚糖酶候选者一起用来进行DNA测序。确认了上述两种Tth内含肽中的氨基酸和位于内含肽-外显肽接头处的P77853残基与增强的转化和剪接有关。通过将Tth内含肽在P77853的T134位点插入P77853而产生的候选者来说，从P71（Tth内含肽中第71个氨基酸）到L、T或Q发生的Tth内含肽突变（SEQIDNOS:1928、1929和1930）与TSP表型有关。单个P136（C-外显肽的+3位置）插入物也与TSP表型有关（SEQIDNO:1931）。在所测序的TSP候选者中没有产生上述突变的结合（P71到L/T/Q，或P136处的插入物）。在P136插入物的情况中还存在其它的突变，大多是在S135位点（C-外显肽的+2位置）S被取代为V（SEQIDNO:1932）。这些双重突变也被划分为隶属TSP族。61个中余下的候选者虽展现了转化表型，但却难以检测到其是否发生了热敏剪接。

对通过在S158插入内含肽构造得到的Tth内含肽修饰的P77853木聚糖酶进行分析，并对不同的TSP构造进行了确认。Tth内含肽（SEQIDNO:91）中的17个R51G（S）（内含肽中第51个氨基酸）取代物得到了确认（SEQIDNOS:1675、1678-1681、1689、1691、1700-1708和1710），并且这些取代物均与TSP有关。测序数据显示，这些与TSP表型有关的内含肽突变被插入这些特定位置后，在对Tth内含肽修饰的P77853木聚糖酶发生依赖于接触温度的剪接时发挥了重要作用。其它支持TSP元件对剪接产生作用的证据来自对内含肽表面上的突变进行的结构分析。预测Tth中的R51和P71与内含肽-外显肽结构十分接近，因此成为进行内含肽切割和剪接的活性位点。

实施例1-5结果小结。如上文所述地，用内含肽对一种木聚糖酶P77853进行修饰并对其进行分析。向酶中插入诱变内含肽能产生多个P77853诱变内含肽文库。使用多个诱变内含肽和多个内含肽插入位点来获得文库。文库中每一个被修饰的酶中含有插入到一个插入位点的一个诱变内含肽。从文库中的约一千万个突变体中分离出500个候选者。通过DNA测序、酶活性分析对候选者进行分析，并分析其在活性和剪接方面与温度改变之间的敏感性。证实了在60℃附近温度下进行预测处理时最可能诱发内含肽修饰酶发生转化，即活性发生改变。在一些候选者中，转化是于内含肽剪接相关的。还发现内含肽和外显肽中的特定氨基酸改变（尤其是在内含肽-外显肽接头附近的那些）能显著地增强内含肽剪接，或热敏性。这些氨基酸改变与特定的内含肽、靶酶和内含肽插入位点有关。

按照上文实施例的描述，将Tth内含肽插入P77853（其天然序列中不含内含肽）后得到TSP转化表型。P77853的T134位点位于β-片状结构和环形区域的接头，因此SVM评分将其分为前5个最可能发生剪接位点。此外，剪接增加的同时在插入位点附近发生突变引入了+2脯氨酸，这与较高的SVM分数有关。将Tth内含肽插入P77853的S158位点（这是与活性位点残基第七接近的位点（仅相距6.6埃），同时这也发生在β-片状环形屈居的接头处）时，得到能够根据温度发生剪接并同时具有转化和TSP表示的内含肽修饰的候选者。

在SEQIDNOS:1629-1712中提供了内含肽修饰的木聚糖酶的实例。

实施例6在SEQIDNOS:1713-1784中提供了内含肽修饰的纤维素酶。

实施例7——对纤维素酶进行分析和提纯。纤维素酶Acel（来自解纤维热酸菌11B的内切葡聚糖酶E1）是来自解纤维热酸菌（基因库中的登录号为P54583）的内切葡聚糖酶（EC3.2.1.4）。该酶具有N-末端催化结构域（CD）（与糖基水解酶第5家族中的酶具有同源性）和C-末端纤维素结合域（与碳水化合物结合结构域第2家族（CBM2）中的蛋白具有同源性）。P54583中的CD和CBM2域通过富含丝氨酸-、苏氨酸-和脯氨酸的连接域连接。在异源系统（包括植物）中对P54583进行表达，并表现能有效地水解植物源的纤维素物质。

P54583的表达和表征。参见图5，显示了具有纤维素酶插入物质粒pGAPZα和pAL410。所述质粒没有按比例进行绘制。在图5中的注释代表以下内容：P-GAP，名义构造酵母GAP的启动子；α，来自酵母交配因子α的分泌信号肽，它被翻译成与内切葡聚糖酶发生融合的N-末端；P54583，Ace1内切葡聚糖酶的编码序列（见下文）；AOXt，源于酵母AOX基因的转录终止子和多腺苷酸化信号；P-TEF1，来自酵母TEF1基因的启动子；P-EM7源于酵母AM7基因的启动子；zeo，酵母和大肠杆菌内产生博莱霉素（zeocin）耐药性的编码序列；CYC1t，源自酵母CYC1基因的转录终止子和多腺苷酸化信号；ColEI，大肠杆菌内能对质粒进行复制的区域；f1ori，产生单个标准质粒衍生物的序列；KanMX，酵母内产生G418耐药性的基因；2uori，2微米起点，使质粒能在酵母细胞内进行复制；bla，在细菌细胞中产生氨苄西林耐药性的基因。注意到表达出的P54583具有从pGAPZa-P54583和pAL410-P54583中翻译融合的C-末端6组氨酸和myc。

获得了P54583的优化密码子。下文列举了优化后在植物中进行表达的P54583的DNA序列。注意到：该序列仅对应解纤维热酸菌中天然多肽上第42-562号氨基酸残基，该氨基酸残基与内切葡聚糖酶的“成熟”形式对应，并不含信号肽（第1-4号氨基酸残基）。在ATC起始密码子之后的GCT密码子编码了第42号氨基酸。

P54583优化版密码子

ATGGCTGGAGGAGGATACTGGCACACTTCCGGCAGGGAGATCCTCGACGCAAATAACGTTCCAGTCAGAATCGCCGGGATTAATTGGTTTGGCTTCGAAACGTGTAACTACGTGGTTCACGGCCTGTGGTCTCGGGATTACAGATCAATGCTCGACCAGATCAAATCCTTGGGGTATAATACAATTAGGCTGCCCTACAGCGATGACATTCTTAAGCCTGGAACCATGCCGAACTCGATTAATTTCTACCAAATGAACCAGGATCTGCAGGGATTGACTTCTCTGCAGGTTATGGACAAGATCGTGGCGTACGCCGGCCAAATCGGGCTCAGAATTATTTTGGATCGGCACAGGCCAGACTGCTCAGGTCAGTCGGCCCTGTGGTACACAAGCTCCGTGTCAGAGGCAACATGGATTTCAGATCTTCAAGCCCTCGCACAACGCTATAAAGGCAACCCCACGGTTGTGGGATTCGACCTTCACAACGAACCTCACGATCCGGCCTGTTGGGGCTGCGGGGACCCTTCGATCGACTGGAGACTGGCAGCGGAGAGGGCTGGTAACGCCGTTCTCAGCGTCAATCCCAACTTGCTGATCTTTGTGGAGGGAGTTCAGTCCTACAACGGCGATTCTTACTGGTGGGGCGGAAATCTCCAAGGCGCAGGGCAGTATCCTGTCGTGCTTAACGTTCCGAATCGCCTGGTCTACTCAGCACACGACTACGCGACTAGCGTGTACCCACAGACGTGGTTCTCCGATCCCACATTTCCTAACAATATGCCGGGAATCTGGAACAAGAATTGGGGTTACTTGTTTAACCAAAACATTGCTCCAGTTTGGTTGGGTGAATTTGGCACCACTCTTCAGTCGACGACAGACCAAACCTGGCTGAAAACCCTCGTCCAGTATTTGCGGCCAACTGCTCAGTACGGAGCAGATTCTTTTCAATGGACGTTCTGGTCTTGGAATCCTGACTCCGGGGATACAGGCGGTATCCTGAAAGACGATTGGCAACCGTGGACACTGTTAAGGACGGGTACTTGGCGCCGATTAAAAGCTCGATCTTTGACCCAGTCGGCGCTAGCGCTTCCCCATCTTCACAACCTTCGCCGAGCGTCAGCCCCAGCCCAAGCCCAAGCCCGTCTGCCAGCAGAACCCCCACTCCCACACCTACCCCCACGGCCTCACCAACTCCGACGCTCACTCCTACGGCGACGCCAACACCAACTGCTTCACCCACTCCTAGCCCCACCGCAGCGAGCGGGGCTAGGTGCACCGCTTCTTACCAGGTCAACTCTGACTGGGGTAATGGCTTCACCGTGACTGTGGCGGTCACTAACTCAGGAAGCGTCGCGACGAAAACCTGGACTGTGTCCTGGACGTTCGGGGGCAACCAAACAATCACCAACAGCTGGAACGCTGCAGTTACGCAGAATGGGCAAAGCGTCACGGCGCGCAATATGAGCTACAACAACGTGATTCAACCAGGCCAGAATACCACATTCGGTTTTCAAGCAAGCTATACCGGGTCAAACGCTGCCCCAACTGTCGCTTGTGCTGCCTCA(SEQIDNO：1933).

将携带该序列的DNA片段与上文描述的巴斯德毕赤酵母（Pichiapastoris）整合型表达载体pGAPZα（invitrogen，CarlsbadCA）进行连接。pGAPZα是用来对巴斯德毕赤酵母GS115进行转化的整合型载体。接着遵照Invitrogen指南，将得到的质粒pGAPZα-P54583（图5）引入巴斯德毕赤酵母GS115细胞中。按照博莱霉素耐药性的选择重组体，并对它们在琼脂平板上驱动染料脱离AZCL-HE-纤维素（MegazymeInternationalIreland有限公司）中的能力进行评分。

存在博莱霉素时，使表达P54583（来自在里氏木霉（糖基水解酶第7家族中的P07981）的无关内切葡聚糖酶）或白蛋白的毕赤酵母菌株在富集培养基中进行生长。收集这些培养物的上清液，用CellazymeC分析法（见下文）对内切葡聚糖酶活性进行分析，其中，所述内切葡聚糖酶将蓝色染料（AZCL）从纤维素底物（MegazymeInternationalIreland有限公司）中释放出来。这些分析证实了表达P54583的毕赤酵母克隆体产生的内切葡聚糖酶活性大约是表达P07981克隆体的2倍。参见图6。在图6中的空白（blank）是含有未接种培养基的样品，用纤维素酶单位来表达活性。

鉴于在酿酒酵母中更容易发生诱变，将P54583的编码序列从pGAPZα-P54583转移到pAL410上，生成质粒pAL410-P54583（图5）。pAL410是在酿酒酵母转化中的自主复制载体。在YPD琼脂平板上对携带pAL410-P54583质粒或pAL410质粒的酿酒酵母菌株进行评分，所述YPD琼脂平板中含有100mg/L的G418，其上还涂覆了0.2%的AZCL-HE-纤维素（Megazyme）在2%的琼脂覆层。下文提供了详细的平板活性分析法。如图7所示，将2个携带pAL410-P54583的独立转化体和两个携带pAL410在AZCL-HE-纤维素表面划线。仅在分泌活性内切葡聚糖的克隆体附近可以清楚第看到AZCL染料的移动。

测量内切葡聚糖酶和内含肽修饰的衍生物的活性：

平板活性分析法。将含有0.2%的AZCL-HE纤维素底物的液体琼脂薄层施覆到含100mg/L的G418的YPD选择模板上，从而制得活性分析平板。平板固化后，将含有目标基因酵母细胞接种到底物覆层上。随后使细胞在30℃下生长。具有活性的内纤维素酶将驱动AZCL染料，并在周围培养基上形成蓝晕。这是针对不同宿主菌株中活性、以及构造随着温度和时间框的改变而进行的定性分析。这还能用来测试观察内含肽修饰的P54583衍生物中的活性。

液相活性分析。液相分析考虑了在分析和样品制备条件中的较大改变，通过分光光度计的吸光度读数给出可计量的结果。分析条件可以在较大范围的pH、温度、持续时间和样品的制备中变化。用于本分析的样品制备可以包括不同的生长条件、浓缩或提纯方法以及预处理。可以对本分析法进行改良，从而对培养物上清液或细胞团块（cellpellet）内的活性进行测量。

对纤维素内切酶检测底物片剂(Megazyme）进行的液相分析纤维素酶检测底物片剂是预先团块化的AZCL-HE纤维素底物（MegazymeInternationalIreland有限公司）。本分析法得到的结果与平板法的结果具有较高的对应性。按下文记载进行标准纤维素内切酶检测底物片剂分析。将液体培养物中的蛋白样品与25mM的NaOAc缓冲液（pH4.5）混合定容至500uL。使样品在42℃下平衡5分钟。向每个样品中加入1片纤维素检测底物，然后在42℃下培养30分钟。加入lmL的20%的tris碱来使反应停止。在酶标仪上用透明平地板测量吸光值₅₉₀。含有较多内纤维素酶活性的样品能跟迅速地对底物进行降解，进而使吸光值590增加。通过这一分析，测出P54583活性在pH5.0周围最佳，且活性随着温度升高（到至少70℃）而增加。更长的反应持续时间将使吸光值（590nm）读数增加（图8和图9）。如图8所示，P54583的活性从pH4.5到pH8.0发生了增加。但阴性对照组在超过pH2.0的条件下没有表现出显著活性了。如图9所示，可以用纤维素内切酶检测底物来证实P54583活性随着温度增加而增加，信号强度（吸光值590）随着时间增加。

PNP-C液相分析。还可以用对硝基苯基纤二糖苷（PNP-C）底物检测内切葡聚糖酶（如P54583）的活性。标准PNP-C分析为50μl的反应液，其中含有5mM的PNP-C底物、活性酶和用来控制pH的缓冲液。这一分析可以在较宽范围的pH和温度条件下进行。在特定时间点加入100μl的碳酸钠，来终止反应并放大信号强度。在分光光度读数板（spectrophotometricplatereader）上测量405纳米下的吸光值（Abs.₄₀₅）。活性增加则读数越大（图10）。如图10所示，对P54583进行的PNP-C分析显示酶活性随着分析温度升高而升高。

Enzchek(Invitrogen）液相分析。Enzchek是能用于内其葡聚糖酶活性分析的合成荧光底物。下面记载了有关Enzchek底物标准分析法。将体积相同的室温底物和室温酶混合，将pH缓冲为5.0左右，在黑色孔板（例如，康宁（Corning）黑色384孔板#3820）上进行荧光读数。在室温下进行避光培养，在340/450的激发/放射波长下进行荧光测量。荧光读数随着时间和样品浓度的增加而增大。可以在不终止反应的情况下，自分析开始之后5分钟或者对水平活性较低的样品进行数小时培养后开始读数。可以通过终止反应的方法来对进行了相同时间培养的样品进行读数，这在对成百上千的样品进行处理的过程中十分有用。加入相同体积的20%的tris碱来终止反应。这能立即增加荧光读数（这在全部样品中呈现出了一致性），并保持数小时的稳定。本活性分析具有敏感性、可重复实现，并且能用于液体处理器上进行的高通量分析。可以将标准液体处理器条件设定为在康宁#3820板上使用含有全部培养物的10μl的反应物。

选择用来表达内含肽修饰的内切葡聚糖酶的酵母宿主。为了测试各种酵母住宿是否更适于进行i）诱变和ii）对表达内含肽修饰的内切葡聚糖酶的克隆体进行筛选，对两种酵母菌株（INVSc-1（Invitrogen，CarlsbadCA）和SCBJ（a.k.a.BJ5465，美国典型培养物保藏中心（AmericanTypeCultureCollection），ManassasVA，目录编号：20829)）接受外来DNA的能力进行了比较。制备质粒DNA（超螺旋或线性DNA）样品，并通过ZymoResearch’sEZ酵母转化试剂盒用这些DNA来对样品进行转化。下表5显示了酿酒酵母两种菌株的相对转化率。从表中可以看出，使用SCBJ的转化率比用INVScl的转化率高100倍。SCBJ比INVSc-1细胞在更短时间内形成了明显的菌落。

表5

宿主	DNA	#菌落
			SCBJ	160ng线性DNA	5000
INVSc-1	160ng线性DNA	30
			SCBJ	超螺旋质粒	7000
INVSc-1	超螺旋质粒	50

酵母表达的内切葡聚糖酶的蛋白沉降(pulldown）浓度和纯度。许多内切葡聚糖酶中常见的P54583具有能将酶限制在其结晶底物上的C-末端的碳水化合物结合域。以该特点为基础，对通过碳水化合物类似物来降低或部分纯化内切葡聚糖酶的方法进行测试。收集6等份的表达P54583的培养物或携带阴性对照空载体（pAL410，图5）的上清液。向5个等份（除去一个保留作为未处理样品的全部等份）中加入Avicel^TM（微晶纤维素）。然后，在室温下对全部等份进行1小时的摇晃。进行培养后，微晶纤维素呈团块状，将上清液倒掉。用洗提缓冲液对4份团块进行洗涤，示于图11中。迅速将洗出液转移到干净试管内，并调节至中性pH。第5份微晶纤维素未进行洗提。随后用纤维素内切酶检测底物片剂来测量全部6等份的活性。如图11所示，可以使用微晶纤维素将活性纤维素酶从培养物样品中分离出来。这是一种简单、廉价而且迅速地进行蛋白提纯并对上清液和细胞裂解液进行浓缩的方法。随后可以通过蛋白质印迹分析对酶进行分析，也可以直接用Avicel^TM进行活性分析，或者用各种缓冲液将其洗提至更低的程度。

免疫分析法。可以通过免疫分析法（如蛋白质印迹）直接对P54583进行检测。图12显示了蛋白印迹的结果。为了进行上述分析，从培养物上清液或者细胞团块的裂解液中获得蛋白后，在电泳前对其进行脱糖基化。该分析显示大多数可检测到的蛋白来自培养物上清液，这说明对酶进行基于抗体的亲和提纯法能用来对蛋白进行浓缩和提纯。

实施例8——对P54583内切葡聚糖酶进行内含肽修饰。通过前文详细描述的方法对P54583内含肽插入位点进行确认。图13显示了P54583中被选择插入Tth内含肽位点的相对位置。显示了催化结构域（GH5）、连接域（窄条形）以及碳水化合物结合结构域（CBM2）的相对位置。两种催化谷氨酸盐是GH5家族中的保守成员。所示的丝氨酸、苏氨酸和半胱氨酸的残基编号全部是相对于α信号肽被切割后，从酿酒酵母中分泌的“成熟”形式多肽而言的（除了C75和C465，它们实际上位于相对于切割位点的35号和425号位置）。

随后如图14所示地，通过SOEPCR策略（HortonRM，HuntHD，HoSN，PullenJK，PeaseLR.1989.Engineeringhybridgeneswithouttheuseofrestrictionenzymes:genesplicingbyoverlapextension.Gene.77(l):61-8，通过引用该文献全部记载而将其整体与本文结合。）将重组P54583蛋白的编码序列进行组装。该策略与上文中用来组装内含肽修饰的木聚糖酶基因的策略相似。将引物设计成退火到：

（A）pAL410-P54583（见图5）中α信号肽的编码序列；

（B）P54583编码序列内与插入位点相邻的区域；

（C）Tth内含肽编码序列的5’端；

（D）Tth内含肽编码序列的3’端；

（E）P54583编码序列内与插入位点（注意：该位点不与引物C覆盖的区域发生重叠）相邻的区域；和

（F）来源于pAL410P54583的CYC终止序列中的区域。

PCR1使用引物A和引物B组装的短产物含有针对部分α信号和内切葡聚糖酶（P54583-N）的N-末端部分的编码序列。PCR产物1的3’末端上含有与Tth内含肽5’末端同源的短区段。PCR2使用了引物C和引物D来对Tth内含肽编码序列进行扩增。PCR3使用了引物E和引物E来对内切葡聚糖酶（P54583-C，可以含有全部或一部分的催化结构域和碳水化合物结合结构域）中带有“C+1”氨基酸的C-末端部分、与Tth内含肽5’末端同源的短区段以及一部分的pAL410P54583中的CYC1终止子（CYC1t）的编码序列进行扩增。然后将PCR产物1、PCR产物2和PCR产物3在一个PCR反应中进行组合。鉴于其与Tth内含肽端部的同源性，PCR产物1和PCR产物3能退火到PCR产物2上。在最外层引物（A和F）进行的DNA合成或扩增能生成大量的完整长度产品（如最下方图所示）。通常将该终产品简称为“NIC”（N-末端片段，内含肽和C-末端片段）。通过选择合适的引物，可以用这种方法在任意插入位点构建任意类型的内含肽修饰蛋白。通过在0位置使用天然亲核氨基酸，或者将0位置处氨基酸诱变为亲核氨基酸的方法，可以选择蛋白质中的任意氨基酸作为内含肽插入物的位点。所述亲核氨基酸可以是C、T或S的残基。

用于SOEPCR的典型环化条件包括：20μl的反应物、10μl的PhusionHF（NewEnglandBiolabs，IpswichMA）DNA聚合酶主混合、4μl的各引物（来自浓度为1μΜ的原料）和2μl的合适模板，稀释至接近0.1-1ng/l。按照PhusionHFDNA聚合酶指南的说明进行热环化。进行第一轮PCR反应后，通过WizardSV凝胶和PCRCleanup试剂盒（Promega，Madison，WI）对产物进行凝胶提纯，将1μl的各个第一轮产物进行混合后在随后的PCR反应中组装成第二轮（完整长度）产物，其条件基本与第一轮条件相同，不同的是延伸时间从30秒增加为60秒。

对适合于各个内含肽插入位置的PCR产物进行制备，以得到所有期望的内含肽修饰P54583衍生物。但是本实验步骤中的一些组成被模块化了。例如，可以用引物C和引物D来制备PCR产物2，然后可以用PCR产物2来组装任何计划内重组物。类似地，无论插入物位置在哪里，都可以用引物A和引物F分别制备PCR产物1和PCR产物3。这样一来，只有引物B和引物E能唯一地获得特定内含肽插入物。下表6列举了用来组装各个内含肽修饰的内切葡聚糖酶的寡核苷酸引物序列（从5’到3’方向）。虽然引物B和引物E对各个产物来说都是唯一的，但它们中的每一个都含有与Tth内含肽的末端同源的区域（如图14中讨论所示）。下表6中，将这一区域在每个引物中用下划线标记出来。

表6

Tth内含肽在C75位置的插入还伴随少量的在内含肽/外显肽接头附近的保守氨基酸改变。为了适应这些改变，按照下面记载地用不同类型的引物C和引物D对用来组装C75Tth内含肽产物的Tth内含肽（PCR2）进行扩增。

C_C75Tth，5’TGCCTTGCCGAGGGTACCCGAGTCTTGGACGCGGCTACCGGGCA3’(SEQIDNO：1968)

D_C75Tth，5’GTTGTGCACGACAACCCCTTCGCTCACGAAGTTTGCAAAGGGT3’(SEQIDNO：1969)

表2所列插入位点与图13所表示的相同。还设计了一系列的引物来将PspPol内含肽和RecA内含肽插入到P54583内的多个位点上。插入这些内含肽的策略与图14中描述的相同，不同的是，引物B、引物C、引物D和引物E全与特定的内含肽相匹配。上述引物的组合物列于表7（用来组装编码PspPol内含肽修饰的P54583内切葡聚糖酶的引物）和表8（用来组装编码RecA内含肽修饰的P54583内切葡聚糖酶的引物）。

表7

表8

用上述引物针对全部设计的内含肽修饰的内切葡聚糖酶进行SOEPCR反应。然后将完整长度PCR产物与pCRBluntIITOPO（Invitrogen）连接，并对单个克隆体进行完全测序，以确保在PCR和/或克隆过程中没有发生不期望的碱基改变。一旦发现突变，重复全部或部分受影响的PCR反应并将错误进行校正。当编码内含肽修饰的P54583的产物组成得到确认后，将整个片段从pCRBluntII载体中切除，并连接到pAL410（或相关载体）上。将得到的载体一次引入酵母细胞。通过菌落PCR和小量制备的质粒还原（使用来自ZymoPrep酵母小量制备试剂盒II，ZymoResearch，OrangeCA）的组合来对酵母转化体进行典型性验证。接着，将从酵母细胞中还原的质粒再引入大肠杆菌细胞，通过大肠杆菌质粒小量制备进行传播和分离，通过限制酶切进行检测，来测定质粒自引入原始酵母细胞之后是否经历了突变或重排。通过这种方式将完全验证的质粒还原，相应的酵母菌株可以用于随后有关内含肽修饰的内切葡聚糖酶的实验中。

随后在平行YPD平板（A和B）上对携带内含肽修饰的内切葡聚糖酶的表达载体的酿酒酵母转化体进行评分，所述YPD平板中含有100mg/L的G418，其上施覆有0.2%的AZCL-HE-纤维素覆层。将这些平板在30℃下培养2个晚上。然后将平板B移至70℃下数小时。图15显示了平板A和B及各自对应的顺序：条纹1-21分别为P54583T154Tth、P54583S135Tth、P54583S134Tth、P54583S96Tth、P54583S94Tth、P54583T93Tth、P54583C75Tth、P54583S67Tth、P54583T61Tth、P54583S56Tth、P54583S10Tth、P54583-野生型、pAL410空载体、P54583S393Tth、P54583S353Tth、P54583S330Tth、P54583S321Tth、P54583S314Tth、P54583S277Tth、P54583S237Tth和P54583S192，它们含有具有序列SEQIDNOS:1753-1758、1741、1759、1760、1739、1761、111、2006、1762-1767、1743和1742。在一些细胞附近出现的蓝晕说明P54583具有活性。本实验的结果说明Tth内含肽插入物根据其插入位点对P54583产生了不同程度的干扰，且这些内含肽修饰的内切葡聚糖酶中的一种或多种展现出热敏酶活性。

插入P54583野生型的Tth内含肽对酶表达和活性水平产生了影响，这可以通过蛋白质印迹分析和活性分析测量得到。对20个NIC和对照组进行Enzchek活性分析。20个NIC和Tth内含肽插入到S10、S56、T61、S67、（C75）、T93、S94、（S96）、S134、（S135）、T154、S192、S237、S290、S314、S321、S353和（S393）位置处。这20个NIC具有序列（SEQIDNOS:1761、1739、1760、1759、1741、1758、1757、1756、1755、1754、1753、1742、1743、1768、1766、1765、1763和1762）。将培养物上清液分成两等份。从这些等份中取出一半在52.5℃下进行6小时的加热预处理，另一半则贮存在4℃下。进行预处理的温度和持续时间可以不同。随后使这些样品在室温下进行平衡，并进行Enzchek分析（与底物进行3小时的培养）。分析的最后，根据各个样品中的荧光量来推断内切葡聚糖酶的活性。如图16所示地，Enzchek活性分析反映了内含肽修饰的内切葡聚糖酶产生超过其来源（background）的酶活性（pAL410，空载体对照）在52.5℃下进行预温育时，该部分人显示出较高的活性。图16中的wt表示野生型P54583内切葡聚糖酶。鉴于对结构（显示了不含信号肽的P54583的不成熟形式或不成熟形式）进行的编号上存在差异，相对于不成熟形式的氨基酸插入位点的位置表示在括号内，作为NIC的子集。

图16所示构造在羧基端上含有可以被His标签抗体检测到的His标签。将来自对应培养物的上清液浓缩20倍，并用于蛋白质印迹分析中（图17）。在图17中，wt表示P54583野生型，pAL410表示具有His抗体（Genscript，PiscatawayNJ）的空载体，成熟的剪接蛋白由60kDa带状表示。如图17所示，还通过蛋白质印迹对其它Tth内含肽修饰的P54583——C465（SEQIDNO:1769）进行分析。用星形标记的泳道在平板法中也表现出显著的活性（见图15）。通过蛋白质印迹显示，表达内含肽修饰酶的培养物中可以检测到分子量与野生型酶相似的蛋白质，这说明在重组蛋白中发生了内含肽剪接。也能在一些样品中检测到具有较高分子量的种类，它们可能对应于未剪接的NIC、剪接中间体、聚集体或其它形式的重组蛋白。NIC显示了不同水平的蛋白积累，这在一定程度上对应于图16所示的活性测量结果。

实施例9——对内含肽修饰的内切葡聚糖酶的诱变。

用同源重组在酿酒酵母（SwersJS，KelloggBA，WittrupKD.2004,通过活体内同源重组产生的洗牌抗体文库及酵母表面展示（Shuffledantibodylibrariescreatedbyinvivohomologousrecombinationandyeastsurfacedisplay），NucleicAcidsRes.32:e36，通过引用该文献全部记载而将其整体与本文结合。）的DNA文库中产生大量的多样性。在该系统中，可以将携带有多肽（已生成）编码序列的线性DNA通过共转化到酵母内的方法插入到线性表达载体上。可以使用易错PCR或其它策略来对诱变整个或部分（例如，内含肽）的内含肽修饰的核酸内切酶。得到的产物可以与合适的线性表达载体（例如，pAL410或其衍生物）一起共转化到酿酒酵母细胞中，这能催化分子之间发生同源重，并能增加数千个酵母克隆体集合，其中每个克隆体都携带唯一的重组表达载体。通过这种或体内重组方案产生的酵母菌落可以对多个被修饰的蛋白进行表达，所述蛋白的多样性又直接与发生诱变的编码序列水平相关（或者超过了该水平）。

培育一系列的用于酵母或体内重组的重组载体。各个重组载体携带截断的Tth内含肽。截断的Tth内含肽失去了大部分的内含肽序列，仅留下从内含肽编码序列5’端和3’端开始70-80bp。在该DNA序列的中心是唯一的EcoRV位点。下面显示了具有截断Tth的DNA序列，其中EcoRV位点用下划线标记。

TGCCTGGCCGAGGGCTCGCTCGTCTTGGACGCGGCTACCGGGCAGAGGGTCCCTATCGAAAAGGTGCGTCCGGGGAT ATCGAACCGGCCGGTAAGGCGAGAACATTCGACTTGCGCGTTCCACCCTTTGCAAACTTCGTGAGCGAGGACCTGGTGGTGCATAAC(SEQIDNO：2007)

通过EcoRV酶切可以简单地使携带上述截断内含肽的表达载体线性化。由于这种载体缺乏大部分“野生型”内含肽序列，在酵母内进行的同源重组过程中产生的表达载体更可能携带在易错PCR过程中产生的突变，这是因为在重组过程中与突变体竞争的“野生型”内含肽变少了。此外，载体在高通量筛选模式下发生的自连接可能产生假阳性，而在重组载体中使用所述截断内含肽就能降低假阳性数量方面具有更大的优势。鉴于截断的性质，截断内含肽会在内切葡聚糖酶基因内产生移码（frameshift），产生的酶的翻译过程被过早地终止了。这种翻译产物具有酶活性的可能性较低。因此，在文库筛选中产生的功能性酶更有可能来自于涉及DNA片段编码诱变内含肽的真重组事件。

使用类似于图14中描述的策略制备源于无His的pAL410-P54583的表达载体。在这些表达载体中，在S56、C75、S192、或S237位置处引入截断内含肽Tth内含肽序列来代替完整长度的内含肽。随后，使用该重组载体的集合来产生酵母SCBJ细胞内的内含肽修饰的内切葡聚糖酶诱变文库。图18A-18C中描述了PCR内含肽诱变机制。在模板表达载体（无His的pAL410-P54583S237Tth（图18A））的内含肽插入位点侧翼的引物（例如，S237上游和S237下游）可以用来对重组载体的特定区域进行扩增，所述重组载体含有完整内含肽编码序列和部分侧翼外显肽编码序列。可选择地，也能使用仅能扩增内含肽序列的引物。在合适的条件下生成了PCR产物，同时在扩增的DNA分子集合中分散有随机突变（五角星）。可以将这些诱变DNA分子与合适载体进行混合，如图18C所示，通过用EcoRV限制性核酸内切酶进行酶切使其线性化。随后可以将混合物引入酵母细胞中驱动重组进行。在下面的实施例中，将线性无His的pAL410-P54583S237Tth-截断作为载体，利用图18B所示的DNA分子在S237位置产生诱变内含肽文库。适用于S56、C75或S192位置的引物也能与各自的重组载体（图18C所示）结合使用。该策略将携带有位于外显肽（本实施例中，为内切葡聚糖酶）侧翼区域内和位于内含肽内部的突变的DNA分子包括进来。但是，如果在易错-PCR中使用PCR引物仅对内含肽序列进行扩增，那么也可以使用任意重组载体作为改变后内含肽编码序列的宿主。图18A中，P54583-N和P54583-C指的是针对内切葡聚糖酶的N-末端部分和C-末端部分的编码序列。图18B中，P54583*代表源于内切葡聚糖酶编码序列的小侧翼部分，它能通过明智设计的引物而包含在诱变PCR产物中。图18C中，TthN和TthC代表Tth编码序列的N-末端部分和C-末端部分，它们在截断内含肽内通过EcoRV位点发生分立。其它的缩写与图5中的相同。

实施例10——用微小内含肽对P54583进行修饰。

基于一开始的平板分析和液相分析，选择上文描述的插入位点的子集与另外8个微小Tth内含肽进行修饰，它们是mTth001（SEQIDNO:92）、mTTh002(SEQIDNO:93）、mTth003(SEQIDNO:94）、mTth004(SEQIDNO:95）、mTth005(SEQIDNO:96）、mTth007(SEQIDNO:98）、mTth008(SEQIDNO:99）、andmTth010(SEQIDNO:101）。每个构造中插入一种内含肽。P54583中的S56位置是第一个选择用微小内含肽进行修饰的位点。在单一酵母活体内的重组反应中，将微小mini-Tth内含肽插入该部位。酵母在YPDG418平板上进行还原和生长后，培养出36个独立的菌落以进行活性分析。36个菌落中有2个表达出超过了基线水平。将质粒从这两个菌株中还原出来，并使其进行DNA测序分析。发现两种样品均携带mTth010微小内含肽。下面是mTth010微小内含肽的DNA序列，其下方是对应的氨基酸序列。

mTth010

tgcctggccgagggctcgctcgtcttggacgcggctaccgggcagagggtccctatcgaa

CLAEGSLVLDAATGQRVPIE

aaggtgcgtccggggatggaagttttctccttgggacctgattacagactgtatcgggtg

KVRPGMEVFSLGPDYRLYRV

cccgttttggaggtccttgagagcggggttagggaagttgtgcgcctcagaactcggtca

PVLEVLESGVREVVRLRTRS

gggagaacgctggtgttgacaccagatcacccgcttttgacccccgaaggttggaaacct

GRTLVLTPDHPLLTPEGWKP

ctttgtgacctcccgcttggaactccaattgcagtcagagatgttgagactggagaggtt

LCDLPLGTPIAVRDVETGEV

ctctgggaccctattgttgctgtcgaaccggccggtaaggcgagaacattcgacttgcgc

LWDPIVAVEPAGKARTFDLR

gttccaccctttgcaaacttcgtgagcgaggacctggtggtgcataac(SEQIDNO：2008)

VPPFANFVSEDLVVHN(SEQIDNO：101)

为了测试携带微小内含肽的P54583衍生物（a.k.a.“P54583S56mTth010”）的内切葡聚糖酶是否依赖于该微小内含肽发生剪接的能力，制备了被修饰的构造。在被修饰的构造中，用丙氨酸取代内含肽的端部氨基酸（在半胱氨酸N-端残基处，和天冬氨酸C-端残基处；见以上序列）。N-末端半胱氨酸和C-末端天冬氨酸很可能在催化内含肽剪接过程中起到关键作用，因此用丙氨酸取代这些残基是已知的或可能阻止内含肽进行剪接。参见图19，将样品从SCBJ酵母培养物中取出，所述SCBJ酵母培养物中携带了空表达载体、pAL410（阴性对照）、编码不间断酶的表达载体、P54583（野生型（wt））、编码在S56位置携带了微小内含肽的衍生物的表达载体（P54583S56Tth139），或编码在S56位置携带了缺陷微小内含肽的衍生物的表达载体（P54583S56AThA139）。在Enzchek分析中，通过在室温下进行4小时的培养来分析样品中的内切葡聚糖酶活性。与微小内含肽不同的是，缺陷内含肽将内切葡聚糖酶活性降低至接近阴性对照的水平。无论样品是否在进行分析前先在低温（4℃）或高温（55℃）下进行5小时预处理都没有改变这种趋势。由此得出结论：不能在P54583的S56位置对微小内含肽进行剪接将会对酶活性造成干扰，在同一位置处能发生剪接的微小内含肽则能重新构建起大部分的天然酶活性。

为了调查位于该位置的微小内含肽能否表现出热敏剪接作用（即在特定温度下对重组酶进行的预温育是否重新构建了不同程度的内切葡聚糖酶活性），使来自SCBJ酵母细胞（表达P54583S56MTth010（a.k.a.P54583S56Tth139））单一培养物的样品在不同的温度下进行6小时的预温育。之后，使样品均匀冷却至4℃，然后进行标准Enzchek分析（与与底物在室温下进行培养）。参见图20，在46.6℃的预温育温度下重新构建的活性与4℃预温育温度下重新构建的活性。但是，在50.8-53.6℃下对酶进行6小时的预温育能以最适度的方式增加酶活性。在更高的温度处，内切葡聚糖酶活性开始下降到未在4℃以上进行加热的酶所达到的活性水平。这种表观活度发生下降至少在一定程度上是由于本底“类似内切葡聚糖酶”活性的丧失，改活性可以在酵母培养物的上清液中检测到。本底活性不能耐受所述提高温度中的热量。当总内切葡聚糖酶活性较低时（如在特定实施例中），本底活性的效果就至关重要。从某种程度上来说，可以从图19所示数据中观察到这一现象的效果，其中，在进行分析前，培养物在55℃下进行的预温育使阴性对照样品（pAL410）的内切葡聚糖酶“活性”表现出下降。在图20中，50.8-53.6℃之间的温度能重新构建最大程度的重组酶活性。

将8种微小内含肽引入P54583的S237位置处。所述8种微小内含肽分别含有SEQIDNOS:2009-2016的序列。每个构造中插入一种内含肽。通过体内重组将微小内含肽引入S237位置处。使每个案例中的候选重组酵母菌落发生还原，其中携带的质粒进行分离并通过DNA测序进行测试来证实负责内含肽修饰的内切葡聚糖酶的基因是否完整，是否不存在突变点或其它的改变。确认了产生各个微小内含肽修饰的内切葡聚糖酶的酵母菌株后，对全体进行内切葡聚糖酶分析。经证实，携带mTth010微小内含肽的菌株具有内切葡聚糖酶活性。如图21所示，内含肽修饰的内切葡聚糖酶显示在52.5℃附近具有最佳诱导温度。在50.8-53.6℃下对酶进行的预温育能使酶活性增加约75%。用Enzchek底物在室温下进行1小时的分析。对其它被分离出来的P54583-mTth010-S237内含肽修饰蛋白（表现出更高的活性水平）指定SEQIDNOS:1751，1752。

已示出的是，mTth010活性可以通过在接近52.5℃的温度下进行预温育而从P54583S237MTth010内含肽修饰的内切葡聚糖酶中还原，然后测试该预温育步骤的长度是否对酶活性产生影响。将4个来自SCBJ（无His的pAL410P54583S237Tth139）培养物的独立菌落各自在丰富培养基内进行培养。从各个培养物中取出等份样品后，将每个等份分割成多个样品，并且每一个分割样品（splitsample）在52.5℃按下面进行不同时间长度的预温育：0小时（未经加热，经在4℃下进行了预温育）、2小时、4小时、6小时、8小时或10小时。进行预温育步骤后，将单个分割样品保存在4℃下直到进行分析。接着，在室温下通过Enzchek分析对每个分割样品进行分析。如图22所示地，4种受测培养物中有3种在2-4小时内就达到了它们最高的活性水平。比上述时间更长的预温育时间即不会提高酶活性，也不会降低所恢复的活性程度。

实施例11——对内含肽修饰的内切葡聚糖酶进行诱变和筛选。

采用图18所提出的策略，使用易错PCR来产生携带其中碱基对发生改变的DNA的突变体集合（文库），所述DNA编码内含肽及内切葡聚糖酶的连续部分。得到了P54583内多个位置（包括S56、C75、S192和S237位置）之一上的完整长度内含肽和微小内含肽的衍生物的文库。收集来自每个文库的酵母克隆体进行初步分析。使用菌落PCR（采用来自KAPABiosystems的KAPA2GRobustTaq，WalthamMA）来对部分编码内切葡聚糖酶的基因（每个案例中均为含有诱变内含肽）进行扩增。接着对这些PCR产物进行DNA测序，以评估文库中突变的频率和性质。

对突变频率进行初步评估后，将来自单个文库的克隆体涂覆在选择培养基（添加了100mg/L的G418的YPD凝胶）上，并使它们在30℃下生长2-3天。从这些平板上挑出3760个菌落，同时还有多个阳性[SCBJ（无His的pAL410P54583）]和阴性[SCBJ（pAL410）]对照，并将其接种到1ml体积的添加了100mg/L的G418的YPD液体培养基（已分散到96深孔板上）。然后使这些培养物在连续搅拌的条件下在30℃培养3天。从各个液体培养物中取出等份，将等份分成两组重抽样品（replicatesample），并对其进行Enzchek分析。对每个培养物来说，将重抽样品中的一份在52.5℃下进行4小时的预温育，而余下的一份被保存在室温下。在这之后，使所有的重抽样品在室温下达到平衡，在与Enzchek底物混合之前将其分割成三重样品（triplicatesample）。90分钟后，通过加入等体积的20%的tris碱来使内切葡聚糖酶反应停止，并对总荧光单元进行测量。通过针对每个样品中进行加热和未经加热处理后测得的活性差，来推断热敏酶的活性程度。然后将克隆体在两种预处理条件上表现出的活性差异计算成诱导倍数，其中1倍表示活性没有发生变化。略去酶活性的热敏程度的增加（或降低），将落入各范畴的克隆体的数量在图23中标出。如图23所示，文库中克隆体的多种行为（热敏性）集中在亲本克隆者，其中，P54583内切葡聚糖酶在S56位置携带了MTth010微小内含肽，它同时还表现处在约52.5℃进行预温育时能提高10%的活性（即1.1-诱导倍数；见图23）。

在近4000个克隆体中对热敏性进行分级可以对候选者进行识别以用于更进一步的分析。对来自“文库14”（Libl4，携带pAL410P54583S56Tth139衍生物的SCBJ细胞）的文库的克隆体进行分析。进一步分析图23所示试验中表现出最大差异的克隆体，将部分数据列于图24的表格中。所选的克隆体含有下表9所列的内含肽修饰酶突变体。图24中每个突变体的左边条形表示的是在室温下进行处理的样品中的活性，每个突变体右边条形表示的是经过热处理的样品中的活性。图24中的误差线反映了三重分析中的活性差。在这些分析中，野生型P54583阳性对照和pAL410阴性对照均显示：在提高温度下进行预温育后，活性下降得最平缓。这样一来，在40个活性增加最多的克隆体中，没有将上述对照样品示于图24中。

表9

突变	序列
		AA0002.C8	SEQ ID NO:1745
AA0021.C10	SEQ ID NO:1746
		AA0057.F3	SEQ ID NO:1747
AA0057.D5	SEQ ID NO:1748

AA0063.C5	SEQ ID NO:1749
		AA0064.B7	SEQ ID NO:1750

从上面经提纯的组和菌落中收集单一克隆体（Individualclone）。新鲜培养物（在YPDG418中）从各个克隆体产生的3种单菌落中生长出来，对这些培养物进行Enzchek分析以测定其热敏内切葡聚糖酶活性，由此构成了对上述候选者的第二次分析。接着，将3种单菌落中（在第二次分析中使用的）的一种菌落接种到3份独立的1mL的YPDG418上，使其在30℃下生长，并通过Enzchek进行测试，这构成了对上述候选者的第三次分析。每种情况中，对活性增加倍数进行技术，这就能够测定各个克隆体表现的再现性。将这一针对6种收集自文库的克隆体的比较示于图25中。图25中，分析1指的是各个克隆体进行高通量筛选的第一次结果。该分析中的数据对应于这样的单培养物：从其中产生了6份技巧性样本（3份进行预热，3份不进行加热），并进行分析。分析2中的数据反映了3个生物学样品（来自3个独立菌落的单一培养物），从中制得复样（一个进行预热，另一个不进行加热），在进行分析前，将所述复样又各自分割成2份技巧性样本。分析3反映了来自单一菌落（从初始培养物中提纯得到，该培养物在分析1中进行了测量）的培养物的结果。分析3中的结构是最小12次分析（6个在室温下进行预温育，6个在52.5℃下进行预温育）的平均数，每组6个结果对应于2个技巧性样本（对应于最少为3个生物学样本）。虽然图25所示的每个候选者在接下来的分析中显示出>1.5的诱导倍数，但这些结果表示第一次的筛选可能稍微夸大了活性（可以从特定基因中恢复）变化程度。

通过菌落PCR将部分的编码内含肽修饰的内切葡聚糖酶的DNA序列从多个候选者（对文库14进行第一筛选后确认的）中分离出来。对图25所示的各个克隆体中内含肽编码区域的序列进行的检测显示，每个序列携带了能导致微小内含肽MTth010序列内至少一个氨基酸改变的突变，所述克隆体之一还含有能导致位于相邻N-外显肽序列中的氨基酸改变的突变。这些突变列于下表10中。

表10

*相对于MTth010的计数

相对于成熟形式的P54583内切葡聚糖酶的编号

在表10所总结的实施例中，仅对紧邻内含肽的区域进行了测序。令人感兴趣的是，发现从内含肽中同一个突变上还原出来两个无关的克隆体（Lib14AA0057.F3和Lib14AA0057.D5中的R55C）。

还构造了其它文库，其中，靶定完整长度Tth内含肽内的单个氨基酸进行饱和诱变（saturatingmutagenesis）。先前的木聚糖酶（SwissProt登录号为P77853）中的内含肽诱变结果反映，当Tth插入P77853中的某些位置处时，内含肽内的突变（感染了的精氨酸51）能使内含肽修饰的木聚糖酶具有较强的热敏转化表型。为了测试类似的突变是否能在内含肽修饰的内切葡聚糖酶引起热敏性为，发明人在Tth内含肽中51位置处引入了随机突变，其中，所述内含肽位于054583中的S56、C75、S192或S237位置处。通过与上文描述相同的高通量Enzchek分析，对具有这些突变的内含肽修饰的内切葡聚糖酶进行表达的酵母克隆体的文库进行筛选。将数据分类，以识别对具有最强热敏诱导性进行表达的酶的克隆体。如图26所示，经该筛选得到的候选者在进行预处理时显示出最温和的活性诱导（1.5-2倍）。绝大多数的最佳表现者来携带了位于P54583的S192位置或S56位置处的内含肽的克隆体。

实施例11a——在P54583S237Tth139NIC（a.k.a.P54583-S237MTth010）内的离散位置处进行饱和诱变后，对表达个体重组蛋白的酿酒酵母培养物进行的高通量扫描识别了数个相对于对照蛋白具有改善的转化性的候选者。使质粒DNA从单个酵母克隆体中还原出来。对这些质粒中的一部分进行的测序能识别各个对应基因中的突变。对突变体序列进行的翻译显示，其所编码的蛋白携带了一种或多种有关起始NIC的氨基酸改变。将这些改变列于下表10A中。

用4-甲基伞形酮-纤二糖苷（4-methylumbelliferylcellobioside）对这些克隆体中的每一个进行的活性分析的结果总结在图26A中。

将最少为8个代表着每一个候选者的酿酒酵母克隆体在800μl的YPD+300mg/l的G418中进行培养，并在室温下摇动下生长4天。将得到的培养物分成4份5μl的重复等份样本。该等份样本中的两份在37℃下预温育5小时，另两份在53℃下预温育5小时。随后，将全部等份冷却整夜至4℃，用4-MUC作为底物在室温下分析内切葡聚糖酶活性。针对每个克隆体在各个预温育条件下的全部重复培养物和样品的平均数（包括标准偏差在内）示于图26A中。无论何种预温育温度，野生型酶（P54583）酶活性改变都十分小。亲本NIC（P54583S237Tth139）的整体活性较低，并且在该分析中针对预温育条件作出的改变很小。阴性对照样品（仅携带质粒载体pAL410）在53℃下进行预温育后，其残留活性（residualactivity）表现出了显著的下降。本组中得的大部分候选者在53℃下进行预温育后显示出了高活性。

下面是在各个质粒（从以上克隆体中分离出来）上编码的推断NIC多肽序列，具有下划线的序列（及相应的数字）指的是内含肽。

亲本NICP54583S237Tth139(SEQIDNO：2059)

MAGGGYWHTSGRETLDANNVPVRTAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPTKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACAAS522

(SEQIDNO：2060)

MAGGGYWHTSGREILDANNVPVRIAGTNWFGFETCNYVVHGLWSRDYRSMLDQTKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACAAS522

(SEQIDNO：2061)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACAAS522

(SEQIDNO：2062)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACAAS522

(SEQIDNO：2063)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQAIAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYMNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2064)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACAAS522

(SEQIDNO：2065)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQMIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACAAS522

(SEQIDNO：2066)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRAVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARMMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2067)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPKRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2068)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACAAS522

(SEQIDNO：2069)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGPDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPKRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2070)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLSY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2071)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNGLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2072)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2073)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPKRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2074)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPCRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2075)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPLRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2076)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRGVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2077)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPSRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2078)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPWRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2079)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR130

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNLLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2080)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPVRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGVLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2081)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNSLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2082)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPMRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQVLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2083)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPARLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2084)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPVRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2085)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACAAS522

(SEQIDNO：2086)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPSRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2087)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLGY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

(SEQIDNO：2088)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQALAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACAAS522

(SEQIDNO：2089)

MAGGGYWHTSGREILDANNVPVRIAGINWFGFETCNYVVHGLWSRDYRSMLDQIKSLGYN60

TIRLPYSDDILKPGTMPNSINFYQMNQDLQGLTSLQVMDKIVAYAGQIGLRIILDRHRPD120

CSGQSALWYTSSVSEATWISDLQAIAQRYKGNPTVVGFDLHNEPHDPACWGCGDPSIDWR180

LAAERAGNAVLSVNPNLLIFVEGVQSYNGDSYWWGGNLQGAGQYPVVLNVPNRLVY236/

SAHDYATSVYPQTWFSDPTFPNNMPGIWNKNWGYLFNQNIAPVWLGEF/284

GTTLQSTTDQTWLKTLVQYLRPTAQYGADSFQWTFWSWNPDSGDTGGILKDDWQTVDTVK344

DGYLAPIKSSIFDPVGASASPSSQPSPSVSPSPSPSPSASRTPTPTPTPTASPTPTLTPT404

ATPTPTASPTPSPTAASGARCTASYQVNSDWGNGFTVTVAVTNSGSVATKTWTVSWTFGG464

NQTITNSWNAAVTQNGQSVTARNMSYNNVIQPGQNTTFGFQASYTGSNAAPTVACVAS522

实施例12——白蚁内切葡聚糖酶。

用内含肽对高山象白蚁源性内切葡聚糖酶进行修饰，使内含肽对内切葡聚糖酶的活性造成损害，而切除内含肽（自发性地或对刺激（例如温度变化）作出的应答）能是内切葡聚糖酶的活性发生重构。可以将内含肽修饰的内切葡聚糖酶用在需要对纤维素物质和/或其它多糖进行传统水解的应用中，内切葡聚糖酶将所述纤维素物质和/或其它多糖识别作为底物。与其它内切葡聚糖酶相比，白蚁源的内切葡聚糖酶可以在pH耐受性、表达和/或比活性方面具有优势。例如，可以将pH诱导的内含肽插入内切葡聚糖酶中。

鉴于白蚁独特的解剖结构、生理结构和共生菌群，它们能自然代谢多种木素纤维素材料。当白蚁对木素纤维素材料进行消化时，它们将颗粒物质与多种酶进行混合。这些材料穿过白蚁消化道时经历了pH从弱酸到强碱的改变。接着这些颗粒被白蚁消化道内的共生体摄入并进一步被消化。共生体和白蚁之间有机代谢物的交换提供了这样的方式：白蚁通过该方式从摄入的物质中获得了间接的营养利益。

并不是白蚁体内所有能分解木素纤维素材料的消化酶都源于微生物。白蚁系统内的一些最具活性的酶实际上是由白蚁自身进行表达和分泌，随后由共生体将其与颗粒材料一起摄入的。在一些白蚁种（如黄胸散白蚁（Reticulitermessperatus）或达尔文澳白蚁（Mastotermesdarwiniensis））中，内切葡聚糖酶由唾液腺分泌，在咀嚼的过程中与木质材料混合，在此之后它们进入肠道然后由共生体摄入。其它的种属中（如高山象白蚁），这些酶被直接分泌到中肠内。

图27显示了白蚁内切葡聚糖酶的进化史。对来自不同糖基水解酶第9家族（GH9）的内切葡聚糖酶的催化结构域的氨基刷序列进行的比较显示，在来源于白蚁（象白蚁（Nasutitermes）、散白蚁（Reticulitermes））、微生物和植物的酶具有极大的相似度。如图所示地，由原始白蚁和更高级的白蚁表达的内切葡聚糖酶（EC3.1.2.4）不仅彼此具有显著的同源性，它们与来源于细菌和植物的配也具有显著的同源性。与GH9家族酶的许多其它成员不同的是，白蚁内切葡聚糖酶通常不含碳水化合物结合域，而仅含有催化结构域。高山象白蚁产生的内切葡聚糖酶NtEG可以作为功能酶在大肠杆菌中得到表达。源于家白蚁（Coptotermesformosanus）并能在大肠杆菌中进行表达的纤维素酶在天然形式和C-末端标记形式下具有不同的纤维素分解活性，它使酶的衍生物能够在体外进化成具有更强的性能（如热稳定性）。通过家族改组（familyshuffling）在4种亲本白蚁纤维素酶之间的随机交换的非保守氨基酸残基同样也能提高热稳定性。可以按照本文记载地用内含肽对上述酶中的任意一种进行修饰。

NtEG内切葡聚糖酶显示出在极酸性条件下的结构稳定性。这反映了一个事实：如前文所描述，可以将来源于白蚁的内切葡聚糖酶暴露于较宽的肠内pH范围中。使主要来源于高山象白蚁（NtEG）的内切葡聚糖酶结晶化，并在pH从6.5-2.5变化时，该内切葡聚糖酶中仅在结构上发生了非常细微的改变。可以将来源于白蚁的内含肽修饰的内切葡聚糖酶提供在需要暴露在强烈pH改变的条件中。

实施例13——对白蚁内切葡聚糖酶进行表达及其特征。

制得优化的NtEG（O77044，SEQIDNO:2017）密码子。下文显示了能在植物中进行表达的优化NtEG的DNA序列。该序列中包含了编码N-末端多肽（约16个氨基酸）的区域（在下面的序列中以下划线标出），当蛋白在白蚁细胞中得到表达时，所述多肽很可能起到分泌信号肽的作用。

密码子优化的NtEG

ATGAGGGTGTTCCTTTGCCTGCTCTCGGCGCTAGCTTTGTGCCAGGCGGCTTACGACTACAAGCAGGTGTTGCGGGACTCGCTACTATTCTATGAGGCCCAGAGATCCGGCCGGCTCCCAGCCGACCAGAAGGTCACGTGGAGGAAGGATAGCGCGCTGAATGACCAGGGTGACCAGGGACAAGACTTGACCGGCGGCTACTTTGACGCTGGGGACTTCGTCAAGTTCGGGTTCCCCATGGCTTATACCGCAACCGTGCTGGCATGGGGCCTCATAGATTTTGAGGCCGGCTACAGCAGTGCCGGGGCCTTGGATGATGGACGGAAGGCTGTCAAATGGGCCACCGACTATTTCATAAAGGCCCACACAAGTCAAAATGAGTTCTATGGTCAGGTCGGCCAGGGTGACGCCGATCACGCTTTCTGGGGAAGACCAGAGGATATGACGATGGCGCGCCCGGCGTACAAGATAGACACCTCAAGGCCTGGCTCTGATCTGGCAGGCGAGACAGCGGCTGCTCTTGCCGCTGCTTCAATCGTGTTCCGGAACGTCGATGGCACTTACTCAAATAACCTGTTAACACACGCTCGCCAGCTATTCGACTTCGCGAACAACTACCGGGGAAAGTATAGTGACTCTATTACTGACGCAAGAAATTTCTACGCAAGCGCAGACTACAGAGACGAGTTGGTTTGGGCTGCTGCGTGGTTATACAGAGCGACCAACGACAACACCTACCTCAACACTGCTGAGTCACTGTACGATGAGTTTGGGCTACAGAACTGGGGGGGGGGCCTGAACTGGGATAGCAAGGTGTCTGGCGTGCAGGTGTTGTTGGCCAAGCTTACCAATAAGCAGGCCTACAAGGACACGGTGCAGTCTTACGTCAATTACCTAATTAATAACCAGCAGAAGACTCCCAAGGGCCTCCTCTACATCGACATGTGGGGCACCCTTCGCCACGCTGCCAACGCCGCATTCATCATGCTCGAAGCCGCCGAGCTGGGCTTGTCCGCCTCCTCTTATAGACAGTTCGCGCAAACGCAAATCGACTACGCCCTGGGCGATGGTGGCCGCTCCTTTGTGTGCGGGTTCGGGAGTAATCCTCCTACGAGACCGCACCACAGATCCTCGTCGTGCCCGCCAGCTCCCGCTACTTGCGACTGGAATACATTCAACTCACCTGACCCAAACTACCACGTCCTCTCTGGGGCCCTAGTGGGCGGACCTGATCAGAATGACAACTACGTCGATGACCGTTCAGACTATGTTCACAACGAAGTCGCCACTGATTACAACGCGGGTTTCCAGTCCGCGTTAGCTGCTTTGGTGGCCCTTGGTTAC(SEQIDNO：2017)

使携带这种序列的DNA片段连接到酿酒酵母表达载体pAL410上。得到的构造pAL410NtEG示于图28中。在图28中，P-GAP是名义组成型酵母GAP启动子；α为来自酵母α交配因子的分泌信号肽，它被翻译成与白蚁源性内切葡聚糖酶发生融合的N-末端；NtEG-SP假定存在的16个氨基酸的信号序列，它能驱使NtEG从白蚁细胞中进行分泌；BAA33708NtEG是白蚁源性内切葡聚糖酶的编码序列的余下部分；CYCt是源于酵母CYC1基因的转录终止子和多腺苷酸化信号；f1ori是产生单个标准质粒衍生物的序列；KanMX，酵母内具有G418耐药性的基因；2uori是2微米起点，使质粒能在酵母细胞内进行复制；bla是在细菌细胞中产生氨苄西林耐药性的基因；以及ColEI是大肠杆菌内能对质粒进行复制的区域。

两个信号肽（一个来自酵母，另一个来自NtEG）在从pAL410进行表达时很可能产生冲突。为了测定是否能通过移除天然信号肽来增强NtEG的表达，制备这样的NtEG衍生物表达载体：它与原始载体的区别仅在于缺少从NtEG开放阅读框架开始的48个碱基对。这48个碱基对编码的是天然信号肽。将这种载体（pAL410NtEGm）引入酵母细胞内。

将携带pAL410、pAL410NtEG或pAL410NtEGm之一的酵母细胞划线于YPD琼脂平板上（含100mg/L的G418），该平板上施覆了1.5%的琼脂糖和0.2%的AZCL-HE-纤维素（MegazymeInternationalIrelandLtd）覆层。如图29所示，在携带pAL410NtEGm的菌落附近极易检测到内切葡聚糖酶活性，这说明酶具有活性，且它由生长细胞分泌出来。

接着，使携带pAL410NtEG，、pAL410NtEGm或pAL410-P54583（Ace1内切葡聚糖酶，见实施例7）质粒的酵母细胞，以及携带空pAL410作为对照的载体的菌株在丰富培养基上生长，并通过纤维素内切酶检测底物分析（MegazymeInternationalIreland有限公司）来分析培养物上清液的内切葡聚糖酶活性，该方法对染料从AZCL-HE-纤维素中的释放量进行测量（590nm下的吸光值）。如图30所示地，成熟形式的白蚁内切葡聚糖酶（NtEGm）比完整长度形式（保留了天然信号序列）的明显表现出更高的活性。NtEGm还表现出高于P54583的活性。虽然NtEGm和P54583的活性都随着温度增加而增加，但在70℃下进行培养时，NtEGm却失去其活性，而P54583的活性则继续增加。这些分析显示，NtEGm中的表达产生了比P54583中的表达产生了更易于检测的内切葡聚糖酶活性。

对被表达酶的耐pH性进行初步测量时，将表达NtEGm或P54583的培养物中的上清液进行收集。鉴于其较低的整体活性，进行分析前，使来自P54583培养物的上清液通过截留分子量10000的Millicon滤膜（Millipore，BedfordMA）过滤进行20倍浓缩。然后在不同pH的缓冲液中以及不同的温度下进行纤维素内切酶检测底物分析。如图31所示，NtEGm在pH等于4.5和8.0时显示出比P54583更高的活性（通过测量释放出的染料在590nm下的吸光值）。将培养物在40℃或58℃下进行预温育时也发生了这种现象。虽然前文也记载了在更高的pH环境中，P54583在70℃下的活性高于NtEGm。

按下面记载对pH在酶稳定性方面的效果对pH在酶活性方面的效果进行分析。根据上文描述从培养物上清液中制备P54583和NtEGm。然后使培养物暴露在不同pH的缓冲液中1小时。进行该处理后，用分析缓冲液（pH4.5）通过UltracelYM-30再生纤维素滤膜（Millipore）进行过滤来置换缓冲液。通过这一分析得到的结果说明NtEGm承受了pH值高达10.5时的预处理，在pH2或pH3的预处理中（数据未示出）的耐受性稍差。

为了测定His标间能否加入NtEGm中，以及它是否对活性产生任何影响，制备这样的pAL410NtEGm：其中，在紧接NtEGm编码序列的终止密码子之前引入6个组氨酸密码子。将这种质粒pAL410NtEGmHis引入酵母细胞中。随后从携带pAL410、pAL410NtEGm或pAL410NtEGmHis的酵母细胞培养物中收集上清液，并按前文所述对内切葡聚糖酶活性进行分析。通过这些实验（图32），可以发现His标签的引入会损害内切葡聚糖酶活性。

实施例14——对白蚁源性内切葡聚糖酶进行内含肽修饰。

制备一系列的融合蛋白，其中内含肽从不同的位置插入NtEG。通过本文描述的方法对内含肽插入位点进行测定，且所述位点通常与丝氨酸、苏氨酸或半胱氨酸相邻。随后通过图33所示的SOEPCR策略（也可以参见实施例6b）将重组NtEG蛋白的编码序列进行组装。如图33所示，将引物设计成退火到：

（A）pAL410NtEGm中α信号肽的编码序列；

（B）NtEGm编码序列内与插入位点相邻的区域（本例中为丝氨酸84）；

（C）Tth内含肽编码序列的5’端；

（D）Tth内含肽编码序列的3’端；

（E）NtEGm编码序列内与插入位点（本例中，该位点不与引物C覆盖的区域发生重叠）相邻的区域；和

（F）来源于pAL410NtEGm的CYC终止序列中的区域。

PCR1使用引物A和引物B组装的短产物含有针对部分α信号和内切葡聚糖酶（NtEG-N）的N-末端部分的编码序列。PCR产物1的3’末端上含有与Tth内含肽5’末端同源的短区段。PCR2使用了引物C和引物D来对Tth内含肽编码序列进行扩增。PCR3使用了引物E和引物E来对内切葡聚糖酶的C-末端部分的编码序列（NtEG-C）进行扩增，包括“C+1”氨基酸（本例中为丝氨酸84）和与Tth内含肽5’末端同源的短区段，以及一部分的pAL410中的CYC1终止子（CYC1t）。然后将PCR产物1、PCR产物2和PCR产物3在一个PCR反应中进行组合；鉴于其与Tth内含肽端部的同源性，PCR产物1和PCR产物3能退火到PCR产物2上。用最外层引物（引物A和引物F）进行的DNA合成或扩增能生成大量的完整长度产品（如最下方图所示）。

对适合于各个内含肽插入位置的PCR产物进行制备，以得到所有期望的内含肽修饰P54583衍生物。但是本实验步骤中的一些组成被模块化了。例如，可以用引物C和引物D来制备PCR产物2，然后可以用PCR产物2对所有计划的重组物进行组装。类似地，无论插入物位置在哪里，都可以用引物A和引物F分别制备PCR产物1和PCR产物3。这样一来，只有引物B和引物E能唯一地获得特定内含肽插入物。下表11列举了用来组装各个内含肽修饰的NtEG内切葡聚糖酶的寡核苷酸引物序列（从5’到3’方向）。虽然引物B和引物E对各个产物来说都是唯一的，但它们均含有与Tth内含肽的末端同源的区域。下表11中，将这一恒定区域在每个引物中用下划线标记出来。

表11所列插入位点指的是确定位置和外显肽C+1位置处的氨基酸残基的相对位置。编号是与预测的NtEGm多肽氨基酸序列相对应，其中2-5对应于天然NtEG序列（O77044）（SEQIDNO:112）中的氨基酸17-20（丙氨酸-酪氨酸-天冬氨酸-酪氨酸，Ala-Tyr-Asp-Tyr）。

用上述引物针进行SOEPCR反应。使这些重组PCR产物与pCRBluntIITOPO（Invitrogen，CarlsbadCA）连接，测序以证实其组成，随后转移到pAL410酵母表达载体上。从携带pAL410、pAL410NtEGm或其中Tth内含肽插入丝氨酸84、苏氨酸303、丝氨酸325或苏氨酸333的pAL410NtEGm的酵母细胞的培养物中收集上清液。随后在纤维素内切酶检测底物分析中对上清液进行检测，通过在590nm下吸光值的增加（因为染料从AZCL-HE-纤维素底物中释放出来了）来监测内切葡聚糖酶活性，以作为实践的函数。图34显示，将Tth内含肽插入任意的4个测试位置中均能显著地降低酶的活性。

综上，应该理解本发明不限于所公开的具体实施方式，而意在囊括说所有未背离本发明实质和随附权利要求书、说明书和/或附图所限定的范围内的改进。

Claims

1.一种内含肽修饰蛋白，该内含肽修饰蛋白由选自由SEQIDNOS:1629-1675、1677-1691、1699-1708和1710所组成的组中的序列组成。

2.根据权利要求1所述的内含肽修饰蛋白，其中，所述内含肽修饰蛋白由选自由SEQIDNOS:1701-1703所组成的组中的序列组成。

3.一种表达构建体在制备转基因植物中的用途，该转基因植物含有编码内含肽修饰蛋白的表达构建体，所述内含肽修饰蛋白由选自由SEQIDNOS:1629-1675、1677-1691、1699-1708和1710所组成的组中的序列组成。

4.根据权利要求3所述的用途，其中，所述内含肽修饰蛋白由选自由SEQIDNOS:1701-1703所组成的组中的序列组成。