CN1954072A

CN1954072A - 自加工的植物和植物部分

Info

Publication number: CN1954072A
Application number: CNA2004800429878A
Authority: CN
Inventors: M·B·拉纳汉; S·S·巴苏; C·J·巴蒂; 陈文�; J·克雷格; M·金凯玛
Original assignee: Syngenta Participations AG
Current assignee: Syngenta Participations AG
Priority date: 2004-03-08
Filing date: 2004-03-08
Publication date: 2007-04-25
Also published as: BRPI0418622B1; EP1730284A2; US20090320831A1; RS20060506A; BRPI0418622A; CA2558603A1; AU2004318207A1; US20080289066A1; AU2004318207B2; EP1730284A4; WO2005096804A3; WO2005096804A2; JP2007527726A

Abstract

本发明提供针对在植物中的表达进行了优化的、编码加工酶的多核苷酸，优选地合成的多核苷酸。所述多核苷酸编码嗜温型、嗜热型、或嗜高热型的加工酶，该加工酶在适宜的激活条件下被激活而作用于期望的底物。本发明还提供表达这些酶中的一种或多种并具有利于植物和谷粒加工的改变的组成的、“自加工的”转基因植物和植物部分，例如，谷粒。本发明也提供制备和使用这些植物以例如产生具有改良味道的食品和产生用于乙醇和发酵饮料生产的发酵底物的方法。

Description

自加工的植物和植物部分

相关申请

本申请是2002年8月27日提交的、要求2001年8月27日提交的申请系列号60/315,281的优选权的10/228,063号美国专利申请的部分延续，在此将两个申请完整地并入作为参考。

技术领域

本发明一般地涉及植物分子生物学领域，更具体地，涉及表达加工酶的植物的构建，其中所述加工酶向所述植物或其部分提供期望的特征。

背景技术

酶被用于加工各种农业产品，例如木材、果实和蔬菜、淀粉、汁液等等。典型地，加工酶以工业规模自各种来源生产和回收，所述来源为例如微生物发酵(芽孢杆菌属α-淀粉酶)、或从植物分离(咖啡的β-半乳糖苷酶或来自植物部分的木瓜蛋白酶)。在不同的加工应用中通过将酶和底物在使得酶反应可以以商业可行方式实现的、适宜的湿度、温度、时间和机械混和条件下混和，而使用酶制备物。这些方法包括如下多个分开的步骤：生产酶、制备酶制备物、混和酶和底物、以及将混合物置于适宜条件下以利于酶促反应。减少或消除时间、能量、混和、资金花费、和/或酶的生产费用的方法，或者导致改良的或新的产品的方法，将是有用和有益的。需要此类改良的领域的一个实例是玉米碾磨领域。

现今碾磨玉米获得玉米淀粉和其它玉米碾磨副产物，例如玉米面筋(gluten)饲料、玉米面筋粉和玉米油。由此工艺获得的淀粉常常进一步加工成其它产品，例如衍生化的淀粉和糖(sugar)，或者进一步发酵以制备各种产品，包括醇或乳酸。玉米淀粉的加工常常涉及到使用酶，尤其是将淀粉水解和转化成可发酵的糖或果糖的酶(α-和葡糖-淀粉酶、α-葡糖苷酶、葡萄糖异构酶等)。目前商业使用的加工工艺的资金昂贵，因为为了以合理的成本效益所需的规模加工玉米，需要构建非常大的磨坊。此外，该加工工艺需要分开制备淀粉水解或淀粉改性酶，然后机械混合酶和底物以生产淀粉水解产品。

从玉米粒中回收淀粉的方法是熟知的，涉及湿磨工艺。玉米湿磨包括步骤：浸渍玉米籽粒(kernel)、研磨玉米籽粒和分离籽粒的成分。这些籽粒在浸渍槽中在大约120_用逆向水流浸渍，籽粒在浸渍槽中放置24至48小时。此浸渍水典型地含有浓度为大约0.2％重量的二氧化硫。二氧化硫在此过程中用于帮助减少微生物生长以及还原胚乳蛋白中的二硫键以利于更有效地分离淀粉蛋白质。正常地，每蒲式耳玉米使用大约0.59加仑的浸渍水。浸渍水被认为是废水，其常常含有不期望的残余二氧化硫水平。

然后，浸渍后的玉米籽粒脱水，并使用成组的碾磨型磨机对其进行加工。第一组碾磨型磨机造成籽粒破裂，从而将胚芽从籽粒的剩余部分中释放出来。一种适于湿磨作业的商业碾磨型磨机以商标名称Bauer出售。通过离心将胚芽与籽粒的剩余部分分开。典型的商业离心分离器是Merco离心分离器。碾磨型磨机和离心分离器是使用能量进行作业的大型昂贵机器。

在该工艺的下一步骤，剩余的籽粒成分，包括淀粉、壳、纤维和面筋，在另一组碾磨型磨机上加工，并通过一组洗涤筛以将纤维成分与淀粉和面筋(胚乳蛋白)分开。淀粉和面筋通过筛子，而纤维不能通过。通过离心或者第三次碾磨后离心，从胚乳蛋白中分离出淀粉。离心产生淀粉浆，对该淀粉浆进行脱水，然后用新鲜的水洗涤并干燥至大约12％湿度。此基本上纯的淀粉典型地通过使用酶作进一步的加工。

由于除去种皮、胚和胚乳蛋白将允许淀粉与加工酶有效地接触，并且所获水解产物相对地没有来自其它籽粒成分的杂质，故分离淀粉与谷粒(grain)的其它成分。所述分离也确保谷粒的其它成分能够有效地回收以及能够随后作为副产物出售以增加磨坊的收入。

从湿磨工艺回收淀粉后，淀粉典型地经历糊化、液化和糊精化加工步骤用于生产麦芽糖糊精，并经历随后的糖化、异构化和精制(refining)步骤用于生产葡萄糖、麦芽糖和果糖。

由于目前可获得的酶不能快速地水解结晶淀粉，故在淀粉水解中使用糊化作用。为了使淀粉可适用于水解酶，典型地用水将淀粉制成浆(20-40％干固体)并在适当的凝胶化温度下加热。对于玉米淀粉，此温度为105至110℃。糊化后的淀粉典型地非常粘滞，因此在称作液化的下一步骤中使其稀薄化。液化作用造成淀粉的葡萄糖分子之间的一些键断开，液化可以通过酶促作用或通过使用酸来实现。热稳定的内切α-淀粉酶可以用于此步骤和随后的糊精化步骤中。在糊精化步骤中控制水解程度可以产生具有期望百分比的右旋糖(dextrose)的水解产物。

依据期望获得的产物，可以利用多种不同的外切淀粉酶和脱支酶，进一步水解来自液化步骤的糊精产物。最后，如果期望获得果糖，则典型地使用固定化的葡萄糖异构酶将葡萄糖转化为果糖。

从玉米淀粉制备可发酵糖(以及然后例如，生产乙醇)的干磨工艺，有利于外源酶与淀粉的有效接触。这些工艺与湿磨相比资金上所需较少，但是由于来源于这些工艺的副产物常常不如来源于湿磨的副产物有价值，故仍然期望实现显著的成本优势。例如，在干磨玉米时，将籽粒研磨成粉末以利于淀粉与降解酶进行有效地接触。在酶水解玉米面粉后，残余的固体由于含有蛋白质和一些其它成分而具有一定的饲料价值。Eckhoff近来在题为“使用快速胚芽方法从玉米发酵燃料乙醇及其成本”的文章(Appl.Biochem.Biotechnol.，94：41(2001))中描述了与干磨有关的改良可能性以及相关问题。“快速胚芽”方法(“quick-germ”method)允许使用减少的浸渍时间从淀粉分离富含油的胚芽。

通过植物中内源加工酶的调节和/或水平可以导致期望产物的一个实例是甜玉米。典型的甜玉米(sweet corn)品种与大田玉米(fieldcorn)品种的区别在于：甜玉米不能进行正常水平的淀粉生物合成这一事实。在甜玉米品种中典型地使用在编码淀粉合成中所涉及的酶的基因中的遗传突变，以限制淀粉的生物合成。此类突变位于编码淀粉合酶和ADP-葡萄糖焦磷酸化酶的基因中(例如甜的(sugary)和超甜的(super-sweet)突变)。果糖、葡萄糖和蔗糖是产生可食用新鲜玉米的消费者期望的可口甜味所必需的简单糖类，其在这些突变体的发育的胚乳中积累。然而，如果淀粉积累水平太高(例如，为使玉米成熟将玉米留置太长时间(收获后)，或者在玉米食用前长期贮存玉米的情况)，产品将丧失甜味并有生淀粉味和口感(mouthfeel)。因此，甜玉米的收获窗(harvest window)十分的窄，并且保存期限受到限制。

对于种植甜玉米品种的农民，另一显著缺点是这些品种的用途被仅仅限制于可食用食品。如果农民想要在种子发育过程中先行收获其甜玉米用作可食用食品，则将造成作物的实质性损失。谷粒产量和甜玉米的品质由于两个根本原因而不佳。第一个原因是：淀粉生物合成途径中的突变削弱了淀粉生物合成机器，谷粒不能完全饱满，从而对产量和品质造成损害。其次，由于谷粒中存在高水平的糖而这些糖不能以淀粉的形式隔绝，由此导致种子的整体库强度(sink strength)降低，而这将使谷粒中营养物贮存的减少加剧。甜玉米品种的胚乳缩小并塌陷，不经历彻底干燥，易于患病。甜玉米粒的不良品质带来进一步的农艺学牵连问题；由不充分的淀粉积累造成的各种因素组合起来引起不良的种子生存力、不良的萌芽、幼苗对疾病的易感性及不良的早期幼苗活力。因此，甜玉米的不良品质问题将影响消费者、农民/种植者、销售者和种子生产者。

因此，对于干磨，需要提高工艺效力和/或增加副产物的价值的方法。对于湿磨，需要对长期的浸渍、研磨、碾磨和/或分离籽粒成分所必需的设备不存在需求的淀粉加工方法。例如，需要修饰或消除湿磨中的浸渍步骤，因为这将减少需要处置的废水量，由此节约能量和时间并增加磨坊的生产量(玉米粒将在浸渍槽中花费较少时间)。此外，也需要消除或改进将含淀粉的胚乳与胚分离的工艺。

发明内容

本发明涉及自加工植物和植物部分及其使用方法。本发明的自加工植物和植物部分能够表达和激活酶(嗜温型的(mesophilic)、嗜热型的(thermophilic)和/或嗜高热型的(hyperthermophilic))。在所述酶(嗜温型的、嗜热型的或嗜高热型的)激活后，植物或植物部分能够自加工底物，对该底物的作用可以获得期望的结果。

本发明涉及分离的多核苷酸，其a)包含SEQ ID NO：2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、或59或其互补序列，或与SEQ ID NO：2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、或59之任一的互补序列在低严紧杂交条件下杂交并编码具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶或葡糖淀粉酶活性的多肽的多核苷酸，或者b)编码包含SEQ ID NO：10、13、14、15、16、18、20、24、26、27、28、29、30、33、34、35、36、38、40、42、44、45、47、49或51的多肽或其酶活性片段。优选地，分离的多核苷酸编码包含第一多肽和第二肽的融合多肽，其中所述第一多肽具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶或葡糖淀粉酶活性。最优选地，第二肽包含信号序列肽，该肽可以将第一多肽引导至植物的液泡、内质网、叶绿体、淀粉粒(starch granule)、种子或细胞壁。例如，信号序列可以是来自waxy的N端信号序列、来自γ-玉米醇溶蛋白的N端信号序列、淀粉结合域、或C端淀粉结合域。本发明进一步包括与SEQ ID NO：2、9或52之任一的互补序列在低严紧杂交条件下杂交并编码具有α-淀粉酶活性的多肽的多核苷酸；与SEQ ID NO：4或25的互补序列在低严紧杂交条件下杂交并编码具有支链淀粉酶活性的多肽的多核苷酸；与SEQ ID NO：6的互补序列杂交并编码具有α-葡糖苷酶活性的多肽的多核苷酸；与SEQ ID NO：19、21、37、39、41或43之任一的互补序列在低严紧杂交条件下杂交并编码具有葡萄糖异构酶活性的多肽的多核苷酸；与SEQ ID NO：46、48、50或59之任一的互补序列在低严紧杂交条件下杂交并编码具有葡糖淀粉酶活性的多肽的多核苷酸。

本发明还涉及分离的多核苷酸，其a)包含SEQ ID NO：61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108和110或其互补序列，或者与SEQ ID NO：61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108或110之任一的互补序列在低严紧杂交条件下杂交并编码具有木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、酯酶或植酸酶活性的多肽的多核苷酸；b)编码包含SEQ ID NO：62、64、66、70、80、82、84、86、88、90、92、109或111的多肽或其酶活性片段。该分离的多核苷酸可以编码包含第一多肽和第二肽的融合多肽，其中所述第一多肽具有木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、蛋白酶或植酸酶活性。第二肽可以包含信号序列肽，该信号序列肽可以将第一多肽引导至植物的液泡、内质网、叶绿体、淀粉粒(starch granule)、种子或细胞壁。例如，信号序列可以是来自waxy的N端信号序列、来自γ-玉米醇溶蛋白的N端信号序列、淀粉结合域或C端淀粉结合域。

在本发明中提供的、可用于本发明中的示例性木聚糖酶包括SEQID NO：61、63或65编码的木聚糖酶。本发明还提供SEQ ID NO：69编码的示例性蛋白酶，即，菠萝蛋白酶。示例性纤维素酶包括本文中提供的由SEQ ID NO：79、81、93和94编码的纤维二糖水解酶I和II。本发明提供示例性葡聚糖酶，即，本文中描述的由SEQ ID NO：85编码的6GPl。示例性β葡糖苷酶包括本文中描述的由SEQ ID NO：96和97编码的β葡糖苷酶2和D。还提供示例性酯酶，即，由SEQ ID NO：99编码的阿魏酸酯酶。还提供示例性植酸酶，即，SEQ ID NO：109-112编码的Nov9X。

本发明还包括包含如下多核苷酸的表达盒，所述多核苷酸a)具有SEQ ID NO：2、4、6、9、19、21、25、37、39、41、43、46、48、50、52或59或其互补序列，或者与SEQ ID NO：2、4、6、9、19、21、25、37、39、41、43、46、48、50、52或59之任一的互补序列在低严紧杂交条件下杂交并编码具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶或葡糖淀粉酶活性的多肽的多核苷酸，或b)编码包含SEQ ID NO：10、13、14、15、16、18、20、24、26、27、28、29、30、33、34、35、36、38、40、42、44、45、47、49或51的多肽或其酶活性片段。表达盒还包含与该多核苷酸可操作连接的启动子，例如诱导型启动子、组织特异性启动子、或优选地胚乳特异性启动子。优选地，胚乳特异性启动子是玉米γ-玉米醇溶蛋白启动子或玉米ADP-gpp启动子或玉米Q启动子或稻的谷蛋白-1启动子。在一个优选实施方案中，启动子包含SEQ ID NO：11或SEQ ID NO：12或SEQ IDNO：67或SEQ ID NO：98。此外，在另一优选实施方案中，多核苷酸的取向相对于启动子为正义方向。本发明的表达盒还可以编码与多核苷酸编码的多肽可操作地连接的信号序列。信号序列优选将可操作连接的多肽引导至植物的液泡、内质网、叶绿体、淀粉粒、种子或细胞壁。信号序列包括来自waxy的N端信号序列、来自γ-玉米醇溶蛋白的N端信号序列或淀粉结合域。

而且，本发明包括包含如下多核苷酸的表达盒，所述多核苷酸a)具有SEQ ID NO：61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108和110或其互补序列，或者与SEQ ID NO：61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108和110之任一的互补序列在低严紧杂交条件下杂交并编码具有木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、脂酶或植酸酶活性的多肽的多核苷酸，或b)编码包含SEQ ID NO：62、64、66、70、80、82、84、86、88、90、92、109或111的多肽或其酶活性片段。该表达盒还包含与多核苷酸可操作地连接的启动子，例如诱导型启动子、组织特异性启动子、或优选地胚乳特异性启动子。胚乳特异性启动子可以是玉米γ-玉米醇溶蛋白启动子或玉米ADP-gpp启动子或玉米Q启动子或稻的谷蛋白-1启动子。在一个实施方案中，启动子包含SEQ ID NO：11或SEQ ID NO：12或SEQ ID NO：67或SEQ ID NO：98。此外，在另一优选实施方案中，多核苷酸的取向相对于启动子为正义方向。本发明的表达盒还可以编码与多核苷酸编码的多肽可操作地连接的信号序列。信号序列优选将可操作连接的多肽引导至植物的液泡、内质网、叶绿体、淀粉粒、种子或细胞壁。信号序列包括来自waxy的N端信号序列、来自γ-玉米醇溶蛋白的N端信号序列或淀粉结合域。

本发明还涉及包含本发明表达盒的载体或细胞。细胞可以选自农杆菌属(Agrobacterium)、单子叶植物细胞、双子叶植物细胞、百合纲(Liliopsida)细胞、黍亚科(Panicoideae)细胞、玉米细胞和谷物细胞，例如稻细胞。

此外，本发明包括用本发明载体稳定转化的植物。本发明提供用包含α-淀粉酶的载体稳定转化的植物，其中所述α-淀粉酶具有SEQID NO：1、10、13、14、15、16、33、35或88之任一的氨基酸序列或由包含SEQ ID NO：2、9或87之任一的多核苷酸编码。

另一实施方案中，提供用包含支链淀粉酶的载体稳定转化的植物，其中所述支链淀粉酶具有SEQ ID NO：24或34的氨基酸序列或者由包含SEQ ID NO：4或25之任一的多核苷酸编码。本发明还提供用包含α-葡糖苷酶的载体稳定转化的植物，其中所述α-葡糖苷酶具有SEQID NO：26或27之任一的氨基酸序列或者由包含SEQ ID NO：6的多核苷酸编码。本文还描述了用包含葡萄糖异构酶的载体稳定转化的植物，其中所述葡萄糖异构酶具有SEQ ID NO：18、20、28、29、30、38、40、42或44之任一的氨基酸序列或者由包含SEQ ID NO：19、21、37、39、41或43之任一的多核苷酸编码。在另一实施方案中，描述用包含葡萄糖淀粉酶的载体稳定转化的植物，其中所述葡萄糖淀粉酶具有SEQ ID NO：45、47或49之任一的氨基酸序列或者由包含SEQ IDNO：46、48、50、或59之任一的多核苷酸编码。

另一实施方案提供用包含木聚糖酶的载体稳定转化的植物，其中所述木聚糖酶具有SEQ ID NO：62、64或66之任一的氨基酸序列或者由包含SEQ ID NO：61、63或65之任一的多核苷酸编码。此外，还提供用包含蛋白酶的载体稳定转化的植物。该蛋白酶可以是具有SEQ IDNO：70中所示的氨基酸序列或者由具有SEQ ID NO：69的多核苷酸编码的菠萝蛋白酶。在另一实施方案中，提供用包含纤维素酶的载体稳定转化的植物。该纤维素酶可以是由包含SEQ ID NO：79、80、81、82、93或94之任一的多核苷酸编码的纤维二糖水解酶。

另一实施方案提供用包含葡聚糖酶，例如内切葡聚糖酶的载体稳定转化的植物。该内切葡聚糖酶可以是具有SEQ ID NO：84所示的氨基酸序列或者由包含SEQ ID NO：83的多核苷酸编码的内切葡聚糖酶I。此外，还提供用包含β葡糖苷酶的载体稳定转化的植物。该β葡糖苷酶可以是具有SEQ ID NO：90或92中所示氨基酸序列或者由具有SEQ ID NO：89或91的多核苷酸编码的β葡糖苷酶2或β葡糖苷酶D。在另一实施方案中，提供用包含酯酶的载体稳定转化的植物。该酯酶可以是由包含SEQ ID NO：99的多核苷酸编码的阿魏酸酯酶。

本发明还提供来自本发明稳定转化的植物的植物产物，例如种子、果实或谷粒。

在另一实施方案中，本发明涉及转化的植物，所述植物的基因组增加了与启动子序列可操作连接的重组多核苷酸，该多核苷酸编码至少一种加工酶，该多核苷酸的序列针对在该植物中的表达而进行了优化。所述植物可以是单子叶植物，例如玉米或稻，或双子叶植物。该植物可以是谷类植物或商业栽培的植物。所述加工酶选自α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、葡聚糖酶、β-淀粉酶、α-葡糖苷酶、异淀粉酶、支链淀粉酶、新支链淀粉酶(neo-pullulanase)、异支链淀粉酶(iso-pullulanase)、淀粉型支链淀粉酶(amylopullulanase)、纤维素酶、外切-1，4-β-纤维二糖水解酶、外切-1，3-β-D-葡聚糖酶、β-葡糖苷酶、内切葡聚糖酶、L-阿拉伯糖酶、α-阿拉伯糖苷酶、半乳聚糖酶、半乳糖苷酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、木糖苷酶、蛋白酶、葡聚糖酶、木聚糖酶、酯酶、植酸酶和脂肪酶。所述加工酶是选自α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、β-淀粉酶、α-葡糖苷酶、异淀粉酶、支链淀粉酶、新支链淀粉酶、异支链淀粉酶和淀粉型支链淀粉酶的淀粉加工酶。该酶可以选自α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶。加工酶可以是嗜高热型的。根据本发明此方面，该酶可以是选自蛋白酶、葡聚糖酶、木聚糖酶、酯酶、植酸酶、纤维素酶、β葡糖苷酶和脂肪酶的非淀粉降解酶(non-starch degrading enzyme)。此类酶可以是嗜高热型的。在一个实施方案中，酶聚积在植物的液泡、内质网、叶绿体、淀粉粒、种子或细胞壁中。而且，在另一实施方案中，植物的基因组还可以增加包含非嗜高热型的酶的第二重组多核苷酸。

在本发明另一方面，提供转化的植物，该植物的基因组增加了编码至少一种加工酶的重组多核苷酸，其中所述加工酶选自：α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶、支链淀粉酶、木聚糖酶、纤维素酶、蛋白酶、葡聚糖酶、β葡糖苷酶、酯酶、植酸酶或脂肪酶，所述重组多核苷酸与启动子序列可操作地连接，该多核苷酸的序列针对在该植物中的表达而实行优化。

另一实施方案涉及转化的玉米植物，该植物的基因组增加了编码至少一种加工酶的重组多核苷酸，其中所述加工酶选自：α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶、支链淀粉酶、木聚糖酶、纤维素酶、蛋白酶、葡聚糖酶、植酸酶、β葡糖苷酶、酯酶或脂肪酶，所述重组多核苷酸与启动子序列可操作地连接，该多核苷酸的序列针对在该玉米植物中的表达而实行优化。

本发明提供转化的植物，该植物的基因组增加了与启动子以及信号序列可操作地连接的、具有SEQ ID NO：83的重组多核苷酸。此外，本发明还描述转化的植物，该植物的基因组增加了与启动子以及信号序列可操作地连接的、具有SEQ ID NO：93或94的重组多核苷酸。在另一实施方案中，提供转化的植物，该植物的基因组增加了具有SEQ IDNO：95的重组多核苷酸，该多核苷酸与启动子和信号序列可操作地连接。此外，还描述了基因组中增加了具有SEQ ID NO：96的重组多核苷酸的转化植物。还描述了基因组中增加了具有SEQ ID NO：97的重组多核苷酸的转化植物。还描述了基因组中增加了具有SEQ ID NO：99的重组多核苷酸的转化植物。

在此还预期到转化的植物的产物。所述产物包括例如种子、果实或谷粒。或者，产物可以是加工酶、淀粉或糖。

本发明还描述从本发明稳定转化的植物获得的植物。在此方面，该植物可以是杂种植物或近交/自交植物。

包含至少一种加工酶的淀粉组合物是本发明的再一实施方案，其中所述加工酶是蛋白酶、葡聚糖酶或酯酶。

包含至少一种加工酶的谷粒是本发明另一实施方案，所述加工酶是α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡糖淀粉酶、葡萄糖异构酶、木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、酯酶、蛋白酶、脂肪酶或植酸酶。

在另一实施方案中，提供制备淀粉粒的方法，包括：将包含至少一种非淀粉型加工酶的谷粒在激活所述至少一种酶的条件下进行处理，产生包含淀粉粒和非淀粉降解产物的混合物，其中所述谷粒从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和从混合物分离淀粉粒。其中，酶可以是蛋白酶、葡聚糖酶、木聚糖酶、植酸酶、脂肪酶、β葡糖苷酶、纤维素酶或酯酶。而且，该酶优选是嗜高热型的。谷粒可以是破碎的谷粒和/或可以在低或高湿度条件下处理。或者，谷粒可以用二氧化硫处理。本发明还可以包括从混合物分离非淀粉产物。本发明还描述通过此方法获得的淀粉产物和非淀粉产物。

在再一实施方案中，提供生产超甜玉米(hypersweet corn)的方法，包括处理转化的玉米或其部分，其中所述玉米在基因组中增加了编码至少一种淀粉降解酶或淀粉异构化酶的表达盒并在胚乳中表达该表达盒，其中所述处理在激活所述至少一种酶从而将玉米中的多糖转化成糖(sugar)的条件下进行，由此产生超甜玉米。表达盒还可以包含与编码所述酶的多核苷酸可操作地连接的启动子。启动子可以是例如，组成型启动子、种子特异性启动子、或胚乳特异性启动子。酶可以是嗜高热型的，并且可以是α-淀粉酶。在此处使用的表达盒还可以包含编码与所述至少一种酶可操作地连接的信号序列的多核苷酸。信号序列可以指引酶达到例如质外体或内质网。所述酶包含SEQ ID NO：13、14、15、16、33或35之任一。所述酶还可以包含SEQ ID NO：87。

在一个最优选的实施方案中，描述生产超甜玉米的方法，包括处理转化的玉米或其部分，其中所述玉米在基因组中增加了编码α-淀粉酶的表达盒并在胚乳中表达该表达盒，其中所述处理在激活所述至少一种酶从而将玉米中的多糖转化成糖(sugar)的条件下进行，由此产生超甜玉米。酶可以是嗜高热型的，并且嗜高热型的α-淀粉酶可以包含SEQ ID NO：10、13、14、15、16、33或35之任一的氨基酸序列或其具有α-淀粉酶活性的酶活性片段。该酶包含SEQ ID NO：87。

本文描述制备淀粉水解产物的溶液的方法，包括：将包含淀粉粒和至少一种加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此加工淀粉粒以形成包含淀粉水解产物的水溶液，其中植物部分从基因组中增加了编码所述至少一种淀粉加工酶的表达盒的转化植物获得；和收集含有该淀粉水解产物的水溶液。淀粉水解产物可以包含糊精、麦芽寡糖(maltooligosaccharide)、葡萄糖和/或其混合物。酶可以是α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、淀粉型支链淀粉酶、葡萄糖异构酶、或其任何组合。而且，酶可以是嗜高热型的。另一方面，植物部分的基因组还可以增加编码非嗜高热型的淀粉加工酶的表达盒。非嗜高热型的淀粉加工酶可以选自淀粉酶、葡糖淀粉酶、α-葡糖苷酶、支链淀粉酶、葡萄糖异构酶或其组合。在另一方面，加工酶优选在胚乳中表达。植物部分可以是谷粒(grain)，来自玉米、小麦、大麦、黑麦、燕麦、甘蔗或稻。所述至少一种加工酶与启动子和信号序列可操作地连接，该信号序列将酶引导至淀粉粒或内质网或引导至细胞壁。该方法还可以包括分离淀粉水解产物和/或发酵该淀粉水解产物。

在本发明另一方面，描述制备淀粉水解产物的方法，包括将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此加工淀粉粒以形成包含淀粉水解产物的水溶液，其中植物部分从基因组增加了编码至少一种α-淀粉酶的表达盒的转化植物获得；和收集包含淀粉水解产物的水溶液。该α-淀粉酶可以是嗜高热型的，嗜高热型的α-淀粉酶包含SEQ ID NO：1、10、13、14、15、16、33、或35之任一的氨基酸序列或其具有α-淀粉酶活性的活性片段。表达盒可以包含选自SEQ ID NO：2、9、46或52或其互补序列的多核苷酸，或者与SEQ ID NO：2、9、46或52之任一在低严紧杂交条件下杂交并编码具有α-淀粉酶活性的多肽的多核苷酸。而且，本发明也提供该转化的植物的基因组，其还包含编码非嗜高热型的淀粉加工酶的多核苷酸。或者，植物部分可以用非嗜高热型的淀粉加工酶处理。

本发明还涉及在植物的细胞中包含至少一种淀粉加工酶的、转化的植物部分，其中植物部分从基因组中增加了编码所述至少一种淀粉加工酶的表达盒的转化植物获得。优选地，酶是选自α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、β-淀粉酶、α-葡糖苷酶、异淀粉酶、支链淀粉酶、新支链淀粉酶、异支链淀粉酶和淀粉型支链淀粉酶的淀粉加工酶。而且，所述酶可以是嗜高热型的。所述植物可以是任何植物，例如玉米或稻。

本发明另一实施方案是在植物的细胞壁或细胞中包含有至少一种非淀粉加工酶的、转化的植物部分，其中植物部分从基因组中增加了编码所述至少一种非淀粉加工酶或至少一种非淀粉多糖加工酶的表达盒的转化植物获得。该酶可以是嗜高热型的。而且，非淀粉加工酶可以是蛋白酶、葡聚糖酶、木聚糖酶、酯酶、植酸酶、β葡糖苷酶、纤维素酶或脂肪酶。所述植物部分可以是任何植物部分，但优选是穗、种子、果实、谷粒、秸秆、谷壳(chaff)、或蔗渣。

本发明还涉及转化的植物部分。例如，描述了包含具有SEQ ID NO：1、10、13、14、15、16、33或35之任一的氨基酸序列或者由包含SEQID NO：2、9、46或52之任一的多核苷酸编码的α-淀粉酶的转化植物部分，包含具有SEQ ID NO：5、26或27之任一的氨基酸序列或者由包含SEQ ID NO：6的多核苷酸编码的α-葡糖苷酶的转化植物部分，包含具有SEQ ID NO：28、29、30、38、40、42或44之任一的氨基酸序列或者由包含SEQ ID NO：19、21、37、39、41或43之任一的多核苷酸编码的葡萄糖异构酶的转化植物部分，包含具有SEQ ID NO：45或SEQ ID NO：47或SEQ ID NO：49的氨基酸序列或者由包含SEQ IDNO：46、48、50或59之任一的多核苷酸编码的葡糖淀粉酶的转化植物部分，以及包含由含有SEQ ID NO：4或25之任一的多核苷酸编码的支链淀粉酶的转化植物部分。

本发明还涉及转化的植物部分。例如，描述了包含具有SEQ ID NO：62、64或66之任一的氨基酸序列或者由包含SEQ ID NO：61、63或65之任一的多核苷酸编码的木聚糖酶的转化植物部分。也提供包含蛋白酶的转化的植物部分。该蛋白酶可以是具有SEQ ID NO：70所示的氨基酸序列或由具有SEQ ID NO：69的多核苷酸编码的菠萝蛋白酶。在另一实施方案中，提供包含纤维素酶的转化的植物部分。纤维素酶可以是由包含SEQ ID NO：79、80、81、82、93或94之任一的多核苷酸编码的纤维二糖水解酶。

另一实施方案提供包含葡聚糖酶，例如内切葡聚糖酶的转化的植物部分。内切葡聚糖酶可以是具有SEQ ID NO：84所示的氨基酸序列或者由包含SEQ ID NO：83的多核苷酸编码的内切葡聚糖酶I。也提供包含β葡糖苷酶的转化的植物部分。β葡糖苷酶可以是具有SEQ IDNO：90或92中所示的氨基酸序列或者由具有SEQ ID NO：89或91的多核苷酸编码的β葡糖苷酶2或β葡糖苷酶D。在另一实施方案中，提供包含酯酶的转化的植物部分。酯酶可以是由包含SEQ ID NO：99的多核苷酸编码的阿魏酸酯酶。

另一实施方案是对转化的植物部分中的淀粉实施转化的方法，包括激活植物部分中所包含的淀粉加工酶。此外，还描述根据此方法产生的淀粉、糊精、麦芽寡糖或糖(sugar)。

本发明还描述使用转化的植物部分的方法，其中所述转化的植物部分在该植物部分的细胞壁或细胞中包含至少一种非淀粉加工酶，所述方法包括将包含至少一种非淀粉多糖加工酶的转化植物部分在激活所述至少一种酶由此消化非淀粉多糖以形成包含寡糖和/或糖(sugar)的水溶液的条件下进行处理，其中植物部分从基因组中增加了编码所述至少一种非淀粉多糖加工酶的表达盒的转化植物获得；和收集含有寡糖和/或糖(sugar)的水溶液。非淀粉多糖加工酶可以是嗜高热型的。

本发明提供使用包含至少一种加工酶的转化的种子的方法，包括将包含至少一种蛋白酶或脂肪酶的转化种子在激活所述至少一种酶的条件下进行处理，从而产生包含氨基酸和脂肪酸的含水混合物，其中种子从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和收集该含水混合物。优选地分离氨基酸、脂肪酸或两者。所述至少一种蛋白酶或脂肪酶可以是嗜高热型的。

本发明还描述制备乙醇的方法，包括将包含至少一种多糖加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此消化多糖以形成寡糖或可发酵糖，其中所述植物部分从基因组中增加了编码所述至少一种多糖加工酶的表达盒的转化植物获得；和在促进可发酵糖或寡糖转化成乙醇的条件下温育可发酵糖。植物部分可以是谷粒、果实、种子、茎秆、木材、蔬菜或根。植物部分可以从选自如下的植物获得：燕麦、大麦、小麦、浆果、葡萄、黑麦、玉米、稻、马铃薯、甜菜、甘蔗、凤梨、草和树。在另一优选实施方案中，多糖加工酶是α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、葡萄糖异构酶、支链淀粉酶或其组合。

本发明提供制备乙醇的方法，包括将包含至少一种加工酶的植物部分在可以激活所述至少一种酶的时间长度和条件下进行热处理，由此消化多糖以形成可发酵糖，其中所述加工酶选自：α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、葡萄糖异构酶、或支链淀粉酶或其组合，其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和在促进可发酵糖转化成乙醇的条件下温育可发酵糖。所述至少一种酶可以是嗜高热型的或嗜温型的。

在另一实施方案中，提供制备乙醇的方法，包括将包含至少一种非淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此将非淀粉多糖消化成寡糖和可发酵糖，其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和在促进可发酵糖转化成乙醇的条件下孵育可发酵糖。非淀粉加工酶可以是木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、蛋白酶、酯酶、脂肪酶或植酸酶。

本发明还提供制备乙醇的方法，包括将包含至少一种酶的植物部分在激活所述至少一种酶的条件下进行处理，由此将多糖消化以形成可发酵糖，其中所述酶选自：α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、葡萄糖异构酶或支链淀粉酶、或其组合，其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和在促进可发酵糖转化成乙醇的条件下孵育可发酵糖。所述酶可以是嗜高热型的。

此外，还描述了在不添加额外的增甜剂的情况下制备甜的粉质食品(farinaceous food)的方法，包括将包含至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此将植物部分中的淀粉粒加工成糖(sugar)从而形成甜的产物，其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和将该甜的产物加工成粉质食品。所述粉质食品可以从甜的产物和水形成。而且，粉质食品可以含有麦芽、调味剂、维生素、矿物质、着色剂或其任何组合。所述至少一种酶可以是嗜高热型的。该酶可以选自：α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶或其任何组合。植物还可以选自：大豆、黑麦、燕麦、大麦、小麦、玉米、稻和甘蔗。粉质食品可以是谷物食品、早餐食品、即食食品、或烘焙的食品。所述加工可以包括烘焙、煮沸、加热、蒸、放电(electrical discharge)或其任何组合。

本发明还涉及在不添加增甜剂的情况下甜化含淀粉产品的方法，包括将包含至少一种淀粉加工酶的淀粉在激活所述至少一种酶的条件下进行处理，由此消化该淀粉以形成糖(sugar)从而生成甜的淀粉，其中淀粉从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和将此甜的淀粉添加至产品中以产生甜的含淀粉产品。转化的植物可以选自玉米、大豆、黑麦、燕麦、小麦、稻和甘蔗。所述至少一种酶可以是嗜高热型的。所述至少一种酶可以是α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶、或其任何组合。

在此提供粉质食品和甜的含淀粉产品。

本发明还涉及甜化含多糖的果实或蔬菜的方法，包括将包含至少一种多糖加工酶的果实或蔬菜在激活所述至少一种酶的条件下处理，由此加工果实或蔬菜中的多糖以形成糖(sugar)，产生甜的果实或蔬菜，其中果实或蔬菜从基因组中增加了编码所述至少一种多糖加工酶的表达盒的转化植物获得。果实或蔬菜选自：马铃薯、番茄、香蕉、南瓜、豌豆和大豆。所述至少一种酶可以是嗜高热型的。

本发明还涉及制备含糖(sugar)的水溶液的方法，包括将获自该植物部分的淀粉粒在激活所述至少一种酶的条件下进行处理，由此产生含糖(sugar)的水溶液。

另一实施方案涉及从谷粒制备淀粉衍生产品的方法，其中所述方法不涉及在回收淀粉衍生产品之前对谷粒进行湿磨或干磨，所述方法包括将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此加工淀粉粒以形成含有糊精或糖(sugar)的水溶液，其中植物部分从基因组中增加了编码所述至少一种淀粉加工酶的表达盒的转化植物获得；和收集含有该淀粉衍生产品的水溶液。所述至少一种淀粉加工酶可以是嗜高热型的。

本发明还提供分离α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶的方法，包括培养含有该α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶或支链淀粉酶的转化植物，和从中分离该α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶或支链淀粉酶。本发明还提供分离木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、蛋白酶、酯酶、植酸酶或脂肪酶的方法，包括培养含有该木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、蛋白酶、酯酶、植酸酶或脂肪酶的转化植物，和分离该木聚糖酶、纤维素酶、葡聚糖酶、酯酶、β葡糖苷酶、蛋白酶、酯酶、植酸酶或脂肪酶。

本发明也提供制备麦芽糖糊精的方法，包括将水和转基因谷粒混合，加热所述混合物，从产生的糊精浆液中分离出固体，和收集该麦芽糖糊精。该转基因谷粒包含至少一种淀粉加工酶。淀粉加工酶可以是α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶和葡萄糖异构酶。而且，本发明还提供通过该方法产生的麦芽糖糊精以及通过该方法产生的组合物。

本发明提供从谷粒制备糊精或糖(sugar)的方法，所述方法不涉及在回收淀粉衍生产物之前机械破碎谷粒，所述方法包括：将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此加工淀粉粒以形成含有糊精或糖(sugar)的水溶液，其中植物部分从基因组中增加了编码所述至少一种加工酶的表达盒的转化植物获得；和收集含有糖(sugar)和/或糊精的水溶液。

本发明还涉及制备可发酵糖的方法，包括将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此加工淀粉粒以形成含有糊精或糖(sugar)的水溶液，其中植物部分从基因组中增加了编码所述至少一种加工酶的表达盒的转化植物获得；和收集含有可发酵糖的水溶液。

此外，本文还提供用包含嗜高热型的α-淀粉酶的载体稳定转化的玉米植物。例如，优选地，包括用包含编码α-淀粉酶的多核苷酸序列的载体稳定转化的玉米植物，其中所述α-淀粉酶与SEQ ID NO：1或SEQ ID NO：51有大于60％的同一性。

附图简述

图1A和1B说明在来自分离的T1籽粒的玉米籽粒及胚乳中表达的α-淀粉酶的活性，其中所述分离的T1籽粒来自pNOV6201植物和6个pNOV6200系。

图2说明在来自pNOV6201系的分离的T1籽粒中α-淀粉酶的活性。

图3描述含有热稳定797GL3α淀粉酶的转基因玉米的醪液在发酵时产生的乙醇量，其中醪液在85℃和95℃下的液化时间不超过60分钟。该图说明自液化的15分钟起至60分钟，发酵72小时的乙醇产量几乎未变。而且，该图还显示，95℃液化产生的醪液比85℃液化产生的醪液在每一个时间点上都产生更多的乙醇。

图4描述在含有热稳定α淀粉酶的转基因玉米醪液发酵后剩余的残余淀粉量(％)，其中所述醪液在85℃和95℃下的液化时间不超过60分钟。该图说明，自液化的15分钟起至60分钟，72小时发酵的乙醇产量几乎不变。而且，该图还显示95℃液化产生的醪液比85℃液化产生的醪液在每一个时间点上都产生更多的乙醇。

图5描述转基因玉米、对照玉米和其各种混合物的醪液的乙醇产量，其中所述醪液在85℃和95℃下制备。该图说明包含α-淀粉酶的转基因玉米由于发酵后留下的淀粉减少，故其显著地提高了淀粉在发酵中的可利用率。

图6描述在发酵转基因谷粒、对照玉米和其各种混合物的醪液后在干燥的釜馏物中测量到的残余淀粉量，其中所述醪液在85℃和95℃制备。

图7描述在5.2至6.4的各种pH下在20小时至80小时期间作为样品发酵时间的函数的乙醇产量，其中所述样品包含3％转基因玉米。该图说明在较低pH下进行的发酵比在pH6.0或更高pH下进行的发酵进展快速。

图8描述在5.2至6.4的各种pH下醪液发酵过程中的乙醇产量，其中所述醪液含有从0至12wt％的各种重量百分比的转基因玉米。该图说明，乙醇产量独立于样品中所包含的转基因谷粒的量。

图9显示对来自不同pNOV7005转化事件的T2种子的分析。与非转基因对照比较，可以在多个事件中检测到支链淀粉酶活性的高表达。

图10A和10B显示水解产物的HPLC分析结果，所述水解产物通过表达的支链淀粉酶从转基因玉米面粉的淀粉中产生。75℃在反应缓冲液中温育表达支链淀粉酶的玉米的面粉30分钟，导致从玉米淀粉产生中等链长的寡糖(聚合度(DP)大约10-30)和短直链淀粉链(DP大约100-200)。图10A和10B也显示添加的钙离子对支链淀粉酶活性的影响。

图11A和11B描述从来自两个反应混合物的淀粉水解产物的HPLC分析得到的数据。第一反应以‘淀粉酶’标示，含有表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米面粉样品的混合物[1∶1(w/w)]；第二反应混合物‘淀粉酶+支链淀粉酶’包含表达α-淀粉酶的转基因玉米和表达支链淀粉酶的转基因玉米的玉米面粉样品的混合物[1∶1(w/w)]。

图12描述对于两个反应混合物而言在25μl反应混合物中的糖(sugar)产物量(μg)。第一反应以‘淀粉酶’表示，含有表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米面粉样品的混合物[1∶1(w/w)]；第二反应混合物‘淀粉酶+支链淀粉酶’包含表达α-淀粉酶的转基因玉米和表达支链淀粉酶的转基因玉米的玉米面粉样品的混合物[1∶1(w/w)]。

图13A和13B显示在85℃和95℃ 30分钟温育结束时从两组反应混合物得到的淀粉水解产物。对于每一组，都有两个反应混合物；第一反应以‘淀粉酶X支链淀粉酶’表示，含有表达α-淀粉酶和支链淀粉酶两者的转基因玉米(通过异花授粉产生)的面粉；第二反应以‘淀粉酶’表示，含有表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米面粉样品的混合物，其中两种玉米面粉样品以可以获得与在杂交(淀粉酶X支链淀粉酶)中观察到的相同量的α-淀粉酶活性的比例混合。

图14描述使用非转基因玉米种子(对照)、含有797GL3α-淀粉酶的转基因玉米种子、以及797GL3转基因玉米种子和MalAα-葡糖苷酶的组合将淀粉降解为葡萄糖。

图15描述在室温或30℃转化生淀粉。在此图中，反应混合物1和2分别是水和淀粉在室温和30℃的组合。反应混合物3和4分别是大麦α-淀粉酶和淀粉在室温和30℃的组合。反应混合物5和6分别是热厌氧杆菌属(Thermoanaerobacterium)葡糖淀粉酶和淀粉在室温和30℃的组合。反应混合物7和8分别是大麦α-淀粉酶(sigma)和热厌氧杆菌属葡糖淀粉酶及淀粉在室温和30℃的组合。反应混合物9和10分别是大麦α-淀粉酶(sigma)对照和淀粉在室温和30℃的组合。图中指出热厌氧杆菌属葡糖淀粉酶的产物的聚合度(DP)。

图16描述使用实施例19中描述的α淀粉酶、α葡糖苷酶和葡萄糖异构酶的组合从淀粉酶转基因玉米面粉生产果糖。淀粉酶玉米面粉与酶溶液加上水或缓冲液混合。所有反应含有60mg淀粉酶面粉和总共600μl液体，在90℃温育2小时。

图17描述作为自90℃ 0至1200分钟的温育时间的函数、使用来自自加工籽粒的100％淀粉酶面粉得到的反应产物的峰面积。

图18描述作为自90℃ 0至1200分钟的温育时间的函数、使用来自自加工籽粒的10％转基因淀粉酶面粉和90％对照玉米面粉获得的反应产物的峰面积。

图19提供在70℃、80℃、90℃或100℃温育不超过90分钟的转基因淀粉酶面粉的HPLC分析结果，以评价温度对淀粉水解的影响。

图20描述含有60mg转基因淀粉酶面粉和酶溶液加水或缓冲液的混合物的样品在各种反应条件下的ELSD峰面积。一组反应用50mMMOPS(室温下pH7.0)加上10mM MgSO4和1mM CoCl₂缓冲；在第二组反应中用水替换此含金属的缓冲溶液。所有反应在90℃温育2小时。

发明详述

根据本发明，“自加工”植物或植物部分在其中整合了编码加工酶的分离的多核苷酸，其中所述加工酶能够加工，例如修饰，植物中的淀粉、多糖、脂质、蛋白质等，其中该加工酶可以是嗜温型的、嗜热型的或嗜高热型的，并且可以通过研磨、加水、加热或以其它方式为酶的功能提供有利条件而激活。编码加工酶的分离的多核苷酸整合在植物或植物部分中用于在其中表达。一旦加工酶表达和激活后，本发明的植物或植物部分将对该加工酶所作用的底物实施加工。因此，本发明的植物或植物部分能够在其中所含的加工酶激活后自加工该酶的底物，而且该加工可以在加工这些底物时正常所需的外来来源缺乏或减少的情况下进行。照此，该转化的植物、转化的植物细胞和转化的植物部分具有通过根据本发明整合在其中的酶加工期望底物的“内在”加工能力。优选地，编码加工酶的多核苷酸是“遗传稳定的”，即，该多核苷酸在本发明转化的植物或植物部分中稳定地维持并通过后代稳定地遗传至后继世代。

根据本发明，使用这些植物和植物部分的方法在回收淀粉衍生产物之前可以无需碾磨或以其它方式物理破碎植物部分的完整性。例如，本发明提供加工玉米和其它谷粒以回收淀粉衍生产物的改良方法。本发明还提供允许回收在淀粉粒中或在淀粉粒上含有一定水平的淀粉降解酶的淀粉粒的方法，其中所述淀粉降解酶的水平足以导致对淀粉中特定键的水解而无需添加外源产生的淀粉水解酶。本发明还提供通过本发明方法从自加工植物或植物部分获得的改良产物。

此外，“自加工的”转化的植物部分，例如谷粒，和转化的植物避免了现有技术的主要问题，即，加工酶典型地通过发酵微生物而产生，这就需要花费金钱从培养上清液分离酶；该分离的酶需要针对特定的应用进行配制，并且必须开发用于酶及其底物的添加、混合和反应的工艺和机器。本发明的转化植物或其部分也是加工酶本身以及该酶的底物和产物，例如糖、氨基酸、脂肪酸和淀粉及非淀粉多糖的来源。本发明的植物也可以用于制备后代植物，例如杂种和近交系/自交系。

加工酶和编码其的多核苷酸

将编码加工酶(嗜温型的、嗜热型的和嗜高热型的)的多核苷酸引入植物或植物部分中。该加工酶基于存在于植物或转基因植物中的该酶所作用的期望底物和/或期望终产物进行选择。例如，加工酶可以是淀粉加工酶，例如淀粉降解或淀粉异构化酶，或者非淀粉加工酶。适宜的加工酶包括但不限于淀粉降解或异构化酶，包括例如α-淀粉酶、内切或外切-1，4或1，6-α-D葡糖淀粉酶、葡萄糖异构酶、β-淀粉酶、α-葡糖苷酶及其它外切淀粉酶；和淀粉脱支酶，例如异淀粉酶、支链淀粉酶、新支链淀粉酶、异支链淀粉酶、淀粉型支链淀粉酶等，糖基转移酶例如环糊精糖基转移酶等，纤维素酶例如外切-1，4-β-纤维二糖水解酶、外切-1，3-β-D-葡聚糖酶、半纤维素酶、β-葡糖苷酶等；内切葡聚糖酶，例如内切-1，3-β-葡聚糖酶和内切-1，4-β-葡聚糖酶等；L-阿拉伯糖酶，例如内切-1，5-α-L-阿拉伯糖酶、α-阿拉伯糖苷酶等；半乳聚糖酶例如内切-1，4-β-D-半乳聚糖酶、内切-1，3-β-D半乳聚糖酶、β-半乳糖苷酶、α-半乳糖苷酶等；甘露聚糖酶，例如内切-1，4-β-D-甘露聚糖酶、β-甘露糖苷酶、α-甘露糖苷酶等；木聚糖酶，例如内切-1，4-β-木聚糖酶、β-D-木糖苷酶、1，3-β-D-木聚糖酶等；和果胶酶；以及非淀粉加工酶，包括蛋白酶、葡聚糖酶、木聚糖酶、硫氧还蛋白/硫氧还蛋白还原酶、酯酶、植酸酶和脂肪酶。

在一个实施方案中，加工酶是淀粉降解酶，选自：α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡糖淀粉酶、淀粉型支链淀粉酶、葡萄糖异构酶或其组合。根据该实施方案，淀粉降解酶能够允许自加工的植物或植物部分在该植物或植物部分中所含的该酶激活后降解淀粉，这将在本文中进一步描述。淀粉降解酶基于期望的终产物选择。例如，可以选择葡萄糖异构酶以将葡萄糖(己糖)转化成果糖。或者，可以基于具有各种期望的链长度(基于例如加工程度的函数)或具有各种期望的分支模式的期望淀粉衍生终产物，选择酶。例如，可以使用α-淀粉酶、葡糖淀粉酶、或淀粉型支链淀粉酶在短温育时间下产生糊精产物而在较长的温育时间下产生较短链长的产物或糖(sugar)。可以使用支链淀粉酶特异地水解淀粉中的分支点，产生高直链淀粉的淀粉，或者可以使用新支链淀粉酶产生具有其中散布有α1，6连接的、α1，4连接的链的淀粉。可以使用葡糖苷酶产生极限糊精，或者使用不同酶的组合制备其它淀粉衍生物。

在另一实施方案中，加工酶是非淀粉加工酶，选自蛋白酶、葡聚糖酶、木聚糖酶、植酸酶、脂肪酶、纤维素酶、β葡糖苷酶和酯酶。这些非淀粉加工酶允许本发明自加工的植物或植物部分在植物的被靶向区域整合这些酶，并在激活后破坏植物而保留其中的淀粉粒完整。例如，在一个优选实施方案中，非淀粉降解酶靶向植物细胞的胚乳基质并在激活后破坏该胚乳基质而保留其中的淀粉粒完整并且使淀粉粒可以更容易地从所得物中回收。

本发明还考虑加工酶的组合。例如，可以组合使用淀粉加工酶和非淀粉加工酶。加工酶的组合可以通过使用分别编码各一种酶的多种基因构建体获得。或者，可以通过已知方法使利用这些酶分别地稳定转化的各单个转基因植物杂交以获得同时含有这些酶的植物。另一方法包括将外源酶和转基因植物一起使用。

加工酶可以从任何来源分离或获得，并且编码其的相应多核苷酸可以由本领域技术人员确定。例如，加工酶例如α-淀粉酶可以来源于炽热球菌属(Pyrococcus)(例如，强烈炽热球菌(Pyrococcusfuriosus))、栖热菌属(Thermus)、高温球菌属(Thermococcus)(例如，Thermococcus hydrothermalis)、硫化叶菌属(Sulfolobus)(例如，硫磺矿硫化叶菌(Sulfolobus sofataricus))、栖热袍菌属(Thermotoga)(例如，海栖热袍菌(Thermotoga maritima)和Thermotoga neapolitana)、热厌氧杆菌属(Thermoanaerobacterium)(例如，腾冲热厌氧杆菌(Thermoanaerobacter tengcongensis))、曲霉属(Aspergillus)(例如Aspergiusshirousami和黑曲霉)、根霉属(例如米根霉(Rhizopus oryzae))、热变形菌目(Thermoproteales)、除硫球菌属(Desulfurococcus)(例如，溶淀粉除硫球菌(Desulfurococcusamylolyticus))、热自养甲烷杆菌(Methanobacteriumthermoautothrophicum)、詹氏甲烷球菌(Methanococcusjannaschii)、Methanopyrus kandleri、Thermosynechococcuselongatus、嗜酸热原体(Thermoplasma acidophilum)、Thefmoplasmavolcanium、敏捷气热菌(Aeropyrum pernix)和植物例如玉米、大麦和稻。

本发明加工酶能够在引入植物基因组中和表达后被激活。激活酶的条件针对各不同的酶来确定，并且可以包括变化的条件，例如温度、pH、水合作用、金属的存在、激活化合物、失活化合物等。例如，温度依赖型酶可以包括嗜温型的、嗜热型的和嗜高热型的酶。嗜温酶(mesophilic enzyme)典型地在20℃至65℃的温度下具有最大活性，并在大于70℃的温度失活。嗜温酶在30至37℃具有显著的活性，30℃的活性优选是最大活性的至少10％，更优选是最大活性的至少20％。

嗜热酶(Thermophilic enzyme)在50℃至80℃的温度下具有最大活性，并在大于80℃的温度失活。嗜热酶优选在30℃具有不到20％的最大活性，更优选不到10％的最大活性。

“嗜高热”酶(hyperthermophilic enzyme)在甚至更高温度下仍具有活性。嗜高热酶在大于80℃的温度下具有最大活性，并在至少80℃的温度下保持活性，更优选地在至少90℃的温度下保持活性，最优选地在至少95℃的温度下保持活性。嗜高热酶在低温下也具有降低的活性。嗜高热酶在30℃可以具有不足最大活性的10％的活性，优选地该活性不足最大活性的5％。

优选地，修饰编码加工酶的多核苷酸以包括针对在所选生物体例如植物中的表达而优化的密码子(见例如，Wada等，Nucl.Acids Res.，18：2367(1990)，Murray等，Nucl.Acids Res.，17：477(1989)，美国专利号5,096,825、5,625,136、5,670,356和5,874,304)。密码子优化型序列是合成的序列，即，它们并不天然存在，并且优选地与编码加工酶的、密码子未优化的亲本多核苷酸编码相同的多肽(或与全长多肽具有基本上相同活性的全长多肽的酶活性片段)。优选地，该多肽在生物化学上与亲本来源多核苷酸截然不同，或者从亲本来源多核苷酸通过例如编码特定加工酶的DNA的递归诱变(recursivemutagenesis)而改良产生，从而使得其在工艺应用中的性能得以提高。优选的多核苷酸针对在靶宿主植物中的表达进行优化，并编码加工酶。制备这些酶的方法包括诱变，例如递归诱变和选择。用于诱变和核苷酸序列改变的方法是本领域熟知的。见例如，Kunkel，Proc.Natl.Acad.Sci.USA，82：488(1985)；Kunkel等，Methods in Enzymol.154：367(1987)；美国专利号4,873,192；Walker和Gaastra编(1983)Techniques in Molecular Biology(MacMillan Publishing Company，纽约)和其中引用的参考文献以及Arnold等，Chem.Eng.Sci.，51：5091(1996))。优化核酸区段在靶植物或生物体中的表达的方法是本领域熟知的。简而言之，获得指示靶生物所使用的最佳密码子的密码子使用表，并选择最佳密码子以替换靶多核苷酸中的密码子，然后化学合成此经过优化的序列。玉米的优选密码子描述在美国专利号5,625,136中。

本发明还考虑本发明多核苷酸的互补核酸。对于Southern印迹或Northern印迹中具有100个以上的互补残基的互补核酸在滤膜上的杂交，低严紧杂交条件的一个例子是50％甲酰胺，例如，在50％甲酰胺、1M NaCl、1％SDS中37℃杂交并在0.1X SSC中60℃至65℃洗涤。示例性低严紧条件包括用30至35％甲酰胺、1M NaCl、1％SDS(十二烷基硫酸钠)的缓冲溶液在37℃杂交，并在1X至2X SSC(20X SSC＝3.0MNaCl/0.3M柠檬酸三钠)中50至55℃洗涤。示例性中等严紧条件包括在40至45％甲酰胺、1.0M NaCl、1％SDS中37℃杂交并在0.5X至1XSSC中55至60℃洗涤。

而且，本发明还考虑编码加工酶的“酶活性”片段的多核苷酸。本文中，“酶活性”指加工酶的多肽片段，该片段与该加工酶在修饰该加工酶于适当条件下正常所作用的底物方面具有基本上相同的生物学活性。

在一个优选实施方案中，本发明多核苷酸是编码α-淀粉酶的玉米优化型(maize-optimized)多核苷酸，例如SEQ ID NO：2、9、46和52中提供的多核苷酸。在另一优选实施方案中，多核苷酸是编码支链淀粉酶的玉米优化型多核苷酸，例如SEQ ID NO：4和25中提供的多核苷酸。在再一优选实施方案中，多核苷酸是编码α-葡糖苷酶的玉米优化型多核苷酸，例如SEQ ID NO：6中提供的多核苷酸。另一优选的多核苷酸是具有SEQ ID NO：19、21、37、39、41或43的、编码葡萄糖异构酶的玉米优化型多核苷酸。另一实施方案中，优选SEQ ID NO：46、48或50中给出的、编码葡糖淀粉酶的玉米优化型多核苷酸。而且，在SEQ ID NO：57中提供了编码葡聚糖酶/甘露聚糖酶融合多肽的玉米优化型多核苷酸。本发明还提供在中等或优选地低的严紧杂交条件下杂交并根据具体情况而定编码具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶、葡糖淀粉酶、葡聚糖酶或甘露聚糖酶活性的多肽的、这些多核苷酸的互补核酸。

多核苷酸可以与“核酸”或“polynucleic acid”互换使用，指脱氧核糖核苷酸或核糖核苷酸及其由单体(核苷酸)组成的、单链或双链形式的聚合物，其中所述单体(核苷酸)含有糖、磷酸和碱基，所述碱基是嘌呤或嘧啶。除非特别地限制，该术语包括含有天然核苷酸的已知类似物的核酸，所述核酸与参考核酸具有相似的结合性质并与天然存在的核苷酸以相似的方式代谢。除非另行指出，否则特定核酸序列也隐含其保守修饰的变体(例如，简并密码子替代)和互补序列以及明确指出的该序列。特别地，可以通过产生一个或多个选定的(或所有的)密码子的第三位被混合型碱基(mixed-base)和/或脱氧肌苷残基替代的序列，而实现简并密码子替代。

在此也包括“变体”或基本上相似的序列。对于核苷酸序列，变体包括由于遗传密码的简并性而编码天然蛋白质的相同氨基酸序列的那些序列。天然存在的等位变体例如这些变体可以使用熟知的分子生物学技术，例如聚合酶链式反应(PCR)、杂交技术和连接重组装技术而鉴定。变体核苷酸序列也包括合成来源的核苷酸序列，例如，通过例如使用定点诱变产生的编码天然蛋白质的核苷酸序列以及编码具有氨基酸替代的多肽的核苷酸序列。一般地，本发明的核苷酸序列变体与天然核苷酸序列具有至少40％、50％、60％，优选地70％，更优选地80％，甚至更优选地90％，最优选地99％的同一性，以及在这些等级基础上的单个最小正整数百分比的同一性。例如，71％、72％、73％等，直到至少90％等级。变体也可以包括相应于所鉴定的基因片段的全长基因。

调节序列：启动子/信号序列/选择标记

编码本发明加工酶的多核苷酸序列可以和编码定位信号或信号序列(在多肽的N端或C端)的多核苷酸序列可操作地连接，以便例如将嗜高热酶引导至植物中的特定区室。该靶的例子包括但不限于液泡、内质网、叶绿体、造粉体、淀粉粒、或细胞壁，或者特定组织，例如种子。编码具有信号序列的加工酶的多核苷酸在植物中的表达，尤其是在与组织特异性或诱导型启动子联用时，可以在植物中产生高水平的定位加工酶。已知多种信号序列可以影响多核苷酸朝向特定区室或在特定区室外的表达或靶向。适宜的信号序列和靶向启动子是本领域已知的，包括但不限于本文中提供的那些。

例如，当期望在特定组织或器官中表达时，可以使用组织特异性启动子。相反，如果期望基因响应刺激物而表达，诱导型启动子是特别好的调节元件。当期望在植物的所有细胞中实现连续表达时，使用组成型启动子。可以将玉米启动子序列上游和/或下游的其它调节序列包括在转化载体的表达构建体中以导致异源核苷酸序列在转基因植物中不同水平的表达。

具有各种表达特征的多种植物启动子已有描述。已有描述的一些组成型启动子的例子包括稻肌动蛋白1(Wang等，Mol.Cell.Biol.，12：3399(1992)；美国专利号5,641,876)、CaMV35S(Odell等，Nature，313：810(1985))、CaMV19S(Lawton等，1987)、nos(Ebert等，1987)、Adh(Walker等，1987)、蔗糖合酶(Yang & Russell，1990)和泛素的启动子。

在转基因植物中用于基因的组织特异性靶向的载体典型地包括组织特异性启动子，也可以包括其它组织特异性控制元件例如增强子序列。基于本公开，在某些植物组织中指导特异的或增强的表达的启动子将是本领域技术人员已知的。这些启动子包括，例如，特异于绿色组织的rbcS启动子；在根或受伤的叶组织中具有较高活性的ocs、nos和mas启动子；在根中指导增强的表达的、截短的(-90至+8)35S启动子，在根中指导表达的α-微管蛋白基因，和来源于玉米醇溶蛋白贮存蛋白基因的、在胚乳中指导表达的启动子。

可以通过联合引入组成型表达的基因(所有组织)以及仅仅在不期望该基因产物出现的那些组织中表达的反义基因，而功能性地实现组织特异性表达。例如，可以将编码脂肪酶的基因引入，使用来自花椰菜花叶病毒的35S启动子使其在所有组织中表达。使用例如玉米醇溶蛋白启动子，在玉米籽粒中表达该脂肪酶基因的反义转录物，则将阻止该脂肪酶蛋白质在种子中积累。由此，由引入的基因编码的蛋白质将存在于除籽粒之外的所有组织中。

而且，已经报道了植物中的几种组织特异性调节的基因和/或启动子。已经报道的一些组织特异性基因包括编码种子贮存蛋白(例如napin、cruciferin、β-conglycinin和菜豆蛋白)、玉米醇溶蛋白或油体蛋白(例如，油质蛋白)的基因，或者参与脂肪酸生物合成的基因(包括酰基载体蛋白、硬脂酰ACP去饱和酶和脂肪酸去饱和酶(fad2-1))、和在胚胎发育过程表达的其它基因(例如Bce4，见例如EP255378和Kridl等Seed Science Research，1：209(1991))。已有描述的组织特异性启动子的例子包括凝集素启动子(Vodkin，Prog.Clin.Biol.Res.138：87(1983)；Lindstrom等Der.Genet.，11：160(1990))、玉米醇脱氢酶1启动子(Vogel等，1989；Dennis等，NucleicAcids Res.12：3983(1984))、玉米集光复合体启动子(Simpson，1986；Bansal等，Proc.Natl.Acad.Sci.USA，89：3654(1992))、玉米热休克蛋白启动子(Odell等，1985；Rochester等，1986)、豌豆小亚基RuBP羧化酶启动子(Poulsen等，1986；Cashmore等，1983)、Ti质粒甘露碱合酶启动子(Langridge等，1989)、Ti质粒胭脂碱合酶启动子(Langridge等，1989)、矮牵牛查耳酮异构酶启动子(vanTunen等，EMBO J.，7：1257(1988))、菜豆富甘氨酸蛋白质1启动子(Keller等，Genes Dev.3：1639(1989))、截短的CaMV35s启动子(Odell等，Nature，313：810(1985))、马铃薯patatin启动子(Wenzler等，Plant Mol.Biol. 13：347(1989))、根细胞启动子(Yamamoto等，Nucleic Acids Res.，18：7499(1990))、玉米的玉米醇溶蛋白启动子(Reina等，Nucleic Acids Res.18：6425(1990)；Kriz等，Mol.Gen.Genet.，207：90(1987)；Wandelt等，Nucleic Acids Res.17：2354(1989)；Langridge等Cell，34：1015(1983)；Reina等，NucleicAcids Res.18：7449(1990))、球蛋白-1启动子(Belanger等，Genetics，129：863(1991))、α-微管蛋白启动子、cab启动子(Sullivan等，Mo1.Gen.Genet.215：431(1989))、PEPCase启动子(Hudspeth & Grula，1989)、R基因复合体相关启动子(Chandler等，Plant Cell，1：175(1989))、和查耳酮合酶启动子(Franken等，EMBO J.10：2605(1991))。对于种子特异性表达尤其有用的是豌豆的豌豆球蛋白启动子(Czako等，Mol.Gen.Genet.235：33(1992))。(也参见美国专利号5,625,136，在此并入作为参考。)对于在成熟叶中的表达有用的其它启动子是在衰老期开始时开关的那些启动子，例如来自拟南芥属(Arabidopsis)的SAG启动子(Gan等，Science，270：1986(1995))。

U.S.4,943,674(其公开内容特此并入作为参考)中讨论了一类在开花期或在开花期至果实发育(至少直到成熟开始)的过程中表达的果实特异性启动子。已经分离了优选在棉纤维中表达的cDNA克隆(John等，Proc.Natl.Acad.Sci.USA，89：5769(1992))。已经分离并表征了来自番茄的、在果实发育过程中展示出差异表达的cDNA克隆(Mansson等，Gen.Genet.200：356(1985)，Slater等，PlantMol.Biol.5：137(1985))。多聚半乳糖醛酸酶基因的启动子在果实成熟中具有活性。多聚半乳糖醛酸酶基因描述在美国专利号4,535,060、美国专利号4,769,061、美国专利号4,801,590和美国专利号5,107,065中，这些专利的公开内容并入此处作为参考。

组织特异性启动子的其它例子包括在叶受损(例如，由昆虫咀嚼所致)后在叶细胞中指导表达的启动子、在块茎中指导表达的启动子(例如，patatin基因启动子)、和在纤维细胞中指导表达的启动子(发育调节的纤维细胞蛋白质的一个例子是E6(John等，Proc.Natl.Acad.Sci.USA，89：5769(1992)。E6基因在纤维中具有最大活性，但在叶、胚珠和花中存在低水平的转录物。

一些“组织特异性”启动子的组织特异性可能不是绝对的，并可以由本领域技术人员使用白喉毒素序列测试。也可以通过不同组织特异性启动子的组合，实现具有“渗漏”表达的组织特异性表达(Beals等，Plant Cell，9：1527(1997))。其它组织特异性启动子可以由本领域技术人员分离(见U.S.5,589,379)。

一个实施方案中，可以使多糖水解基因的产物，例如α-淀粉酶的方向定向于特定的细胞器，例如质外体而非细胞质。对于此的一个例子是使用赋予蛋白质质外体特异性靶向的玉米γ-玉米醇溶蛋白N端信号序列(SEQ ID NO：17)。指引蛋白质或酶达到特定区室将允许酶以不与底物接触的方式定位。以此方式，在酶接触其底物之前不发生酶的酶学反应。通过碾磨工艺(物理破碎细胞完整性)、或加热细胞或植物组织以破坏含有酶的植物细胞或器官的物理完整性，可以使酶与其底物接触。例如，可以将嗜温淀粉水解酶引导至质外体或内质网以免与造粉体中的淀粉粒接触。碾磨谷粒将破坏谷粒的完整性，然后淀粉水解酶将与淀粉粒接触。以此方式，可以规避酶和其底物共定位的潜在负作用。

在另一实施方案中，组织特异性启动子包括胚乳特异性启动子如玉米γ-玉米醇溶蛋白启动子(SEQ ID NO：12所示例的)或玉米ADP-gpp启动子(SEQ ID NO：11所示例的，该序列包括5’非翻译序列和内含子序列)或Q蛋白启动子(SEQ ID NO：98所示例的)或稻的谷蛋白1启动子(SEQ ID NO：67中所示例的)。因此，本发明包括包含含有SEQ IDNO：11、12、67或98的启动子的分离多核苷酸、与其互补物在低严紧杂交条件下杂交的多核苷酸、或其具有启动子活性(例如，具有SEQID NO：11、12、67或98的启动子的活性的至少10％，优选地至少50％)的片段。

在本发明另一实施方案中，多核苷酸编码嗜高热加工酶，该酶与叶绿体(造粉体)转运肽(CTP)和淀粉结合域(例如来自waxy基因)可操作地连接。在此实施方案中一个示例性多核苷酸编码SEQ ID NO：10(与来自waxy的淀粉结合域连接的α-淀粉酶)。其它示例性多核苷酸编码与将该酶引导至内质网并分泌至造粉体的信号序列连接的嗜高热加工酶(如，编码SEQ ID NO：13、27或30的多核苷酸，其分别包含与α-淀粉酶、α-葡糖苷酶、葡萄糖异构酶可操作连接的来自玉米γ-玉米醇溶蛋白的N端序列)、与将酶滞留于内质网的信号序列连接的嗜高热加工酶(如编码包含与嗜高热酶可操作连接的玉米γ-玉米醇溶蛋白N端序列的SEQ ID NO：14、26、28、29、33、34、35或36的多核苷酸，其中所述酶与SEKDEL可操作连接，其中所述酶是α-淀粉酶、malAα-葡糖苷酶、海栖热袍菌(T.maritima)葡萄糖异构酶、T.neapolitana葡萄糖异构酶)、与将酶引导至造粉体的N端序列连接的嗜高热加工酶(如编码SEQ ID NO：15的多核苷酸，其中SEQ ID NO：15包含与α-淀粉酶可操作连接的、来自waxy的N端造粉体引导序列)、将酶引导至淀粉粒的嗜高热融合多肽(如编码SEQ ID NO：16的多核苷酸，其中SEQ ID NO：16包含与含有waxy淀粉结合域的α-淀粉酶/waxy融合多肽可操作连接的、来自waxy的N端造粉体引导序列)、与ER滞留信号连接的嗜高热加工酶(如编码SEQ ID NO：38和39的多核苷酸)。而且，嗜高热加工酶可以与具有氨基酸序列(SEQ IDNO：53)的生淀粉结合位点连接，其中编码加工酶的多核苷酸与编码该结合位点的玉米优化型核酸序列(SEQ ID NO：54)连接。

已经报道了几种诱导型启动子。许多在以下文献中以综述形式进行描述：Gatz，Current Opinion in Biotechnology，7：168(1996)和Gatz，C.Annu.Rev.Plant Physiol.Plant Mol.Biol.48：89(1997)。例子包括四环素阻遏系统，Lac阻遏系统、铜诱导系统、水杨酸诱导系统(例如PRla系统)、糖皮质激素诱导(Aoyama T.等，N-HPlant Journal，11：605(1997))和蜕皮激素诱导系统。其它诱导型启动子包括ABA和膨压诱导启动子、生长素结合蛋白基因的启动子(Schwob等，Plant J.4：423(1993))、UDP葡萄糖类黄酮糖基转移酶基因启动子(Ralston等，Genetics，119：185(1988))、MPI蛋白酶抑制剂启动子(Cordero等，Plant J.6：141(1994))和甘油醛-3-磷酸脱氢酶基因启动子(Kohler等，Plant Mol.Biol.29：1293(1995)；Quigley等，J.Mol.Evol.29：412(1989)；Martinez等，J.Mol.Biol.208：551(1989))。也包括苯磺胺诱导型(U.S.5364,780)和醇诱导型(WO97/06269和WO97/06268)系统及谷胱甘肽S转移酶启动子。

其它研究集中于响应于环境压力或刺激物例如增加的盐度、干旱、病原体和损伤而被诱导调节的基因。(Graham等，J.Biol.Chem.260：6555(1985)；Graham等，J.Biol.Chem.260：6561(1985)；Smith等，Planta，168：94(1986))。已经报道了金属羧肽酶抑制剂蛋白质在损伤的马铃薯植物的叶中积累(Graham等，Biochem.Biophys.Res.Comm.，101：1164(1981))。已经报道了可以被茉莉酮酸甲酯、elicitor、热休克、缺氧应激或除草剂防护剂诱导的其它植物基因。

嵌合反式作用病毒复制蛋白质的调节性表达还可以通过其它遗传策略，例如Cre介导的基因激活来进行调节(Odell等，Mol.Gen.Genet.113：369(1990))。因此，位于启动子和复制蛋白编码序列之间阻断嵌合复制基因自启动子表达的、由lox位点界定的含有3’调节序列的DNA片段，可以通过Cre介导的切除作用而除去，导致反式作用复制基因表达。在此情况下，嵌合Cre基因、嵌合反式作用复制基因或两者可以在组织特异性和发育特异性或诱导型启动子的控制下。一个备用遗传策略是使用tRNA抑制基因。例如，tRNA抑制基因的调节性表达可以有条件地控制含有适当终止密码子的反式作用复制蛋白编码序列的表达(Ulmasov等，Plant.Mol.Biol.35：417(1997))。同样，嵌合tRNA抑制基因、嵌合反式作用复制基因或两者可以在组织特异性和发育特异性或诱导型启动子的控制下。

优选地，对于多细胞生物，启动子也可以对特定组织、器官或发育阶段是特异的。此类启动子的例子包括但不限于玉蜀黍(Zea mays)ADP-gpp和玉蜀黍γ-玉米醇溶蛋白启动子和玉蜀黍球蛋白启动子。

基因在转基因植物中的表达可能仅仅在植物发育过程中的某些时间段是期望的。发育的时间安排常常与组织特异性基因表达相关。例如，玉米醇溶蛋白贮存蛋白质在授粉后大约15天于胚乳中开始表达。

此外，可以构建并使用载体来实现特定基因产物在转基因植物细胞中的细胞内定向或者指引蛋白质到达细胞外环境。这一般可以通过将编码转运肽或信号肽的DNA序列与特定基因的编码序列连接而实现。所得转运肽或信号肽分别将蛋白质运送至特定的细胞内或细胞外目的地，然后被翻译后除去。转运肽或信号肽通过促进蛋白质跨细胞内膜，例如液泡、小泡、质体和线粒体膜的运输来起作用，而信号肽指引蛋白质通过细胞外膜。

信号序列如用于靶向内质网和在质外体中分泌的玉米γ-玉米醇溶蛋白N端信号序列可以可操作地与编码本发明嗜高热加工酶的多核苷酸连接(Torrent等，1997)。例如，SEQ ID NO：13、27和30提供编码与来自玉米γ玉米醇溶蛋白的N端序列可操作连接的嗜高热酶的多核苷酸。另一信号序列是将多肽滞留在内质网中的氨基酸序列SEKDEL(Munro和Pelham，1987)。例如，编码SEQ ID NO：14、26、28、29、33、34、35或36(含有与加工酶可操作连接的来自玉米γ玉米醇溶蛋白的N端序列，其中所述加工酶与SEKDEL可操作连接)的多核苷酸。多肽还可以通过与waxy造粉体引导肽(Klosgen等，1986)融合而被引导至造粉体或者可以被引导至淀粉粒。例如，编码嗜高热加工酶的多核苷酸可以与叶绿体(造粉体)转运肽(CTP)和淀粉结合域(例如来自waxy基因)可操作地连接。SEQ ID NO：10示例了与来自waxy的淀粉结合域连接的α-淀粉酶。SEQ ID NO：15示例了与α淀粉酶可操作连接的、来自waxy的N端序列造粉体引导序列。而且，编码加工酶的多核苷酸可以使用waxy淀粉结合域进行融合以靶向淀粉粒。例如，SEQ ID NO：16示例了含有来自waxy的N端造粉体引导序列的融合多肽，其中所述引导序列与包含waxy淀粉结合域的α-淀粉酶/waxy融合多肽可操作地连接。

除了加工信号外，本发明多核苷酸还可以包括本领域已知的其它调节序列。“调节序列”和“适宜的调节序列”均指位于编码序列上游(5’非编码序列)、内部或下游(3’非编码序列)并影响与之连接的编码序列的转录、RNA加工或稳定性或翻译的核苷酸序列。调节序列包括增强子、启动子、翻译前导序列、内含子和多聚腺苷酸化信号序列。这些序列包括天然的和合成的序列以及可以是天然序列和合成序列的组合的序列。

如本领域熟知的，也可以在本发明中使用选择标记以允许选择转化的植物和植物组织。可能期望将可选择或可甄别的标记基因用作可表达的目的基因，或者在可表达的目的基因之外还使用可选择或可甄别的标记基因。“标记基因”是赋予表达该标记基因的细胞独特表型由此允许将该转化的细胞与不具有该标记的细胞区分开来的基因。此类基因可以编码可选择的或可甄别的标记，这取决于该标记是否赋予可以通过化学手段(即，通过使用选择剂，如除草剂、抗生素等)进行选择的性状，或者其是否仅仅是可以通过观察或检查，即通过甄别而鉴定的性状(例如R基因座性状)。当然，适宜的标记基因的许多例子是本领域已知的，并可以用于实施本发明。

在术语可选择的或可甄别的标记基因中也包括编码“可分泌标记”的基因，其中可以通过检测所述可分泌标记的分泌作为鉴定或选择转化细胞的手段。实例包括编码可分泌抗原(能够通过抗体相互作用鉴定)或者甚至是可分泌酶(能够通过其催化活性检测)的标记。可分泌蛋白分为几类，包括能够通过例如ELISA检测的、小的、可扩散的蛋白质；能够在细胞外溶液中检测的、小的活性酶(例如，α-淀粉酶、β-内酰胺酶、膦丝菌素乙酰转移酶)；和插入或陷入细胞壁中的蛋白质(例如，包括前导序列，如存在于伸展蛋白或马铃薯PR-S的表达单位中的前导序列的蛋白质)。

关于可选择或可甄别标记，使用编码包括独特表位并被隔离在细胞壁中的蛋白质的基因，被认为是尤其有利的。此类分泌型抗原标记理想地使用在植物组织中提供低背景的表位序列、以及可以造成有效的表达和跨越质膜的定向的启动子-前导序列，并且将产生结合在细胞壁中但仍可以被抗体接近的蛋白质。经过修饰包括独特表位的正常分泌型细胞壁蛋白质将满足所有这些需要。

适于以此方式修饰的蛋白质的一个例子是伸展蛋白、或富含羟基脯氨酸的糖蛋白(HPRG)。例如，玉米HPRG(Steifel等，The Plant Cell，2：785(1990))分子在分子生物学、表达和蛋白质结构上进行了充分的表征。然而，各种伸展蛋白和/或富含甘氨酸的细胞壁蛋白(Keller等，EMBO Journal，8：1309(1989))之任一种都可以通过添加抗原性位点进行修饰而产生可甄别的标记。

a.可选择标记

可以用于本发明的可选择标记包括，但不限于，编码卡那霉素抗性并可以使用卡那霉素、G418等选择的neo或nptII基因(Potrykus等，Mol.Gen.Genet.199：183(1985))；赋予对除草剂膦丝菌素的抗性的bar基因；编码改变的EPSP合酶蛋白由此赋予草甘膦(glyphosate)抗性的基因(Hinchee等，Biotech.6：915(1988))；赋予对溴苯腈(bromoxynil)的抗性的腈水解酶基因，例如来自臭鼻克雷白氏杆菌(Klebsiella ozaenae)的bxn(Stalker等，Science，242：419(1998))；赋予对咪唑啉酮、磺酰尿或其它ALS抑制化学药品的抗性的、突变的乙酰乳酸合酶基因(ALS)(欧洲专利申请154,204,1985)；氨甲蝶呤抗性DHFR基因(Thillet等，J.Biol.Chem.，263：12500(1988))；赋予对除草剂茅草枯的抗性的茅草枯脱卤素酶基因；磷酸甘露糖异构酶(PMI)基因；赋予对5-甲基色氨酸的抗性的、突变的邻氨基苯甲酸合酶基因；赋予对抗生素潮霉素的抗性的hph基因；或提供代谢甘露糖的能力的甘露糖-6-磷酸异构酶基因(在此也称作磷酸甘露糖异构酶基因)(美国专利号5,767,378和5,994,629)。本领域技术人员能够选择适宜的可选择标记基因用于本发明。当使用突变的EPSP合酶基因时，通过并入适宜的叶绿体转运肽CTP，可以获得额外的益处(欧洲专利申请0,218,571,1987)。

能够在系统中用于选择转化体的可选择标记基因的一个举例说明性实施方案是，编码膦丝菌素乙酰转移酶的基因，例如来自吸水链霉菌(Streptomyces hygroscopicus)的bar基因或来自产绿色链霉菌(Streptomyces Viridochromogenes)的pat基因。膦丝菌素乙酰转移酶(PAT)失活除草剂茅草枯中的活性成分，膦丝菌素(PPT)。PPT抑制谷氨酰胺合成酶(Murakami等，Mol.Gen.Genet.205：42(1986)；Twell等，Plant Physiol.91：1270(1989))，从而造成快速的氨积累和细胞死亡。因为已经报道的存在于谷物转化中的主要困难(Potrykus，Trends Biotech.7：269(1989))，在单子叶植物中成功地使用此选择系统是尤其令人惊奇的。

当期望使用双丙氨膦(bialaphos)抗性基因实施本发明时，对于此目的尤其有用的基因是可以从链霉菌属(Streptomyces)物种(例如ATCC21，705)获得的bar或pat基因。Bar基因的克隆已有描述(Murakami等，Mol.Gen.Genet.205：42(1986)；Thompson等，EMBOJourna l，6：2519(1987))，此外也描述了bar基因在单子叶植物以外的植物背景中的使用(DeBlock等，EMBO Journal，6：2513(1987)；De Block等，Plant Physiol.91：694(1989))。

b.可甄别的标记

可以使用的可甄别标记包括但不限于β-葡糖醛酸糖苷酶或udiA基因(GUS)，其编码具有多种已知的显色底物的酶；R-基因座基因，其编码在植物组织中调节花色素苷色素(红色)产生的产物(Dellaporta等，Chromosome Structure and Function，pp263-282(1988))；β-内酰胺酶基因(Sutcliffe，PNAS USA，75：3737(1978))，其编码存在多种已知的显色底物(例如，PADAC，一种显色的头孢菌素)的酶；xy1E基因(Zukowsky等，PNAS USA80：1101(1983))，其编码能够转化显色儿茶酚的儿茶酚双加氧酶；α-淀粉酶基因(Ikuta等，Biotech.，8：241(1990))；酪氨酸酶基因(Katz等，J.Gen.Microbiol.129：2703(1983))，其编码能够将酪氨酸氧化成DOPA和多巴醌的酶，其中多巴醌又缩合形成可以容易地检测的化合物黑色素；β-半乳糖苷酶基因，其编码存在显色底物的酶；萤光素酶(1ux)基因(Ow等，Science，234：856(1986))，其允许进行生物发光检测；或水母发光蛋白基因(Prasher等，Biochem.Biophys.Res.Comm.，126：1259(1985))，其可以用于钙敏感的生物发光检测；或绿色荧光蛋白基因(Niedz等，Plant Cell Reports，14：403(1995))。

预期来自玉米R基因复合体的基因作为可甄别标记将尤其有用。玉米中的R基因复合体编码起着调节大多数种子和植物组织中花色素苷色素生产的作用的蛋白质。来自R基因复合体的基因适用于玉米转化，因为该基因在转化细胞中的表达对细胞不会产生损害。因此，引入该细胞的R基因将造成红色色素的表达，并且，如果在稳定整合的情况下，能够以红色部分直观评分。如果玉米品系带有编码花色素苷生物合成途径中的酶促中间体的基因的显性等位基因(C2、A1、A2、Bz1和Bz2)，但在R基因座带有隐性等位基因，则来自该品系的任何细胞用R转化将导致红色色素的形成。示例性品系包括Wisconsin 22(该品系含有rg-Stadler等位基因)和TR112，一种K55衍生物(其是r-g，b，P1)。或者，如果将C1和R等位基因一起引入，则可以使用任何玉米基因型。考虑用于本发明的另一可甄别标记是1ux基因编码的萤火虫萤光素酶。Lux基因在转化细胞中的存在可以通过使用例如X光片、闪烁计数、荧光分光光度测定法、低光照摄像机、光子计数照相机或多孔发光测定法检测。也设想到，可以发展该系统以便用于群体的生物发光筛选，例如在组织培养板上进行筛选，或甚至用于整株植物筛选。

用于转化植物的多核苷酸可以包括，但不限于，来自植物基因和非植物基因例如来自细菌、酵母、动物或病毒的那些基因的DNA。引入的DNA可以包括修饰的基因、基因的部分、或嵌合基因，包括来自相同或不同玉米基因型的基因。术语“嵌合基因”或“嵌合DNA”定义为包含来自物种的至少两种DNA序列或区段的基因或DNA序列或区段，其中所述至少两种DNA序列或区段在天然状况下不组合成DNA，或者所述至少两种DNA序列或区段以在未转化植物的天然基因组中正常不存在的方式定位或连接。

本发明还提供包含编码嗜高热加工酶的多核苷酸，优选地密码子优化的多核苷酸的表达盒。优选地，表达盒中多核苷酸(第一多核苷酸)与调节序列，例如启动子、增强子、内含子、终止序列或其任何组合以及任选地编码信号序列(N或C端)的第二多核苷酸可操作地连接，其中所述信号序列指导第一多核苷酸编码的酶到达特定的细胞或亚细胞位置。因此，启动子和一个或多个信号序列可以导致酶在植物、植物组织或植物细胞的特定位置进行高水平的表达。启动子可以是组成型启动子、诱导型(条件型)启动子或组织特异性启动子，例如胚乳特异性启动子如玉米的γ-玉米醇溶蛋白启动子(如SEQ ID NO：12)或玉米的ADP-gpp启动子(如SEQ ID NO：11，其包括5’非翻译序列和内含子序列)。本发明还提供包含含有SEQ ID NO：11或12的启动子的分离的多核苷酸，与其互补序列在低严紧杂交条件下杂交的多核苷酸、或其具有启动子活性(例如，该活性是具有SEQ ID NO：11或12的启动子的活性的至少10％，优选地至少50％)的片段。还提供包含本发明表达盒或多核苷酸的载体以及包含本发明多核苷酸、表达盒或载体的转化细胞。本发明载体可以包含编码一种以上本发明嗜高热加工酶的多核苷酸序列，所述序列可以采取正义方向或反义方向，并且转化的细胞可以包含一种或多种本发明载体。优选的载体是可用于将核酸引入植物细胞中的那些载体。

转化

可以将表达盒或含有表达盒的载体构建体插入细胞。表达盒或载体构建体可以以附加体的形式存在或者整合在细胞基因组中。然后可以将转化的细胞培养成转基因植物。因此，本发明提供转基因植物的产物。该产物可以包括但不限于种子、果实、后代和转基因植物后代的产物。

本领域技术人员已知并可以获得多种用于将构建体引入细胞宿主中的技术。细菌和许多真核细胞的转化可以通过使用聚乙二醇、氯化钙、病毒感染、噬菌体感染、电穿孔和本领域已知的其它方法来实现。转化植物细胞或组织的技术包括使用根癌农杆菌(A.tumefaciens)或发根农杆菌(A.rhizogenes)作为转化剂用DNA进行的转化、电穿孔、DNA注射、微粒轰击、粒子加速等(见例如EP295959和EP138341)。

在一个实施方案中，可以使用农杆菌属物种Ti衍生载体的Ti和Ri质粒的二元型载体，转化各种高等植物，包括单子叶植物和双子叶植物，例如大豆、棉、油菜、烟草和稻(Pacciotti等，Bio/Technology，3：241(1985)；Byrne等，Plant Cell Tissue and Organ Culture，8：3(1987)；Sukhapinda等Plant Mol.Biol.8：209(1987)；Lorz等，Mol.Gen.Genet.199：178(1985)；Potrykus Mol.Gen.Genet.199：183(1985)；Park等，J.Plant Biol.38：365(1985)；Hiei等，Plant J.6：271(1994))。对于使用T-DNA转化植物细胞已经有深入的研究和详细的描述(EP120516；Hoekema，The Binary PlantVector System.Offset-drukkerij Kanters B.V.；Alblasserdam(1985)，第V章；Knauf等，Genetic Analysis of Host RangeExpression by Agr obacterium，Moleuclar Genetics of theBacteria-Plant Interaction，Puhler，A.编，Springer-Verlag，纽约，1983，245页；和An.等，EMBO J.4：277(1985))。

本领域技术人员可以获得其它转化方法，例如外源DNA构建体的直接摄取(见EP295959)、电穿孔技术(Fromm等，Nature(London)319：791(1986)、或用包被有核酸构建体的金属粒子进行的高速弹道轰击(Kline等，Nature(London)327：70(1987)和美国专利号4,945,050)。一旦转化后，细胞可以由本领域技术人员进行再生。尤其相关的是近来描述的将外源基因转化至商业重要作物中的方法，所述作物例如菜籽油菜(De Block等，Plant Physiol.91：694-710(1989))、向日葵(Everett等，Bio/Technology，5：1201(1987))、大豆(McCabe等，Bio/Technology，6：923(1988)；Hinchee等，Bio/Technology，6：915(1988)；Chee等，Plant Physiol.91：1212(1989)；Christou等，Proc.Natl.Acad.Sci.USA，86：7500(1989)，EP 301749)、稻(Hiei等，Plant J.6：271(1994))和玉米(Gordon Kamm等，Plant Cell，2：603(1990)；Fromm等，Biotechnology8：833(1990))。

可以将含有基因组的或合成的片段的表达载体引入原生质体或引入完整的组织或分离的细胞中。优选地，将表达载体引入完整组织中。培养植物组织的一般方法可以参见例如Maki等，“将外源DNA引入植物中的方法”，《(Methods in Plant Moleuclar BiologyBiotechnology》，Glich等(编)，pp.67-88 CRC Press(1993)；和Phillips等，“细胞-组织培养和体外操作”，《(Corn & CornImprovement》，第3版10，Sprague等(编)pp345-387，AmericanSociety of Agronomy Inc.(1988)。

在一个实施方案中，可以使用直接基因转移方法，例如微粒(microprojectile)介导的递送、DNA注射、电穿孔等，将表达载体引入玉米或其它植物组织中。利用生物轰击(biolistic)装置使用微粒介导的递送，可以将表达载体引入植物组织中。见例如，Tomes等″通过微粒轰击直接将DNA直接转移至完整植物细胞中″，Gamborg andPhillips (Eds.)《(Plant Cell，Tissue and Organ Culture：Fundamental Methods》，Springer Verlag，Berlin(1995)。然而，本发明考虑根据已知转化方法利用嗜高热加工酶转化植物。也参见，Weissinger等，Annual Rev.Genet.，22：421(1988)；Sanford等，Particulate Science and Technology.5：27(1987)(洋葱)；Christou等，Plant Physiol.，87：671(1988)(大豆)；McCabe等，Bio/Technology，6：923(1988)(大豆)；Datta等，Bio/Technology，8：736(1990)(稻)；Klein等，Proc.Natl.Acad.Sci.USA，85：4305(1988)(玉米)；Klein等，Bio/Technology，6：559(1988)(玉米)；Klein等，Plant Physiol.，91：440(1988)(玉米)；Fromm等，Bio/Technology，8：833(1990)(玉米)；和Gordon-Kamm等，Plant Cell，2，603(1990)(玉米)；Svab等，Proc.Natl.Acad.Sci.USA，87：8526(1990)(烟草叶绿体)；Koziel等，Biotechnology，11：194(1993)(玉米)；Shimamoto等，Nature，338：274(1989)(稻)；Christou等，Biotechnology，9：957(1991)(稻)；欧洲专利申请EP 0332581(鸭茅(orchardgrass)和其它早熟禾亚科(Pooideae))；Vasil等，Biotechnology，11：1553(1993)(小麦)；Weeks等，Plant Physiol.，102：1077(1993)(小麦)。Methods inMolecular Biology，82.Arabidopsis Protocols，编者Martinez-Zapater和Salinas，1998Humana Press(拟南芥属植物)。

可以用单种DNA分子或多种DNA分子(即，共转化)转化植物，这两种技术均适用于本发明的表达盒和构建体。可以获得多种转化载体用于植物转化，并且可以联合使用本发明表达盒以及任何此类载体。载体的选择取决于优选的转化技术和用于转化的靶物种。

最后，对于引入单子叶植物基因组而言，最期望的DNA区段可能是编码期望性状(例如，水解蛋白质、脂质或多糖)并在新的启动子或增强子等的控制下或者可能地甚至在同源的或组织特异性的(例如，根、珠托/叶鞘、轮(whorl)、茎、穗秆(earshank)、籽粒或叶特异的)启动子或控制元件的控制下的同源基因或基因家族。事实上，可以想到本发明的一个特定用途是基因以组成型方式或以诱导型方式的定向。

适宜的转化载体的例子

可用于植物转化的许多转化载体是植物转化领域的普通技术人员所已知的，与本发明相关的基因可以和本领域已知的任何此类载体联用。载体的选择取决于优选的转化技术和转化的靶物种。

a.适用于农杆菌转化的载体

可获得许多载体用于使用根癌农杆菌的转化。这些载体典型地带有至少一个T-DNA边界序列，并包括载体例如pBIN19(Bevan，Nucl.Acids，Res.(1984))。以下描述适用于农杆菌转化的两个典型载体的构建。

pCIB200和pCIB2001

二元载体pcIB200和pCIB2001被用于构建与农杆菌联用的重组载体，这二个载体按以下方式构建。通过NarI消化pTJS75(Schmidhauser & Helinski，J.Bacteriol.164：446(1985))，允许切除四环素抗性基因，之后插入带有NPTII的来自pUC4K的AccI片段(Messing & Vierra，Gene，19：259(1982)；Bevan等，Nature，304：184(1983)；McBride等，Plant Molecular Biology，14：266(1990))，构建pTJS75kan。将XhoI接头与含有T-DNA左右边界、植物选择性nos/nptII嵌合基因和pUC多接头的、PCIB7的EcoRV片段(Rothstein等，Gene，53：153(1987))连接，将XhoI消化的片段克隆至SalI消化的pTJSkan中以构建pCIB200(也参见EP 0332104，实施例19)。pCIB200含有以下单一多接头限制性位点：EcoRI，SstI，KpnI，BglII，XbaI和SalI。pCIB2001是pCIB200的衍生物，其通过在多接头中插入额外的限制性位点而构建。pCIB2001多接头中的单一限制性位点是EcoRI，SstI，KpnI，BglII，XbaI，SalI，MluI，BclI，AvrII，ApaI，HpaI和StuI。Pcib2001除了含有这些单一限制性位点外，还具有植物和细菌卡那霉素选择、用于农杆菌介导的转化的T-DNA左右边界、用于在大肠杆菌(E.coli)和其它宿主之间移动的RK2衍生的trfA功能、以及也来自RK2的OriT和OriV功能。pCIB2001多接头适用于克隆含有自己的调节信号的植物表达盒。

pCIB10及其潮霉素选择衍生物

二元载体pCIB10含有编码用于植物中选择的卡那霉素抗性的基因和T-DNA左右边界序列，并整合了来自宽宿主范围的质粒pRK252的序列，从而使得其在大肠杆菌和农杆菌中均能够复制。该载体的构建已由Rothstein等(Gene，53：153(1987))描述。可以构建掺入Gritz等(Gene25：179(1983))描述的潮霉素B磷酸转移酶基因的各种pCIB10衍生物。这些衍生物使得可以仅仅在潮霉素上(pCIB743)或者在潮霉素和卡那霉素上(pCIB715，pCIB717)选择转基因植物细胞。

b.适用于非农杆菌转化的载体

在不使用根癌农杆菌的情况下进行的转化规避了所选转化载体对T-DNA序列的需要，因此，除了诸如以上含有T-DNA序列的载体外，也可以使用缺少这些序列的载体。不依赖于农杆菌的转化技术包括通过微粒轰击进行的转化、原生质体摄取(例如PEG和电穿孔)和显微注射。载体的选择很大程度上取决于对所转化的物种的优选选择。本文也描述了适用于非农杆菌转化的典型载体的构建的非限制性实例。

pCIB3064

pCIB3064是pUC衍生载体，其适用于直接基因转移技术和通过除草剂basta(或膦丝菌素)进行的选择。质粒pCIB246含有与大肠杆菌GUS基因以及CaMV 35S转录终止子操作性融合的CaMV 35S启动子，该质粒描述在PCT公布的申请WO93/07278中。该载体的35S启动子在起始位点5’含有两个ATG序列。这些位点使用标准PCR技术进行突变以除去ATG并产生限制性位点SspI和PvuII。这些新的限制性位点距离单一SalI位点96和37bp，并距离实际起始位点101和42bp。得到的该pCIB246衍生物命名为pCIB3025。然后通过用SalI和SacI消化，从pCIB3025中切除GUS基因，之后末端平端化并重新连接以产生质粒pCIB3060。质粒pJIT82可以从John Innes Centre，Norwich获得，切下含有来自产绿色链霉菌(Streptomyces viridochromogenes)的bar基因的400bp SmaI片段，并将其插入pCIB3060的HpaI位点(Thompson等，EMBO J.，6：2519(1987))。这产生pCIB3064，该质粒含有在CaMV 35S启动子和终止子控制下的bar基因用于除草剂选择、并含有氨苄青霉素抗性基因(用于在大肠杆菌中的选择)和具有单一位点SphI、PstI、HindIII和BamHI的多接头。该载体适用于克隆本身含有自己的调节信号的植物表达盒。

pSOG19和pSOG35：

质粒pSOG35是利用大肠杆菌基因二氢叶酸还原酶(DHFR)作为选择标记从而赋予对氨甲蝶呤的抗性的转化载体。使用PCR从pSOG10扩增35S启动子(-800bp)、来自玉米AdhI基因的内含子6(-550bp)和GUS非翻译前导序列的18bp。也通过PCR扩增编码大肠杆菌二氢叶酸还原酶II型基因的250bp片段，这两个PCR片段与来自pB1221(Clontech)(含有pUC19载体主链和胭脂碱合酶终止子)的SacI-PstI片段组装。这些片段的组装产生含有与内含子6、GUS前导序列、DHFR基因及胭脂碱合酶终止子融合的35S启动子的pSOG19。用来自玉米萎黄斑点病毒(Maize ch1orotic mottle virus，MCMV)的前导序列置换pSOG19中的GUS前导序列，产生载体pSOG35。pSOG19和pSOG35带有pUC的氨苄青霉素抗性基因，并具有可用于克隆外来物质的HindIII、SphI、PstI和EcoRI位点。

c.适用于叶绿体转化的载体

为了在植物质体中表达本发明核苷酸序列，可以使用质体转化载体pPH143(WO97/32011，实施例36)。将核苷酸序列插入pPH143中，由此置换PROTOX编码序列。然后可以将该载体用于质体转化和选择壮观霉素抗性转化体。或者，将核苷酸序列插入pPH143中以置换addH基因。在此情况下，选择对PROTOX抑制剂具有抗性的转化体。

用于转化方法的植物宿主

任何能够随后克隆繁殖(无论是通过器官发生还是通过胚胎发生)的植物组织，均可以用本发明构建体转化。术语器官发生是指从分生组织中心相继地发育出芽和根的过程，而术语胚胎发生是指芽和根以协同方式(不是相继地)一起发育(无论是从体细胞还是从配子)的过程。所选择的特定组织将随着对于所转化的该特定物种而言可获得的且是最适宜的克隆繁殖系统的不同而变化。示例性的组织靶标包括分化的和未分化的组织或植物，包括但不限于叶盘、根、茎、芽、叶、花粉、种子、胚胎、子叶、下胚轴、雌配子体、愈伤组织、现有的分生组织(例如，顶端分生组织、腋芽和根分生组织)、和诱导的分生组织(例如，子叶分生组织和下胚轴分生组织)、肿瘤组织、以及各种形式的细胞和培养物例如单细胞、原生质体、胚和愈伤组织。所述植物组织可以在植物中或在器官、组织或细胞培养物中。

本发明植物可以采取多种形式。该植物可以是转化的细胞和未转化的细胞的嵌合体；该植物可以是克隆的转化体(例如，所有细胞均被转化而含有表达盒)；该植物可以包括转化的和未转化的组织的嫁接体(例如，柑橘类的植物物种中嫁接至未转化的接穗上的转化的根状茎)。转化的植物可以通过各种方式繁殖，例如通过克隆繁殖或经典的育种技术繁殖。例如，第一代(或T1)转化植物可以自交以产生纯合的第二代(或T2)转化植物，T2植物可以进一步通过经典育种技术繁殖。可以将显性选择标记(例如nptII)与表达盒相关联以辅助育种的进行。

本发明可以用于转化任何植物物种，包括单子叶植物或双子叶植物，包括，但不限于，玉米(玉蜀黍(Zea mays))、芸苔属物种(Brassicasp.)(例如，欧洲油菜(B.napus)、芜菁(B.rapa)、芥菜(B.junncea))，尤其是可用作种子油来源的那些芸苔属物种、紫苜蓿(Medicagosativa)、稻(Oryza sativa)、黑麦(Secale cereale)、高粱(Sorghumbicolor，Sorghum vulgare)、黍稷(如珍珠稷(Pennisetum glaucum)、黍糜(Panicum miliaceum)、小米(Setaria italica)、穇(Eleusinecoracana))、向日葵(Hilianthus annuus)、红花(Carthamustinctorius)、小麦(Triticum aestiyum)、大豆(Glycine max)、烟草(Nicotiana tabacum)、马铃薯(Solanum tuberosum)、落花生(Arachis hypogaea)、棉(海岛棉(Gossypium barbadense)、陆地棉(Gossypium hirsutum))、甘薯(Ipomoea batatus)、木薯(Manihotesculenta)、咖啡(Cofea spp.)、椰子(Cocos nucifera)、凤梨(Ananascomosus)、柑橘树(Citrus spp.)、可可(Theobroma cacao)、茶(Camellia sinensis)、芭蕉(Musa spp.)、鳄梨(Persea americana)、无花果(Ficus casica)、番石榴(Psidium guajava)、芒果(Mangiferaindica)、油橄榄(Olea europaea)、番木瓜(Carica papaya)、腰果(Anacardium occidentale)、澳洲坚果(Macadamia integrifolia)、扁桃(Prunus amygdalus)、甜菜(Beta vulgaris)、甘蔗(Saccharumspp.)、燕麦、大麦、蔬菜、观赏植物、木本植物如针叶树和落叶树、南瓜(squash)、南瓜(pumpkin)、大麻、绿皮西葫芦(zucchini)、苹果、梨、温柏、香瓜、李、樱桃、桃、油桃、杏、草莓、葡萄、覆盆子、黑莓、大豆、高梁、甘蔗、菜籽油菜、苜蓿、胡萝卜和拟南芥(Arabidopsis thaliana)。

蔬菜包括番茄(Lycopersicon esculentum)、莴苣(例如，Lactucasativa)、菜豆(Phaseolus vulgaris)、利马豆(phaseolus limensis)、豌豆(山黧豆属(Lathyrus spp.))、花椰菜、花茎甘蓝(broccoll)、芜箐、萝卜、菠菜、芦笋、洋葱、大蒜、辣椒、芹菜、和香瓜属(Cucumis)成员，例如黄瓜(C.sativus)、罗马甜瓜(C.cantalupensis)和香瓜(C.melo)。观赏植物包括杜鹃(Rhododendron spp.)、绣球(Hydrangeamacrophylla)、木槿(朱槿(hibiscus rosasanensis))、蔷薇属物种(Rosa spp.)、郁金香(Tulipa spp.)、水仙(Narcissu sspp.)、碧冬茄(Petunia hybrida)、香石竹(Dianthus caryophyllus)、一品红(Euphorbia pulcherrima)和菊。可以用于实施本发明的针叶树包括例如，松如火炬松(Pinustaeda)、湿地松(Pinus elliotii)、西黄松(Pinus ponderosa)、扭叶松(Pinus contorta)、以及辐射松(Pinusradiate)、花旗松(Pseudostuga menziesii)；Western hemlock(加拿大铁杉(Tsuga Canadensis))；白云杉(Picea glauca)；北美红杉(Sequoia sempervirens)、冷杉(true firs)如温哥华冷杉(Abiesamabilis)和香脂冷杉(Abies balsamea)；以及柏如北美乔柏(Thujaplicata)和阿拉斯加花柏(Chamaecyparis nootkatensis)。豆类包括蚕豆和豌豆。蚕豆包括瓜尔豆、角豆、胡芦巴、大豆、四季豆、豇豆、绿豆、利马豆、蚕豆、兵豆、鹰嘴豆等。豆科植物包括但不限于，落花生属(Arachis)，如落花生，野豌豆属(Vicia)，如广布野豌豆(crownvetch)、毛苕子、赤豆、绿豆和鹰嘴豆，羽扇豆属(Lupinus)，如羽扇豆、三叶草，菜豆属(Phaseolus)，如云扁豆(common bean)和利马豆，豌豆属(Pisum)，如field bean，草木樨属(Melilotus)，如cloVer，苜蓿属(Medicago)，例如紫苜蓿，百脉根属(Lotus)，如车轴草，兵豆属(Lens)，如兵豆，以及紫穗槐。对于在本发明方法中的应用，优选的饲料草和草坪草包括紫苜蓿、鸭茅、高羊茅、多年生黑麦草、匍匐翦股颖(creeping bent grass)和红顶草(redtop)。

优选地，本发明植物包括作物植物，例如玉米、紫苜蓿、向日葵、芸苔属植物、大豆、棉、红花、落花生、高梁、小麦、稷、烟草、大麦、稻、番茄、马铃薯、南瓜、香瓜、豆科作物等。其它优选植物包括百合纲(Liliopsida)和黍亚科(Panicoideae)。

一旦期望的DNA序列被转化入特定植物物种中后，其可以在该物种中繁殖或者通过传统的育种技术移动至同一物种的其它品种(尤其包括商业品种)中。

以下描述用于转化双子叶植物和单子叶植物的代表性技术以及代表性的质体转化技术。

a.双子叶植物的转化

用于双子叶植物的转化技术是本领域熟知的，包括基于农杆菌的技术和不需要农杆菌的技术。非农杆菌技术涉及原生质体或细胞对外源遗传物质的直接摄取。这可以通过PEG或电穿孔介导的摄取、微粒轰击介导的递送、或显微注射来实现。这些技术的例子描述在Paszkowski等，EMBO J.3：2717(1984)，Potrykus等，Mol.Gen.Genet.199：169(1985)，Reich等，Biotechnology，4：1001(1986)，和Klein等，Nature，327：70(1987)。在每一种情况下，转化的植物都可以使用本领域已知的标准技术再生为整株植物。

农杆菌介导的转化，由于其高的转化效率和其在许多不同物种中的宽范围应用，而是转化双子叶植物的优选技术。农杆菌转化典型地涉及将带有外来目的DNA的二元载体(例如pCIB200或pCIB2001)转移至适宜的农杆菌菌株中，所述菌株可能取决于宿主农杆菌菌株在共定居的Ti质粒上或在染色体上带有的vir基因的互补性(例如，菌株CIB542用于pCIB200和pCIB2001(Uknes等，Plant Cell，5：159(1993))。重组二元载体向农杆菌的转移可以通过三亲本杂交方法，使用带有重组二元载体的大肠杆菌、带有质粒如pRK2013并能够使重组二元载体移动至靶农杆菌菌株中的辅助大肠杆菌菌株来实现。或者，可以通过DNA转化，将重组二元载体转移至农杆菌中(Hofgen &Willmitzer，Nucl.Acids Res.16：9877(1988))。

重组农杆菌对靶植物的转化通常涉及农杆菌与来自植物的外植体的共培养，并遵循本领域熟知的方案进行。在选择培养基上再生带有二元质粒T-DNA边界之间存在的抗生素或除草剂抗性标记的转化组织。

可以按照已知的方式将载体引入植物细胞。优选用于转化的细胞包括农杆菌(Agrobacterium)、单子叶植物细胞和双子叶植物细胞，包括百合纲(Liliopsida)细胞和黍亚科(Panicoideae)细胞。优选的单子叶植物细胞是谷物细胞，例如玉米(corn，maize)、大麦和小麦，以及淀粉积累性双子叶植物细胞，例如马铃薯。

用基因转化植物细胞的另一方法涉及将惰性或生物活性粒子推进植物组织或细胞。该技术公开在美国专利号4,945,050、5,036,006和5,100,792中。一般地，该方法包括将惰性或生物活性粒子在可以有效地穿透细胞外表面和在其内部实现整合的条件下推进细胞。当利用惰性粒子时，可以通过用含有期望基因的载体包被粒子而将载体引入细胞中。或者，靶细胞可以被载体围绕，以便载体随着粒子而被带入细胞中。也可以将生物活性粒子(例如，干的酵母细胞、干的细菌或噬菌体，每种均含有待引入的DNA)推进植物细胞组织。

b.单子叶植物的转化

大多数单子叶植物物种的转化目前也已经成为常规技术。优选的技术包括使用聚乙二醇(PEG)或电穿孔技术直接将基因转移至原生质体中，以及使用微粒轰击将基因直接转移至愈伤组织中。可以采用一种DNA或多种DNA(即，共转化)进行转化，并且这两种技术都适用于本发明。共转化可以具有如下优点：避免完全载体构建，并产生目的基因和选择标记位于不连锁基因座的转基因植物，这使得，如果期望的话，可以在后续世代中除去选择标记。然而，使用共转化的缺点在于这些分开的DNA种类整合在基因组中的频率将不足100％(Schocher等，Biotechnology，4：1093(1986))。

专利申请EP 0292435、EP 0392225和WO 93/07278描述从玉米原种近交系制备愈伤组织和原生质体、使用PEG或电穿孔转化原生质体、和从转化的原生质体再生玉米植物的技术。Gordon-Kamm等(Plant Cell，2：603(1990)和Fromm等(Biotechnology，8：833(1990))公布了使用微粒轰击转化A188衍生玉米品系的技术。而且，WO 93/07278和Koziel等(Biotechnology，11：194(1993))描述了通过微粒轰击转化玉米的原种近交系的技术。该技术利用从授粉后14-15天的玉米穗上切下的长1.5-2.5mm的未成熟玉米胚和PDS-1000He生物轰击装置用于轰击。

稻的转化也可以采用原生质体或微粒轰击，通过直接基因转移技术而实现。原生质体介导的转化已经针对Japonica型和Indica型进行过描述(Zhang等，Plant Cell Rep，7：379(1988)；Shimamoto等，Nature，338：274(1989)；Datta等，Biotechnology，8：736(1990))。两种类型也可以使用微粒轰击进行常规转化(Christou等，Biotechnology，9：957(1991))。而且，WO 93/21335还描述了通过电穿孔转化稻的技术。专利申请EP 0332581描述了产生、转化和再生早熟禾亚科(Pooideae)原生质体的技术。这些技术允许转化鸭茅属(Dactylis)和小麦。而且，Vasil等(Biotechnology，10：667(1992))描述了使用微粒轰击C型长期可再生愈伤组织的细胞进行的小麦转化，Vasil等(Biotechnology，11：1553(1993))和Weeks等(PlantPhysiol.102：1077(1993))也描述了使用微粒轰击未成熟胚和未成熟胚来源的愈伤组织进行的小麦转化。然而，转化小麦的优选技术涉及通过微粒轰击未成熟胚进行的小麦转化，并包括在基因递送之前的高蔗糖或高麦芽糖步骤。在轰击之前，将任何数量的胚胎(长0.76-1mm)接种在具有3％蔗糖(Murashiga & Skoog，Physiologia Plantarum，15：473(1962))和3mg/l2，4-D的MS培养基上以诱导体细胞胚，这被允许在暗处进行。在选定的轰击日，将胚胎从诱导培养基中移出并放置在渗压剂(即，添加有期望浓度(典型地15％)的蔗糖或麦芽糖的诱导培养基)上。允许胚胎质壁分离2-3小时，然后轰击。每个靶板典型地20个胚胎，但这不是关键的。使用标准方法，将适宜的带有基因的质粒(例如pCIB3064或pSG35)沉淀在微米大小的金粒上。每个板的胚胎使用标准80目的筛子、利用DuPont Biolistics_氦装置以及大约1000psi的爆裂压力(burst pressure)进行射击。轰击后，将胚胎放回暗处，恢复大约24小时(仍然在渗压剂上)。24小时后，将胚胎从渗压剂上移走并放回诱导培养基上，胚胎在再生以前在诱导培养基上停留大约1个月。大约1个月后，将具有正在发育的胚发生愈伤组织的胚胎外植体转移至再生培养基上，该再生培养基(MS+1mg/升NAA，5mg/升GA)还含有适宜的选择剂(在pCIB3064的情况下为10mg/l0basta，在pSOG35的情况下为2mg/l氨甲蝶呤)。

大约1个月后，将发育的芽转移至含有一半浓度的MS、2％蔗糖和相同浓度的选择剂的更大无菌容器(称作“GA7s”)中。

使用农杆菌转化单子叶植物也已有描述。见WO 94/00977和美国专利号5,591,616，两份文献均并入此处作为参考。

c.质体的转化

按每板7个，以1’’圆形排列方式，在T琼脂培养基上萌芽烟草栽培品种(Nicotiana tabacumc.v.)‘Xanthi nc’的种子，并基本上按所述的(Svab和Maliga，PNAS，90：913(1993))，在撒播包被有来自质粒pPH143和pPH145的DNA的1μm钨粒(M10，Biorad，Hercules，CA)后12-14天，进行轰击。经过轰击的幼苗在T培养基上温育2天，之后切下叶，并以背轴侧朝上放置在亮光(350-500μmol光子/m²/s)中于含有500μg/ml壮观霉素二盐酸盐(Sigma，St.Louis，MO)的RMOP培养基(Svab，Hajdukiewicz和Maliga，PNAS，87：8526(1990))板上。将轰击后3至8周出现在变白的叶下面的抗性芽亚克隆至相同选择培养基上，允许形成愈伤组织，并分离和亚克隆次生芽。通过标准Southern印迹(Sambrook等，Molecular Cloning：ALaboratory Manual，Cold Spring Harbor Laboratory，Cold SpringHarbor(1989))，评价独立的亚克隆中转化的质体基因组拷贝的完全分离(同质性(homoplasmicity))。在1％Tris-硼酸(TBE)琼脂糖凝胶上分离BamHI/EcoRI消化的总细胞DNA(Mettler，J.J.Plant Mol.Biol.Reporter，5：346(1987))，转移至尼龙膜(Amersham)，并用³²P标记的、随机引物引发的DNA序列(相应于来自pC8的、含有rps7/12质体引导序列的一部分的、0.7kb BamHI/HindIII DNA片段)探测。在无菌条件下在含有壮观霉素的MS/IBA培养基(McBride等，PNAS，91：7301(1994))上让同质的芽生根，并转移至温室。

产生和表征稳定转化的植物

然后，将转化的植物细胞放置在适宜的选择培养基中以选择转基因细胞，然后允许转基因细胞生长成愈伤组织。从愈伤组织生芽并通过在生根培养基中培养从该芽产生小植株。正常地，各种构建体都与植物细胞中的选择标记连接。有利地，该标记可以是对杀生物剂(尤其是抗生素，如卡那霉素、G418、博来霉素、潮霉素、氯霉素，或除草剂等)的抗性。所使用的特定标记将允许相对于缺乏引入的DNA的细胞选择转化的细胞。DNA构建体的成分，包括本发明的转录/表达盒，可以从对于宿主而言天然的(内源)或外来的(外源)序列制备。“外来的”指该序列不存在于该结构待引入的野生型宿主中。异源构建体将包含至少一个对于转录-起始区所来源的基因而言非天然的区域。

为了验证转基因在转基因细胞和植物中的存在，可以使用本领域已知的方法，实施Southern印迹分析。通过Southern印迹可以对核苷酸区段在基因组中的整合进行检测和定量，这是因为通过使用适宜的限制性酶可以容易地将它们与含有该区段的构建体区分开来。取决于转基因的表达产物的性质，该产物可以以各种方式检测，包括Western印迹和酶分析试验。一种尤其有用的在不同植物组织中定量蛋白质表达和检测复制的方式是，使用报道基因，例如GUS。一旦获得转基因植物，可以培育该转基因植物以产生具有期望表型的植物组织或部分。可以收获该植物组织或植物部分，和/或收集种子。种子可以充当培育其它具有带期望特征的组织或部分的植物的来源。

本发明因此提供包含本发明至少一种多核苷酸、表达盒或载体的、转化的植物或植物部分，例如穗、种子、果实、谷粒、秸秆、谷壳、或蔗渣，制备该植物的方法和使用该植物或其部分的方法。该转化的植物或植物部分表达加工酶，任选地，该加工酶定位在某个组织的特定细胞区室或亚细胞区室或者定位在正在发育的谷粒中。例如，本发明提供在植物细胞中包含有至少一种淀粉加工酶的转化的植物部分，其中该植物部分从基因组中增加了编码该至少一种淀粉加工酶的表达盒的转化植物获得。该加工酶，除非被诸如加热、研磨或其它方法(这允许酶在使酶具有活性的条件下与底物接触)激活，否则不对靶底物产生作用。

示例性的本发明方法

本发明的自加工植物和植物部分可以用于其中使用所表达和活化的加工酶(嗜温型的、嗜热型的、嗜高热型的)的各种方法中。根据本发明，将从基因组中增加了至少一种加工酶的转基因植物获得的转基因植物部分，放置在使该加工酶表达和活化的条件下。一旦活化后，该加工酶被激活并对其正常所作用的底物发挥作用以获得期望结果。例如，淀粉加工酶在激活后将作用于淀粉进行降解、水解、异构化或其它方式的修饰，以获得期望的结果。非淀粉加工酶可以用于破坏植物细胞膜以便利于从植物中提取淀粉、脂质、氨基酸或其它产物。而且，非嗜高热型的和嗜高热型的酶都可以与本发明的自加工植物或植物部分联用。例如，可以激活嗜温型非淀粉降解酶来破坏植物细胞膜以便实施淀粉提取，随后，可以在该自加工植物中激活嗜高热型的淀粉降解酶来降解淀粉。

在谷粒中表达的酶可以通过将含有所述酶的植物或植物部分放置在促进酶活性的条件中而激活。例如，可以使用一种或多种以下技术：植物部分可以与为水解酶提供底物由此激活该酶的水接触。植物部分可以与允许酶从其在植物部分发育过程中沉积的区室中迁移出来并由此与其底物结合的水接触。由于在谷粒的成熟、干燥和再水合过程中区室化作用被打破，故酶可以移动。完整的或破裂的谷粒可以与允许酶从其在植物部分发育过程中沉积的区室迁移出来并由此与其底物结合的水接触。酶也可以通过添加激活化合物而活化。例如，钙依赖性酶可以通过添加钙而活化。其它激活化合物可以由本领域技术人员确定。酶可以通过灭活剂的除去而激活。例如，存在淀粉酶的已知肽抑制剂，该淀粉酶可以和淀粉酶抑制剂共表达，然后通过添加蛋白酶而激活。酶可以通过将pH改变至酶具有最大活性时的pH而激活。酶也可以通过增加温度而激活。一般，在不超过酶的最大温度时，酶的活性将增加。对于嗜温型酶，其活性将从室温活性水平上升，直到达到导致其活性丧失的温度(典型地小于或等于70℃)为止。相似地，嗜热型和嗜高热型酶也可以通过增加温度而激活。嗜热型酶可以通过将温度加热至不超过活性或稳定性的最大温度而激活。对于嗜热型酶，稳定性和活性的最大温度一般在70至85℃之间。嗜高热酶，由于具有从25℃至不超过85℃至95℃或甚至100℃的更大潜在温度变化，故将比嗜温型和嗜热型酶具有甚至更高的相对活性。可以通过任何方法，例如，通过加热，如烘焙、煮沸、加热、蒸、放电或其任何组合，升高温度。而且，在表达嗜温型或嗜热型酶的植物中，可以通过研磨由此允许酶与底物接触，而活化酶。

最适条件，例如温度、水合作用、pH等，可以由本领域技术人员确定，并且可能取决于所使用的各酶以及该酶的期望应用。

本发明还提供可以在特定方法中起辅助作用的外源酶的应用。例如，可以将本发明的自加工植物或植物部分与外源提供的酶联用以促进该反应。例如，可以联合使用转基因α-淀粉酶玉米和其它淀粉加工酶，例如支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶、甘露聚糖酶、半纤维素酶等，以水解淀粉或产生乙醇。事实上，已经发现，转基因α-淀粉酶玉米与此类酶的联合意想不到地提供了比转基因α-淀粉酶玉米单独使用时好的淀粉转化程度。

本文提供在此考虑的适宜方法的实例。

a.从植物提取淀粉

本发明提供利于从植物中提取淀粉的方法。具体地，将至少一种编码破坏胚乳的物理限制性基质(细胞壁、非淀粉多糖和蛋白质基质)的加工酶的多核苷酸引入植物，使该酶优选地在植物中处于紧靠淀粉粒的物理位置。在本发明的此实施方案中，转化的植物表达一种或多种蛋白酶、葡聚糖酶、木聚糖酶、硫氧还蛋白/硫氧还蛋白还原酶、纤维素酶、植酸酶、脂肪酶、β葡糖苷酶、酯酶等，但不表达具有任何淀粉降解活性的酶，由此保持淀粉粒的完整性。因此，这些酶在植物部分例如谷粒中的表达将改善谷粒的加工特征。加工酶可以是嗜温型的、嗜热型的或嗜高热型的。一个实例中，热干燥来自本发明转化植物的谷粒，从而可能地失活非嗜高热型的加工酶并改善种子的完整性。在低温或高温(在此时间是决定性的)，在高或低湿度含量或条件(见Primary Cereal Processing，Gordon和Willm，编，pp.319-337(1994)，其公开并入此处)下，在有或无二氧化硫的情况下，浸渍谷粒(破裂的谷粒)。一旦达到升高的温度时，任选地在一定的湿度条件下，胚乳基质的完整性将由于酶，例如蛋白酶、木聚糖酶、植酸酶或葡聚糖酶的活化而遭到破坏，其中所述酶降解胚乳中存在的蛋白质和非淀粉多糖而保留其中的淀粉粒的完整性，并且可以更容易地从所得物中回收。而且，流出物中的蛋白质和非淀粉多糖至少被部分地降解和高度浓缩，由此可以用于改良的动物饲料、食物，或用作发酵微生物的培养基成分。该流出物被认为是具有改良组成的玉米浆。

因此，本发明提供制备淀粉粒的方法。该方法包括将包含至少一种非淀粉加工酶的谷粒，例如破裂的谷粒，在激活所述至少一种酶的条件下进行处理，产生含有淀粉粒和非淀粉降解产物，例如消化的胚乳基质产物的混合物。非淀粉加工酶可以是嗜温型的、嗜热型的或嗜高热型的。在酶活化后，从混合物中分离淀粉粒。所述谷粒从基因组中包含(增加了)编码所述至少一种加工酶的表达盒的转化植物获得。例如，加工酶可以是蛋白酶、葡聚糖酶、木聚糖酶、植酸酶、硫氧还蛋白、硫氧还蛋白还原酶、酯酶、纤维素酶、脂肪酶或β葡糖苷酶。加工酶可以是嗜高热型的。谷粒可以在低或高湿度条件下，在有或无二氧化硫的情况下处理。根据加工酶在来自转基因植物的谷粒中的活性和表达水平，转基因谷粒可以在加工之前或期间与商品谷粒混合。本发明还提供通过该方法获得的产物，例如淀粉、非淀粉产物和包含至少一种额外成分的改良的浸渍水(steepwater)。

b.淀粉加工方法

本发明的转化植物或植物部分可以包含本文公开的、将淀粉粒降解为糊精、其它改性淀粉或己糖(例如α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡糖淀粉酶、淀粉型支链淀粉酶)或将葡萄糖转化成果糖(例如葡萄糖异构酶)的淀粉降解酶。优选地，淀粉降解酶选自： α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、新支链淀粉酶、淀粉型支链淀粉酶、葡萄糖异构酶，并且可以使用其组合转化谷粒。而且，优选地，酶与启动子和将酶引导至淀粉粒、造粉体、质外体、或内质网的信号序列可操作地连接。最优选地，酶在胚乳中表达，尤其是在玉米胚乳中表达，并定位在一个或多个细胞区室，或者淀粉粒本身中。优选的植物部分是谷粒。优选的植物部分来自玉米、小麦、大麦、黑麦、燕麦、甘蔗或稻。

根据本发明的一种淀粉降解方法，转化的谷粒在淀粉粒中积累淀粉降解酶，在50℃至60℃的常规温度下浸渍，并按本领域已知的方式进行湿磨。优选地，淀粉降解酶是嗜高热型的。由于酶朝着淀粉粒的亚细胞定向，或者由于酶和淀粉粒的结合，通过在常温下湿磨工艺过程中酶和淀粉粒的接触，加工酶与淀粉粒被共纯化，从而获得淀粉粒/酶混合物。在回收淀粉粒/酶混合物后，然后可以通过提供对于酶活性有利的条件，激活该酶。例如，可以在各种湿度和/或温度条件下实施该加工，以利于淀粉部分地(为了制备衍生化的淀粉或糊精)或完全地水解为己糖。以此方式可以获得含有高的右旋糖或果糖当量的糖浆。该方法有效地降低了将淀粉转化成相应己糖的时间、能量和酶的消耗以及效率，并且产物，如高糖(sugar)浸渍水和更高右旋糖当量的糖浆，的生产效率增加。

在另一实施方案中，处理表达该酶的植物、或植物产物如果实或谷粒，或从谷粒制备的面粉，以激活酶并将植物中表达的和包含的多糖转化成糖(sugar)。优选地，酶与将酶引导至淀粉粒、造粉体、质外体或内质网的信号序列(见本文公开)融合。然后，可以从植物或植物产物中分离或回收所产生的糖(sugar)。另一实施方案中，根据本领域已知的和本文公开的方法，能够将多糖转化成糖(sugar)的加工酶被放置在诱导型启动子的控制下。加工酶可以是嗜温型的、嗜热型的、或嗜高热型的。让植物生长至期望阶段，诱导启动子从而造成酶的表达和植物或植物产物中的多糖向糖(sugar)的转化。优选地，酶与将酶引导至淀粉粒、造粉体、质外体或内质网的信号序列可操作地连接。另一实施方案中，产生表达能够将淀粉转化成糖(sugar)的加工酶的转化植物。该酶与将酶引导至植物中的淀粉粒的信号序列融合。然后从含有自该转化的植物表达的酶的转化植物中分离淀粉。然后，可以激活包含在分离的淀粉中的酶，以将淀粉转化成糖(sugar)。酶可以是嗜温型的、嗜热型的或嗜高热型的。在此提供能够将淀粉转化成糖(sugar)的嗜高热酶的例子。这些方法可以用于产生多糖并可以表达能够将多糖转化成糖(sugar)或淀粉水解产物如糊精、麦芽寡糖、葡萄糖和/或其混合物的酶的任何植物。

本发明提供从植物或植物产物产生糊精和改性(altered)淀粉的方法，其中所述植物已经转化了可以水解多糖的某些共价键从而形成多糖衍生物的加工酶。一个实施方案中，将表达该酶的植物或植物产物，例如果实或谷粒、或从谷粒制备的面粉，放置在足以激活该酶以及将植物中所含多糖转化成具有降低的分子量的多糖的条件下。优选地，酶与本文所公开的、将酶引导至淀粉粒、造粉体、质外体或内质网的信号序列融合。然后，可以从植物或植物产物中分离产生的糊精或淀粉衍生物。另一实施方案中，根据本领域已知的和本文公开的方法，将能够将多糖转化成糊精或改性淀粉的加工酶置于诱导型启动子的控制下。使植物生长至期望阶段，诱导启动子从而造成酶的表达和植物或植物产物中的多糖向糊精或改性淀粉的转化。优选地，酶是α-淀粉酶、支链淀粉酶、异或新支链淀粉酶，并且与将酶引导至淀粉粒、造粉体、质外体或内质网的信号序列可操作地连接。一个实施方案中，酶被引导至质外体或内质网(endoreticulum)。在再一实施方案中，制备表达能够将淀粉转化成糊精或改性淀粉的酶的转化植物。所述酶与将酶引导至植物中的淀粉粒的信号序列融合。然后从含有该转化植物所表达的酶的转化植物中分离淀粉。包含在分离的淀粉中的酶然后可以在足以导致激活作用以将淀粉转化成糊精或改性淀粉的条件下活化。在此提供例如能够将淀粉转化成淀粉水解产物的嗜高热酶的例子。这些方法可以用于产生多糖并可以表达能够将多糖转化成糖(sugar)的酶的任何植物。

另一实施方案中，来自积累淀粉降解酶的本发明转化植物的谷粒在利于淀粉降解酶活性的条件下浸渍不同时间，其中所述淀粉降解酶可以降解淀粉粒中的键从而形成糊精、改性淀粉或己糖(例如，α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡糖淀粉酶、淀粉型支链淀粉酶)。所得混合物可以含有高水平的淀粉衍生产物。该谷粒的应用：1)消除了碾磨谷粒或以其它方式加工谷粒以首先获得淀粉粒的需要，2)由于将酶直接置于谷粒的胚乳组织中，故使得淀粉更容易接近酶，和3)消除了对微生物生产的淀粉水解酶的需要。因此，通过在有水存在的情况下简单的加热谷粒，优选地玉米谷粒，以允许酶作用于淀粉，即可以去除己糖回收之前的整个湿磨过程。

该方法也可以用于乙醇、高果糖糖浆、含己糖(葡萄糖)的发酵培养基的生产、以及无需精炼谷粒成分的任何其它的淀粉用途。

本发明还提供制备糊精、麦芽寡糖、和/或糖(sugar)的方法，包括将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此消化淀粉粒以形成含有糖(sugar)的水溶液。所述植物部分从基因组中增加了编码所述至少一种加工酶的表达盒的转化植物获得。然后，收集含有糊精、麦芽寡糖和/或糖(sugar)的水溶液。一个实施方案中，加工酶是α-淀粉酶、α-葡糖苷酶、支链淀粉酶、葡糖淀粉酶、淀粉型支链淀粉酶、葡萄糖异构酶或其任何组合。优选地，酶是嗜高热型的。另一实施方案中，该方法还包括分离糊精、麦芽寡糖和/或糖(sugar)。

c.改良的玉米品种

本发明还提供改良的玉米品种(以及其它作物品种)的生产，其中所述品种具有正常水平的淀粉积累，并在其胚乳或淀粉积累器官中积累足够水平的淀粉水解酶，由此当激活其中所含的酶(例如在嗜高热酶的情况下，通过煮沸、加热植物或其部分来激活)时，酶被活化并促进淀粉快速地转化成简单的糖(simple sugar)。这些简单的糖(主要是葡萄糖)将向所处理的玉米提供甜味。所得玉米植物是可以作为谷粒生产杂种以及作为甜玉米进行双重应用的改良品种。因此，本发明提供产生超甜玉米的方法，包括处理转化的玉米或其部分，其中所述转化的玉米在基因组中增加了包含与编码至少一种淀粉水解酶的第一多核苷酸可操作连接的启动子的表达盒，并在胚乳中表达该表达盒，其中所述处理在激活所述至少一种酶从而将玉米中的多糖转化成糖(sugaf)的条件下进行，从而产生超甜玉米。所述启动子可以是组成型启动子、种子特异性启动子或胚乳特异性启动子，其与编码加工酶例如α-淀粉酶(如包含SEQ ID NO：13、14或16的α-淀粉酶)的多核苷酸序列连接。优选地，酶是嗜高热型的。一个实施方案中，表达盒还包含编码信号序列的第二多核苷酸，其中所述信号序列与第一多核苷酸编码的酶可操作地连接。在本发明此实施方案中，示例性信号序列指导酶到达质外体、内质网、淀粉粒或造粉体。培育玉米植物以便形成具有籽粒(kernel)的穗，然后，诱导启动子以造成酶表达并将植物中所含的多糖转化成糖(sugar)。

d.自发酵植物

在本发明另一实施方案中，对植物，如玉米、稻、小麦和甘蔗进行工程化改变以在它们的细胞壁中积累大量的加工酶，例如木聚糖酶、纤维素酶、半纤维素酶、葡聚糖酶、果胶酶、脂肪酶、酯酶、β-葡糖苷酶、植酸酶、蛋白酶等(非淀粉的多糖降解酶)。收获谷粒成分(或者在甘蔗的情况下糖(sugar))后，使用秸秆、谷壳或蔗渣作为酶(其中所述酶被引导在细胞壁中表达和积累)的来源以及作为生物质的来源。秸秆(或其它剩下的组织)可以用作工艺中的给料以回收可发酵糖。获得可发酵糖的工艺由激活所述非淀粉的多糖加工酶组成。例如，激活可以包括在有水存在下加热植物组织一段时间，所述时间足以导致非淀粉的多糖水解成所得糖(sugar)。因此，当该自加工秸秆作为给料成分时，其基本上以无边际成本的方式产生将多糖转化成单糖所需的酶。而且，该温度依赖性酶对植物的生长和发育无有害影响，并且细胞壁靶向，甚至是通过与蛋白质融合的纤维素/木糖结合域靶向多糖微丝，可以提高底物的酶可接近性。

因此，本发明也提供使用在植物细胞的细胞壁中包含至少一种非淀粉多糖加工酶的转化植物部分的方法。该方法包括处理包含至少一种非淀粉多糖加工酶的转化的植物部分，其中所述处理在激活所述至少一种酶的条件下进行，由此消化淀粉粒以形成含有糖(sugar)的水溶液，其中所述植物部分从基因组中增加了编码所述至少一种非淀粉多糖加工酶的表达盒的转化植物获得；和收集含有糖(sugar)的水溶液。本发明也包括转化的植物或植物部分，其中该植物或植物部分在其细胞或细胞壁中包含至少一种非淀粉多糖加工酶。植物部分从基因组中增加了编码所述至少一种非淀粉加工酶(例如木聚糖酶、纤维素酶、葡聚糖酶、果胶酶、脂肪酶、酯酶、β-葡糖苷酶、植酸酶、蛋白酶或其任何组合)的表达盒的转化植物获得。

e.蛋白质和糖(sugar)含量高的水相

在再一实施方案中，对蛋白酶和脂肪酶进行工程化改造以便其聚集在种子如大豆种子中。在激活(例如，通过加热)该蛋白酶或脂肪酶后，种子中的这些酶将在加工期间水解大豆中存在的脂肪和贮存蛋白。由此可以获得含有氨基酸的可溶性产物(该产物可以用作饲料、食物或发酵培养基)以及脂肪酸。多糖典型地存在于加工后的谷粒的不溶级分中。然而，通过在种子中组合进行多糖降解酶的表达和积累，蛋白质和多糖均可以被水解并存在于水相中。例如，可以以此方式使来自玉米的玉米醇溶蛋白和来自大豆的贮存蛋白和非淀粉多糖溶解。水相和疏水相的成分可以容易地通过用有机溶剂和超临界二氧化碳提取而分离。因此，提供制备含有较高水平的蛋白质、氨基酸、糖(sugar)或糖(saccharide)的谷粒水提取物。

f.自加工发酵

本发明提供生产乙醇、发酵饮料或其它发酵衍生产物的方法。该方法涉及获得其中表达将多糖转化成糖(sugar)的加工酶的植物、或植物产物或植物部分、或植物衍生物如谷粒面粉。处理该植物或其产物，使得如上述通过多糖转化产生糖(sugar)。然后，根据本领域已知的方法，发酵糖(sugar)和植物的其它成分以形成乙醇或发酵饮料、或其它发酵衍生产物。见例如美国专利号4,929,452。简单而言，在促进糖(sugar)转化成乙醇的条件下，将多糖转化产生的糖(sugar)与酵母一起孵育。适宜的酵母包括高醇(alcohol)耐受性和高糖(sugar)耐受性酵母菌株，例如，酿酒酵母(S.cerevisiae)ATCC No.20867。该菌株于1987年9月17日保藏在美国典型培养物保藏中心(Rockville，MD)，保藏号ATCC NO.20867。然后可以蒸馏该发酵产物或发酵饮料，以分离乙醇或蒸馏饮料，或者以其方式回收的发酵产物。在此方法中使用的植物可以是含有多糖并能够表达本发明酶的任何植物。本文中公开了许多此类植物。优选地，植物是商业栽培的植物。更优选地，植物是正常用于产生乙醇或发酵饮料或发酵产物的植物，例如小麦、大麦、玉米、黑麦、马铃薯、葡萄或稻。

该方法包括处理包含至少一种多糖加工酶的植物部分，其中所述处理在激活所述至少一种酶由此消化植物部分中的多糖以形成可发酵糖的条件下进行。多糖加工酶可以是嗜温型的、嗜热型的或嗜高热型的。该植物部分从基因组中增加了编码所述至少一种多糖加工酶的表达盒的转化植物获得。用于本发明此实施方案的植物部分包括但不限于，谷粒、果实、种子、茎秆、木材、蔬菜或根。植物包括但不限于燕麦、大麦、小麦、浆果、葡萄、黑麦、玉米、稻、马铃薯、甜菜、甘蔗、凤梨、草和树。该植物部分可以与商品谷粒或其它商业可获得的底物组合；用于加工的底物的来源可以是除自加工植物之外的来源。然后在促进可发酵糖转化成乙醇的条件下，例如与酵母和/或其它微生物一起，孵育可发酵糖。一个实施方案中，植物部分来源于α-淀粉酶转化的玉米，已经发现该玉米可以降低发酵的时间和成本量。

已经发现，当例如在发酵中使用根据本发明制备的表达热稳定α-淀粉酶的转基因玉米时，可以减少残余淀粉的量。这说明，在发酵过程中溶解了更多淀粉。残余淀粉量的减少导致具有按重量计更高的蛋白质含量和更高的价值的酒糟。而且，发酵本发明转基因玉米允许液化过程在较低pH(由此节省了用于调整pH的化学药品的花费)、较高温度，例如大于85℃，优选地大于90℃，更优选地95℃或更高温度(由此导致较短的液化时间和淀粉更完全的溶解)，以及减少的液化时间下进行，所有这些均导致有效的发酵反应以及更高的乙醇产量。

而且，已经发现，常规植物部分与甚至一小部分根据本发明的转基因植物接触都可以减少发酵时间和与此相关的费用。因此，本发明涉及减少植物的发酵时间，包括处理来自包含多糖加工酶的植物的转基因植物部分和不含该多糖加工酶的植物部分，其中所述多糖加工酶可以将多糖转化成糖(sugar)。

g.生淀粉加工酶和编码其的多核苷酸

将编码嗜温型加工酶的多核苷酸引入植物或植物部分。一个实施方案中，本发明多核苷酸是针对玉米优化的多核苷酸，例如SEQ ID NO：48、50和59中提供的多核苷酸，其编码葡糖淀粉酶，例如SEQ ID NO：47和49中提供的葡糖淀粉酶。另一实施方案中，本发明多核苷酸是针对玉米优化的多核苷酸，例如SEQ ID NO：52中提供的多核苷酸，其编码α-淀粉酶，例如SEQ ID NO：51中提供的α-淀粉酶。而且，还考虑加工酶的融合产物。一个实施方案中，本发明多核苷酸是针对玉米优化的多核苷酸，例如SEQ ID NO：46中提供的多核苷酸，其编码α-淀粉酶和葡糖淀粉酶的融合物，例如SEQ ID NO：45中提供的融合物。本发明还想到加工酶的组合。例如，在此考虑淀粉加工酶和非淀粉加工酶的组合。加工酶的此类组合可以通过使用分别编码各酶的多个基因构建体而获得。或者，可以通过已知方法，使这些酶稳定转化的各单个植物杂交，以获得包含两者酶的植物。另一方法包括使用外源酶和转基因植物。

淀粉加工酶和非淀粉加工酶的来源可以分离或得自任何来源，相应于其的多核苷酸可以由本领域技术人员确定。α-淀粉酶可以来源于曲霉属(Aspergillus)(例如，Aspergillus shirousami和黑曲霉)、根霉属(例如米根霉)和嗜热厌氧杆菌(Thermoanaerobacter)(例如，Thermoanaerobacter thermosaccharolyticum)。

在本发明另一实施方案中，多核苷酸编码嗜温型淀粉加工酶，该酶与编码生淀粉结合域(例如SEQ ID NO：53中提供的结合域)的、针对玉米优化的多核苷酸(例如SEQ ID NO：54中提供的多核苷酸)可操作地连接。

另一实施方案中，组织特异性启动子包括胚乳特异性启动子，例如玉米的γ-玉米醇溶蛋白启动子(如SEQ ID NO：12)或玉米ADP-gpp启动子(如SEQ ID NO：11，其包括5’非翻译序列和内含子序列)或Q蛋白启动子(如SEQ ID NO：98)或稻的谷蛋白启动子(如SEQ ID NO：67)。因此，本发明包括含有包含SEQ ID NO：11、12、67或98的启动子的分离多核苷酸，与其互补序列在低严紧杂交条件下杂交的多核苷酸，或其具有启动子活性(例如，具有SEQ ID NO：11、12、67或68的启动子的活性的至少10％，优选地至少50％)的片段。

一个实施方案中，可以将来自淀粉水解基因的产物，例如α-淀粉酶、葡糖淀粉酶、或α-淀粉酶/葡糖淀粉酶融合物，引导至特定的细胞器或位置，例如内质网或质外体，而非细胞质。这可以通过如下例子举例说明：使用玉米的γ-玉米醇溶蛋白N端信号序列(SEQ ID NO：71)，其使蛋白质具有质外体特异的定向；和使用与加工酶可操作连接的γ-玉米醇溶蛋白的N端信号序列，其中所述加工酶与用于在内质网中滞留的序列SEKDEL可操作连接。指导蛋白质或酶到达特定区室将允许酶以不和底物接触的方式定位。以此方式，在酶接触其底物之前，酶的酶促作用都不会发生。可以通过碾磨(物理破坏细胞完整性)和水合的方法，而使酶与其底物接触。例如，可以将嗜温型淀粉水解酶引导至质外体或内质网，由此不与造粉体中的淀粉粒接触。碾磨谷粒将破坏谷粒的完整性，之后淀粉水解酶将与淀粉粒接触。以此方式，可以规避酶和其底物共定位所带来的潜在负面影响。

h.不添加增甜剂的食品

本发明也提供制备不添加增甜剂的、甜的粉质食品(farinaceousfood product)。粉质食品的例子包括但不限于，早餐食品、即食食品、烘焙的食品、通心面(pasta)和谷物产品如谷物早餐。该方法包括将包含至少一种淀粉加工酶的植物部分在激活该淀粉加工酶的条件下进行处理，由此将植物部分中的淀粉粒加工成糖(sugar)，从而，例如，相对于通过加工来自不含该嗜高热酶的植物部分的淀粉粒产生的产品而言，形成甜的产品。优选地，淀粉加工酶是嗜高热型的，并通过加热，例如烘焙、煮沸、加热、蒸、放电或其任何组合而激活。所述植物部分从基因组中增加了表达所述至少一种嗜高热淀粉加工酶(例如，α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶或其任何组合)的表达盒的转化植物(例如，转化的大豆、黑麦、燕麦、大麦、小麦、玉米、稻或甘蔗)获得。然后可以将该甜产品加工成粉质食品。本发明也提供通过此方法制备的粉质食品，例如，谷物食品、早餐食品、即食食品、或烘焙食品。该粉质食品可以从所述甜产品和水形成，并可以含有麦芽、调味剂、维生素、矿物质、着色剂或其任何组合。

可以在将植物材料包括在谷物产品中之前或者在谷物产品加工期间，激活酶以将植物材料中所包含的多糖转化成糖(sugar)。因此，可以在将植物材料包括在粉质产品中之前，通过活化该材料，例如在嗜高热酶的情况下通过加热，使植物材料中所包含的多糖转化成糖(sugar)。然后，将含有通过多糖转化产生的糖(sugar)的植物材料，加入产品以产生甜的产品。或者，可以在粉质产品的加工过程中，通过酶将多糖转化成糖(sugar)。用于制备谷物产品的工艺的例子是本领域熟知的，包括加热、烘焙、煮沸等，参见美国专利号：6,183,788、6,159,530、6,149,965；4,988,521和5,368,870。

简而言之，面团的制备可以通过将各种干成分与水一起混合并蒸煮以糊化含淀粉成分和产生煮熟香味而进行。然后可以将煮熟的材料机械加工以形成煮熟的面团，例如谷物面团。干成分可以包括各种添加剂，例如糖(sugar)、淀粉、盐、维生素、矿物质、着色剂、调味剂、盐等。除了水，还可以添加各种液体成分，例如，玉米(corn，maize)或麦芽糖浆。粉质材料可以包括来自本发明转化植物的谷物谷粒，小麦、稻、玉米、燕麦、大麦、黑麦或其它谷物谷粒的切粒(cut grain)、粗磨谷粉或面粉，以及其混合物。然后可以通过诸如挤出或冲压等工艺将面团加工成期望的形状，并使用诸如James蒸煮器、烤箱或放电设备等手段进一步蒸煮。

本发明还提供不添加增甜剂而甜化含淀粉产品的方法。该方法包括将包含至少一种淀粉加工酶的淀粉在激活该至少一种酶的条件下进行处理，由此消化淀粉以形成糖(sugar)，从而例如相对于通过处理不含该嗜高热酶的淀粉产生的产品而言，形成处理的(甜化的)淀粉。本发明淀粉从基因组中增加了编码所述至少一种加工酶的表达盒的转化植物获得。酶包括α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶或其任何组合。酶可以是嗜高热型的，并可以通过加热来活化。优选的转化植物包括玉米、大豆、黑麦、燕麦、大麦、小麦、稻和甘蔗。然后，将处理的淀粉加入产品以产生甜的含淀粉产品，例如，粉质食品。本发明也提供通过此方法产生的甜的含淀粉产品。

本发明还提供甜化含多糖的果实或蔬菜的方法，包括：将包含至少一种多糖加工酶的果实或蔬菜在激活该至少一种酶的条件下进行处理，由此加工果实或蔬菜中的多糖以形成糖(sugar)，从而产生甜的果实或蔬菜(例如，相对于来自不含该多糖加工酶的植物的果实或蔬菜而言)。本发明的果实或蔬菜从基因组中增加了编码所述至少一种多糖加工酶的表达盒的转化植物获得。果实和蔬菜包括马铃薯、番茄、香蕉、南瓜、豌豆和大豆。酶包括α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶或其任何组合。酶可以是嗜高热型的。

i.甜化含多糖的植物或植物产物

该方法涉及获得表达如上所述将多糖加工成糖(sugar)的多糖加工酶的植物。因此，该酶在植物以及植物的产物，如果实或蔬菜中表达。一个实施方案中，酶被置于诱导型启动子的控制之下，从而可以通过外来刺激物诱导酶的表达。此类诱导型启动子和构建体是本领域熟知的，并在本文中进行了描述。酶在植物或其产物中的表达造成植物或其产物中所包含的多糖被转化成糖(sugar)以及该植物或其产物变甜。另一实施方案中，多糖加工酶组成型表达。因此，可以在足以激活酶的条件下活化该植物或其产物，以便通过酶的作用将多糖转化成糖(sugar)以甜化该植物或其产物。结果，果实或蔬菜中该多糖自加工形成糖(sugar)，从而产生甜的果实或蔬菜(例如，相对于来自不含该多糖加工酶的植物的果实或蔬菜而言)。本发明的果实或蔬菜从基因组中增加编码所述至少一种多糖加工酶的表达盒的转化植物获得。果实和蔬菜包括马铃薯、番茄、香蕉、南瓜、豌豆和大豆。酶包括α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶或其任何组合。多糖加工酶可以是嗜高热型的。

j.从含有可以破坏胚乳基质的酶的转化谷粒分离淀粉

本发明提供从转化的谷粒分离淀粉的方法，其中在所述转化的谷粒中表达可以破坏胚乳基质的酶。该方法涉及获得表达可以通过修饰如细胞壁、非淀粉多糖和/或蛋白质而破坏胚乳基质的酶的植物。此类酶的例子包括但不限于蛋白酶、葡聚糖酶、硫氧化蛋白、硫氧化蛋白还原酶、植酸酶、脂肪酶、纤维素酶、β葡糖苷酶、木聚糖酶和酯酶。此类酶不包括表现出淀粉降解活性的任何酶，从而维持了淀粉粒的完整性。酶可以与将酶引导至淀粉粒的信号序列融合。一个实施方案中，加热干燥谷粒以激活所述酶而失活谷粒中所包含的内源性酶。热处理造成所述酶的活化，该酶产生作用而破坏胚乳基质，之后胚乳基质可以容易地与淀粉粒分开。在另一实施方案中，在低温或高温、高或低湿度含量、以及有或无二氧化硫的情况下，浸渍谷粒。然后热处理谷粒以破坏胚乳基质和允许容易地分离淀粉粒。另一实施方案中，构建合适的温度和湿度条件以允许蛋白酶进入淀粉粒和降解颗粒中所包含的蛋白质。此类处理将产生高产量和几乎无污染蛋白的淀粉粒。

k.具有高糖(sugar)当量的糖浆和该糖浆在生产乙醇或发酵饮料中的用途

该方法涉及获得表达如上所述将多糖加工成糖(sugar)的多糖加工酶的植物。在所表达的酶可以将植物或其产物中包含的多糖转化成糊精、麦芽寡糖、和/或糖(sugar)的条件下，在水蒸汽中浸渍植物或其产物。然后分离含有通过多糖转化产生的糊精、麦芽寡糖和/或糖(sugar)的水蒸汽，产生具有高糖(sugar)当量的糖浆。该方法可以包括或可以不包括湿磨植物或其产物以获得淀粉粒的额外步骤。可以用于此方法的酶的例子包括但不限于α-淀粉酶、葡糖淀粉酶、支链淀粉酶和α-葡糖苷酶。该酶可以是嗜高热型的。根据此方法产生的糖(sugar)包括但不限于己糖、葡萄糖和果糖。可以用于此方法的植物的例子包括但不限于玉米、小麦或大麦。可以使用的植物产物的例子包括但不限于果实、谷粒和蔬菜。一个实施方案中，多糖加工酶被置于诱导型启动子的控制之下。因此，在浸渍工艺之前或期间，诱导启动子以造成酶的表达，然后该酶导致多糖转化成糖(sugar)。本领域熟知并且本文中提供了诱导型启动子和包含其的构建体的例子。因此，当多糖加工酶是嗜高热型的时，在高温下进行浸渍以激活该嗜高热酶和失活植物或其产物中存在的内源性酶。另一实施方案中，能够将多糖转化成糖(sugar)的嗜高热酶组成型地表达。该酶可以通过使用信号序列而靶向或可以不靶向植物中的区室。在高温条件下浸渍植物或其产物，造成植物中的多糖转化成糖(sugar)。

本发明也提供从具有高糖(sugar)当量的糖浆生产乙醇或发酵饮料的方法。该方法涉及在允许糖浆中所包含的糖(sugar)转化成乙醇或发酵饮料的条件下将糖浆与酵母一起孵育。此类发酵饮料的例子包括但不限于，啤酒和酒(wine)。发酵条件是本领域熟知的，描述在美国专利号：4,929,452以及本文中。优选地，酵母是高醇耐受性和高糖耐受性酵母菌株，例如酿酒酵母ATCC NO.20867。可以蒸馏该发酵的产物或发酵饮料以分离乙醇或蒸馏饮料。

1.在植物的细胞壁中积累嗜高热酶

本发明提供在植物的细胞壁中积累嗜高热酶的方法。该方法涉及在植物中表达与细胞壁引导信号融合的嗜高热酶，这样该被定向的酶在细胞壁中积累。优选地，酶能够将多糖转化成单糖。引导序列的例子包括但不限于纤维素或木糖结合域。嗜高热酶的例子包括SEQ ID NO：1、3、5、10、13、14、15或16中列出的那些。可以添加含有细胞壁的植物材料作为从给料中回收糖(sugar)的工艺中的期望酶的来源，或者作为将源于其它来源的多糖转化成单糖的酶的来源。此外，细胞壁可以充当来源以从中可以纯化出酶。纯化酶的方法是本领域熟知的，包括但不限于凝胶过滤、离子交换层析、层析聚焦、等电聚焦、亲和层析、FPLC、HPLC、盐沉淀、透析等。因此，本发明也提供从植物的细胞壁分离的纯化的酶。

m.制备和分离加工酶的方法

根据本发明，本发明的重组产生的加工酶可以通过转化植物组织或植物细胞使之包含能够在该植物中激活的本发明加工酶，选择转化的植物组织或细胞，将该转化的植物组织或细胞培植成整株植物，和从该转化的植物或其部分分离加工酶。重组产生的酶可以是α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶、支链淀粉酶、木聚糖酶、蛋白酶、葡聚糖酶、β葡糖苷酶、酯酶、脂肪酶或植酸酶。酶可以由选自SEQ ID NO：2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、59、61、63、65、79、81、83、85、87、89、91、93、94、95、96、97或99之任一的多核苷酸编码。

本发明通过以下实施例进一步描述，这些实施例不旨在以任何方式限制本发明的范围。

实施例

实施例1

构建针对玉米优化的嗜高热淀粉加工/异构酶基因

根据酶的期望活性谱，选择参与淀粉降解或葡萄糖异构化的酶，α-淀粉酶、支链淀粉酶、α-葡糖苷酶和葡萄糖异构酶。所述活性谱包括例如，室温的最小活性、高温活性/稳定性、以及低pH下的活性。然后通过使用美国专利号5,625,136中描述的玉米优选密码子，设计相应的基因，并由Integrated DNA Technologies，Inc.(Coralville，IA)合成。

具有SEQ ID NO：1氨基酸序列的797GL3α-淀粉酶由于其嗜高热活性而被选择。推导出该酶的核酸序列并针对玉米优化为SEQ ID NO：2。相似地，选择具有SEQ ID NO：3中所示氨基酸序列的6gp3支链淀粉酶。推导出6gp3支链淀粉酶的核酸序列并针对玉米优化为SEQ ID NO：4。

从文献J.Bact.177：482-485(1995)；J.Bact.180：1287-1295(1998)，获得硫磺矿硫化叶菌(Sulfolobus solfataricus)的malAα-葡糖苷酶氨基酸序列。基于公布的该蛋白质的氨基酸序列(SEQ ID NO：5)，设计了针对玉米优化的、编码malA -葡糖苷酶的合成基因(SEQID No：6)。

选择了几种葡萄糖异构酶。基于具有登录号NC_000853的公布的DNA序列，预测了来源于海栖热袍菌的葡萄糖异构酶的氨基酸序列(SEQ ID NO：18)，并设计了针对玉米优化的合成基因(SEQ ID NO：19)。类似地，基于Appl.Envir.Microbiol.61(5)：1867-1875(1995)、登录号L38994公布的DNA序列，预测了来源于Thermotoganeapolitana的葡萄糖异构酶的氨基酸序列(SEQ ID NO：20)。设计了编码该Thermotoga neapolitana葡萄糖异构酶的、针对玉米优化的合成基因(SEQ ID NO：21)。

实施例2

在大肠杆菌中表达797GL3α-淀粉酶和淀粉包囊化区域(starchencapsulating region)的融合物

将编码与来自玉米颗粒结合型淀粉合酶(waxy)的淀粉包囊化区域(SER)融合的嗜高热797GL3α-淀粉酶的构建体，引入大肠杆菌并在其中表达。编码氨基酸序列(SEQ ID NO：8)(Klosgen RB，等，1986)的玉米颗粒结合型淀粉合酶cDNA(SEQ ID NO：7)被克隆作为淀粉结合域和淀粉包囊化区域(SER)的来源。通过RT-PCR从制备自玉米种子的RNA，使用自GenBank登录号X03935设计的引物SV57(5’AGCGAATTCATGGCGGCTCTGGCCACGT3’)(SEQ ID NO：22)和SV58(5’AGCTAAGCTTCAGGGCGCGGCCACGTTCT3’)(SEQ ID NO：23)，扩增全长cDNA。将整个cDNA以EcoRI/HindIII片段形式克隆至pBluescript中，质粒命名为pNOV4022。

自pNOV4022扩增包括淀粉结合域的waxy cDNA的C端部分(由bp919-1818编码)，将其以符合阅读框的形式融合至全长的玉米优化型797GL3基因(SEQ ID NO：2)的3’末端。具有核酸SEQ ID NO：9并编码氨基酸序列SEQ ID NO：10的融合基因产物797GL3/Waxy，以NcoI/XbaI片段克隆至已经用NcoI/NheI切割的pET28b(Novagen，Madison，WI)中。797GL3基因也被单独地以NcoI/XbaI片段形式克隆在pET28b载体中。

将pET28/797GL3和pET28/797GL3/Waxy载体转化至BL21/DE3大肠杆菌细胞(NOVAGEN)中，并根据厂商说明进行培养和诱导。PAGE/考马斯染色分析揭示在两种提取物中存在分别相应于预定大小的融合淀粉酶和未融合淀粉酶的诱导蛋白质。

按如下所述分析总细胞提取物的嗜高热淀粉酶活性：将5mg淀粉悬浮在20μl水，然后用25μl乙醇稀释。将标准淀粉酶阳性对照或待测样品加入该混合物中，并添加水至500μl终反应体积。80℃实施反应15-45分钟。然后将反应冷却至室温，加入500μl邻联二茴香胺和葡萄糖氧化酶/过氧化物酶混合物(Sigma)。混合物在37℃温育30分钟。加入500μl的12N硫酸以终止反应。测定540nm的吸光度以定量通过淀粉酶/样品所释放的葡萄糖量。融合的和未融合的淀粉酶提取物的试验给出了相似水平的嗜高热淀粉酶活性，而对照提取物未阴性。这说明，797GL3α-淀粉酶在与waxy蛋白C端部分融合后仍具有活性(在高温下)。

实施例3

分离用于在玉米中进行胚乳特异性表达的启动子片段

从玉米基因组DNA，使用自GenBank登录号M81603设计的引物，扩增玉蜀黍(Zea mays)ADP-gpp(ADP-葡萄糖焦磷酸化酶)大亚基的启动子和5’非编码区I(包括第一个内含子)，产生1515碱基对片段(SEQID No；11)。已经证明，ADP-gpp启动子是胚乳特异性的(Shaw和Hannah，1992)。

从质粒pGZ27.3(获自Dr.Brian Larkins)扩增673bp片段的玉蜀黍γ-玉米醇溶蛋白基因启动子(SEQ ID NO：12)。已经证明该γ-玉米醇溶蛋白启动子是胚乳特异性的(Torrent等，1997)。

实施例4

构建用于797GL3嗜高热α-淀粉酶的转化载体

按照如下所述，使用各种引导信号，构建表达盒以在玉米胚乳中表达797GL3嗜高热淀粉酶：

pNOV6200(SEQ ID NO：13)包含与以上实施例1中所述的合成797GL3淀粉酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO：17)，以便靶向内质网和在质外体中分泌(Torrent等，1997)。将该融合体克隆在玉米ADP-gpp启动子后面用于在胚乳中特异性表达。

pNOV6201(SEQ ID NO：14)包含与C端添加了序列SEKDEL(Munro和Pelham，1987)的合成797GL3淀粉酶融合的γ-玉米醇溶蛋白N端信号序列以便靶向和滞留在内质网(ER)中。将该融合物克隆在玉米ADP-gpp启动子后以便在胚乳中特异地表达。

pNOV7013包含与C端添加了序列SEKDEL的合成797GL3淀粉酶融合的γ-玉米醇溶蛋白N端信号序列以便靶向和滞留在内质网(ER)中。除了使用玉米γ-玉米醇溶蛋白启动子(SEQ ID NO：12)代替玉米ADP-gpp启动子来实现融合物在胚乳中的表达外，pNOV7013与pNOV6201相同。

pNOV4029(SEQ ID NO：15)包含与合成的797GL3淀粉酶融合的waxy造粉体引导肽(Klosgen等，1986)，以便靶向造粉体。将该融合物克隆在玉米ADP-gpp启动子后以便在胚乳中特异地表达。

pNOV4031(SEQ ID NO：16)包含与合成的797GL3/waxy融合蛋白融合的waxy造粉体引导肽，以便靶向淀粉粒。将该融合物克隆在玉米ADP-gpp启动子后以便在胚乳中特异地表达。

通过将这些融合物克隆在玉米γ-玉米醇溶蛋白启动子后以获得更高水平的酶表达，还构建了其它构建体。将所有这些表达盒移入二元载体中，以便通过农杆菌感染转化玉米。二元载体含有磷酸甘露糖异构酶(PMI)基因，该基因允许用甘露糖选择转基因细胞。使转化的玉米植物自交或者远交，收集种子进行分析。

通过将以上引导信号与6gp3支链淀粉酶或340g12α-葡糖苷酶以正如针对α-淀粉酶所述的相同方式融合，还构建了其它构建体。这些融合物被克隆在玉米ADP-gpp启动子和/或γ-玉米醇溶蛋白启动子之后，并按上述转化至玉米中。使转化的玉米植物自交或远交，收集种子进行分析。

可以通过使分别表达各酶的植物杂交，或者通过将几种表达盒克隆在相同的二元载体中以便能够实现共转化，来产生酶的组合。

实施例5

构建用于6GP3嗜热支链淀粉酶的植物转化载体

按如下所述，构建表达盒以在玉米胚乳内质网中表达6GP3嗜热支链淀粉酶。

pNOV7005(SEQ ID NO：24和25)包含与C端添加了序列SEKDEL的合成6GP3支链淀粉酶融合的玉米γ-玉米醇溶蛋白N端信号序列，以便靶向和滞留在ER中。使用设计用于扩增合成的基因并同时在该蛋白质的C末端添加6个氨基酸的引物，通过PCR，将氨基酸肽SEKDEL融合在酶的C末端。将融合物克隆在玉米γ-玉米醇溶蛋白启动子后，以便在胚乳中特异地表达。

实施例6

构建用于malA嗜高热α-葡糖苷酶的植物转化载体

按如下所述，使用各种引导信号，构建表达盒，以便在玉米胚乳中表达硫磺矿硫化叶菌malA嗜高热α-葡糖苷酶：

pNOV4831(SEQ ID NO：26)包含与C端添加了序列SEKDEL(Munro和Pelham，1987)的合成malAα-葡糖苷酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO：17)，以便靶向和滞留在内质网(ER)中。该融合物被克隆在玉米γ-玉米醇溶蛋白启动子后，用于在胚乳中特异地表达。

pNOV4839(SEQ ID NO：27)包含与合成的malAα-葡糖苷酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQID NO：17)，以便靶向内质网并在质外体中分泌(Torrent等，1997)。该融合物被克隆在玉米γ-玉米醇溶蛋白启动子后以便特异地在胚乳中表达。

pNOV4837包含与C端添加了序列SEKDEL的合成malAα-葡糖苷酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO：17)，以便靶向和滞留在内质网(ER)中。该融合物被克隆在玉米ADPgpp启动子后以便在胚乳中特异地表达。用于该克隆的此氨基酸序列与pNOV4831中的是相同的(SEQ ID NO：26)。

实施例7

构建用于嗜高热型的海栖热袍菌和Thefmotoga neapolitana葡萄糖异构酶的植物转化载体

按如下所述，使用各种引导信号，构建表达盒，以便在玉米胚乳中表达海栖热袍菌和Thermotoga neapolitana的嗜高热葡萄糖异构酶：

pNOV4832(SEQ ID NO：28)包含与C端添加了序列SEKDEL的合成海栖热袍菌葡萄糖异构酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO：17)，以便靶向和滞留在内质网(ER)中。该融合物被克隆在玉米γ-玉米醇溶蛋白启动子后以便在胚乳中特异地表达。

pNOV4833(SEQ ID NO：29)包含与C端添加了序列SEKDEL的合成Thermotoga neapolitana葡萄糖异构酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO：17)，以便靶向和滞留在内质网(ER)中。该融合物被克隆在玉米γ-玉米醇溶蛋白启动子后以便在胚乳中特异地表达。

pNOV4840(SEQ ID NO：30)包含与合成的Thermotoga neapolitana葡萄糖异构酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO：17)，以便靶向内质网并在质外体中分泌。该融合物被克隆在玉米γ-玉米醇溶蛋白启动子后以便在胚乳中特异地表达。

pNOV4838包含与C端添加了序列SEKDEL的合成的Thermotoganeapolitana葡萄糖异构酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO：17)，以便靶向和滞留在ER中。该融合物被克隆在玉米ADPgpp启动子后以便在胚乳中特异地表达。用于该克隆的此氨基酸序列与pNOV4833中的(SEQ ID NO：29)相同。

实施例8

构建用于表达嗜高热葡聚糖酶EglA的植物转化载体

pNOV4800(SEQ ID NO：58)包含与EglA成熟蛋白序列融合的大麦α淀粉酶AMY32b信号序列(MGKNGNLCCFSLLLLLLAGLASGHQ)(SEQ IDNO：31)，以便实现在造粉体的定位。该融合物被克隆在玉米γ玉米醇溶蛋白启动子后以便特异地在胚乳中表达。

实施例9

构建用于表达多种嗜高热酶的植物转化载体

pNOV4841包含具有797GL3α淀粉酶融合物和6GP3支链淀粉酶融合物的双重基因构建体。797GL3融合物(SEQ ID NO：33)和6GP3融合物(SEQ ID NO：34)两者都具有用于靶向和滞留在ER中的玉米γ玉米醇溶蛋白N端信号序列和SEKDEL序列。每个融合物被分别地克隆在分开的玉米γ玉米醇溶蛋白启动子后以便在胚乳中特异地表达。

pNOV4842包含具有797GL3α淀粉酶融合物和malAα-葡糖苷酶融合物的双重基因构建体。797GL3融合多肽(SEQ ID NO：35)和malAα-葡糖苷酶融合多肽(SEQ ID NO：36)两者都具有用于靶向和滞留在ER中的玉米γ玉米醇溶蛋白N端信号序列和SEKDEL序列。每个融合物被分别地克隆在分开的玉米γ玉米醇溶蛋白启动子后以便在胚乳中特异地表达。

pNOV4843包含具有797GL3α淀粉酶融合物和malAα-葡糖苷酶融合物的双重基因构建体。797GL3融合物和malAα-葡糖苷酶融合物两者都具有用于靶向和滞留在ER中的玉米γ玉米醇溶蛋白N端信号序列和SEKDEL序列。797GL3融合物被克隆在玉米γ玉米醇溶蛋白启动子后而malA融合物被克隆在玉米ADPgpp启动子后以便在胚乳中特异地表达。此797GL3融合物和malA融合物的氨基酸序列与pNOV4842中的(分别是SEQ ID NO：35和36)相同。

pNOV4844包含具有797GL3α淀粉酶融合物、6GP3支链淀粉酶融合物和malAα-葡糖苷酶融合物的三重基因构建体。797GL3、malA和6GP3都具有用于靶向和滞留在ER中的玉米γ玉米醇溶蛋白N端信号序列和SEKDEL序列。797GL3融合物和malA融合物被分别克隆在2个分开的玉米γ玉米醇溶蛋白启动子后而6GP3融合物被克隆在玉米ADPgpp启动子后以便在胚乳中特异地表达。此797GL3融合物和malA融合物的氨基酸序列与pNOV4842中的(分别是SEQ ID NO：35和36)相同。此6GP3融合物的氨基酸序列与pNOV4841中的(SEQ ID NO：34)相同。

本实施例以及以下实施例中给出的所有表达盒都被移入二元载体中，以便通过农杆菌感染转化玉米。pNOV2117包含磷酸甘露糖异构酶(PMI)基因，由此允许使用甘露糖选择转基因细胞。pNOV2117是具有pVS1和ColE1复制起点的二元载体。该载体含有来自pAD1289(Hans en，G等，PNAS USA 91：7603-7607(1994)，并入此处作为参考)组成型VirG基因以及来自Tn7的壮观霉素抗性基因。pNOV117(Negrotto，D.，等，PLant Cell Reports 19：798-803(2000)，并入此处作为参考)的玉米泛素启动子、PMI编码区和胭脂碱合酶终止子被克隆在左右边界之间的多接头中。使转化的玉米植物自交或远交，收集种子用于分析。可以通过使分别表达各酶的植物杂交，或者通过用这些多基因盒中的一个转化植物，产生不同酶的组合。

实施例1O

构建细菌和毕赤酵母(Pichia)表达载体

按如下所述，构建表达盒以在毕赤酵母或细菌中表达嗜高热α-葡糖苷酶和葡萄糖异构酶：

pNOV4829(SEQ ID NO：37和38)在细菌表达载体pET29a中包含与ER滞留信号融合的合成海栖热袍菌葡萄糖异构酶。该葡萄糖异构酶融合基因被克隆在pET29a的NcoI和SacI位点中，从而导致用于蛋白质纯化的N端S-标签的添加。

pNOV4830(SEQ ID NO：39和40)在细菌表达载体pET29a中包含与ER滞留信号融合的合成Thermotoga neapolitana葡萄糖异构酶。该葡萄糖异构酶融合基因被克隆在pET29a的NcoI和SacI位点中，从而导致用于蛋白质纯化的N端S-标签的添加。

pNOV4835(SEQ ID NO：41和42)包含克隆在细菌表达载体pET28C的BamHI和EcoRI位点中的合成海栖热袍菌葡萄糖异构酶基因。这导致His标签(用于蛋白质纯化)与葡萄糖异构酶的N末端融合。

pNOV4836(SEQ ID NO：43和44)包含克隆在细菌表达载体pET28C的BamHI和EcoRI位点中的合成Thermotoga neapolitana葡萄糖异构酶基因。这导致His标签(用于蛋白质纯化)与葡萄糖异构酶的N末端融合。

实施例11

基本上按照Negrotto等PLant Cell Reports 19：798-803所述，转化未成熟的玉米胚胎。对于此实施例，所有的培养基成分均如Negrotto等，前述引文中所述的。然而，可以替代该文献中描述的各种培养基成分。

A.转化质粒和选择标记

将用于转化的基因克隆在适于玉米转化的载体中。用于此实施例的载体含有用于选择转基因株系的磷酸甘露糖异构酶(PMI)基因(Negrotto等(2000)Plant Cell Reports 19：798-803)。

B.制备农杆菌

将含有植物转化质粒的农杆菌菌株LBA4404(pSB1)在YEP(酵母提取物(5g/L)、蛋白胨(10g/L)、NaCl(5g/L)、15g/L琼脂，pH6.8)固体培养基上28℃培养2-4天。将大约0.8×10⁹农杆菌悬浮在补加有100μM As的LS-inf培养基(Negrotto等(2000)Plant Cell Rep19：798-803)中。在此培养基中预诱导细菌30-60分钟。

C.接种

从8至12天龄穗切下A188或其它适宜基因型的未成熟胚，放入液体LS-inf+100μM As中。用新鲜的感染培养基洗涤胚胎一次。然后添加农杆菌溶液，涡旋胚胎30秒，并允许和细菌一起沉淀5分钟。然后将胚胎以盾片侧朝上转移至LSA培养基，暗处培养2至3天。随后，将每培养皿20至25个胚胎转移至补加有头孢噻肟(250mg/l)和硝酸银(1.6mg/l)的LSDc培养基中，暗处28℃培养10天。

D.选择转化的细胞和再生转化的植物

将产生胚发生愈伤组织的未成熟胚胎转移至LSD1M0.5S培养基。在此培养基上选择培养物6周，其中在第3周作传代培养。将存活的愈伤组织转移至补加有甘露糖的Reg1培养基。在光下培养(16小时光/8小时暗方案)，之后将绿色组织转移至无生长调节剂的Reg2培养基，孵育1-2周。将小植物转移至含有Reg3培养基的Magenta GA-7盒(Magenta Corp，Chicago I11.)，光下培养。2至3周后，PCR测试植物是否存在PMI基因和其它目的基因。将PCR试验的阳性植物转移至温室。

实施例12

分析来自表达靶向质外体或ER的α-淀粉酶的玉米植物的T1种子

从使用实施例4描述的pNOV6200或pNOV6201转化的自花授粉玉米植物，获得T1种子。基于视觉观察和在任何高温暴露之前碘溶液对淀粉的正常染色，这些籽粒(kernel)中的淀粉积累似乎是正常的。解剖未成熟的籽粒，将纯化的胚乳分别单独地放置在离心管中，浸泡在200μl 50mM NaPO₄缓冲液中。将管子放入85℃水浴20分钟，然后在冰上冷却。将20μl的1％碘溶液加入各管并混合。大约25％的分离籽粒有正常的淀粉染色。剩余的75％未能染色，说明淀粉已经降解成不被碘染色的低分子量糖(sugar)。发现，pNOV6200和pNOV6201的T1籽粒正在自水解玉米淀粉。37℃温育后没有可检测到的淀粉减少。

在PAGE/考马斯染色后，通过从胚乳分离嗜高热蛋白质级分，进一步分析淀粉酶的表达。观察到正确分子量(50kD)的分离蛋白质带。使用商业可获得的经染色的直链淀粉(AMYLAZYME，来自Megazyme，Ireland)，在α-淀粉酶试验中分析这些样品。高水平的嗜高热淀粉酶活性与50kD蛋白质的存在有关。

还发现，在来自大多数表达靶向造粉体的嗜高热α-淀粉酶的转基因玉米的籽粒中，淀粉在室温下具有足够的活性，以致如果允许该酶与淀粉粒直接接触，则可以水解大多数淀粉。在具有靶向造粉体的嗜高热α-淀粉酶的80个株系中，鉴定出4个株系在籽粒中积累淀粉。使用比色amylazyme试验(Megazyme)，分析了这些株系中的三个株系的热稳定α-淀粉酶活性。该淀粉酶试验说明，这三个株系具有低水平的热稳定淀粉酶活性。当用适当的湿度和热条件处理来自这三个株系的纯化淀粉时，淀粉被水解，这说明存在足以促进制备自这些株系的淀粉自水解的α-淀粉酶水平。

从pNOV6200和pNOV6201转化体的多个独立株系获得T1种子。解剖来自各株系的各单个籽粒，并在300μl 50mM NaPO₄缓冲液中将纯化的胚乳分开单独地匀浆。85℃分析胚乳悬浮液的等分试样的α-淀粉酶活性。大约80％的株系的嗜高热活性发生分离(见图1A、1B和2)。

100℃加热来自野生型植物或转化了pNOV6201的植物的籽粒1、2、3或6小时，然后用碘溶液染色淀粉。分别在3或6小时后在成熟的籽粒中检测到几乎没有或完全没有淀粉。因此，在高温孵育时，在来自表达靶向内质网的嗜高热淀粉酶的转基因玉米的籽粒中，淀粉被水解。

另一实验中，将来自pNOV6201植物的成熟T1籽粒的部分纯化的淀粉于50℃浸渍16小时，该淀粉在85℃加热5分钟后被水解。这说明，被引导至内质网的α-淀粉酶在籽粒研磨后与淀粉结合，并能够在加热时水解淀粉。碘染色显示，50℃浸渍16小时后成熟种子中的淀粉保持完整。

另一实验中，95℃加热来自转化了pNOV6201的植物的、分离的成熟籽粒16小时，然后干燥。在表达嗜高热α-淀粉酶的种子中，由于淀粉水解为糖(sugar)，从而导致干燥后起皱的外观。

实施例13

分析来自表达靶向造粉体的α-淀粉酶的玉米植物的T1种子

从按实施例4所述转化了pNOV4029或pNOV4031的自花授粉玉米植物获得T1种子。在来自这些株系的籽粒中淀粉的积累明显地不正常。针对非常低的淀粉表型或无淀粉的表型，所有株系分离，严重程度上存在一些差异。从未成熟籽粒纯化的胚乳在暴露于高温之前仅仅被碘弱染色。85℃ 20分钟后，无染色存在。当干燥穗时，籽粒皱缩。如果被允许与谷粒直接接触，此特定淀粉酶清楚地在温室温度下具有足以水解淀粉的活性。

实施例14

发酵来自表达α-淀粉酶的玉米植物的谷粒

100％转基因谷粒85℃对95℃，变化的液化时间

在不添加外源α-淀粉酶的情况下，包含热稳定α-淀粉酶的转基因玉米(pNOV6201)在发酵中表现良好，需要短得多的液化时间，并导致淀粉更完全的溶解。按照具有如下步骤(以下详细描述)的操作方案，实施实验室规模的发酵：1)研磨，2)湿度分析，3)制备含有研磨后的玉米、水、回流液(backset)和α-淀粉酶的浆液，4)液化和5)同时糖化和发酵(SSF)。在此实施例中，液化步骤的温度和时间如下述进行变化。此外，在有和无外源α-淀粉酶的情况下进行转基因玉米的液化，将此乙醇生产性能与用商业可获得α-淀粉酶处理的对照玉米进行比较。

用于此实施例中的转基因玉米根据实施例4中所示方法，使用包含α-淀粉酶基因和PMI选择标记的载体(即，pNOV6201)制备。通过用来自表达高水平热稳定α-淀粉酶的转基因系的花粉给商业杂种授粉，产生转基因玉米。将该玉米干燥至11％湿度并室温贮存。转基因玉米面粉的α-淀粉酶含量为95单位/g，在此，1单位酶在pH6.0 MES缓冲液中85℃下每分钟从玉米面粉产生1μmol还原端。所用的对照玉米为已知在乙醇生产中表现良好的黄色马齿形玉米。

1)研磨：在装备有2.0mm筛子的Perten 3100锤磨机中研磨转基因玉米(1180g)，由此产生转基因玉米面粉。彻底清洗以防止由转基因玉米造成污染后，在相同磨机中研磨对照玉米。

2)湿度分析：在铝称量舟皿中称取转基因和对照玉米样品(20g)，100℃加热4h。再次称量样品，从重量的损失计算含湿量。转基因面粉的含湿量为9.26％，对照面粉的为12.54％。

3)制备浆液：设计浆液的组成以便在SSF开始时产生具有36％固体的醪液。在100ml塑料瓶中制备对照样品，其含有21.50g对照玉米面粉、23ml去离子水、6.0ml回流液(按重量计8％固体)和0.30ml以水1/50稀释的商业可获得的α-淀粉酶。作为工业应用的代表，选择了该α-淀粉酶剂量。当在上述用于分析转基因α-淀粉酶的条件下进行分析时，对照α-淀粉酶的剂量为2U/g玉米面粉。通过添加氢氧化铵，将pH调整为6.0。以相同的方式制备转基因样品，但是由于转基因面粉具有较低的含湿量，其包含20g玉米面粉。在有与对照样品相同剂量的α-淀粉酶或无外源α-淀粉酶的情况下，制备转基因面粉的浆液。

4)液化：将含有转基因玉米面粉的瓶子浸泡在85℃或95℃的水浴中5、15、30、45或60分钟。对照浆液在85℃温育60分钟。在高温温育期间，每5分钟剧烈地手动混合浆液一次。高温步骤后，在冰上冷却浆液。

5)同时糖化和发酵：液化产生醪液与葡糖淀粉酶(0.65ml 1/50稀释的商业可获得的L-400葡糖淀粉酶)、蛋白酶(0.60mL 1,000倍稀释的商业可获得蛋白酶)、0.2mg Lactocide &尿素(0.85ml 10倍稀释的50％尿素液体(Urea Liquor))。在含有醪液的100ml瓶子的盖上挖一个洞，以允许CO₂排出。然后用酵母(1.44ml)接种醪液，在设定在90F的水浴中孵育。发酵24小时后，将温度降低至86F；在48小时时，将温度设定为82F。

通过制备含有酵母(0.12g)和70g麦芽糖糊精、230ml水、100ml回流液、葡糖淀粉酶(0.88ml 10倍稀释的商业可获得的葡糖淀粉酶)、蛋白酶(1.76ml 100倍稀释的商业可获得的蛋白酶)、尿素(1.07g)、青霉素(0.67mg)和硫酸锌(0.13g)的混合物，使接种的酵母繁殖。在需要前一天起始繁殖培养物，并在混合下90_温育该培养物。

于24、48、和72小时，从每个发酵容器中采取样品，通过0.2μm滤器过滤，HPLC分析乙醇和糖(sugar)。72小时时，分析样品的总的溶解的固体和残余淀粉。

HPLC分析在配备有折光率检测器、柱加热器和Bio-Rad AminexHPX-87H柱子的二元梯度系统上实施。该系统使用水中的0.005M H₂SO₄以1ml/min进行平衡。柱温为50℃。样品注射体积为5μl；在相同溶剂中洗脱。通过注射已知标准，校正RI反应。在每一个注射中测量乙醇和葡萄糖。

残余淀粉按如下所述进行测量。在烤箱中50℃干燥样品和标准，然后在样品磨(samplemill)中研磨成粉。称取粉末(0.2g)放在15ml带刻度的离心管中。用10ml乙醇水溶液(80％v/v)，通过涡旋之后离心并弃上清液，洗涤该粉末3次。向沉淀加入DMSO(2.0ml)，之后加入3.0ml在MOPS缓冲液中的热稳定α-淀粉酶(300单位)。剧烈地混合后，85℃水浴中温育管子60分钟。温育期间，混合管子4次。冷却样品并加入4.0ml乙酸钠缓冲液(200mM，pH 4.5)，之后加入0.1ml葡糖淀粉酶(20U)。50℃温育样品2小时，混合，然后3,500rpm离心5分钟。通过0.2μm滤器过滤上清液，通过上述HPLC方法分析葡萄糖。对于具有低残余淀粉(＜20％固体)的样品，使用50μl注射体积。

结果在不添加α-淀粉酶的情况下转基因玉米在发酵中表现良好。如表1中所示，72小时时的乙醇产量在添加或不添加外源α-淀粉酶的情况下基本上相同。这些数据也说明，当液化温度较高时可以获得较高的乙醇产量；转基因玉米中表达的本发明酶与商业使用的其它酶(例如液化芽孢杆菌(Bacillus liquefaciens)α-淀粉酶)相比在较高温度下具有活性。

表 1

液化温度℃	液化时间min	外源α-淀粉酶	#重复	平均乙醇％v/v	标准差％v/v
液化温度℃	液化时间min	外源α-淀粉酶	#重复	平均乙醇％v/v	标准差％v/v	85	60	是	4	17.53	0.18
85	60	否	4	17.78	0.27	85	60	是	4	17.53	0.18
85	60	否	4	17.78	0.27	95	60	是	2	18.22	ND
95	60	否	2	18.25	ND	95	60	是	2	18.22	ND

当改变液化时间时，发现有效的乙醇生产所需的液化时间比常规方法所需的小时数少得多。图3显示，从15分钟至60分钟的液化，72小时发酵的乙醇产量几乎不变。此外，95℃液化比85℃液化在每个时间点上都给出更多的乙醇。此观察结果说明利用嗜高热酶获得了工艺改良。

对照玉米比转基因玉米给出更高的最终乙醇产量，但是对照是由于其在发酵中的良好表现而被选择的。相反地，转基因玉米具有针对有利于转化而选择的遗传背景。利用熟知的育种技术将此α-淀粉酶性状导入原种玉米的种质中应会消除此差异。

检查72小时产生的啤酒(beer)的残余淀粉水平(图4)，显示转基因α-淀粉酶显著提高了淀粉可用于发酵的利用度；发酵后剩下少得多的淀粉。

使用乙醇水平和残余淀粉水平两者时，最佳的液化时间是95℃ 15分钟和85℃ 30分钟。在本实验中，这些时间是发酵容器放置在水浴中的总时间，因此包括样品温度从室温增加至85℃或95℃的时间段。较短的液化时间在使用仪器例如蒸汽加压锅快速加热醪液的大规模工业生产中可能是最佳的。常规工业液化工艺需要收集槽以允许高温孵育醪液1个或多个小时。本发明消除了对此类收集槽的需要，并且将增加液化仪器的生产力。

α-淀粉酶在发酵工艺中的一个重要功能是降低醪液的粘度。在所有的时间点上，含有转基因玉米面粉的样品都比对照样品具有显著小的粘度。此外，转基因样品看起来未经历在所有对照样品中都观察到的凝胶相；糊化作用正常发生在蒸煮玉米浆时。因此，让α-淀粉酶遍布于胚乳的所有部分，将导致醪液在蒸煮期间通过避免大凝胶而具有有利的物理性质，其中所述大凝胶将减缓扩散和增加混合和抽吸醪液的能量消耗。

转基因玉米中α-淀粉酶的高剂量也可以有助于转基因醪液的此有利性质。85℃下，转基因玉米的α-淀粉酶活性比对照中使用的外源α-淀粉酶剂量的活性高许多倍。后者是作为商业使用率的代表而选择的。

实施例15

当与对照玉米混合时转基因玉米的有效功能

以5％至100％转基因玉米面粉的不同水平，将转基因玉米面粉与对照玉米面粉混合。按实施例14进行处理。含有转基因表达的α-淀粉酶的醪液在85℃液化30分钟或在95℃液化15分钟；对照醪液按照实施例14所述制备并在85℃液化30分钟或60分钟(各一)或在95℃液化15分钟或60分钟(各一)。

表2给出了48小时和72小时的乙醇数据以及残余淀粉数据。48小时的乙醇水平被绘制在图5的曲线图中；图6中显示残余淀粉的测定值。这些数据说明，转基因表达的热稳定α-淀粉酶在乙醇生产中具有非常好的表现，甚至在转基因谷粒仅仅在醪液中占总谷粒的一小部分(低至5％)时也是如此。该数据也说明，当转基因谷粒占总谷粒的至少40％时，残余淀粉比对照醪液中的显著地低。

表 2

	85℃液化			95℃液化
	85℃液化			95℃液化			转基因谷粒wt％	残余淀粉	乙醇48h	乙醇％v/v72h	残余淀粉	乙醇48h	乙醇％v/v72h
100	3.58	16.71	18.32	4.19	17.72	21.14	转基因谷粒wt％	残余淀粉	乙醇48h	乙醇％v/v72h	残余淀粉	乙醇48h	乙醇％v/v72h
100	3.58	16.71	18.32	4.19	17.72	21.14	80	4.06	17.04	19.2	3.15	17.42	19.45
60	3.86	17.16	19.67	4.81	17.58	19.57	80	4.06	17.04	19.2	3.15	17.42	19.45
60	3.86	17.16	19.67	4.81	17.58	19.57	40	5.14	17.28	19.83	8.69	17.56	19.51
20	8.77	17.11	19.5	11.05	17.71	19.36	40	5.14	17.28	19.83	8.69	17.56	19.51
20	8.77	17.11	19.5	11.05	17.71	19.36	10	10.03	18.05	19.76	10.8	17.83	19.28
5	10.67	18.08	19.41	12.44	17.61	19.38	10	10.03	18.05	19.76	10.8	17.83	19.28
5	10.67	18.08	19.41	12.44	17.61	19.38	0*	7.79	17.64	20.11	11.23	17.88	19.87

*对照样品。2次测定的平均值

实施例16

以总玉米的1.5至12％的比率使用转基因玉米时作为液化pH的函数的乙醇产量

由于发酵中转基因玉米在总玉米的5％至10％的水平时表现良好，故又进行了一系列其中转基因玉米占总玉米的1.5％至12％的额外发酵。pH从6.4至5.2变化，并且转基因玉米中表达的α-淀粉酶根据在比常规工业使用的pH低的pH下的活性进行了优化。

除了以下例外情况外，按实施例15所述实施这些实验：

1)将转基因面粉以1.5％至12％(总干重的百分数)的水平与对照面粉混合。

2)对照玉米是N3030BT，其比实施例14和15中使用的对照更类似于转基因玉米。

3)未向包含转基因面粉的样品添加外源α-淀粉酶。

4)在液化前将样品的pH调整为5.2、5.6、6.0或6.4。针对每个pH，制备至少5个跨0％转基因玉米面粉至12％转基因玉米面粉的样品。

5)所有样品的液化都在85℃实施60分钟。

图7显示了作为发酵时间的函数的乙醇含量的变化。该图显示从含有3％转基因玉米的样品获得的数据。在较低pH，发酵比在pH6.0及更高时进展更快；在具有其它转基因谷粒剂量的样品中观察到类似行为。转基因酶活性的此pH谱与高水平表达联合将允许较低pH的液化作用，从而导致与常规pH6.0工艺下可能的情况相比更快的发酵和由此更高的生产量。

图8显示72小时时的乙醇产量。正如可以看到的，基于乙醇产量，这些结果显示出几乎与样品中所包括的转基因谷粒的量无关。因此，该谷粒含有丰富的淀粉酶以利于乙醇的发酵生产。此外，也证明较低pH的液化可以导致更高的乙醇产量。

检测样品在液化后的粘度，观察到在pH6.0，6％转基因谷粒足以实现粘度的充分降低。在pH5.2和5.6，12％转基因谷粒时的粘度等于对照的粘度，但是更低百分数的转基因谷粒则不等于。

实施例17

使用嗜热酶从玉米面粉生产果糖

表达嗜高热α-淀粉酶797GL3的玉米被证实当与α-葡糖苷酶(MalA)和木糖异构酶(XylA)混合时可以促进果糖的产生。

将来自表达797GL3的pNOV6201转基因植物的种子在Kleco槽中研磨成面粉，由此产生淀粉酶面粉。将非转基因玉米的籽粒以相同方式研磨以产生对照面粉。

所述α-葡糖苷酶MalA(来自硫磺矿硫化叶菌)在大肠杆菌中表达。将收获的细菌悬浮在含有1mM 4-(2-氨基乙基)苯磺酰氟的50mM磷酸钾缓冲液pH7.0中，然后在弗氏细胞压碎器中裂解。裂解物在4℃23,000×g离心15分钟。移出上清液，并70℃加热10分钟，冰上冷却10分钟，然后4℃ 34,000×g离心30分钟。移出上清液，在Centricon10装置中将MalA浓缩2倍。保留Centricon10步骤的滤过物作为MalA的阴性对照。

通过在大肠杆菌中表达T.neapolitana的xylA基因，制备木糖(葡萄糖)异构酶。将细菌悬浮在100mM磷酸钠pH7.0中，通过弗氏细胞压碎器裂解。沉淀细胞碎片后，80℃加热提取物10分钟，然后离心。上清液含有XylA酶促活性。与XylA提取物平行地制备空载体对照提取物。

将玉米面粉(每份样品60mg)与缓冲液及来自大肠杆菌的提取物混合。如表3中所示，样品含有淀粉酶玉米面粉(淀粉酶)或对照玉米面粉(对照)、50μl MalA提取物(+)或滤过物(-)、以及20μl XylA提取物(+)或空载体对照(-)。所有样品还含有230μl 50mM MOPS、10mMMgSO₄和1mM CoCl₂；室温下缓冲液的pH为7.0。

样品85℃温育18小时。温育时间结束时，用0.9ml 85℃的水稀释样品，离心以除去不溶性物质。然后通过Centricon3超滤装置过滤上清液级分，并通过带有ELSD检测的HPLC进行分析。

该梯度HPLC系统配备有Astec Polymer Amino柱、5微米粒径、250×4.6mm和Altech ELSD 2000检测器。该系统预先用水∶乙腈的15∶85混合物平衡。流速为1ml/min。初始条件在注射后维持5分钟，之后20分钟的梯度至50∶50水∶乙腈，之后10分钟的相同溶剂。用20min的80∶20水∶乙腈洗涤该系统，然后用起始溶剂重新平衡。果糖在5.8min洗脱，葡萄糖在8.7min洗脱。

表 3

样品	玉米面粉	MalA	XylA	果糖峰面积×10^-6	葡萄糖峰面积×10^-6
样品	玉米面粉	MalA	XylA	果糖峰面积×10^-6	葡萄糖峰面积×10^-6	1	淀粉酶	+	+	25.9	110.3
2	淀粉酶	-	+	7.0	12.4	1	淀粉酶	+	+	25.9	110.3
2	淀粉酶	-	+	7.0	12.4	3	淀粉酶	+	-	0.1	147.5
4	淀粉酶	-	-	0	25.9	3	淀粉酶	+	-	0.1	147.5
4	淀粉酶	-	-	0	25.9	5	对照	+	+	0.8	0.5
6	对照	-	+	0.3	0.2	5	对照	+	+	0.8	0.5
6	对照	-	+	0.3	0.2	7	对照	+	-	1.3	1.7
8	对照	-	-	0.2	0.3	7	对照	+	-	1.3	1.7

HPLC结果也说明在含有α-淀粉酶的所有样品中存在更大的麦芽寡糖。这些结果证明，三种嗜热酶可以在高温下一起发挥功能从玉米产生果糖。

实施例18

具有异构酶的淀粉酶面粉

另一实施例中，将淀粉酶面粉与纯化的MalA以及分别地两种细菌木糖异构酶(海栖热袍菌的XylA和从Diversa获得的命名为BD8037的酶)之每一种混合。按实施例18制备淀粉酶面粉。

在大肠杆菌中表达具有6His纯化标签的硫磺矿硫化叶菌。按实施例18制备细胞裂解物，然后使用镍亲和树脂(Probond，Invitrogen)按照生产商针对天然蛋白质纯化的教导，纯化至表观同质性。

在大肠杆菌中表达添加了S标签和ER滞留信号的海栖热袍菌XylA，并按实施例18中所述用与T.neapolitana XylA相同的方式制备。

木糖异构酶BD8037以冻干粉末形式获得，并重悬在0.4×最初体积的水中。

淀粉酶玉米面粉与酶溶液加水或缓冲液混合。所有反应含有60mg淀粉酶面粉和总共600μl的液体。一组反应使用室温pH7.0的50mMMOPS加上10mM MgSO₄和1mM CoCl₂缓冲；第二组反应中用水代替该含金属的缓冲液。如表4中所示，变化异构酶的量。所有反应90℃温育2小时。离心制备反应上清液级分。再用600μl H₂O洗涤沉淀并再次离心。将来自每个反应的上清液级分合并，通过Centricon10过滤，并利用带有ELSD检测的HPLC按照实施例17进行分析。图15为观察到的葡萄糖和果糖量的曲线图。

表 4

样品	淀粉酶面粉	MalA	异构酶
样品	淀粉酶面粉	MalA	异构酶	1	60mg	+	无
2	60mg	+	海栖热袍菌，100μl	1	60mg	+	无
2	60mg	+	海栖热袍菌，100μl	3	60mg	+	海栖热袍菌，10μl
4	60mg	+	海栖热袍菌，2μl	3	60mg	+	海栖热袍菌，10μl
4	60mg	+	海栖热袍菌，2μl	5	60mg	+	BD8037，100μl
7	60mg	+	BD8037，2μl	5	60mg	+	BD8037，100μl
7	60mg	+	BD8037，2μl	C	60mg	无	无

当反应中存在-淀粉酶和α-葡糖苷酶时，利用每一种异构酶都从玉米面粉以剂量依赖性方式产生了果糖。这些结果说明，谷粒表达的淀粉酶797GL3能够与MalA以及各种不同的嗜热异构酶在添加金属离子或不添加金属离子的情况下一起作用，以在高温下从玉米面粉产生果糖。在存在添加的金属离子的情况下，这些异构酶能够在90℃达到大约55％果糖的预期果糖∶葡萄糖平衡。这将优于需要色谱分离以增加果糖浓度的使用嗜温型异构酶的常规工艺。

实施例19

在玉米中表达支链淀粉酶

pNOV7013或pNOV7005纯合的转基因植物杂交，产生表达797GL3α-淀粉酶和6GP3支链淀粉酶两者的转基因玉米种子。

从转化了pNOV7005或pNOV7013的自花授粉玉米植物获得T1或T2种子。pNOV4093是6GP3的玉米优化型合成基因(SEQ ID NO：3，4)与用于融合蛋白在造粉体定位的造粉体引导序列(SEQ ID NO：7，8)的融合物。该融合蛋白在ADPgpp启动子(SEQ ID NO：11)的控制之下，以便在胚乳中特异地表达。pNOV7005构建体使支链淀粉酶的表达靶向胚乳的内质网中。该酶在ER中的定位允许淀粉在籽粒中正常积累。在任何高温接触前，也观察到碘溶液对淀粉的正常染色。

正如α-淀粉酶的情况中描述的，靶向造粉体的支链淀粉酶的表达导致籽粒中异常的淀粉积累。当干燥玉米穗时，籽粒皱缩。显然，此嗜热型支链淀粉酶在低温下具有充足的活性，如果允许其与种子胚乳中的淀粉粒直接接触，则其将水解淀粉。

从玉米面粉制备酶或提取酶：通过在Kleco研磨机中研磨转基因种子，然后在50mM NaOAc pH5.5缓冲液中不停振摇下室温温育面粉，从该转基因种子提取支链淀粉酶。然后14000rpm离心温育的混合物15min。使用上清液作为酶的来源。

支链淀粉酶试验：该试验反应在96孔板中进行。从玉米面粉提取的酶(100μl)用900μl含有40mM CaCl₂的50mM NaOAc pH5.5缓冲液稀释10倍。涡旋混合物，向每个反应混合物中加入1片Limit-Dextrizyme(天青蛋白(azurine)交联的支链淀粉，来自Megazyme)，75℃温育30分钟(或如所提及的)。在温育结束时，3500rpm离心反应混合物15分钟。稀释上清液5倍，并转移至96孔平底板用于590nm的吸光度测量。支链淀粉酶水解天青蛋白交联的支链淀粉底物产生水溶性染料片断，这些片断的释放速度(以590nm吸光度的增加来测量)直接与酶活性相关。

图9显示对来自不同pNOV7005转化事件的T2种子的分析。与非转基因对照相比，能够在许多事件中检测到支链淀粉酶活性的高表达。

向测定量(～100μg)的、来自转基因(表达支链淀粉酶或淀粉酶或两种酶)和/或对照(非转基因的)的干玉米面粉中，加入1000μl含有40mM CaCl₂的50mM NaOAc pH5.5缓冲液。涡旋反应混合物，摇床上孵育1小时。通过转移孵育混合物至高温(75℃，支链淀粉酶的最适反应温度或如图中所述温度)一段如图中所示的时间长度，启始酶促反应。通过在冰上冷却，终止反应。然后14000rpm离心反应混合物10分钟。将上清液的等分试样(100μl)稀释3倍，通过0.2微米过滤器过滤用于HPLC分析。

使用以下条件通过HPLC分析样品：

柱子：Alltech Prevall Carbohydrate E55微米250×4.6mm

检测器：Alltech ELSD2000

泵：Gilson322

注射器：Gilson215注射器/稀释剂

溶剂：HPLC级乙腈(Fisher Scientific)和水(由WatersMillipore System纯化)。

用于低聚合度(DP1-15)的寡糖的梯度：

时间	％水	％乙腈
时间	％水	％乙腈	0	15	85
5	15	85	0	15	85
5	15	85	25	50	50
35	50	50	25	50	50
35	50	50	36	80	20
55	80	20	36	80	20
55	80	20	56	15	85
76	15	85	56	15	85

用于高聚合度(DP20-100及以上)的糖的梯度：

时间	％水	％乙腈
时间	％水	％乙腈	0	35	65
60	85	15	0	35	65
60	85	15	70	85	15
85	35	65	70	85	15
85	35	65	100	35	65

用于数据分析的系统：Gilson Unipoint软件系统3.2版

图10A和10B显示在转基因玉米面粉中通过表达的支链淀粉酶从淀粉产生的水解产物的HPLC分析结果。表达支链淀粉酶的玉米的面粉在75℃反应缓冲液中温育30分钟，导致从玉米淀粉产生中等链长的寡糖(DP～10-30)和短链直链淀粉(DP～100-200)。该图也显示支链淀粉酶活性对钙离子存在的依赖性。

可以使用表达支链淀粉酶的转基因玉米产生脱支(α1-6键被切割)并因此具有高水平的直链淀粉/直链糊精的改性淀粉/糊精。此外，取决于所用淀粉的类型(例如，蜡质的、高直链淀粉等)，由支链淀粉酶产生的直链淀粉/糊精的链长度分布将发生变化，并因此将是该改性淀粉/糊精的特性。

使用支链淀粉作为底物，也证明了α1-6键的水解。从玉米面粉分离的该支链淀粉酶有效地水解了支链淀粉。对孵育结束时产生的产物的HPLC分析(如所述进行)显示出，如预期的，由于来自玉米的酶对支链淀粉分子中α1-6键的水解而导致的麦芽三糖的产生。

实施例20

在玉米中表达支链淀粉酶

通过从玉米面粉中提取接着进行PAGE和考马斯染色来进一步分析6gp 3支链淀粉酶的表达。通过Kleco研磨器中研磨种子30秒来制备玉米面粉。用1ml 50mM NaOAc pH5.5缓冲液从大约150mg面粉中提取酶。将混合物涡旋振荡，并在振摇器上于室温孵育1小时，随后在70℃孵育15分钟。然后离心混合物(室温下14000rpm 15分钟)，将上清液用于SDS-PAGE分析。观察到了大约95kD分子量的蛋白条带。使用商购获得的缀合染料的 limit-糊精(LIMIT-DEXTRIZYME，来自Megazyme，Ireland)对这些样品进行支链淀粉酶分析。高水平的嗜热型支链淀粉酶活性与95kD蛋白的存在相关。

转基因玉米种子的Western印迹和ELISA分析也证明了大约95kD蛋白的表达(表达于大肠杆菌)，所述蛋白与针对支链淀粉酶而产生的抗体反应。

实施例21

通过添加表达支链淀粉酶的玉米而增加淀粉水解速度和提高小链长(可发酵的)寡糖的产量

对来自两个反应混合物的淀粉水解产物实施如上所述的HPLC分析，产生图11A和11B中显示的数据。第一反应标示为“淀粉酶”，含有例如根据实施例4描述的方法制备的表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米面粉样品混合物[1∶1(w/w)]；第二反应混合物‘淀粉酶+支链淀粉酶’含有表达α-淀粉酶的转基因玉米和根据实施例19中所述方法制备的表达支链淀粉酶的转基因玉米的玉米面粉样品混合物[1∶1(w/w)]。获得结果支持在淀粉水解工艺期间联合使用支链淀粉酶和α-淀粉酶的益处。这些益处来自于淀粉水解速度的增加(图11A)以及具有低DP的可发酵寡糖的产量增加(图11B)。

已经发现，玉米中单独表达的α-淀粉酶或联合表达的α-淀粉酶与支链淀粉酶(或任何其它淀粉水解酶组合)都可以用于产生麦芽糖糊精(直链的或支链的寡糖)(图11A、11B、12和13A)。取决于反应条件、水解酶的类型以及其组合、和所用的淀粉类型，产生的麦芽糖糊精的组成以及由此它们的性质都将发生变化。

图12描述以类似于针对图11描述的方式实施实验的结果。图中显示了在温育反应期间使用的不同温度和时间方案。支链淀粉酶的最适反应温度是75℃，α-淀粉酶的是＞95℃。因此，采用所示方案以便理解支链淀粉酶和/或α-淀粉酶在其各自最适反应温度下实施的催化。从所示结果可以清楚地推导出，α-淀粉酶和支链淀粉酶的联合在60分钟的温育期结束时在水解玉米淀粉方面表现更好。

HPLC分析(如上述，除了在这些反应中使用～150mg玉米面粉外)30分钟温育结束时来自两组反应混合物的淀粉水解产物，结果显示在图13A和13B中。第一组反应在85℃温育，第二组反应在95℃温育。对于每一组，都存在两个反应混合物；第一个反应标示为‘淀粉酶×支链淀粉酶’，其含有来自表达α-淀粉酶和支链淀粉酶两者的转基因玉米(通过异花传粉产生)的面粉；第二个反应标示为‘淀粉酶’，其含有表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米面粉样品混合物，在此两种玉米面粉样品的混合比例使得可以获得与杂种(淀粉酶×支链淀粉酶)中观察到的相同量的α-淀粉酶活性。当在85℃温育玉米面粉样品时，低DP寡糖的总产量在α-淀粉酶和支链淀粉酶杂交的情况下大于单独表达α-淀粉酶的玉米。95℃的温育温度使支链淀粉酶失活(至少部分地)，因此在‘淀粉酶×支链淀粉酶’和‘淀粉酶’之间几乎观察不到差异。然而，与单独表达α-淀粉酶的玉米相比，当使用α-淀粉酶和支链淀粉酶的玉米面粉时，来自两个温育温度的数据均表现出在温育期结束时产生的葡萄糖量有显著的改进(图13B)。因此，使用表达α-淀粉酶和支链淀粉酶两者的玉米可能对于其中重要的是将淀粉完全水解成葡萄糖的工艺而言尤其有利。

以上实施例提供了丰富的依据来支持当与α-淀粉酶联用时玉米种子中表达支链淀粉酶可以改善淀粉水解过程。支链淀粉酶活性是α1-6键特异的，其比α-淀粉酶(α-1-4键特异的酶)在使淀粉脱分支方面远远更为有效，由此降低了支链寡糖(例如，极限糊精、潘糖；这些通常是不可发酵的)的量并增加了直链短寡糖(可以容易地发酵成乙醇等)的量。其次，由于支链淀粉酶催化的脱分支导致的淀粉分子的片段化，增加了α-淀粉酶的底物可接近性，由此导致α-淀粉酶催化反应的效率增加。

实施例22

为了确定797GL3α淀粉酶和malAα葡糖苷酶可以在相似的pH和温度条件下起作用以相对于单独任一种酶而言产生增加量的葡萄糖，将大约0.35μg malAα葡糖苷酶(在细菌中产生)加入含有1％淀粉以及从非转基因玉米种子(对照)或797GL3转基因玉米种子(在797GL3转基因玉米种子中α淀粉酶与淀粉共纯化)纯化的淀粉的溶液中。此外，在无任何malA酶存在的情况下，将从非转基因的和797GL3转基因的玉米种子纯化的淀粉加入1％玉米淀粉。混合物在90℃，pH6.0温育1小时，离心除去任何不溶性物质，通过HPLC分析可溶性级分的葡萄糖水平。如图14中所示，797GL3α-淀粉酶和malAα-葡糖苷酶在相似的pH和温度下起作用，将淀粉分解为葡萄糖。所产生的葡萄糖量显著地高于单独任一种酶所产生的葡萄糖量。

实施例23

测定热厌氧杆菌属葡糖淀粉酶在生淀粉水解中的用途。如图15中所示，用水、大麦α-淀粉酶(来自Sigma的商业制品)、热厌氧杆菌属葡糖淀粉酶测定生淀粉的水解转化，在室温和30℃确定其组合。如所示，大麦α-淀粉酶和热厌氧杆菌属葡糖淀粉酶的组合能够将生淀粉水解成葡萄糖。而且，通过大麦淀粉酶和热厌氧杆菌属GA产生的葡萄糖量高于单独任一种酶所产生的葡萄糖量。

实施例24

用于生淀粉水解的玉米优化型基因和序列以及用于植物转化的载体

基于在大约20℃至50℃的温度下水解生淀粉的能力，选择酶。然后通过使用玉米优化的密码子设计相应的基因或基因片段以便如实施例1中所述构建合成的基因。

选择Aspergillus shirousamiα-淀粉酶/葡糖淀粉酶融合多肽(无信号序列)，其具有Biosci.Biotech.Biochem.，56：884-889(1992)；Agric.Biol.Chem.545：1905-14(1990)；Biosci.Biotechol.Biochem.56：174-79(1992)中鉴定的、SEQ ID NO：45中所示的氨基酸序列。设计玉米优化型核酸，并以SEQ ID NO：46给出。

相似地，选择Thermoanaerobacter thermosaccharolyticum葡糖淀粉酶，其具有Biosci.Biotech.Biochem.62：302-308(1998)公布的SEQ ID NO：47的氨基酸。设计玉米优化型核酸(SEQ ID NO：48)。

选择具有文献(Agric.Biol.Chem.(1986)50，pg957-964)中描述的氨基酸序列(无信号序列)(SEQ ID NO：50)的米根霉葡糖淀粉酶。设计玉米优化型核酸，在SEQ ID NO：51中给出。

此外，选择玉米α-淀粉酶，从文献获得氨基酸序列(SEQ ID NO：51)和核酸序列(SEQ ID NO：52)。见例如Plant Physiol.105：759-760(1994)。

构建表达盒，以从SEQ ID NO：46中给出的经设计的玉米优化型核酸表达Aspergillus shirousamiα-淀粉酶/葡糖淀粉酶融合多肽、从SEQ ID NO：48中给出的经设计的玉米优化型核酸表达Thermoanaerobacter thermosaccharolyticum葡糖淀粉酶、从SEQ ID NO：50中给出的经设计的玉米优化型核酸表达具有氨基酸序列(无信号序列)(SEQ ID NO：49)的选定米根霉葡糖淀粉酶、以及表达α-淀粉酶。

含有玉米γ玉米醇溶蛋白N端信号序列(MRVLLVALALLALAA SATS)(SEQ ID NO：17)的质粒与编码酶的合成基因融合。任选地，将序列SEKDEL融合于合成基因的C端，以便靶向并滞留在ER中。将融合物克隆在植物转化质粒中用于在胚乳中获得特异表达的玉米γ玉米醇溶蛋白启动子之后。融合物通过农杆菌转染递送至玉米组织。

实施例25

构建含有选定的酶的表达盒以表达这些酶。含有生淀粉结合位点的序列的质粒与编码酶的合成基因融合。生淀粉结合位点允许酶融合物与未糊化的淀粉结合。基于文献确定了该生淀粉结合位点氨基酸序列(SEQID NO：53)，并基于玉米优化了核酸序列，给出SEQ ID NO：54。玉米优化型核酸序列与编码酶的合成基因在用于植物中表达的质粒中融合。

实施例26

构建玉米优化型基因和用于植物转化的载体

利用玉米优选的密码子设计基因或基因片段，以便如实施例1中所述构建合成基因。

选择强烈炽热球菌EGLA——嗜高热内切葡聚糖酶氨基酸序列(无信号序列)，其具有Journal of Bacteriology(1999)181，284-290页)中鉴定的、SEQ ID NO：55中所示的氨基酸序列。设计玉米优化型核酸并在SEQ ID NO：56中给出。

选择The rmus flavus木糖异构酶，其具有Applied Biochemistryand Biotechnology 62：15-27(1997)中所述的、SEQ ID NO：57中所示氨基酸序列。

构建表达盒，以从玉米优化型核酸(SEQ ID NO：56)表达强烈炽热球菌EGLA(内切葡聚糖酶)，从编码氨基酸序列SEQ ID NO：57的玉米优化型核酸表达Thermus flavus木糖异构酶。含有玉米γ玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO：17)的质粒与编码酶的玉米优化型合成基因融合。任选地，将序列SEKDEL融合于合成基因的C端以便靶向和滞留在ER中。在植物转化质粒中，将融合物克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。融合物通过农杆菌转染而递送至玉米组织。

实施例27

使用玉米中表达的嗜热酶从玉米面粉产生葡萄糖

已经证实，嗜高热α-淀粉酶797GL3和α-葡糖苷酶(MalA)的表达可以导致当与水性溶液混合并90℃温育时产生葡萄糖。

通过测定α-葡糖苷酶活性(以对硝基苯基-α-葡萄糖的水解指示)，鉴定表达MalA酶的转基因玉米系(168A10B系，pNOV4831)。

将来自表达797GL3的转基因植物的玉米籽粒在Kleco槽中研磨成面粉，由此产生淀粉酶面粉。将来自表达MalA的转基因植物的玉米籽粒在Kleco槽中研磨成面粉，由此产生MalA面粉。以相同方式研磨非转基因的玉米籽粒，以产生对照面粉。

缓冲液是50mM MES缓冲液，pH6.0。

玉米面粉水解反应：按下表5所示制备样品。将玉米面粉(每份样品大约60mg)与40ml 50mM MES缓冲液pH6.0混合。样品在设定于90℃的水浴中温育2.5和14小时。在所示温育时间，取出样品并分析葡萄糖含量。

通过基于葡萄糖氧化酶/辣根过氧化物酶的实验，分析样品中的葡萄糖。GOPOD试剂含有：0.2mg/ml邻联二茴香胺、100mM Tris pH7.5、100U/ml葡萄糖氧化酶&10U/ml辣根过氧化物酶。20μl样品或稀释的样品在96孔板中与葡萄糖标准品(从0至0.22mg/ml变化)一起进行分析。在混合下向每孔加入100μl GOPOD试剂，37℃温育板子30分钟。加入100μl硫酸(9M)，读取540nm的吸光度。参考标准曲线，确定样品的葡萄糖浓度。表5中显示了每个样品中观察到的葡萄糖量。

表 5

样品	WT面粉mg	淀粉酶面粉mg	MalA面粉mg	缓冲液ml	葡萄糖2.5hmg	葡萄糖14hmg
样品	WT面粉mg	淀粉酶面粉mg	MalA面粉mg	缓冲液ml	葡萄糖2.5hmg	葡萄糖14hmg	1	66	0	0	40	0	0
2	31	30	0	40	0.26	0.50	1	66	0	0	40	0	0
2	31	30	0	40	0.26	0.50	3	30	0	31.5	40	0	0.09
4	0	32.2	30.0	40	2.29	12.30	3	30	0	31.5	40	0	0.09
4	0	32.2	30.0	40	2.29	12.30	5	0	6.1	56.2	40	1.16	8.5 2

这些数据说明，当嗜高热α淀粉酶和α葡糖苷酶在玉米中表达时将导致在适当条件下水合及加热玉米产物时该玉米产物产生葡萄糖。

实施例28

产生麦芽糖糊精

使用表达嗜热α-淀粉酶的谷粒制备麦芽糖糊精。此示例性方法既无需淀粉的预先分离也无需添加外源酶。

将来自表达797GL3的转基因植物的玉米籽粒在Kleco槽中研磨成面粉，产生“淀粉酶面粉”。以相同方式研磨10％转基因的/90％非转基因的籽粒的混合物，产生“10％淀粉酶面粉”。

将淀粉酶面粉和10％淀粉酶面粉(大约60mg/样品)与水按照每mg面粉5μl水的比例混合。如表6所示，所得浆液在90℃温育不超过20小时。85℃添加0.9ml 50mM EDTA以终止反应，并通过抽吸进行混合。取出0.2ml浆液的样品，离心除去不溶性物质，并在水中稀释3倍。

利用带有ELSD检测的HPLC分析样品的糖(sugar)和麦芽糖糊精。该梯度HPLC系统配备有Astec Polymer Amino柱、5微米粒径、250×4.6mm以及Altech ELSD 2000检测器。系统使用水∶乙腈的15∶85混合物预先平衡。流速为1ml/min。注射后维持初始条件5分钟，之后20分钟的梯度至50∶50水∶乙腈，之后10分钟的相同溶剂。系统使用20min 80∶20水∶乙腈洗涤，然后使用起始溶剂重新平衡。

所得峰面积基于面粉的体积和重量进行标化。每μg碳水化合物的ELSD反应因子随着DP的增加而降低，因此较高DP的麦芽糖糊精比峰面积所示的在总体中占有更高的百分比。

图17显示具有100％淀粉酶面粉的反应的产物的相对峰面积。图18显示具有10％淀粉酶面粉的反应的产物的相对峰面积。

这些数据说明，通过变化加热时间可以产生各种麦芽糖糊精混合物。通过将表达α-淀粉酶的转基因玉米与野生型玉米混合，可以改变α-淀粉酶活性的水平，从而改变麦芽糖糊精谱。

此实施例中描述的水解反应的产物可以利用各种被充分阐述的方法，包括：离心、过滤、离子交换、凝胶渗透、超滤、纳米过滤、反渗透、利用碳颗粒脱色、喷雾干燥和本领域已知的其它标准技术，浓缩和纯化以用于食物和其它应用。

实施例29

时间和温度对麦芽糖糊精生产的影响

通过含有嗜热α-淀粉酶的谷粒的自水解产生的麦芽糖糊精产物的组成可以通过变化反应的时间和温度而改变。

另一实验中，按以上实施例28中所述制备淀粉酶面粉，并与水按照每60mg面粉300μl水的比例混合。样品70℃、80℃、90℃或100℃温育不超过90分钟。90℃添加900ml 50mM EDTA终止反应，离心除去不溶性物质，并通过0.45μm尼龙滤器过滤。按照实施例28中所述，利用HPLC分析滤过物。

图19中给出了此分析的结果。DP数命名法指聚合度。DP2是麦芽糖；DP3是麦芽三糖等。在靠近洗脱末尾的单峰中洗脱的、较大DP的麦芽糖糊精被标记为“＞DP12”。此集合物包括通过0.45μm滤器并通过保护柱的糊精，并且不包括被滤器和保护柱挡住的任何非常大的淀粉片断。

该实验证明，产物的麦芽糖糊精组成可以通过变化温度和温育时间而改变，从而获得期望的麦芽寡糖或麦芽糖糊精产物。

实施例30

麦芽糖糊精的生产

从含有嗜热α-淀粉酶的转基因玉米产生的麦芽糖糊精产物的组成，也可以通过添加其它的酶，例如α-葡糖苷酶和木糖异构酶以及通过在热处理之前于面粉水混合物中包括盐类，而改变。

另一实验中，将按上述制备的淀粉酶面粉与纯化的MalA和/或命名为BD8037的细菌木糖异构酶混合。具有6His纯化标签的硫磺矿硫化叶菌MalA在大肠杆菌中表达。按实施例28中所述制备细胞裂解物，然后使用镍亲和树脂(Probond，Invitrogen)，按照生产商提供的用于天然蛋白质纯化的说明书，纯化至表观同质性。木糖异构酶BD8037以冻干粉末形式从Diversa获得，并重悬在0.4倍最初体积的水中。

将淀粉酶玉米面粉与酶溶液加水或缓冲液混合。所有反应均含有60mg淀粉酶面粉和总共600μl液体。一组反应采用室温pH7.0的50mMMOPS加10mM MgSO₄和1mM CoCl₂缓冲；在第二组反应中，用水替代此含金属的缓冲溶液。所有反应在90℃温育2小时。离心制备反应上清液级分。再使用600μl H₂O洗涤沉淀，并重新离心。将来自每个反应的上清液级分分别合并，通过Centricon 10过滤，并使用带有ELSD检测的HPLC按上述进行分析。

结果绘制在图20中。它们说明，表达淀粉酶797GL3的谷粒可以与其它嗜热酶一起在有或无添加的金属离子的情况下一起发挥作用，在高温下从玉米面粉产生各种麦芽糖糊精混合物。尤其是，将葡糖淀粉酶或α-葡糖苷酶包括在内可以导致具有更多葡萄糖和其它低DP产物的产物。将具有葡萄糖异构酶活性的酶包括在内可以导致具有果糖并由此比单独淀粉酶或淀粉酶加α-葡糖苷酶产生的产物更甜的产物。此外，这些数据也说明，通过包括二价阳离子盐，例如CoCl₂和MgSO₄，可以增加DP5、DP6和DP7麦芽寡糖的比例。

改变在诸如此处所述的反应中产生的麦芽糖糊精的组成的其它方式包括：变化反应pH、变化转基因的或非转基因的谷粒中的淀粉类型、变化固体比率、或添加有机溶剂。

实施例31

在回收淀粉衍生产物之前不经机械破碎谷粒而从谷粒制备糊精或糖(sugar)

通过将表达α-淀粉酶797GL3的转基因谷粒与水接触并加热至90℃过夜(＞14小时)，由此制备糖(sugar)和麦芽糖糊精。然后通过过滤将液体与谷粒分开。利用实施例15中所述方法，通过HPLC分析液体产物。表6给出检测到的产物谱。

表 6

分子种类	产物浓度μg/25μl注射
分子种类	产物浓度μg/25μl注射	果糖	0.4
葡萄糖	18.0	果糖	0.4
葡萄糖	18.0	麦芽糖	56.0
DP3*	26.0	麦芽糖	56.0
DP3*	26.0	DP4*	15.9
DP5*	11.3	DP4*	15.9
DP5*	11.3	DP6*	5.3
DP7*	1.5	DP6*	5.3

*DP3的定量包括麦芽三糖并可能包括具有代替α(1→4)键的α(1→6)键的麦芽三糖异构体。类似地，DP4至DP7的定量包括给定链长的线性麦芽寡糖以及具有一个或多个代替α(1→4)键的α(1→6)键的异构体。

这些数据说明，可以通过使完整的表达α-淀粉酶的谷粒与水接触并加热，而制备糖(sugar)和麦芽糖糊精。这些产物然后可以通过过滤或离心或通过重力沉降与完整谷粒分开。

实施例32

发酵表达米根霉葡糖淀粉酶的玉米中的生淀粉

从按实施例29所述制备的转基因植物收获转基因玉米籽粒。将籽粒研磨成面粉。该玉米籽粒表达含有被引导至内质网的米根霉葡糖淀粉酶活性片段(SEQ ID NO：49)的蛋白质。

按实施例15所述，将玉米籽粒研磨成面粉。然后制备含有20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8％固体)的醪液。添加氢氧化铵调节pH至6.0。向醪液中加入以下成分：蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mgLactocide &尿素(0.85ml 10倍稀释的50％尿素液体)。在含有醪液的100ml瓶子的盖上挖一个洞，以允许CO₂排出。然后用酵母(1.44ml)接种醪液，在设定于90℃的水浴中温育。24小时发酵后，将温度降至86℃；在48小时时将温度设定在82℃。

用于接种的酵母按实施例14繁殖。

按实施例14中所述取样品，然后通过实施例14中所述方法分析。

实施例33

从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。将籽粒研磨成面粉。该玉米籽粒表达含有被引导至内质网的米根霉葡糖淀粉酶活性片段(SEQ ID NO：49)的蛋白质。

用于接种的酵母按实施例14繁殖。

实施例34

在添加外源α-淀粉酶的情况下发酵表达米根霉葡糖淀粉酶的玉米的完整籽粒中的生淀粉的实例

从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达含有被引导至内质网的米根霉葡糖淀粉酶活性片段(SEQ ID NO：49)的蛋白质。

玉米籽粒与20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8％固体)接触。添加氢氧化铵调节pH至6.0。加入以下成分：购自Sigma的大麦α-淀粉酶(2mg)、蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mg Lactocide &尿素(0.85ml 10倍稀释的50％尿素液体)。在含有此混合物的100ml瓶子的盖上挖一个洞，以允许CO₂排出。然后用酵母(1.44ml)接种混合物，在设定于90℃的水浴中温育。24小时发酵后，将温度降至86℃；在48小时时将温度设定在82℃。

用于接种的酵母按实施例14繁殖。

实施例35

表达米根霉葡糖淀粉酶和玉蜀黍淀粉酶的玉米中的生淀粉的发酵

从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达含有被引导至内质网的米根霉葡糖淀粉酶活性片段(SEQ ID NO：49)的蛋白质。该籽粒也表达具有如实施例28中所述的生淀粉结合域的玉米淀粉酶。

按实施例14所述，将玉米籽粒研磨成面粉。然后制备含有20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8％固体)的醪液。添加氢氧化铵调节pH至6.0。向醪液中加入以下成分：蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mgLactocide &尿素(0.85ml 10倍稀释的50％尿素液体)。在含有醪液的100ml瓶子的盖上挖一个洞，以允许CO₂排出。然后用酵母(1.44ml)接种醪液，在设定于90F的水浴中温育。24小时发酵后，将温度降至86F；在48小时时将温度设定在82F。

用于接种的酵母按实施例14繁殖。

实施例36

表达Thermoanaerobacter thermosaccharolyticum葡糖淀粉酶的玉米中的生淀粉的发酵实例

从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达含有被引导至内质网的Thermoanaerobacterthermosaccharolyticum葡糖淀粉酶活性片段(SEQ ID NO：47)的蛋白质。

用于接种的酵母按实施例14繁殖。

实施例37

表达黑曲霉葡糖淀粉酶的玉米中的生淀粉的发酵实例

从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达含有黑曲霉葡糖淀粉酶活性片段(Fiil，N.P.，“从两种不同但紧密相关的mRNA合成黑曲霉的葡糖淀粉酶G1和G2”，EMBOJ3(5)，1097-1102(1984)，登录号P04064)的蛋白质。编码该葡糖淀粉酶的玉米优化型核酸具有SEQ ID NO：59，并被引导至内质网。

按实施例14所述，将玉米籽粒研磨成面粉。然后制备含有20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8％固体)的醪液。添加氢氧化铵调节pH至6.0。向醪液中加入以下成分：蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mgLactocide &尿素(0.85ml 10倍稀释的50％尿素液体)。在含有醪液的100ml瓶子的盖上挖一个洞，以允许CO₂排出。然后用酵母(1.44ml)接种醪液，在设定于90℃的水浴中温育。24小时发酵后，将温度降至86℃；在48小时时将温度设定在82℃。

用于接种的酵母按实施例14繁殖。

实施例38

表达黑曲霉葡糖淀粉酶和玉蜀黍淀粉酶的玉米中的生淀粉的发酵实例

从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达含有黑曲霉葡糖淀粉酶活性片段(Fiil，N.P.，“从两种不同但紧密相关的mRNA合成黑曲霉的葡糖淀粉酶G1和G2”，EMBOJ3(5)，1097-1102(1984)，登录号P04064)(SEQ ID NO：59，玉米优化型核酸)并被引导至内质网的蛋白质。该籽粒也表达具有实施例28中所述的生淀粉结合域的玉米淀粉酶。

用于接种的酵母按实施例14繁殖。

实施例39

表达Thermoanaerobacter thermosaccharolyticum葡糖淀粉酶和大麦淀粉酶的玉米中的生淀粉的发酵实例

从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达含有被引导至内质网的Thermoanaerobacterthermosaccharolyticum葡糖淀粉酶活性片段(SEQ ID NO：47)的蛋白质。该籽粒也表达低pI大麦淀粉酶amyl基因(Rogers，J.C.和Milliman，C.“分离和序列分析大麦α-淀粉酶cDNA克隆”，J.Biol.Chem.258(13)，8169-8174(1983)，该基因经过修饰使得该蛋白质靶向内质网表达。

用于接种的酵母按实施例14繁殖。

实施例40

表达Thermoanaerobacter thermosaccharolyticum葡糖淀粉酶和大麦淀粉酶的玉米的完整籽粒中的生淀粉的发酵实例

玉米籽粒与20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8％固体)接触。添加氢氧化铵调节pH至6.0。向混合物中加入以下成分：蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mg Lactocide &尿素(0.85ml 10倍稀释的50％尿素液体)。在含有该醪液的100ml瓶子的盖上挖一个洞，以允许CO₂排出。然后用酵母(1.44ml)接种此混合物，在设定于90℃的水浴中温育。24小时发酵后，将温度降至86℃；在48小时时将温度设定在82℃。

用于接种的酵母按实施例14繁殖。

实施例41

表达α-淀粉酶和葡糖淀粉酶的玉米中的生淀粉发酵实例

从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达诸如SEQ ID NO：46中提供的玉米优化型多核苷酸，该多核苷酸编码诸如SEQ ID NO：45中提供的、被引导至内质网的α-淀粉酶和葡糖淀粉酶融合物。

用于接种的酵母按实施例14繁殖。

实施例42

构建转化载体

构建下述表达盒以在玉米中表达嗜高热β-葡聚糖酶EglA：

pNOV4800含有与EglAβ-葡聚糖酶的合成基因融合的大麦Amy32b信号肽(MGKNGNLCCFSLLLLLLAGLASGHQ)，以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

pNOV4803含有与EglAβ-葡聚糖酶的合成基因融合的大麦Amy32b信号肽，以便靶向内质网和在质外体中分泌。融合物被克隆在用于在整个植物中实现表达的玉米泛素启动子之后。

构建下述表达盒，以便在玉米中表达嗜热β-葡聚糖酶/甘露聚糖6GPl(SEQ ID NO：85)：

pNOV4819含有与6GPlβ-葡聚糖酶/甘露聚糖酶的合成基因融合的烟草PRla信号肽(MGFVLFSQLPSFLLVSTLLLFLVISHSCRA)，以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

pNOV4820含有克隆在用于细胞质定位和胚乳中特异表达的玉米γ-玉米醇溶蛋白启动子之后的6GP1合成基因。

pNOV4823含有与C端添加了序列KDEL的6GP1β-葡聚糖酶/甘露聚糖酶合成基因融合的烟草PR1a信号肽，以便靶向和滞留在内质网中。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

pNOV4825包含与C端添加了序列KDEL的6GP1β-葡聚糖酶/甘露聚糖酶合成基因融合的烟草PR1a信号肽，以便靶向和滞留在内质网中。融合物被克隆在用于在整个植物中实现表达的玉米泛素启动子之后。

构建下述表达盒以在玉米中表达大麦Amy1α-淀粉酶(SEQ ID NO：87)：

pNOV4867含有与C端添加了序列SEKDEL的大麦AmyIα-淀粉酶融合的玉米γ-玉米醇溶蛋白N端信号序列，以便靶向和滞留在内质网中。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

pNOV4879含有与C端添加了序列SEKDEL的大麦AmyIα-淀粉酶融合的玉米γ-玉米醇溶蛋白N端信号序列，以便靶向和滞留在内质网中。融合物被克隆在用于在胚中实现特异表达的玉米球蛋白启动子之后。

pNOV4897含有与大麦AmyIα-淀粉酶融合的玉米γ-玉米醇溶蛋白N端信号序列，以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚中实现特异表达的玉米球蛋白启动子之后。

pNOV4895含有与大麦AmyIα-淀粉酶融合的玉米γ-玉米醇溶蛋白N端信号序列，以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

pNOV4901含有克隆在用于细胞质定位和胚中特异表达的玉米球蛋白启动子之后的大麦AmyIα-淀粉酶基因。

构建如下的表达盒以在玉米中表达根霉属葡糖淀粉酶(SEQ ID NO：50)：

pNOV4872含有与C端添加了序列SEKDEL的根霉属葡糖淀粉酶合成基因融合的玉米γ-玉米醇溶蛋白N端信号序列，以便靶向和滞留在内质网中。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

pNOV4880含有与C端添加了序列SEKDEL的根霉属葡糖淀粉酶合成基因融合的玉米γ-玉米醇溶蛋白N端信号序列，以便靶向和滞留在内质网中。融合物被克隆在用于在胚中实现特异表达的玉米球蛋白启动子之后。

pNOV4889含有与根霉属葡糖淀粉酶合成基因融合的玉米γ-玉米醇溶蛋白N端信号序列，以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚中实现特异表达的玉米球蛋白启动子之后。

pNOV4890含有与根霉属葡糖淀粉酶合成基因融合的玉米γ-玉米醇溶蛋白N端信号序列，以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

pNOV4891含有克隆在用于细胞质定位和胚乳中特异表达的玉米γ-玉米醇溶蛋白启动子之后的根霉属葡糖淀粉酶合成基因。

实施例43

在玉米中表达嗜温型根霉属葡糖淀粉酶

制备用于在玉米中表达根霉属葡糖淀粉酶的各种构建体。使用玉米γ-玉米醇溶蛋白启动子和球蛋白启动子分别在胚乳或胚中特异地表达葡糖淀粉酶。此外，使用玉米γ-玉米醇溶蛋白信号序列和合成的ER滞留信号调节葡糖淀粉酶蛋白的亚细胞定位。所有5个构建体(pNOV4872、pNOV4880、pNOV4889、pNOV4890和pNOV4891)均产生在种子中检测到葡糖淀粉酶活性的转基因植物。表7和8分别显示各单个转基因种子(构建体pNOV4872)和汇合的种子(构建体pNOV4889)的结果。对于表达此根霉属葡糖淀粉酶的任何转基因植物，均未观察到有害的表型。

葡糖淀粉酶试验：将种子研磨成面粉，将面粉悬浮在水中。30度温育样品50分钟，以允许葡糖淀粉酶与淀粉反应。沉淀不溶性物质，测定上清液中葡萄糖的浓度。以每个样品中释放的葡萄糖量指示存在的葡糖淀粉酶水平。通过样品与DOHOD试剂(300mM Tris/Cl pH7.5，葡萄糖氧化酶(20U/ml)、辣根过氧化物酶(20U/ml)、邻联二茴香胺0.1mg/ml)一起37℃温育30分钟，添加0.5体积的12N H₂SO₄和测定OD540，确定葡萄糖的浓度。

表7显示在各单个转基因玉米种子中(构建体pNOV4872)的根霉属葡糖淀粉酶活性。

表 7

U/g

种子面粉

野生型#1 0.07

野生型#2 0.55

野生型#3 0.25

野生型#4 0.33

野生型#5 0.30

野生型#6 0.42

野生型#7 -0.01

野生型#8 0.31

MD9L022156#1 5.17

MD9L022156#2 1.66

MD9L022156#3 7.66

MD9L022156 #4 1.77

MD9L022156#5 7.08

MD9L022156#6 4.46

MD9L022156#7 2.20

MD9L022156#8 3.50

MD9L023377#1 9.23

MD9L023377#2 4.30

MD9L023377#3 6.72

MD9L023377#4 3.35

MD9L023377#5 0.56

MD9L023377#6 4.79

MD9L023377#7 4.60

MD9L023377#8 6.01

MD9L023043#1 4.93

MD9L023043#2 8.74

MD9L023043#3 2.70

MD9L023043#4 0.72

MD9L023043#5 3.33

MD9L023043#6 3.53

MD9L023043#7 3.94

MD9L023043#8 11.51

MD9L023334#1 4.28

MD9L023334#2 2.86

MD9L023334#3 0.56

MD9L023334#4 6.96

MD9L023334#5 3.29

MD9L023334#6 3.18

MD9L023334#7 4.57

MD9L023334#8 7.44

MD9L022039#1 6.25

MD9L022039#2 2.85

MD9L022039#3 4.32

MD9L022039#4 2.51

MD9L022039#5 5.06

MD9L022039#6 5.03

MD9L022039#7 2.79

MD9L022039#8 2.98

表8显示在汇合的转基因玉米种子中(构建体pNOV4889)根霉属葡糖淀粉酶的活性

表 8

U/g

种子面粉

野生型 0.38

MD9L023347 2.14

MD9L023352 2.34

MD9L023369 1.66

MD9L023469 1.42

MD9L023477 1.33

MD9L023482 1.95

MD9L023484 1.32

MD9L024170 1.35

MD9L024177 1.48

MD9L024184 1.60

MD9L024186 1.34

MD9L024196 1.38

MD9L024228 1.69

MD9L024263 1.70

MD9L024315 1.32

MD9L024325 1.73

MD9L024333 1.41

MD9L024339 1.84

将所有的表达盒都插入二元载体pNOV2117中，以便通过农杆菌感染转染至玉米中。该二元载体含有允许使用甘露糖选择转基因细胞的磷酸甘露糖异构酶(PMI)基因。使转化的玉米植物自花授粉或远交，收集种子用于分析。

实施例44

在玉米中表达嗜高热β-葡聚糖酶Eg1A

为了在玉米中表达嗜高热β-葡聚糖酶Eg1A，我们使用了用于在整个植物中实现表达的泛素启动子和用于在玉米种子的胚乳中实现特异表达的γ-玉米醇溶蛋白启动子。大麦Amy32b信号肽与Eg1A融合以实现在质外体中的定位。

使用酶学试验和Western印迹，在转基因玉米种子和叶中分析嗜高热β-葡聚糖酶Eg1A的表达。

使用针对β-葡聚糖酶的western印迹和酶学试验，分析基于构建体pNOV4800或pNOV4803分离的转基因种子。在水中浸渍48小时后，从各单个种子中分离胚乳。通过在50mM NaPO₄缓冲液(pH6.0)中研磨胚乳，提取蛋白质。通过50℃加热提取物15分钟，之后沉淀不溶性物质，而分离热稳定的蛋白质。含有热稳定蛋白质的上清液使用氮(azo)-大麦葡聚糖方法(megazyme)分析β葡聚糖酶活性。样品100℃预先温育10分钟，之后使用氮-大麦葡聚糖底物在100℃进行10分钟试验。温育后，向每个样品添加3体积的沉淀溶液，离心样品1分钟，测定每个上清液的OD590。此外，通过SDS-PAGE分离5μg蛋白质，印迹在硝化纤维素上使用抗Eg1A蛋白质的抗体进行western印迹分析。Western印迹分析在Eg1A阳性胚乳提取物中而非在阴性提取物中检测到特定的热稳定蛋白质。Western印迹信号与酶学检测到的Eg1A活性水平相关。

在分别含有转基因构建体pNOV4803和pNOV4800的植物的叶和种子中分析Eg1A活性。这些试验(如上述实施)显示，在转基因植物的叶(表9)和种子(表10)中热稳定β-葡聚糖酶Eg1A以各种水平表达，而在非转基因的对照植物中没有检测到活性。利用构建体pNOV4800和pNOV4803在玉米中实现的Eg1A表达不导致任何可检测的负面表型。

表9显示在转基因玉米植物的叶中嗜高热β-葡聚糖酶Eg1A的活性。对来自pNOV4803转基因植物叶的提取物实施酶学分析，以检测嗜高热β-葡聚糖酶活性。使用氮-大麦葡聚糖方法(megazyme)，在100℃实施试验。结果说明，转基因叶具有变化水平的嗜高热β-葡聚糖酶活性。

表 9

植物 Abs590

野生型 0

266A-17D 0.008

266A-18E 0.184

266A-13C 0.067

266A-15E 0.003

266A-11E 0

265C-1B 0.024

265C-1C 0.065

265C-2D 0.145

265C-5C 0.755

265C-5D 0.133

265C-3A 0.076

266A-4B 0.045

266A-12B 0.066

266A-11C 0.096

266A-14B 0.074

266A-4C 0.107

266A-4A 0.084

266A-12A 0.054

266A-15B 0.052

266A-11A 0.109

266A-20C 0.044

266A-19D 0.02

266A-12C 0.098

266A-4E 0.248

266A-18B 0.367

265C-3D 0.066

266A-20E 0.163

266A-13D 0.084

265C-3B 0.065

266A-15A 0.131

266A-13A 0.169

265C-3E 0.116

266A-20A 0.365

266A-20B 0.521

266A-19C 0.641

266A-20D 0.561

266A-4D 0.363

266A-18A 0.676

265C-5E 0.339

266A-17E 0.221

266A-11B 0.251

265C-4E 0.138

265C-4D 0.242

表10显示转基因玉米植物种子中嗜高热β-葡聚糖酶Eg1A的活性。在来自pNOV4800转基因植物的各单个分离种子的提取物上实施酶学分析，以检测嗜高热β-葡聚糖酶活性。使用氮-大麦葡聚糖方法(megazyme)在100℃进行试验。结果说明，转基因种子具有变化水平的嗜高热β-葡聚糖酶活性。

表 10

种子 Abs590

野生型 0

1A 1.1

1B 0

1C 1.124

1D 1.323

2A 0

2B 1.354

2C 1.307

2D 0

3A 0.276

3B 0.089

3C 0.463

3D 0

4A 0.026

4B 0.605

4C 0.599

4D 0.642

5A 1.152

5B 1.359

5C 1.035

5D 0

6A 0.006

6B 1.201

6C 0.034

6D 1.227

7A 0.465

7B 0

7C 0.366

7D 0.77

8A 1.494

8B 1.427

8C 0.003

8D 1.413

内切葡聚糖酶Eg1A的转基因表达对细胞壁组成的影响以及体外消化性分析

在温室中分别栽培来自不表达或表达Eg1a(pNOV4803)的两个系#263和#266之每一个的各5颗种子。从来自未成熟植物的小叶样品制备蛋白质提取物，用于验证#266植物中内在而#263植物中不存在转基因内切葡聚糖酶活性。在完全植物成熟时，授粉后大约30天，收获整个地上植物，粗略地剁碎，烤箱干燥72小时。将每个样品分成2个相同的样品(分别标记为A和B)，并且使用粗滤的瘤胃液，按照通常的方法(饲料纤维分析装置、试剂、方法和一些应用，H.K.Goering和P.J.Van Soest，Goering，H.Keith 1941(Washington，D.C.)：美国农业部，农业研究部门，1970.iv，20p：ill.AgricultureHandbook；no.379)，但是在体外消化性分析之前将材料于40℃或90℃作预先温育处理，由此进行体外消化性分析。体外消化性分析按如下进行：

利用Wiley磨将样品切成大约1mm，然后再分成16个称重后的等分试验用于分析。将材料悬浮在缓冲液中，40℃或90℃温育2小时，然后过夜冷却。添加微量营养物、胰胨&酪蛋白&亚硫酸钠，之后加入粗滤的瘤胃液，37℃温育30小时。使用标准重量分析方法(Van Soest&Wine，使用去污剂分析含纤维饲料，IV.植物细胞壁成分的测定，P.J.Van Soest & R.H.Wine(1967)，Journal of The AOAC，50：50-55；也参见Methods for dietry fiber，neutral detergent fiberand nonstarch polysaccharides in relationto animal nutrition(1991).P.J.Van Soest，J.B.Roberston & B.A.Lewis.J.DairyScience，74：3583-3597)，分析中性去污剂纤维(NDF)、酸性去污剂纤维(ADF)和酸性去污剂木质素(AD-L)。

数据显示，表达Eg1A的转基因(#266)比对照植物(#233)含有更多的NDF，而ADF和木质素相对不变。转基因植物的NDF级分比非转基因植物的NDF级分更容易被消化，这是因为纤维素(NDF-ADF-AD-L)的消化性增加(与转基因表达内切葡聚糖酶导致的细胞壁纤维素“自消化”相符)所致。

实施例45

在玉米中表达嗜热型β-葡聚糖酶/甘露聚糖酶(6GPl)

使用氮-大麦葡聚糖方法(megazyme)，分析pNOV4820和pNOV4823的转基因种子的6GP1β葡聚糖酶活性。在50℃进行的酶学试验说明，转基因种子具有嗜热性6GP1β-葡聚糖酶活性，而在非转基因种子中检测不到活性(阳性信号是与此试验相关的背景噪音)。

表11显示转基因玉米种子中嗜热型β-葡聚糖酶/甘露聚糖酶6GP1的活性。pNOV4820(事件1-6)和pNOV4823(事件7-9)的转基因种子使用氮-大麦葡聚糖方法(megazyme)分析6GP1β-葡聚糖酶活性。在50℃实施酶学试验，结果说明，转基因种子具有嗜热性6GP1β-葡聚糖酶活性，而在非转基因的种子中没有检测到活性。

表 11

种子	Abs 590
种子	Abs 590	野生型	0
1	0.21	野生型	0
1	0.21	2	0.31
3	0.36	2	0.31
3	0.36	4	0.23
5	0.16	4	0.23
5	0.16	6	0.14
7	0.52	6	0.14
7	0.52	8	0.54
9	0.49	8	0.54

实施例46

在玉米中表达嗜温型大麦AmyI淀粉酶

为了在玉米中表达大麦AmyIα-淀粉酶，制备了各种构建体。使用玉米γ-玉米醇溶蛋白启动子和球蛋白启动子以分别在胚乳或胚中实现特异表达。此外，使用玉米γ-玉米醇溶蛋白信号序列和合成的ER滞留信号调节淀粉酶蛋白的亚细胞定位。所有5个构建体(pNOV4867、pNOV4879、pNOV4897、pNOV4895、pNOV4901)均产生在种子中检测到α-淀粉酶活性的转基因植物。表12显示5个独立的分离事件(构建体pNOV4879和pNOV4897)的各单个种子中的活性。所有的构建体都产生一些具有皱缩种子表型的转基因事件，说明大麦AmyI淀粉酶的合成可以影响淀粉形成、积累或分解。

表12显示在各单个玉米种子中的大麦AmyIα-淀粉酶活性(构建体pNOV4879和pNOV4897)。如前所述，分析了构建体pNOV4879(种子样品1和2)和pNOV4897(种子样品3-5)的分离种子的α-淀粉酶活性。

表 12

种子 U/g玉米面粉

1A 19.29

1B 1.49

1C 18.36

1D 1.15

1E 1.62

1F 14.99

1G 1.88

1H 1.83

2A 2.05

2B 36.79

2C 30.11

2D 2.25

2E 32.37

2F 1.92

2G 20.24

2H 35.76

3A 22.99

3B 1.72

3C 25.38

3D 18.41

3E 28.51

3F 2.11

3G 16.67

3H 1.89

4A 1.57

4B 36.14

4C 23.35

4D 1.70

4E 1.94

4F 14.38

4G 2.09

4H 1.83

5A 11.64

5B 18.20

5C 1.87

5D 2.07

5E 1.71

5F 1.92

5G 12.94

5H 15.25

实施例47

制备木聚糖酶构建体

表13列出9个二元载体，其中的每个二元载体都含有独特的木聚糖酶表达盒。这些木聚糖酶表达盒包括启动子、合成的木聚糖酶基因(编码序列)、内含子(PEPC，反向)和终止子(35S)。

在二元载体pNOV2117中克隆两个合成的玉米优化型内切木聚糖酶基因。这两个木聚糖酶基因命名为BD7436(SEQ ID NO：61)和BD6002A(SEQ ID NO：63)。可以制备含有第三玉米优化型序列BD6002B(SEQ ID NO：65)的其它二元载体。

使用两个启动子：玉米的谷蛋白-2启动子(27-kDγ-玉米醇溶蛋白启动子(SEQ ID NO：12)和稻的谷蛋白-1(Osgt1)启动子(SEQ ID NO：67)。表1中列出的前6个载体已经用于制备转基因植物。可以制备后3个载体，并将其用于产生转基因植物。

载体11560和11562编码SEQ ID NO：62(BD7436)中所示的多肽。构建体11559和11561编码由与SEQ ID NO：62的N端融合的SEQ IDNO：17组成的多肽。SEQ ID NO：17是来自27kDγ-玉米醇溶蛋白的19个氨基酸的信号序列。

载体12175编码SEQ ID NO：64(BD6002A)中所示的多肽。载体12174编码由与SEQ ID NO：64的N端融合的γ-玉米醇溶蛋白信号序列(SEQ ID NO：17)组成的融合蛋白。

载体pWIN062和pWIN064编码SEQ ID NO：66(BD6002B)中所示的多肽。载体pWIN058编码由与SEQ ID NO：66的N端融合的玉米waxy蛋白叶绿体转运肽(SEQ ID NO：68)组成的融合蛋白。

表13 木聚糖酶二元载体

载体	启动子	信号序列来源	木聚糖酶基因
载体	启动子	信号序列来源	木聚糖酶基因	11559	27kDγ-玉米醇溶蛋白	27kDγ-玉米醇溶蛋白	BD7436
11560	27kDγ-玉米醇溶蛋白	无	BD7436	11559	27kDγ-玉米醇溶蛋白	27kDγ-玉米醇溶蛋白	BD7436
11560	27kDγ-玉米醇溶蛋白	无	BD7436	11561	0sGt1	27kDγ-玉米醇溶蛋白	BD7436
11562	0sGt1	无	BD7436	11561	0sGt1	27kDγ-玉米醇溶蛋白	BD7436
11562	0sGt1	无	BD7436	12174	27kDγ-玉米醇溶蛋白	27kDγ-玉米醇溶蛋白	BD6002A
12175	27kDγ-玉米醇溶蛋白	无	BD6002A	12174	27kDγ-玉米醇溶蛋白	27kDγ-玉米醇溶蛋白	BD6002A
12175	27kDγ-玉米醇溶蛋白	无	BD6002A	PWIN058	27kDγ-玉米醇溶蛋白	玉米waxy蛋白	BD6002B
PWIN062	OsGt1	无	BD6002B	PWIN058	27kDγ-玉米醇溶蛋白	玉米waxy蛋白	BD6002B
PWIN062	OsGt1	无	BD6002B	PWIN064	27kDγ-玉米醇溶蛋白	无	BD6002B

所有构建体均包括PMI的表达盒，以允许在含有甘露糖的培养基上阳性选择再生的转基因组织。

实施例48

木聚糖酶活性试验结果

表14和15显示的数据说明，木聚糖酶活性在T1代种子中积累，其中所述T1种子收获自稳定转化了含有木聚糖酶基因BD7436(SEQ IDNO：61，实施例47中)和BD6002A(SEQ ID NO：63，实施例47)的二元载体的再生(T0)玉米植物。使用Azo-WAXY试验(Megazyme)，在来自汇合的(分离的)转基因种子和单个转基因种子的提取物中检测到活性。

将T1种子研磨成粉，使用柠檬酸-磷酸缓冲液(pH 5.4)从面粉样品中提取蛋白质。室温搅拌面粉悬浮液60分钟，离心除去不溶性物质。使用Azo-WAXY试验(McCleary，B.V.“饲料酶和动物饲料中β-木聚糖酶、β-葡聚糖酶和α-淀粉酶测定的问题”，《(Proceedings of SecondEuropean Symposium on Feed Enzymes》(W.van Hartingsveldt，M.Hessing，J.P.vander Jugt，和W.A.C Somers编)，Noordwiijkerhout，Netherlands，25-27，1995年10月)测定上清液级分的木聚糖酶活性。提取物和底物在37℃预先温育。向1体积1×提取物上清液中加入1体积底物(1％Azo-小麦阿拉伯木聚糖S-AWAXP)，然后37℃温育5分钟。玉米面粉提取物中的木聚糖酶活性通过内切机制使Azo-小麦阿拉伯木聚糖解聚，产生木糖寡糖形式的低分子量染色的片断。5分钟温育后，加入5体积95％EtOH，终止反应。醇的添加造成未解聚的染色的底物沉淀，这样仅仅低分子量的木糖寡糖保留在溶液中。通过离心除去不溶性物质。590nm测定上清液级分的吸光度，通过与使用具有已知活性的木聚糖酶标准品从相同试验获得的吸光度值比较，确定每克面粉的木聚糖酶单位。此标准品的活性由BCA试验确定。使用小麦阿拉伯木聚糖作为底物，通过还原端与2，2’-二金鸡宁酸(BCA)反应以测定还原端的释放，从而确定标准品的酶活性。底物制备为在含有0.02％叠氮化钠的100mM乙酸钠缓冲液pH5.30中的1.4％w/w小麦阿拉伯木聚糖(Megazyme P-WAXYM)溶液。通过将50份试剂A与1份试剂B(试剂A和B分别来自Pierce，产品号23223和23224)混合，制备BCA试剂。这些试剂在使用前不超过4小时时混合。通过将200微升底物与80微升酶样品混合，实施试验。在期望温度温育期望的时间长度后，添加2.80毫升BCA试剂。混合内容物并放置于80℃ 30-45分钟。使内容物冷却，然后转移至杯中，并相对于已知的木糖浓度测定560nm的吸光度。可以由本领域技术人员变化酶稀释度、温育时间和温育温度的选择。

表14中显示的实验结果说明在制备自T代玉米种子的面粉中存在重组木聚糖酶活性。分析来自12个T0植物(来源于独立的T-DNA整合事件)的种子。这12个转基因事件来源于所示的6个不同载体(关于载体的描述参考实施例47中表13)。非转基因(阴性对照)玉米面粉的提取物不含可测量的木聚糖酶活性(见表15)。在这12个样品中木聚糖酶活性为10至87单位/g面粉。

表14 分析汇合的T1种子

载体	样品	木聚糖酶单位/g面粉
载体	样品	木聚糖酶单位/g面粉	11559	MD9L013800	63
11559	MD9L012428	58	11559	MD9L013800	63
11559	MD9L012428	58	11560	MD9L011296	33
11560	MD9L011322	21	11560	MD9L011296	33
11560	MD9L011322	21	11561	MD9L012413	87
11561	MD9L012443	83	11561	MD9L012413	87
11561	MD9L012443	83	11562	MD9L012890	13
11562	MD9L013788	12	11562	MD9L012890	13
11562	MD9L013788	12	12174	MD9L022080	16
12174	MD9L022195	10	12174	MD9L022080	16
12174	MD9L022195	10	12175	MD9L022061	74
12175	MD9L022134	69	12175	MD9L022061	74

表15中的结果说明在来源单个籽粒的玉米面粉中存在木聚糖酶活性。分析了来自两个含有载体11561和11559的T0植物的T1种子。这些载体描述在实施例47中。将来自两个植物之每一个的各8颗种子研磨成粉，提取每颗种子的面粉样品。表中显示每个提取物的单次试验的结果。在两个转基因事件的种子1、5和8的提取物试验中均未发现木聚糖酶活性。这些种子是无效分离子。两个转基因事件的种子2、3、4、6和7都积累可测量的木聚糖酶活性，该活性可归因于重组BD7436基因的表达。所有测定为阳性木聚糖酶活性(＞10单位/克面粉)的10颗种子都具有明显的皱缩或不饱满的外观。相反地，测试为阴性木聚糖酶活性(≤1单位/克面粉)的6颗种子具有正常外观。此结果提示，在种子发育和/或成熟期间重组木聚糖酶造成内源性(阿拉伯)木聚糖底物解聚。

表15 分析单个T1种子

载体11561		载体11559
载体11561		载体11559		种子编号	木聚糖酶单位/克面粉	种子编号	木聚糖酶单位/克面粉
1	0	1	1	种子编号	木聚糖酶单位/克面粉	种子编号	木聚糖酶单位/克面粉
1	0	1	1	2	45	2	52
3	38	3	21	2	45	2	52
3	38	3	21	4	40	4	13
5	0	5	0	4	40	4	13
5	0	5	0	6	40	6	28
7	32	7	23	6	40	6	28
7	32	7	23	8	0	8	0

实施例49

使用酶增加从玉米种子回收淀粉

玉米湿磨包括步骤：浸渍玉米籽粒、研磨玉米籽粒、和分离籽粒的成分。开发桌面试验(the Cracked Corn Assay)以模拟玉米湿磨工艺。

使用“碎玉米试验”鉴定可以增加来自玉米种子的淀粉产量从而提高玉米湿磨工艺的效率的酶。通过外源添加、转基因玉米种子、或两者的组合来递送酶。除了酶在促进玉米成分分离中的用途外，还证实可以自该工艺中消除SO₂。

碎玉米试验(cfacked corn assay)

在4000、2000、1000、500、400、40或0ppm SO₂中50℃或37℃浸渍一克种子过夜。将种子切成两半，除去胚芽。再次将每一半种子切成两半。保留来自每个浸渍种子样品的浸渍水，并稀释至400ppm至0ppm SO₂的最终浓度。向有或无酶存在的两毫升浸渍水中加入去胚芽的种子，并将样品放置在50℃或37℃2至3小时。以每份样品10个单位，分别添加每一种酶。所有样品大约每15分钟涡旋一次。2至3小时后，通过Mira布过滤至50ml离心管中。用2ml水洗涤种子，并将该样品与第一份上清液合并。15分钟离心样品3000rpm。离心后，倒掉上清液，沉淀37℃放置干燥。记录所有沉淀的重量。也测定了样品的淀粉和蛋白质以确定处理过程中释放的淀粉：蛋白比率(数据未显示)。

在碎玉米试验中分析来自表达6GP1内切葡聚糖酶的玉米植物的T1和T2种子

当在碎玉米试验中分析时，含有热稳定内切葡聚糖酶的转基因玉米(pNOV4819和pNOV4823)表现良好。当在2000ppm SO₂中浸渍时，在表达内切葡聚糖酶的种子中发现从pNOV4819系获得高2倍的淀粉回收。与对照种子相比，向内切葡聚糖酶种子添加蛋白酶和纤维二糖水解酶使淀粉回收增加了大约7倍。见表16。

表16胞质表达的内切葡聚糖酶(pNOV4820)的碎玉米试验结果。对照株系，A188/HiII；PNOV4819株系，42C6A-1-21和27

玉米株系	处理	淀粉沉淀重量(mg)
玉米株系	处理	淀粉沉淀重量(mg)	A188/HiII对照	无酶	28.4
A188/HiII对照	菠萝蛋白酶/C8546 10U	109.3	A188/HiII对照	无酶	28.4
A188/HiII对照	菠萝蛋白酶/C8546 10U	109.3
42C6A-1-21	无酶	52.6
42C6A-1-21	无酶	52.6	42C6A-1-21	菠萝蛋白酶/C8546 10U	170.4
			42C6A-1-21	菠萝蛋白酶/C8546 10U	170.4
			42C6A-1-27	无酶	60.5
42C6A-1-27	菠萝蛋白酶/C8546 10U	207.5	42C6A-1-27	无酶	60.5

在含有靶向胚乳ER的内切葡聚糖酶的转基因种子(pNOV4823)中观察到相似结果，再次在与对照种子相比时导致淀粉回收增加2至7倍。见表17

表17：ER表达内切葡聚糖酶(pNOV4823)的碎玉米试验。对照株系，A188/HiII；PNOV4823株系，101D11A-1-28。

株系	处理	淀粉沉淀重量(mg)	淀粉沉淀重量(mg)	平均重量
株系	处理	淀粉沉淀重量(mg)	淀粉沉淀重量(mg)	平均重量	A188/HiII	无酶	22.5	19.1	20.8
101D11A-1-28	无酶	41.2	32	36.6	A188/HiII	无酶	22.5	19.1	20.8
101D11A-1-28	无酶	41.2	32	36.6
A188/HiII	10U菠萝蛋白酶/C8546	78.6	73.8	76.2
A188/HiII	10U菠萝蛋白酶/C8546	78.6	73.8	76.2	101D11A-1-28	10U菠萝蛋白酶/C8546	169.8	132.6	151.2

这些结果证实，内切葡聚糖酶的表达可以增强玉米种子的淀粉和蛋白质成分的分离。而且，可以看到，在浸渍过程中减少或除去SO2导致了与正常浸渍的对照种子相当或更好的淀粉回收。见表18。从湿磨工艺中除去高水平SO2可以提供增值的益处。

表18：基于自转基因6GP1种子的淀粉回收，比较各种浓度的SO2

株系	处理	淀粉沉淀重量(mg)
株系	处理	淀粉沉淀重量(mg)	A188 Control	2000 ppm SO2	18.5
JHAF Control	2000 ppm SO2	29.1	A188 Control	2000 ppm SO2	18.5
JHAF Control	2000 ppm SO2	29.1	42C(pNOV4820)	2000 ppm SO2	29.5
101C(eNOV4823)	2000 ppm SO2	73.1	42C(pNOV4820)	2000 ppm SO2	29.5
101C(eNOV4823)	2000 ppm SO2	73.1	101D(pNOV4823)	2000 pprn SO2	42.5
136A(pNOV4825)	2000 ppm SO2	36.6	101D(pNOV4823)	2000 pprn SO2	42.5
136A(pNOV4825)	2000 ppm SO2	36.6	137A(pNOV4825)	2000 ppm SO2	38.8
			137A(pNOV4825)	2000 ppm SO2	38.8
			42C(pNOV4820)	400 ppm SO2	18.5
101C(pNOV4823)	400 ppm SO2	20.4	42C(pNOV4820)	400 ppm SO2	18.5
101C(pNOV4823)	400 ppm SO2	20.4	101D(pNOV4823)	400 ppm SO2	39.7
136A(pNOV4825)	400 ppmSO2	26	101D(pNOV4823)	400 ppm SO2	39.7
136A(pNOV4825)	400 ppmSO2	26	37A(pNOV4825)	400 ppm SO2	26.9
			37A(pNOV4825)	400 ppm SO2	26.9
			42C(pNOV4820)	0 ppm SO2	21.9
101C(pNOV4823)	0 ppm SO2	32.5	42C(pNOV4820)	0 ppm SO2	21.9
101C(pNOV4823)	0 ppm SO2	32.5	101D(pNOV4823)	0 ppm SO2	39
36A(pNOV4825)	0 ppm SO2	17.8	101D(pNOV4823)	0 ppm SO2	39
36A(pNOV4825)	0 ppm SO2	17.8	137A(pNOV4825)	0 ppm SO2	29.2

实施例50

构建用于玉米优化型菠萝蛋白酶的转化载体

按下述，使用各种引导信号构建表达盒，以在玉米胚乳中表达玉米优化型菠萝蛋白酶：

pSYN11000(SEQ ID NO：73)含有菠萝蛋白酶信号序列(MAWKVQVVFLFLFLCVMWASPSAASA)(SEQ ID NO：72)以及合成的菠萝蛋白酶序列，其中该合成的菠萝蛋白酶序列通过融合在C端添加了用于靶向和滞留在PVS中的序列VFAEAIAANSTLVAE(Vitale和Raikhel，Trends in Plant Science，Vol 4，no.4，pg149-155)。融合物被克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。

pSYN11587(SEQ ID NO：75)包含菠萝蛋白酶N端信号序列(MAWKVQVVFLFLFLCVMWASPSAASA)以及合成的菠萝蛋白酶序列，其中该合成的菠萝蛋白酶序列在C端添加了用于靶向和滞留在内质网(ER)中的序列SEKDEL(Munro和Pelham，1987)。融合物被克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。

pSYN11589(SEQ ID NO：74)含有与裂解性液泡(lytic vacuole)引导序列SSSSFADSNPIRVTDRAAST(Neuhaus和Rogers PlantMolecular Biology 38：127-144，1998)融合的菠萝蛋白酶信号序列(MAWKVQVVFLFLFLCVMWASPSAASA)(SEQ ID NO：72)以及合成的菠萝蛋白酶序列，以便靶向裂解性液泡。融合物被克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。

pSYN12169(SEQ ID NO：76)包含与合成的菠萝蛋白酶融合的玉米y-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO：17)，以便靶向内质网和在质外体中分泌(Torrent等，1997)。融合物被克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之启。

pSYN12575(SEQ ID NO：77)包含与合成的菠萝蛋白酶融合的waxy造粉体引导肽(Klosgen等人，1986)，以便靶向造粉体。将该融合物克隆在用于胚乳中特异表达的γ玉米醇溶蛋白启动子之后。

pSM270(SEQ ID NO：78)包含与裂解性液泡(lytic vaCUole)引导序列SSSSFADSNPIRVTDRAAST(Neuhaus和Rogers Plant MolecularBiology 38：127-144，1998)融合的菠萝蛋白酶N端信号序列以及合成的菠萝蛋白酶序列，以便靶向裂解性液泡。融合物被克隆在用于在糊粉层(aleurone)中特异表达的糊粉层特异启动子P19(美国专利6392123)。

实施例51

在玉米中表达菠萝蛋白酶

分析来自转化了含有菠萝蛋白酶合成基因的载体的T1转基因株系的种子的蛋白酶活性，其中所述菠萝蛋白酶合成基因具有用于实现在种子的不同亚细胞位置表达的引导序列。在Kleco研磨机中研磨种子30秒，制备玉米面粉。使用含有1mM EDTA和5mM DTT的1ml 50mMNaOAc pH4.8或50mM Tris pH7.0缓冲液，从100mg面粉提取酶。涡旋样品，然后不停振摇下置于4℃ 30分钟。使用试卤灵标记的树脂(Roche，Cat.No.1080733)如产品小册子中所述的，分析来自每个转基因株系的提取物。使用菠萝蛋白酶特异试验，按照具有如下修改之处的Methods in Enzymology，Vol.244：Pg557-558中给出的方法，分析来自T2种子的面粉。用1ml 50mM Na₂HPO₄/50mM NaH₂PO₄，pH7.0、1mM EDTA+/-1μM亮酶抑肽于4℃提取1000mg玉米种子面粉15分钟。14,000rpm，4℃离心提取物5分钟。实施一式两份提取。使用Z-Arg-Arg-NHMec(Sigma)作为底物，分析来自T2转基因株系的面粉的菠萝蛋白酶活性。将100μl/玉米种子提取物的4个等分试样加入含有50μl 100mM Na₂HPO₄/100mM NaH₂PO₄，pH7.0、2mM EDTA、8mM DTT/孔的96孔平底板(Corning)中。加入50μl 20μMZ-Arg-Arg-NHMec以开始反应。使用安装有360nm激发波长和465nm发射波长滤波器的SpectraFluorPlus(Tecan)在40℃每隔2.5分钟检测反应速度一次。

表19显示对来自不同T1菠萝蛋白酶事件的种子的分析。发现与A188和JHAF对照株系相比，菠萝蛋白酶的表达高2至7倍。再种植T1转基因株系，获得T2种子。T2种子的分析结果显示菠萝蛋白酶的表达。图21显示使用Z-Arg-Arg-NHMec在T2种子中针对ER靶向的(11587)和裂解性液泡靶向的(11589)菠萝蛋白酶进行的菠萝蛋白酶活性试验。

分析来自表达菠萝蛋白酶的玉米植物的T2种子

在碎玉米试验中分析来自T2转基因菠萝蛋白酶株系11587-2的种子的增加的玉米回收。使用外源添加的菠萝蛋白酶的前面实验已经证实，当单独和与其它酶(尤其是纤维素酶)测试时淀粉酶回收增加。当在37℃/2000ppm SO2浸渍过夜时，来自11587-2系的T2种子显示出比对照种子增加了1.3倍的淀粉回收。更重要的是，当添加纤维素酶(C8546)并在37℃/2000ppm SO2浸渍种子时，在来自T2菠萝蛋白酶株系11587-2的淀粉中存在2倍的增加。

当在37℃/400ppm SO2浸渍种子时，转基因株系显示出高于对照种子的相似淀粉增加趋势。在转基因种子中观察到与对照相比回收的淀粉增加1.6倍，并且在添加纤维素酶(C8546)的情况下淀粉增加2.1倍。见表20。

这些结果的意义在于证明了在湿磨工艺期间使用表达菠萝蛋白酶的转基因种子可以降低温度和SO2水平而同时也增强淀粉回收。

表19

T1玉米中菠萝蛋白酶的谷粒特异性表达的总结

株系编号	靶向	构建体	“比活性”ng菠萝蛋白酶/蛋白
株系编号	靶向	构建体	“比活性”ng菠萝蛋白酶/蛋白	11000-1	液泡	GZP/菠萝蛋白酶原/大麦PVS	252
11000-2	液泡	GZP/菠萝蛋白酶原/大麦PVs	277	11000-1	液泡	GZP/菠萝蛋白酶原/大麦PVS	252
11000-2	液泡	GZP/菠萝蛋白酶原/大麦PVs	277	11000-3	液泡	GZP/菠萝蛋白酶原/大麦PVS	284
11587-1	ER	GZP/菠萝蛋白酶原/KDEL	174	11000-3	液泡	GZP/菠萝蛋白酶原/大麦PVS	284
11587-1	ER	GZP/菠萝蛋白酶原/KDEL	174	11587-1	ER	GZP/菠萝蛋白酶原/KDEL	153
11589-1	裂解性液泡	GZP/aleurain SS/菠萝蛋白酶原	547	11587-1	ER	GZP/菠萝蛋白酶原/KDEL	153
11589-1	裂解性液泡	GZP/aleurain SS/菠萝蛋白酶原	547	11589-2	裂解性液泡	GZP/aleurain SS/菠萝蛋白酶原	223
		A188对照	56	11589-2	裂解性液泡	GZP/aleurain SS/菠萝蛋白酶原	223
		A188对照	56			JHAF对照	75

表20：T2菠萝蛋白酶种子的碎玉米试验结果

浸渍条件	株系	淀粉沉淀重量(mg)
浸渍条件	株系	淀粉沉淀重量(mg)	2000 ppm SO2	A188	41.3
2000 ppm SO2	A188/C8546(10单位)	44	2000 ppm SO2	A188	41.3
2000 ppm SO2	A188/C8546(10单位)	44
2000 ppm SO2	11587-2	57.4
2000 ppm SO2	11587-2	57.4	2000 ppm SO2	11587-2/C8546(10单位)	94.6
			2000 ppm SO2	11587-2/C8546(10单位)	94.6
			400 ppm	A188	30.7
400 ppm	A188/C8546(10单位)	35.8	400 ppm	A188	30.7
400 ppm	A188/C8546(10单位)	35.8
400 ppm	11587-2	50.5
400 ppm	11587-2	50.5	400 ppm	11587-2/C8546(10单位)	86.6

实施例52

构建用于玉米优化型阿魏酸酯酶的转化载体

按如下所述，使用或不使用各种引导信号，构建表达盒，以便在玉米胚乳中表达玉米优化型阿魏酸酯酶。

质粒13036(SEQ ID NO：101)包含玉米优化型阿魏酸酯酶(FAE)序列(SEQ ID NO：99)。将该序列克隆在用于在胚乳胞质中实现特异表达的、不带任何引导序列的玉米γ玉米醇溶蛋白启动子之后。

质粒13038(SEQ ID NO：103)包含与合成的FAE融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO：17)，以便靶向内质网并在质外体中分泌(Torrent等，1997)。将融合物克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。

质粒13039(SEQ ID NO：105)包含与合成FAE融合的waxy造粉体引导肽(MLAALATSQL VATRA GLGVPDASTF RRGAA Q GLRG ARASA AADTLSMRTS ARAAP RHQHQ QARRG ARRFPS LVVCA SAGA)(Klosgen等人，1986)，以便于靶向造粉体。将该融合物克隆在用于胚乳特异性表达的γ玉米醇溶蛋白启动子之后。

质粒13347(SEQ ID NO：107)包含与C端添加了序列SEKDEL的合成FAE序列融合的玉米γ玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO：17)，以便靶向并滞留在内质网(ER)中(Munro和Pelham，1987)。将融合物克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。

将所有表达盒移至二元载体pNOV2117中以便通过农杆菌感染转化入玉米。该二元载体含有允许使用甘露糖选择转基因细胞的磷酸甘露糖异构酶(PMI)。使转化的玉米植物自花授粉或远交，收集种子用于分析。

可以通过使分别表达各单个酶的植物杂交，或者通过将几个表达盒克隆在相同二元载体中实现共转化来产生酶的组合。

合成的阿魏酸酯酶序列(SEQ ID NO：99)

atggccgcctccctcccgaccatgccgccgtccggctacgaccaggtgcgcaacggcgtgccgcgcggccaggtggtgaacatctcctacttctccaccgccaccaa

ctccacccgcccggcccgcgtgtacctcccgccgggctactccaaggacaagaagtactccgtgctctacctcctccacggcatcggcggctccgagaacgactggtt

cgagggcggcggccgcgccaacgtgatcgccgacaacctcatcgccgagggcaagatcaagccgctcatcatcgtgaccccgaacaccaacgccgccggcccgg

gcatcgccgacggctacgagaacaacaccaaaaacctcctcaactccctcatcccgtacatcgagtccaactactccgtgtacaccgaccgcgagcaccgcgccatcgc

cggcctctctaggcggcggccagtccttcaacatcggcctcaccaacctcgacaagttcgcctacatcggcccgatctccgccgccccgaacacctacccgaacga

gcgcctcttcccggacggcggcaaggccgcccgcgagaagctcaagctcctcttcatcgcctgcggcaccaacgactccctcatcggctgcggccagcgcgtgcacg

agtactgcgtggccaacaacatcaaccacgtgtactggctcatccagggcggcggccacgacttcaacgtgtggaagccgggcctctggaacttcctccagatggcccg

acgaggccggcctcacccgcgacggcaacaccccggtgccgaccccgtccccgaagccggccaacacccgcatcgaggccgaggactacgacggcatcaatcc

tcctccatcgagatcatcggcgtgccgccggagggcggccgcggcatcggctacatcacctccggcgactacctcgtgtacaagtccatcgacttcggacggcgcc

acctccttcaaggccaaggtggccaacgccaacacctccaacatcgagcttcgcctcaacggcccgaacggcaccctcatcggcaccctctccgtgaagtccaccggc

gactggaacacctacgaggagcagacctgctccatctccaaggtgaccggcatcaacgacctctacctcgtgttcaagggcccggtgaacatcgactggttcaccttcg

gcgtgtag

合成的阿魏酸酯酶氨基酸序列(SEQ ID NO：100)

maaslpttmppsgydqvrngvprgqvvnisyfstatnstrparvyinngyskdkkysvlyllhgiggsendwfegggranviadnliaegkikpliivtpntnaagp

giadgyenftkdllnslipyiesnysvytcdrehraiaglsmgggqsfnigltnldkfayigpisaapntypnerlfpdggkaareklkllfiacgtndsligfgqrvheyc

vanninhvywliqggghdfnvwkpglwnflqmadeagltrdgntpvptpspkpantrieaedydginsssieiigyppeggrgigyitsgdylyyksidfgngat

sfkakvanantsnielrlngpngtligtlsvkstgdwntyeeqtcsiskvtgindlylvfkgpvnidwftfgv*

13036序列(SEQ ID NO：101)

ctccacccgcccggcccgcgtgtacctcccgccgggctactccaaggacaagaagtactccgtgctctacctcctccacgggcatcggcggctccgagaacgactggtt

cgagggcggcggccgcgccaacgtgatcgccgacaacctcatcgccgggggcaaggtcaagccgctcatcatcgtgaccccgaacaccaacgccgccggcccg

gcatcgccgacggctacgagaacttcaccaaggacctcctcaactccctcatcccgtacatcgagtccaactactccgtgtacaccgaccgcgagcaccgcgccatcg

cggcctctctatgggcggcggccagtccttcaacatcggcctcaccacctcgacaagttcgcctacatcggcccgatctccgccctacccgaacga

gcgcctcttcccggacggcggaaggccgcccgcgagaagctcaagctcctcttcatcgcctgcggcaccaacgactccctcatcggcttcggccagcgcgtgcacg

agtactgcgtggccaacaacatcaaccacgtgtactggctcatccagggcggcggccacgacttcaacgtgtggaagccgggcctctggaacttcctccagatggccg

acgaggccggcctcacccgcgacggcaacaccccggtgccgaccccgtccccgaagccggccaacacccgcatcgaggccgaggactacgacggcatcaactcc

tcctccatcgagatcatcggcgtgccgccggagggcggccgcggcatcggctacatcacctccggcgactacctcgtgtacaagtccatcgacttcggcaacggcgcc

acctccttcaaggccaaggccaacgccaacacctccaacatcgagcttcgcctcaacggcccgaacggcaccctcatcggcaccctctccgtgaagtccaccgg

gcgtgtag

13036AA序列(SEQ ID NO：102)

maaslptmppsgydqvrngvprgqvvnisyfstatnstrparvylppgyskdkkyvlyllhgiggsendwfegggranviadnliaegkikpliivtpntnaagp

giadgyenftkdllnslipyiesnysvytdrehraiaglsmgggsfnigltnldkfayigpisaapntypnerlfpddggkaareklkllfiacgtndsligfgqrvheyc

vanninhvywliqggghdfnvwkpglwnflqmadeagltrdgntpvptpspkpantrieaedydginsssieiigvppeggrgigyitsgdylvyksidfgngat

sfkakvanantsnielrlngpngtligtlsvkstgdwntyeeqtcsiskkvtgindlylvfkgpvnidwftfgv*

13038序列(SEQ ID NO：103)

atgagggtgttgctcgttgccctcgctctcctggctctcgctgcgagcgccacctccatggccgcctccctcccgaccatgccgccgtccggctacgaccaggtgcgca

acggcgtgccgcgcggccaggtggtgaacatctcctacttctccaccgcccacccaactccacccgcccggcccgcgtgtacctcccgccgggtactccaaaggacaag

aagtactccgtgctctacctcctccacggcatcggcggctccgagaacgactggcgagggcggcggccgcgccaacgtgatcgccgacaacctcatcgccgaggg

caagatcaagccgctcatcatcgtgaccccgaacaccaacgccgccggcccgggcatcgccgacggctacgagaacttcaccaaggacctcctcaactccctcatccc

gtacatcgagtccaactactccgtgtacaccgaccgcgagcaccgcgccatcgccggcctctctatgggcggcggccagtccttcaacatcggcctcaaccaacctcgac

aagttcgcctacatcggcccgatctccgccgccccgaacacctacccgaacgagcgcctcttcccggacggcggcaaggccgcccgcgagaagctcsagctcctctt

catcgcctgcggcaccaacgactccctcatcggcttcggccagcgcgtgcacgagtactgcgtggccaacaacatcaaccacgtgtactggctcatccagggcggcgg

ccacgacttcaacgtgtggaagccgggcctctggaacttcctccagatggccgacgaggccggcctcacccgcgacggcaacaccccggtgccgaccccgtccccg

aagccggccaacacccgcatcgaggccgaggactacgaacggcatcaactcctcctccatcgagatcatcggcgtgccgccggagggcggccgcggcatcggctac

atcacctccggcgactacctcgtgtacaagtccatcgacttcggcaacggcgccacctccttcaaggccaaggtggccaacgccaacacctccaacatcgagcttcgcc

tcaacggcccgaacggcaccctcatcggcaccctctccgtgaagtccaccggcgactggaacacctacgaggagcagacctgctccatctccaaggtgaccggcatc

aacgacctctacctcgtgttcaagggcccggtgaacatcgactggttcaccttcggcgtgtag

13038AA序列(SEQ ID NO：104)

mrvllvalallalaasatsmaaslptmppsgydqvrngvprgqvvnisyfstatnstrparvylppgyskdkkysvlyllhgiggsendwfeggmanviadnlia

gkikpliivtpntnaaggpgiadgyenftkdllnslipviesnysvytdrehraiaglsmgggqsfnigltnldkfayigpisaapntypnerlfpdggkaareklkllfi

cgmdsligfgqrvheycvanninhvywliqggghdfnvwkpglwnflqmadeagltrdgntpvptpspkpantrieaedydginsssieiigvppeggrgigyi

tsgdylvyksidfgngatsfkakvanantsnielrlngpngtligtlsvkstgdwntyeeqtcsiskvtgindlylvfkggpvnidwftfgv*

13039序列(SEQ ID NO：105)

atgctggcggctctggccacgtcgcagctcgtcgcaacgcgcgccggcctgggcgtcccggacgcmccacgttccgccgcggcgccgcgcagggcctgagggg

ggcccgggcgtcggcggcggcggacacgctcagcatgcggaccagcgcgcgcgcggcgcccaggcaccagcaccagcaggcgcgccgcggggccaggltcc

cgtcgctcgtcgtgtgcgccagcgccggcgccatggccgcctccctcccgaccatgccgccgtccggctacgaccaggtgcgcaacggcgtgccgcgcggcaggt

ggtgaacatctcctacttctccaccgccaccaactccacccgcccggcccgcgtgtacctcccgccgggctactccaaggacaagaaggtactccgtgctctcctcctcc

acggcatcggcggctccgagaacggactggttcgagggcggcggccgcgccaacgtgatcgccgacaacctcatcgccgagggcaagatcaagccgctcatcatcgt

gaccccgaacaccaacgccgccggcccgggcatcgccgacggctacgagaacttcaccaaggacctcctcaactccctcatcccgtacatcgagtccaactactccgt

gtacaccgaccgcgagcaccgcgccatcgccggcctctctatgggcggcggccagtccttcaacatcggcctcaccaacctcgacaagttcgcctacatcggcccgat

ctccgccgccccgaacacctacccgaacgagcgcctcttcccggacggcggcaaggccgcccgcgagaagctcgagctcctcttcatcgcctgcggcaccacgact

ccctcatcggcttcggccagcgcgtgcacgagtactgcgtggccaacaacatcaaccacgtgtactggctcatccagggcggcggccacgacttcaacgtgtggaagc

cgggcctctggaacttcctccagatggccgacgaggccggcctcacccgcgacggcaacaccccggtgccgaccccgtccccgaagccggccaacacccgcatcg

aggccgaggactacgacggcatcaactcctcctccatcgagatcatcggcgtgccgccggagggcggccgcggcgtcggctacatcacctccggcgactacctcgtgg

tacaagtccatcgacttcggcaacggcgccacctccttcaaggccaaggtggccaacgccagcacctccaacatcgagcttcgcctcaacgggccgaacggcaccctc

atcggcaccctctccgtgaagtccaccggcgactggaacacctacgaggagcagacctgctccatctccaaggtgaccggcatcaacgacctctacctcgtgttcaagg

gcccggtgaacatcgactggttcaccttcggcgtgtag

13039AA序列(SEQ ID NO：106)

mlaalatsqlvatraglgvpdastfrrgaaqglrgarasaaadtlsrrrtsaraaprhqhqqarrgarfpslvvcasagamaaslptnppsgvdqvrngvprgqvvni

syfstatnshparvylppgyskdkkysvlyllhgiggsendwfeggggranwadnliaegkikpliitpntmaaggpgiadgyenftkdllmlipyiesnysvytdre

hraiaglsmgggqsfinigltnldkfayigpisaapntypnerlfpdggkaareklkllfiacgtnddigfgqrvheycvanninhvywliqggghdfnvwkkpglw

nflqmadeagltrdgntpvptpspkpantrieaedydginsssieiigvppeggrgigyitsgdylvyksidfgngatsfkakvanantsnielrlmgnngtligtlsvk

stgdwntyeeqtcsiskvtgindlylvfkgpvnidwftfgv*

13347序列(SEQ ID NO：107)

atgagggtgttgctcgttgccctcgctctcctggctctcgctgcgagcgccacctccatggccgcctccctcccgaccatgccgccgtccggcta1cgaccaggtgcgca

acggcgtgccgcgcggccaggtggtgaacatctcctacltctccaccgccaccaactccacccgcccggccgcgtgtacctcccgccgggctactccaaggacaag

aagtactccgtgctctacctcctccacggcatcggcggclccgagaacgactggttcgagggcggcggccgcgccaacgtgatcgccgacaacctcatcgccgaggg

gtacatcgagtccaactactccglgtacgccgaccgcgagcaccgcgccatcgccggcctctctatgggcggcggcccagtccttcaacatcggcctcaccaacctcgac

aagttcgcctacatcggcccgatctccgccgccccgaacacctacccgaaacgagcgcctcttcccggacggcggcaaggccgcccgcgagaagctcaagctcctct

catcgcctgcggcaccaacgactccctcatcggcttcggccagcgcgtgcacgagtactgcgtggccaacacatcaaccacgtgtactggctcatccagggcggcgg

ccacggacttcaacgtgtggaagccgggcctctgggaacttcctccagatgggccgacggggccggcctcacccgcggcggcaacaccccggtgccgaccccgtccccg

agccggccaaacacccgcacgaggccgaggactacgacggcatcaactcctcctccatcgagatcatcggcgtgccgccggagggcggccgcggcatcggctac

atcacctccgcgcgactacctcgtgtacaagtccatcgacttcggcaacggcgccacctccttcaaggccaaggtggccaacgccaacacctccaacatcgagcttcgcc

aacgacctctacctcgtgttcaagggcccggtgaacatcgactggttcaccttcggcgtgtccgagaaggacgaactctag

13347AA序列(SEQ ID NO：108)

mrvllvalallalaasatsmaaslptmppsgydqvrngvprgqvvnisyfstatnstrparvylppgyskdkkysvlyllhgiggsendwfeggranviadnliae

gkikpliivtpntnaagpgiadgyenftkdllnslinyiesnysvytdrehraiaglsmgggqsfnigltnldkfayigpisaapntypperlfpdggkaareklkllfia

cgtndsligfgqrvheycvanninhvywliqggghdfnvwkpglwnflqmadeagltrdgnwpvptpspkpantrieaedydginsssieiigvppeggrgigyi

tsgdylvyksidfgngatsfkakvanantsnielrlngpngtligtlsvkstgdwntyeeqtcsiskvtgindlyvfkgpvnidwfgvsekdel*

实施例53

阿魏酸酯酶对玉米纤维的水解降解

玉米纤维是玉米湿磨和干磨的主要副产品。该纤维成分主要由产生自种子的果皮(pericarp)(壳)和糊粉层的粗纤维以及较小一部分的来自胚乳细胞壁的细纤维组成。阿魏酸，一种羟基肉桂酸，以高浓度存在于谷物谷粒的细胞壁中，导致细胞壁的木质素、半纤维素和纤维素成分交联。酶促降解阿魏酸交联是水解玉米纤维的一个重要步骤，其可以导致其它水解酶的进一步酶促降解的可达性。

阿魏酸酯酶活性试验

在大肠杆菌中表达阿魏酸酯酶FAE-1(来自嗜热纤维梭状芽孢秆菌(C.thermocellum)的玉米优化型合成基因)。收获细胞并-80℃贮存过夜。将收获的细菌悬浮在50mM Tris缓冲液pH7.5中。加入溶菌酶至200μg/ml终浓度，在轻柔振摇下室温温育样品10分钟。4℃以4000rpm离心样品15分钟。离心后，将上清液转移至50mL圆锥管，放在70℃水浴中30分钟。然后4000rpm离心样品15分钟，将澄清的上清液转移至圆锥管(B1um等，J Bacteriology，2000年3月，pg1346-1351)。

如Mastihubova等(2002)Analytical Biochemistry309：96-101所述，使用阿魏酸4-甲基伞形酮酰基酯(4-methylumbelliferylferulate)，检查重组FAE-1的活性。将重组蛋白质FAE-1(104-3)稀释10、100和1000倍进行检测。活性试验结果显示在图22中。

制备玉米种子纤维

将黄色马齿形玉米#2籽粒在2000ppm偏亚硫酸氢钠(Aldrich)中50℃浸渍48小时，以分离玉米果皮粗纤维。将籽粒与水以等分混合，在具有叶片的Waring实验室重型搅拌器中反向搅拌。搅拌器使用可调自耦变压器(Staco Energy)以50％的电压输出控制2分钟。在标准的测试筛#7(Fisher scientific)上用自来水洗涤搅拌后的材料，以从淀粉级分中分离粗纤维。通过在4L烧杯使纤维漂离胚胎，分离粗纤维和胚胎。然后将纤维浸泡在乙醇中，之后在真空炉(Precision)中60℃干燥过夜。来源于玉米籽粒果皮的玉米粗纤维使用装备有磨机进料器的实验室磨机3100碾磨至0.5mm粒径。

玉米纤维水解试验

以30mg/5ml缓冲液，将粗纤维(CF)悬浮在50mM柠檬酸-磷酸缓冲液pH 5.2中。涡旋此CF原液，并转移至40ml定型贮液器(Beckman，Cat.No.372790)。充分地混合溶液，然后将100μl转移至96孔板(CorningInc.，Cat.No.9017，聚苯乙烯，平底)。以1-10μl/孔加入酶并使用缓冲液调节终体积至110μl。CF背景对照仅含有10μl缓冲液。用铝箔密封板子，37℃持续振摇下温育18小时。4000rpm离心板子15分钟。将1-10μl CF上清液转移至预先加载了100μl BCA试剂(BCA试剂：试剂A(Pierce，Prod.#23223)、试剂 B(Pierce，Prod.#23224))的96孔板。将终体积调整至110μl。用铝箔密封板子，85℃放置30分钟。85℃温育后，板子以2500rpm离心5分钟。读取(MolecularDevices，Spectramax Plus)562nm吸光度。样品使用D-葡萄糖和D-木糖(Sigma)校正曲线定量。试验结果以释放的总糖(sugar)报道。

在玉米种子纤维水解试验中测定通过阿魏酸酯酶释放的总糖

从重组FAE-1纤维水解试验得到的结果显示总还原糖不增加(数据未显示)。由于文献中已经报道过仅在联合FAE使用其它水解酶时才可以检测到总还原糖的增加(Yu等，J.Agric.Food Chem.2003，51，218-223)，故这些结果并非是意料之外的。图23显示向玉米纤维上培养的真菌上清液添加FAE-2，显示出总还原糖的增加。这提示FAE确实在玉米纤维水解中起重要作用。

图23显示玉米纤维水解试验结果，说明向真菌上清液(FS9)添加FAE-2可以增加自玉米纤维释放的总还原糖。

分析通过FAE-1自玉米种子纤维释放的阿魏酸

按照稍有修饰的Walfron和Parr(1996)(Waldron，KW，ParrAJ1996 Vol 7，305-312页，Phytochem Anal)中所述方法，通过跟踪阿魏酸的释放，检查FAE对玉米纤维的活性。将来源于玉米籽粒果皮的玉米粗纤维用装备有磨机进料器3170的实验室磨机3100(Perteninstruments)碾磨至0.5mm粒径，并以10mg/ml用作底物。在24孔Becton Dickenson MultiWell^TM中实施1ml试验。在有和无重组FAE存在下，在50mM柠檬酸磷酸pH5.4中50℃以110rpm温育底物18小时。温育期之后，13,000rpm离心样品，之后乙酸乙酯提取。所用的所有溶剂和酸均来自Fisher Scientific。用0.5ml冰醋酸酸化0.8ml上清液，用等体积的乙酸乙酯萃取三次。合并有机级分，利用Speed vac于40℃干燥。然后使用100μl甲醇悬浮样品用于HPLC分析。

按如下实施HPLC色谱。在HPLC分析中使用阿魏酸(ICNBiomedicals)作为标准品。使用Hewlett Packard系列1100 HPLC系统实施HPLC分析。该方法使用C₁₈完全封端的反向柱(XterraRp18，150mm×3.9mm内径，5μm粒径)，该柱子在40℃以1.0ml min^-1运转。使用32分钟25至70％B的梯度(溶剂A：H₂O，0.01％b TFA；溶剂B：MeCN，0.0075％)洗脱阿魏酸。

如图24中所示，当使用10或100μl FAE-1处理时，从玉米纤维释放的FA比对照高2-3倍。这些结果清楚地说明，FAE-1能够水解玉米纤维。

实施例54

表达葡糖淀粉酶和淀粉酶的玉米在发酵中的功能

该实施例阐明，玉米表达的酶可以支持在不添加酶且不蒸煮玉米浆的情况下发酵玉米浆中的淀粉。含有米根霉葡糖淀粉酶(ROGA)(SEQID NO：49)玉米籽粒按实施例32所述制备。含有大麦低pI的α-淀粉酶(AMYI)(SEQ ID NO：88)的玉米籽粒按照实施例46中所述制备。在此实施例中使用以下材料：

黑曲霉葡糖淀粉酶(ANGA)购自Sigma。

根霉属物种的葡糖淀粉酶(RxGA)以干晶体粉末形式购自Wako，并在10mM乙酸钠pH5.2、5mM CaCl₂中配制成10mg/ml。

MAMYI，微生物生产的AMYI，在10mM乙酸钠pH5.2、5mM CaCl₂中配制为大约0.25mg/ml。

酵母是酿酒酵母(Saccharomyces cereviceae)。

YE是酵母提取物在水中的无菌5％溶液。

酵母起子在总体积300ml的水中含有50g麦芽糖糊精、1.5g酵母提取物、0.2mg ZnSO₄。在制备后通过高压灭菌消毒培养基。冷却至室温后，加入1ml四环素(10mg/ml，在乙醇中)、100μl AMG300葡糖淀粉酶和155mg活性干酵母。然后30℃振摇混合物22h。此过夜的酵母培养物以1/10用水稀释，并按照Current Protocols in MolecularBiology中所述，测定A600以确定酵母数量。

ROGA面粉：将来自几个被证实具有活性葡糖淀粉酶的T0株系的籽粒汇合。在Kleco中碾磨这些种子，并将所有的面粉汇合在一起。

AMYI面粉：将来自表达AMYI的T0玉米的籽粒汇合，并按以上所述碾磨。

对照面粉：以和ROGA表达玉米相同的方式，碾磨具有相似遗传背景的籽粒。

在无菌试管中制备接种混合物；其含有每1.65ml：酵母细胞(1×10⁷)、酵母提取物(8.6mg)、四环素(55μg)。按每克面粉1.65ml加入每个发酵试管。

发酵预备：以1.8g/管称取面粉，放入配衡17×100mm无菌聚丙烯管中。加入50μl 0.9M H₂SO₄以便在发酵前使最终pH达到5。每管加入接种混合物(2.1ml)以及如下所述的RXGA、AMYI-P和淀粉酶脱盐缓冲液。基于每种面粉的含湿量调整缓冲液的量，以便每个管子中的总固体含量不变。彻底混合管子，称重并放入塑料袋，30℃温育。

表 21

	面粉			接种	微生物酶		淀粉酶脱盐缓冲液
	面粉			接种	微生物酶			试管	对照	ROGA	AMYl	Mix	RXGA	AMYl-P
	g	g	g	ml	ml	ml		试管	对照	ROGA	AMYl	Mix	RXGA	AMYl-P	ml
	g	g	g	ml	ml	ml	A	1.8			2.1	0	0		ml
B	1.8			2.1	0.036	0	A	1.8			2.1	0	0		1
B	1.8			2.1	0.036	0	C	1.8			2.1	0.036	1	0	1
D	1.8			2.1	0	1	C	1.8			2.1	0.036	1	0	0.036
D	1.8			2.1	0	1	E	1.6		0.2	2.1	0.036	0	1	0.036
F	0.2	1.6		2.1			E	1.6		0.2	2.1	0.036	0	1	1
F	0.2	1.6		2.1			G	0.2	1.6		2.1	0	1	0	1
H	0	1.6	0.2	2.1		0	G	0.2	1.6		2.1	0	1	0	1

在67小时时程中不时称重发酵管。重量的损失对应于发酵过程中放出的CO₂。样品的乙醇含量在发酵67小时后利用DCL乙醇试验方法确定。该试剂盒(目录号#229-29)购自Diagnostic Chemicals Limited，Charlottetown，PE，加拿大，DIE 1B0。从每个发酵管中取样品(10μl)一式三份，稀释在990μl水中。将10μl稀释的样品与试验缓冲液/ADH-NAD试剂的12.5/l混合物1.25ml混合。稀释标准品(0、5、10、15和20％v/v ETOH)，平行地进行试验。37℃温育反应物10分钟，然后读取A340。标准品按一式两份制备，来自每个发酵的样品以一式三份制备(包括最初的稀释)。如下表中详细描述的，样品重量随时间而变化。重量的损失表示为0时间的初始样品重量的百分数。

表 22

		时间(h)
		时间(h)								0	18	24	42	48	67
样品	面粉组成	％重量损失								0	18	24	42	48	67
样品	面粉组成	％重量损失						A	对照	0.00	8.09	9.38	12.96	13.83	16.85
B	对照+RXGA	0.00	11.48	14.20	21.79	23.83	24.63	A	对照	0.00	8.09	9.38	12.96	13.83	16.85
B	对照+RXGA	0.00	11.48	14.20	21.79	23.83	24.63	C	对照+RXGA+MAMYI	0.00	17.90	23.27	36.48	39.07	47.59
D	对照+MAMYI	0.00	13.70	17.72	28.27	30.80	38.27	C	对照+RXGA+MAMYI	0.00	17.90	23.27	36.48	39.07	47.59
D	对照+MAMYI	0.00	13.70	17.72	28.27	30.80	38.27	E	对照+RXGA+AMYI面粉	0.00	16.85	21.60	33.95	36.98	45.74
F	R0GA面粉	0.00	9.81	11.74	16.96	18.39	23.17	E	对照+RXGA+AMYI面粉	0.00	16.85	21.60	33.95	36.98	45.74
F	R0GA面粉	0.00	9.81	11.74	16.96	18.39	23.17	G	R0GA面粉+MAMYI	0.00	15.53	19.69	29.75	32.11	39.94
H	R0GA面粉+AMYI面粉	0.00	13.35	16.27	23.60	25.53	31.68	G	R0GA面粉+MAMYI	0.00	15.53	19.69	29.75	32.11	39.94

这些数据说明，玉米中表达的ROGA酶相对于无酶对照可以增加发酵速度。这也验证了前面说明玉米籽粒中表达的AMYI酶是玉米中淀粉发酵的有利激活剂的数据。

以下详细给出了乙醇含量。

表 23

样品	面粉组成	ETOH％v/v	标准差
样品	面粉组成	ETOH％v/v	标准差	A	对照	2.09	0.08
B	对照+RXGA	7.97	0.18	A	对照	2.09	0.08
B	对照+RXGA	7.97	0.18	C	对照+RXGA+MAMYI	13.47	0.27
D	对照+MAMYI	11.26	0.12	C	对照+RXGA+MAMYI	13.47	0.27
D	对照+MAMYI	11.26	0.12	E	对照+RXGA+AMYI面粉	12.28	0.08
F	ROGA面粉	3.55	0.05	E	对照+RXGA+AMYI面粉	12.28	0.08
F	ROGA面粉	3.55	0.05	G	ROGA面粉+MAMYI	11.29	0.18
H	ROGA面粉+AMYI面粉	8.58	0.13	G	ROGA面粉+MAMYI	11.29	0.18

这些数据也说明，在玉米中表达米根霉葡糖淀粉酶可以利于玉米中的淀粉的发酵增加。类似地，在玉米中表达大麦淀粉酶也可以使玉米淀粉在不添加外源酶的情况下更能够被发酵。

实施例55

纤维二糖水解酶I

基于公布的数据库序列(登录号#E00389)，通过RT-PCR扩增和克隆Trichoderma reesei纤维二糖水解酶I(CBHI)基因。利用SignalP程序分析此cDNA序列是否存在信号序列，该程序预测到17个氨基酸的信号序列。如序列(SEQ ID NO：79)中所示，通过PCR将编码此信号序列的DNA序列替换成ATG。此cDNA序列用于制备随后的构建体。通过替换成该基因的玉米优化型版本(SEQ ID NO：93)，还制备其它构建体。

实施例56

纤维二糖水解酶II

基于公布的数据库序列(登录号#M55080)，通过RT-PCR扩增和克隆Trichoderma reesei纤维二糖水解酶II(CBH II)基因。利用SignalP程序分析此cDNA序列是否存在信号序列，该程序预测到18个氨基酸的信号序列。如序列(SEQ ID NO：81)中所示，通过PCR将编码此信号序列的DNA序列替换成ATG。此cDNA序列用于制备随后的构建体。通过替换成该基因的玉米优化型版本(SEQ ID NO：94)，还制备其它构建体。

实施例57

构建用于Trichoderma reesii纤维二糖水解酶I和纤维二糖水解酶II的转化载体

在实施例55中描述了无天然N端信号序列的Trichoderma reesii纤维二糖水解酶I(cbhi)cDNA的克隆。按如下所述，使用各种引导信号，构建表达盒，以在玉米胚乳中表达Trichoderma reesii纤维二糖水解酶I cDNA：

质粒12392包含克隆在用于在细胞质中实现表达以及在胚乳中实现特异表达的γ玉米醇溶蛋白启动子之后的Trichoderma reesiicbhi cDNA。

质粒12391包含按实施例1中所述与Trichoderma reesii cbhicDNA融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO：17)，以便靶向内质网和在质外体中分泌(Torrent等，1997)。将融合物克隆在用于在胚乳中实现特异表达的γ玉米醇溶蛋白启动子之后。

质粒12392包含与C端添加了序列KDEL的Trichoderma reesiicbhi cDNA融合的γ玉米醇溶蛋白N端信号序列，以便靶向和滞留在内质网(ER)中(Munro和Pelham，1987)。将融合物克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。

质粒12656包含与Trichoderma reesii cbhi cDNA融合的造粉体引导肽，以便靶向造粉体(Torrent等，1997)。将融合物克隆在用于在胚乳中实现特异表达的γ玉米醇溶蛋白启动子之后。

将所有表达盒移入二元载体(pNOV2117)中，以便通过农杆菌感染转染至玉米中。该二元载体含有允许使用甘露糖选择转基因细胞的磷酸甘露糖异构酶(PMI)基因。使转化的玉米植物自花授粉或远交，收集种子用于分析。

完全按照针对Trichoderma reesii cbhi cDNA描述的方式，使用与Trichoderma reesii纤维二糖水解酶II(cbhii)cDNA融合的上述引导信号，制备了其它的构建体(质粒12652、12653、12654和12655)。这些融合物被克隆在用于在胚乳中实现特异表达的玉米Q蛋白启动子(50Kdγ玉米醇溶蛋白)之后，并按上述方法转化至玉米中。使转化的玉米植物自花授粉或远交，收集种子用于分析。

可以通过使分别表达各单个酶的植物杂交，或者通过将几个表达盒克隆在相同二元载体中实现共转化，而产生酶的组合。

实施例58

在玉米中表达cbhi

从转化了质粒12390、12391或12392的自花授粉玉米植物，获得T1种子。12390构建体使CbhI的表达靶向胚乳的内质网中，12391构建体使CbhI的表达靶向胚乳的质外体中，12392构建体使CbhI的表达靶向胚乳的细胞质中。

从玉米面粉提取和检测CbhI：根据已建立的方案，在山羊中产生CbhI和CbhII的多克隆抗体。通过在Autogizer研磨机中研磨CbhI转基因种子，自这些种子获得面粉。将大约50mg面粉悬浮在0.5ml20mM NaPO₄缓冲液(pH7.4)、150mM NaCl中，之后不停振摇下RT温育15分钟。然后10,000×g离心该温育混合物10分钟。使用上清液作为酶的来源。将30μl该提取物加载至4-12％NuPAGE凝胶(Invitrogen)上，在NuPAGE MES电泳缓冲液(Invitrogen)中分离。将蛋白质印迹在硝化纤维素膜上，使用上述特异抗体，之后使用碱性磷酸酶缀合的兔抗山羊IgG(H+L)，遵循已经建立的操作方案实施Western印迹。通过膜与来自Moss Inc.的即用型BCIP/MBT(plus)底物一起温育，检测碱性磷酸酶活性。

对来自质粒12390转化的不同事件的T1种子实施Western印迹分析。将CbhI蛋白质的表达与非转基因对照比较，并在多个事件中对其进行检测。

基本上按照实施例49中所述，使用表达Cbhi的转基因种子进行碎玉米试验。测定从转基因种子回收的淀粉，结果显示在表24中。

表 24

	株系3-非表达对照	株系4-表达CBHI
	株系3-非表达对照	株系4-表达CBHI	条件	淀粉	(mg)
400ppm SO2-无菠萝蛋白酶	40.2	78.1	条件	淀粉	(mg)
400ppm SO2-无菠萝蛋白酶	40.2	78.1	400ppm SO2-加菠萝蛋白酶	48.1	118.7
2000ppm SO2-无菠萝蛋白酶	47.5	73.1	400ppm SO2-加菠萝蛋白酶	48.1	118.7
2000ppm SO2-无菠萝蛋白酶	47.5	73.1	2000ppm SO2-加菠萝蛋白酶	49.2	109

实施例59

制备内切葡聚糖酶I构建体

基于公布的数据库序列(登录号#M15665；Penttila等，1986)，通过PCR扩增和克隆Trichoderma reesii内切葡聚糖酶I(EGLI)基因。由于仅仅获得基因组序列，故通过使用重叠PCR除去2个内含子，从基因组序列产生cDNA。所得cDNA使用Signal程序分析是否存在信号序列，该程序预测到一个22个氨基酸的信号序列。如序列(SEQ ID NO：83)中所示，通过PCR将编码该信号序列的DNA序列替换成ATG。如下述，该cDNA序列用于制备随后的构建体。

重叠PCR(overlap PCR)

重叠PCR是用于将两个或多个PCR产物的互补末端融合在一起的技术(Ho等，1989)，其可以用于改变碱基对(bp)、添加bp或缺失bp。在期望的bp改变的位点，制备正向和反向诱变引物(Mut-F和Mut-R)，所述引物含有期望的变化以及在所述变化的任一侧的各15bp序列。例如，为了除去内含子，引物由与外显子2的头15bp融合的外显子1的最后15bp组成。还制备与待扩增的序列的末端退火的引物，例如ATG和STOP密码子引物。在独立的反应中使用ATG/Mut-R引物对和Mut-F/STOP引物对进行产物的PCR扩增。凝胶纯化产物，在PCR中不添加引物的情况下将这些产物融合在一起。在凝胶上分离融合反应物，凝胶纯化正确大小的条带，并克隆。可以通过添加其它诱变引物对，同时实现多个变化。

EGLI植物表达构建体

按如下所述，制备表达盒以在玉米胚乳中表达Trichodermareesei ELGI cDNA：

13025包含克隆在用于细胞质定位和在胚乳中特异性表达的玉米γ玉米醇溶蛋白启动子之后的T.reesei EGLI基因。

13026包含与T.reesei EGLI基因融合的玉米γ-玉米醇溶蛋白N端信号肽(MRVLLVALALLALAASATS)，以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

13027包含与C端添加了序列KDEL的T.reesei EGLI基因融合的玉米γ-玉米醇溶蛋白N端信号肽，以便靶向和滞留在内质网中。该融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

13028包含与T.reesei EGLI基因融合的玉米颗粒结合型淀粉合酶I(GBSSI)N端信号肽(N端77个氨基酸)，以便靶向造粉体的内腔。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

13029包含与C端添加了玉米6BSSI基因的淀粉结合域(C端301个氨基酸)的T.reesei EGLI基因融合的玉米GBSSIN端信号肽，以便靶向淀粉粒。该融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

使用ELGI的玉米优化型版本(SEQ ID NO：95)，还可以制备其它表达盒。

EGLI酶试验

使用麦芽β-葡聚糖酶试验试剂盒(Cat# K-MBGL)(MegazymeInternational Ireland Ltd.)，在转基因玉米中测定EGLI酶活性。按实施例53中所述，在玉米纤维水解试验中，检查EGLI表达者的酶促活性。

实施例60

β-葡糖苷酶2

基于序列登录号#AB003110(Takashima等，1999)，通过RT-PCR扩增和克隆Trichoderma reesei的β-葡糖苷酶2(BGL2)基因。

BGL2植物表达构建体

按如下制备表达盒以在玉米胚乳中表达Trichoderma reesei的BGL2 cDNA(SEQ ID NO：89)：

13030包含克隆在用于细胞质定位和在胚乳中特异表达的玉米γ-玉米醇溶蛋白启动子之后的T.reesei BGL2基因。

13031包含与T.reesei BGL2基因融合的玉米γ-玉米醇溶蛋白N端信号肽(MRVLLVALALLALAASATS)，以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

13032包含与C端添加了序列KDEL的T.reesei BGL2基因融合的玉米γ-玉米醇溶蛋白N端信号肽，以便靶向和滞留在内质网中。该融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

13033包含与T.reesei BGL2基因融合的玉米颗粒结合型淀粉合酶I(GBSSI)N端信号肽(N端77个氨基酸)，以便靶向造粉体的内腔。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

13034包含与C端添加了玉米GBSSI基因的淀粉结合域(C端301个氨基酸)的T.reesei BGL2基因融合的玉米GBSSI N端信号肽，以便靶向淀粉粒。该融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。

替换BGL2的玉米优化型版本(SEQ ID NO：96)，还可以制备其它表达盒。

将所有表达盒插入二元载体pNOV2117，以便通过农杆菌感染转化入玉米。该二元载体含有磷酸甘露糖异构酶(PMI)基因，该基因允许用甘露糖选择转基因细胞。转化的玉米植物自交或远交，并收集种子用于分析。

BGL2酶试验

使用从Bauer和Kelly(Bguer，M.W.和Kelly，R.M.，1998，来自Pyrococcus furiosus和Agrobacterium faecalis的β-葡糖苷酶家族1具有共同的催化机制，Biochemistry37：17170-17178)改良的方案，在转基因玉米中测定BGL2酶活性。可以修饰该方案以在37℃而非100℃温育样品。在纤维水解试验中，检查BGL2表达者的酶促活性。

实施例61

β-葡糖苷酶D

基于公布的数据库序列(登录号#AY281378；Foreman等，2003)，通过PCR扩增和克隆Trichoderma reesei的β-葡糖苷酶D(CEL3D)基因。由于仅仅获得基因组序列，故通过使用如实施例58所述的重叠PCR除去2个内含子，而从该基因组序列产生cDNA。所得cDNA(SEQ IDNO：91)可用于随后的构建体。也可以将玉米优化型版本(SEQ ID NO：97)用于构建体。

按照实施例60中针对BGL2所述的方法，通过用CEL3D替换BGL2，可以产生植物构建体并可以实施β-葡糖苷酶试验。

实施例62

脂肪酶

使用来自登录号#D85895、AF04488和AF04489(Tsuchiya等，1996；Yu等，2003)的序列以及实施例59和60中所述方法学，产生编码脂肪酶的cDNA。

使用荧光脂肪酶试验试剂盒(Cat #M0621)(Marker GeneTechnologies，Inc.)，在转基因玉米中测定脂肪酶活性。也可以使用荧光底物1，2-二油酰基-3-(芘-1-基)癸酰基-rac甘油(M0258)(也来自Marker Gene Technologies，Inc.)，体内测定脂肪酶活性。

实施例63

在稻中表达植酸酶

载体11267和11268包含编码Nov9x植酸酶的二元载体。在两个载体中Nov9x植酸酶基因的表达处于稻的谷蛋白-1启动子(SEQ ID NO：67)的控制之下。载体11267和11268来源于pNOV2117。

载体11267中Nov9x植酸酶表达盒包含稻的谷蛋白-1启动子、具有质外体引导信号的Nov9x植酸酶基因、PEPC内含子和35S终止子。载体11267中的Nov9x植酸酶编码序列的产物显示在SEQ ID NO：110中。

载体11268中Nov9x植酸酶表达盒包含稻的谷蛋白-1启动子、具有ER滞留信号的Nov9x植酸酶基因(SEQ ID NO：111)、PEPC内含子和35S终止子。载体11268中的Nov9x植酸酶编码序列的产物显示在SEQ ID NO：112中。

具有质外体引导DNA序列的11267 Nov9x植酸酶(SEQ ID NO：109)。下划线处为翻译起始和终止密码子。编码27kDγ-玉米醇溶蛋白信号序列的序列为粗体。

atgagggtgttgctcgttgccctcgctctcctggctctcgctgcgagcgccaccagcgctgcgcagtccgagccggagctgaagctgg

agtccgtggtgatcgtgtcccgccacggcgtgcgcgccccgaccaaggccacccagctcatgcaggacgtgaccccggacgcctggcc

gacctggccggtgaagctcggcgagctgaccccgcgcggcggcgagctgatcgcctacctcggccactactggcgccagcgcctcgtg

gccgacggcctcctcccgaagtgcggctgcccgcagtccggccaggtggccatcatcgccgacgtggacgagcgcacccgcaagacc

ggcgaggccttcgccgccggcctcgccccggactgcgccatcaccgtgcacacccaggccgacacctcctccccggacccgctcttc aa

cccgctcaagaccggcgtgtgccagctcgacaacgccaacgtgaccgacgccatcctggagcgcgccggcggctccatcgccgacttc

accggccactaccagaccgccttccgcgagctggagcgcgtgctcaacttcccgcagtccaacctctgcctcaagcgcgagaagcagga

cgagtcctgctccctcacccaggccctcccgtccgagctgaaggtgtccgccgactgcgtgtccctcaccggcgccgtgtccctcgcctcc

atgctcaccgaaatcttcctcctccagcaggcccagggcatgccggagccgggctggggccgcatcaccgactcccaccagtggaacac

cctcctctccctccacaacgcccagttcgacctcctccagcgcaccccggaggtggcccgctcccgcgccaccccgctcctcgacctcatc

aagaccgccctcaccccgcacccgccgcagaagcaggcctacggcgtgaccctcccgacctccgtgctcttcatcgccggccacgacac

caacctcgccaacctcggcggcgccctggagctgaactggaccctcccgggccagccggacaacaccccgccgggcggcgagctggt

gttcgagcgctggcgccgcctctccgacaactcccagtggattcaggtgtccctcgtgttccagaccctccagcagatgcgcgacaagacc

ccgctctccctcaacaccccgccgggcgaggtgaagctcaccctcgccggctgcgaggagcgcaacgcccagggcatgtgctccctcg

ccggcttcacccagatcgtgaacgaggcccgcatcccggcctgctccctctaa

具有质外体引导基因产物的11267 Nov9x植酸酶(SEQ ID NO：110)。27kDγ-玉米醇溶蛋白信号序列为粗体。

mrvllvalallalaasatsaaqslkoelklesvvivsrhgvraptkatqlmqdvtpdawptwpvklgeltprggeliaylghywrqrlva

dgllpkcgcpqsgqvaiiadvdertrktgealaaglapdcaitvhtqadtsspdplfinplktgvcqldnanvtdaileraggsiadnghy

qtafrelervlnfpqsnlclkrekqdescsltqalpselkvsadcvsltgavslasmlteiflqqaqgmpepgwgritdshqwntllslhn

aqfdllqrtpevarsratplldliktaltphppqkqaygvtlptsvlfiaghdtnlanlggalelnwtlpgqpdntppggelvferwrrlsdn

sqwiqvslvfqtlqqmrdktplslntppgevkltlagceernaqgmcslagftqivnearipacsl

具有ER滞留DNA序列的11268 Nov9x植酸酶(SEQ ID NO：111)。编码27kDγ-玉米醇溶蛋白信号序列的序列为粗体。编码SEKDEL六肽ER滞留信号的序列加有下划线。

ggcgaggccttcgccgccggcctcgccccggactgcgccatcaccgtgcacacccaggccgacacctcctccccggacccgctcttcaa

ccggcttcacccagatcgtgaacgaggcccgcatcccggcctgctccctc tccgagaaggacgagctgtaa

具有ER滞留的11268 Nov9x植酸酶基因产物(SEQ ID NO：112)。27kDγ-玉米醇溶蛋白信号序列为粗体。ER滞留信号加有下划线。

mrvllvalallalaasatsaaqsepelklesvvivsrhgvraptkatqlmqdvtpdawptwpvklgeltprggeliaylghywrqrlva

dgllpkcgcpqsgqvaiiadvdertrktgeafaaglapdcaitvhtqadtsspdplfnplktgvcqldnanvtdaileraggsiadftghy

qtafrelervlnfpqsnlclkrekqdescsltqalpselkvsadcvsltgavslasmlteifllqqaqgmpepgwgritdshqwntllslhn

snwinvslvfqtlqqmrdktplslntppgevkltlagceemaqgmncslagftqivnearipacsl sekdel

产生转基因稻植物

使用稻(Oryza sativa)产生转基因植物。各种稻栽培品种都可以使用(Hiei等，1994，Plant Journa l6：271-282；Dong等，1996，Molecular Breeding2：267-276；Hiei等，1997，Plant MolecularBiology，35：205-218)。此外，可以变化下述各种培养基成分的浓度或替换这些培养基成分。通过在MS-CIM培养基(MS基础盐，4.3g/升；B5维生素(200×)，5ml/升；蔗糖，30g/升；脯氨酸，500mg/升；谷氨酰胺，500mg/升；酪蛋白水解物，300mg/升；2，4-D(1mg/ml)，2ml/升；用1N KOH调节pH至5.8；Phytagel，3g/升)上培养，从成熟胚起动胚发生反应和/或建立培养物。接种处于培养反应的初始阶段的成熟胚或者已建立的培养系，将其与含有期望的载体构建体的农杆菌菌株LBA4404共培养。农杆菌自甘油贮存物出发在固体YPC培养基(100mg/L壮观霉素和任何其它适宜的抗生素)上28℃培养大约2天。在液体MS-CIM培养基中重悬农杆菌。将农杆菌培养物稀释至OD600等于0.2至0.3，加入乙酰丁香酮至200μM终浓度。用乙酰丁香酮诱导农杆菌，之后该溶液与稻培养物混合。为了接种，将培养物浸没在此细菌悬浮液中。除去液体细菌悬浮液，将接种后的培养物置于共培养培养基上，22℃孵育2天。然后将培养物转移至具有Ticarcillin(400mg/升)的MS-CIM培养基上，以抑制农杆菌生长。对于使用PMI选择标记基因(Reed等，In Vitro Cell.Dev.Biol.-Plant，37：127-132)的构建体，7天后将培养物转移至含有甘露糖作为碳水化合物的来源的选择培养基(具有2％甘露糖、300mg/升Ticarcillin的MS)上，并在暗处培养3至4周。然后将抗性集落转移至再生诱导培养基(不具有2，4-D、具有0.5mg/升IAA、1mg/升玉米素、200mg/升Ticarcillin、2％甘露糖和3％山梨糖醇的MS)，在暗处培养14天。然后将增殖的集落转移至另一轮再生诱导培养基上，并移动至亮生长室。将再生的芽转移至GA7-1培养基(不带激素但具有2％山梨糖醇的MS)2周，然后在它们足够大并具有充足的根时移至温室。将植物移栽在温室的土壤中并栽培至成熟。

实施例64

分析表达Nov9x植酸酶的转基因稻种子

用于定量来自稻种子的Nov9x植酸酶的ELISA

通过ELISA分析转基因稻种子中表达的植酸酶的量。将1颗(1g)稻种子在Kleco种子研磨机中研磨成面粉。在实施例中针对Nov9x植酸酶活性试验描述的乙酸钠缓冲液中重悬50mg面粉，并按照免疫测定试验的要求进行稀释。Nov9x免疫测定试验是一种使用两种多克隆抗体检测植酸酶的定量三明治试验。兔抗体使用蛋白质A进行纯化，而山羊抗体使用在大肠杆菌包函体中产生的重组植酸酶(Nov9x)蛋白质进行免疫亲和纯化。使用这些高度特异的抗体，该试验可以测定转基因植物中皮克水平的植酸酶。该试验有三个基本部分。使用兔抗体将样品中的植酸酶蛋白质捕获在固相微量滴定板孔上。然后在固相抗体、植酸酶蛋白质和已经添加在孔中的二抗之间形成“三明治”。洗涤步骤(在此除去未结合的二抗)后，使用碱性磷酸酶标记的抗体检测结合的抗体。添加该酶的底物，并通过读取每孔的吸光度，测定颜色的显现。标准曲线使用4参数曲线拟合以绘制出浓度对吸光度的曲线图。

植酸酶活性试验

可以按照Engelen，A.J.等，J.AOAC.Inter.，84，269(2001)的方法，基于对植酸水解所释放的无机磷酸的估计，37℃测定植酸酶活性。一单位酶活性定义为在试验条件下每分钟释放1μmol无机磷酸的酶量。例如，可以通过与在补加有1mM CaCl₂的250mM乙酸钠缓冲液pH5.5中将2.0ml酶制备物与4.0ml 9.1mM植酸钠在37℃温育60分钟，测定植酸酶活性。温育后，加入4.0ml由等份的10％(w/v)钼酸铵和0.235％(w/v)钒酸铵原液组成的颜色终止试剂，终止反应。离心除去沉淀，相对于一组磷酸标准品，通过分光光度法于415nm测定释放的磷酸。使用产生的磷酸标准曲线，通过外推从含有植酸酶的样品获得的A415nm吸光度值，计算植酸酶活性。

该操作方案可以按比例缩小以适应更小的体积，并且可以进行适应性调整以适合优选的容器。优选的容器包括玻璃试管和塑料微量板。将反应容器部分浸没在水浴中是在酶反应过程中维持恒定温度所必需的。

表 24

转基因株系	μg植酸酶每g面粉*	植酸酶活性单位每克面粉**	通过蒸煮去壳的稻种子所释放的内源无机磷酸(μmol/g种子)	通过蒸煮经过去壳和碾米处理的稻种子所释放的内源无机磷酸(μmol/g种子)
转基因株系	μg植酸酶每g面粉*	植酸酶活性单位每克面粉**	通过蒸煮去壳的稻种子所释放的内源无机磷酸(μmol/g种子)	通过蒸煮经过去壳和碾米处理的稻种子所释放的内源无机磷酸(μmol/g种子)	野生型	0	0	1.442	0.469
1	510	916	1.934	0.840	野生型	0	0	1.442	0.469
1	510	916	1.934	0.840	2	1518	2800	2.894	1.073

^*通过三明治ELISA测定植酸酶μg数。

^**通过上述的植酸酶活性检测法检测植酸酶活性。

在表达植酸酶的转基因稻的蒸煮过程中分析无机磷酸的释放

来自选定的稻转基因株系和对照野生型株系的两个1g种子样品，使用台式Kett TR200自动稻脱壳机去壳。然后一个样品在Kett稻碾米机(polisher)中进行30秒的碾米处理(polish)。向每一份样品加入两体积H2O，将管子浸在有水的烧杯中进行稻的蒸煮。将水煮沸，并保持在完全沸腾的煮沸状态10分钟。然后将“蒸煮的”稻种研磨成糊，用水使浆液的总体积达到6ml。15,000×g离心浆液10分钟，测定清澈的上清液中释放的内源性无机磷酸。对释放的磷酸的分析基于由钼酸盐和钒酸盐离子与无机磷酸络合引起的颜色形成而进行，按照实施例中针对植酸酶活性而描述的方法通过分光光度法在415nm实施测定。结果在表24中。

所有出版物、专利、专利申请均并入此处作为参考。尽管在前面的说明书中已经联系本发明的某些优选实施方案对本发明进行了描述，而且为了举例说明的目的阐述了许多细节，但是本领域技术人员明了，本发明可以允许其它的实施方案，并且可以对本文描述的某些细节进行相当大的改变而不偏离本发明的基本原则。

序列表

<110>Lanahan，Mike

<120>自加工植物和植物部分

<130>109846.317

<140>US 60/315,281

<141>2001-08-27

<160>60

<170>FastSEQ for Windows Version 4.0

<210>1

<211>436

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>1

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala

1 5 10 15

Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg

20 25 30

Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile

35 40 45

Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp

50 55 60

Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val

65 70 75 80

Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr

85 90 95

Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His

100 105 110

Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr

115 120 125

Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr

130 135 140

Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe

145 150 155 160

Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp

165 170 175

Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly

180 185 190

Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val

195 200 205

Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr

210 215 220

Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly

225 230 235 240

Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe

245 250 255

Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly

260 265 270

Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn

275 280 285

His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile

290 295 300

Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu

305 310 315 320

Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn

325 330 335

Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met

340 345 350

Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr

355 360 365

Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys

370 375 380

Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp

385 390 395 400

Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro

405 410 415

Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr

420 425 430

Cys Gly Val Gly

435

<210>2

<211>1308

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>2

atggccaagt acctggagct ggaggagggc ggcgtgatca tgcaggcgtt ctactgggac 60

gtcccgagcg gaggcatctg gtgggacacc atccgccaga agatccccga gtggtacgac 120

gccggcatct ccgcgatctg gataccgcca gcttccaagg gcatgtccgg gggctactcg 180

atgggctacg acccgtacga ctacttcgac ctcggcgagt actaccagaa gggcacggtg 240

gagacgcgct tcgggtccaa gcaggagctc atcaacatga tcaacacggc gcacgcctac 300

ggcatcaagg tcatcgcgga catcgtgatc aaccacaggg ccggcggcga cctggagtgg 360

aacccgttcg tcggcgacta cacctggacg gacttctcca aggtcgcctc cggcaagtac 420

accgccaact acctcgactt ccaccccaac gagctgcacg cgggcgactc cggcacgttc 480

ggcggctacc cggacatctg ccacgacaag tcctgggacc agtactggct ctgggcctcg 540

caggagtcct acgcggccta cctgcgctcc atcggcatcg acgcgtggcg cttcgactac 600

gtcaagggct acggggcctg ggtggtcaag gactggctca actggtgggg cggctgggcg 660

gtgggcgagt actgggacac caacgtcgac gcgctgctca actgggccta ctcctccggc 720

gccaaggtgt tcgacttccc cctgtactac aagatggacg cggccttcga caacaagaac 780

atcccggcgc tcgtcgaggc cctgaagaac ggcggcacgg tggtctcccg cgacccgttc 840

aaggccgtga ccttcgtcgc caaccacgac acggacatca tctggaacaa gtacccggcg 900

tacgccttca tcctcaccta cgagggccag cccacgatct tctaccgcga ctacgaggag 960

tggctgaaca aggacaagct caagaacctg atctggattc acgacaacct cgcgggcggc 1020

tccactagta tcgtgtacta cgactccgac gagatgatct tcgtccgcaa cggctacggc 1080

tccaagcccg gcctgatcac gtacatcaac ctgggctcct ccaaggtggg ccgctgggtg 1140

tacgtcccga agttcgccgg cgcgtgcatc cacgagtaca ccggcaacct cggcggctgg 1200

gtggacaagt acgtgtactc ctccggctgg gtctacctgg aggccccggc ctacgacccc 1260

gccaacggcc agtacggcta ctccgtgtgg tcctactgcg gcgtcggc 1308

<210>3

<211>800

<212>PRT

<2l3>人工序列

<220>

<223>合成的

<400>3

Met Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe Thr Gly Glu

1 5 10 15

Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met Asp Leu Thr

20 25 30

Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala Lys Asp Val

35 40 45

Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala Glu Val Trp

50 55 60

Ile Leu Gln Gly Val Glu Glu Ile phe Tyr Glu Lys Pro Asp Thr Ser

65 70 75 80

Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val Ile Glu Ala

85 90 95

Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu Phe Lys Val

100 105 110

Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu Lys Ala Asp

115 120 125

Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val Leu Ser Glu

130 135 140

Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu Ile Ile Glu

145 150 155 160

Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu Asp Asp Tyr

165 170 175

Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu Lys Thr Ile

180 185 190

Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val Leu Leu Phe

195 200 205

Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn Met Glu Tyr

210 215 220

Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp Leu Asp Gly

225 230 235 240

Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile Arg Thr Thr

245 250 255

Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala ASn Asn Gln Glu Ser Ala

260 265 270

Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu Asn Asp Arg

275 280 285

Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr Glu Ile His

290 295 300

Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys Asn Lys Gly

305 310 315 320

Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Gly Pro Gly Gly Val

325 330 335

Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr His Val His

340 345 350

Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu Asp Lys Asp

355 360 365

Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu Phe Met Val

370 375 380

Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His Thr Arg Ile

385 390 395 400

Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His Gly Ile Gly

405 410 415

Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile Gly Glu Leu

420 425 430

Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg Ile Asp Lys

435 440 445

Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val Ile Ala Ser

450 455 460

Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val Thr Tyr Trp

465 470 475 480

Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln Met Gly Leu

485 490 495

Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu His Lys Ile

500 505 510

Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly Trp Gly Ala

515 520 525

Pro Ile Arg Phe Gly Lys Ser Asp Val Ala gly Thr His Val Ala Ala

530 535 540

Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val Phe Asn Pro

545 550 555 560

Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu Thr Lys Ile

565 570 575

Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys Leu Ile Lys

580 585 90

Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala Ala Cys His

595 600 605

Asp Asn His Thr Leu Trp Asp Lys Ash Tyr Leu Ala Ala Lys Ala Asp

610 615 620

Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala Gln Lys Leu

625 630 635 640

Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe Leu His Gly

645 650 655

Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn Ser Tyr Asn

660 665 670

Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys Leu Gln Phe

675 680 685

Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu Arg Lys Glu

690 695 700

His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys Lys His Leu

705 710 715 720

Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met Leu Lys Asp

725 730 735

His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile Tyr Asn Gly

740 745 750

Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys Trp Asn Val

755 760 765

Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu Thr Val Glu

770 775 780

Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu Tyr Arg Glu

785 790 795 800

<210>4

<211>2400

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>4

atgggccact ggtacaagca ccagcgcgcc taccagttca ccggcgagga cgacttcggg 60

aaggtggccg tggtgaagct cccgatggac ctcaccaagg tgggcatcat cgtgcgcctc 120

aacgagtggc aggcgaagga cgtggccaag gaccgcttca tcgagatcaa ggacggcaag 180

gccgaggtgt ggatactcca gggcgtggag gagatcttct acgagaagcc ggacacctcc 240

ccgcgcatct tcttcgccca ggcccgctcc aacaaggtga tcgaggcctt cctcaccaac 300

ccggtggaca ccaagaagaa ggagctgttc aaggtgaccg tcgacggcaa ggagatcccg 360

gtgtcccgcg tggagaaggc cgacccgacc gacatcgacg tgaccaacta cgtgcgcatc 420

gtgctctccg agtccctcaa ggaggaggac ctccgcaagg acgtggagct gatcatcgag 480

ggctacaagc cggcccgcgt gatcatgatg gagatcctcg acgactacta ctacgacggc 540

gagctggggg cggtgtactc cccggagaag accatcttcc gcgtgtggtc cccggtgtcc 600

aagtgggtga aggtgctcct cttcaagaac ggcgaggaca ccgagccgta ccaggtggtg 660

aacatggagt acaagggcaa cggcgtgtgg gaggccgtgg tggagggcga cctcgacggc 720

gtgttctacc tctaccagct ggagaactac ggcaagatcc gcaccaccgt ggacccgtac 780

tccaaggccg tgtacgccaa caaccaggag tctgcagtgg tgaacctcgc ccgcaccaac 840

ccggagggct gggagaacga ccgcggcccg aagatcgagg gctacgagga cgccatcatc 900

tacgagatcc acatcgccga catcaccggc ctggagaact ccggcgtgaa gaacaagggc 960

ctctacctcg gcctcaccga ggagaacacc aaggccccgg gcggcgtgac caccggcctc 1020

tcccacctcg tggagctggg cgtgacccac gtgcacatcc tcccgttctt cgacttctac 1080

accggcgacg agctggacaa ggacttcgag aagtactaca actggggcta cgacccgtac 1140

ctcttcatgg tgccggaggg ccgctactcc accgacccga agaacccgca cacccgaatt 1200

cgcgaggtga aggagatggt gaaggccctc cacaagcacg gcatcggcgt gatcatggac 1260

atggtgttcc cgcacaccta cggcatcggc gagctgtccg ccttcgacca gaccgtgccg 1320

tactacttct accgcatcga caagaccggc gcctacctca acgagtccgg ctgcggcaac 1380

gtgatcgcct ccgagcgccc gatgatgcgc aagttcatcg tggacaccgt gacctactgg 1440

gtgaaggagt accacatcga cggcttccgc ttcgaccaga tgggcctcat cgacaagaag 1500

accatgctgg aggtggagcg cgccctccac aagatcgacc cgaccatcat cctctacggc 1560

gagccgtggg gcggctgggg ggccccgatc cgcttcggca agtccgacgt ggccggcacc 1620

cacgtggccg ccttcaacga cgagttccgc gacgccatcc gcggctccgt gttcaacccg 1680

tccgtgaagg gcttcgtgat gggcggctac ggcaaggaga ccaagatcaa gcgcggcgtg 1740

gtgggctcca tcaactacga cggcaagctc atcaagtcct tcgccctcga cccggaggag 1800

accatcaact acgccgcctg ccacgacaac cacaccctct gggacaagaa ctacctcgcc 1860

gccaaggccg acaagaagaa ggagtggacc gaggaggagc tgaagaacgc ccagaagctc 1920

gccggcgcca tcctcctcac tagtcagggc gtgccgttcc tccacggcgg ccaggacttc 1980

tgccgcacca ccaacttcaa cgacaactcc tacaacgccc cgatctccat caacggcttc 2040

gactacgagc gcaagctcca gttcatcgac gtgttcaact accacaaggg cctcatcaag 2100

ctccgcaagg agcacccggc cttccgcctc aagaacgccg aggagatcaa gaagcacctg 2160

gagttcctcc cgggcgggcg ccgcatcgtg gccttcatgc tcaaggacca cgccggcggc 2220

gacccgtgga aggacatcgt ggtgatctac aacggcaacc tggagaagac cacctacaag 2280

ctcccggagg gcaagtggaa cgtggtggtg aactcccaga aggccggcac cgaggtgatc 2340

gagaccgtgg agggcaccat cgagctggac ccgctctccg cctacgtgct ctaccgcgag 2400

<210>5

<211>693

<212>PRT

<213>硫磺矿硫化叶菌

<400>5

Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr Lys Val Val

1 5 10 15

Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu Gln Lys Ile

20 25 30

Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile Val Gln Gln

35 40 45

Gly Asn Lys Val lle Val Glu Lys Ser Leu Asp Leu Lys Glu His lle

50 55 60

Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys Arg Lys Arg

65 70 75 80

Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys Tyr Gln Asp

85 90 95

Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys Asp Gly Val

100 105 110

Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile Phe Asp Val

115 120 125

Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro Glu Asp Ser

130 135 140

Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp Val Leu Glu

145 150 155 160

Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro Met Trp Ala

165 170 175

Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln Asp Lys Val

180 185 190

Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg Val Ala Gly

195 200 205

Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu Phe Thr Trp

210 215 220

His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp Glu Leu His

225 230 235 240

Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly Ile Arg Val

245 250 255

Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys Phe Cys Glu

260 265 270

Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro Gly Thr Thr

275 280 285

Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp Trp Ala Gly

290 295 300

Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile Trp Leu Asp

305 310 315 320

Met Asn Glu Pro Thr Asp Phe Ser Arg Ala lle Glu Ile Arg Asp Val

325 330 335

Leu Ser Set Leu Pro Val Gln Phe Arg Asp Asp Arg Leu Val Thr Thr

340 345 350

Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg Val Lys His

355 360 365

Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met Ala Thr Phe

370 375 380

Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile Leu Ser Arg

385 390 395 400

Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp Thr Gly Asp

405 410 415

Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln Leu Val Leu

420 425 430

Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp Ile Gly Gly

435 440 445

Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Ash Ser Met Asp Leu Leu

450 455 460

Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr Arg Ser His

465 470 475 480

Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu Pro Asp Tyr

485 490 495

Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr Lys Phe Leu

500 505 510

Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys Gly His Pro

515 520 525

Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp Asp Met Tyr

530 535 540

Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu Tyr Ala Pro

545 550 555 560

Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro Arg Gly Lys

565 570 575

Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys Ser Val Val

580 585 590

Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly Ser Ile Ile

595 600 605

Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr Ser Phe Lys

610 615 620

Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu Ile Lys Phe

625 630 635 640

Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser Glu Lys Pro

645 650 655

Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln Val Glu Lys

660 665 670

Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys Ile Arg Gly

675 680 685

Lys Ile Asn Leu Glu

690

<210>6

<211>2082

<212>DNA

<213>硫磺矿硫化叶菌

<400>6

atggagacca tcaagatcta cgagaacaag ggcgtgtaca aggtggtgat cggcgagccg 60

ttcccgccga tcgagttccc gctcgagcag aagatctcct ccaacaagtc cctctccgag 120

ctgggcctca ccatcgtgca gcagggcaac aaggtgatcg tggagaagtc cctcgacctc 180

aaggagcaca tcatcggcct cggcgagaag gccttcgagc tggaccgcaa gcgcaagcgc 240

tacgtgatgt acaacgtgga cgccggcgcc tacaagaagt accaggaccc gctctacgtg 300

tccatcccgc tcttcatctc cgtgaaggac ggcgtggcca ccggctactt cttcaactcc 360

gcctccaagg tgatcttcga cgtgggcctc gaggagtacg acaaggtgat cgtgaccatc 420

ccggaggact ccgtggagtt ctacgtgatc gagggcccgc gcatcgagga cgtgctcgag 480

aagtacaccg agctgaccgg caagccgttc ctcccgccga tgtgggcctt cggctacatg 540

atctcccgct actcctacta cccgcaggac aaggtggtgg agctggtgga catcatgcag 600

aaggagggct tccgcgtggc cggcgtgttc ctcgacatcc actacatgga ctcctacaag 660

ctcttcacct ggcacccgta ccgcttcccg gagccgaaga agctcatcga cgagctgcac 720

aagcgcaacg tgaagctcat caccatcgtg gaccacggca tccgcgtgga ccagaactac 780

tccccgttcc tctccggcat gggcaagttc tgcgagatcg agtccggcga gctgttcgtg 840

ggcaagatgt ggccgggcac caccgtgtac ccggacttct tccgcgagga cacccgcgag 900

tggtgggccg gcctcatctc cgagtggctc tcccagggcg tggacggcat ctggctcgac 960

atgaacgagc cgaccgactt ctcccgcgcc atcgagatcc gcgacgtgct ctcctccctc 1020

ccggtgcagt tccgcgacga ccgcctcgtg accaccttcc cggacaacgt ggtgcactac 1080

ctccgcggca agcgcgtgaa gcacgagaag gtgcgcaacg cctacccgct ctacgaggcg 1140

atggccacct tcaagggctt ccgcacctcc caccgcaacg agatcttcat cctctcccgc 1200

gccggctacg ccggcatcca gcgctacgcc ttcatctgga ccggcgacaa caccccgtcc 1260

tgggacgacc tcaagctcca gctccagctc gtgctcggcc tctccatctc cggcgtgccg 1320

ttcgtgggct gcgacatcgg cggcttccag ggccgcaact tcgccgagat cgacaactcg 1380

atggacctcc tcgtgaagta ctacgccctc gccctcttct tcccgttcta ccgctcccac 1440

aaggccaccg acggcatcga caccgagccg gtgttcctcc cggactacta-caaggagaag 1500

gtgaaggaga tcgtggagct gcgctacaag ttcctcccgt acatctactc cctcgccctc 1560

gaggcctccg agaagggcca cccggtgatc cgcccgctct tctacgagtt ccaggacgac 1620

gacgacatgt accgcatcga ggacgagtac atggtgggca agtacctcct ctacgccccg 1680

atcgtgtcca aggaggagtc ccgcctcgtg accctcccgc gcggcaagtg gtacaactac 1740

tggaacggcg agatcatcaa cggcaagtcc gtggtgaagt ccacccacga gctgccgatc 1800

tacctccgcg agggctccat catcccgctc gagggcgacg agctgatcgt gtacggcgag 1860

acctccttca agcgctacga caacgccgag atcacctcct cctccaacga gatcaagttc 1920

tcccgcgaga tctacgtgtc caagctcacc atcacctccg agaagccggt gtccaagatc 1980

atcgtggacg actccaagga gatccaggtg gagaagacca tgcagaacac ctacgtggcc 2040

aagatcaacc agaagatccg cggcaagatc aacctcgagt ga 2082

<210>7

<211>1818

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>7

atggcggctc tggccacgtc gcagctcgtc gcaacgcgcg ccggcctggg cgtcccggac 60

gcgtccacgt tccgccgcgg cgccgcgcag ggcctgaggg gggcccgggc gtcggcggcg 120

gcggacacgc tcagcatgcg gaccagcgcg cgcgcggcgc ccaggcacca gcaccagcag 180

gcgcgccgcg gggccaggtt cccgtcgctc gtcgtgtgcg ccagcgccgg catgaacgtc 240

gtcttcgtcg gcgccgagat ggcgccgtgg agcaagaccg gaggcctcgg cgacgtcctc 300

ggcggcctgc cgccggccat ggccgcgaac gggcaccgtg tcatggtcgt ctctccccgc 360

tacgaccagt acaaggacgc ctgggacacc agcgtcgtgt ccgagatcaa gatgggagac 420

gggtacgaga cggtcaggtt cttccactgc tacaagcgcg gagtggaccg cgtgttcgtt 480

gaccacccac tgttcctgga gagggtttgg ggaaagaccg aggagaagat ctacgggcct 540

gtcgctggaa cggactacag ggacaaccag ctgcggttca gcctgctatg ccaggcagca 600

cttgaagctc caaggatcct gagcctcaac aacaacccat acttctccgg accatacggg 660

gaggacgtcg tgttcgtctg caacgactgg cacaccggcc ctctctcgtg ctacctcaag 720

agcaactacc agtcccacgg catctacagg gacgcaaaga ccgctttctg catccacaac 780

atctcctacc agggccggtt cgccttctcc gactacccgg agctgaacct ccccgagaga 840

ttcaagtcgt ccttcgattt catcgacggc tacgagaagc ccgtggaagg ccggaagatc 900

aactggatga aggccgggat cctcgaggcc gacagggtcc tcaccgtcag cccctactac 960

gccgaggagc tcatctccgg catcgccagg ggctgcgagc tcgacaacat catgcgcctc 1020

accggcatca ccggcatcgt caacggcatg gacgtcagcg agtgggaccc cagcagggac 1080

aagtacatcg ccgtgaagta cgacgtgtcg acggccgtgg aggccaaggc gctgaacaag 1140

gaggcgctgc aggcggaggt cgggctcccg gtggaccgga acatcccgct ggtggcgttc 1200

atcggcaggc tggaagagca gaagggcccc gacgtcatgg cggccgccat cccgcagctc 1260

atggagatgg tggaggacgt gcagatcgtt ctgctgggca cgggcaagaa gaagttcgag 1320

cgcatgctca tgagcgccga ggagaagttc ccaggcaagg tgcgcgccgt ggtcaagttc 1380

aacgcggcgc tggcgcacca catcatggcc ggcgccgacg tgctcgccgt caccagccgc 1440

ttcgagccct gcggcctcat ccagctgcag gggatgcgat acggaacgcc ctgcgcctgc 1500

gcgtccaccg gtggactcgt cgacaccatc atcgaaggca agaccgggtt ccacatgggc 1560

cgcctcagcg tcgactgcaa cgtcgtggag ccggcggacg tcaagaaggt ggccaccacc 1620

ttgcagcgcg ccatcaaggt ggtcggcacg ccggcgtacg aggagatggt gaggaactgc 1680

atgatccagg atctctcctg gaagggccct gccaagaact gggagaacgt gctgctcagc 1740

ctcggggtcg ccggcggcga gccaggggtt gaaggcgagg agatcgcgcc gctcgccaag 1800

gagaacgtgg ccgcgccc 1818

<210>8

<211>606

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>8

Met Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly Leu

1 5 10 15

Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly Leu

20 25 30

Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg Thr

35 40 45

Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg Gly

50 55 60

Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Met Asn Val

65 70 75 80

Val Phe Val Gly Ala Glu Met Ala Pro Trp Ser Lys Thr Gly Gly Leu

85 90 95

Gly Asp Val Leu Gly Gly Leu Pro Pro Ala Met Ala Ala Asn Gly His

100 105 110

Arg Val Met Val Val Ser Pro Arg Tyr Asp Gln Tyr Lys Asp Ala Trp

115 120 125

Asp Thr Ser Val Val Ser Glu Ile Lys Met Gly Asp Gly Tyr Glu Thr

130 135 140

Val Arg Phe Phe His Cys Tyr Lys Arg Gly Val Asp Arg Val Phe Val

145 150 155 160

Asp His Pro Leu Phe Leu Glu Arg Val Trp Gly Lys Thr Glu Glu Lys

165 170 175

Ile Tyr Gly Pro Val Ala Gly Thr Asp Tyr Arg Asp Asn Gln Leu Arg

180 185 190

Phe Ser Leu Leu Cys Gln Ala Ala Leu Glu Ala Pro Arg Ile Leu Ser

195 200 205

Leu Asn Asn Asn Pro Tyr Phe Ser Gly Pro Tyr Gly Glu Asp Val Val

210 215 220

Phe Val Cys Asn Asp Trp His Thr Gly Pro Leu Ser Cys Tyr Leu Lys

225 230 235 240

Ser Asn Tyr Gln Ser His Gly Ile Tyr Arg Asp Ala Lys Thr Ala Phe

245 250 255

Cys Ile His Asn Ile Ser Tyr Gln Gly Arg Phe Ala Phe Ser Asp Tyr

260 265 270

Pro Glu Leu Asn Leu Pro Glu Arg Phe Lys Ser Ser Phe Asp Phe Ile

275 280 285

Asp Gly Tyr Glu Lys Pro Val Glu Gly Arg Lys Ile Asn Trp Met Lys

290 295 300

Ala Gly Ile Leu Glu Ala Asp Arg Val Leu Thr Val Ser Pro Tyr Tyr

305 310 315 320

Ala Glu Glu Leu Ile Ser Gly Ile Ala Arg Gly Cys Glu Leu Asp Asn

325 330 335

Ile Met Arg Leu Thr Gly Ile Thr Gly Ile Val Asn Gly Met Asp Val

340 345 350

Ser Glu Trp Asp Pro Ser Arg Asp Lys Tyr Ile Ala Val Lys Tyr Asp

355 360 365

Val Ser Thr Ala Val Glu Ala Lys Ala 5eu Asn Lys Glu Ala Leu Gln

370 375 380

Ala Glu Val Gly Leu Pro Val Asp Arg Asn Ile Pro Leu Val Ala Phe

385 390 395 400

Ile Gly Arg Leu Glu Glu Gln Lys Gly Pro Asp Val Met Ala Ala Ala

405 410 415

Ile Pro Gln Leu Met Glu Met Val Glu Asp Val Gln Ile Val Leu Leu

420 425 430

Gly Thr Gly Lys Lys Lys Phe Glu Arg Met Leu Met ser Ala Glu Glu

435 440 445

Lys Phe Pro Gly Lys Val Arg Ala Val Val Lys Phe Asn Ala Ala Leu

450 455 460

Ala His His Ile Met Ala Gly Ala Asp Val Leu Ala Val Thr Ser Arg

465 470 475 480

Phe Glu Pro Cys Gly Leu Ile Gln Leu Gln Gly Met Arg Tyr Gly Thr

485 490 495

Pro Cys Ala Cys Ala Ser Thr Gly Gly Leu Val Asp Thr Ile Ile Glu

500 505 510

Gly Lys Thr Gly Phe His Met Gly Arg Leu Ser Val Asp Cys Asn Val

515 520 525

Val Glu Pro Ala Asp Val Lys Lys Val Ala Thr Thr Leu Gln Arg Ala

530 535 540

Ile Lys Val Val Gly Thr Pro Ala Tyr Glu Glu Met Val Arg Asn Cys

545 550 555 560

Met Ile Gln Asp Leu Ser Trp Lys Gly Pro Ala Lys Asn Trp Glu Asn

565 570 575

Val Leu Leu Ser Leu Gly Val Ala Gly Gly Glu Pro Gly Val Glu Gly

580 585 590

Glu Glu Ile Ala Pro Leu Ala Lys Glu Asn Val Ala Ala Pro

595 600 605

<210>9

<211>2223

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>9

atggccaagt acctggagct ggaggagggc ggcgtgatca tgcaggcgtt ctactgggac 60

gtcccgagcg gaggcatctg gtgggacacc atccgccaga agatccccga gtggtacgac 120

gccggcatct ccgcgatctg gataccgcca gcttccaagg gcatgtccgg gggctactcg 180

atgggctacg acccgtacga ctacttcgac ctcggcgagt actaccagaa gggcacggtg 240

gagacgcgct tcgggtccaa gcaggagctc atcaacatga tcaacacggc gcacgcctac 300

ggcatcaagg tcatcgcgga catcgtgatc aaccacaggg ccggcggcga cctggagtgg 360

aacccgttcg tcggcgacta cacctggacg gacttctcca aggtcgcctc cggcaagtac 420

accgccaact acctcgactt ccaccccaac gagctgcacg cgggcgactc cggcacgttc 480

ggcggctacc cggacatctg ccacgacaag tcctgggacc agtactggct ctgggcctcg 540

caggagtcct acgcggccta cctgcgctcc atcggcatcg acgcgtggcg cttcgactac 600

gtcaagggct acggggcctg ggtggtcaag gactggctca actggtgggg cggctgggcg 660

gtgggcgagt actgggacac caacgtcgac gcgctgctca actgggccta ctcctccggc 720

gccaaggtgt tcgacttccc cctgtactac aagatggacg cggccttcga caacaagaac 780

atcccggcgc tcgtcgaggc cctgaagaac ggcggcacgg tggtctcccg cgacccgttc 840

aaggccgtga ccttcgtcgc caaccacgac acggacatca tctggaacaa gtacccggcg 900

tacgccttca tcctcaccta cgagggccag cccacgatct tctaccgcga ctacgaggag 960

tggctgaaca aggacaagct caagaacctg atctggattc acgacaacct cgcgggcggc 1020

tccactagta tcgtgtacta cgactccgac gagatgatct tcgtccgcaa cggctacggc 1080

tccaagcccg gcctgatcac gtacatcaac ctgggctcct ccaaggtggg ccgctgggtg 1140

tacgtcccga agttcgccgg cgcgtgcatc cacgagtaca ccggcaacct cggcggctgg 1200

gtggacaagt acgtgtactc ctccggctgg gtctacctgg aggccccggc ctacgacccc 1260

gccaacggcc agtacggcta ctccgtgtgg tcctactgcg gcgtcggcac atcgattgct 1320

ggcatcctcg aggccgacag ggtcctcacc gtcagcccct actacgccga ggagctcatc 1380

tccggcatcg ccaggggctg cgagctcgac aacatcatgc gcctcaccgg catcaccggc 1440

atcgtcaacg gcatggacgt cagcgagtgg gaccccagca gggacaagta catcgccgtg 1500

aagtacgacg tgtcgacggc cgtggaggcc aaggcgctga acaaggaggc gctgcaggcg 1560

gaggtcgggc tcccggtgga ccggaacatc ccgctggtgg cgttcatcgg caggctggaa 1620

gagcagaagg gccccgacgt catggcggcc gccatcccgc agctcatgga gatggtggag 1680

gacgtgcaga tcgttctgct gggcacgggc aagaagaagt tcgagcgcat gctcatgagc 1740

gccgaggaga agttcccagg caaggtgcgc gccgtggtca agttcaacgc ggcgctggcg 1800

caccacatca tggccggcgc cgacgtgctc gccgtcacca gccgcttcga gccctgcggc 1860

ctcatccagc tgcaggggat gcgatacgga acgccctgcg cctgcgcgtc caccggtgga 1920

ctcgtcgaca ccatcatcga aggcaagacc gggttccaca tgggccgcct cagcgtcgac 1980

tgcaacgtcg tggagccggc ggacgtcaag aaggtggcca ccaccttgca gcgcgccatc 2040

aaggtggtcg gcacgccggc gtacgaggag atggtgagga actgcatgat ccaggatctc 2100

tcctggaagg gccctgccaa gaactgggag aacgtgctgc tcagcctcgg ggtcgccggc 2160

ggcgagccag gggttgaagg cgaggagatc gcgccgctcg ccaaggagaa cgtggccgcg 2220

ccc 2223

<210>10

<211>741

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>10

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala

1 5 10 15

Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg

20 25 30

Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile

35 40 45

Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp

50 55 60

Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val

65 70 75 80

Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu lle Asn Met Ile Asn Thr

85 90 95

Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His

100 105 110

Arg Ala Gly Gly Asp Leu Glu Trp Asn pro Phe Val Gly Asp Tyr Thr

115 120 125

Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr

130 135 140

Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe

145 150 155 160

Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp

165 170 175

Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly

180 185 190

Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val

195 200 205

Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr

210 215 220

Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly

225 230 235 240

Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe

245 250 255

Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly

260 265 270

Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn

275 280 285

His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile

290 295 300

Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu

305 310 315 320

Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn

325 330 335

Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met

340 345 350

Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr

355 360 365

Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys

370 375 380

Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp

385 390 395 400

Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro

405 410 415

Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr

420 425 430

Cys Gly Val Gly Thr Ser Ile Ala Gly Ile Leu Glu Ala Asp Arg Val

435 440 445

Leu Thr Val Ser Pro Tyr Tyr Ala Glu Glu Leu Ile Ser Gly Ile Ala

450 455 460

Arg Gly Cys Glu Leu Asp Asn Ile Met Arg Leu Thr Gly Ile Thr Gly

465 470 475 480

Ile Val Asn Gly Met Asp Val Ser Glu Trp Asp Pro Ser Arg Asp Lys

485 490 495

Tyr Ile Ala Val Lys Tyr Asp Val Ser Thr Ala Val Glu Ala Lys Ala

500 505 510

Leu Asn Lys Glu Ala Leu Gln Ala Glu Val Gly Leu Pro Val Asp Arg

515 520 525

Asn Ile Pro Leu Val Ala Phe Ile Gly Arg Leu Glu Glu Gln Lys Gly

530 535 540

Pro Asp Val Met Ala Ala Ala Ile Pro Gln Leu Met Glu Met Val Glu

545 550 555 560

Asp Val Gln Ile Val Leu Leu Gly Thr Gly Lys Lys Lys Phe Glu Arg

565 570 575

Met Leu Met Ser Ala Glu Glu Lys Phe Pro Gly Lys Val Arg Ala Val

580 585 590

Val Lys Phe Asn Ala Ala Leu Ala His His Ile Met Ala Gly Ala Asp

595 600 605

Val Leu Ala Val Thr Ser Arg Phe Glu Pro Cys Gly Leu Ile Gln Leu

610 615 620

Gln Gly Met Arg Tyr Gly Thr Pro Cys Ala Cys Ala Ser Thr Gly Gly

625 630 635 640

Leu Val Asp Thr Ile Ile Glu Gly Lys Thr Gly Phe His Met Gly Arg

645 650 655

Leu Ser Val Asp Cys Asn Val Val Glu Pro Ala Asp Val Lys Lys Val

660 665 670

Ala Thr Thr Leu Gln Arg Ala Ile Lys Val Val Gly Thr Pro Ala Tyr

675 680 685

Glu Glu Met Val Arg Asn Cys Met Ile Gln Asp Leu Ser Trp Lys Gly

690 695 700

Pro Ala Lys Asn Trp Glu Asn Val Leu Leu Ser Leu Gly Val Ala Gly

705 710 715 720

Gly Glu Pro Gly Val Glu Gly Glu Glu Ile Ala Pro Leu Ala Lys Glu

725 730 735

Asn Val Ala Ala Pro

740

<210>11

<211>1515

<212>DNA

<213>玉蜀黍

<400>11

ggagagctat gagacgtatg tcctcaaagc cactttgcat tgtgtgaaac caatatcgat 60

ctttgttact tcatcatgca tgaacatttg tggaaactac tagcttacaa gcattagtga 120

cagctcagaa aaaagttatc tatgaaaggt ttcatgtgta ccgtgggaaa tgagaaatgt 180

tgccaactca aacaccttca atatgttgtt tgcaggcaaa ctcttctgga agaaaggtgt 240

ctaaaactat gaacgggtta cagaaaggta taaaccacgg ctgtgcattt tggaagtatc 300

atctatagat gtctgttgag gggaaagccg tacgccaacg ttatttactc agaaacagct 360

tcaacacaca gttgtctgct ttatgatggc atctccaccc aggcacccac catcacctat 420

ctctcgtgcc tgtttatttt cttgcccttt ctgatcataa aaaaacatta agagtttgca 480

aacatgcata ggcatatcaa tatgctcatt tattaatttg ctagcagatc atcttcctac 540

tctttacttt atttattgtt tgaaaaatat gtcctgcacc tagggagctc gtatacagta 600

ccaatgcatc ttcattaaat gtgaatttca gaaaggaagt aggaacctat gagagtattt 660

ttcaaaatta attagcggct tctattatgt ttatagcaaa ggccaagggc aaaattggaa 720

cactaatgat ggttggttgc atgagtctgt cgattacttg caagaaatgt gaacctttgt 780

ttctgtgcgt gggcataaaa caaacagctt ctagcctctt ttacggtact tgcacttgca 840

agaaatgtga actccttttc atttctgtat gtggacataa tgccaaagca tccaggcttt 900

ttcatggttg ttgatgtctt tacacagttc atctccacca gtatgccctc ctcatactct 960

atataaacac atcaacagca tcgcaattag ccacaagatc acttcgggag gcaagtgcga 1020

tttcgatctc gcagccacct ttttttgttc tgttgtaagt ataccttccc ttaccatctt 1080

tatctgttag tttaatttgt aattgggaag tattagtgga aagaggatga gatgctatca 1140

tctatgtact ctgcaaatgc atctgacgtt atatgggctg cttcatataa tttgaattgc 1200

tccattcttg ccgacaatat attgcaaggt atatgcctag ttccatcaaa agttctgttt 1260

tttcattcta aaagcatttt agtggcacac aatttttgtc catgagggaa aggaaatctg 1320

ttttggttac tttgcttgag gtgcattctt catatgtcca gttttatgga agtaataaac 1380

ttcagtttgg tcataagatg tcatattaaa gggcaaacat atattcaatg ttcaattcat 1440

cgtaaatgtt ccctttttgt aaaagattgc atactcattt atttgagttg caggtgtatc 1500

tagtagttgg aggag 1515

<210>12

<211>673

<212>DNA

<213>玉蜀黍

<400>12

gatcatccag gtgcaaccgt ataagtccta aagtggtgag gaacacgaaa caaccatgca 60

ttggcatgta aagctccaag aatttgttgt atccttaaca actcacagaa catcaaccaa 120

aattgcacgt caagggtatt gggtaagaaa caatcaaaca aatcctctct gtgtgcaaag 180

aaacacggtg agtcatgccg agatcatact catctgatat acatgcttac agctcacaag 240

acattacaaa caactcatat tgcattacaa agatcgtttc atgaaaaata aaataggccg 300

gacaggacaa aaatccttga cgtgtaaagt aaatttacaa caaaaaaaaa gccatatgtc 360

aagctaaatc taattcgttt tacgtagatc aacaacctgt agaaggcaac aaaactgagc 420

cacgcagaag tacagaatga ttccagatga accatcgacg tgctacgtaa agagagtgac 480

gagtcatata catttggcaa gaaaccatga agctgcctac agccgtctcg gtggcataag 540

aacacaagaa attgtgttaa ttaatcaaag ctataaataa cgctcgcatg cctgtgcact 600

tctccatcac caccactggg tcttcagacc attagcttta tctactccag agcgcagaag 660

aacccgatcg aca 673

<2l0>13

<211>454

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>13

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met

20 25 30

Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr

35 40 45

Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile

50 55 60

Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly

65 70 75 80

Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly

85 90 95

Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu lle Asn Met Ile

100 105 110

Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile

115 120 125

Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp

130 135 140

Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala

145 150 155 160

Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly

165 170 175

Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln

180 185 190

Tyr Trp Leu Trp Ala ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser

195 200 205

Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala

210 215 220

Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly

225 230 235 240

Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser

245 250 255

Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala

260 265 270

Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn

275 280 285

Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val

290 295 300

Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala

305 310 315 320

Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr

325 330 335

Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His

340 345 350

Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp

355 360 365

Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile

370 375 380

Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val

385 390 395 400

Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly

405 410 415

Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu

420 425 430

Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp

435 440 445

Ser Tyr Cys Gly Val Gly

450

<210>14

<211>460

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>14

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met

20 25 30

Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr

35 40 45

Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile

50 55 60

Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly

65 70 75 80

Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly

85 90 95

Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile

100 105 110

Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile

115 120 125

Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gjy Asp

130 135 140

Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala

145 150 155 160

Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly

165 170 175

Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln

180 185 190

Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser

195 200 205

Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala

210 215 220

Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly

225 230 235 240

Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser

245 250 255

Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala

260 265 270

Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn

275 280 285

Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val

290 295 300

Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala

305 310 315 320

Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr

325 330 335

Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His

340 345 350

Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp

355 360 365

Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile

370 375 380

Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val

385 390 395 400

Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly

405 410 415

Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu

420 425 430

Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp

435 440 445

Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu

450 455 460

<210>15

<211>518

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>15

Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly

1 5 10 15

Leu Gly Val Pro Asp Ala ser Thr Phe Arg Arg Gly Ala Ala Gln Gly

20 25 30

Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg

35 40 45

Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg

50 55 60

Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met

65 70 75 80

Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala Phe

85 90 95

Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gln

100 105 110

Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro

115 120 125

Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro

130 135 140

Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val Glu

145 150 155 160

Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met lle Asn Thr Ala

165 170 175

His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His Arg

180 185 190

Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr Trp

195 200 205

Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu

210 215 220

Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly

225 230 235 240

Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp Leu

245 250 255

Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile

260 265 270

Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val Val

275 280 285

Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp

290 295 300

Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala

305 310 315 320

Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp

325 330 335

Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly Thr

340 345 350

Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala ASn His

355 360 365

ASp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu

370 375 380

Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp

385 390 395 400

Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp ASn Leu

405 410 415

Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met Ile

420 425 430

Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile

435 440 445

Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys Phe

450 455 460

Ala Gly Ala Cys lle His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Val

465 470 475 480

Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro Ala

485 490 495

Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys

500 505 510

Gly Val Gly Thr Ser Ile

515

<210>16

<211>820

<212>PRT

<2l3>人工序列

<220>

<223>合成的

<400>16

Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly

1 5 10 15

Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly

20 25 30

Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg

35 40 45

Thr Ser Ala Arg Ala AlaPro Arg His Gln His Gln Gln Ala Arg Arg

50 55 60

Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met

65 70 75 80

Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala Phe

85 90 95

Tyr Trp Asp Val Pro Ser Gly Gly lle Trp Trp Asp Thr lle Arg Gln

100 105 110

Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro

115 120 125

Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro

130 135 140

Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val Glu

145 150 155 160

Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr Ala

165 170 175

His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His Arg

180 185 190

Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr Trp

195 200 205

Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu

210 215 220

Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly

225 230 235 240

Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp Leu

245 250 255

Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile

260 265 270

Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val Val

275 280 285

Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp

290 295 300

Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala

305 310 315 320

Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp

325 330 335

Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly Thr

340 345 350

Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn His

355 360 365

Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu

370 375 380

Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp

385 390 395 400

Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu

405 410 415

Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met Ile

420 425 430

Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile

435 440 445

Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys Phe

450 455 460

Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Val

465 470 475 480

Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro Ala

485 490 495

Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys

500 505 510

Gly Val Gly Thr Ser Ile Ala Gly Ile Leu Glu Ala Asp Arg Val Leu

515 520 525

Thr Val Ser Pro Tyr Tyr Ala Glu Glu Leu lle Ser Gly Ile Ala Arg

530 535 540

Gly Cys Glu Leu Asp Asn Ile Met Arg Leu Thr Gly Ile Thr Gly Ile

545 550 555 560

Val Asn Gly Met Asp Val Ser Glu Trp Asp Pro Ser Arg Asp Lys Tyr

565 570 575

Ile Ala Val Lys Tyr Asp Val Ser Thr Ala Val Glu Ala Lys Ala Leu

580 585 590

Asn Lys Glu Ala Leu Gln Ala Glu Val Gly Leu Pro Val Asp Arg Asn

595 600 605

Ile Pro Leu Val Ala Phe Ile Gly Arg Leu Glu Glu Gln Lys Gly Pro

610 615 620

Asp Val Met Ala Ala Ala Ile Pro Gln Leu Met Glu Met Val Glu Asp

625 630 635 640

Val Gln Ile Val Leu Leu Gly Thr Gly Lys Lys Lys Phe Glu Arg Met

645 650 655

Leu Met Ser Ala Glu Glu Lys Phe Pro Gly Lys Val Arg Ala Val Val

660 665 670

Lys Phe Asn Ala Ala Leu Ala His His Ile Met Ala Gly Ala Asp Val

675 680 685

Leu Ala Val Thr Ser Arg Phe Glu Pro Cys Gly Leu Ile Gln Leu Gln

690 695 700

Gly Met Arg Tyr Gly Thr Pro Cys Ala Cys Ala Ser Thr Gly Gly Leu

705 710 715 720

Val Asp Thr Ile Ile Glu Gly Lys Thr Gly Phe His Met Gly Arg Leu

725 730 735

Ser Val Asp Cys Asn Val Val Glu Pro Ala Asp Val Lys Lys Val Ala

740 745 750

Thr Thr Leu Gln Arg Ala Ile Lys Val Val Gly Thr Pro Ala Tyr Glu

755 760 765

Glu Met Val Arg Asn Cys Met Ile Gln Asp Leu Ser Trp Lys Gly Pro

770 775 780

Ala Lys Asn Trp Glu Asn Val Leu Leu Ser Leu Gly Val Ala Gly Gly

785 790 795 800

Glu Pro Gly Val Glu Gly Glu Glu Ile Ala Pro Leu Ala Lys Glu Asn

805 810 815

Val Ala Ala Pro

820

<210>17

<211>19

<212>pRT

<213>人工序列

<220>

<223>合成的

<400>17

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

I 5 10 15

Ala Thr Ser

<210>18

<211>444

<212>PRT

<213>海栖热袍菌

<400>18

Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe Glu Gly Lys

1 5 10 15

Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro Asn Glu Val

20 25 30

Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe

35 40 45

Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr

50 55 60

Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp Lys Ala Phe

65 70 75 80

Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu

85 90 95

Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu

100 105 110

Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu

115 120 125

Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu

130 135 140

Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala

145 150 155 160

Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile

165 170 175

Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu

180 185 190

Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu Leu Glu Asn

195 200 205

Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys Lys Ile Gly

210 215 220

Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys

225 230 235 240

His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Asn

245 250 255

His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala

260 265 270

Thr Leu Ala GIy His Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile

275 280 285

Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu

290 295 300

Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp Thr Thr Leu

305 310 315 320

Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu

325 330 335

Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu

340 345 350

Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys

355 360 365

Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys Phe Ile Glu

370 375 380

Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu Ile Val Glu

385 390 395 400

Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu

405 410 415

Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Leu

420 425 430

Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg

435 440

<210>19

<211>1335

<212>DNA

<213>海栖热袍菌

<400>19

atggccgagt tcttcccgga gatcccgaag atccagttcg agggcaagga gtccaccaac 60

ccgctcgcct tccgcttcta cgacccgaac gaggtgatcg acggcaagcc gctcaaggac 120

cacctcaagt tctccgtggc cttctggcac accttcgtga acgagggccg cgacccgttc 180

ggcgacccga ccgccgagcg cccgtggaac cgcttctccg acccgatgga caaggccttc 240

gcccgcgtgg acgccctctt cgagttctgc gagaagctca acatcgagta cttctgcttc 300

cacgaccgcg acatcgcccc ggagggcaag accctccgcg agaccaacaa gatcctcgac 360

aaggtggtgg agcgcatcaa ggagcgcatg aaggactcca acgtgaagct cctctggggc 420

accgccaacc tcttctccca cccgcgctac atgcacggcg ccgccaccac ctgctccgcc 480

gacgtgttcg cctacgccgc cgcccaggtg aagaaggccc tggagatcac caaggagctg 540

ggcggcgagg gctacgtgtt ctggggcggc cgcgagggct acgagaccct cctcaacacc 600

gacctcggcc tggagctgga gaacctcgcc cgcttcctcc gcatggccgt ggagtacgcc 660

aagaagatcg gcttcaccgg ccagttcctc atcgagccga agccgaagga gccgaccaag 720

caccagtacg acttcgacgt ggccaccgcc tacgccttcc tcaagaacca cggcctcgac 780

gagtacttca agttcaacat cgaggccaac cacgccaccc tcgccggcca caccttccag 840

cacgagctgc gcatggcccg catcctcggc aagctcggct ccatcgacgc caaccagggc 900

gacctcctcc tcggctggga caccgaccag ttcccgacca acatctacga caccaccctc 960

gccatgtacg aggtgatcaa ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc 1020

aaggtgcgcc gcgcctccta caaggtggag gacctcttca tcggccacat cgccggcatg 1080

gacaccttcg ccctcggctt caagatcgcc tacaagctcg ccaaggacgg cgtgttcgac 1140

aagttcatcg aggagaagta ccgctccttc aaggagggca tcggcaagga gatcgtggag 1200

ggcaagaccg acttcgagaa gctggaggag tacatcatcg acaaggagga catcgagctg 1260

ccgtccggca agcaggagta cctggagtcc ctcctcaact cctacatcgt gaagaccatc 1320

gccgagctgc gctga 1335

<210>20

<211>444

<212>PRT

<213>那不勒斯栖热袍菌

<400>20

Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe Glu Gly Lys

1 5 10 15

Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro Glu Glu Ile

20 25 30

Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe

35 40 45

Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr

50 55 60

Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp Lys Ala Phe

65 70 75 80

Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu

85 90 95

Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu

100 105 110

Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu

115 120 125

Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu

130 135 140

Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala

145 150 155 160

Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile

165 170 175

Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu

180 185 190

Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu Leu Glu Asn

195 200 205

Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys Arg Ile Gly

210 215 220

Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys

225 230 235 240

His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Ser

245 250 255

His Gly Leu Asp Glu Tyr Phe Lys Phe Ash Ile Glu Ala Asn His Ala

260 265 270

Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile

275 280 285

Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu

290 295 300

Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp Thr Thr Leu

305 310 315 320

Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu

325 330 335

Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu

340 345 350

Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys

355 360 365

Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys Phe Ile Glu

370 375 380

Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp Ile Val Glu

385 390 395 400

Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu

405 410 415

Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Ile

420 425 430

Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg

435 440

<210>21

<211>1335

<212>DNA

<213>那不勒斯栖热袍菌

<400>21

atggccgagt tcttcccgga gatcccgaag gtgcagttcg agggcaagga gtccaccaac 60

ccgctcgcct tcaagttcta cgacccggag gagatcatcg acggcaagcc gctcaaggac 120

cacctcaagt tctccgtggc cttctggcac accttcgtga acgagggccg cgacccgttc 180

ggcgacccga ccgccgaccg cccgtggaac cgctacaccg acccgatgga caaggccttc 240

gcccgcgtgg acgccctctt cgagttctgc gagaagctca acatcgagta cttctgcttc 300

cacgaccgcg acatcgcccc ggagggcaag accctccgcg agaccaacaa gatcctcgac 360

aaggtggtgg agcgcatcaa ggagcgcatg aaggactcca acgtgaagct cctctggggc 420

accgccaacc tcttctccca cccgcgctac atgcacggcg ccgccaccac ctgctccgcc 480

gacgtgttcg cctacgccgc cgcccaggtg aagaaggccc tggagatcac caaggagctg 540

ggcggcgagg gctacgtgtt ctggggcggc cgcgagggct acgagaccct cctcaacacc 600

gacctcggct tcgagctgga gaacctcgcc cgcttcctcc gcatggccgt ggactacgcc 660

aagcgcatcg gcttcaccgg ccagttcctc atcgagccga agccgaagga gccgaccaag 720

caccagtacg acttcgacgt ggccaccgcc tacgccttcc tcaagtccca cggcctcgac 780

gagtacttca agttcaacat cgaggccaac cacgccaccc tcgccggcca caccttccag 840

cacgagctgc gcatggcccg catcctcggc aagctcggct ccatcgacgc caaccagggc 900

gacctcctcc tcggctggga caccgaccag ttcccgacca acgtgtacga caccaccctc 960

gccatgtacg aggtgatcaa ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc 1020

aaggtgcgcc gcgcctccta caaggtggag gacctcttca tcggccacat cgccggcatg 1080

gacaccttcg ccctcggctt caaggtggcc tacaagctcg tgaaggacgg cgtgctcgac 1140

aagttcatcg aggagaagta ccgctccttc cgcgagggca tcggccgcga catcgtggag 1200

ggcaaggtgg acttcgagaa gctggaggag tacatcatcg acaaggagac catcgagctg 1260

ccgtccggca agcaggagta cctggagtcc ctcatcaact cctacatcgt gaagaccatc 1320

ctggagcgc gctga 1335

<210>22

<211>28

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>22

agcgaattca tggcggctct ggccacgt 28

<210>23

<211>29

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>23

agctaagctt cagggcgcgg ccacgttct 29

<210>24

<211>825

<212>pRT

<213>人工序列

<220>

<223>合成的

<400>24

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe

20 25 30

Thr Gly Glu Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met

35 40 45

Asp Leu Thr Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala

50 55 60

Lys Asp Val Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala

65 70 75 80

Glu Val Trp Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro

85 90 95

Asp Thr Ser Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val

100 105 110

Ile Glu Ala Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu

115 120 125

Phe Lys Val Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu

130 135 140

Lys Ala Asp Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val

145 150 155 160

Leu Ser Glu Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu

165 170 175

Ile Ile Glu Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu

180 185 190

Asp Asp Tyr Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu

195 200 205

Lys Thr Ile Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val

210 215 220

Leu Leu Phe Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn

225 230 235 240

Met Glu Tyr Lys Gly Asn Gly Val Trp Glu Ala ValVal Glu Gly Asp

245 250 255

Leu Asp Gly Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile

260 265 270

Arg Thr Thr Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln

275 280 285

Glu Ser Ala Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu

290 295 300

Asn Asp Arg Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr

305 310 315 320

Glu Ile His Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys

325 330 335

Asn Lys Gly Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Ala Pro

340 345 350

Gly Gly Val Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr

355 360 365

His Val His Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu

370 375 380

Asp Lys Asp Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu

385 390 395 400

Phe Met Val Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His

405 410 415

Thr Arg Ile Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His

420 425 430

Gly Ile Gly Val Ile Met Asp Met Val Phe Pro HisThr Tyr Gly Ile

435 440 445

Gly Glu Leu Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg

450 455 460

lle Asp Lys Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val

465 470 475 480

Ile Ala Ser Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val

485 490 495

Thr Tyr Trp Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln

500 505 510

Net Gly Leu Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu

515 520 525

His Lys Ile Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly

530 535 540

Trp Gly Ala Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His

545 550 555 560

Val Ala Ala Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val

565 570 575

Phe Asn Pro Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu

580 585 590

Thr Lys Ile Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys

595 600 605

Leu Ile Lys Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala

610 615 620

Ala Cys His Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala

625 630 635 640

Lys Ala Asp Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala

645 650 655

Gln Lys Leu Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe

660 665 670

Leu His Gly Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn

675 680 685

Ser Tyr Asn Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys

690 695 700

Leu Gln Phe Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu

705 710 715 720

Arg Lys Glu His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys

725 730 735

Lys His Leu Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met

740 745 750

Leu Lys Asp His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile

755 760 765

Tyr Asn Gly Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys

770 775 780

Trp Asn Val Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu

785 790 795 800

Thr Val Glu Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu

805 810 815

Tyr Arg Glu Ser Glu Lys Asp Glu Leu

820 825

<210>25

<211>2478

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>25

atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc caccagcgct 60

ggccactggt acaagcacca gcgcgcctac cagttcaccg gcgaggacga cttcgggaag 120

gtggccgtgg tgaagctccc gatggacctc accaaggtgg gcatcatcgt gcgcctcaac 180

gagtggcagg cgaaggacgt ggccaaggac cgcttcatcg agatcaagga cggcaaggcc 240

gaggtgtgga tactccaggg cgtggaggag atcttctacg agaagccgga cacctccccg 300

cgcatcttct tcgcccaggc ccgctccaac aaggtgatcg aggccttcct caccaacccg 360

gtggacacca agaagaagga gctgttcaag gtgaccgtcg acggcaagga gatcccggtg 420

tcccgcgtgg agaaggccga cccgaccgac atcgacgtga ccaactacgt gcgcatcgtg 480

ctctccgagt ccctcaagga ggaggacctc cgcaaggacg tggagctgat catcgagggc 540

tacaagccgg cccgcgtgat catgatggag atcctcgacg actactacta cgacggcgag 600

ctgggggcgg tgtactcccc ggagaagacc atcttccgcg tgtggtcccc ggtgtccaag 660

tgggtgaagg tgctcctctt caagaacggc gaggacaccg agccgtacca ggtggtgaac 720

atggagtaca agggcaacgg cgtgtgggag gccgtggtgg agggcgacct cgacggcgtg 780

ttctacctct accagctgga gaactacggc aagatccgca ccaccgtgga cccgtactcc 840

aaggccgtgt acgccaacaa ccaggagtct gcagtggtga acctcgcccg caccaacccg 900

gagggctggg agaacgaccg cggcccgaag atcgagggct acgaggacgc catcatctac 960

gagatccaca tcgccgacat caccggcctg gagaactccg gcgtgaagaa caagggcctc 1020

tacctcggcc tcaccgagga gaacaccaag gccccgggcg gcgtgaccac cggcctctcc 1080

cacctcgtgg agctgggcgt gacccacgtg cacatcctcc cgttcttcga cttctacacc 1140

ggcgacgagc tggacaagga cttcgagaag tactacaact ggggctacga cccgtacctc 1200

ttcatggtgc cggagggccg ctactccacc gacccgaaga acccgcacac ccgaattcgc 1260

gaggtgaagg agatggtgaa ggccctccac aagcacggca tcggcgtgat catggacatg 1320

gtgttcccgc acacctacgg catcggcgag ctgtccgcct tcgaccagac cgtgccgtac 1380

tacttctacc gcatcgacaa gaccggcgcc tacctcaacg agtccggctg cggcaacgtg 1440

atcgcctccg agcgcccgat gatgcgcaag ttcatcgtgg acaccgtgac ctactgggtg 1500

aaggagtacc acatcgacgg cttccgcttc gaccagatgg gcctcatcga caagaagacc 1560

atgctggagg tggagcgcgc cctccacaag atcgacccga ccatcatcct ctacggcgag 1620

ccgtggggcg gctggggggc cccgatccgc ttcggcaagt ccgacgtggc cggcacccac 1680

gtggccgcct tcaacgacga gttccgcgac gccatccgcg gctccgtgtt caacccgtcc 1740

gtgaagggct tcgtgatggg cggctacggc aaggagacca agatcaagcg cggcgtggtg 1800

ggctccatca actacgacgg caagctcatc aagtccttcg ccctcgaccc ggaggagacc 1860

atcaactacg ccgcctgcca cgacaaccac accctctggg acaagaacta cctcgccgcc 1920

aaggccgaca agaagaagga gtggaccgag gaggagctga agaacgccca gaagctcgcc 1980

ggcgccatcc tcctcactag tcagggcgtg ccgttcctcc acggcggcca ggacttctgc 2040

cgcaccacca acttcaacga caactcctac aacgccccga tctccatcaa cggcttcgac 2100

tacgagcgca agctccagtt catcgacgtg ttcaactacc acaagggcct catcaagctc 2160

cgcaaggagc acccggcctt ccgcctcaag aacgccgagg agatcaagaa gcacctggag 2220

ttcctcccgg gcgggcgccg catcgtggcc ttcatgctca aggaccacgc cggcggcgac 2280

ccgtggaagg acatcgtggt gatctacaac ggcaacctgg agaagaccac ctacaagctc 2340

ccggagggca agtggaacgt ggtggtgaac tcccagaagg ccggcaccga ggtgatcgag 2400

accgtggagg gcaccatcga gctggacccg ctctccgcct acgtgctcta ccgcgagtcc 2460

gagaaggacg agctgtga 2478

<210>26

<211>718

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>26

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr

25 25 30

Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu

35 40 45

Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile

50 55 60

Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys

65 70 75 80

Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys

85 90 95

Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys

100 105 110

Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys

115 120 125

Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile

130 135 140

Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro

145 150 155 160

Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp

165 170 175

Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro

180 185 190

Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln

195 200 205

Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg

210 215 220

Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu

225 230 235 240

Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp

245 250 255

Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly

260 265 270

Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys

275 280 285

Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro

290 295 300

Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp

305 310 315 320

Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile

325 330 335

Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile

340 345 350

Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu

355 360 365

Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg

370 375 380

Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met

385 390 395 400

Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile

405 410 415

Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp

420 425 430

Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln

435 440 445

Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp

450 455 460

Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met

465 470 475 480

Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr

485 490 495

Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu

500 505 510

Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr

515 520 525

Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys

530 535 540

Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp

545 550 555 560

Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu

565 570 575

Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro

580 585 590

Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys

595 600 605

Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly

610 615 620

Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr

625 630 635 640

Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu

645 650 655

Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser

660 665 670

Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln

675 680 685

Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys

690 695 700

Ile Arg Gly Lys Ile Asn Leu Glu Ser Glu Lys Asp Glu Leu

705 710 715

<210>27

<21l>712

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>27

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr

20 25 30

Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu

35 40 45

Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile

50 55 60

Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys

65 70 75 80

Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys

85 90 95

Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys

100 105 110

Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys

115 120 125

Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile

130 135 140

Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro

145 150 155 160

Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp

165 170 175

Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro

180 185 190

Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln

195 200 205

Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg

210 215 220

Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu

225 230 235 240

Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp

245 250 255

Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly

260 265 270

Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys

275 280 285

Phe Cys Glu Ile Glu Set Gly Glu Leu Phe Val Gly Lys Met Trp Pro

290 295 300

Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp

305 310 315 320

Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile

325 330 335

Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile

340 345 350

Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu

355 360 365

Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg

370 375 380

Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met

385 390 395 400

Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile

405 410 415

Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp

420 425 430

Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln

435 440 445

Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp

450 455 460

Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met

465 470 475 480

Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr

485 490 495

Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu

500 505 510

Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr

515 520 525

Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys

530 535 540

Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp

545 550 555 560

Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu

565 570 575

Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro

580 585 590

Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys

595 600 605

Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly

610 615 620

Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr

625 630 635 640

Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu

645 650 655

Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser

660 665 670

Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln

675 680 685

Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys

690 695 700

Ile Arg Gly Lys Ile Asn Leu Glu

705 710

<210>28

<211>469

<212>PRT

<2l3>人工序列

<220>

<223>合成的

<400>28

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe

20 25 30

Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro

35 40 45

Asn Glu Val lle Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser

50 55 60

Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly

65 70 75 80

Asp Pro Thr Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp

85 90 95

Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu

100 105 110

Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly

115 120 125

Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg

130 135 140

Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr

145 150 155 160

Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr

165 170 175

Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala

180 185 190

Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly

195 200 205

Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu

210 215 220

Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys

225 230 235 240

Lys Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu

245 250 255

Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe

260 265 270

Leu Lys Asn His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala

275 280 285

Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met

290 295 300

Ala Arg Ile Leu GIy Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp

305 310 315 320

Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp

325 330 335

Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys

340 345 350

Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val

355 360 365

Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu

370 375 380

Gly Phe Lys Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys

385 390 395 400

Phe Ile Glu Glu Lys Tyr Arg ser Phe Lys Glu Gly Ile Gly Lys Glu

405 410 415

Ile Val Glu Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile

420 425 430

Asp Lys Glu Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu

435 440 445

Ser Leu Leu Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg Ser

450 455 460

Glu Lys Asp Glu Leu

465

<210>29

<21l>469

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>29

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe

20 25 30

Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro

35 40 45

Glu Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser

50 55 60

Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly

65 70 75 80

Asp Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp

85 90 95

Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu

100 105 110

Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly

115 120 125

Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg

130 135 140

Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr

145 150 155 160

Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr

165 170 175

Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala

180 185 190

Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly

195 200 205

Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu

210 215 220

Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys

225 230 235 240

Arg Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu

245 250 255

Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe

260 265 270

Leu Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala

275 280 285

Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met

290 295 300

Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp

305 310 315 320

Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp

325 330 335

Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys

340 345 350

Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val

355 360 365

Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu

370 375 380

Gly Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys

385 390 395 400

Phe Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp

405 410 415

Ile Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile

420 425 430

Asp Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu

435 440 445

Ser Leu lle Asn Ser Tyr lle Val Lys Thr Ile Leu Glu Leu Arg Ser

450 455 460

Glu Lys Asp Glu Leu

465

<210>30

<211>463

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>30

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe

20 25 30

Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro

35 40 45

Glu Glu lle Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser

50 55 60

Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly

65 70 75 80

Asp Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp

85 90 95

Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu

100 105 110

Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly

115 120 125

Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg

130 135 140

Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr

145 150 155 160

Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr

165 170 175

Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala

180 185 190

Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly

195 200 205

Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu

210 215 220

Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys

225 230 235 240

Arg Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu

245 250 255

Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe

260 265 270

Leu Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala

275 280 285

Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met

290 295 300

Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp

305 310 315 320

Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp

325 330 335

Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys

340 345 350

Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val

355 360 365

Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu

370 375 380

Gly Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys

385 390 395 400

Phe Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp

405 410 415

Ile Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile

420 425 430

Asp Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu

435 440 445

Ser Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg

450 455 460

<210>31

<211>25

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>31

Met Gly Lys Asn Gly Asn Leu Cys Cys Phe Ser Leu Leu Leu Leu Leu

1 5 10 15

Leu Ala Gly Leu Ala Ser Gly His Gln

20 25

<210>32

<211>30

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>32

Met Gly Phe Val Leu Phe Ser Gln Leu Pro Ser Phe Leu Leu Val Ser

1 5 10 15

Thr Leu Leu Leu Phe Leu Val Ile Ser His Ser Cys Arg Ala

20 25 30

<210>33

<211>460

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>33

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met

20 25 30

Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr

35 40 45

Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile

50 55 60

Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly

65 70 75 80

Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly

85 90 95

Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile

100 105 110

Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile

115 120 125

Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp

130 135 140

Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala

145 150 155 160

Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly

165 170 175

Thr Phe Gly Gly Tyr Pro Asp lle Cys His Asp Lys Ser Trp Asp Gln

180 185 190

Tyr Trp Leu Trp Ala ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser

195 200 205

Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala

210 215 220

Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly

225 230 235 240

Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser

245 250 255

Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala

260 265 270

Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn

275 280 285

Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val

290 295 300

Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala

305 310 315 320

Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr

325 330 335

Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu lle Trp lle His

340 345 350

Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp

355 360 365

Glu Met Ile Phe Val Arg Asn Gly TyrGly Ser Lys Pro Gly Leu Ile

370 375 380

Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val

385 390 395 400

Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly

405 410 415

Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu

420 425 430

Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp

435 440 445

Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu

450 455 460

<210>34

<211>825

<212>PRT

<2l3>人工序列

<220>

<223>合成的

<400>34

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe

20 25 30

Thr Gly Glu Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met

35 40 45

Asp Leu Thr Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala

50 55 60

Lys Asp Val Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala

65 70 75 80

Glu Val Trp Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro

85 90 95

Asp Thr Ser Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val

100 105 110

Ile Glu Ala Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu

115 120 125

Phe Lys Val Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu

130 135 140

Lys Ala Asp Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val

145 150 155 160

Leu Ser Glu Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu

165 170 175

Ile Ile Glu Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu

180 185 190

Asp Asp Tyr Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu

195 200 205

Lys Thr Ile Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val

210 215 220

Leu Leu Phe Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn

225 230 235 240

Met Glu Tyr Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp

245 250 255

Leu Asp Gly Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile

260 265 270

Arg Thr Thr Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln

275 280 285

Glu Ser Ala Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu

290 295 300

Asn Asp Arg Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr

305 310 315 320

Glu Ile His Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys

325 330 335

Asn Lys Gly Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Ala Pro

340 345 350

Gly Gly Val Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr

355 360 365

His Val His Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu

370 375 380

Asp Lys Asp Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu

385 390 395 400

Phe Met Val Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His

405 410 415

Thr Arg Ile Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His

420 425 430

Gly Ile Gly Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile

435 440 445

Gly Glu Leu Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg

450 455 460

Ile Asp Lys Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val

465 470 475 480

Ile Ala Ser Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val

485 490 495

Thr Tyr Trp Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln

500 505 510

Met Gly Leu Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu

515 520 525

His Lys Ile Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly

530 535 540

Trp Gly Ala Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His

545 550 555 560

Val Ala Ala Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val

565 570 575

Phe Asn Pro Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu

580 585 590

Thr Lys Ile Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys

595 600 605

Leu Ile Lys Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala

610 615 620

Ala Cys His Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala

625 630 635 640

Lys Ala Asp Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala

645 650 655

Gln Lys Leu Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe

660 665 670

Leu His Gly Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn

675 680 685

Ser Tyr Asn Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys

690 695 700

Leu Gln Phe Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu

705 710 715 720

Arg Lys Glu His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys

725 730 735

Lys His Leu Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met

740 745 750

Leu Lys Asp His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile

755 760 765

Tyr Asn Gly Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys

770 775 780

Trp Asn Val Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu

785 790 795 800

Thr Val Glu Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu

805 810 815

Tyr Arg Glu Ser Glu Lys Asp Glu Leu

820 825

<2l0>35

<211>460

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>35

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met

20 25 30

Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr

35 40 45

Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile

50 55 60

Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly

65 70 75 80

Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly

85 90 95

Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile

100 105 110

Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile

115 120 125

Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp

130 135 140

Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala

145 150 155 160

Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly

165 170 175

Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln

180 185 190

Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser

195 200 205

Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala

210 215 220

Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly

225 230 235 240

Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser

245 250 255

Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala

260 265 270

Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn

275 280 285

Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val

290 295 300

Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala

305 310 315 320

Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr

325 330 335

Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His

340 345 350

Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp

355 360 365

Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile

370 375 380

Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val

385 390 395 400

Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly

405 410 415

Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu

420 425 430

Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp

435 440 445

Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu

450 455 460

<210>36

<211>718

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>36

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Glu Thr lle Lys lle Tyr Glu Asn Lys Gly Val Tyr

20 25 30

Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu

35 40 45

Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile

50 55 60

Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys

65 70 75 80

Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys

85 90 95

Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys

100 105 110

Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys

115 120 125

Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile

130 135 140

Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro

145 150 155 160

Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp

165 170 175

Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro

180 185 190

Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln

195 200 205

Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg

210 215 220

Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu

225 230 235 240

Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp

245 250 255

Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly

260 265 270

Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys

275 280 285

Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro

290 295 300

Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp

305 310 315 320

Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile

325 330 335

Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile

340 345 350

Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu

355 360 365

Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg

370 375 380

Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met

385 390 395 400

Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile

405 410 415

Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp

420 425 430

Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln

435 440 445

Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val GIy Cys Asp

450 455 460

Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met

465 470 475 480

Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr

485 490 495

Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu

500 505 510

Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr

515 520 525

Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys

530 535 540

Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp

545 550 555 560

Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu

565 570 575

Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro

580 585 590

Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys

595 600 605

Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly

610 615 620

Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr

625 630 635 640

Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu

645 650 655

Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser

660 665 670

Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln

675 680 685

Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys

690 695 700

Ile Arg Gly Lys Ile Asn Leu Glu Ser Glu Lys Asp Glu Leu

705 710 715

<2l0>37

<211>1434

<212>DNA

<213>海栖热袍菌

<400>37

atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt 60

accctggtgc cacgcggttc catggccgag ttcttcccgg agatcccgaa gatccagttc 120

gagggcaagg agtccaccaa cccgctcgcc ttccgcttct acgacccgaa cgaggtgatc 180

gacggcaagc cgctcaagga ccacctcaag ttctccgtgg ccttctggca caccttcgtg 240

aacgagggcc gcgacccgtt cggcgacccg accgccgagc gcccgtggaa ccgcttctcc 300

gacccgatgg acaaggcctt cgcccgcgtg gacgccctct tcgagttctg cgagaagctc 360

aacatcgagt acttctgctt ccacgaccgc gacatcgccc cggagggcaa gaccctccgc 420

gagaccaaca agatcctcga caaggtggtg gagcgcatca aggagcgcat gaaggactcc 480

aacgtgaagc tcctctgggg caccgccaac ctcttctccc acccgcgcta catgcacggc 540

gccgccacca cctgctccgc cgacgtgttc gcctacgccg ccgcccaggt gaagaaggcc 600

ctggagatca ccaaggagct gggcggcgag ggctacgtgt tctggggcgg ccgcgagggc 660

tacgagaccc tcctcaacac cgacctcggc ctggagctgg agaacctcgc ccgcttcctc 720

cgcatggccg tggagtacgc caagaagatc ggcttcaccg gccagttcct catcgagccg 780

aagccgaagg agccgaccaa gcaccagtac gacttcgacg tggccaccgc ctacgccttc 840

ctcaagaacc acggcctcga cgagtacttc aagttcaaca tcgaggccaa ccacgccacc 900

ctcgccggcc acaccttcca gcacgagctg cgcatggccc gcatcctcgg caagctcggc 960

tccatcgacg ccaaccaggg cgacctcctc ctcggctggg acaccgacca gttcccgacc 1020

aacatctacg acaccaccct cgccatgtac gaggtgatca aggccggcgg cttcaccaag 1080

ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct acaaggtgga ggacctcttc 1140

atcggccaca tcgccggcat ggacaccttc gccctcggct tcaagatcgc ctacaagctc 1200

gccaaggacg gcgtgttcga caagttcatc gaggagaagt accgctcctt caaggagggc 1260

atcggcaagg agatcgtgga gggcaagacc gacttcgaga agctggagga gtacatcatc 1320

gacaaggagg acatcgagct gccgtccggc aagcaggagt acctggagtc cctcctcaac 1380

tcctacatcg tgaagaccat cgccgagctg cgctccgaga aggacgagct gtga 1434

<210>38

<211>477

<212>PRT

<213>海栖热袍菌

<400>38

Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser

1 5 10 15

Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Glu Phe Phe

20 25 30

Pro Glu Ile Pro Lys Ile Gln Phe Glu Gly Lys Glu Ser Thr Asn Pro

35 40 45

Leu Ala Phe Arg Phe Tyr Asp Pro Asn Glu Val lle Asp Gly Lys Pro

50 55 60

Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe Trp His Thr Phe Val

65 70 75 80

Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr Ala Glu Arg Pro Trp

85 90 95

Asn Arg Phe Ser Asp Pro Met Asp Lys Ala Phe Ala Arg Val Asp Ala

100 105 110

Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu Tyr Phe Cys Phe His

115 120 125

Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu Arg Glu Thr Asn Lys

130 135 140

Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu Arg Met Lys Asp Ser

145 150 155 160

Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu Phe Ser His Pro Arg

165 170 175

Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala Asp Val Phe Ala Tyr

180 185 190

Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile Thr Lys Glu Leu Gly

195 200 205

Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu Gly Tyr Glu Thr Leu

210 215 220

Leu Asn Thr Asp Leu Gly Leu Glu Leu Glu Asn Leu Ala Arg Phe Leu

225 230 235 240

Arg Met Ala Val Glu Tyr Ala Lys Lys Ile Gly Phe Thr Gly Gln Phe

245 250 255

Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys His Gln Tyr Asp Phe

260 265 270

Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Asn His Gly Leu Asp Glu

275 280 285

Tyr Phe Lys Phe Asn Ile Glu Ala Ash His Ala Thr Leu Ala Gly His

290 295 300

Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile Leu Gly Lys Leu Gly

305 310 315 320

Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu Gly Trp Asp Thr Asp

325 330 335

Gln Phe Pro Thr Asn Ile Tyr Asp Thr Thr Leu Ala Met Tyr Glu Val

340 345 350

Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu Asn Phe Asp Ala Lys

355 360 365

Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu Phe Ile Gly His Ile

370 375 380

Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys Ile Ala Tyr Lys Leu

385 390 395 400

Ala Lys Asp Gly Val Phe Asp Lys Phe Ile Glu Glu Lys Tyr Arg Ser

405 410 415

Phe Lys Glu Gly Ile Gly Lys Glu Ile Val Glu Gly Lys Thr Asp Phe

420 425 430

Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu Asp Ile Glu Leu Pro

435 440 445

Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Leu Asn Ser Tyr Ile Val

450 455 460

Lys Thr Ile Ala Glu Leu Arg Ser Glu Lys Asp Glu Leu

465 470 475

<210>39

<211>1434

<212>DNA

<213>那不勒斯栖热袍菌

<400>39

atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt 60

accctggtgc cacgcggttc catggccgag ttcttcccgg agatcccgaa ggtgcagttc 120

gagggcaagg agtccaccaa cccgctcgcc ttcaagttct acgacccgga ggagatcatc 180

gacggcaagc cgctcaagga ccacctcaag ttctccgtgg ccttctggca caccttcgtg 240

aacgagggcc gcgacccgtt cggcgacccg accgccgacc gcccgtggaa ccgctacacc 300

gacccgatgg acaaggcctt cgcccgcgtg gacgccctct tcgagttctg cgagaagctc 360

aacatcgagt acttctgctt ccacgaccgc gacatcgccc cggagggcaa gaccctccgc 420

gagaccaaca agatcctcga caaggtggtg gagcgcatca aggagcgcat gaaggactcc 480

aacgtgaagc tcctctgggg caccgccaac ctcttctccc acccgcgcta catgcacggc 540

gccgccacca cctgctccgc cgacgtgttc gcctacgccg ccgcccaggt gaagaaggcc 600

ctggagatca ccaaggagct gggcggcgag ggctacgtgt tctggggcgg ccgcgagggc 660

tacgagaccc tcctcaacac cgacctcggc ttcgagctgg agaacctcgc ccgcttcctc 720

cgcatggccg tggactacgc caagcgcatc ggcttcaccg gccagttcct catcgagccg 780

aagccgaagg agccgaccaa gcaccagtac gacttcgacg tggccaccgc ctacgccttc 840

ctcaagtccc acggcctcga cgagtacttc aagttcaaca tcgaggccaa ccacgccacc 900

ctcgccggcc acaccttcca gcacgagctg cgcatggccc gcatcctcgg caagctcggc 960

tccatcgacg ccaaccaggg cgacctcctc ctcggctggg acaccgacca gttcccgacc 1020

aacgtgtacg acaccaccct cgccatgtac gaggtgatca aggccggcgg cttcaccaag 1080

ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct acaaggtgga ggacctcttc 1140

atcggccaca tcgccggcat ggacaccttc gccctcggct tcaaggtggc ctacaagctc 1200

gtgaaggacg gcgtgctcga caagttcatc gaggagaagt accgctcctt ccgcgagggc 1260

atcggccgcg acatcgtgga gggcaaggtg gacttcgaga agctggagga gtacatcatc 1320

gacaaggaga ccatcgagct gccgtccggc aagcaggagt acctggagtc cctcatcaac 1380

tcctacatcg tgaagaccat cctggagctg cgctccgaga aggacgagct gtga 1434

<210>40

<211>477

<212>PRT

<213>那不勒斯栖热袍菌

<400> 40

Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser

1 5 10 15

Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Glu Phe Phe

20 25 30

Pro Glu Ile Pro Lys Val Gln Phe Glu Gly Lys Glu Ser Thr Asn Pro

35 40 45

Leu Ala Phe Lys Phe Tyr Asp Pro Glu Glu Ile Ile Asp Gly Lys Pro

50 55 60

Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe Trp His Thr Phe Val

65 70 75 80

Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr Ala Asp Arg Pro Trp

85 90 95

Asn Arg Tyr Thr Asp Pro Met Asp Lys Ala Phe Ala Arg Val Asp Ala

100 105 110

Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu Tyr Phe Cys Phe His

115 120 125

Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu Arg Glu Thr Asn Lys

130 135 140

Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu Arg Met Lys Asp Ser

145 150 155 160

Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu Phe Ser His Pro Arg

165 170 175

Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala Asp Val Phe Ala Tyr

180 185 190

Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile Thr Lys Glu Leu Gly

195 200 205

GIy Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu Gly Tyr Glu Thr Leu

210 215 220

Leu Asn Thr Asp Leu Gly Phe Glu Leu Glu Asn Leu Ala Arg Phe Leu

225 230 235 240

Arg Met Ala Val Asp Tyr Ala Lys Arg Ile Gly Phe Thr Gly Gln Phe

245 250 255

Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys His Gln Tyr Asp Phe

260 265 270

Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Ser His Gly Leu Asp Glu

275 280 285

Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala Thr Leu Ala Gly His

290 295 300

Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile Leu Gly Lys Leu Gly

305 310 315 320

Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu Gly Trp Asp Thr Asp

325 330 335

Gln Phe Pro Thr Asn Val Tyr Asp Thr Thr Leu Ala Met Tyr Glu Val

340 345 350

Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu Asn Phe Asp Ala Lys

355 360 365

Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu Phe Ile Gly His Ile

370 375 380

Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys Val Ala Tyr Lys Leu

385 390 395 400

Val Lys Asp Gly Val Leu Asp Lys Phe Ile Glu Glu Lys Tyr Arg Ser

405 410 415

Phe Arg Glu Gly Ile Gly Arg Asp Ile Val Glu Gly Lys Val Asp Phe

420 425 430

Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu Thr Ile Glu Leu Pro

435 440 445

Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Ile Asn Ser Tyr Ile Val

450 455 460

Lys Thr lle Leu Glu Leu Arg Ser Glu Lys Asp Glu Leu

465 470 475

<210>41

<211>1435

<212>DNA

<213>海栖热袍菌

<400>41

atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60

atggctagca tgactggtgg acagcaaatg ggtcggatcc ccatggccga gttcttcccg 120

gagatcccga agatccagtt cgagggcaag gagtccacca acccgctcgc cttccgcttc 180

tacgacccga acgaggtgat cgacggcaag ccgctcaagg accacctcaa gttctccgtg 240

gccttctggc acaccttcgt gaacgagggc cgcgacccgt tcggcgaccc gaccgccgag 300

cgcccgtgga accgcttctc cgacccgatg gacaaggcct tcgcccgcgt ggacgccctc 360

ttcgagttct gcgagaagct caacatcgag tacttctgct tccacgaccg cgacatcccc 420

cggagggcaa gaccctccgc gagaccaaca agatcctcga caaggtggtg gagcgcatca 480

aggagcgcat gaaggactcc aacgtgaagc tcctctgggg caccgccaac ctcttctccc 540

acccgcgcta catgcacggc gccgccacca cctgctccgc cgacgtgttc gcctacgccg 600

ccgcccaggt gaagaaggcc ctggagatca ccaaggagct gggcggcgag ggctacgtgt 660

tctggggcgg ccgcgagggc tacgagaccc tcctcaacac cgacctcggc ctggagctgg 720

agaacctcgc ccgcttcctc cgcatggccg tggagtacgc caagaagatc ggcttcaccg 780

gccagttcct catcgagccg aagccgaagg agccgaccaa gcaccagtac gcttcgacgt 840

ggccaccgcc tacgccttcc tcaagaacca cggcctcgac gagtacttca agttcaacat 900

cgaggccaac cacgccaccc tcgccggcca caccttccag cacgagctgc gcatggcccg 960

catcctcggc aagctcggct ccatcgacgc caaccagggc gacctcctcc tcggctggga 1020

caccgaccag ttcccgacca acatctacga caccaccctc gccatgtacg aggtgatcaa 1080

ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc aaggtgcgcc gcgcctccta 1140

caaggtggag gacctcttca tcggccacat cgccggcatg gacaccttcg ccctcggctt 1200

caagatcgcc tacaagctcg ccaaggacgg cgtgttcgac aagttcatcg aggagaagta 1260

ccgctccttc aaggagggca tcggcaagga gatcgtggag ggcaagaccg acttcgagaa 1320

gctggaggag tacatcatcg acaaggagga catcgagctg ccgtccggca agcaggagta 1380

cctggagtcc ctcctcaact cctacatcgt gaagaccatc gccgagctgc gctga 1435

<210>42

<211>478

<212>PRT

<213>海栖热袍菌

<400>42

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg

20 25 30

Ile Pro Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe Glu

35 40 45

Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro Asn

50 55 60

Glu Val Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val

65 70 75 80

Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp

85 90 95

Pro Thr Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp Lys

100 105 110

Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn

115 120 125

Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys

130 135 140

Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile

145 150 155 160

Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala

165 170 175

Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys

180 185 190

Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu

195 200 205

Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly

210 215 220

Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu Leu

225 230 235 240

Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys Lys

245 250 255

Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro

260 265 270

Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu

275 280 285

Lys Asn His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn

290 295 300

His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala

305 310 315 320

Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu

325 330 335

Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp Thr

340 345 350

Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly

355 360 365

Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu

370 375 380

Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly

385 390 395 400

Phe Lys Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys Phe

405 410 415

Ile Glu Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu Ile

420 425 430

Val Glu Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp

435 440 445

Lys Glu Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser

450 455 460

Leu Leu Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg

465 470 475

<210>43

<211>1436

<212>DNA

<213>那不勒斯栖热袍菌

<400>43

atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60

atggctagca tgactggtgg acagcaaatg ggtcggatcc ccatggccga gttcttcccg 120

gagatcccga aggtgcagtt cgagggcaag gagtccacca acccgctcgc cttcaagttc 180

tacgacccgg aggagatcat cgacggcaag ccgctcaagg accacctcaa gttctccgtg 240

gccttctggc acaccttcgt gaacgagggc cgcgacccgt tcggcgaccc gaccgccgac 300

cgcccgtgga accgctacac cgacccgatg gacaaggcct tcgcccgcgt ggacgccctc 360

ttcgagttct gcgagaagct caacatcgag tacttctgct tccacgaccg cgacatcccc 420

cggagggcaa gaccctccgc gagaccaaca agatcctcga caaggtggtg gagcgcatca 480

aggagcgcat gaaggactcc aacgtgaagc tcctctgggg caccgccaac ctcttctccc 540

acccgcgcta catgcacggc gccgccacca cctgctccgc cgacgtgttc gcctacgccg 600

ccgcccaggt gaagaaggcc ctggagatca ccaaggagct gggcggcgag ggctacgtgt 660

tctggggcgg ccgcgagggc tacgagaccc tcctcaacac cgacctcggc ttcgagctgg 720

agaacctcgc ccgcttcctc cgcatggccg tggactacgc caagcgcatc ggcttcaccg 780

gccagttcct catcgagccg aagccgaagg agccgaccaa gcaccagtac gacttcgacg 840

tggccaccgc ctacgccttc ctcaagtccc acggcctcga cgagtacttc aagttcaaca 900

tcgaggccaa ccacgccacc ctcgccggcc acaccttcca gcacgagctg cgcatggccc 960

gcatcctcgg caagctcggc tccatcgacg ccaaccaggg cgacctcctc ctcggctggg 1020

acaccgacca gttcccgacc aacgtgtacg acaccaccct cgccatgtac gaggtgatca 1080

aggccggcgg cttcaccaag ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct 1140

acaaggtgga ggacctcttc atcggccaca tcgccggcat ggacaccttc gccctcggct 1200

tcaaggtggc ctacaagctc gtgaaggacg gcgtgctcga caagttcatc gaggagaagt 1260

accgctcctt ccgcgagggc atcggccgcg acatcgtgga gggcaaggtg gacttcgaga 1320

agctggagga gtacatcatc gacaaggaga ccatcgagct gccgtccggc aagcaggagt 1380

acctggagtc cctcatcaac tcctacatcg tgaagaccat cctggagctg cgctga 1436

<210>44

<211>478

<212>pRT

<213>那不勒斯栖热袍菌

<400>44

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg

20 25 30

Ile Pro Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe Glu

35 40 45

Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro Glu

50 55 60

Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val

65 70 75 80

Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp

85 90 95

Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp Lys

100 105 110

Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn

115 120 125

Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys

130 135 140

Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile

145 150 155 160

Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala

165 170 175

Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys

180 185 190

Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu

195 200 205

Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly

210 215 220

Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu Leu

225 230 235 240

Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys Arg

245 250 255

Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro

260 265 270

Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu

275 280 285

Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn

290 295 300

HiS Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala

305 310 315 320

Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu

325 330 335

Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp Thr

340 345 350

Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly

355 360 365

Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu

370 375 380

Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly

385 390 395 400

Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys Phe

405 410 415

Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp Ile

420 425 430

Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp

435 440 445

Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser

450 455 460

Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg

465 470 475

<210>45

<211>1095

<212>PRT

<213>Aspergillus shirousami

<400>45

Ala Thr Pro Ala Asp Trp Arg Ser Gln Ser lle Tyr Phe Leu Leu Thr

1 5 10 15

Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala Thr Cys Asn Thr

20 25 30

Ala Asp Gln Lys Tyr Cys Gly Gly Thr Trp Gln Gly Ile Ile Asp Lys

35 40 45

Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile Trp Ile Thr Pro

50 55 60

Val Thr Ala Gln Leu Pro Gln Thr Thr Ala Tyr Gly Asp Ala Tyr His

65 70 75 80

Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asn Glu Asn Tyr Gly Thr

85 90 95

Ala Asp Asp Leu Lys Ala Leu Ser Ser Ala Leu His Glu Arg Gly Met

100 105 110

Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly Tyr Asp Gly Ala

115 120 125

Gly Ser Ser Val Asp Tyr Ser Val Phe Lys Pro Phe Ser Ser Gln Asp

130 135 140

Tyr Phe His Pro Phe Cys Phe Ile Gln Asn Tyr Glu Asp Gln Thr Gln

145 150 155 160

Val Glu Asp Cys Trp Leu Gly Asp Asn Thr Val Ser Leu Pro Asp Leu

165 170 175

Asp Thr Thr Lys Asp Val Val Lys Asn Glu Trp Tyr Asp Trp Val Gly

180 185 190

Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg Ile Asp Thr Val

195 200 205

Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn Lys Ala Ala Gly

210 215 220

Val Tyr Cys Ile Gly Glu Val Leu Asp Val Asp Pro Ala Tyr Thr Cys

225 230 235 240

Pro Tyr Gln Asn Val Met Asp Gly Val Leu Asn Tyr Pro Ile Tyr Tyr

245 250 255

Pro Leu Leu Asn Ala Phe Lys ser Thr Ser Gly Ser Met Asp Asp Leu

260 265 270

Tyr Asn Met Ile Asn Thr Val Lys Ser Asp Cys Pro Asp Ser Thr Leu

275 280 285

Leu Gly Thr Phe Val Glu Asn His Asp Asn Pro Arg Phe Ala Ser Tyr

290 295 300

Thr Asn Asp Ile Ala Leu Ala Lys Asn Val Ala Ala Phe Ile Ile Leu

305 310 315 320

Asn Asp Gly Ile Pro Ile Ile Tyr Ala Gly Gln Glu Gln His Tyr Ala

325 330 335

Gly Gly Asn Asp Pro Ala Asn Arg Glu Ala Thr Trp Leu Ser Gly Tyr

340 345 350

Pro Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Ser Ala Asn Ala Ile

355 360 365

Arg Asn Tyr Ala Ile Ser Lys Asp Thr Gly Phe Val Thr Tyr Lys Asn

370 375 380

Trp Pro Ile Tyr Lys Asp Asp Thr Thr Ile Ala Met Arg Lys Gly Thr

385 390 395 400

Asp Gly Ser Gln Ile Val Thr Ile Leu Ser Asn Lys Gly Ala Ser Gly

405 410 415

Asp Ser Tyr Thr Leu Ser Leu Ser Gly Ala Gly Tyr Thr Ala Gly Gln

420 425 430

Gln Leu Thr Glu Val Ile Gly Cys Thr Thr Val Thr Val Gly Ser Asp

435 440 445

Gly Asn Val Pro Val Pro Met Ala Gly Gly Leu Pro Arg Val Leu Tyr

450 455 460

Pro Thr Glu Lys Leu Ala Gly Ser Lys Ile Cys Ser Ser Ser Lys Pro

465 470 475 480

Ala Thr Leu Asp Ser Trp Leu Ser Asn Glu Ala Thr Val Ala Arg Thr

485 490 495

Ala Ile Leu Asn Asn Ile Gly Ala Asp Gly Ala Trp Val Ser Gly Ala

500 505 510

Asp Ser Gly Ile Val Val Ala Ser Pro Ser Thr Asp Asn Pro Asp Tyr

515 520 525

Phe Tyr Thr Trp Thr Arg Asp Ser Gly Ile Val Leu Lys Thr Leu Val

530 535 540

Asp Leu Phe Arg Asn Gly Asp Thr Asp Leu Leu Ser Thr Ile Glu His

545 550 555 560

Tyr Ile Ser Ser Gln Ala Ile Ile Gln Gly Val Ser Asn Pro Ser Gly

565 570 575

Asp Leu Ser Ser Gly Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Glu

580 585 590

Thr Ala Tyr Ala Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala

595 600 605

Leu Arg Ala Thr Ala Met Ile Gly Phe Gly Gln Trp Leu Leu Asp Asn

610 615 620

Gly Tyr Thr Ser Ala Ala Thr Glu Ile Val Trp Pro Leu Val Arg Asn

625 630 635 640

Asp Leu Ser Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Tyr Asp Leu

645 650 655

Trp Glu Glu Val Asn Gly Ser Ser Phe Phe Thr Ile Ala Val Gln His

660 665 670

Arg Ala Leu Val Glu Gly Ser Ala Phe Ala Thr Ala Val Gly Ser Ser

675 680 685

Cys Ser Trp Cys Asp Ser Gln Ala Pro Gln Ile Leu Cys Tyr Leu Gln

690 695 700

Ser Phe Trp Thr Gly Ser Tyr Ile Leu Ala Asn Phe Asp Ser Ser Arg

705 710 715 720

Ser Gly Lys Asp Thr Asn Thr Leu Leu Gly Ser Ile His Thr Phe Asp

725 730 735

Pro Glu Ala Gly Cys Asp Asp Ser Thr Phe Gln Pro Cys Ser Pro Arg

740 745 750

Ala Leu Ala Asn His Lys Glu Val Val Asp Ser Phe Arg Ser Ile Tyr

755 760 765

Thr Leu Asn Asp Gly Leu Ser Asp Ser Glu Ala Val Ala Val Gly Arg

770 775 780

Tyr Pro Glu Asp Ser Tyr Tyr Asn Gly Asn Pro Trp Phe Leu Cys Thr

785 790 795 800

Leu Ala Ala Ala Glu Gln Leu Tyr Asp Ala Leu Tyr Gln Trp Asp Lys

805 810 815

Gln Gly Ser Leu Glu Ile Thr Asp Val Ser Leu Asp Phe Phe Lys Ala

820 825 830

Leu Tyr Ser Gly Ala Ala Thr Gly Thr Tyr Ser Ser Ser Ser Ser Thr

835 840 845

Tyr Ser Ser Ile Val Ser Ala Val Lys Thr Phe Ala Asp Gly Phe Val

850 855 860

Ser Ile Val Glu Thr His Ala Ala Ser Asn Gly Ser Leu Ser Glu Gln

865 870 875 880

Phe Asp Lys Ser Asp Gly Asp Glu Leu Ser Ala Arg Asp Leu Thr Trp

885 890 895

Ser Tyr Ala Ala Leu Leu Thr Ala Asn Asn Arg Arg Asn Ser Val Val

900 905 910

Pro Pro Ser Trp Gly Glu Thr Ser Ala Ser Ser Val Pro Gly Thr Cys

915 920 925

Ala Ala Thr Ser Ala Ser GIy Thr Tyr Ser Ser Val Thr Val Thr Ser

930 935 940

Trp Pro Ser Ile Val Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Thr

945 950 955 960

Thr Gly Ser Gly Gly Val Thr Ser Thr Ser Lys Thr Thr Thr Thr Ala

965 970 975

Ser Lys Thr Ser Thr Thr Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr

980 985 990

Ala Val Ala Val Thr Phe Asp Leu Thr Ala Thr Thr Thr Tyr Gly Glu

995 1000 1005

Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln Leu Gly Asp Trp Glu Thr

1010 1015 1020

Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys Tyr Thr Ser Ser Asn Pro

1025 1030 1035 1040

Pro Trp Tyr Val Thr Val Thr Leu Pro Ala Gly Glu Ser Phe Glu Tyr

1045 1050 1055

Lys Phe Ile Arg Val Glu Ser Asp Asp Ser Val Glu Trp Glu Ser Asp

1060 1065 1070

Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala Cys Gly Glu Ser Thr Ala

1075 1080 1085

Thr Val Thr Asp Thr Trp Arg

1090 1095

<210>46

<211>3285

<212>DNA

<213>Aspergillus shirousami

<400>46

gccaccccgg ccgactggcg ctcccagtcc atctacttcc tcctcaccga ccgcttcgcc 60

cgcaccgacg gctccaccac cgccacctgc aacaccgccg accagaagta ctgcggcggc 120

acctggcagg gcatcatcga caagctcgac tacatccagg gcatgggctt caccgccatc 180

tggatcaccc cggtgaccgc ccagctcccg cagaccaccg cctacggcga cgcctaccac 240

ggctactggc agcaggacat ctactccctc aacgagaact acggcaccgc cgacgacctc 300

aaggccctct cctccgccct ccacgagcgc ggcatgtacc tcatggtgga cgtggtggcc 360

aaccacatgg gctacgacgg cgccggctcc tccgtggact actccgtgtt caagccgttc 420

tcctcccagg actacttcca cccgttctgc ttcatccaga actacgagga ccagacccag 480

gtggaggact gctggctcgg cgacaacacc gtgtccctcc cggacctcga caccaccaag 540

gacgtggtga agaacgagtg gtacgactgg gtgggctccc tcgtgtccaa ctactccatc 600

gacggcctcc gcatcgacac cgtgaagcac gtgcagaagg acttctggcc gggctacaac 660

aaggccgccg gcgtgtactg catcggcgag gtgctcgacg tggacccggc ctacacctgc 720

ccgtaccaga acgtgatgga cggcgtgctc aactacccga tctactaccc gctcctcaac 780

gccttcaagt ccacctccgg ctcgatggac gacctctaca acatgatcaa caccgtgaag 840

tccgactgcc cggactccac cctcctcggc accttcgtgg agaaccacga caacccgcgc 900

ttcgcctcct acaccaacga catcgccctc gccaagaacg tggccgcctt catcatcctc 960

aacgacggca tcccgatcat ctacgccggc caggagcagc actacgccgg cggcaacgac 1020

ccggccaacc gcgaggccac ctggctctcc ggctacccga ccgactccga gctgtacaag 1080

ctcatcgcct ccgccaacgc catccgcaac tacgccatct ccaaggacac cggcttcgtg 1140

acctacaaga actggccgat ctacaaggac gacaccacca tcgccatgcg caagggcacc 1200

gacggctccc agatcgtgac catcctctcc aacaagggcg cctccggcga ctcctacacc 1260

ctctccctct ccggcgccgg ctacaccgcc ggccagcagc tcaccgaggt gatcggctgc 1320

accaccgtga ccgtgggctc cgacggcaac gtgccggtgc cgatggccgg cggcctcccg 1380

cgcgtgctct acccgaccga gaagctcgcc ggctccaaga tatgctcctc ctccaagccg 1440

gccaccctcg actcctggct ctccaacgag gccaccgtgg cccgcaccgc catcctcaac 1500

aacatcggcg ccgacggcgc ctgggtgtcc ggcgccgact ccggcatcgt ggtggcctcc 1560

ccgtccaccg acaacccgga ctacttctac acctggaccc gcgactccgg catcgtgctc 1630

aagaccctcg tggacctctt ccgcaacggc gacaccgacc tcctctccac catcgagcac 1680

tacatctcct cccaggccat catccagggc gtgtccaacc cgtccggcga cctctcctcc 1740

ggcggcctcg gcgagccgaa gttcaacgtg gacgagaccg cctacgccgg ctcctggggc 1800

cgcccgcagc gcgacggccc ggccctccgc gccaccgcca tgatcggctt cggccagtgg 1860

ctcctcgaca acggctacac ctccgccgcc accgagatcg tgtggccgct cgtgcgcaac 1920

gacctctcct acgtggccca gtactggaac cagaccggct acgacctctg ggaggaggtg 1980

aacggctcct ccttcttcac catcgccgtg cagcaccgcg ccctcgtgga gggctccgcc 2040

ttcgccaccg ccgtgggctc ctcctgctcc tggtgcgact cccaggcccc gcagatcctc 2100

tgctacctcc agtccttctg gaccggctcc tacatcctcg ccaacttcga ctcctcccgc 2160

tccggcaagg acaccaacac cctcctcggc tccatccaca ccttcgaccc ggaggccggc 2220

tgcgacgact ccaccttcca gccgtgctcc ccgcgcgccc tcgccaacca caaggaggtg 2280

gtggactcct tccgctccat ctacaccctc aacgacggcc tctccgactc cgaggccgtg 2340

gccgtgggcc gctacccgga ggactcctac tacaacggca acccgtggtt cctctgcacc 2400

ctcgccgccg ccgagcagct ctacgacgcc ctctaccagt gggacaagca gggctccctg 2460

gagatcaccg acgtgtccct cgacttcttc aaggccctct actccggcgc cgccaccggc 2520

acctactcct cctcctcctc cacctactcc tccatcgtgt ccgccgtgaa gaccttcgcc 2580

gacggcttcg tgtccatcgt ggagacccac gccgcctcca acggctccct ctccgagcag 2640

ttcgacaagt ccgacggcga cgagctgtcc gcccgcgacc tcacctggtc ctacgccgcc 2700

ctcctcaccg ccaacaaccg ccgcaactcc gtggtgccgc cgtcctgggg cgagacctcc 2760

gcctcctccg tgccgggcac ctgcgccgcc acctccgcct ccggcaccta ctcctccgtg 2820

accgtgacct cctggccgtc catcgtggcc accggcggca ccaccaccac cgccaccacc 2880

accggctccg gcggcgtgac ctccacctcc aagaccacca ccaccgcctc caagacctcc 2940

accaccacct cctccacctc ctgcaccacc ccgaccgccg tggccgtgac cttcgacctc 3000

accgccacca ccacctacgg cgagaacatc tacctcgtgg gctccatctc ccagctcggc 3060

gactgggaga cctccgacgg catcgccctc tccgccgaca agtacacctc ctccaacccg 3120

ccgtggtacg tgaccgtgac cctcccggcc ggcgagtcct tcgagtacaa gttcatccgc 3180

gtggagtccg acgactccgt ggagtgggag tccgacccga accgcgagta caccgtgccg 3240

caggcctgcg gcgagtccac cgccaccgtg accgacacct ggcgc 3285

<210>47

<211>679

<212>PRT

<213>Thermoanaerobacterium thermosaccharolyticum

<400>47

Val Leu Ser Gly Cys Ser Asn Asn Val Ser Ser Ile Lys Ile Asp Arg

1 5 10 15

Phe Asn Asn Ile Ser Ala Val Asn Gly Pro Gly Glu Glu Asp Thr Trp

20 25 30

Ala Ser Ala Gln Lys Gln Gly Val Gly Thr Ala Asn Asn Tyr Val Ser

35 40 45

Arg Val Trp Phe Thr Leu Ala Asn Gly Ala Ile Ser Glu Val Tyr Tyr

50 55 60

Pro Thr Ile Asp Thr Ala Asp Val Lys Glu Ile Lys Phe Ile Val Thr

65 70 75 80

Asp Gly Lys Ser Phe Val Ser Asp Glu Thr Lys Asp Ala Ile Ser Lys

85 90 95

Val Glu Lys Phe Thr Asp Lys Ser Leu Gly Tyr Lys Leu Val Asn Thr

100 105 110

Asp Lys Lys Gly Arg Tyr Arg Ile Thr Lys Glu Ile Phe Thr Asp Val

115 120 125

Lys Arg Asn Ser Leu Ile Met Lys Ala Lys Phe Glu Ala Leu Glu Gly

130 135 140

Ser Ile His Asp Tyr Lys Leu Tyr Leu Ala Tyr Asp Pro His Ile Lys

145 150 155 160

Asn Gln Gly Ser Tyr Asn Glu Gly Tyr Val Ile Lys Ala Asn Asn Asn

165 170 175

Glu Met Leu Met Ala Lys Arg Asp Asn Val Tyr Thr Ala Leu Ser Ser

180 185 190

Asn Ile Gly Trp Lys Gly Tyr Ser Ile Gly Tyr Tyr Lys Val Asn Asp

195 200 205

Ile Met Thr Asp Leu Asp Glu Asn Lys Gln Met Thr Lys His Tyr Asp

210 215 220

Ser Ala Arg Gly Asn Ile Ile Glu Gly Ala Glu Ile Asp Leu Thr Lys

225 230 235 240

Asn Ser Glu Phe Glu Ile Val Leu Ser Phe Gly Gly Ser Asp Ser Glu

245 250 255

Ala Ala Lys Thr Ala Leu Glu Thr Leu Gly Glu Asp Tyr Asn Asn Leu

260 265 270

Lys Asn Asn Tyr Ile Asp Glu Trp Thr Lys Tyr Cys Asn Thr Leu Asn

275 280 285

Asn Phe Asn Gly Lys Ala Asn Ser Leu Tyr Tyr Asn Ser Met Met Ile

290 295 300

Leu Lys Ala Ser Glu Asp Lys Thr Asn Lys Gly Ala Tyr Ile Ala Ser

305 310 315 320

Leu Ser Ile Pro Trp Gly Asp Gly Gln Arg Asp Asp Asn Thr Gly Gly

325 330 335

Tyr His Leu Val Trp Ser Arg Asp Leu Tyr His Val Ala Asn Ala Phe

340 345 350

Ile Ala Ala Gly Asp Val Asp Ser Ala Asn Arg Ser Leu Asp Tyr Leu

355 360 365

Ala Lys Val Val Lys Asp Asn Gly Met Ile Pro Gln Asn Thr Trp Ile

370 375 380

Ser Gly Lys Pro Tyr Trp Thr Ser Ile Gln Leu Asp Glu Gln Ala Asp

385 390 395 400

Pro Ile Ile Leu Ser Tyr Arg Leu Lys Arg Tyr Asp Leu Tyr Asp Ser

405 410 415

Leu Val Lys Pro Leu Ala Asp Phe Ile Ile Lys Ile Gly Pro Lys Thr

420 425 430

Gly Gln Glu Arg Trp Glu Glu Ile Gly Gly Tyr Ser Pro Ala Thr Met

435 440 445

Ala Ala Glu Val Ala Gly Leu Thr Cys Ala Ala Tyr Ile Ala Glu Gln

450 455 460

Asn Lys Asp Tyr Glu Ser Ala Gln Lys Tyr Gln Glu Lys Ala Asp Asn

465 470 475 480

Trp Gln Lys Leu Ile Asp Asn Leu Thr Tyr Thr Glu Asn Gly Pro Leu

485 490 495

Gly Asn Gly Gln Tyr Tyr Ile Arg Ile Ala Gly Leu Ser Asp Pro Asn

500 505 510

Ala Asp Phe Met Ile Asn Ile Ala Asn Gly Gly Gly Val Tyr Asp Gln

515 520 525

Lys Glu Ile Val Asp Pro Ser Phe Leu Glu Leu Val Arg Leu Gly Val

530 535 540

Lys Ser Ala Asp Asp Pro Lys Ile Leu Asn Thr Leu Lys Val Val Asp

545 550 555 560

Ser Thr Ile Lys Val Asp Thr Pro Lys Gly Pro Ser Trp Tyr Arg Tyr

565 570 575

Asn His Asp Gly Tyr Gly Glu Pro Ser Lys Thr Glu Leu Tyr His Gly

580 585 590

Ala Gly Lys Gly Arg Leu Trp Pro Leu Leu Thr Gly Glu Arg Gly Met

595 600 605

Tyr Glu Ile Ala Ala Gly Lys Asp Ala Thr Pro Tyr Val Lys Ala Met

610 615 620

Glu Lys Phe Ala Asn Glu Gly Gly Ile Ile Ser Glu Gln Val Trp Glu

625 630 635 640

Asp Thr Gly Leu Pro Thr Asp Ser Ala Ser Pro Leu Asn Trp Ala His

645 650 655

Ala Glu Tyr Val Ile Leu Phe Ala Ser Asn Ile Glu His Lys Val Leu

660 665 670

Asp Met Pro Asp Ile Val Tyr

675

<210>48

<211>2037

<212>DNA

<213>Thermoanaerobacterium thermosaccharolyticum

<220>

<223>合成的

<400>48

gtgctctccg gctgctccaa caacgtgtcc tccatcaaga tcgaccgctt caacaacatc 60

tccgccgtga acggcccggg cgaggaggac acctgggcct ccgcccagaa gcagggcgtg 120

ggcaccgcca acaactacgt gtcccgcgtg tggttcaccc tcgccaacgg cgccatctcc 180

gaggtgtact acccgaccat cgacaccgcc gacgtgaagg agatcaagtt catcgtgacc 240

gacggcaagt ccttcgtgtc cgacgagacc aaggacgcca tctccaaggt ggagaagttc 300

accgacaagt ccctcggcta caagctcgtg aacaccgaca agaagggccg ctaccgcatc 360

accaaggaaa tcttcaccga cgtgaagcgc aactccctca tcatgaaggc caagttcgag 420

gccctcgagg gctccatcca cgactacaag ctctacctcg cctacgaccc gcacatcaag 480

aaccagggct cctacaacga gggctacgtg atcaaggcca acaacaacga gatgctcatg 540

gccaagcgcg acaacgtgta caccgccctc tcctccaaca tcggctggaa gggctactcc 600

atcggctact acaaggtgaa cgacatcatg accgacctcg acgagaacaa gcagatgacc 660

aagcactacg actccgcccg cggcaacatc atcgagggcg ccgagatcga cctcaccaag 720

aactccgagt tcgagatcgt gctctccttc ggcggctccg actccgaggc cgccaagacc 780

gccctcgaga ccctcggcga ggactacaac aacctcaaga acaactacat cgacgagtgg 840

accaagtact gcaacaccct caacaacttc aacggcaagg ccaactccct ctactacaac 900

tccatgatga tcctcaaggc ctccgaggac aagaccaaca agggcgccta catcgcctcc 960

ctctccatcc cgtggggcga cggccagcgc gacgacaaca ccggcggcta ccacctcgtg 1020

tggtcccgcg acctctacca cgtggccaac gccttcatcg ccgccggcga cgtggactcc 1080

gccaaccgct ccctcgacta cctcgccaag gtggtgaagg acaacggcat gatcccgcag 1140

aacacctgga tctccggcaa gccgtactgg acctccatcc agctcgacga gcaggccgac 1200

ccgatcatcc tctcctaccg cctcaagcgc tacgacctct acgactccct cgtgaagccg 1260

ctcgccgact tcatcatcaa gatcggcccg aagaccggcc aggagcgctg ggaggagatc 1320

ggcggctact ccccggccac gatggccgcc gaggtggccg gcctcacctg cgccgcctac 1380

atcgccgagc agaacaagga ctacgagtcc gcccagaagt accaggagaa ggccgacaac 1440

tggcagaagc tcatcgacaa cctcacctac accgagaacg gcccgctcgg caacggccag 1500

tactacatcc gcatcgccgg cctctccgac ccgaacgccg acttcatgat caacatcgcc 1560

aacggcggcg gcgtgtacga ccagaaggag atcgtggacc cgtccttcct cgagctggtg 1620

cgcctcggcg tgaagtccgc cgacgacccg aagatcctca acaccctcaa ggtggtggac 1680

tccaccatca aggtggacac cccgaagggc ccgtcctggt atcgctacaa ccacgacggc 1740

tacggcgagc cgtccaagac cgagctgtac cacggcgccg gcaagggccg cctctggccg 1800

ctcctcaccg gcgagcgcgg catgtacgag atcgccgccg gcaaggacgc caccccgtac 1860

gtgaaggcga tggagaagtt cgccaacgag ggcggcatca tctccgagca ggtgtgggag 1920

gacaccggcc tcccgaccga ctccgcctcc ccgctcaact gggcccacgc cgagtacgtg 1980

atcctcttcg cctccaacat cgagcacaag gtgctcgaca tgccggacat cgtgtac 2037

<210>49

<211>579

<212>PRT

<213>Rhizopus oryzae

<400>49

Ala Ser Ile Pro Ser Ser Ala Ser Val Gln Leu Asp Ser Tyr Asn Tyr

1 5 10 15

Asp Gly Ser Thr Phe Ser Gly Lys Ile Tyr Val Lys Asn Ile Ala Tyr

20 25 30

Ser Lys Lys Val Thr Val Ile Tyr Ala Asp Gly Ser Asp Asn Trp Asn

35 40 45

Asn Asn Gly Asn Thr Ile Ala Ala Ser Tyr Ser Ala Pro Ile Ser Gly

50 55 60

Ser Asn Tyr Glu Tyr Trp Thr Phe Ser Ala Ser Ile Asn Gly Ile Lys

65 70 75 80

Glu Phe Tyr Ile Lys Tyr Glu Val Ser Gly Lys Thr Tyr Tyr Asp Asn

85 90 95

Asn Asn Ser Ala Asn Tyr Gln Val Ser Thr Ser Lys Pro Thr Thr Thr

100 105 110

Thr Ala Thr Ala Thr Thr Thr Thr Ala Pro Ser Thr Ser Thr Thr Thr

115 120 125

Pro Pro Ser Arg Ser Glu Pro Ala Thr Phe Pro Thr Gly Asn Ser Thr

130 135 140

Ile Ser Ser Trp Ile Lys Lys Gln Glu Gly Ile Ser Arg Phe Ala Met

145 150 155 160

Leu Arg Asn Ile Asn Pro Pro Gly Ser Ala Thr Gly Phe Ile Ala Ala

165 170 175

Ser Leu Ser Thr Ala Gly Pro Asp Tyr Tyr Tyr Ala Trp Thr Arg Asp

180 185 190

Ala Ala Leu Thr Ser Asn Val Ile Val Tyr Glu Tyr Asn Thr Thr Leu

195 200 205

Ser Gly Asn Lys Thr Ile Leu Asn Val Leu Lys Asp Tyr Val Thr Phe

210 21S 220

Ser Val Lys Thr Gln Ser Thr Ser Thr Val Cys Asn Cys Leu Gly Glu

225 230 235 240

Pro Lys Phe Asn Pro Asp Ala Ser Gly Tyr Thr Gly Ala Trp Gly Arg

245 250 255

Pro Gln Asn Asp Gly Pro Ala Glu Arg Ala Thr Thr Phe Ile Leu Phe

260 265 270

Ala Asp Ser Tyr Leu Thr Gln Thr Lys Asp Ala Ser Tyr Val Thr Gly

275 280 285

Thr Leu Lys Pro Ala Ile Phe Lys Asp Leu Asp Tyr Val Val Asn Val

290 295 300

Trp Ser Asn Gly Cys Phe Asp Leu Trp Glu Glu Val Asn Gly Val His

305 310 315 320

Phe Tyr Thr Leu Met Val Met Arg Lys Gly Leu Leu Leu Gly Ala Asp

325 330 335

Phe Ala Lys Arg Asn Gly Asp Ser Thr Arg Ala Ser Thr Tyr Ser Ser

340 345 350

Thr Ala Ser Thr Ile Ala Asn Lys Ile Ser Ser Phe Trp Val Ser Ser

355 360 365

Asn Asn Trp Ile Gln Val Ser Gln Ser Val Thr Gly Gly Val Ser Lys

370 375 380

Lys Gly Leu Asp Val Ser Thr Leu Leu Ala Ala Asn Leu Gly Ser Val

385 390 395 400

Asp Asp Gly Phe Phe Thr Pro Gly Ser Glu Lys Ile Leu Ala Thr Ala

405 410 415

Val Ala Val Glu Asp Ser Phe Ala Ser Leu Tyr Pro Ile Asn Lys Asn

420 425 430

Leu Pro Ser Tyr Leu Gly Asn Ser Ile Gly Arg Tyr Pro Glu Asp Thr

435 440 445

Tyr Asn Gly Asn Gly Asn Ser Gln Gly Asn Ser Trp Phe Leu Ala Val

450 455 460

Thr Gly Tyr Ala Glu Leu Tyr Tyr Arg Ala Ile Lys Glu Trp Ile Gly

465 470 475 480

Asn Gly Gly Val Thr Val Ser Ser Ile Ser Leu Pro Phe Phe Lys Lys

485 490 495

Phe Asp Ser Ser Ala Thr Ser Gly Lys Lys Tyr Thr Val Gly Thr Ser

500 505 510

Asp Phe Asn Asn Leu Ala Gln Asn Ile Ala Leu Ala Ala Asp Arg Phe

515 520 525

Leu Ser Thr Val Gln Leu His Ala His Asn Asn Gly Ser Leu Ala Glu

530 535 540

Glu Phe Asp Arg Thr Thr Gly Leu Ser Thr Gly Ala Arg Asp Leu Thr

545 550 555 560

Trp Ser His Ala Ser Leu Ile Thr Ala Ser Tyr Ala Lys Ala Gly Ala

565 570 575

Pro Ala Ala

<210>50

<211>1737

<212>DNA

<213>Rhizopus oryzae

<400>50

gcctccatcc cgtcctccgc ctccgtgcag ctcgactcct acaactacga cggctccacc 60

ttctccggca aaatctacgt gaagaacatc gcctactcca agaaggtgac cgtgatctac 120

gccgacggct ccgacaactg gaacaacaac ggcaacacca tcgccgcctc ctactccgcc 180

ccgatctccg gctccaacta cgagtactgg accttctccg cctccatcaa cggcatcaag 240

gagttctaca tcaagtacga ggtgtccggc aagacctact acgacaacaa caactccgcc 300

aactaccagg tgtccacctc caagccgacc accaccaccg ccaccgccac caccaccacc 360

gccccgtcca cctccaccac caccccgccg tcccgctccg agccggccac cttcccgacc 420

ggcaactcca ccatctcctc ctggatcaag aagcaggagg gcatctcccg cttcgccatg 480

ctccgcaaca tcaacccgcc gggctccgcc accggcttca tcgccgcctc cctctccacc 540

gccggcccgg actactacta cgcccggacc cgcgacgccg ccctcacctc caacgtgatc 600

gtgtacgagt acaacaccac cctctccggc aacaagacca tcctcaacgt gctcaaggac 660

tacgtgacct tctccgtgaa gacccagtcc acctccaccg tgtgcaactg cctcggcgag 720

ccgaagttca acccggacgc ctccggctac accggcgcct ggggccgccc gcagaacgac 780

ggcccggccg agcgcgccac caccttcatc ctcttcgccg actcctacct cacccagacc 840

aaggacgcct cctacgtgac cggcaccctc aagccggcca tcttcaagga cctcgactac 900

gtggtgaacg tgtggtccaa cggctgcttc gacctctggg aggaggtgaa cggcgtgcac 960

ttctacaccc tcatggtgat gcgcaagggc ctcctcctcg gcgccgactt cgccaagcgc 1020

aacggcgact ccacccgcgc ctccacctac tcctccaccg cctccaccat cgccaacaaa 1080

atctcctcct tctgggtgtc ctccaacaac tggatacagg tgtcccagtc cgtgaccggc 1140

ggcgtgtcca agaagggcct cgacgtgtcc accctcctcg ccgccaacct cggctccgtg 1200

gacgacggct tcttcacccc gggctccgag aagatcctcg ccaccgccgt ggccgtggag 1260

gactccttcg cctccctcta cccgatcaac aagaacctcc cgtcctacct cggcaactcc 1320

atcggccgct acccggagga cacctacaac ggcaacggca actcccaggg caactcctgg 1380

ttcctcgccg tgaccggcta cgccgagctg tactaccgcg ccatcaagga gtggatcggc 1440

aacggcggcg tgaccgtgtc ctccatctcc ctcccgttct tcaagaagtt cgactcctcc 1500

gccacctccg gcaagaagta caccgtgggc acctccgact tcaacaacct cgcccagaac 1560

atcgccctcg ccgccgaccg cttcctctcc accgtgcagc tccacgccca caacaacggc 1620

tccctcgccg aggagttcga ccgcaccacc ggcctctcca ccggcgcccg cgacctcacc 1680

tggtcccacg cctccctcat caccgcctcc tacgccaagg ccggcgcccc ggccgcc 1737

<210>51

<211>439

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>51

Met Ala Lys His Leu Ala Ala Met Cys Trp Cys Ser Leu Leu Val Leu

1 5 10 15

Val Leu Leu Cys Leu Gly Ser Gln Leu Ala Gln Ser Gln Val Leu Phe

20 25 30

Gln Gly Phe Asn Trp Glu Ser Trp Lys Lys Gln Gly Gly Trp Tyr Asn

35 40 45

Tyr Leu Leu Gly Arg Val Asp Asp Ile Ala Ala Thr Gly Ala Thr His

50 55 60

Val Trp Leu Pro Gln Pro Ser His Ser Val Ala Pro Gln Gly Tyr Met

65 70 75 80

Pro Gly Arg Leu Tyr Asp Leu Asp Ala Ser Lys Tyr Gly Thr His Ala

85 90 95

Glu Leu Lys Ser Leu Thr Ala Ala Phe His Ala Lys Gly Val Gln Cys

100 105 110

Val Ala Asp Val Val Ile Asn His Arg Cys Ala Asp Tyr Lys Asp Gly

115 120 125

Arg Gly Ile Tyr Cys Val Phe Glu Gly Gly Thr Pro Asp Ser Arg Leu

130 135 140

Asp Trp Gly Pro Asp Met Ile Cys Ser Asp Asp Thr Gln Tyr Ser Asn

145 150 155 160

Gly Arg Gly His Arg Asp Thr Gly Ala Asp Phe Ala Ala Ala Pro Asp

165 170 175

Ile Asp His Leu Asn Pro Arg Val Gln Gln Glu Leu Ser Asp Trp Leu

l80 185 190

Asn Trp Leu Lys ser Asp Leu Gly Phe Asp Gly Trp Arg Leu Asp Phe

195 200 205

Ala Lys Gly Tyr Ser Ala Ala Val Ala Lys Val Tyr Val Asp Ser Thr

210 215 220

Ala Pro Thr Phe Val Val Ala Glu Ile Trp Ser Ser Leu His Tyr Asp

225 230 235 240

Gly Asn Gly Glu Pro Ser Ser Asn Gln Asp Ala Asp Arg Gln Glu Leu

245 250 255

Val Asn Trp Ala Gln Ala Val Gly Gly Pro Ala Ala Ala Phe Asp Phe

260 265 270

Thr Thr Lys Gly Val Leu Gln Ala Ala Val Gln Gly Glu Leu Trp Arg

275 280 285

Met Lys Asp Gly Asn Gly Lys Ala Pro Gly Met Ile Gly Trp Leu Pro

290 295 300

Glu Lys Ala Val Thr Phe Val Asp Asn His Asp Thr Gly Ser Thr Gln

305 310 315 320

Asn Ser Trp Pro Phe Pro Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr

325 330 335

Ile Leu Thr His Pro Gly Thr Pro Cys Ile Phe Tyr Asp His Val Phe

340 345 350

Asp Trp Asn Leu Lys Gln Glu Ile Ser Ala Leu Ser Ala Val Arg Ser

355 360 365

Arg Asn Gly Ile His Pro Gly Ser Glu Leu Asn Ile Leu Ala Ala Asp

370 375 380

Gly Asp Leu Tyr Val Ala Lys Ile Asp Asp Lys Val Ile Val Lys Ile

385 390 395 400

Gly Ser Arg Tyr Asp Val Gly Asn Leu Ile Pro Ser Asp Phe His Ala

405 410 415

Val Ala His Gly Asn Asn Tyr Cys Val Trp Glu Lys His Gly Leu Arg

420 425 430

Val Pro Ala Gly Arg His His

435

<210>52

<211>1320

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>52

atggcgaagc acttggctgc catgtgctgg tgcagcctcc tagtgcttgt actgctctgc 60

ttgggctccc agctggccca atcccaggtc ctcttccagg ggttcaactg ggagtcgtgg 120

aagaagcaag gtgggtggta caactacctc ctggggcggg tggacgacat cgccgcgacg 180

ggggccacgc acgtctggct cccgcagccg tcgcactcgg tggcgccgca ggggtacatg 240

cccggccggc tctacgacct ggacgcgtcc aagtacggca cccacgcgga gctcaagtcg 300

ctcaccgcgg cgttccacgc caagggcgtc cagtgcgtcg ccgacgtcgt gatcaaccac 360

cgctgcgccg actacaagga cggccgcggc atctactgcg tcttcgaggg cggcacgccc 420

gacagccgcc tcgactgggg ccccgacatg atctgcagcg acgacacgca gtactccaac 480

gggcgcgggc accgcgacac gggggccgac ttcgccgccg cgcccgacat cgaccacctc 540

aacccgcgcg tgcagcagga gctctcggac tggctcaact ggctcaagtc cgacctcggc 600

ttcgacggct ggcgcctcga ctccgccaag ggctactccg ccgccgtcgc caaggtgtac 660

gtcgacagca ccgcccccac cttcgtcgtc gccgagatat ggagctccct ccactacgac 720

ggcaacggcg agccgtccag caaccaggac gccgacaggc aggagctggt caactgggcg 780

caggcggtgg gcggccccgc cgcggcgttc gacttcacca ccaagggcgt gctgcaggcg 840

gccgtccagg gcgagctgtg gcgcatgaag gacggcaacg gcaaggcgcc cgggatgatc 900

ggctggctgc cggagaaggc cgtcacgttc gtcgacaacc acgacaccgg ctccacgcag 960

aactcgtggc cattcccctc cgacaaggtc atgcagggct acgcctatat cctcacgcac 1020

ccaggaactc catgcatctt ctacgaccac gttttcgact ggaacctgaa gcaggagatc 1080

agcgcgctgt ctgcggtgag gtcaagaaac gggatccacc cggggagcga gctgaacatc 1140

ctcgccgccg acggggatct ctacgtcgcc aagattgacg acaaggtcat cgtgaagatc 1200

gggtcacggt acgacgtcgg gaacctgatc ccctcagact tccacgccgt tgcccctggc 1260

aacaactact gcgtttggga gaagcacggt ctgagagttc cagcggggcg gcaccactag 1320

<210>53

<211>45

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>53

Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Thr Thr Gly Ser Gly Gly

1 5 10 15

Val Thr Ser Thr Ser Lys Thr Thr Thr Thr Ala Ser Lys Thr Ser Thr

20 25 30

Thr Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr Ala Val

35 40 45

<210>54

<211>137

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>54

gccaccggcg gcaccaccac caccgccacc accaccggct ccggcggcgt gacctccacc 60

tccaagacca ccaccaccgc ctccaagacc tccaccacca cctcctccac ctcctgcacc 120

accccgaccg ccgtgtc 137

<210>55

<211>300

<212>pRT

<213>激烈火球菌

<400>55

Ile Tyr Phe Val Glu Lys Tyr His Thr Ser Glu Asp Lys Ser Thr Ser

1 5 10 15

Asn Thr Ser Ser Thr Pro Pro Gln Thr Thr Leu Ser Thr Thr Lys Val

20 25 30

Leu Lys Ile Arg Tyr Pro Asp Asp Gly Glu Trp Pro Gly Ala Pro Ile

35 40 45

Asp Lys Asp Gly Asp Gly Asn Pro Glu Phe Tyr Ile Glu Ile Asn Leu

50 55 60

Trp Asn Ile Leu Asn Ala Thr Gly Phe Ala Glu Met Thr Tyr Asn Leu

65 70 75 80

Thr Ser Gly Val Leu His Tyr Val Gln Gln Leu Asp Asn Ile Val Leu

85 90 95

Arg Asp Arg Ser Asn Trp Val His Gly Tyr Pro Glu Ile Phe Tyr Gly

100 105 110

Asn Lys Pro Trp Asn Ala Asn Tyr Ala Thr Asp Gly Pro Ile Pro Leu

115 120 125

Pro Ser Lys Val Ser Asn Leu Thr Asp Phe Tyr Leu Thr Ile Ser Tyr

130 135 140

Lys Leu Glu Pro Lys Asn Gly Leu Pro Ile Asn Phe Ala Ile Glu Ser

145 150 155 160

Trp Leu Thr Arg Glu Ala Trp Arg Thr Thr Gly Ile Asn Ser Asp Glu

165 170 175

Gln Glu Val Met Ile Trp Ile Tyr Tyr Asp Gly Leu Gln Pro Ala Gly

180 185 190

Ser Lys Val Lys Glu lle Val Val Pro lle Ile Val Asn Gly Thr Pro

195 200 205

Val Asn Ala Thr Phe Glu Val Trp Lys Ala Asn Ile Gly Trp Glu Tyr

210 215 220

Val Ala Phe Arg Ile Lys Thr Pro Ile Lys Glu Gly Thr Val Thr Ile

225 230 235 240

Pro Tyr Gly Ala Phe Ile Ser Val Ala Ala Asn Ile Ser Ser Leu Pro

245 250 255

Asn Tyr Thr Glu Leu Tyr Leu Glu Asp Val Glu Ile Gly Thr Glu Phe

260 265 270

Gly Thr Pro Ser Thr Thr Ser Ala His Leu Glu Trp Trp Ile Thr Asn

275 280 285

Ile Thr Leu Thr Pro Leu Asp Arg Pro Leu Ile Ser

290 295 300

<210>56

<211>903

<212>DNA

<213>激烈火球菌

<400>56

atctacttcg tggagaagta ccacacctcc gaggacaagt ccacctccaa cacctcctcc 60

accccgccgc agaccaccct ctccaccacc aaggtgctca agatccgcta cccggacgac 120

ggcgagtggc ccggcgcccc gatcgacaag gacggcgacg gcaacccgga gttctacatc 180

gagatcaacc tctggaacat cctcaacgcc accggcttcg ccgagatgac ctacaacctc 240

actagtggcg tgctccacta cgtgcagcag ctcgacaaca tcgtgctccg cgaccgctcc 300

aactgggtgc acggctaccc ggaaatcttc tacggcaaca agccgtggaa cgccaactac 360

gccaccgacg gcccgatccc gctcccgtcc aaggtgtcca acctcaccga cttctacctc 420

accatctcct acaagctcga gccgaagaac ggtctcccga tcaacttcgc catcgagtcc 480

tggctcaccc gcgaggcctg gcgcaccacc ggcatcaact ccgacgagca ggaggtgatg 540

atctggatct actacgacgg cctccagccc gcgggctcca aggtgaagga gatcgtggtg 600

ccgatcatcg tgaacggcac cccggtgaac gccaccttcg aggtgtggaa ggccaacatc 660

ggctgggagt acgtggcctt ccgcatcaag accccgatca aggagggcac cgtgaccatc 720

ccgtacggcg ccttcatctc cgtggccgcc aacatctcct ccctcccgaa ctacaccgag 780

aagtacctcg aggacgtgga gatcggcacc gagttcggca ccccgtccac cacctccgcc 840

cacctcgagt ggtggatcac caacatcacc ctcaccccgc tcgaccgccc gctcatctcc 900

tag 903

<210>57

<211>387

<212>PRT

<213>黄栖热菌

<400>57

Met Tyr Glu Pro Lys Pro Glu His Arg Phe Thr Phe Gly Leu Trp Thr

1 5 10 15

Val Asp Asn Val Asp Arg Asp Pro Phe Gly Asp Thr Val Arg Glu Arg

20 25 30

Leu Asp Pro Val Tyr Val Val His Lys Leu Ala Glu Leu Gly Ala Tyr

35 40 45

Gly Val Asn Leu His Asp Glu Asp Leu Ile Pro Arg Gly Thr Pro Pro

50 55 60

Gln Glu Arg Asp Gln Ile Val Arg Arg Phe Lys Lys Ala Leu Asp Glu

65 70 75 80

Thr Val Leu Lys Val Pro Met Val Thr Ala Asn Leu Phe Ser Glu Pro

85 90 95

Ala Phe Arg Asp Gly Ala Ser Thr Thr Arg Asp Pro Trp Val Trp Ala

100 105 110

Tyr Ala Leu Arg Lys Ser Leu Glu Thr Met Asp Leu Gly Ala Glu Leu

115 120 125

Gly Ala Glu Ile Tyr Met Phe Trp Met Val Arg Glu Arg Ser Glu Val

130 135 140

Glu Ser Thr Asp Lys Thr Arg Lys Val Trp Asp Trp Val Arg Glu Thr

145 150 155 160

Leu Asn Phe Met Thr Ala Tyr Thr Glu Asp Gln Gly Tyr Gly Tyr Arg

165 170 175

Phe Ser Val Glu Pro Lys Pro Asn Glu Pro Arg Gly Asp Ile Tyr Phe

180 185 190

Thr Thr Val Gly Ser Met Leu Ala Leu Ile His Thr Leu Asp Arg Pro

195 200 205

Glu Arg Phe Gly Leu Asn Pro Glu Phe Ala His Glu Thr Met Ala Gly

210 215 220

Leu Asn Phe Asp His Ala Val Ala Gln Ala Val Asp Ala Gly Lys Leu

225 230 235 240

Phe His Ile Asp Leu Asn Asp Gln Arg Met Ser Arg Phe Asp Gln Asp

245 250 255

Leu Arg Phe Gly Ser Glu Asn Leu Lys Ala Gly Phe Phe Leu Val Asp

260 265 270

Leu Leu Glu Ser Ser Gly Tyr Gln Gly Pro Arg His Phe Glu Ala His

275 280 285

Ala Leu Arg Thr Glu Asp Glu Glu Gly Val Trp Thr Phe Val Arg Val

290 295 300

Cys Met Arg Thr Tyr Leu Ile Ile Lys Val Arg Ala Glu Thr Phe Arg

305 310 315 320

Glu Asp Pro Glu Val Lys Glu Leu Leu Ala Ala Tyr Tyr Gln Glu Asp

325 330 335

Pro Ala Thr Leu Ala Leu Leu Asp Pro Tyr Ser Arg Glu Lys Ala Glu

340 345 350

Ala Leu Lys Arg Ala Glu Leu Pro Leu Glu Thr Lye Arg Arg Arg Gly

355 360 365

Tyr Ala Leu Glu Arg Leu Asp Gln Leu Ala Val Glu Tyr Leu Leu Gly

370 375 380

Val Arg Gly

385

<210>58

<211>978

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>58

atggggaaga acggcaacct gtgctgcttc tctctgctgc tgcttcttct cgccgggttg 60

gcgtccggcc atcaaatcta cttcgtggag aagtaccaca cctccgagga caagtccacc 120

tccaacacct cctccacccc gccgcagacc accctctcca ccaccaaggt gctcaagatc l80

cgctacccgg acgacggtga gtggcccggc gccccgatcg acaaggacgg cgacggcaac 240

ccggagttct acatcgagat caacctctgg aacatcctca acgccaccgg cttcgccgag 300

atgacctaca acctcactag tggcgtgctc cactacgtgc agcagctcga caacatcgtg 360

ctccgcgacc gctccaactg ggtgcacggc tacccggaaa tcttctacgg caacaagccg 420

tggaacgcca actacgccac cgacggcccg atcccgctcc cgtccaaggt gtccaacctc 480

accgacttct acctcaccat ctcctacaag ctcgagccga agaacggtct cccgatcaac 540

ttcgccatcg agtcctggct cacccgcgag gcctggcgca ccaccggcat caactccgac 600

gagcaggagg tgatgatctg gatctactac gacggcctcc agcccgcggg ctccaaggtg 660

aaggagatcg tggtgccgat catcgtgaac ggcaccccgg tgaacgccac cttcgaggtg 720

tggaaggcca acatcggctg ggagtacgtg gccttccgca tcaagacccc gatcaaggag 780

ggcaccgtga ccatcccgta cggcgccttc atctccgtgg ccgccaacat ctcctccctc 840

ccgaactaca ccgagaagta cctcgaggac gtggagatcg gcaccgagtt cggcaccccg 900

tccaccacct ccgcccacct cgagtggtgg atcaccaaca tcaccctcac cccgctcgac 960

cgcccgctca tctcctag 978

<210>59

<211>1920

<212>DNA

<213>黑曲霉

<400>59

atgtccttcc gctccctcct cgccctctcc ggcctcgtgt gcaccggcct cgccaacgtg 60

atctccaagc gcgccaccct cgactcctgg ctctccaacg aggccaccgt ggcccgcacc 120

gccatcctca acaacatcgg cgccgacggc gcctgggtgt ccggcgccga ctccggcatc 180

gtggtggcct ccccgtccac cgacaacccg gactacttct acacctggac ccgcgactcc 240

ggcctcgtgc tcaagaccct cgtggacctc ttccgcaacg gcgacacctc cctcctctcc 300

accatcgaga actacatctc cgcccaggcc atcgtgcagg gcatctccaa cccgtccggc 360

gacctctcct ccggcgccgg cctcggcgag ccgaagttca acgtggacga gaccgcctac 420

accggctcct ggggccgccc gcagcgcgac ggcccggccc tccgcgccac cgccatgatc 480

ggcttcggcc agtggctcct cgacaacggc tacacctcca ccgccaccga catcgtgtgg 540

ccgctcgtgc gcaacgacct ctcctacgtg gcccagtact ggaaccagac cggctacgac 600

ctctgggagg aggtgaacgg ctcctccttc ttcaccatcg ccgtgcagca ccgcgccctc 660

gtggagggct ccgccttcgc caccgccgtg ggctcctcct gctcctggtg cgactcccag 720

gccccggaga tcctctgcta cctccagtcc ttctggaccg gctccttcat cctcgccaac 780

ttcgactcct cccgctccgg caaggacgcc aacaccctcc tcggctccat ccacaccttc 840

gacccggagg ccgcctgcga cgactccacc ttccagccgt gctccccgcg cgccctcgcc 900

aaccacaagg aggtggtgga ctccttccgc tccatctaca ccctcaacga cggcctctcc 960

gactccgagg ccgtggccgt gggccgctac ccggaggaca cctactacaa cggcaacccg 1020

tggttcctct gcaccctcgc cgccgccgag cagctctacg acgccctcta ccagtgggac 1080

aagcagggct ccctcgaggt gaccgacgtg tccctcgact tcttcaaggc cctctactcc 1140

gacgccgcca ccggcaccta ctcctcctcc tcctccacct actcctccat cgtggacgcc 1200

gtgaagacct tcgccgacgg cttcgtgtcc atcgtggaga cccacgccgc ctccaacggc 1260

tccatgtccg agcagtacga caagtccgac ggcgagcagc tctccgcccg cgacctcacc 1320

tggtcctacg ccgccctcct caccgccaac aaccgccgca actccgtggt gccggcctcc 1380

tggggcgaga cctccgcctc ctccgtgccg ggcacctgcg ccgccacctc cgccatcggc 1440

acctactcct ccgtgaccgt gacctcctgg ccgtccatcg tggccaccgg cggcaccacc 1500

accaccgcca ccccgaccgg ctccggctcc gtgacctcca cctccaagac caccgccacc 1560

gcctccaaga cctccacctc cacctcctcc acctcctgca ccaccccgac cgccgtggcc 1620

gtgaccttcg acctcaccgc caccaccacc tacggcgaga acatctacct cgtgggctcc 1680

atctcccagc tcggcgactg ggagacctcc gacggcatcg ccctctccgc cgacaagtac 1740

acctcctccg acccgctctg gtacgtgacc gtgaccctcc cggccggcga gtccttcgag 1800

tacaagttca tccgcatcga gtccgacgac tccgtggagt gggagtccga cccgaaccgc 1860

gagtacaccg tgccgcaggc ctgcggcacc tccaccgcca ccgtgaccga cacctggcgc 1920

<210>60

<211>6

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>60

Ser Glu Ly8 Asp Glu Leu

1 5

<210>61

<211>561

<212>DNA

<213>人工序列

<220>

<223>木聚糖酶BD7436

<220>

<221>CDS

<222>(1)..(561)

<400>61

atg gct agc acc ttc tac tgg cat ttg tgg acc gac ggc atc ggc acc 48

Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly Ile Gly Thr

1 5 10 15

gtg aac gct acc aac ggc agc gac ggc aac tac agc gtg agc tgg agc 96

Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser

20 25 30

aac tgc ggc aac ctc gtg gtg ggc aag ggc tgg acc acc ggc agc gct 144

Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala

35 40 45

acc agg gtg atc aac tac aac gct cat gct ttc agc gtg gtg ggc aac 192

Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val Val Gly Asn

50 55 60

gct tac ttg gct ttg tac ggc tgg acc agg aac agc ttg atc gag tac 240

Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr

65 70 75 80

tac gtg gtg gac agc tgg ggc acc tac agg cca acc ggc acc tac aag 288

Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys

85 90 95

ggc acc gtg acc agc gac ggc ggc acc tac gac atc tac acc acc acc 336

Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr

100 105 110

agg acc aac gct cca agc atc gac ggc aac aac acc acc ttc acc caa 384

Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln

115 120 125

ttc tgg agc gtg agg caa agc aag agg cca atc ggc acc aac aac acc 432

Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr

130 135 140

atc acc ttc agc aac cat gtg aac gct tgg aag agc aag ggc atg aac 480

Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn

145 150 155 160

ttg ggc agc agc tgg agc tac caa gtg ttg gct acc gag ggc tac caa 528

Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln

165 170 175

agc agc ggc tac agc aac gtg acc gtg tgg tag 561

Ser Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210>62

<211>186

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>62

Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly Ile Gly Thr

1 5 10 15

Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser

20 25 30

Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala

35 40 45

Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val Val Gly Asn

50 55 60

Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr

65 70 75 80

Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys

85 90 95

Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr

100 105 110

Arg Thr Asn Ala Pro Ser Ile Asp G1y Asn Asn Thr Thr Phe Thr Gln

115 120 125

Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr

130 135 140

Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn

145 150 155 160

Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln

165 170 175

Ser Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210>63

<211>561

<212>DNA

<213>人工序列

<220>

<223>木聚糖酶BD6002A

<220>

<221>CDS

<222>(1).. (561)

<400>63

atg gct agc acc gac tac tgg caa aac tgg acc gac ggc ggc ggc acc 48

Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr

1 5 10 15

gtg aac gct acc aac ggc agc gac ggc aac Lac agc gtg agc tgg agc 96

Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser

20 25 30

aac tgc ggc aac ttc gtg gtg ggc aag ggc tgg acc acc ggc agc gct 144

Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala

35 40 45

acc agg gtg atc aac tac aac gct ggc gct ttc agc cca agc ggc aac 192

Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn

50 55 60

ggc tac ttg gct ttg tac ggc tgg acc agg aac agc ttg atc gag tac 240

Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr

65 70 75 80

tac gtg gtg gac agc tgg ggc acc tac agg cca acc ggc acc Lac aag 288

Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr G1y Thr Tyr Lys

85 90 95

ggc acc gtg acc agc gac ggc ggc acc Lac gac atc Lac acc acc acc 336

Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr

100 105 110

agg acc aac gct cca agc atc gac ggc aac aac acc acc ttc acc caa 384

Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln

115 120 125

ttc tgg agc gtg agg caa agc aag agg cca arc ggc acc aac aac acc 432

Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr

130 135 140

atc acc ttc agc aac cat gtg aac gct tgg aag agc aag ggc atg aac 480

Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn

145 150 155 160

ttg ggc agc agc tgg agc tac caa gtg ttg gct acc gag ggc tac caa 528

Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln

165 170 175

agc agc ggc tac agc aac gtg acc gtg tgg tag 561

Ser Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210>64

<211>186

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>64

Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr

1 5 10 15

Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser

20 25 30

Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala

35 40 45

Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn

50 55 60

Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr

65 70 75 80

Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys

85 90 95

Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr

100 105 110

Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln

115 120 125

Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr

130 135 140

Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn

145 150 155 160

Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln

165 170 175

Ser Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210> 65

<211> 561

<212>DNA

<213>人工序列

<220>

<223>木聚糖酶BD6002B

<220>

<221>CDS

<222>(1)..(561)

<400>65

atg gcc tcc acc gac tac tgg cag aac tgg acc gac ggc ggc ggc acc 48

Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr

1 5 10 15

gtg aac gcc acc aac ggc tcc gac ggc aac tac tcc gtg tcc tgg tcc 96

Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser

20 25 30

aac tgc ggc aac ttc gtg gtg ggc aag ggc tgg acc acc ggc tcc gcc 144

Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala

35 40 45

acc cgc gtg atc aac tac aac gcc ggc gcc ttc tcc ccg tcc ggc aac 192

Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn

50 55 60

ggc tac ctc gcc ctc tac ggc tgg acc cgc aac tcc ctc atc gag tac 240

Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr

65 70 75 80

tac gtg gtg gac tcc tgg ggc acc tac cgc ccg acc ggc acc tac aag 288

Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys

85 90 95

ggc acc gtg acc tcc gac ggc ggc acc tac gac atc tac acc acc acc 336

Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr

100 105 110

cgc acc aac gcc ccg tcc atc gac ggc aac aac acc acc ttc acc cag 384

Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln

115 120 125

ttc tgg tcc gtg cgc cag tcc aag cgc ccg atc ggc acc aac aac acc 432

Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr

130 135 140

atc acc ttc tcc aac cac gtg aac gcc tgg aag tcc aag ggc atg aac 480

Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn

145 150 155 160

ctc ggc tcc tcc tgg tcc tac cag gtg ctc gcc acc gag ggc tac cag 528

Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln

165 170 175

tcc tcc ggc tac tcc aac gtg acc gtg tgg tga 561

Ser Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210>66

<211>186

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>66

Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr

1 5 10 15

Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser

20 25 30

Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala

35 40 45

Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn

50 55 60

Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr

65 70 75 80

Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys

85 90 95

Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr

100 105 110

Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln

115 120 125

Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr

130 135 140

Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn

145 150 155 160

Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln

165 170 175

Ser Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210>67

<211>2071

<212>DNA

<213>稻

<220>

<221>misc feature

<222>(1)..(2071)

<223>启动子

<400>67

tccatgctgt cctactactt gcttcatccc cttctacatt ttgttctggt ttttggcctg 60

catttcggat catgatgtat gtgatttcca atctgctgca atatgaatgg agactctgtg 120

ctaaccatca acaacatgaa atgcttatga ggcctttgct gagcagccaa tcttgcctgt 180

gtttatgtct tcacaggccg aattcctctg ttttgttttt caccctcaat atttggaaac 240

atttatctag gttgtttgtg tccaggccta taaatcatac atgatgttgt cgtattggat 300

gtgaatgtgg tggcgtgttc agtgccttgg atttgagttt gatgagagtt gcttctgggt 360

caccactcac cattatcgat gctcctcttc agcataaggt aaaagtcttc cctgtttacg 420

ttattttacc cactatggtt gcttgggttg gttttttcct gattgcttat gccatggaaa 480

gtcatttgat atgttgaact tgaattaact gtagaattgt atacatgttc catttgtgtt 540

gtacttcctt cttttctatt agtagcctca gatgagtgtg aaaaaaacag attatataac 600

ttgccctata aatcatttga aaaaaatatt gtacagtgag aaattgatat atagtgaatt 660

tttaagagca tgttttccta aagaagtata tattttctat gtacaaaggc cattgaagta 720

attgtagata caggataatg tagacttttt ggacttacac tgctaccttt aagtaacaat 780

catgagcaat agtgttgcaa tgatatttag gctgcattcg tttactctct tgatttccat 840

gagcacgctt cccaaactgt taaactctgt gttttttgcc aaaaaaaaat gcataggaaa 900

gttgctttta aaaaatcata tcaatccatt ttttaagtta tagctaatac ttaattaatc 960

atgcgctaat aagtcactct gtttttcgta ctagagagat tgttttgaac cagcactcaa 1020

gaacacagcc ttaacccagc caaataatgc tacaacctac cagtccacac ctcttgtaaa 1080

gcatttgttg catggaaaag ctaagatgac agcaacctgt tcaggaaaac aactgacaag 1140

gtcataggga gagggagctt ttggaaaggt gccgtgcagt tcaaacaatt agttagcagt 1200

agggtgttgg tttttgctca cagcaataag aagttaatca tggtgtaggc aacccaaata 1260

aaacaccaaa atatgcacaa ggcagtttgt tgtattctgt agtacagaca aaactaaaag 1320

taatgaaaga agatgtggtg ttagaaaagg aaacaatatc atgagtaatg tgtgggcatt 1380

atgggaccac gaaataaaaa gaacattttg atgagtcgtg tatcctcgat gagcctcaaa 1440

agttctctca ccccggataa gaaaccctta agcaatgtgc aaagtttgca ttctccactg 1500

acataatgca aaataagata tcatcgatga catagcaact catgcatcat atcatgcctc 1560

tctcaaccta ttcattccta ctcatctaca taagtatctt cagctaaatg ttagaacata 1620

aacccataag tcacgtttga tgagtattag gcgtgacaca tgacaaatca cagactcaag 1680

caagataaag caaaatgatg tgtacataaa actccagagc tatatgtcat attgcaaaaa 1740

gaggagagct tataagacaa ggcatgactc acaaaaattc atttgccttt cgtgtcaaaa 1800

agaggagggc tttacattat ccatgtcata ttgcaaaaga aagagagaaa gaacaacaca 1860

atgctgcgtc aattatacat atctgtatgt ccatcattat tcatccacct ttcgtgtacc 1920

acacttcata tatcatgagt cacttcatgt ctggacatta acaaactcta tcttaacatt 1980

tagatgcaag agcctttatc tcactataaa tgcacgatga tttctcattg tttctcacaa 2040

aaagcattca gttcattagt cctacaacaa c 2071

<210>68

<211>79

<212>PRT

<213>玉蜀黍

<220>

<221>SIGNAL

<222>(1)..(79)

<223>玉米waxy信号序列

<400>68

Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly

1 5 10 15

Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly

20 25 30

Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg

35 40 45

Thr Ser lla Arg Ala Ala Pro Arg His Gln His Gln Gln lla Arg Arg

50 55 60

Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala

65 70 75

<210>69

<211>1005

<212>DNA

<213>人工序列

<220>

<223>合成的菠萝蛋白酶序列

<220>

<221>CDS

<222>(1)..(1005)

<223>合成的菠萝蛋白酶

<400>69

atg gcc tgg aag gtg cag gtg gtg ttc ctc ttc ctc ttc ctc tgc gtg 48

Met Ala Trp Lys Val Gln Val Val Phe Leu Phe Leu Phe Leu Cys Val

1 5 10 15

atg tgg gcc tcc ccg tcc gcc gcc tcc gcg gac gag ccg tcc gac ccg 96

Met Trp Ala Ser Pro Ser Ala Ala Ser Ala Asp Glu Pro Ser Asp Pro

20 25 30

atg atg aag cgc ttc gag gag tgg atg gtg gag tac ggc cgc gtg tac 144

Met Met Lys Arg Phe Glu Glu Trp Met Val Glu Tyr Gly Arg Val Tyr

35 40 45

aag gac aac gac gag aag atg cgc cgc ttc cag atc ttc aag aac aac 192

Lys Asp Asn Asp Glu Lys Met Arg Arg Phe Gln Ile Phe Lys Asn Asn

50 55 60

gtg aac cac atc gag acc ttc aac tcc cgc aac gag aac tcc tac acc 240

Val Asn His Ile Glu Thr Phe Asn Ser Arg Asn Glu Asn Ser Tyr Thr

65 70 75 80

ctc ggc atc aac cag ttc acc gac atg acc aac aac gag ttc atc gcc 288

Leu Gly Ile Asn Gln Phe Thr Asp Met Thr Asn Asn Glu Phe Ile Ala

85 90 95

cag tac acc ggc ggc atc tcc cgc ccg ctc aac atc gag cgc gag ccg 336

Gln Tyr Thr Gly Gly Ile Ser Arg Pro Leu Asn Ile Glu Arg Glu Pro

100 105 110

gtg gtg tcc ttc gac gac gtg gac atc tcc gcc gtg ccg cag tcc atc 384

Val Val Ser Phe Asp Asp Val Asp Ile Ser Ala Val Pro Gln Ser Ile

115 120 125

gac tgg cgc gac tac ggc gcc gtg acc tcc gtg aag aac cag aac ccg 432

Asp Trp Arg Asp Tyr Gly Ala Val Thr Ser Val Lys Asn Gln Asn Pro

130 135 140

tgc ggc gcc tgc tgg gcc ttc gcc gcc atc gcc acc gtg gag tcc atc 480

Cys Gly Ala Cys Trp Ala Phe Ala Ala Ile Ala Thr Val Glu Ser Ile

145 150 155 160

tac aag atc aag aag ggc atc ctc gag ccg ctc tcc gag cag cag gtg 528

Tyr Lys Ile Lys Lys Gly Ile Leu Glu Pro Leu Ser Glu Gln Gln Val

165 170 175

ctc gac tgc gcc aag ggc tac ggc tgc aag ggc ggc tgg gag ttc cgc 576

Leu Asp Cys Ala Lys Gly Tyr Gly Cys Lys Gly Gly Trp Glu Phe Arg

180 185 190

gcc ttc gag ttc atc atc tcc aac aag ggc gtg gcc tcc ggc gcc atc 624

Ala Phe Glu Phe Ile Ile Ser Asn Lys Gly Val Ala Ser Gly Ala Ile

195 200 205

tac ccg tac aag gcc gcc aag ggc acc tgc aag acc gac ggc gtg ccg 672

Tyr Pro Tyr Lys Ala Ala Lys Gly Thr Cys Lys Thr Asp G1y Val Pro

210 215 220

aac tcc gcc tac atc acc ggc tac gcc cgc gtg ccg cgc aac aac gag 720

Asn Ser Ala Tyr Ile Thr Gly Tyr Ala Arg Val Pro Arg Asn ASn Glu

225 230 235 240

tcc tcc atg atg tac gcc gtg tcc aag cag ccg atc acc gtg gcc gtg 768

Ser Ser Met Met Tyr Ala Val Ser Lys Gln Pro Ile Thr Val Ala Val

245 250 255

gac gcc aac gcc aac ttc cag tac tac aag tcc ggc gtg ttc aac ggc 816

Asp Ala Asn Ala Asn phe Gln Tyr Tyr Lys Ser Gly Val Phe Asn Gly

260 265 270

ccg tgc ggc acc tcc ctc aac cac gcc gtg acc gcc atc ggc tac ggc 864

Pro Cys Gly Thr Ser Leu Asn His Ala Val Thr Ala Ile Gly Tyr Gly

275 280 285

cag gac tcc atc atc tac ccg aag aag tgg ggc gcc aag tgg ggc gag 912

Gln Asp Ser Ile Ile Tyr Pro Lys Lys Trp Gly Ala Lys Trp Gly Glu

290 295 300

gcc ggc tac atc cgc atg gcc cgc gac gtg tcc tcc tcc tcc ggc atc 960

Ala Gly Tyr Ile Arg Met Ala Arg Asp Val Ser Ser Ser Ser Gly Ile

305 310 315 320

tgc ggc atc gcc atc gac ccg ctc tac ccg acc ctc gag gag tag 1005

Cys Gly Ile Ala Ile Asp Pro Leu Tyr Pro Thr Leu Glu Glu

325 330

<2l0>70

<211>334

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>70

Met Ala Trp Lys Val Gln Val Val Phe Leu Phe Leu Phe Leu Cys Val

1 5 10 15

Met Trp Ala Ser Pro Ser Ala Ala Ser Ala Asp Glu Pro Ser Asp Pro

20 25 30

Met Met Lys Arg Phe Glu Glu Trp Met Val Glu Tyr Gly Arg Val Tyr

35 40 45

Lys Asp Asn Asp Glu Lys Met Arg Arg Phe Gln Ile Phe Lys Asn Asn

50 55 60

Val Asn His Ile Glu Thr Phe Asn Ser Arg Asn Glu Asn Ser Tyr Thr

65 70 75 80

Leu Gly Ile Asn Gln Phe Thr Asp Met Thr Asn Asn Glu Phe Ile Ala

85 90 95

Gln Tyr Thr Gly Gly Ile Ser Arg Pro Leu Asn Ile Glu Arg Glu Pro

100 105 110

Val Val Ser Phe Asp Asp Val Asp Ile Ser Ala Val Pro Gln Ser Ile

115 120 125

Asp Trp Arg Asp Tyr Gly Ala Val Thr Ser Val Lys Asn Gln Asn Pro

130 135 140

Cys Gly Ala Cys Trp Ala Phe Ala Ala Ile Ala Thr Val Glu Ser Ile

145 150 155 160

Tyr Lys Ile Lys Lys Gly Ile Leu Glu Pro Leu Ser Glu Gln Gln Val

165 170 175

Leu Asp Cys Ala Lys Gly Tyr Gly Cys Lys Gly Gly Trp Glu Phe Arg

180 185 190

Ala Phe Glu Phe Ile Ile Ser Ash Lys Gly Val Ala Ser Gly Ala Ile

195 200 205

Tyr Pro Tyr Lys Ala Ala Lys Gly Thr Cys Lys Thr Asp Gly Val Pro

210 215 220

Asn Ser Ala Tyr Ile Thr Gly Tyr Ala Arg Val Pro Arg Asn Asn Glu

225 230 235 240

Ser Ser Met Met Tyr Ala Val Ser Lys Gln Pro Ile Thr Val Ala Val

245 250 255

Asp Ala Asn Ala Asn Phe Gln Tyr Tyr Lys Ser Gly Val Phe Ash Gly

260 265 270

Pro Cys Gly Thr Ser Leu Asn His Ala Val Thr Ala Ile Gly Tyr Gly

275 280 285

Gln Asp Ser Ile Ile Tyr Pro Lys Lys Trp Gly Ala Lys Trp Gly Glu

290 295 300

Ala Gly Tyr Ile Arg Met Ala Arg Asp Val Ser Ser Ser Ser Gly Ile

305 310 315 320

Cys Gly Ile Ala Ile Asp Pro Leu Tyr Pro Thr Leu Glu Glu

325 330

<210>71

<21l>78

<212>DNA

<2l3>人工序列

<220>

<223>菠萝蛋白酶信号序列

<400>71

atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc 60

ccgtccgccg cctccgcc 78

<210>72

<211>26

<212>PRT

<213>人工序列

<220>

<223>菠萝蛋白酶信号肽

<400>72

Met Ala Trp Lys Val Gln Val Val Phe Leu Phe Leu Phe Leu Cys Val

1 5 10 15

Met Trp Ala Ser Pro Ser Ala Ala Ser Ala

20 25

<210>73

<211>1050

<212>DNA

<213>人工序列

<220>

<223>pSYNll000

<400>73

atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc 60

ccgtccgccg cctccgcgga cgagccgtcc gacccgatga tgaagcgctt cgaggagtgg 120

atggtggagt acggccgcgt gtacaaggac aacgacgaga agatgcgccg cttccagatc 180

ttcaagaaca acgtgaacca catcgagacc ttcaactccc gcaacgagaa ctcctacacc 240

ctcggcatca accagttcac cgacatgacc aacaacgagt tcatcgccca gtacaccggc 300

ggcatctccc gcccgctcaa catcgagcgc gagccggtgg tgtccttcga cgacgtggac 360

atctccgccg tgccgcagtc catcgactgg cgcgactacg gcgccgtgac ctccgtgaag 420

aaccagaacc cgtgcggcgc ctgctgggcc ttcgccgcca tcgccaccgt ggagtccatc 480

tacaagatca agaagggcat cctcgagccg ctctccgagc agcaggtgct cgactgcgcc 540

aagggctacg gctgcaaggg cggctgggag ttccgcgcct tcgagttcat catctccaac 600

aagggcgtgg cctccggcgc catctacccg tacaaggccg ccaagggcac ctgcaagacc 660

gacggcgtgc cgaactccgc ctacatcacc ggctacgccc gcgtgccgcg caacaacgag 720

tcctccatga tgtacgccgt gtccaagcag ccgatcaccg tggccgtgga cgccaacgcc 780

aacttccagt actacaagtc cggcgtgttc aacggcccgt gcggcacctc cctcaaccac 840

gccgtgaccg ccatcggcta cggccaggac tccatcatct acccgaagaa gtggggcgcc 900

aagtggggcg aggccggcta catccgcatg gcccgcgacg tgtcctcctc ctccggcatc 960

tgcggcatcg ccatcgaccc gctctacccg accctcgagg aggtgttcgc cgaggccatc 1020

gccgccaact ccaccctcgt ggccgagtag 1050

<210>74

<211>1067

<212>DNA

<213>人工序列

<220>

<223>pSYN11589

<400>74

tggcctggaa ggtgcaggtg gtgttcctct tcctcttcct ctgcgtgatg tgggcctccc 60

cgtccgccgc ctccgcctcc tcctcctcct tcgccgactc caacccgatc cgcccggtga 120

ccgaccgcgc cgcctccacc gacgagccgt ccgacccgat gatgaagcgc ttcgaggagt 180

ggatggtgga gtacggccgc gtgtacaagg acaacgacga gaagatgcgc cgcttccaga 240

tcttcaagaa caacgtgaac cacatcgaga ccttcaactc ccgcaacgag aactcctaca 300

ccctcggcat caaccagttc accgacatga ccaacaacga gttcatcgcc cagtacaccg 360

gcggcatctc ccgcccgctc aacatcgagc gcgagccggt ggtgtccttc gacgacgtgg 420

acatctccgc cgtgccgcag tccatcgact ggcgcgacta cggcgccgtg acctccgtga 480

agaaccagaa cccgtgcggc gcctgctggg ccttcgccgc catcgccacc gtggagtcca 540

tctacaagat caagaagggc atcctcgagc cgctctccga gcagcaggtg ctcgactgcg 600

ccaagggcta cggctgcaag ggcggctggg agttccgcgc cttcgagttc atcatctcca 660

acaagggcgt ggcctccggc gccatctacc cgtacaaggc cgccaagggc acctgcaaga 720

ccgacggcgt gccgaactcc gcctacatca ccggctacgc ccgcgtgccg cgcaacaacg 780

agtcctccat gatgtacgcc gtgtccaagc agccgatcac cgtggccgtg gacgccaacg 840

ccaacttcca gtactacaag tccggcgtgt tcaacggccc gtgcggcacc tccctcaacc 900

acgccgtgac cgccatcggc tacggccagg actccatcat ctacccgaag aagtggggcg 960

ccaagtgggg cgaggccggc tacatccgca tggcccgcga cgtgtcctcc tcctccggca 1020

tctgcggcat cgccatcgac ccgctctacc cgaccctcga ggagtag 1067

<210>75

<211>1023

<212>DNA

<213>人工序列

<220>

<223>pSYN11587 序列

<400>75

atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc 60

ccgtccgccg cctccgcgga cgagccgtcc gacccgatga tgaagcgctt cgaggagtgg 120

atggtggagt acggccgcgt gtacaaggac aacgacgaga agatgcgccg cttccagatc 180

ttcaagaaca acgtgaacca catcgagacc ttcaactccc gcaacgagaa ctcctacacc 240

ctcggcatca accagttcac cgacatgacc aacaacgagt tcatcgccca gtacaccggc 300

ggcatctccc gcccgctcaa catcgagcgc gagccggtgg tgtccttcga cgacgtggac 360

atctccgccg tgccgcagtc catcgactgg cgcgactacg gcgccgtgac ctccgtgaag 420

aaccagaacc cgtgcggcgc ctgctgggcc ttcgccgcca tcgccaccgt ggagtccatc 480

tacaagatca agaagggcat cctcgagccg ctctccgagc agcaggtgct cgactgcgcc 540

aagggctacg gctgcaaggg cggctgggag ttccgcgcct tcgagttcat catctccaac 600

aagggcgtgg cctccggcgc catctacccg tacaaggccg ccaagggcac ctgcaagacc 660

gacggcgtgc cgaactccgc ctacatcacc ggctacgccc gcgtgccgcg caacaacgag 720

tcctccatga tgtacgccgt gtccaagcag ccgatcaccg tggccgtgga cgccaacgcc 780

aacttccagt actacaagtc cggcgtgttc aacggcccgt gcggcacctc cctcaaccac 840

gccgtgaccg ccatcggcta cggccaggac tccatcatct acccgaagaa gtggggcgcc 900

aagtggggcg aggccggcta catccgcatg gcccgcgacg tgtcctcctc ctccggcatc 960

tgcggcatcg ccatcgaccc gctctacccg accctcgagg agtccgagaa ggacgagctg 1020

tag 1023

<210>76

<211>990

<212>DNA

<213>人工序列

<220>

<223>pSYN12169 序列

<400>76

atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccatg 60

gcggacgagc cgtccgaccc gatgatgaag cgcttcgagg agtggatggt ggagtacggc 120

cgcgtgtaca aggacaacga cgagaagatg cgccgcttcc agatcttcaa gaacaacgtg 180

aaccacatcg agaccttcaa ctcccgcaac gagaactcct acaccctcgg catcaaccag 240

ttcaccgaca tgaccaacaa cgagttcatc gcccagtaca ccggcggcat ctcccgcccg 300

ctcaacatcg agcgcgagcc ggtggtgtcc ttcgacgacg tggacatctc cgccgtgccg 360

cagtccatcg actggcgcga ctacggcgcc gtgacctccg tgaagaacca gaacccgtgc 420

ggcgcctgct gggccttcgc cgccatcgcc accgtggagt ccatctacaa gatcaagaag 480

ggcatcctcg agccgctctc cgagcagcag gtgctcgact gcgccaaggg ctacggctgc 540

aagggcggct gggagttccg cgccttcgag ttcatcatct ccaacaaggg cgtggcctcc 600

ggcgccatct acccgtacaa ggccgccaag ggcacctgca agaccgacgg cgtgccgaac 660

tccgcctaca tcaccggcta cgcccgcgtg ccgcgcaaca acgagtcctc catgatgtac 720

gccgtgtcca agcagccgat caccgtggcc gtggacgcca acgccaactt ccagtactac 780

aagtccggcg tgttcaacgg cccgtgcggc acctccctca accacgccgt gaccgccatc 840

ggctacggcc aggactccat catctacccg aagaagtggg gcgccaagtg gggcgaggcc 900

ggctacatcc gcatggcccg cgacgtgtcc tcctcctccg gcatctgcgg catcgccatc 960

gacccgctct acccgaccct cgaggagtag 990

<210>77

<211>1170

<212>DNA

<213>人工序列

<220>

<223>pSYN12575 序列

<400>77

atgctggcgg ctctggccac gtcgcagctc gtcgcaacgc gcgccggcct gggcgtcccg 60

gacgcgtcca cgttccgccg cggcgccgcg cagggcctga ggggggcccg ggcgtcggcg 120

gcggcggaca cgctcagcat gcggaccagc gcgcgcgcgg cgcccaggca ccagcaccag 180

caggcgcgcc gcggggccag gttcccgtcg ctcgtcgtgt gcgccagcgc cggcgccatg 240

gcggacgagc cgtccgaccc gatgatgaag cgcttcgagg agtggatggt ggagtacggc 300

cgcgtgtaca aggacaacga cgagaagatg cgccgcttcc agatcttcaa gaacaacgtg 360

aaccacatcg agaccttcaa ctcccgcaac gagaactcct acaccctcgg catcaaccag 420

ttcaccgaca tgaccaacaa cgagttcatc gcccagtaca ccggcggcat ctcccgcccg 480

ctcaacatcg agcgcgagcc ggtggtgtcc ttcgacgacg tggacatctc cgccgtgccg 540

cagtccatcg actggcgcga ctacggcgcc gtgacctccg tgaagaacca gaacccgtgc 600

ggcgcctgct gggccttcgc cgccatcgcc accgtggagt ccatctacaa gatcaagaag 660

ggcatcctcg agccgctctc cgagcagcag gtgctcgact gcgccaaggg ctacggctgc 720

aagggcggct gggagttccg cgccttcgag ttcatcatct ccaacaaggg cgtggcctcc 780

ggcgccatct acccgtacaa ggccgccaag ggcacctgca agaccgacgg cgtgccgaac 840

tccgcctaca tcaccggcta cgcccgcgtg ccgcgcaaca acgagtcctc catgatgtac 900

gccgtgtcca agcagccgat caccgtggcc gtggacgcca acgccaactt ccagtactac 960

aagtccggcg tgttcaacgg cccgtgcggc acctccctca accacgccgt gaccgccatc 1020

ggctacggcc aggactccat catctacccg aagaagtggg gcgccaagtg gggcgaggcc 1080

ggctacatcc gcatggcccg cgacgtgtcc tcctcctccg gcatctgcgg catcgccatc 1140

gacccgctct acccgaccct cgaggagtag 1170

<210>78

<211>1068

<212>DNA

<213>人工序列

<220>

<223>pSM270 序列

<400>78

atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc 60

ccgtccgccg cctccgcctc ctcctcctcc ttcgccgact ccaacccgat ccgcccggtg 120

accgaccgcg ccgcctccac cgacgagccg tccgacccga tgatgaagcg cttcgaggag 180

tggatggtgg agtacggccg cgtgtacaag gacaacgacg agaagatgcg ccgcttccag 240

atcttcaaga acaacgtgaa ccacatcgag accttcaact cccgcaacga gaactcctac 300

accctcggca tcaaccagtt caccgacatg accaacaacg agttcatcgc ccagtacacc 360

ggcggcatct cccgcccgct caacatcgag cgcgagccgg tggtgtcctt cgacgacgtg 420

gacatctccg ccgtgccgca gtccatcgac tggcgcgact acggcgccgt gacctccgtg 480

aagaaccaga acccgtgcgg cgcctgctgg gccttcgccg ccatcgccac cgtggagtcc 540

atctacaaga tcaagaaggg catcctcgag ccgctctccg agcagcaggt gctcgactgc 600

gccaagggct acggctgcaa gggcggctgg gagttccgcg ccttcgagtt catcatctcc 660

aacaagggcg tggcctccgg cgccatctac ccgtacaagg ccgccaaggg cacctgcaag 720

accgacggcg tgccgaactc cgcctacatc accggctacg cccgcgtgcc gcgcaacaac 780

gagtcctcca tgatgtacgc cgtgtccaag cagccgatca ccgtggccgt ggacgccaac 840

gccaacttcc agtactacaa gtccggcgtg ttcaacggcc cgtgcggcac ctccctcaac 900

cacgccgtga ccgccatcgg ctacggccag gactccatca tctacccgaa gaagtggggc 960

gccaagtggg gcgaggccgg ctacatccgc atggcccgcg acgtgtcctc ctcctccggc 1020

atctgcggca tcgccatcga cccgctctac ccgaccctcg aggagtag 1068

<210>79

<211>1497

<212>DNA

<213>Trichoderma reesei

<220>

<221>CDS

<222>(1)..(1497)

<223>Trichoderma reesei 纤维二糖水解酶 I

<400>79

atg cag tcg gcg tgt act ctc caa tcg gag act cac ccg cct ctg aca 48

Met Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr

1 5 10 15

tgg cag aaa tgc tcg tct ggt ggc acg tgc act caa cag aca ggc tcc 96

Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser

20 25 30

gtg gtc atc gac gcc aac tgg cgc tgg act cac gct acg aac agc agc 144

Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser

35 40 45

acg aac tgc tac gat ggc aac act tgg agc tcg acc cta tgt cct gac 192

Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp

50 55 60

aac gag acc tgc gcg aag aac tgc tgt ctg gac ggt gcc gcc tac gcg 240

Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala

65 70 75 80

tcc acg tac gga gtt acc acg agc ggt aac agc ctc tcc att ggc ttt 288

Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe

85 90 95

gtc acc cag tct gcg cag aag aac gtt ggc gct cgc ctt tac ctt atg 336

Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met

100 105 110

gcg agc gac acg acc tac cag gaa ttc acc ctg ctt ggc aac gag ttc 384

Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe

115 120 125

tct ttc gat gtt gat gtt tcg cag ctg ccg tgc ggc ttg aac gga gct 432

Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala

130 135 140

ctc tac ttc gtg tcc atg gac gcg gat ggt ggc gtg agc aag tat ccc 480

Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro

145 150 155 160

acc aac acc gct ggc gcc aag tac ggc acg ggg tac tgt gac agc cag 528

Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln

165 170 175

tgt ccc cgc gat ctg aag ttc atc aat ggc cag gcc aac gtt gag ggc 576

Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly

180 185 190

tgg gag ccg tca tcc aac aac gcg aac acg ggc att gga gga cac gga 624

Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly

195 200 205

agc tgc tgc tct gag atg gat atc tgg gag gcc aac tcc atc tcc gag 672

Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu

210 215 220

gct ctt acc ccc cac cct tgc acg act gtc ggc cag gag atc tgc gag 720

Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu

225 230 235 240

ggt gat ggg tgc ggc gga act tac tcc gat aac aga tat ggc ggc act 768

Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr

245 250 255

tgc gat ccc gat ggc tgc gac tgg aac cca tac cgc ctg ggc aac acc 816

Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr

260 265 270

agc ttc tac ggc cct ggc tct agc ttt acc ctc gat acc acc aag aaa 864

Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys

275 280 285

ttg acc gtt gtc acc cag ttc gag acg tcg ggt gcc atc aac cga tac 912

Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr

290 295 300

tat gtc cag aat ggc gtc act ttc cag cag ccc aac gcc gag ctt ggt 960

Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly

305 310 315 320

agt tac tct ggc aac gag ctc aac gat gat tac tgc aca gct gag gag 1008

Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu

325 330 335

gca gaa ttc ggc gga tcc tct ttc tca gac aag ggc ggc ctg act cag 1056

Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln

340 345 350

ttc aag aag gct acc tct ggc ggc atg gtt ctg gtc atg agt ctg tgg 1104

Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp

355 360 365

gat gat tac tac gcc aac atg ctg tgg ctg gac tcc acc tac ccg aca 1152

Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr

370 375 380

aac gag acc tcc tcc aca ccc ggt gcc gtg cgc gga agc tgc tcc acc 1200

Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr

385 390 395 400

agc tcc ggt gtc cct gct cag gtc gaa tct cag tct ccc aac gcc aag 1248

Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys

405 410 415

gtc acc ttc tcc aac atc aag ttc gga ccc att ggc agc acc ggc aac 1296

Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn

420 425 430

cct agc ggc ggc aac cct ccc ggc gga aac ccg cct ggc acc acc acc 1344

Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr

435 440 445

acc cgc cgc cca gcc act acc act gga agc tct ccc gga cct acc cag 1392

Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln

450 455 460

tct cac tac ggc cag tgc ggc ggt att ggc tac agc ggc ccc acg gtc 1440

Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val

465 470 475 480

tgc gcc agc ggc aca act tgc cag gtc ctg aac cct tac tac tct cag 1488

Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln

485 490 495

tgc ctg taa 1497

Cys Leu

<210>80

<211>498

<212>PRT

<213>Trichoderma reesei

<400>80

Met Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr

1 5 10 15

Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser

20 25 30

Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser

35 40 45

Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp

50 55 60

Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala

65 70 75 80

Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe

85 90 95

Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met

100 105 110

Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe

115 120 125

Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala

130 135 140

Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro

145 150 155 160

Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln

165 170 175

Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly

180 185 190

Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly

195 200 205

Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu

210 215 220

Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu

225 230 235 240

Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr

245 250 255

Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr

260 265 270

Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys

275 280 285

Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr

290 295 300

Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly

305 310 315 320

Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu

325 330 335

Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln

340 345 350

Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp

355 360 365

Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr

370 375 380

Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr

385 390 395 400

Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys

405 410 415

Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn

420 425 430

Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr

435 440 445

Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln

450 455 460

Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val

465 470 475 480

Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln

485 490 495

Cys Leu

<210>81

<211>1365

<212>DNA

<213>Trichoderma reesei

<220>

<221>CDS

<222>(1)..(1365)

<223>trichoderma reesei 纤维二糖水解酶 II

<400>81

atg gtg cct cra gag gag cgg caa gct tgc tca agc gtc tgg ggc caa 48

Met Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly Gln

1 5 10 15

tgt ggt ggc cag aat tgg tcg ggt ccg act tgc tgt gct tcc gga agc 96

Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly Ser

20 25 30

aca tgc gtc tac tcc aac gac tat tac tcc cag tgt ctt ccc ggc gct 144

Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly Ala

35 40 45

gca agc tca agc tcg tcc acg cgc gcc gcg tcg acg act tca cga gta 192

Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg Val

50 55 60

tcc ccc aca aca tcc cgg tcg agc tcc gcg acg cct cca cct ggt tct 240

Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly Ser

65 70 75 80

acc act acc aga gta cct cca gtc gga tcg gga acc gct acg tat tca 288

Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr Ser

85 90 95

ggc aac cct ttt gtt ggg gtc act cct tgg gcc aat gca tat tac gcc 336

Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala

100 105 110

tct gaa gtt agc agc ctc gct att cct agc ttg act gga gcc atg gcc 384

Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala

115 120 125

act gct gca gca gct gtc gca aag gtt ccc tct ttt atg tgg cta gat 432

Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu Asp

130 135 140

act ctt gac aag acc cct ctc atg gag caa acc ttg gcc gac atc cgc 480

Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg

145 150 155 160

acc gcc aac aag aat ggc ggt aac tat gcc gga cag ttt gtg gtg tat 528

Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val Tyr

165 170 175

gac ttg ccg gat cgc gat tgc gct gcc ctt gcc tcg aat ggc gaa tac 576

Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Tyr

180 185 190

tct att gcc gat ggt ggc gtc gcc aaa tat aag aac tat atc gac acc 624

Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp Thr

195 200 205

att cgt caa att gtc gtg gaa tat tcc gat atc cgg acc ctc ctg gtt 672

Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu Val

210 215 220

att gag cct gac tct ctt gcc aac ctg gtg acc aac ctc ggt act cca 720

Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr Pro

225 230 235 240

aag tgt gcc aat gct cag tca gcc tac ctt gag tgc atc aac tac gcc 768

Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr Ala

245 250 255

gtc aca cag ctg aac ctt cca aat gtt gcg atg tat ttg gac gct ggc 816

Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly

260 265 270

cat gca gga tgg ctt ggc tgg ccg gca aac caa gac ccg gcc gct cag 864

His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala Gln

275 280 285

cta ttt gca aat gtt tac aag aat gca tcg tct ccg aga gct ctt cgc 912

Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu Arg

290 295 300

gga ttg gca acc aat gtc gcc aac tac aac ggg tgg aac att acc agc 960

Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr Ser

305 310 315 320

ccc cca tcg tac acg caa ggc aac gct gtc tac aac gag aag ctg tac 1008

Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu Tyr

325 330 335

atc cac gct att gga cct ctt ctt gcc aat cac ggc tgg tcc aac gcc 1056

Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn Ala

340 345 350

ttc ttc atc act gat caa ggt cga tcg gga aag cag cct acc gga cag 1104

Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln

355 360 365

caa cag tgg gga gac tgg tgc aat gtg atc ggc acc gga ttt ggt att 1152

Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Ile

370 375 380

cgc cca tcc gca aac act ggg gac tcg ttg ctg gat tcg ttt gtc tgg 1200

Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val Trp

385 390 395 400

gtc aag cca ggc ggc gag tgt gac ggc acc agc gac agc agt gcg cca 1248

Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala Pro

405 410 415

cga ttt gac tcc cac tgt gcg ctc cca gat gcc ttg caa ccg gcg cct 1296

Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro

420 425 430

caa gct ggt gct tgg ttc caa gcc tac ttt gtg cag ctt ctc aca aac 1344

Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn

435 440 445

gca aac cca tcg ttc ctg tag 1365

Ala Asn Pro Ser Phe Leu

450

<210>82

<211>454

<212>PRT

<213>Trichoderma reesei

<400>82

Met Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly Gln

1 5 10 15

Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly Ser

20 25 30

Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly Ala

35 40 45

Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg Val

50 55 60

Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly Ser

65 70 75 80

Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr Ser

85 90 95

Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala

100 105 110

Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala

115 120 125

Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu Asp

130 135 140

Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg

145 150 155 160

Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val Tyr

165 170 175

Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Tyr

180 185 190

Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp Thr

195 200 205

Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu Val

210 215 220

Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr Pro

225 230 235 240

Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr Ala

245 250 255

Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly

260 265 270

His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala Gln

275 280 285

Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu Arg

290 295 300

Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr Ser

305 310 315 320

Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu Tyr

325 330 335

Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn Ala

340 345 350

Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln

355 360 365

Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Ile

370 375 380

Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val Trp

385 390 395 400

Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala Pro

405 410 415

Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro

420 425 430

Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn

435 440 445

Ala Asn Pro Ser Phe Leu

450

<210>83

<211>1317

<212>DNA

<213>Trichoderma reesei

<220>

<221>CDS

<222>(1)..(1317)

<223>Trichoderma reesei 内切葡聚糖酶 I

<400>83

atg cag caa ccg gga acc agc acc ccc gag gtc cat ccc aag ttg aca 48

Met Gln Gln Pro Gly Thr Ser Thr Pro Glu Val His Pro Lys Leu Thr

1 5 10 15

acc tac aag tgc aca aag tcc ggg ggg tgc gtg gcc cag gac acc tcg 96

Thr Tyr Lys Cys Thr Lys Sar Gly Gly Cys Val Ala Gln Asp Thr Ser

20 25 30

gtg gtc ctt gac tgg aac tac cgc tgg atg cac gac gca aac tac aac 144

Val Val Leu Asp Trp Asn Tyr Arg Trp Met His Asp Ala Asn Tyr Asn

35 40 45

tcg tgc acc gtc aac ggc ggc gtc aac acc acg ctc tgc cct gac gag 192

Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr Leu Cys Pro Asp Glu

50 55 60

gcg acc tgt ggc aag aac tgc ttc atc gag ggc gtc gac tac gcc gcc 240

Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly Val Asp Tyr Ala Ala

65 70 75 80

tcg ggc gtc acg acc tcg ggc agc agc ctc acc atg aac cag tac atg 288

Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr Met Asn Gln Tyr Met

85 90 95

ccc agc agc tct ggc ggc tac agc agc gtc tct cct cgg ctg tat ctc 336

Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser Pro Arg Leu Tyr Leu

100 105 110

ctg gac tct gac ggt gag tac gtg atg ctg aag ctc aac ggc cag gag 384

Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys Leu Asn Gly Gln Glu

115 120 125

ctg agc ttc gac gtc gac ctc tct gct ctg ccg tgt gga gag aac ggc 432

Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro Cys Gly Glu Asn Gly

130 135 140

tcg ctc tac ctg tct cag atg gac gag aac ggg ggc gcc aac cag tat 480

Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly Gly Ala Asn Gln Tyr

145 150 155 160

aac acg gcc ggt gcc aac tac ggg agc ggc tac tgc gat gct cag tgc 528

Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr Cys Asp Ala Gln Cys

165 170 175

ccc gtc cag aca tgg agg aac ggc acc ctc aac act agc cac cag ggc 576

Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn Thr Ser His Gln Gly

180 185 190

ttc tgc tgc aac gag atg gat atc ctg gag ggc aac tcg agg gcg aat 624

Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly Asn Ser Arg Ala Asn

195 200 205

gcc ttg acc cct cac tct tgc acg gcc acg gcc tgc gac tct gcc ggt 672

Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala Cys Asp Ser Ala Gly

210 215 220

tgc ggc ttc aac ccc tat ggc agc ggc tac aaa agc tac tac ggc ccc 720

Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys Ser Tyr Tyr Gly Pro

225 230 235 240

gga gat acc gtt gac acc tcc aag acc ttc acc atc atc acc cag ttc 768

Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr Ile Ile Thr Gln Phe

245 250 255

aac acg gac aac ggc tcg ccc tcg ggc aac ctt gtg agc atc acc cgc 816

Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu Val Ser Ile Thr Arg

260 265 270

aag tac cag caa aac ggc gtc gac atc ccc agc gcc cag ccc ggc ggc 864

Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser Ala Gln Pro Gly Gly

275 280 285

gac acc atc tcg tcc tgc ccg tcc gcc tca gcc tac ggc ggc ctc gcc 912

Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala Tyr Gly Gly Leu Ala

290 295 300

acc atg ggc aag gcc ctg agc agc ggc atg gtg ctc gtg ttc agc att 960

Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val Leu Val Phe Ser Ile

305 310 315 320

tgg aac gac aac agc cag tac atg aac tgg ctc gac agc ggc aac gcc 1008

Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu Asp Ser Gly Asn Ala

325 330 335

ggc ccc tgc agc agc acc gag ggc aac cca tcc aac acc ctg gcc aac 1056

Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser Asn Thr Leu Ala Asn

340 345 350

aac ccc aac acg cac gtc gtc ttc tcc aac atc cgc tgg gga gac att 1104

Asn Pro Asn Thr His Val Val Phe Ser Asn Ile Arg Trp Gly Asp Ile

355 360 365

ggg tct act acg aac tcg act gcg ccc ccg ccc ccg cct gcg tcc agc 1152

Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro Pro Pro Ala Ser Ser

370 375 380

acg acg ttt tcg act aca cgg agg agc tcg acg act tcg agc agc ccg 1200

Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr Thr Ser Ser Ser Pro

385 390 395 400

agc tgc acg cag act cac tgg ggg cag tgc ggt ggc att ggg tac agc 1248

Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly Gly Ile Gly Tyr Ser

405 410 415

ggg tgc aag acg tgc acg tcg ggc act acg tgc cag tat agc aac gac 1296

Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys Gln Tyr Ser Asn Asp

420 425 430

tac tac tcg caa tgc ctt tag 1317

Tyr Tyr Ser Gln Cys Leu

435

<210>84

<211>438

<212>PRT

<213>Trichoderma reesei

<400>84

Met Gln Gln Pro Gly Thr Ser Thr Pro Glu Val His Pro Lys Leu Thr

1 5 10 15

Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val Ala Gln Asp Thr Ser

20 25 30

Val Val Leu Asp Trp Asn Tyr Arg Trp Met His Asp Ala Asn Tyr Asn

35 40 45

Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr Leu Cys Pro Asp Glu

50 55 60

Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly Val Asp Tyr Ala Ala

65 70 75 80

Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr Met Asn Gln Tyr Met

85 90 95

Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser Pro Arg Leu Tyr Leu

100 105 110

Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys Leu Asn Gly Gln Glu

115 120 125

Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro Cys Gly Glu Asn Gly

130 135 140

Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly Gly Ala Asn Gln Tyr

145 150 155 160

Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr Cys Asp Ala Gln Cys

165 170 175

Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn Thr Ser His Gln Gly

180 185 190

Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly Asn Ser Arg Ala Asn

195 200 205

Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala Cys Asp Ser Ala Gly

210 215 220

Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys Ser Tyr Tyr Gly Pro

225 230 235 240

Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr Ile Ile Thr Gln Phe

245 250 255

Asn Thr Asp Ash Gly Ser Pro Ser Gly Asn Leu Val Ser Ile Thr Arg

260 265 270

Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser Ala Gln Pro Gly Gly

275 280 285

Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala Tyr Gly Gly Leu Ala

290 295 300

Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val Leu Val Phe Ser Ile

305 310 315 320

Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu Asp Ser Gly Asn Ala

325 330 335

Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser Asn Thr Leu Ala Asn

340 345 350

Asn Pro Asn Thr His Val Val Phe Ser Asn Ile Arg Trp Gly Asp Ile

355 360 365

Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro Pro Pro Ala Ser Ser

370 375 380

Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr Thr Ser Ser Ser Pro

385 390 395 400

Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly Gly Ile Gly Tyr Ser

405 410 415

Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys Gln Tyr Ser Asn Asp

420 425 430

Tyr Tyr Ser Gln Cys Leu

435

<210>85

<211>954

<212>DNA

<213>人工序列

<220>

<223>6GP1

<220>

<221>CDS

<222>(1)..(954)

<223>6GP1

<400>85

atg ggc gtg gac ccg ttc gag cgc aac aag atc ctc ggc cgc ggc atc 48

Met Gly Val Asp Pro Phe Glu Arg Asn Lys Ile Leu Gly Arg Gly Ile

1 5 10 15

aac atc ggc aac gcc ctg gag gcc ccg aac gag ggc gac tgg ggc gtg 96

Asn Ile Gly Asn Ala Leu Glu Ala Pro Asn Glu Gly Asp Trp Gly Val

20 25 30

gtg atc aag gac gag ttc ttc gac atc atc aag gag gcc ggc ttc tcc 144

Val Ile Lys Asp Glu Phe Phe Asp Ile Ile Lys Glu Ala Gly Phe Ser

35 40 45

cac gtg cgc atc ccg atc cgc tgg tcc acc cac gcc tac gcc ttc ccg 192

His Val Arg Ile Pro Ile Arg Trp Ser Thr His Ala Tyr Ala Phe Pro

50 55 60

ccg tac aag atc atg gac cgc ttc ttc aag cgc gtg gac gag gtg atc 240

Pro Tyr Lys Ile Met Asp Arg Phe Phe Lys Arg Val Asp Glu Val Ile

65 70 75 80

aac ggc gcc ctc aag cgc ggc ctc gcc gtg gcc atc aac atc cac cac 288

Asn Gly Ala Leu Lys Arg Gly Leu Ala Val Ala Ile Asn Ile His His

85 90 95

tac gag gag ctc atg aac gac ccg gag gag cac aag gag cgc ttc ctc 336

Tyr Glu Glu Leu Met Asn Asp Pro Glu Glu His Lys Glu Arg Phe Leu

100 105 110

gcc ctc tgg aag cag atc gcc gac cgc tac aag gac tac ccg gag acc 384

Ala Leu Trp Lys Gln Ile Ala Asp Arg Tyr Lys Asp Tyr Pro Glu Thr

115 120 125

ctc ttc ttc gag atc ctc aac gag ccg cac ggc aac ctc acc ccg gag 432

Leu Phe Phe Glu Ile Leu Asn Glu Pro His Gly Asn Leu Thr Pro Glu

130 135 140

aag tgg aac gag ctg ctc gag gag gcc ctc aag gtg atc cgc tcc atc 480

Lys Trp Asn Glu Leu Leu Glu Glu Ala Leu Lys Val Ile Arg Ser Ile

145 150 155 160

gac aag aag cac acc atc atc att ggc acc gca gag tgg gga ggc atc 528

Asp Lys Lys His Thr Ile Ile Ile Gly Thr Ala Glu Trp Gly Gly Ile

165 170 175

tcc gcc ctc gag aag ctc tcc gtg ccg aag tgg gag aag aat tcc atc 576

Ser Ala Leu Glu Lys Leu Ser Val Pro Lys Trp Glu Lys Asn Ser Ile

180 185 190

gtg acc atc cac tac tac aac ccg ttc gag ttc acg cac cag ggc gcc 624

Val Thr Ile His Tyr Tyr Asn Pro Phe Glu Phe Thr His Gln Gly Ala

195 200 205

gag tgg gtg gag ggc tcc gag aag tgg ctt ggc cgc aag tgg ggc tcc 672

Glu Trp Val Glu Gly Ser Glu Lys Trp Leu Gly Arg Lys Trp Gly Ser

210 215 220

ccg gac gac cag aag cac ctc atc gag gag ttc aac ttc atc gag gag 720

Pro Asp Asp Gln Lys His Leu Ile Glu Glu Phe Asn Phe Ile Glu Glu

225 230 235 240

tgg tcc aag aag aac aag cgc ccg atc tac atc ggc gag ttt ggc gcc 768

Trp Ser Lys Lys Asn Lys Arg Pro Ile Tyr Ile Gly Glu Phe Gly Ala

245 250 255

tac cgc aag gcc gac ctc gag tcc cgc atc aag tgg acc tcc ttc gtg 816

Tyr Arg Lys Ala Asp Leu Glu Ser Arg Ile Lys Trp Thr Ser Phe Val

260 265 270

gtg cgt gag atg gag aag cgc cgc tgg tcc tgg gcc tac tgg gag ttc 864

Val Arg Glu Met Glu Lys Arg Arg Trp Ser Trp Ala Tyr Trp Glu Phe

275 280 285

tgc tcc ggc ttc ggc gtg tac gac acc ctc cgc aag acc tgg aac aag 912

Cys Ser Gly Phe Gly Val Tyr Asp Thr Leu Arg Lys Thr Trp Asn Lys

290 295 300

gac ctc ctc gag gcc ctc atc ggc ggc gac tcc atc gag tag 954

Asp Leu Leu Glu Ala Leu Ile Gly Gly Asp Ser Ile Glu

305 310 315

<210>86

<211>317

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>86

Met Gly Val Asp Pro Phe Glu Arg Asn Lys Ile Leu Gly Arg Gly Ile

1 5 10 15

Asn Ile Gly Asn Ala Leu Glu Ala Pro Asn Glu Gly Asp Trp Gly Val

20 25 30

Val Ile Lys Asp Glu Phe Phe Asp Ile Ile Lys Glu Ala Gly Phe Ser

35 40 45

His Val Arg Ile Pro Ile Arg Trp Ser Thr His Ala Tyr Ala Phe Pro

50 55 60

Pro Tyr Lys Ile Met Asp Arg Phe Phe Lys Arg Val Asp Glu Val Ile

65 70 75 80

Asn Gly Ala Leu Lys Arg Gly Leu Ala Val Ala Ile Asn Ile His His

85 90 95

Tyr Glu Glu Leu Met Asn Asp Pro Glu Glu His Lys Glu Arg Phe Leu

100 105 110

Ala Leu Trp Lys Gln Ile Ala Asp Arg Tyr Lys Asp Tyr Pro Glu Thr

115 120 125

Leu Phe Phe Glu Ile Leu Asn Glu Pro His Gly Asn Leu Thr Pro Glu

130 135 140

Lys Trp Asn Glu Leu Leu Glu Glu Ala Leu Lys Val Ile Arg Ser Ile

145 150 155 160

Asp Lys Lys His Thr Ile Ile Ile Gly Thr Ala Glu Trp Gly Gly Ile

165 170 175

Ser Ala Leu Glu Lys Leu Ser Val Pro Lys Trp Glu Lys Asn Ser Ile

180 185 190

Val Thr Ile His Tyr Tyr Asn Pro Phe Glu Phe Thr His Gln Gly Ala

195 200 205

Glu Trp Val Glu Gly Ser Glu Lys Trp Leu Gly Arg Lys Trp Gly Ser

210 215 220

Pro Asp Asp Gln Lys His Leu Ile Glu Glu Phe Asn Phe Ile Glu Glu

225 230 235 240

Trp Ser Lys Lys Asn Lys Arg Pro Ile Tyr Ile Gly Glu Phe Gly Ala

245 250 255

Tyr Arg Lys Ala Asp Leu Glu Ser Arg Ile Lys Trp Thr Ser Phe Val

260 265 270

Val Arg Glu Met Glu Lys Arg Arg Trp Ser Trp Ala Tyr Trp Glu Phe

275 280 285

Cys Ser Gly Phe Gly Val Tyr Asp Thr Leu Arg Lys Thr Trp Asn Lys

290 295 300

Asp Leu Leu Glu Ala Leu Ile Gly Gly Asp Ser Ile Glu

305 310 315

<210>87

<211>1248

<212>DNA

<213>Hordeum vulgare

<220>

<221>CDS

<222>(1)..(1248)

<223>大麦AmyI淀粉酶

<400>87

atg gca cac caa gtc ctc ttt cag ggg ttc aac tgg gag tcg tgg aag 48

Met Ala His Gln Val Leu Phe Gln Gly Phe Asn Trp Glu Ser Trp Lys

1 5 10 15

cag agc ggc ggg tgg tac aac atg atg atg ggc aag gtc gac gac atc 96

Gln ser Gly Gly Trp Tyr Asn Met Met Met Gly Lys Val Asp Asp Ile

20 25 30

gcc gct gcc gga gtc acc cac gtc tgg ctg cca ccg ccg tcg cac tcc 144

Ala Ala Ala Gly Val Thr His Val Trp Leu Pro Pro Pro Ser His Ser

35 40 45

gtc tcc aac gaa ggt tac atg cct ggt cgg ctg tac gac atc gac gcg 192

Val Ser Asn Glu Gly Tyr Met Pro Gly Arg Leu Tyr Asp Ile Asp Ala

50 55 60

tcc aag tac ggc aac gcg gcg gag ctc aag tcg ctc atc ggc gcg ctc 240

Ser Lys Tyr Gly Asn Ala Ala Glu Leu Lys Ser Leu Ile Gly Ala Leu

65 70 75 80

cac ggc aag ggc gtg cag gcc atc gcc gac atc gtc atc aac cac cgc 288

His Gly Lys Gly Val Gln Ala Ile Ala Asp Ile Val Ile Asn His Arg

85 90 95

tgc gcc gac tac aag gat agc cgc ggc atc tac tgc atc ttc gag ggc 336

Cys Ala Asp Tyr Lys Asp Ser Arg Gly Ile Tyr Cys Ile Phe Glu Gly

100 105 110

ggc acc tcc gac ggc cgc ctc gac tgg ggc ccc cac atg atc tgt cgc 384

Gly Thr Ser Asp Gly Arg Leu Asp Trp Gly Pro His Met Ile Cys Arg

115 120 125

gac gac acc aaa tac tcc gat ggc acc gca aac ctc gac acc gga gcc 432

Asp Asp Thr Lys Tyr Ser Asp Gly Thr Ala Asn Leu Asp Thr Gly Ala

130 135 140

gac ttc gcc gcc gcg ccc gac atc gac cac ctc aac gac cgg gtc cag 480

Asp Phe Ala Ala Ala Pro Asp Ile Asp His Leu Asn Asp Arg Val Gln

145 150 155 160

cgc gag ctc aag gag tgg ctc ctc tgg ctc aag agc gac ctc ggc ttc 528

Arg Glu Leu Lys Glu Trp Leu Leu Trp Leu Lys Ser Asp Leu Gly Phe

165 170 175

gac gcg tgg cgc ctt gac ttc gcc agg ggc tac tcg ccg gag atg gcc 576

Asp Ala Trp Arg Leu Asp Phe Ala Arg Gly Tyr Ser Pro Glu Met Ala

180 185 190

aag gtg tac atc gac ggc aca tcc ccg agc ctc gcc gtg gcc gag gtg 624

Lys Val Tyr Ile Asp Gly Thr Ser Pro Ser Leu Ala Val Ala Glu Val

195 200 205

tgg gac aat atg gcc acc ggc ggc gac ggc aag ccc aac tac gac cag 672

Trp Asp Asn Met Ala Thr Gly Gly Asp Gly Lys Pro Asn Tyr Asp Gln

210 215 220

gac gcg cac cgg cag aat ctg gtg aac tgg gtg gac aag gtg ggc ggc 720

Asp Ala His Arg Gln Asn Leu Val Asn Trp Val Asp Lys Val Gly Gly

225 230 235 240

gcg gcc tcg gca ggc atg gtg ttc gac ttc acg acc aaa ggg ata ctg 768

Ala Ala Ser Ala Gly Met Val Phe Asp Phe Thr Thr Lys Gly Ile Leu

245 250 255

aac gct gcc gtg gag ggc gag ctg tgg agg ctg atc gac ccg cag ggg 816

Asn Ala Ala Val Glu Gly Glu Leu Trp Arg Leu Ile Asp Pro Gln Gly

260 265 270

aag gcc ccc ggc gtg atg gga tgg tgg ccg gcc aag gcc gtc acc ttc 864

Lys Ala Pro Gly Val Met Gly Trp Trp Pro Ala Lys Ala Val Thr Phe

275 280 285

gtc gac aac cac gat aca ggc tcc acg cag gcc atg tgg cca ttc ccc 912

Val Asp Asn His Asp Thr Gly Ser Thr Gln Ala Met Trp Pro Phe Pro

290 295 300

tcc gac aag gtc atg cag ggc tac gcg tac atc ctc acc cac ccc ggc 960

Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr Ile Leu Thr His Pro Gly

305 310 315 320

atc cca tgc atc ttc tac gac cat ttc ttc aac tgg ggg ttt aag gac 1008

Ile Pro Cys Ile Phe Tyr Asp His Phe Phe Asn Trp Gly Phe Lys Asp

325 330 335

cag atc gcg gcg ctg gtg gcg atc agg aag cgc aac ggc atc acg gcg 1056

Gln Ile Ala Ala Leu Val Ala Ile Arg Lys Arg Asn Gly Ile Thr Ala

340 345 350

acg agc gct ctg aag atc ctc atg cac gaa gga gat gcc tac gtc gcc 1104

Thr Ser Ala Leu Lys Ile Leu Met His Glu Gly Asp Ala Tyr Val Ala

355 360 365

gag ata gac ggc aag gtg gtg gtg aag atc ggg tcc agg tac gac gtc 1152

Glu Ile Asp Gly Lys Val Val Val Lys Ile Gly Ser Arg Tyr Asp Val

370 375 380

ggg gcg gtg atc ccg gcc ggg ttc gtg acc tcg gca cac ggc aac gac 1200

Gly Ala Val Ile Pro Ala Gly Phe Val Thr Ser Ala His Gly Asn Asp

385 390 395 400

tac gcc gtc tgg gag aag aac ggt gcc gcg gca aca cra caa cgg agc 1248

Tyr Ala Val Trp Glu Lys Asn Gly Ala Ala Ala Thr Leu Gln Arg Ser

405 410 415

<210>88

<211>416

<212>PRT

<213>Hordeum vulgare

<400>88

Met Ala His Gln Val Leu Phe Gln Gly Phe Asn Trp Glu Ser Trp Lys

1 5 10 15

Gln Ser Gly Gly Trp Tyr Asn Met Met Met Gly Lys Val Asp Asp Ile

20 25 30

Ala Ala Ala Gly Val Thr His Val Trp Leu Pro Pro Pro Ser His Ser

35 40 45

Val Ser Asn Glu Gly Tyr Met Pro Gly Arg Leu Tyr Asp Ile Asp Ala

50 55 60

Ser Lys Tyr Gly Asn Ala Ala Glu Leu Lys Ser Leu Ile Gly Ala Leu

65 70 75 80

His Gly Lys Gly Val Gln Ala Ile Ala Asp Ile Val Ile Asn His Arg

85 90 95

Cys Ala Asp Tyr Lys Asp Ser Arg Gly Ile Tyr Cys Ile Phe Glu Gly

100 105 110

Gly Thr Ser Asp Gly Arg Leu Asp Trp Gly Pro His Met Ile Cys Arg

115 120 125

Asp Asp Thr Lys Tyr Ser Asp Gly Thr Ala Asn Leu Asp Thr Gly Ala

130 135 140

Asp Phe Ala Ala Ala Pro Asp Ile Asp His Leu Asn Asp Arg Val Gln

145 150 155 160

Arg Glu Leu Lys Glu Trp Leu Leu Trp Leu Lys Ser Asp Leu Gly Phe

165 170 175

Asp Ala Trp Arg Leu Asp Phe Ala Arg Gly Tyr Ser Pro Glu Met Ala

180 185 190

Lys Val Tyr Ile Asp Gly Thr Ser Pro Ser Leu Ala Val Ala Glu Val

195 200 205

Trp Asp Asn Met Ala Thr Gly Gly Asp Gly Lys Pro Asn Tyr Asp Gln

210 215 220

Asp Ala His Arg Gln Asn Leu Val Asn Trp Val Asp Lys Val Gly Gly

225 230 235 240

Ala Ala Ser Ala Gly Met Val Phe Asp Phe Thr Thr Lys Gly Ile Leu

245 250 255

Asn Ala Ala Val Glu Gly Glu Leu Trp Arg Leu Ile Asp Pro Gln Gly

260 265 270

Lys Ala Pro Gly Val Met Gly Trp Trp Pro Ala Lys Ala Val Thr Phe

275 280 285

Val Asp Asn His Asp Thr Gly Ser Thr Gln Ala Met Trp Pro Phe Pro

290 295 300

Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr Ile Leu Thr His Pro Gly

305 310 315 320

Ile Pro Cys Ile Phe Tyr Asp His Phe Phe Asn Trp Gly Phe Lys Asp

325 330 335

Gln Ile Ala Ala Leu Val Ala Ile Arg Lys Arg Asn Gly Ile Thr Ala

340 345 350

Thr Ser Ala Leu Lys Ile Leu Met His Glu Gly Asp Ala Tyr Val Ala

355 360 365

Glu Ile Asp Gly Lys Val Val Val Lys Ile Gly Ser Arg Tyr Asp Val

370 375 380

Gly Ala Val Ile Pro Ala Gly Phe Val Thr Ser Ala His Gly Asn Asp

385 390 395 400

Tyr Ala Val Trp Glu Lys Asn Gly Ala Ala Ala Thr Leu Gln Arg Ser

405 410 415

<210>89

<211>1401

<212>DNA

<213>人工序列

<220>

<223>Trichoderma reesei β-葡糖苷酶 2

<220>

<221>CDS

<222>(1)..(1401)

<223>Trichoderma reesei β-葡糖苷酶 2

<400>89

atg ttg ccc aag gac ttt cag tgg ggg ttc gcc acg gct gcc tac cag 48

Met Leu Pro Lys Asp Phe Gln Trp Gly Phe Ala Thr Ala Ala Tyr Gln

1 5 10 15

atc gag ggc gcc gtc gac cag gac ggc cgc ggc ccc agc atc tgg gac 96

Ile Glu Gly Ala Val Asp Gln Asp Gly Arg Gly Pro Ser Ile Trp Asp

20 25 30

acg ttc tgc gcg cag ccc ggc aag atc gcc gac ggc tcg tcg ggc gtg 144

Thr Phe Cys Ala Gln Pro Gly Lys Ile Ala Asp Gly Ser Ser Gly Val

35 40 45

acg gcg tgc gac tcg tac aac cgc acg gcc gag gac att gcg ctg ctg 192

Thr Ala Cys Asp Ser Tyr Asn Arg Thr Ala Glu Asp Ile Ala Leu Leu

50 55 60

aag tcg ctc ggg gcc aag agc tac cgc ttc tcc atc tcg tgg tcg cgc 240

Lys Ser Leu Gly Ala Lys Ser Tyr Arg Phe Ser Ile Ser Trp Ser Arg

65 70 75 80

atc atc ccc gag ggc ggc cgc ggc gat gcc gtc aac cag gcg ggc atc 288

Ile Ile Pro Glu Gly Gly Arg Gly Asp Ala Val Asn Gln Ala Gly Ile

85 90 95

gac cac tac gtc aag ttc gtc gac gac ctg ctc gac gcc ggc atc acg 336

Asp His Tyr Val Lys Phe Val Asp Asp Leu Leu Asp Ala Gly Ile Thr

100 105 110

ccc ttc atc acc ctc ttc cac tgg gac ctg ccc gag ggc ctg cat cag 384

Pro Phe Ile Thr Leu Phe His Trp Asp Leu Pro Glu Gly Leu His Gln

115 120 125

cgg tac ggg ggg ctg ctg aac cgc acc gag ttc ccg ctc gac ttt gaa 432

Arg Tyr Gly Gly Leu Leu Asn Arg Thr Glu Phe Pro Leu Asp Phe Glu

130 135 140

aac tac gcc cgc gtc atg ttc agg gcg ctg ccc aag gtg cgc aac tgg 480

Asn Tyr Ala Arg Val Met Phe Arg Ala Leu Pro Lys Val Arg Asn Trp

145 150 155 160

atc acc ttc aac gag ccg ctg tgc tcg gcc atc ccg ggc tac ggc tcc 528

Ile Thr Phe Asn Glu Pro Leu Cys Ser Ala Ile Pro Gly Tyr Gly Ser

165 170 175

ggc acc ttc gcc ccc ggc cgg cag agc acc tcg gag ccg tgg acc gtc 576

Gly Thr Phe Ala Pro Gly Arg Gln Ser Thr Ser Glu Pro Trp Thr Val

180 185 190

ggc cac aac atc ctc gtc gcc cac ggc cgc gcc gtc aag gcg tac cgc 624

Gly His Asn Ile Leu Val Ala His Gly Arg Ala Val Lys Ala Tyr Arg

195 200 205

gac gac ttc aag ccc gcc agc ggc gac ggc cag atc ggc atc gtc ctc 672

Asp Asp Phe Lys Pro Ala Ser Gly Asp Gly Gln Ile Gly Ile Val Leu

210 215 220

aac ggc gac ttc acc tac ccc tgg gac gcc gcc gac ccg gcc gac aag 720

Asn Gly Asp Phe Thr Tyr Pro Trp Asp Ala Ala Asp Pro Ala Asp Lys

225 230 235 240

gag gcg gcc gag cgg cgc ctc gag ttc ttc acg gcc tgg ttc gcg gac 768

Glu Ala Ala Glu Arg Arg Leu Glu Phe Phe Thr Ala Trp Phe Ala Asp

245 250 255

ccc atc tac ttg ggc gac tac ccg gcg tcg atg cgc aag cag ctg ggc 816

Pro Ile Tyr Leu Gly Asp Tyr Pro Ala Ser Met Arg Lys Gln Leu Gly

260 265 270

gac cgg ctg ccg acc ttt acg ccc gag gag cgc gcc ctc gtc cac ggc 864

Asp Arg Leu Pro Thr Phe Thr Pro Glu Glu Arg Ala Leu Val His Gly

275 280 285

tcc aac gac ttt tac ggc atg aac cac tac acg tcc aac tac atc cgc 912

Ser Asn Asp Phe Tyr Gly Met Asn His Tyr Thr Ser Asn Tyr Ile Arg

290 295 300

cac cgc agc tcg ccc gcc tcc gcc gac gac acc gtc ggc aac gtc gac 960

His Arg Ser Ser Pro Ala Ser Ala Asp Asp Thr Val Gly Asn Val Asp

305 310 315 320

gtg ctc ttc acc aac aag cag ggc aac tgc atc ggc ccc gag acg cag 1008

Val Leu Phe Thr Asn Lys Gln Gly Asn Cys Ile Gly Pro Glu Thr Gln

325 330 335

tcc ccc tgg ctg cgc ccc tgt gcc gcc ggc ttc cgc gac ttc ctg gtg 1056

Ser Pro Trp Leu Arg Pro Cys Ala Ala Gly Phe Arg Asp Phe Leu Val

340 345 350

tgg atc agc aag agg tac ggc tac ccg ccc atc tac gtg acg gag aac 1104

Trp Ile Ser Lys Arg Tyr Gly Tyr Pro Pro Ile Tyr Val Thr Glu Asn

355 360 365

ggc acg agc atc aag ggc gag agc gac ttg ccc aag gag aag att ctc 1152

Gly Thr Ser Ile Lys Gly Glu Ser Asp Leu Pro Lys Glu Lys Ile Leu

370 375 380

gaa gat gac ttc agg gtc aag tac tat aac gag tac atc cgt gcc atg 1200

Glu Asp Asp Phe Arg Val Lys Tyr Tyr Asn Glu Tyr Ile Arg Ala Met

385 390 395 400

gtt acc gcc gtg gag ctg gac ggg gtc aac gtc aag ggg tac ttt gcc 1248

Val Thr Ala Val Glu Leu Asp Gly Val Asn Val Lys Gly Tyr Phe Ala

405 410 415

tgg tcg ctc atg gac aac ttt gag tgg gcg gac ggc tac gtg acg agg 1296

Trp Ser Leu Met Asp Asn Phe Glu Trp Ala Asp Gly Tyr Val Thr Arg

420 425 430

ttt ggg gtt acg tat gtg gat tat gag aat ggg cag aag cgg ttc ccc 1344

Phe Gly Val Thr Tyr Val Asp Tyr Glu Asn Gly Gln Lys Arg Phe Pro

435 440 445

aag aag agc gca aag agc ttg aag ccg ctg ttt gac gag ctg att gcg 1392

Lys Lys Ser Ala Lys Ser Leu Lys Pro Leu Phe Asp Glu Leu Ile Ala

450 455 460

gcg gcg tga

Ala Ala

465

<210>90

<211>466

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>90

Met Leu Pro Lys Asp Phe Gln Trp Gly Phe Ala Thr Ala Ala Tyr Gln

1 5 10 15

Ile Glu Gly Ala Val Asp Gln Asp Gly Arg Gly Pro Ser Ile Trp Asp

20 25 30

Thr Phe Cys Ala Gln Pro Gly Lys Ile Ala Asp Gly Ser Ser Gly Val

35 40 45

Thr Ala Cys Asp Ser Tyr Asn Arg Thr Ala Glu Asp Ile Ala Leu Leu

50 55 60

Lys Ser Leu Gly Ala Lys Ser Tyr Arg Phe Ser Ile Ser Trp Ser Arg

65 70 75 80

Ile Ile Pro Glu Gly Gly Arg Gly Asp Ala Val Asn Gln Ala Gly Ile

85 90 95

Asp His Tyr Val Lys Phe Val Asp Asp Leu Leu Asp Ala Gly Ile Thr

100 105 110

Pro Phe Ile Thr Leu Phe His Trp Asp Leu Pro Glu Gly Leu His Gln

115 120 125

Arg Tyr Gly Gly Leu Leu Asn Arg Thr Glu Phe Pro Leu Asp Phe Glu

130 135 140

Asn Tyr Ala Arg Val Met Phe Arg Ala Leu Pro Lys Val Arg Asn Trp

145 150 155 160

Ile Thr Phe Asn Glu Pro Leu Cys Ser Ala Ile Pro Gly Tyr Gly Ser

165 170 175

Gly Thr Phe Ala Pro Gly Arg Gln Ser Thr Ser Glu Pro Trp Thr Val

180 185 190

Gly His Asn Ile Leu Val Ala His Gly Arg Ala Val Lys Ala Tyr Arg

195 200 205

Asp Asp Phe Lys Pro Ala Ser Gly Asp Gly Gln Ile Gly Ile Val Leu

210 215 220

Asn Gly Asp Phe Thr Tyr Pro Trp Asp Ala Ala Asp Pro Ala Asp Lys

225 230 235 240

Glu Ala Ala Glu Arg Arg Leu Glu Phe Phe Thr Ala Trp Phe Ala Asp

245 250 255

Pro Ile Tyr Leu Gly Asp Tyr Pro Ala Ser Met Arg Lys Gln Leu Gly

260 265 270

Asp Arg Leu Pro Thr Phe Thr Pro Glu Glu Arg Ala Leu Val His Gly

275 280 285

Ser Asn Asp Phe Tyr Gly Met Asn His Tyr Thr Ser Asn Tyr Ile Arg

290 295 300

His Arg Ser Ser Pro Ala Ser Ala Asp Asp Thr Val Gly Asn Val Asp

305 310 315 320

Val Leu Phe Thr Asn Lys Gln Gly Asn Cys Ile Gly Pro Glu Thr Gln

325 330 335

Ser Pro Trp Leu Arg Pro Cys Ala Ala Gly Phe Arg Asp Phe Leu Val

340 345 350

Trp Ile Ser Lys Arg Tyr Gly Tyr Pro Pro Ile Tyr Val Thr Glu Asn

355 360 365

Gly Thr Ser Ile Lys Gly Glu Ser Asp Leu Pro Lys Glu Lys Ile Leu

370 375 380

Glu Asp Asp Phe Arg Val Lys Tyr Tyr Asn Glu Tyr Ile Arg Ala Met

385 390 395 400

Val Thr Ala Val Glu Leu Asp Gly Val Asn Val Lys Gly Tyr Phe Ala

405 410 415

Trp Ser Leu Met Asp Asn Phe Glu Trp Ala Asp Gly Tyr Val Thr Arg

420 425 430

Phe Gly Val Thr Tyr Val Asp Tyr Glu Asn Gly Gln Lys Arg Phe Pro

435 440 445

Lys Lys Ser Ala Lys Ser Leu Lys Pro Leu Phe Asp Glu Leu Ile Ala

450 455 460

Ala Ala

465

<210>91

<211>2103

<212>DNA

<213>人工序列

<220>

<223>Trichoderma reesei β-葡糖苷酶 D

<220>

<221>CDS

<222>(1)..(2103)

<223>Trichoderma reesei β-葡糖苷酶 D

<400>91

atg att ctc ggc tgt gaa agc aca ggt gtc atc tct gcc gtc aaa cac 48

Met Ile Leu Gly Cys Glu Ser Thr Gly Val Ile Ser Ala Val Lys His

1 5 10 15

ttt gtc gcc aac gac cag gag cac gag cgg cga gcg gtc gac tgt ctc 96

Phe Val Ala Asn Asp Gln Glu His Glu Arg Arg Ala Val Asp Cys Leu

20 25 30

atc acc cag cgg gct ctc cgg gag gtc tat ctg cga ccc ttc cag atc 144

Ile Thr Gln Arg Ala Leu Arg Glu Val Tyr Leu Arg Pro Phe Gln Ile

35 40 45

gta gcc cga gat gca agg ccc ggc gca ttg atg aca tcc tac aac aag 192

Val Ala Arg Asp Ala Arg Pro Gly Ala Leu Met Thr Ser Tyr Asn Lys

50 55 60

gtc aat ggc aag cac gtc gct gac agc gcc gag ttc ctt cag ggc att 240

Val Asn Gly Lys His Val Ala Asp Ser Ala Glu Phe Leu Gln Gly Ile

65 70 75 80

ctc cgg act gag tgg aat tgg gac cct ctc att gtc agc gac tgg tac 288

Leu Arg Thr Glu Trp Asn Trp Asp Pro Leu Ile Val Ser Asp Trp Tyr

85 90 95

ggc acc tac acc act att gat gcc atc aaa gcc ggc ctt gat ctc gag 336

Gly Thr Tyr Thr Thr Ile Asp Ala Ile Lys Ala Gly Leu Asp Leu Glu

100 105 110

atg ccg ggc gtt tea cga tat cgc ggc aaa tac atc gag tct gct ctg 384

Met Pro Gly Val Ser Arg Tyr Arg Gly Lys Tyr Ile Glu Ser Ala Leu

115 120 125

cag gcc cgt ttg ctg aag cag tcc act atc gat gag cgc gct cgc cgc 432

Gln Ala Arg Leu Leu Lys Gln Ser Thr Ile Asp Glu Arg Ala Arg Arg

130 135 140

gtg ctc agg ttc gcc cag aag gcc agc cat ctc aag gtc tcc gag gta 480

Val Leu Arg Phe Ala Gln Lys Ala Ser His Leu Lys Val Ser Glu Val

145 150 155 160

gag caa ggc cgt gac ttc cca gag gat cgc gtc ctc aac cgt cag atc 528

Glu Gln Gly Arg Asp Phe Pro Glu Asp Arg Val Leu Asn Arg Gln Ile

165 170 175

tgc ggc agc agc att gtc cta ctg aag aat gag aac tcc atc tta cct 576

Cys Gly Ser Ser Ile Val Leu Leu Lys Asn Glu Asn Ser Ile Leu Pro

180 185 190

ctc ccc aag tcc gtc aag aag gtc gcc ctt gtt ggt tcc cac gtg cgt 624

Leu Pro Lys Ser Val Lys Lys Val Ala Leu Val Gly Ser His Val Arg

195 200 205

cta ccg gct atc tcg gga gga ggc agc gcc tct ctt gtc cct tac tat 672

Leu Pro Ala Ile Ser Gly Gly Gly Ser Ala Ser Leu Val Pro Tyr Tyr

210 215 220

gcc ata tct cta tac gat gcc gtc tct gag gta cta gcc ggt gcc acg 720

Ala Ile Ser Leu Tyr Asp Ala Val Ser Glu Val Leu Ala Gly Ala Thr

225 230 235 240

atc acg cac gag gtc ggt gcc tat gcc cac caa atg ctg ccc gtc atc 768

Ile Thr His Glu Val Gly Ala Tyr Ala His Gln Met Leu Pro Val Ile

245 250 255

gac gca atg atc agc aac gcc gta atc cac ttc tac aac gac ccc atc 816

Asp Ala Met Ile Ser Asn Ala Val Ile His Phe Tyr Asn Asp Pro Ile

260 265 270

gat gtc aaa gac aga aag crc ctt ggc agt gag aac gta tcg tcg aca 864

Asp Val Lys Asp Arg Lys Leu Leu Gly Ser Glu Asn Val Ser Ser Thr

275 280 285

tcg ttc cag ctc atg gat tac aac aac atc cca acg ctc aac aag gcc 912

Ser Phe Gln Leu Met Asp Tyr Asn Asn Ile Pro Thr Leu Asn Lys Ala

290 295 300

atg ttc tgg ggt act ctc gtg ggc gag ttt atc cct acc gcc acg gga 960

Met Phe Trp Gly Thr Leu Val Gly Glu Phe Ile Pro Thr Ala Thr Gly

305 310 315 320

att tgg gaa ttt ggc ctc agt gtc ttt ggc act gcc gac ctt tat att 1008

Ile Trp Glu Phe Gly Leu Ser Val Phe Gly Thr Ala Asp Leu Tyr Ile

325 330 335

gat aat gag ctc gtg att gaa aat aca aca cat cag acg cgt gga acc 1056

Asp Asn Glu Leu Val Ile Glu Asn Thr Thr His Gln Thr Arg Gly Thr

340 345 350

gcc ttt ttc gga aag gga acg acg gaa aaa gtc gct acc agg agg atg 1104

Ala Phe Phe Gly Lys Gly Thr Thr Glu Lys Val Ala Thr Arg Arg Met

355 360 365

gtg gcc ggc agc acc tac aag ctg cgt ctc gag ttt ggg tct gcc aac 1152

Val Ala Gly Ser Thr Tyr Lys Leu Arg Leu Glu Phe Gly Ser Ala Asn

370 375 380

acg acc aag atg gag acg acc ggt gtt gtc aac ttt ggc ggc ggt gcc 1200

Thr Thr Lys Met Glu Thr Thr Gly Val Val Asn Phe Gly Gly Gly Ala

385 390 395 400

gta cac ctg ggt gcc tgt ctc aag gtc gac cca cag gag atg att gcg 1248

Val His Leu Gly Ala Cys Leu Lys Val Asp Pro Gln Glu Met Ile Ala

405 410 415

cgg gcc gtc aag gcc gca gcc gat gcc gac tac acc atc atc tgc acg 1296

Arg Ala Val Lys Ala Ala Ala Asp Ala Asp Tyr Thr Ile Ile Cys Thr

420 425 430

gga ctc agc ggc gag tgg gag tct gag ggt ttt gac cgg cct cac atg 1344

Gly Leu Ser Gly Glu Trp Glu Ser Glu Gly Phe Asp Arg Pro His Met

435 440 445

gac ctg ccc cct ggt gtg gac acc atg atc tcg caa gtt ctt gac gcc 1392

Asp Leu Pro Pro Gly Val Asp Thr Met Ile Ser Gln Val Leu Asp Ala

450 455 460

gct ccc aat gct gta gtc gtc aac cag tca ggc acc cca gtg aca atg 1440

Ala Pro Asn Ala Val Val Val Asn Gln Ser Gly Thr Pro Val Thr Met

465 470 475 480

agc tgg gct cat aaa gca aag gcc att gtg cag gct tgg tat ggt ggt 1488

Ser Trp Ala His Lys Ala Lys Ala Ile Val Gln Ala Trp Tyr Gly Gly

485 490 495

aac gag aca ggc cac gga atc tcc gat gtg ctc ttt ggc aac gtc aac 1536

Asn Glu Thr Gly His Gly Ile Ser Asp Val Leu Phe Gly Asn Val Asn

500 505 510

ccg tcg ggg aaa ctc tcc cta tcg tgg cca gtc gat gtg aag cac aac 1584

Pro Ser Gly Lys Leu Ser Leu Ser Trp Pro Val Asp Val Lys His Asn

515 520 525

cca gca tat ctc aac tac gcc agc gtt ggt gga cgg gtc ttg tat ggc 1632

Pro Ala Tyr Leu Asn Tyr Ala Ser Val Gly Gly Arg Val Leu Tyr Gly

530 535 540

gag gat gtt tac gtt ggc tac aag ttc tac gac aaa acg gag agg gag 1680

Glu Asp Val Tyr Val Gly Tyr Lys Phe Tyr Asp Lys Thr Glu Arg Glu

545 550 555 560

gtt ctg ttt cct ttt ggg cat ggc ctg tct tac gct acc ttc aag ctc 1728

Val Leu Phe Pro Phe Gly His Gly Leu Ser Tyr Ala Thr Phe Lys Leu

565 570 575

cca gat tct acc gtg agg acg gtc ccc gaa acc ttc cac ccg gac cag 1776

Pro Asp Ser Thr Val Arg Thr Val Pro Glu Thr Phe His Pro Asp Gln

580 585 590

ccc aca gta gcc att gtc aag atc aag aac acg agc agt gtc ccg ggc 1824

Pro Thr Val Ala Ile Val Lys Ile Lys Asn Thr Ser Ser Val Pro Gly

595 600 605

gcc cag gtc ctg cag tta tac att tcg gcc cca aac tcg cct aca cat 1872

Ala Gln Val Leu Gln Leu Tyr Ile Ser Ala Pro Asn Ser Pro Thr His

610 615 620

cgc ccg gtc aag gag ctg cac gga ttc gaa aag gtg tat ctt gaa gct 1920

Arg Pro Val Lys Glu Leu His Gly Phe Glu Lys Val Tyr Leu Glu Ala

625 630 635 640

ggc gag gag aag gag gta caa ata ccc att gac cag tac gct act agc 1968

Gly Glu Glu Lys Glu Val Gln Ile Pro Ile Asp Gln Tyr Ala Thr Ser

645 650 655

ttc tgg gac gag att gag agc atg tgg aag agc gag agg ggc att tat 2016

Phe Trp Asp Glu Ile Glu Ser Met Trp Lys Ser Glu Arg Gly Ile Tyr

660 665 670

gat gtg ctt gta gga ttc tcg agt cag gaa atc tcg ggc aag ggg aag 2064

Asp Val Leu Val Gly Phe Ser Ser Gln Glu Ile Ser Gly Lys Gly Lys

675 680 685

ctg att gtg cct gaa acg cga ttc tgg atg ggg ctg tag 2103

Leu Ile Val Pro Glu Thr Arg Phe Trp Met Gly Leu

690 695 700

<210>92

<211>700

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>92

Met Ile Leu Gly Cys Glu Ser Thr Gly Val Ile Ser Ala Val Lys His

1 5 10 15

Phe Val Ala Asn Asp Gln Glu His Glu Arg Arg Ala Val Asp Cys Leu

20 25 30

Ile Thr Gln Arg Ala Leu Arg Glu Val Tyr Leu Arg Pro Phe Gln Ile

35 40 45

Val Ala Arg Asp Ala Arg Pro Gly Ala Leu Met Thr Ser Tyr Asn Lys

50 55 60

Val Asn Gly Lys His Val Ala Asp Ser Ala Glu Phe Leu Gln Gly Ile

65 70 75 80

Leu Arg Thr Glu Trp Asn Trp Asp Pro Leu Ile Val Ser Asp Trp Tyr

85 90 95

Gly Thr Tyr Thr Thr Ile Asp Ala Ile Lys Ala Gly Leu Asp Leu Glu

100 105 110

Met Pro Gly Val Ser Arg Tyr Arg Gly Lys Tyr Ile Glu Ser Ala Leu

115 120 125

Gln Ala Arg Leu Leu Lys Gln Ser Thr Ile Asp Glu Arg Ala Arg Arg

130 135 140

Val Leu Arg Phe Ala Gln Lys Ala Ser His Leu Lys Val Ser Glu Val

145 150 155 160

Glu Gln Gly Arg Asp Phe Pro Glu Asp Arg Val Leu Asn Arg Gln Ile

165 170 175

Cys Gly Ser Ser Ile Val Leu Leu Lys Asn Glu Asn Ser Ile Leu Pro

180 185 190

Leu Pro Lys Ser Val Lys Lys Val Ala Leu Val Gly Ser His Val Arg

195 200 205

Leu Pro Ala Ile Ser Gly Gly Gly Ser Ala Ser Leu Val Pro Tyr Tyr

210 215 220

Ala Ile Ser Leu Tyr Asp Ala Val Ser Glu Val Leu Ala Gly Ala Thr

225 230 235 240

Ile Thr His Glu Val Gly Ala Tyr Ala His Gln Met Leu Pro Val Ile

245 250 255

Asp Ala Met Ile Ser Asn Ala Val Ile His Phe Tyr Asn Asp Pro Ile

260 265 270

Asp Val Lys Asp Arg Lys Leu Leu Gly Ser Glu Asn Val Ser Ser Thr

275 280 285

Ser Phe Gln Leu Met Asp Tyr Asn Asn Ile Pro Thr Leu Asn Lys Ala

290 295 300

Met Phe Trp Gly Thr Leu Val Gly Glu Phe Ile Pro Thr Ala Thr Gly

305 310 315 320

Ile Trp Glu Phe Gly Leu Ser Val Phe Gly Thr Ala Asp Leu Tyr Ile

325 330 335

Asp Asn Glu Leu Val Ile Glu Asn Thr Thr His Gln Thr Arg Gly Thr

340 345 350

Ala Phe Phe Gly Lys Gly Thr Thr Glu Lys Val Ala Thr Arg Arg Met

355 360 365

Val Ala Gly Ser Thr Tyr Lys Leu Arg Leu Glu Phe Gly Ser Ala Asn

370 375 380

Thr Thr Lys Met Glu Thr Thr Gly Val Val Asn Phe Gly Gly Gly Ala

385 390 395 400

Val His Leu Gly Ala Cys Leu Lys Val Asp Pro Gln Glu Met Ile Ala

405 410 415

Arg Ala Val Lys Ala Ala Ala Asp Ala Asp Tyr Thr Ile Ile Cys Thr

420 425 430

Gly Leu Ser Gly Glu Trp Glu Ser Glu Gly Phe Asp Arg Pro His Met

435 440 445

Asp Leu Pro Pro Gly Val Asp Thr Met Ile Ser Gln Val Leu Asp Ala

450 455 460

Ala Pro Asn Ala Val Val Val Asn Gln Ser Gly Thr Pro Val Thr Met

465 470 475 480

Ser Trp Ala His Lys Ala Lys Ala Ile Val Gln Ala Trp Tyr Gly Gly

485 490 495

Asn Glu Thr Gly His Gly Ile Ser Asp Val Leu Phe Gly Asn Val Asn

500 505 510

Pro Ser Gly Lys Leu Ser Leu Ser Trp Pro Val Asp Val Lys His Asn

515 520 525

Pro Ala Tyr Leu Asn Tyr Ala Ser Val Gly Gly Arg Val Leu Tyr Gly

530 535 540

Glu Asp Val Tyr Val Gly Tyr Lys Phe Tyr Asp Lys Thr Glu Arg Glu

545 550 555 560

Val Leu Phe Pro Phe Gly His Gly Leu Ser Tyr Ala Thr Phe Lys Leu

565 570 575

Pro Asp Ser Thr Val Arg Thr Val Pro Glu Thr Phe His Pro Asp Gln

580 585 590

Pro Thr Val Ala Ile Val Lys Ile Lys Asn Thr Ser Ser Val Pro Gly

595 600 605

Ala Gln Val Leu Gln Leu Tyr Ile Ser Ala Pro Asn Ser Pro Thr His

610 615 620

Arg Pro Val Lys Glu Leu His Gly Phe Glu Lys Val Tyr Leu Glu Ala

625 630 635 640

Gly Glu Glu Lys Glu Val Gln Ile Pro Ile Asp Gln Tyr Ala Thr Ser

645 650 655

Phe Trp Asp Glu Ile Glu Ser Met Trp Lys Ser Glu Arg Gly Ile Tyr

660 665 670

Asp Val Leu Val Gly Phe Ser Ser Gln Glu Ile Ser Gly Lys Gly Lys

675 680 685

Leu Ile Val Pro Glu Thr Arg Phe Trp Met Gly Leu

690 695 700

<210>93

<211>1496

<212>DNA

<213>人工序列

<220>

<223>玉米优化的CBHI

<400>93

tgcagtccgc ctgcaccctc cagtccgaga cccacccgcc gctcacctgg cagaagtgct 60

cctccggcgg cacctgcacc cagcagaccg gctccgtggt gatcgacgcc aactggcgct 120

ggacccacgc caccaactcc tccaccaact gctacgacgg caacacctgg tcctccaccc 180

tctgcccgga caacgagacc tgcgccaaga actgctgcct cgacggcgcc gcctacgcct 240

ccacctacgg cgtgaccacc tccggcaact ccctctccat cggcttcgtg acccagtccg 300

cccagaagaa cgtgggcgcc cgcctctacc tcatggcctc cgacaccacc taccaggagt 360

tcaccctcct cggcaacgag ttctccttcg acgtggacgt gtcccagctc ccgtgcggcc 420

tcaacggcgc cctctacttc gtgtccatgg acgccgacgg cggcgtgtcc aagtacccga 480

ccaacaccgc cggcgccaag tacggcaccg gctactgcga ctcccagtgc ccgcgcgacc 540

tcaagttcat caacggccag gccaacgtgg agggctggga gccgtcctcc aacaacgcca 600

acaccggcat cggcggccac ggctcctgct gctccgagat ggacatctgg gaggccaact 660

ccatctccga ggccctcacc ccgcacccgt gcaccaccgt gggccaggag atctgcgagg 720

gcgacggctg cggcggcacc tactccgaca accgctacgg cggcacctgc gacccggacg 780

gctgcgactg gaacccgtac cgcctcggca acacctcctt ctacggcccg ggctcctcct 840

tcaccctcga caccaccaag aagctcaccg tggtgaccca gttcgagacc tccggcgcca 900

tcaaccgcta ctacgtgcag aacggcgtga ccttccagca gccgaacgcc gagctcggct 960

cctactccgg caacgagctc aacgacgact actgcaccgc cgaggaggcc gagttcggcg 1020

gctcctcctt ctccgacaag ggcggcctca cccagttcaa gaaggccacc tccggcggca 1080

tggtgctcgt gatgtccctc tgggacgact actacgccaa catgctctgg ctcgactcca 1140

cctacccgac caacgagacc tcctccaccc cgggcgccgt gcgcggctcc tgctccacct 1200

cctccggcgt gccggcccag gtggagtccc agtccccgaa cgccaaggtg accttctcca 1260

acatcaagtt cggcccgatc ggctccaccg gcaacccgtc cggcggcaac ccgccgggcg 1320

gcaacccgcc gggcaccacc accacccgcc gcccggccac caccaccggc tcctccccgg 1380

gcccgaccca gtcccactac ggccagtgcg gcggcatcgg ctactccggc ccgaccgtgt 1440

gcgcctccgg caccacctgc caggtgctca acccgtacta ctcccagtgc ctctag 1496

<210>94

<211>1365

<212>DNA

<213>人工序列

<220>

<223>玉米优化的CBHII

<400>94

atggtgccgc tcgaggagcg ccaggcctgc tcctccgtgt ggggccagtg cggcggccag 60

aactggtccg gcccgacctg ctgcgcctcc ggctccacct gcgtgtactc caacgactac 120

tactcccagt gcctcccggg cgccgcctcc tcctcctcct ccacccgcgc cgcctccacc 180

acctcccgcg tgtccccgac cacctcccgc tcctcctccg ccaccccgcc gccgggctcc 240

accaccaccc gcgtgccgcc ggtgggctcc ggcaccgcca cctactccgg caacccgttc 300

gtgggcgtga ccccgtgggc caacgcctac tacgcctccg aggtgtcctc cctcgccatc 360

ccgtccctca ccggcgccat ggccaccgcc gccgccgccg tggccaaggt gccgtccttc 420

atgtggctcg acaccctcga caagaccccg ctcatggagc agaccctcgc cgacatccgc 480

accgccaaca agaacggcgg caactacgcc ggccagttcg tggtgtacga cctcccggac 540

cgcgactgcg ccgccctcgc ctccaacggc gagtactcca tcgccgacgg cggcgtggcc 600

aagtacaaga actacatcga caccatccgc cagatcgtgg tggagtactc cgacatccgc 660

accctcctcg tgatcgagcc ggactccctc gccaacctcg tgaccaacct cggcaccccg 720

aagtgcgcca acgcccagtc cgcctacctc gagtgcatca actacgccgt gacccagctc 780

aacctcccga acgtggccat gtacctcgac gccggccacg ccggctggct cggctggccg 840

gccaaccagg acccggccgc ccagctcttc gccaacgtgt acaagaacgc ctcctccccg 900

cgcgccctcc gcggcctcgc caccaacgtg gccaactaca acggctggaa catcacctcc 960

ccgccgtcct acacccaggg caacgccgtg tacaacgaga agctctacat ccacgccatc 1020

ggcccgctcc tcgccaacca cggctggtcc aacgccttct tcatcaccga ccagggccgc 1080

tccggcaagc agccgaccgg ccagcagcag tggggcgact ggtgcaacgt gatcggcacc 1140

ggcttcggca tccgcccgtc cgccaacacc ggcgactccc tcctcgactc cttcgtgtgg 1200

gtgaagccgg gcggcgagtg cgacggcacc tccgactcct ccgccccgcg cttcgactcc 1260

cactgcgccc tcccggacgc cctccagccg gccccgcagg ccggcgcctg gttccaggcc 1320

tacttcgtgc agctcctcac caacgccaac ccgtccttcc tctag 1365

<210>95

<211>1317

<212>DNA

<213>人工序列

<220>

<223>玉米优化的EGLI

<400>95

atgcagcagc cgggcacctc caccccggag gtgcacccga agctcaccac ctacaagtgc 60

accaagtccg gcggctgcgt ggcccaggac acctccgtgg tgctcgactg gaactaccgc 120

tggatgcacg acgccaacta caactcctgc accgtgaacg gcggcgtgaa caccaccctc 180

tgcccggacg aggccacctg cggcaagaac tgcttcatcg agggcgtgga ctacgccgcc 240

tccggcgtga ccacctccgg ctcctccctc accatgaacc agtacatgcc gtcctcctcc 300

ggcggctact cctccgtgtc cccgcgcctc tacctcctcg actccgacgg cgagtacgtg 360

atgctcaagc tcaacggcca ggagctctcc ttcgacgtgg acctctccgc cctcccgtgc 420

ggcgagaacg gctccctcta cctctcccag atggacgaga acggcggcgc caaccagtac 480

aacaccgccg gcgccaacta cggctccggc tactgcgacg cccagtgccc ggtgcagacc 540

tggcgcaacg gcaccctcaa cacctcccac cagggcttct gctgcaacga gatggacatc 600

ctcgagggca actcccgcgc caacgccctc accccgcact cctgcaccgc caccgcctgc 660

gactccgccg gctgcggctt caacccgtac ggctccggct acaagtccta ctacggcccg 720

ggcgacaccg tggacacctc caagaccttc accatcatca cccagttcaa caccgacaac 780

ggctccccgt ccggcaacct cgtgtccatc acccgcaagt accagcagaa cggcgtggac 840

atcccgtccg cccagccggg cggcgacacc atctcctcct gcccgtccgc ctccgcctac 900

ggcggcctcg ccaccatggg caaggccctc tcctccggca tggtgctcgt gttctccatc 960

tggaacgaca actcccagta catgaactgg ctcgactccg gcaacgccgg cccgtgctcc 1020

tccaccgagg gcaacccgtc caacaccctc gccaacaacc cgaacaccca cgtggtgttc 1080

tccaacatcc gctggggcga catcggctcc accaccaact ccaccgcccc gccgccgccg 1140

ccggcctcct ccaccacctt ctccaccacc cgccgctcct ccaccacctc ctcctccccg 1200

tcctgcaccc agacccactg gggccagtgc ggcggcatcg gctactccgg ctgcaagacc 1260

tgcacctccg gcaccacctg ccagtactcc aacgactact actcccagtg cctctag 1317

<210>96

<211>1401

<212>DNA

<213>人工序列

<220>

<223>玉米优化的BGLII

<400>96

atgctcccga aggacttcca gtggggcttc gccaccgccg cctaccagat cgagggcgcc 60

gtggaccagg acggccgcgg cccgtccatc tgggacacct tctgcgccca gccgggcaag 120

atcgccgacg gctcctccgg cgtgaccgcc tgcgactcct acaaccgcac cgccgaggac 180

atcgccctcc tcaagtccct cggcgccaag tcctaccgct tctccatctc ctggtcccgc 240

atcatcccgg agggcggccg cggcgacgcc gtgaaccagg ccggcatcga ccactacgtg 300

aagttcgtgg acgacctcct cgacgccggc atcaccccgt tcatcaccct cttccactgg 360

gacctcccgg agggcctcca ccagcgctac ggcggcctcc tcaaccgcac cgagttcccg 420

ctcgacttcg agaactacgc ccgcgtgatg ttccgcgccc tcccgaaggt gcgcaactgg 480

atcaccttca acgagccgct ctgctccgcc atcccgggct acggctccgg caccttcgcc 540

ccgggccgcc agtccacctc cgagccgtgg accgtgggcc acaacatcct cgtggcccac 600

ggccgcgccg tgaaggccta ccgcgacgac ttcaagccgg cctccggcga cggccagatc 660

ggcatcgtgc tcaacggcga cttcacctac ccgtgggacg ccgccgaccc ggccgacaag 720

gaggccgccg agcgccgcct cgagttcttc accgcctggt tcgccgaccc gatctacctc 780

ggcgactacc cggcctccat gcgcaagcag ctcggcgacc gcctcccgac cttcaccccg 840

gaggagcgcg ccctcgtgca cggctccaac gacttctacg gcatgaacca ctacacctcc 900

aactacatcc gccaccgctc ctccccggcc tccgccgacg acaccgtggg caacgtggac 960

gtgctcttca ccaacaagca gggcaactgc atcggcccgg agacccagtc cccgtggctc 1020

cgcccgtgcg ccgccggctt ccgcgacttc ctcgtgtgga tctccaagcg ctacggctac 1080

ccgccgatct acgtgaccga gaacggcacc tccatcaagg gcgagtccga cctcccgaag 1140

gagaagatcc tcgaggacga cttccgcgtg aagtactaca acgagtacat ccgcgccatg 1200

gtgaccgccg tggagctcga cggcgtgaac gtgaagggct acttcgcctg gtccctcatg 1260

gacaacttcg agtgggccga cggctacgtg acccgcttcg gcgtgaccta cgtggactac 1320

gagaacggcc agaagcgctt cccgaagaag tccgccaagt ccctcaagcc gctcttcgac 1380

gagctcatcg ccgccgccta g 1401

<210>97

<211>2103

<212>DNA

<213>人工序列

<220>

<223>玉米优化的CEL3D

<400>97

atgatcctcg gctgcgagtc caccggcgtg atctccgccg tgaagcactt cgtggccaac 60

gaccaggagc acgagcgccg cgccgtggac tgcctcatca cccagcgcgc cctccgcgag 120

gtgtacctcc gcccgttcca gatcgtggcc cgcgacgccc gcccgggcgc cctcatgacc 180

tcctacaaca aggtgaacgg caagcacgtg gccgactccg ccgagttcct ccagggcatc 240

ctccgcaccg agtggaactg ggacccgctc atcgtgtccg actggtacgg cacctacacc 300

accatcgacg ccatcaaggc cggcctcgac ctcgagatgc cgggcgtgtc ccgctaccgc 360

ggcaagtaca tcgagtccgc cctccaggcc cgcctcctca agcagtccac catcgacgag 420

cgcgcccgcc gcgtgctccg cttcgcccag aaggcctccc acctcaaggt gtccgaggtg 480

gagcagggcc gcgacttccc ggaggaccgc gtgctcaacc gccagatctg cggctcctcc 540

atcgtgctcc tcaagaacga gaactccatc ctcccgctcc cgaagtccgt gaagaaggtg 600

gccctcgtgg gctcccacgt gcgcctcccg gccatctccg gcggcggctc cgcctccctc 660

gtgccgtact acgccatctc cctctacgac gccgtgtccg aggtgctcgc cggcgccacc 720

atcacccacg aggtgggcgc ctacgcccac cagatgctcc cggtgatcga cgccatgatc 780

tccaacgccg tgatccactt ctacaacgac ccgatcgacg tgaaggaccg caagctcctc 840

ggctccgaga acgtgtcctc cacctccttc cagctcatgg actacaacaa catcccgacc 900

ctcaacaagg ccatgttctg gggcaccctc gtgggcgagt tcatcccgac cgccaccggc 960

atctgggagt tcggcctctc cgtgttcggc accgccgacc tctacatcga caacgagctc 1020

gtgatcgaga acaccaccca ccagacccgc ggcaccgcct tcttcggcaa gggcaccacc 1080

gagaaggtgg ccacccgccg catggtggcc ggctccacct acaagctccg cctcgagttc 1140

ggctccgcca acaccaccaa gatggagacc accggcgtgg tgaacttcgg cggcggcgcc 1200

gtgcacctcg gcgcctgcct caaggtggac ccgcaggaga tgatcgcccg cgccgtgaag 1260

gccgccgccg acgccgacta caccatcatc tgcaccggcc tctccggcga gtgggagtcc 1320

gagggcttcg accgcccgca catggacctc ccgccgggcg tggacaccat gatctcccag 1380

gtgctcgacg ccgccccgaa cgccgtggtg gtgaaccagt ccggcacccc ggtgaccatg 1440

tcctgggccc acaaggccaa ggccatcgtg caggcctggt acggcggcaa cgagaccggc 1500

cacggcatct ccgacgtgct cttcggcaac gtgaacccgt ccggcaagct ctccctctcc 1560

tggccggtgg acgtgaagca caacccggcc tacctcaact acgcctccgt gggcggccgc 1620

gtgctctacg gcgaggacgt gtacgtgggc tacaagttct acgacaagac cgagcgcgag 1680

gtgctcttcc cgttcggcca cggcctctcc tacgccacct tcaagctccc ggactccacc 1740

gtgcgcaccg tgccggagac cttccacccg gaccagccga ccgtggccat cgtgaagatc 1800

aagaacacct cctccgtgcc gggcgcccag gtgctccagc tctacatctc cgccccgaac 1860

tccccgaccc accgcccggt gaaggagctc cacggcttcg agaaggtgta cctcgaggcc 1920

ggcgaggaga aggaggtgca gatcccgatc gaccagtacg ccacctcctt ctgggacgag 1980

atcgagtcca tgtggaagtc cgagcgcggc atctacgacg tgctcgtggg cttctcctcc 2040

caggagatct ccggcaaggg caagctcatc gtgccggaga cccgcttctg gatgggcctc 2100

tag 2103

<210>98

<211>420

<212>DNA

<213>玉蜀黍

<220>

<223>Q蛋白启动子

<400>98

gggctggtaa attacttggg agcaatggta tgcaaatcct ttgcatgtac gcaaaactag 60

ctagttgtca caagttgtat atcgattcgt cgcgtttcaa caactcatgc aacattacaa 120

acaagtaaca caatattaca aagttagttt catacaaagc aagaaaagga caataatact 180

tgacatgtaa agtgaagctt attatacttc ctaatccaac acaaaacaaa aaaaagttgc 240

acaaaggtcc aaaaatccac atcaaccatt aacctatacg taaagtgagt gatgagtcac 300

attatccaac aaatgtttat caatgtggta tcatacaagc attgacatcc cataaatgca 360

agaaattgtg ccaacaaagc tataagtaac cctcatatgt atttgcactc atgcatcaca 420

<210>99

<211>1188

<212>DNA

<213>人工序列

<220>

<223>合成的阿魏酸酯酶

<400>99

atggccgcct ccctcccgac catgccgccg tccggctacg accaggtgcg caacggcgtg 60

ccgcgcggcc aggtggtgaa catctcctac ttctccaccg ccaccaactc cacccgcccg 120

gcccgcgtgt acctcccgcc gggctactcc aaggacaaga agtactccgt gctctacctc 180

ctccacggca tcggcggctc cgagaacgac tggttcgagg gcggcggccg cgccaacgtg 240

atcgccgaca acctcatcgc cgagggcaag atcaagccgc tcatcatcgt gaccccgaac 300

accaacgccg ccggcccggg catcgccgac ggctacgaga acttcaccaa ggacctcctc 360

aactccctca tcccgtacat cgagtccaac tactccgtgt acaccgaccg cgagcaccgc 420

gccatcgccg gcctctctat gggcggcggc cagtccttca acatcggcct caccaacctc 480

gacaagttcg cctacatcgg cccgatctcc gccgccccga acacctaccc gaacgagcgc 540

ctcttcccgg acggcggcaa ggccgcccgc gagaagctca agctcctctt catcgcctgc 600

ggcaccaacg actccctcat cggcttcggc cagcgcgtgc acgagtactg cgtggccaac 660

aacatcaacc acgtgtactg gctcatccag ggcggcggcc acgacttcaa cgtgtggaag 720

ccgggcctct ggaacttcct ccagatggcc gacgaggccg gcctcacccg cgacggcaac 780

accccggtgc cgaccccgtc cccgaagccg gccaacaccc gcatcgaggc cgaggactac 840

gacggcatca actcctcctc catcgagatc atcggcgtgc cgccggaggg cggccgcggc 900

atcggctaca tcacctccgg cgactacctc gtgtacaagt ccatcgactt cggcaacggc 960

gccacctcct tcaaggccaa ggtggccaac gccaacacct ccaacatcga gcttcgcctc 1020

aacggcccga acggcaccct catcggcacc ctctccgtga agtccaccgg cgactggaac 1080

acctacgagg agcagacctg ctccatctcc aaggtgaccg gcatcaacga cctctacctc 1140

gtgttcaagg gcccggtgaa catcgactgg ttcaccttcg gcgtgtag 1188

<210>100

<211>395

<212>PRT

<213>人工序列

<220>

<223>合成的阿魏酸酯酶

<400>100

Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr Asp Gln Val

1 5 10 15

Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser Tyr Phe Ser

20 25 30

Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu Pro Pro Gly

35 40 45

Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu His Gly Ile

50 55 60

Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg Ala Asn Val

65 70 75 80

Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro Leu Ile Ile

85 90 95

Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala Asp Gly Tyr

100 105 110

Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro Tyr Ile Glu

115 120 125

Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala Ile Ala Gly

130 135 140

Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu Thr Asn Leu

145 150 155 160

Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro Asn Thr Tyr

165 170 175

Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala Arg Glu Lys

180 185 190

Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser Leu Ile Gly

195 200 205

Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn Ile Asn His

210 215 220

Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn Val Trp Lys

225 230 235 240

Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala Gly Leu Thr

245 250 255

Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys Pro Ala Asn

260 265 270

Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser Ser Ser Ile

275 280 285

Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile Gly Tyr Ile

290 295 300

Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe Gly Asn Gly

305 310 315 320

Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr Ser Asn Ile

325 330 335

Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly Thr Leu Ser

340 345 350

Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln Thr Cys Ser

355 360 365

Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val Phe Lys Gly

370 375 380

Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val

385 390 395

<210>101

<211>1188

<212>DNA

<213>人工序列

<220>

<223>质粒13036

<400>101

atggccgcct ccctcccgac catgccgccg tccggctacg accaggtgcg caacggcgtg 60

ccgcgcggcc aggtggtgaa catctcctac ttctccaccg ccaccaactc cacccgcccg 120

gcccgcgtgt acctcccgcc gggctactcc aaggacaaga agtactccgt gctctacctc 180

ctccacggca tcggcggctc cgagaacgac tggttcgagg gcggcggccg cgccaacgtg 240

atcgccgaca acctcatcgc cgagggcaag atcaagccgc tcatcatcgt gaccccgaac 300

accaacgccg ccggcccggg catcgccgac ggctacgaga acttcaccaa ggacctcctc 360

aactccctca tcccgtacat cgagtccaac tactccgtgt acaccgaccg cgagcaccgc 420

gccatcgccg gcctctctat gggcggcggc cagtccttca acatcggcct caccaacctc 480

gacaagttcg cctacatcgg cccgatctcc gccgccccga acacctaccc gaacgagcgc 540

ctcttcccgg acggcggcaa ggccgcccgc gagaagctca agctcctctt catcgcctgc 600

ggcaccaacg actccctcat cggcttcggc cagcgcgtgc acgagtactg cgtggccaac 660

aacatcaacc acgtgtactg gctcatccag ggcggcggcc acgacttcaa cgtgtggaag 720

ccgggcctct ggaacttcct ccagatggcc gacgaggccg gcctcacccg cgacggcaac 780

accccggtgc cgaccccgtc cccgaagccg gccaacaccc gcatcgaggc cgaggactac 840

gacggcatca actcctcctc catcgagatc atcggcgtgc cgccggaggg cggccgcggc 900

atcggctaca tcacctccgg cgactacctc gtgtacaagt ccatcgactt cggcaacggc 960

gccacctcct tcaaggccaa ggtggccaac gccaacacct ccaacatcga gcttcgcctc 1020

aacggcccga acggcaccct catcggcacc ctctccgtga agtccaccgg cgactggaac 1080

acctacgagg agcagacctg ctccatctcc aaggtgaccg gcatcaacga cctctacctc 1140

gtgttcaagg gcccggtgaa catcgactgg ttcaccttcg gcgtgtag 1188

<210>102

<211>395

<212>PRT

<213>人工序列

<220>

<223>质粒13036

<400>102

Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr Asp Gln Val

1 5 10 15

Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser Tyr Phe Ser

20 25 30

Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu Pro Pro Gly

35 40 45

Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu His Gly Ile

50 55 60

Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg Ala Asn Val

65 70 75 80

Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro Leu Ile Ile

85 90 95

Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala Asp Gly Tyr

100 105 110

Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro Tyr Ile Glu

115 120 125

Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala Ile Ala Gly

130 135 140

Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu Thr Asn Leu

145 150 155 160

Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro Asn Thr Tyr

165 170 175

Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala Arg Glu Lys

180 185 190

Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser Leu Ile Gly

195 200 205

Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn Ile Asn His

210 215 220

Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn Val Trp Lys

225 230 235 240

Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala Gly Leu Thr

245 250 255

Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys Pro Ala Asn

260 265 270

Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser Ser Ser Ile

275 280 285

Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile Gly Tyr Ile

290 295 300

Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe Gly Asn Gly

305 310 315 320

Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr Ser Asn Ile

325 330 335

Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly Thr Leu Ser

340 345 350

Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln Thr Cys Ser

355 360 365

Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val Phe Lys Gly

370 375 380

Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val

385 390 395

<210>103

<211>1245

<212>DNA

<213>人工序列

<220>

<223>质粒13038

<400>103

atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccatg 60

gccgcctccc tcccgaccat gccgccgtcc ggctacgacc aggtgcgcaa cggcgtgccg 120

cgcggccagg tggtgaacat ctcctacttc tccaccgcca ccaactccac ccgcccggcc 180

cgcgtgtacc tcccgccggg ctactccaag gacaagaagt actccgtgct ctacctcctc 240

cacggcatcg gcggctccga gaacgactgg ttcgagggcg gcggccgcgc caacgtgatc 300

gccgacaacc tcatcgccga gggcaagatc aagccgctca tcatcgtgac cccgaacacc 360

aacgccgccg gcccgggcat cgccgacggc tacgagaact tcaccaagga cctcctcaac 420

tccctcatcc cgtacatcga gtccaactac tccgtgtaca ccgaccgcga gcaccgcgcc 480

atcgccggcc tctctatggg cggcggccag tccttcaaca tcggcctcac caacctcgac 540

aagttcgcct acatcggccc gatctccgcc gccccgaaca cctacccgaa cgagcgcctc 600

ttcccggacg gcggcaaggc cgcccgcgag aagctcaagc tcctcttcat cgcctgcggc 660

accaacgact ccctcatcgg cttcggccag cgcgtgcacg agtacggcgt ggccaacaac 720

atcaaccacg tgtactggct catccagggc ggcggccacg acttcaacgt gtggaagccg 780

ggcctctgga acttcctcca gatggccgac gaggccggcc tcacccgcga cggcaacacc 840

ccggtgccga ccccgtcccc gaagccggcc aacacccgca tcgaggccga ggactacgac 900

ggcatcaact cctcctccat cgagatcatc ggcgtgccgc cggagggcgg ccgcggcatc 960

ggctacatca cctccggcga ctacctcgtg tacaagtcca tcgacttcgg caacggcgcc 1020

acctccttca aggccaaggt ggccaacgcc aacacctcca acatcgagct tcgcctcaac 1080

ggcccgaacg gcaccctcat cggcaccctc tccgtgaagt ccaccggcga ctggaacacc 1140

tacgaggagc agacctgctc catctccaag gtgaccggca tcaacgacct ctacctcgtg 1200

ttcaagggcc cggtgaacat cgactggttc accttcggcg tgtag 1245

<210>104

<211>414

<212>PRT

<213>人工序列

<220>

<223>质粒13038 aa

<400>104

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr

20 25 30

Asp Gln Val Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser

35 40 45

Tyr Phe Ser Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu

50 55 60

Pro Pro Gly Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu

65 70 75 80

His Gly Ile Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg

85 90 95

Ala Asn Val Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro

100 105 110

Leu Ile Ile Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala

115 120 125

Asp Gly Tyr Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro

130 135 140

Tyr Ile Glu Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala

145 150 155 160

Ile Ala Gly Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu

165 170 175

Thr Asn Leu Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro

180 185 190

Asn Thr Tyr Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala

195 200 205

Arg Glu Lys Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser

210 215 220

Leu Ile Gly Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn

225 230 235 240

Ile Asn His Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn

245 250 255

Val Trp Lys Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala

260 265 270

Gly Leu Thr Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys

275 280 285

Pro Ala Asn Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser

290 295 300

Ser Ser Ile Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile

305 310 315 320

Gly Tyr Ile Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe

325 330 335

Gly Asn Gly Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr

340 345 350

Ser Asn Ile Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly

355 360 365

Thr Leu Ser Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln

370 375 380

Thr Cys Ser Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val

385 390 395 400

Phe Lys Gly Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val

405 410

<210>105

<211>1425

<212>DNA

<213>人工序列

<220>

<223>质粒13039

<400>105

atgctggcgg ctctggccac gtcgcagctc gtcgcaacgc gcgccggcct gggcgtcccg 60

gacgcgtcca cgttccgccg cggcgccgcg cagggcctga ggggggcccg ggcgtcggcg 120

gcggcggaca cgctcagcat gcggaccagc gcgcgcgcgg cgcccaggca ccagcaccag 180

caggcgcgcc gcggggccag gttcccgtcg ctcgtcgtgt gcgccagcgc cggcgccatg 240

gccgcctccc tcccgaccat gccgccgtcc ggctacgacc aggtgcgcaa cggcgtgccg 300

cgcggccagg tggtgaacat ctcctacttc tccaccgcca ccaactccac ccgcccggcc 360

cgcgtgtacc tcccgccggg ctactccaag gacaagaagt actccgtgct ctacctcctc 420

cacggcatcg gcggctccga gaacgactgg ttcgagggcg gcggccgcgc caacgtgatc 480

gccgacaacc tcatcgccga gggcaagatc aagccgctca tcatcgtgac cccgaacacc 540

aacgccgccg gcccgggcat cgccgacggc tacgagaact tcaccaagga cctcctcaac 600

tccctcatcc cgtacatcga gtccaactac tccgtgtaca ccgaccgcga gcaccgcgcc 660

atcgccggcc tctctatggg cggcggccag tccttcaaca tcggcctcac caacctcgac 720

aagttcgcct acatcggccc gatctccgcc gccccgaaca cctacccgaa cgagcgcctc 780

ttcccggacg gcggcaaggc cgcccgcgag aagctcaagc tcctcttcat cgcctgcggc 840

accaacgact ccctcatcgg cttcggccag cgcgtgcacg agtactgcgt ggccaacaac 900

atcaaccacg tgtactggct catccagggc ggcggccacg acttcaacgt gtggaagccg 960

ggcctctgga acttcctcca gatggccgac gaggccggcc tcacccgcga cggcaacacc 1020

ccggtgccga ccccgtcccc gaagccggcc aacacccgca tcgaggccga ggactacgac 1080

ggcatcaact cctcctccat cgagatcatc ggcgtgccgc cggagggcgg ccgcggcatc 1140

ggctacatca cctccggcga ctacctcgtg tacaagtcca tcgacttcgg caacggcgcc 1200

acctccttca aggccaaggt ggccaacgcc aacacctcca acatcgagct tcgcctcaac 1260

ggcccgaacg gcaccctcat cggcaccctc tccgtgaagt ccaccggcga ctggaacacc 1320

tacgaggagc agacctgctc catctccaag gtgaccggca tcaacgacct ctacctcgtg 1380

ttcaagggcc cggtgaacat cgactggttc accttcggcg tgtag 1425

<210>106

<211>474

<212>PRT

<213>人工序列

<220>

<223>质粒13039 aa

<400>106

Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly

1 5 10 15

Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly

20 25 30

Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg

35 40 45

Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg

50 55 60

Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met

65 70 75 80

Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr Asp Gln Val Arg

85 90 95

Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser Tyr Phe Ser Thr

100 105 110

Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu Pro Pro Gly Tyr

115 120 125

Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu His Gly Ile Gly

130 135 140

Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg Ala Asn Val Ile

145 150 155 160

Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro Leu Ile Ile Val

165 170 175

Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala Asp Gly Tyr Glu

180 185 190

Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro Tyr Ile Glu Ser

195 200 205

Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala Ile Ala Gly Leu

210 215 220

Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu Thr Asn Leu Asp

225 230 235 240

Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro Asn Thr Tyr Pro

245 250 255

Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala Arg Glu Lys Leu

260 265 270

Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser Leu Ile Gly Phe

275 280 285

Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn Ile Asn His Val

290 295 300

Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn Val Trp Lys Pro

305 310 315 320

Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala Gly Leu Thr Arg

325 330 335

Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys Pro Ala Asn Thr

340 345 350

Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser Ser Ser Ile Glu

355 360 365

Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile Gly Tyr Ile Thr

370 375 380

Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe Gly Asn Gly Ala

385 390 395 400

Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr Ser Asn Ile Glu

405 410 415

Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly Thr Leu Ser Val

420 425 430

Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln Thr Cys Ser Ile

435 440 445

Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val Phe Lys Gly Pro

450 455 460

Val Asn Ile Asp Trp Phe Thr Phe Gly Val

465 470

<210>107

<211>1263

<212>DNA

<213>人工序列

<220>

<223>质粒13347

<400>107

atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccatg 60

gccgcctccc tcccgaccat gccgccgtcc ggctacgacc aggtgcgcaa cggcgtgccg 120

cgcggccagg tggtgaacat ctcctacttc tccaccgcca ccaactccac ccgcccggcc 180

cgcgtgtacc tcccgccggg ctactccaag gacaagaagt actccgtgct ctacctcctc 240

cacggcatcg gcggctccga gaacgactgg ttcgagggcg gcggccgcgc caacgtgatc 300

gccgacaacc tcatcgccga gggcaagatc aagccgctca tcatcgtgac cccgaacacc 360

aacgccgccg gcccgggcat cgccgacggc tacgagaact tcaccaagga cctcctcaac 420

tccctcatcc cgtacatcga gtccaactac tccgtgtaca ccgaccgcga gcaccgcgcc 480

atcgccggcc tctctatggg cggcggccag tccttcaaca tcggcctcac caacctcgac 540

aagttcgcct acatcggccc gatctccgcc gccccgaaca cctacccgaa cgagcgcctc 600

ttcccggacg gcggcaaggc cgcccgcgag aagctcaagc tcctcttcat cgcctgcggc 660

accaacgact ccctcatcgg cttcggccag cgcgtgcacg agtactgcgt ggccaacaac 720

atcaaccacg tgtactggct catccagggc ggcggccacg acttcaacgt gtggaagccg 780

ggcctctgga acttcctcca gatggccgac gaggccggcc tcacccgcga cggcaacacc 840

ccggtgccga ccccgtcccc gaagccggcc aacacccgca tcgaggccga ggactacgac 900

ggcatcaact cctcctccat cgagatcatc ggcgtgccgc cggagggcgg ccgcggcatc 960

ggctacatca cctccggcga ctacctcgtg tacaagtcca tcgacttcgg caacggcgcc 1020

acctccttca aggccaaggt ggccaacgcc aacacctcca acatcgagct tcgcctcaac 1080

ggcccgaacg gcaccctcat cggcaccctc tccgtgaagt ccaccggcga ctggaacacc 1140

tacgaggagc agacctgctc catctccaag gtgaccggca tcaacgacct ctacctcgtg 1200

ttcaagggcc cggtgaacat cgactggttc accttcggcg tgtccgagaa ggacgaactc 1260

tag 1263

<210>108

<211>420

<212>PRT

<213>人工序列

<220>

<223>质粒13347

<400>108

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr

20 25 30

Asp Gln Val Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser

35 40 45

Tyr Phe Ser Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu

50 55 60

Pro Pro Gly Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu

65 70 75 80

His Gly Ile Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg

85 90 95

Ala Asn Val Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro

100 105 110

Leu Ile Ile Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala

115 120 125

Asp Gly Tyr Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro

130 135 140

Tyr Ile Glu Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala

145 150 155 160

Ile Ala Gly Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu

165 170 175

Thr Asn Leu Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro

180 185 190

Asn Thr Tyr Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala

195 200 205

Arg Glu Lys Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser

210 215 220

Leu Ile Gly Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn

225 230 235 240

Ile Asn His Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn

245 250 255

Val Trp Lys Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala

260 265 270

Gly Leu Thr Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys

275 280 285

Pro Ala Asn Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser

290 295 300

Ser Ser Ile Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile

305 310 315 320

Gly Tyr Ile Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe

325 330 335

Gly Asn Gly Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr

340 345 350

Ser Asn Ile Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly

355 360 365

Thr Leu Ser Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln

370 375 380

Thr Cys Ser Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val

385 390 395 400

Phe Lys Gly Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val Ser Glu

405 410 415

Lys Asp Glu Leu

420

<210>109

<211>1296

<212>DNA

<213>人工序列

<220>

<223>质粒11267

<400>109

atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc caccagcgct 60

gcgcagtccg agccggagct gaagctggag tccgtggtga tcgtgtcccg ccacggcgtg 120

cgcgccccga ccaaggccac ccagctcatg caggacgtga ccccggacgc ctggccgacc 180

tggccggtga agctcggcga gctgaccccg cgcggcggcg agctgatcgc ctacctcggc 240

cactactggc gccagcgcct cgtggccgac ggcctcctcc cgaagtgcgg ctgcccgcag 300

tccggccagg tggccatcat cgccgacgtg gacgagcgca cccgcaagac cggcgaggcc 360

ttcgccgccg gcctcgcccc ggactgcgcc atcaccgtgc acacccaggc cgacacctcc 420

tccccggacc cgctcttcaa cccgctcaag accggcgtgt gccagctcga caacgccaac 480

gtgaccgacg ccatcctgga gcgcgccggc ggctccatcg ccgacttcac cggccactac 540

cagaccgcct tccgcgagct ggagcgcgtg ctcaacttcc cgcagtccaa cctctgcctc 600

aagcgcgaga agcaggacga gtcctgctcc ctcacccagg ccctcccgtc cgagctgaag 660

gtgtccgccg actgcgtgtc cctcaccggc gccgtgtccc tcgcctccat gctcaccgaa 720

atcttcctcc tccagcaggc ccagggcatg ccggagccgg gctggggccg catcaccgac 780

tcccaccagt ggaacaccct cctctccctc cacaacgccc agttcgacct cctccagcgc 840

accccggagg tggcccgctc ccgcgccacc ccgctcctcg acctcatcaa gaccgccctc 900

accccgcacc cgccgcagaa gcaggcctac ggcgtgaccc tcccgacctc cgtgctcttc 960

atcgccggcc acgacaccaa cctcgccaac ctcggcggcg ccctggagct gaactggacc 1020

ctcccgggcc agccggacaa caccccgccg ggcggcgagc tggtgttcga gcgctggcgc 1080

cgcctctccg acaactccca gtggattcag gtgtccctcg tgttccagac cctccagcag 1140

atgcgcgaca agaccccgct ctccctcaac accccgccgg gcgaggtgaa gctcaccctc 1200

gccggctgcg aggagcgcaa cgcccagggc atgtgctccc tcgccggctt cacccagatc 1260

gtgaacgagg cccgcatccc ggcctgctcc ctctaa 1296

<210>110

<211>431

<212>PRT

<213>人工序列

<220>

<223>质粒11267 aa序列

<400>110

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Ala Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val

20 25 30

Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln

35 40 45

Leu Met Gln Asp Val Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys

50 55 60

Leu Gly Glu Leu Thr Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly

65 70 75 80

His Tyr Trp Arg Gln Arg Leu Val Ala Asp Gly Leu Leu Pro Lys Cys

85 90 95

Gly Cys Pro Gln Ser Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu

100 105 110

Arg Thr Arg Lys Thr Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp

115 120 125

Cys Ala Ile Thr Val His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro

130 135 140

Leu Phe Asn Pro Leu Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn

145 150 155 160

Val Thr Asp Ala Ile Leu Glu Arg Ala Gly Gly Ser Ile Ala Asp Phe

165 170 175

Thr Gly His Tyr Gln Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn

180 185 190

Phe Pro Gln Ser Asn Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser

195 200 205

Cys Ser Leu Thr Gln Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp

210 215 220

Cys Val Ser Leu Thr Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu

225 230 235 240

Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly

245 250 255

Arg Ile Thr Asp Ser His Gln Trp Asn Thr Leu Leu Ser Leu His Asn

260 265 270

Ala Gln Phe Asp Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg

275 280 285

Ala Thr Pro Leu Leu Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro

290 295 300

Pro Gln Lys Gln Ala Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe

305 310 315 320

Ile Ala Gly His Asp Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu

325 330 335

Leu Asn Trp Thr Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly

340 345 350

Glu Leu Val Phe Glu Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp

355 360 365

Ile Gln Val Ser Leu Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys

370 375 380

Thr Pro Leu Ser Leu Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu

385 390 395 400

Ala Gly Cys Glu Glu Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly

405 410 415

Phe Thr Gln Ile Val Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu

420 425 430

<210>111

<211>1314

<212>DNA

<213>人工序列

<220>

<223>质粒11268

<400>111

atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc caccagcgct 60

gcgcagtccg agccggagct gaagctggag tccgtggtga tcgtgtcccg ccacggcgtg 120

cgcgccccga ccaaggccac ccagctcatg caggacgtga ccccggacgc ctggccgacc 180

tggccggtga agctcggcga gctgaccccg cgcggcggcg agctgatcgc ctacctcggc 240

cactactggc gccagcgcct cgtggccgac ggcctcctcc cgaagtgcgg ctgcccgcag 300

tccggccagg tggccatcat cgccgacgtg gacgagcgca cccgcaagac cggcgaggcc 360

ttcgccgccg gcctcgcccc ggactgcgcc atcaccgtgc acacccaggc cgacacctcc 420

tccccggacc cgctcttcaa cccgctcaag accggcgtgt gccagctcga caacgccaac 480

gtgaccgacg ccatcctgga gcgcgccggc ggctccatcg ccgacttcac cggccactac 540

cagaccgcct tccgcgagct ggagcgcgtg ctcaacttcc cgcagtccaa cctctgcctc 600

aagcgcgaga agcaggacga gtcctgctcc ctcacccagg ccctcccgtc cgagctgaag 660

gtgtccgccg actgcgtgtc cctcaccggc gccgtgtccc tcgcctccat gctcaccgaa 720

atcttcctcc tccagcaggc ccagggcatg ccggagccgg gctggggccg catcaccgac 780

tcccaccagt ggaacaccct cctctccctc cacaacgccc agttcgacct cctccagcgc 840

accccggagg tggcccgctc ccgcgccacc ccgctcctcg acctcatcaa gaccgccctc 900

accccgcacc cgccgcagaa gcaggcctac ggcgtgaccc tcccgacctc cgtgctcttc 960

atcgccggcc acgacaccaa cctcgccaac ctcggcggcg ccctggagct gaactggacc 1020

ctcccgggcc agccggacaa caccccgccg ggcggcgagc tggtgttcga gcgctggcgc 1080

cgcctctccg acaactccca gtggattcag gtgtccctcg tgttccagac cctccagcag 1140

atgcgcgaca agaccccgct ctccctcaac accccgccgg gcgaggtgaa gctcaccctc 1200

gccggctgcg aggagcgcaa cgcccagggc atgtgctccc tcgccggctt cacccagatc 1260

gtgaacgagg cccgcatccc ggcctgctcc ctctccgaga aggacgagct gtaa 1314

<210>112

<211>437

<212>PRT

<213>人工序列

<220>

<223>质粒11268氨基酸序列

<400>112

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Ala Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val

20 25 30

Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln

35 40 45

Leu Met Gln Asp Val Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys

50 55 60

Leu Gly Glu Leu Thr Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly

65 70 75 80

His Tyr Trp Arg Gln Arg Leu Val Ala Asp Gly Leu Leu Pro Lys Cys

85 90 95

Gly Cys Pro Gln Ser Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu

100 105 110

Arg Thr Arg Lys Thr Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp

115 120 125

Cys Ala Ile Thr Val His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro

130 135 140

Leu Phe Asn Pro Leu Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn

145 150 155 160

Val Thr Asp Ala Ile Leu Glu Arg Ala Gly Gly Ser Ile Ala Asp Phe

165 170 175

Thr Gly His Tyr Gln Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn

180 185 190

Phe Pro Gln Ser Asn Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser

195 200 205

Cys Ser Leu Thr Gln Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp

210 215 220

Cys Val Ser Leu Thr Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu

225 230 235 240

Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly

245 250 255

Arg Ile Thr Asp Ser His Gln Trp Asn Thr Leu Leu Ser Leu His Asn

260 265 270

Ala Gln Phe Asp Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg

275 280 285

Ala Thr Pro Leu Leu Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro

290 295 300

Pro Gln Lys Gln Ala Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe

305 310 315 320

Ile Ala Gly His Asp Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu

325 330 335

Leu Asn Trp Thr Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly

340 345 350

Glu Leu Val Phe Glu Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp

355 360 365

Ile Gln Val Ser Leu Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys

370 375 380

Thr Pro Leu Ser Leu Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu

385 390 395 400

Ala Gly Cys Glu Glu Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly

405 410 415

Phe Thr Gln Ile Val Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu Ser

420 425 430

Glu Lys Asp Glu Leu

435

序列表

<110>Lanahan，Mike

<120>自加工植物和植物部分

<130>109846.317

<140>US 60/315,281

<141>2001-08-27

<160>112

<170>FastSEQ for Windows Version 4.0

<210>1

<211>436

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>1

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala

1 5 10 15

Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg

20 25 30

Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile

35 40 45

Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp

50 55 60

Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val

65 70 75 80

Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr

85 90 95

Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His

100 105 110

Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr

115 120 125

Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr

130 135 140

Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe

145 150 155 160

Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp

165 170 175

Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly

180 185 190

Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val

195 200 205

Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr

210 215 220

Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly

225 230 235 240

Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe

245 250 255

Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly

260 265 270

Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn

275 280 285

His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile

290 295 300

Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu

305 310 315 320

Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn

325 330 335

Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met

340 345 350

Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr

355 360 365

Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys

370 375 380

Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp

385 390 395 400

Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro

405 410 415

Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr

420 425 430

Cys Gly Val Gly

435

<210>2

<211>1308

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>2

atggccaagt acctggagct ggaggagggc ggcgtgatca tgcaggcgtt ctactgggac 60

gtcccgagcg gaggcatctg gtgggacacc atccgccaga agatccccga gtggtacgac 120

gccggcatct ccgcgatctg gataccgcca gcttccaagg gcatgtccgg gggctactcg 180

atgggctacg acccgtacga ctacttcgac ctcggcgagt actaccagaa gggcacggtg 240

gagacgcgct tcgggtccaa gcaggagctc atcaacatga tcaacacggc gcacgcctac 300

ggcatcaagg tcatcgcgga catcgtgatc aaccacaggg ccggcggcga cctggagtgg 360

aacccgttcg tcggcgacta cacctggacg gacttctcca aggtcgcctc cggcaagtac 420

accgccaact acctcgactt ccaccccaac gagctgcacg cgggcgactc cggcacgttc 480

ggcggctacc cggacatctg ccacgacaag tcctgggacc agtactggct ctgggcctcg 540

caggagtcct acgcggccta cctgcgctcc atcggcatcg acgcgtggcg cttcgactac 600

gtcaagggct acggggcctg ggtggtcaag gactggctca actggtgggg cggctgggcg 660

gtgggcgagt actgggacac caacgtcgac gcgctgctca actgggccta ctcctccggc 720

gccaaggtgt tcgacttccc cctgtactac aagatggacg cggccttcga caacaagaac 780

atcccggcgc tcgtcgaggc cctgaagaac ggcggcacgg tggtctcccg cgacccgttc 840

aaggccgtga ccttcgtcgc caaccacgac acggacatca tctggaacaa gtacccggcg 900

tacgccttca tcctcaccta cgagggccag cccacgatct tctaccgcga ctacgaggag 960

tggctgaaca aggacaagct caagaacctg atctggattc acgacaacct cgcgggcggc 1020

tccactagta tcgtgtacta cgactccgac gagatgatct tcgtccgcaa cggctacggc 1080

tccaagcccg gcctgatcac gtacatcaac ctgggctcct ccaaggtggg ccgctgggtg 1140

tacgtcccga agttcgccgg cgcgtgcatc cacgagtaca ccggcaacct cggcggctgg 1200

gtggacaagt acgtgtactc ctccggctgg gtctacctgg aggccccggc ctacgacccc 1260

gccaacggcc agtacggcta ctccgtgtgg tcctactgcg gcgtcggc 1308

<210>3

<211>800

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>3

Met Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe Thr Gly Glu

1 5 10 15

Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met Asp Leu Thr

20 25 30

Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala Lys Asp Val

35 40 45

Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala Glu Val Trp

50 55 60

Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro Asp Thr Ser

65 70 75 80

Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val Ile Glu Ala

85 90 95

Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu Phe Lys Val

100 105 110

Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu Lys Ala Asp

115 120 125

Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val Leu Ser Glu

130 135 140

Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu Ile Ile Glu

145 150 155 160

Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu Asp Asp Tyr

165 170 175

Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu Lys Thr Ile

180 185 190

Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val Leu Leu Phe

195 200 205

Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn Met Glu Tyr

210 215 220

Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp Leu Asp Gly

225 230 235 240

Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile Arg Thr Thr

245 250 255

Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln Glu Ser Ala

260 265 270

Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu Asn Asp Arg

275 280 285

Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr Glu Ile His

290 295 300

Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys Asn Lys Gly

305 310 315 320

Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Gly Pro Gly Gly Val

325 330 335

Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr His Val His

340 345 350

Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu Asp Lys Asp

355 360 365

Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu Phe Met Val

370 375 380

Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His Thr Arg Ile

385 390 395 400

Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His Gly Ile Gly

405 410 415

Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile Gly Glu Leu

420 425 430

Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg Ile Asp Lys

435 440 445

Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val Ile Ala Ser

450 455 460

Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val Thr Tyr Trp

465 470 475 480

Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln Met Gly Leu

485 490 495

Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu His Lys Ile

500 505 510

Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly Trp Gly Ala

515 520 525

Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His Val Ala Ala

530 535 540

Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val Phe Asn Pro

545 550 555 560

Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu Thr Lys Ile

565 570 575

Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys Leu Ile Lys

580 585 590

Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala Ala Cys His

595 600 605

Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala Lys Ala Asp

610 615 620

Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala Gln Lys Leu

625 630 635 640

Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe Leu His Gly

645 650 655

Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn Ser Tyr Asn

660 665 670

Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys Leu Gln Phe

675 680 685

Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu Arg Lys Glu

690 695 700

His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys Lys His Leu

705 710 715 720

Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met Leu Lys Asp

725 730 735

His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile Tyr Asn Gly

740 745 750

Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys Trp Asn Val

755 760 765

Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu Thr Val Glu

770 775 780

Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu Tyr Arg Glu

785 790 795 800

<210>4

<211>2400

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>4

atgggccact ggtacaagca ccagcgcgcc taccagttca ccggcgagga cgacttcggg 60

aaggtggccg tggtgaagct cccgatggac ctcaccaagg tgggcatcat cgtgcgcctc 120

aacgagtggc aggcgaagga cgtggccaag gaccgcttca tcgagatcaa ggacggcaag 180

gccgaggtgt ggatactcca gggcgtggag gagatcttct acgagaagcc ggacacctcc 240

ccgcgcatct tcttcgccca ggcccgctcc aacaaggtga tcgaggcctt cctcaccaac 300

ccggtggaca ccaagaagaa ggagctgttc aaggtgaccg tcgacggcaa ggagatcccg 360

gtgtcccgcg tggagaaggc cgacccgacc gacatcgacg tgaccaacta cgtgcgcatc 420

gtgctctccg agtccctcaa ggaggaggac ctccgcaagg acgtggagct gatcatcgag 480

ggctacaagc cggcccgcgt gatcatgatg gagatcctcg acgactacta ctacgacggc 540

gagctggggg cggtgtactc cccggagaag accatcttcc gcgtgtggtc cccggtgtcc 600

aagtgggtga aggtgctcct cttcaagaac ggcgaggaca ccgagccgta ccaggtggtg 660

aacatggagt acaagggcaa cggcgtgtgg gaggccgtgg tggagggcga cctcgacggc 720

gtgttctacc tctaccagct ggagaactac ggcaagatcc gcaccaccgt ggacccgtac 780

tccaaggccg tgtacgccaa caaccaggag tctgcagtgg tgaacctcgc ccgcaccaac 840

ccggagggct gggagaacga ccgcggcccg aagatcgagg gctacgagga cgccatcatc 900

tacgagatcc acatcgccga catcaccggc ctggagaact ccggcgtgaa gaacaagggc 960

ctctacctcg gcctcaccga ggagaacacc aaggccccgg gcggcgtgac caccggcctc 1020

tcccacctcg tggagctggg cgtgacccac gtgcacatcc tcccgttctt cgacttctac 1080

accggcgacg agctggacaa ggacttcgag aagtactaca actggggcta cgacccgtac 1140

ctcttcatgg tgccggaggg ccgctactcc accgacccga agaacccgca cacccgaatt 1200

cgcgaggtga aggagatggt gaaggccctc cacaagcacg gcatcggcgt gatcatggac 1260

atggtgttcc cgcacaccta cggcatcggc gagctgtccg ccttcgacca gaccgtgccg 1320

tactacttct accgcatcga caagaccggc gcctacctca acgagtccgg ctgcggcaac 1380

gtgatcgcct ccgagcgccc gatgatgcgc aagttcatcg tggacaccgt gacctactgg 1440

gtgaaggagt accacatcga cggcttccgc ttcgaccaga tgggcctcat cgacaagaag 1500

accatgctgg aggtggagcg cgccctccac aagatcgacc cgaccatcat cctctacggc 1560

gagccgtggg gcggctgggg ggccccgatc cgcttcggca agtccgacgt ggccggcacc 1620

cacgtggccg ccttcaacga cgagttccgc gacgccatcc gcggctccgt gttcaacccg 1680

tccgtgaagg gcttcgtgat gggcggctac ggcaaggaga ccaagatcaa gcgcggcgtg 1740

gtgggctcca tcaactacga cggcaagctc atcaagtcct tcgccctcga cccggaggag 1800

accatcaact acgccgcctg ccacgacaac cacaccctct gggacaagaa ctacctcgcc 1860

gccaaggccg acaagaagaa ggagtggacc gaggaggagc tgaagaacgc ccagaagctc 1920

gccggcgcca tcctcctcac tagtcagggc gtgccgttcc tccacggcgg ccaggacttc 1980

tgccgcacca ccaacttcaa cgacaactcc tacaacgccc cgatctccat caacggcttc 2040

gactacgagc gcaagctcca gttcatcgac gtgttcaact accacaaggg cctcatcaag 2100

ctccgcaagg agcacccggc cttccgcctc aagaacgccg aggagatcaa gaagcacctg 2160

gagttcctcc cgggcgggcg ccgcatcgtg gccttcatgc tcaaggacca cgccggcggc 2220

gacccgtgga aggacatcgt ggtgatctac aacggcaacc tggagaagac cacctacaag 2280

ctcccggagg gcaagtggaa cgtggtggtg aactcccaga aggccggcac cgaggtgatc 2340

gagaccgtgg agggcaccat cgagctggac ccgctctccg cctacgtgct ctaccgcgag 2400

<210>5

<211>693

<212>PRT

<213>硫磺矿硫化叶菌

<400>5

Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr Lys Val Val

1 5 10 15

Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu Gln Lys Ile

20 25 30

Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile Val Gln Gln

35 40 45

Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys Glu His Ile

50 55 60

Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys Arg Lys Arg

65 70 75 80

Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys Tyr Gln Asp

85 90 95

Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys Asp Gly Val

100 105 110

Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile Phe Asp Val

115 120 125

Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro Glu Asp Ser

130 135 140

Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp Val Leu Glu

145 150 155 160

Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro Met Trp Ala

165 170 175

Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln Asp Lys Val

180 185 190

Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg Val Ala Gly

195 200 205

Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu Phe Thr Trp

210 215 220

His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp Glu Leu His

225 230 235 240

Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly Ile Arg Val

245 250 255

Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys Phe Cys Glu

260 265 270

Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro Gly Thr Thr

275 280 285

Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp Trp Ala Gly

290 295 300

Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile Trp Leu Asp

305 310 315 320

Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile Arg Asp Val

325 330 335

Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu Val Thr Thr

340 345 350

Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg Val Lys His

355 360 365

Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met Ala Thr Phe

370 375 380

Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile Leu Ser Arg

385 390 395 400

Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp Thr Gly Asp

405 410 415

Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln Leu Val Leu

420 425 430

Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp Ile Gly Gly

435 440 445

Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met Asp Leu Leu

450 455 460

Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr Arg Ser His

465 470 475 480

Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu Pro Asp Tyr

485 490 495

Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr Lys Phe Leu

500 505 510

Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys Gly His Pro

515 520 525

Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp Asp Met Tyr

530 535 540

Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu Tyr Ala Pro

545 550 555 560

Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro Ara Gly Lys

565 570 575

Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys Ser Val Val

580 585 590

Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly Ser Ile Ile

595 600 605

Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr Ser Phe Lys

610 615 620

Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu Ile Lys Phe

625 630 635 640

Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser Glu Lys Pro

645 650 655

Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln Val Glu Lys

660 665 670

Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys Ile Arg Gly

675 680 685

Lys Ile Asn Leu Glu

690

<210>6

<211>2082

<212>DNA

<213>硫磺矿硫化叶菌

<400>6

atggagacca tcaagatcta cgagaacaag ggcgtgtaca aggtggtgat cggcgagccg 60

ttcccgccga tcgagttccc gctcgagcag aagatctcct ccaacaagtc cctctccgag 120

ctgggcctca ccatcgtgca gcagggcaac aaggtgatcg tggagaagtc cctcgacctc 180

aaggagcaca tcatcggcct cggcgagaag gccttcgagc tggaccgcaa gcgcaagcgc 240

tacgtgatgt acaacgtgga cgccggcgcc tacaagaagt accaggaccc gctctacgtg 300

tccatcccgc tcttcatctc cgtgaaggac ggcgtggcca ccggctactt cttcaactcc 360

gcctccaagg tgatcttcga cgtgggcctc gaggagtacg acaaggtgat cgtgaccatc 420

ccggaggact ccgtggagtt ctacgtgatc gagggcccgc gcatcgagga cgtgctcgag 480

aagtacaccg agctgaccgg caagccgttc ctcccgccga tgtgggcctt cggctacatg 540

atctcccgct actcctacta cccgcaggac aaggtggtgg agctggtgga catcatgcag 600

aaggagggct tccgcgtggc cggcgtgttc ctcgacatcc actacatgga ctcctacaag 660

ctcttcacct ggcacccgta ccgcttcccg gagccgaaga agctcatcga cgagctgcac 720

aagcgcaacg tgaagctcat caccatcgtg gaccacggca tccgcgtgga ccagaactac 780

tccccgttcc tctccggcat gggcaagttc tgcgagatcg agtccggcga gctgttcgtg 840

ggcaagatgt ggccgggcac caccgtgtac ccggacttct tccgcgagga cacccgcgag 900

tggtgggccg gcctcatctc cgagtggctc tcccagggcg tggacggcat ctggctcgac 960

atgaacgagc cgaccgactt ctcccgcgcc atcgagatcc gcgacgtgct ctcctccctc 1020

ccggtgcagt tccgcgacga ccgcctcgtg accaccttcc cggacaacgt ggtgcactac 1080

ctccgcggca agcgcgtgaa gcacgagaag gtgcgcaacg cctacccgct ctacgaggcg 1140

atggccacct tcaagggctt ccgcacctcc caccgcaacg agatcttcat cctctcccgc 1200

gccggctacg ccggcatcca gcgctacgcc ttcatctgga ccggcgacaa caccccgtcc 1260

tgggacgacc tcaagctcca gctccagctc gtgctcggcc tctccatctc cggcgtgccg 1320

ttcgtgggct gcgacatcgg cggcttccag ggccgcaact tcgccgagat cgacaactcg 1380

atggacctcc tcgtgaagta ctacgccctc gccctcttct tcccgttcta ccgctcccac 1440

aaggccaccg acggcatcga caccgagccg gtgttcctcc cggactacta caaggagaag 1500

gtgaaggaga tcgtggagct gcgctacaag ttcctcccgt acatctactc cctcgccctc 1560

gaggcctccg agaagggcca cccggtgatc cgcccgctct tctacgagtt ccaggacgac 1620

gacgacatgt accgcatcga ggacgagtac atggtgggca agtacctcct ctacgccccg 1680

atcgtgtcca aggaggagtc ccgcctcgtg accctcccgc gcggcaagtg gtacaactac 1740

tggaacggcg agatcatcaa cggcaagtcc gtggtgaagt ccacccacga gctgccgatc 1800

tacctccgcg agggctccat catcccgctc gagggcgacg agctgatcgt gtacggcgag 1860

acctccttca agcgctacga caacgccgag atcacctcct cctccaacga gatcaagttc 1920

tcccgcgaga tctacgtgtc caagctcacc atcacctccg agaagccggt gtccaagatc 1980

atcgtggacg actccaagga gatccaggtg gagaagacca tgcagaacac ctacgtggcc 2040

aagatcaacc agaagatccg cggcaagatc aacctcgagt ga 2082

<210>7

<211>1818

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>7

atggcggctc tggccacgtc gcagctcgtc gcaacgcgcg ccggcctggg cgtcccggac 60

gcgtccacgt tccgccgcgg cgccgcgcag ggcctgaggg gggcccgggc gtcggcggcg 120

gcggacacgc tcagcatgcg gaccagcgcg cgcgcggcgc ccaggcacca gcaccagcag 180

gcgcgccgcg gggccaggtt cccgtcgctc gtcgtgtgcg ccagcgccgg catgaacgtc 240

gtcttcgtcg gcgccgagat ggcgccgtgg agcaagaccg gaggcctcgg cgacgtcctc 300

ggcggcctgc cgccggccat ggccgcgaac gggcaccgtg tcatggtcgt ctctccccgc 360

tacgaccagt acaaggacgc ctgggacacc agcgtcgtgt ccgagatcaa gatgggagac 420

gggtacgaga cggtcaggtt cttccactgc tacaagcgcg gagtggaccg cgtgttcgtt 480

gaccacccac tgttcctgga gagggtttgg ggaaagaccg aggagaagat ctacgggcct 540

gtcgctggaa cggactacag ggacaaccag ctgcggttca gcctgctatg ccaggcagca 600

cttgaagctc caaggatcct gagcctcaac aacaacccat acttctccgg accatacggg 660

gaggacgtcg tgttcgtctg caacgactgg cacaccggcc ctctctcgtg ctacctcaag 720

agcaactacc agtcccacgg catctacagg gacgcaaaga ccgctttctg catccacaac 780

atctcctacc agggccggtt cgccttctcc gactacccgg agctgaacct ccccgagaga 840

ttcaagtcgt ccttcgattt catcgacggc tacgagaagc ccgtggaagg ccggaagatc 900

aactggatga aggccgggat cctcgaggcc gacagggtcc tcaccgtcag cccctactac 960

gccgaggagc tcatctccgg catcgccagg ggctgcgagc tcgacaacat catgcgcctc 1020

accggcatca ccggcatcgt caacggcatg gacgtcagcg agtgggaccc cagcagggac 1080

aagtacatcg ccgtgaagta cgacgtgtcg acggccgtgg aggccaaggc gctgaacaag 1140

gaggcgctgc aggcggaggt cgggctcccg gtggaccgga acatcccgct ggtggcgttc 1200

atcggcaggc tggaagagca gaagggcccc gacgtcatgg cggccgccat cccgcagctc 1260

atggagatgg tggaggacgt gcagatcgtt ctgctgggca cgggcaagaa gaagttcgag 1320

cgcatgctca tgagcgccga ggagaagttc ccaggcaagg tgcgcgccgt ggtcaagttc 1380

aacgcggcgc tggcgcacca catcatggcc ggcgccgacg tgctcgccgt caccagccgc 1440

ttcgagccct gcggcctcat ccagctgcag gggatgcgat acggaacgcc ctgcgcctgc 1500

gcgtccaccg gtggactcgt cgacaccatc atcgaaggca agaccgggtt ccacatgggc 1560

cgcctcagcg tcgactgcaa cgtcgtggag ccggcggacg tcaagaaggt ggccaccacc 1620

ttgcagcgcg ccatcaaggt ggtcggcacg ccggcgtacg aggagatggt gaggaactgc 1680

atgatccagg atctctcctg gaagggccct gccaagaact gggagaacgt gctgctcagc 1740

ctcggggtcg ccggcggcga gccaggggtt gaaggcgagg agatcgcgcc gctcgccaag 1800

gagaacgtgg ccgcgccc 1818

<210>8

<211>606

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>8

Met Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly Leu

1 5 10 15

Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly Leu

20 25 30

Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg Thr

35 40 45

Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg Gly

50 55 60

Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Met Asn Val

65 70 75 80

Val Phe Val Gly Ala Glu Met Ala Pro Trp Ser Lys Thr Gly Gly Leu

85 90 95

Gly Asp Val Leu Gly Gly Leu Pro Pro Ala Met Ala Ala Asn Gly His

100 105 110

Arg Val Met Val Val Ser Pro Arg Tyr Asp Gln Tyr Lys Asp Ala Trp

115 120 125

Asp Thr Ser Val Val Ser Glu Ile Lys Met Gly Asp Gly Tyr Glu Thr

130 135 140

Val Arg Phe Phe His Cys Tyr Lys Arg Gly Val Asp Arg Val Phe Val

145 150 155 160

Asp His Pro Leu Phe Leu Glu Arg Val Trp Gly Lys Thr Glu Glu Lys

165 170 175

Ile Tyr Gly Pro Val Ala Gly Thr Asp Tyr Arg Asp Asn Gln Leu Arg

180 185 190

Phe Ser Leu Leu Cys Gln Ala Ala Leu Glu Ala Pro Arg Ile Leu Ser

195 200 205

Leu Asn Asn Asn Pro Tyr Phe Ser Gly Pro Tyr Gly Glu Asp Val Val

210 215 220

Phe Val Cys Asn Asp Trp His Thr Gly Pro Leu Ser Cys Tyr Leu Lys

225 230 235 240

Ser Asn Tyr Gln Ser His Gly Ile Tyr Arg Asp Ala Lys Thr Ala Phe

245 250 255

Cys Ile His Asn Ile Ser Tyr Gln Gly Arg Phe Ala Phe Ser Asp Tyr

260 265 270

Pro Glu Leu Asn Leu Pro Glu Arg Phe Lys Ser Ser Phe Asp Phe Ile

275 280 285

Asp Gly Tyr Glu Lys Pro Val Glu Gly Arg Lys Ile Asn Trp Met Lys

290 295 300

Ala Gly Ile Leu Glu Ala Asp Arg Val Leu Thr Val Ser Pro Tyr Tyr

305 310 315 320

Ala Glu Glu Leu Ile Ser Gly Ile Ala Arg Gly Cys Glu Leu Asp Asn

325 330 335

Ile Met Arg Leu Thr Gly Ile Thr Gly Ile Val Asn Gly Met Asp Val

340 345 350

Ser Glu Trp Asp Pro Ser Arg Asp Lys Tyr Ile Ala Val Lys Tyr Asp

355 360 365

Val Ser Thr Ala Val Glu Ala Lys Ala Leu Asn Lys Glu Ala Leu Gln

370 375 380

Ala Glu Val Gly Leu Pro Val Asp Arg Asn Ile Pro Leu Val Ala Phe

385 390 395 400

Ile Gly Arg Leu Glu Glu Gln Lys Gly Pro Asp Val Met Ala Ala Ala

405 410 415

Ile Pro Gln Leu Met Glu Met Val Glu Asp Val Gln Ile Val Leu Leu

420 425 430

Gly Thr Gly Lys Lys Lys Phe Glu Arg Met Leu Met Ser Ala Glu Glu

435 440 445

Lys Phe Pro Gly Lys Val Arg Ala Val Val Lys Phe Asn Ala Ala Leu

450 455 460

Ala His His Ile Met Ala Gly Ala Asp Val Leu Ala Val Thr Ser Arg

465 470 475 480

Phe Glu Pro Cys Gly Leu Ile Gln Leu Gln Gly Met Arg Tyr Gly Thr

485 490 495

Pro Cys Ala Cys Ala Ser Thr Gly Gly Leu Val Asp Thr Ile Ile Glu

500 505 510

Gly Lys Thr Gly Phe His Met Gly Arg Leu Ser Val Asp Cys Asn Val

515 520 525

Val Glu Pro Ala Asp Val Lys Lys Val Ala Thr Thr Leu Gln Arg Ala

530 535 540

Ile Lys Val Val Gly Thr Pro Ala Tyr Glu Glu Met Val Arg Asn Cys

545 550 555 560

Met Ile Gln Asp Leu Ser Trp Lys Gly Pro Ala Lys Asn Trp Glu Asn

565 570 575

Val Leu Leu Ser Leu Gly Val Ala Gly Gly Glu Pro Gly Val Glu Gly

580 585 590

Glu Glu Ile Ala Pro Leu Ala Lys Glu Asn Val Ala Ala Pro

595 600 605

<210>9

<211>2223

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>9

atggccaagt acctggagct ggaggagggc ggcgtgatca tgcaggcgtt ctactgggac 60

gtcccgagcg gaggcatctg gtgggacacc atccgccaga agatccccga gtggtacgac 120

gccggcatct ccgcgatctg gataccgcca gcttccaagg gcatgtccgg gggctactcg 180

atgggctacg acccgtacga ctacttcgac ctcggcgagt actaccagaa gggcacggtg 240

gagacgcgct tcgggtccaa gcaggagctc atcaacatga tcaacacggc gcacgcctac 300

ggcatcaagg tcatcgcgga catcgtgatc aaccacaggg ccggcggcga cctggagtgg 360

aacccgttcg tcggcgacta cacctggacg gacttctcca aggtcgcctc cggcaagtac 420

accgccaact acctcgactt ccaccccaac gagctgcacg cgggcgactc cggcacgttc 480

ggcggctacc cggacatctg ccacgacaag tcctgggacc agtactggct ctgggcctcg 540

caggagtcct acgcggccta cctgcgctcc atcggcatcg acgcgtggcg cttcgactac 600

gtcaagggct acggggcctg ggtggtcaag gactggctca actggtgggg cggctgggcg 660

gtgggcgagt actgggacac caacgtcgac gcgctgctca actgggccta ctcctccggc 720

gccaaggtgt tcgacttccc cctgtactac aagatggacg cggccttcga caacaagaac 780

atcccggcgc tcgtcgaggc cctgaagaac ggcggcacgg tggtctcccg cgacccgttc 840

aaggccgtga ccttcgtcgc caaccacgac acggacatca tctggaacaa gtacccggcg 900

tacgccttca tcctcaccta cgagggccag cccacgatct tctaccgcga ctacgaggag 960

tggctgaaca aggacaagct caagaacctg atctggattc acgacaacct cgcgggcggc 1020

tccactagta tcgtgtacta cgactccgac gagatgatct tcgtccgcaa cggctacggc 1080

tccaagcccg gcctgatcac gtacatcaac ctgggctcct ccaaggtggg ccgctgggtg 1140

tacgtcccga agttcgccgg cgcgtgcatc cacgagtaca ccggcaacct cggcggctgg 1200

gtggacaagt acgtgtactc ctccggctgg gtctacctgg aggccccggc ctacgacccc 1260

gccaacggcc agtacggcta ctccgtgtgg tcctactgcg gcgtcggcac atcgattgct 1320

ggcatcctcg aggccgacag ggtcctcacc gtcagcccct actacgccga ggagctcatc 1380

tccggcatcg ccaggggctg cgagctcgac aacatcatgc gcctcaccgg catcaccggc 1440

atcgtcaacg gcatggacgt cagcgagtgg gaccccagca gggacaagta catcgccgtg 1500

aagtacgacg tgtcgacggc cgtggaggcc aaggcgctga acaaggaggc gctgcaggcg 1560

gaggtcgggc tcccggtgga ccggaacatc ccgctggtgg cgttcatcgg caggctggaa 1620

gagcagaagg gccccgacgt catggcggcc gccatcccgc agctcatgga gatggtggag 1680

gacgtgcaga tcgttctgct gggcacgggc aagaagaagt tcgagcgcat gctcatgagc 1740

gccgaggaga agttcccagg caaggtgcgc gccgtggtca agttcaacgc ggcgctggcg 1800

caccacatca tggccggcgc cgacgtgctc gccgtcacca gccgcttcga gccctgcggc 1860

ctcatccagc tgcaggggat gcgatacgga acgccctgcg cctgcgcgtc caccggtgga 1920

ctcgtcgaca ccatcatcga aggcaagacc gggttccaca tgggccgcct cagcgtcgac 1980

tgcaacgtcg tggagccggc ggacgtcaag aaggtggcca ccaccttgca gcgcgccatc 2040

aaggtggtcg gcacgccggc gtacgaggag atggtgagga actgcatgat ccaggatctc 2100

tcctggaagg gccctgccaa gaactgggag aacgtgctgc tcagcctcgg ggtcgccggc 2160

ggcgagccag gggttgaagg cgaggagatc gcgccgctcg ccaaggagaa cgtggccgcg 2220

ccc 2223

<210>10

<211>741

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>10

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala

1 5 10 15

Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Ara

20 25 30

Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile

35 40 45

Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp

50 55 60

Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val

65 70 75 80

Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr

85 90 95

Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His

100 105 110

Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr

115 120 125

Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr

130 135 140

Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe

145 150 155 160

Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp

165 170 175

Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly

180 185 190

Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val

195 200 205

Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr

210 215 220

Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly

225 230 235 240

Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe

245 250 255

Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly

260 265 270

Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn

275 280 285

His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile

290 295 300

Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu

305 310 315 320

Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn

325 330 335

Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met

340 345 350

Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr

355 360 365

Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys

370 375 380

Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp

385 390 395 400

Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro

405 410 415

Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr

420 425 430

Cys Gly Val Gly Thr Ser Ile Ala Gly Ile Leu Glu Ala Asp Arg Val

435 440 445

Leu Thr Val Ser Pro Tyr Tyr Ala Glu Glu Leu Ile Ser Gly Ile Ala

450 455 460

Arg Gly Cys Glu Leu Asp Asn Ile Met Arg Leu Thr Gly Ile Thr Gly

465 470 475 480

Ile Val Asn Gly Met Asp Val Ser Glu Trp Asp Pro Ser Arg Asp Lys

485 490 495

Tyr Ile Ala Val Lys Tyr Asp Val Ser Thr Ala Val Glu Ala Lys Ala

500 505 510

Leu Asn Lys Glu Ala Leu Gln Ala Glu Val Gly Leu Pro Val Asp Arg

515 520 525

Asn Ile Pro Leu Val Ala Phe Ile Gly Arg Leu Glu Glu Gln Lys Gly

530 535 540

Pro Asp Val Met Ala Ala Ala Ile Pro Gln Leu Met Glu Met Val Glu

545 550 555 560

Asp Val Gln Ile Val Leu Leu Gly Thr Gly Lys Lys Lys Phe Glu Arg

565 570 575

Met Leu Met Ser Ala Glu Glu Lys Phe Pro Gly Lys Val Arg Ala Val

580 585 590

Val Lys Phe Asn Ala Ala Leu Ala His His Ile Met Ala Gly Ala Asp

595 600 605

Val Leu Ala Val Thr Ser Arg Phe Glu Pro Cys Gly Leu Ile Gln Leu

610 615 620

Gln Gly Met Arg Tyr Gly Thr Pro Cys Ala Cys Ala Ser Thr Gly Gly

625 630 635 640

Leu Val Asp Thr Ile Ile Glu Gly Lys Thr Gly Phe His Met Gly Arg

645 650 655

Leu Ser Val Asp Cys Asn Val Val Glu Pro Ala Asp Val Lys Lys Val

660 665 670

Ala Thr Thr Leu Gln Arg Ala Ile Lys Val Val Gly Thr Pro Ala Tyr

675 680 685

Glu Glu Met Val Arg Asn Cys Met Ile Gln Asp Leu Ser Trp Lys Gly

690 695 700

Pro Ala Lys Asn Trp Glu Asn Val Leu Leu Ser Leu Gly Val Ala Gly

705 710 715 720

Gly Glu Pro Gly Val Glu Gly Glu Glu Ile Ala Pro Leu Ala Lys Glu

725 730 735

Asn Val Ala Ala Pro

740

<210>11

<211>1515

<212>DNA

<213>玉蜀黍

<400>11

ggagagctat gagacgtatg tcctcaaagc cactttgcat tgtgtgaaac caatatcgat 60

ctttgttact tcatcatgca tgaacatttg tggaaactac tagcttacaa gcattagtga 120

cagctcagaa aaaagttatc tatgaaaggt ttcatgtgta ccgtgggaaa tgagaaatgt 180

tgccaactca aacaccttca atatgttgtt tgcaggcaaa ctcttctgga agaaaggtgt 240

ctaaaactat gaacgggtta cagaaaggta taaaccacgg ctgtgcattt tggaagtatc 300

atctatagat gtctgttgag gggaaagccg tacgccaacg ttatttactc agaaacagct 360

tcaacacaca gttgtctgct ttatgatggc atctccaccc aggcacccac catcacctat 420

ctctcgtgcc tgtttatttt cttgcccttt ctgatcataa aaaaacatta agagtttgca 480

aacatgcata ggcatatcaa tatgctcatt tattaatttg ctagcagatc atcttcctac 540

tctttacttt atttattgtt tgaaaaatat gtcctgcacc tagggagctc gtatacagta 600

ccaatgcatc ttcattaaat gtgaatttca gaaaggaagt aggaacctat gagagtattt 660

ttcaaaatta attagcggct tctattatgt ttatagcaaa ggccaagggc aaaattggaa 720

cactaatgat ggttggttgc atgagtctgt cgattacttg caagaaatgt gaacctttgt 780

ttctgtgcgt gggcataaaa caaacagctt ctagcctctt ttacggtact tgcacttgca 840

agaaatgtga actccttttc atttctgtat gtggacataa tgccaaagca tccaggcttt 900

ttcatggttg ttgatgtctt tacacagttc atctccacca gtatgccctc ctcatactct 960

atataaacac atcaacagca tcgcaattag ccacaagatc acttcgggag gcaagtgcga 1020

tttcgatctc gcagccacct ttttttgttc tgttgtaagt ataccttccc ttaccatctt 1080

tatctgttag tttaatttgt aattgggaag tattagtgga aagaggatga gatgctatca 1140

tctatgtact ctgcaaatgc atctgacgtt atatgggctg cttcatataa tttgaattgc 1200

tccattcttg ccgacaatat attgcaaggt atatgcctag ttccatcaaa agttctgttt 1260

tttcattcta aaagcatttt agtggcacac aatttttgtc catgagggaa aggaaatctg 1320

ttttggttac tttgcttgag gtgcattctt catatgtcca gttttatgga agtaataaac 1380

ttcagtttgg tcataagatg tcatattaaa gggcaaacat atattcaatg ttcaattcat 1440

cgtaaatgtt ccctttttgt aaaagattgc atactcattt atttgagttg caggtgtatc 1500

tagtagttgg aggag 1515

<210>12

<211>673

<212>DNA

<213>玉蜀黍

<400>12

gatcatccag gtgcaaccgt ataagtccta aagtggtgag gaacacgaaa caaccatgca 60

ttggcatgta aagctccaag aatttgttgt atccttaaca actcacagaa catcaaccaa 120

aattgcacgt caagggtatt gggtaagaaa caatcaaaca aatcctctct gtgtgcaaag 180

aaacacggtg agtcatgccg agatcatact catctgatat acatgcttac agctcacaag 240

acattacaaa caactcatat tgcattacaa agatcgtttc atgaaaaata aaataggccg 300

gacaggacaa aaatccttga cgtgtaaagt aaatttacaa caaaaaaaaa gccatatgtc 360

aagctaaatc taattcgttt tacgtagatc aacaacctgt agaaggcaac aaaactgagc 420

cacgcagaag tacagaatga ttccagatga accatcgacg tgctacgtaa agagagtgac 480

gagtcatata catttggcaa gaaaccatga agctgcctac agccgtctcg gtggcataag 540

aacacaagaa attgtgttaa ttaatcaaag ctataaataa cgctcgcatg cctgtgcact 600

tctccatcac caccactggg tcttcagacc attagcttta tctactccag agcgcagaag 660

aacccgatcg aca 673

<210>13

<211>454

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>13

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met

20 25 30

Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr

35 40 45

Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile

50 55 60

Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly

65 70 75 80

Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly

85 90 95

Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile

100 105 110

Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile

115 120 125

Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp

130 135 140

Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala

145 150 155 160

Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly

165 170 175

Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln

180 185 190

Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser

195 200 205

Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala

210 215 220

Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly

225 230 235 240

Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser

245 250 255

Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala

260 265 270

Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn

275 280 285

Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val

290 295 300

Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala

305 310 315 320

Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr

325 330 335

Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His

340 345 350

Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp

355 360 365

Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile

370 375 380

Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val

385 390 395 400

Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly

405 410 415

Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu

420 425 430

Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp

435 440 445

Ser Tyr Cys Gly Val Gly

450

<210>14

<211>460

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>14

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met

20 25 30

Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr

35 40 45

Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile

50 55 60

Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly

65 70 75 80

Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly

85 90 95

Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile

100 105 110

Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile

115 120 125

Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp

130 135 140

Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala

145 150 155 160

Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly

165 170 175

Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln

180 185 190

Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser

195 200 205

Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala

210 215 220

Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly

225 230 235 240

Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser

245 250 255

Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala

260 265 270

Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn

275 280 285

Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val

290 295 300

Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala

305 310 315 320

Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr

325 330 335

Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His

340 345 350

Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp

355 360 365

Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile

370 375 380

Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val

385 390 395 400

Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly

405 410 415

Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu

420 425 430

Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp

435 440 445

Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu

450 455 460

<210>15

<211>518

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>15

Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly

1 5 10 15

Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly

20 25 30

Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg

35 40 45

Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg

50 55 60

Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met

65 70 75 80

Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala Phe

85 90 95

Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gln

100 105 110

Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro

115 120 125

Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro

130 135 140

Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val Glu

145 150 155 160

Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr Ala

165 170 175

His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His Arg

180 185 190

Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr Trp

195 200 205

Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu

210 215 220

Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly

225 230 235 240

Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp Leu

245 250 255

Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile

260 265 270

Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val Val

275 280 285

Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp

290 295 300

Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala

305 310 315 320

Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp

325 330 335

Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly Thr

340 345 350

Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn His

355 360 365

Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu

370 375 380

Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp

385 390 395 400

Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu

405 410 415

Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met Ile

420 425 430

Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile

435 440 445

Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys Phe

450 455 460

Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Val

465 470 475 480

Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro Ala

485 490 495

Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys

500 505 510

Gly Val Gly Thr Ser Ile

515

<210>16

<211>820

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>16

Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly

1 5 10 15

Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly

20 25 30

Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg

35 40 45

Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg

50 55 60

Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met

65 70 75 80

Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala Phe

85 90 95

Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gln

100 105 110

Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro

115 120 125

Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro

130 135 140

Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val Glu

145 150 155 160

Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr Ala

165 170 175

His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His Arg

180 185 190

Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr Trp

195 200 205

Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu

210 215 220

Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly

225 230 235 240

Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp Leu

245 250 255

Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile

260 265 270

Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val Val

275 280 285

Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp

290 295 300

Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala

305 310 315 320

Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp

325 330 335

Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly Thr

340 345 350

Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn His

355 360 365

Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu

370 375 380

Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp

385 390 395 400

Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu

405 410 415

Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met Ile

420 425 430

Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile

435 440 445

Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys Phe

450 455 460

Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Val

465 470 475 480

Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro Ala

485 490 495

Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys

500 505 510

Gly Val Gly Thr Ser Ile Ala Gly Ile Leu Glu Ala Asp Arg Val Leu

515 520 525

Thr Val Ser Pro Tyr Tyr Ala Glu Glu Leu Ile Ser Gly Ile Ala Arg

530 535 540

Gly Cys Glu Leu Asp Asn Ile Met Arg Leu Thr Gly Ile Thr Gly Ile

545 550 555 560

Val Asn Gly Met Asp Val Ser Glu Trp Asp Pro Ser Arg Asp Lys Tyr

565 570 575

Ile Ala Val Lys Tyr Asp Val Ser Thr Ala Val Glu Ala Lys Ala Leu

580 585 590

Asn Lys Glu Ala Leu Gln Ala Glu Val Gly Leu Pro Val Asp Arg Asn

595 600 605

Ile Pro Leu Val Ala Phe Ile Gly Arg Leu Glu Glu Gln Lys Gly Pro

610 615 620

Asp Val Met Ala Ala Ala Ile Pro Gln Leu Met Glu Met Val Glu Asp

625 630 635 640

Val Gln Ile Val Leu Leu Gly Thr Gly Lys Lys Lys Phe Glu Arg Met

645 650 655

Leu Met Ser Ala Glu Glu Lys Phe Pro Gly Lys Val Arg Ala Val Val

660 665 670

Lys Phe Asn Ala Ala Leu Ala His His Ile Met Ala Gly Ala Asp Val

675 680 685

Leu Ala Val Thr Ser Arg Phe Glu Pro Cys Gly Leu Ile Gln Leu Gln

690 695 700

Gly Met Arg Tyr Gly Thr Pro Cys Ala Cys Ala Ser Thr Gly Gly Leu

705 710 715 720

Val Asp Thr Ile Ile Glu Gly Lys Thr Gly Phe His Met Gly Arg Leu

725 730 735

Ser Val Asp Cys Asn Val Val Glu Pro Ala Asp Val Lys Lys Val Ala

740 745 750

Thr Thr Leu Gln Arg Ala Ile Lys Val Val Gly Thr Pro Ala Tyr Glu

755 760 765

Glu Met Val Arg Asn Cys Met Ile Gln Asp Leu Ser Trp Lys Gly Pro

770 775 780

Ala Lys Asn Trp Glu Asn Val Leu Leu Ser Leu Gly Val Ala Gly Gly

785 790 795 800

Glu Pro Gly Val Glu Gly Glu Glu Ile Ala Pro Leu Ala Lys Glu Asn

805 810 815

Val Ala Ala Pro

820

<210>17

<211>19

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>17

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser

<210>18

<211>444

<212>PRT

<213>海栖热袍菌

<400>18

Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe Glu Gly Lys

1 5 10 15

Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro Asn Glu Val

20 25 30

Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe

35 40 45

Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr

50 55 60

Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp Lys Ala Phe

65 70 75 80

Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu

85 90 95

Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu

100 105 110

Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu

115 120 125

Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu

130 135 140

Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala

145 150 155 160

Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile

165 170 175

Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu

180 185 190

Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu Leu Glu Asn

195 200 205

Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys Lys Ile Gly

210 215 220

Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys

225 230 235 240

His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Asn

245 250 255

His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala

260 265 270

Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile

275 280 285

Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu

290 295 300

Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp Thr Thr Leu

305 310 315 320

Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu

325 330 335

Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu

340 345 350

Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys

355 360 365

Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys Phe Ile Glu

370 375 380

Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu Ile Val Glu

385 390 395 400

Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu

405 410 415

Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Leu

420 425 430

Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg

435 440

<210>19

<211>1335

<212>DNA

<213>海栖热袍菌

<400>19

atggccgagt tcttcccgga gatcccgaag atccagttcg agggcaagga gtccaccaac 60

ccgctcgcct tccgcttcta cgacccgaac gaggtgatcg acggcaagcc gctcaaggac 120

cacctcaagt tctccgtggc cttctggcac accttcgtga acgagggccg cgacccgttc 180

ggcgacccga ccgccgagcg cccgtggaac cgcttctccg acccgatgga caaggccttc 240

gcccgcgtgg acgccctctt cgagttctgc gagaagctca acatcgagta cttctgcttc 300

cacgaccgcg acatcgcccc ggagggcaag accctccgcg agaccaacaa gatcctcgac 360

aaggtggtgg agcgcatcaa ggagcgcatg aaggactcca acgtgaagct cctctggggc 420

accgccaacc tcttctccca cccgcgctac atgcacggcg ccgccaccac ctgctccgcc 480

gacgtgttcg cctacgccgc cgcccaggtg aagaaggccc tggagatcac caaggagctg 540

ggcggcgagg gctacgtgtt ctggggcggc cgcgagggct acgagaccct cctcaacacc 600

gacctcggcc tggagctgga gaacctcgcc cgcttcctcc gcatggccgt ggagtacgcc 660

aagaagatcg gcttcaccgg ccagttcctc atcgagccga agccgaagga gccgaccaag 720

caccagtacg acttcgacgt ggccaccgcc tacgccttcc tcaagaacca cggcctcgac 780

gagtacttca agttcaacat cgaggccaac cacgccaccc tcgccggcca caccttccag 840

cacgagctgc gcatggcccg catcctcggc aagctcggct ccatcgacgc caaccagggc 900

gacctcctcc tcggctggga caccgaccag ttcccgacca acatctacga caccaccctc 960

gccatgtacg aggtgatcaa ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc 1020

aaggtgcgcc gcgcctccta caaggtggag gacctcttca tcggccacat cgccggcatg 1080

gacaccttcg ccctcggctt caagatcgcc tacaagctcg ccaaggacgg cgtgttcgac 1140

aagttcatcg aggagaagta ccgctccttc aaggagggca tcggcaagga gatcgtggag 1200

ggcaagaccg acttcgagaa gctggaggag tacatcatcg acaaggagga catcgagctg 1260

ccgtccggca agcaggagta cctggagtcc ctcctcaact cctacatcgt gaagaccatc 1320

gccgagctgc gctga 1335

<210>20

<211>444

<212>PRT

<213>那不勒斯栖热袍菌

<400>20

Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe Glu Gly Lys

1 5 10 15

Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro Glu Glu Ile

20 25 30

Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe

35 40 45

Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr

50 55 60

Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp Lys Ala Phe

65 70 75 80

Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu

85 90 95

Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu

100 105 110

Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu

115 120 125

Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu

130 135 140

Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala

145 150 155 160

Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile

165 170 175

Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu

180 185 190

Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu Leu Glu Asn

195 200 205

Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys Arg Ile Gly

210 215 220

Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys

225 230 235 240

His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Ser

245 250 255

His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala

260 265 270

Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile

275 280 285

Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu

290 295 300

Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp Thr Thr Leu

305 310 315 320

Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu

325 330 335

Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu

340 345 350

Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys

355 360 365

Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys Phe Ile Glu

370 375 380

Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp Ile Val Glu

385 390 395 400

Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu

405 410 415

Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Ile

420 425 430

Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg

435 440

<210>21

<211>1335

<212>DNA

<213>那不勒斯栖热袍菌

<400>21

atggccgagt tcttcccgga gatcccgaag gtgcagttcg agggcaagga gtccaccaac 60

ccgctcgcct tcaagttcta cgacccggag gagatcatcg acggcaagcc gctcaaggac 120

cacctcaagt tctccgtggc cttctggcac accttcgtga acgagggccg cgacccgttc 180

ggcgacccga ccgccgaccg cccgtggaac cgctacaccg acccgatgga caaggccttc 240

gcccgcgtgg acgccctctt cgagttctgc gagaagctca acatcgagta cttctgcttc 300

cacgaccgcg acatcgcccc ggagggcaag accctccgcg agaccaacaa gatcctcgac 360

aaggtggtgg agcgcatcaa ggagcgcatg aaggactcca acgtgaagct cctctggggc 420

accgccaacc tcttctccca cccgcgctac atgcacggcg ccgccaccac ctgctccgcc 480

gacgtgttcg cctacgccgc cgcccaggtg aagaaggccc tggagatcac caaggagctg 540

ggcggcgagg gctacgtgtt ctggggcggc cgcgagggct acgagaccct cctcaacacc 600

gacctcggct tcgagctgga gaacctcgcc cgcttcctcc gcatggccgt ggactacgcc 660

aagcgcatcg gcttcaccgg ccagttcctc atcgagccga agccgaagga gccgaccaag 720

caccagtacg acttcgacgt ggccaccgcc tacgccttcc tcaagtccca cggcctcgac 780

gagtacttca agttcaacat cgaggccaac cacgccaccc tcgccggcca caccttccag 840

cacgagctgc gcatggcccg catcctcggc aagctcggct ccatcgacgc caaccagggc 900

gacctcctcc tcggctggga caccgaccag ttcccgacca acgtgtacga caccaccctc 960

gccatgtacg aggtgatcaa ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc 1020

aaggtgcgcc gcgcctccta caaggtggag gacctcttca tcggccacat cgccggcatg 1080

gacaccttcg ccctcggctt caaggtggcc tacaagctcg tgaaggacgg cgtgctcgac 1140

aagttcatcg aggagaagta ccgctccttc cgcgagggca tcggccgcga catcgtggag 1200

ggcaaggtgg acttcgagaa gctggaggag tacatcatcg acaaggagac catcgagctg 1260

ccgtccggca agcaggagta cctggagtcc ctcatcaact cctacatcgt gaagaccatc 1320

ctggagctgc gctga 1335

<210>22

<211>28

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>22

agcgaattca tggcggctct ggccacgt 28

<210>23

<211>29

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>23

agctaagctt cagggcgcgg ccacgttct 29

<210>24

<211>825

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>24

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe

20 25 30

Thr Gly Glu Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met

35 40 45

Asp Leu Thr Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala

50 55 60

Lys Asp Val Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala

65 70 75 80

Glu Val Trp Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro

85 90 95

Asp Thr Ser Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val

100 105 110

Ile Glu Ala Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu

115 120 125

Phe Lys Val Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu

130 135 140

Lys Ala Asp Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val

145 150 155 160

Leu Ser Glu Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu

165 170 175

Ile Ile Glu Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu

180 185 190

Asp Asp Tyr Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu

195 200 205

Lys Thr Ile Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val

210 215 220

Leu Leu Phe Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn

225 230 235 240

Met Glu Tyr Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp

245 250 255

Leu Asp Gly Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile

260 265 270

Arg Thr Thr Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Ash Asn Gln

275 280 285

Glu Ser Ala Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu

290 295 300

Asn Asp Arg Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr

305 310 315 320

Glu Ile His Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys

325 330 335

Asn Lys Gly Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Ala Pro

340 345 350

Gly Gly Val Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr

355 360 365

His Val His Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu

370 375 380

Asp Lys Asp Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu

385 390 395 400

Phe Met Val Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His

405 410 415

Thr Arg Ile Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His

420 425 430

Gly Ile Gly Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile

435 440 445

Gly Glu Leu Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg

450 455 460

Ile Asp Lys Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val

465 470 475 480

Ile Ala Ser Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val

485 490 495

Thr Tyr Trp Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln

500 505 510

Met Gly Leu Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu

515 520 525

His Lys Ile Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly

530 535 540

Trp Gly Ala Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His

545 550 555 560

Val Ala Ala Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val

565 570 575

Phe Asn Pro Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu

580 585 590

Thr Lys Ile Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys

595 600 605

Leu Ile Lys Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala

610 615 620

Ala Cys His Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala

625 630 635 640

Lys Ala Asp Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala

645 650 655

Gln Lys Leu Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe

660 665 670

Leu His Gly Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn

675 680 685

Ser Tyr Asn Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys

690 695 700

Leu Gln Phe Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu

705 710 715 720

Arg Lys Glu His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys

725 730 735

Lys His Leu Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met

740 745 750

Leu Lys Asp His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile

755 760 765

Tyr Asn Gly Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys

770 775 780

Trp Asn Val Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu

785 790 795 800

Thr Val Glu Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu

805 810 815

Tyr Arg Glu Ser Glu Lys Asp Glu Leu

820 825

<210>25

<211>2478

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>25

atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc caccagcgct 60

ggccactggt acaagcacca gcgcgcctac cagttcaccg gcgaggacga cttcgggaag 120

gtggccgtgg tgaagctccc gatggacctc accaaggtgg gcatcatcgt gcgcctcaac 180

gagtggcagg cgaaggacgt ggccaaggac cgcttcatcg agatcaagga cggcaaggcc 240

gaggtgtgga tactccaggg cgtggaggag atcttctacg agaagccgga cacctccccg 300

cgcatcttct tcgcccaggc ccgctccaac aaggtgatcg aggccttcct caccaacccg 360

gtggacacca agaagaagga gctgttcaag gtgaccgtcg acggcaagga gatcccggtg 420

tcccgcgtgg agaaggccga cccgaccgac atcgacgtga ccaactacgt gcgcatcgtg 480

ctctccgagt ccctcaagga ggaggacctc cgcaaggacg tggagctgat catcgagggc 540

tacaagccgg cccgcgtgat catgatggag atcctcgacg actactacta cgacggcgag 600

ctgggggcgg tgtactcccc ggagaagacc atcttccgcg tgtggtcccc ggtgtccaag 660

tgggtgaagg tgctcctctt caagaacggc gaggacaccg agccgtacca ggtggtgaac 720

atggagtaca agggcaacgg cgtgtgggag gccgtggtgg agggcgacct cgacggcgtg 780

ttctacctct accagctgga gaactacggc aagatccgca ccaccgtgga cccgtactcc 840

aaggccgtgt acgccaacaa ccaggagtct gcagtggtga acctcgcccg caccaacccg 900

gagggctggg agaacgaccg cggcccgaag atcgagggct acgaggacgc catcatctac 960

gagatccaca tcgccgacat caccggcctg gagaactccg gcgtgaagaa caagggcctc 1020

tacctcggcc tcaccgagga gaacaccaag gccccgggcg gcgtgaccac cggcctctcc 1080

cacctcgtgg agctgggcgt gacccacgtg cacatcctcc cgttcttcga cttctacacc 1140

ggcgacgagc tggacaagga cttcgagaag tactacaact ggggctacga cccgtacctc 1200

ttcatggtgc cggagggccg ctactccacc gacccgaaga acccgcacac ccgaattcgc 1260

gaggtgaagg agatggtgaa ggccctccac aagcacggca tcggcgtgat catggacatg 1320

gtgttcccgc acacctacgg catcggcgag ctgtccgcct tcgaccagac cgtgccgtac 1380

tacttctacc gcatcgacaa gaccggcgcc tacctcaacg agtccggctg cggcaacgtg 1440

atcgcctccg agcgcccgat gatgcgcaag ttcatcgtgg acaccgtgac ctactgggtg 1500

aaggagtacc acatcgacgg cttccgcttc gaccagatgg gcctcatcga caagaagacc 1560

atgctggagg tggagcgcgc cctccacaag atcgacccga ccatcatcct ctacggcgag 1620

ccgtggggcg gctggggggc cccgatccgc ttcggcaagt ccgacgtggc cggcacccac 1680

gtggccgcct tcaacgacga gttccgcgac gccatccgcg gctccgtgtt caacccgtcc 1740

gtgaagggct tcgtgatggg cggctacggc aaggagacca agatcaagcg cggcgtggtg 1800

ggctccatca actacgacgg caagctcatc aagtccttcg ccctcgaccc ggaggagacc 1860

atcaactacg ccgcctgcca cgacaaccac accctctggg acaagaacta cctcgccgcc 1920

aaggccgaca agaagaagga gtggaccgag gaggagctga agaacgccca gaagctcgcc 1980

ggcgccatcc tcctcactag tcagggcgtg ccgttcctcc acggcggcca ggacttctgc 2040

cgcaccacca acttcaacga caactcctac aacgccccga tctccatcaa cggcttcgac 2100

tacgagcgca agctccagtt catcgacgtg ttcaactacc acaagggcct catcaagctc 2160

cgcaaggagc acccggcctt ccgcctcaag aacgccgagg agatcaagaa gcacctggag 2220

ttcctcccgg gcgggcgccg catcgtggcc ttcatgctca aggaccacgc cggcggcgac 2280

ccgtggaagg acatcgtggt gatctacaac ggcaacctgg agaagaccac ctacaagctc 2340

ccggagggca agtggaacgt ggtggtgaac tcccagaagg ccggcaccga ggtgatcgag 2400

accgtggagg gcaccatcga gctggacccg ctctccgcct acgtgctcta ccgcgagtcc 2460

gagaaggacg agctgtga 2478

<210>26

<211>718

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>26

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr

20 25 30

Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu

35 40 45

Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile

50 55 60

Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys

65 70 75 80

Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys

85 90 95

Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys

100 105 110

Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys

115 120 125

Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile

130 135 140

Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro

145 150 155 160

Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp

165 170 175

Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro

180 185 190

Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln

195 200 205

Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg

210 215 220

Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu

225 230 235 240

Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp

245 250 255

Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly

260 265 270

Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys

275 280 285

Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro

290 295 300

Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp

305 310 315 320

Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile

325 330 335

Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile

340 345 350

Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu

355 360 365

Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg

370 375 380

Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met

385 390 395 400

Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Ash Glu Ile Phe Ile

405 410 415

Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp

420 425 430

Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln

435 440 445

Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp

450 455 460

Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met

465 470 475 480

Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr

485 490 495

Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu

500 505 510

Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr

515 520 525

Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys

530 535 540

Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp

545 550 555 560

Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu

565 570 575

Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro

580 585 590

Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys

595 600 605

Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly

610 615 620

Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr

625 630 635 640

Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu

645 650 655

Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser

660 665 670

Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln

675 680 685

Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys

690 695 700

Ile Arg Gly Lys Ile Asn Leu Glu Ser Glu Lys Asp Glu Leu

705 710 715

<210>27

<211>712

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>27

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr

20 25 30

Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu

35 40 45

Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile

50 55 60

Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys

65 70 75 80

Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys

85 90 95

Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys

100 105 110

Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys

115 120 125

Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile

130 135 140

Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro

145 150 155 160

Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp

165 170 175

Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro

180 185 190

Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln

195 200 205

Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg

210 215 220

Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu

225 230 235 240

Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp

245 250 255

Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly

260 265 270

Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys

275 280 285

Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro

290 295 300

Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp

305 310 315 320

Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile

325 330 335

Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile

340 345 350

Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu

355 360 365

Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg

370 375 380

Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met

385 390 395 400

Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile

405 410 415

Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp

420 425 430

Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln

435 440 445

Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp

450 455 460

Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met

465 470 475 480

Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr

485 490 495

Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu

500 505 510

Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr

515 520 525

Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys

530 535 540

Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp

545 550 555 560

Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu

565 570 575

Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro

580 585 590

Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys

595 600 605

Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly

610 615 620

Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr

625 630 635 640

Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu

645 650 655

Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser

660 665 670

Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln

675 680 685

Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys

690 695 700

Ile Arg Gly Lys Ile Asn Leu Glu

705 710

<210>28

<211>469

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>28

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe

20 25 30

Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro

35 40 45

Asn Glu Val Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser

50 55 60

Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly

65 70 75 80

Asp Pro Thr Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp

85 90 95

Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu

100 105 110

Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly

115 120 125

Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg

130 135 140

Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr

145 150 155 160

Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr

165 170 175

Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala

180 185 190

Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly

195 200 205

Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu

210 215 220

Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys

225 230 235 240

Lys Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu

245 250 255

Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe

260 265 270

Leu Lys Asn His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala

275 280 285

Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met

290 295 300

Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp

305 310 315 320

Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp

325 330 335

Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys

340 345 350

Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val

355 360 365

Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu

370 375 380

Gly Phe Lys Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys

385 390 395 400

Phe Ile Glu Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu

405 410 415

Ile Val Glu Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile

420 425 430

Asp Lys Glu Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu

435 440 445

Ser Leu Leu Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg Ser

450 455 460

Glu Lys Asp Glu Leu

465

<210>29

<211>469

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>29

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe

20 25 30

Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro

35 40 45

Glu Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser

50 55 60

Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly

65 70 75 80

Asp Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp

85 90 95

Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu

100 105 110

Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly

115 120 125

Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg

130 135 140

Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr

145 150 155 160

Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr

165 170 175

Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala

180 185 190

Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly

195 200 205

Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu

210 215 220

Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys

225 230 235 240

Arg Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu

245 250 255

Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe

260 265 270

Leu Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala

275 280 285

Ash His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met

290 295 300

Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp

305 310 315 320

Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp

325 330 335

Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys

340 345 350

Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val

355 360 365

Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu

370 375 380

Gly Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys

385 390 395 400

Phe Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp

405 410 415

Ile Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile

420 425 430

Asp Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu

435 440 445

Ser Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg Ser

450 455 460

Glu Lys Asp Glu Leu

465

<210>30

<211>463

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>30

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe

20 25 30

Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro

35 40 45

Glu Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser

50 55 60

Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly

65 70 75 80

Asp Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp

85 90 95

Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu

100 105 110

Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly

115 120 125

Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg

130 135 140

Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr

145 150 155 160

Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr

165 170 175

Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala

180 185 190

Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly

195 200 205

Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu

210 215 220

Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys

225 230 235 240

Arg Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu

245 250 255

Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe

260 265 270

Leu Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala

275 280 285

Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met

290 295 300

Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp

305 310 315 320

Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp

325 330 335

Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys

340 345 350

Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val

355 360 365

Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu

370 375 380

Gly Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys

385 390 395 400

Phe Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp

405 410 415

Ile Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile

420 425 430

Asp Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu

435 440 445

Ser Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg

450 455 460

<210>31

<211>25

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>31

Met Gly Lys Asn Gly Asn Leu Cys Cys Phe Ser Leu Leu Leu Leu Leu

1 5 10 15

Leu Ala Gly Leu Ala Ser Gly His Gln

20 25

<210>32

<211>30

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>32

Met Gly Phe Val Leu Phe Ser Gln Leu Pro Ser Phe Leu Leu Val Ser

1 5 10 15

Thr Leu Leu Leu Phe Leu Val Ile Ser His Ser Cys Arg Ala

20 25 30

<210>33

<211>460

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>33

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met

20 25 30

Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr

35 40 45

Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile

50 55 60

Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly

65 70 75 80

Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly

85 90 95

Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile

100 105 110

Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile

115 120 125

Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp

130 135 140

Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala

145 150 155 160

Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly

165 170 175

Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln

180 185 190

Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser

195 200 205

Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala

210 215 220

Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly

225 230 235 240

Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser

245 250 255

Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala

260 265 270

Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn

275 280 285

Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val

290 295 300

Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala

305 310 315 320

Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr

325 330 335

Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His

340 345 350

Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp

355 360 365

Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile

370 375 380

Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val

385 390 395 400

Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly

405 410 415

Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu

420 425 430

Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp

435 440 445

Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu

450 455 460

<210>34

<211>825

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>34

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe

20 25 30

Thr Gly Glu Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met

35 40 45

Asp Leu Thr Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala

50 55 60

Lys Asp Val Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala

65 70 75 80

Glu Val Trp Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro

85 90 95

Asp Thr Ser Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val

100 105 110

Ile Glu Ala Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu

115 120 125

Phe Lys Val Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu

130 135 140

Lys Ala Asp Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val

145 150 155 160

Leu Ser Glu Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu

165 170 175

Ile Ile Glu Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu

180 185 190

Asp Asp Tyr Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu

195 200 205

Lys Thr Ile Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val

210 215 220

Leu Leu Phe Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn

225 230 235 240

Met Glu Tyr Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp

245 250 255

Leu Asp Gly Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile

260 265 270

Arg Thr Thr Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln

275 280 285

Glu Ser Ala Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu

290 295 300

Asn Asp Arg Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr

305 310 315 320

Glu Ile His Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys

325 330 335

Asn Lys Gly Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Ala Pro

340 345 350

Gly Gly Val Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr

355 360 365

His Val His Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu

370 375 380

Asp Lys Asp Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu

385 390 395 400

Phe Met Val Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His

405 410 415

Thr Arg Ile Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His

420 425 430

Gly Ile Gly Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile

435 440 445

Gly Glu Leu Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg

450 455 460

Ile Asp Lys Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val

465 470 475 480

Ile Ala Ser Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val

485 490 495

Thr Tyr Trp Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln

500 505 510

Met Gly Leu Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu

515 520 525

His Lys Ile Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly

530 535 540

Trp Gly Ala Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His

545 550 555 560

Val Ala Ala Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val

565 570 575

Phe Asn Pro Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu

580 585 590

Thr Lys Ile Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys

595 600 605

Leu Ile Lys Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala

610 615 620

Ala Cys His Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala

625 630 635 640

Lys Ala Asp Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala

645 650 655

Gln Lys Leu Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe

660 665 670

Leu His Gly Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn

675 680 685

Ser Tyr Asn Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys

690 695 700

Leu Gln Phe Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu

705 710 715 720

Arg Lys Glu His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys

725 730 735

Lys His Leu Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met

740 745 750

Leu Lys Asp His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile

755 760 765

Tyr Asn Gly Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys

770 775 780

Trp Asn Val Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu

785 790 795 800

Thr Val Glu Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu

805 810 815

Tyr Arg Glu Ser Glu Lys Asp Glu Leu

820 825

<210>35

<211>460

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>35

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met

20 25 30

Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr

35 40 45

Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile

50 55 60

Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly

65 70 75 80

Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly

85 90 95

Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile

100 105 110

Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile

115 120 125

Asn His Arg Ala Gly Gly Asp Leu Glu Trp Ash Pro Phe Val Gly Asp

130 135 140

Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala

145 150 155 160

Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly

165 170 175

Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln

180 185 190

Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser

195 200 205

Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala

210 215 220

Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly

225 230 235 240

Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser

245 250 255

Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala

260 265 270

Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn

275 280 285

Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val

290 295 300

Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala

305 310 315 320

Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr

325 330 335

Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His

340 345 350

Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp

355 360 365

Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile

370 375 380

Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val

385 390 395 400

Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly

405 410 415

Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu

420 425 430

Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp

435 440 445

Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu

450 455 460

<210>36

<211>718

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>36

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr

20 25 30

Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu

35 40 45

Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile

50 55 60

Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys

65 70 75 80

Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys

85 90 95

Arg Lys Arg Tyr Val Mer Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys

100 105 110

Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys

115 120 125

Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile

130 135 140

Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro

145 150 155 160

Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp

165 170 175

Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro

180 185 190

Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln

195 200 205

Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg

210 215 220

Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu

225 230 235 240

Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp

245 250 255

Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly

260 265 270

Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys

275 280 285

Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro

290 295 300

Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp

305 310 315 320

Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile

325 330 335

Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile

340 345 350

Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu

355 360 365

Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg

370 375 380

Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met

385 390 395 400

Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile

405 410 415

Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp

420 425 430

Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln

435 440 445

Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp

450 455 460

Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met

465 470 475 480

Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr

485 490 495

Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu

500 505 510

Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr

515 520 525

Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys

530 535 540

Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp

545 550 555 560

Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Va1 Gly Lys Tyr Leu Leu

565 570 575

Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro

580 585 590

Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys

595 600 605

Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly

610 615 620

Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr

625 630 635 640

Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu

645 650 655

Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser

660 665 670

Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln

675 680 685

Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys

690 695 700

Ile Arg Gly Lys Ile Asn Leu Glu Ser Glu Lys Asp Glu Leu

705 710 715

<210>37

<211>1434

<212>DNA

<213>海栖热袍菌

<400>37

atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt 60

accctggtgc cacgcggttc catggccgag ttcttcccgg agatcccgaa gatccagttc 120

gagggcaagg agtccaccaa cccgctcgcc ttccgcttct acgacccgaa cgaggtgatc 180

gacggcaagc cgctcaagga ccacctcaag ttctccgtgg ccttctggca caccttcgtg 240

aacgagggcc gcgacccgtt cggcgacccg accgccgagc gcccgtggaa ccgcttctcc 300

gacccgatgg acaaggcctt cgcccgcgtg gacgccctct tcgagttctg cgagaagctc 360

aacatcgagt acttctgctt ccacgaccgc gacatcgccc cggagggcaa gaccctccgc 420

gagaccaaca agatcctcga caaggtggtg gagcgcatca aggagcgcat gaaggactcc 480

aacgtgaagc tcctctgggg caccgccaac ctcttctccc acccgcgcta catgcacggc 540

gccgccacca cctgctccgc cgacgtgttc gcctacgccg ccgcccaggt gaagaaggcc 600

ctggagatca ccaaggagct gggcggcgag ggctacgtgt tctggggcgg ccgcgagggc 660

tacgagaccc tcctcaacac cgacctcggc ctggagctgg agaacctcgc ccgcttcctc 720

cgcatggccg tggagtacgc caagaagatc ggcttcaccg gccagttcct catcgagccg 780

aagccgaagg agccgaccaa gcaccagtac gacttcgacg tggccaccgc ctacgccttc 840

ctcaagaacc acggcctcga cgagtacttc aagttcaaca tcgaggccaa ccacgccacc 900

ctcgccggcc acaccttcca gcacgagctg cgcatggccc gcatcctcgg caagctcggc 960

tccatcgacg ccaaccaggg cgacctcctc ctcggctggg acaccgacca gttcccgacc 1020

aacatctacg acaccaccct cgccatgtac gaggtgatca aggccggcgg cttcaccaag 1080

ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct acaaggtgga ggacctcttc 1140

atcggccaca tcgccggcat ggacaccttc gccctcggct tcaagatcgc ctacaagctc 1200

gccaaggacg gcgtgttcga caagttcatc gaggagaagt accgctcctt caaggagggc 1260

atcggcaagg agatcgtgga gggcaagacc gacttcgaga agctggagga gtacatcatc 1320

gacaaggagg acatcgagct gccgtccggc aagcaggagt acctggagtc cctcctcaac 1380

tcctacatcg tgaagaccat cgccgagctg cgctccgaga aggacgagct gtga 1434

<210>38

<211>477

<212>PRT

<213>海栖热袍菌

<400>38

Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser

1 5 10 15

Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Glu Phe Phe

20 25 30

Pro Glu Ile Pro Lys Ile Gln Phe Glu Gly Lys Glu Ser Thr Asn Pro

35 40 45

Leu Ala Phe Arg Phe Tyr Asp Pro Asn Glu Val Ile Asp Gly Lys Pro

50 55 60

Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe Trp His Thr Phe Val

65 70 75 80

Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr Ala Glu Arg Pro Trp

85 90 95

Asn Arg Phe Ser Asp Pro Met Asp Lys Ala Phe Ala Arg Val Asp Ala

100 105 110

Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu Tyr Phe Cys Phe His

115 120 125

Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu Arg Glu Thr Asn Lys

130 135 140

Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu Arg Met Lys Asp Ser

145 150 155 160

Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu Phe Ser His Pro Arg

165 170 175

Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala Asp Val Phe Ala Tyr

180 185 190

Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile Thr Lys Glu Leu Gly

195 200 205

Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu Gly Tyr Glu Thr Leu

210 215 220

Leu Asn Thr Asp Leu Gly Leu Glu Leu Glu Asn Leu Ala Arg Phe Leu

225 230 235 240

Arg Met Ala Val Glu Tyr Ala Lys Lys Ile Gly Phe Thr Gly Gln Phe

245 250 255

Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys His Gln Tyr Asp Phe

260 265 270

Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Asn His Gly Leu Asp Glu

275 280 285

Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala Thr Leu Ala Gly His

290 295 300

Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile Leu Gly Lys Leu Gly

305 310 315 320

Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu Gly Trp Asp Thr Asp

325 330 335

Gln Phe Pro Thr Asn Ile Tyr Asp Thr Thr Leu Ala Met Tyr Glu Val

340 345 350

Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu Asn Phe Asp Ala Lys

355 360 365

Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu Phe Ile Gly His Ile

370 375 380

Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys Ile Ala Tyr Lys Leu

385 390 395 400

Ala Lys Asp Gly Val Phe Asp Lys Phe Ile Glu Glu Lys Tyr Arg Ser

405 410 415

Phe Lys Glu Gly Ile Gly Lys Glu Ile Val Glu Gly Lys Thr Asp Phe

420 425 430

Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu Asp Ile Glu Leu Pro

435 440 445

Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Leu Asn Ser Tyr Ile Val

450 455 460

Lys Thr Ile Ala Glu Leu Arg Ser Glu Lys Asp Glu Leu

465 470 475

<210>39

<211>1434

<212>DNA

<213>那不勒斯栖热袍菌

<400>39

atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt 60

accctggtgc cacgcggttc catggccgag ttcttcccgg agatcccgaa ggtgcagttc 120

gagggcaagg agtccaccaa cccgctcgcc ttcaagttct acgacccgga ggagatcatc 180

gacggcaagc cgctcaagga ccacctcaag ttctccgtgg ccttctggca caccttcgtg 240

aacgagggcc gcgacccgtt cggcgacccg accgccgacc gcccgtggaa ccgctacacc 300

gacccgatgg acaaggcctt cgcccgcgtg gacgccctct tcgagttctg cgagaagctc 360

aacatcgagt acttctgctt ccacgaccgc gacatcgccc cggagggcaa gaccctccgc 420

gagaccaaca agatcctcga caaggtggtg gagcgcatca aggagcgcat gaaggactcc 480

aacgtgaagc tcctctgggg caccgccaac ctcttctccc acccgcgcta catgcacggc 540

gccgccacca cctgctccgc cgacgtgttc gcctacgccg ccgcccaggt gaagaaggcc 600

ctggagatca ccaaggagct gggcggcgag ggctacgtgt tctggggcgg ccgcgagggc 660

tacgagaccc tcctcaacac cgacctcggc ttcgagctgg agaacctcgc ccgcttcctc 720

cgcatggccg tggactacgc caagcgcatc ggcttcaccg gccagttcct catcgagccg 780

aagccgaagg agccgaccaa gcaccagtac gacttcgacg tggccaccgc ctacgccttc 840

ctcaagtccc acggcctcga cgagtacttc aagttcaaca tcgaggccaa ccacgccacc 900

ctcgccggcc acaccttcca gcacgagctg cgcatggccc gcatcctcgg caagctcggc 960

tccatcgacg ccaaccaggg cgacctcctc ctcggctggg acaccgacca gttcccgacc 1020

aacgtgtacg acaccaccct cgccatgtac gaggtgatca aggccggcgg cttcaccaag 1080

ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct acaaggtgga ggacctcttc 1140

atcggccaca tcgccggcat ggacaccttc gccctcggct tcaaggtggc ctacaagctc 1200

gtgaaggacg gcgtgctcga caagttcatc gaggagaagt accgctcctt ccgcgagggc 1260

atcggccgcg acatcgtgga gggcaaggtg gacttcgaga agctggagga gtacatcatc 1320

gacaaggaga ccatcgagct gccgtccggc aagcaggagt acctggagtc cctcatcaac 1380

tcctacatcg tgaagaccat cctggagctg cgctccgaga aggacgagct gtga 1434

<210>40

<211>477

<212>PRT

<213>那不勒斯栖热袍菌

<400>40

Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser

1 5 10 15

Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Glu Phe Phe

20 25 30

Pro Glu Ile Pro Lys Val Gln Phe Glu Gly Lys Glu Ser Thr Asn Pro

35 40 45

Leu Ala Phe Lys Phe Tyr Asp Pro Glu Glu Ile Ile Asp Gly Lys Pro

50 55 60

Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe Trp His Thr Phe Val

65 70 75 80

Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr Ala Asp Arg Pro Trp

85 90 95

Asn Arg Tyr Thr Asp Pro Met Asp Lys Ala Phe Ala Arg Val Asp Ala

100 105 110

Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu Tyr Phe Cys Phe His

115 120 125

Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu Arg Glu Thr Asn Lys

130 135 140

Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu Arg Met Lys Asp Ser

145 150 155 160

Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu Phe Ser His Pro Arg

165 170 175

Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala Asp Val Phe Ala Tyr

180 185 190

Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile Thr Lys Glu Leu Gly

195 200 205

Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu Gly Tyr Glu Thr Leu

210 215 220

Leu Asn Thr Asp Leu Gly Phe Glu Leu Glu Asn Leu Ala Arg Phe Leu

225 230 235 240

Arg Met Ala Val Asp Tyr Ala Lys Arg Ile Gly Phe Thr Gly Gln Phe

245 250 255

Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys His Gln Tyr Asp Phe

260 265 270

Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Ser His Gly Leu Asp Glu

275 280 285

Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala Thr Leu Ala Gly His

290 295 300

Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile Leu Gly Lys Leu Gly

305 310 315 320

Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu Gly Trp Asp Thr Asp

325 330 335

Gln Phe Pro Thr Asn Val Tyr Asp Thr Thr Leu Ala Met Tyr Glu Val

340 345 350

Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu Asn Phe Asp Ala Lys

355 360 365

Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu Phe Ile Gly His Ile

370 375 380

Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys Val Ala Tyr Lys Leu

385 390 395 400

Val Lys Asp Gly Val Leu Asp Lys Phe Ile Glu Glu Lys Tyr Arg Ser

405 410 415

Phe Arg Glu Gly Ile Gly Arg Asp Ile Val Glu Gly Lys Val Asp Phe

420 425 430

Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu Thr Ile Glu Leu Pro

435 440 445

Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Ile Asn Ser Tyr Ile Val

450 455 460

Lys Thr Ile Leu Glu Leu Arg Ser Glu Lys Asp Glu Leu

465 470 475

<210>41

<211>1435

<212>DNA

<213>海栖热袍菌

<400>41

atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60

atggctagca tgactggtgg acagcaaatg ggtcggatcc ccatggccga gttcttcccg 120

gagatcccga agatccagtt cgagggcaag gagtccacca acccgctcgc cttccgcttc 180

tacgacccga acgaggtgat cgacggcaag ccgctcaagg accacctcaa gttctccgtg 240

gccttctggc acaccttcgt gaacgagggc cgcgacccgt tcggcgaccc gaccgccgag 300

cgcccgtgga accgcttctc cgacccgatg gacaaggcct tcgcccgcgt ggacgccctc 360

ttcgagttct gcgagaagct caacatcgag tacttctgct tccacgaccg cgacatcccc 420

cggagggcaa gaccctccgc gagaccaaca agatcctcga caaggtggtg gagcgcatca 480

aggagcgcat gaaggactcc aacgtgaagc tcctctgggg caccgccaac ctcttctccc 540

acccgcgcta catgcacggc gccgccacca cctgctccgc cgacgtgttc gcctacgccg 600

ccgcccaggt gaagaaggcc ctggagatca ccaaggagct gggcggcgag ggctacgtgt 660

tctggggcgg ccgcgagggc tacgagaccc tcctcaacac cgacctcggc ctggagctgg 720

agaacctcgc ccgcttcctc cgcatggccg tggagtacgc caagaagatc ggcttcaccg 780

gccagttcct catcgagccg aagccgaagg agccgaccaa gcaccagtac gcttcgacgt 840

ggccaccgcc tacgccttcc tcaagaacca cggcctcgac gagtacttca agttcaacat 900

cgaggccaac cacgccaccc tcgccggcca caccttccag cacgagctgc gcatggcccg 960

catcctcggc aagctcggct ccatcgacgc caaccagggc gacctcctcc tcggctggga 1020

caccgaccag ttcccgacca acatctacga caccaccctc gccatgtacg aggtgatcaa 1080

ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc aaggtgcgcc gcgcctccta 1140

caaggtggag gacctcttca tcggccacat cgccggcatg gacaccttcg ccctcggctt 1200

caagatcgcc tacaagctcg ccaaggacgg cgtgttcgac aagttcatcg aggagaagta 1260

ccgctccttc aaggagggca tcggcaagga gatcgtggag ggcaagaccg acttcgagaa 1320

gctggaggag tacatcatcg acaaggagga catcgagctg ccgtccggca agcaggagta 1380

cctggagtcc ctcctcaact cctacatcgt gaagaccatc gccgagctgc gctga 1435

<210>42

<211>478

<212>PRT

<213>海栖热袍菌

<400>42

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg

20 25 30

Ile Pro Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile G1n Phe Glu

35 40 45

Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro Asn

50 55 60

Glu Val Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val

65 70 75 80

Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp

85 90 95

Pro Thr Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp Lys

100 105 110

Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn

115 120 125

Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys

130 135 140

Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile

145 150 155 160

Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala

165 170 175

Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys

180 185 190

Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu

195 200 205

Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly

210 215 220

Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu Leu

225 230 235 240

Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys Lys

245 250 255

Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro

260 265 270

Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu

275 280 285

Lys Asn His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn

290 295 300

His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala

305 310 315 320

Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu

325 330 335

LeL Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp Thr

340 345 350

Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly

355 360 365

Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu

370 375 380

Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly

385 390 395 400

Phe Lys Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys Phe

405 410 415

Ile Glu Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu Ile

420 425 430

Val Glu Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp

435 440 445

Lys Glu Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser

450 455 460

Leu Leu Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg

465 470 475

<210>43

<211>1436

<212>DNA

<213>那不勒斯栖热袍菌

<400>43

atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60

atggctagca tgactggtgg acagcaaatg ggtcggatcc ccatggccga gttcttcccg 120

gagatcccga aggtgcagtt cgagggcaag gagtccacca acccgctcgc cttcaagttc 180

tacgacccgg aggagatcat cgacggcaag ccgctcaagg accacctcaa gttctccgtg 240

gccttctggc acaccttcgt gaacgagggc cgcgacccgt tcggcgaccc gaccgccgac 300

cgcccgtgga accgctacac cgacccgatg gacaaggcct tcgcccgcgt ggacgccctc 360

ttcgagttct gcgagaagct caacatcgag tacttctgct tccacgaccg cgacatcccc 420

cggagggcaa gaccctccgc gagaccaaca agatcctcga caaggtggtg gagcgcatca 480

aggagcgcat gaaggactcc aacgtgaagc tcctctgggg caccgccaac ctcttctccc 540

acccgcgcta catgcacggc gccgccacca cctgctccgc cgacgtgttc gcctacgccg 600

ccgcccaggt gaagaaggcc ctggagatca ccaaggagct gggcggcgag ggctacgtgt 660

tctggggcgg ccgcgagggc tacgagaccc tcctcaacac cgacctcggc ttcgagctgg 720

agaacctcgc ccgcttcctc cgcatggccg tggactacgc caagcgcatc ggcttcaccg 780

gccagttcct catcgagccg aagccgaagg agccgaccaa gcaccagtac gacttcgacg 840

tggccaccgc ctacgccttc ctcaagtccc acggcctcga cgagtacttc aagttcaaca 900

tcgaggccaa ccacgccacc ctcgccggcc acaccttcca gcacgagctg cgcatggccc 960

gcatcctcgg caagctcggc tccatcgacg ccaaccaggg cgacctcctc ctcggctggg 1020

acaccgacca gttcccgacc aacgtgtacg acaccaccct cgccatgtac gaggtgatca 1080

aggccggcgg cttcaccaag ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct 1140

acaaggtgga ggacctcttc atcggccaca tcgccggcat ggacaccttc gccctcggct 1200

tcaaggtggc ctacaagctc gtgaaggacg gcgtgctcga caagttcatc gaggagaagt 1260

accgctcctt ccgcgagggc atcggccgcg acatcgtgga gggcaaggtg gacttcgaga 1320

agctggagga gtacatcatc gacaaggaga ccatcgagct gccgtccggc aagcaggagt 1380

acctggagtc cctcatcaac tcctacatcg tgaagaccat cctggagctg cgctga 1436

<210>44

<211>478

<212>PRT

<213>那不勒斯栖热袍菌

<400>44

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg

20 25 30

Ile Pro Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe Glu

35 40 45

Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro Glu

50 55 60

Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val

65 70 75 80

Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp

85 90 95

Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp Lys

100 105 110

Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn

115 120 125

Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys

130 135 140

Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile

145 150 155 160

Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala

165 170 175

Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys

180 185 190

Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu

195 200 205

Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly

210 215 220

Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu Leu

225 230 235 240

Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys Arg

245 250 255

Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro

260 265 270

Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu

275 280 285

Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn

290 295 300

His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala

305 310 315 320

Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu

325 330 335

Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp Thr

340 345 350

Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly

355 360 365

Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu

370 375 380

Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly

385 390 395 400

Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys Phe

405 410 415

Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp Ile

420 425 430

Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp

435 440 445

Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser

450 455 460

Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg

465 470 475

<210>45

<211>1095

<212>PRT

<213>Aspergillus shirousami

<400>45

Ala Thr Pro Ala Asp Trp Arg Ser Gln Ser Ile Tyr Phe Leu Leu Thr

1 5 10 15

Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala Thr Cys Asn Thr

20 25 30

Ala Asp Gln Lys Tyr Cys Gly Gly Thr Trp Gln Gly Ile Ile Asp Lys

35 40 45

Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile Trp Ile Thr Pro

50 55 60

Val Thr Ala Gln Leu Pro Gln Thr Thr Ala Tyr Gly Asp Ala Tyr His

65 70 75 80

Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asn Glu Asn Tyr Gly Thr

85 90 95

Ala Asp Asp Leu Lys Ala Leu Ser Ser Ala Leu His Glu Arg Gly Met

100 105 110

Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly Tyr Asp Gly Ala

115 120 125

Gly Ser Ser Val Asp Tyr Ser Val Phe Lys Pro Phe Ser Ser Gln Asp

130 135 140

Tyr Phe His Pro Phe Cys Phe Ile Gln Asn Tyr Glu Asp Gln Thr Gln

145 150 155 160

Val Glu Asp Cys Trp Leu Gly Asp Asn Thr Val Ser Leu Pro Asp Leu

165 170 175

Asp Thr Thr Lys Asp Val Val Lys Asn Glu Trp Tyr Asp Trp Val Gly

180 185 190

Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg Ile Asp Thr Val

195 200 205

Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn Lys Ala Ala Gly

210 215 220

Val Tyr Cys Ile Gly Glu Val Leu Asp Val Asp Pro Ala Tyr Thr Cys

225 230 235 240

Pro Tyr Gln Asn Val Met Asp Gly Val Leu Asn Tyr Pro Ile Tyr Tyr

245 250 255

Pro Leu Leu Asn Ala Phe Lys Ser Thr Ser Gly Ser Met Asp Asp Leu

260 265 270

Tyr Asn Met Ile Asn Thr Val Lys Ser Asp Cys Pro Asp Ser Thr Leu

275 280 285

Leu Gly Thr Phe Val Glu Asn His Asp Asn Pro Arg Phe Ala Ser Tyr

290 295 300

Thr Asn Asp Ile Ala Leu Ala Lys Asn Val Ala Ala Phe Ile Ile Leu

305 310 315 320

Asn Asp Gly Ile Pro Ile Ile Tyr Ala Gly Gln Glu Gln His Tyr Ala

325 330 335

Gly Gly Asn Asp Pro Ala Asn Arg Glu Ala Thr Trp Leu Ser Gly Tyr

340 345 350

Pro Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Ser Ala Asn Ala Ile

355 360 365

Arg Asn Tyr Ala Ile Ser Lys Asp Thr Gly Phe Val Thr Tyr Lys Asn

370 375 380

Trp Pro Ile Tyr Lys Asp Asp Thr Thr Ile Ala Met Arg Lys Gly Thr

385 390 395 400

Asp Gly Ser Gln Ile Val Thr Ile Leu Ser Asn Lys Gly Ala Ser Gly

405 410 415

Asp Ser Tyr Thr Leu Ser Leu Ser Gly Ala Gly Tyr Thr Ala Gly Gln

420 425 430

Gln Leu Thr Glu Val Ile Gly Cys Thr Thr Val Thr Val Gly Ser Asp

435 440 445

Gly Asn Val Pro Val Pro Met Ala Gly Gly Leu Pro Arg Val Leu Tyr

450 455 460

Pro Thr Glu Lys Leu Ala Gly Ser Lys Ile Cys Ser Ser Ser Lys Pro

465 470 475 480

Ala Thr Leu Asp Ser Trp Leu Ser Asn Glu Ala Thr Val Ala Arg Thr

485 490 495

Ala Ile Leu Asn Asn Ile Gly Ala Asp Gly Ala Trp Val Ser Gly Ala

500 505 510

Asp Ser Gly Ile Val Val Ala Ser Pro Ser Thr Asp Asn Pro Asp Tyr

515 520 525

Phe Tyr Thr Trp Thr Arg Asp Ser Gly Ile Val Leu Lys Thr Leu Val

530 535 540

Asp Leu Phe Arg Asn Gly Asp Thr Asp Leu Leu Ser Thr Ile Glu His

545 550 555 560

Tyr Ile Ser Ser Gln Ala Ile Ile Gln Gly Val Ser Asn Pro Ser Gly

565 570 575

Asp Leu Ser Ser Gly Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Glu

580 585 590

Thr Ala Tyr Ala Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala

595 600 605

Leu Arg Ala Thr Ala Met Ile Gly Phe Gly Gln Trp Leu Leu Asp Asn

610 615 620

Gly Tyr Thr Ser Ala Ala Thr Glu Ile Val Trp Pro Leu Val Arg Asn

625 630 635 640

Asp Leu Ser Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Tyr Asp Leu

645 650 655

Trp Glu Glu Val Asn Gly Ser Ser Phe Phe Thr Ile Ala Val Gln His

660 665 670

Arg Ala Leu Val Glu Gly Ser Ala Phe Ala Thr Ala Val Gly Ser Ser

675 680 685

Cys Ser Trp Cys Asp Ser Gln Ala Pro Gln Ile Leu Cys Tyr Leu Gln

690 695 700

Ser Phe Trp Thr Gly Ser Tyr Ile Leu Ala Asn Phe Asp Ser Ser Arg

705 710 715 720

Ser Gly Lys Asp Thr Asn Thr Leu Leu Gly Ser Ile His Thr Phe Asp

725 730 735

Pro Glu Ala Gly Cys Asp Asp Ser Thr Phe Gln Pro Cys Ser Pro Arg

740 745 750

Ala Leu Ala Asn His Lys Glu Val Val Asp Ser Phe Arg Ser Ile Tyr

755 760 765

Thr Leu Asn Asp Gly Leu Ser Asp Ser Glu Ala Val Ala Val Gly Arg

770 775 780

Tyr Pro Glu Asp Ser Tyr Tyr Asn Gly Asn Pro Trp Phe Leu Cys Thr

785 790 795 800

Leu Ala Ala Ala Glu Gln Leu Tyr Asp Ala Leu Tyr Gln Trp Asp Lys

805 810 815

Gln Gly Ser Leu Glu Ile Thr Asp Val Ser Leu Asp Phe Phe Lys Ala

820 825 830

Leu Tyr Ser Gly Ala Ala Thr Gly Thr Tyr Ser Ser Ser Ser Ser Thr

835 840 845

Tyr Ser Ser Ile Val Ser Ala Val Lys Thr Phe Ala Asp Gly Phe Val

850 855 860

Ser Ile Val Glu Thr His Ala Ala Ser Asn Gly Ser Leu Ser Glu Gln

865 870 875 880

Phe Asp Lys Ser Asp Gly Asp Glu Leu Ser Ala Arg Asp Leu Thr Trp

885 890 895

Ser Tyr Ala Ala Leu Leu Thr Ala Asn Asn Arg Arg Asn Ser Val Val

900 905 910

Pro Pro Ser Trp Gly Glu Thr Ser Ala Ser Ser Val Pro Gly Thr Cys

915 920 925

Ala Ala Thr Ser Ala Ser Gly Thr Tyr Ser Ser Val Thr Val Thr Ser

930 935 940

Trp Pro Ser Ile Val Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Thr

945 950 955 960

Thr Gly Ser Gly Gly Val Thr Ser Thr Ser Lys Thr Thr Thr Thr Ala

965 970 975

Ser Lys Thr Ser Thr Thr Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr

980 985 990

Ala Val Ala Val Thr Phe Asp Leu Thr Ala Thr Thr Thr Tyr Gly Glu

995 1000 1005

Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln Leu Gly Asp Trp Glu Thr

1010 1015 1020

Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys Tyr Thr Ser Ser Asn Pro

1025 1030 1035 1040

Pro Trp Tyr Val Thr Val Thr Leu Pro Ala Gly Glu Ser Phe Glu Tyr

1045 1050 1055

Lys Phe Ile Arg Val Glu Ser Asp Asp Ser Val Glu Trp Glu Ser Asp

1060 1065 1070

Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala Cys Gly Glu Ser Thr Ala

1075 1080 1085

Thr Val Thr Asp Thr Trp Arg

1090 1095

<210>46

<211>3285

<212>DNA

<213>Aspergillus shirousami

<400>46

gccaccccgg ccgactggcg ctcccagtcc atctacttcc tcctcaccga ccgcttcgcc 60

cgcaccgacg gctccaccac cgccacctgc aacaccgccg accagaagta ctgcggcggc 120

acctggcagg gcatcatcga caagctcgac tacatccagg gcatgggctt caccgccatc 180

tggatcaccc cggtgaccgc ccagctcccg cagaccaccg cctacggcga cgcctaccac 240

ggctactggc agcaggacat ctactccctc aacgagaact acggcaccgc cgacgacctc 300

aaggccctct cctccgccct ccacgagcgc ggcatgtacc tcatggtgga cgtggtggcc 360

aaccacatgg gctacgacgg cgccggctcc tccgtggact actccgtgtt caagccgttc 420

tcctcccagg actacttcca cccgttctgc ttcatccaga actacgagga ccagacccag 480

gtggaggact gctggctcgg cgacaacacc gtgtccctcc cggacctcga caccaccaag 540

gacgtggtga agaacgagtg gtacgactgg gtgggctccc tcgtgtccaa ctactccatc 600

gacggcctcc gcatcgacac cgtgaagcac gtgcagaagg acttctggcc gggctacaac 660

aaggccgccg gcgtgtactg catcggcgag gtgctcgacg tggacccggc ctacacctgc 720

ccgtaccaga acgtgatgga cggcgtgctc aactacccga tctactaccc gctcctcaac 780

gccttcaagt ccacctccgg ctcgatggac gacctctaca acatgatcaa caccgtgaag 840

tccgactgcc cggactccac cctcctcggc accttcgtgg agaaccacga caacccgcgc 900

ttcgcctcct acaccaacga catcgccctc gccaagaacg tggccgcctt catcatcctc 960

aacgacggca tcccgatcat ctacgccggc caggagcagc actacgccgg cggcaacgac 1020

ccggccaacc gcgaggccac ctggctctcc ggctacccga ccgactccga gctgtacaag 1080

ctcatcgcct ccgccaacgc catccgcaac tacgccatct ccaaggacac cggcttcgtg 1140

acctacaaga actggccgat ctacaaggac gacaccacca tcgccatgcg caagggcacc 1200

gacggctccc agatcgtgac catcctctcc aacaagggcg cctccggcga ctcctacacc 1260

ctctccctct ccggcgccgg ctacaccgcc ggccagcagc tcaccgaggt gatcggctgc 1320

accaccgtga ccgtgggctc cgacggcaac gtgccggtgc cgatggccgg cggcctcccg 1380

cgcgtgctct acccgaccga gaagctcgcc ggctccaaga tatgctcctc ctccaagccg 1440

gccaccctcg actcctggct ctccaacgag gccaccgtgg cccgcaccgc catcctcaac 1500

aacatcggcg ccgacggcgc ctgggtgtcc ggcgccgact ccggcatcgt ggtggcctcc 1560

ccgtccaccg acaacccgga ctacttctac acctggaccc gcgactccgg catcgtgctc 1620

aagaccctcg tggacctctt ccgcaacggc gacaccgacc tcctctccac catcgagcac 1680

tacatctcct cccaggccat catccagggc gtgtccaacc cgtccggcga cctctcctcc 1740

ggcggcctcg gcgagccgaa gttcaacgtg gacgagaccg cctacgccgg ctcctggggc 1800

cgcccgcagc gcgacggccc ggccctccgc gccaccgcca tgatcggctt cggccagtgg 1860

ctcctcgaca acggctacac ctccgccgcc accgagatcg tgtggccgct cgtgcgcaac 1920

gacctctcct acgtggccca gtactggaac cagaccggct acgacctctg ggaggaggtg 1980

aacggctcct ccttcttcac catcgccgtg cagcaccgcg ccctcgtgga gggctccgcc 2040

ttcgccaccg ccgtgggctc ctcctgctcc tggtgcgact cccaggcccc gcagatcctc 2100

tgctacctcc agtccttctg gaccggctcc tacatcctcg ccaacttcga ctcctcccgc 2160

tccggcaagg acaccaacac cctcctcggc tccatccaca ccttcgaccc ggaggccggc 2220

tgcgacgact ccaccttcca gccgtgctcc ccgcgcgccc tcgccaacca caaggaggtg 2280

gtggactcct tccgctccat ctacaccctc aacgacggcc tctccgactc cgaggccgtg 2340

gccgtgggcc gctacccgga ggactcctac tacaacggca acccgtggtt cctctgcacc 2400

ctcgccgccg ccgagcagct ctacgacgcc ctctaccagt gggacaagca gggctccctg 2460

gagatcaccg acgtgtccct cgacttcttc aaggccctct actccggcgc cgccaccggc 2520

acctactcct cctcctcctc cacctactcc tccatcgtgt ccgccgtgaa gaccttcgcc 2580

gacggcttcg tgtccatcgt ggagacccac gccgcctcca acggctccct ctccgagcag 2640

ttcgacaagt ccgacggcga cgagctgtcc gcccgcgacc tcacctggtc ctacgccgcc 2700

ctcctcaccg ccaacaaccg ccgcaactcc gtggtgccgc cgtcctgggg cgagacctcc 2760

gcctcctccg tgccgggcac ctgcgccgcc acctccgcct ccggcaccta ctcctccgtg 2820

accgtgacct cctggccgtc catcgtggcc accggcggca ccaccaccac cgccaccacc 2880

accggctccg gcggcgtgac ctccacctcc aagaccacca ccaccgcctc caagacctcc 2940

accaccacct cctccacctc ctgcaccacc ccgaccgccg tggccgtgac cttcgacctc 3000

accgccacca ccacctacgg cgagaacatc tacctcgtgg gctccatctc ccagctcggc 3060

gactgggaga cctccgacgg catcgccctc tccgccgaca agtacacctc ctccaacccg 3120

ccgtggtacg tgaccgtgac cctcccggcc ggcgagtcct tcgagtacaa gttcatccgc 3180

gtggagtccg acgactccgt ggagtgggag tccgacccga accgcgagta caccgtgccg 3240

caggcctgcg gcgagtccac cgccaccgtg accgacacct ggcgc 3285

<210>47

<211>679

<212>PRT

<213>Thermoanaerobacterium thermosaccharolyticum

<400>47

Val Leu Ser Gly Cys Ser Asn Asn Val Ser Ser Ile Lys Ile Asp Arg

1 5 10 15

Phe Asn Asn Ile Ser Ala Val Asn Gly Pro Gly Glu Glu Asp Thr Trp

20 25 30

Ala Ser Ala Gln Lys Gln Gly Val Gly Thr Ala Asn Asn Tyr Val Ser

35 40 45

Arg Val Trp Phe Thr Leu Ala Asn Gly Ala Ile Ser Glu Val Tyr Tyr

50 55 60

Pro Thr Ile Asp Thr Ala Asp Val Lys Glu Ile Lys Phe Ile Val Thr

65 70 75 80

Asp Gly Lys Ser Phe Val Ser Asp Glu Thr Lys Asp Ala Ile Ser Lys

85 90 95

Val Glu Lys Phe Thr Asp Lys Ser Leu Gly Tyr Lys Leu Val Asn Thr

100 105 110

Asp Lys Lys Gly Arg Tyr Arg Ile Thr Lys Glu Ile Phe Thr Asp Val

115 120 125

Lys Arg Asn Ser Leu Ile Met Lys Ala Lys Phe Glu Ala Leu Glu Gly

130 135 140

Ser Ile His Asp Tyr Lys Leu Tyr Leu Ala Tyr Asp Pro His Ile Lys

145 150 155 160

Asn Gln Gly Ser Tyr Asn Glu Gly Tyr Val Ile Lys Ala Asn Asn Asn

165 170 175

Glu Met Leu Met Ala Lys Arg Asp Asn Val Tyr Thr Ala Leu Ser Ser

180 185 190

Asn Ile Gly Trp Lys Gly Tyr Ser Ile Gly Tyr Tyr Lys Val Asn Asp

195 200 205

Ile Met Thr Asp Leu Asp Glu Asn Lys Gln Met Thr Lys His Tyr Asp

210 215 220

Ser Ala Arg Gly Asn Ile Ile Glu Gly Ala Glu Ile Asp Leu Thr Lys

225 230 235 240

Asn Ser Glu Phe Glu Ile Val Leu Ser Phe Gly Gly Ser Asp Ser Glu

245 250 255

Ala Ala Lys Thr Ala Leu Glu Thr Leu Gly Glu Asp Tyr Asn Asn Leu

260 265 270

Lys Asn Asn Tyr Ile Asp Glu Trp Thr Lys Tyr Cys Asn Thr Leu Asn

275 280 285

Asn Phe Asn Gly Lys Ala Asn Ser Leu Tyr Tyr Asn Ser Met Met Ile

290 295 300

Leu Lys Ala Ser Glu Asp Lys Thr Asn Lys Gly Ala Tyr Ile Ala Ser

305 310 315 320

Leu Ser Ile Pro Trp Gly Asp Gly Gln Arg Asp Asp Asn Thr Gly Gly

325 330 335

Tyr His Leu Val Trp Ser Arg Asp Leu Tyr His Val Ala Asn Ala Phe

340 345 350

Ile Ala Ala Gly Asp Val Asp Ser Ala Asn Arg Ser Leu Asp Tyr Leu

355 360 365

Ala Lys Val Val Lys Asp Asn Gly Met Ile Pro Gln Asn Thr Trp Ile

370 375 380

Ser Gly Lys Pro Tyr Trp Thr Ser Ile Gln Leu Asp Glu Gln Ala Asp

385 390 395 400

Pro Ile Ile Leu Ser Tyr Arg Leu Lys Arg Tyr Asp Leu Tyr Asp Ser

405 410 415

Leu Val Lys Pro Leu Ala Asp Phe Ile Ile Lys Ile Gly Pro Lys Thr

420 425 430

Gly Gln Glu Arg Trp Glu Glu Ile Gly Gly Tyr Ser Pro Ala Thr Met

435 440 445

Ala Ala Glu Val Ala Gly Leu Thr Cys Ala Ala Tyr Ile Ala Glu Gln

450 455 460

Asn Lys Asp Tyr Glu Ser Ala Gln Lys Tyr Gln Glu Lys Ala Asp Asn

465 470 475 480

Trp Gln Lys Leu Ile Asp Asn Leu Thr Tyr Thr Glu Asn Gly Pro Leu

485 490 495

Gly Asn Gly Gln Tyr Tyr Ile Arg Ile Ala Gly Leu Ser Asp Pro Asn

500 505 510

Ala Asp Phe Met Ile Asn Ile Ala Asn Gly Gly Gly Val Tyr Asp Gln

515 520 525

Lys Glu Ile Val Asp Pro Ser Phe Leu Glu Leu Val Arg Leu Gly Val

530 535 540

Lys Ser Ala Asp Asp Pro Lys Ile Leu Asn Thr Leu Lys Val Val Asp

545 550 555 560

Ser Thr Ile Lys Val Asp Thr Pro Lys Gly Pro Ser Trp Tyr Arg Tyr

565 570 575

Asn His Asp Gly Tyr Gly Glu Pro Ser Lys Thr Glu Leu Tyr His Gly

580 585 590

Ala Gly Lys Gly Arg Leu Trp Pro Leu Leu Thr Gly Glu Arg Gly Met

595 600 605

Tyr Glu Ile Ala Ala Gly Lys Asp Ala Thr Pro Tyr Val Lys Ala Met

610 615 620

Glu Lys Phe Ala Asn Glu Gly Gly Ile Ile Ser Glu Gln Val Trp Glu

625 630 635 640

Asp Thr Gly Leu Pro Thr Asp Ser Ala Ser Pro Leu Asn Trp Ala His

645 650 655

Ala Glu Tyr Val Ile Leu Phe Ala Ser Asn Ile Glu His Lys Val Leu

660 665 670

Asp Met Pro Asp Ile Val Tyr

675

<210>48

<211>2037

<212>DNA

<213>Thermoanaerobacterium thermosaccharolyticum

<220>

<223>合成的

<400>48

gtgctctccg gctgctccaa caacgtgtcc tccatcaaga tcgaccgctt caacaacatc 60

tccgccgtga acggcccggg cgaggaggac acctgggcct ccgcccagaa gcagggcgtg 120

ggcaccgcca acaactacgt gtcccgcgtg tggttcaccc tcgccaacgg cgccatctcc 180

gaggtgtact acccgaccat cgacaccgcc gacgtgaagg agatcaagtt catcgtgacc 240

gacggcaagt ccttcgtgtc cgacgagacc aaggacgcca tctccaaggt ggagaagttc 300

accgacaagt ccctcggcta caagctcgtg aacaccgaca agaagggccg ctaccgcatc 360

accaaggaaa tcttcaccga cgtgaagcgc aactccctca tcatgaaggc caagttcgag 420

gccctcgagg gctccatcca cgactacaag ctctacctcg cctacgaccc gcacatcaag 480

aaccagggct cctacaacga gggctacgtg atcaaggcca acaacaacga gatgctcatg 540

gccaagcgcg acaacgtgta caccgccctc tcctccaaca tcggctggaa gggctactcc 600

atcggctact acaaggtgaa cgacatcatg accgacctcg acgagaacaa gcagatgacc 660

aagcactacg actccgcccg cggcaacatc atcgagggcg ccgagatcga cctcaccaag 720

aactccgagt tcgagatcgt gctctccttc ggcggctccg actccgaggc cgccaagacc 780

gccctcgaga ccctcggcga ggactacaac aacctcaaga acaactacat cgacgagtgg 840

accaagtact gcaacaccct caacaacttc aacggcaagg ccaactccct ctactacaac 900

tccatgatga tcctcaaggc ctccgaggac aagaccaaca agggcgccta catcgcctcc 960

ctctccatcc cgtggggcga cggccagcgc gacgacaaca ccggcggcta ccacctcgtg 1020

tggtcccgcg acctctacca cgtggccaac gccttcatcg ccgccggcga cgtggactcc 1080

gccaaccgct ccctcgacta cctcgccaag gtggtgaagg acaacggcat gatcccgcag 1140

aacacctgga tctccggcaa gccgtactgg acctccatcc agctcgacga gcaggccgac 1200

ccgatcatcc tctcctaccg cctcaagcgc tacgacctct acgactccct cgtgaagccg 1260

ctcgccgact tcatcatcaa gatcggcccg aagaccggcc aggagcgctg ggaggagatc 1320

ggcggctact ccccggccac gatggccgcc gaggtggccg gcctcacctg cgccgcctac 1380

atcgccgagc agaacaagga ctacgagtcc gcccagaagt accaggagaa ggccgacaac 1440

tggcagaagc tcatcgacaa cctcacctac accgagaacg gcccgctcgg caacggccag 1500

tactacatcc gcatcgccgg cctctccgac ccgaacgccg acttcatgat caacatcgcc 1560

aacggcggcg gcgtgtacga ccagaaggag atcgtggacc cgtccttcct cgagctggtg 1620

cgcctcggcg tgaagtccgc cgacgacccg aagatcctca acaccctcaa ggtggtggac 1680

tccaccatca aggtggacac cccgaagggc ccgtcctggt atcgctacaa ccacgacggc 1740

tacggcgagc cgtccaagac cgagctgtac cacggcgccg gcaagggccg cctctggccg 1800

ctcctcaccg gcgagcgcgg catgtacgag atcgccgccg gcaaggacgc caccccgtac 1860

gtgaaggcga tggagaagtt cgccaacgag ggcggcatca tctccgagca ggtgtgggag 1920

gacaccggcc tcccgaccga ctccgcctcc ccgctcaact gggcccacgc cgagtacgtg 1980

atcctcttcg cctccaacat cgagcacaag gtgctcgaca tgccggacat cgtgtac 2037

<210>49

<211>579

<212>PRT

<213>Rhizopus oryzae

<400>49

Ala Ser Ile Pro Ser Ser Ala Ser Val Gln Leu Asp Ser Tyr Asn Tyr

1 5 10 15

Asp Gly Ser Thr Phe Ser Gly Lys Ile Tyr Val Lys Asn Ile Ala Tyr

20 25 30

Ser Lys Lys Val Thr Val Ile Tyr Ala Asp Gly Ser Asp Asn Trp Asn

35 40 45

Asn Asn Gly Asn Thr Ile Ala Ala Ser Tyr Ser Ala Pro Ile Ser Gly

50 55 60

Ser Asn Tyr Glu Tyr Trp Thr Phe Ser Ala Ser Ile Asn Gly Ile Lys

65 70 75 80

Glu Phe Tyr Ile Lys Tyr Glu Val Ser Gly Lys Thr Tyr Tyr Asp Asn

85 90 95

Asn Asn Ser Ala Asn Tyr Gln Val Ser Thr Ser Lys Pro Thr Thr Thr

100 105 110

Thr Ala Thr Ala Thr Thr Thr Thr Ala Pro Ser Thr Ser Thr Thr Thr

115 120 125

Pro Pro Ser Arg Ser Glu Pro Ala Thr Phe Pro Thr Gly Asn Ser Thr

130 135 140

Ile Ser Ser Trp Ile Lys Lys Gln Glu Gly Ile Ser Arg Phe Ala Met

145 150 155 160

Leu Arg Asn Ile Asn Pro Pro Gly Ser Ala Thr Gly Phe Ile Ala Ala

165 170 175

Ser Leu Ser Thr Ala Gly Pro Asp Tyr Tyr Tyr Ala Trp Thr Arg Asp

180 185 190

Ala Ala Leu Thr Ser Asn Val Ile Val Tyr Glu Tyr Asn Thr Thr Leu

195 200 205

Ser Gly Asn Lys Thr Ile Leu Asn Val Leu Lys Asp Tyr Val Thr Phe

210 215 220

Ser Val Lys Thr Gln Ser Thr Ser Thr Val Cys Asn Cys Leu Gly Glu

225 230 235 240

Pro Lys Phe Asn Pro Asp Ala Ser Gly Tyr Thr Gly Ala Trp Gly Arg

245 250 255

Pro Gln Asn Asp Gly Pro Ala Glu Arg Ala Thr Thr Phe Ile Leu Phe

260 265 270

Ala Asp Ser Tyr Leu Thr Gln Thr Lys Asp Ala Ser Tyr Val Thr Gly

275 280 285

Thr Leu Lys Pro Ala Ile Phe Lys Asp Leu Asp Tyr Val Val Asn Val

290 295 300

Trp Ser Asn Gly Cys Phe Asp Leu Trp Glu Glu Val Asn Gly Val His

305 310 315 320

Phe Tyr Thr Leu Met Val Met Arg Lys Gly Leu Leu Leu Gly Ala Asp

325 330 335

Phe Ala Lys Arg Asn Gly Asp Ser Thr Arg Ala Ser Thr Tyr Ser Ser

340 345 350

Thr Ala Ser Thr Ile Ala Asn Lys Ile Ser Ser Phe Trp Val Ser Ser

355 360 365

Asn Asn Trp Ile Gln Val Ser Gln Ser Val Thr Gly Gly Val Ser Lys

370 375 380

Lys Gly Leu Asp Val Ser Thr Leu Leu Ala Ala Asn Leu Gly Ser Val

385 390 395 400

Asp Asp Gly Phe Phe Thr Pro Gly Ser Glu Lys Ile Leu Ala Thr Ala

405 410 415

Val Ala Val Glu Asp Ser Phe Ala Ser Leu Tyr Pro Ile Asn Lys Asn

420 425 430

Leu Pro Ser Tyr Leu Gly Asn Ser Ile Gly Arg Tyr Pro Glu Asp Thr

435 440 445

Tyr Asn Gly Asn Gly Asn Ser Gln Gly Asn Ser Trp Phe Leu Ala Val

450 455 460

Thr Gly Tyr Ala Glu Leu Tyr Tyr Arg Ala Ile Lys Glu Trp Ile Gly

465 470 475 480

Asn Gly Gly Val Thr Val Ser Ser Ile Ser Leu Pro Phe Phe Lys Lys

485 490 495

Phe Asp Ser Ser Ala Thr Ser Gly Lys Lys Tyr Thr Val Gly Thr Ser

500 505 510

Asp Phe Asn Asn Leu Ala Gln Asn Ile Ala Leu Ala Ala Asp Arg Phe

515 520 525

Leu Ser Thr Val Gln Leu His Ala His Asn Asn Gly Ser Leu Ala Glu

530 535 540

Glu Phe Asp Arg Thr Thr Gly Leu Ser Thr Gly Ala Arg Asp Leu Thr

545 550 555 560

Trp Ser His Ala Ser Leu Ile Thr Ala Ser Tyr Ala Lys Ala Gly Ala

565 570 575

Pro Ala Ala

<210>50

<211>1737

<212>DNA

<213>Rhizopus oryzae

<400>50

gcctccatcc cgtcctccgc ctccgtgcag ctcgactcct acaactacga cggctccacc 60

ttctccggca aaatctacgt gaagaacatc gcctactcca agaaggtgac cgtgatctac 120

gccgacggct ccgacaactg gaacaacaac ggcaacacca tcgccgcctc ctactccgcc 180

ccgatctccg gctccaacta cgagtactgg accttctccg cctccatcaa cggcatcaag 240

gagttctaca tcaagtacga ggtgtccggc aagacctact acgacaacaa caactccgcc 300

aactaccagg tgtccacctc caagccgacc accaccaccg ccaccgccac caccaccacc 360

gccccgtcca cctccaccac caccccgccg tcccgctccg agccggccac cttcccgacc 420

ggcaactcca ccatctcctc ctggatcaag aagcaggagg gcatctcccg cttcgccatg 480

ctccgcaaca tcaacccgcc gggctccgcc accggcttca tcgccgcctc cctctccacc 540

gccggcccgg actactacta cgcctggacc cgcgacgccg ccctcacctc caacgtgatc 600

gtgtacgagt acaacaccac cctctccggc aacaagacca tcctcaacgt gctcaaggac 660

tacgtgacct tctccgtgaa gacccagtcc acctccaccg tgtgcaactg cctcggcgag 720

ccgaagttca acccggacgc ctccggctac accggcgcct ggggccgccc gcagaacgac 780

ggcccggccg agcgcgccac caccttcatc ctcttcgccg actcctacct cacccagacc 840

aaggacgcct cctacgtgac cggcaccctc aagccggcca tcttcaagga cctcgactac 900

gtggtgaacg tgtggtccaa cggctgcttc gacctctggg aggaggtgaa cggcgtgcac 960

ttctacaccc tcatggtgat gcgcaagggc ctcctcctcg gcgccgactt cgccaagcgc 1020

aacggcgact ccacccgcgc ctccacctac tcctccaccg cctccaccat cgccaacaaa 1080

atctcctcct tctgggtgtc ctccaacaac tggatacagg tgtcccagtc cgtgaccggc 1140

ggcgtgtcca agaagggcct cgacgtgtcc accctcctcg ccgccaacct cggctccgtg 1200

gacgacggct tcttcacccc gggctccgag aagatcctcg ccaccgccgt ggccgtggag 1260

gactccttcg cctccctcta cccgatcaac aagaacctcc cgtcctacct cggcaactcc 1320

atcggccgct acccggagga cacctacaac ggcaacggca actcccaggg caactcctgg 1380

ttcctcgccg tgaccggcta cgccgagctg tactaccgcg ccatcaagga gtggatcggc 1440

aacggcggcg tgaccgtgtc ctccatctcc ctcccgttct tcaagaagtt cgactcctcc 1500

gccacctccg gcaagaagta caccgtgggc acctccgact tcaacaacct cgcccagaac 1560

atcgccctcg ccgccgaccg cttcctctcc accgtgcagc tccacgccca caacaacggc 1620

tccctcgccg aggagttcga ccgcaccacc ggcctctcca ccggcgcccg cgacctcacc 1680

tggtcccacg cctccctcat caccgcctcc tacgccaagg ccggcgcccc ggccgcc 1737

<210>51

<211>439

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>51

Met Ala Lys His Leu Ala Ala Met Cys Trp Cys Ser Leu Leu Val Leu

1 5 10 15

Val Leu Leu Cys Leu Gly Ser Gln Leu Ala Gln Ser Gln Val Leu Phe

20 25 30

Gln Gly Phe Asn Trp Glu Ser Trp Lys Lys Gln Gly Gly Trp Tyr Asn

35 40 45

Tyr Leu Leu Gly Arg Val Asp Asp Ile Ala Ala Thr Gly Ala Thr His

50 55 60

Val Trp Leu Pro Gln Pro Ser His Ser Val Ala Pro Gln Gly Tyr Met

65 70 75 80

Pro Gly Arg Leu Tyr Asp Leu Asp Ala Ser Lys Tyr Gly Thr His Ala

85 90 95

Glu Leu Lys Ser Leu Thr Ala Ala Phe His Ala Lys Gly Val Gln Cys

100 105 110

Val Ala Asp Val Val Ile Asn His Arg Cys Ala Asp Tyr Lys Asp Gly

115 120 125

Arg Gly Ile Tyr Cys Val Phe Glu Gly Gly Thr Pro Asp Ser Arg Leu

130 135 140

Asp Trp Gly Pro Asp Met Ile Cys Ser Asp Asp Thr Gln Tyr Ser Asn

145 150 155 160

Gly Arg Gly His Arg Asp Thr Gly Ala Asp Phe Ala Ala Ala Pro Asp

165 170 175

Ile Asp His Leu Asn Pro Arg Val Gln Gln Glu Leu Ser Asp Trp Leu

180 185 190

Asn Trp Leu Lys Ser Asp Leu Gly Phe Asp Gly Trp Arg Leu Asp Phe

195 200 205

Ala Lys Gly Tyr Ser Ala Ala Val Ala Lys Val Tyr Val Asp Ser Thr

210 215 220

Ala Pro Thr Phe Val Val Ala Glu Ile Trp Ser Ser Leu His Tyr Asp

225 230 235 240

Gly Asn Gly Glu Pro Ser Ser Asn Gln Asp Ala Asp Arg Gln Glu Leu

245 250 255

Val Asn Trp Ala Gln Ala Val Gly Gly Pro Ala Ala Ala Phe Asp Phe

260 265 270

Thr Thr Lys Gly Val Leu Gln Ala Ala Val Gln Gly Glu Leu Trp Arg

275 280 285

Met Lys Asp Gly Asn Gly Lys Ala Pro Gly Met Ile Gly Trp Leu Pro

290 295 300

Glu Lys Ala Val Thr Phe Val Asp Asn His Asp Thr Gly Ser Thr Gln

305 310 315 320

Asn Ser Trp Pro Phe Pro Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr

325 330 335

Ile Leu Thr His Pro Gly Thr Pro Cys Ile Phe Tyr Asp His Val Phe

340 345 350

Asp Trp Asn Leu Lys Gln Glu Ile Ser Ala Leu Ser Ala Val Arg Ser

355 360 365

Arg Asn Gly Ile His Pro Gly Ser Glu Leu Asn Ile Leu Ala Ala Asp

370 375 380

Gly Asp Leu Tyr Val Ala Lys Ile Asp Asp Lys Val Ile Val Lys Ile

385 390 395 400

Gly Ser Arg Tyr Asp Val Gly Asn Leu Ile Pro Ser Asp Phe His Ala

405 410 415

Val Ala His Gly Asn Asn Tyr Cys Val Trp Glu Lys His Gly Leu Arg

420 425 430

Val Pro Ala Gly Arg His His

435

<210>52

<211>1320

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>52

atggcgaagc acttggctgc catgtgctgg tgcagcctcc tagtgcttgt actgctctgc 60

ttgggctccc agctggccca atcccaggtc ctcttccagg ggttcaactg ggagtcgtgg 120

aagaagcaag gtgggtggta caactacctc ctggggcggg tggacgacat cgccgcgacg 180

ggggccacgc acgtctggct cccgcagccg tcgcactcgg tggcgccgca ggggtacatg 240

cccggccggc tctacgacct ggacgcgtcc aagtacggca cccacgcgga gctcaagtcg 300

ctcaccgcgg cgttccacgc caagggcgtc cagtgcgtcg ccgacgtcgt gatcaaccac 360

cgctgcgccg actacaagga cggccgcggc atctactgcg tcttcgaggg cggcacgccc 420

gacagccgcc tcgactgggg ccccgacatg atctgcagcg acgacacgca gtactccaac 480

gggcgcgggc accgcgacac gggggccgac ttcgccgccg cgcccgacat cgaccacctc 540

aacccgcgcg tgcagcagga gctctcggac tggctcaact ggctcaagtc cgacctcggc 600

ttcgacggct ggcgcctcga cttcgccaag ggctactccg ccgccgtcgc caaggtgtac 660

gtcgacagca ccgcccccac cttcgtcgtc gccgagatat ggagctccct ccactacgac 720

ggcaacggcg agccgtccag caaccaggac gccgacaggc aggagctggt caactgggcg 780

caggcggtgg gcggccccgc cgcggcgttc gacttcacca ccaagggcgt gctgcaggcg 840

gccgtccagg gcgagctgtg gcgcatgaag gacggcaacg gcaaggcgcc cgggatgatc 900

ggctggctgc cggagaaggc cgtcacgttc gtcgacaacc acgacaccgg ctccacgcag 960

aactcgtggc cattcccctc cgacaaggtc atgcagggct acgcctatat cctcacgcac 1020

ccaggaactc catgcatctt ctacgaccac gttttcgact ggaacctgaa gcaggagatc 1080

agcgcgctgt ctgcggtgag gtcaagaaac gggatccacc cggggagcga gctgaacatc 1140

ctcgccgccg acggggatct ctacgtcgcc aagattgacg acaaggtcat cgtgaagatc 1200

gggtcacggt acgacgtcgg gaacctgatc ccctcagact tccacgccgt tgcccctggc 1260

aacaactact gcgtttggga gaagcacggt ctgagagttc cagcggggcg gcaccactag 1320

<210>53

<211>45

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>53

Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Thr Thr Gly Ser Gly Gly

1 5 10 15

Val Thr Ser Thr Ser Lys Thr Thr Thr Thr Ala Ser Lys Thr Ser Thr

20 25 30

Thr Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr Ala Val

35 40 45

<210>54

<211>137

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>54

gccaccggcg gcaccaccac caccgccacc accaccggct ccggcggcgt gacctccacc 60

tccaagacca ccaccaccgc ctccaagacc tccaccacca cctcctccac ctcctgcacc 120

accccgaccg ccgtgtc 137

<210>55

<211>300

<212>PRT

<213>激烈火球菌

<400>55

Ile Tyr Phe Val Glu Lys Tyr His Thr Ser Glu Asp Lys Ser Thr Ser

1 5 10 15

Asn Thr Ser Ser Thr Pro Pro Gln Thr Thr Leu Ser Thr Thr Lys Val

20 25 30

Leu Lys Ile Arg Tyr Pro Asp Asp Gly Glu Trp Pro Gly Ala Pro Ile

35 40 45

Asp Lys Asp Gly Asp Gly Asn Pro Glu Phe Tyr Ile Glu Ile Asn Leu

50 55 60

Trp Asn Ile Leu Asn Ala Thr Gly Phe Ala Glu Met Thr Tyr Asn Leu

65 70 75 80

Thr Ser Gly Val Leu His Tyr Val Gln Gln Leu Asp Asn Ile Val Leu

85 90 95

Arg Asp Arg Ser Asn Trp Val His Gly Tyr Pro Glu Ile Phe Tyr Gly

100 105 110

Asn Lys Pro Trp Asn Ala Asn Tyr Ala Thr Asp Gly Pro Ile Pro Leu

115 120 125

Pro Ser Lys Val Ser Asn Leu Thr Asp Phe Tyr Leu Thr Ile Ser Tyr

130 135 140

Lys Leu Glu Pro Lys Asn Gly Leu Pro Ile Asn Phe Ala Ile Glu Ser

145 150 155 160

Trp Leu Thr Arg Glu Ala Trp Arg Thr Thr Gly Ile Asn Ser Asp Glu

165 170 175

Gln Glu Val Met Ile Trp Ile Tyr Tyr Asp Gly Leu Gln Pro Ala Gly

180 185 190

Ser Lys Val Lys Glu Ile Val Val Pro Ile Ile Val Asn Gly Thr Pro

195 200 205

Val Asn Ala Thr Phe Glu Val Trp Lys Ala Asn Ile Gly Trp Glu Tyr

210 215 220

Val Ala Phe Arg Ile Lys Thr Pro Ile Lys Glu Gly Thr Val Thr Ile

225 230 235 240

Pro Tyr Gly Ala Phe Ile Ser Val Ala Ala Asn Ile Ser Ser Leu Pro

245 250 255

Asn Tyr Thr Glu Leu Tyr Leu Glu Asp Val Glu Ile Gly Thr Glu Phe

260 265 270

Gly Thr Pro Ser Thr Thr Ser Ala His Leu Glu Trp Trp Ile Thr Asn

275 280 285

Ile Thr Leu Thr Pro Leu Asp Arg Pro Leu Ile Ser

290 295 300

<210>56

<211>903

<212>DNA

<213>激烈火球菌

<400>56

atctacttcg tggagaagta ccacacctcc gaggacaagt ccacctccaa cacctcctcc 60

accccgccgc agaccaccct ctccaccacc aaggtgctca agatccgcta cccggacgac 120

ggcgagtggc ccggcgcccc gatcgacaag gacggcgacg gcaacccgga gttctacatc 180

gagatcaacc tctggaacat cctcaacgcc accggcttcg ccgagatgac ctacaacctc 240

actagtggcg tgctccacta cgtgcagcag ctcgacaaca tcgtgctccg cgaccgctcc 300

aactgggtgc acggctaccc ggaaatcttc tacggcaaca agccgtggaa cgccaactac 360

gccaccgacg gcccgatccc gctcccgtcc aaggtgtcca acctcaccga cttctacctc 420

accatctcct acaagctcga gccgaagaac ggtctcccga tcaacttcgc catcgagtcc 480

tggctcaccc gcgaggcctg gcgcaccacc ggcatcaact ccgacgagca ggaggtgatg 540

atctggatct actacgacgg cctccagccc gcgggctcca aggtgaagga gatcgtggtg 600

ccgatcatcg tgaacggcac cccggtgaac gccaccttcg aggtgtggaa ggccaacatc 660

ggctgggagt acgtggcctt ccgcatcaag accccgatca aggagggcac cgtgaccatc 720

ccgtacggcg ccttcatctc cgtggccgcc aacatctcct ccctcccgaa ctacaccgag 780

aagtacctcg aggacgtgga gatcggcacc gagttcggca ccccgtccac cacctccgcc 840

cacctcgagt ggtggatcac caacatcacc ctcaccccgc tcgaccgccc gctcatctcc 900

tag 903

<210>57

<211>387

<212>PRT

<213>黄栖热菌

<400>57

Met Tyr Glu Pro Lys Pro Glu His Arg Phe Thr Phe Gly Leu Trp Thr

1 5 10 15

Val Asp Asn Val Asp Arg Asp Pro Phe Gly Asp Thr Val Arg Glu Arg

20 25 30

Leu Asp Pro Val Tyr Val Val His Lys Leu Ala Glu Leu Gly Ala Tyr

35 40 45

Gly Val Asn Leu His Asp Glu Asp Leu Ile Pro Arg Gly Thr Pro Pro

50 55 60

Gln Glu Arg Asp Gln Ile Val Arg Arg Phe Lys Lys Ala Leu Asp Glu

65 70 75 80

Thr Val Leu Lys Val Pro Met Val Thr Ala Asn Leu Phe Ser Glu Pro

85 90 95

Ala Phe Arg Asp Gly Ala Ser Thr Thr Arg Asp Pro Trp Val Trp Ala

100 105 110

Tyr Ala Leu Arg Lys Ser Leu Glu Thr Met Asp Leu Gly Ala Glu Leu

115 120 125

Gly Ala Glu Ile Tyr Met Phe Trp Met Val Arg Glu Arg Ser Glu Val

130 135 140

Glu Ser Thr Asp Lys Thr Arg Lys Val Trp Asp Trp Val Arg Glu Thr

145 150 155 160

Leu Asn Phe Met Thr Ala Tyr Thr Glu Asp Gln Gly Tyr Gly Tyr Arg

165 170 175

Phe Ser Val Glu Pro Lys Pro Asn Glu Pro Arg Gly Asp Ile Tyr Phe

180 185 190

Thr Thr Val Gly Ser Met Leu Ala Leu Ile His Thr Leu Asp Arg Pro

195 200 205

Glu Arg Phe Gly Leu Asn Pro Glu Phe Ala His Glu Thr Met Ala Gly

210 215 220

Leu Asn Phe Asp His Ala Val Ala Gln Ala Val Asp Ala Gly Lys Leu

225 230 235 240

Phe His Ile Asp Leu Asn Asp Gln Arg Met Ser Arg Phe Asp Gln Asp

245 250 255

Leu Arg Phe Gly Ser Glu Asn Leu Lys Ala Gly Phe Phe Leu Val Asp

260 265 270

Leu Leu Glu Ser Ser Gly Tyr Gln Gly Pro Arg His Phe Glu Ala His

275 280 285

Ala Leu Arg Thr Glu Asp Glu Glu Gly Val Trp Thr Phe Val Arg Val

290 295 300

Cys Met Arg Thr Tyr Leu Ile Ile Lys Val Arg Ala Glu Thr Phe Arg

305 310 315 320

Glu Asp Pro Glu Val Lys Glu Leu Leu Ala Ala Tyr Tyr Gln Glu Asp

325 330 335

Pro Ala Thr Leu Ala Leu Leu Asp Pro Tyr Ser Arg Glu Lys Ala Glu

340 345 350

Ala Leu Lys Arg Ala Glu Leu Pro Leu Glu Thr Lys Arg Arg Arg Gly

355 360 365

Tyr Ala Leu Glu Arg Leu Asp Gln Leu Ala Val Glu Tyr Leu Leu Gly

370 375 380

Val Arg Gly

385

<210>58

<211>978

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>58

atggggaaga acggcaacct gtgctgcttc tctctgctgc tgcttcttct cgccgggttg 60

gcgtccggcc atcaaatcta cttcgtggag aagtaccaca cctccgagga caagtccacc 120

tccaacacct cctccacccc gccgcagacc accctctcca ccaccaaggt gctcaagatc 180

cgctacccgg acgacggtga gtggcccggc gccccgatcg acaaggacgg cgacggcaac 240

ccggagttct acatcgagat caacctctgg aacatcctca acgccaccgg cttcgccgag 300

atgacctaca acctcactag tggcgtgctc cactacgtgc agcagctcga caacatcgtg 360

ctccgcgacc gctccaactg ggtgcacggc tacccggaaa tcttctacgg caacaagccg 420

tggaacgcca actacgccac cgacggcccg atcccgctcc cgtccaaggt gtccaacctc 480

accgacttct acctcaccat ctcctacaag ctcgagccga agaacggtct cccgatcaac 540

ttcgccatcg agtcctggct cacccgcgag gcctggcgca ccaccggcat caactccgac 600

gagcaggagg tgatgatctg gatctactac gacggcctcc agcccgcggg ctccaaggtg 660

aaggagatcg tggtgccgat catcgtgaac ggcaccccgg tgaacgccac cttcgaggtg 720

tggaaggcca acatcggctg ggagtacgtg gccttccgca tcaagacccc gatcaaggag 780

ggcaccgtga ccatcccgta cggcgccttc atctccgtgg ccgccaacat ctcctccctc 840

ccgaactaca ccgagaagta cctcgaggac gtggagatcg gcaccgagtt cggcaccccg 900

tccaccacct ccgcccacct cgagtggtgg atcaccaaca tcaccctcac cccgctcgac 960

cgcccgctca tctcctag 978

<210>59

<211>1920

<212>DNA

<213>黑曲霉

<400>59

atgtccttcc gctccctcct cgccctctcc ggcctcgtgt gcaccggcct cgccaacgtg 60

atctccaagc gcgccaccct cgactcctgg ctctccaacg aggccaccgt ggcccgcacc 120

gccatcctca acaacatcgg cgccgacggc gcctgggtgt ccggcgccga ctccggcatc 180

gtggtggcct ccccgtccac cgacaacccg gactacttct acacctggac ccgcgactcc 240

ggcctcgtgc tcaagaccct cgtggacctc ttccgcaacg gcgacacctc cctcctctcc 300

accatcgaga actacatctc cgcccaggcc atcgtgcagg gcatctccaa cccgtccggc 360

gacctctcct ccggcgccgg cctcggcgag ccgaagttca acgtggacga gaccgcctac 420

accggctcct ggggccgccc gcagcgcgac ggcccggccc tccgcgccac cgccatgatc 480

ggcttcggcc agtggctcct cgacaacggc tacacctcca ccgccaccga catcgtgtgg 540

ccgctcgtgc gcaacgacct ctcctacgtg gcccagtact ggaaccagac cggctacgac 600

ctctgggagg aggtgaacgg ctcctccttc ttcaccatcg ccgtgcagca ccgcgccctc 660

gtggagggct ccgccttcgc caccgccgtg ggctcctcct gctcctggtg cgactcccag 720

gccccggaga tcctctgcta cctccagtcc ttctggaccg gctccttcat cctcgccaac 780

ttcgactcct cccgctccgg caaggacgcc aacaccctcc tcggctccat ccacaccttc 840

gacccggagg ccgcctgcga cgactccacc ttccagccgt gctccccgcg cgccctcgcc 900

aaccacaagg aggtggtgga ctccttccgc tccatctaca ccctcaacga cggcctctcc 960

gactccgagg ccgtggccgt gggccgctac ccggaggaca cctactacaa cggcaacccg 1020

tggttcctct gcaccctcgc cgccgccgag cagctctacg acgccctcta ccagtgggac 1080

aagcagggct ccctcgaggt gaccgacgtg tccctcgact tcttcaaggc cctctactcc 1140

gacgccgcca ccggcaccta ctcctcctcc tcctccacct actcctccat cgtggacgcc 1200

gtgaagacct tcgccgacgg cttcgtgtcc atcgtggaga cccacgccgc ctccaacggc 1260

tccatgtccg agcagtacga caagtccgac ggcgagcagc tctccgcccg cgacctcacc 1320

tggtcctacg ccgccctcct caccgccaac aaccgccgca actccgtggt gccggcctcc 1380

tggggcgaga cctccgcctc ctccgtgccg ggcacctgcg ccgccacctc cgccatcggc 1440

acctactcct ccgtgaccgt gacctcctgg ccgtccatcg tggccaccgg cggcaccacc 1500

accaccgcca ccccgaccgg ctccggctcc gtgacctcca cctccaagac caccgccacc 1560

gcctccaaga cctccacctc cacctcctcc acctcctgca ccaccccgac cgccgtggcc 1620

gtgaccttcg acctcaccgc caccaccacc tacggcgaga acatctacct cgtgggctcc 1680

atctcccagc tcggcgactg ggagacctcc gacggcatcg ccctctccgc cgacaagtac 1740

acctcctccg acccgctctg gtacgtgacc gtgaccctcc cggccggcga gtccttcgag 1800

tacaagttca tccgcatcga gtccgacgac tccgtggagt gggagtccga cccgaaccgc 1860

gagtacaccg tgccgcaggc ctgcggcacc tccaccgcca ccgtgaccga cacctggcgc 1920

<210>60

<211>6

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>60

Ser Glu Lys Asp Glu Leu

1 5

<210>61

<211>561

<212>DNA

<213>人工序列

<220>

<223>木聚糖酶BD7436

<220>

<221>CDS

<222>(1)..(561)

<400>61

atg gct agc acc ttc tac tgg cat ttg tgg acc gac ggc arc ggc acc 48

Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly Ile Gly Thr

1 5 10 15

gtg aac gct acc aac ggc agc gac ggc aac tac agc gtg agc tgg agc 96

Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser

20 25 30

aac tgc ggc aac ttc gtg gtg ggc aag ggc tgg acc acc ggc agc gct 144

Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala

35 40 45

acc agg gtg atc aac tac aac gct cat gct ttc agc gtg gtg ggc aac 192

Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val Val Gly Asn

50 55 60

gct tac ttg gct ttg tac ggc tgg acc agg aac agc ttg atc gag tac 240

Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr

65 70 75 80

tac gtg gtg gac agc tgg ggc acc tac agg cca acc ggc acc tac aag 288

Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys

85 90 95

ggc acc gtg acc agc gac ggc ggc acc tac gac atc tac acc acc acc 336

Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr

100 105 110

agg acc aac gct cca agc atc gac ggc aac aac acc acc ttc acc caa 384

Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln

115 120 125

ttc tgg agc gtg agg caa agc aag agg cca atc ggc acc aac aac acc 432

Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr

130 135 140

atc acc ttc agc aac cat gtg aac gct tgg aag agc aag ggc atg aac 480

Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn

145 150 155 160

ttg ggc agc agc tgg agc tac caa gtg ttg gct acc gag ggc tac caa 528

Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln

165 170 175

agc agc ggc tac agc aac gtg acc gtg tgg tag 561

Ser Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210>62

<211>186

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>62

Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly Ile Gly Thr

1 5 10 15

Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser

20 25 30

Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala

35 40 45

Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val Val Gly Asn

50 55 60

Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr

65 70 75 80

Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys

85 90 95

Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr

100 105 110

Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln

115 120 125

Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr

130 135 140

Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn

145 150 155 160

Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln

165 170 175

Set Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210>63

<211>561

<212>DNA

<213>人工序列

<220>

<223>木聚糖酶BD6002A

<220>

<221>CDS

<222>(1)..(561)

<400>63

atg gct agc acc gac tac tgg caa aac tgg acc gac ggc ggc ggc acc 48

Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr

1 5 10 15

gtg aac gct acc aac ggc agc gac ggc aac tac agc gtg agc tgg agc 96

Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser

20 25 30

aac tgc ggc aac ttc gtg gtg ggc aag ggc tgg acc acc ggc agc gct 144

Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala

35 40 45

acc agg gtg atc aac tac aac gct ggc gct ttc agc cca agc ggc aac 192

Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn

50 55 60

ggc tac ttg gct ttg tac ggc tgg acc agg aac agc ttg atc gag tac 240

Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr

65 70 75 80

tac gtg gtg gac agc tgg ggc acc tac agg cca acc ggc acc tac aag 288

Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys

85 90 95

ggc acc gtg acc agc gac ggc ggc acc tac gac atc tac acc acc acc 336

Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr

100 105 110

agg acc aac gct cca agc atc gac ggc aac aac acc acc ttc acc caa 384

Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln

115 120 125

ttc tgg agc gtg agg caa agc aag agg cca atc ggc acc aac aac acc 432

Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr

130 135 140

atc acc ttc agc aac cat gtg aac gct tgg aag agc aag ggc atg aac 480

Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn

145 150 155 160

ttg ggc agc agc tgg agc tac caa gtg ttg gct acc gag ggc tac caa 528

Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln

165 170 175

agc agc ggc tac agc aac gtg acc gtg tgg tag 561

Ser Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210>64

<211>186

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>64

Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr

1 5 10 15

Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser

20 25 30

Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala

35 40 45

Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn

50 55 60

Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr

65 70 75 80

Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys

85 90 95

Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr

100 105 110

Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln

115 120 125

Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr

130 135 140

Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn

145 150 155 160

Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln

165 170 175

Ser Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210>65

<211>561

<212>DNA

<213>人工序列

<220>

<223>木聚糖酶BD6002B

<220>

<221>CDS

<222>(1)..(561)

<400>65

atg gcc tcc acc gac tac tgg cag aac tgg acc gac ggc ggc ggc acc 48

Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr

1 5 10 15

gtg aac gcc acc aac ggc tcc gac ggc aac tac tcc gtg tcc tgg tcc 96

Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser

20 25 30

aac tgc ggc aac ttc gtg gtg ggc aag ggc tgg acc acc ggc tcc gcc 144

Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala

35 40 45

acc cgc gtg atc aac tac aac gcc ggc gcc ttc tcc ccg tcc ggc aac 192

Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn

50 55 60

ggc tac ctc gcc ctc tac ggc tgg acc cgc aac tcc ctc atc gag tac 240

Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr

65 70 75 80

tac gtg gtg gac tcc tgg ggc acc tac cgc ccg acc ggc acc tac aag 288

Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys

85 90 95

ggc acc gtg acc tcc gac ggc ggc acc tac gac atc tac acc acc acc 336

Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr

100 105 110

cgc acc aac gcc ccg tcc atc gac ggc aac aac acc acc ttc acc cag 384

Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln

115 120 125

ttc tgg tcc gtg cgc cag tcc aag cgc ccg atc ggc acc aac aac acc 432

Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr

130 135 140

atc acc ttc tcc aac cac gtg aac gcc tgg aag tcc aag ggc atg aac 480

Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn

145 150 155 160

ctc ggc tcc tcc tgg tcc tac cag gtg ctc gcc acc gag ggc tac cag 528

Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln

165 170 175

tcc tcc ggc tac tcc aac gtg acc gtg tgg tga 561

Ser Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210>66

<211>186

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>66

Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr

1 5 10 15

Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser

20 25 30

Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala

35 40 45

Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn

50 55 60

Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr

65 70 75 80

Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys

85 90 95

Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr

100 105 110

Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln

115 120 125

Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr

130 135 140

Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn

145 150 155 160

Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln

165 170 175

Ser Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210>67

<211>2071

<212>DNA

<213>稻

<220>

<221>misc_feature

<222>(1)..(2071)

<223>启动子

<400>67

tccatgctgt cctactactt gcttcatccc cttctacatt ttgttctggt ttttggcctg 60

catttcggat catgatgtat gtgatttcca atctgctgca atatgaatgg agactctgtg 120

ctaaccatca acaacatgaa atgcttatga ggcctttgct gagcagccaa tcttgcctgt 180

gtttatgtct tcacaggccg aattcctctg ttttgttttt caccctcaat atttggaaac 240

atttatctag gttgtttgtg tccaggccta taaatcatac atgatgttgt cgtattggat 300

gtgaatgtgg tggcgtgttc agtgccttgg atttgagttt gatgagagtt gcttctgggt 360

caccactcac cattatcgat gctcctcttc agcataaggt aaaagtcttc cctgtttacg 420

ttattttacc cactatggtt gcttgggttg gttttttcct gattgcttat gccatggaaa 480

gtcatttgat atgttgaact tgaattaact gtagaattgt atacatgttc catttgtgtt 540

gtacttcctt cttttctatt agtagcctca gatgagtgtg aaaaaaacag attatataac 600

ttgccctata aatcatttga aaaaaatatt gtacagtgag aaattgatat atagtgaatt 660

tttaagagca tgttttccta aagaagtata tattttctat gtacaaaggc cattgaagta 720

attgtagata caggataatg tagacttttt ggacttacac tgctaccttt aagtaacaat 780

catgagcaat agtgttgcaa tgatatttag gctgcattcg tttactctct tgatttccat 840

gagcacgctt cccaaactgt taaactctgt gttttttgcc aaaaaaaaat gcataggaaa 900

gttgctttta aaaaatcata tcaatccatt ttttaagtta tagctaatac ttaattaatc 960

atgcgctaat aagtcactct gtttttcgta ctagagagat tgttttgaac cagcactcaa 1020

gaacacagcc ttaacccagc caaataatgc tacaacctac cagtccacac ctcttgtaaa 1080

gcatttgttg catggaaaag ctaagatgac agcaacctgt tcaggaaaac aactgacaag 1140

gtcataggga gagggagctt ttggaaaggt gccgtgcagt tcaaacaatt agttagcagt 1200

agggtgttgg tttttgctca cagcaataag aagttaatca tggtgtaggc aacccaaata 1260

aaacaccaaa atatgcacaa ggcagtttgt tgtattctgt agtacagaca aaactaaaag 1320

taatgaaaga agatgtggtg ttagaaaagg aaacaatatc atgagtaatg tgtgggcatt 1380

atgggaccac gaaataaaaa gaacattttg atgagtcgtg tatcctcgat gagcctcaaa 1440

agttctctca ccccggataa gaaaccctta agcaatgtgc aaagtttgca ttctccactg 1500

acataatgca aaataagata tcatcgatga catagcaact catgcatcat atcatgcctc 1560

tctcaaccta ttcattccta ctcatctaca taagtatctt cagctaaatg ttagaacata 1620

aacccataag tcacgtttga tgagtattag gcgtgacaca tgacaaatca cagactcaag 1680

caagataaag caaaatgatg tgtacataaa actccagagc tatatgtcat attgcaaaaa 1740

gaggagagct tataagacaa ggcatgactc acaaaaattc atttgccttt cgtgtcaaaa 1800

agaggagggc tttacattat ccatgtcata ttgcaaaaga aagagagaaa gaacaacaca 1860

atgctgcgtc aattatacat atctgtatgt ccatcattat tcatccacct ttcgtgtacc 1920

acacttcata tatcatgagt cacttcatgt ctggacatta acaaactcta tcttaacatt 1980

tagatgcaag agcctttatc tcactataaa tgcacgatga tttctcattg tttctcacaa 2040

aaagcattca gttcattagt cctacaacaa c 2071

<210>68

<211>79

<212>PRT

<213>玉蜀黍

<220>

<221>SIGNAL

<222>(1)..(79)

<223>玉米waxy信号序列

<400>68

Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly

1 5 10 15

Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly

20 25 30

Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg

35 40 45

Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg

50 55 60

Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala

65 70 75

<210>69

<211>1005

<212>DNA

<213>人工序列

<220>

<223>合成的菠萝蛋白酶序列

<220>

<221>CDS

<222>(1)..(1005)

<223>合成的菠萝蛋白酶

<400>69

atg gcc tgg aag gtg cag gtg gtg ttc ctc ttc ctc ttc ctc tgc gtg 48

Met Ala Trp Lys Val Gln Val Val Phe Leu Phe Leu Phe Leu Cys Val

1 5 10 15

atg tgg gcc tcc ccg tcc gcc gcc tcc gcg gac gag ccg tcc gac ccg 96

Met Trp Ala Ser Pro Ser Ala Ala Ser Ala Asp Glu Pro Ser Asp Pro

20 25 30

atg atg aag cgc ttc gag gag tgg atg gtg gag tac ggc cgc gtg tac 144

Met Met Lys Arg Phe Glu Glu Trp Met Val Glu Tyr Gly Arg Val Tyr

35 40 45

aag gac aac gac gag aag atg cgc cgc ttc cag atc ttc aag aac aac 192

Lys Asp Asn Asp Glu Lys Met Arg Arg Phe Gln Ile Phe Lys Asn Asn

50 55 60

gtg aac cac atc gag acc ttc aac tcc cgc aac gag aac tcc tac acc 240

Val Asn His Ile Glu Thr Phe Asn Ser Arg Asn Glu Asn Ser Tyr Thr

65 70 75 80

ctc ggc atc aac cag ttc acc gac atg acc aac aac gag ttc atc gcc 288

Leu Gly Ile Asn Gln Phe Thr Asp Met Thr Asn Asn Glu Phe Ile Ala

85 90 95

cag tac acc ggc ggc atc tcc cgc ccg ctc aac atc gag cgc gag ccg 336

Gln Tyr Thr Gly Gly Ile Ser Arg Pro Leu Asn Ile Glu Arg Glu Pro

100 105 110

gtg gtg tcc ttc gac gac gtg gac atc tcc gcc gtg ccg cag tcc atc 384

Val Val Ser Phe Asp Asp Val Asp Ile Ser Ala Val Pro Gln Ser Ile

115 120 125

gac tgg cgc gac tac ggc gcc gtg acc tcc gtg aag aac cag aac ccg 432

Asp Trp Arg Asp Tyr Gly Ala Val Thr Ser Vel Lys Asn Gln Asn Pro

130 135 140

tgc ggc gcc tgc tgg gcc ttc gcc gcc atc gcc acc gtg gag tcc atc 480

Cys Gly Ala Cys Trp Ala Phe Ala Ala Ile Ala Thr Val Glu Ser Ile

145 150 155 160

tac aag atc aag aag ggc atc ctc gag ccg ctc tcc gag cag cag gtg 528

Tyr Lys Ile Lys Lys Gly Ile Leu Glu Pro Leu Ser Glu Gln Gln Val

165 170 175

ctc gac tgc gcc aag ggc tac ggc tgc aag ggc ggc tgg gag ttc cgc 576

Leu Asp Cys Ala Lys Gly Tyr Gly Cys Lys Gly Gly Trp Glu Phe Arg

180 185 190

gcc ttc gag ttc atc atc tcc aac aag ggc gtg gcc tcc ggc gcc atc 624

Ala Phe Glu Phe Ile Ile Ser Asn Lys Gly Val Ala Ser Gly Ala Ile

195 200 205

tac ccg tac aag gcc gcc aag ggc acc tgc aag acc gac ggc gtg ccg 672

Tyr Pro Tyr Lys Ala Ala Lys Gly Thr Cys Lys Thr Asp Gly Val Pro

210 215 220

aac tcc gcc tac atc acc ggc tac gcc cgc gtg ccg cgc aac aac gag 720

Asn Ser Ala Tyr Ile Thr Gly Tyr Ala Arg Val Pro Arg Asn Asn Glu

225 230 235 240

tcc tcc atg atg tac gcc gtg tcc aag cag ccg atc acc gtg gcc gtg 768

Ser Ser Met Met Tyr Ala Val Ser Lys Gln Pro Ile Thr Val Ala Val

245 250 255

gac gcc aac gcc aac ttc cag tac tac aag tcc ggc gtg ttc aac ggc 816

Asp Ala Asn Ala Asn Phe Gln Tyr Tyr Lys Ser Gly Val Phe Asn Gly

260 265 270

cog tgc ggc acc tcc ctc aac cac gcc gtg acc gcc atc ggc tac ggc 864

Pro Cys Gly Thr Ser Leu Asn His Ala Val Thr Ala Ile Gly Tyr Gly

275 280 285

cag gac tcc atc atc tac ccg aag aag tgg ggc gcc aag tgg ggc gag 912

Gln Asp Ser Ile Ile Tyr Pro Lys Lys Trp Gly Ala Lys Trp Gly Glu

290 295 300

gcc ggc tac atc cgc atg gcc cgc gac gtg tcc tcc tcc tcc ggc atc 960

Ala Gly Tyr Ile Arg Met Ala Arg Asp Val Ser Ser Ser Ser Gly Ile

305 310 315 320

tgc ggc atc gcc atc gac ccg ctc tac ccg acc ctc gag gag tag 1005

Cys Gly Ile Ala Ile Asp Pro Leu Tyr Pro Thr Leu Glu Glu

325 330

<210>70

<211>334

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>70

Met Ala Trp Lys Val Gln Val Val Phe Leu Phe Leu Phe Leu Cys Val

1 5 10 15

Met Trp Ala Ser Pro Ser Ala Ala Ser Ala Asp Glu Pro Ser Asp Pro

20 25 30

Met Met Lys Arg Phe Glu Glu Trp Met Val Glu Tyr Gly Arg Val Tyr

35 40 45

Lys Asp Asn Asp Glu Lys Met Arg Arg Phe Gln Ile Phe Lys Asn Asn

50 55 60

Val Asn His Ile Glu Thr Phe Asn Ser Arg Asn Glu Asn Ser Tyr Thr

65 70 75 80

Leu Gly Ile Asn Gln Phe Thr Asp Met Thr Asn Asn Glu Phe Ile Ala

85 90 95

Gln Tyr Thr Gly Gly Ile Ser Arg Pro Leu Asn Ile Glu Arg Glu Pro

100 105 110

Val Val Ser Phe Asp Asp Val Asp Ile Ser Ala Val Pro Gln Ser Ile

115 120 125

Asp Trp Arg Asp Tyr Gly Ala Val Thr Ser Val Lys Asn Gln Asn Pro

130 135 140

Cys Gly Ala Cys Trp Ala Phe Ala Ala Ile Ala Thr Val Glu Ser Ile

145 150 155 160

Tyr Lys Ile Lys Lys Gly Ile Leu Glu Pro Leu Ser Glu Gln Gln Val

165 170 175

Leu Asp Cys Ala Lys Gly Tyr Gly Cys Lys Gly Gly Trp Glu Phe Arg

180 185 190

Ala Phe Glu Phe Ile Ile Ser Asn Lys Gly Val Ala Ser Gly Ala Ile

195 200 205

Tyr Pro Tyr Lys Ala Ala Lys Gly Thr Cys Lys Thr Asp Gly Val Pro

210 215 220

Asn Ser Ala Tyr Ile Thr Gly Tyr Ala Arg Val Pro Arg Asn Asn Glu

225 230 235 240

Ser Ser Met Met Tyr Ala Val Ser Lys Gln Pro Ile Thr Val Ala Val

245 250 255

Asp Ala Asn Ala Asn Phe Gln Tyr Tyr Lys Ser Gly Val Phe Asn Gly

260 265 270

Pro Cys Gly Thr Ser Leu Asn His Ala Val Thr Ala Ile Gly Tyr Gly

275 280 285

Gln Asp Ser Ile Ile Tyr Pro Lys Lys Trp Gly Ala Lys Trp Gly Glu

290 295 300

Ala Gly Tyr Ile Arg Met Ala Arg Asp Val Ser Ser Ser Ser Gly Ile

305 310 315 320

Cys Gly Ile Ala Ile Asp Pro Leu Tyr Pro Thr Leu Glu Glu

325 330

<210>71

<211>78

<212>DNA

<213>人工序列

<220>

<223>菠萝蛋白酶信号序列

<400>71

atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc 60

ccgtccgccg cctccgcc 78

<210>72

<211>26

<212>PRT

<213>人工序列

<220>

<223>菠萝蛋白酶信号肽

<400>72

Met Ala Trp Lys Val Gln Val Val Phe Leu Phe Leu Phe Leu Cys Val

1 5 10 15

Met Trp Ala Ser Pro Ser Ala Ala Ser Ala

20 25

<210>73

<211>1050

<212>DNA

<213>人工序列

<220>

<223>pSYN11000

<400>73

atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc 60

ccgtccgccg cctccgcgga cgagccgtcc gacccgatga tgaagcgctt cgaggagtgg 120

atggtggagt acggccgcgt gtacaaggac aacgacgaga agatgcgccg cttccagatc 180

ttcaagaaca acgtgaacca catcgagacc ttcaactccc gcaacgagaa ctcctacacc 240

ctcggcatca accagttcac cgacatgacc aacaacgagt tcatcgccca gtacaccggc 300

ggcatctccc gcccgctcaa catcgagcgc gagccggtgg tgtccttcga cgacgtggac 360

atctccgccg tgccgcagtc catcgactgg cgcgactacg gcgccgtgac ctccgtgaag 420

aaccagaacc cgtgcggcgc ctgctgggcc ttcgccgcca tcgccaccgt ggagtccatc 480

tacaagatca agaagggcat cctcgagccg ctctccgagc agcaggtgct cgactgcgcc 540

aagggctacg gctgcaaggg cggctgggag ttccgcgcct tcgagttcat catctccaac 600

aagggcgtgg cctccggcgc catctacccg tacaaggccg ccaagggcac ctgcaagacc 660

gacggcgtgc cgaactccgc ctacatcacc ggctacgccc gcgtgccgcg caacaacgag 720

tcctccatga tgtacgccgt gtccaagcag ccgatcaccg tggccgtgga cgccaacgcc 780

aacttccagt actacaagtc cggcgtgttc aacggcccgt gcggcacctc cctcaaccac 840

gccgtgaccg ccatcggcta cggccaggac tccatcatct acccgaagaa gtggggcgcc 900

aagtggggcg aggccggcta catccgcatg gcccgcgacg tgtcctcctc ctccggcatc 960

tgcggcatcg ccatcgaccc gctctacccg accctcgagg aggtgttcgc cgaggccatc 1020

gccgccaact ccaccctcgt ggccgagtag 1050

<210>74

<211>1067

<212>DNA

<213>人工序列

<220>

<223>pSYN11589

<400>74

tggcctggaa ggtgcaggtg gtgttcctct tcctcttcct ctgcgtgatg tgggcctccc 60

cgtccgccgc ctccgcctcc tcctcctcct tcgccgactc caacccgatc cgcccggtga 120

ccgaccgcgc cgcctccacc gacgagccgt ccgacccgat gatgaagcgc ttcgaggagt 180

ggatggtgga gtacggccgc gtgtacaagg acaacgacga gaagatgcgc cgcttccaga 240

tcttcaagaa caacgtgaac cacatcgaga ccttcaactc ccgcaacgag aactcctaca 300

ccctcggcat caaccagttc accgacatga ccaacaacga gttcatcgcc cagtacaccg 360

gcggcatctc ccgcccgctc aacatcgagc gcgagccggt ggtgtccttc gacgacgtgg 420

acatctccgc cgtgccgcag tccatcgact ggcgcgacta cggcgccgtg acctccgtga 480

agaaccagaa cccgtgcggc gcctgctggg ccttcgccgc catcgccacc gtggagtcca 540

tctacaagat caagaagggc atcctcgagc cgctctccga gcagcaggtg ctcgactgcg 600

ccaagggcta cggctgcaag ggcggctggg agttccgcgc cttcgagttc atcatctcca 660

acaagggcgt ggcctccggc gccatctacc cgtacaaggc cgccaagggc acctgcaaga 720

ccgacggcgt gccgaactcc gcctacatca ccggctacgc ccgcgtgccg cgcaacaacg 780

agtcctccat gatgtacgcc gtgtccaagc agccgatcac cgtggccgtg gacgccaacg 840

ccaacttcca gtactacaag tccggcgtgt tcaacggccc gtgcggcacc tccctcaacc 900

acgccgtgac cgccatcggc tacggccagg actccatcat ctacccgaag aagtggggcg 960

ccaagtgggg cgaggccggc tacatccgca tggcccgcga cgtgtcctcc tcctccggca 1020

tctgcggcat cgccatcgac ccgctctacc cgaccctcga ggagtag 1067

<210>75

<211>1023

<212>DNA

<213>人工序列

<220>

<223>pSYN11587 序列

<400>75

atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc 60

ccgtccgccg cctccgcgga cgagccgtcc gacccgatga tgaagcgctt cgaggagtgg 120

atggtggagt acggccgcgt gtacaaggac aacgacgaga agatgcgccg cttccagatc 180

ttcaagaaca acgtgaacca catcgagacc ttcaactccc gcaacgagaa ctcctacacc 240

ctcggcatca accagttcac cgacatgacc aacaacgagt tcatcgccca gtacaccggc 300

ggcatctccc gcccgctcaa catcgagcgc gagccggtgg tgtccttcga cgacgtggac 360

atctccgccg tgccgcagtc catcgactgg cgcgactacg gcgccgtgac ctccgtgaag 420

aaccagaacc cgtgcggcgc ctgctgggcc ttcgccgcca tcgccaccgt ggagtccatc 480

tacaagatca agaagggcat cctcgagccg ctctccgagc agcaggtgct cgactgcgcc 540

aagggctacg gctgcaaggg cggctgggag ttccgcgcct tcgagttcat catctccaac 600

aagggcgtgg cctccggcgc catctacccg tacaaggccg ccaagggcac ctgcaagacc 660

gacggcgtgc cgaactccgc ctacatcacc ggctacgccc gcgtgccgcg caacaacgag 720

tcctccatga tgtacgccgt gtccaagcag ccgatcaccg tggccgtgga cgccaacgcc 780

aacttccagt actacaagtc cggcgtgttc aacggcccgt gcggcacctc cctcaaccac 840

gccgtgaccg ccatcggcta cggccaggac tccatcatct acccgaagaa gtggggcgcc 900

aagtggggcg aggccggcta catccgcatg gcccgcgacg tgtcctcctc ctccggcatc 960

tgcggcatcg ccatcgaccc gctctacccg accctcgagg agtccgagaa ggacgagctg 1020

tag 1023

<210>76

<211>990

<212>DNA

<213>人工序列

<220>

<223>pSYN12169 序列

<400>76

atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccatg 60

gcggacgagc cgtccgaccc gatgatgaag cgcttcgagg agtggatggt ggagtacggc 120

cgcgtgtaca aggacaacga cgagaagatg cgccgcttcc agatcttcaa gaacaacgtg 180

aaccacatcg agaccttcaa ctcccgcaac gagaactcct acaccctcgg catcaaccag 240

ttcaccgaca tgaccaacaa cgagttcatc gcccagtaca ccggcggcat ctcccgcccg 300

ctcaacatcg agcgcgagcc ggtggtgtcc ttcgacgacg tggacatctc cgccgtgccg 360

cagtccatcg actggcgcga ctacggcgcc gtgacctccg tgaagaacca gaacccgtgc 420

ggcgcctgct gggccttcgc cgccatcgcc accgtggagt ccatctacaa gatcaagaag 480

ggcatcctcg agccgctctc cgagcagcag gtgctcgact gcgccaaggg ctacggctgc 540

aagggcggct gggagttccg cgccttcgag ttcatcatct ccaacaaggg cgtggcctcc 600

ggcgccatct acccgtacaa ggccgccaag ggcacctgca agaccgacgg cgtgccgaac 660

tccgcctaca tcaccggcta cgcccgcgtg ccgcgcaaca acgagtcctc catgatgtac 720

gccgtgtcca agcagccgat caccgtggcc gtggacgcca acgccaactt ccagtactac 780

aagtccggcg tgttcaacgg cccgtgcggc acctccctca accacgccgt gaccgccatc 840

ggctacggcc aggactccat catctacccg aagaagtggg gcgccaagtg gggcgaggcc 900

ggctacatcc gcatggcccg cgacgtgtcc tcctcctccg gcatctgcgg catcgccatc 960

gacccgctct acccgaccct cgaggagtag 990

<210>77

<211>1170

<212>DNA

<213>人工序列

<220>

<223>pSYN12575 序列

<400>77

atgctggcgg ctctggccac gtcgcagctc gtcgcaacgc gcgccggcct gggcgtcccg 60

gacgcgtcca cgttccgccg cggcgccgcg cagggcctga ggggggcccg ggcgtcggcg 120

gcggcggaca cgctcagcat gcggaccagc gcgcgcgcgg cgcccaggca ccagcaccag 180

caggcgcgcc gcggggccag gttcccgtcg ctcgtcgtgt gcgccagcgc cggcgccatg 240

gcggacgagc cgtccgaccc gatgatgaag cgcttcgagg agtggatggt ggagtacggc 300

cgcgtgtaca aggacaacga cgagaagatg cgccgcttcc agatcttcaa gaacaacgtg 360

aaccacatcg agaccttcaa ctcccgcaac gagaactcct acaccctcgg catcaaccag 420

ttcaccgaca tgaccaacaa cgagttcatc gcccagtaca ccggcggcat ctcccgcccg 480

ctcaacatcg agcgcgagcc ggtggtgtcc ttcgacgacg tggacatctc cgccgtgccg 540

cagtccatcg actggcgcga ctacggcgcc gtgacctccg tgaagaacca gaacccgtgc 600

ggcgcctgct gggccttcgc cgccatcgcc accgtggagt ccatctacaa gatcaagaag 660

ggcatcctcg agccgctctc cgagcagcag gtgctcgact gcgccaaggg ctacggctgc 720

aagggcggct gggagttccg cgccttcgag ttcatcatct ccaacaaggg cgtggcctcc 780

ggcgccatct acccgtacaa ggccgccaag ggcacctgca agaccgacgg cgtgccgaac 840

tccgcctaca tcaccggcta cgcccgcgtg ccgcgcaaca acgagtcctc catgatgtac 900

gccgtgtcca agcagccgat caccgtggcc gtggacgcca acgccaactt ccagtactac 960

aagtccggcg tgttcaacgg cccgtgcggc acctccctca accacgccgt gaccgccatc 1020

ggctacggcc aggactccat catctacccg aagaagtggg gcgccaagtg gggcgaggcc 1080

ggctacatcc gcatggcccg cgacgtgtcc tcctcctccg gcatctgcgg catcgccatc 1140

gacccgctct acccgaccct cgaggagtag 1170

<210>78

<211>1068

<212>DNA

<213>人工序列

<220>

<223>pSM270序列

<400>78

atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc 60

ccgtccgccg cctccgcctc ctcctcctcc ttcgccgact ccaacccgat ccgcccggtg 120

accgaccgcg ccgcctccac cgacgagccg tccgacccga tgatgaagcg cttcgaggag 180

tggatggtgg agtacggccg cgtgtacaag gacaacgacg agaagatgcg ccgcttccag 240

atcttcaaga acaacgtgaa ccacatcgag accttcaact cccgcaacga gaactcctac 300

accctcggca tcaaccagtt caccgacatg accaacaacg agttcatcgc ccagtacacc 360

ggcggcatct cccgcccgct caacatcgag cgcgagccgg tggtgtcctt cgacgacgtg 420

gacatctccg ccgtgccgca gtccatcgac tggcgcgact acggcgccgt gacctccgtg 480

aagaaccaga acccgtgcgg cgcctgctgg gccttcgccg ccatcgccac cgtggagtcc 540

atctacaaga tcaagaaggg catcctcgag ccgctctccg agcagcaggt gctcgactgc 600

gccaagggct acggctgcaa gggcggctgg gagttccgcg ccttcgagtt catcatctcc 660

aacaagggcg tggcctccgg cgccatctac ccgtacaagg ccgccaaggg cacctgcaag 720

accgacggcg tgccgaactc cgcctacatc accggctacg cccgcgtgcc gcgcaacaac 780

gagtcctcca tgatgtacgc cgtgtccaag cagccgatca ccgtggccgt ggacgccaac 840

gccaacttcc agtactacaa gtccggcgtg ttcaacggcc cgtgcggcac ctccctcaac 900

cacgccgtga ccgccatcgg ctacggccag gactccatca tctacccgaa gaagtggggc 960

gccaagtggg gcgaggccgg ctacatccgc atggcccgcg acgtgtcctc ctcctccggc 1020

atctgcggca tcgccatcga cccgctctac ccgaccctcg aggagtag 1068

<210>79

<211>1497

<212>DNA

<213>Trichoderma reesei

<220>

<221>CDS

<222>(1)..(1497)

<223>Trichoderma reesei 纤维二糖水解酶 I

<400>79

atg cag tcg gcg tgt act ctc caa tcg gag act cac ccg cct ctg aca 48

Met Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr

1 5 10 15

tgg cag aaa tgc tcg tct ggt ggc acg tgc act caa cag aca ggc tcc 96

Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser

20 25 30

gtg gtc atc gac gcc aac tgg cgc tgg act cac gct acg aac agc agc 144

Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser

35 40 45

acg aac tgc tac gat ggc aac act tgg agc tcg acc cta tgt cct gac 192

Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp

50 55 60

aac gag acc tgc gcg aag aac tgc tgt ctg gac ggt gcc gcc tac gcg 240

Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala

65 70 75 80

tcc acg tac gga gtt acc acg agc ggt aac agc ctc tcc att ggc ttt 288

Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe

85 90 95

gtc acc cag tct gcg cag aag aac gtt ggc gct cgc ctt tac ctt atg 336

Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met

100 105 110

gcg agc gac acg acc tac cag gaa ttc acc ctg ctt ggc aac gag ttc 384

Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe

115 120 125

tct ttc gat gtt gat gtt tcg cag ctg ccg tgc ggc ttg aac gga gct 432

Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala

130 135 140

ctc tac ttc gtg tcc atg gac gcg gat ggt ggc gtg agc aag tat ccc 480

Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro

145 150 155 160

acc aac acc gct ggc gcc aag tac ggc acg ggg tac tgt gac agc cag 528

Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln

165 170 175

tgt ccc cgc gat ctg aag ttc atc aat ggc cag gcc aac gtt gag ggc 576

Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly

180 185 190

tgg gag ccg tca tcc aac aac gcg aac acg ggc att gga gga cac gga 624

Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly

195 200 205

agc tgc tgc tct gag atg gat atc tgg gag gcc aac tcc atc tcc gag 672

Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu

210 215 220

gct ctt acc ccc cac cct tgc acg act gtc ggc cag gag atc tgc gag 720

Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu

225 230 235 240

ggt gat ggg tgc ggc gga act tac tcc gat aac aga tat ggc ggc act 768

Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr

245 250 255

tgc gat ccc gat ggc tgc gac tgg aac cca tac cgc ctg ggc aac acc 816

Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr

260 265 270

agc ttc tac ggc cct ggc tct agc ttt acc ctc gat acc acc aag aaa 864

Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys

275 280 285

ttg acc gtt gtc acc cag ttc gag acg tcg ggt gcc atc aac cga tac 912

Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr

290 295 300

tat gtc cag aat ggc gtc act ttc cag cag ccc aac gcc gag ctt ggt 960

Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly

305 310 315 320

agt tac tct ggc aac gag ctc aac gat gat tac tgc aca gct gag gag 1008

Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu

325 330 335

gca gaa ttc ggc gga tcc tct ttc tca gac aag ggc ggc ctg act cag 1056

Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln

340 345 350

ttc aag aag gct acc tct ggc ggc atg gtt ctg gtc atg agt ctg tgg 1104

Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp

355 360 365

gat gat tac tac gcc aac atg ctg tgg ctg gac tcc acc tac ccg aca 1152

Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr

370 375 380

aac gag acc tcc tcc aca ccc ggt gcc gtg cgc gga agc tgc tcc acc 1200

Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr

385 390 395 400

agc tcc ggt gtc cct get cag gtc gaa tct cag tct ccc aac gcc aag 1248

Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys

405 410 415

gtc acc ttc tcc aac atc aag ttc gga ccc att ggc agc acc ggc aac 1296

Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn

420 425 430

cct agc ggc ggc aac cct ccc ggc gga aac ccg cct ggc acc acc acc 1344

Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr

435 440 445

acc cgc cgc cca gcc act acc act gga agc tct ccc gga cct acc cag 1392

Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln

450 455 460

tct cac tac ggc cag tgc ggc ggt att ggc tac agc ggc ccc acg gtc 1440

Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val

465 470 475 480

tgc gcc agc ggc aca act tgc cag gtc ctg aac cct tac tac tct cag 1488

Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln

485 490 495

tgc ctg taa

Cys Leu

<210>80

<211>498

<212>PRT

<213>Trichoderma reesei

<400>80

Met Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr

1 5 10 15

Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser

20 25 30

Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser

35 40 45

Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp

50 55 60

Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala

65 70 75 80

Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe

85 90 95

Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met

100 105 110

Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe

115 120 125

Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala

130 135 140

Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro

145 150 155 160

Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln

165 170 175

Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly

180 185 190

Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly

195 200 205

Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu

210 215 220

Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu

225 230 235 240

Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr

245 250 255

Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr

260 265 270

Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys

275 280 285

Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr

290 295 300

Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly

305 310 315 320

Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu

325 330 335

Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln

340 345 350

Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp

355 360 365

Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr

370 375 380

Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr

385 390 395 400

Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys

405 410 415

Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn

420 425 430

Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr

435 440 445

Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln

450 455 460

Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val

465 470 475 480

Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln

485 490 495

Cys Leu

<210>81

<211>1365

<212>DNA

<213>Trichoderma reesei

<220>

<221>CDS

<222>(1)..(1365)

<223>trichoderma reesei 纤维二糖水解酶 II

<400>81

atg gtg cct cta gag gag cgg caa gct tgc tca agc gtc tgg ggc caa 48

Met Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly Gln

1 5 10 15

tgt ggt ggc cag aat tgg tcg ggt ccg act tgc tgt gct tcc gga agc 96

Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly Ser

20 25 30

aca tgc gtc tac tcc aac gac tat tac tcc cag tgt ctt ccc ggc gct 144

Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly Ala

35 40 45

gca agc tca agc tcg tcc acg cgc gcc gcg tcg acg act tca cga gta 192

Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg Val

50 55 60

tcc ccc aca aca tcc cgg tcg agc tcc gcg acg cct cca cct ggt tct 240

Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly Ser

65 70 75 80

acc act acc aga gta cct cca gtc gga tcg gga acc gct acg tat tca 288

Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr Ser

85 90 95

ggc aac cct ttt gtt ggg gtc act cct tgg gcc aat gca tat tac gcc 336

Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala

100 105 110

tct gaa gtt agc agc crc gct att cct agc ttg act gga gcc atg gcc 384

Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala

115 120 125

act gct gca gca gct gtc gca aag gtt ccc tct ttt atg tgg cta gat 432

Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu Asp

130 135 140

act ctt gac aag acc cct ctc atg gag caa acc ttg gcc gac atc cgc 480

Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg

145 150 155 160

acc gcc aac aag aat ggc ggt aac tat gcc gga cag ttt gtg gtg tat 528

Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val Tyr

165 170 175

gac ttg ccg gat cgc gat tgc gct gcc ctt gcc tcg aat ggc gaa tac 576

Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Tyr

180 185 190

tct att gcc gat ggt ggc gtc gcc aaa tat aag aac tat atc gac acc 624

Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp Thr

195 200 205

att cgt caa att gtc gtg gaa tat tcc gat atc cgg acc ctc ctg gtt 672

Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu Val

210 215 220

att gag cct gac tct ctt gcc aac ctg gtg acc aac ctc ggt act cca 720

Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr Pro

225 230 235 240

aag tgt gcc aat gct cag tca gcc tac ctt gag tgc atc aac tac gcc 768

Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr Ala

245 250 255

gtc aca cag ctg aac ctt cca aat gtt gcg atg tat ttg gac gct ggc 816

Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly

260 265 270

cat gca gga tgg ctt ggc tgg ccg gca aac caa gac ccg gcc gct cag 864

His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala Gln

275 280 285

cta ttt gca aat gtt tac aag aat gca tcg tct ccg aga gct ctt cgc 912

Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu Arg

290 295 300

gga ttg gca acc aat gtc gcc aac tac aac ggg tgg aac att acc agc 960

Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr Ser

305 310 315 320

ccc cca tcg tac acg caa ggc aac gct gtc tac aac gag aag ctg tac 1008

Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu Tyr

325 330 335

atc cac gct att gga cct ctt ctt gcc aat cac ggc tgg tcc aac gcc 1056

Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn Ala

340 345 350

ttc ttc atc act gat caa ggt cga tcg gga aag cag cct acc gga cag 1104

Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln

355 360 365

caa cag tgg gga gac tgg tgc aat gtg atc ggc acc gga ttt ggt att 1152

Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Ile

370 375 380

cgc cca tcc gca aac act ggg gac tcg ttg ctg gat tcg ttt gtc tgg 1200

Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val Trp

385 390 395 400

gtc aag cca ggc ggc gag tgt gac ggc acc agc gac agc agt gcg cca 1248

Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala Pro

405 410 415

cga ttt gac tcc cac tgt gcg ctc cca gat gcc ttg caa ccg gcg cct 1296

Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro

420 425 430

caa gct ggt gct tgg ttc caa gcc tac ttt gtg cag ctt ctc aca aac 1344

Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn

435 440 445

gca aac cca tcg ttc ctg tag 1365

Ala Asn Pro Ser Phe Leu

450

<210>82

<211>454

<212>PRT

<213>Trichoderma reesei

<400>82

Met Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly Gln

1 5 10 15

Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly Ser

20 25 30

Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly Ala

35 40 45

Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg Val

50 55 60

Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly Ser

65 70 75 80

Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr Ser

85 90 95

Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala

100 105 110

Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala

115 120 125

Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu Asp

130 135 140

Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg

145 150 155 160

Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val Tyr

165 170 175

Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Tyr

180 185 190

Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp Thr

195 200 205

Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu Val

210 215 220

Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr Pro

225 230 235 240

Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr Ala

245 250 255

Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly

260 265 270

His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala Gln

275 280 285

Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu Arg

290 295 300

Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr Ser

305 310 315 320

Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu Tyr

325 330 335

Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn Ala

340 345 350

Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln

355 360 365

Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Ile

370 375 380

Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val Trp

385 390 395 400

Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala Pro

405 410 415

Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro

420 425 430

Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn

435 440 445

Ala Asn Pro Ser Phe Leu

450

<210>83

<211>1317

<212>DNA

<213>Trichoderma reesei

<220>

<221>CDS

<222>(1)..(1317)

<223>Trichoderma reesei 内切葡聚糖酶 I

<400>83

atg cag caa ccg gga acc agc acc ccc gag gtc cat ccc aag ttg aca 48

Met Gln Gln Pro Gly Thr Ser Thr Pro Glu Val His Pro Lys Leu Thr

1 5 10 15

acc tac aag tgc aca aag tcc ggg ggg tgc gtg gcc cag gac acc tcg 96

Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val Ala Gln Asp Thr Ser

20 25 30

gtg gtc ctt gac tgg aac tac cgc tgg atg cac gac gca aac tac aac 144

Val Val Leu Asp Trp Asn Tyr Arg Trp Met His Asp Ala Asn Tyr Asn

35 40 45

tcg tgc acc gtc aac ggc ggc gtc aac acc acg ctc tgc cct gac gag 192

Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr Leu Cys Pro Asp Glu

50 55 60

gcg acc tgt ggc aag aac tgc ttc atc gag ggc gtc gac tac gcc gcc 240

Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly Val Asp Tyr Ala Ala

65 70 75 80

tcg ggc gtc acg acc tcg ggc agc agc ctc acc atg aac cag tac atg 288

Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr Met Asn Gln Tyr Met

85 90 95

ccc agc agc tct ggc ggc tac agc agc gtc tct cct cgg ctg tat ctc 336

Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser Pro Arg Leu Tyr Leu

100 105 110

ctg gac tct gac ggt gag tac gtg atg ctg aag ctc aac ggc cag gag 384

Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys Leu Asn Gly Gln Glu

115 120 125

ctg agc ttc gac gtc gac ctc tct gct ctg ccg tgt gga gag aac ggc 432

Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro Cys Gly Glu Asn Gly

130 135 140

tcg ctc tac ctg tct cag atg gac gag aac ggg ggc gcc aac cag tat 480

Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly Gly Ala Asn Gln Tyr

145 150 155 160

aac acg gcc ggt gcc aac tac ggg agc ggc tac tgc gat gct cag tgc 528

Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr Cys Asp Ala Gln Cys

165 170 175

ccc gtc cag aca tgg agg aac ggc acc ctc aac act agc cac cag ggc 576

Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn Thr Ser His Gln Gly

180 185 190

ttc tgc tgc aac gag atg gat atc ctg gag ggc aac tcg agg gcg aat 624

Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly Asn Ser Arg Ala Asn

195 200 205

gcc ttg acc cct cac tct tgc acg gcc acg gcc tgc gac tct gcc ggt 672

Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala Cys Asp Ser Ala Gly

210 215 220

tgc ggc ttc aac ccc tat ggc agc ggc tac aaa agc tac tac ggc ccc 720

Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys Ser Tyr Tyr Gly Pro

225 230 235 240

gga gat acc gtt gac acc tcc aag acc ttc acc arc atc acc cag ttc 768

Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr Ile Ile Thr Gln Phe

245 250 255

aac acg gac aac ggc tcg ccc tcg ggc aac ctt gtg agc atc acc cgc 816

Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu Val Ser Ile Thr Arg

260 265 270

aag tac cag caa aac ggc gtc gac atc ccc agc gcc cag ccc ggc ggc 864

Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser Ala Gln Pro Gly Gly

275 280 285

gac acc atc tcg tcc tgc ccg tcc gcc tca gcc tac ggc ggc ctc gcc 912

Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala Tyr Gly Gly Leu Ala

290 295 300

acc atg ggc aag gcc ctg agc agc ggc atg gtg ctc gtg ttc agc att 960

Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val Leu Val Phe Ser Ile

305 310 315 320

tgg aac gac aac agc cag tac atg aac tgg ctc gac agc ggc aac gcc 1008

Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu Asp Ser Gly Asn Ala

325 330 335

ggc ccc tgc agc agc acc gag ggc aac cca tcc aac acc ctg gcc aac 1056

Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser Asn Thr Leu Ala Asn

340 345 350

aac ccc aac acg cac gtc gtc ttc tcc aac atc cgc tgg gga gac att 1104

Asn Pro Asn Thr His Val Val Phe Ser Asn Ile Arg Trp Gly Asp Ile

355 360 365

ggg tct act acg aac tcg act gcg ccc ccg ccc ccg cct gcg tcc agc 1152

Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro Pro Pro Ala Ser Ser

370 375 380

acg acg ttt tcg act aca cgg agg agc tcg acg act tcg agc agc ccg 1200

Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr Thr Ser Ser Ser Pro

385 390 395 400

agc tgc acg cag act cac tgg ggg cag tgc ggt ggc att ggg tac agc 1248

Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly Gly Ile Gly Tyr Ser

405 410 415

ggg tgc aag acg tgc acg tcg ggc act acg tgc cag tat agc aac gac 1296

Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys Gln Tyr Ser Asn Asp

420 425 430

tac tac tcg caa tgc crt tag 1317

Tyr Tyr Ser Gln Cys Leu

435

<210>84

<211>438

<212>PRT

<213>Trichoderma reesei

<400>84

Met Gln Gln Pro Gly Thr Ser Thr Pro Glu Val His Pro Lys Leu Thr

1 5 10 15

Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val Ala Gln Asp Thr Ser

20 25 30

Val Val Leu Asp Trp Asn Tyr Arg Trp Met His Asp Ala Ash Tyr Asn

35 40 45

Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr Leu Cys Pro Asp Glu

50 55 60

Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly Val Asp Tyr Ala Ala

65 70 75 80

Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr Met Asn Gln Tyr Met

85 90 95

Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser Pro Arg Leu Tyr Leu

100 105 110

Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys Leu Asn Gly Gln Glu

115 120 125

Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro Cys Gly Glu Asn Gly

130 135 140

Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly Gly Ala Asn Gln Tyr

145 150 155 160

Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr Cys Asp Ala Gln Cys

165 170 175

Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn Thr Ser His Gln Gly

180 185 190

Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly Asn Ser Arg Ala Asn

195 200 205

Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala Cys Asp Ser Ala Gly

210 215 220

Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys Ser Tyr Tyr Gly Pro

225 230 235 240

Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr Ile Ile Thr Gln Phe

245 250 255

Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu Val Ser Ile Thr Arg

260 265 270

Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser Ala Gln Pro Gly Gly

275 280 285

Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala Tyr Gly Gly Leu Ala

290 295 300

Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val Leu Val Phe Ser Ile

305 310 315 320

Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu Asp Ser Gly Asn Ala

325 330 335

Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser Asn Thr Leu Ala Asn

340 345 350

Asn Pro Asn Thr His Val Val Phe Ser Asn Ile Arg Trp Gly Asp Ile

355 360 365

Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro Pro Pro Ala Ser Ser

370 375 380

Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr Thr Ser Ser Ser Pro

385 390 395 400

Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly Gly Ile Gly Tyr Ser

405 410 415

Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys Gln Tyr Ser Asn Asp

420 425 430

Tyr Tyr Ser Gln Cys Leu

435

<210>85

<211>954

<212>DNA

<213>人工序列

<220>

<223>6GP1

<220>

<221>CDS

<222>(1)..(954)

<223>6GP1

<400>85

atg ggc gtg gac ccg ttc gag cgc aac aag atc ctc ggc cgc ggc atc 48

Met Gly Val Asp Pro Phe Glu Arg Asn Lys Ile Leu Gly Arg Gly Ile

1 5 10 15

aac atc ggc aac gcc ctg gag gcc ccg aac gag ggc gac tgg ggc gtg 96

Asn Ile Gly Asn Ala Leu Glu Ala Pro Asn Glu Gly Asp Trp Gly Val

20 25 30

gtg atc aag gac gag ttc ttc gac atc atc aag gag gcc ggc ttc tcc 144

Val Ile Lys Asp Glu Phe Phe Asp Ile Ile Lys Glu Ala Gly Phe Ser

35 40 45

cac gtg cgc atc ccg atc cgc tgg tcc acc cac gcc tac gcc ttc ccg 192

His Val Arg Ile Pro Ile Arg Trp Ser Thr His Ala Tyr Ala Phe Pro

50 55 60

ccg tac aag atc atg gac cgc ttc ttc aag cgc gtg gac gag gtg atc 240

Pro Tyr Lys Ile Met Asp Arg Phe Phe Lys Arg Val Asp Glu Val Ile

65 70 75 80

aac ggc gcc ctc aag cgc ggc ctc gcc gtg gcc atc aac atc cac cac 288

Asn Gly Ala Leu Lys Arg Gly Leu Ala Val Ala Ile Asn Ile His His

85 90 95

tac gag gag ctc atg aac gac ccg gag gag cac aag gag cgc ttc ctc 336

Tyr Glu Glu Leu Met Asn Asp Pro Glu Glu His Lys Glu Arg Phe Leu

100 105 110

gcc ctc tgg aag cag atc gcc gac cgc tac aag gac tac ccg gag acc 384

Ala Leu Trp Lys Gln Ile Ala Asp Arg Tyr Lys Asp Tyr Pro Glu Thr

115 120 125

ctc ttc ttc gag atc ctc aac gag ccg cac ggc aac ctc acc ccg gag 432

Leu Phe Phe Glu Ile Leu Asn Glu Pro His Gly Asn Leu Thr Pro Glu

130 135 140

aag tgg aac gag ctg ctc gag gag gcc ctc aag gtg atc cgc tcc atc 480

Lys Trp Asn Glu Leu Leu Glu Glu Ala Leu Lys Val Ile Arg Ser Ile

145 150 155 160

gac aag aag cac acc atc atc att ggc acc gca gag tgg gga ggc atc 528

Asp Lys Lys His Thr Ile Ile Ile Gly Thr Ala Glu Trp Gly Gly Ile

165 170 175

tcc gcc ctc gag aag ctc tcc gtg ccg aag tgg gag aag aat tcc atc 576

Ser Ala Leu Glu Lys Leu Ser Val Pro Lys Trp Glu Lys Asn Ser Ile

180 185 190

gtg acc atc cac tac tac aac ccg ttc gag ttc acg cac cag ggc gcc 624

Val Thr Ile His Tyr Tyr Asn Pro Phe Glu Phe Thr His Gln Gly Ala

195 200 205

gag tgg gtg gag ggc tcc gag aag tgg ctt ggc cgc aag tgg ggc tcc 672

Glu Trp Val Glu Gly Ser Glu Lys Trp Leu Gly Arg Lys Trp Gly Ser

210 215 220

ccg gac gac cag aag cac ctc atc gag gag ttc aac ttc atc gag gag 720

Pro Asp Asp Gln Lys His Leu Ile Glu Glu Phe Asn Phe Ile Glu Glu

225 230 235 240

tgg tcc aag aag aac aag cgc ccg atc tac atc ggc gag ttt ggc gcc 768

Trp Ser Lys Lys Asn Lys Arg Pro Ile Tyr Ile Gly Glu Phe Gly Ala

245 250 255

tac cgc aag gcc gac ctc gag tcc cgc atc aag tgg acc tcc ttc gtg 816

Tyr Arg Lys Ala Asp Leu Glu Ser Arg Ile Lys Trp Thr Ser Phe Val

260 265 270

gtg cgt gag atg gag aag cgc cgc tgg tcc tgg gcc tac tgg gag ttc 864

Val Arg Glu Met Glu Lys Arg Arg Trp Ser Trp Ala Tyr Trp Glu Phe

275 280 285

tgc tcc ggc ttc ggc gtg tac gac acc ctc cgc aag acc tgg aac aag 912

Cys Ser Gly Phe Gly Val Tyr Asp Thr Leu Arg Lys Thr Trp Asn Lys

290 295 300

gac ctc ctc gag gcc ctc atc ggc ggc gac tcc atc gag tag 954

Asp Leu Leu Glu Ala Leu Ile Gly Gly Asp Ser Ile Glu

305 310 315

<210>86

<211>317

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>86

Met Gly Val Asp Pro Phe Glu Arg Asn Lys Ile Leu Gly Arg Gly Ile

1 5 10 15

Asn Ile Gly Asa Ala Leu Glu Ala Pro Asn Glu Gly Asp Trp Gly Val

20 25 30

Val Ile Lys Asp Glu Phe Phe Asp Ile Ile Lys Glu Ala Gly Phe Ser

35 40 45

His Val Arg Ile Pro Ile Arg Trp Ser Thr His Ala Tyr Ala Phe Pro

50 55 60

Pro Tyr Lys Ile Met Asp Arg Phe Phe Lys Arg Val Asp Glu Val Ile

65 70 75 80

Asn Gly Ala Leu Lys Arg Gly Leu Ala Val Ala Ile Asn Ile His His

85 90 95

Tyr Glu Glu Leu Met Asn Asp Pro Glu Glu His Lys Glu Arg Phe Leu

100 105 110

Ala Leu Trp Lys Gln Ile Ala Asp Arg Tyr Lys Asp Tyr Pro Glu Thr

115 120 125

Leu Phe Phe Glu Ile Leu Asn Glu Pro His Gly Asn Leu Thr Pro Glu

130 135 140

Lys Trp Asn Glu Leu Leu Glu Glu Ala Leu Lys Val Ile Arg Ser Ile

145 150 155 160

Asp Lys Lys His Thr Ile Ile Ile Gly Thr Ala Glu Trp Gly Gly Ile

165 170 175

Ser Ala Leu Glu Lys Leu Ser Val Pro Lys Trp Glu Lys Asn Ser Ile

180 185 190

Val Thr Ile His Tyr Tyr Asn Pro Phe Glu Phe Thr His Gln Gly Ala

195 200 205

Glu Trp Val Glu Gly Ser Glu Lys Trp Leu Gly Arg Lys Trp Gly Ser

210 215 220

Pro Asp Asp Gln Lys His Leu Ile Glu Glu Phe Asn Phe Ile Glu Glu

225 230 235 240

Trp Ser Lys Lys Asn Lys Arg Pro Ile Tyr Ile Gly Glu Phe Gly Ala

245 250 255

Tyr Arg Lys Ala Asp Leu Glu Ser Arg Ile Lys Trp Thr Ser Phe Val

260 265 270

Val Arg Glu Met Glu Lys Arg Arg Trp Ser Trp Ala Tyr Trp Glu Phe

275 280 285

Cys Ser Gly Phe Gly Val Tyr Asp Thr Leu Arg Lys Thr Trp Asn Lys

290 295 300

Asp Leu Leu Glu Ala Leu Ile Gly Gly Asp Ser Ile Glu

305 310 315

<210>87

<211>1248

<212>DNA

<213>Hordeun vulaare

<220>

<221>CDS

<222>(1)..(1248)

<223>大麦AmyI淀粉酶

<400>87

atg gca cac caa gtc ctc ttt cag ggg ttc aac tgg gag tcg tgg aag 48

Met Ala His Gln Val Leu Phe Gln Gly Phe Asn Trp Glu Ser Trp Lys

1 5 10 15

cag agc ggc ggg tgg tac aac atg atg atg ggc aag gtc gac gac atc 96

Gln Ser Gly Gly Trp Tyr Asn Met Met Met Gly Lys Val Asp Asp Ile

20 25 30

gcc gct gcc gga gtc acc cac gtc tgg ctg cca ccg ccg tcg cac tcc 144

Ala Ala Ala Gly Val Thr His Val Trp Leu Pro Pro Pro Ser His Ser

35 40 45

gtc tcc aac gaa ggt tac atg cct ggt cgg ctg tac gac atc gac gcg 192

Val Ser Asn Glu Gly Tyr Met Pro Gly Arg Leu Tyr Asp Ile Asp Ala

50 55 60

tcc aag tac ggc aac gcg gcg gag ctc aag tcg ctc atc ggc gcg ctc 240

Ser Lys Tyr Gly Asn Ala Ala Glu Leu Lys Ser Leu Ile Gly Ala Leu

65 70 75 80

cac ggc aag ggc gtg cag gcc atc gcc gac atc gtc atc aac cac cgc 288

His Gly Lys Gly Val Gln Ala Ile Ala Asp Ile Val Ile Asn His Arg

85 90 95

tgc gcc gac tac aag gat agc cgc ggc atc tac tgc atc ttc gag ggc 336

Cys Ala Asp Tyr Lys Asp Ser Arg Gly Ile Tyr Cys Ile Phe Glu Gly

100 105 110

ggc acc tcc gac ggc cgc ctc gac tgg ggc ccc cac atg atc tgt cgc 384

Gly Thr Ser Asp Gly Arg Leu Asp Trp Gly Pro His Met Ile Cys Arg

115 120 125

gac gac acc aaa tac tcc gat ggc acc gca aac ctc gac acc gga gcc 432

Asp Asp Thr Lys Tyr Ser Asp Gly Thr Ala Asn Leu Asp Thr Gly Ala

130 135 140

gac ttc gcc gcc gcg ccc gac atc gac cac ctc aac gac cgg gtc cag 480

Asp Phe Ala Ala Ala Pro Asp Ile Asp His Leu Asn Asp Arg Val Gln

145 150 155 160

cgc gag ctc aag gag tgg ctc ctc tgg ctc aag agc gac ctc ggc ttc 528

Arg Glu Leu Lys Glu Trp Leu Leu Trp Leu Lys Ser Asp Leu Gly Phe

165 170 175

gac gcg tgg cgc ctt gac ttc gcc agg ggc tac tcg ccg gag atg gcc 576

Asp Ala Trp Arg Leu Asp Phe Ala Arg Gly Tyr Ser Pro Glu Met Ala

180 185 190

aag gtg tac atc gac ggc aca tcc ccg agc ctc gcc gtg gcc gag gtg 624

Lys Val Tyr Ile Asp Gly Thr Ser Pro Ser Leu Ala Val Ala Glu Val

195 200 205

tgg gac aat atg gcc acc ggc ggc gac ggc aag ccc aac tac gac cag 672

Trp Asp Asn Met Ala Thr Gly Gly Asp Gly Lys Pro Asn Tyr Asp Gln

210 215 220

gac gcg cac cgg cag aat ctg gtg aac tgg gtg gac aag gtg ggc ggc 720

Asp Ala His Arg Gln Asn Leu Val Asn Trp Val Asp Lys Val Gly Gly

225 230 235 240

gcg gcc tcg gca ggc atg gtg ttc gac ttc acg acc aaa ggg ata ctg 768

Ala Ala Ser Ala Gly Met Val Phe Asp Phe Thr Thr Lys Gly Ile Leu

245 250 255

aac gct gcc gtg gag ggc gag ctg tgg agg ctg atc gac ccg cag ggg 816

Asn Ala Ala Val Glu Gly Glu Leu Trp Arg Leu Ile Asp Pro Gln Gly

260 265 270

aag gcc ccc ggc gtg atg gga tgg tgg ccg gcc aag gcc gtc acc ttc 864

Lys Ala Pro Gly Val Met Gly Trp Trp Pro Ala Lys Ala Val Thr Phe

275 280 285

gtc gac aac cac gat aca ggc tcc acg cag gcc atg tgg cca ttc ccc 912

Val Asp Asn His Asp Thr Gly Ser Thr Gln Ala Met Trp Pro Phe Pro

290 295 300

tcc gac aag gtc atg cag ggc tac gcg tac atc ctc acc cac ccc ggc 960

Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr Ile Leu Thr His Pro Gly

305 310 315 320

atc cca tgc atc ttc tac gac cat ttc ttc aac tgg ggg ttt aag gac 1008

Ile Pro Cys Ile Phe Tyr Asp His Phe Phe Asn Trp Gly Phe Lys Asp

325 330 335

cag atc gcg gcg ctg gtg gcg atc agg aag cgc aac ggc atc acg gcg 1056

Gln Ile Ala Ala Leu Val Ala Ile Arg Lys Arg Asn Gly Ile Thr Ala

340 345 350

acg agc gct ctg aag atc ctc atg cac gaa gga gat gcc tac gtc gcc 1104

Thr Ser Ala Leu Lys Ile Leu Met His Glu Gly Asp Ala Tyr Val Ala

355 360 365

gag ata gac ggc aag gtg gtg gtg aag atc ggg tcc agg tac gac gtc 1152

Glu Ile Asp Gly Lys Val Val Val Lys Ile Gly Ser Arg Tyr Asp Val

370 375 380

ggg gcg gtg atc ccg gcc ggg ttc gtg acc tcg gca cac ggc aac gac 1200

Gly Ala Val Ile Pro Ala Gly Phe Val Thr Ser Ala His Gly Asn Asp

385 390 395 400

tac gcc gtc tgg gag aag aac ggt gcc gcg gca aca cta caa cgg agc 1248

Tyr Ala Val Trp Glu Lys Asn Gly Ala Ala Ala Thr Leu Gln Arg Ser

405 410 415

<210>88

<211>416

<212>PRT

<213>Hordeum vulgare

<400>88

Met Ala His Gln Val Leu Phe Gln Gly Phe Asn Trp Glu Ser Trp Lys

1 5 10 15

Gln Ser Gly Gly Trp Tyr Asn Met Met Met Gly Lys Val Asp Asp Ile

20 25 30

Ala Ala Ala Gly Val Thr His Val Trp Leu Pro Pro Pro Ser His Ser

35 40 45

Val Ser Asn Glu Gly Tyr Met Pro Gly Arg Leu Tyr Asp Ile Asp Ala

50 55 60

Ser Lys Tyr Gly Asn Ala Ala Glu Leu Lys Ser Leu Ile Gly Ala Leu

65 70 75 80

His Gly Lys Gly Val Gln Ala Ile Ala Asp Ile Val Ile Asn His Arg

85 90 95

Cys Ala Asp Tyr Lys Asp Ser Arg Gly Ile Tyr Cys Ile Phe Glu Gly

100 105 110

Gly Thr Ser Asp Gly Arg Leu Asp Trp Gly Pro His Met Ile Cys Arg

115 120 125

Asp Asp Thr Lys Tyr Ser Asp Gly Thr Ala Asn Leu Asp Thr Gly Ala

130 135 140

Asp Phe Ala Ala Ala Pro Asp Ile Asp His Leu Asn Asp Arg Val Gln

145 150 155 160

Arg Glu Leu Lys Glu Trp Leu Leu Trp Leu Lys Ser Asp Leu Gly Phe

165 170 175

Asp Ala Trp Arg Leu Asp Phe Ala Arg Gly Tyr Ser Pro Glu Met Ala

180 185 190

Lys Val Tyr Ile Asp Gly Thr Ser Pro Ser Leu Ala Val Ala Glu Val

195 200 205

Trp Asp Asn Met Ala Thr Gly Gly Asp Gly Lys Pro Asn Tyr Asp Gln

210 215 220

Asp Ala His Arg Gln Asn Leu Val Asn Trp Val Asp Lys Val Gly Gly

225 230 235 240

Ala Ala Ser Ala Gly Met Val Phe Asp Phe Thr Thr Lys Gly Ile Leu

245 250 255

Asn Ala Ala Val Glu Gly Glu Leu Trp Arg Leu Ile Asp Pro Gln Gly

260 265 270

Lys Ala Pro Gly Val Met Gly Trp Trp Pro Ala Lys Ala Val Thr Phe

275 280 285

Val Asp Asn His Asp Thr Gly Ser Thr Gln Ala Met Trp Pro Phe Pro

290 295 300

Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr Ile Leu Thr His Pro Gly

305 310 315 320

Ile Pro Cys Ile Phe Tyr Asp His Phe Phe Asn Trp Gly Phe Lys Asp

325 330 335

Gln Ile Ala Ala Leu Val Ala Ile Arg Lys Arg Asn Gly Ile Thr Ala

340 345 350

Thr Ser Ala Leu Lys Ile Leu Met His Glu Gly Asp Ala Tyr Val Ala

355 360 365

Glu Ile Asp Gly Lys Val Val Val Lys Ile Gly Ser Arg Tyr Asp Val

370 375 380

Gly Ala Val Ile Pro Ala Gly Phe Val Thr Ser Ala His Gly Asn Asp

385 390 395 400

Tyr Ala Val Trp Glu Lys Asn Gly Ala Ala Ala Thr Leu Gln Arg Ser

405 410 415

<210>89

<211>1401

<212>DNA

<213>人工序列

<220>

<223>Trichoderma reesei β-葡糖苷酶 2

<220>

<221>CDS

<222>(1)..(1401)

<223>Trichoderma reesei β-葡糖苷酶 2

<400>89

atg ttg ccc aag gac ttt cag tgg ggg ttc gcc acg gct gcc tac cag 48

Met Leu Pro Lys Asp Phe Gln Trp Gly Phe Ala Thr Ala Ala Tyr Gln

1 5 10 15

atc gag ggc gcc gtc gac cag gac ggc cgc ggc ccc agc atc tgg gac 96

Ile Glu Gly Ala Val Asp Gln Asp Gly Arg G1y Pro Ser Ile Trp Asp

20 25 30

acg ttc tgc gcg cag ccc ggc aag atc gcc gac ggc tcg tcg ggc gtg 144

Thr Phe Cys Ala Gln Pro Gly Lys Ile Ala Asp Gly Ser Ser Gly Val

35 40 45

acg gcg tgc gac tcg tac aac cgc acg gcc gag gac att gcg ctg ctg 192

Thr Ala Cys Asp Ser Tyr Asn Arg Thr Ala Glu Asp Ile Ala Leu Leu

50 55 60

aag tcg ctc ggg gcc aag agc tac cgc ttc tcc atc tcg tgg tcg cgc 240

Lys Ser Leu Gly Ala Lys Ser Tyr Arg Phe Ser Ile Ser Trp Ser Arg

65 70 75 80

atc atc ccc gag ggc ggc cgc ggc gat gcc gtc aac cag gcg ggc atc 288

Ile Ile Pro Glu Gly Gly Arg Gly Asp Ala Val Asn Gln Ala Gly Ile

85 90 95

gac cac tac gtc aag ttc gtc gac gac ctg ctc gac gcc ggc atc acg 336

Asp His Tyr Val Lys Phe Val Asp Asp Leu Leu Asp Ala Gly Ile Thr

100 105 110

ccc ttc atc acc ctc ttc cac tgg gac ctg ccc gag ggc ctg cat cag 384

Pro Phe Ile Thr Leu Phe His Trp Asp Leu Pro Glu Gly Leu His Gln

115 120 125

cgg tac ggg ggg ctg ctg aac cgc acc gag ttc ccg ctc gac ttt gaa 432

Arg Tyr Gly Gly Leu Leu Asn Arg Thr Glu Phe Pro Leu Asp Phe Glu

130 135 140

aac tac gcc cgc gtc atg ttc agg gcg ctg ccc aag gtg cgc aac tgg 480

Asn Tyr Ala Arg Val Met Phe Arg Ala Leu Pro Lys Val Arg Asn Trp

145 150 155 160

atc acc ttc aac gag ccg ctg tgc tcg gcc atc ccg ggc tac ggc tcc 528

Ile Thr Phe Asn Glu Pro Leu Cys Ser Ala Ile Pro Gly Tyr Gly Ser

165 170 175

ggc acc ttc gcc ccc ggc cgg cag agc acc tcg gag ccg tgg acc gtc 576

Gly Thr Phe Ala Pro Gly Arg Gln Ser Thr Ser Glu Pro Trp Thr Val

180 185 190

ggc cac aac atc ctc gtc gcc cac ggc cgc gcc gtc aag gcg tac cgc 624

Gly His Asn Ile Leu Val Ala His Gly Arg Ala Val Lys Ala Tyr Arg

195 200 205

gac gac ttc aag ccc gcc agc ggc gac ggc cag atc ggc atc gtc ctc 672

Asp Asp Phe Lys Pro Ala Ser Gly Asp Gly Gln Ile Gly Ile Val Leu

210 215 220

aac ggc gac ttc acc tac ccc tgg gac gcc gcc gac ccg gcc gac aag 720

Asn Gly Asp Phe Thr Tyr Pro Trp Asp Ala Ala Asp Pro Ala Asp Lys

225 230 235 240

gag gcg gcc gag cgg cgc ctc gag ttc ttc acg gcc tgg ttc gcg gac 768

Glu Ala Ala Glu Arg Arg Leu Glu Phe Phe Thr Ala Trp Phe Ala Asp

245 250 255

ccc atc tac ttg ggc gac tac ccg gcg tcg atg cgc aag cag ctg ggc 816

Pro Ile Tyr Leu Gly Asp Tyr Pro Ala Ser Met Arg Lys Gln Leu Gly

260 265 270

gac cgg ctg ccg acc ttt acg ccc gag gag cgc gcc ctc gtc cac ggc 864

Asp Arg Leu Pro Thr Phe Thr Pro Glu Glu Arg Ala Leu Val His Gly

275 280 285

tcc aac gac ttt tac ggc atg aac cac tac acg tcc aac tac atc cgc 912

Ser Asn Asp Phe Tyr Gly Met Asn His Tyr Thr Ser Asn Tyr Ile Arg

290 295 300

cac cgc agc tcg ccc gcc tcc gcc gac gac acc gtc ggc aac gtc gac 960

His Arg Ser Ser Pro Ala Ser Ala Asp Asp Thr Val Gly Asn Val Asp

305 310 315 320

gtg ctc ttc acc aac aag cag ggc aac tgc atc ggc ccc gag acg cag 1008

Val Leu Phe Thr Asn Lys Gln Gly Asn Cys Ile Gly Pro Glu Thr Gln

325 330 335

tcc ccc tgg ctg cgc ccc tgt gcc gcc ggc ttc cgc gac ttc ctg gtg 1056

Ser Pro Trp Leu Arg Pro Cys Ala Ala Gly Phe Arg Asp Phe Leu Val

340 345 350

tgg atc agc aag agg tac ggc tac ccg ccc atc tac gtg acg gag aac 1104

Trp Ile Ser Lys Arg Tyr Gly Tyr Pro Pro Ile Tyr Val Thr Glu Asn

355 360 365

ggc acg agc atc aag ggc gag agc gac ttg ccc aag gag aag att ctc 1152

Gly Thr Ser Ile Lys Gly Glu Ser Asp Leu Pro Lys Glu Lys Ile Leu

370 375 380

gaa gat gac ttc agg gtc aag tac tat aac gag tac atc cgt gcc atg 1200

Glu Asp Asp Phe Arg Val Lys Tyr Tyr Asn Glu Tyr Ile Arg Ala Met

385 390 395 400

gtt acc gcc gtg gag ctg gac ggg gtc aac gtc aag ggg tac ttt gcc 1248

Val Thr Ala Val Glu Leu Asp Gly Val Asn Val Lys Gly Tyr Phe Ala

405 410 415

tgg tcg ctc atg gac aac ttt gag tgg gcg gac ggc tac gtg acg agg 1296

Trp Ser Leu Met Asp Asn Phe Glu Trp Ala Asp Gly Tyr Val Thr Arg

420 425 430

ttt ggg gtt acg tat gtg gat tat gag aat ggg cag aag cgg ttc ccc 1344

Phe Gly Val Thr Tyr Val Asp Tyr Glu Asn Gly Gln Lys Arg Phe Pro

435 440 445

aag aag agc gca aag agc ttg aag ccg ctg ttt gac gag ctg att gcg 1392

Lys Lys Ser Ala Lys Ser Leu Lys Pro Leu Phe Asp Glu Leu Ile Ala

450 455 460

gcg gcg tga 1401

Ala Ala

465

<210>90

<211>466

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>90

Met Leu Pro Lys Asp Phe Gln Trp Gly Phe Ala Thr Ala Ala Tyr Gln

1 5 10 15

Ile Glu Gly Ala Val Asp Gln Asp Gly Arg Gly Pro Ser Ile Trp Asp

20 25 30

Thr Phe Cys Ala Gln Pro Gly Lys Ile Ala Asp Gly Ser Ser Gly Val

35 40 45

Thr Ala Cys Asp Ser Tyr Asn Arg Thr Ala Glu Asp Ile Ala Leu Leu

50 55 60

Lys Ser Leu Gly Ala Lys Ser Tyr Arg Phe Ser Ile Ser Trp Ser Arg

65 70 75 80

Ile Ile Pro Glu Gly Gly Arg Gly Asp Ala Val Asn Gln Ala Gly Ile

85 90 95

Asp His Tyr Val Lys Phe Val Asp Asp Leu Leu Asp Ala Gly Ile Thr

100 105 110

Pro Phe Ile Thr Leu Phe His Trp Asp Leu Pro Glu Gly Leu His Gln

115 120 125

Arg Tyr Gly Gly Leu Leu Asn Arg Thr Glu Phe Pro Leu Asp Phe Glu

130 135 140

Asn Tyr Ala Arg Val Met Phe Arg Ala Leu Pro Lys Val Arg Asn Trp

145 150 155 160

Ile Thr Phe Asn Glu Pro Leu Cys Ser Ala Ile Pro Gly Tyr Gly Ser

165 170 175

Gly Thr Phe Ala Pro Gly Arg Gln Ser Thr Ser Glu Pro Trp Thr Val

180 185 190

Gly His Asn Ile Leu Val Ala His Gly Arg Ala Val Lys Ala Tyr Arg

195 200 205

Asp Asp Phe Lys Pro Ala Ser Gly Asp Gly Gln Ile Gly Ile Val Leu

210 215 220

Asn Gly Asp Phe Thr Tyr Pro Trp Asp Ala Ala Asp Pro Ala Asp Lys

225 230 235 240

Glu Ala Ala Glu Arg Arg Leu Glu Phe Phe Thr Ala Trp Phe Ala Asp

245 250 255

Pro Ile Tyr Leu Gly Asp Tyr Pro Ala Ser Met Arg Lys Gln Leu Gly

260 265 270

Asp Arg Leu Pro Thr Phe Thr Pro Glu Glu Arg Ala Leu Val His Gly

275 280 285

Ser Asn Asp Phe Tyr Gly Met Asn His Tyr Thr Ser Asn Tyr Ile Arg

290 295 300

His Arg Ser Ser Pro Ala Ser Ala Asp Asp Thr Val Gly Asn Val Asp

305 310 315 320

Val Leu Phe Thr Asn Lys Gln Gly Asn Cys Ile Gly Pro Glu Thr Gln

325 330 335

Ser Pro Trp Leu Arg Pro Cys Ala Ala Gly Phe Arg Asp Phe Leu Val

340 345 350

Trp Ile Ser Lys Arg Tyr Gly Tyr Pro Pro Ile Tyr Val Thr Glu Asn

355 360 365

Gly Thr Ser Ile Lys Gly Glu Ser Asp Leu Pro Lys Glu Lys Ile Leu

370 375 380

Glu Asp Asp Phe Arg Val Lys Tyr Tyr Asn Glu Tyr Ile Arg Ala Met

385 390 395 400

Val Thr Ala Val Glu Leu Asp Gly Val Asn Val Lys Gly Tyr Phe Ala

405 410 415

Trp Ser Leu Met Asp Asn Phe Glu Trp Ala Asp Gly Tyr Val Thr Arg

420 425 430

Phe Gly Val Thr Tyr Val Asp Tyr Glu Asn Gly Gln Lys Arg Phe Pro

435 440 445

Lys Lys Ser Ala Lys Ser Leu Lys Pro Leu Phe Asp Glu Leu Ile Ala

450 455 460

Ala Ala

465

<210>91

<211>2103

<212>DNA

<213>人工序列

<220>

<223>Trichoderma reesei β-葡糖苷酶 D

<220>

<221>CDS

<222>(1)..(2103)

<223>Trichoderma reesei β-葡糖苷酶 D

<400>91

atg att ctc ggc tgt gaa agc aca ggt gtc atc tct gcc gtc aaa cac 48

Met Ile Leu Gly Cys Glu Ser Thr Gly Val Ile Ser Ala Val Lys His

1 5 10 15

ttt gtc gcc aac gac cag gag cac gag cgg cga gcg gtc gac tgt ctc 96

Phe Val Ala Asn Asp Gln Glu His Glu Arg Arg Ala Val Asp Cys Leu

20 25 30

atc acc cag cgg gct ctc cgg gag gtc tat ctg cga ccc ttc cag atc 144

Ile Thr Gln Arg Ala Leu Arg Glu Val Tyr Leu Arg Pro Phe Gln Ile

35 40 45

gta gcc cga gat gca agg ccc ggc gca ttg atg aca tcc tac aac aag 192

Val Ala Arg Asp Ala Arg Pro Gly Ala Leu Met Thr Ser Tyr Asn Lys

50 55 60

gtc aat ggc aag cac gtc gct gac agc gcc gag ttc ctt cag ggc att 240

Val Asn Gly Lys His Val Ala Asp Ser Ala Glu Phe Leu Gln Gly Ile

65 70 75 80

ctc cgg act gag tgg aat tgg gac cct ctc att gtc agc gac tgg tac 288

Leu Arg Thr Glu Trp Asn Trp Asp Pro Leu Ile Val Ser Asp Trp Tyr

85 90 95

ggc acc tac acc act att gat gcc atc aaa gcc ggc ctt gat ctc gag 336

Gly Thr Tyr Thr Thr Ile Asp Ala Ile Lys Ala Gly Leu Asp Leu Glu

100 105 110

atg ccg ggc gtt tca cga tat cgc ggc aaa tac atc gag tct gct ctg 384

Met Pro Gly Val Ser Arg Tyr Arg Gly Lys Tyr Ile Glu Ser Ala Leu

115 120 125

cag gcc cgt ttg ctg aag cag tcc act atc gat gag cgc gct cgc cgc 432

Gln Ala Arg Leu Leu Lys Gln Ser Thr Ile Asp Glu Arg Ala Arg Arg

130 135 140

gtg ctc agg ttc gcc cag aag gcc agc cat ctc aag gtc tcc gag gta 480

Val Leu Arg Phe Ala Gln Lys Ala Ser His Leu Lys Val Ser Glu Val

145 150 155 160

gag caa ggc cgt gac ttc cca gag gat cgc gtc ctc aac cgt cag atc 528

Glu Gln Gly Arg Asp Phe Pro Glu Asp Arg Val Leu Asn Arg Gln Ile

165 170 175

tgc ggc agc agc att gtc cta ctg aag aat gag aac tcc atc tta cct 576

Cys Gly Ser Ser Ile Val Leu Leu Lys Asn Glu Asn Ser Ile Leu Pro

180 185 190

ctc ccc aag tcc gtc aag aag gtc gcc ctt gtt ggt tcc cac gtg cgt 624

Leu Pro Lys Ser Val Lys Lys Val Ala Leu Val Gly Ser His Val Arg

195 200 205

cta ccg gct atc tcg gga gga ggc agc gcc tct ctt gtc cct tac tat 672

Leu Pro Ala Ile Ser Gly Gly Gly Ser Ala Ser Leu Val Pro Tyr Tyr

210 215 220

gcc ata tct cta tac gat gcc gtc tct gag gta cta gcc ggt gcc acg 720

Ala Ile Ser Leu Tyr Asp Ala Val Ser Glu Val Leu Ala Gly Ala Thr

225 230 235 240

atc acg cac gag gtc ggt gcc tat gcc cac caa atg ctg ccc gtc atc 768

Ile Thr His Glu Val Gly Ala Tyr Ala His Gln Met Leu Pro Val Ile

245 250 255

gac gca atg atc agc aac gcc gta atc cac ttc tac aac gac ccc atc 816

Asp Ala Met Ile Ser Asn Ala Val Ile His Phe Tyr Asn Asp Pro Ile

260 265 270

gat gtc aaa gac aga aag ctc ctt ggc agt gag aac gta tcg tcg aca 864

Asp Val Lys Asp Arg Lys Leu Leu Gly Ser Glu Asn Val Ser Ser Thr

275 280 285

tcg ttc cag ctc atg gat tac aac aac atc cca acg ctc aac aag gcc 912

Ser Phe Gln Leu Met Asp Tyr Asn Asn Ile Pro Thr Leu Asn Lys Ala

290 295 300

atg ttc tgg ggt act ctc gtg ggc gag ttt atc cct acc gcc acg gga 960

Met Phe Trp Gly Thr Leu Val Gly Glu Phe Ile Pro Thr Ala Thr Gly

305 310 315 320

att tgg gaa ttt ggc ctc agt gtc ttt ggc act gcc gac ctt tat att 1008

Ile Trp Glu Phe Gly Leu Ser Val Phe Gly Thr Ala Asp Leu Tyr Ile

325 330 335

gat aat gag ctc gtg att gaa aat aca aca cat cag acg cgt gga acc 1056

Asp Asn Glu Leu Val Ile Glu Asn Thr Thr His Gln Thr Arg Gly Thr

340 345 350

gcc ttt ttc gga aag gga acg acg gaa aaa gtc gct acc agg agg atg 1104

Ala Phe Phe Gly Lys Gly Thr Thr Glu Lys Val Ala Thr Arg Arg Met

355 360 365

gtg gcc ggc agc acc tac aag ctg cgt ctc gag ttt ggg tct gcc aac 1152

Val Ala Gly Ser Thr Tyr Lys Leu Arg Leu Glu Phe Gly Ser Ala Asn

370 375 380

acg acc aag atg gag acg acc ggt gtt gtc aac ttt ggc ggc ggt gcc 1200

Thr Thr Lys Met Glu Thr Thr Gly Val Val Asn Phe Gly Gly Gly Ala

385 390 395 400

gta cac ctg ggt gcc tgt ctc aag gtc gac cca cag gag atg att gcg 1248

Val His Leu Gly Ala Cys Leu Lys Val Asp Pro Gln Glu Met Ile Ala

405 410 415

cgg gcc gtc aag gcc gca gcc gat gcc gac tac acc atc atc tgc acg 1296

Arg Ala Val Lys Ala Ala Ala Asp Ala Asp Tyr Thr Ile Ile Cys Thr

420 425 430

gga ctc agc ggc gag tgg gag tct gag ggt ttt gac cgg cct cac atg 1344

Gly Leu Ser Gly Glu Trp Glu Ser Glu Gly Phe Asp Arg Pro His Met

435 440 445

gac ctg ccc cct ggt gtg gac acc atg atc tcg caa gtt ctt gac gcc 1392

Asp Leu Pro Pro Gly Val Asp Thr Met Ile Ser Gln Val Leu Asp Ala

450 455 460

gct ccc aat gct gta gtc gtc aac cag tca ggc acc cca gtg aca atg 1440

Ala Pro Asn Ala Val Val Val Asn Gln Ser Gly Thr Pro Val Thr Met

465 470 475 480

agc tgg gct cat aaa gca aag gcc att gtg cag gct tgg tat ggt ggt 1488

Ser Trp Ala His Lys Ala Lys Ala Ile Val Gln Ala Trp Tyr Gly Gly

485 490 495

aac gag aca ggc cac gga atc tcc gat gtg ctc ttt ggc aac gtc aac 1536

Asn Glu Thr Gly His Gly Ile Ser Asp Val Leu Phe Gly Asn Val Asn

500 505 510

ccg tcg ggg aaa ctc tcc cta tcg tgg cca gtc gat gtg aag cac aac 1584

Pro Ser Gly Lys Leu Ser Leu Ser Trp Pro Val Asp Val Lys His Asn

515 520 525

cca gca tat ctc aac tac gcc agc gtt ggt gga cgg gtc ttg tat ggc 1632

Pro Ala Tyr Leu Asn Tyr Ala Ser Val Gly Gly Arg Val Leu Tyr Gly

530 535 540

gag gat gtt tac gtt ggc tac aag ttc tac gac aaa acg gag agg gag 1680

Glu Asp Val Tyr Val Gly Tyr Lys Phe Tyr Asp Lys Thr Glu Arg Glu

545 550 555 560

gtt ctg ttt cct ttt ggg cat ggc ctg tct tac gct acc ttc aag ctc 1728

Val Leu Phe Pro Phe Gly His Gly Leu Ser Tyr Ala Thr Phe Lys Leu

565 570 575

cca gat tct acc gtg agg acg gtc ccc gaa acc ttc cac ccg gac cag 1776

Pro Asp Ser Thr Val Arg Thr Val Pro Glu Thr Phe His Pro Asp Gln

580 585 590

ccc aca gta gcc att gtc aag atc aag aac acg agc agt gtc ccg ggc 1824

Pro Thr Val Ala Ile Val Lys Ile Lys Asn Thr Ser Ser Val Pro Gly

595 600 605

gcc cag gtc ctg cag tta tac att tcg gcc cca aac tcg cct aca cat 1872

Ala Gln Val Leu Gln Leu Tyr Ile Ser Ala Pro Asn Ser Pro Thr His

610 615 620

cgc ccg gtc aag gag ctg cac gga ttc gaa aag gtg tat ctt gaa gct 1920

Arg Pro Val Lys Glu Leu His Gly Phe Glu Lys Val Tyr Leu Glu Ala

625 630 635 640

ggc gag gag aag gag gta caa ata ccc att gac cag tac gct act agc 1968

Gly Glu Glu Lys Glu Val Gln Ile Pro Ile Asp Gln Tyr Ala Thr Ser

645 650 655

ttc tgg gac gag att gag agc atg tgg aag agc gag agg ggc att tat 2016

Phe Trp Asp Glu Ile Glu Ser Met Trp Lys Ser Glu Arg Gly Ile Tyr

660 665 670

gat gtg ctt gta gga ttc tog agt cag gaa atc tcg ggc aag ggg aag 2064

Asp Val Leu Val Gly Phe Ser Ser Gln Glu Ile Ser Gly Lys Gly Lys

675 680 685

ctg att gtg cct gaa acg cga ttc tgg atg ggg ctg tag 2103

Leu Ile Val Pro Glu Thr Arg Phe Trp Met Gly Leu

690 695 700

<210>92

<211>700

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>92

Met Ile Leu Gly Cys Glu Ser Thr Gly Val Ile Ser Ala Val Lys His

1 5 10 15

Phe Val Ala Asn Asp Gln Glu His Glu Arg Arg Ala Val Asp Cys Leu

20 25 30

Ile Thr Gln Arg Ala Leu Arg Glu Val Tyr Leu Arg Pro Phe Gln Ile

35 40 45

Val Ala Arg Asp Ala Arg Pro Gly Ala Leu Met Thr Ser Tyr Asn Lys

50 55 60

Val Asn Gly Lys His Val Ala Asp Ser Ala Glu Phe Leu Gln Gly Ile

65 70 75 80

Leu Arg Thr Glu Trp Asn Trp Asp Pro Leu Ile Val Ser Asp Trp Tyr

85 90 95

Gly Thr Tyr Thr Thr Ile Asp Ala Ile Lys Ala Gly Leu Asp Leu Glu

100 105 110

Met Pro Gly Val Ser Arg Tyr Arg Gly Lys Tyr Ile Glu Ser Ala Leu

115 120 125

Gln Ala Arg Leu Leu Lys Gln Ser Thr Ile Asp Glu Arg Ala Arg Arg

130 135 140

Val Leu Arg Phe Ala Gln Lys Ala Ser His Leu Lys Val Ser Glu Val

145 150 155 160

Glu Gln Gly Arg Asp Phe Pro Glu Asp Arg Val Leu Asn Arg Gln Ile

165 170 175

Cys Gly Ser Ser Ile Val Leu Leu Lys Asn Glu Asn Ser Ile Leu Pro

180 185 190

Leu Pro Lys Ser Val Lys Lys Val Ala Leu Val Gly Ser His Val Arg

195 200 205

Leu Pro Ala Ile Ser Gly Gly Gly Ser Ala Ser Leu Val Pro Tyr Tyr

210 215 220

Ala Ile Ser Leu Tyr Asp Ala Val Ser Glu Val Leu Ala Gly Ala Thr

225 230 235 240

Ile Thr His Glu Val Gly Ala Tyr Ala His Gln Met Leu Pro Val Ile

245 250 255

Asp Ala Met Ile Ser Asn Ala Val Ile His Phe Tyr Asn Asp Pro Ile

260 265 270

Asp Val Lys Asp Arg Lys Leu Leu Gly Ser Glu Asn Val Ser Ser Thr

275 280 285

Ser Phe Gln Leu Met Asp Tyr Asn Asn Ile Pro Thr Leu Asn Lys Ala

290 295 300

Met Phe Trp Gly Thr Leu Val Gly Glu Phe Ile Pro Thr Ala Thr Gly

305 310 315 320

Ile Trp Glu Phe Gly Leu Ser Val Phe Gly Thr Ala Asp Leu Tyr Ile

325 330 335

Asp Asn Glu Leu Val Ile Glu Asn Thr Thr His Gln Thr Arg Gly Thr

340 345 350

Ala Phe Phe Gly Lys Gly Thr Thr Glu Lys Val Ala Thr Arg Arg Met

355 360 365

Val Ala Gly Ser Thr Tyr Lys Leu Arg Leu Glu Phe Gly Ser Ala Asn

370 375 380

Thr Thr Lys Met Glu Thr Thr Gly Val Val Asn Phe Gly Gly Gly Ala

385 390 395 400

Val His Leu Gly Ala Cys Leu Lys Val Asp Pro Gln Glu Met Ile Ala

405 410 415

Arg Ala Val Lys Ala Ala Ala Asp Ala Asp Tyr Thr Ile Ile Cys Thr

420 425 430

Gly Leu Ser Gly Glu Trp Glu Ser Glu Gly Phe Asp Arg Pro His Met

435 440 445

Asp Leu Pro Pro Gly Val Asp Thr Met Ile Ser Gln Val Leu Asp Ala

450 455 460

Ala Pro Asn Ala Val Val Val Asn Gln Ser Gly Thr Pro Val Thr Met

465 470 475 480

Ser Trp Ala His Lys Ala Lys Ala Ile Val Gln Ala Trp Tyr Gly Gly

485 490 495

Asn Glu Thr Gly His Gly Ile Ser Asp Val Leu Phe Gly Asn Val Asn

500 505 510

Pro Ser Gly Lys Leu Ser Leu Ser Trp Pro Val Asp Val Lys His Asn

515 520 525

Pro Ala Tyr Leu Asn Tyr Ala Ser Val Gly Gly Arg Val Leu Tyr Gly

530 535 540

Glu Asp Val Tyr Val Gly Tyr Lys Phe Tyr Asp Lys Thr Glu Arg Glu

545 550 555 560

Val Leu Phe Pro Phe Gly His Gly Leu Ser Tyr Ala Thr Phe Lys Leu

565 570 575

Pro Asp Ser Thr Val Arg Thr Val Pro Glu Thr Phe His Pro Asp Gln

580 585 590

Pro Thr Val Ala Ile Val Lys Ile Lys Asn Thr Ser Ser Val Pro Gly

595 600 605

Ala Gln Val Leu Gln Leu Tyr Ile Ser Ala Pro Asn Ser Pro Thr His

610 615 620

Arg Pro Val Lys Glu Leu His Gly Phe Glu Lys Val Tyr Leu Glu Ala

625 630 635 640

Gly Glu Glu Lys Glu Val Gln Ile Pro Ile Asp Gln Tyr Ala Thr Ser

645 650 655

Phe Trp Asp Glu Ile Glu Ser Met Trp Lys Ser Glu Arg Gly Ile Tyr

660 665 670

Asp Val Leu Val Gly Phe Ser Ser Gln Glu Ile Ser Gly Lys Gly Lys

675 680 685

Leu Ile Val Pro Glu Thr Arg Phe Trp Met Gly Leu

690 695 700

<210>93

<211>1496

<212>DNA

<213>人工序列

<220>

<223>玉米优化的CBHI

<400>93

tgcagtccgc ctgcaccctc cagtccgaga cccacccgcc gctcacctgg cagaagtgct 60

cctccggcgg cacctgcacc cagcagaccg gctccgtggt gatcgacgcc aactggcgct 120

ggacccacgc caccaactcc tccaccaact gctacgacgg caacacctgg tcctccaccc 180

tctgcccgga caacgagacc tgcgccaaga actgctgcct cgacggcgcc gcctacgcct 240

ccacctacgg cgtgaccacc tccggcaact ccctctccat cggcttcgtg acccagtccg 300

cccagaagaa cgtgggcgcc cgcctctacc tcatggcctc cgacaccacc taccaggagt 360

tcaccctcct cggcaacgag ttctccttcg acgtggacgt gtcccagctc ccgtgcggcc 420

tcaacggcgc cctctacttc gtgtccatgg acgccgacgg cggcgtgtcc aagtacccga 480

ccaacaccgc cggcgccaag tacggcaccg gctactgcga ctcccagtgc ccgcgcgacc 540

tcaagttcat caacggccag gccaacgtgg agggctggga gccgtcctcc aacaacgcca 600

acaccggcat cggcggccac ggctcctgct gctccgagat ggacatctgg gaggccaact 660

ccatctccga ggccctcacc ccgcacccgt gcaccaccgt gggccaggag atctgcgagg 720

gcgacggctg cggcggcacc tactccgaca accgctacgg cggcacctgc gacccggacg 780

gctgcgactg gaacccgtac cgcctcggca acacctcctt ctacggcccg ggctcctcct 840

tcaccctcga caccaccaag aagctcaccg tggtgaccca gttcgagacc tccggcgcca 900

tcaaccgcta ctacgtgcag aacggcgtga ccttccagca gccgaacgcc gagctcggct 960

cctactccgg caacgagctc aacgacgact actgcaccgc cgaggaggcc gagttcggcg 1020

gctcctcctt ctccgacaag ggcggcctca cccagttcaa gaaggccacc tccggcggca 1080

tggtgctcgt gatgtccctc tgggacgact actacgccaa catgctctgg ctcgactcca 1140

cctacccgac caacgagacc tcctccaccc cgggcgccgt gcgcggctcc tgctccacct 1200

cctccggcgt gccggcccag gtggagtccc agtccccgaa cgccaaggtg accttctcca 1260

acatcaagtt cggcccgatc ggctccaccg gcaacccgtc cggcggcaac ccgccgggcg 1320

gcaacccgcc gggcaccacc accacccgcc gcccggccac caccaccggc tcctccccgg 1380

gcccgaccca gtcccactac ggccagtgcg gcggcatcgg ctactccggc ccgaccgtgt 1440

gcgcctccgg caccacctgc caggtgctca acccgtacta ctcccagtgc ctctag 1496

<210>94

<211>1365

<212>DNA

<213>人工序列

<220>

<223>玉米优化的CBHII

<400>94

atggtgccgc tcgaggagcg ccaggcctgc tcctccgtgt ggggccagtg cggcggccag 60

aactggtccg gcccgacctg ctgcgcctcc ggctccacct gcgtgtactc caacgactac 120

tactcccagt gcctcccggg cgccgcctcc tcctcctcct ccacccgcgc cgcctccacc 180

acctcccgcg tgtccccgac cacctcccgc tcctcctccg ccaccccgcc gccgggctcc 240

accaccaccc gcgtgccgcc ggtgggctcc ggcaccgcca cctactccgg caacccgttc 300

gtgggcgtga ccccgtgggc caacgcctac tacgcctccg aggtgtcctc cctcgccatc 360

ccgtccctca ccggcgccat ggccaccgcc gccgccgccg tggccaaggt gccgtccttc 420

atgtggctcg acaccctcga caagaccccg ctcatggagc agaccctcgc cgacatccgc 480

accgccaaca agaacggcgg caactacgcc ggccagttcg tggtgtacga cctcccggac 540

cgcgactgcg ccgccctcgc ctccaacggc gagtactcca tcgccgacgg cggcgtggcc 600

aagtacaaga actacatcga caccatccgc cagatcgtgg tggagtactc cgacatccgc 660

accctcctcg tgatcgagcc ggactccctc gccaacctcg tgaccaacct cggcaccccg 720

aagtgcgcca acgcccagtc cgcctacctc gagtgcatca actacgccgt gacccagctc 780

aacctcccga acgtggccat gtacctcgac gccggccacg ccggctggct cggctggccg 840

gccaaccagg acccggccgc ccagctcttc gccaacgtgt acaagaacgc ctcctccccg 900

cgcgccctcc gcggcctcgc caccaacgtg gccaactaca acggctggaa catcacctcc 960

ccgccgtcct acacccaggg caacgccgtg tacaacgaga agctctacat ccacgccatc 1020

ggcccgctcc tcgccaacca cggctggtcc aacgccttct tcatcaccga ccagggccgc 1080

tccggcaagc agccgaccgg ccagcagcag tggggcgact ggtgcaacgt gatcggcacc 1140

ggcttcggca tccgcccgtc cgccaacacc ggcgactccc tcctcgactc cttcgtgtgg 1200

gtgaagccgg gcggcgagtg cgacggcacc tccgactcct ccgccccgcg cttcgactcc 1260

cactgcgccc tcccggacgc cctccagccg gccccgcagg ccggcgcctg gttccaggcc 1320

tacttcgtgc agctcctcac caacgccaac ccgtccttcc tctag 1365

<210>95

<211>1317

<212>DNA

<213>人工序列

<220>

<223>玉米优化的EGLI

<400>95

atgcagcagc cgggcacctc caccccggag gtgcacccga agctcaccac ctacaagtgc 60

accaagtccg gcggctgcgt ggcccaggac acctccgtgg tgctcgactg gaactaccgc 120

tggatgcacg acgccaacta caactcctgc accgtgaacg gcggcgtgaa caccaccctc 180

tgcccggacg aggccacctg cggcaagaac tgcttcatcg agggcgtgga ctacgccgcc 240

tccggcgtga ccacctccgg ctcctccctc accatgaacc agtacatgcc gtcctcctcc 300

ggcggctact cctccgtgtc cccgcgcctc tacctcctcg actccgacgg cgagtacgtg 360

atgctcaagc tcaacggcca ggagctctcc ttcgacgtgg acctctccgc cctcccgtgc 420

ggcgagaacg gctccctcta cctctcccag atggacgaga acggcggcgc caaccagtac 480

aacaccgccg gcgccaacta cggctccggc tactgcgacg cccagtgccc ggtgcagacc 540

tggcgcaacg gcaccctcaa cacctcccac cagggcttct gctgcaacga gatggacatc 600

ctcgagggca actcccgcgc caacgccctc accccgcact cctgcaccgc caccgcctgc 660

gactccgccg gctgcggctt caacccgtac ggctccggct acaagtccta ctacggcccg 720

ggcgacaccg tggacacctc caagaccttc accatcatca cccagttcaa caccgacaac 780

ggctccccgt ccggcaacct cgtgtccatc acccgcaagt accagcagaa cggcgtggac 840

atcccgtccg cccagccggg cggcgacacc atctcctcct gcccgtccgc ctccgcctac 900

ggcggcctcg ccaccatggg caaggccctc tcctccggca tggtgctcgt gttctccatc 960

tggaacgaca actcccagta catgaactgg ctcgactccg gcaacgccgg cccgtgctcc 1020

tccaccgagg gcaacccgtc caacaccctc gccaacaacc cgaacaccca cgtggtgttc 1080

tccaacatcc gctggggcga catcggctcc accaccaact ccaccgcccc gccgccgccg 1140

ccggcctcct ccaccacctt ctccaccacc cgccgctcct ccaccacctc ctcctccccg 1200

tcctgcaccc agacccactg gggccagtgc ggcggcatcg gctactccgg ctgcaagacc 1260

tgcacctccg gcaccacctg ccagtactcc aacgactact actcccagtg cctctag 1317

<210>96

<211>1401

<212>DNA

<213>人工序列

<220>

<223>玉米优化的BGLII

<400>96

atgctcccga aggacttcca gtggggcttc gccaccgccg cctaccagat cgagggcgcc 60

gtggaccagg acggccgcgg cccgtccatc tgggacacct tctgcgccca gccgggcaag 120

atcgccgacg gctcctccgg cgtgaccgcc tgcgactcct acaaccgcac cgccgaggac 180

atcgccctcc tcaagtccct cggcgccaag tcctaccgct tctccatctc ctggtcccgc 240

atcatcccgg agggcggccg cggcgacgcc gtgaaccagg ccggcatcga ccactacgtg 300

aagttcgtgg acgacctcct cgacgccggc atcaccccgt tcatcaccct cttccactgg 360

gacctcccgg agggcctcca ccagcgctac ggcggcctcc tcaaccgcac cgagttcccg 420

ctcgacttcg agaactacgc ccgcgtgatg ttccgcgccc tcccgaaggt gcgcaactgg 480

atcaccttca acgagccgct ctgctccgcc atcccgggct acggctccgg caccttcgcc 540

ccgggccgcc agtccacctc cgagccgtgg accgtgggcc acaacatcct cgtggcccac 600

ggccgcgccg tgaaggccta ccgcgacgac ttcaagccgg cctccggcga cggccagatc 660

ggcatcgtgc tcaacggcga cttcacctac ccgtgggacg ccgccgaccc ggccgacaag 720

gaggccgccg agcgccgcct cgagttcttc accgcctggt tcgccgaccc gatctacctc 780

ggcgactacc cggcctccat gcgcaagcag ctcggcgacc gcctcccgac cttcaccccg 840

gaggagcgcg ccctcgtgca cggctccaac gacttctacg gcatgaacca ctacacctcc 900

aactacatcc gccaccgctc ctccccggcc tccgccgacg acaccgtggg caacgtggac 960

gtgctcttca ccaacaagca gggcaactgc atcggcccgg agacccagtc cccgtggctc 1020

cgcccgtgcg ccgccggctt ccgcgacttc ctcgtgtgga tctccaagcg ctacggctac 1080

ccgccgatct acgtgaccga gaacggcacc tccatcaagg gcgagtccga cctcccgaag 1140

gagaagatcc tcgaggacga cttccgcgtg aagtactaca acgagtacat ccgcgccatg 1200

gtgaccgccg tggagctcga cggcgtgaac gtgaagggct acttcgcctg gtccctcatg 1260

gacaacttcg agtgggccga cggctacgtg acccgcttcg gcgtgaccta cgtggactac 1320

gagaacggcc agaagcgctt cccgaagaag tccgccaagt ccctcaagcc gctcttcgac 1380

gagctcatcg ccgccgccta g 1401

<210>97

<211>2103

<212>DNA

<213>人工序列

<220>

<223>玉米优化的CEL3D

<400>97

atgatcctcg gctgcgagtc caccggcgtg atctccgccg tgaagcactt cgtggccaac 60

gaccaggagc acgagcgccg cgccgtggac tgcctcatca cccagcgcgc cctccgcgag 120

gtgtacctcc gcccgttcca gatcgtggcc cgcgacgccc gcccgggcgc cctcatgacc 180

tcctacaaca aggtgaacgg caagcacgtg gccgactccg ccgagttcct ccagggcatc 240

ctccgcaccg agtggaactg ggacccgctc atcgtgtccg actggtacgg cacctacacc 300

accatcgacg ccatcaaggc cggcctcgac ctcgagatgc cgggcgtgtc ccgctaccgc 360

ggcaagtaca tcgagtccgc cctccaggcc cgcctcctca agcagtccac catcgacgag 420

cgcgcccgcc gcgtgctccg cttcgcccag aaggcctccc acctcaaggt gtccgaggtg 480

gagcagggcc gcgacttccc ggaggaccgc gtgctcaacc gccagatctg cggctcctcc 540

atcgtgctcc tcaagaacga gaactccatc ctcccgctcc cgaagtccgt gaagaaggtg 600

gccctcgtgg gctcccacgt gcgcctcccg gccatctccg gcggcggctc cgcctccctc 660

gtgccgtact acgccatctc cctctacgac gccgtgtccg aggtgctcgc cggcgccacc 720

atcacccacg aggtgggcgc ctacgcccac cagatgctcc cggtgatcga cgccatgatc 780

tccaacgccg tgatccactt ctacaacgac ccgatcgacg tgaaggaccg caagctcctc 840

ggctccgaga acgtgtcctc cacctccttc cagctcatgg actacaacaa catcccgacc 900

ctcaacaagg ccatgttctg gggcaccctc gtgggcgagt tcatcccgac cgccaccggc 960

atctgggagt tcggcctctc cgtgttcggc accgccgacc tctacatcga caacgagctc 1020

gtgatcgaga acaccaccca ccagacccgc ggcaccgcct tcttcggcaa gggcaccacc 1080

gagaaggtgg ccacccgccg catggtggcc ggctccacct acaagctccg cctcgagttc 1140

ggctccgcca acaccaccaa gatggagacc accggcgtgg tgaacttcgg cggcggcgcc 1200

gtgcacctcg gcgcctgcct caaggtggac ccgcaggaga tgatcgcccg cgccgtgaag 1260

gccgccgccg acgccgacta caccatcatc tgcaccggcc tctccggcga gtgggagtcc 1320

gagggcttcg accgcccgca catggacctc ccgccgggcg tggacaccat gatctcccag 1380

gtgctcgacg ccgccccgaa cgccgtggtg gtgaaccagt ccggcacccc ggtgaccatg 1440

tcctgggccc acaaggccaa ggccatcgtg caggcctggt acggcggcaa cgagaccggc 1500

cacggcatct ccgacgtgct cttcggcaac gtgaacccgt ccggcaagct ctccctctcc 1560

tggccggtgg acgtgaagca caacccggcc tacctcaact acgcctccgt gggcggccgc 1620

gtgctctacg gcgaggacgt gtacgtgggc tacaagttct acgacaagac cgagcgcgag 1680

gtgctcttcc cgttcggcca cggcctctcc tacgccacct tcaagctccc ggactccacc 1740

gtgcgcaccg tgccggagac cttccacccg gaccagccga ccgtggccat cgtgaagatc 1800

aagaacacct cctccgtgcc gggcgcccag gtgctccagc tctacatctc cgccccgaac 1860

tccccgaccc accgcccggt gaaggagctc cacggcttcg agaaggtgta cctcgaggcc 1920

ggcgaggaga aggaggtgca gatcccgatc gaccagtacg ccacctcctt ctgggacgag 1980

atcgagtcca tgtggaagtc cgagcgcggc atctacgacg tgctcgtggg cttctcctcc 2040

caggagatct ccggcaaggg caagctcatc gtgccggaga cccgcttctg gatgggcctc 2100

tag 2103

<210>98

<211>420

<212>DNA

<213>玉蜀黍

<220>

<223>Q蛋白启动子

<400>98

gggctggtaa attacttggg agcaatggta tgcaaatcct ttgcatgtac gcaaaactag 60

ctagttgtca caagttgtat atcgattcgt cgcgtttcaa caactcatgc aacattacaa 120

acaagtaaca caatattaca aagttagttt catacaaagc aagaaaagga caataatact 180

tgacatgtaa agtgaagctt attatacttc ctaatccaac acaaaacaaa aaaaagttgc 240

acaaaggtcc aaaaatccac atcaaccatt aacctatacg taaagtgagt gatgagtcac 300

attatccaac aaatgtttat caatgtggta tcatacaagc attgacatcc cataaatgca 360

agaaattgtg ccaacaaagc tataagtaac cctcatatgt atttgcactc atgcatcaca 420

<210>99

<211>1188

<212>DNA

<213>人工序列

<220>

<223>合成的阿魏酸酯酶

<400>99

atggccgcct ccctcccgac catgccgccg tccggctacg accaggtgcg caacggcgtg 60

ccgcgcggcc aggtggtgaa catctcctac ttctccaccg ccaccaactc cacccgcccg 120

gcccgcgtgt acctcccgcc gggctactcc aaggacaaga agtactccgt gctctacctc 180

ctccacggca tcggcggctc cgagaacgac tggttcgagg gcggcggccg cgccaacgtg 240

atcgccgaca acctcatcgc cgagggcaag atcaagccgc tcatcatcgt gaccccgaac 300

accaacgccg ccggcccggg catcgccgac ggctacgaga acttcaccaa ggacctcctc 360

aactccctca tcccgtacat cgagtccaac tactccgtgt acaccgaccg cgagcaccgc 420

gccatcgccg gcctctctat gggcggcggc cagtccttca acatcggcct caccaacctc 480

gacaagttcg cctacatcgg cccgatctcc gccgccccga acacctaccc gaacgagcgc 540

ctcttcccgg acggcggcaa ggccgcccgc gagaagctca agctcctctt catcgcctgc 600

ggcaccaacg actccctcat cggcttcggc cagcgcgtgc acgagtactg cgtggccaac 660

aacatcaacc acgtgtactg gctcatccag ggcggcggcc acgacttcaa cgtgtggaag 720

ccgggcctct ggaacttcct ccagatggcc gacgaggccg gcctcacccg cgacggcaac 780

accccggtgc cgaccccgtc cccgaagccg gccaacaccc gcatcgaggc cgaggactac 840

gacggcatca actcctcctc catcgagatc atcggcgtgc cgccggaggg cggccgcggc 900

atcggctaca tcacctccgg cgactacctc gtgtacaagt ccatcgactt cggcaacggc 960

gccacctcct tcaaggccaa ggtggccaac gccaacacct ccaacatcga gcttcgcctc 1020

aacggcccga acggcaccct catcggcacc ctctccgtga agtccaccgg cgactggaac 1080

acctacgagg agcagacctg ctccatctcc aaggtgaccg gcatcaacga cctctacctc 1140

gtgttcaagg gcccggtgaa catcgactgg ttcaccttcg gcgtgtag 1188

<210>100

<211>395

<212>PRT

<213>人工序列

<220>

<223>合成的阿魏酸酯酶

<400>100

Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr Asp Gln Val

1 5 10 15

Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser Tyr Phe Ser

20 25 30

Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu Pro Pro Gly

35 40 45

Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu His Gly Ile

50 55 60

Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg Ala Asn Val

65 70 75 80

Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro Leu Ile Ile

85 90 95

Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala Asp Gly Tyr

100 105 110

Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro Tyr Ile Glu

115 120 125

Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala Ile Ala Gly

130 135 140

Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu Thr Asn Leu

145 150 155 160

Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro Asn Thr Tyr

165 170 175

Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala Arg Glu Lys

180 185 190

Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser Leu Ile Gly

195 200 205

Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn Ile Asn His

210 215 220

Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn Val Trp Lys

225 230 235 240

Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala Gly Leu Thr

245 250 255

Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys Pro Ala Asn

260 265 270

Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser Ser Ser Ile

275 280 285

Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile Gly Tyr Ile

290 295 300

Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe Gly Asn Gly

305 310 315 320

Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr Ser Asn Ile

325 330 335

Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly Thr Leu Ser

340 345 350

Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln Thr Cys Ser

355 360 365

Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val Phe Lys Gly

370 375 380

Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val

385 390 395

<210>101

<211>1188

<212>DNA

<213>人工序列

<220>

<223>质粒13036

<400>101

atggccgcct ccctcccgac catgccgccg tccggctacg accaggtgcg caacggcgtg 60

ccgcgcggcc aggtggtgaa catctcctac ttctccaccg ccaccaactc cacccgcccg 120

gcccgcgtgt acctcccgcc gggctactcc aaggacaaga agtactccgt gctctacctc 180

ctccacggca tcggcggctc cgagaacgac tggttcgagg gcggcggccg cgccaacgtg 240

atcgccgaca acctcatcgc cgagggcaag atcaagccgc tcatcatcgt gaccccgaac 300

accaacgccg ccggcccggg catcgccgac ggctacgaga acttcaccaa ggacctcctc 360

aactccctca tcccgtacat cgagtccaac tactccgtgt acaccgaccg cgagcaccgc 420

gccatcgccg gcctctctat gggcggcggc cagtccttca acatcggcct caccaacctc 480

gacaagttcg cctacatcgg cccgatctcc gccgccccga acacctaccc gaacgagcgc 540

ctcttcccgg acggcggcaa ggccgcccgc gagaagctca agctcctctt catcgcctgc 600

ggcaccaacg actccctcat cggcttcggc cagcgcgtgc acgagtactg cgtggccaac 660

aacatcaacc acgtgtactg gctcatccag ggcggcggcc acgacttcaa cgtgtggaag 720

ccgggcctct ggaacttcct ccagatggcc gacgaggccg gcctcacccg cgacggcaac 780

accccggtgc cgaccccgtc cccgaagccg gccaacaccc gcatcgaggc cgaggactac 840

gacggcatca actcctcctc catcgagatc atcggcgtgc cgccggaggg cggccgcggc 900

atcggctaca tcacctccgg cgactacctc gtgtacaagt ccatcgactt cggcaacggc 960

gccacctcct tcaaggccaa ggtggccaac gccaacacct ccaacatcga gcttcgcctc 1020

aacggcccga acggcaccct catcggcacc ctctccgtga agtccaccgg cgactggaac 1080

acctacgagg agcagacctg ctccatctcc aaggtgaccg gcatcaacga cctctacctc 1140

gtgttcaagg gcccggtgaa catcgactgg ttcaccttcg gcgtgtag 1188

<210>102

<211>395

<212>PRT

<213>人工序列

<220>

<223>质粒13036

<400>102

Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr Asp Gln Val

1 5 10 15

Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser Tyr Phe Ser

20 25 30

Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu Pro Pro Gly

35 40 45

Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu His Gly Ile

50 55 60

Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg Ala Asn Val

65 70 75 80

Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro Leu Ile Ile

85 90 95

Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala Asp Gly Tyr

100 105 110

Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro Tyr Ile Glu

115 120 125

Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala Ile Ala Gly

130 135 140

Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu Thr Asn Leu

145 150 155 160

Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro Asn Thr Tyr

165 170 175

Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala Arg Glu Lys

180 185 190

Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser Leu Ile Gly

195 200 205

Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn Ile Asn His

210 215 220

Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn Val Trp Lys

225 230 235 240

Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala Gly Leu Thr

245 250 255

Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys Pro Ala Asn

260 265 270

Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser Ser Ser Ile

275 280 285

Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile Gly Tyr Ile

290 295 300

Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe Gly Asn Gly

305 310 315 320

Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr Ser Asn Ile

325 330 335

Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly Thr Leu Ser

340 345 350

Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln Thr Cys Ser

355 360 365

Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val Phe Lys Gly

370 375 380

Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val

385 390 395

<210>103

<211>1245

<212>DNA

<213>人工序列

<220>

<223>质粒13038

<400>103

atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccatg 60

gccgcctccc tcccgaccat gccgccgtcc ggctacgacc aggtgcgcaa cggcgtgccg 120

cgcggccagg tggtgaacat ctcctacttc tccaccgcca ccaactccac ccgcccggcc 180

cgcgtgtacc tcccgccggg ctactccaag gacaagaagt actccgtgct ctacctcctc 240

cacggcatcg gcggctccga gaacgactgg ttcgagggcg gcggccgcgc caacgtgatc 300

gccgacaacc tcatcgccga gggcaagatc aagccgctca tcatcgtgac cccgaacacc 360

aacgccgccg gcccgggcat cgccgacggc tacgagaact tcaccaagga cctcctcaac 420

tccctcatcc cgtacatcga gtccaactac tccgtgtaca ccgaccgcga gcaccgcgcc 480

atcgccggcc tctctatggg cggcggccag tccttcaaca tcggcctcac caacctcgac 540

aagttcgcct acatcggccc gatctccgcc gccccgaaca cctacccgaa cgagcgcctc 600

ttcccggacg gcggcaaggc cgcccgcgag aagctcaagc tcctcttcat cgcctgcggc 660

accaacgact ccctcatcgg cttcggccag cgcgtgcacg agtactgcgt ggccaacaac 720

atcaaccacg tgtactggct catccagggc ggcggccacg acttcaacgt gtggaagccg 780

ggcctctgga acttcctcca gatggccgac gaggccggcc tcacccgcga cggcaacacc 840

ccggtgccga ccccgtcccc gaagccggcc aacacccgca tcgaggccga ggactacgac 900

ggcatcaact cctcctccat cgagatcatc ggcgtgccgc cggagggcgg ccgcggcatc 960

ggctacatca cctccggcga ctacctcgtg tacaagtcca tcgacttcgg caacggcgcc 1020

acctccttca aggccaaggt ggccaacgcc aacacctcca acatcgagct tcgcctcaac 1080

ggcccgaacg gcaccctcat cggcaccctc tccgtgaagt ccaccggcga ctggaacacc 1140

tacgaggagc agacctgctc catctccaag gtgaccggca tcaacgacct ctacctcgtg 1200

ttcaagggcc cggtgaacat cgactggttc accttcggcg tgtag 1245

<210>104

<211>414

<212>PRT

<213>人工序列

<220>

<223>质粒13038 aa

<400>104

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr

20 25 30

Asp Gln Val Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser

35 40 45

Tyr Phe Ser Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu

50 55 60

Pro Pro Gly Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu

65 70 75 80

His Gly Ile Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg

85 90 95

Ala Asn Val Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro

100 105 110

Leu Ile Ile Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala

115 120 125

Asp Gly Tyr Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro

130 135 140

Tyr Ile Glu Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala

145 150 155 160

Ile Ala Gly Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu

165 170 175

Thr Asn Leu Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro

180 185 190

Asn Thr Tyr Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala

195 200 205

Arg Glu Lys Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser

210 215 220

Leu Ile Gly Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn

225 230 235 240

Ile Asn His Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn

245 250 255

Val Trp Lys Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala

260 265 270

Gly Leu Thr Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys

275 280 285

Pro Ala Asn Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser

290 295 300

Ser Ser Ile Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile

305 310 315 320

Gly Tyr Ile Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe

325 330 335

Gly Asn Gly Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr

340 345 350

Ser Asn Ile Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly

355 360 365

Thr Leu Ser Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln

370 375 380

Thr Cys Ser Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val

385 390 395 400

Phe Lys Gly Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val

405 410

<210>105

<211>1425

<212>DNA

<213>人工序列

<220>

<223>质粒13039

<400>105

atgctggcgg ctctggccac gtcgcagctc gtcgcaacgc gcgccggcct gggcgtcccg 60

gacgcgtcca cgttccgccg cggcgccgcg cagggcctga ggggggcccg ggcgtcggcg 120

gcggcggaca cgctcagcat gcggaccagc gcgcgcgcgg cgcccaggca ccagcaccag 180

caggcgcgcc gcggggccag gttcccgtcg ctcgtcgtgt gcgccagcgc cggcgccatg 240

gccgcctccc tcccgaccat gccgccgtcc ggctacgacc aggtgcgcaa cggcgtgccg 300

cgcggccagg tggtgaacat ctcctacttc tccaccgcca ccaactccac ccgcccggcc 360

cgcgtgtacc tcccgccggg ctactccaag gacaagaagt actccgtgct ctacctcctc 420

cacggcatcg gcggctccga gaacgactgg ttcgagggcg gcggccgcgc caacgtgatc 480

gccgacaacc tcatcgccga gggcaagatc aagccgctca tcatcgtgac cccgaacacc 540

aacgccgccg gcccgggcat cgccgacggc tacgagaact tcaccaagga cctcctcaac 600

tccctcatcc cgtacatcga gtccaactac tccgtgtaca ccgaccgcga gcaccgcgcc 660

atcgccggcc tctctatggg cggcggccag tccttcaaca tcggcctcac caacctcgac 720

aagttcgcct acatcggccc gatctccgcc gccccgaaca cctacccgaa cgagcgcctc 780

ttcccggacg gcggcaaggc cgcccgcgag aagctcaagc tcctcttcat cgcctgcggc 840

accaacgact ccctcatcgg cttcggccag cgcgtgcacg agtactgcgt ggccaacaac 900

atcaaccacg tgtactggct catccagggc ggcggccacg acttcaacgt gtggaagccg 960

ggcctctgga acttcctcca gatggccgac gaggccggcc tcacccgcga cggcaacacc 1020

ccggtgccga ccccgtcccc gaagccggcc aacacccgca tcgaggccga ggactacgac 1080

ggcatcaact cctcctccat cgagatcatc ggcgtgccgc cggagggcgg ccgcggcatc 1140

ggctacatca cctccggcga ctacctcgtg tacaagtcca tcgacttcgg caacggcgcc 1200

acctccttca aggccaaggt ggccaacgcc aacacctcca acatcgagct tcgcctcaac 1260

ggcccgaacg gcaccctcat cggcaccctc tccgtgaagt ccaccggcga ctggaacacc 1320

tacgaggagc agacctgctc catctccaag gtgaccggca tcaacgacct ctacctcgtg 1380

ttcaagggcc cggtgaacat cgactggttc accttcggcg tgtag 1425

<210>106

<211>474

<212>PRT

<213>人工序列

<220>

<223>质粒13039 aa

<400>106

Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly

1 5 10 15

Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly

20 25 30

Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg

35 40 45

Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg

50 55 60

Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met

65 70 75 80

Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr Asp Gln Val Arg

85 90 95

Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser Tyr Phe Ser Thr

100 105 110

Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu Pro Pro Gly Tyr

115 120 125

Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu His Gly Ile Gly

130 135 140

Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg Ala Asn Val Ile

145 150 155 160

Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro Leu Ile Ile Val

165 170 175

Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala Asp Gly Tyr Glu

180 185 190

Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro Tyr Ile Glu Ser

195 200 205

Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala Ile Ala Gly Leu

210 215 220

Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu Thr Asn Leu Asp

225 230 235 240

Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro Asn Thr Tyr Pro

245 250 255

Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala Arg Glu Lys Leu

260 265 270

Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser Leu Ile Gly Phe

275 280 285

Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn Ile Asn His Val

290 295 300

Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn Val Trp Lys Pro

305 310 315 320

Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala Gly Leu Thr Arg

325 330 335

Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys Pro Ala Asn Thr

340 345 350

Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser Ser Ser Ile Glu

355 360 365

Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile Gly Tyr Ile Thr

370 375 380

Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe Gly Asn Gly Ala

385 390 395 400

Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr Ser Asn Ile Glu

405 410 415

Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly Thr Leu Ser Val

420 425 430

Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln Thr Cys Ser Ile

435 440 445

Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val Phe Lys Gly Pro

450 455 460

Val Asn Ile Asp Trp Phe Thr Phe Gly Val

465 470

<210>107

<211>1263

<212>DNA

<213>人工序列

<220>

<223>质粒13347

<400>107

atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccatg 60

gccgcctccc tcccgaccat gccgccgtcc ggctacgacc aggtgcgcaa cggcgtgccg 120

cgcggccagg tggtgaacat ctcctacttc tccaccgcca ccaactccac ccgcccggcc 180

cgcgtgtacc tcccgccggg ctactccaag gacaagaagt actccgtgct ctacctcctc 240

cacggcatcg gcggctccga gaacgactgg ttcgagggcg gcggccgcgc caacgtgatc 300

gccgacaacc tcatcgccga gggcaagatc aagccgctca tcatcgtgac cccgaacacc 360

aacgccgccg gcccgggcat cgccgacggc tacgagaact tcaccaagga cctcctcaac 420

tccctcatcc cgtacatcga gtccaactac tccgtgtaca ccgaccgcga gcaccgcgcc 480

atcgccggcc tctctatggg cggcggccag tccttcaaca tcggcctcac caacctcgac 540

aagttcgcct acatcggccc gatctccgcc gccccgaaca cctacccgaa cgagcgcctc 600

ttcccggacg gcggcaaggc cgcccgcgag aagctcaagc tcctcttcat cgcctgcggc 660

accaacgact ccctcatcgg cttcggccag cgcgtgcacg agtactgcgt ggccaacaac 720

atcaaccacg tgtactggct catccagggc ggcggccacg acttcaacgt gtggaagccg 780

ggcctctgga acttcctcca gatggccgac gaggccggcc tcacccgcga cggcaacacc 840

ccggtgccga ccccgtcccc gaagccggcc aacacccgca tcgaggccga ggactacgac 900

ggcatcaact cctcctccat cgagatcatc ggcgtgccgc cggagggcgg ccgcggcatc 960

ggctacatca cctccggcga ctacctcgtg tacaagtcca tcgacttcgg caacggcgcc 1020

acctccttca aggccaaggt ggccaacgcc aacacctcca acatcgagct tcgcctcaac 1080

ggcccgaacg gcaccctcat cggcaccctc tccgtgaagt ccaccggcga ctggaacacc 1140

tacgaggagc agacctgctc catctccaag gtgaccggca tcaacgacct ctacctcgtg 1200

ttcaagggcc cggtgaacat cgactggttc accttcggcg tgtccgagaa ggacgaactc 1260

tag 1263

<210>108

<211>420

<212>PRT

<213>人工序列

<220>

<223>质粒13347

<400>108

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr

20 25 30

Asp Gln Val Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser

35 40 45

Tyr Phe Ser Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu

50 55 60

Pro Pro Gly Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu

65 70 75 80

His Gly Ile Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg

85 90 95

Ala Asn Val Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro

100 105 110

Leu Ile Ile Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly lle Ala

115 120 125

Asp Gly Tyr Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro

130 135 140

Tyr Ile Glu Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala

145 150 155 160

Ile Ala Gly Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu

165 170 175

Thr Asn Leu Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro

180 185 190

Asn Thr Tyr Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala

195 200 205

Arg Glu Lys Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser

210 215 220

Leu Ile Gly Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn

225 230 235 240

Ile Asn His Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn

245 250 255

Val Trp Lys Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala

260 265 270

Gly Leu Thr Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys

275 280 285

Pro Ala Asn Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser

290 295 300

Ser Ser Ile Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile

305 310 315 320

Gly Tyr Ile Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe

325 330 335

Gly Asn Gly Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr

340 345 350

Ser Asn Ile Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly

355 360 365

Thr Leu Ser Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln

370 375 380

Thr Cys Ser Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val

385 390 395 400

Phe Lys Gly Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val Ser Glu

405 410 415

Lys Asp Glu Leu

420

<210>109

<211>1296

<212>DNA

<213>人工序列

<220>

<223>质粒11267

<400>109

atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc caccagcgct 60

gcgcagtccg agccggagct gaagctggag tccgtggtga tcgtgtcccg ccacggcgtg 120

cgcgccccga ccaaggccac ccagctcatg caggacgtga ccccggacgc ctggccgacc 180

tggccggtga agctcggcga gctgaccccg cgcggcggcg agctgatcgc ctacctcggc 240

cactactggc gccagcgcct cgtggccgac ggcctcctcc cgaagtgcgg ctgcccgcag 300

tccggccagg tggccatcat cgccgacgtg gacgagcgca cccgcaagac cggcgaggcc 360

ttcgccgccg gcctcgcccc ggactgcgcc atcaccgtgc acacccaggc cgacacctcc 420

tccccggacc cgctcttcaa cccgctcaag accggcgtgt gccagctcga caacgccaac 480

gtgaccgacg ccatcctgga gcgcgccggc ggctccatcg ccgacttcac cggccactac 540

cagaccgcct tccgcgagct ggagcgcgtg ctcaacttcc cgcagtccaa cctctgcctc 600

aagcgcgaga agcaggacga gtcctgctcc ctcacccagg ccctcccgtc cgagctgaag 660

gtgtccgccg actgcgtgtc cctcaccggc gccgtgtccc tcgcctccat gctcaccgaa 720

atcttcctcc tccagcaggc ccagggcatg ccggagccgg gctggggccg catcaccgac 780

tcccaccagt ggaacaccct cctctccctc cacaacgccc agttcgacct cctccagcgc 840

accccggagg tggcccgctc ccgcgccacc ccgctcctcg acctcatcaa gaccgccctc 900

accccgcacc cgccgcagaa gcaggcctac ggcgtgaccc tcccgacctc cgtgctcttc 960

atcgccggcc acgacaccaa cctcgccaac ctcggcggcg ccctggagct gaactggacc 1020

ctcccgggcc agccggacaa caccccgccg ggcggcgagc tggtgttcga gcgctggcgc 1080

cgcctctccg acaactccca gtggattcag gtgtccctcg tgttccagac cctccagcag 1140

atgcgcgaca agaccccgct ctccctcaac accccgccgg gcgaggtgaa gctcaccctc 1200

gccggctgcg aggagcgcaa cgcccagggc atgtgctccc tcgccggctt cacccagatc 1260

gtgaacgagg cccgcatccc ggcctgctcc ctctaa 1296

<210>110

<211>431

<212>PRT

<213>人工序列

<220>

<223>质粒11267 aa序列

<400>110

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Ala Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val

20 25 30

Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln

35 40 45

Leu Met Gln Asp Val Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys

50 55 60

Leu Gly Glu Leu Thr Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly

65 70 75 80

His Tyr Trp Arg Gln Arg Leu Val Ala Asp Gly Leu Leu Pro Lys Cys

85 90 95

Gly Cys Pro Gln Ser Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu

100 105 110

Arg Thr Arg Lys Thr Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp

115 120 125

Cys Ala Ile Thr Val His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro

130 135 140

Leu Phe Asn Pro Leu Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn

145 150 155 160

Val Thr Asp Ala Ile Leu Glu Arg Ala Gly Gly Ser Ile Ala Asp Phe

165 170 175

Thr Gly His Tyr Gln Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn

180 185 190

Phe Pro Gln Ser Asn Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser

195 200 205

Cys Ser Leu Thr Gln Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp

210 215 220

Cys Val Ser Leu Thr Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu

225 230 235 240

Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly

245 250 255

Arg Ile Thr Asp Ser His Gln Trp Asn Thr Leu Leu Ser Leu His Asn

260 265 270

Ala Gln Phe Asp Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg

275 280 285

Ala Thr Pro Leu Leu Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro

290 295 300

Pro Gln Lys Gln Ala Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe

305 310 315 320

Ile Ala Gly His Asp Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu

325 330 335

Leu Asn Trp Thr Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly

340 345 350

Glu Leu Val Phe Glu Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp

355 360 365

Ile Gln Val Ser Leu Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys

370 375 380

Thr Pro Leu Ser Leu Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu

385 390 395 400

Ala Gly Cys Glu Glu Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly

405 410 415

Phe Thr Gln Ile Val Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu

420 425 430

<210>111

<211>1314

<212>DNA

<213>人工序列

<220>

<223>质粒11268

<400>111

atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc caccagcgct 60

gcgcagtccg agccggagct gaagctggag tccgtggtga tcgtgtcccg ccacggcgtg 120

cgcgccccga ccaaggccac ccagctcatg caggacgtga ccccggacgc ctggccgacc 180

tggccggtga agctcggcga gctgaccccg cgcggcggcg agctgatcgc ctacctcggc 240

cactactggc gccagcgcct cgtggccgac ggcctcctcc cgaagtgcgg ctgcccgcag 300

tccggccagg tggccatcat cgccgacgtg gacgagcgca cccgcaagac cggcgaggcc 360

ttcgccgccg gcctcgcccc ggactgcgcc atcaccgtgc acacccaggc cgacacctcc 420

tccccggacc cgctcttcaa cccgctcaag accggcgtgt gccagctcga caacgccaac 480

gtgaccgacg ccatcctgga gcgcgccggc ggctccatcg ccgacttcac cggccactac 540

cagaccgcct tccgcgagct ggagcgcgtg ctcaacttcc cgcagtccaa cctctgcctc 600

aagcgcgaga agcaggacga gtcctgctcc ctcacccagg ccctcccgtc cgagctgaag 660

gtgtccgccg actgcgtgtc cctcaccggc gccgtgtccc tcgcctccat gctcaccgaa 720

atcttcctcc tccagcaggc ccagggcatg ccggagccgg gctggggccg catcaccgac 780

tcccaccagt ggaacaccct cctctccctc cacaacgccc agttcgacct cctccagcgc 840

accccggagg tggcccgctc ccgcgccacc ccgctcctcg acctcatcaa gaccgccctc 900

accccgcacc cgccgcagaa gcaggcctac ggcgtgaccc tcccgacctc cgtgctcttc 960

atcgccggcc acgacaccaa cctcgccaac ctcggcggcg ccctggagct gaactggacc 1020

ctcccgggcc agccggacaa caccccgccg ggcggcgagc tggtgttcga gcgctggcgc 1080

cgcctctccg acaactccca gtggattcag gtgtccctcg tgttccagac cctccagcag 1140

atgcgcgaca agaccccgct ctccctcaac accccgccgg gcgaggtgaa gctcaccctc 1200

gccggctgcg aggagcgcaa cgcccagggc atgtgctccc tcgccggctt cacccagatc 1260

gtgaacgagg cccgcatccc ggcctgctcc ctctccgaga aggacgagct gtaa 1314

<210>112

<211>437

<212>PRT

<213>人工序列

<220>

<223>质粒11268氨基酸序列

<400>112

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

1 5 10 15

Ala Thr Ser Ala Ala Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val

20 25 30

Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln

35 40 45

Leu Met Gln Asp Val Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys

50 55 60

Leu Gly Glu Leu Thr Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly

65 70 75 80

His Tyr Trp Arg Gln Arg Leu Val Ala Asp Gly Leu Leu Pro Lys Cys

85 90 95

Gly Cys Pro Gln Ser Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu

100 105 110

Arg Thr Arg Lys Thr Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp

115 120 125

Cys Ala Ile Thr Val His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro

130 135 140

Leu Phe Asn Pro Leu Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn

145 150 155 160

Val Thr Asp Ala Ile Leu Glu Arg Ala Gly Gly Ser Ile Ala Asp Phe

165 170 175

Thr Gly His Tyr Gln Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn

180 185 190

Phe Pro Gln Ser Asn Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser

195 200 205

Cys Ser Leu Thr Gln Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp

210 215 220

Cys Val Ser Leu Thr Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu

225 230 235 240

Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly

245 250 255

Arg Ile Thr Asp Ser His Gln Trp Asn Thr Leu Leu Ser Leu His Asn

260 265 270

Ala Gln Phe Asp Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg

275 280 285

Ala Thr Pro Leu Leu Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro

290 295 300

Pro Gln Lys Gln Ala Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe

305 310 315 320

Ile Ala Gly His Asp Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu

325 330 335

Leu Asn Trp Thr Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly

340 345 350

Glu Leu Val Phe Glu Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp

355 360 365

Ile Gln Val Ser Leu Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys

370 375 380

Thr Pro Leu Ser Leu Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu

385 390 395 400

Ala Gly Cys Glu Glu Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly

405 410 415

Phe Thr Gln Ile Val Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu Ser

420 425 430

Glu Lys Asp Glu Leu

435

Claims

1.分离的多核苷酸，其a)包含SEQ ID NO：2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、59、61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108和110或其互补序列，或与SEQ ID NO：2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、59、61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108和110之任一的互补序列在低严紧杂交条件下杂交并编码具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶、葡糖淀粉酶、木聚糖酶、蛋白酶、纤维素酶、葡聚糖酶、β葡糖苷酶或植酸酶活性的多肽的多核苷酸，或者b)编码包含SEQ ID NO：10、13、14、15、16、18、20、24、26、27、28、29、30、33、34、35、36、38、40、42、44、45、47、49、51、62、64、66、70、80、82、84、86、88、90、92、109或111或其酶活性片段的多肽。

2.权利要求1的分离的多核苷酸，其中所述多核苷酸编码包含第一多肽和第二肽的融合多肽，其中所述第一多肽具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶或葡糖淀粉酶活性。

3.权利要求2的分离的多核苷酸，其中所述第二肽包含信号序列肽。

4.权利要求3的分离的多核苷酸，其中所述信号序列肽将第一多肽引导至植物的液泡、内质网、叶绿体、淀粉粒、种子或细胞壁。

5.权利要求3的分离的多核苷酸，其中所述信号序列是来自waxy的N端信号序列、来自γ-玉米醇溶蛋白的N端信号序列、淀粉结合域或C端淀粉结合域。

6.权利要求1的分离的多核苷酸，其中所述多核苷酸与SEQ ID NO：2、9或52之任一的互补序列在低严紧杂交条件下杂交，并编码具有α-淀粉酶活性的多肽。

7.权利要求1的分离的多核苷酸，其中所述多核苷酸与SEQ IDNO：4或25之任一的互补序列在低严紧杂交条件下杂交，并编码具有支链淀粉酶活性的多肽。

8.权利要求1的分离的多核苷酸，其中所述多核苷酸与SEQ IDNO：6的互补序列杂交，并编码具有α-葡糖苷酶活性的多肽。

9.权利要求1的分离的多核苷酸，其中所述多核苷酸与SEQ ID NO：19、21、37、39、41或43之任一的互补序列在低严紧杂交条件下杂交，并编码具有葡萄糖异构酶活性的多肽。

10.权利要求1的分离的多核苷酸，其中所述多核苷酸与SEQ IDNO：46、48、50或59之任一的互补序列在低严紧杂交条件下杂交，并编码具有葡糖淀粉酶活性的多肽。

11.包含SEQ ID NO：2或9之任一或其互补序列的分离的多核苷酸。

12.包含SEQ ID NO：4或25之任一或其互补序列的分离的多核苷酸。

13.包含SEQ ID NO：6或其互补序列的分离的多核苷酸。

14.包含SEQ ID NO：19、21、37、39、41、或43之任一或其互补序列的分离的多核苷酸。

15.包含SEQ ID NO：46、48、50或59之任一或其互补序列的分离的多核苷酸。

16.包含多核苷酸的表达盒，其中所述多核苷酸a)具有SEQ ID NO：2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、59、61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108或110或其互补序列，或与SEQ ID NO：2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、59、61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108或110之任一的互补序列在低严紧杂交条件下杂交并编码具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶、葡糖淀粉酶、木聚糖酶、蛋白酶、纤维素酶、葡聚糖酶、β葡糖苷酶或植酸酶活性的多肽的多核苷酸，或者b)编码包含SEQ ID NO：10、13、14、15、16、18、20、24、26、27、28、29、30、33、34、35、36、38、40、42、44、45、47、49、51、62、64、66、70、80、82、84、86、88、90、92、109或111或其酶活性片段的多肽。

17.权利要求16的表达盒，其与启动子可操作地连接。

18.权利要求17的表达盒，其中所述启动子是诱导型启动子。

19.权利要求17的表达盒，其中所述启动子是组织特异性启动子。

20.权利要求19的表达盒，其中所述启动子是胚乳特异性启动子。

21.权利要求20的表达盒，其中所述胚乳特异性启动子是玉米γ-玉米醇溶蛋白启动子或玉米ADP-gpp启动子。

22.权利要求21的表达盒，其中所述启动子包含SEQ ID NO：11或SEQ ID NO：12。

23.权利要求16的表达盒，其中所述多核苷酸相对于所述启动子采取正义方向。

24.权利要求16的表达盒，其中a)的多核苷酸还编码与该多核苷酸所编码的多肽可操作地连接的信号序列。

25.权利要求24的表达盒，其中所述信号序列将可操作地连接的多肽引导至植物的液泡、内质网、叶绿体、淀粉粒、种子或细胞壁。

26.权利要求25的表达盒，其中所述信号序列是来自waxy的N端信号序列或来自γ-玉米醇溶蛋白的N端信号序列。

27.权利要求25的表达盒，其中所述信号序列是淀粉结合域。

28.权利要求16的表达盒，其中b)的多核苷酸与组织特异性启动子可操作地连接。

29.权利要求28的表达盒，其中组织特异性启动子是玉蜀黍γ-玉米醇溶蛋白启动子或玉蜀黍ADP-gpp启动子。

30.包含多核苷酸的表达盒，其中所述多核苷酸包含SEQ ID NO：2或9之任一或其互补序列。

31.包含多核苷酸的表达盒，其中所述多核苷酸包含SEQ ID NO：6或其互补序列。

32.包含多核苷酸的表达盒，其中所述多核苷酸包含SEQ ID NO：19、21、37、39、41、或43之任一或其互补序列。

33.包含多核苷酸的表达盒，其中所述多核苷酸包含SEQ ID NO：46、48、50或59之任一或其互补序列。

34.包含多核苷酸的表达盒，其中所述多核苷酸包含SEQ ID NO：4或25之任一或其互补序列。

35.包含多核苷酸的表达盒，其中所述多核苷酸编码具有SEQ IDNO：10、13、14、15、16、24、26、27、28、29、30、33、34、35、36、38、40、42、44、45、47、49、51、61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108或110之任一的氨基酸序列的多肽或其酶活性片段。

36.包含多核苷酸的表达盒，其中所述多核苷酸编码具有SEQ IDNO：10、13、14、15、16、33、35或51之任一的氨基酸序列的多肽或其具有α-淀粉酶活性的活性片段。

37.包含多核苷酸的表达盒，其中所述多核苷酸编码具有SEQ IDNO：3、24或34之任一的氨基酸序列的多肽或其具有支链淀粉酶活性的活性片段。

38.包含多核苷酸的表达盒，其中所述多核苷酸编码具有SEQ IDNO：5、26或27之任一的氨基酸序列的多肽或其具有α-葡糖苷酶活性的活性片段。

39.包含多核苷酸的表达盒，其中所述多核苷酸编码具有SEQ IDNO：18、20、28、29、30、38、40、42或44之任一的氨基酸序列的多肽或其具有葡萄糖异构酶活性的活性片段。

40.包含多核苷酸的表达盒，其中所述多核苷酸编码具有SEQ IDNO：45、47或49之任一的氨基酸序列的多肽或其具有葡糖淀粉酶活性的活性片段。

41.包含权利要求16的表达盒的载体。

42.包含权利要求30-40之任一的表达盒的载体。

43.包含权利要求16的表达盒的细胞。

44.包含权利要求30-40之任一的表达盒的细胞。

45.权利要求44的细胞，其中所述细胞选自：农杆菌、单子叶植物细胞、双子叶植物细胞、百合纲(Liluipsida)细胞、黍亚科(Panicoideae)细胞、玉米细胞和谷物细胞。

46.权利要求45的细胞，其中所述细胞是玉米细胞或稻细胞。

47.权利要求45的细胞，其中所述细胞选自：农杆菌、单子叶植物细胞、双子叶植物细胞、百合纲(Liliopsida)细胞、黍亚科(Panicoideae)细胞、玉米细胞和谷物细胞。

48.权利要求47的细胞，其中所述细胞是玉米细胞。

49.稳定地转化了权利要求41的载体的植物。

50.稳定地转化了权利要求42的载体的植物。

51.稳定地转化了包含α-淀粉酶的载体的植物，其中所述α-淀粉酶具有SEQ ID NO：1、10、13、14、15、16、33或35之任一的氨基酸序列或由包含SEQ ID NO：2或9之任一的多核苷酸编码。

52.权利要求51的植物，其中所述α-淀粉酶是嗜高热型的。

53.稳定地转化了包含支链淀粉酶的载体的植物，其中所述支链淀粉酶具有SEQ ID NO：24或34之任一的氨基酸序列或者由包含SEQID NO：4或25之任一的多核苷酸编码。

54.稳定地转化了包含α-葡糖苷酶的载体的植物，其中所述α-葡糖苷酶具有SEQ ID NO：26或27之任一的氨基酸序列或者由包含SEQ ID NO：6的多核苷酸编码。

55.权利要求54的植物，其中所述α-葡糖苷酶是嗜高热型的。

56.稳定地转化了包含葡萄糖异构酶的载体的植物，其中所述葡萄糖异构酶具有SEQ ID NO：18、20、28、29、30、38、40、42或44之任一的氨基酸序列，或者由包含SEQ ID NO：19、21、37、39、41或43之任一的多核苷酸编码。

57.权利要求56的植物，其中所述α-葡糖苷酶是嗜高热型的。

58.稳定地转化了包含葡萄糖淀粉酶的载体的植物，其中所述葡萄糖淀粉酶具有SEQ ID NO：45、47或49之任一的氨基酸序列或者由包含SEQ ID NO：46、48、50或59之任一的多核苷酸编码。

59.权利要求58的植物，其中所述葡萄糖淀粉酶是嗜高热型的。

60.来自权利要求49的植物的种子、果实或谷粒。

61.来自权利要求50的植物的种子、果实或谷粒。

62.来自权利要求51的植物的种子、果实或谷粒。

63.来自权利要求53的植物的种子、果实或谷粒。

64.来自权利要求54的植物的种子、果实或谷粒。

65.来自权利要求56的植物的种子、果实或谷粒。

66.来自权利要求58的植物的种子、果实或谷粒。

67.转化的植物，其基因组中增加了与启动子序列可操作地连接的、编码至少一种加工酶的重组多核苷酸。

68.权利要求67的植物，其中植物是单子叶植物。

69.权利要求68的植物，其中单子叶植物是玉米或稻。

70.权利要求67的植物，其中植物是双子叶植物。

71.权利要求67的植物，其中植物是谷类植物或商业栽培的植物。

72.权利要求67的植物，其中加工酶选自：α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、葡聚糖酶、β-淀粉酶、α-葡糖苷酶、异淀粉酶、支链淀粉酶、新支链淀粉酶、异支链淀粉酶、淀粉型支链淀粉酶、纤维素酶、外切-1，4-β-纤维二糖水解酶、外切-1，3-β-D-葡聚糖酶、β-葡糖苷酶、内切葡聚糖酶、L-阿拉伯聚糖酶、α-阿拉伯糖苷酶、半乳聚糖酶、半乳糖苷酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、木糖苷酶、蛋白酶、葡聚糖酶、酯酶、植酸酶和脂肪酶。

73.权利要求72的植物，其中加工酶是淀粉加工酶，选自：α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、β-淀粉酶、α-葡糖苷酶、异淀粉酶、支链淀粉酶、新支链淀粉酶、异支链淀粉酶和淀粉型支链淀粉酶。

74.权利要求73的植物，其中酶选自：α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶。

75.权利要求74的植物，其中酶是嗜高热型的。

76.权利要求72的植物，其中酶是非淀粉降解酶，选自：蛋白酶、葡聚糖酶、木聚糖酶、纤维素酶、β-葡糖苷酶、酯酶、植酸酶和脂肪酶。

77.权利要求76的植物，其中酶是嗜高热型的。

78.权利要求67的植物，其中酶积累在植物的液泡、内质网、叶绿体、淀粉粒、种子或细胞壁中。

79.权利要求78的植物，其中酶积累在内质网中。

80.权利要求78的植物，其中酶积累在淀粉粒中。

81.权利要求67的植物，其基因组中还增加了包含非嗜高热型的酶的第二重组多核苷酸。

82.转化的植物，其基因组中增加了与启动子序列可操作地连接的、编码至少一种加工酶的重组多核苷酸，其中所述加工酶选自：α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶。

83.权利要求82的转化的植物，其中加工酶是嗜高热型的。

84.权利要求82的转化的植物，其中植物是玉米或稻。

85.转化的玉米植物，其基因组中增加了与启动子序列可操作地连接的、编码至少一种加工酶的重组多核苷酸，其中所述加工酶选自：α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶。

86.权利要求85的转化的玉米植物，其中加工酶是嗜高热型的。

87.转化的植物，其基因组中增加了与启动子和信号序列可操作地连接的、具有SEQ ID NO：2、9或52的重组多核苷酸。

88.转化的植物，其基因组中增加了与启动子和信号序列可操作地连接的、具有SEQ ID NO：4或25的重组多核苷酸。

89.转化的植物，其基因组中增加了与启动子和信号序列可操作地连接的、具有SEQ ID NO：6的重组多核苷酸。

90.转化的植物，其基因组中增加了具有SEQ ID NO：19、21、37、39、41或43的重组多核苷酸。

91.转化的植物，其基因组中增加了具有SEQ ID NO：46、48、50或59的重组多核苷酸。

92.权利要求82的转化的植物的产物。

93.权利要求85的转化的植物的产物。

94.权利要求87-91之任一的转化的植物的产物。

95.权利要求92的产物，其中产物是种子、果实或谷粒。

96.权利要求92的产物，其中产物是加工酶、淀粉或糖。

97.从权利要求82的植物获得的植物。

98.从权利要求85的植物获得的植物。

99.从权利要求87-91之任一的植物获得的植物。

100.权利要求97的植物，其是杂种植物。

101.权利要求98的植物，其是杂种植物。

102.权利要求99的植物，其是杂种植物。

103.权利要求97的植物，其是近交/自交植物。

104.权利要求98的植物，其是近交/自交植物。

105.权利要求99的植物，其是近交/自交植物。

106.包含至少一种加工酶的淀粉组合物，其中所述加工酶是蛋白酶、葡聚糖酶、植酸酶、脂肪酶、木聚糖酶、纤维素酶、β-葡糖苷酶或酯酶。

107.权利要求106的淀粉组合物，其中酶是嗜高热型的。

108.包含至少一种加工酶的谷粒，其中所述酶是α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡糖淀粉酶或葡萄糖异构酶。

109.权利要求108的谷粒，其中酶是嗜高热型的。

110.制备淀粉粒的方法，包括：

a)将包含至少一种非淀粉加工酶的谷粒在激活所述至少一种酶的条件下进行处理，从而产生包含淀粉粒和非淀粉降解产物的混合物，其中所述谷粒从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和

b)从混合物中分离淀粉粒。

111.权利要求110的方法，其中酶是蛋白酶、葡聚糖酶、植酸酶、脂肪酶、木聚糖酶、纤维素酶、β-葡糖苷酶或酯酶。

112.权利要求111的方法，其中酶是嗜高热型的。

113.权利要求110的方法，其中谷粒是破碎的谷粒。

114.权利要求110的方法，其中谷粒在低湿度条件下处理。

115.权利要求110的方法，其中谷粒在高湿度条件下处理。

116.权利要求110的方法，其中谷粒用二氧化硫处理。

117.权利要求110的方法，还包括从混合物中分离非淀粉产物。

118.通过权利要求110的方法获得的淀粉。

119.通过权利要求112的方法获得的淀粉。

120.通过权利要求110的方法获得的非淀粉产物。

121.通过权利要求112的方法获得的非淀粉产物。

122.制备超甜玉米的方法，包括将基因组中增加了编码至少一种淀粉降解酶或淀粉异构化酶的表达盒并在胚乳中表达该表达盒的转化的玉米或其部分，在激活所述至少一种酶的条件下进行处理，以致将玉米中的多糖转化成糖(sugar)，从而产生超甜玉米。

123.权利要求122的方法，其中表达盒还包含与编码该酶的多核苷酸可操作地连接的启动子。

124.权利要求123的方法，其中启动子是组成型启动子。

125.权利要求123的方法，其中启动子是种子特异性启动子。

126.权利要求123的方法，其中启动子是胚乳特异性启动子。

127.权利要求123的方法，其中酶是嗜高热型的。

128.权利要求127的方法，其中酶是α-淀粉酶。

129.权利要求122的方法，其中表达盒还包含编码与所述至少一种酶可操作地连接的信号序列的多核苷酸。

130.权利要求129的方法，其中信号序列指引嗜高热酶到达质外体。

131.权利要求129的方法，其中信号序列指引嗜高热酶到达内质网。

132.权利要求122的方法，其中酶包含SEQ ID NO：13、14、15、16、33或35之任一。

133.制备超甜玉米的方法，包括将基因组中增加了编码α-淀粉酶的表达盒并在胚乳中表达该表达盒的转化的玉米或其部分，在激活所述至少一种酶的条件下进行处理，以致将玉米中的多糖转化成糖(sugar)，从而产生超甜玉米。

134.权利要求133的方法，其中酶是嗜高热型的。

135.权利要求134的方法，其中嗜高热型的α-淀粉酶包含SEQID NO：10、13、14、15、16、33或35之任一的氨基酸序列或者其具有α-淀粉酶活性的酶活性片段。

136.权利要求134的方法，其中表达盒包含选自SEQ ID NO：2、9或52之任一或其互补序列的多核苷酸，或与SEQ ID NO：2、9或52之任一在低严紧杂交条件下杂交并编码具有α-淀粉酶活性的多肽的多核苷酸。

137.制备淀粉水解产物的溶液的方法，包括：

a)将包含淀粉粒和至少一种加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此加工淀粉粒以形成包含淀粉水解产物的水溶液，其中所述植物部分从基因组中增加了编码所述至少一种淀粉加工酶的表达盒的转化的植物获得；和

b)收集含有淀粉水解产物的水溶液。

138.权利要求137的方法，其中淀粉水解产物包括糊精、麦芽寡糖、糖(sugar)和/或其混合物。

139.权利要求137的方法，其中酶是α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、淀粉型支链淀粉酶、葡萄糖异构酶、β-淀粉酶、异淀粉酶、新支链淀粉酶、异支链淀粉酶、或其任何组合。

140.权利要求137的方法，其中所述至少一种加工酶是嗜高热型的。

141.权利要求139的方法，其中所述至少一种加工酶是嗜高热型的。

142.权利要求137的方法，其中植物部分的基因组中还增加了编码非嗜高热型淀粉加工酶的表达盒。

143.权利要求142的方法，其中非嗜高热型淀粉加工酶选自：淀粉酶、葡糖淀粉酶、α-葡糖苷酶、支链淀粉酶、葡萄糖异构酶、或其组合。

144.权利要求137的方法，其中所述至少一种加工酶在胚乳中表达。

145.权利要求137的方法，其中植物部分是谷粒。

146.权利要求137的方法，其中植物部分来自玉米、小麦、大麦、黑麦、燕麦、甘蔗或稻。

147.权利要求137的方法，其中所述至少一种加工酶与启动子和信号序列可操作地连接，其中所述信号序列可以将酶引导至淀粉粒或内质网或细胞壁。

148.权利要求137的方法，还包括分离淀粉水解产物。

149.权利要求137的方法，还包括发酵淀粉水解产物。

150.制备淀粉水解产物的方法，包括：

a)将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此加工淀粉粒以形成含有淀粉水解产物的水溶液，其中所述植物部分从基因组中增加了编码至少一种α-淀粉酶的表达盒的转化的植物获得；和

b)收集含有淀粉水解产物的水溶液。

151.权利要求150的方法，其中α-淀粉酶是嗜高热型的。

152.权利要求151的方法，其中嗜高热型的α-淀粉酶包含SEQ IDNO：1、10、13、14、15、16、33或35之任一的氨基酸序列或者其具有α-淀粉酶活性的活性片段。

153.权利要求151的方法，其中表达盒包含选自SEQ ID NO：2、9、46或52之任一或其互补序列的多核苷酸，或者与SEQ ID NO：2、9、46或52之任一在低严紧杂交条件下杂交并编码具有α-淀粉酶活性的多肽的多核苷酸。

154.权利要求150的方法，其中转化的植物的基因组中还包含编码非嗜热型淀粉加工酶的多核苷酸。

155.权利要求150的方法，还包括用非嗜高热型淀粉加工酶处理植物部分。

156.转化的植物部分，其包含存在于该植物的细胞中的至少一种淀粉加工酶，其中所述植物部分从基因组中增加了编码所述至少一种淀粉加工酶的表达盒的转化的植物获得。

157.权利要求156的植物部分，其中酶是选自α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、β-淀粉酶、α-葡糖苷酶、异淀粉酶、支链淀粉酶、新支链淀粉酶、异支链淀粉酶和淀粉型支链淀粉酶的淀粉加工酶。

158.权利要求156的植物部分，其中酶是嗜高热型的。

159.权利要求156的植物部分，其中植物是玉米。

160.转化的植物部分，其包含至少一种存在于该植物的细胞壁或细胞中的非淀粉加工酶，其中所述植物部分从基因组中增加了编码所述至少一种非淀粉加工酶或至少一种非淀粉多糖加工酶的表达盒的转化植物获得。

161.权利要求160的植物部分，其中酶是嗜高热型的。

162.权利要求160的植物部分，其中非淀粉加工酶选自：蛋白酶、葡聚糖酶、木聚糖酶、酯酶、植酸酶、纤维素酶、β-葡糖苷酶或脂肪酶。

163.权利要求156或160的植物部分，其是穗、种子、果实、谷粒、秸秆、谷壳、或蔗渣。

164.转化的植物部分，其包含具有SEQ ID NO：1、10、11、13、14、15、16、33或35之任一的氨基酸序列或由包含SEQ ID NO：2、9、46或52之任一的多核苷酸编码的α-淀粉酶。

165.转化的植物部分，其包含具有SEQ ID NO：5、26或27之任一的氨基酸序列或由包含SEQ ID NO：6的多核苷酸编码的α-葡糖苷酶。

166.转化的植物部分，其包含具有SEQ ID NO：28、29、30、38、40、42或44之任一的氨基酸序列或由包含SEQ ID NO：19、21、37、39、41或43之任一的多核苷酸编码的葡萄糖异构酶。

167.转化的植物部分，其包含具有SEQ ID NO：45或SEQ ID NO：47或SEQ ID NO：49的氨基酸序列或由包含SEQ ID NO：46、48、50或59之任一的多核苷酸编码的葡糖淀粉酶。

168、转化的植物部分，其包含由包含SEQ ID NO：4或25之任一的多核苷酸编码的支链淀粉酶。

169.在权利要求156的转化的植物部分中转化淀粉的方法，包括激活其中所包含的淀粉加工酶。

170.在权利要求164-168之任一项的转化的植物部分中将淀粉转化成淀粉衍生产物的方法，包括激活其中所含的酶。

171.根据权利要求169的方法产生的淀粉、糊精、麦芽寡糖或糖(sugar)。

172.根据权利要求170的方法产生的淀粉、糊精、麦芽寡糖或糖(sugar)。

173.使用转化的植物部分的方法，其中所述转化的植物部分在该植物部分的细胞壁或细胞中包含至少一种非淀粉加工酶，所述方法包括：

a)将包含至少一种非淀粉多糖加工酶的转化的植物部分在激活所述至少一种酶的条件下进行处理，由此消化非淀粉多糖以形成含有寡糖和/或糖(sugar)的水溶液，其中植物部分从基因组中增加了编码所述至少一种非淀粉多糖加工酶的表达盒的转化植物获得；和

b)收集合有寡糖和/或糖(sugar)的水溶液。

174.权利要求173的方法，其中非淀粉多糖加工酶是蛋白酶、葡聚糖酶、植酸酶、脂肪酶、木聚糖酶、纤维素酶、β-葡糖苷酶或酯酶。

175.使用包含至少一种加工酶的转化种子的方法，包括：

a)将包含至少一种蛋白酶或脂肪酶的转化种子在激活所述至少一种酶的条件下进行处理，从而产生包含氨基酸和脂肪酸的含水混合物，其中种子从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和

b)收集含水混合物。

176.权利要求175的方法，其中分离氨基酸、脂肪酸或两者。

177.权利要求175的方法，其中所述至少一种蛋白酶或脂肪酶是嗜高热型的。

178.制备乙醇的方法，包括：

a)将包含至少一种多糖加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此消化多糖以形成寡糖或可发酵糖，其中植物部分从基因组中增加了编码所述至少一种多糖加工酶的表达盒的转化植物获得；和

b)在促进可发酵糖或寡糖转化成乙醇的条件下孵育可发酵糖。

179.权利要求178的方法，其中植物部分是谷粒、果实、种子、秸秆、木材、蔬菜或根。

180.权利要求178的方法，其中植物部分从选自燕麦、大麦、小麦、浆果、葡萄、黑麦、玉米、稻、马铃薯、甜菜、甘蔗、凤梨、草和树的植物获得。

181.权利要求178的方法，其中多糖加工酶是α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、葡萄糖异构酶、支链淀粉酶或其组合。

182.权利要求178的方法，其中多糖加工酶是嗜高热型的。

183.权利要求178的方法，其中多糖加工酶是嗜温型的。

184.权利要求181的方法，其中多糖加工酶是嗜高热型的。

185.制备乙醇的方法，包括：

a)将包含选自α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、葡萄糖异构酶或支链淀粉酶或其组合的至少一种酶的植物部分，在足以激活所述至少一种酶的条件和时间长度下进行热处理，由此消化多糖以形成可发酵糖，其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和

b)在促进可发酵糖转化成乙醇的条件下孵育可发酵糖。

186.权利要求185的方法，其中所述至少一种酶是嗜高热型的。

187、权利要求185的方法，其中所述至少一种酶是嗜温型的。

188.权利要求185的方法，其中α-淀粉酶具有SEQ ID NO：1、10、13、14、15、16、33或35之任一的氨基酸序列，或者由包含SEQID NO：2或9的多核苷酸编码。

189.权利要求185的方法，其中α-葡糖苷酶具有SEQ ID NO：5、26或27之任一的氨基酸序列，或者由包含SEQ ID NO：6的多核苷酸编码。

190.权利要求185的方法，其中葡萄糖异构酶具有SEQ ID NO：28、29、30、38、40、42或44之任一的氨基酸序列，或者由包含SEQ ID NO：19、21、37、39、41或43之任一的多核苷酸编码。

191.权利要求185的方法，其中葡糖淀粉酶具有SEQ ID NO：45的氨基酸序列，或者由包含SEQ ID NO：46、48或50之任一的多核苷酸编码。

192.权利要求185的方法，其中支链淀粉酶具有SEQ ID NO：24或34的氨基酸序列，或者由包含SEQ ID NO：4或25之任一的多核苷酸编码。

193.制备乙醇的方法，包括：

a)将包含至少一种非淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此将非淀粉多糖消化成寡糖和可发酵糖，其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和

b)在促进可发酵糖转化成乙醇的条件下孵育可发酵糖。

194.权利要求193的方法，其中非淀粉加工酶是蛋白酶、葡聚糖酶、植酸酶、脂肪酶、木聚糖酶、纤维素酶、β-葡糖苷酶或酯酶。

195.制备乙醇的方法，包括：

a)将包含选自α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、葡萄糖异构酶或支链淀粉酶或其组合的至少一种酶的植物部分，在激活所述至少一种酶的条件下进行处理，由此消化多糖以形成可发酵糖，其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和

b)在促进可发酵糖转化成乙醇的条件下孵育可发酵糖。

196.权利要求195的方法，其中所述至少一种酶是嗜高热型的。

197.在不添加额外增甜剂的情况下制备甜的粉质食品的方法，包括：

a)将包含至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此将植物部分中的淀粉粒加工成糖(sugar)以形成甜的产物，其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和

b)将所述甜的产物加工成粉质食品。

198.权利要求197的方法，其中粉质食品由所述甜的产物和水形成。

199.权利要求197的方法，其中粉质食品含有麦芽、调味剂、维生素、矿物质、着色剂、或其任何组合。

200.权利要求197的方法，其中所述至少一种酶是嗜高热型的。

201.权利要求197的方法，其中酶是α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶或其任何组合。

202.权利要求197的方法，其中植物选自：大豆、黑麦、燕麦、大麦、小麦、玉米、稻和甘蔗。

203.权利要求197的方法，其中粉质食品是谷物食品。

204.权利要求197的方法，其中粉质食品是早餐食品。

205.权利要求197的方法，其中粉质食品是即食食品。

206.权利要求197的方法，其中粉质食品是烘焙的食品。

207.权利要求197的方法，其中所述加工是烘焙、煮沸、加热、蒸、放电或其任何组合。

208.在不添加增甜剂的情况下甜化含淀粉产品的方法，包括：

a)将包含至少一种淀粉加工酶的淀粉在激活所述至少一种酶的条件下处理，由此消化淀粉以形成糖(sugar)，从而形成甜的淀粉，其中所述淀粉从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得；和

b)将此甜的淀粉加入产品以产生甜化的含淀粉产品。

209.权利要求208的方法，其中转化的植物选自：玉米、大豆、黑麦、燕麦、大麦、小麦、稻和甘蔗。

210.权利要求208的方法，其中所述至少一种酶是嗜高热型的。

211.权利要求208的方法，其中所述至少一种酶是α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶、或其任何组合。

212.通过权利要求197的方法获得的粉质食品。

213.通过权利要求208的方法获得的甜的含淀粉产品。

214.甜化含多糖的果实或蔬菜的方法，包括：将包含至少一种多糖加工酶的果实或蔬菜在激活所述至少一种酶的条件下进行处理，由此加工果实或蔬菜中的多糖以形成糖(sugar)，从而产生甜的果实或蔬菜，其中所述果实或蔬菜从基因组中增加了编码所述至少一种多糖加工酶的表达盒的转化植物获得。

215.权利要求214的方法，其中果实或蔬菜选自：马铃薯、番茄、香蕉、南瓜、豌豆和大豆。

216.权利要求214的方法，其中所述至少一种酶是嗜高热型的。

217.权利要求214的方法，其中酶是α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶、或其任何组合。

218.制备含有糖(sugar)的水溶液的方法，包括将获自权利要求156的植物部分的淀粉粒在激活所述至少一种酶的条件下进行处理，由此产生含有糖(sugar)的水溶液。

219.从谷粒制备淀粉衍生产物的方法，其中所述方法不包括在回收淀粉衍生产物之前对谷粒进行湿磨或干磨，所述方法包括：

a)将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此加工淀粉粒以形成含有糊精或糖(sugar)的水溶液，其中植物部分从基因组中增加了编码所述至少一种淀粉加工酶的转化植物获得；和

b)收集含有淀粉衍生产物的水溶液。

220.权利要求219的方法，其中所述至少一种淀粉加工酶是嗜高热型的。

221.分离α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶的方法，包括培养权利要求82的转化的植物，和从其中分离α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶。

222.权利要求221的方法，其中α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶是嗜高热型的。

223.制备麦芽糖糊精的方法，包括：

a)将转基因谷粒与水混合；

b)加热所述混合物；

c)从(b)中产生的糊精糖浆分离固体；和

d)收集麦芽糖糊精。

224.权利要求223的方法，其中转基因谷粒包含至少一种淀粉加工酶。

225.权利要求224的方法，其中淀粉加工酶是α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶和葡萄糖异构酶。

226.权利要求225的方法，其中所述淀粉加工酶的至少一种是嗜高热型的。

227.通过权利要求223-226之任一项的方法产生的麦芽糖糊精。

228.通过权利要求223-226之任一项的方法产生的麦芽糖糊精组合物。

229.从谷粒制备糊精或糖(sugar)的方法，其中所述方法不包括在回收淀粉衍生产物之前机械破碎谷粒，所述方法包括：

a)将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理，由此加工淀粉粒以形成含有糊精或糖(sugar)的水溶液，其中植物部分从基因组中增加了编码所述至少一种加工酶的表达盒的转化植物获得；和

b)收集含有糖(sugar)和/或糊精的水溶液。

230.权利要求229的方法，其中淀粉加工酶是α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶和葡萄糖异构酶。

231.制备可发酵糖的方法，包括：

b)收集含有可发酵糖的水溶液。

232.权利要求231的方法，其中淀粉加工酶是α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶和葡萄糖异构酶。

233.稳定地转化了包含嗜高热型α-淀粉酶的载体的玉米植物。

234.稳定地转化了含有编码α-淀粉酶的多核苷酸序列的载体的玉米植物，其中所述α-淀粉酶与SEQ ID NO：1或SEQ ID NO：51有大于60％的同一性。