CN101868537B

CN101868537B - 具有改变性质的葡糖淀粉酶变体

Info

Publication number: CN101868537B
Application number: CN2008801166952A
Authority: CN
Inventors: W·埃赫勒; R·R·博特; M·舍费尔斯; P·范索林恩; C·弗勒门
Original assignee: Danisco USA Inc
Current assignee: Danisco USA Inc
Priority date: 2007-11-20
Filing date: 2008-11-20
Publication date: 2013-11-06
Anticipated expiration: 2028-11-20
Also published as: CN101868537A; US20140227754A1; US20090275080A1; EP2222842B1; CA2705941C; CA2705941A1; JP5594899B2; HUE050328T2; BRPI0820483A2; US20120149087A1; BRPI0820483B1; JP2011502543A; WO2009067218A3; DK2816109T3; DK2222842T3; WO2009067218A2; US8058033B2; US9290753B2; EP2816109A1; EP2222842A2

Abstract

本发明公开文本涉及具有改变性质(例如：改善的热稳定性和/或比活性)的亲本葡糖淀粉酶的变体。特别的，本发明公开文本提供包含变体葡糖淀粉酶的组合物，包括淀粉水解组合物和清洁组合物。公开文本还涉及编码变体的DNA构建体，和在宿主细胞内生产葡糖淀粉酶变体的方法。

Description

具有改变性质的葡糖淀粉酶变体

相关申请的交叉引用

本申请要求于2007年11月20日提交的美国临时申请第60/989,426号的权益。

序列表

还附加有包括SEQ ID NO：1-167的序列表，其以整体引入作为参考。

发明领域

具有改变的性质(例如：改善的热稳定性和/或比活性)的葡糖淀粉酶变体。提供了包含变体葡糖淀粉酶的组合物，编码变体的DNA构建体，和在宿主细胞内生产葡糖淀粉酶变体的方法。

发明背景

葡糖淀粉酶(葡聚糖1，4-α-葡糖水解酶，EC3.2.1.3)是淀粉水解的外切糖酶，催化从淀粉或相关的寡糖和多糖分子的非还原末端移除连续的葡萄糖单元。葡糖淀粉酶可以水解淀粉(例如：直链淀粉和支链淀粉)的直链和分支的糖苷键。

多种细菌、真菌、酵母和植物都生产葡糖淀粉酶。特别有趣的，且商业上重要的是，葡糖淀粉酶是胞外生产的真菌酶，例如来自以下属的菌株：曲霉属(Aspergillus)(Svensson等人，(1983)Carlsberg Res.Commun.48：529-544；Boel等人，(1984)EMBO J.3：1097-1102；Hayashida等人，(1989)Agric.Biol.Chem.53：923-929；US专利5,024,941；US专利4,794,175和WO88/09795)；踝节菌属(Talaromyces)(US专利4,247,637；US专利6,255,084和US专利6,620,924)；根霉属(Rhizopus)(Ashikari等人，(1986)Agric. Biol.Chem.50：957-964；Ashikari等人，(1989)App.Microbiol.Biotech.32：129-133和US专利4,863,864)；腐质霉属(Humicola)(WO 05/052148和US专利4,618,579)和毛霉属(Mucor)(Houghton-Larsen等人，(2003)Appl.Microbiol.Biotechnol.62：210-217)。编码这些酶的许多基因都已经在酵母、真菌和/或细菌细胞内得到克隆和表达。

在商业上，葡糖淀粉酶是非常重要的酶，已经在多种需要淀粉水解的应用中使用(例如从淀粉中生产葡萄糖和其它单糖)。葡糖淀粉酶用于生产高果糖的玉米增甜剂.其占据超过50％的美国增甜剂市场。一般，在淀粉水解过程中，葡糖淀粉酶可以是且通常是与α淀粉酶一起使用，将淀粉水解为糊精，再水解为葡萄糖。然后，葡萄糖可以通过其它酶转化为果糖(例如：葡萄糖异构酶)；结晶；或在发酵中使用来生产多种终产物(例如：乙醇、柠檬酸、乳酸、琥珀酸盐、抗坏血酸中间体、谷氨酸、甘油和1，3丙二醇)。在含有淀粉和/或纤维素的材料的发酵中使用葡糖淀粉酶生产的乙醇可以作为燃料来源或用于醇消费。

虽然葡糖淀粉酶已经成功用于商业应用多年，但是仍然需要具有改变性质的新型葡糖淀粉酶，所述性质例如改善的比活性和增加的热稳定性。

曲霉属的葡糖淀粉酶已经产生了不同的突变，其增加了热稳定性和比活性，参考US专利6,537,792；US专利6,352,851；Chen等人，(1996)Prot.Eng.9：499-505，Chen等人，(1995)Prot Eng.8：575-582；Fierobe等人，(1996)Biochem.35：8698-8704；和Li等人，(1997)Prot.Eng.10：1199-1204，但是仍然需要提供葡糖淀粉酶变体，相对于它们的亲本具有改变的性质。

发明概述

本公开文本涉及亲本葡糖淀粉酶的葡糖淀粉酶变体。葡糖淀粉酶变体在催化结构域和/或淀粉结合结构域含有氨基酸取代。变体表现出具有改变的性质，例如改善的热稳定性和/或比活性。

在一个方面，本公开文本涉及这样的葡糖淀粉酶变体，所述变体在相应于SEQ ID NO：2的第61、73、417、430、431、503、511、535、539或563 位和/或亲本葡糖淀粉酶中的等价位置上具有两个或多于两个的氨基酸取代。在另一个方面，本公开文本涉及这样的葡糖淀粉酶变体，所述变体具有与SEQ ID NO：1、2、3、5、6、7、8或9的亲本葡糖淀粉酶至少80％、85％、90％、95％或99.5％的序列同一性。在一个实施方案中，亲本葡糖淀粉酶具有这样的催化结构域，所述结构域与SEQ ID NO：1、2、3、5、6、7、8或9具有至少80％的序列同一性，或者具有这样的淀粉结合结构域，所述结构域与SEQ ID NO：1或2具有至少80％的序列同一性。在其他方面，亲本葡糖淀粉酶是SEQ ID NO：1或2。本公开文本的另一方面涉及这样的葡糖淀粉酶变体，所述变体还在相应于SEQ ID NO：2的第4、5、12、24、43、44、45、46、47、49、51、70、75、6、94、100、108、114、116、119、122、124、125、137、141、143、146、148、169、171、172、175、178、180、181、208、211、228、242、243、245、292、294、197、309、310、313、314、315、316、317、321、340、341、350、353、356、363、368、369、375、376、395、398、401、408、409、412、415、418、421、433、436或451位或亲本葡糖淀粉酶中等价的位置，包含一个或多个氨基酸取代。在一些方面，葡糖淀粉酶变体还在相应于SEQ ID NO：2的第4、5、24、29、43、44、49、70、75、76、100、108、119、124、137、146、148、169、171、172、175、178、181、208、211、243、292、294、297、314、316、317、340、341、350、356、363、368、369、376、395、401、412、433、436或451位或亲本葡糖淀粉酶中等价的位置，包含一个或多个氨基酸取代。在一些方面，葡糖淀粉酶变体还在相应于SEQ ID NO：2的第5、24、43、44、49、70、75、76、94、119、141、146、148、172、175、178、180、181、208、211、243、294、309、314、353、369、375或409位或亲本葡糖淀粉酶中等价的位置，包含一个或多个氨基酸取代。在一些方面，葡糖淀粉酶还在相应于SEQ ID NO：2的第43、44或294位或亲本葡糖淀粉酶中等价的位置，包含一个或多个氨基酸取代。

在本发明的其它方面，葡糖淀粉酶变体在对应于SEQ ID NO：2的N61I、G73F、L417R/V、T430A/M、A431L/Q、E503A/V、Q511H、A535R、 A539R或N563I/K的位置中，或亲本葡糖淀粉酶中等价的位置中，包括两个或多于两个的氨基酸取代。在一些方面，葡糖淀粉酶变体还包括一个或多个下列取代：SEQ ID NO：2的D4L/E/R/S/C/A/Q/W、F5C/M/N/R/S/T/V/W、I12L/R、D24E/L/Y/T、F29L/I/D/C/S/V/W、I43F/R/D/Y/S/Q、D44E/H/K/S/N/Y/F/R/C、Y47W、Y49N、Q70R/K/M/P/G/L/F、Q75R/K/A、R76L/M/K/T/P、P94L、D100W/I/Q/M/P/A/N、N119P/T/Y/D/E、N146S/G/C/H/E/D/T/W/L/F/M、Q148V/Y/H/A/C/D/G/M/R/S/T、Y169D/F、Q172C/A/D/R/E/F/H/V/L/M/N/S/T/V、F175H/A/G/R/S/T/C/W/Y、W178A/C/D/E/F/G/H/K/N/R/S/T/V/Y、E180A/C/G/H/I/L/N/P/Q/R/S/T/V/Y/、V181E/C/D/G/H/I/P/T/Y/S/L/K/F/A、Q208L/A/C/E/N/F/H/T、S211C/R/E/A/Y/W/M/H/L/I/R/Q/T、E243S/R/N/M/Y/A/L、R245A/E/M/I/P/V、I292D/H/P/R/T/N/V/F/L、G294C/D/E/T/Q/I/A、K297F/L/P/T/M/D/N/Q/A/Y/H/S/R/W、R309A/C/G/H/I/N/P/Q/S/T/W/Y/L、Y310E/G/L/P/S/W/R/Q、D313Q、V314A/R/N/D/C/E/Q/G/H/I/L/K/M/F/P/S/T/W/Y、Y315F、Y316Q/R、N317T/H、K340D/T、K341F/D/P/V/G/S、T350S/E/A/N、Q356H/D/E、T363L/R/C/H/W、S368W/D/F/L、S369F、N376Q/T/H/S/V、Y395Q/R/S、A398S/I/T、S401C/V、R408S、N409W/T/K、T412A/H/K/G、R433H/Q、I436A/T或S451M/T/H，或在亲本葡糖淀粉酶中等价的位置中。在一些方面，葡糖淀粉酶变体还包括一个或多个下列取代：SEQ ID NO：2的I43F/R/D/Y/S/Q、D44E/H/K/S/N/Y/F/R/C或G294C/D/E/T/Q/I/A，或在亲本葡糖淀粉酶中等价的位置中。

在一个方面，本公开文本涉及这样的葡糖淀粉酶，其在对应于SEQ IDNO：2的I43Q/D44C、D44C/G294C、I43Q/G294C或I43Q/D44C/G294，或亲本葡糖淀粉酶中的等价位置的位置中包括氨基酸取代。葡糖淀粉酶变体具有与SEQ ID NO：1、2、3、5、6、7、8或9至少80％、85％、90％、95％或99.5％的序列同一性。在一个实施方案中，亲本葡糖淀粉酶具有与SEQID NO：1、2、3、5、6、7、8或9至少80％序列同一性的催化结构域，或者具有与SEQ ID NO：1或2至少80％序列同一性的淀粉结合结构域。

亲本葡糖淀粉酶可以是获得自任意下列属的物种的酶：木霉属(Trichoderma)、曲霉属、腐质霉属、青霉属(Penicillium)、踝节菌属(Talaromycese)，或裂殖酵母属(Schizosaccharmyces)。在一些方面，亲本葡糖淀粉酶可以来自木霉属或曲霉属的物种。

在一个方面，与亲本葡糖淀粉酶相比，变体葡糖淀粉酶表现出改变的热稳定性。改变的热稳定性可以是增加的热稳定性。可选的，或者此外，变体还表现出与亲本葡糖淀粉酶相比改变的比活性。改变的比活性可以是增加的比活性。

本公开文本的另一方面是编码所述变体的多核苷酸。另一方面是包含多核苷酸的载体。另一方面是含有载体的宿主细胞。

本公开文本的另一方面是包括葡糖淀粉酶变体的酶组合物。在一个方面，酶组合物用于淀粉转化过程或醇发酵过程中。

发明的另一方面是生产变体葡糖淀粉酶的方法，这是通过在适合葡糖淀粉酶变体表达和生产的条件下培养含有多核苷酸的宿主细胞，并生产变体。方法还可以包括从培养物中回收葡糖淀粉酶变体的步骤。

附图简述

图lA描述了具有632个氨基酸的里氏木霉葡糖淀粉酶(TrGA)的亲本葡糖淀粉酶(SEQ ID NO：1)。信号肽用下划线标出，催化区域(SEQ IDNO：3)用粗体标出，开始于氨基酸残基SVDDFI(SEQ ID NO：160)，具有453个氨基酸残基；接头区用斜体标出；淀粉结合结构域(SEQ IDNO：161)既用斜体又用下划线标出。成熟的蛋白质由SEQ ID NO：2表示，包括催化结构域(SEQ ID NO：3)、接头区域和淀粉结合结构域(SEQ IDNO：161)。图1B示例了编码TrGA的cDNA(SEQ ID NO：4)。

图2描述了质粒pDONR-TrGA，其包括亲本TrGA的cDNA(SEQ IDNO：4)。

图3描述了质粒pREP3Y-DEST(A)和pREP3Y-TrGA(C)。

图4A-4B描述了亲本葡糖淀粉酶的催化结构域的比对比较，包括来自泡盛曲霉(Aspergillus awamori)(AaGA)(SEQ ID NO：5)；黑曲霉(Aspergillus niger)(AnGA)(SEQ ID NO：6)；米曲霉(Aspergillus orzyae)(AoGA)(SEQ ID NO：7)；里氏木霉(Trichoderma reesei)(TrGA)(SEQ ID NO：3)；灰腐质霉(Humicola grisea)(HgGA)(SEQ ID NO：8)；和Hypocrea vinosa(HvGA)(SEQ ID NO：9)的葡糖淀粉酶。用星号(*)指示了相同的氨基酸。

图4C-4D描述了亲本葡糖淀粉酶的淀粉结合结构域(SBD)的比对比较，包括里氏木霉(TrGA)(SEQ ID NO：161)；灰腐质霉(HgGA)(SEQID NO：162)；太瑞斯梭孢壳霉(Thielavia terrestris)(TtGA)(SEQ IDNO：163)；疏棉状嗜热丝孢菌(Thermomyces lanuginosus)(ThGA)(SEQID NO：164)；埃默森踝节菌(Talaromyces emersonii)(AnGA)(SEQID NO：165)；黑曲霉(AnGA)(SEQ ID NO：166)；和泡盛曲霉(AaGA)(SEQ ID NO：167)的葡糖淀粉酶。用点号(.)指示了相同的氨基酸。

图5A描述了质粒pTrex 3g-DEST。图5B描述了质粒pTrex3g-TrGA。质粒用作表达载体，用于在里氏木霉宿主中表达和生产变体葡糖淀粉酶。

图6描述了在60℃和32℃下，亲本(野生型)TrGA和变体V314、S211R、Q172F和Q208N之间的V_max(μM葡萄糖/秒)比较，在实施例8中进一步进行讨论。

图7描述了组合变体对淀粉底物的活性。本文描述的组合变体包括ET7-1(D24Y/V181L/Q208C/G294A/T353R/N375N/N409W)、LR8(Q172F/Q208N)、LR12(Q172F/S211R)、LR6(Q172F/Q208N/V314H)、ET8-1(D24E/V181K/E243Y/I292V/G294Q/N409K)和ET7-2(Q24L/V181L/Q208C/G294A/T353R/N375Q/N409W)。活性以在340nm处作为所示纳克的葡糖淀粉酶变体的函数的吸收单位表示。

图8描述了单位点变体对玉米淀粉底物的活性。本文描述的单位点变体包括V314H、G294Q、S211R、Q208N、Q172F、G294I和P94N。活性以在340nm处作为所示纳克的葡糖淀粉酶变体的函数的吸收单位表示。

图9描述了TrGA和TrGA变体LR8(Q172F/Q208N)对玉米醪液液化物(liquefact)(NE)样品的葡糖淀粉酶活性。

图10描述了TrGA和TrGA变体LR8(Q172F/Q208N)对玉米醪液液化物(BSE)样品的活性谱。

图11描述了TrGA和TrGA变体LR8(Q172F/Q208N)对可溶性玉米淀粉底物样品的活性谱。

图12是从侧面观察里氏木霉葡糖淀粉酶(黑色)(SEQ ID NO：2)和泡盛曲霉葡糖淀粉酶(灰色)三维结构的比较。

图13是从顶部观察里氏木霉葡糖淀粉酶(黑色)和泡盛曲霉葡糖淀粉酶(灰色)三维结构的比较。

图14A描述了质粒pTTT-Dest。图14B描述了质粒pTTT-TrGA(B)。

发明的详细描述

葡糖淀粉酶是在多种需要水解淀粉的应用中，具有商业重要意义的酶。本文描述的葡糖淀粉酶变体在催化结构域或淀粉结合结构域内含有氨基酸取代。变体可以表现出改变的性质，例如改善的热稳定性和/或比活性。具有改善的热稳定性和/或比活性的变体可以显著增加从例如玉米淀粉生产葡萄糖和燃料乙醇的效率。

I.定义

除非另外定义，本文中使用的所有技术和科学术语都具有与本发明所属领域技术人员常规理解的相应术语相同的含义。Singleton等人，DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY，第2版，John Wiley and Sons，New York(1994)，和Hale & Markham，THEHARPER COLLINS DICTIONARY OF BIOLOGY，Harper Perennial，N.Y.(1991)为技术人员提供了本文中使用的许多术语的常规含义。但是，出于清楚和便于参考的原因，下文仍然定义了一些术语。

如本文中使用的，术语“葡糖淀粉酶(EC 3.2.1.3)”指催化从淀粉和相关的寡糖和多糖的非还原端释放D-葡萄糖的酶。

术语“亲本”或“亲本序列”指宿主细胞内天然的或天然存在的序列。亲本系列包括但不限于SEQ ID NO：1、2、3、5、6、7、8和9中提出的葡糖淀粉酶序列。

如本文中使用的，“等价的位置”意指基于对所讨论的亲本葡糖淀粉酶氨基酸序列以及对所讨论的亲本葡糖淀粉酶三维结构与TrGA参照葡糖淀粉酶氨基酸序列(SEQ ID NO：2)和三维序列的比对，两条亲本序列共同的位置。

术语“TrGA”指具有SEQ ID NO：2中所示成熟蛋白质序列的亲本里氏木霉葡糖淀粉酶序列，其包括具有SEQ ID NO：3中所示序列的催化结构域。TrGA的分离、克隆和表达描述在美国专利7,413,887中，其通过引入本文作为参考。在一些实施方案中，亲本序列指作为蛋白质工程起点的葡糖淀粉酶。本文的葡糖淀粉酶氨基酸的编号方式是基于葡糖淀粉酶与TrGA(SEQ ID NO：2和SEQ ID NO：3)的序列比对。

词组“蛋白质或多肽的成熟形态”指蛋白质或多肽的最终功能形态。作为示例，TrGA的成熟形态具有SEQ ID NO：2的氨基酸序列，包括催化结构域、接头区域和淀粉结合结构域。

如本文中使用的，术语“葡糖淀粉酶变体”和“变体”用于指与亲本葡糖淀粉酶序列具有一定程度的氨基酸序列同一性，并可以保留葡糖淀粉酶的功能特征的葡糖淀粉酶。变体与亲本序列相似，但在其氨基酸序列中具有至少一个取代、缺失或插入，使其不同于亲本葡糖淀粉酶的序列。在一些情况下，已操作和/或改造变体，使其在其氨基酸序列中具有至少一个取代、缺失或插入，从而不同于亲本的序列。

“变体”意指当优化比对进行比较时，与多肽序列具有至少99.5％、至少99％、至少98％、至少97％、至少96％、至少95％、至少94％、至少93％、至少92％、至少91％、至少90％、至少88％、至少85％、至少80％、至少75％、至少70％，至少65％、至少60％、至少55％、至少50％或至少45％的序列同一性。在一些实施方案中，葡糖淀粉酶变体可以与亲本葡糖淀粉酶的催化结构域具有至少99.5％、至少99％、至少98％、至少97％、至少96％、至少95％、至少94％、至少93％、至少92％、至少91％、至少90％、至少88％、至少85％、至少80％、至少75％、至少70％，至少65％、至少60％、至少55％、至少50％或至少45％的序列同一性。在一些实施方案中，葡糖淀粉酶变体可以与亲本葡糖淀粉酶的淀粉结合结构域具有至少99.5％、至少99％、至少98％、至少97％、至少96％、至少95％、至少94％、至少93％、至少92％、至少91％、至少90％、至少88％、至少85％、至少80％、至少75％、至少70％，至少65％、至少60％、至少55％、至少50％或至少45％的序列同一性。可以在亲本或变体序列的全长测量序列同一性。

使用本领域已知的标准技术确定序列同一性(参见例如，Smith和Waterman，Adv.Appl.Math.2：482(1981)；Needleman和Wunsch，J.Mol.Biol.48：443(1970)；Pearson和Lipman，Proc.Natl.Acad.Sci.USA 85：2444(1988)；程序例如Wisconsin Genetics Software Package(GeneticsComputer Group，Madison，WI)中的GAP、BESTHT、FASTA和TFASTA；以及Devereux等人，Nucleic Acid Res.，12：387-395(1984))。

“百分比(％)核酸序列同一性”或“百分比(％)氨基酸序列同一性”定义为候选序列中与起始序列(例如，TrGA)的核苷酸残基或氨基酸残基相同的核苷酸残基或氨基酸残基的百分比。可以在起始序列(例如，SEQ ID NO：2)的全长上测量序列同一性。

通过已知的序列比对方法确定序列同一性。常用的比对方法是Altschul等人描述的BLAST(Altschul等人，J.Mol.Biol.215：403-410(1990)；和Karlin等人，Proc.Natl.Acad.Sci.USA 90：5873-5787(1993))。特别有效的BLAST程序是WU-BLAST-2程序(参见，Altschul等人，Meth.Enzymol.266：460-480(1996))。WU-BLAST-2利用了一些搜索参数，其中大部分都设定为缺省值。用下列值设定可调节的参数：重叠跨度(overlap span)＝1，重叠分数(overlap fraction)＝0.125，字节阈值(word threshold)＝11。HSP S和HSP S2参数是动态值，由程序本身根据特定序列的组成和进行目标序列搜索的特定数据库的组成来决定。然而，可以调节值来增加灵敏度。％氨基酸序列同一性值是由匹配相同的残基数除以比对区域内“较长”序列的残基总数确定的。“较长”序列是在比对区域内具有最多真实残基的序列(忽视为了使比对分数最大化，由WU-Blast-2引入的空位)。

其它方法也可以用于比对序列。一个有效算法的实例是PILEUP。PILEUP利用渐进式成对比对，从一组相关序列中创建多重序列比对。它还可以绘制显示群关系的树图，用于创建比对。PILEUP利用了Feng和Doolittle的渐进比对方法的简化版(Feng和Doolittle，J.Mol.Evol.，35：351-360[1987])。所述方法与Higgins和Sharp描述的相似(Higgins和Sharp，CABIOS 5：151-153[1989])。有用的PILEUP参数包括缺省的空位权重3.00，缺省的空位长度权重0.10，和加权的末端空位。

术语“优化比对”指产生最高百分比同一性分数的比对。

如本文中使用的，术语“催化结构域”指多肽的结构性区域，其含有用于底物水解的活性位点。

术语“接头”指通常具有3至40个氨基酸残基之间的短氨基酸序列，其共价的连接了包含淀粉结合结构域的氨基酸序列，和包含催化结构域的氨基酸序列。

术语“淀粉结合结构域”指优选地与淀粉底物结合的氨基酸序列。

如本文中使用的，术语“突变序列”和“突变基因”是可互换的使用的，指这样的多核苷酸序列，其具有存在于宿主细胞的亲本序列中至少一个密码子的改变。突变序列的表达产物是相对于亲本具有改变的氨基酸序列的变体蛋白质。表达产物可以具有改变的功能能力(例如：增加的酶活)。

如本文中使用的，对于多肽，术语“性质”或其语法的等价体指可以被选择或检测的多肽的任何性质或属性。这些性质包括但不限于，氧化稳定性、底物特异性、催化活性、热稳定性、pH活性谱、蛋白水解的耐受性、K_M、K_CAT、K_CAT/K_M比值、蛋白质折叠、结合底物的能力和分泌的能力。

如本文中使用的，对于核酸，术语“性质”或其语法的等价体指可以被选择或检测的核酸的任何性质或属性。这些性质包括但不限于，影响基因转录的性质(例如：启动子强度或启动子识别)，影响RNA加工的性质 (例如：RNA剪切和RNA稳定性)，影响翻译的性质(例如：调控，mRNA与核糖体蛋白质的结合)。

术语“热学上稳定的”和“热稳定的”指本发明的葡糖淀粉酶变体，在暴露于一定温度下给定时间段后，仍然维持规定量的酶活性，其中处于在淀粉底物水解过程中常见的条件下，例如：暴露在改变的温度下。

在涉及例如热稳定性的性质时，术语“增加的稳定性”指经过一段时间后，与另一个参照(即亲本)葡糖淀粉酶相比，保留较高的淀粉水解活性。

在涉及例如热稳定性的性质时，术语“减少的稳定性”指经过一段时间后，与另一个参照葡糖淀粉酶相比，保留较低的淀粉水解活性。

术语“比活性”定义为每毫克葡糖淀粉酶蛋白质的活性。在一些实施方案中，通过本文描述的乙醇检测法来测定葡糖淀粉酶的活性，表示为从淀粉底物产生的葡萄糖的量。在一些实施方案中，可以使用本文描述的Caliper检测法来测定蛋白质浓度。

术语“活性”和“生物学活性”指与特定蛋白质相关的生物学活性。给定蛋白质的生物学活性指本领域技术人员归属于所述蛋白质的任何生物学活性。例如，与葡糖淀粉酶相关的酶活性是水解的，因此，活性葡糖淀粉酶具有水解活性。

在本文中，术语“多核苷酸”和“核酸”可互换使用，指任意长度的核苷酸的多聚合形式，不论是核糖核苷酸还是脱氧核糖核苷酸。这类术语包括但不限于单链、双链或三链DNA，基因组DNA，cDNA，RNA，DNA-RNA杂合体或包含嘌呤和嘧啶碱基，或者其它天然、化学、生物化学修饰的，非天然或衍生的核苷酸碱基的聚合物。

如本文中使用的，术语“DNA构建体”、“转化DNA”和“表达载体”可互换使用，指用于将序列引入宿主细胞或生物内的DNA。DNA可以通过PCR或任何其它本领域技术人员已知的合适技术在体外产生。DNA构建体，转化DNA或重组表达盒可以整合到质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。通常，表达载体、DNA构建体或转化DNA 的重组表达盒部分包括将被转录的核酸序列和启动子。在一些实施方案中，表达载体具有在宿主细胞内掺入和表达异源DNA片段的能力。

如本文中使用的，术语“载体”指设计用于将核酸引入一种或多种细胞类型中的多核苷酸构建体。载体包括克隆载体、表达载体、穿梭载体、质粒、盒等。

如本文中使用的，涉及将核酸序列引入细胞时，术语“引入”指适合将核酸序列转移到细胞内的任何方法。此类用于引入的方法包括但不限于原生质体融合、转染、转化、接合和转导。

如本文中使用的，术语“转化的”和“稳定转化的”指这样的细胞，所述细胞具有整合到其基因组内，或作为附加体质粒维持至少两代的非天然的(异源的)多核苷酸序列。

如本文中使用的，术语“选择性标记”和“选择标记”指能够在宿主细胞内表达的核酸(例如：基因)，其允许方便的选择含有载体的宿主。通常，选择性标记是使宿主细胞产生抗生素抗性或代谢优势的基因，使含有外源DNA的细胞区别于在转化过程中未接受任何外源序列的细胞。

如本文中使用的，术语“启动子”指发挥指导下游基因转录的功能的核酸序列。启动子，以及其它转录和翻译调控核酸序列(也被称为“控制序列”)是表达给定基因必需的。一般，转录和翻译调控序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列，以及增强子或激活子序列。

当核酸与另一核酸序列处于功能性关联时，它是“有效连接的”。例如，如果表达为参与多肽分泌的前蛋白，则编码分泌前导序列(即，信号肽)的DNA与多肽的DNA是有效连接的。一般，“有效连接”意指所连接的DNA序列是连续的，在分泌前导序列的情况下，是连续的且处于阅读相(reading phase)。

如本文中使用的，术语“基因”指编码多肽的多核苷酸(例如：DNA片段)，包括在编码区域前后的区域，和位于单个编码片段(外显子)之间的间插序列(内含子)。

如本文中使用的，“直向同源物”和“直向同源基因”指不同物种中从共同祖先基因(即，同源基因)通过物种形成进化成的基因。通常，直向同源物在进化过程中保留了相同的功能。直向同源物的鉴别可用于对新测序基因组中的基因功能进行可靠预测。

如本文中使用的，“旁系同源物”和“共生同源基因”指基因组内通过复制相关的基因。直向同源物在进化过程中保留了相同的功能，而旁系同源物则进化出新的功能，虽然一些功能通常是与原始功能相关的。共生同源基因的实例包括但不限于编码胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶和凝血酶的基因，它们都是丝氨酸蛋白酶，并同时存在于相同的物种内。

如本文中使用的，如本领域已知的，术语“杂交”指核酸链通过碱基配对与互补链结合的过程。

如果在中至高严谨杂交和洗涤条件下，两条序列特异的彼此杂交，则认为核酸序列与参照核酸序列是“选择性可杂交的”。杂交条件是基于核酸结合复合体或探针的解链温度(T_m)的。例如，“最大严谨”通常发生在约T_m-5℃(比探针的Tm低5℃)；“高严谨”比T_m低约5-10℃；“中等严谨”比探针的T_m低约10-20℃；“低严谨”比T_m低约20-25℃。从功能上讲，最大严谨条件可用于鉴别与杂交探针具有严格同一性或接近严格同一性的序列；而中等或低严谨条件可用于鉴别或检测多核苷酸序列同源物。

中等和高严谨杂交条件是本领域普遍已知的。高严谨条件的实例包括在约42℃下，在50％甲酰胺、5×SSC、5×Denhardt氏溶液、0.5％ SDS和100μg/ml变性的载体DNA中杂交，然后在室温用2×SSC和0.5％ SDS洗涤两次，在42℃用0.1×SSC和0.5％ SDS再洗涤两次。中等严谨条件的实例包括在37℃下，在包含20％甲酰胺、5×SSC(150mM NaCl，15mM柠檬酸三钠)、50mM磷酸钠(pH7.6)、5×Denhardt氏溶液、10％硫酸葡聚糖和20mg/ml变性的剪切鲑精DNA中杂交过夜，然后在约37-50℃，用1×SSC洗涤滤膜。本领域技术人员已知当需要适应例如探针长度等因子时，如何调节温度、离子强度等。

如本文中使用的，“重组”包括涉及细胞或载体，其已通过引入异源或同源的核酸序列而修饰，或者细胞从所述修饰的细胞衍生而来。因此，例如，作为人类有意干预的结果，重组细胞表达在天然(非重组)形态的细胞中未发现相同形态的基因，或表达天然基因，其否则异常表达，低表达或根本不表达。

在本发明的实施方案中，在至少一个密码子上用位点饱和诱变来产生突变的DNA序列。在另一个实施方案中，位点饱和诱变实施于两个或更多的密码子。在其它的实施方案中，突变DNA序列与亲本序列具有多于50％，多于55％，多于60％，多于65％，多于70％，多于75％，多于80％，多于85％，多于90％，多于95％，或者多于98％的同源性。在可选的实施方案中，利用任何已知的突变方法在体内产生突变DNA，例如：辐射、亚硝基胍等。然后分离所需的DNA序列并用于本文中提供的方法。

如本文中使用的，“异源蛋白质”指在宿主细胞内非天然存在的蛋白质或多肽。

如果酶在细胞内表达的水平比在相应的野生型细胞内表达的水平更高，则酶在宿主细胞内是“过表达”的。

术语“蛋白质”和“多肽”在本文中可互换使用。在本公开文本和权利要求中，氨基酸使用常规的三字母和一字母代码。氨基酸的3字母代码与IUPAC-IUB生物化学命名联合委员会(JCBN)一致。还应理解，由于遗传密码的简并性，多肽可以由一个以上核苷酸序列编码。

公开文本的变体按以下命名法描述：[原始氨基酸残基/位置/取代的氨基酸残基]。例如，亮氨酸取代第76位的精氨酸表示为R76L。当在一个给定位置取代多个氨基酸时，取代表示为1)Q172C、Q172D或Q172R；2)Q172C、D、或R或3)Q172C/D/R。当本文中鉴别的适合取代的位置没有提示特定的氨基酸时，应该理解任何氨基酸都可以取代所述位置上出现的氨基酸残基。当变体葡糖淀粉酶与其它葡糖淀粉酶相比，含有缺失时，用“*”表示缺失。例如，R76位的缺失表示为R76^*。两个或多个连续的氨基酸的缺失表示为例如(76-78)^*。

“前序列”是位于信号肽和成熟蛋白质之间的氨基酸序列，是蛋白质分泌必需的。前序列的切除可获得成熟的活性蛋白。

术语“信号序列”或“信号肽”指任何参与成熟蛋白质或蛋白质前体形态分泌的核苷酸和/或氨基酸序列。该信号序列的定义是功能性的，意指包括由蛋白质基因的N-末端部分编码的所有氨基酸序列，其参与实现蛋白质的分泌。它们通常，但并非全部，结合在蛋白质的N-末端部分，或结合在前体蛋白质的N-末端部分。信号序列可以是内源的或外源的。信号序列可以是一般与蛋白质相关的(例如：葡糖淀粉酶)，或者可以是来自另一个编码分泌蛋白的基因。

术语蛋白质或肽的“前体”形态指成熟形态的蛋白质，其具有与蛋白质的氨基端或羧基端有效连接的前序列。前体还可以具有与前序列的氨基端有效连接的“信号”序列。前体还可以具有在翻译后活性中涉及的其它多核苷酸(例如：从其上切除以留下成熟形态的蛋白质或肽的多核苷酸)。

“宿主株”或“宿主细胞”指适合含有根据本公开文本的DNA的表达载体的宿主。

术语“来自”和“获得自”不仅指由讨论的生物的株生产或可生产的葡糖淀粉酶，而且还指由从此类株中分离的DNA序列编码，并在含有此类DNA序列的宿主生物中生产的葡糖淀粉酶。此外，术语还指由合成的和/或cDNA起源的DNA序列编码的葡糖淀粉酶，并具有讨论的葡糖淀粉酶的已鉴别的特征。

在该定义范围内的“衍生物”一般保留了在野生型、天然或亲本形态中观察到的特征性水解活性，达到使衍生物可用于与野生型、天然或亲本形态相似目的的程度。葡糖淀粉酶的功能衍生物涵盖了天然存在的、合成或重组生产的肽或肽片段，其具有本发明的葡糖淀粉酶的一般特征。

术语“分离的”指如果其是天然存在的，则从其天然环境中移出的材料。

“纯化的”蛋白质指至少部分纯化为均质的蛋白质。在一些实施方案中，通过SDS-PAGE确定，纯化的蛋白质是超过10％纯的，任选的超过20％纯的，任选的超过30％纯的。公开文本的其它方面涵盖了通过SDS-PAGE 确定，高度纯化形态的蛋白质(即，超过40％纯的，超过60％纯的，超过80％纯的，超过90％纯的，超过95％纯的，超过97％纯的，甚至超过99％纯的)。

如本文中使用的，术语“组合诱变”指产生起始序列的变体文库的方法。在这类文库中，变体含有选自预定义的突变集合的一个或多个突变。此外，方法提供引入随机突变的方式，所述突变不是预定义的突变集合的成员。在一些实施方案中，方法包括在US专利6,582,914中提出的，其通过引入本文作为参考。在可选的实施方案中，组合诱变方法涵盖了可商购的试剂盒(例如：QuikChange

Multisite，Stratagene，San Diego，CA)。

如本文中使用的，术语“突变体文库”指其基因组大部分相同，但包括一个或多个基因的不同同源物的细胞群体。此类文库可用于，例如，鉴别具有改善性状的基因或操纵子。

如本文中使用的，术语“干燥固体含量(DS或ds)”指的是浆液的总固体基于干重的百分比。

如本文中使用的，术语“初始命中(initial hit)”指通过筛选组合共同诱变文库鉴别的变体。在一些实施方案中，与起始基因相比，初始命中具有改良的性能特征。

如本文中使用的，术语“改良命中(improved hit)”指通过筛选增强的组合共同诱变文库鉴别的变体。

如本文中使用的，术语“目标性质(target property)”指待改变的起始基因的性质。其不意味着本发明限于任何特定的目标性质。然而，在一些优选的实施方案中，目标特性是基因产物的稳定性(例如：对变性、蛋白水解或其它降解因素的抗性)，而在其他实施方案中，生产宿主中的生产水平得到改变。事实上，预期起始基因的任何特性都在本发明中得到应用。其它术语定义也可以出现在说明书的全文。

当提供数值范围时，除非上下文另外清楚的指出，应理解为该范围上下限之间的每个中间值(到下限单位的十分之一)，也都是具体公开的。任何陈述值之间的每个更小范围或陈述范围内的中间值和任何其它公开的或所述公开范围内的中间值都包括在本发明内。这些更小范围的上限或下限可以独立地包括于或排除于该范围，两个端点之一，两个端点都不或都包括在更小范围的每个范围也包括在本发明之内，其受限于公开范围内任何具体排除的界限。如果公开的范围包括一个或两个端点，排除一个或者两个所述被包括端点的范围也包括在本发明内。

在详细描述示例性的实施方案之前，还应理解本发明不限于所描述的特定的实施方案，其当然可以变化。与本文公开的内容相似或等价的任何方法和材料都可用于实践或测试本公开文本，但目前仍描述了示例性的方法和材料。

除非上下文另外清楚的指出，如本文中和所附权利要求中使用的单数形态“一个”、“一种”和“这”都包括了复数的指示物。因此，例如，讨论“基因”包括了复数的此类候选物质，讨论“细胞”包括了讨论一个或多个细胞及其本领域技术人员已知的等价物，等等。

本文中讨论的出版物只有其公开早于本申请的申请日，才被提供。本文不承认本发明无权由于是在先发明而早于此类出版物。

2、亲本葡糖淀粉酶

在一些实施方案中，本发明提供了葡糖淀粉酶变体。葡糖淀粉酶变体是亲本葡糖淀粉酶的变体，其同时包括催化结构域和淀粉结合结构域。在一些实施方案中，亲本葡糖淀粉酶包括这样的催化结构域，所述结构域具有SEQ ID NO：1、2、3、5、6、7、8或9中所示的氨基酸序列，或者具有与SEQ ID NO：1、2、3、5、6、7、8或9中所示一个或多个氨基酸序列有至少80％序列同一性的氨基酸序列。在其他实施方案中，亲本葡糖淀粉酶包括由这样的DNA序列编码的催化结构域，所述DNA序列在中、高或严谨条件下与编码葡糖淀粉酶催化结构域的DNA杂交，所述葡糖淀粉酶具有SEQ IDNO：1、2或3之一的氨基酸序列。

在一些实施方案中，亲本葡糖淀粉酶包括这样的淀粉结合结构域，所述结构域具有SEQ ID NO：1、2、161、162、163、164、165、166或167中所示的氨基酸序列，或者具有与SEQ ID NO：1、2、161、162、163、164、165、166或167所示一个或多个氨基酸序列有至少80％序列同一性的氨基酸序列。在其他实施方案中，亲本葡糖淀粉酶包括由这样的DNA序列编码的淀粉结合结构域，所述DNA序列在中、高或严谨条件下与编码葡糖淀粉酶淀粉结合结构域的DNA杂交，所述葡糖淀粉酶具有SEQ ID NO：1或2之一的氨基酸序列。

在真菌物种之间，葡糖淀粉酶的预测结构和已知序列都是保守的(Coutinho等人，1994 Protein Eng.，7：393-400和Coutinho等人，1994，Protein Eng.，7：749-760)。在一些实施方案中，亲本葡糖淀粉酶是丝状真菌的葡糖淀粉酶。在一些实施方案中，亲本葡糖淀粉酶是获得自木霉属菌株(例如：里氏木霉、长梗木霉(T.longibrachiatum)、严紧木霉(T.strictipilis)、棘孢木霉(T.asperellum)、康长木霉(T.konilangbra)和哈茨木霉(T.hazianum))，曲霉属菌株(例如：黑曲霉(A.niger)、构巢曲霉(A.nidulans)、A.kawachi、泡盛曲霉(Aspergillus awamori)和米曲霉(A.orzyae))，踝节菌属菌株(例如：埃默森踝节菌(T.emersonii)，湿热踝节菌(T.thermophilus)和T.duponti)，肉座菌属(Hypocrea)菌株(例如：胶质肉座菌(H.gelatinosa)，东方肉座菌(H.orientalis)，H.vinosa和淡黄肉座菌(H.citrina))，镰孢属菌株(例如：尖镰孢(F.oxysporum)、粉红镰孢(F.roseum)和腹状镰孢(F.venenatum))，脉孢属(Neurospora)菌株(例如：粗糙脉孢菌(N.crassa))和腐质霉属菌株(例如：灰腐质霉、特异腐质霉(H.insolens)和面包腐质霉(H.lanuginose))，青霉属菌株(例如：点青霉(P.notatum)或产黄青霉(P.chrysogenum))，或者复膜孢酵母属菌株(例如：扣囊复膜孢酵母(S.fibuligera))。

在一些实施方案中，亲本葡糖淀粉酶可以是细菌葡糖淀粉酶，例如，多肽可以获得自革兰氏阳性菌株例如芽孢杆菌属(例如：嗜碱芽孢杆菌(B.alkalophilus)、解淀粉芽胞杆菌(B.amyloliquefaciens)、迟缓芽胞杆菌(B.lentus)、地衣芽胞杆菌(B.licheniformis)、嗜热脂肪芽胞杆菌(B. stearothermophilus)、枯草芽孢杆菌和苏云金芽孢杆菌)，或链霉属菌株(例如：浅青紫链霉菌(Streptomyces lividans))。

在一些实施方案中，亲本葡糖淀粉酶包括催化结构域，所述结构域与SEQ ID NO：3的TrGA氨基酸序列的催化结构域具有至少80％序列同一性，至少85％序列同一性，至少90％序列同一性，至少95％序列同一性，至少97％序列同一性，至少98％序列同一性。

在其它实施方案中，亲本葡糖淀粉酶包括催化结构域，所述结构域具有与SEQ ID NO：5或SEQ ID NO：6的曲霉属亲本葡糖淀粉酶的催化结构域至少90％序列同一性，至少93％序列同一性，至少95％序列同一性，至少96％序列同一性，至少97％序列同一性，至少98％序列同一性，和至少99％序列同一性。

在其它实施方案中，亲本葡糖淀粉酶包括催化结构域，所述结构域具有与SEQ ID NO：8的灰腐质霉亲本葡糖淀粉酶(HgGA)的催化结构域至少90％序列同一性，至少95％序列同一性，至少97％序列同一性，和至少99％序列同一性。

在一些实施方案中，亲本葡糖淀粉酶包括淀粉结合结构域，所述结构域具有与SEQ ID NO：1、2或161的TrGA氨基酸序列的淀粉结合结构域至少80％序列同一性，至少85％序列同一性，至少90％序列同一性，至少95％序列同一性，至少97％序列同一性，和至少98％序列同一性。

在其它实施方案中，亲本葡糖淀粉酶包括淀粉结合结构域，所述结构域具有与SEQ ID NO：162的灰腐质霉葡糖淀粉酶(HgGA)的淀粉结合结构域至少90％序列同一性，至少95％序列同一性，至少97％序列同一性，和至少99％序列同一性。

在其它实施方案中，亲本葡糖淀粉酶包括淀粉结合结构域，所述结构域具有与SEQ ID NO：163的太瑞斯梭孢壳霉葡糖淀粉酶(TtGA)的淀粉结合结构域至少90％序列同一性，至少95％序列同一性，至少97％序列同一性，和至少99％序列同一性。

在其它实施方案中，亲本葡糖淀粉酶包括淀粉结合结构域，所述结构域具有与SEQ ID NO：164的疏棉状嗜热丝孢菌(Thermomyces lanuginosus)葡糖淀粉酶(ThGA)的淀粉结合结构域至少90％序列同一性，至少95％序列同一性，至少97％序列同一性，和至少99％序列同一性。

在其它实施方案中，亲本葡糖淀粉酶包括淀粉结合结构域，所述结构域具有与SEQ ID NO：165的埃默森踝节菌(Talaromyces emersoniit)葡糖淀粉酶(TeGA)的淀粉结合结构域至少90％序列同一性，至少95％序列同一性，至少97％序列同一性，和至少99％序列同一性。

在其它实施方案中，亲本葡糖淀粉酶包括淀粉结合结构域，所述结构域具有与SEQ ID NO：166或167的曲霉属亲本葡糖淀粉酶的淀粉结合结构域至少90％序列同一性，至少93％序列同一性，至少95％序列同一性，至少96％序列同一性，至少97％序列同一性，至少98％序列同一性和至少99％序列同一性。

在一些实施方案中，亲本葡糖淀粉酶具有与SEQ ID NO：2的TrGA氨基酸序列至少80％序列同一性，至少85％序列同一性，至少88％序列同一性，至少90％序列同一性，至少93％序列同一性，至少95％序列同一性，至少96％序列同一性，至少97％序列同一性，至少98％序列同一性和至少99％的序列同一性。

在其它实施方案中，可以自木霉属或肉座菌属菌株中获得木霉属葡糖淀粉酶的同源物。一些优选的木霉属葡糖淀粉酶同源物描述在美国专利7,413,887中，特别涉及所述文献中SEQ ID NOs：17-22和43-47所示的氨基酸序列。

在一些实施方案中，亲本葡糖淀粉酶是包含SEQ ID NO：2的氨基酸序列的TrGA，或与TrGA序列(SEQ ID NO：2)具有至少80％，至少85％，至少88％，至少90％，至少93％，至少95％，至少96％，至少97％，至少98％，至少99％序列同一性的木霉属葡糖淀粉酶同源物。

可以使用标准的重组DNA技术分离和/或鉴别亲本葡糖淀粉酶。可以使用的任何标准技术都是本领域技术人员已知的。例如，可以使用特异性针对葡糖淀粉酶保守区的探针和/或引物来鉴别细菌或真菌细胞中的同源物 (催化结构域，活性位点等)。可选的，可以使用简并PCR来鉴别细菌或真菌细胞中的同源物。在一些情况下，可以分析例如数据库中的已知序列与某一已知葡糖淀粉酶(包括SEQ ID NO：2)或已知淀粉结合结构域(包括SEQ ID NO：161)的序列和/或结构同一性。还可以使用功能性测定来鉴别细菌或真菌细胞中的葡糖淀粉酶活性。可以分离并反向测序具有葡糖淀粉酶活性的蛋白质，来分离相应的DNA序列。此类方法是本领域技术人员已知的。

3、葡糖淀粉酶结构同源性：

分子生物学的中心法则是，编码特定酶的基因的DNA序列，决定蛋白质的氨基酸序列，该序列依次决定酶的三维折叠。该折叠将分离的残基放到一起，形成催化中心和底物结合表面，从而获得所讨论的酶的高特异性和活性。

葡糖淀粉酶由三个不同的结构域组成，约450个残基的催化结构域(其在所有葡糖淀粉酶中都是结构上保守的)，一般连接了由30至80个残基组成的接头区域，后者连接至约100个残基的淀粉结合结构域上。具有所有三个完整区域的里氏木霉葡糖淀粉酶的结构在本文中确定至1.8埃解析度(参见表20和实施例13)。利用坐标(参见表20)，将结构与以前确定的泡盛曲霉菌株X100的催化结构域坐标进行比对(Aleshin，A.E.，Hoffman，C.，Firsov，L.M.，和Honzatko，R.B.1994 Refined crystal structures ofglucoamylase from Aspergillus awamori var.X100.J Mol Biol 238：575-591)。泡盛曲霉的晶体结构仅包括催化结构域。如图12和13中所见，催化结构域的结构重叠非常紧密，基于该结构重叠能够鉴别等价的残基。发明人相信，所有的葡糖淀粉酶共享图12和13中描述的基本结构。

图12是从侧面观察，SEQ ID NO：1的木霉属葡糖淀粉酶(黑色)(氨基酸序列参见图1)和泡盛曲霉葡糖淀粉酶(灰色)的三维结构比较。在此观察中可见催化结构域、接头区域和淀粉结合结构域之间的关系。

图13是从顶面观察，木霉属葡糖淀粉酶(黑色)和泡盛曲霉葡糖淀粉酶(灰色)的三维结构比较。图中所示的葡糖淀粉酶，和实际上目前所有已知的葡糖淀粉酶都享有该结构同源性。结构的保守与所有葡糖淀粉酶的活性的保守和保守的作用机制相关。考虑到该高同源性，引起功能变化的木霉属葡糖淀粉酶位点特异性突变所导致的改变，将也具有在其它葡糖淀粉酶中相似的结构，从而具有相似的功能结果。因此，何种变体产生理想优势的教导可用于其它葡糖淀粉酶。

使用表20中的坐标还对淀粉结合结构域(SBD)生成了晶体结构。将TrGA的SBD与黑曲霉的SBD进行比对。如图13所示，黑曲霉和TrGA SBD的结构重叠紧密。发明人相信，所有的淀粉结合结构域共享至少部分的图13中所示的基本结构，而一些SBD在结构上比其他的更相似。例如，TrGASBD可以分类在CAZY数据库(cazy.org)的碳水化合物结合模块20家族中。CAZY数据库描述了酶的结构相关的催化和碳水化合物结合模块(或功能性结构域)的家族，所述酶降解、修饰或创造糖苷键。考虑到高的结构同源性，引起功能变化的TrGA SBD的位点特异性变体也将具有在其它具有与TrGA SBD结构相似的SBD(特别是分类在碳水化合物结合模块20家族中的那些)的葡糖淀粉酶中相似的结构，从而具有相似的功能结果。因此，何种变体产生理想优势的教导可用于具有结构相似性的其它SBD。

因此，本文中讨论的氨基酸位置数指那些指定给图1所示成熟的里氏木霉葡糖淀粉酶序列的位置数。然而，本发明不限于木霉属葡糖淀粉酶的变体，而延伸至包含这样的位置上的氨基酸残基的葡糖淀粉酶，所述位置上的氨基酸残基与里氏木霉葡糖淀粉酶(SEQ ID NO：2)中特定的已鉴别残基是“等价的”的。在本公开文本的实施方案中，亲本葡糖淀粉酶是踝节菌属葡糖淀粉酶，在踝节菌葡糖淀粉酶中等价的氨基酸残基位置上如本文所述进行取代。在其它实施方案中，亲本葡糖淀粉酶是表1中列举的任一个。在其它实施方案中，亲本葡糖淀粉酶是青霉属葡糖淀粉酶，例如产黄青霉。

结构同一性决定氨基酸残基是否是等价的。结构同一性是当比对两个结构(三维和氨基酸结构)时，一对一的拓扑学等价。如果与里氏木霉葡糖淀粉酶中的特定残基或所述残基的部分是同源(即，初级或三级结构中相应的位置)或者同功的(具有相同或相似的化学结合、反应或相互作用的功能能力)，则葡糖淀粉酶的(氨基酸)残基位置与里氏木霉葡糖淀粉酶的残基是等价的。

为了建立初级结构的同一性，可以将葡糖淀粉酶的氨基酸序列与里氏木霉葡糖淀粉酶的初级结构直接比较，特别是直接比较在序列已知的葡糖淀粉酶中已知不变的残基集合。例如，本文中的图4A和B显示了葡糖淀粉酶之间的保守残基。本文中的图4C和D显示了不同的葡糖淀粉酶的淀粉结合结构域的比对。在比对保守残基后，允许进行必要的插入和删除从而维持比对(即，避免通过随意的删除和插入而除去保守残基)，定义与里氏木霉葡糖淀粉酶的初级序列中特定氨基酸等价的残基。保守残基的比对典型地应该保守100％的此类残基。然而大于75％或少至50％的保守残基的比对，也足以定义等价残基。此外，可以结合使用结构同一性和序列同一性来鉴别等价的残基。

例如，在图4A和B中，比对了来自六种生物的葡糖淀粉酶的催化结构域，提供氨基酸序列之间的最大量同源性。这些序列的比较显示，每个序列中都含有多个保守残基，用星号指示。因此，这些保守残基可用于在其它葡糖淀粉酶，例如来自黑曲霉的葡糖淀粉酶中，定义与里氏木霉葡糖淀粉酶相应的等价氨基酸残基。相似的，图4C和D显示了比较来自7种生物的葡糖淀粉酶的淀粉结合结构域，来鉴别等价的残基。

结构同一性涉及在两个结构之间等价残基的鉴别。对于酶，可以通过在酶三级结构水平上测定同源性(结构同一性)来定义“等价残基”，所述酶的三级结构已经通过X射线晶体学确定。等价残基定义为，在比对后，与里氏木霉葡糖淀粉酶(N对N，CA对CA，C对C和O对O)的特定氨基酸残基的两个或多个主链原子的原子坐标在0.13nm之内，优选的在0.1nm之内的那些残基。在将最佳模型定向和定位，使所讨论的葡糖淀粉酶与里氏木霉葡糖淀粉酶的非氢蛋白质原子的原子坐标产生最大重叠之后，实施比对。最佳模型是在可获得的最高解析度下，对实验衍射数据产生最低R因子的晶体学模型。

与里氏木霉葡糖淀粉酶的特定残基功能性类似的等价残基定义为酶的那些氨基酸，其可以采用这样的构象，使得其以确定的和属于里氏木霉葡糖淀粉酶特定残基的方式改变，修饰或者促进蛋白质结构、底物结合或催化。进而，它们是酶(已经通过X射线晶体学获得了三级结构)的残基，所述残基占据同功位置到这样的程度：尽管给定残基的主链原子可能不满足以占据同源位置为基础的等价标准，但是该残基的至少两个侧链原子的原子坐标位于里氏木霉葡糖淀粉酶相应侧链原子的0.13nm内。表15中提出了里氏木霉属葡糖淀粉酶的三维结构的坐标，其可以如上述使用以确定三级结构水平上的等价残基。

一些鉴别用于取代的残基是保守残基，而另一些不是。在残基不保守的情况下，一个或多个氨基酸的取代被限于这样的取代，其产生的变体具有与天然发现的序列不一致的氨基酸序列。在保守残基的情况下，此类取代不应当获得天然存在的序列。

4、变体

根据本公开文本的变体包括在亲本葡糖淀粉酶的氨基酸序列中至少一个取代、缺失或插入，使变体与亲本葡糖淀粉酶的序列不同。在一些实施方案中，公开文本的变体具有SEQ ID NO：2的TrGA活性的至少20％、至少40％、至少60％、至少80％、至少85％、至少90％、至少95％和至少100％的葡糖淀粉酶活性。

在一些实施方案中，根据本发明的变体包含在亲本TrGA(SEQ IDNO：2)的至少一个氨基酸位置上，或者在另一个亲本葡糖淀粉酶序列的等价位置上的取代、缺失或插入，所述另一个亲本葡糖淀粉酶具有和TrGA序列至少80％的序列同一性，包括但不限于：至少90％、至少93％、至少 95％、至少97％和至少99％序列同一性。

在其它实施方案中，根据公开文本的变体包含在亲本TrGA片段的至少一个氨基酸位置上的取代、缺失或插入，其中片段包含TrGA序列的催化结构域(SEQ ID NO：3)，或者在下述片段的等价位置上的所述取代、缺失或插入，所述片段包含亲本葡糖淀粉酶的催化结构域，其与TrGA序列的片段具有至少80％的序列同一性，包括但不限于至少90％、至少95％、至少97％和至少99％序列同一性。在一些实施方案中，片段包含至少400、425、450和/或500个氨基酸残基。

在其它实施方案中，根据公开文本的变体包含在亲本TrGA片段的至少一个氨基酸位置上的取代、缺失或插入，其中片段包含TrGA序列的淀粉结合结构域(SEQ ID NO：161)，或者在下述片段的等价位置上的所述取代、缺失或插入，所述片段包含亲本葡糖淀粉酶的淀粉结合结构域，其与TrGA序列的片段具有至少80％的序列同一性，包括但不限于至少90％、至少95％、至少97％和至少99％序列同一性。在一些实施方案中，片段包含TrGA淀粉结合结构域(SEQ ID NO：161)的至少40、50、60、70、80、90、100和/或109个氨基酸残基。

在一些实施方案中，当亲本葡糖淀粉酶包括催化结构域、接头区域和淀粉结合结构域时，变体将在包括部分接头区域的片段的至少一个氨基酸位置上包括取代、缺失或插入。在一些的实施方案中，在TrGA序列(SEQID NO：2)片段的氨基酸序列中，变体可以包括取代、缺失或插入。

关于氨基酸取代的结构同一性，意指取代发生在同源葡糖淀粉酶或亲本葡糖淀粉酶中的等价氨基酸位置上。术语等价位置意指两个亲本序列共有的位置，这是基于讨论的亲本葡糖淀粉酶的氨基酸序列以及三维结构与TrGA序列葡糖淀粉酶的氨基酸序列和三维结构的比对。例如，参考图5，TrGA(SEQ ID NO：2或3)中的位置24是D24，黑曲霉(SEQ ID NO：6)的等价位置是位置D25，米曲霉(SEQ ID NO：7)的等价位置是位置D26。参见图12和13的三维序列的示例性比对。

在一些实施方案中，葡糖淀粉酶变体在亲本的氨基酸序列中包括至少一个取代。在其它实施方案中，变体可以具有一个以上的取代(例如，2、3或4个取代)。

在一些实施方案中，葡糖淀粉酶变体包括取代、缺失或插入，通常是取代，这是在与图5示例的非保守氨基酸区域相对应位置(例如：对应于图5中没有用“*”指示的那些位置的氨基酸位置)中的至少一个氨基酸位置上。

尽管变体可以发生在成熟蛋白质序列(SEQ ID NO：2)中的任何位置，在一个实施方案中，葡糖淀粉酶变体包含一个或多个取代，其在SEQ IDNO：2所示的氨基酸序列的下列位置中：4、5、12、24、29、43、44、45、46、47、49、51、61、70、73、75、76、94、100、108、114、116、119、122、124、125、137、143、146、148、169、171、172、175、178、180、181、208、211、228、242、243、245、292、294、297、309、310、313、314、315、316、317、321、340、341、350、353、356、363、368、369、375、376、395、398、401、408、409、412、415、417、418、421、430、431、433、436、451、503、511、535、539或563；或者在亲本葡糖淀粉酶的等价位置上。在一些实施方案中，亲本葡糖淀粉酶具有和SEQ ID NO：2至少90％、至少95％、至少96％、至少97％、至少98％，以及至少99％的同一性。在其它实施方案中，亲本葡糖淀粉酶可以是木霉属葡糖淀粉酶同源物。

在一些实施方案中，葡糖淀粉酶变体包含一个或多个取代，其发生在SEQ ID NO：2所示的氨基酸序列中的下列位置上：

D4、F5、I12、D24、F29、I43、D44、P45、D46、Y47、Y49、W51、N61、Y70、G73、Q75、R76、P94、D100、K108、K114、F116、N119、R122、Q124、R125、G137、N146、Q148、Y169、N171、Q172、F175、W178、E180、V181、Q208、S211、W228、N242、E243、R245、I292、G294、K297、R309、Y310、D313、V314、Y315、Y316、N317、W321、K340、K341、T350、Q356、T363、S368、S369、N376、Y395、A398、S401、R408、N409、T412、L417、H418、W421、T430、A431、R433、I436、S451、E503、Q511、A535、A539或N563；或者在亲本葡糖淀粉酶中的等价位置上(例如：木霉属葡糖淀粉酶同源物)。

在其它实施方案中，亲本葡糖淀粉酶变体包含一个或多个取代，其在SEQ ID NO：2所示的氨基酸序列的下列位置中：4、5、24、29、43、44、49、61、70、73、75、76、100、108、119、124、137、146、148、169、171、172、175、178、181、208、211、243、292、294、297、314、316、317、340、341、350、356、363、368、369、376、395、401、409、412、417、430、431、433、436、451、503、511、535、539或563；或者在亲本葡糖淀粉酶中的等价位置上(例如：木霉属葡糖淀粉酶同源物)。

在其它实施方案中，亲本葡糖淀粉酶变体包含至少一个下列取代，其在SEQ ID NO：2所示的氨基酸序列的下列位置中：D4L/E/R/S/C/A/Q/W，F5C/M/N/R/S/T/V/W，I12L/R，D24E/L/Y/T，F29L/I/D/C/S/V/W，I43F/R/D/Y/S/Q，D44E/H/K/S/N/Y/F/R/C，Y47W，Y49N，N61D/I/L/Q/V/W，Q70R/K/M/P/G/L/F，G73F/C/L/W，Q75R/K/A，R76L/M/K/T/P，P94L，D100W/I/Q/M/P/A/N，N119P/T/Y/D/E，N146S/G/C/H/E/D/T/W/L/F/M，Q148V/Y/H/A/C/D/G/M/R/S/T，Y169D/F，Q172C/A/D/R/E/F/H/V/L/M/N/S/T/V，F175H/A/G/R/S/T/C/W/Y，W178A/C/D/E/F/G/H/K/N/R/S/T/V/Y，E180A/C/G/H/I/L/N/P/Q/R/S/T/V/Y/，V181E/C/D/G/H/I/P/T/Y/S/L/K/F/A，Q208L/A/C/E/N/F/H/T，S211C/R/E/A/Y/W/M/H/L/I/R/Q/T，E243S/R/N/M/Y/A/L，R245A/E/M/I/P/V，I292D/H/P/R/T/N/V/F/L，G294C/D/E/T/Q/I/A，K297F/L/P/T/M/D/N/Q/A/Y/H/S/R/W，R309A/C/G/H/I/N/P/Q/S/T/W/Y/L，Y310E/G/L/P/S/W/R/Q，D313Q，V314A/R/N/D/C/E/Q/G/H/I/L/K/M/F/P/S/T/W/Y，Y315F，Y316Q/R，N317T/H，K340D/T，K341F/D/P/V/G/S，T350S/E/A/N，Q356H/D/E，T363L/R/C/H/W，S368W/D/F/L，S369F，N376Q/T/H/S/V，Y395Q/R/S，A398S/I/T，S401C/V，R408S，N409W/T/K，T412A/H/K/G，L417A/D/E/F/G/I/K/Q/R/S/T/V/W/Y，T430A/E/F/G/H/I/K/M/N/Q/R/V，A431C/E/H/I/L/M/Q/R/S/W/Y，R433H/Q，I436A/T，S451M/T/H，E503A/C/D/H/S/V/W，Q511C/G/H/I/K/T/V，A535E/F/G/K/L/N/P/R/S/T/V/W/Y，A539E/H/M/R/S/W或N563/A/C/E/I/K/L/Q/T/V；或者在亲本葡糖淀粉酶同源物中的等价位置上。

在一些实施方案中，葡糖淀粉酶变体包含至少一个取代，发生在相应于下述SEQ ID NO：2所示的氨基酸残基位置的位置上：5、24、43、44、49、61、70、73、75、76、94、119、146、148、172、175、178、180、181、208、211、245、294、353、315、375、409、309、314、369、412、417、430、431、503、511、535、539或563；或者在亲本葡糖淀粉酶同源物中的等价位置上。

在一些示例性的实施方案中，葡糖淀粉酶变体包含对应于SEQ ID NO：2所示的位置，或者同源的亲本葡糖淀粉酶中的等价位置的至少一个选自以下的取代：F5W，D24E，I43R，I43Y，I43Q，I43S，I43F，D44C，D44R，Y47W，Y49N，N61I，Q70K，G73F，Q75R，R76L，P94L，N119P/T/Y/D，N146S/D/T/E/W/L，Q148V N171D，Q172C/D/R/E/F/V/L/T，F175R/W/Y，W178K/N/Y，E180H/N/V/R，V181E/F/G/I/H，Q208A/T/N，S211H/M/L/R，R245E，R245M，G294C，R309W，V314F/G/H/K/P/R/Y，Y315F，S369F，T412K，L417R，L417V，T430A，T430M，A431L，A431Q，E503A，E503V，Q511H，A535R，A539R，N563I和N563K。

在其它特定的实施方案中，葡糖淀粉酶变体包含氨基酸残基的至少一个取代，所述氨基酸残基选自与SEQ ID NO：2的位置5、43、44、61、73、75、76、94、108、119、124、146、148、171、172、175、178、180、181、208、211、294、297、314、316、412、417、430、431、503、511、535、539或563，或者与木霉属葡糖淀粉酶同源物中的等价位置对应的位置上。在一些实施方案中，取代发生在与SEQ ID NO：2的位置编号43、44、61、73、148、172、175、178、180、208、211、294、297、314、412、417、430、431、503、511、535、539或563，或者与木霉属葡糖淀粉酶同源物的等价位置相对应的位置上。

在一些示例性的实施方案中，取代是在与SEQ ID NO：2或同源的亲本葡糖淀粉酶(例如：木霉属葡糖淀粉酶同源物)的位置编号43、44、61、73、108、124、171、172、208、211、294、314、316、417、430、431、503、 511、535、539或563对应的位置上。

在一些实施方案中，葡糖淀粉酶变体包含多个取代。一些多个取代包括在一个或多个位置上的取代，所述位置等价于且包括SEQ ID NO：2的位置24、43、44、108、124、171、175、181、208、243、292、294、297、310、314、363、417、430、431、503、511、535、539或563。一些典型的多个取代包括一个或多个位置，所述位置等价于和对应于SEQ ID NO：2的位置43、44、61、73、08、124、171、208、211、294、314、417、430、431、503、511、535、539或563。

具有多个取代的变体的一些实例包括在以下位置的取代：

SEQ ID NO：2的

D24/I43/D44/F175/V181/V314/T363；

D24/Q208/I292/G294/K297/Y310；

V181/E243/I292/k297/N317/Y395；

D24/V181/Q208/G294/T363/N376/N409；

D24/V181/I292/G294/E243/N409；

I43R/E243/I292/G294/K297；

I43/D44/N61/L417/E503/Q511/A539；

I43/D44/L417/E503/Q511/A539；

I43/N61/L417/T430/Q511/A539；

I43/N61/L417/E503/Q511/A539；

I43/N61/T430/A431/Q511/A539；

I43/N61/T430/Q511；

I43/N61/T430/Q511/A539；

I43/N61/Q511；

I43/N61/Q511/A539；

I43/G73/T430；

I43/L417/E503/Q511/A539；

I43/L417/Q511；

I43/L417/T430/A431/Q511/A539；

I43/L417/T430/Q511；

I43/L417/T430/Q511/A539；

I43/L417/E503/A539；

I43/L417/E503/Q511/A539；

I43/T430；

I43/T430/A431/E503/Q511；

I43/T430/A431/Q511；

I43/T430/A431/Q511/A539；

I43/T430/E503/Q511；

I43/T430/Q511；

I43Q/T430/Q511/A539；

I43/A431/Q511；

I43/T430/E503/Q511/N563；

I43/T430/E503/A535/N563；

I43/E503/Q511/A539；

I43/Q511/A539；

D44/G73/L417/N563；

D44/G73/E503/Q511；

D44/G73/N563；

D44/L417/N563；

D44/T430/Q511/A535；

D44/E503/Q511/N563；

G73/T430/E503/Q511；

G73/T430/Q511；

G294/L417/A431；

G294/L417/A431/Q511；

L417/T430/A431/Q511/A535/A539/N563；

L417/A431/Q511；

L417/T430/Q511/A535/N563；

L417/T430/Q511/A539/N563；和

E503/N563；

或者在亲本葡糖淀粉酶特别是木霉属葡糖淀粉酶同源物中的等价位置上。

一些具有多个取代的变体可以包括以下位置上的取代：

SEQ ID NO：2的

Y47F/W，Y315F/W；

D24E，L/I43F，R/D44H，N/F175H/V181K，L/V314D，H，K/T363R；

D24L，W，Y/Q208F/I292F，N，V/G294A，I，Q/K297A/Y310F，Q，R；

V181F，K，L/E243A，N，M，R，Y/I292F，L，N，V/K297A，D，H，M，N，Q/N317H/Y395Q，R；

D24E，L，Y/V 181F，K，L/Q208C，F/G294A，I，Q/T363R/N376Q/N409K，W；

D24E，L，Y/V181F，K，L/I292F，L，N，V/G294A，I，Q/E243A，M，N，R，Y/N409K，W；

I43R/E243A，M，N，R，Y/I292F，L，N，V/G294A/K297A，D，H，M，N，Q，S，R，W，Y；

I43Q/D44C/N61I/L417V/E503A/Q511H/A539R；

I43Q/D44C/L417V/E503A/Q511H/A539R；

I43Q/N61I/L417V/E503A/Q511H/A539R；

I43Q/N61I/L417V/T430M/Q511H/A539R；

I43R/N61I/L417R，V/E503A/Q511H/A539R；

I43Q/N61I/T430A/A431L/Q511H/A539R；

I43Q/N61I/T430A/Q511H；

I43Q/N61I/T430A/Q511H/A539R；

I43Q/N61I/T430M/Q511H/A539R I43Q/N61I/Q511H；

I43Q/N61I/Q511H/A539R；

I43R/G73F/T430A；

I43Q/L417V/T430A/A431L/Q511H/A539R；

I43Q/L417V/T430A/Q511H；

I43Q/L417V/T430A/Q511H/A539R；

I43R/L417R/E503A/A539R；

I43R，Q/L417V/E503A/Q511H/A539R；

I43Q/L417V/Q511H；

I43R，Q/T430A；

I43Q/T430A/A431L/E503A/Q511H；

I43Q/T430A/A431L/Q511H；

I43Q/T430A/A431L/Q511H/A539R；

I43Q/T430A/E503A/Q511H；

I43Q/T430A/Q511H；

I43Q/T430A，M/Q511H/A539R；

I43R/T430A/E503A，V/Q511H/N563K；

I43Q/A431L/Q511H；

I43Q/E503A/Q511H/A539R；

I43Q/Q511H/A539R；

D44C/G73F/E503V/Q511H；

D44C/G73F/L417R/N563K；

D44C/G73F/N563K；

D44C/L417R/N563K；

D44R/E503A/Q511H/N563I；

D44R/T430A/Q511H/A535R；

G73F/T430A/E503V/Q511H；

G73F/T430A/Q511H；

G294C/L417R/A431L；

G294C/L417R/A431L，Q/Q511H；

G294C/L417V/A431Q；

L417R，V/A431L，Q/Q511H；

L417V/T430A/A431L，Q/Q511H/A535R/A539R/563I；

L417V/T430A/Q511H/A535R/N563I；

L417V/T430A/Q511H/A539R/N563I；和

E503A/N563I

或者在亲本葡糖淀粉酶特别是木霉属葡糖淀粉酶同源物中的等价位置。

已经比对了多个亲本葡糖淀粉酶和TrGA的氨基酸序列。图4A和4B包括下列亲本葡糖淀粉酶的催化结构域：泡盛曲霉(AaGA)(SEQ ID NO：5)；黑曲霉(AnGA)(SEQ ID NO：6)；米曲霉(AoGA)(SEQ ID NO：7)；灰腐质霉(HgGA)(SEQ ID NO：8)和Hypocrea vinosa(HvGA)(SEQ ID NO：9)。下表1中显示了催化结构域的％同一性。图4C和4D包括下列亲本葡糖淀粉酶的淀粉结合结构域：里氏木霉(TrGA)(SEQ ID NO：161)；灰腐质霉(HgGA)(SEQ ID NO：162)；太瑞斯梭孢壳霉(Thielaviaterrestris)(TtGA)(SEQ ID NO：163)；疏棉状嗜热丝孢菌(Thermomyceslanuginosus)(ThGA)(SEQ ID NO：164)；埃默森踝节菌(Talaromycesemersonii)(TeGA)(SEQ ID NO：165)；黑曲霉(AnGA)(SEQ ID NO：166)和泡盛曲霉(AaGA)(SEQ ID NO：167)。在一些实施方案中，例如，变体葡糖淀粉酶来自是曲霉属葡糖淀粉酶的亲本葡糖淀粉酶，并且变体将包括至少一个取代，其发生在与SEQ ID NO：2所示的位置等价的位置上，特别是在对应的D4、F5、I12、D24、F29、I43、D44、P45、D46、Y47、Y49、W51、N61、Y70、G73、Q75、R76、P94、D100、K108、K114、F116、N119、R122、Q124、R125、G137、N146、Q148、Y169、N171、Q172、F175、W178、E180、V181、Q208、S211、W228、N242、E243、R245、I292、G294、K297、R309、Y310、D313、V314、Y315、Y316、N317、W321、K340、K341、T350、Q356、T363、S368、S369、N376、Y395、A398、S401、R408、N409、T412、L417、H418、W421、T430、A431、R433、I436、S451、E503、Q511、A535、A539或N563的位置上。

内切-H去除里氏木霉葡糖淀粉酶的N-连接糖，具有稳定化效果(观察T_m时)。因此，具有N171D取代的变体与野生型相比，可具有增加的热稳定性。在一些实施方案中，提供了在具有N-连接糖的位置具有一个或多个取代的变体，包括里氏木霉(SEQ ID NO：2)中的N171D。

表1

本公开文本还提供与亲本葡糖淀粉酶，特别是与TrGA相比，具有至少一个改变性质(例如：改善的性质)的葡糖淀粉酶变体。在一些实施方案中，至少一个改变的性质(例如：改善的性质)选自酸稳定性、热稳定性和比活性。通常，改变的性质是增加的酸稳定性、增加的热稳定性和/或增加的比活性。通常，增加的热稳定性是在较高温度下。在一个实施方案中，增加的pH稳定性是在高pH下。在另一个实施方案中，增加的pH稳定性是在低pH下。

与亲本葡糖淀粉酶相比，本公开文本的葡糖淀粉酶变体还可以提供在低底物浓度下，较高的淀粉水解速率。当在相同条件下测试时，变体可具有比亲本葡糖淀粉酶较高的V_max或较低的K_m。例如，变体葡糖淀粉酶可具有在温度范围为25℃至70℃下较高的V_max(例如：25℃至35℃；30℃至35℃；40℃至50℃；50℃至55℃和55℃至62℃)。可以利用已知的标准方法方便的确定米-曼常数(Michaelis-Menten constant)、K_m和V_max值。

5、热稳定性(热稳定变体)

在一个方面，公开文本涉及与亲本或野生型相比，在改变的温度下，具有改变的热稳定性的变体葡糖淀粉酶。改变的温度包括增加的或降低的温度。在一些实施方案中，葡糖淀粉酶变体具有改善的热稳定性，例如在暴露于改变的温度下给定的时间后，保留至少50％、60％、70％、75％、 80％、85％、90％、92％、95％、96％、97％、98％或99％酶活性，所述时间例如至少60分钟、120分钟、180分钟、240分钟、300分钟等。在一些实施方案中，变体与亲本葡糖淀粉酶相比，在40-80℃范围内的选定温度下，具有增加的热稳定性，还可以是50-75℃的范围内，和60-70℃的范围内，并且pH范围通常是4.0-6.0。在一些实施方案中，按实施例描述的确定热稳定性。

在一些实施方案中，与热稳定性的改良有关的特别有兴趣的变体包括一个或多个缺失、取代或插入，特别是取代，它们发生在SEQ ID NO：2所示的氢基酸序列的下列位置上：D4、F5、I12、D24、F29、143、D44、P45、D46、Y47、Y49、W51、N61，Y70、G73、Q75、R76、P94、D100、K108、K114、F116、N119、R122、Q124、R125、G137、N146、Q148、Y169、N171、Q172、F175、W178、E180、V181、Q208、S211、W228、N242、E243、R245、I292、G294、K297、R309、Y310、D313、V314、Y315、Y316、N317、W321、K340、K341、T350、Q356、T363、S368、S369、N376、Y395、A398、S401、R408、N409、T412、L417、H418、W421、T430、A431、R433、I436、S451、E503、Q511、A535、A539或N563；或亲本葡糖淀粉酶中等价的位置上。在一些实施方案中，亲本葡糖淀粉酶是木霉葡糖淀粉酶同源物，在典型的实施方案中，亲本葡糖淀粉酶具有与SEQ ID NO：2至少90％、至少95％和至少98％序列同一性。

6、嵌合的葡糖淀粉酶：

本公开文本的葡糖淀粉酶变体还可以包括嵌合的或杂合的葡糖淀粉酶，具有例如来自一种葡糖淀粉酶的淀粉结合结构域(SBD)和来自另一种的催化结构域和接头。例如，可以通过将AnGA的SBD与TrGA的SBD互换，产生具有AnGA SBD和TrGA催化结构域和接头的杂化物，来制造杂合的葡糖淀粉酶。可选的，来自AnGA的SBD和接头可以与TrGA的SBD和接头互换。

7、比活性

在另一方面，公开文本涉及与亲本或野生型葡糖淀粉酶相比，具有改变的比活性的变体葡糖淀粉酶。

在一些实施方案中，与比活性的改良有关的特别有兴趣的变体包括一个或多个缺失、取代或插入，特别是取代，发生在SEQ ID NO：2所示的氨基酸序列的下列位置上：D4、F5、I12、D24、F29、I43、D44、P45、D46、Y47、Y49、W51、N61、Y70、G73、Q75、R76、P94、D100、K108、K114、F116、N119、R122、Q124、R125、G137、N146、Q148、Y169、N171、Q172、F175、W178、E180、V181、Q208、S211、W228、N242、E243、R245、I292、G294、K297、R309、Y310、D313、V314、Y315、Y316、N317、W321、K340、K341、T350、Q356、T363、S368、S369、N376、Y395、A398、S401、R408、N409、T412、L417、T430、A431、H418、W421、R433、I436、S451、E503、Q511、A535、A539或N563；或在亲本葡糖淀粉酶中等价的位置上。在一些实施方案中，具有改善的比活性的公开文本的变体包括取代，其发生在SEQ ID NO：2所示的氨基酸序列的下列位置上：D4、D24、I43、D44、N61、Y70、G73、Q75、R76、D100、K108、N119、Q124、N146、Q148、N171、Q172、F175、V181、Q208、S211、E243、R245、I292、G294、K297、V314、Y316、N317、K340、K341、T350、Q356、T363、S368、N376、Y395、A398、S401、N409、T412、L417、T430、A431、I436、S451、E503、Q511、A535、A539或N563；或在亲本葡糖淀粉酶中等价的位置上。在一些实施方案中，亲本葡糖淀粉酶包含与SEQ ID NO：2的序列具有至少90％或95％序列同一性的序列。

8、多核苷酸：

本公开文本还涉及编码本发明的变体葡糖淀粉酶的分离的多核苷酸。编码变体葡糖淀粉酶的多核苷酸可以通过本领域已知的常规技术制备。可以合成制备多核苷酸，例如通过自动化DNA合成仪。DNA序列可以是通过将片段连接在一起而制备的混合的基因组(或cDNA)和合成的起源。多核苷酸还可以是通过聚合酶链式反应(PCR)利用特异引物制备的。一般，参考Minshull J.等人，(2004)，Engineered protein function by selectiveamino acid diversification，Methods 32(4)：416-427。而且，目前多家公司都合成DNA，例如Geneart AG，Regensburg，德国。

本公开文本还提供包含下述核苷酸序列的分离的多核苷酸：所述序列(i)具有与SEQ ID NO：4至少70％同一性，或(ii)在中等至高严谨条件下，能够与来自SEQ ID NO：4所示的核苷酸序列的探针杂交，或(iii)与核苷酸序列互补，所述核苷酸序列与SEQ ID NO：4所示的序列具有至少90％序列同一性。根据本公开文本有效的探针可以包括SEQ ID NO：4的至少50、100、150、200、250、300或更多个连续的核苷酸。

本公开文本还提供了编码变体葡糖淀粉酶的分离的多核苷酸，所述变体葡糖淀粉酶包含的氨基酸序列具有与SEQ ID NO：2至少80％氨基酸序列同一性。在一些实施方案中，变体葡糖淀粉酶具有与SEQ ID NO：2至少80％氨基酸序列同一性。在一些实施方案中，变体葡糖淀粉酶具有与SEQID NO：2至少90％氨基酸序列同一性。在一些实施方案中，变体葡糖淀粉酶具有与SEQ ID NO：2至少93％氨基酸序列同一性。在一些实施方案中，变体葡糖淀粉酶具有与SEQ ID NO：2至少95％氨基酸序列同一性。在一些实施方案中，变体葡糖淀粉酶具有与SEQ ID NO：2至少97％氨基酸序列同一性。在一些实施方案中，变体葡糖淀粉酶具有与SEQ ID NO：2至少98％氨基酸序列同一性。在一些实施方案中，变体葡糖淀粉酶具有与SEQID NO：2至少99％氨基酸序列同一性。本发明还提供包含任何上述多核苷酸的表达载体。

本公开文本还提供编码本文中提供的变体葡糖淀粉酶的DNA片段(即，部分)。这些片段可用于获得部分长度的DNA片段，其能够用于从丝状真菌细胞(例如：木霉属、曲霉属、镰孢属、青霉属、裂殖酵母属和腐质霉属)中分离或鉴别编码本文中描述的成熟的葡糖淀粉酶或其具有葡糖淀粉酶活性的区段的多核苷酸。在一些实施方案中，DNA片段可以包含至少50、100、150、200、250、300或更多个连续的核苷酸。在一些实施方案中，SEQ ID NO：4中提供的DNA的部分可用于从其它物种，例如编码葡糖淀粉酶的丝状真菌中，获得亲本葡糖淀粉酶，特别是木霉葡糖淀粉酶同源物。

9、DNA构建体和载体

根据公开文本的一个实施方案，组装包括上述编码本发明涵盖的变体葡糖淀粉酶的多核苷酸并且有效连接至启动子序列的DNA构建体，用于转移至宿主细胞内。

可以利用载体将DNA构建体引入宿主细胞。载体可以是任何载体，当其被引入宿主细胞时，通常被整合到宿主细胞基因组内并复制。载体包括克隆载体、表达载体、穿梭载体、质粒、噬菌体颗粒、盒等。在一些实施方案中，载体是表达载体，其包含与葡糖淀粉酶编码序列有效连接的调控序列。

Sambrook等人，(1989)如上，和Ausubel(1987)如上，和van den Hondel等人，(1991)在Bennett和Lasure(编著)More Gene Manipulations in Fungi，Academic Press第396-428页中，和美国专利5,874,276中提供了合适的表达和/或整合载体的实例。Fungal Genetics Stock center catalogue of Strains(FGSC，<WWW.fgsc.net>)也公开了有用的载体。特别有效的载体包括获得自例如英杰生命科学公司(Invitrogen)和普罗米加公司(Promega)的载体。

适合用于真菌宿主细胞的特定载体包括载体例如pFB6、pBR322、pUC18、pUC100、pDONR^TM201、pDONR^TM221、pENTR^TM、pGEM3Z和pGEM

4Z。用于曲霉属的通用表达载体包括具有glaA启动子的pRAX，在肉座菌属/木霉属中包括具有cbh1启动子的pTrex3g。

在细菌细胞中使用的合适质粒包括能在大肠杆菌(E.coli)中进行复制的pBR322和pUC19，以及例如允许在芽孢杆菌属中复制的pE194。

在一些实施方案中，启动子在细菌或真菌宿主细胞内表现出转录活性，可来自编码与宿主细胞同源或异源蛋白质的基因。启动子可以是突变的、截短的和/或杂合的启动子。上述启动子是本领域已知的。

用于真菌细胞，特别是丝状真菌细胞例如木霉属或曲霉属细胞的合适的启动子的实例包括以下示例性启动子，如里氏木霉启动子cbh1、cbh2、egl1、egl2、eg5、xln1和xln2。其它有效的启动子的实例包括来自泡盛曲霉和黑曲霉葡糖淀粉酶基因(glaA)的启动子(参见：Nunberg等人，(1984)Mol.Cell Biol.4：2306-2315和Boel等人，(1984)EMBO J.3：1581-1585)，米曲霉TAKA淀粉酶启动子，来自酿酒酵母的TPI(丙糖磷酸异构酶)启动子，来自构巢曲霉(Aspergillus nidulans)乙酰胺酶基因和米赫根毛霉(Rhizomucor miehei)脂肪酶基因的启动子。

用于细菌细胞的合适的启动子的实例包括自以下获得的启动子：大肠杆菌lac操纵子；地衣芽孢杆菌(Bacillus licheniformis)α淀粉酶基因(amyL)，嗜热脂肪芽孢杆菌(B.stearothermophilus)淀粉酶基因(amyM)；枯草芽孢杆菌xylA和xylB基因，β-内酰胺酶基因，和tac启动子。

在一个实施方案中，启动子是宿主细胞天然的启动子。例如，当里氏木霉是宿主时，启动子是天然的里氏木霉启动子。在另一个实施方案中，启动子是真菌宿主细胞异源的启动子。在一些实施方案中，启动子是亲本葡糖淀粉酶的启动子，例如TrGA启动子。

在一些实施方案中，DNA构建体包括编码信号序列的核酸，所述信号序列是连接在多肽氨基端的氨基酸序列，指导编码的多肽进入细胞的分泌途径。核酸序列的编码序列的5’端可天然的包含信号肽编码区，其在翻译阅读框中天然的连接至葡糖淀粉酶编码序列的区段上，编码分泌的葡糖淀粉酶，或者核酸序列的编码序列的5’端可以包括对该编码序列是外来性的信号肽。在一些实施方案中，DNA构建体包括与亲本葡糖淀粉酶基因天然相关的信号序列，其中从所述亲本葡糖淀粉酶获得变体葡糖淀粉酶。在一些实施方案中，信号序列是SEQ ID NO：1描述的序列，或与其具有至少90％，至少94％和至少98％序列同一性的序列。有效的信号序列可以包括自其它丝状真菌酶的葡糖淀粉酶获得的信号序列，例如来自木霉属(里氏木霉葡糖淀粉酶)，腐质霉属(特异腐质霉的纤维素酶或灰腐质霉的葡糖淀粉酶)，曲霉属(黑曲霉葡糖淀粉酶和米曲霉TAKA淀粉酶)，和根霉属。

在其它实施方案中，包含信号序列的DNA构建体或载体与待被引入宿主细胞的启动子序列来自相同的来源。在一些实施方案中，可以使用木霉葡糖淀粉酶同源物的天然葡糖淀粉酶信号序列，例如来自肉座菌属菌株的信号序列。

在一些实施方案中，表达载体还可以包括终止序列。本发明可以使用任何在宿主细胞内有功能的终止序列。在一个实施方案中，终止序列和启动子序列来自相同的来源。在另一个实施方案中，终止序列是与宿主细胞同源的。有效的终止序列包括自以下基因获得的终止序列：里氏木霉cbh1；黑曲霉或泡盛曲霉葡糖淀粉酶(Nunberg等人，(1984)如上，和Boel等人，(1984)如上)，构巢曲霉的邻氨基苯甲酸合酶，米曲霉TAKA淀粉酶，或构巢曲霉trpC(Punt等人，(1987)Gene 56：117-124)。

在一些实施方案中，表达载体包括选择性标记。典型的选择性标记的实例包括产生抗微生物抗性(例如：潮霉素和腐草霉素)的标记。营养择性标记也可用于本发明，包括本领域已知的标记，如amdS(乙酰胺酶)，argB(鸟氨酸氨甲酰基转移酶)和pyrG(乳清苷-5’磷酸脱羧酶)。对于木霉转化，在载体系统中有效的标记是本领域已知的(参见例如：Finkelstein，Biotechnology of Filamentous Fungi，第6章，Finkelstein等编著，Butterworth-Heinemann，Boston，MA(1992)；Kinghorn等人，(1992)Applied Molecular Genetics of Filamentous Fungi，Blackie Academic andProfessional，Chapman and Hall，London；Berges和Barreau(1991)Curr.Genet.19：359-365；以及van Hartingsveldt等人，(1987)Mol.Gen.Genet.206：71-75)。在典型的实施方案中，选择性标记是amdS基因，其编码乙酰胺酶，允许转化的细胞以乙酰胺为氮源生长。使用构巢曲霉amdS基因作为选择性标记的应用描述在Kelley等人，(1985)EMBO J.4：475-479和等人，(1987)Gene 61：155-164中。

连接包含编码变体葡糖淀粉酶的核酸序列的DNA构建体、启动子、终止子和其它序列，并将它们插入合适的载体所使用的方法是本领域普遍已知的。一般通过在合适的限制性酶切位点实现连接。如果不存在此类位点，则根据常规实践使用合成的寡核苷酸接头。(参见Sambrook(1989)如上，和Bennett和Lasure，More Gene Manipulations in Fungi，Academic Press，San Diego(1991)第70-76页)。此外，可以利用已知的重组技术构建载体(例如：英杰生命技术公司(Invitrogen Life Technologies)，Gateway技术)。

10、宿主细胞

本公开文本还涉及包含编码本发明的变体葡糖淀粉酶的多核苷酸的宿主细胞，其用于生产本发明的葡糖淀粉酶。在一些实施方案中，宿主细胞选自细菌、真菌、植物和酵母细胞。术语宿主细胞既包括细胞，细胞的后代，以及从细胞产生的原生质体，它们用于生产根据本发明的变体葡糖淀粉酶。

在一些实施方案中，宿主细胞是真菌细胞，通常是丝状真菌宿主细胞。术语“丝状真菌”指真菌亚门的所有丝状体(参见：Alexopoulos，C.J.(1962)，Introductory Mycology，Wiley，New York)。这类真菌的特征是营养菌丝体具有包含壳多糖、纤维素和其它复杂多糖的细胞壁。本公开文本的丝状真菌与酵母是在形态学上、生理学上和遗传学上不同的。丝状真菌的营养生长是通过菌丝伸长，碳分解代谢是专性需氧的。在本公开文本中，丝状真菌亲本细胞可以是但不限于以下种的细胞：木霉属(例如：里氏木霉，红褐肉座菌(Hypocrea jecorina)的无性型，原分类为长梗木霉；绿色木霉(Trichoderma viride)；康宁木霉(Trichoderma koningii)；哈茨木霉(Trichoderma harzianum)(Sheir-Neirs等人，(1984)Appl.Microbiol.Bioteehnol 20：46-53；ATCC No.56765和ATCC NO.26921)；青霉属物种；腐质霉属物种(例如：特异腐质霉，面包腐质霉(H.lanuginosa)和灰腐质霉)；金小孢子菌属(Chrysosporium)物种(例如：C.lucknowense)；粘帚霉属(Gliocladium)物种；曲霉属物种(例如：米曲霉、黑曲霉、酱油曲霉(A sojae)、日本曲霉(A.japonicus)、构巢曲霉和泡盛曲霉)(Ward等人，(1993)Appl.Microbiol.Biotechnol.39：738-743和Goedegebuur等人，(2002)Genet 41：89-98)：镰孢属物种(Fusarium sp.)(例如：粉红镰孢、禾赤镰孢(F.graminum)、F.cerealis、尖镰孢(F.oxysporuim)和腹状镰孢(F.venenatum))；脉孢属物种(粗糙脉孢菌(N.crassa))；肉座菌属(Hypocrea)物种；毛霉属(Mucor)物种(米黑毛霉(M.miehei))；根霉属物种和裸孢壳属(Emericella)物种(还参见：Innis等人，(1985)Sci.228：21-26)。术语“木霉”或“木霉属”或“木霉菌”都指原来或现在分类为木霉属的任何真菌属。

在一些实施方案中，宿主细胞是革兰氏阳性菌细胞。非限制性实例包括链霉菌属(例如：浅青紫链霉菌(S.lividans)、天蓝色链霉菌(S.coelicolor)和灰色链霉菌(S.griseus))和芽孢杆菌属的菌。如本文中使用的，“芽孢杆菌属”包括本领域技术人员已知的在“芽孢杆菌”属中的所有种，包括但不限于枯草芽孢杆菌(B.subtilis)、地衣芽孢杆菌(B.licheniformis)、迟缓芽孢杆菌(B.lentus)、短芽孢杆菌(B.brevis)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、嗜碱芽孢杆菌(B.alkalophilus)、解淀粉芽孢杆菌(B.amyloliquefaciens)、克劳氏芽孢杆菌(B.clausii)、耐盐芽孢杆菌(B.halodurans)、巨大芽孢杆菌(B.megaterium)、凝结芽孢杆菌(B.coagulans)、环状芽孢杆菌(B.circulans)、灿烂芽孢杆菌(B.lautus)和苏云金芽孢杆菌(B.thuringiensis)。认识到芽孢杆菌属不断进行着分类重构。因此，意味着属包括已经重分类的种，包括但不限于如嗜热脂肪芽孢杆菌一类的生物，其现在命名为“嗜热脂肪土芽孢杆菌(Geobacillusstearothermophilus)”。

在一些实施方案中，宿主细胞是革兰氏阴性菌株，例如大肠杆菌或假单胞菌属物种(Pseudomonas sp.)。在其它实施方案中，宿主细胞可以是酵母细胞，例如酵母属物种(Saccharomyces sp.)、裂殖酵母属物种(Schizosaccharomyces sp.)、毕赤酵母属物种(Pichia sp.)或假丝酵母属物种(Candida sp.)。

在其它实施方案中，宿主细胞是遗传改造的宿主细胞，其中天然的基因已经失活，例如在细菌或真菌细胞内通过缺失。当希望获得具有一个或多个失活基因的真菌宿主细胞时，可使用已知的方法(例如：在美国专利5,246,853，美国专利5,475,101和WO 92/06209中描述的方法)。通过完全或部分缺失，插入失活或任何其它导致基因对于其意图的目的无功能的方法，都可以实现基因失活(使基因不能表达功能性蛋白质)。在一些实施方案中，当宿主细胞是木霉属细胞，特别是里氏木霉宿主细胞时，cbh1、cbh2、egl1和egl2基因将被失活和/或通常被缺失。典型的，里氏木霉宿主细胞具有四删除的蛋白质，提出并描述在美国专利5,847,276和WO05/001036中。在其它实施方案中，宿主细胞是蛋白酶缺陷的，或蛋白酶减小的菌株。

11、宿主细胞转化

将DNA构建体或载体引入宿主细胞内包括以下技术，例如：转化；电穿孔；核显微注射；转导；转染(例如：脂质体介导和DEAE-Dextrin介导的转染)；用磷酸钙DNA沉淀孵育；用DNA-包被的微粒高速轰击；和原生质体融合。常规的转化技术是本领域已知的(参见例如：Ausubel等人，(1987)，如上，第9章；和Sambrook(1989)如上和Campbell等人，(1989)Curr.Genet.16：53-56)。

多个文献都公开了用于芽孢杆菌的转化方法，包括Anagnostopoulos C和J.Spizizen(1961)J.Bacteriol.81：741-746，以及WO 02/14490。

用于曲霉属的转化方法描述在Yelton等人，(1984)Proc.Natl.Acad.Sci.USA 81：1470-1474；Berka等人，(1991)，在Applications of EnzymeBiotechnology，Kelly和Baldwin编著，Plenum Press(NY)；Cao等人，(2000)Science 9：991-1001；Campbell等人，(1989)Curr.Genet.16：53-56和EP 238023中。在木霉属表达异源蛋白描述在美国专利6,022,725；美国专利6,268,328；Harkki等人，(1991)；Enzyme Microb.Technol.13：227-233；Harkki等人，(1989)Bio Technol.7：596-603；EP 244,234；EP 215,594；和 Nevalainen等人，“The Molecular Biology of Trichoderma and itsApplication to the Expression of Both Homologous and Heterologous Genes”，M_OLECULAR I_NDUSTRIAL M_YCOLOGY，Leong和Berka编著，Marcel DekkerInc.，NY(1992)第129-148页。还可参考W096/00787和Bajar等人，(1991)Proc.Natl.Acad.Sci.USA 88：8202-8212用于镰孢属菌株转化。

在一个特定的实施方案中，制备用于转化的木霉属物种涉及从真菌菌丝体制备原生质体(参见：Campbell等人，(1989)Curr.Genet.16：53-56；Pentilla等人，(1987)Gene 61：155-164)。根癌农杆菌(Agrobacteriumtumefaciens)介导的丝状真菌转化是已知的(参见：de Groot等人，(1998)Nat.Biotechnol.16：839-842)。还可参考美国专利6,022,725和美国专利6,268,328的使用丝状真菌宿主的转化方法。

典型的，使用载体系统构建基因稳定的转化体，由此编码变体葡糖淀粉酶的核酸稳定整合到宿主菌株染色体中。然后利用已知技术纯化转化体。

在其它一些实施方案中，宿主细胞是植物细胞，例如来自单子叶植物的细胞(例如：玉米、小麦和高粱)，或来自双子叶植物的细胞(例如：大豆)。生产用于转化植物的DNA构建体的方法，和转化植物的方法是已知的。一些这类方法包括根癌农杆菌介导的基因转移；微粒轰击；PEG介导的原生质体转化；电穿孔等。参考美国专利6,803,499，美国专利6,777,589；Fromm等人(1990)Biotechnol.8：833-839；Potrykus等人，(1985)Mol.Gen.Genet.199：169-177。

12、蛋白质的生产

本公开文本还涉及生产变体葡糖淀粉酶的方法，包括用含有编码本发明的变体葡糖淀粉酶的多核苷酸的表达载体转化宿主细胞，任选的在适合生产变体葡糖淀粉酶的条件下培养宿主细胞，和任选的回收葡糖淀粉酶。

在本公开文本的表达和生产方法中，在合适条件下培养宿主细胞，在摇瓶培养，实验室或工业发酵罐的小规模或大规模发酵(包括连续发酵，批次发酵和补料分批发酵)，其中使用含有生理盐和营养物的合适培养基 (参见例如：Pourquie，J.等人，B_{IOCHEMISTRY AND} G_ENETICS OFC_ELLULOSE D_EGRADATION，Aubert编辑，J.P.等人，Academic Press，第71-86页，1988和Ilmen，M.等人，(1997)Appl.Environ.Microbiol.63：1298-1306)。本公开文本可使用常规商业制备的培养基(例如：酵母麦芽提取物(YM)培养基、Luria Bertani(LB)培养基和沙氏葡萄糖(SD)培养基)。用于细菌和丝状真菌细胞的典型培养条件是本领域已知的，可以从科技文献和/或真菌来源处获得，例如美国典型培养物保藏中心(AmericanType culture Collection)和真菌品种中心(Fungal Genetics Stock Center)。当葡糖淀粉酶编码序列处于可诱导的启动子控制下时，将诱导剂(例如糖、金属盐或抗微生物剂)以有效诱导葡糖淀粉酶表达的浓度添加到培养基中。

在一些实施方案中，本公开文本涉及生产变体葡糖淀粉酶的方法，包括在适合生产变体的条件下，培养含有编码本发明的变体葡糖淀粉酶的多核苷酸的植物或植物细胞，和任选的回收葡糖淀粉酶。

在一些实施方案中，为了评估已经用编码本发明涵盖的变体葡糖淀粉酶的多核苷酸转化的细胞系对变体葡糖淀粉酶的表达，在蛋白质水平、RNA水平进行测定，和/或使用特别针对葡糖淀粉酶活性和/或生产的功能性生物测定。一些这类测定包括Northern印迹、斑点印迹(DNA或RNA分析)、RT-PCR(逆转录酶聚合酶链式反应)，或利用合适的标记探针(基于核酸编码序列)的原位杂交，和常规的Southern印迹和放射自显影。

此外，可以直接测量样品中的变体葡糖淀粉酶的生产和/或表达，例如通过在培养基中直接测量还原糖例如葡萄糖的测定，和通过测量葡糖淀粉酶活性、表达和/或生产的测定。特别的，可以通过3，5-二硝基水杨酸(DNS)方法(参见：Goto等人，(1994)Biosci.Biotechnol.Biochem.58：49-54)测定葡糖淀粉酶活性。在其它实施方案中，通过免疫学方法评估蛋白质表达，例如细胞的免疫组织化学染色，组织切片或组织培养基的免疫测定(例如：通过Western印迹或ELISA)。此类免疫测定可用于定性和定量地评估葡糖淀粉酶的表达。此类方法的细节是本领域技术人员已知的，许多用于实践此类方法的试剂也是可商购的。

本发明的葡糖淀粉酶可以从培养基中通过本领域已知的多种方法回收或纯化，包括离心、过滤、提取、沉淀等。

13、组合物：

变体葡糖淀粉酶可以用于酶组合物中，所述酶组合物包括但不限于淀粉水解和糖化组合物，清洁和去污组合物(例如：衣物去污剂、碗碟洗涤去污剂，和硬表面清洁组合物)，醇发酵组合物，和动物饲料组合物。进一步的，变体葡糖淀粉酶可用于烘烤用途，例如面包和蛋糕生产、酿造、健康护理、纺织品、环境废弃物转化过程、生物浆处理，和生物质转化应用。

在一些实施方案中，酶组合物包括本发明涵盖的变体葡糖淀粉酶，其自培养基获得或从培养基中回收和纯化，所述酶组合物任选的与任一种或组合的下列酶联合使用：α淀粉酶、蛋白酶、支链淀粉酶、异淀粉酶、纤维素酶、半纤维素酶、木聚糖酶、环糊精葡糖转移酶(cyclodextringlycotransferase)、脂肪酶、植酸酶、漆酶、氧化酶、酯酶、角质酶(cutinase)、木聚糖酶、粒状淀粉水解酶和其它葡糖淀粉酶。在一个实施方案中，蛋白酶是酸性真菌蛋白酶(AFP)。在另一个实施方案中，酸性真菌蛋白酶是来自木霉属(例如：NSP-24，还参见US 2006/0154353，公开于2006年7月13日，通过整体引入本文作为参考)。在另一个实施方案中，植酸酶来自Buttiauxiella物种(例如：BP-17，还参见PCT专利公开WO 2006/043178中公开的变体)。

在一些典型的组合物中，公开文本的变体葡糖淀粉酶与α淀粉酶组合，例如真菌α淀粉酶(例如：曲霉属)或细菌α淀粉酶(例如：芽孢杆菌属物种如嗜热脂肪芽孢杆菌、解淀粉芽孢杆菌和地衣芽孢杆菌)，及其变体和杂合体。在一个实施方案中，α淀粉酶是酸稳定的α淀粉酶。在一个实施方案中，α淀粉酶是颗粒淀粉水解酶(GSHE)。在一个实施方案中，α淀粉酶是Aspergillus kawachi的α淀粉酶(AKAA)，参见US 7,037,704。考虑用于本发明的组合物的可商购的α淀粉酶是已知的，包括GZYME G997、SPEZYME FRED、SPEZYME XTRA、STARGEN(美国丹尼斯克有限公司杰能科子公司(Danisco US、lnc、Genencor Division))、TERMAMYL 120-L和SUPRA(诺和酶生物技术公司(Novozymes，Biotech.))和VIRIDIUM(Diversa)。

在其它实施方案中，公开文本的变体葡糖淀粉酶可以与其它葡糖淀粉酶组合。在一些实施方案中，公开文本的葡糖淀粉酶与一种或多种来自曲霉属菌株(例如米曲霉、黑曲霉、A.kawachi和泡盛曲霉)的葡糖淀粉酶；来自腐质霉属菌株(特别是灰腐质霉)的葡糖淀粉酶或其变体，例如与WO05/052148中公开的SEQ ID NO：3具有至少90％、93％、95％、96％、97％、98％和99％序列同一性的葡糖淀粉酶；来自踝节菌属菌株的葡糖淀粉酶或其变体，特别是埃默森踝节菌(T.emersonii)的葡糖淀粉酶；来自阿太菌属(Athelia)菌株，特别是罗氏阿太菌(A.rolfsii)的葡糖淀粉酶；来自青霉属菌株，特别是产黄青霉的葡糖淀粉酶进行组合。

14、用途

特别的，变体葡糖淀粉酶可用于淀粉转化过程，特别是生产用于果糖浆液的葡萄糖、特制糖，以及从包含淀粉的底物发酵中来生产醇和其它终产物(例如有机酸、抗坏血酸和氨基酸)中(G.M.A van Beynum等人编著，(1985)S_TARCH C_ONVERSION T_ECHNOLOGY，Marcel Dekker Inc.NY)。利用本发明的变体葡糖淀粉酶组合物生产的糊精可以获得至少80％、至少85％、至少90％和至少95％的葡萄糖产量。利用本发明涵盖的葡糖淀粉酶从淀粉底物发酵中生产醇可以包括燃料用醇或可饮用醇的生产。在一些实施方案中，当使用变体葡糖淀粉酶时，与亲本葡糖淀粉酶在相同条件下，醇产量较大。在一些实施方案中，醇产量比亲本葡糖淀粉酶多约0.5％和2.5％之间，包括但不限于，比亲本葡糖淀粉酶多0.6％、0.7％、0.8％、0.9％、1.0％、1.1％、1.2％、1.3％、1.4％、1.5％、1.6％、1.7％、1.8％、1.9％、2.0％、2.1％、2.2％、2.3％和2.4％。

在一个典型的实施方案中，本公开文本的变体葡糖淀粉酶可用于从多种基于植物的底物中水解淀粉，其用于醇生产。在一些实施方案中，基于植物的底物包括玉米、小麦、大麦、黑麦、高粱、稻、甘蔗、马铃薯及其组合。在一些实施方案中，基于植物的底物可以是分级分离的植物原料，例如谷类如玉米，其被分级分离为例如纤维，胚芽，蛋白质和淀粉(胚乳)成分(美国专利6,254,914和美国专利6,899,910)。醇发酵的方法描述在T_HEA_LCOHOL T_EXTBOOK，A R_EFERENCE F_OR T_HE B_EVERAGE，F_UEL ANDI_NDUSTRIAL A_LCOHOL I_NDUSTRIES，第3版，K.A.Jacques等人编著，1999，Nottingham University Press，UK中。在一些实施方案中，醇可以是乙醇。特别的，醇发酵生产过程的特征是湿磨或干磨法。在一些实施方案中，变体葡糖淀粉酶可用于湿磨法发酵过程，在其它实施方案中，变体葡糖淀粉酶可用于干磨法。

谷粒干磨涉及多个基本步骤，一般包括：研磨、蒸煮、液化、糖化、发酵和固液分离来生产醇和其它副产品。植物材料，特别是全谷粒，例如玉米、小麦或黑麦是是被研磨的。在一些情况下，谷类可以先被分级分离组分部分。研磨的植物原料可以被碾碎以获得粗制的或精细的颗粒。研磨的植物原料与液体(例如，水和/或酒槽水)在浆料槽中混合。浆体在喷射蒸煮器中接受高温(例如90℃到105℃或更高)和液化酶(例如，α淀粉酶)以溶解和水解谷物中的淀粉为糊精。混合物被冷却，进一步地，用糖化酶，例如包含在本发明中的葡糖淀粉酶处理，以产生葡萄糖。含有葡萄糖的醪液于是在发酵微生物，例如生产醇的微生物，尤其是酵母(酿酒酵母属)存在条件下，发酵约24到120小时。从液相中分离醪液中的固体，获得醇例如乙醇和有用的副产品，例如酒糟。

在一些实施方案中，将糖化步骤和发酵步骤组合，该过程被称为同时糖化和发酵或同时糖化、酵母增殖和发酵。

在其它实施方案中，在淀粉水解的过程中使用变体葡糖淀粉酶，其中，所述过程的温度是在30℃和75℃之间的温度下进行，以及在40℃和65℃之间的温度下进行，其中pH范围在pH3.0和pH6.5之间。一些实施方案中的发酵过程包括碾磨谷物或分级分离谷物和混合碾磨的谷物和液体以形成浆体，所述浆体接着在单独容器中与根据本发明的变体葡糖淀粉酶以及任选地，其它酶例如，但不限于，α淀粉酶、其它的葡糖淀粉酶、植酸酶、蛋白酶、支链淀粉酶、异淀粉酶或其它具有颗粒淀粉水解活性的酶和酵母混合，以产生乙醇和其它的副产品(美国专利4,514,496，WO 04/081193和WO 04/080923)。

在一些实施方案中，发明涉及糖化液体淀粉溶液的方法，包括利用本发明的变体葡糖淀粉酶的酶促糖化步骤。

本公开文本还提供包含至少一种本公开文本涵盖的变体葡糖淀粉酶的动物饲料。2002年12月13日提交的WO 03/049550(通过完整并入本文作为参考)中，提供了在生产包含淀粉的饲料中利用葡糖淀粉酶的方法。简而言之，葡糖淀粉酶变体与包含淀粉的饲料混合。葡糖淀粉酶能够降解抗性淀粉供动物使用。

本发明的其它目标和优势根据本说明书是显而易见的。

实施例

提供下列实施例是为了证实并进一步示例一些典型的实施方案以及本公开文本的一些方面，并非视为限制本发明的范围。

在下列公开内容和实验部分，使用以下缩写：GA(葡糖淀粉酶)；GAU(葡糖淀粉酶单元)；wt％(重量百分比)；℃(摄氏度)；rpm(每分钟转数)；H₂O(水)；dH₂O(去离子水)；dIH₂O(去离子水，Milli-Q过滤)；aa或AA(氨基酸)；bp(碱基对)；kb(千碱基对)；kD(千道尔顿)；g或gm(克)；μg(微克)；mg(毫克)；μL(微升)；ml和mL(毫升)；mm(毫米)；μm(微米)；M(摩尔)；mM(毫摩尔)；μM(微摩尔)；U(单位)；V(伏特)；MW(分子量)；sec(s)或s(s)(秒)；min(s)或m(s)(分钟)；hr(s)或h(s)(小时)；DO(溶解氧)；ABS(吸光度)；EtOH(乙醇)；PSS(生理盐溶液)；m/v(质量/体积)；和MTP(微量滴定板)；N(正常)；DPI(单糖)；DP2(二糖)；DP＞3(寡糖，具有聚合度大于3的糖)；ppm(百万分之一)。

下文描述了用于提供变体的方法。然而，应该注意到可以使用不同的方法提供亲本分子的变体，发明不限于实施例中使用的方法。意指可以使用任何适合产生变体和选择变体的方式。

96孔微量滴定板的pNPG葡糖淀粉酶活性测定：

试剂溶液是：NaAc缓冲液：200mM乙酸钠缓冲液，pH4.5；底物：在NaAc缓冲液中(0.3g/20m1)的50mM对硝基苯-α-D-吡喃葡萄糖苷(SigmaN-1377)，和终止溶液：800mM甘氨酸-NaOH缓冲液，pH10。在新96孔平底MTP中置入30μl过滤的上清液。每个孔加入50μl NaAc缓冲液和120μl底物，在50℃孵育30分钟(Thermolab系统iEMS培养箱/摇床HT)。通过加入100μl终止溶液结束反应。在MTP读板器(Molecular DevicesSpectramax 384 plus)中，测量405nm吸光度，利用0.011μM/cm的摩尔消光系数计算活性。

热稳定性测定：

将粗制上清液(100μl)加入到100μl 150mM NaAc缓冲液(pH4.5)中。将样品等分至2个MTP。一个MTP(初始板)在4℃孵育1小时，另一MTP(剩余板)在60℃孵育(Thermolab系统iEMS培养箱/摇床HT)1小时。剩余板在冰上冷却15分钟。利用下文描述的乙醇应用测定法测量两种平板的活性，具有下列改变：取作热稳定性测定的样品量是25μl，30mM NaAc缓冲液(pH4.0)的量是35μl。

如下计算热稳定性为残余活性百分比：

在生长期后，就培养基中的剩余葡萄糖测试粗制上清液材料。如果发现剩余葡萄糖，就从初始活性和剩余活性的测量的吸光度值中减去该吸光度值。

在96孔微量滴定板用Bradford测定定量蛋白质：

试剂溶液是Bradford Quickstart工作溶液(BioRad cat#500-0205)。在新的96孔平底板中置入100μl的10kD-过滤的上清液。在每个孔中加入200μl试剂，在室温孵育5分钟。在MTP读板器(Molecular DevicesSpectramax 384 plus)中，测量595nm吸光度。根据牛血清白蛋白(BSA)(0-50μg/m1)标准曲线计算蛋白质浓度。

己糖激酶活性测定：

己糖激酶混合物：在使用前10-15分钟，向BoatIL容器葡萄糖HK R1(IL检测葡萄糖(HK)试剂盒，Instrument Laboratory#182507-40)中加入90ml水，轻柔混合。将85μl己糖激酶混合物加入到100μl的dH₂O中。混合物中加入15μl样品，在黑暗室温下孵育5分钟。在MTP读板器中，读出340nm处的吸光度。根据葡萄糖(0-1mg/m1)标准曲线计算葡萄糖浓度。

乙醇应用测定条件：

为了制备8％储液：将8g可溶性玉米淀粉(Sigma#S4180)在室温下悬浮于40ml dH₂O中。在250ml的烧瓶中向浆液中加入50ml煮沸的dH₂O，煮5分钟。将淀粉溶液冷却至25℃，用dH₂O调节体积至100ml。通过用100mMpH3.7的乙酸钠缓冲液稀释储液(1∶1)，来制备4％(m/v)可溶性淀粉工作溶液。

对于筛选测定，在平底的96孔MTP中，用175μl的50mM NaAc缓冲液pH4.5稀释5μl粗制上清液。向120μl 4％可溶性玉米淀粉中加入60μl该稀释液，并在32℃ 900rpm(Thermolab系统iEMS培养箱/摇床HT)孵育2小时。加入90μl 4℃-冷却的终止溶液(800mM甘氨酸-NaOH缓冲液，pH10.0)来终止反应。样品置于冰上。在15℃，1118×g旋转沉降淀粉5分钟(SIGMA 6K15)，在上述己糖激酶活性测定中使用15μl上清液，来确定葡萄糖含量。

在生长期后，就培养基中的剩余葡萄糖测试粗制上清液材料。如果发现剩余葡萄糖，不计算由葡糖淀粉酶产生的葡萄糖的量。

增甜剂应用测定条件：

为了制备8％储液：将8g可溶性玉米淀粉(Sigma#S4180)在室温下悬浮于40ml水中。在250ml的烧瓶中向浆液中加入50ml煮沸的dH₂O，煮5分钟。将淀粉溶液冷却至25℃，用dH₂O调节体积至100ml。通过用100mMpH4.5的乙酸钠缓冲液1∶1稀释储液，来制备4％(m/v)可溶性淀粉工作溶液。

在新的96孔平底板中放置50微升80mM NaAc缓冲液(pH4.5)。每个孔加入120μl 4％可溶性玉米淀粉和5μl 10kD-过滤的上清液，在60℃孵育1小时。加入90μl 4℃冷却的终止溶液(800mM甘氨酸-NaOH缓冲液，pH10.0)来终止反应。样品置于冰上30分钟。在15℃，716rpm下旋转沉降淀粉5分钟(Sigma 6K15，离心)，在上述己糖激酶活性测定中使用15μl上清液，来确定葡萄糖含量。

实施例1

pREP3Y-TrGA载体的构建

TrGA表达盒包括编码TrGA信号肽，前序列和成熟蛋白质的DNA序列(SEQ ID NO：4)，所述成熟蛋白质包括催化结构域、接头区域和淀粉结合结构域，将所述表达盒克隆到pDONR^TM201中，它是Gateway

进入(Entry)载体(英杰生命科学公司(Invitrogen)，Carlsbad，CA，USA)。通过Gateway

LR重组反应将TrGA表达盒克隆到Gateway相容性目标载体pREP3Y-DEST(图3)中。

pRep3Y-TrGA表达载体(图3B)使TrGA蛋白质(SEQ ID NO：2)能够在粟酒裂殖酵母(Schizosaccharomyces pombe)中表达。

利用pDONR-TrGA进入载体(图2)作为模板，和表2中列举的引物，构建65个TrGA位点饱和诱变(SSM)文库。在实验中使用的诱变引物在下述位置均包含三联体DNA序列密码子NNS(N＝A、C、T、G和S＝C或G)，苷酸所述位置对应于TrGA序列(SEQ ID NO：2)中要被突变的密码子，并且该位置允许随机掺入核苷酸。每个SSM文库的构建都始于两步PCR扩增，所述PCR扩增利用Gateway正向引物(pDONR201-FW)和特异的反向诱变引物(表3)，和Gateway反向引物(pDONR201-RV)和特异的正向诱变引物(表2)(诱变引物的等价位置)。根据法恩酶公司(Finnzymes)提供的方案，PCR扩增反应(0.2μM引物，25个循环)使用Phusion高保真DNA聚合酶(法恩酶公司(Finnzymes OY)，Espoo，Finland)。简而言之，在48μl新鲜的PCR反应溶液中，加入lμl(SEQ ID NO：1)都靶向相同密码子的两种特异PCR混合物的DNA片段，以及引物Gatewav Fw和GatewayRV(英杰生命科学公司(Invitrogen))并混合。该融合PCR扩增(22个循环)获得具有特异的随机突变的TrGA密码子，以及两端具有独特的Gateway重组位点的线性表达盒DNA片段。该DNA片段的纯化(ChargeSwitch PCR提纯，英杰生命科学公司(Invitrogen)，CarlsbadUSA)，和与pDONR201(英杰生命科学公司(Invitrogen))的BP重组反应(英杰生命科学公司(Invitrogen)，Carlsbad，USA)，产生了环状的多聚DNA(进入载体)，其随后被转化至大肠杆菌Max efficiency DH5α(英杰生命科学公司(Invitrogen))，并放置于补充了50μg/mL卡那霉素的2xTY培养基中[Bacto胰蛋白胨(Difco)16g/L，Bacto酵母提取物(Difco)10g/L，NaCL 5g/L]。

表2.用于产生TrGA SSM文库的正向引物

[0358]

表3：用于产生TrGA SSM文库的引物

对于每个文库，在37℃孵育过夜后，将克隆重悬在PSS中合并菌落。从合并的大肠杆菌转化体中，利用标准技术分离总质粒(强基因公司 (Qiagen))。简而言之，将1μl粒溶液加入到1μl的pRep3Y目标载体(图1A)溶液中，并根据英杰生命科学公司(Invitrogen)提供的方案，加入LR CLONASE^TM II酶混合物。产生了环状多聚DNA，如供应商所述将其转化到大肠杆菌Max EfficiencyDH5α中。

在37℃孵育过夜后，从具有100μg/ml青霉素的2xTY琼脂平板上挑取每个文库96个单个菌落，并在MTP中37℃生长24小时，所述MTP含有具100μg/ml青霉素的200μL 2xTY培养基。培养物用于序列分析(BaseClearB.V.，Leiden，Netherlands)。

文库数从1至65不等，具有额外的涉及随机突变的TrGA序列的密码子。在选择后，每个文库都包含最多19个TrGA变体。根据生产商的指导(Zymo Research，Orange CA.USA)将这些变体单独转移到粟酒裂殖酵母中。

将粟酒裂殖酵母转化体放置在选择培养基(EMM琼脂，Qbiogene，Irvine，USA目录号4110-232)上，在28℃孵育4天。通过在EMM琼脂上划线分离菌落，从转化平板上纯化转化体。

实施例2

生长条件和样品预处理的描述

将粟酒裂殖酵母转化体接种在含有选择培养基(2xEMM-C)的96孔微量滴定板(MTP)中[64.4g/L EMM培养基(Qbiogene目录号4110-032)，0.62g/L完全补充混合物(Complete Supplement Mixture)(CSM-HIS-LEU-TRP，Qbiogene，目录号4530-122)]，在28℃孵育过夜。从孵育过夜的微量滴定板中，将200μl生长的粟酒裂殖酵母培养物接种在100ml摇瓶中的20ml的2xEMM-C液体培养基中，在26℃在Multitron振荡孵育器(Infors AG，Bottmingen，Switzerland)中280rpm下孵育4天。从生长培养物中取样2ml的粟酒裂殖酵母培养物，在14,000rpm(Sigma)离心5分钟。将上清液转移至10 kD Vivaspin 500 HT过滤装置中(VivaScience AG，Hannover，Germany)，在1000g离心25分钟。将存留物用补充了0.015％ Tween-80的50mM NaAc pH4.5稀释至初始体积。该溶液用于不同的测定。

实施例3

4种TrGA变体的组合文库的构建

(A)进行实验构建携带下列单位点突变组合的TrGA变体：Q172F；Q208N；S211R和V314H。变体的概述显示如下：

a)Q172F；Q208N

b)Q172F；S211R

c)Q172F；V314H

d)Q208N；S211R

e)Q208N V314H

f)S211R；V314H

g)Q172F；Q208N；S211R

h)Q172F；Q208N；V314H

i)Q172F；S211R；V314H

j)Q208N；S211R；V314H

k)Q172F；Q208N；S211R；V314H

使用Quikchange

多位点定向诱变(QCMS)试剂盒(Stratagene)构建文库。用于创建文库的5’磷酸化引物显示在表4中。通过使用HPLC、PAGE或任何其它类型的纯化引物(Invitrogen)，可以获得全长引物掺入以及引物导致错误显著降低的最佳结果。

表4：用于构建选定的组合变体的引物

利用Stratagene的QCMS试剂盒，使用模板质粒pDONR-TrGA(图2)构建组合文库。根据供应商描述，用反应中使用的改良的引物浓度，构建文库。特别地，将4μl pDONR-TrGA(25-50ng)与11μl无菌蒸馏水、1.5μl的dNTP、2.5μl的10×QCMS-缓冲液、1μl酶混合物和1μl各种突变引物混合物(在每种反应中提供总共100ng的引物)混合。PCR条件是在MJResearch热循环仪中，使用薄壁的0.2ml PCR管，在95℃下1分钟，然后进行30个循环的在95℃下1分钟、55℃下1分钟和65℃下6分钟。用来自QCMS试剂盒的1μl的Dpn1在37℃孵育过夜，消化反应产物。使用PCR纯化试剂盒(Qiagen)进行样品纯化，并在37℃用Dpnl(Stratagene)进行1小时的第二轮消化。

将反应混合物转化到大肠杆菌Max efficiency DH5α(Invitrogen)中，并在选择性琼脂(补充了50μg卡那霉素/mL的2xTY)上铺板。在37℃孵育过夜后，挑取96个单个菌落进行序列分析(BaseClear B.V.，Leiden，Netherlands)。克隆组合变体，并如下述和WO06/060062所述，在里氏木霉宿主菌株中表达。

(B)还通过Geneart公司(Regensburg，Germany)合成生产了其它6个组合文库(表5)，测试热稳定性，以及在如本文所述的乙醇和增甜剂应用测定中测试。

表5：重组文库

实施例4

具有改善的热稳定性的变体

在所述条件下的亲本TrGA分子具有在15和44％之间的残留活性(日常变动)。基于同一批次的TrGA热稳定性计算性能指数。性能指数是商值PI＝(变体残留活性)/(TrGA残留活性)。性能指数＞1表示改善的稳定性。具有热稳定性的性能指数大于1.0的变体显示在下表6中。

表6：热稳定性筛选

实施例5

来自乙醇筛选测定的高性能变体

在乙醇筛选测定中利用上述测定来测试变体。表7显示了对与亲本 TrGA PI相比，具有性能指数(PI)＞1.0的变体进行筛选测定的结果。PI是比活性(活性/mg酶)的测量值。比活性的PI是“变体比活性/WT比活性”的商值。比活性的PI是1.0，并且具有PI＞1.0的变体具有大于亲本TrGA的比活性。比活性是乙醇筛选测定测量的活性除以上述Bradford测定获得的结果。

表7：乙醇筛选

实施例6

来自增甜剂筛选测定的高性能变体

在如上所述的增甜剂筛选测定中测试变体。表8显示了筛选测定的结果，其中显示了与亲本TrGA PI相比，具有性能指数(PI)＞1.00的变体。PI是比活性(活性/mg酶)的测量值。比活性的PI是“变体比活性/WT比活性”的商值。比活性的PI是1.0，并且具有PI＞1.0的变体具有大于亲本TrGA的比活性。

表8：增甜剂筛选

实施例7

载体构建和转化里氏木霉宿主细胞

A.含有编码变体GA的多核苷酸的表达载体的构建

将包含SEQ ID NO：4的DNA序列的TrGA表达盒克隆到pDONR^TM 201中，其是Gateway

进入载体(Invitrogen，Carlsbad，CA)。通过Gateway

LR重组反应，将TrGA表达盒克隆到Gateway相容性目标载体 pTrex3g-DEST(图5)中，其公开于WO 06/060062中。pTrex3g-TrGA表达载体(图5)使得在里氏木霉宿主中能够表达TrGA蛋白质(SEQ IDNO：2)。构建载体，其包括编码至少下列变体的修饰的TrGA cDNA：(1)V314H；(2)S211R；(3)Q208N和(4)Q172F。

B.转化

使用粒子轰击，通过PDS-1000/Helium系统(BioRad目录号165-02257)，将含有变体GA的表达载体转化到来自RL-P37(IA52)并且具有多种基因缺失(Δcbh1，Δcbh2，Δegl1，Δegl2)的里氏木霉宿主菌株中。方案概述如下，还参考WO 05/001036的实施例6和11。

制备来自里氏木霉菌株的孢子悬液(约5x10⁸孢子/m1)。将100至200微升的孢子悬液涂布在基本培养基(MM)乙酰胺培养基的平板中央。MM乙酰胺培养基具有下列组成：0.6g/L乙酰胺；1.68g/L CsCl；20g/L葡萄糖；20g/L KH₂PO₄；0.6g/L CaCl₂·2H₂O；1ml/L 1000X痕量元素溶液；20g/L琼脂；和pH5.5；1ml/L 400X痕量元素盐溶液：柠檬酸175g/L，FeSO₄·7H₂O200g/L，ZnSO₄·7H₂O 16g/L，CuSO₄·5H₂O 3.2g/L，MnSO₄·H₂O 1.4g/L，H₃BO₃ 0.8g/L。使孢子悬液在MM乙酰胺培养基的表面干燥。

按生产商的说明进行转化。简而言之，将60mg的M10钨颗粒置于微离心管中。加入1mL乙醇，静置15分钟。颗粒在15,000rpm离心15秒。去除乙醇，在加入1mL的50％(v/v)无菌甘油前，用无菌dH₂O洗涤颗粒3次。将25μl钨微粒悬液置于微离心管中。当持续旋转时，加入下列成分：0.5-5μl(100-200ng/μl)质粒DNA，25μl的2.5M CaCl₂和10μl的0.1M亚精胺。颗粒离心3秒。去除上清液，用200μl的70％(v/v)乙醇洗涤颗粒，离心3秒。去除上清液，加入24μl 100％乙醇，吸液混合，将管置于超声波浴中，移去8μl颗粒的等分试样，将其放在干燥器中的巨载体盘中央。一旦钨/DNA悬液干燥，就将微载体盘与具有孢子的MM乙酰胺平板一起放于轰击室中，根据生产商的指导实施轰击过程。在用钨/DNA颗粒轰击平板孢子后，在28℃孵育平板。在4天后，将转化的茵落挑取到MM乙酰胺的新鲜平板上(

等人，(1987)Gene 61：155-164)。

C.证实在转化细胞中表达的变体TrGA的GA活性

在MM乙酰胺平板上生长5天后，将表现出稳定形态的转化体接种到含有30ml Proflo培养基的250ml摇瓶中。Proflo培养基含有：30g/L α-乳糖；6.5g/L (NH₄)₂SO₄；2g/L KH₂PO₄；0.3g/L MgSO₄·7H₂O；0.2g/LCaCl₂·2H₂O；1ml/L 400X痕量元素盐溶液：柠檬酸175g/L，FeSO₄·7H₂O200g/L，ZnSO₄·7H₂O 16g/L，CuSO₄·5H₂O 3.2g/L，MnSO₄·H₂O 1.4g/L，H₃BO₃ 0.8g/L；2ml/L 10％ Tween 80；22.5g/L ProFlo棉籽粉(Traders蛋白质公司，Memphis，TN)；0.72g/L CaCO₃。在28℃和140rpm下生长2天后，将10％的Proflo培养物转移到含有30ml乳糖确定成分培养基(LactoseDefined Media)的250ml摇瓶中。乳糖确定成分培养基的组成如下：5g/L(NH₄)₂SO₄；33g/L 1，4-哌嗪双(丙磺酸)缓冲液；9g/L酪蛋白氨基酸；4.5g/LKH₂PO₄；1.0g/L MgSO₄·7H₂O；5ml/L Mazu DF60-P消泡剂(MazurChemicals，IL)；1000X痕量元素溶液；pH5.5；在灭菌后向培养基加入40ml/L的40％(w/v)乳糖溶液。乳糖确定成分培养基摇瓶在28℃，140rpm下孵育4-5天。

将培养上清液的样品与含有还原剂的合适体积的2x上样缓冲液混合。通过离心去除菌丝体，分析上清液的总蛋白(BCA蛋白质测定试剂盒，Pierce公司目录号23225)。

使用pNPG作为底物(Sigma N-1377)，利用对硝基苯-α-D-吡喃葡萄糖苷(pNPG)测定测量GA活性。在该测定中，测量了葡糖淀粉酶催化对硝基苯-α-D-吡喃葡萄糖苷(pNPG)水解为葡萄糖和对硝基酚的能力。在碱性pH下，硝基酚形成黄色，这与葡糖淀粉酶活性成比例，在405nm下监测，并与测量为GAU的酶标比较(Elder，M.T.和Montgomery R.S.，Glucoamylase activity in industrial enzyme preparations usingcolorimetric enzymatic method，Journal 0f AOAC International，卷78(2)，1995)。一个GAU被定义为产生1gm还原糖的酶量，其是按照pH4.2和60℃每小时从可溶性淀粉底物产生的葡萄糖(4％ ds)而被计算的。

在NuPAGE

Novex 10％ Bis-Tris Gel上，使用MES SDS运行缓冲液 (Invitrogen，Carlsbad，CA，USA)，通过PAGE电泳确定蛋白质谱。

实施例8

选定变体对可溶性淀粉的小规模应用测试

表达单个变体a)V314H、b)S211R、c)Q172F和d)Q208N的里氏木霉宿主菌株，在34℃、pH3.5下，在补料分批的14L发酵罐中的营养培养基中生长，所述营养培养基包括葡萄糖(Cerelose DE99)，KH₂PO₄，MgSO₄·7H₂O，(NH₄)₂SO₄，CaCl₂·2H₂O，痕量元素和Mazu消泡剂(DF6000K)。在耗尽葡萄糖后，将生长温度和pH分别调至28℃和4.0。通过过滤去除细胞材料，收集培养上清液，浓缩至含有大于90％的葡糖淀粉酶(作为总蛋白)。

确定在pH4.3，32℃和60℃下，在可溶性马铃薯淀粉上葡萄糖生产的多种动力学性质，并与野生型TrGA比较。与野生型(TrGA)相比，四个变体的每一个都表现出增加的V_max(μM葡萄糖/秒)值，提示升高的催化速率(k_cat(sec^-1))。图6显示了每个测试温度下两个重复的V_max。

实施例9

确定变体EtOH生产性能的方法

利用新型小规模乙醇应用测试，对鉴定为比亲本TrGA具有更高性能指数的变体(参见表7/8)实施筛选的验证。选择自点评估(site evaluation)和组合文库(表9)的24个变体，将它们直接转化进里氏木霉中用于大规模表达和测试。利用差示扫描热量测定法(如下文描述的DSC分析)测试变体的热解折叠，利用新型的次级小规模乙醇应用测定来测试变体性能。方法包括两步：1)将变体注射至阴离子交换柱，精确的确定蛋白质浓度；和2)用三种不同的TrGA浓度(0.3-0.15-0.075g/28g ds)滴定变体，从而计算它们相对于野生型分子的乙醇生产性能。

表9：组合变体列表

蛋白质纯化和确定

利用AKTA探索100 FPLC系统(Amersham Biosciences，Piscataway，NJ)纯化粗酶制品。将β-环糊精(Sigma-Aldrich，Zwijndrecht，TheNetherlands；85.608-8)偶联到环氧-活化的琼脂糖珠子(GE Healthcare，Diegem，Belgium；17-0480-01)上。用柱捕获酶制品中的葡糖淀粉酶。使用含有10mM α-环糊精(Sigma，28705)的25mM Tris缓冲液，pH7.5或50mM乙酸钠缓冲液，pH4.3，从珠子上洗脱酶。通过SDS-PAGE分析纯化的样品。为了精确确定变体的蛋白质浓度，开发了基于FPLC的蛋白质测定方法。首先利用标准的Bradford方案(Bio-Rad cat#500-0205)确定纯化的标记TrGA分子的蛋白质浓度。然后，将纯化的样品注射到ResourceQ 1ml柱(GE Healthcare)上，用含有500mM NaCl的25mM Tris pH缓冲液洗脱酶。确定峰面积，相对于具有已知浓度的TrGA标准的峰面积，计算蛋白质浓度。

小规模EtOH应用

表10总结了通过不同组合变体的乙醇和糖(DP1，DP2，DP＞3)的产量。获得玉米醪液液化物的样品，并利用稀釜馏物稀释至26％ DS。利用4N硫酸将浆液的pH调至pH4.3。将100g醪液等分试样置于32℃水浴中，使其平衡。在加入100μl 400ppm尿素后，向每个玉米醪液样品中加入1ml纯化的变体TrGA酶样品(150μg/ml)或纯化的TrGA(300、150、75μg/ml)。最后，向每个样品中加入333μl的在45ml DI水溶液中经过30分钟水合的15g RedStar Red酵母(Lesaffre酵母公司(Lesaffre yeast Corp)Milwaukee，WI)。在5、21、28、48和52小时取样，利用Aminex HPX-87H柱9(Bio-Rad)进行HPLC分析。

乙醇和碳水化合物测定

2ml Eppendorf离心管中装入发酵醪，在冰上冷却10分钟。样品在14,000×g离心3分钟，将500μl的上清液转移到含有50μl杀伤溶液(1.1N硫酸)的试管中，静置5分钟。向试管中加入5.0ml的水，然后过滤到0.22μm过滤平板(多屏，Millipore，Amsterdam，the Netherlands)中，运行HPLC。柱温：60℃；移动相：0.01N硫酸；流速0.6ml/分钟；检测器：RI；注射体积：20μl。柱基于电荷和分子量分离分子；DP1(单糖)；DP2(二糖)；DP3(三糖)；DP＞3(具有聚合度大于3的寡糖)；琥珀酸；乳酸；甘油；甲醇；乙醇。

DSC分析

利用差示扫描热量测定法(DSC)测定纯化的酶样品(0.2-0.4mg/ml)的熔融温度。

表10.乙醇和糖类的生产

表11表示了0.15mg剂量的变体的终乙醇产量和性能。性能是通过变体的值对0.3mg和0.15mg TrGA值的插值进行计算的。

表11：乙醇产量

除ET7-2外，所有的组合变体都比TrGA野生型表现的更好。表现最好的LR8具有1.56倍改善的性能。

表12给出了利用小规模乙醇应用测定测试的单位点和组合诱变体的概述。表12中阴影化的变体具有比TrGA更好的性能，还具有更高的热解折叠温度(dTm)。

表12：变体相对于TrGA的性能和热解折叠

结果显示，色谱法(FPLC)是精确确定蛋白质浓度的有效工具。结果还显示，用三种浓度的TrGA滴定变体是小规模确定变体性能的有价值的方法。7个变体的表现好于TrGA野生型(参见表12)，还具有更高的热解折叠温度，表现不如TrGA的变体则具有较低的Tm。

实施例10：选定的组合和单位点变体集合的比活性测定，和LR8的底物特异性

分析了一组组合变体和一些用于构建组合变体的单位点变体的比活性(表13)。进一步研究了LR8(用小规模应用测定确定PI 1.56)的底物特异性。这是通过建立MTP测定来确定GA变体的葡萄糖产率，和确定LR8变体的底物特异性实现的。发现变体之间的MTP测定不同，且除ET7-1外，所有变体都显示出比野生型(wt)里氏木霉葡糖淀粉酶更高的速率。另外，一些变体(LR8/ET8/Q172F)的实施效果比TrGA好20-30％。与野生型相比，LR8在可溶性玉米淀粉和两种不同的玉米醪液液化物样品上效果更好。

在下列实验中使用的底物是可溶性玉米淀粉储液，制备如下：将8g可溶性玉米淀粉(Sigma # S4180)溶解在100ml milliQ水中，微波炉加热1分钟。将分散体煮沸5分钟，冷却后，调整体积至100ml。用100mM NaAc缓冲液、pH4，1∶1稀释储液来制备4％可溶性玉米淀粉。在一个实验中，使用湿度分析仪测量％ds来制备玉米液化物底物(NE)，然后用50mM NaAc7.5倍稀释底物，最终获得4％ds。底物在2000×g离心5分钟，用0.22μm滤器过滤上清液。在另一个实验中，除了在离心前将底物10倍稀释外，以相同方式制备玉米液化物底物(BSE)。

使用150μg酶/ml(3μg/180μl反应混合物)的储液稀释酶。用50mMNaAc pH4.0如下进一步稀释溶液：300ng(10x)、200ng、150ng、100ng、75ng、50ng、25ng、10ng/180μl反应混合物。

如下实施测定：每个孔加入40μl 50mM NaAc pH4.0，120μl 4％可溶性玉米淀粉，和20μl酶。样品在32℃，900rpm孵育2小时，并且加入90μl800mM甘氨酸-NaOH缓冲液pH105分钟后，在冰上终止。平板在15℃，2000rpm离心5分钟。向新鲜的平板中加入85μl milliQ水和100μl己糖激酶混合物(Il测试葡萄糖(HK)试剂盒，Instrumental Laboratory # 182507-40)和20μl上清液。对于葡萄糖(0-1mg/ml)校准线，则加入20μl葡萄糖储液替代。平板在室温黑暗中孵育10分钟，然后利用Spectramax进行340nm处吸光度测量。

表13：

相对于野生型的性能

图7和8中显示了测定GA变体葡萄糖生产速率的测定结果。在这些附图中，计算了每一添加的酶量的对TrGA的相对性能。从图中150ng酶处的线性区域获得结论。图7、8和表13的结果显示，LR8、ET8、ET7-2、S211R、Q172F和P94N在整个线性范围都比野生型的实施效果好。

为了确定LR8的底物特异性，对筛选和应用中使用的底物(可溶性玉米淀粉，和实施例10中生产的两种玉米醪液底物)测试了LR8和TrGA野生型的性能。当通过HPLC分析时，底物在聚合度(DP)模式中表现出差异(参见图9-11)。在NE和BSE中出现DP1-＞＝DP4，而可溶性玉米淀粉由至少4个或更多个葡萄糖分子组成。在所有的底物上，LR8都比野生型的实施效果更好(参见图9、10和11)。

实施例11：利用pTTT载体中的TrGA点评估文库(SEL)筛选和表征在里氏木霉中表达的变体

在里氏木霉中创造并直接筛选其它变体，特别是在SBD中具有取代的变体。与实施例1类似，使用pDONR-TrGA进入载体作为模板，和表14中列举的引物构建另十个TrGA位点饱和诱变(SSM)文库。位点包括：N61、 G73、L417、T430、A431、E503、Q511、A535、A539和N563。在这些位点中，E503、Q511、A535、A539和N563位于TrGA的淀粉结合结构域中。然后，根据Invitrogen提供的方案，使用LR CLONASE^TM II酶混合物，并用pTTT-Dest载体(图14)实施重组。将重组产物转化到大肠杆菌Maxefficiency DH5α(Invitrogen)中，在补充了100μg/mL青霉素的2xTY培养基[Bacto胰蛋白胨(Difco)16g/L，Bacto酵母提取物(Difco)10g/L，NaCL5g/L]上涂板。在37℃孵育过夜后，从含100μg/mL青霉素的2xTY琼脂平板上，每个文库挑取96个单克隆，在含有200μL 2xTY培养基(含100μg/mL青霉素)的MTP中，37℃生长24小时。培养物用于序列分析(ABI3100序列分析仪，Applied Biosystems)。每个文库含有15-19个不同的在最终表达载体中的TrGA变体。将这些变体分别转化到里氏木霉中。

表14：用于产生其他TrGA SSM文库的引物

利用PEG-原生质体方法(参见例如，

等人，(1987)Gene 61：155-164)将SEL转化到里氏木霉中。里氏木霉宿主是源自RL-P37(IA52)的菌株，具有四个基因缺失(Δcbh1，Δcbh2，Δegl1，Δegl2；即，“四重缺失”；参见美国专利5,847,276、WO 92/06184和WO 05/001036)。在25μl总体积的转化混合物中，含有至多600ng的DNA和1-5×10⁵原生质体，所述转化混合物用200ml的25％ PEG溶液处理，用2倍体积的1.2M山梨糖醇溶液稀释，与含有乙酰胺的3％选择性顶层琼脂糖MM混合，并倒在含有乙酰胺的2％选择性琼脂糖上，或在24孔微滴度平板上。平板在28℃孵育5-8天。利用0.85％ NaCl、0.015％ Tween 80的溶液，从平板收获在各个单独的孔再生的转化体总群体的孢子。使用孢子悬浮液接种96孔MTP中的发酵。在24孔MTP的情况下，为了富集孢子数量，引入了对含选择性乙酰胺MM的新24孔MTP额外的涂板步骤。

在MTP中发酵转化体，使用含有表达蛋白质变体的培养上清液进行测定。简而言之，用表达TrGA变体的里氏木霉转化体的孢子悬浮液(超过10⁴孢子/孔)，一式四份地接种含有200μl的LD-GSM培养基的MTP。平板在28℃用230rpm和80％湿度孵育6天。通过真空过滤收获培养上清。在不同的测定中使用上清，筛选具有改进性质的变体。

表15-17中显示了在热稳定性、比活性以及同时在热稳定性和比活性中表现出性能指数大于1.0的变体。

表15：其它TrGA变体的热稳定性筛选

表16：其它TrGA变体的比活性筛选

表17：同时表现出增加的热稳定性和比活性的其它TrGA变体

实施例12：选定的单位点和组合变体的集合的表征

基于实施例4-6和11的结果，针对选定的组合变体和单位点变体的集合，进一步表征了它们的改变的性质。选定的集合包括具有以下位置取代的单位点和组合变体：I43、D44、N61、G73、G294、L417、T430、A431、E503、Q511、A535、A539和/或N563。从大规模发酵中纯化变体，并确定热稳定性和比活性的PI。特别的，利用不同的底物确定比活性，包括DP7、玉米淀粉和液化物。结果显示在表18和19中。

表18：选定的单位点变体集合的PI，每个变体来自500ml发酵物

表19：选定的组合变体集合的PI

实施例11：TrGA的晶体结构

测定了1.9

分辨率下的里氏木霉(红褐肉座茵)葡糖淀粉酶(TrGA)的完整三维结构。表20显示了木霉葡糖淀粉酶晶体结构的坐标。TrGA以含有599个残基以及在天然宿主中将正常发生的所有的翻译后修饰的完整形式结晶。按如下产生和分析晶体结构：

对于蛋白质表达和纯化，将编码红褐肉座茵GA的基因，根据美国专利7,413,887中描述的方案，进行克隆和表达。

所有结晶实验使用的TrGA蛋白质材料都如下通过阴离子交换色谱进行一步初级纯化：包含180mg/ml总蛋白的、表达的TrGA的浓缩培养上清液通过在25mM Tris-HCI，pH8.0缓冲液中1∶10稀释样品来制备。使用HiPrep 16/10 Q Sepharose FF柱(GE Helthcare)进行阴离子交换纯化。用4倍柱体积(CV)的起始缓冲液(25mM Tris-HCl，pH8.0)平衡HiPrep柱，然后，再使用10ml的稀释的蛋白质样品。使用在运行缓冲液(25mMTris-HCl，pH8.0)中的0-140mM NaCl的8CV线性梯度洗脱结合的蛋白质。在约80mM NaCl盐浓度下从HiPrep Q琼脂糖柱上洗脱结合的TrGA。合并含有纯TrGA蛋白质的级分，并使用具有10 kD分子量截留(cutoff)(MWCO)的25ml Vivaspin离心浓缩管(Viva Science)将其浓缩至50mg/ml。使用DG-10脱盐柱(Bio-Rad)(用50mM乙酸钠缓冲液，pH4.3平衡)，将纯化和浓缩的TrGA材料进行缓冲液交换。通过测量280nm处的吸光度确定蛋白质浓度。然后将初步纯化和浓缩的TrGA蛋白质储液储存在-20℃。

还引入了两步额外的纯化步骤，额外的阴离子交换纯化和大小排阻纯化，来增加TrGA蛋白质材料的结晶能力(crystability)。如下进行这两步额外的纯化步骤：首先，使用10ml MonoQ柱(GE Helthcare)的阴离子交换纯化步骤。将1ml初步纯化和冷冻的TrGA材料(50mg蛋白质)样品解冻，通过将样品在新鲜缓冲液中重复稀释至6ml，再利用6ml 5 kD MWCO浓缩管将样品再次浓缩至0.5ml，将缓冲液换为20mM Tris-HCl，pH8.0。在最后一次浓缩步骤后，在蒸馏水中稀释TrGA样品，直到蛋白质样品的电导率达到与阴离子纯化的起始缓冲液的电导率相对应，所述起始缓冲液即，25mM Tris-HCl，pH8.0。首先用4倍柱体积(CV)的起始缓冲液平衡MonoQ柱，然后向柱内加入稀释的蛋白质样品。通过两个不同的梯度从MonoQ柱上洗脱结合的蛋白质。首先，使用4CV线性pH梯度，其中起始缓冲液的pH从8.0降至6.0。在第二个梯度中，使用8CV长的盐梯度，其中，运行缓冲液(25mM Tris-HCl，pH6.0)中的盐浓度从0增加至350mM NaCl。在第二个盐梯度过程中，在约150mM NaCl浓度处，发现从柱上洗脱了结合的TrGA。合并含有TrGA的级分，并使用6ml 5 kD MWCO的Vivaspin浓缩管将其浓缩至2ml。然后，将浓缩的TrGA样品用于Superdex 200 16/60大小排阻柱 (GE Helthcare)上，所述排阻柱用4CV的20mM Tris-Cl，pH8.0和50mMNaCl平衡，所述平衡液还用做运行缓冲液。在大小排阻纯化后，合并来自主洗脱峰的级分，并利用6ml 5 kD MWCO的Vivaspin离心浓缩管将其浓缩至约7.5mg/ml的蛋白质浓度。

对于蛋白质结晶，用来发现初步的TrGA结晶条件的蛋白质样品是这样的TrGA材料样品，其通过阴离子交换纯化一次，然后储存在-20C。在初步结晶实验前，将TrGA蛋白质样品解冻，并用50mM乙酸钠缓冲液，pH4.3稀释至约12mg/ml。正交晶的x-射线数据集通过分子替换(MR)用于解析TrGA的结构，而高分辨率正交晶的数据集，用于最终的正交晶的空间群TrGA结构模型。发现使用悬滴的蒸气扩散方法(McPherson 1982)，在20℃下，正交晶的TrGA晶体生长在含有25％ PEG 3350，0.20M乙酸铵，0.10M Bis-Tris pH5.5(池液)的溶液中。通过将等量的蛋白质溶液(12mg/m1)和池液混合至终体积10μl，来制备结晶化悬滴。发现TrGA晶体属于正交晶的空间群P212121，具有晶胞大小约：a＝52.2

，b＝99.2 ，c＝121.2

，所述晶体具有计算的V_m为2.3(Matthews 1968)，且一个分子在不对称单元中。

对于x-射线数据收集，在室温，从固定在密封毛细管内的单晶体收集两套正交晶的TrGA数据集。在home X-射线源——具有聚焦镜的MSC/Rigaku(Molecular Structures Corp.，The Woodlands，Texas)RaxisIV++成像板检测器上，利用来自Rigaku RU200旋转阳极发生器的CuKα射线，收集初步lo-分辨率正交晶的TrGA X-射线数据集，用于解析通过分子替换方法(MR)的结构。使用由MSC/Rigaku提供的d*trek软件来处理、衡量和平均该数据集。在100K从单个冷冻的TrGA晶体收集C中心的单斜数据集，所述单个冷冻的TrGA晶体在包含25％ PEG 3350，15％甘油，50mM CaCl2和0.1M Bis-Tris pH5.5的冷冻保护剂(作为冷冻保护剂)中平衡，置于人造丝纤维环内，在转移到同步加速器前浸入液氮中冷冻。高分辨率正交晶的(1.9

)数据集和C中心的单斜晶数据集(1.8

)都在Lund，Sweden的MAX LAB同步加速器源，光束911∶5处收集。用MOSFLM处理自同步加速器源收集的两套数据集，并用包含在CCP4程序包(Collaborative Computational Project Number 4 1994)中的程序SCALA衡量。除非另外提及，所有的后继数据处理都使用CCP4程序包实施(Collaborative Computational Project Number 4 1994)。从每套数据集留出了一组5％的反射，用作为监控R-free(Brünger，A(1992)Nature，355：472-475)。

使用包括在CCP4程序包中的自动置换程序MOLREP(CollaborativeComputational Project Number 4 1994)，通过MR，利用初步的lo-分辨率正交晶的数据集，以及利用泡盛曲霉GA(AaGA)变体X100(pdb进入1GLM(Aleshin等人，(1994)J.Mol.Biol.238：575-591)的坐标作为搜索模型，初步解析TrGA结构。编辑了泡盛曲霉GA搜索模型，以在进行MR实验前去除附着在蛋白质分子上的作为N-和O-糖基化的所有糖基化部分，以及所有的溶剂分子。来自初步lo-分辨率TrGA数据集的，所有分辨率在36.8和2.8

之间的反射都用于MR解析。MR程序发现了单旋转功能解析，具有高于背景最大11.1σ，高于背景的次最大为3.8σ。翻译功能解析产生了48。7％的R-因子，并具有17.4的对照因子。利用程序Refmac 5.0(Murshudov等人，(1997)Acta Crystallogr.D53：240-255)对MR解析进行了10轮限制性最小二乘精修法的优化。这将结晶学R-因子降低至31.1％，同时R-自由值从42.2％降至41.1％。

精修的MR解析模型用于从lo-分辨率正交晶的TrGA数据集计算初始密度图。在该电子密度图中，可以方便的鉴别出在TrGA的19和26位残基之间的二硫桥的电子密度，所述二硫桥是泡盛曲霉变体X100结构模型中不存在的二硫桥。这提示所述电子密度图的质量足够用于从氨基酸序列构建TrGA的结构模型。精修基于lo-分辨率数据集的初始TrGA结构模型，所述精修利用了Coot(Emsley和Cowtan，(2004)Acta Crystallogr.D boilCrystallogr.60：2126-2132)构建的交替循环模型，和Refmac 5.0的最大可能性精修。

通过利用程序Refmac 5.0，针对高分辨率数据集精修了初始TrGA结构模型(进行10轮限制性精修)，将初始TrGA结构模型的分辨率延伸到了高分辨率正交晶的数据集(1.9

)的分辨率。利用精修程序中的水选取方案，将结构模型中的大部分水分子自动定位，然后通过肉眼检查人工选取或剔除。所有结构比较都使用Coot(Emsley和Cowtan(2004)如上)或O(Jones等人，(1991)Acta Crystallogr.A47：110-119)，并用PyMOL(DelanoW.L.(2002)The PyMOL Molecular Graphics System.Palo Alto，CA，USA；Delano Scientific)制图。

根据这些结果，可见TrGA催化核心区段与Aleshin等人，1992对AaGA的(α/α)₆-桶状拓扑结构的描述一致，由α螺旋的两个桶组成，其中外螺旋的C-末端通向内螺旋的N-末端。能够鉴别电子密度中的关键差异，例如在残基19和26之间的二硫桥，和相对于AaGA的插入(残基257-260)。包含80-100的片段也经历了延伸的模型重建。鉴别的一个主要的糖基化位点是在Asn 171，其上附着了至多四个糖苷部分。在AaGA中也鉴别出了相似的糖基化位点。此外，催化核心在残基22-23、44-45和122-123之间，含有三个顺式肽，所述催化核心在TrGA和AaGA之间是保守的。总而言之，当比较TrGA和AaGA的催化核心的坐标时，453个Cα原子中的409个之间有0.535

的rms差异。

实施例14：TrGA和AaGA之间的同源性

实施例13中鉴别的TrGA的晶体结构，与以前已鉴别的泡盛曲霉GA(AaGA)的晶体结构重叠。AaGA晶体结构获得自蛋白质数据库(PDB)，且结晶的AaGA的形式是仅含有催化结构域的形式。在本文中，将具有所有三个区域完整的里氏木霉葡糖淀粉酶的结构确定至1.8埃分辨率(参见表15和实施例12)。利用坐标(参见表20)，将结构与已测定的泡盛曲霉菌株X100的催化结构域的坐标进行了比对(Aleshin，A.E.，Hoffman，C.，Firsov，L.M.和Honzatko，R.B.1994 Refined crystal structures ofglucoamylase from Aspergillus awamori var.X100.J Mol Biol 238：575-591和PDB)。如图12和13中可见，催化结构域的结构紧密重叠，并允许基于该结构重叠鉴别等价的残基。

基于该分析，鉴别了能够在TrGA中突变，并且导致增加的稳定性和/或比活性的位点。这些位点包括活性位点的108、124、175和316位。还鉴别了特定的成对变体Y47W/Y315F和Y47F/Y315W。鉴别的其它位点是I43、D44、P45、D46、R122、R125、V181、E242、Y310、D313、V314、N317、R408和N409。由于高的结构同源性，预期在TrGA中的位点上发现的有益变体，在泡盛曲霉和其它同源的葡糖淀粉酶中也将具有相似的效果。

在不脱离本发明的范围和精神的条件下，本发明所述方法和系统的不同修饰和变化对本领域技术人员是显而易见的。虽然描述本发明已经就特定的优选实施方案进行了描述，应该理解，要求保护的发明不应过分限于此类特定的实施方案。实际上，对本领域技术人员显而易见的、实施本发明的所述模式的不同修饰，也意在下列权利要求的范围内。

表20.

序列表

<110>丹尼斯科美国公司

<120>具有改变性质的葡糖淀粉酶变体

<130>48452-0032-WO(430971)

<140>

<141>

<150>60/989,426

<151>2007-11-20

<160>168

<170>PatentIn version 3.5

<210>1

<211>632

<212>PRT

<213>里氏木霉

<400>1

Met His Val Leu Ser Thr Ala Val Leu Leu Gly Ser Val Ala Val Gln

1 5 10 15

Lys Val Leu Gly Arg Pro Gly Ser Ser Gly Leu Ser Asp Val Thr Lys

20 25 30

Arg Ser Val Asp Asp Phe Ile Ser Thr Glu Thr Pro Ile Ala Leu Asn

35 40 45

Asn Leu Leu Cys Asn Val Gly Pro Asp Gly Cyg Arg Ala Phe Gly Thr

50 55 60

Ser Ala Gly Ala Val Ile Ala Ser Pro Ser Thr Ile Asp Pro Asp Tyr

65 70 75 80

Tyr Tyr Met Trp Thr Arg Asp Ser Ala Leu Val Phe Lys Asn Leu Ile

85 90 95

Asp Arg Phe Thr Glu Thr Tyr Asp Ala Gly Leu Gln Arg Arg Ile Glu

100 105 110

Gln Tyr Ile Thr Ala Gln Val Thr Leu Gln Gly Leu Ser Asn Pro Ser

115 120 125

Gly Ser Leu Ala Asp Gly Ser Gly Leu Gly Glu Pro Lys Phe Glu Leu

130 135 140

Thr Leu Lys Pro Phe Thr Gly Asn Trp Gly Arg Pro Gln Arg Asp Gly

145 150 155 160

Pro Ala Leu Arg Ala Ile Ala Leu Ile Gly Tyr Ser Lys Trp Leu Ile

165 170 175

Asn Asn Asn Tyr Gln Ser Thr Val Ser Asn Val Ile Trp Pro Ile Val

180 185 190

Arg Asn Asp Leu Asn Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Phe

195 200 205

Asp Leu Trp Glu Glu Val Asn Gly Ser Ser Phe Phe Thr Val Ala Asn

210 215 220

Gln His Arg Ala Leu Val Glu Gly Ala Thr Leu Ala Ala Thr Leu Gly

225 230 235 240

Gln Ser Gly Ser Ala Tyr Ser Ser Val Ala Pro Gln Val Leu Cys Phe

245 250 255

Leu Gln Arg Phe Trp Val Ser Ser Gly Gly Tyr Val Asp Ser Asn Ile

260 265 270

Asn Thr Asn Glu Gly Arg Thr Gly Lys Asp Val Asn Ser Val Leu Thr

275 280 285

Ser Ile His Thr Phe Asp Pro Asn Leu Gly Cys Asp Ala Gly Thr Phe

290 295 300

Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Val Val Asp

305 310 315 320

Ser Phe Arg Ser Ile Tyr Gly Val Asn Lys Gly Ile Pro Ala Gly Ala

325 330 335

Ala Val Ala Ile Gly Arg Tyr Ala Glu Asp Val Tyr Tyr Asn Gly Asn

340 345 350

Pro Trp Tyr Leu Ala Thr Phe Ala Ala Ala Glu Gln Leu Tyr Asp Ala

355 360 365

Ile Tyr Val Trp Lys Lys Thr Gly Ser Ile Thr Val Thr Ala Thr Ser

370 375 380

Leu Ala Phe Phe Gln Glu Leu Val Pro Gly Val Thr Ala Gly Thr Tyr

385 390 395 400

Ser Ser Ser Ser Ser Thr Phe Thr Asn Ile Ile Asn Ala Val Ser Thr

405 410 415

Tyr Ala Agp Gly Phe Leu Ser Glu Ala Ala Lys Tyr Val Pro Ala Asp

420 425 430

Gly Ser Leu Ala Glu Gln Phe Asp Arg Asn Ser Gly Thr Pro Leu Ser

435 440 445

Ala Leu His Leu Thr Trp Ser Tyr Ala Ser Phe Leu Thr Ala Thr Ala

450 455 460

Arg Arg Ala Gly Ile Val Pro Pro Ser Trp Ala Asn Ser Ser Ala Ser

465 470 475 480

Thr Ile Pro Ser Thr Cys Ser Gly Ala Ser Val Val Gly Ser Tyr Ser

485 490 495

Arg Pro Thr Ala Thr Ser Phe Pro Pro Ser Gln Thr Pro Lys Pro Gly

500 505 510

Val Pro Ser Gly Thr Pro Tyr Thr Pro Leu Pro Cys Ala Thr Pro Thr

515 520 525

Ser Val Ala Val Thr Phe His Glu Leu Val Ser Thr Gln Phe Gly Gln

530 535 540

Thr Val Lys Val Ala Gly Asn Ala Ala Ala Leu Gly Asn Trp Ser Thr

545 550 555 560

Ser Ala Ala Val Ala Leu Asp Ala Val Asn Tyr Ala Asp Asn His Pro

565 570 575

Leu Trp Ile Gly Thr Val Asn Leu Glu Ala Gly Asp Val Val Glu Tyr

580 585 590

Lys Tyr Ile Asn Val Gly Gln Asp Gly Ser Val Thr Trp Glu Ser Asp

595 600 605

Pro Asn His Thr Tyr Thr Val Pro Ala Val Ala Cys Val Thr Gln Val

610 615 620

Val Lys Glu Asp Thr Trp Gln Ser

625 630

<210>2

<211>.599

<212>PRT

<213>里氏木霉

<400>2

Ser Val Asp Asp Phe Ile Ser Thr Glu Thr Pro Ile Ala Leu Asn Asn

1 5 10 15

Leu Leu Cys Asn Val Gly Pro Asp Gly Cys Arg Ala Phe Gly Thr Ser

20 25 30

Ala Gly Ala Val Ile Ala Ser Pro Ser Thr Ile Asp Pro Asp Tyr Tyr

35 40 45

Tyr Met Trp Thr Arg Asp Ser Ala Leu Val Phe Lys Asn Leu Ile Asp

50 55 60

Arg Phe Thr Glu Thr Tyr Asp Ala Gly Leu Gln Arg Arg Ile Glu Gln

65 70 75 80

Tyr Ile Thr Ala Gln Val Thr Leu Gln Gly Leu Ser Asn Pro Ser Gly

85 90 95

Ser Leu Ala Asp Gly Ser Gly Leu Gly Glu Pro Lys Phe Glu Leu Thr

100 105 110

Leu Lys Pro Phe Thr Gly Asn Trp Gly Arg Pro Gln Arg Asp Gly Pro

115 120 125

Ala Leu Arg Ala Ile Ala Leu Ile Gly Tyr Ser Lys Trp Leu Ile Asn

130 135 140

Asn Asu Tyr Gln Ser Thr Val Ser Asn Val Ile Trp Pro Ile Val Arg

145 150 155 160

Asn Asp Leu Asn Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Phe Asp

165 170 175

Leu Trp Glu Glu Val Asn Gly Ser Ser Phe Phe Thr Val Ala Asn Gln

180 185 190

His Arg Ala Leu Val Glu Gly Ala Thr Leu Ala Ala Thr Leu Gly Gln

195 200 205

Ser Gly Ser Ala Tyr Ser Ser Val Ala Pro Gln Val Leu Cys Phe Leu

210 215 220

Gln Arg Phe Trp Val Ser Ser Gly Gly Tyr Val Asp Ser Asn Ile Asn

225 230 235 240

Thr Asn Glu Gly Arg Thr Gly Lys Asp Val Asn Ser Val Leu Thr Ser

245 250 255

Ile His Thr Phe Asp Pro Agn Leu Gly Cys Asp Ala Gly Thr Phe Gln

260 265 270

Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Val Val Asp Ser

275 280 285

Phe Arg Ser Ile Tyr Gly Val Asn Lys Gly Ile Pro Ala Gly Ala Ala

290 295 300

Val Ala Ile Gly Arg Tyr Ala Glu Asp Val Tyr Tyr Asn Gly Asn Pro

305 310 315 320

Trp Tyr Leu Ala Thr Phe Ala Ala Ala Glu Gln Leu Tyr Asp Ala Ile

325 330 335

Tyr Val Trp Lys Lys Thr Gly Ser Ile Thr Val Thr Ala Thr Ser Leu

340 345 350

Ala Phe Phe Gln Glu Leu Val Pro Gly Val Thr Ala Gly Thr Tyr Ser

355 360 365

Ser Ser Ser Ser Thr Phe Thr Asn Ile Ile Asn Ala Val Ser Thr Tyr

370 375 380

Ala Asp Gly Phe Leu Ser Glu Ala Ala Lys Tyr Val Pro Ala Asp Gly

385 390 395 400

Ser Leu Ala Glu Gln Phe Asp Arg Asn Ser Gly Thr Pro Leu Ser Ala

405 410 415

Leu His Leu Thr Trp Ser Tyr Ala Ser Phe Leu Thr Ala Thr Ala Arg

420 425 430

Arg Ala Gly Ile Val Pro Pro Ser Trp Ala Asn Ser Ser Ala Ser Thr

435 440 445

Ile Pro Ser Thr Cys Ser Gly Ala Ser Val Val Gly Ser Tyr Ser Arg

450 455 460

Pro Thr Ala Thr Ser Phe Pro Pro Ser Gln Thr Pro Lys Pro Gly Val

465 470 475 480

Pro Ser Gly Thr Pro Tyr Thr Pro Leu Pro Cys Ala Thr Pro Thr Ser

485 490 495

Val Ala Val Thr Phe His Glu Leu Val Ser Thr Gln Phe Gly Gln Thr

500 505 510

Val Lys Val Ala Gly Asn Ala Ala Ala Leu Gly Asn Trp Ser Thr Ser

515 520 525

Ala Ala Val Ala Leu Asp Ala Val Asn Tyr Ala Asp Asn His Pro Leu

530 535 540

Trp Ile Gly Thr Val Asn Leu Glu Ala Gly Asp Val Val Glu Tyr Lys

545 550 555 560

Tyr Ile Asn Val Gly Gln Asp Gly Ser Val Thr Trp Glu Ser Asp Pro

565 570 575

Asn His Thr Tyr Thr Val Pro Ala Val Ala Cys Val Thr Gln Val Val

580 585 590

Lys Glu Asp Thr Trp Gln Ser

595

<210>3

<211>453

<212>PRT

<213>里氏木霉

<400>3

Ser Val Asp Asp Phe Ile Ser Thr Glu Thr Pro Ile Ala Leu Asn Asn

1 5 10 15

Leu Leu Cys Asn Val Gly Pro Asp Gly Cys Arg Ala Phe Gly Thr Ser

20 25 30

Ala Gly Ala Val Ile Ala Ser Pro Ser Thr Ile Asp Pro Asp Tyr Tyr

35 40 45

Tyr Met Trp Thr Arg Asp Ser Ala Leu Val Phe Lys Asn Leu Ile Asp

50 55 60

Arg Phe Thr Glu Thr Tyr Asp Ala Gly Leu Gln Arg Arg Ile Glu Gln

65 70 75 80

Tyr Ile Thr Ala Gln Val Thr Leu Gln Gly Leu Ser Asn Pro Ser Gly

85 90 95

Ser Leu Ala Asp Gly Ser Gly Leu Gly Glu Pro Lys Phe Glu Leu Thr

100 105 110

Leu Lys Pro Phe Thr Gly Asn Trp Gly Arg Pro Gln Arg Asp Gly Pro

115 120 125

Ala Leu Arg Ala Ile Ala Leu Ile Gly Tyr Ser Lys Trp Leu Ile Asn

130 135 140

Asn Agn Tyr Gln Ser Thr Val Ser Asn Val Ile Trp Pro Ile Val Arg

145 150 155 160

Asn Asp Leu Asn Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Phe Asp

165 170 175

Leu Trp Glu Glu Val Asn Gly Ser Ser Phe Phe Thr Val Ala Asn Gln

180 185 190

His Arg Ala Leu Val Glu Gly Ala Thr Leu Ala Ala Thr Leu Gly Gln

195 200 205

Ser Gly Ser Ala Tyr Ser Ser Val Ala Pro Gln Val Leu Cys Phe Leu

210 215 220

Gln Arg Phe Trp Val Ser Ser Gly Gly Tyr Val Asp Ser Asn Ile Asn

225 230 235 240

Thr Asn Glu Gly Arg Thr Gly Lys Asp Val Asn Ser Val Leu Thr Ser

245 250 255

Ile His Thr Phe Asp Pro Asn Leu Gly Cys Asp Ala Gly Thr Phe Gln

260 265 270

Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Val Val Asp Ser

275 280 285

Phe Arg Ser Ile Tyr Gly Val Asn Lys Gly Ile Pro Ala Gly Ala Ala

290 295 300

Val Ala Ile Gly Arg Tyr Ala Glu Asp Val Tyr Tyr Asn Gly Asn Pro

305 310 315 320

Trp Tyr Leu Ala Thr Phe Ala Ala Ala Glu Gln Leu Tyr Asp Ala Ile

325 330 335

Tyr Val Trp Lys Lys Thr Gly Ser Ile Thr Val Thr Ala Thr Ser Leu

340 345 350

Ala Phe Phe Gln Glu Leu Val Pro Gly Val Thr Ala Gly Thr Tyr Ser

355 360 365

Ser Ser Ser Ser Thr Phe Thr Asn Ile Ile Asn Ala Val Ser Thr Tyr

370 375 380

Ala Asp Gly Phe Leu Ser Glu Ala Ala Lys Tyr Val Pro Ala Asp Gly

385 390 395 400

Ser Leu Ala Glu Gln Phe Asp Arg Asn Ser Gly Thr Pro Leu Ser Ala

405 410 415

Leu His Leu Thr Trp Ser Tyr Ala Ser Phe Leu Thr Ala Thr Ala Arg

420 425 430

Arg Ala Gly Ile Val Pro Pro Ser Trp Ala Asn Ser Ser Ala Ser Thr

435 440 445

Ile Pro Ser Thr Cys

450

<210>4

<211>1899

<212>DNA

<213>里氏木霉

<400>4

atgcacgtcc tgtcgactgc ggtgctgctc ggctccgttg ccgttcaaaa ggtcctggga 60

agaccaggat caagcggtct gtccgacgtc accaagaggt ctgttgacga cttcatcagc 120

accgagacgc ctattgcact gaacaatctt ctttgcaatg ttggtcctga tggatgccgt 180

gcattcggca catcagctgg tgcggtgatt gcatctccca gcacaattga cccggactac 240

tattacatgt ggacgcgaga tagcgctctt gtcttcaaga acctcatcga ccgcttcacc 300

gaaacgtacg atgcgggcct gcagcgccgc atcgagcagt acattactgc ccaggtcact 360

ctccagggcc tctctaaccc ctcgggctcc ctcgcggacg gctctggtct cggcgagccc 420

aagtttgagt tgaccctgaa gcctttcacc ggcaactggg gtcgaccgca gcgggatggc 480

ccagctctgc gagccattgc cttgattgga tactcaaagt ggctcatcaa caacaactat 540

cagtcgactg tgtccaacgt catctggcct attgtgcgca acgacctcaa ctatgttgcc 600

cagtactgga accaaaccgg ctttgacctc tgggaagaag tcaatgggag ctcattcttt 660

actgttgcca accagcaccg agcacttgtc gagggcgcca ctcttgctgc cactcttggc 720

cagtcgggaa gcgcttattc atctgttgct ccccaggttt tgtgctttct ccaacgattc 780

tgggtgtcgt ctggtggata cgtcgactcc aacatcaaca ccaacgaggg caggactggc 840

aaggatgtca actccgtcct gacttccatc cacaccttcg atcccaacct tggctgtgac 900

gcaggcacct tccagccatg cagtgacaaa gcgctctcca acctcaaggt tgttgtcgac 960

tccttccgct ccatctacgg cgtgaacaag ggcattcctg ccggtgctgc cgtcgccatt 1020

ggccggtatg cagaggatgt gtactacaac ggcaaccctt ggtatcttgc tacatttgct 1080

gctgccgagc agctgtacga tgccatctac gtctggaaga agacgggctc catcacggtg 1140

accgccacct ccctggcctt cttccaggag cttgttcctg gcgtgacggc cgggacctac 1200

tccagcagct cttcgacctt taccaacatc atcaacgccg tctcgacata cgccgatggc 1260

ttcctcagcg aggctgccaa gtacgtcccc gccgacggtt cgctggccga gcagtttgac 1320

cgcaacagcg gcactccgct gtctgcgctt cacctgacgt ggtcgtacgc ctcgttcttg 1380

acagccacgg cccgtcgggc tggcatcgtg cccccctcgt gggccaacag cagcgctagc 1440

acgatcccct cgacgtgctc cggcgcgtcc gtggtcggat cctactcgcg tcccaccgcc 1500

acgtcattcc ctccgtcgca gacgcccaag cctggcgtgc cttccggtac tccctacacg 1560

cccctgccct gcgcgacccc aacctccgtg gccgtcacct tccacgagct cgtgtcgaca 1620

cagtttggcc agacggtcaa ggtggcgggc aacgccgcgg ccctgggcaa ctggagcacg 1680

agcgccgccg tggctctgga cgccgtcaac tatgccgata accaccccct gtggattggg 1740

acggtcaacc tcgaggctgg agacgtcgtg gagtacaagt acatcaatgt gggccaagat 1800

ggctccgtga cctgggagag tgatcccaac cacacttaca cggttcctgc ggtggcttgt 1860

gtgacgcagg ttgtcaagga ggacacctgg cagtcgtaa 1899

<210>5

<211>448

<212>PRT

<213>泡盛曲霉

<400>5

Ala Thr Leu Asp Ser Trp Leu Ser Asn Glu Ala Thr Val Ala Arg Thr

1 5 10 15

Ala Ile Leu Asn Asn Ile Gly Ala Asp Gly Ala Trp Val Ser Gly Ala

20 25 30

Asp Ser Gly Ile Val Val Ala Ser Pro Ser Thr Asp Asn Pro Asp Tyr

35 40 45

Phe Tyr Thr Trp Thr Arg Asp Ser Gly Leu Val Ile Lys Thr Leu Val

50 55 60

Asp Leu Phe Arg Asn Gly Asp Thr Asp Leu Leu Ser Thr Ile Glu Asn

65 70 75 80

Tyr Ile Ser Ser Gln Ala Ile Val Gln Gly Ile Ser Asn Pro Ser Gly

85 90 95

Asp Leu Ser Ser Gly Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Glu

100 105 110

Thr Ala Tyr Thr Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala

115 120 125

Leu Arg Ala Thr Ala Met Ile Gly Phe Arg Gln Trp Leu Leu Asp Asn

130 135 140

Gly Tyr Thr Ser Ala Ala Thr Glu Ile Val Trp Pro Leu Val Arg Asn

145 150 155 160

Asp Leu Ser Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Tyr Asp Leu

165 170 175

Trp Glu Glu Val Asn Gly Ser Ser Phe Phe Thr Ile Ala Val Gln His

180 185 190

Arg Ala Leu Val Glu Gly Ser Ala Phe Ala Thr Ala Val Gly Ser Ser

195 200 205

Cys Ser Trp Cys Asp Ser Gln Ala Pro Gln Ile Leu Cys Tyr Leu Gln

210 215 220

Ser Phe Trp Thr Gly Glu Tyr Ile Leu Ala Asn Phe Asp Ser Ser Arg

225 230 235 240

Ser Gly Lys Asp Thr Asn Thr Leu Leu Gly Ser Ile His Thr Phe Asp

245 250 255

Pro Glu Ala Gly Cys Asp Asp Ser Thr Phe Gln Pro Cys Ser Pro Arg

260 265 270

Ala Leu Ala Asn His Lys Glu Val Val Asp Ser Phe Arg Ser Ile Tyr

275 280 285

Thr Leu Asn Asp Gly Leu Ser Asp Ser Glu Ala Val Ala Val Gly Arg

290 295 300

Tyr Pro Lys Agp Ser Tyr Tyr Asn Gly Asn Pro Trp Phe Leu Cys Thr

305 310 315 320

Leu Ala Ala Ala Glu Gln Leu Tyr Asp Ala Leu Tyr Gln Trp Asp Lys

325 330 335

Gln Gly Ser Leu Glu Ile Thr Asp Val Ser Leu Asp Phe Phe Gln Ala

340 345 350

Leu Tyr Ser Asp Ala Ala Thr Gly Thr Tyr Ser Ser Ser Ser Ser Thr

355 360 365

Tyr Ser Ser Ile Val Asp Ala Val Lys Thr Phe Ala Asp Gly Phe Val

370 375 380

Ser Ile Val Glu Thr His Ala Ala Ser Asn Gly Ser Leu Ser Glu Gln

385 390 395 400

Tyr Agp Lys Ser Asp Gly Asp Glu Leu Ser Ala Arg Asp Leu Thr Trp

405 410 415

Ser Tyr Ala Ala Leu Leu Thr Ala Asn Asn Arg Arg Asn Ser Val Met

420 425 430

Pro Pro Ser Trp Gly Glu Thr Ser Ala Ser Ser Val Pro Gly Thr Cys

435 440 445

<210>6

<211>449

<212>PRT

<213>黑曲霉

<400>6

Ala Thr Leu Asp Ser Trp Leu Ser Asn Glu Ala Thr Val Ala Arg Thr

1 5 10 15

Ala Ile Leu Asn Asn Ile Gly Ala Asp Gly Ala Trp Val Ser Gly Ala

20 25 30

Agp Ser Gly Ile Val Val Ala Ser Pro Ser Thr Asp Asn Pro Asp Tyr

35 40 45

Phe Tyr Thr Trp Thr Arg Asp Ser Gly Leu Val Leu Lys Thr Leu Val

50 55 60

Asp Leu Phe Arg Asn Gly Asp Thr Ser Leu Leu Ser Thr Ile Glu Asn

65 70 75 80

Tyr Ile Ser Ala Gln Ala Ile Val Gln Gly Ile Ser Asn Pro Ser Gly

85 90 95

Asp Leu Ser Ser Gly Ala Gly Leu Gly Glu Pro Lys Phe Asn Val Asp

100 105 110

Glu Thr Ala Tyr Thr Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro

115 120 125

Ala Leu Arg Ala Thr Ala Met Ile Gly Phe Gly Gln Trp Leu Leu Asp

130 135 140

Asn Gly Tyr Thr Ser Thr Ala Thr Asp Ile Val Trp Pro Leu Val Arg

145 150 155 160

Asn Asp Leu Ser Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Tyr Asp

165 170 175

Leu Trp Glu Glu Val Asn Gly Ser Ser Phe Phe Thr Ile Ala Val Gln

180 185 190

His Arg Ala Leu Val Glu Gly Ser Ala Phe Ala Thr Ala Val Gly Ser

195 200 205

Ser Cys Ser Trp Cys Asp Ser Gln Ala Pro Glu Ile Leu Cys Tyr Leu

210 215 220

Gln Ser Phe Trp Thr Gly Ser Phe Ile Leu Ala Asn Phe Asp Ser Ser

225 230 235 240

Arg Ser Gly Lys Asp Ala Asn Thr Leu Leu Gly Ser Ile His Thr Phe

245 250 255

Asp Pro Glu Ala Ala Cys Asp Asp Ser Thr Phe Gln Pro Cys Ser Pro

260 265 270

Arg Ala Leu Ala Asn His Lys Glu Val Val Asp Ser Phe Arg Ser Ile

275 280 285

Tyr Thr Leu Asn Asp Gly Leu Ser Asp Ser Glu Ala Val Ala Val Gly

290 295 300

Arg Tyr Pro Glu Asp Thr Tyr Tyr Asn Gly Asn Pro Trp Phe Leu Cys

305 310 315 320

Thr Leu Ala Ala Ala Glu Gln Leu Tyr Asp Ala Leu Tyr Gln Trp Asp

325 330 335

Lys Gln Gly Ser Leu Glu Val Thr Asp Val Ser Leu Asp Phe Phe Lys

340 345 350

Ala Leu Tyr Ser Asp Ala Ala Thr Gly Thr Tyr Ser Ser Ser Ser Ser

355 360 365

Thr Tyr Ser Ser Ile Val Asp Ala Val Lys Thr Phe Ala Asp Gly Phe

370 375 380

Val Ser Ile Val Glu Thr His Ala Ala Ser Asn Gly Ser Met Ser Glu

385 390 395 400

Gln Tyr Asp Lys Ser Asp Gly Glu Gln Leu Ser Ala Arg Asp Leu Thr

405 410 415

Trp Ser Tyr Ala Ala Leu Leu Thr Ala Asn Asn Arg Arg Asn Ser Val

420 425 430

Val Pro Ala Ser Trp Gly Glu Thr Ser Ala Ser Ser Val Pro Gly Thr

435 440 445

Cys

<210>7

<211>450

<212>PRT

<213>米曲霉

<400>7

Gln Ser Asp Leu Asn Ala Phe Ile Glu Ala Gln Thr Pro Ile Ala Lys

1 5 10 15

Gln Gly Tyr Leu Asn Asn Ile Gly Ala Asp Gly Lys Lsu Val Glu Gly

20 25 30

Ala Ala Ala Gly Ile Val Tyr Ala Ser Pro Ser Lys Ser Asn Pro Asp

35 40 45

Tyr Phe Tyr Thr Trp Thr Arg Asp Ala Gly Leu Thr Met Glu Glu Tyr

50 55 60

Ile Glu Gln Phe Ile Gly Gly Asp Ala Thr Leu Glu Ser Thr Ile Gln

65 70 75 80

Asn Tyr Val Asp Ser Gln Ala Asn Glu Gln Ala Val Ser Asn Pro Ser

85 90 95

Gly Gly Leu Ser Asp Gly Ser Gly Leu Ala Glu Pro Lys Phe Tyr Tyr

100 105 110

Asn Ile Ser Gln Phe Thr Asp Ser Trp Gly Arg Pro Gln Arg Asp Gly

115 120 125

Pro Ala Leu Arg Ala Ser Ala Leu Ile Ala Tyr Gly Asn Ser Leu Ile

130 135 140

Ser Ser Asp Lys Gln Ser Val Val Lys Ala Asn Ile Trp Pro Ile Tyr

145 150 155 160

Gln Asn Asp Leu Ser Tyr Val Gly Gln Tyr Trp Asn Gln Thr Gly Phe

165 170 175

Asp Leu Trp Glu Glu Val Gln Gly Ser Ser Phe Phe Thr Val Ala Val

180 185 190

Gln His Lys Ala Leu Val Glu Gly Asp Ala Phe Ala Lys Ala Leu Gly

195 200 205

Glu Glu Cys Gln Ala Cys Ser Val Ala Pro Gln Ile Leu Cys His Leu

210 215 220

Gln Asp Phe Trp Asn Gly Ser Ala Val Leu Ser Asn Leu Pro Thr Asn

225 230 235 240

Gly Arg Ser Gly Leu Asp Thr Asn Ser Leu Leu Gly Ser Ile His Thr

245 250 255

Phe Asp Pro Ala Ala Ala Cys Asp Asp Thr Thr Phe Gln Pro Cys Ser

260 265 270

Ser Arg Ala Leu Ser Asn His Lys Leu Val Val Asp Ser Phe Arg Ser

275 280 285

Val Tyr Gly Ile Asn Asn Gly Arg Gly Ala Gly Lys Ala Ala Ala Val

290 295 300

Gly Pro Tyr Ala Glu Asp Thr Tyr Gln Gly Gly Asn Pro Trp Tyr Leu

305 310 315 320

Thr Thr Leu Val Ala Ala Glu Leu Leu Tyr Asp Ala Leu Tyr Gln Trp

325 330 335

Asp Lys Gln Gly Gln Val Asn Val Thr Glu Thr Ser Leu Pro Phe Phe

340 345 350

Lys Asp Leu Ser Ser Asn Val Thr Thr Gly Ser Tyr Ala Lys Ser Ser

355 360 365

Ser Ala Tyr Glu Ser Leu Thr Ser Ala Val Lys Thr Tyr Ala Asp Gly

370 375 380

Phe Ile Ser Val Val Gln Glu Tyr Thr Pro Asp Gly Gly Ala Leu Ala

385 390 395 400

Glu Gln Tyr Ser Arg Asp Gln Gly Thr Pro Val Ser Ala Ser Asp Leu

405 410 415

Thr Trp Ser Tyr Ala Ala Phe Leu Ser Ala Val Gly Arg Arg Asn Gly

420 425 430

Thr Val Pro Ala Ser Trp Gly Ser Ser Thr Ala Asn Ala Val Pro Ser

435 440 445

Gln Cys

450

<210>8

<211>441

<212>PRT

<213>灰腐质霉

<400>8

Ala Ala Val Asp Thr Phe Ile Asn Thr Glu Lys Pro Ile Ala Trp Asn

1 5 10 15

Lys Leu Leu Ala Asn Ile Gly Pro Asn Gly Lys Ala Ala Pro Gly Ala

20 25 30

Ala Ala Gly Val Val Ile Ala Ser Pro Ser Arg Thr Asp Pro Pro Tyr

35 40 45

Phe Phe Thr Trp Thr Pro Asp Ala Ala Leu Val Leu Thr Gly Ile Ile

50 55 60

Glu Ser Leu Gly His Asn Tyr Asn Thr Thr Leu Gln Gln Val Ser Asn

65 70 75 80

Pro Ser Gly Thr Phe Ala Asp Gly Ser Gly Leu Gly Glu Ala Lys Phe

85 90 95

Asn Val Asp Leu Thr Ala Phe Thr Gly Glu Trp Gly Arg Pro Gln Arg

100 105 110

Asp Gly Pro Pro Leu Arg Ala Ile Ala Leu Ile Gln Tyr Ala Lys Trp

115 120 125

Leu Ile Ala Asn Gly Tyr Lys Ser Thr Ala Lys Ser Val Val Trp Pro

130 135 140

Val Val Lys Asn Asp Leu Ala Tyr Thr Ala Gln Tyr Trp Asn Glu Thr

145 150 155 160

Gly Phe Asp Leu Trp Glu Glu Val Pro Gly Ser Ser Phe Phe Thr Ile

165 170 175

Ala Ser Ser His Arg Ala Leu Thr Glu Gly Ala Tyr Leu Ala Ala Gln

180 185 190

Leu Asp Thr Glu Cys Pro Pro Cys Thr Thr Val Ala Pro Gln Val Leu

195 200 205

Cys Phe Gln Gln Ala Phe Trp Asn Ser Lys Gly Asn Tyr Val Val Ser

210 215 220

Thr Ser Thr Ala Gly Glu Tyr Arg Ser Gly Lys Asp Ala Asn Ser Ile

225 230 235 240

Leu Ala Ser Ile His Asn Phe Asp Pro Glu Ala Gly Cys Asp Asn Leu

245 250 255

Thr Phe Gln Pro Cys Ser Glu Arg Ala Leu Ala Asn His Lys Ala Tyr

260 265 270

Val Asp Ser Phe Arg Asn Leu Tyr Ala Ile Asn Lys Gly Ile Ala Gln

275 280 285

Gly Lys Ala Val Ala Val Gly Arg Tyr Ser Glu Asp Val Tyr Tyr Asn

290 295 300

Gly Asn Pro Trp Tyr Leu Ala Asn Phe Ala Ala Ala Glu Gln Leu Tyr

305 310 315 320

Asp Ala Ile Tyr Val Trp Asn Lys Gln Gly Ser Ile Thr Val Thr Ser

325 330 335

Val Ser Leu Pro Phe Phe Arg Asp Leu Val Ser Ser Val Ser Thr Gly

340 345 350

Thr Tyr Ser Lys Ser Ser Ser Thr Phe Thr Asn Ile Val Asn Ala Val

355 360 365

Lys Ala Tyr Ala Asp Gly Phe Ile Glu Val Ala Ala Lys Tyr Thr Pro

370 375 380

Ser Asn Gly Ala Leu Ala Glu Gln Tyr Asp Arg Asn Thr Gly Lys Pro

385 390 395 400

Asp Ser Ala Ala Asp Leu Thr Trp Ser Tyr Ser Ala Phe Leu Ser Ala

405 410 415

Ile Asp Arg Arg Ala Gly Leu Val Pro Pro Ser Trp Arg Ala Ser Val

420 425 430

Ala Lys Ser Gln Leu Pro Ser Thr Cys

435 440

<210>9

<211>452

<212>PRT

<213>Hypocrea vinosa

<400>9

Ser Val Asp Asp Phe Ile Asn Thr Gln Thr Pro Ile Ala Lsu Asn Asn

1 5 10 15

Leu Leu Cys Asn Val Gly Pro Asp Gly Cys Arg Ala Phe Gly Thr Ser

20 25 30

Ala Gly Ala Val Ile Ala Ser Pro Ser Thr Thr Asp Pro Asp Tyr Tyr

35 40 45

Tyr Met Trp Thr Arg Asp Ser Ala Leu Val Phe Lys Asn Ile Val Asp

50 55 60

Arg Phe Thr Gln Gln Tyr Asp Ala Gly Leu Gln Arg Arg Ile Glu Gln

65 70 75 80

Tyr Ile Ser Ala Gln Val Thr Leu Gln Gly Ile Ser Asn Pro Ser Gly

85 90 95

Ser Leu Ser Asp Gly Ser Gly Leu Gly Glu Pro Lys Phe Glu Leu Thr

100 105 110

Leu Ser Gln Phe Thr Gly Asn Trp Gly Arg Pro Gln Arg Asp Gly Pro

115 120 125

Ala Leu Arg Ala Ile Ala Leu Ile Gly Tyr Ser Lys Trp Leu Ile Asn

130 135 140

Asn Asn Tyr Gln Ser Thr Val Ser Asn Ile Ile Trp Pro Ile Val Arg

145 150 155 160

Asn Asp Leu Asn Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Phe Asp

165 170 175

Leu Trp Glu Glu Val Asn Gly Ser Ser Phe Phe Thr Val Ala Agn Gln

180 185 190

His Arg Ala Leu Val Glu Gly Ala Thr Leu Ala Ala Thr Leu Gly Gln

195 200 205

Ser Gly Ser Thr Tyr Ser Ser Val Ala Pro Gln Ile Leu Cys Phe Leu

210 215 220

Gln Arg Phe Trp Val Ser Gly Gly Tyr Ile Asp Ser Asn Ile Asn Thr

225 230 235 240

Asn Glu Gly Arg Thr Gly Lys Asp Ala Asn Ser Leu Leu Ala Ser Ile

245 250 255

His Thr Phe Asp Pro Ser Leu Gly Cys Asp Ala Ser Thr Phe Gln Pro

260 265 270

Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Val Val Asp Ser Phe

275 280 285

Arg Ser Ile Tyr Gly Val Asn Lys Gly Ile Pro Ala Gly Ser Ala Val

290 295 300

Ala Ile Gly Arg Tyr Pro Glu Asp Val Tyr Phe Asn Gly.Asn Pro Trp

305 310 315 320

Tyr Leu Ala Thr Phe Ala Ala Ala Glu Gln Leu Tyr Asp Ser Val Tyr

325 330 335

Val Trp Lys Lys Thr Gly Ser Ile Thr Val Thr Ser Thr Ser Ser Ala

340 345 350

Phe Phe Gln Glu Leu Val Pro Gly Val Ala Ala Gly Thr Tyr Ser Ser

355 360 365

Ser Gln Ser Thr Phe Thr Ser Ile Ile Asn Ala Ile Ser Thr Tyr Ala

370 375 380

Asp Gly Phe Leu Ser Glu Ala Ala Lys Tyr Val Pro Ala Asp Gly Ser

385 390 395 400

Leu Ala Glu Gln Phe Asp Arg Asn Thr Gly Thr Pro Leu Ser Ala Val

405 410 415

His Leu Thr Trp Ser Tyr Ala Ser Phe Leu Thr Ala Ala Ala Arg Arg

420 425 430

Ala Gly Val Val Pro Pro Ser Trp Ala Ser Ser Gly Ala Asn Thr Val

435 440 445

Pro Ser Ser Cys

450

<210>10

<211>25

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>10

tcgcgttaac gctagcatgg atctc 25

<210>11

<211>31

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(10)..(11)

<223>a，c，g，t，未知或者其它

<400>11

tctgttgacn nsttcatcag caccgagacg c 31

<210>12

<211>34

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(13)..(14)

<223>a，c，g，t，未知或者其它

<400>12

tctgttgacg acnnsatcag caccgagacg ccta 34

<210>13

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>13

atcagcaccg agacgcctnn sgcactgaac aatcttcttt 40

<210>14

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>14

ctttgcaatg ttggtcctnn sggatgccgt gcattcggca 40

<210>15

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>15

cctgatggat gccgtgcann sggcacatca gctggtgcgg 40

<210>16

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>16

attgcatctc ccagcacann sgacccggac tactattaca 40

<210>17

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>17

gcatctccca gcacaattnn sccggactac tattacatgt 40

<210>18

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>18

tctcccagca caattgacnn sgactactat tacatgtgga 40

<210>19

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>19

cccagcacaa ttgacccgnn stactattac atgtggacgc 40

<210>20

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>20

agcacaattg acccggacnn stattacatg tggacgcgag 40

<210>21

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>21

attgacccgg actactatnn satgtggacg cgagatagcg 40

<210>22

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>22

ccggactact attacatgnn sacgcgagat agcgctcttg 40

<210>23

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>23

9accgcttca ccgaaacgnn sgatgcgggc ctgcagcgcc 40

<210>24

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>24

acgtacgatg cgggcctgnn scgccgcatc gagcagtaca 40

<210>25

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>25

tacgatgcgg gcctgcagnn scgcatcgag cagtacatta 40

<210>26

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>26

ctccagggcc tctctaacnn stcgggctcc ctcgcggacg 40

<210>27

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>27

ccctcgggct ccctcgcgnn sggctctggt ctcggcgagc 40

<210>28

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>28

aagtttgagt tgaccctgnn scctttcacc ggcaactggg 40

<210>29

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>29

gagttgaccc tgaagcctnn saccggcaac tggggtcgac 40

<210>30

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>30

ctgaagcctt tcaccggcnn stggggtcga ccgcagcggg 40

<210>31

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>31

ttcaccggca actggggtnn sccgcagcgg gatggcccag 40

<210>32

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>32

aactggggtc gaccgcagnn sgatggccca gctctgcgag 40

<210>33

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>33

aagtggctca tcaacaacnn statcagtcg actgtgtcca 40

<210>34

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>34

ctcatcaaca acaactatnn stcgactgtg tccaacgtca 40

<210>35

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>35

ctcaactatg ttgcccagnn stggaaccaa accggctttg 40

<210>36

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>36

gttgcccagt actggaacnn saccggcttt gacctctggg 40

<210>37

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>37

tactggaacc aaaccggcnn sgacctctgg gaagaagtca 40

<210>38

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>38

caaaccggct ttgacctcnn sgaagaagtc aatgggagct 40

<210>39

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>39

ggctttgacc tctgggaann sgtcaatggg agctcattct 40

<210>40

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>40

tttgacctct gggaagaann saatgggagc tcattcttta 40

<210>41

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>41

cttgctgcca ctcttggcnn stcgggaagc gcttattcat 40

<210>42

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>42

actcttggcc agtcgggann sgcttattca tctgttgctc 40

<210>43

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>43

tgctttctcc aacgattcnn sgtgtcgtct ggtggatacg 40

<210>44

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>44

gactccaaca tcaacaccnn sgagggcagg actggcaagg 40

<210>45

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>45

tccaacatca acaccaacnn sggcaggact ggcaaggatg 40

<210>46

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>46

atcaacacca acgagggcnn sactggcaag gatgtcaact 40

<210>47

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>47

gtcgactcct tccgctccnn stacggcgtg aacaagggca 40

<210>48

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>48

tccttccgct ccatctacnn sgtgaacaag ggcattcctg 40

<210>49

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>49

tccatctacg gcgtgaacnn sggcattcct gccggtgctg 40

<210>50

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>50

gctgccgtcg ccattggcnn statgcagag gatgtgtact 40

<210>51

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>51

gccgtcgcca ttggccggnn sgcagaggat gtgtactaca 40

<210>52

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>52

attggccggt atgcagagnn sgtgtactac aacggcaacc 40

<210>53

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>53

ggccggtatg cagaggatnn stactacaac ggcaaccctt 40

<210>54

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>54

cggtatgcag aggatgtgnn stacaacggc aacccttggt 40

<210>55

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>55

tatgcagagg atgtgtacnn saacggcaac ccttggtatc 40

<210>56

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>56

gcagaggatg tgtactacnn sggcaaccct tggtatcttg 40

<210>57

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>57

tactacaacg gcaaccctnn statcttgct acatttgctg 40

<210>58

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>58

gatgccatct acgtctggnn saagacgggc tccatcacgg 40

<210>59

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>59

gccatctacg tctggaagnn sacgggctcc atcacggtga 40

<210>60

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>60

tccatcacgg tgaccgccnn stccctggcc ttcttccagg 40

<210>61

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>61

acctccctgg ccttcttcnn sgagcttgtt cctggcgtga 40

<210>62

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>62

gagcttgttc ctggcgtgnn sgccgggacc tactccagca 40

<210>63

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>63

gtgacggccg ggacctacnn sagcagctct tcgaccttta 40

<210>64

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>64

acggccggga cctactccnn sagctcttcg acctttacca 40

<210>65

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>65

agctcttcga cctttaccnn satcatcaac gccgtctcga 40

<210>66

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>66

ctcagcgagg ctgccaagnn sgtccccgcc gacggttcgc 40

<210>67

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>67

gctgccaagt acgtccccnn sgacggttcg ctggccgagc 40

<210>68

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>68

tacgtccccg ccgacggtnn sctggccgag cagtttgacc 40

<210>69

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>69

ctggccgagc agtttgacnn saacagcggc actccgctgt 40

<210>70

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>70

gccgagcagt ttgaccgcnn sagcggcact ccgctgtctg 40

<210>71

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>71

tttgaccgca acagcggcnn sccgctgtct gcgcttcacc 40

<210>72

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>72

actccgctgt ctgcgcttnn sctgacgtgg tcgtacgcct 40

<210>73

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>73

tctgcgcttc acctgacgnn stcgtacgcc tcgttcttga 40

<210>74

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>74

ttgacagcca cggcccgtnn sgctggcatc gtgcccccct 40

<210>75

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>75

acggcccgtc gggctggcnn sgtgcccccc tcgtgggcca 40

<210>76

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(19)..(20)

<223>a，c，g，t，未知或者其它

<400>76

agcgctagca cgatccccnn sacgtgctcc ggcgcgtccg 40

<210>77

<211>24

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>77

gtaacatcag agattttgag acac 24

<210>78

<211>31

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>78

gcgtctcggt gctgatgaas nngtcaacag a 31

<210>79

<211>34

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>79

taggcgtctc ggtgctgats nngtcgtcaa caga 34

<210>80

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>80

aaagaagatt gttcagtgcs nnaggcgtct cggtgctgat 40

<210>81

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>81

tgccgaatgc acggcatccs nnaggaccaa cattgcaaag 40

<210>82

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>82

ccgcaccagc tgatgtgccs nntgcacggc atccatcagg 40

<210>83

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>83

tgtaatagta gtccgggtcs nntgtgctgg gagatgcaat 40

<210>84

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>84

acatgtaata gtagtccggs nnaattgtgc tgggagatgc 40

<210>85

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>85

tccacatgta atagtagtcs nngtcaattg tgctgggaga 40

<210>86

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>86

gcgtccacat gtaatagtas nncgggtcaa ttgtgctggg 40

<210>87

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>87

ctcgcgtcca catgtaatas nngtccgggt caattgtgct 40

<210>88

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>88

cgctatctcg cgtccacats nnatagtagt ccgggtcaat 40

<210>89

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>89

caagagcgct atctcgcgts nncatgtaat agtagtccgg 40

<210>90

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>90

ggcgctgcag gcccgcatcs nncgtttcgg tgaagcggtc 40

<210>91

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>91

tgtactgctc gatgcggcgs nncaggcccg catcgtacgt 40

<210>92

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>92

taatgtactg ctcgatgcgs nnctgcaggc ccgcatcgta 40

<210>93

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>93

cgtccgcgag ggagcccgas nngttagaga ggccctggag 40

<210>94

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>94

gctcgccgag accagagccs nncgcgaggg agcccgaggg 40

<210>95

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>95

cccagttgcc ggtgaaaggs nncagggtca actcaaactt 40

<210>96

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22).

<223>a，c，g，t，未知或者其它

<400>96

gtcgacccca gttgccggts nnaggcttca gggtcaactc 40

<210>97

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>97

cccgctgcgg tcgaccccas nngccggtga aaggcttcag 40

<210>98

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>98

ctgggccatc ccgctgcggs nnaccccagt tgccggtgaa 40

<210>99

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>99

ctcgcagagc tgggccatcs nnctgcggtc gaccccagtt 40

<210>100

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>100

tggacacagt cgactgatas nngttgttga tgagccactt 40

<210>101

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>101

tgacgttgga cacagtcgas nnatagttgt tgttgatgag 40

<210>102

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>102

caaagccggt ttggttccas nnctgggcaa catagttgag 40

<210>103

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>103

cccagaggtc aaagccggts nngttccagt actgggcaac 40

<210>104

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>104

tgacttcttc ccagaggtcs nngccggttt ggttccagta 40

<210>105

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>105

agctcccatt gacttcttcs nngaggtcaa agccggtttg 40

<210>106

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>106

agaatgagct cccattgacs nnttcccaga ggtcaaagcc 40

<210>107

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>107

taaagaatga gctcccatts nnttcttccc agaggtcaaa 40

<210>108

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>108

atgaataagc gcttcccgas nngccaagag tggcagcaag 40

<210>109

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>109

gagcaacaga tgaataagcs nntcccgact ggccaagagt 40

<210>110

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>110

cgtatccacc agacgacacs nngaatcgtt ggagaaagca 40

<210>111

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>111

ccttgccagt cctgccctcs nnggtgttga tgttggagtc 40

<210>112

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>112

catccttgcc agtcctgccs nngttggtgt tgatgttgga 40

<210>113

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>113

agttgacatc cttgccagts nngccctcgt tggtgttgat 40

<210>114

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>114

tgcccttgtt cacgccgtas nnggagcgga aggagtcgac 40

<210>115

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>115

caggaatgcc cttgttcacs nngtagatgg agcggaagga 40

<210>116

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>116

cagcaccggc aggaatgccs nngttcacgc cgtagatgga 40

<210>117

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>117

agtacacatc ctctgcatas nngccaatgg cgacggcagc 40

<210>118

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>118

tgtagtacac atcctctgcs nnccggccaa tggcgacggc 40

<210>119

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>119

ggttgccgtt gtagtacacs nnctctgcat accggccaat 40

<210>120

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>120

aagggttgcc gttgtagtas nnatcctctg cataccggcc 40

<210>121

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>121

accaagggtt gccgttgtas nncacatcct ctgcataccg 40

<210>122

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>122

gataccaagg gttgccgtts nngtacacat cctctgcata 40

<210>123

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>123

caagatacca agggttgccs nngtagtaca catcctctgc 40

<210>124

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>124

cagcaaatgt agcaagatas nnagggttgc cgttgtagta 40

<210>125

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>125

ccgtgatgga gcccgtctts nnccagacgt agatggcatc 40

<210>126

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>126

tcaccgtgat ggagcccgts nncttccaga cgtagatggc 40

<210>127

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>127

cctggaagaa ggccagggas nnggcggtca ccgtgatgga 40

<210>128

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>128

tcacgccagg aacaagctcs nngaagaagg ccagggaggt 40

<210>129

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>129

tgctggagta ggtcccggcs nncacgccag gaacaagctc 40

<210>130

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>130

taaaggtcga agagctgcts nngtaggtcc cggccgtcac 40

<210>131

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>131

tggtaaaggt cgaagagcts nnggagtagg tcccggccgt 40

<210>132

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>132

tcgagacggc gttgatgats nnggtaaagg tcgaagagct 40

<210>133

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>133

gcgaaccgtc ggcggggacs nncttggcag cctcgctgag 40

<210>134

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>134

gctcggccag cgaaccgtcs nnggggacgt acttggcagc 40

<210>135

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>135

ggtcaaactg ctcggccags nnaccgtcgg cggggacgta 40

<210>136

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>136

acagcggagt gccgctgtts nngtcaaact gctcggccag 40

<210>137

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>137

cagacagcgg agtgccgcts nngcggtcaa actgctcggc 40

<210>138

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>138

ggtgaagcgc agacagcggs nngccgctgt tgcggtcaaa 40

<210>139

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>139

aggcgtacga ccacgtcags nnaagcgcag acagcggagt 40

<210>140

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>140

tcaagaacga ggcgtacgas nncgtcaggt gaagcgcaga 40

<210>141

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>141

aggggggcac gatgccagcs nnacgggccg tggctgtcaa 40

<210>142

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>142

tggcccacga ggggggcacs nngccagccc gacgggccgt 40

<210>143

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<220>

<221>经修饰的碱基

<222>(21)..(22)

<223>a，c，g，t，未知或者其它

<400>143

cggacgcgcc ggagcacgts nnggggatcg tgctagcgct 40

<210>144

<211>33

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>144

gcatctccca gcacacgaga cccggactac tat 33

<210>145

<211>33

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>145

gcatctccca gcacatacga cccggactac tat 33

<210>146

<211>33

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>146

gatgcgggcc tgcagctgcg catcgagcag tac 33

<210>147

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>147

ctgaagcctt tcaccggcac ctggggtcga ccgcagcggg 40

<210>148

<211>39

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>148

tgaagccttt caccggctac tggggtcgac cgcagcggg 39

<210>149

<211>40

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>149

ctgaagcctt tcaccggcga ctggggtcga ccgcagcggg 40

<210>150

<211>36

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>150

agtggctcat caacaacgas tatcagtcga ctgtgt 36

<210>151

<211>36

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>151

agtggctcat caacaacacc tatcagtcga ctgtgt 36

<210>152

<211>34

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>152

gtggctcatc aacaatggta tcagtcgact gtgt 34

<210>153

<211>36

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>153

agtggctcat caacaacctg tatcagtcga ctgtgt 36

<210>154

<211>36

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>154

agtggctcat caacaactcc tatcagtcga ctgtgt 36

<210>155

<211>38

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>155

ttgcccagta ctggaacgas accggctttg acctctgg 38

<210>156

<211>38

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>156

ttgcccagta ctggaacstg accggctttg acctctgg 38

<210>157

<211>38

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>157

ttgcccagta ctggaacacc accggctttg acctctgg 38

<210>158

<211>38

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>158

ttgcccagta ctggaaccga accggctttg acctctgg 38

<210>159

<211>38

<212>DNA

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的引物

<400>159

ttgcccagta ctggaactgc accggctttg acctctgg 38

<210>160

<211>6

<212>PRT

<213>里氏木霉

<400>160

Ser Val Asp Asp Phe Ile

1 5

<210>161

<211>599

<212>PRT

<213>人工序列

<220>

<221>来源

<223>/注释＝人工序列的描述：合成的多肽

<400>161

Ser Val Asp Asp Phe Ile Ser Thr Glu Thr Pro Ile Ala Leu Asn Asn

1 5 10 15

Leu Leu Cys Asn Val Gly Pro Asp Gly Cys Arg Ala Phe Gly Thr Ser

20 25 30

Ala Gly Ala Val Ile Ala Ser Pro Ser Thr Ile Asp Pro Asp Tyr Tyr

35 40 45

Tyr Met Trp Thr Arg Asp Ser Ala Leu Val Phe Lys Asn Leu Ile Asp

50 55 60

Arg Phe Thr Glu Thr Tyr Asp Ala Gly Leu Gln Arg Arg Ile Glu Gln

65 70 75 80

Tyr Ile Thr Ala.Gln Val Thr Leu Gln Gly Asn Ser Asn Pro Ser Gly

85 90 95

Ser Leu Ala Asp Gly Ser Gly Leu Gly Glu Pro Lys Phe Glu Leu Thr

100 105 110

Leu Lys Pro Phe Thr Gly Asn Trp Gly Arg Pro Gln Arg Asp Gly Pro

115 120 125

Ala Leu Arg Ala Ile Ala Leu Ile Gly Tyr Ser Lys Trp Leu Ile Asn

130 135 140

Asn Asn Tyr Gln Phe Thr Val Ser Asn Val Ile Trp Pro Ile Val Arg

145 150 155 160

Asn Asp Leu Asn Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Phe Asp

165 170 175

Leu Trp Glu Glu Val Asn Gly Ser Ser Phe Phe Thr Val Ala Asn Gln

180 185 190

His Arg Ala Leu Val Glu Gly Ala Thr Leu Ala Ala Thr Leu Gly Gln

195 200 205

Ser Gly Ser Ala Tyr Ser Ser Val Ala Pro Gln Val Leu Cys Phe Leu

210 215 220

Gln Arg Phe Trp Val Ser Ser Gly Gly Tyr Val Asp Ser Asn Ile Asn

225 230 235 240

Thr Asn Glu Gly Arg Thr Gly Lys Asp Val Asn Ser Val Leu Thr Ser

245 250 255

Ile His Thr Phe Asp Pro Asn Leu Gly Cys Asp Ala Gly Thr Phe Gln

260 265 270

Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Val Val Asp Ser

275 280 285

Phe Arg Ser Ile Tyr Gly Val Asn Lys Gly Ile Pro Ala Gly Ala Ala

290 295 300

Val Ala Ile Gly Arg Tyr Ala Glu Asp Val Tyr Tyr Asn Gly Asn Pro

305 310 315 320

Trp Tyr Leu Ala Thr Phe Ala Ala Ala Glu Gln Leu Tyr Asp Ala Ile

325 330 335

Tyr Val Trp Lys Lys Thr Gly Ser Ile Thr Val Thr Ala Thr Ser Leu

340 345 350

Ala Phe Phe Gln Glu Leu Val Pro Gly Val Thr Ala Gly Thr Tyr Ser

355 360 365

Ser Ser Ser Ser Thr Phe Thr Asn Ile Ile Asn Ala Val Ser Thr Tyr

370 375 380

Ala Asp Gly Phe Leu Ser Glu Ala Ala Lys Tyr Val Pro Ala Asp Gly

385 390 395 400

Ser Leu Ala Glu Gln Phe Asp Arg Asn Ser Gly Thr Pro Leu Ser Ala

405 410 415

Leu His Leu Thr Trp Ser Tyr Ala Ser Phe Leu Thr Ala Thr Ala Arg

420 425 430

Arg Ala Gly Ile Val Pro Pro Ser Trp Ala Asn Ser Ser Ala Ser Thr

435 440 445

Ile Pro Ser Thr Cys Ser Gly Ala Ser Val Val Gly Ser Tyr Ser Arg

450 455 460

Pro Thr Ala Thr Ser Phe Pro Pro Ser Gln Thr Pro Lys Pro Gly Val

465 470 475 480

Pro Ser Gly Thr Pro Tyr Thr Pro Leu Pro Cys Ala Thr Pro Thr Ser

485 490 495

Val Ala Val Thr Phe His Glu Leu Val Ser Thr Gln Phe Gly Gln Thr

500 505 510

Val Lys Val Ala Gly Asn Ala Ala Ala Leu Gly Asn Trp Ser Thr Ser

515 520 525

Ala Ala Val Ala Leu Asp Ala Val Asn Tyr Ala Asp Asn His Pro Leu

530 535 540

Trp Ile Ala Thr Val Asn Leu Glu Ala Gly Asp Val Val Glu Tyr Lys

545 550 555 560

Tyr Ile Asn Val Gly Gln Asp Gly Ser Val Thr Trp Glu Ser Asp Pro

565 570 575

Asn Hig Thr Tyr Thr Val Pro Ala Val Ala Cys Val Thr Gln Val Val

580 585 590

Lys Glu Asp Thr Trp Gln Ser

595

<210>162

<211>109

<212>PRT

<213>里氏木霉

<400>162

Cys Ala Thr Pro Thr Ser Val Ala Val Thr Phe His Glu Leu Val Ser

1 5 10 15

Thr Gln Phe Gly Gln Thr Val Lys Val Ala Gly Asn Ala Ala Ala Leu

20 25 30

Gly Asn Trp Ser Thr Ser Ala Ala Val Ala Leu Asp Ala Val Asn Tyr

35 40 45

Ala Asp Asn His Pro Leu Trp Ile Gly Thr Val Asn Leu Glu Ala Gly

50 55 60

Asp Val Val Glu Tyr Lys Tyr Ile Asn Val Gly Gln Asp Gly Ser Val

65 70 75 80

Thr Trp Glu Ser Asp Pro Asn His Thr Tyr Thr Val Pro Ala Val Ala

85 90 95

Cys Val Thr Gln Val Val Lys Glu Asp Thr Trp Gln Ser

100 105

<210>163

<211>112

<212>PRT

<213>灰腐质霉

<400>163

Cys Ala Asp Ala Ser Glu Val Tyr Val Thr Phe Asn Glu Arg Val Ser

1 5 10 15

Thr Ala Trp Gly Glu Thr Ile Lys Val Val Gly Asn Val Pro Ala Leu

20 25 30

Gly Asn Trp Asp Thr Ser Lys Ala Val Thr Leu Ser Ala Ser Gly Tyr

35 40 45

Lys Ser Asn Asp Pro Leu Trp Ser Ile Thr Val Pro Ile Lys Ala Thr

50 55 60

Gly Ser Ala Val Gln Tyr Lys Tyr Ile Lys Val Gly Thr Asn Gly Lys

65 70 75 80

Ile Thr Trp Glu Ser Asp Pro Asn Arg Ser Ile Thr Leu Gln Thr Ala

85 90 95

Ser Ser Ala Gly Lys Cys Ala Ala Gln Thr Val Asn Asp Ser Trp Arg

100 105 110

<210>164

<211>108

<212>PRT

<213>太瑞斯梭孢壳霉

<400>164

Cys Ser Thr Pro Thr Ala Val Ala Val Thr Phe Asn Glu Arg Val Thr

1 5 10 15

Thr Gln Trp Gly Gln Thr Ile Lys Val Val Gly Asp Ala Ala Ala Leu

20 25 30

Gly Gly Trp Asp Thr Ser Lys Ala Val Pro Leu Ser Ala Ala Gly Tyr

35 40 45

Thr Ala Ser Asp Pro Leu Trp Ser Gly Thr Val Asp Leu Pro Ala Gly

50 55 60

Leu Ala Val Gln Tyr Lys Tyr Ile Asn Val Ala Ala Asp Gly Gly Val

65 70 75 80

Thr Trp Glu Ala Asp Pro Asn His Ser Phe Thr Val Pro Ala Ala Cys

85 90 95

Gly Thr Thr Ala Val Thr Arg Asp Asp Thr Trp Gln

100 105

<210>165

<211>109

<212>PRT

<213>疏棉状嗜热丝孢菌

<400>165

Cys Thr Pro Pro Ser Glu Val Thr Leu Thr Phe Asn Ala Leu Val Asp

1 5 10 15

Thr Ala Phe Gly Gln Asn Ile Tyr Leu Val Gly Ser Ile Pro Glu Leu

20 25 30

Gly Ser Trp Asp Pro Ala Asn Ala Leu Leu Met Ser Ala Lys Ser Trp

35 40 45

Thr Ser Gly Asn Pro Val Trp Thr Leu Ser Ile Ser Leu Pro Ala Gly

50 55 60

Thr Ser Phe Glu Tyr Lys Phe Ile Arg Lys Asp Asp Gly Ser Ser Asp

65 70 75 80

Val Val Trp Glu Ser Asp Pro Asn Arg Ser Tyr Asn Val Pro Lys Asp

85 90 95

Cys Gly Ala Asn Thr Ala Thr Val Asn Ser Trp Trp Arg

100 105

<210>166

<211>108

<212>PRT

<213>埃默森踝节菌

<400>166

Cys Thr Thr Pro Thr Ser Val Ala Val Thr Phe Asp Glu Ile Val Ser

1 5 10 15

Thr Ser Tyr Gly Glu Thr Ile Tyr Leu Ala Gly Ser Ile Pro Glu Leu

20 25 30

Gly Asn Trp Ser Thr Ala Ser Ala Ile Pro Leu Arg Ala Asp Ala Tyr

35 40 45

Thr Asn Ser Asn Pro Leu Trp Tyr Val Thr Val Asn Leu Pro Pro Gly

50 55 60

Thr Ser Phe Glu Tyr Lys Phe Phe Lys Asn Gln Thr Asp Gly Thr Ile

65 70 75 80

Val Trp Glu Asp Asp Pro Asn Arg Ser Tyr Thr Val Pro Ala Tyr Cys

85 90 95

Gly Gln Thr Thr Ala Ile Leu Asp Asp Ser Trp Gln

100 105

<210>167

<211>108

<212>PRT

<213>黑曲霉

<400>167

Cys Thr Thr Pro Thr Ala Val Ala Val Thr Phe Asp Leu Thr Ala Thr

1 5 10 15

Thr Thr Tyr Gly Glu Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln Leu

20 25 30

Gly Asp Trp Glu Thr Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys Tyr

35 40 45

Thr Ser Ser Asp Pro Leu Trp Tyr Val Thr Val Thr Leu Pro Ala Gly

50 55 60

Glu Ser Phe Glu Tyr Lys Phe Ile Arg Ile Glu Ser Asp Asp Ser Val

65 70 75 80

Glu Trp Glu Ser Asp Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala Cys

85 90 95

Gly Thr Ser Thr Ala Thr Val Thr Asp Thr Trp Arg

100 105

<210>168

<211>108

<212>PRT

<213>泡盛曲霉

<400>168

Cys Thr Thr Pro Thr Ala Val Ala Val Thr Phe Asp Leu Thr Ala Thr

1 5 10 15

Thr Thr Tyr Gly Glu Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln Leu

20 25 30

Gly Asp Trp Asp Thr Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys Tyr

35 40 45

Thr Ser Ser Asn Pro Leu Trp Tyr Val Thr Val Thr Leu Pro Ala Gly

50 55 60

Glu Ser Phe Glu Tyr Lys Phe Ile Arg Ile Glu Ser Asp Asp Ser Val

65 70 75 80

Glu Trp Glu Ser Asp Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala Cys

85 90 95

Gly Glu Ser Thr Ala Thr Val Thr Asp Thr Trp Arg

100 105

Claims

1.在下述残基位置处包含三个氨基酸取代的葡糖淀粉酶变体，所述残基位置对应于SEQ ID NO：2的第417、430和563位，或亲本葡糖淀粉酶的等价位置，其中亲本葡糖淀粉酶的氨基酸序列为SEQ ID NO：1、2、3、5、6、7、8或9。

2.权利要求1的葡糖淀粉酶变体，其中亲本葡糖淀粉酶是SEQ ID NO：1或2。

3.权利要求1的葡糖淀粉酶变体，其中葡糖淀粉酶变体还在下述残基位置处包含一个或多个氨基酸取代，所述残基位置对应于SEQ ID NO：2的第61、511、539或535位，或亲本葡糖淀粉酶的等价位置。

4.权利要求1的葡糖淀粉酶变体，其中所述三个氨基酸取代是SEQ IDNO：2的L417V、T430A和N563I，或亲本葡糖淀粉酶的等价位置。

5.权利要求4的葡糖淀粉酶变体，其中变体还包括一个或多个下列取代：SEQ ID NO：2的Q511H、A539R、A535R、N61X，或亲本葡糖淀粉酶中的等价位置，其中X为任一取代氨基酸。

6.权利要求4或5的葡糖淀粉酶变体，其中所述变体选自由下列组成的组：SEQ ID NO：2的i)L417V，T430A，Q511H，A539R，和N563I；ii)L417V，T430A，A539R，和N563I；iii)L417V，T430A，Q511H，和N563I；iv)L417V，T430A，和N563I；v)L417V，T430A，Q511H，A535R，和N563I；vi)N61X，L417V，T430A，Q511H，A539R，和N563I，或亲本葡糖淀粉酶中的等价位置，其中X为任一取代氨基酸。

7.权利要求1-5任一项的葡糖淀粉酶变体，其中亲本葡糖淀粉酶选自从木霉属物种、曲霉属物种、腐质霉属物种、青霉属物种、踝节菌属物种或裂殖酵母属物种获得的葡糖淀粉酶。

8.权利要求7的葡糖淀粉酶变体，其中亲本葡糖淀粉酶获得自木霉属物种或曲霉属物种。

9.权利要求1-5任一项的葡糖淀粉酶变体，其中葡糖淀粉酶变体与亲本葡糖淀粉酶相比，表现出改变的热稳定性。

10.权利要求9的葡糖淀粉酶变体，其中葡糖淀粉酶变体与亲本葡糖淀粉酶相比，表现出增加的热稳定性。

11.权利要求1-5任一项的葡糖淀粉酶变体，其中葡糖淀粉酶变体与亲本葡糖淀粉酶相比，表现出改变的比活性。

12.权利要求11的葡糖淀粉酶变体，其中葡糖淀粉酶变体与亲本葡糖淀粉酶相比，表现出增加的比活性。

13.权利要求1-5任一项的葡糖淀粉酶变体，其中葡糖淀粉酶变体与亲本葡糖淀粉酶相比，表现出增加的热稳定性和增加的比活性。

14.编码权利要求1-13任一项的变体的多核苷酸。

15.包括权利要求14的多核苷酸的载体。

16.包括权利要求15的载体的宿主细胞。

17.包括权利要求1-13任一项的葡糖淀粉酶变体的酶组合物。

18.权利要求17的酶组合物，其中酶组合物用于淀粉转化过程中。

19.权利要求17的酶组合物，其中酶组合物用于醇发酵过程中。

20.在宿主细胞内生产葡糖淀粉酶变体的方法，包括在适合表达和生产葡糖淀粉酶变体的条件下培养权利要求16的宿主细胞，和生产葡糖淀粉酶变体。

21.根据权利要求20的方法，还包括从培养物中回收葡糖淀粉酶变体。