CN102618564B

CN102618564B - 淀粉酶、编码它们的核酸及其制备和应用方法

Info

Publication number: CN102618564B
Application number: CN201210020583.5A
Authority: CN
Inventors: W·考伦; T·理查森; G·弗莱; K·格雷; J·S·克罗夫; M·斯卢皮斯卡; N·巴顿; E·欧唐纳古; C·米勒
Original assignee: Diversa Corp
Current assignee: BASF Enzymes LLC
Priority date: 2003-03-06
Filing date: 2004-03-08
Publication date: 2014-10-29
Anticipated expiration: 2024-03-08
Also published as: ES2713024T3; DK2194133T3; EP2194133A2; JP6396371B2; CN104388449A; JP2017006131A; EP3023498A1; PL3023498T3; EP2194133B1; JP6177580B2; EP3508578A1; JP6208163B2; CA2920416A1; EP2194133A3; JP2015164421A; ZA200508046B; CN102618564A; JP2013236628A; EP3023498B1

Abstract

一方面，本发明涉及具有淀粉酶活性的多肽，编码这些多肽的多核苷酸，以及制备和使用这些多核苷酸和多肽的方法。一方面，本发明的多肽可以被用作淀粉酶，例如α淀粉酶，以便催化淀粉水解成为糖。一方面，本发明提供了缓释组合物，该组合物包括一种由胶乳聚合物涂层包衣的期望成分。

Description

淀粉酶、编码它们的核酸及其制备和应用方法

本申请为分案申请，原申请的申请日为2004年3月8日，申请号为200480012052.5(PCT/US2004/007096)，发明名称为“淀粉酶、编码它们的核酸及其制备和应用方法”。

参考以光盘形式提交的序列表

本申请包括一张含有序列表的光盘(以一式四份提交)。此处将该序列表的完整内容引入，作为参考。该序列表在光盘上的标识如下。

文件名	生成日期	大小(字节)
			Sequence Listing.txt	2004年3月4日	1,798,144

技术领域

本发明涉及分子和细胞生物学和生物化学。一方面，本发明涉及具有淀粉酶活性的多肽、编码这些多肽的多核苷酸，以及制备和使用这些多核苷酸和多肽的方法。一方面，本发明的多肽可以被用作淀粉酶，例如α淀粉酶或葡糖淀粉酶，以便将淀粉水解为糖。一方面，本发明涉及具有热稳定的淀粉酶活性的多肽，如α淀粉酶或葡糖淀粉酶活性，例如1，4-α-D-葡聚糖葡糖水解酶活性。一方面，本发明的多肽可以被用作淀粉酶，例如α淀粉酶或葡糖淀粉酶，以便将淀粉水解为糖，如葡萄糖。本发明也涉及包含本发明的核酸序列的核酸构建物、载体和宿主细胞，以及用于产生本发明的多肽的重组方法。本发明也涉及本发明的淀粉酶在淀粉转化过程中的用途，包括高果糖玉米糖浆(HFCS)、乙醇、葡萄糖和葡萄糖糖浆的产生。

背景技术

淀粉是在人类饮食中常被发现的复合糖。淀粉的结构是用α-1，4和α-1，6糖苷键连接的葡萄糖聚合物。淀粉酶是一种能催化淀粉水解为糖的酶。淀粉酶将淀粉中的内α-1，4-糖苷键水解，在很大程度上是随机水解，从而得到更小分子量的麦芽糖糊精。在消化系统中和在商业上，淀粉的分解是很重要的。所以淀粉酶被认为很有商业价值，在很多场合得到使用：淀粉加工的初始阶段(液化)；湿玉米碾磨；酒精生产；在去污剂基料中作为清洗剂；在纺织行业用于淀粉脱浆；烘培应用；饮料行业；在油田的钻探工艺中；给循环纸上墨；和动物饲料中。

淀粉酶通过大量的微生物产生，这些微生物包括杆菌属(Bacillus)和曲霉属(Aspergillus)，商业上的大部分淀粉酶是产生自细菌来源，例如地衣芽孢杆菌(Bacillus licheniformis)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、枯草芽胞杆菌(Bacillus subtilis)或嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)。近些年，商业应用中的淀粉酶主要是那些来自地衣芽孢杆菌的淀粉酶，这是由于它们至少在中性和弱碱性pH下的热稳定性和性能。

在商业上，葡糖淀粉酶被用于进一步水解玉米淀粉，而该玉米淀粉已经用α-淀粉酶部分地水解。然后在该反应中产生的葡萄糖可能通过葡萄糖异构酶转化为葡萄糖和果糖的混合物。该混合物，或富含果糖的混合物，便是已在世界范围内商业化的高果糖玉米糖浆。通常，淀粉到果糖的加工包括四个步骤：颗粒状淀粉的液化，液化的淀粉被糖化为右旋葡萄糖，纯化，和异构化为果糖。淀粉液化过程的目标是将淀粉聚合物颗粒的浓缩悬液转化为低粘度的可溶的链长更短的糊精的溶液。

最广泛使用的葡糖淀粉酶是从真菌黑曲霉(Aspergillus niger)产生的。该酶在商业应用中遇到的一个问题是其热稳定性相对较低。已经报导了许多其它的真菌葡糖淀粉酶，包括根霉属(Rizopus)、梭孢壳属(Thielavia)、Thermoascus和篮状菌属(Talaromyces)，以及来自嗜热真菌棉状嗜热丝孢菌(Thermomyceslanuginosus)的葡糖淀粉酶。

通常，淀粉到果糖的加工包括四个步骤：颗粒淀粉的液化，液化的淀粉糖化为葡萄糖，纯化，和异构化为果糖。淀粉液化步骤的目的是将淀粉聚合物颗粒的浓缩悬液转化为低粘度的可溶性短链糊精溶液。该步骤对于用标准设备便利地处理和有效转化为葡萄糖或其它糖是必要的。为了液化颗粒淀粉，必须通过将颗粒淀粉的温度升高到高于大约72℃以使颗粒凝胶化(gelatinize)。加热过程可以瞬间破坏不溶性淀粉颗粒从而产生水溶性淀粉溶液。然后通过淀粉酶将溶解的淀粉溶液液化。淀粉颗粒包括：69-74％支链淀粉，26-31％直链淀粉，11-14％水，0.2-0.4％蛋白质，0.5-0.9％脂质，0.05-0.1％灰分，0.02-0.03％磷，0.1％戊聚糖。大约70％的颗粒是非晶态的，30％是晶态的。

常见的酶促液化步骤涉及通过加入氢氧化钙、氢氧化钠或碳酸钠将颗粒淀粉浆料的pH值调节到6.0到6.5之间，这是来源于地衣芽孢杆菌的α-淀粉酶的最适pH值。加入氢氧化钙还有一个优点，就是可以提供钙离子，已知钙离子能够稳定α-淀粉酶以免其发生失活。一旦加入α-淀粉酶，就泵出悬液通过蒸气喷嘴，这样可以将温度瞬间升高到80℃到115℃之间。淀粉被立刻凝胶化，并且由于存在α-淀粉酶，通过α-淀粉酶随机水解(1-4)糖苷键，其被解聚为易于抽吸的流体物质。

在液化步骤的第二种变化形式中，α-淀粉酶被加入到淀粉悬液中，该悬液被保持在80-100℃的温度以部分地水解淀粉颗粒，然后部分水解的淀粉悬液被泵出通过喷嘴，其温度超过大约105℃，从而彻底地凝胶化任何剩余的颗粒结构。在冷却凝胶化的淀粉后，再次加入α-淀粉酶，以进一步水解淀粉。

该步骤的第三种变化形式被称作干磨方法。在干磨法中，将全粒研磨，并且与水混合。通过漂浮分离或等效的技术任选地去除胚芽。用α-淀粉酶液化所得到的混合物，该混合物含有淀粉、纤维、蛋白质和谷物的其它成分。当使用干磨法时，本技术领域通常的实践是采取在较低温度下进行酶促液化。通常，在将淀粉转化为可溶性糊精时，认为低温液化比高温液化的效率低一些。

典型地，在凝胶化后，淀粉溶液在存在α-淀粉酶的条件下，被保持于提高的温度，直到DE达到10-20，通常需要1-3小时。葡萄糖当量值(DE)是用于量度总还原糖的浓度的行业标准，是以基于干重量来计算的D-葡萄糖来表示。未水解的颗粒淀粉的DE实质上为零，而D-葡萄糖的DE被定义为100。

玉米湿磨是一种产生玉米油、谷蛋白粉、谷蛋白饲料和淀粉的方法。碱性淀粉酶被用于淀粉的液化中，葡糖淀粉酶被用于糖化中，从而产生葡萄糖。玉米是一种包括外种皮(纤维)、淀粉、淀粉和葡萄糖的结合物和内胚芽的谷粒，对其进行四步骤加工，该四步骤加工方法导致产生淀粉。玉米被浸泡，去胚芽，去纤维，最后谷蛋白被分离。在浸泡过程中，去除可溶性物质。去掉可溶性物质后剩余的产物被去胚芽，这样导致产生了玉米油并且产生了油渣，油渣被加入到来自浸泡步骤的可溶物中。剩余产物被去纤维，然后纤维固体被加入到油渣/可溶物混合物中。纤维固体、油渣和可溶物的混合物形成了谷蛋白饲料。在去纤维后，对剩余产物进行谷蛋白分离。由该分离产生了谷蛋白粉和淀粉。然后将淀粉进行液化和糖化，产生葡萄糖。

烘烤产品(如面包)的不新鲜化(staling)已经被认为是随着面包产品的生产时刻和消费时刻之间的时间变长而会变得越来越严重的一个问题。术语不新鲜化被用于描述面包产品在离开烤箱后，不受消费者欢迎的性质变化，如面包屑硬度的增加、面包屑弹性的降低、面包皮发生变化，变得坚韧嚼不动。面包屑的硬度在储存过程中进一步增加到一个被认为是被拒绝的水平。面包屑硬度的增加被认为是不新鲜化的最重要方面，这是可被消费者辨认的，而且是在面包产品变得不适合消费之前的很长一段时间就发生。

在该行业中存在着鉴定和优化对于多种应用有用的淀粉酶的需求，所述应用包括商业化的玉米淀粉液化过程。例如，相对于来自地衣芽孢杆菌的行业标准酶而言，这些第二代酸性淀粉酶将提供改进的生产和/或功能特性。

也存在着鉴别和优化在自动洗碗(ADW)产品和洗衣去污剂中有用的淀粉酶的需求。在ADW产品中，淀粉酶将在存在钙螯合剂和氧化条件的情况下，在pH10-11和45-60℃发挥作用。对于洗衣，将要求在适当的去污剂基料中，在pH 9-10和40℃时有活性。淀粉酶也在织物脱浆、酿造工艺、造纸和纸浆行业中的淀粉改性以及本技术领域的其它工艺中有用。

淀粉酶可以在商业上应用于淀粉加工的初始阶段(液化)；湿玉米碾磨；酒精生产；在去污剂基料中作为清洗剂；在纺织行业用于淀粉脱浆；烘培应用；饮料行业；油田的钻探工艺；给循环纸上墨；和动物饲料中。淀粉酶也在织物脱浆、酿造工艺、纸和纸浆工业中的淀粉改性以及其它过程中有用。

本文中讨论的出版物被提供出来，仅仅是因为它们的公开是在本申请的提交日期之前。此处没有任何内容可以被解释为承认：基于优先发明，本发明没有资格居先拥有这些公开内容。

发明概述

本发明提供了分离的或重组的核酸，包括与本发明的核酸例如本发明的示例性核酸在至少大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多个残基的区域内，具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的核酸序列。一方面，该核酸编码至少一个具有淀粉酶活性的多肽，所述序列同一性通过运用了序列比较算法的分析或通过视觉观察来确定。另一方面，本发明提供了可用作探针的核酸、抑制性分子(例如反义分子、iRNAs)、转录或翻译调控，等等。本发明的示例性核酸包括，含有如下序列中所示的核酸序列的分离的或重组的核酸：SEQ ID NO：1，SEQ ID NO：3，SEQ ID NO：5，SEQ IDNO：9，SEQ ID NO：11，SEQ ID NO：13，SEQ ID NO：15，SEQ ID NO：17，SEQ IDNO：19，SEQ ID NO：21，SEQ ID NO：23，SEQ ID NO：25，SEQ ID NO：27，SEQ IDNO：29，SEQ ID NO：31，SEQ ID NO：33，SEQ ID NO：35，SEQ ID NO：37，SEQ IDNO：39，SEQ ID NO：41，SEQ ID NO：43，SEQ ID NO：45，SEQ ID NO：47，SEQ IDNO：49，SEQ ID NO：51，SEQ ID NO：53，SEQ ID NO：55，SEQ ID NO：57，SEQ IDNO：59，SEQ ID NO：61，SEQ ID NO：63，SEQ ID NO：65，SEQ ID NO：67，SEQ IDNO：69，SEQ ID NO：71，SEQ ID NO：73，SEQ ID NO：75，SEQ ID NO：77，SEQ IDNO：79，SEQ ID NO：81，SEQ ID NO：83，SEQ ID NO：85，SEQ ID NO：87，SEQ IDNO：89，SEQ ID NO：91，SEQ ID NO：93，SEQ ID NO：95，SEQ ID NO：97，SEQ IDNO：99，SEQ ID NO：101，SEQ ID NO：103，SEQ ID NO：105，SEQ ID NO：107，SEQID NO：109，SEQ ID NO：111，SEQ ID NO：113，SEQ ID NO：115，SEQ ID NO：117，SEQ ID NO：119，SEQ ID NO：121，SEQ ID NO：123，SEQ ID NO：125，SEQ IDNO：127，SEQ ID NO：129，SEQ ID NO：131，SEQ ID NO：133，SEQ ID NO：135，SEQ ID NO：137，SEQ ID NO：139，SEQ ID NO：141，SEQ ID NO：143，SEQ IDNO：145，SEQ ID NO：147，SEQ ID NO：149，SEQ ID NO：151，SEQ ID NO：153，SEQ ID NO：155，SEQ ID NO：157，SEQ ID NO：159，SEQ ID NO：161，SEQ IDNO：163，SEQ ID NO：165，SEQ ID NO：167，SEQ ID NO：189，SEQ ID NO：191，SEQ ID NO：193，SEQ ID NO：203，SEQ ID NO：205，SEQ ID NO：207，SEQ IDNO：209，SEQ ID NO：211，SEQ ID NO：322，SEQ ID NO：324，SEQ ID NO：326，SEQID NO：328，SEQ ID NO：330，SEQ ID NO：332，SEQ ID NO：334，SEQ ID NO：336，SEQ ID NO：338，SEQ ID NO：340，SEQ ID NO：342，SEQ ID NO：344，SEQ IDNO：346，SEQ ID NO：348，SEQ ID NO：350，SEQ ID NO：352，SEQ ID NO：354，SEQ ID NO：356，SEQ ID NO：358，SEQ ID NO：360，SEQ ID NO：362，SEQ IDNO：364，SEQ ID NO：366，SEQ ID NO：368，SEQ ID NO：370，SEQ ID NO：372，SEQ ID NO：374，SEQ ID NO：376，SEQ ID NO：378，SEQ ID NO：380，SEQ IDNO：382，SEQ ID NO：384，SEQ ID NO：386，SEQ ID NO：388，SEQ ID NO：390，SEQ ID NO：392，SEQ ID NO：394，SEQ ID NO：396，SEQ ID NO：398，SEQ IDNO：400，SEQ ID NO：402，SEQ ID NO：404，SEQ ID NO：406，SEQ ID NO：408，SEQ ID NO：410，SEQ ID NO：412，SEQ ID NO：414，SEQ ID NO：416，SEQ IDNO：418，SEQ ID NO：420，SEQ ID NO：422，SEQ ID NO：424，SEQ ID NO：426，SEQ ID NO：428，SEQ ID NO：430，SEQ ID NO：432，SEQ ID NO：434，SEQ IDNO：436，SEQ ID NO：438，SEQ ID NO：440，SEQ ID NO：442，SEQ ID NO：444，SEQ ID NO：446，SEQ ID NO：448，SEQ ID NO：450，SEQ ID NO：452，SEQ IDNO：454，SEQ ID NO：456，SEQ ID NO：458，SEQ ID NO：460，SEQ ID NO：460，SEQ ID NO：462，SEQ ID NO：465，SEQ ID NO：467，SEQ ID NO：473，SEQ IDNO：475，SEQ ID NO：478，SEQ ID NO：480，SEQ ID NO：484，SEQ ID NO：486，SEQ ID NO：492，SEQ ID NO：494，SEQ ID NO：498，SEQ ID NO：500，SEQ IDNO：509，SEQ ID NO：511，SEQ ID NO：515，SEQ ID NO：517，SEQ ID NO：517，SEQID NO：519，SEQ ID NO：522，SEQ ID NO：524，SEQ ID NO：527，SEQ ID NO：529，SEQ ID NO：532，SEQ ID NO：534，SEQ ID NO：539，SEQ ID NO：541，SEQ IDNO：544，SEQ ID NO：546，SEQ ID NO：552，SEQ ID NO：554，SEQ ID NO：558，SEQ ID NO：560，SEQ ID NO：565，SEQ ID NO：567，SEQ ID NO：569，SEQ IDNO：571，SEQ ID NO：573，SEQ ID NO：575，SEQ ID NO：577，SEQ ID NO：579，SEQ ID NO：581，SEQ ID NO：583，SEQ ID NO：585，SEQ ID NO：587，SEQ IDNO：593，SEQ ID NO：603，SEQ ID NO：605，SEQ ID NO：607，SEQ ID NO：609，SEQ ID NO：611，SEQ ID NO：613，SEQ ID NO：615，SEQ ID NO：617，SEQ ID NO：619或SEQ ID NO：621，及其子序列，例如长度至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500或更多残基，或者基因或转录物的全长范围内。

本发明的示例性核酸也包括，编码本发明的多肽的分离的或重组的核酸，本发明的多肽例如具有如下序列中所示序列的示例性多肽：SEQ ID NO：2，SEQ IDNO：4，SEQ ID NO：6，SEQ ID NO：10，SEQ ID NO：12，SEQ ID NO：14，SEQ IDNO：16，SEQ ID NO：18，SEQ ID NO：20，SEQ ID NO：22，SEQ ID NO：24，SEQ IDNO：26，SEQ ID NO：28，SEQ ID NO：30，SEQ ID NO：32，SEQ ID NO：34，SEQ IDNO：36，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ IDNO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ IDNO：56，SEQ ID NO：58，SEQ ID NO：60，SEQ ID NO：62，SEQ ID NO：64，SEQ IDNO：66，SEQ ID NO：68，SEQ ID NO：70，SEQ ID NO：72，SEQ ID NO：74，SEQ IDNO：76，SEQ ID NO：78，SEQ ID NO：80，SEQ ID NO：82，SEQ ID NO：84，SEQ IDNO：86，SEQ ID NO：88，SEQ ID NO：90，SEQ ID NO：92，SEQ ID NO：94，SEQ IDNO：96，SEQ ID NO：98，SEQ ID NO：100，SEQ ID NO：102，SEQ ID NO：104，SEQID NO：106，SEQ ID NO：108，SEQ ID NO：110，SEQ ID NO：112，SEQ ID NO：114，SEQ ID NO：116，SEQ ID NO：118，SEQ ID NO：120，SEQ ID NO：122，SEQ IDNO：124，SEQ ID NO：126，SEQ ID NO：128，SEQ ID NO：130，SEQ ID NO：132，SEQ ID NO：134，SEQ ID NO：136，SEQ ID NO：138，SEQ ID NO：140，SEQ IDNO：142，SEQ ID NO：144，SEQ ID NO：146，SEQ ID NO：148，SEQ ID NO：150，SEQ ID NO：152，SEQ ID NO：154，SEQ ID NO：156，SEQ ID NO：158，SEQ IDNO：160，SEQ ID NO：162，SEQ ID NO：164，SEQ ID NO：166，SEQ ID NO：168，SEQ ID NO：190，SEQ ID NO：192，SEQ ID NO：194，SEQ ID NO：204，SEQ IDNO：206，SEQ ID NO：208，SEQ ID NO：210，SEQ ID NO：212，SEQ ID NO：323，SEQ ID NO：325，SEQ ID NO：327，SEQ ID NO：329，SEQ ID NO：331，SEQ IDNO：333，SEQ ID NO：335，SEQ ID NO：337，SEQ ID NO：339，SEQ ID NO：341，SEQ ID NO：343，SEQ ID NO：345，SEQ ID NO：347，SEQ ID NO：349，SEQ IDNO：351，SEQ ID NO：353，SEQ ID NO：355，SEQ ID NO：357，SEQ ID NO：359，SEQ ID NO：361，SEQ ID NO：363，SEQ ID NO：365，SEQ ID NO：367，SEQ IDNO：369，SEQ ID NO：371，SEQ ID NO：373，SEQ ID NO：375，SEQ ID NO：377，SEQ ID NO：379，SEQ ID NO：381，SEQ ID NO：383，SEQ ID NO：385，SEQ IDNO：387，SEQ ID NO：389，SEQ ID NO：391，SEQ ID NO：393，SEQ ID NO：395，SEQ ID NO：397，SEQ ID NO：399，SEQ ID NO：401，SEQ ID NO：403，SEQ IDNO：405，SEQ ID NO：407，SEQ ID NO：409，SEQ ID NO：411，SEQ ID NO：413，SEQID NO：415，SEQ ID NO：417，SEQ ID NO：419，SEQ ID NO：421，SEQ ID NO：423，SEQ ID NO：425，SEQ ID NO：427，SEQ ID NO：429，SEQ ID NO：431，SEQ IDNO：433，SEQ ID NO：435，SEQ ID NO：437，SEQ ID NO：439，SEQ ID NO：441，SEQ ID NO：443，SEQ ID NO：445，SEQ ID NO：447，SEQ ID NO：449，SEQ IDNO：451，SEQ ID NO：453，SEQ ID NO：455，SEQ ID NO：457，SEQ ID NO：459，SEQ ID NO：461，SEQ ID NO：461，SEQ ID NO：463，SEQ ID NO：464，SEQ IDNO：466，SEQ ID NO：468，SEQ ID NO：469，SEQ ID NO：470，SEQ ID NO：471，SEQ ID NO：472，SEQ ID NO：474，SEQ ID NO：476，SEQ ID NO：477，SEQ IDNO：479，SEQ ID NO：481，SEQ ID NO：482，SEQ ID NO：483，SEQ ID NO：485，SEQ ID NO：487，SEQ ID NO：488，SEQ ID NO：489，SEQ ID NO：490，SEQ IDNO：491，SEQ ID NO：493，SEQ ID NO：495，SEQ ID NO：496，SEQ ID NO：497，SEQ ID NO：499，SEQ ID NO：501，SEQ ID NO：502，SEQ ID NO：503，SEQ IDNO：504，SEQ ID NO：505，SEQ ID NO：506，SEQ ID NO：507，SEQ ID NO：508，SEQ ID NO：510，SEQ ID NO：512，SEQ ID NO：513，SEQ ID NO：514，SEQ IDNO：516，SEQ ID NO：518，SEQ ID NO：518，SEQ ID NO：520，SEQ ID NO：521，SEQ ID NO：523，SEQ ID NO：525，SEQ ID NO：526，SEQ ID NO：528，SEQ IDNO：530，SEQ ID NO：531，SEQ ID NO：533，SEQ ID NO：535，SEQ ID NO：536，SEQ ID NO：537，SEQ ID NO：538，SEQ ID NO：540，SEQ ID NO：542，SEQ IDNO：543，SEQ ID NO：545，SEQ ID NO：547，SEQ ID NO：548，SEQ ID NO：549，SEQ ID NO：550，SEQ ID NO：551，SEQ ID NO：553，SEQ ID NO：555，SEQ IDNO：556，SEQ ID NO：557，SEQ ID NO：559，SEQ ID NO：561，SEQ ID NO：562，SEQ ID NO：563，SEQ ID NO：564，SEQ ID NO：566，SEQ ID NO：568，SEQ IDNO：570，SEQ ID NO：572，SEQ ID NO：574，SEQ ID NO：576，SEQ ID NO：578，SEQ ID NO：580，SEQ ID NO：582，SEQ ID NO：584，SEQ ID NO：586，SEQ IDNO：588，SEQ ID NO：589，SEQ ID NO：590，SEQ ID NO：591，SEQ ID NO：592，SEQ ID NO：594，SEQ ID NO：604，SEQ ID NO：606，SEQ ID NO：608，SEQ IDNO：610，SEQ ID NO：612，SEQ ID NO：614，SEQ ID NO：616，SEQ ID NO：618，SEQ ID NO：620或SEQ ID NO：622，及其子序列和其变体，以及与本发明的示例性多肽具有至少大约50％(或更多，正如下面所描述的)序列同一性的多肽。一方面，该多肽具有淀粉酶活性，例如α淀粉酶或葡糖淀粉酶活性(下面进一步描述了可选择的淀粉酶活性)。一方面，该多肽作为免疫原或表位(epitope)发挥作用。

一方面，本发明也提供了编码淀粉酶的核酸，其共同的新颖性在于它们来源于混合培养物。本发明提供了从混合培养物分离的编码淀粉酶的核酸，所述核酸包括在至少大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多残基的区域内，与本发明的示例性核酸具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的核酸序列，其中该核酸编码至少一个具有淀粉酶活性的多肽，所述序列同一性通过运用了序列比较算法的分析或通过视觉观察来确定。一方面，本发明提供了分离自混合培养物的编码淀粉酶的核酸，所述核酸包括本发明的核酸，例如本发明的示例性核酸，例如SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQID NO：9、SEQ ID NO：11等中所示的序列，及其子序列，例如长度为至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500或更多残基，或基因或转录物的全长范围内；或者，编码本发明的多肽的核酸。

一方面，本发明也提供了编码淀粉酶的核酸，其共同的新颖性在于它们来源于环境来源，例如混合的环境来源。一方面，本发明也提供了从环境来源例如混合的环境来源分离的编码淀粉酶的核酸，所述核酸包括在至少大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多残基的区域内，与本发明的示例性核酸具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的核酸序列，其中该核酸编码至少一个具有淀粉酶活性的多肽，所述序列同一性通过运用了序列比较算法的分析或通过视觉观察来确定。一方面，本发明提供了分离自环境来源例如混合的环境来源的编码淀粉酶的核酸，所述核酸包括本发明的核酸，例如本发明的示例性核酸，如SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：9、SEQ ID NO：11等、SEQ ID NO：583、SEQ ID NO：585所示的核酸序列，及其子序列，例如长度为至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500或更多残基，或基因的全长或转录物的全长的范围内；或者，编码本发明的多肽的核酸。

一方面，本发明也提供了淀粉酶和编码淀粉酶的核酸，其共同的新颖性在于它们来源于古细菌来源，包括SEQ ID NO：80(由SEQ ID NO：79编码)、SEQ IDNO：82(由SEQ ID NO：81编码)、SEQ ID NO：116(由SEQ ID NO：115编码)、SEQID NO：323(由SEQ ID NO：322编码)、SEQ ID NO：570(由SEQ ID NO：169编码)的古细菌来源的淀粉酶。

一方面，序列比较算法是BLAST 2.2.2版本算法，其中过滤设置(filteringsetting)被设置为blastall-p blastp-d“nr pataa”-FF，所有其它选项被设置为缺省。

本发明的另一个方面是分离的或重组的核酸，其包括本发明的核酸序列、与其基本上同一的序列、与其互补的序列的至少10个连续碱基。

一方面，淀粉酶活性包括α-淀粉酶活性，包括水解淀粉中的内α-1，4-糖苷键，从而产生更小分子量的麦芽糊精(malto-dextrins)的能力。一方面，α-淀粉酶活性包括随机地水解淀粉中的内部α-1，4-糖苷键。淀粉酶活性可以包括α-淀粉酶活性、β-淀粉酶活性、葡糖淀粉酶活性、1，4-α-D-葡聚糖葡糖水解酶活性、外切淀粉酶活性、葡聚糖α-麦芽四糖水解酶活性、麦芽糖酶活性、异麦芽糖酶活性、葡聚糖1，4，α-葡糖苷酶活性、α-葡糖苷酶活性、蔗糖酶活性或琼脂糖酶活性(例如β-琼脂糖酶活性)。

淀粉酶活性可以包括水解糖苷键。一方面，糖苷键包括α-1，4-糖苷键。另一方面，糖苷键包括α-1，6-糖苷键。一方面，淀粉酶活性包括水解淀粉中的糖苷键，所述淀粉例如液化的淀粉。淀粉酶活性可以进一步包括将糖苷键水解为麦芽糊精。一方面，淀粉酶活性包括从淀粉的非还原末端切割麦芽糖或D-葡萄糖单元。

一方面，分离的或重组的核酸编码具有淀粉酶活性的多肽，该多肽是热稳定的。该多肽在如下温度下可以保持淀粉酶活性：从大约0℃到大约37℃或从大约37℃到大约95℃或更高温度——例如98℃、100℃或更高——之间的任何温度范围内；大约55℃到大约85℃之间、大约70℃到大约95℃之间，或大约90℃到大约95℃之间。例如，具有如SEQ ID NO：437中所示序列的示例性多肽是热稳定的，在不加入钙的情况下在100℃保持25分钟后可以保留50％的活性。

另一方面，分离的或重组的核酸编码具有淀粉酶活性的多肽，该多肽是耐热的。该多肽在暴露于如下温度后可以保持淀粉酶活性：从大于37℃到大约95℃的范围内，或从大于55℃到大约85℃之间的任何温度。一方面，该多肽在暴露于从大于90℃到大约95℃的温度范围内的温度和pH 4.5后可以保留住淀粉酶活性。

本发明提供了分离的或重组的核酸，其包括在严紧(stringent)条件下与本发明的核酸例如本发明的示例性核酸杂交的序列，所述的示例性核酸包括如下序列中所示的序列：SEQ ID NO：1，SEQ ID NO：3，SEQ ID NO：5，SEQ ID NO：9，SEQID NO：11，SEQ ID NO：13，SEQ ID NO：15，SEQ ID NO：17，SEQ ID NO：19，SEQID NO：21，SEQ ID NO：23，SEQ ID NO：25，SEQ ID NO：27，SEQ ID NO：29，SEQID NO：31，SEQ ID NO：33，SEQ ID NO：35，SEQ ID NO：37，SEQ ID NO：39，SEQID NO：41，SEQ ID NO：43，SEQ ID NO：45，SEQ ID NO：47，SEQ ID NO：49，SEQID NO：51，SEQ ID NO：53，SEQ ID NO：55，SEQ ID NO：57，SEQ ID NO：59，SEQID NO：61，SEQ ID NO：63，SEQ ID NO：65，SEQ ID NO：67，SEQ ID NO：69，SEQID NO：71，SEQ ID NO：73，SEQ ID NO：75，SEQ ID NO：77，SEQ ID NO：79，SEQID NO：81，SEQ ID NO：83，SEQ ID NO：85，SEQ ID NO：87，SEQ ID NO：89，SEQID NO：91，SEQ ID NO：93，SEQ ID NO：95，SEQ ID NO：97，SEQ ID NO：99，SEQID NO：101，SEQ ID NO：103，SEQ ID NO：105，SEQ ID NO：107，SEQ ID NO：109，SEQ ID NO：111，SEQ ID NO：113，SEQ ID NO：115，SEQ ID NO：117，SEQ IDNO：119，SEQ ID NO：121，SEQ ID NO：123，SEQ ID NO：125，SEQ ID NO：127，SEQID NO：129，SEQ ID NO：131，SEQ ID NO：133，SEQ ID NO：135，SEQ ID NO：137，SEQ ID NO：139，SEQ ID NO：141，SEQ ID NO：143，SEQ ID NO：145，SEQ IDNO：147，SEQ ID NO：149，SEQ ID NO：151，SEQ ID NO：153，SEQ ID NO：155，SEQ ID NO：157，SEQ ID NO：159，SEQ ID NO：161，SEQ ID NO：163，SEQ IDNO：165，SEQ ID NO：167，SEQ ID NO：189，SEQ ID NO：191，SEQ ID NO：193，SEQ ID NO：203，SEQ ID NO：205，SEQ ID NO：207，SEQ ID NO：209，SEQ IDNO：211，SEQ ID NO：322，SEQ ID NO：324，SEQ ID NO：326，SEQ ID NO：328，SEQID NO：330，SEQ ID NO：332，SEQ ID NO：334，SEQ ID NO：336，SEQ ID NO：338，SEQ ID NO：340，SEQ ID NO：342，SEQ ID NO：344，SEQ ID NO：346，SEQ IDNO：348，SEQ ID NO：350，SEQ ID NO：352，SEQ ID NO：354，SEQ ID NO：356，SEQ ID NO：358，SEQ ID NO：360，SEQ ID NO：362，SEQ ID NO：364，SEQ IDNO：366，SEQ ID NO：368，SEQ ID NO：370，SEQ ID NO：372，SEQ ID NO：374，SEQ ID NO：376，SEQ ID NO：378，SEQ ID NO：380，SEQ ID NO：382，SEQ IDNO：384，SEQ ID NO：386，SEQ ID NO：388，SEQ ID NO：390，SEQ ID NO：392，SEQ ID NO：394，SEQ ID NO：396，SEQ ID NO：398，SEQ ID NO：400，SEQ IDNO：402，SEQ ID NO：404，SEQ ID NO：406，SEQ ID NO：408，SEQ ID NO：410，SEQ ID NO：412，SEQ ID NO：414，SEQ ID NO：416，SEQ ID NO：418，SEQ IDNO：420，SEQ ID NO：422，SEQ ID NO：424，SEQ ID NO：426，SEQ ID NO：428，SEQ ID NO：430，SEQ ID NO：432，SEQ ID NO：434，SEQ ID NO：436，SEQ IDNO：438，SEQ ID NO：440，SEQ ID NO：442，SEQ ID NO：444，SEQ ID NO：446，SEQ ID NO：448，SEQ ID NO：450，SEQ ID NO：452，SEQ ID NO：454，SEQ IDNO：456，SEQ ID NO：458，SEQ ID NO：460，SEQ ID NO：460，SEQ ID NO：462，SEQ ID NO：465，SEQ ID NO：467，SEQ ID NO：473，SEQ ID NO：475，SEQ IDNO：478，SEQ ID NO：480，SEQ ID NO：484，SEQ ID NO：486，SEQ ID NO：492，SEQ ID NO：494，SEQ ID NO：498，SEQ ID NO：500，SEQ ID NO：509，SEQ IDNO：511，SEQ ID NO：515，SEQ ID NO：517，SEQ ID NO：517，SEQ ID NO：519，SEQID NO：522，SEQ ID NO：524，SEQ ID NO：527，SEQ ID NO：529，SEQ ID NO：532，SEQ ID NO：534，SEQ ID NO：539，SEQ ID NO：541，SEQ ID NO：544，SEQ IDNO：546，SEQ ID NO：552，SEQ ID NO：554，SEQ ID NO：558，SEQ ID NO：560，SEQ ID NO：565，SEQ ID NO：567，SEQ ID NO：569，SEQ ID NO：571，SEQ IDNO：573，SEQ ID NO：575，SEQ ID NO：577，SEQ ID NO：579，SEQ ID NO：581，SEQ ID NO：583，SEQ ID NO：585，SEQ ID NO：587，SEQ ID NO：593，SEQ IDNO：603，SEQ ID NO：605，SEQ ID NO：607，SEQ ID NO：609，SEQ ID NO：611，SEQID NO：613，SEQ ID NO：615，SEQ ID NO：617，SEQ ID NO：619或SEQ ID NO：621，或其片段或其子序列。一方面，该核酸编码具有淀粉酶活性的多肽。该核酸的长度可以是至少大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500或更多残基，或基因的全长或转录物的全长。一方面，严紧条件包括洗涤步骤，包括在0.2X SSC中在大约65℃的温度洗涤大约15分钟。

本发明提供了核酸探针，用于鉴定编码具有淀粉酶活性的多肽的核酸，其中所述探针含有核酸序列的至少大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多个连续碱基，所述核酸序列包括本发明的序列或其片段或其子序列，其中所述探针通过结合或杂交来鉴定核酸。该探针可以包括寡核苷酸，该寡核苷酸含有核酸序列的至少大约10到50、大约20到60、大约30到70、大约40到80或大约60到100个连续碱基，所述核酸序列包括本发明的序列或其片段或其子序列。

本发明提供了核酸探针，用于鉴定编码具有淀粉酶活性的多肽的核酸，其中所述探针包括含有与本发明的核酸在至少大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多残基的区域内具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的序列的核酸，其中序列同一性通过运用序列比较算法的分析或通过视觉观察来确定。

该探针可以包括寡核苷酸，该寡核苷酸含有本发明的核酸序列或其子序列的至少大约10到50、大约20到60、大约30到70、大约40到80或大约60到100个连续碱基。

本发明提供了扩增引物序列对，用于扩增编码具有淀粉酶活性的多肽的核酸，其中该引物对能够扩增含有本发明的序列或其片段或子序列的核酸。扩增引物序列对的一个或每一个成员可以包括寡核苷酸，该寡核苷酸包括该序列的至少大约10到50个连续碱基。

本发明提供了扩增核酸的方法，其中所述核酸编码具有淀粉酶活性的多肽，所述方法包括用能扩增本发明的核酸序列或其片段或子序列的扩增引物序列对扩增模板核酸。

本发明提供了包含本发明的核酸或其子序列的表达序列盒。一方面，表达序列盒可以包含可操作地连接到启动子上的核酸。启动子可以是病毒、细菌、哺乳动物或植物启动子。一方面，植物启动子可以是马铃薯、稻、玉米、小麦、烟草或大麦启动子。启动子可以是组成型启动子。组成型启动子可以包括CaMV35S。另一方面，启动子可以是诱导型启动子。一方面，启动子可以是组织特异性启动子或环境调节型或发育调节型启动子。因此，启动子可以是，例如种子特异性、叶特异性、根特异性、茎特异性或脱落诱导启动子。一方面，表达序列盒可以进一步包括植物或植物病毒表达载体。

本发明提供了克隆媒介物，包括本发明的表达序列盒(例如载体)或本发明的核酸。克隆载体可以是病毒载体、质粒、噬菌体(phage)、噬粒、粘粒(cosmid)、fos-质粒(fosmid)、细菌噬菌体(bacteriophage)或人工染色体。病毒载体可以包括腺病毒载体、逆转录病毒载体或腺相关病毒载体。克隆载体可以包括细菌人工染色体(BAC)、质粒、细菌噬菌体P1衍生载体(PAC)、酵母人工染色体(YAC)或哺乳动物人工染色体(MAC)。

本发明提供了包含本发明所述核酸或本发明所述表达序列盒(例如载体)或本发明所述克隆载体的转化细胞。一方面，转化细胞可以是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或植物细胞。一方面，植物细胞可以是马铃薯、小麦、稻、玉米、烟草或大麦细胞。

本发明提供了包含本发明所述核酸或本发明所述表达序列盒(例如载体)的转基因非人动物。一方面，该动物是小鼠。

本发明提供了包含本发明所述核酸或本发明所述表达序列盒(例如载体)的转基因植物。转基因植物可以是玉米植物、马铃薯植物、番茄植物、小麦植物、含油种子植物、油菜籽植物、大豆植物、水稻植物、大麦植物或烟草植物。

本发明提供了包含本发明所述核酸或本发明所述表达序列盒(例如载体)的转基因种子。转基因种子可以是玉米种子、小麦粒、含油种子、油菜籽、大豆种子、棕榈核、向日葵种子、芝麻种子、花生或烟草植物种子。

本发明提供了包含与本发明的核酸互补的核酸序列或能与本发明的核酸在严紧条件下杂交的核酸序列的反义寡核苷酸。本发明提供了抑制淀粉酶信息在细胞中翻译的方法，该方法包括给细胞施用反义寡核苷酸或在细胞中表达反义寡核苷酸，所述反义寡核苷酸包括与本发明的核酸互补的核酸序列或能与本发明的核酸在严紧条件下杂交的核酸序列。

本发明提供了分离的或重组的多肽，其包括在至少大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多个残基的区域内或者在多肽的全长区域内，与本发明的示例性多肽或肽具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的氨基酸序列，序列同一性通过运用序列比较算法的分析或通过视觉观察来确定。本发明的示例性多肽或肽序列包括SEQ IDNO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：10，SEQ ID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQ ID NO：18，SEQ ID NO：20，SEQ ID NO：22，SEQ ID NO：24，SEQ ID NO：26，SEQ ID NO：28，SEQ ID NO：30，SEQ ID NO：32，SEQ ID NO：34，SEQ ID NO：36，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60，SEQ ID NO：62，SEQ ID NO：64，SEQ ID NO：66，SEQ ID NO：68，SEQ ID NO：70，SEQ ID NO：72，SEQ ID NO：74，SEQ ID NO：76，SEQ ID NO：78，SEQ ID NO：80，SEQ ID NO：82，SEQ ID NO：84，SEQ ID NO：86，SEQ ID NO：88，SEQ ID NO：90，SEQ ID NO：92，SEQ ID NO：94，SEQ ID NO：96，SEQ ID NO：98，SEQ ID NO：100，SEQ ID NO：102，SEQ ID NO：104，SEQ ID NO：106，SEQ ID NO：108，SEQ ID NO：110，SEQ ID NO：112，SEQ IDNO：114，SEQ ID NO：116，SEQ ID NO：118，SEQ ID NO：120，SEQ ID NO：122，SEQID NO：124，SEQ ID NO：126，SEQ ID NO：128，SEQ ID NO：130，SEQ ID NO：132，SEQ ID NO：134，SEQ ID NO：136，SEQ ID NO：138，SEQ ID NO：140，SEQ IDNO：142，SEQ ID NO：144，SEQ ID NO：146，SEQ ID NO：148，SEQ ID NO：150，SEQ ID NO：152，SEQ ID NO：154，SEQ ID NO：156，SEQ ID NO：158，SEQ IDNO：160，SEQ ID NO：162，SEQ ID NO：164，SEQ ID NO：166，SEQ ID NO：168，SEQ ID NO：190，SEQ ID NO：192，SEQ ID NO：194，SEQ ID NO：204，SEQ IDNO：206，SEQ ID NO：208，SEQ ID NO：210，SEQ ID NO：212，SEQ ID NO：323，SEQ ID NO：325，SEQ ID NO：327，SEQ ID NO：329，SEQ ID NO：331，SEQ IDNO：333，SEQ ID NO：335，SEQ ID NO：337，SEQ ID NO：339，SEQ ID NO：341，SEQ ID NO：343，SEQ ID NO：345，SEQ ID NO：347，SEQ ID NO：349，SEQ IDNO：351，SEQ ID NO：353，SEQ ID NO：355，SEQ ID NO：357，SEQ ID NO：359，SEQ ID NO：361，SEQ ID NO：363，SEQ ID NO：365，SEQ ID NO：367，SEQ IDNO：369，SEQ ID NO：371，SEQ ID NO：373，SEQ ID NO：375，SEQ ID NO：377，SEQ ID NO：379，SEQ ID NO：381，SEQ ID NO：383，SEQ ID NO：385，SEQ IDNO：387，SEQ ID NO：389，SEQ ID NO：391，SEQ ID NO：393，SEQ ID NO：395，SEQ ID NO：397，SEQ ID NO：399，SEQ ID NO：401，SEQ ID NO：403，SEQ IDNO：405，SEQ ID NO：407，SEQ ID NO：409，SEQ ID NO：411，SEQ ID NO：413，SEQID NO：415，SEQ ID NO：417，SEQ ID NO：419，SEQ ID NO：421，SEQ ID NO：423，SEQ ID NO：425，SEQ ID NO：427，SEQ ID NO：429，SEQ ID NO：431，SEQ IDNO：433，SEQ ID NO：435，SEQ ID NO：437，SEQ ID NO：439，SEQ ID NO：441，SEQ ID NO：443，SEQ ID NO：445，SEQ ID NO：447，SEQ ID NO：449，SEQ IDNO：451，SEQ ID NO：453，SEQ ID NO：455，SEQ ID NO：457，SEQ ID NO：459，SEQ ID NO：461，SEQ ID NO：461，SEQ ID NO：463，SEQ ID NO：464，SEQ IDNO：466，SEQ ID NO：468，SEQ ID NO：469，SEQ ID NO：470，SEQ ID NO：471，SEQ ID NO：472，SEQ ID NO：474，SEQ ID NO：476，SEQ ID NO：477，SEQ IDNO：479，SEQ ID NO：481，SEQ ID NO：482，SEQ ID NO：483，SEQ ID NO：485，SEQ ID NO：487，SEQ ID NO：488，SEQ ID NO：489，SEQ ID NO：490，SEQ IDNO：491，SEQ ID NO：493，SEQ ID NO：495，SEQ ID NO：496，SEQ ID NO：497，SEQ ID NO：499，SEQ ID NO：501，SEQ ID NO：502，SEQ ID NO：503，SEQ IDNO：504，SEQ ID NO：505，SEQ ID NO：506，SEQ ID NO：507，SEQ ID NO：508，SEQ ID NO：510，SEQ ID NO：512，SEQ ID NO：513，SEQ ID NO：514，SEQ IDNO：516，SEQ ID NO：518，SEQ ID NO：518，SEQ ID NO：520，SEQ ID NO：521，SEQ ID NO：523，SEQ ID NO：525，SEQ ID NO：526，SEQ ID NO：528，SEQ IDNO：530，SEQ ID NO：531，SEQ ID NO：533，SEQ ID NO：535，SEQ ID NO：536，SEQ ID NO：537，SEQ ID NO：538，SEQ ID NO：540，SEQ ID NO：542，SEQ IDNO：543，SEQ ID NO：545，SEQ ID NO：547，SEQ ID NO：548，SEQ ID NO：549，SEQ ID NO：550，SEQ ID NO：551，SEQ ID NO：553，SEQ ID NO：555，SEQ IDNO：556，SEQ ID NO：557，SEQ ID NO：559，SEQ ID NO：561，SEQ ID NO：562，SEQ ID NO：563，SEQ ID NO：564，SEQ ID NO：566，SEQ ID NO：568，SEQ IDNO：570，SEQ ID NO：572，SEQ ID NO：574，SEQ ID NO：576，SEQ ID NO：578，SEQ ID NO：580，SEQ ID NO：582，SEQ ID NO：584，SEQ ID NO：586，SEQ IDNO：588，SEQ ID NO：589，SEQ ID NO：590，SEQ ID NO：591，SEQ ID NO：592，SEQ ID NO：594，SEQ ID NO：604，SEQ ID NO：606，SEQ ID NO：608，SEQ IDNO：610，SEQ ID NO：612，SEQ ID NO：614，SEQ ID NO：616，SEQ ID NO：618，SEQ ID NO：620或SEQ ID NO：622，及其子序列和其变体，例如长度为至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多个残基，或者为酶的全长区域内。本发明的示例性多肽或肽序列包括由本发明的核酸编码的序列。本发明的示例性多肽或肽序列包括由本发明的抗体特异性结合的多肽或肽。一方面，本发明的多肽具有至少一种淀粉酶活性，例如α淀粉酶活性。

本发明的另一方面是分离的或重组的多肽或肽，包括本发明的多肽或肽序列、与其基本上同一的序列、与其互补的序列的至少10个连续碱基。

一方面，本发明的多肽或肽的淀粉酶活性包括α-淀粉酶活性，包括水解淀粉中的内α-1，4-糖苷键，以产生更小分子量的麦芽糊精的能力。一方面，α-淀粉酶活性包括随机地水解淀粉中的内部α-1，4-糖苷键。淀粉酶活性可以包括葡糖淀粉酶活性、1，4-α-D-葡聚糖葡糖水解酶活性、α-淀粉酶活性、外切淀粉酶活性或β-淀粉酶活性。淀粉酶活性可以包括水解糖苷键。一方面，糖苷键包括α-1，4-糖苷键。另一方面，糖苷键包括α-1，6-糖苷键。一方面，淀粉酶活性包括水解淀粉中的糖苷键，所述淀粉例如液化的淀粉。淀粉酶活性可以进一步包括将糖苷键水解为麦芽糊精。一方面，淀粉酶活性包括从淀粉的非还原末端切割麦芽糖或D-葡萄糖单元。

一方面，本发明的淀粉酶活性包括葡糖淀粉酶活性，包括催化糖苷键的水解。本发明的葡糖淀粉酶活性可以包括催化D-葡萄糖从淀粉或其它相关糊精的非还原末端逐步水解释放。葡糖淀粉酶活性可以包括1，4-α-D-葡聚糖葡糖水解酶活性。葡糖淀粉酶活性可以包括催化导致产生游离葡萄糖的麦芽糊精水解。葡糖淀粉酶活性可以包括外切淀粉酶活性。葡糖淀粉酶活性可以包括α-淀粉酶或β-淀粉酶活性。被水解的糖苷键可以包括α-1，4-糖苷键或α-1，6-糖苷键。葡糖淀粉酶活性可以包括水解淀粉中的糖苷键。葡糖淀粉酶活性可以进一步包括水解淀粉中的糖苷键，以产生麦芽糊精。葡糖淀粉酶活性可以包括从淀粉的非还原末端切割出麦芽糖或D-葡萄糖单元。

一方面，淀粉酶活性可以是热稳定的。该多肽在如下温度可以保持淀粉酶活性：从大约37℃到大约95℃之间、大约55℃到大约85℃之间、大约70℃到大约95℃之间、或大约90℃到大约95℃之间的温度。另一方面，淀粉酶活性可以是耐热的。该多肽在暴露于从大于37℃到大约95℃的范围内或从大于55℃到大约85℃的范围内的温度后可以保持淀粉酶活性。一方面，该多肽在暴露于大于90℃到大约95℃的范围内的温度和pH 4.5后可以保持淀粉酶活性。

一方面，分离的或重组的多肽可以包括本发明的缺少信号序列的多肽。一方面，分离的或重组的多肽可以包括本发明的含有异源信号序列的多肽，所述异源信号序列例如异源淀粉酶或非淀粉酶信号序列。

一方面，本发明提供了包括在表3中所示的肽的信号序列。一方面，本发明提供了由在表3中所示的肽组成的信号序列。一方面，本发明提供了嵌合蛋白，其包括含有本发明的信号序列的第一结构域和至少第二结构域。该蛋白可以是融合蛋白。第二结构域可以包括酶。该酶可以是淀粉酶(例如本发明的淀粉酶或者其它的淀粉酶)。

一方面，淀粉酶活性包括在大约37℃每毫克蛋白大约10到大约10,000单位，或每毫克蛋白大约100到大约1000单位的范围内的比活性。另一方面，淀粉酶活性包括每毫克蛋白从大约500到大约750单位的比活性。可以选择地，淀粉酶活性包括在37℃每毫克蛋白从大约500到大约1200单位的范围内的比活性。一方面，淀粉酶活性包括在37℃每毫克蛋白从大约750到大约1000单位的范围内的比活性。另一方面，耐热性包括在被加热到高温后，保持在37℃时淀粉酶比活性的至少一半的比活性。可以选择地，耐热性可以包括在被加热到高温后，保持在37℃的每毫克蛋白从大约500到大约1200单位的范围内的比活性。

本发明提供了本发明的分离的或重组的多肽，其中所述多肽包括至少一个糖基化位点。一方面，糖基化可以是N-连接糖基化。一方面，多肽可以在毕赤酵母(P.pastoris)或裂变酵母(S.pombe)中被表达后被糖基化。本发明也提供了将糖基化加入到多肽的方法，或者通过翻译后加工或者通过化学方法，从而改变多肽的性质，例如其热稳定性、可溶性、聚集的倾向以及类似性质。

一方面，多肽可以在包括大约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5或pH 4的条件下保持淀粉酶活性。另一方面，多肽可以在包括大约pH 7、pH 7.5、pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5或pH 11的条件下保持淀粉酶活性。

本发明提供了含有本发明的多肽的蛋白制剂，其中该蛋白制剂包括液体、固体或凝胶。

本发明提供了包含本发明的多肽和第二结构域的异二聚体。一方面，第二域结构可以是多肽，异源二聚体可以是融合蛋白。一方面，第二结构域可以是表位(epitope)或标记物。一方面，本发明提供了包含本发明的多肽的同型二聚体。

本发明提供了具有淀粉酶活性的固定化多肽，其中所述多肽包括本发明的多肽、由本发明的核酸编码的多肽、或含有本发明的多肽和第二结构域的多肽。一方面，多肽可以被固定在细胞、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、平板、阵列或毛细管上。

本发明提供了包含本发明的固定化核酸的阵列。本发明提供了包含本发明的抗体的阵列。

本发明提供了分离的或重组的抗体，其与本发明的多肽或与由本发明的核酸编码的多肽特异性结合。该抗体可以是单克隆或多克隆抗体。本发明提供了包含本发明的抗体的杂交瘤，所述抗体例如，与本发明的多肽或与由本发明的核酸编码的多肽特异性结合的抗体。

本发明提供了包含本发明的多肽的用于动物的食物添加剂，所述多肽例如由本发明的核酸编码的多肽。一方面，食物添加剂中的多肽可以是糖基化的。本发明提供了包含本发明的多肽的可食用的酶传递基质(enzyme delivery matrices)，所述多肽例如由本发明的核酸编码的多肽。一方面，传递基质包括颗粒状物。一方面，多肽可以被糖基化。一方面，淀粉酶活性是耐热的。另一方面，淀粉酶活性是热稳定的。

本发明提供了分离或鉴定具有淀粉酶活性的多肽的方法，该方法包括如下步骤：(a)提供本发明的抗体；(b)提供包含多肽的样品；和(c)将步骤(b)的样品与步骤(a)的抗体在该抗体能与多肽特异性结合的条件下接触，从而分离或鉴定具有淀粉酶活性的多肽。

本发明提供了制备抗淀粉酶抗体的方法，该方法包括以足够的量向非人动物施用本发明的核酸或本发明的多肽或其子序列，所述的量足以产生体液免疫应答，由此制备抗淀粉酶抗体。本发明提供了产生抗淀粉酶免疫的方法，该方法包括以足够的量向非人动物施用本发明的核酸或本发明的多肽或其子序列，所述量足以产生免疫应答。

本发明提供了产生重组多肽的方法，包括如下步骤：(a)提供与启动子可操作地连接的本发明的核酸；和(b)在允许多肽表达的条件下表达步骤(a)的核酸，从而产生重组多肽。一方面，该方法进一步包括用步骤(a)的核酸转化宿主细胞，随后表达步骤(a)的核酸，从而在转化细胞中产生重组多肽。

本发明提供了用于鉴定具有淀粉酶活性的多肽的方法，该方法包括如下步骤：

(a)提供本发明的多肽；或由本发明的核酸编码的多肽；(b)提供淀粉酶底物；和(c)用步骤(b)的底物接触步骤(a)的多肽或其片段或其变体，并且检测底物量的降低或反应产物量的增加，其中底物量的降低或反应产物量的增加检测出具有淀粉酶活性的多肽。一方面，底物可以是淀粉，例如液化的淀粉。

本发明提供了用于鉴定淀粉酶底物的方法，包括如下步骤：(a)提供本发明的多肽；或由本发明的核酸编码的多肽；(b)提供测试底物；和(c)用步骤(b)的测试底物接触步骤(a)的多肽，并且检测底物量的降低或反应产物量的增加，其中底物量的降低或反应产物量的增加检测出作为淀粉酶底物的测试底物。

本发明提供了确定测试化合物是否与多肽特异性结合的方法，包括如下步骤：(a)在允许核酸翻译为多肽的条件下表达核酸或包含核酸的载体，其中所述核酸包括本发明的核酸，或提供本发明的多肽；(b)提供测试化合物；(c)用测试化合物接触多肽；和(d)确定步骤(b)的测试化合物是否与多肽特异性结合。

本发明提供了用于鉴定淀粉酶活性的调节剂的方法，包括如下步骤：(a)提供本发明的多肽，或由本发明的核酸编码的多肽；(b)提供测试化合物；和(c)用步骤(b)的测试化合物接触步骤(a)的多肽，并测定淀粉酶的活性，其中在存在测试化合物的情况下测定的淀粉酶活性与不存在测试化合物的情况下测定的活性相比的变化，提供了该测试化合物调节淀粉酶活性的测定法。一方面，淀粉酶活性可以通过提供淀粉酶底物并检测底物量的降低或反应产物量的增加，或底物量的增加或反应产物量的降低来测量。与没有测试化合物时底物或反应产物的量相比，有测试化合物时底物量的降低或反应产物量的增加鉴定出作为淀粉酶活性的激活剂的测试化合物。与没有测试化合物时底物或反应产物量相比，有测试化合物时底物量的增加或反应产物量的降低鉴定出作为淀粉酶活性的抑制剂的测试化合物。

本发明提供了计算机系统，该系统包括处理器和数据存储设备，其中所述数据存储设备上已经存储了本发明的多肽序列或核酸序列(例如由本发明的核酸编码的多肽)。一方面，计算机系统可以进一步包括序列比较算法和数据存储设备，其中数据存储设备上已经存储了至少一个参考序列。另一方面，序列比较算法包括可指出多态现象的计算机程序。一方面，计算机系统可以进一步包括在所述序列中鉴定一个或多个特征的鉴定器(identifier)。本发明提供了计算机可读介质，其上已经存储了本发明的多肽序列或核酸序列。本发明提供了用于鉴定序列中的特征的方法，包括如下步骤：(a)使用可鉴定序列中的一个或多个特征的计算机程序读取序列，其中所述序列包括本发明的多肽序列或核酸序列；和(b)用所述计算机程序鉴定序列中的一个或多个特征。本发明提供了将第一个序列与第二个序列进行比较的方法，包括如下步骤：(a)通过使用可比较序列的计算机程序读取第一个序列和第二个序列，其中第一个序列包括本发明的多肽序列或核酸序列；和(b)用所述计算机程序确定第一个序列和第二个序列之间的差异。确定第一个序列和第二个序列之间差异的步骤可以进一步包括鉴定多态性的步骤。一方面，该方法可以进一步包括可鉴定序列中的一个或多个特征的鉴定器。另一方面，该方法可以包括使用计算机程序读取第一个序列，并鉴定该序列的一个或多个特征。

本发明提供了从环境样品中分离或回收核酸的方法，所述核酸编码具有淀粉酶活性的多肽，该方法包括如下步骤：(a)提供用于扩增编码具有淀粉酶活性的多肽的核酸的扩增引物序列对，其中所述引物对能扩增本发明的核酸；(b)从环境样品中分离核酸，或处理环境样品，以便样品中的核酸易于与扩增引物对杂交；和(c)将步骤(a)的扩增引物对与步骤(b)的核酸结合，并从环境样品中扩增核酸，从而从环境样品中分离或回收编码具有淀粉酶活性的多肽的核酸。扩增引物对的一个或每一成员可以包括寡核苷酸，该寡核苷酸包含本发明的序列的至少大约10到50个连续碱基。

本发明提供了从环境样品中分离或回收核酸的方法，所述核酸编码具有淀粉酶活性的多肽，该方法包括如下步骤：(a)提供包含本发明的核酸或其子序列的多核苷酸探针；(b)从环境样品分离核酸，或处理环境样品，以便样品中的核酸易于与步骤(a)的多核苷酸探针杂交；(c)将步骤(a)的多核苷酸探针与步骤(b)的分离的核酸或处理的环境样品结合；和(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸，从而从环境样品中分离或回收编码具有淀粉酶活性的多肽的核酸。环境样品可以包括水样品、液体样品、土壤样品、空气样品或生物样品。一方面，生物样品可以来源于细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞或哺乳动物细胞。

本发明提供了产生编码具有淀粉酶活性的多肽的核酸变体的方法，该方法包括如下步骤：(a)提供包括本发明的核酸的模板核酸；和(b)在模板序列中修饰、删除或添加一个或多个核苷酸，或进行修饰、删除和添加的组合，以产生模板核酸的变体。一方面，该方法可以进一步包括表达变体核酸，以产生变体淀粉酶多肽。修饰、添加或删除通过包括如下方法中的方法来引入：易错PCR、重排(shuffling)、寡核苷酸诱导的定向突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变(recursive ensemble mutagenesis)、指数整体诱变、位点特异性诱变、基因再装配、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)或其组合。另一方面，修饰、添加或删除通过如下方法的方法引入：包括重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双重诱变(gapped duplex mutagenesis)、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。

一方面，该方法可以被反复重复，直到产生与模板核酸编码的多肽相比具有改变的或不同的活性或者改变的或不同的稳定性的淀粉酶。一方面，变体淀粉酶多肽是耐热的，在暴露于增高的温度之后可以保持一些活性。另一方面，与模板核酸编码的淀粉酶相比，变体淀粉酶多肽具有增加的糖基化。可以选择地，变体淀粉酶多肽在高温下具有淀粉酶活性，而由模板核酸编码的淀粉酶在高温下没有活性。一方面，该方法可以被反复重复，直到产生具有与模板核酸的密码子使用有所不同的密码子使用的淀粉酶编码序列。另一方面，该方法可以被反复重复，直到产生具有比模板核酸的信息表达或稳定性更高或更低水平的信息表达或稳定性的淀粉酶基因。

本发明提供了在编码具有淀粉酶活性的多肽的核酸中修饰密码子以增加其在宿主细胞中的表达的方法，该方法包括如下步骤：(a)提供编码具有淀粉酶活性的多肽的本发明的核酸；和(b)鉴定步骤(a)的核酸中非优选或较不优选的密码子，用优选的或中度使用(neutrally used)的密码子来代替，所述优选或中度使用的密码子编码与被取代的密码子相同的氨基酸，其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子，非优选或较不优选密码子是在宿主细胞的基因的编码序列中表现不足的密码子，从而修饰核酸以增加其在宿主细胞中的表达。

本发明提供了在编码具有淀粉酶活性的多肽的核酸中修饰密码子的方法，该方法包括如下步骤：(a)提供本发明的核酸；和(b)鉴定步骤(a)的核酸中的密码子，并用不同的密码子来代替，所述不同的密码子编码与被取代的密码子相同的氨基酸，从而修饰在编码淀粉酶的核酸中的密码子。

本发明提供了在编码具有淀粉酶活性的多肽的核酸中修饰密码子以增加其在宿主细胞中的表达的方法，该方法包括如下步骤：(a)提供编码淀粉酶多肽的本发明核酸；和(b)鉴定步骤(a)的核酸中的非优选或较不优选密码子，并用优选的或中度使用的密码子来代替，所述优选或中度使用的密码子编码与被取代的密码子相同的氨基酸，其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子，非优选或较不优选密码子是在宿主细胞的基因的编码序列中表现不足的密码子，从而修饰核酸以增加其在宿主细胞中的表达。

本发明提供了在编码具有淀粉酶活性的多肽的核酸中修饰密码子以降低其在宿主细胞中的表达的方法，该方法包括如下步骤：(a)提供本发明的核酸；和(b)鉴定步骤(a)的核酸中的至少一个优选密码子，并用非优选的或较不优选的密码子来代替，所述非优选或较不优选的密码子编码与被取代的密码子相同的氨基酸，其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子，非优选或较不优选的密码子是在宿主细胞的基因的编码序列中表现不足的密码子，从而修饰核酸以降低其在宿主细胞中的表达。一方面，宿主细胞可以是细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞或哺乳动物细胞。

本发明提供了用于产生核酸文库的方法，所述核酸编码一系列的被修饰的淀粉酶活性位点或底物结合位点，其中被修饰的活性位点或底物结合位点来源于第一核酸，所述第一核酸包含编码第一活性位点或第一底物结合位点的序列，该方法包括如下步骤：(a)提供第一核酸，其编码第一活性位点或第一底物结合位点，其中第一核酸序列包括在严紧条件下与本发明的核酸杂交的序列，所述核酸编码淀粉酶活性位点或淀粉酶底物结合位点；(b)提供一组诱变寡核苷酸，其在第一核酸的多个目标密码子处编码天然发生的氨基酸变体；和(c)使用该组诱变寡核苷酸，产生一组编码活性位点或编码底物结合位点的变体核酸，其在被诱变的每一氨基酸密码子处编码一定范围的氨基酸变化，从而产生编码多个被修饰的淀粉酶活性位点或底物结合位点的核酸文库。一方面，该方法包括通过包括如下方法中的方法诱变步骤(a)的第一核酸：优化的定向进化系统、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、易错PCR、重排、寡核苷酸诱导的定向突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点特异性诱变、基因再装配、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)及其组合。另一方面，该方法包括通过如下方法中的方法诱变步骤(a)的第一核酸或变体：重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双重诱变、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。

本发明提供了产生小分子的方法，包括如下步骤：(a)提供多个能合成或修饰小分子的生物合成酶，其中这些酶中的一种酶包括由本发明的核酸编码的淀粉酶；(b)为步骤(a)的至少一种酶提供底物；和(c)将步骤(b)的底物与这些酶在能促进多个生物催化反应的条件下通过一系列生物催化反应进行反应，以产生小分子。本发明提供了修饰小分子的方法，包括如下步骤：(a)提供淀粉酶，其中该酶包括本发明的多肽，或由本发明的核酸编码的多肽，或其子序列；(b)提供小分子；和(c)将步骤(b)的小分子与步骤(a)的酶在能促进由淀粉酶催化的酶促反应的条件下进行反应，从而通过淀粉酶酶促反应修饰小分子。一方面，该方法可以包括为步骤(a)的酶提供多个小分子底物，从而产生由淀粉酶催化的至少一种酶促反应产生的被修饰小分子的文库。一方面，该方法可以包括多个其它的酶，在有助于这些酶介导的多个生物催化反应的条件下使用这些酶，以形成由多个酶促反应产生的被修饰小分子的文库。另一方面，该方法可以进一步包括测试该文库以确定该文库中是否存在表现出期望活性的特定被修饰小分子的步骤。测试该文库的步骤可以进一步包括系统地去除所有但保留一个用于产生文库中多个被修饰小分子中的一部分的生物催化反应，方法是通过测试被修饰小分子的所述部分中存在或不存在具有期望活性的特定被修饰小分子，鉴定出产生具有期望活性的特定修饰小分子的至少一个特异性生物催化反应。

本发明提供了确定淀粉酶的功能片段的方法，包括如下步骤：(a)提供淀粉酶，其中该酶包括本发明的多肽、或由本发明的核酸编码的多肽、或其子序列；和(b)从步骤(a)的序列删除多个氨基酸残基，并测试剩余的子序列的淀粉酶活性，从而确定淀粉酶的功能片段。一方面，淀粉酶活性通过提供淀粉酶底物并检测底物量的降低或反应产物量的增加来测量。

本发明提供了通过使用实时代谢流量(real-time metabolic flux)分析进行新的或修饰的表现型的全细胞工程的方法，该方法包括如下步骤：(a)通过修饰细胞的遗传组成产生修饰的细胞，其中遗传组成通过将本发明的核酸加入到细胞来修饰；(b)培养修饰的细胞以产生多个修饰的细胞；(c)通过实时监控步骤(b)的细胞培养物来测量该细胞的至少一个代谢参数；和(d)分析步骤(c)的数据，以确定被测量的参数是否与在类似条件下未修饰细胞中的参照测量值不同，从而使用实时代谢流量分析鉴定细胞中的工程表现型。一方面，细胞的遗传组成可以通过包括在细胞中删除一个序列或修饰一个序列，或敲除基因的表达的方法来修饰。一方面，该方法可以进一步包括选择含有新的工程表现型的细胞。另一方面，该方法可以包括培养被选择的细胞，从而产生包含新的工程表型的新细胞株。

本发明提供了水解淀粉的方法，包括如下步骤：(a)提供具有淀粉酶活性的多肽，其中所述多肽包括本发明的多肽；(b)提供包含淀粉的组合物；和(c)用步骤(b)的组合物在所述多肽可水解淀粉的条件下接触步骤(a)的多肽。一方面，含有淀粉的组合物包括α-1，4-糖苷键或α-1，6-糖苷键。一方面，淀粉酶活性是α-淀粉酶活性。一方面，α-淀粉酶活性水解淀粉或其它多糖中的内部键。

本发明提供了从组合物中液化或去除淀粉的方法，包括如下步骤：(a)提供具有淀粉酶活性的多肽，其中所述多肽包括本发明的多肽；(b)提供包含有淀粉的组合物；和(c)用步骤(b)的组合物在该多肽可去除或液化淀粉的条件下接触步骤(a)的多肽。

本发明提供了增加淀粉酶多肽的耐热性或热稳定性的方法，该方法包括糖基化淀粉酶多肽，其中该多肽包括本发明的多肽或由本发明的核酸序列编码的多肽的至少三十个连续氨基酸，从而增加淀粉酶多肽的耐热性或热稳定性。一方面，淀粉酶比活性可以在大于大约37℃到大约95℃的温度范围内是热稳定的或耐热的。

本发明提供了在细胞中过度表达重组淀粉酶多肽的方法，该方法包括表达含有核酸的载体，该核酸包括本发明的核酸或本发明的核酸序列，其中序列同一性通过使用序列比较算法的分析或通过视觉观察来确定，其中过度表达通过使用高活性启动子、双顺反子(dicistronic)载体或通过该载体的基因扩增来实现。

本发明提供了包含本发明的多肽或由本发明的核酸编码的多肽的去污剂组合物，其中所述多肽包括淀粉酶活性。一方面，淀粉酶可以是非表面活性淀粉酶。另一方面，淀粉酶可以是表面活性淀粉酶。

本发明提供了洗涤目标物体的方法，该方法包括如下步骤：(a)提供包含具有淀粉酶活性的多肽的组合物，其中所述多肽包括本发明的多肽或由本发明的核酸编码的多肽；(b)提供目标物体；和(c)在组合物可以洗涤目标物体的条件下用步骤(b)的目标物体接触步骤(a)的多肽。

本发明提供了在被动物食用之前水解淀粉的方法，例如水解在饲料或食品中的淀粉，该方法包括如下步骤：(a)获得包含淀粉的组合物，例如饲料材料，其中多肽包括本发明的多肽或由本发明的核酸编码的多肽；和(b)在足够长的时间期间将足量步骤(a)的多肽加入到组合物，例如饲料或食物材料中，以导致淀粉的水解，从而水解淀粉。一方面，食物或饲料包括稻、玉米、大麦、小麦、豆类或马铃薯。

本发明提供了用于织物脱浆的方法，该方法包括如下步骤：(a)提供具有淀粉酶活性的多肽，其中该多肽包括本发明的多肽或由本发明的核酸编码的多肽；(b)提供织物；和(c)在淀粉酶可以使织物脱浆的条件下用步骤(b)的织物接触步骤(a)的多肽。

本发明提供了用于纸或纤维的脱墨的方法，该方法包括如下步骤：(a)提供具有淀粉酶活性的多肽，其中该多肽包括本发明的多肽；(b)提供含有纸或纤维的组合物；和(c)在多肽可以使纸或纤维脱墨的条件下用步骤(b)的组合物接触步骤(a)的多肽。

本发明提供了处理木素纤维素纤维的方法，该方法包括如下步骤：(a)提供具有淀粉酶活性的多肽，其中该多肽包括本发明的多肽；(b)提供木素纤维素纤维；和(c)在多肽可以处理纤维的条件下用步骤(b)的纤维接触步骤(a)的多肽，从而改进纤维性质。

本发明提供了产生高麦芽糖或高葡萄糖糖浆的方法，该方法包括如下步骤：(a)提供具有淀粉酶活性的多肽，其中该多肽包括本发明的酶；(b)提供含有淀粉的组合物；和(c)在步骤(a)的多肽可以液化步骤(b)的组合物从而产生可溶的淀粉水解产物，并且可以将可溶的淀粉水解产物糖化从而产生糖浆的条件下，用步骤(b)的组合物接触步骤(a)的多肽。一方面，淀粉可以来自稻、玉米、大麦、小麦、豆类、马铃薯或甘薯。

本发明提供了改进含淀粉的生产流体(production fluids)的流动的方法，该方法包括如下步骤：(a)提供具有淀粉酶活性的多肽，其中该多肽包括本发明的多肽；(b)提供生产流体；和(c)在淀粉酶可以水解生产流体中的淀粉从而通过降低其密度来改进其流动的条件下，将步骤(a)的多肽与步骤(b)的生产流体接触。一方面，生产流体可以来自于地下形成(subterannean formation)。

本发明提供了含有本发明的多肽或由本发明的核酸编码的多肽的抗不新鲜化(anti-staling)的组合物。本发明提供了防止焙烤产品变得不新鲜的方法，该方法包括如下步骤：(a)提供具有淀粉酶活性的多肽，其中该多肽包括本发明的多肽；(b)提供用于焙烤的含淀粉组合物；和(c)在多肽可以水解用于焙烤的组合物中的淀粉，从而防止焙烤产品变得不新鲜的条件下，将步骤(a)的多肽与步骤(b)的组合物组合。一方面，焙烤产品可以是面包。

本发明提供了在酿造或酒精生产中使用淀粉酶的方法，该方法包括如下步骤：

(a)提供具有淀粉酶活性的多肽，其中该多肽包括本发明的多肽；(b)提供在酿造或酒精生产中使用的含淀粉的组合物；和(c)在其中多肽可以水解用于酿造或酒精生产的组合物中的淀粉的条件下，将步骤(a)的多肽与步骤(b)的组合物组合。一方面，含淀粉的组合物可以是啤酒。

本发明提供了产生转基因植物的方法，该方法包括如下步骤：(a)将异源核酸序列引入细胞中，其中异源核酸序列包括本发明的核酸序列，从而产生转化的植物细胞；和(b)从转化的细胞产生转基因植物。一方面，步骤(a)可以进一步包括通过植物细胞原生质体的电穿孔或显微注射引入异源核酸序列。另一方面，步骤(a)可以进一步包括通过DNA微粒轰击(DNA particle bombardment)将异源核酸序列直接引入植物组织中。可以选择地，步骤(a)可以进一步包括使用根瘤农杆菌(Agrobacterium tumefaciens)宿主将异源核酸序列引入植物细胞DNA中。一方面，植物细胞可以是马铃薯、玉米、稻、小麦、烟草或大麦细胞。

本发明提供了在植物细胞中表达异源核酸序列的方法，该方法包括如下步骤：(a)用与启动子可操作地连接的的异源核酸序列转化植物细胞，其中异源核酸序列包括本发明的核酸；(b)在异源核酸序列可在植物细胞中被表达的条件下培养所述植物。

本发明也提供了用于制备面团或由该面团制备的焙烤产品的方法，该方法包括以可有效地延迟面包变得不新鲜的用量，在面团中加入本发明的淀粉酶。本发明也提供了含有所述淀粉酶的面团，和含有面粉以及所述淀粉酶的预混合物。最后，本发明提供了酶促焙烤添加剂，其含有所述淀粉酶。根据本发明的淀粉酶的应用提供了改良的抗不新鲜化效果，所述的效果例如表现为更少的面包屑变硬、被保持的面包屑弹性、改进的切片能力(例如更少的面包屑、非粘性面包屑)、改良的口味或香味。

本发明提供了延迟释放(“控释(controlled release)”)组合物，该组合物含有被胶乳聚合物(或等价的)包衣涂覆的期望成分。一方面，所述期望成分包括酶，例如本发明的酶。一方面，所述期望成分包括小分子、药物、多糖、脂质、核酸、维生素、抗生素或杀虫剂。一方面，所述期望成分包括颗粒状物或基质，例如含有可食用材料的颗粒状物或基质(例如作为动物食品或饲料或补充剂或药剂)。本发明也提供了用于组合物的“控释”或“延迟释放”的方法，其中该组合物用胶乳聚合物(或等价的)包衣来涂覆。

一方面，胶乳聚合物包衣包括胶乳颜料或等价物。胶乳聚合物涂层(包衣)可以包括甲基丙烯酸酯、乙酸乙烯、苯乙烯、乙烯、氯乙烯、丁二烯、偏二氯乙烯、叔羧酸乙烯(vinyl versatate)、乙烯基丙酸酯、丙烯酸叔丁酯、丙烯腈、氯丁橡胶、顺丁烯二酸酯、反丁烯二酸酯，其等价物、其组合和/或其衍生物。

本发明的一个或多个实施方案的细节如附图和下面的详述中所示。本发明的其它特征、目标和优点将通过该详述和附图以及权利要求而更加清楚。

此处引述的所有出版物、专利、专利申请、GenBank序列和ATCC保藏物均被特意地引入，以作为参考。

附图简述

图1是一个计算机系统的框图。

图2是一个流程图，该图示意性说明了用于将新核苷酸或蛋白序列与序列数据库进行比较以确定该新序列与数据库中序列之间的同源性水平的过程的一个方面。

图3是一个流程图，该图示意性说明了在计算机中确定两个序列是否同源的过程的一个方面。

图4是一个流程图，该图示意性说明了检测序列中特征的存在的鉴定过程300的一个方面。

图5是一个图表，该图表显示了在实施例1中，各种淀粉酶在加热到90℃10分钟后的残余活性。

图6是一个图表，该图表显示了在使用了漂白剂和鳌合剂的ADW洗涤测试中，酶浓度与被去除的淀粉的净百分比的关系。

图7是一个图表，该图表说明了在pH 8，40℃亲本淀粉酶在55℃的ADW制剂中的活性。

图8是一个图表，其显示了关于实施例4中的新的酶的H₂O₂耐受的数据。

图9是一个图表，其显示了一群选择的被表征的淀粉酶的pH和温度数据。图9A说明了在pH 8和40℃的数据，图9B说明了在pH 10和50℃的数据。

图10描述了在酶的重装配实验中所使用的序列。

图11描述了实施例5的分析中的样品标准曲线。

图12描述了SEQ ID NO：127的pH速度曲线，其具有中性最适pH，以及SEQID NO：211的pH速度曲线，其最适pH在10左右。

图13说明了示例性的淀粉酶与商业酶的稳定性，正如实施例2中所讨论的。

图14显示了超嗜热(hypothermophilic)α-淀粉酶的序列联配，如实施例8中所述。图14A显示了淀粉酶序列的联配。SEQ ID NO.：81＝环境克隆；pyro＝火球菌某种(Pyrococcus sp.)(菌株：KOD1)，Tachibana(1996)J.Ferment.Bioeng.82：224-232；pyro2＝激烈火球菌(Pyrococcus furiosus)，Appl.Environ.Microbiol.63(9)：3569-3576，1997；Thermo＝高温球菌某种(Thermococcus sp.)；Thermo2＝超热古菌(Thermococcus hydrothermalis)，Leveque，E.等人，专利：France 98.056551998年5月5日。图14B显示了被鉴定的序列SEQ ID NO.：81；pyro；SEQ ID NO.：75；SEQ ID NO.：77；SEQ ID NO.：83；SEQ ID NO.：85；thermo2；SEQ ID NO.：79；thermo；pyro2；CLONE A(克隆A)；thermo3的氨基酸序列联配。图14C说明了与图5和6的多肽序列相应的核酸序列联配。SEQ ID NO.：81；SEQ ID NO.：75；SEQ ID NO.：77；SEQ ID NO.：83；SEQ ID NO.：85；SEQ ID NO.：79；克隆A；和SEQ ID NO.：73。Consensus：共有序列。

图15是栖热菌(Thermococcales)的邻位相连进化树(neighbor-joining tree)。

图16A至图16MMMM显示了本发明的示例性序列的序列。

图17示意性说明了用于淀粉的液化糖化的本发明的方法，正如下面详细描述的。

图18描绘了表7，该表列出了本发明的示例性序列的相对的同一性百分比，正如下面在实施例8中描述的。

图19显示了本发明的测试淀粉酶和商业基准酶的pH曲线，正如下面在实施例15中描述的。

图20显示了本发明的示例性淀粉酶的温度活性曲线，正如下面在实施例15中描述的。

图21显示了在存在EDTA的情况下，(本发明的示例性淀粉酶的)酶活性，正如下面在实施例15中描述的。

图22显示了在存在过氧化氢的情况下，(本发明的示例性淀粉酶的)酶活性，正如下面在实施例15中描述的。

图23显示了在使用可溶性底物(BODIPY-淀粉)的ADW溶液(蒸馏水、硬化溶液、漂白剂、螯合剂、表面活性剂)中的(本发明的示例性淀粉酶的)酶活性，正如下面在实施例15中描述的。

图24显示了使用本发明的示例性淀粉酶，在淀粉包被载片的洗涤测试中的结果，正如下面在实施例15中描述的。

图25示意性说明了本发明的示例性玉米湿磨过程(使用本发明的至少一种酶)。

图26、图27和图28示意性说明了本发明的可供选择的示例性淀粉加工过程，包括淀粉液化过程(使用了本发明的至少一种酶)，正如下面详细描述的。

图29显示的数据概括了对干磨乙醇工艺中淀粉酶SEQ ID NO：437和TERMAMYL^TM SC(Novozymes A/S，Denmark)淀粉酶进行比较的这些结果，正如下面在实施例1中所描述的。

图30描述了在醋酸盐缓冲液和磷酸盐缓冲液中的本发明示例性酶(SEQ IDNO：594)的pH活性曲线，确定了葡糖淀粉酶在每一pH的相对速率，正如下面在实施例16中详细讨论的。

图31描述了在醋酸盐缓冲液中的本发明示例性酶(SEQ ID NO：594)的温度活性曲线，正如下面在实施例16中详细讨论的。

图32描绘了本发明的示例性酶(SEQ ID NO：594)的温度稳定性曲线，正如下面在实施例16中详细讨论的。

图33描述了本发明的示例性酶(SEQ ID NO：594)的底物利用活性曲线，其中使用了糊精麦芽糖(G2)、麦芽三糖(G3)、潘糖(Pan)、麦芽四糖(G4)和麦芽七糖(G7)，正如下面在实施例16中详细讨论的。

图34A至E显示了本发明的示例性的编码葡糖淀粉酶的核酸，如SEQ ID NO：587中所示的基因组序列。编码序列(外显子)用单字母氨基酸在其下面表示出来。内含子序列下面加了下划线。

图35A至Y是一个图表，描述了本发明的示例性核酸和多肽的选择的特征，正如下面进一步详细描述的。

在不同的附图中类似的标记符号表示类似的要素。

发明详述

本发明提供了淀粉酶，例如α-淀粉酶，编码这些酶的多核苷酸，以及产生和应用这些多核苷酸和多肽的方法。本发明涉及具有淀粉酶活性例如α-淀粉酶活性的多肽，编码所述新的多肽的核酸，以及与这些新的多肽结合的抗体。本发明的多肽可以在多种诊断、治疗和工业环境中使用。本发明的多肽可以被使用，例如用作去污剂的添加剂、用于加工食品和用于利用逆反应进行化学合成。此外，本发明多肽可以在织物处理、乙醇生产中使用，以及用作食品或动物饲料的添加剂。

一方面，本发明的淀粉酶在高温和/或低温，或者在很大的温度范围内具有活性。例如，它们可以在20℃到90℃、30℃到80℃或40℃到70℃的温度范围内是有活性的。本发明也提供了在碱性pH或在酸性pH例如低水酸度时具有活性的淀粉酶。在可以选择的方面，本发明的淀粉酶可以在低至pH 5.0、pH 4.5、pH 4.0和pH 3.5的酸性pH下具有活性。在可以选择的方面，本发明的淀粉酶可以在高至pH 9.5、pH 10.0、pH 10.5和pH 11的碱性pH下具有活性。一方面，本发明的淀粉酶在低水酸度(低含水量)的条件下，在大约40℃到大约70℃的温度范围内是有活性的。

本发明也提供了进一步修饰本发明的示例性淀粉酶以产生具有期望特性的蛋白质的方法。例如，由本发明的方法产生的淀粉酶可以具有改变的酶活性、热稳定性、pH/活性曲线、pH/稳定性曲线(如在低pH值例如pH＜6或pH＜5或高pH值例如pH＞9时具有增加的稳定性)、抗氧化作用的稳定性、Ca²⁺依赖性、比活性和类似性质。通过本发明可以改变任何感兴趣的特性。例如，该改变可以导致产生变体，该变体与亲本酶相比，具有改变的酶活性、或者pH或温度活性曲线。

定义

术语“淀粉酶”包括催化多糖例如淀粉的水解的所有多肽，例如酶。术语“淀粉酶”包括具有α-淀粉酶活性、β-淀粉酶活性、葡糖淀粉酶活性、1，4-α-D-葡聚糖葡糖水解酶活性、外切淀粉酶活性、葡聚糖α-麦芽四糖水解酶活性、麦芽酶活性、异麦芽酶活性、葡聚糖1，4，α-葡糖苷酶活性、α-葡糖苷酶活性、蔗糖酶或琼脂糖酶活性(例如β-琼脂糖酶活性)的多肽。例如，本发明的淀粉酶活性包括α-淀粉酶活性，包括水解淀粉中的内部α-1，4-糖苷键以产生较小分子量的麦芽糊精的能力。一方面，α-淀粉酶活性包括随机地水解淀粉中的内部α-1，4-糖苷键。本发明的淀粉酶活性包括具有葡糖淀粉酶活性的多肽，例如水解由α-1，4-和α-1，6-糖苷键连接的葡萄糖聚合物的能力。一方面，本发明的多肽具有葡糖淀粉酶活性，水解内部α-1，4-糖苷键以产生较小分子量的麦芽糊精。本发明的淀粉酶活性也包括葡聚糖1，4-α-葡糖苷酶活性、或1，4-α-D-葡聚糖葡糖水解酶，通常称作葡糖淀粉酶，但也称作淀粉葡糖苷酶和？-淀粉酶，该酶在一方面从1，4-α-、1，6-α-和1，3-α-连接的葡聚糖中释放出β-D-葡萄糖。本发明的淀粉酶活性也包括外切淀粉酶活性。

一方面，葡糖淀粉酶活性包括催化糖苷键的水解。葡糖淀粉酶活性可以包括催化D-葡萄糖从淀粉或其它相关糊精的非还原末端逐步地水解释放。葡糖淀粉酶活性可以包括1，4-α-D-葡聚糖葡糖水解酶活性。葡糖淀粉酶活性可以包括催化导致产生游离葡萄糖的麦芽糊精水解。葡糖淀粉酶活性可以包括外切淀粉酶活性。葡糖淀粉酶活性可以包括α-淀粉酶或β-淀粉酶活性。被水解的糖苷键可以包括α-1，4-糖苷键或α-1，6-糖苷键。葡糖淀粉酶活性可以包括水解淀粉中的糖苷键。葡糖淀粉酶活性可以进一步包括水解淀粉酶中的糖苷键以产生麦芽糊精。葡糖淀粉酶活性可以包括从淀粉的非还原末端切割出麦芽糖或D-葡萄糖单元。

本发明的淀粉酶活性也包括在高温、低温、碱性pH和在酸性pH条件下水解多糖，例如淀粉。例如，一方面，本发明提供了多肽，编码这些多肽的核酸，所述多肽具有淀粉酶活性，例如葡糖淀粉酶活性，该活性是热稳定的。该多肽在包括如下温度的条件下可以保持淀粉酶活性：从大约37℃到大约95℃之间；大约55℃到大约85℃之间，大约70℃到大约95℃之间，或大约90℃到大约95℃之间。另一方面，本发明的多肽可以具有葡糖淀粉酶活性，该多肽是耐热的。该多肽在暴露于如下温度后可以保持淀粉酶活性：从大于37℃到大约95℃的范围内的温度，或从大于55℃到大约85℃之间的任何温度。一方面，该多肽在暴露于从大于90℃到大约95℃的温度范围内的温度和pH4.5后可以保持淀粉酶活性。

“淀粉酶变体”包含来源于“前体淀粉酶”的氨基酸序列的氨基酸序列。前体淀粉酶可以包括天然发生的淀粉酶和重组淀粉酶。淀粉酶变体的氨基酸序列可以“来源于”前体淀粉酶氨基酸序列，通过前体氨基酸序列的一个或多个氨基酸的取代、删除或插入来实现。这样的修饰可以是针对编码前体淀粉酶的氨基酸序列的“前体DNA序列”，而不是操作前体淀粉酶本身。用于前体DNA序列的这样的操作的合适方法包括本文公开的方法，以及本技术领域的普通技术人员已知的方法。

术语“抗体”包括肽或多肽，它们来自于或模制于(modeled after)一种或多种免疫球蛋白基因或其片段，或者实质上由一种或多种免疫球蛋白基因或其片段编码，该肽或多肽能特异性结合抗原或抗原决定基，例如参见FundamentalImmunology，第三版，W.E.Paul编著，Raven Press，N.Y.(1993)；Wilson(1994)J.Immunol.Methods 175：267-273；Yarmush(1992)J.Biochem.Biophys.Methods 25：85-97。术语抗体包括抗原结合部分，即，保持有结合抗原的能力的“抗原结合位点”(例如片段、子序列、互补决定区(CDRs))，包括(i)Fab片段，一种由VL、VH、CL和CH1结构域组成的单价片段；(ii)F(ab’)2片段，由通过二硫键在铰链区连接的两个Fab片段组成的二价片段；(iii)由VH和CH1结构域组成的Fd片段；(iv)由抗体单臂的VL和VH结构域组成的Fv片段；(v)由VH结构域组成的dAb片段(Ward等人，(1989)Nature 341：544-546)；和(vi)分离的互补决定区(CDR)。单链抗体也被包括在术语“抗体”中。

正如本文所用，术语“阵列”或“微阵列”或“生物芯片”或“芯片”是一系列的靶元件，每一靶元件包括固定到基材表面的限定区域上的确定数量的一个或多个多肽(包括抗体)或核酸，正如下面进一步的详细讨论。

正如本文所用，术语“计算机”、“计算机程序”和“处理器”以它们在最广的普通语境中的含义被使用，包括了所有这样的设备，例如下面所详细描述的。“特定多肽或蛋白的编码序列”或“编码特定多肽或蛋白的序列”是指当被置于适当的调控序列的控制下时可被转录和翻译成多肽或蛋白的核酸序列。

正如本文所用，术语“表达序列盒(expression cassette)”指能影响结构基因(即蛋白编码序列，如编码本发明的淀粉酶的序列)在与这样的序列相容的宿主中的表达的核苷酸序列。表达序列盒包括至少一个与多肽编码序列可操作地连接的启动子；并且任选地，可以与其它序列例如转录终止信号序列可操作地连接。也可以使用其它的在影响表达的方面必需的或有用的因子，例如增强子。因此，表达序列盒也包括质粒、表达载体、重组病毒、任何形式的重组“裸DNA”载体，以及类似物。

正如此处所用，“可操作地连接(operably linked)”是指两个或更多个核酸(例如DNA)片段之间的功能关系。典型地，“可操作地连接”指转录调控序列与被转录序列的功能关系。例如，如果启动子刺激或调节编码序列例如本发明的核酸在适当的宿主细胞或其它表达系统中的转录，那么该启动子便是可操作地连接到编码序列。通常，可操作地连接到被转录序列的启动子转录调控序列与被转录序列是物理上相邻的，即它们是顺式作用。然而，一些转录调控序列，如增强子，不需要与编码序列物理相邻或者位于与编码序列接近的位置，但这些转录调控序列仍能增强编码序列的转录。

“载体”包括可以感染、转染、短暂或永久地转导细胞的核酸。应该认识到，载体可以是裸核酸、或与蛋白或脂质复合的核酸。该载体任选地包含病毒或细菌核酸和/或蛋白，和/或膜(例如细胞膜、病毒脂质包被等等)。载体包括但不限于复制子(例如RNA复制子、细菌噬菌体)，DNA片段可以连接到这些复制子上从而可被复制。因此，载体包括但不限于RNA、自主复制环状或线状DNA或RNA

(例如质粒、病毒以及类似物，例如参见美国专利5,217,879)，并且包括表达质粒和非表达质粒。在重组微生物或细胞培养物被描述为“表达载体”的宿主的情况下，该载体包括染色体外环状或线状DNA，它们可以已经被整合到宿主染色体中。在载体通过宿主细胞来维持的情况下，该载体或者可以作为自主结构在有丝分裂过程中被细胞稳定地复制，或者被整合进宿主的基因组中。

正如本文所用，术语“启动子”包括所有能驱动编码序列在细胞例如植物细胞中转录的所有序列。因此，在本发明的构建物中所用的启动子包括顺式作用转录控制元件和调节序列，它们涉及调节或调控基因转录的时间和/或速率。例如，启动子可以是顺式作用转录控制元件，包括增强子、启动子、转录终止子、复制起点、染色体整合序列、5’和3’非翻译区或内含子序列，它们均涉及转录的调节。这些顺式作用序列通常与蛋白或其它生物分子互相作用来执行(打开/关闭、调节、调控等等)转录。“组成型”启动子是那些在大部分环境条件和发育状态或细胞分化状态下持续地驱动表达的启动子。“诱导型”或“可调控型”启动子在环境条件或发育条件的影响下指导本发明的核酸的表达。可以通过诱导型启动子影响转录的环境条件的实例包括厌氧条件、增高的温度、干旱或光的存在。

“组织特异性”启动子是仅仅在特定细胞或组织或器官中有活性的转录控制元件，例如在植物或动物的特定细胞或组织或器官中有活性。组织特异性调节可以通过某些内在因子来实现，这些内在因子确保对给定组织特异的蛋白编码基因被表达。这样的因子已知存在于哺乳动物和植物中，以便允许特异性组织的发育。

术语“植物”包括全植物、植物部分(例如叶、茎、花、根等等)、植物原生质体、种子和植物细胞以及它们的后代。可以用于本发明的方法中的植物的种类很广泛，广泛至能用转化技术进行处理的高等植物，包括被子植物(单子叶植物和双子叶植物)，以及裸子植物。它们包括各种倍数性水平的植物，包括多倍体、二倍体、单倍体和半合子植物。正如此处所用，术语“转基因植物”包括异源核酸序列已经被插入到其中的植物或植物细胞，所述异源核酸序列例如本发明的核酸和各种重组构建物(例如表达序列盒)。

“质粒”可以商购得到，在不受限制的基础上可以公开获得，或可以根据已公开的程序用可获得的质粒来构建。与本文描述的那些质粒等价的质粒在本技术领域是已知的，并且对于普通技术人员是显而易见的。

术语“基因”包括核酸序列，包括在产生转录产物(例如信息)的过程中所涉及的DNA的片段，所述转录产物又被翻译而产生多肽链，或者它调节基因转录、复制或稳定性。基因可以包括编码区之前的区域和之后的区域，如前导区(leader)和尾区(trailer)、启动子和增强子，以及在适用的情况下，可以包括各个编码片段(外显子)之间的间插序列(内含子)。

短语“核酸”或“核酸序列”包括寡核苷酸、核苷酸、多核苷酸，或者寡核苷酸、核苷酸、多核苷酸中任意一种的片段，或者基因组的或合成来源的DNA或RNA(例如mRNA、rRNA、tRNA、iRNA)，它们可以是单链或双链，并且可以代表正义链或反义链，还包括肽核酸(PNA)或者天然或合成来源的任何DNA样或RNA样的物质，例如包括iRNA、核糖核蛋白(例如iRNPs)。该术语包括含有天然核苷酸的已知类似物的核酸，例如寡核苷酸。该术语也包括具有合成骨架的核酸样结构，例如参见Mata(1997)Toxicol.Appl.Pharmacol.144：189-197；Strauss-Soukup(1997)Biochemistry 36：8692-8698；Samstag(1996)Antisense NucleicAcid Drug Dev 6：153-156。

“氨基酸”或“氨基酸序列”包括寡肽、肽、多肽或蛋白序列，或寡肽、肽、多肽或蛋白序列中任意一种的片段、部分或亚基，它们可以是天然发生的或合成的分子。术语“多肽”和“蛋白”包括通过肽键或修饰的肽键即肽等排物(peptideisosteres)彼此结合在一起的氨基酸，可以含有除20个由基因编码的氨基酸之外的修饰的氨基酸。术语“多肽”也包括肽和多肽片段、基序以及类似物。该术语也包括糖基化多肽。本发明的肽和多肽也包括所有“模拟”和“肽模拟”形式，正如下面进一步详细描述的。

术语“分离的”包括从其原始环境中分离出的物质，所述原始环境例如天然环境，如果该环境是天然存在的话。例如，在活的动物中存在的天然发生的多核苷酸或多肽不是分离的，但与该天然系统中的一些或所有的共存物质分离开的相同的多核苷酸或多肽是分离的。这样的多核苷酸可以成为载体的一部分，和/或这样的多核苷酸或多肽可以是组合物的一部分，但它们仍然是分离的，因为这样的载体或组合物不是其天然环境的组成部分。正如本文所用，分离的物质或组合物也可以是“纯化的”组合物，即，它并不要求绝对的纯度；更正确的说，这意味着是一个相对定义。从文库获得的各核酸可以按惯例纯化为电泳同质。在可选择的方面，本发明提供了核酸，这些核酸已经以至少一个、两个、三个、四个、五个或更多个数量级的程度从基因组DNA或从文库或其它环境中的其它序列中被纯化出来。

正如此处所用，术语“重组的”可以包括与“骨架”核酸相邻的核酸，这些核酸在其天然环境中与该“骨架”核酸是不相邻的。一方面，核酸表现为在核酸“骨架分子”群体中有5％或更多数量的带有核酸插入物。本发明的“骨架分子”包括核酸，如表达载体、自主复制核酸、病毒、整合核酸，以及用于维持或操纵感兴趣的核酸插入物的其它载体或核酸。一方面，富集的核酸则表现为在重组的骨架分子群体中有50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多数量的带有核酸插入物。“重组的”多肽或蛋白是指通过重组DNA技术产生的多肽或蛋白；例如由用编码期望多肽或蛋白的外源DNA构建物转化的细胞产生的多肽或蛋白。“合成的”多肽或蛋白是那些通过化学合成制备的多肽或蛋白，正如下面进一步详细描述的。

启动子序列可以“可操作地连接到”编码序列上，此时RNA聚合酶可以在启动子处起始转录，将编码序列转录成mRNA，正如下面进一步详细描述的。

“寡核苷酸”或者包括单链的多脱氧核苷酸，或者包括两个互补的多脱氧核苷酸链，它们可以是化学合成的。这样的合成的寡核苷酸没有5’磷酸，因此如果不在存在激酶的情况下采用腺苷三磷酸(ATP)添加磷酸，该合成寡核苷酸便不会连接到另一个寡核苷酸上。合成的寡核苷酸可以连接到没有被去磷酸化的片段上。

短语“基本上相同(substantially identical)”在用于两个核酸或多肽时，是指当两个或更多个序列被比较和联配(aligned)以寻找最大一致性(maximuncorrespondence)时，它们具有例如至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的核苷酸或氨基酸残基(序列)同一性，所述同一性可以使用任意一种已知的序列比较算法测量，正如下面详细讨论的，或者通过视觉观察。在可选择的方面，本发明提供了与本发明的示例性序列在至少大约10、20、30、40、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多残基的区域内，或从大约50个残基到核酸或多肽的全长的区域内基本上相同的核酸和多肽序列。本发明的核酸序列可以在多肽编码区的整个长度范围内是基本上相同的。

“基本上相同的”氨基酸序列也可以包括通过一个或多个保守或非保守氨基酸的取代、缺失或插入而与参考序列有所不同的序列，尤其是当这样的取代发生在不是分子的活性位点的位置时，前提是该多肽基本上保持其功能特性。保守的氨基酸取代，例如用一个氨基酸取代另一个相同类别的氨基酸(例如用一个疏水氨基酸，如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸，取代另一个疏水氨基酸，或用一个极性氨基酸取代另一个极性氨基酸，例如用精氨酸取代赖氨酸、用谷氨酸取代天冬氨酸，或用谷氨酰胺取代天冬酰胺)。可以从例如淀粉酶中删除一个或多个氨基酸，从而形成对多肽结构的修饰，而又不会显著地改变其生物活性。例如，对淀粉酶活性来说不需要的氨基或羧基末端氨基酸可以被去除。

“杂交”包括这样一个过程，即，通过该过程核酸链与互补链通过碱基配对而结合。杂交反应可以是灵敏的并且是选择性的，以便感兴趣的特定序列可以被鉴定，甚至在其以低浓度存在的样品中也可以被鉴定。严紧条件(stringentconditions)可以通过，例如预杂交和杂交溶液中盐或甲酰胺的浓度来定义，或者通过杂交温度来定义，这些严紧条件在本技术领域是已知的。例如，严紧性可以通过降低盐的浓度、增加甲酰胺的浓度、或升高杂交温度、改变杂交时间来增加，正如下面详细描述的。在可选择的方面，本发明的核酸通过它们在各种严紧条件(例如强、中等和低严紧条件)下杂交的能力来定义，正如本文所示。

“变体”包括在一个或多个碱基对、密码子、内含子、外显子或氨基酸残基处被(分别地)修饰的本发明的多核苷酸或多肽，然而它们仍然保持本发明的淀粉酶的生物活性。变体可以通过许多种方法产生，包括的方法诸如，例如易错PCR、重排、寡核苷酸诱导的突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点特异性诱变、基因再装配、GSSM及其任意组合。本文包括了用于产生变体淀粉酶的技术，例如，所述变体具有活性时的pH或温度与野生型淀粉酶的不同。

术语“饱和诱变”或“GSSM”包括使用简并寡核苷酸引物将点突变引入多核苷酸的方法，正如下面详细描述的。

术语“优化的定向进化系统”或“优化的定向进化”包括用于重新装配相关的核酸序列的片段的方法，所述的相关核酸序列例如相关的基因，下面对其进行了详细解释。

术语“合成连接重装配”或“SLR”包括以非随机方式连接寡核苷酸片段的方法，下面进行了详细解释。

产生和操纵核酸

本发明提供了分离的或重组的核酸，其包括与本发明的示例性核酸在至少大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多残基的区域内，具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的核酸序列。一方面，该核酸编码至少一个具有淀粉酶活性例如α-淀粉酶活性的多肽。

例如，下面的表格描述了本发明的一些示例性的编码淀粉酶的核酸，例如本发明提供了具有SEQ ID NO：474中所示的序列、具有SEQ ID NO：473中所示的示例性编码序列的淀粉酶，一方面，该酶由基因编码，其包括内含子和外显子，该基因具有SEQ ID NO：467中所示的序列(包括具有在SEQ ID NO：468、SEQ IDNO：469、SEQ ID NO：470、SEQ ID NO：471和SEQ ID NO：472中所示的序列的外显子)：等等：

上面罗列的淀粉酶(正如A到S所描述的)以及编码这些淀粉酶的核酸具有共同的新颖性，即它们最初分离自/来源于真菌来源。

本发明也提供了葡糖淀粉酶，如具有SEQ ID NO：594中所示的序列的酶，其由基因组SEQ ID NO：587的4111个残基编码，或SEQ ID NO：593的1854个残基长的cDNA编码。基因组SEQ ID NO：587，包括内含子和外显子，外显子可以被描述为多肽编码片段，其具有在SEQ ID NO：588、SEQ ID NO：589、SEQ ID NO：590、SEQ ID NO：591、SEQ ID NO：592中所示的序列。一方面，“成熟(mature)”的经加工的葡糖淀粉酶由SEQ ID NO：594的残基32到617组成。

本发明提供了分离的和重组的核酸，包括编码本发明的多肽的表达序列盒例如表达载体。本发明提供了包括本发明所述核酸或由本发明所述核酸组成的探针。本发明也包括使用本发明的核酸抑制淀粉酶基因、转录物和多肽的表达的方法。也提供了修饰本发明的核酸的方法，例如通过合成连接重装配、优化的定向进化系统和/或基因位点饱和诱变(GSSM^TM)。

本发明的核酸可以通过，例如cDNA文库的克隆和表达、通过PCR进行的信息或基因组DNA扩增以及类似的技术来制造、分离和/或操纵。在实践本发明的方法时，同源基因可以通过操纵模板核酸来修饰，正如本文所描述的。本发明可以与本技术领域已知的任何方法或程序或设备一起实践，这些方法、程序或设备在科学和专利文献中有很好的描述。

一般技术

用于实践本发明的核酸，不管是RNA、iRNA、反义核酸、cDNA、基因组DNA、载体、病毒或其杂合体，都可以从多种来源分离、进行遗传工程改造、扩增和/或表达/重组产生。从这些核酸产生的重组多肽可以被单独地分离或克隆，并且可测试其期望活性。可以使用任何重组表达系统，包括细菌、哺乳动物、酵母、昆虫或植物细胞表达系统。

可以选择地，这些核酸可以通过熟知的化学合成技术体外合成，正如例如Adams(1983)J.Am.Chem.Soc.105：661；Belousov(1997)Nucleic Acids Res.25：3440-3444；Frenkel(1995)Free Radic.Biol.Med.19：373-380；Blommers(1994)Biochemistry 33：7886-7896；Narang(1979)Meth.Enzymol.68：90；Brown(1979)Meth.Enzymol.68：109；Beaucage(1981)Tetra.Lett.22：1859；美国专利4,458,066中所描述的。

用于操纵核酸的技术，例如亚克隆、标记探针(例如使用Klenow聚合酶的随机引物标记、切口平移、扩增)、测序、杂交以及类似的技术在科学和专利文献中有很好的描述，例如参见Sambrook编著，MOLECULAR CLONING：ALABORATORY MANUAL(2ND ED.)，1-3卷，Cold Spring Harbor Laboratory，(1989)；CURRENT PROTOCOLS IN MOLECULAR BIOLOGY，Ausubel，ed.John Wiley&Sons，Inc.，New York(1997)；LABORATORY TECHNIQUES IN BIOCHEMISTRYAND MOLECULAR BIOLOGY：HYBRIDIZATION WITH NUCLEIC ACIDPROBES，Part I.Theory and Nucleic Acid Preparation，Tijssen，ed.Elsevier，N.Y.(1993)。

获得和操纵用于实践本发明的方法的核酸的另一个有用方法是从基因组样品中克隆，并且如果期望的话，筛选和再克隆插入物，插入物可以分离或扩增自例如基因组克隆或cDNA克隆。用于本发明的方法中的核酸的来源包括基因组或cDNA文库，所述文库可以包含在例如哺乳动物人工染色体(MACs)，例如参见美国专利5,721,118；6,025,155；人类人工染色体，例如参见Rosenfeld(1997)Nat.Genet.15：333-335；酵母人工染色体(YAC)；细菌人工染色体(BAC)；P1人工染色体，例如参见Woon(1998)Genomics 50：306-316；P1来源的载体(PACs)，例如参见Kern(1997)Biotechniques 23：120-124；粘粒、重组病毒、噬菌体或质粒中。

一方面，编码本发明的多肽的核酸与能指导翻译出的多肽或其片段的分泌的前导序列以适当的位置关系进行装配。

本发明提供了融合蛋白和编码这些融合蛋白的核酸。本发明的多肽可以被融合到异源肽或多肽上，如N-末端鉴定肽，其给予了期望的特性，如增加的稳定性或简化的纯化特性。本发明的肽和多肽也可以作为融合蛋白被合成和表达，其中所述融合蛋白中连接有一个或多个额外的结构域，例如用于产生一个免疫原性更强的肽、以便更易于分离重组合成的肽、以便鉴定和分离抗体和表达抗体的B细胞，等等。有利于检测和纯化的结构域包括，例如金属螯合肽，如多组氨酸标记和组氨酸-色氨酸模块，其允许在固定的金属上纯化，还包括蛋白A结构域，其允许在固定的免疫球蛋白上纯化，还包括在FLAGS延伸/亲和纯化系统中所使用的结构域(Immunex Corp，Seattle WA)。在纯化结构域和含有基序的肽或多肽之间包含可切裂的连接子序列有助于纯化，这样的连接子序列如Xa因子或肠激酶(Invitrogen，San Diego CA)。例如，表达载体可以包括编码抗原决定基的核酸序列，其连接到六组氨酸残基上，还连接有硫氧还蛋白和肠激酶切割位点(例如参见Williams(1995)Biochemistry 34：1787-1797；Dobeli(1998)Protein Expr.Purif.12：404-414)。组氨酸残基有助于检测和纯化，而肠激酶切割位点提供了将抗原决定基与融合蛋白的剩余部分纯化分离开的方法。关于编码融合蛋白的载体的技术以及融合蛋白的应用在科学和专利文献中进行了很好的描述，例如参见Kroll(1993)DNA Cell.Biol.，12：441-53。

转录和翻译控制序列

本发明提供了可操作地连接到一个或多个表达(例如转录或翻译)控制序列上的本发明的核酸(例如DNA)序列，所述控制序列例如启动子或增强子，它们可以指导或调节RNA合成/表达。表达控制序列可以在表达载体中。示例性的细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。示例性的真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、来自逆转录病毒的LTR启动子以及鼠金属硫蛋白I启动子。

适合于在细菌中表达多肽的启动子包括大肠杆菌lac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动子和λPL启动子、来自编码糖酵解酶如3-磷酸甘油酯激酶(PGK)的操纵子的启动子、以及酸性磷酸酶启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热激启动子、早期和晚期SV40启动子、来自逆转录病毒的LTRs、以及小鼠金属硫蛋白-I启动子。也可以使用已知的在原核或真核细胞或病毒中控制基因表达的其它启动子。

组织特异性植物启动子

本发明提供了可以以组织特异性方式表达的表达序列盒，例如可以以组织特异性方式表达本发明的淀粉酶的表达序列盒。本发明也提供了以组织特异性方式表达本发明淀粉酶的植物或种子。组织特异性可以是种子特异性、茎特异性、叶特异性、根特异性、果实特异性以及类似的方式。

一方面，组成型启动子如CaMV 35S启动子可以被用于在植物或种子的特定部分或在整个植物中的表达。例如，为了过度表达，可以使用植物启动子片段，其将直接指导核酸在植物例如再生植物的一些或所有组织中表达。此处，这样的启动子被称作“组成型”启动子，它们在大部分环境条件和发育或细胞分化状态下是有活性的。组成型启动子的实例包括花椰菜花叶病毒(CaMV)35S转录起始区、来自根瘤农杆菌的T-DNA的1’或2’启动子、以及来自本技术领域已知的多种植物基因的其它转录起始区。这样的基因包括，例如来自拟南芥(Arabidopsis)的ACT11(Huang(1996)Plant Mol.Biol.33：125-139)；来自拟南芥的Cat3(Genbank No.U43147，Zhong(1996)Mol.Gen.Genet.251：196-203)；来自甘蓝型油菜(Brassicanapus)的编码硬酯酰基-酰基载体蛋白去饱和酶的基因(Genbank No.X74782，Solocombe(1994)Plant Physiol.104：1167-1176)；来自玉米的GPc1(GenbankNo.X15596；Martinez(1989)J.Mol.Biol.208：551-565)；来自玉米的Gpc2(GenbankNo.U45855；Manjunath(1997)Plant.Mol.Biol.33：97-112)；在美国专利4,962,028；5,633,440中描述的植物启动子。

本发明使用来自病毒的组织特异性或组成型启动子，这些启动子可以包括，例如烟草花叶病毒亚基因组启动子(Kumagai(1995)Proc.Natl.Acad.Sci.USA 92：1679-1683；稻米东格鲁杆状病毒(RTBV)，该病毒仅在受感染稻米植物中的韧皮细胞中复制，它的启动子驱动强的韧皮特异性报道基因的表达；木薯脉带花叶病毒(CVMV)启动子，其在导管、叶中轴细胞、根尖中具有最高活性(Verdaguer(1996)Plant Mol.Biol.31：1129-1139)。

可选择地，植物启动子可以指导表达淀粉酶的核酸表达于特定组织、器官或细胞类型中(即，组织特异启动子)，或者可以在更加精确的环境或发育控制下或在可诱导启动子的控制下指导表达淀粉酶的核酸的表达。可以影响转录的环境条件的例子包括厌氧条件、提高温度、有光、或喷撒化学试剂/激素。例如，本发明包括玉米的干旱诱导型启动子(Busk(1997)如上)，马铃薯的寒冷、干旱、高盐诱导型启动子(Kirch(1997)Plant Mol.Biol.33：897 909)。

组织特异性启动子只在该组织的发育阶段的某个时间段内促进转录。参见，例如描述拟南芥LEAFY基因启动子的Blazquez(1998)Plant Cell 10：791-800。也见，描述转录因子SPL3的Cardon(1997)Plant J 12：367-77，SPL3识别拟南芥(A.thaliana)的调节植物分生组织形成的基因(meristem identity gene)AP1的启动子区域的保守序列基序；和描述分生组织启动子eIF4的Mandel(1995)Plant MolecularBiology，29卷，995-1004页。可以使用在特定组织的整个生命周期都具有活性的组织特异性启动子。一方面，本发明的核酸与主要在棉花纤维细胞中有活性的启动子可操作地连接。一方面，本发明的核酸与主要在棉花纤维细胞伸长的阶段具有活性的启动子可操作地连接，例如，Rinehart(1996)如上所描述的。核酸可以与Fbl2A基因启动子可操作地连接，这样它将偏好在棉花纤维细胞(Ibid)中表达。也见John(1997)Proc.Natl.Acad.Sci.USA 89：5769-5773；John等，美国专利5,608,148和5,602,321，描述了用于构建转基因棉花植物的棉花纤维特异性启动子和方法。也可以使用根特异性启动子来表达本发明的核酸。根特异性启动子的例子包括乙醇脱氢酶基因中的启动子(DeLisle(1990)Int.Rey.Cytol.123：39-60)。也可以使用别的启动子来表达本发明的核酸，包括，例如，胚珠特异的、胚芽特异的、胚乳特异的、珠柄特异的、种皮特异的启动子或它们的组合；叶特异的启动子(见，例如，Busk(1997)Plant J.11：1285 1295，描述玉米的叶特异的启动子)；Agrobacterium rhizogenes的ORF13启动子(ORF13启动子在根部表现出高活性，见，例如Hansen(1997)如上)；玉米花粉特异性启动子(见，例如Guerrero(1990)Mol.Gen.Genet.224：161 168)；番茄启动子，其在果实成熟、变老、从叶上脱落的过程中有活性，在花中具有低一些的活性(见，例如，Blume(1997)Plant J.12：731746)；马铃薯SK2基因的雌蕊特异性启动子(见，例如Ficker(1997)Plant Mol.Biol.35：425431)；豌豆的Blec4基因，Blec4基因在蔬菜的表皮组织和转基因苜蓿的花梗顶中具有活性，这使它成为使外源基因靶向表达于活跃地生长的芽或纤维的表皮层的有用工具；胚珠特异的BEL1基因(见，例如，Reiser(1995)Cell 83：735-742，GenBank号：U39944)；和/或Klee，美国专利5,589,583中的启动子，描述了一种植物启动子区域，其可导致在分生组织和/或快速分裂细胞中的高水平转录。

可选择的是，经由对植物激素例如植物生长素的暴露便能被诱导的植物启动子可用于表达本发明的核酸。例如，本发明可以使用大豆(Glycine max L.)中的植物生长素响应元件E1启动子片断(AuxREs)(Liu(1997)Plant Physiol.115：397-407)；植物生长素响应的拟南芥GST6启动子(也对水杨酸和过氧化氢产生响应)(Chen(1996)Plant J.10：955-966)；烟草的植物生长素诱导的parC启动子(Sakai(1996)37：906-913)；植物生物素响应元件(Streit(1997)Mol.Plant MicrobeInteract.10：933-937)；和对应激激素脱落酸产生响应的启动子(Sheen(1996)Science274：1900-1902)。

本发明的核酸也可以与植物启动子可操作地连接，所述植物启动子暴露于施用于植物的化学试剂例如除草剂或抗生素，便能够被诱导。例如，可以使用由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子(De Veylder(1997)Plant Cell Physiol.38：568-577)；不同的除草剂安全剂的应用诱导不同的基因表达模式，包括在根中、排水器中和芽尖分生组织中的表达。编码序列可以处于例如四环素诱导的启动子的控制下，例如，被描述的含有Avena sativa L.(oat)精氨酸脱羧酶基因的转基因烟草植物(Masgrau(1997)Plant J.11：465-473)；或者处于水杨酸响应元件的控制之下(Stange(1997)Plant J.11：1315-1324)。使用化学(例如，激素或杀虫剂)诱导的启动子，即，对施用于田间的转基因植物的化学剂发生响应的启动子，本发明的多肽的表达可以在植物发育的特定阶段被诱导。所以，本发明也提供含有可诱导基因的转基因植物，所述可诱导基因编码本发明的多肽，其宿主范围局限于靶向植物种类，例如玉米、稻、大麦、小麦、马铃薯或别的作物，并且所述可诱导基因在作物发育的任何阶段都可被诱导。

本领域技术人员会认识到，组织特异性的植物启动子可以驱动可操作地连接的序列在不是靶向组织的组织中表达。所以，组织特异性启动子是驱动在靶向组织或细胞类型中产生优势表达的启动子，但是也可以导致在别的组织中的一些表达。

本发明的核酸也可以与化学试剂诱导的植物启动子可操作地连接。这些试剂包括例如，除草剂、合成的植物生长激素或抗生素，它们可以通过例如喷雾而施用于转基因植物。本发明的产生淀粉酶的核酸的可诱导表达将允许对具有最佳的淀粉/糖比率的植物进行选择。植物局部的发育也可以因此被控制。这样，本发明提供了促进植物和植物的部分的收获的方法。例如，在许多实施方式中，玉米的由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子被使用(De Veylder(1997)PlantCell Physiol.38：568-577)。应用不同的除草剂安全剂诱导出不同的基因表达模式，包括在根中、排水器中、芽尖分生组织中的表达。本发明的编码序列也可以处于四环素诱导的启动子的控制之下，例如，对含有燕麦(Avena sativa L.)(oat)精氨酸脱羧酶基因的转基因烟草植物的描述(Masgrau(1997)Plant J.11：465-473)；或者，可以由水杨酸响应元件控制(Stange(1997)Plant J.11：1315-1324)。

如果期望适当的多肽表达，在该编码区域的3’端应该包括多聚腺苷酸化区域。多聚腺苷酸化区域可以源自天然基因、各种类别的其它植物基因、或者农杆菌T-DNA中的基因。

表达载体和克隆载体

本发明提供包括本发明的核酸例如编码本发明的淀粉酶的序列的表达载体和克隆载体。本发明的表达载体和克隆载体可以包括病毒颗粒、杆状病毒、噬菌体、噬菌粒(phagemids)、粘粒、fos-质粒(fosmids)、细菌人工染色体、病毒DNA(例如疫苗、腺病毒、禽痘病毒、伪狂犬病病毒和SV40的衍生物)、P1衍生的人工染色体、酵母质粒、酵母人工染色体和任何别的对感兴趣的特定宿主(例如，杆状菌、曲霉和酵母)有特异性的载体。本发明的载体可以包括染色体、非染色体和合成的DNA序列。大量的合适的载体对于本领域技术人员都是已知的，并且可以商业获得。典型的载体包括：细菌：pQE载体(Qiagen)、pBluescript质粒、PNH载体、λ-ZAP载体(Stratagene)；ptrc99a、PKK223-3、pDR540、pRIT2T(Pharmacia)；真核细胞的：PXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而，也可以使用任何别的质粒或别的载体，只要它们可以在宿主中复制和维持下去。可以在本发明中使用低拷贝数或高拷贝数的载体。

表达载体可以包括启动子、用于起始翻译的核糖体结合位点和转录终止子。载体也可以包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制起始点、任何必需的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、5’侧翼非转录序列。一方面，衍生于SV40剪接子和聚腺苷酸化位点的DNA序列可以用于提供所需要的非转录基因元件。

在一个方面，表达载体含有一个或多个选择性标记基因，使得可以对含有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因和使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(E.coli)具有四环素或氨苄青霉素抗性的基因和酵母(S.cerevisiae)TRP1基因。启动子区域可以从任何期望的基因中选择出来，使用氯霉素转移酶(CAT)载体或具有选择标记的别的载体。

用于在真核细胞中表达多肽或其片段的载体也可以含有增强子，以增加表达水平。增强子是DNA的顺式作用元件，一般长度为大约10到大约300bp，其作用于启动子，增强转录。例子包括在SV40复制起点下游侧100bp到270bp的增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子，和腺病毒增强子。

核酸序列可以通过各种程序插入载体中。一般的，把插入物和载体用合适的限制性内切酶消化后，序列可以连接到载体中的所希望的位置。可选择地，插入物和载体的平末端可以被连接。在本领域已知多种克隆技术，例如在Ausubel和Sambrook中描述的。这样的程序和别的程序被认为在本领域技术人员已知的范围内。

载体可以是质粒、病毒颗粒或噬菌体的形式。别的载体包括染色体的、非染色体的和合成的DNA序列，SV40的衍生物；细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和表达载体被例如Sambrook描述。

可以使用的特定的细菌载体包括商业上可获得的质粒，其包括以下已知的克隆载体的遗传元件：pBR322(ATCC 37017)、pKK223-3(Pharmacia Fine Chemicals，Uppsala，Sweden)、GEM1(Promega Biotec，Madison，WI，USA)、pQE70、pQE60、pQE-9(Qiagen)、pD10、psiX174 pBluescript II KS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK233-3、DR540、pRIT5(Pharmacia)、pKK232-8和pCM7。特定的真核载体包括pSV2CAT、pOG44、pXT1、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而，可以使用任何别的载体，只要它可以在宿主细胞中复制和维持。

本发明的核酸可以在表达序列盒、载体或病毒中表达，在植物细胞和种子中短暂的或稳定的表达。一个典型的短暂表达系统应用了附加体(episomal)表达系统，例如，通过含有超螺旋DNA的附加小染色体的转录而在核中产生的花椰菜花叶病毒(CaMV)RNA，见，例如，Covey(1990)Proc.Natl.Acad.Sci.USA 87：1633-1637。作为选择，编码序列，即本发明的序列的全部或子片断，可以插入到植物宿主细胞基因组中，而成为该宿主染色体DNA的整合的一部分。正义和反义转录子可以以这种方式被表达。包含本发明的核酸的序列(例如，启动子或编码区域)的载体可以包含用于赋予植物细胞或种子选择性表型的标记基因。例如，所述标记可以编码生物杀灭剂抗性，特别是抗生素抗性，例如对卡那霉素、G418、博来霉素、潮霉素或除草剂的抗性，例如对氯磺隆或Basta的抗性。

可以在植物中表达核酸和蛋白的表达载体在本领域中是已知的，可以包括，例如，根瘤农杆菌的载体、马铃薯病毒X(见，例如，Angell(1997)EMBO J.16：3675-3684)、烟草花叶病病毒(见，例如，Casper(1996)Gene 173：69-73)、番茄丛矮病毒(见，例如，Hillman(1989)Virology 169：42-50)、烟草蚀纹病毒(见，例如，Dolja(1997)Virology 234：243-252)、菜豆金色花叶病毒(见，例如，Morinaga(1993)Microbiol inimunol.37：471-476)、花椰菜花叶病毒(见，例如，Cecchini(1997)Mol.Plant Microbe Interact.10：1094-1101)、玉米Ac/Ds转座元件(见，例如，Rubin(1997)Mol.Cell.Biol.17：6294-6302；Kunze(1996)Curr.Top.Microbiol.Inimunol.204：161-194)，和玉米抑制基因-突变基因(Spm)转座元件(见，例如Schlappi(1996)Plant Mol.Biol.32：717-725)；和它们的衍生物。

在一个方面，表达载体可以有两套复制系统，使其可以在两种生物中保持，例如在哺乳动物或昆虫细胞中表达，在原核宿主中克隆和扩增。进一步，对于整合表达载体，该表达载体可以包括至少一个与宿主细胞基因组同源的序列。它可以在该表达构建物的两侧包含两个同源序列。通过选择包含入载体的合适的同源序列，可以将该整合载体定位到宿主细胞的特定位置。整合载体的构建在本领域是已知的。

本发明的表达载体也可以包括选择性的标记基因，以便对已经转化的细菌株进行选择，例如，使细胞对药物，例如氨苄青霉素、氯霉素、红霉素、卡那霉素、新霉素和四环素产生抗性的基因。选择性的标记也可以包括生物合成基因，例如在组氨酸、色氨酸和亮氨酸生物合成途径中的基因。

宿主细胞和转化细胞

本发明也提供了包含本发明的核酸序列的转化细胞，所述核酸序列例如编码本发明的淀粉酶的序列，或本发明的载体。宿主细胞可以是本领域技术人员熟悉的任何宿主细胞，包括原核细胞，真核细胞，例如，细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞或植物细胞。典型的细菌细胞包括大肠杆菌、任何链霉菌或杆菌(例如仙人掌杆菌(Bacillus cereus)、枯草芽孢杆菌(Bacillussubtilis))、鼠伤寒沙门氏菌(Salmonella typhimurium)和杆菌、链霉菌属和葡萄球菌属中的各种。典型的昆虫细胞包括果蝇S2和草地夜蛾(Spodoptera)Sf9。典型的动物细胞包括CHO、COS或黑色素瘤细胞或任何鼠或人的细胞系。合适的宿主的选择在本领域技术人员的能力范围内。转化各种高等植物种类的技术是已知的，在技术和科学文献中有描述，见，例如，Weising(1988)Ann.Rey.Genet.22：421-477；美国专利5,750,870。

载体可以使用各种技术导入宿主细胞中，包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂转染法(lipofection)或电穿孔(Davis，L.，Dibner，M.，Battey，I.，BasicMethods in Molecular Biology，(1986))。

一方面，本发明的核酸或载体导入细胞是为了筛选，所以，所述核酸是以合适于该核酸的后续表达的方式进入细胞。导入的方法大体上由靶细胞类型决定。典型的方法包括CaPO₄沉淀法、脂质体融合、脂转染法(例如，LIPOFECTIN^TM)、电穿孔法、病毒感染法，等等。候选的核酸可以稳定地整合到宿主细胞基因组中(例如，用反转录病毒导入)或者可以短暂的或稳定的存在于细胞质中(即，通过使用传统的质粒，利用标准的调控序列、选择标记，等等)。因为许多药学上重要的筛选要求人或模型哺乳动物靶细胞，所以可以使用能够转染这些靶细胞的反转录病毒载体。

在适当的情况下，工程宿主细胞可以在传统的营养培养基中培养，所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后，用合适的方法(例如，温度变化或化学诱导)诱导被选择的启动子，细胞再培养一段时期，使得它们产生所需的多肽或其片段。

细胞可以通过离心收获，通过物理或化学方法破碎，保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎，包括冷冻-融解循环、超声波裂解法、机械破碎法或使用细胞裂解试剂。这些方法为本领域技术人员所熟知。表达的多肽或其片断可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水作用色谱、亲和色谱、羟基磷灰石色谱和凝集素色谱在内的方法回收和纯化。假如必要的话，可以应用蛋白质重折叠来完成多肽的构象。假如需要的话，在最终的纯化步骤中可以采用高效液相色谱(HPLC)。

各种哺乳动物细胞培养系统也可以被用于表达重组蛋白。哺乳动物表达系统的实例包括猴肾成纤维细胞的COS-7系，以及能从相容载体表达蛋白的其它细胞系，如C127、3T3、CHO、HeLa和BHK细胞系。

宿主细胞中的构建物可以以传统方式用于产生由重组序列编码的基因产物。根据重组产生方法中所用的宿主，由含有载体的宿主细胞产生的多肽可以糖基化或者非糖基化。本发明的多肽也可以包括或不包括起始甲硫氨酸残基。

也可以采用无细胞的翻译系统来产生本发明的多肽。无细胞翻译系统可以应用由DNA构建物转录得到的mRNA，所述DNA构建物包括与编码所述多肽或其片段的核酸可操作地连接的启动子。一些方面，该DNA构建物在进行体外转录反应之前可以被线性化。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育，产生所需的多肽或其片段。

表达载体可以含有一个或多个选择性标记基因，为选择转化宿主细胞提供表型特征，例如真核细胞培养物的二氢叶酸还原酶或新霉素抗性，或者大肠杆菌的例如四环素或氨苄青霉素抗性。

核酸的扩增

在本发明的实践中，本发明的核酸和编码本发明的多肽的核酸，或本发明的修饰的核酸，可以通过扩增来增殖。扩增也可以被用于克隆或修饰本发明的核酸。因此，本发明提供了用于扩增本发明核酸的扩增引物序列对。本技术领域的普通技术人员能设计用于这些序列的任何部分或全长的扩增引物序列对。

扩增反应也可以被用于量化样品中核酸的量(如细胞样品中信息的量)、标记核酸(例如将其应用于阵列或印迹)、检测核酸，或量化样品中特异性核酸的量。在本发明的一个方面，扩增从细胞或cDNA文库分离出的信息。

熟练技术人员可以选择和设计合适的寡核苷酸扩增引物。扩增方法在本技术领域也是已知的，包括，例如聚合酶链式反应PCR(例如参见PCR PROTOCOLS，A GUIDE TO METHODS AND APPLICATIONS，ed.Innis，Academic Press，N.Y.(1990)和PCR STRATEGIES(1995)，ed.Innis，Academic Press，Inc.N.Y.，连接酶链式反应(LCR)(例如参见Wu(1989)Genomics 4：560；Landegren(1988)Science 241：1077；Barringer(1990)Gene 89：117)；转录扩增(例如参见Kwoh(1989)Proc.Natl.Acad.Sci.USA 86：1173)；和自主维持序列扩增(例如参见Guatelli(1990)Proc.Natl.Acad.Sci.USA 87：1874)；Qβ复制酶扩增(例如参见Smith(1997)J.Clin.Microbiol.35：1477-1491)，自动Q-β复制酶扩增测定法(例如参见Burg(1996)Mol.Cell.Probes 10：257-271)和其它的RNA聚合酶介导技术(例如NASBA，Cangene，Mississauga，Ontario)；也参见Berger(1987)Methods Enzymol.152：307-316；Sambrook；Ausubel；美国专利4,683,195和4,683,202；Sooknanan(1995)Biotechnology 13：563-564。

确定序列同一性的程度

本发明提供了核酸，所述核酸包括与本发明的示例性核酸在至少大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多残基的区域内具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的序列。本发明提供了多肽，该多肽包括与本发明的示例性多肽具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的序列。序列同一性(同源性)的程度可以使用任何计算机程序和相关参数来确定，包括本文描述的那些，如BLAST 2.2.2或FASTA 3.0t78版本，参数为默认值。

图35是描述了本发明的示例性核酸和多肽的选择特征的图表，包括示例性序列与公开数据库的序列同一性比较。图35中描述的所有序列已经针对两组数据库进行了BLAST搜索(正如下面详细讨论的)。第一个数据库组可通过NCBI(NationalCenter for Biotechnology Information)获得。针对这些数据库进行搜索而得到的所有结果可在名为“NR描述(NR Description)”、“NR接收编号(NR AccessionCode)”、“NR期望值(NR Evalue)”或“NR生物(NR Organism)”的栏中找到。“NR”指由NCBI维护的非冗余核苷酸数据库。该数据库是GenBank、GenBank更新和EMBL更新的组合。“NR描述”这一栏中的输入涉及在任何给定的NCBI记录中的定义内容，其包括对序列的描述，例如来源生物、基因名称/蛋白名称、或对序列功能的一些描述。“NR接收编号”这一栏中的输入涉及给予序列记录的唯一的标识符。“NR期望值”这一栏中的输入是指期望值(Expect value，Evalue)，它表示，与在受询序列(本发明的序列)和数据库序列之间所发现的联配得分一样好的联配得分在相同数量的随机序列的比较——正如在现有BLAST搜索中所进行的比较——中被发现的概率。“NR生物”这一栏中的输入是指被鉴定为最接近的BLAST命中序列的序列的来源生物。第二组数据库被总称为Geneseq^TM数据库，该数据库可通过Thomson Derwent(Philadelphia，PA)获得。针对该数据库搜索得到的所有结果可在名为“基因序列蛋白描述(Geneseq Protein Description)”、“基因序列蛋白接收编号(Geneseq Protein Accession Code)”、“基因序列蛋白期望值(Geneseq Protein Evalue)”、“基因序列DNA描述(Geneseq DNA Description)”、“基因序列DNA接收编号(Geneseq DNA Accession Code)”或“基因序列DNA期望值(Geneseq DNA Evalue)”的列中找到。在这些栏中发现的信息与上面描述的NR栏中发现的信息相当，不同的是，它们来源于针对Geneseq^TM数据库进行的BLAST搜索，而不是NCBI数据库。此外，该表包括栏“预测EC No.(Predicted ECNo.)”。EC号码是根据Enzyme Commission of the Nomenclature Committee of theInternational Union of Biochemistry and Molecular Biology(IUBMB)开发的标准酶命名的体系对一种类型的酶分配的号码。“预测EC No.”一栏中的结果是通过对Kegg(Kyoto Encyclopedia of Genes and Genomes)数据库的BLAST搜索来确定的。如果最好的BLAST匹配的期望值(Evalue)等于或小于e^-6，那么将分配给该最好的匹配的EC号码输入到该表中。最佳的命中物的EC号码被用来暗示本发明的序列的EC号码可能是什么。“受询DNA长度(Query DNA Length)”和“受询蛋白长度(Query Protein Length)”栏分别是指在针对NCBI或Geneseq数据库而被搜索或查询的本发明序列中的核苷酸数目或氨基酸数目。“Geneseq或NR DNA长度”栏和“Geneseq或NR蛋白长度”栏分别指从BLAST搜索中获得的最佳匹配物的序列中核苷酸的数目或氨基酸的数目。在这些栏中提供的结果是来自于返回了较低期望值的搜索，或者来自NCBI数据库或者来自Geneseq数据库。“Geneseq或NR％ID蛋白”栏和“Geneseq或NR％ID DNA”栏是指本发明的序列与最佳BLAST匹配的序列之间的序列同一性百分比。在这些栏中提供的结果来自于返回了较低期望值的搜索，或者来自NCBI数据库或者来自Geneseq数据库。

同源序列也包括RNA序列，其中尿嘧啶取代核酸序列中的胸腺嘧啶。同源序列可以使用本文描述的任意一种方法获得，或者从对测序错误的纠正中产生。应该意识到，本文所示的核酸序列可以以传统的单字母格式表示(例如参见Stryer，Lubert.Biochemistry，3rd Ed.，W.H Freeman&Co.，New York)，或以在序列中记录核苷酸的身份的任何其它格式表示。

本文描述的各种序列比较程序被用于本发明的该方面。蛋白和/或核酸序列同一性(同源性)可以使用本技术领域已知的各种序列比较算法和程序中的任意一种来评价。这样的算法和程序包括，但不限于，TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(Pearson and Lipman，Proc.Natl.Acad.Sci.USA 85(8)：2444-2448，1988；Altschul等人，J.Mol.Biol.215(3)：403-410，1990；Thompson等人，Nucleic Acids Res.22(2)：4673-4680，1994；Higgins等人，Methods Enzymol.266：383-402，1996；Altschul等人，J.Mol.Biol.215(3)：403-410，1990；Altschul等人，Nature Genetics 3：266-272，1993)。

同源性或序列同一性可以使用序列分析软件来测量(例如，地址为1710University Avenue，Madison，WI 53705的威斯康星大学生物技术中心遗传学计算机组(Genetics Computer Group)的序列分析软件包)。这样的软件通过对各种缺失、替代和其它的修饰赋予表示同源性的数值来匹配相似的序列。用于表示两个或者更多个核酸或者多肽序列之间的关系的术语“同源性”和“同一性”，是指当两个或更多个序列或子序列在某一比较窗口(comparison window)或者指定区域内被比较和联配以确定最大一致性时，这些序列是相同的，或者具有特定百分比例的相同氨基酸残基或核苷酸，其可以应用各种序列比较算法或者通过人工联配和视觉观察来确定。对于序列比较，可以将一段序列作为参考序列，例如本发明的序列，而将测试序列与之进行比较。当使用序列比较算法时，将测试序列和参考序列输入到计算机中，指定子序列坐标，如果必要，也指定序列算法程序参数。可以使用默认的程序参数，或者可以指定别的参数。然后基于程序参数，序列比较算法计算出测试序列相对于参考序列的序列同一性百分比。

正如本文所用，“比较窗口”包括参考具有任意数目的连续残基的片段。例如，在本发明可以选择的方面，在本发明的示例性多肽或核酸序列和参考序列进行最优化联配后，所述本发明的示例性多肽或核酸序列的从20到全长范围的连续残基可与具有相同数目的连续位置的参考序列作比较。如果参考序列与本发明的示例性多肽或核酸序列具有所要求的序列同一性，例如与本发明的序列的序列同一性为50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高，那么该序列在本发明的范围内。在可以选择的实施方案中，在子序列和参考序列进行最优化联配后，将范围从大约20到600、大约50到200和大约100到150的子序列与具有相同数目的邻接位置的参考序列比较。

用于序列比较的联配方法在本技术领域是熟知的。在可以选择的方面，可以通过如下方法进行用于序列比较的最优化联配：例如Smith和Waterman，Adv.Appl.Math.2：482，1981的局部同源性算法，Needleman和Wunsch，J.Mol.Biol.48：443，1970的同源性联配算法，person和Lipman，Proc.Nat′l.Acad.Sci.USA 85：2444，1988的查找相似的方法，这些算法的计算机化实施(Wisconsin Genetics Software Package中的GAP、BESTFIT、FASTA和TFASTA，Genetics Computer Group，575 ScienceDr.，Madison，WI)，手工联配和观察检验。除了BLAST程序(生物信息国家中心的基本局域联配搜索工具(Basic Local Alignment Search Tool))外，用于确定同源性或者同一性的其它的算法包括，例如，ALIGN、AMAS(多重联配序列分析(Analysis of Multiply Aligned Sequences))、AMPS(蛋白多重序列联配(ProteinMultiple Sequence Alignment))、ASSET(联配片段统计评估工具(Aligned SegmentStatistical Evaluation Tool))、BANDS、BESTSCOR、BIOSCAN(生物学序列比较分析节点(Biological Sequence Comparative Analysis Node))、BLIMPS(BLocksIMProved Searcher)、FASTA、Intervals&Points、BMB、CLUSTAL V、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman算法、DARWIN、Las Vegas算法、FNAT(强迫核苷酸联配工具(Forced NucleotideAlignment Tool))、Framealign、Framesearch、DYNAMIC、FILTER、FASP(Fristensky序列分析软件包)、GAP(全局联配程序(Global Alignment Program))、GENAL、GIBBS、GenQuest、ISSC(灵敏性序列比较(Sensitive Sequence Comparison))、LALIGN(局部序列联配(Local Sequence Alignment))、LCP(局部内容程序(LocalContent Program))、MACAW(多重联配构建和分析工作台(Multiple AlignmentConstruction&Analysis Workbench))、MAP(多重联配程序(Multiple AlignmentProgram))、MBLKP、MBLKN、PIMA(模式诱导的多重序列联配(Pattern-InducedMulti-sequence Alignment))、SAGA(通过遗传算法的序列联配(Sequence Alignmentby Genetic Algorithm))和WHAT-IF。这样的联配程序也可以用于筛查基因组数据库，以鉴定具有大体上相同的序列的多聚核苷酸序列。大量的基因组数据库是可利用的，例如，作为人类基因组测序工程的构成部分的人类基因组的实质部分可以被利用(Gibbs，1995)。几个基因组序列已经测定，如，生殖器支原体(M.genitalium)(Fraser等，1995)、甲烷球菌(M.jannaschii)(Bult等，1996)、流行性感冒杆菌(H.influenzae)(Fleischmann等，1995)、大肠杆菌(E.coli)(Blattner等，1997)、和酵母(S.cerevisiae)(Mewes等，1997)，和黑腹果蝇(D.melanogaster)(Adams等，2000)。在模式生物的基因组序列的测序上已经取得了很大的进展，如鼠，线虫(C.elegans)和拟南芥(Arabadopsis sp.)。含有基因组信息并且注释有一些功能性信息的数据库由不同组织维护，可以通过互联网登录。

BLAST、BLAST 2.0和BLAST 2.2.2算法也可以用于实践本发明。这些算法已经有所描述，例如在Altschul(1997)Nuc.Acids Res.25：3389-3402；Altschul(1990)J.Mol.Biol.215：403-410中。用于实施BLAST分析的软件可以通过美国国家生物技术信息中心公开获得。这一算法涉及首先通过鉴别待询序列(query sequence)中长度为W的短的字串来确定高分序列对(high scoring sequence pairs，HSPs)，所述高分序列对在与数据库序列中同样长度的字串联配时，匹配或者满足某个正值的阈值T。T是指邻近字串(neighborhood word)的分数阈值(Altschul等，如上)。这些初始的邻近字串被用来启动搜索以发现包含有它们的更长的HSPs。所述字串沿着每一个序列向两个方向延伸，只要累积的联配分数在增加。对于核苷酸序列，使用参数M(一对匹配的残基的奖励分数；总是大于0)来计算累积分数。对于氨基酸序列，使用记分矩阵来计算累计分数。出现下面情况时，字串在各个方向上的延伸便停止：累积的联配分数由达到的最大值下降了数量X；由于一个或者多个记分为负的残基联配的累积，累积分数达到0或者0以下；或者延伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN程序(对于核苷酸序列)默认的是：字串长度(W)为11，期望值(E)为10，M＝5，N＝-4，对两条链进行比较。对于氨基酸序列，BLASTP程序默认：字串长度为3，期望值(E)为10，BLOSUM62记分矩阵(参见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA 89：10915)联配(B)为50，期望值(E)为10，M＝5，N＝-4，对两条链进行比较。BLAST算法也进行两个序列之间的相似性的统计学分析(参见，例如，Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90：5873)。由BLAST算法提供的一种相似性量度是最小合计概率(smallest sum probability，P(N))，其表示两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如，在测试核酸和参考核酸的比较中，如果最小合计概率小于大约0.2，更优选的是小于0.01，最优选的是小于大约0.001，就认为该核酸与参考序列相似。一方面，应用基本局域联配搜索工具(“BLAST”)来评价蛋白和核酸序列同源性。例如，五个特定的BLAST程序可以用来进行以下的任务：(1)BLASTP和BLAST3把氨基酸待询序列与蛋白质序列数据库进行比较；(2)BLASTN把核苷酸待询序列与核苷酸序列数据库进行比较；(3)BLASTX把待询核苷酸序列(两条链)的六个阅读框架的概念上的翻译产物与蛋白序列数据库进行比较；(4)TBLASTN把待询蛋白序列与核苷酸序列数据库的所有六个阅读框架(两条链)的翻译结果进行比较；(5)TBLASTN把核苷酸待询序列的六个框架的翻译结果与核苷酸序列数据库的六个框架的翻译结果进行比较。BLAST程序通过确定相似片段来确定同源性序列，所述相似片段在此是指在待查询的氨基酸或核酸序列与受测序列之间的“高分片段对(high-scoring segment pairs)”，该受测序列优选从蛋白或者核酸序列数据库得到。高分片段对优选利用记分矩阵来鉴定(即，联配)，很多的记分矩阵在本领域是已知的。优选地，应用的记分矩阵为BLOSUM62矩阵(Gonnet等，Science 256：1443-1445，1992；Henikoff和Henikoff，Proteins 17：49-61，1993)。较不优选地，也可以应用PAM或者PAM250矩阵(参见如，Schwartz和Dayhoff，eds.，1978，Matrices for Detecting Distance Relationships：Atlas of protein Sequence and Structure，Washingion：National Biomedical Research Foundation)。

在本发明的一个方面，为了确定核酸是否具有在本发明的范围内的必要的序列同一性，使用NCBI BLAST 2.2.2程序，默认选项为blastp。在BLAST 2.2.2程序中有大约38个设置选项。在本发明的该示例性方面，除了默认的过滤设置外，所有默认值都被使用(即，所有参数设置为默认值，除了设置过滤为OFF之外)；此处使用了“-F F”设置，该设置使得不能使用过滤。由于序列的长度较短，使用默认过滤通常会导致Karlin-Altschul违例。

在本发明的该示例性方面中所用的缺省值包括：

“低复杂性过滤器：ON

字串大小：3

矩阵：Blosum 62

空位成本：存在：11

延伸：1”

其它缺省设置可以是：低复杂性过滤器OFF，蛋白的字串大小3，BLOSUM62矩阵，空位存在罚分为-11，空位延伸罚分为-1。示例性的NCBI BLAST 2.2.2程序设置的“-W”选项缺省为0。这意味着，如果没有加以设置，对于蛋白，字串大小缺省为3，对于核苷酸为11。

计算机系统和计算机程序产品

为了确定和鉴定序列同一性、结构同源性、基序等等，本发明的序列可以在可通过计算机读取和访问的任何介质上存储、记录和操作。因此，本发明提供了计算机、计算机系统、计算机可读取的介质、计算机程序产品以及其上记录或存储了本发明的核酸和多肽序列的类似设备。正如此处所用，词语“记录”和“存储”指在计算机介质上存储信息的过程。熟练技术人员能容易地采用任何已知方法，在计算机可读取的介质上存储信息，以产生包括本发明的一个或多个核酸和/或多肽序列的产品。

本发明的另一个方面是计算机可读取的介质，其上已经记录了至少一个本发明的核酸和/或多肽序列。计算机可读取介质包括磁性可读取介质、光学可读取介质、电子可读取介质和磁/光学介质。例如，计算机可读取的介质可以是硬盘、软盘、磁带、CD-ROM、数字化视频光盘(DVD)、随机存取存储器(RAM)或只读存储器(ROM)以及本技术领域的技术人员已知的其它类型的其它介质。

本发明的方面包括系统(例如基于因特网的系统)，尤其是计算机系统，它们存储和操纵本文描述的序列和序列信息。计算机系统100的一个实例以框图形式示意性地描述在图1中。正如此处所用，“计算机系统”指硬件部分、软件部分、以及数据存储部分，它们用于分析本发明的核苷酸或多肽序列。计算机系统100可以包括用于处理、访问和操纵序列数据的处理器。处理器105可以是任何类型的中央处理单元，如来自英特尔公司的奔腾III，或来自Sun、Motorola、Compag、AMD或IBM公司的类似处理器。计算机系统100是一个通用的系统，该系统包括处理器105和用于存储数据的一个或多个内部数据存储组分110，以及用于检索数据存储组分上存储的数据的一个或多个数据检索设备。熟练技术人员能容易地意识到，任何一种当前可获得的计算机系统都是合适的。

一方面，计算机系统100包括连接到总线上的处理器105，其中总线连接到主存储器115(优选地以RAM来实现)和一个或多个内部数据存储设备110，例如其上已经存储了数据的硬盘驱动器和/或其它计算机可读介质。计算机系统100可以进一步包括一个或多个数据检索设备118，用于读取在内部数据存储设备110上存储的数据。数据检索设备118可以是，例如软盘驱动器、压缩磁盘驱动器、磁带驱动器或能连接到远程数据存储系统的调制解调器(例如通过因特网)等等。在一些实施方案中，内部数据存储设备110是可移动的计算机可读介质，例如含有控制逻辑和/或其上记录的数据的软盘、压缩磁盘、磁带等等。计算机系统100可以有利地包括适当的软件或用适当的软件编程，用于当数据存储部分被插入到数据检索设备中时从数据存储部分读取控制逻辑和/或数据。计算机系统100包括显示器120，用于给计算机用户显示输出。也应用注意到，计算机系统100可以被连接到网络或广域网中的其它计算机系统125a-c，以便给计算机100提供集中访问。用于访问和处理本发明的核苷酸或氨基酸序列的软件在执行过程中可驻留于主存储器115中。在一些方面，计算机系统100可以进一步包括用于比较本发明核酸序列的序列比较算法。算法和序列可以存储于计算机可读介质上。“序列比较算法”指在计算机系统100上执行的一种或多种程序，以比较核苷酸序列和数据存储设备中存储的其它核苷酸序列和/或化合物。例如，序列比较算法可以将计算机可读介质上存储的本发明的核苷酸序列与计算机可读介质上存储的参考序列进行比较，以鉴定同源性或结构基序。

上述算法所用的参数可以根据序列长度和所研究的同源性程度进行调整。在一些方面，在没有用户说明书的情况下，这些参数可以是算法所用的缺省参数。图2是示意性说明过程200的一个方面的流程图，该过程用于将新的核苷酸或蛋白序列与序列数据库进行比较，以便确定新序列和数据库中的序列之间的同源性水平。序列数据库可以是存储于计算机系统100上的个人数据库，或可以通过因特网获得的公开数据库如GENBANK。过程200在起始状态201开始，然后转到状态202，其中要被比较的新序列被存储于计算机系统100的存储器上。正如上面所讨论的，该存储器可以是任何类型的存储器，包括RAM或内部存储设备。然后过程200转到状态204，其中打开序列数据库以进行分析和比较。然后过程200转到状态206，其中数据库中存储的第一个序列被读取到计算机的存储器中。然后在状态210进行比较，以确定第一个序列是否与第二个序列相同。重要的是应该注意到，该步骤不限于进行新序列和数据库中第一个序列之间的精确比较。用于比较两个核苷酸或蛋白序列的熟知的方法对于本技术领域的普通技术人员是已知的，即使所述两个核苷酸或蛋白序列不完全相同。例如，可以在一个序列中引入空位，以提高两个测试序列之间的同源性水平。控制空位或其它特征在比较过程中是否被引入到序列中的参数通常由计算机系统的用户输入。一旦已经在状态210进行两个序列的比较，在决策状态210就要作出两个序列是否相同的判断。当然，术语“相同的”不限于绝对相同的序列。在过程200中，在由用户输入的同源性参数范围内的序列都将被标记为“相同的”。如果作出两个序列相同的判断，过程200转到状态214，其中来自数据库的序列的名称被显示给用户。该状态通知用户，具有显示的名称的序列满足所输入的同源性限制。一旦所存储序列的名称被显示给用户，过程200转到决策状态218，其中作出数据库中是否存在更多序列的判断。如果数据库中不存在更多的序列，那么过程200在结束状态220终止。然而，如果数据库中确实存在更多的序列，那么过程200转到状态224，其中指针被指向数据库中的下一个序列，以便与新序列进行比较。以这种方式，将新序列与数据库中的每一序列联配并进行比较。应该注意到，如果已经在决策状态212已经作出了序列不同源的判断，那么过程200将立即转到决策状态218，以便确定用于比较的数据库中的任何其它序列是否可利用。因此，本发明的一个方面是计算机系统，该系统包括处理器、其上已经存储了本发明核酸序列的数据存储设备、和用于进行比较的序列比较器。该序列比较器可以指出所比较的序列之间的同源性水平，或者鉴定结构基序，或者该比较器可以鉴定与这些核酸密码和多肽密码进行比较的序列中的结构基序。图3是示意性说明用计算机实施的过程250的一个实施方案的流程图，该过程用于确定两个序列是否同源。过程250在起始状态252开始，然后转到状态254，其中要被比较的第一个序列被存储到存储器上。然后要被比较的第二个序列在状态256被存储到存储器上。然后过程250转到状态260，其中读取第一个序列中的第一个字符，然后转到状态262，其中读取第二个序列的第一个字符。应该理解到，如果序列是核苷酸序列，那么字符将通常是A、T、C、G或U。如果序列是蛋白序列，那么字符可以是单字母氨基酸密码，以便第一个序列和第二个序列可以被容易地比较。然后在决策状态264作出两个字符是否相同的判断。如果它们相同，那么过程250转到状态268，其中第一个和第二个序列中的下一个字符被读取。然后作出第一个和第二个序列中的下一个字符是否相同的判断。如果它们相同，那么过程250继续循环，直到两个字符不相同。如果作出的判断是这两个字母不相符，那么过程250转到决策状态274，以确定是否有更多的字符或者序列可以读取。如果没有可读取的任何更多的字符，那么过程250转到状态276，其中第一个和第二个序列之间的同源性水平被显示给用户。同源性水平通过计算序列之间相同的字符在第一个序列的序列总数中的比例来确定。因此，如果第一个100核苷酸序列中的每一个字符都与第二个序列中的每一个字符联配，那么同源性水平将是100％。

可以选择地，计算机系统可以比较参考序列与本发明的序列，以确定这些序列是否在一个或多个位置上不同。相对于本发明的序列或者参考序列，该程序可以记录所插入、删除或取代的核苷酸或核酸残基的长度和同一性。计算机程序可以是确定参考序列是否相对于本发明的序列含有单核苷酸多态性(SNP)的程序，或者确定本发明的序列是否包含已知序列的SNP的程序。因此，在一些方面，计算机系统是鉴定SNP的程序。该方法可以通过上面描述的算机系统和图3所示意性说明的方法执行。该方法通过使用计算机程序读取本发明的序列和参考序列，并且用计算机程序鉴定差异来执行。

在其它方面，基于计算机的系统包括鉴定器，其用于鉴定本发明的核酸或多肽中的特征。“鉴定器”指在核酸序列中鉴定某些特征的一个或多个程序。例如，鉴定器可以包括在核酸序列中鉴定开发阅读框(ORF)的程序。图4是示意性说明鉴定器过程300的一个方面的流程图，即用于鉴定序列特征的存在。过程300在起始状态302开始，然后转到状态304，其中将被检查特征的第一个序列被存储在计算机系统100的存储器115上。然后过程300转到状态306，其中打开序列特征数据库。这样的数据库包括每一特征的属性以及该特征的名称的列表。例如，特征名称是“起始密码子”，属性是“ATG”。另一个实例是特征名称“TAATAA序列盒”，特征属性是“TAATAA”。这样的数据库的实例由威斯康星大学遗传学计算机组(University of Wisconsin Genetics Computer Group)开发。可以选择地，这些特征是结构多肽基序如α螺旋、β折叠，或功能多肽基序如酶活性位点、螺旋-转角-螺旋基序或本技术领域的普通技术人员已知的其它基序。一旦在状态306打开特征数据库，过程300就转到状态308，其中从数据库读取第一个特征。然后在状态310将第一个特征的属性与第一个序列进行比较。接着在决策状态316作出在第一个序列中是否发现该特征的属性的判断。如果发现了属性，那么过程300转到状态318，其中所发现的特征的名称被显示给用户。然后，过程300转到决策状态320，其中作出数据库中是否存在更多特征的判断。如果不存在更多特征，那么过程300在结束状态324终止。然而，如果数据库中确实存在更多的特征，那么过程300在状态326读取下一个序列特征，循环回到状态310，其中将下一个特征的属性与第一个序列进行比较。如果在决策状态316在第一个序列中没有发现特征属性，那么过程300直接转到决策状态320，以便确定数据库中是否存在更多特征。因此，一方面，本发明提供了鉴定开放阅读框(ORF)的计算机程序。

本发明的多肽或核酸序列可以以多种格式在各种数据处理器程序中存储和操作。例如，序列可以以文本文件存储在字处理文件中，如MicrosoftWORD或WORDPERFECT，或以ASCII文件存储在本技术领域的普通技术人员熟悉的多种数据库程序中，如DB2、SYBASE或ORACLE。此外，许多计算机程序和数据库可以被用作序列比较算法、鉴定器或与本发明的核酸序列进行比较的参考核苷酸序列或多肽序列的来源。用于实践本发明的程序和数据库，包括但不限于：MacPattern(EMBL)、DiscoveryBase(Molecular Application Group)、GeneMine(Molecular Application Group)、Look(Molecular Application Group)、MacLook(MolecularApplication Group)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul等人，J.Mol.Biol.215：403，1990)、FASTA(Pearson and Lipman，Proc.Natl.Acad.Sci.USA，85：2444，1988)、FASTDB(Brutlag等人，Comp.App.Biosci.6：237-245，1990)、Catalyst(Molecular Simulations Inc.)、Catalyst/SHAPE(MolecularSimulations Inc.)、Cerius2.DBAccess(Molecular Simulations Inc.)、HypoGen(Molecular Simulations Inc.)、Insight II(Molecular Simulations Inc.)、Discover(Molecular Simulations Inc.)、CHARMm(Molecular Simulations Inc.)、Felix(Molecular Simulations Inc.)、DelPhi(Molecular Simulations Inc.)、QuanteMM(Molecular Simulations Inc.)、Homology(Molecular Simulations Inc.)、Modeler(Molecular Simulations Inc.)、ISIS(Molecular Simulations Inc.)、Quanta/ProteinDesign(Molecular Simulations Inc.)、WebLab(Molecular Simulations Inc.)、WebLabDiversity Explorer(Molecular Simulations Inc.)、Gene Explorer(Molecular SimulationsInc.)、SeqFold(Molecular Simulations Inc.)、MDL Available Chemicals Directory数据库、MDL Drug Data Report数据库、Comprehensive Medicinal Chemistry数据库、Derwent’s World Drug Index数据库、BioByteMasterFile数据库、Genbank数据库和Genseqn数据库。基于本发明的公开内容，许多其它程序和数据库对于本技术领域的普通技术人员是显而易见的。

可以用上述程序检测的基序包括：编码亮氨酸拉链的序列、螺旋-转角-螺旋基序、糖基化位点、泛素化位点、α螺旋和β折叠、编码指导编码蛋白分泌的信号肽的信号序列、在转录调节中涉及的序列如同源框、酸性伸展物(acidic stretches)、酶活性位点、底物结合位点和酶切割位点。

核酸的杂交

本发明提供了分离的或重组的核酸，这些核酸与本发明的示例性序列或编码本发明的多肽的核酸在严紧条件下杂交。严紧条件可以是高度严紧性条件、中度严紧性条件、低度严紧性条件，包括本文描述的高的和降低的严紧性的条件。一方面，正如下面所讨论的，洗涤条件的严紧性提供了决定核酸是否在本发明范围内的条件。

在可以选择的实施方案中，本发明的核酸，正如通过它们在严紧条件下杂交的能力所定义的，可以在本发明的核酸的大约五个残基到全长之间；例如它们的长度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多残基。也包括小于全长的核酸。这些核酸可以用作，例如杂交探针、标记探针、PCR寡核苷酸探针、iRNA、反义或编码抗体结合肽(抗原决定基)、基序、活性位点的序列以及类似序列。

一方面，本发明的核酸通过它们在高度严紧性下杂交的能力定义，高度严紧性包括在大约37℃到42℃的温度下大约50％的甲酰胺的条件。一方面，本发明的核酸通过它们在降低的严紧性下杂交的能力定义，降低的严紧性包括在大约30℃到35℃在大约35％至25％的甲酰胺中的条件。

可以选择地，本发明的核酸通过它们在高度严紧性下杂交的能力定义，高度严紧性包括的条件为：在42℃、在50％甲酰胺、5X SSPE、0.3％SDS中，和封闭核酸的重复序列，如cot-1或鲑精DNA(例如200n/ml的剪切和变性鲑精DNA)。一方面，本发明的核酸通过它们在降低的严紧性条件下杂交的能力定义，降低的严紧性条件包括在35℃的降低温度下的35％甲酰胺中。

在杂交后，可以用6X SSC、0.5％SDS在50℃洗涤滤膜。这些条件在高于25％的甲酰胺下被认为是“中度”条件，在低于25％的甲酰胺下被认为是“低度”条件。“中度”杂交条件的特定实例是当上述杂交在30％的甲酰胺中进行时。“低度严格性”杂交条件的特定实例是当上述杂交在10％的甲酰胺中进行时。

与特定水平的严紧性相对应的温度范围可以通过计算相关核酸的嘌呤与嘧啶的比率并且相应地调节温度来进一步限定。本发明的核酸也通过它们在Ausubel和Sambrook中所述的高度、中度、低度严紧性条件下杂交的能力来定义。上述范围和条件的变化在本技术领域是熟知的。下面对杂交条件做了进一步的讨论。

可以对上述方法进行修饰，以鉴定与探针序列具有降低水平的同源性的核酸。例如，为了获得与可检测的探针具有降低的同源性的核酸，可以使用较低严紧性的条件。例如，杂交温度可以在杂交缓冲液中以5℃的梯度变量从68℃降低到42℃，杂交缓冲液的Na⁺浓度为大约1M。在杂交后，用2X SSC、0.5％SDS在杂交温度下洗涤滤膜。这些条件在高于50℃被认为是“中度”条件，在低于50℃被认为是“低度”条件。特定实例的“中度”杂交条件是当上述杂交在55℃进行。特定实例的“低度严格性”杂交条件是当上述杂交在45℃进行。

可以选择地，杂交可以在含有甲酰胺的缓冲液如6X SSC中在42℃的温度下进行。在这种情况下，杂交缓冲液中甲酰胺的浓度可以以5％的梯度变量从50％降低到0％，以鉴定与探针具有降低水平的同源性的克隆。在杂交后，用6X SSC、0.5％SDS在50℃洗涤滤膜。这些条件在高于25％的甲酰胺被认为是“中度”条件，在低于25％甲酰胺被认为是“低度”条件。特定实例的“中度”杂交条件是当上述杂交在30％甲酰胺中进行。特定实例的“低度严格性”杂交条件是当上述杂交在10％甲酰胺中进行。

然而，杂交形式的选择不是关键性的-洗涤条件的严紧性是决定核酸是否在本发明范围内的一个条件。用于鉴定本发明范围内的核酸的洗涤条件包括，例如：在pH 7大约0.02M的盐浓度，至少为大约50℃或大约55℃到大约60℃的温度；或者在72℃大约0.15M NaCl的盐浓度下洗涤大约15分钟；或者在至少大约50℃或大约55℃到大约60℃的温度下大约0.2X SSC的盐浓度下洗涤大约15到大约20分钟；或者用溶液将杂交复合物洗涤两次，所述溶液的盐浓度为含有0.1％SDS的大约2X SSC，在室温下洗涤15分钟，然后用含有0.1％SDS的0.1X SSC在68℃洗涤两次，洗涤15分钟；或者等同的条件。参见Sambrook，Tijssen和Ausubel对于SSC缓冲液和等同条件的描述。

这些方法可以被用于分离本发明的核酸。

寡核苷酸探针及其使用这些寡核苷酸探针的方法

本发明也提供了可以使用的核酸探针，例如用于鉴定编码具有淀粉酶活性的多肽的核酸或其片段，或用于鉴定淀粉酶基因。一方面，该探针包括本发明核酸中的至少10个连续碱基。可以选择地，本发明的探针可以是如本发明核酸中所示序列的至少大约5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、110、120、130、150或大约10到50、大约20到60或大约30到70个连续碱基。这些探针通过结合和/或杂交来鉴定核酸。这些探针可以在本发明的阵列中使用，参见下面的讨论，包括例如毛细管阵列。本发明的探针也可以用于分离其它核酸或多肽。

本发明的探针可用于确定生物样品如土壤样品是否含有具有本发明的核酸序列的生物体或从中可得到所述核酸的生物体。在这样的方法中，获得潜在地具有从中可分离出所述核酸的生物体的生物样品，并从样品中获得核酸。将这些核酸在允许探针与样品中存在的任何互补序列特异性杂交的条件下与探针接触。在必要的时候，允许探针与互补序列特异性杂交的条件，可以通过将探针与来自样品的互补序列以及对照序列进行接触来确定，所述样品已知含有互补序列，所述对照序列不含有互补序列。杂交条件，如杂交缓冲液的盐浓度、杂交缓冲液的甲酰胺浓度、或杂交温度，可以被改变以确定允许探针与互补核酸特异性杂交的条件(参见关于特异性杂交条件的讨论)。

如果该样品含有从中可分离出核酸的生物体，那么探针的特异性杂交被检测。杂交可以通过用可检测的试剂标记过的探针来检测，如放射性同位素、荧光染料或能催化可检测产物形成的酶。使用标记探针来检测样品中互补核酸的存在的许多方法对本技术领域的普通技术人员是熟知的。这些方法包括Southern印迹、Northern印迹、集落杂交方法和斑点印迹。这些方法中的每一种方法的方案在Ausubel和Sambrook中有所提供。

可以选择地，多于一种的探针(其中至少一种探针能与核酸样品中存在的任何互补序列特异性杂交)可以在扩增反应中使用，以确定样品是否包含含有本发明的核酸的生物体(例如从中可分离出所述核酸的生物体)。一方面，这些探针包括寡核苷酸。一方面，扩增反应可以包括PCR反应。PCR实验方案在Ausubel和Sambrook中有所描述(参见关于扩增反应的讨论)。在这样的方法中，将样品中的核酸与探针接触，进行扩增反应，检测所得到的扩增产物。扩增产物可以通过在反应产物上进行凝胶电泳并用嵌入剂如溴化乙啶染色凝胶来检测。可以选择地，可以用同位素标记一种或多种探针，放射性扩增产物的存在在凝胶电泳后通过放射自显影术来检测。

衍生自本发明核酸的3’或5’末端附近的序列的探针也可以在染色体步移(chromosome walking)方法中使用，以鉴定含有额外的例如基因组序列的克隆。这样的方法允许从宿主生物中分离编码相关的额外蛋白的基因。

一方面，本发明的核酸序列被用作探针，以鉴定和分离相关的核酸。在一些方面，如此鉴定的相关核酸可以是来自生物体的cDNA或基因组DNA，这些生物体并不是最初从中分离出本发明的核酸的生物体。在这样的方法中，核酸样品在允许探针与相关序列特异性杂交的条件下与探针接触。然后用上面描述的任意一种方法检测探针与来自相关生物体的核酸的杂交。

在核酸杂交反应中，用于获得特定水平的严紧性的条件可以有所变化，依赖于被杂交的核酸的性质。例如，在选择杂交条件时，可以考虑长度、互补程度、核苷酸序列组成(例如GC和AT含量)、以及核酸的杂交区域的核酸类型(例如RNA或DNA)。其它的考虑因素是这些核酸中的一个核酸是否被固定化，例如固定化在滤器上。杂交可以在低度严紧性、中度严紧性或高度严紧性的条件下进行。作为核酸杂交的一个实例，含有固定化的变性核酸的聚合物膜首先在45℃在含有如下成分的溶液中预杂交30分钟：0.9M NaCl、50mM NaH₂PO₄，pH 7.0、5.0mMNa₂EDTA、0.5％SDS、10X Denhardt’s和0.5mg/ml多核糖腺苷酸。然后在该溶液中加入大约2X10⁷cpm(比活性为4-9X10⁸cpm/ug)的³²P末端标记的寡核苷酸探针。在孵育12-16小时后，在室温(RT)下在含有0.5％SDS的1X SET(150mM NaCl、20mM Tris盐酸，pH 7.8、1mM Na₂EDTA)中将膜洗涤30分钟，随后，对于该寡核苷酸探针，在Tm-10℃的温度，在新鲜的1X SET中洗涤30分钟。然后将膜暴露于放射自显影胶片，以检测杂交信号。

通过改变用于鉴定与可检测探针杂交的核酸例如cDNA或基因组DNA的杂交条件的严紧性，鉴定并分离与探针具有不同同源性水平的核酸。严紧性通过在低于探针的解链温度的变化温度下进行杂交来改变。解链温度Tm是50％的靶序列与完全互补的探针杂交时的温度(在确定的离子强度和pH)。选择非常严紧的条件，使其与特定探针的Tm相等，或比Tm低大约5℃。可以使用下述示范性公式计算探针的解链温度。对于长度在14到70个核苷酸的探针，使用如下公式计算解链温度(Tm)：Tm＝81.5+16.6(log[Na+])+0.41(G+C的比例分数)-(600/N)，其中N是探针的长度。如果杂交在含有甲酰胺的溶液中进行，解链温度使用如下等式计算：Tm＝81.5+16.6(log[Na+])+0.41(G+C的比例分数)-(0.63％甲酰胺)-(600/N)，其中N是探针的长度。预杂交在6X SSC、5X Denhardt’s试剂、0.5％SDS、100μg变性的片段化鲑精DNA或6X SSC、5X Denhardt’s试剂、0.5％SDS、100μg变性的片段化鲑精DNA、50％甲酰胺中进行。SSC和Denhardt’s和其它溶液的配方已被列出，例如在Sambrook中。

杂交通过将可检测探针加入到上面所列出的预杂交溶液中来进行。在探针包括双链DNA的情况下，在加入到杂交溶液之前对探针变性。将滤膜与杂交溶液接触充足的时间，以允许探针与含有与其互补的序列或与其同源的序列的cDNA或基因组DNA杂交。对于长度超过200个核苷酸的探针，杂交可以在比Tm低15-25℃的温度进行。对于更短的探针，如寡核苷酸探针，杂交在比Tm低5-10℃的温度进行。一方面，6X SSC中的杂交在大约68℃进行。一方面，在含有50％甲酰胺的溶液中的杂交是在大约42℃进行。所有前述杂交被认为属于高度严紧性条件。

杂交后，洗涤滤膜以除去任何未特异性结合的可检测探针。用于洗涤滤膜的严紧性也可以根据如下方面进行变化：被杂交的核酸的性质、被杂交的核酸的长度、互补程度、核苷酸序列组成(例如GC和AT含量)和核酸类型(例如RNA和DNA)。逐步增高的严紧性条件洗涤的实例如下：2X SSC，0.1％SDS，室温下洗涤15分钟(低度严紧性)；0.1X SSC，0.5％SDS，室温下洗涤30分钟到1小时(中度严紧性)；0.1X SSC，0.5％SDS，杂交温度和68℃之间洗涤15到30分钟(高度严紧性)；和0.15M NaCl，72℃洗涤15分钟(非常高的严紧性)。最终的低严紧性洗涤可以在0.1X SSC在室温下进行。上述的实例仅仅是可用于洗涤滤膜的一组条件的示例性说明。本技术领域的普通技术人员将知道，对于不同严紧性的洗涤，可以有多种方案。

已经与探针杂交的核酸可以通过放射自显影术或其它传统技术来鉴定。可以对上述方法进行修改，以鉴定与探针序列具有降低水平的同源性的核酸。例如，为了获得与可检测探针具有降低同源性的核酸，可以使用较低严格性条件。例如，杂交缓冲液中的杂交温度可以按照5℃的增量从68℃降低到42℃，所述杂交缓冲液的Na+浓度为大约1M。杂交后，用2X SSC、0.5％SDS在杂交温度下洗涤过滤膜。这些条件在高于50℃被认为是“中度”条件，在低于50℃被认为是“低度”条件。“中度”杂交条件的实例是当上述杂交在55℃进行时。“低度严格性”杂交条件的实例是当上述杂交在45℃进行时。

可以选择地，杂交可以在含有甲酰胺的缓冲液如6X SSC中在42℃的温度进行。在这种情况下，杂交缓冲液中的甲酰胺浓度可以以5％的变量从50％降低到0％，以鉴定与探针具有降低水平的同源性的克隆。杂交后，用6X SSC、0.5％SDS在50℃洗涤滤器。这些条件在高于25％甲酰胺被认为是“中度”条件，在低于25％甲酰胺被认为是“低度”条件。“中度”杂交条件的特定实例是当上述杂交在30％甲酰胺进行时。“低度严格性”杂交条件的特定实例是当上述杂交在10％甲酰胺进行时。

本发明的这些探针和方法可被用于分离核酸，所述核酸具有与本发明的核酸序列具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性(“同源性”)的序列或与其互补的序列，所述本发明的核酸序列包括其至少大约10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400、500、550、600、700、750、800、850、900、950、1000或更多个连续碱基。正如本文所讨论的，同源性可以使用联配算法来测量。例如，同源的多核苷酸可以具有编码序列，该编码序列是本文描述的编码序列之一的天然发生的等位基因变体。当与本发明的核酸比较时，这样的等位基因变体可以具有一个或多个核苷酸的取代、删除或添加。

另外，本发明的探针和方法可用于分离编码多肽的核酸，所述多肽与本发明的多肽具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性(同源性)，所述本发明的多肽包括至少大约5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸，正如使用序列联配算法所确定的(例如FASTA 3.0t78版本算法，参数为默认值，或具有如已描述的示例性设置的BLAST 2.2.2程序)。

抑制淀粉酶的表达

本发明提供了与本发明的核酸序列互补的核酸(例如本发明的核酸的反义序列)。反义序列能抑制编码淀粉酶的基因的转运、剪接或转录。抑制可通过将基因组DNA或信使RNA作为靶标来实现。作为靶标的核酸的转录或功能可以被抑制，例如通过杂交和/或切割。本发明提供的一组特别有用的抑制剂包括寡核苷酸，这些寡核苷酸能结合淀粉酶基因或信息，在两种情况下都阻止或抑制淀粉酶的产生或功能。结合可通过序列特异性杂交来完成。另一类有用的抑制剂包括引起淀粉酶信息失活或切割的寡核苷酸。该寡核苷酸可具有引起这样的切割的酶活性，如核酶活性。可以对寡核苷酸进行化学修饰，或与能切割互补核酸的酶或组合物偶联。可以对许多不同的这样的寡核苷酸进行筛选来寻找那些具有期望活性的寡核苷酸。

反义寡核苷酸

本发明提供了能结合淀粉酶信息的反义寡核苷酸，其能通过以mRNA作为靶标来抑制蛋白水解活性。设计反义寡核苷酸的策略在科学和专利文献中有很好的描述，熟练技术人员能使用本发明的新试剂设计这样的淀粉酶寡核苷酸。例如，筛选有效的反义寡核苷酸的基因步移/RNA作图方法在本技术领域是熟知的，例如参见Ho(2000)Methods Enzymol.314：168-183，该文献描述了RNA作图分析法，该分析法是基于标准的分子技术，以提供用于有效的反义序列选择的一种简单且可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11：191-198。

自然发生的核酸被用作反义寡核苷酸。这些反义寡核苷酸可以是任意长度；例如，在可选择的方面，这些反义寡核苷酸在大约5到100之间，大约10到80之间，大约15到60之间，大约18到40之间。最适长度可以通过常规筛选来决定。这些反义寡核苷酸可以以任意浓度存在。最适浓度可通过常规筛选来决定。大量合成的、非天然发生的核苷酸和核酸类似物是已知的，它们可以解决这一潜在的问题。例如，可以使用含有非离子骨架的肽核酸(PNAs)，如N-(2-氨基乙基)甘氨酸单元。也可以使用具有硫代磷酸酯键的反义寡核苷酸，正如在如下文献中所描述的：WO 97/03211；WO 96/39154；Mata(1997)Toxicol Appl Pharmacol 144：189-197；Antisense Therapeutics，ed.Agrawal(Humana Press，Totowa，N.J.，1996)。正如上面所描述的，本发明提供的具有合成DNA骨架类似物的反义寡核苷酸也包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、烷基磷酸三酯、氨基磺酸酯、3′-硫代乙缩醛、亚甲基(甲基亚氨)、3′-N-氨基甲酸酯和吗啉代氨基甲酸酯核酸。

组合化学方法学可用于产生大量能被快速筛选特异性寡核苷酸的寡核苷酸，所述特异性寡核苷酸对靶物质具有适当的结合亲和性和特异性，所述靶物质例如本发明的正义和反义淀粉酶序列(例如参见Gold(1995)J.，Biol.Chem.270：13581-13584)。

抑制性核酶

本发明提供了能结合淀粉酶信息的核酶。这些核酶能抑制淀粉酶活性，例如通过以mRNA作为靶标。设计核酶和选择用于靶向的淀粉酶特异性反义序列的策略在科学和专利文献中有很好的描述，熟练技术人员能使用本发明的新试剂来设计这样的核酶。核酶通过核酶的靶RNA结合部分来与靶RNA结合，从而发挥作用，核酶的靶RNA结合部分与该RNA上切割靶RNA的酶促部分非常接近。这样，通过互补的碱基配对，核酶识别和结合靶RNA，而且一旦结合于正确的位置，便以酶的活性作用来切割靶RNA和使其失活。如果切割发生在编码序列中，以这样的方式切割靶RNA将会破坏其引导合成编码的蛋白的能力。核酶结合和切割其RNA靶之后，它可以从结合的RNA上释放出来并且重复切割新的靶子。

在一些情况下，核酶的酶性质会优于其它的技术，如反义技术(其中核酸分子结合于核酸靶来阻止其转录、翻译或者与其它分子的联系)，因为实现治疗效果所必要的核酶有效浓度可能低于反义寡聚核苷酸的浓度。这一潜在的优点反映出核酶可以以酶的方式进行作用的能力。因此，单个核酶分子可以切割靶RNA的多个分子。此外，核酶是一种典型的高度特异性的抑制物，其抑制作用的特异性不仅依赖于碱基配对的结合机制，也依赖于该分子抑制与其结合的RNA的表达的机制。即，所述抑制是由切割靶RNA引起的，因此特异性定义为靶RNA的切割率与非靶RNA的切割率的比值。除了涉及碱基配对的那些因素，这种切割机制还依赖于另外的因素。这样，核酶作用的特异性比结合于同样的RNA位点的反义寡聚核苷酸强。

本发明的核酶，例如，具有酶活的核酶RNA分子可以形成锤头状基序、发夹基序，如肝炎δ病毒基序、I类内含子基序和/或与RNA引导序列(guide sequence)相联系的RNaseP样RNA。锤头状基序的例子在如Rossi(1992)Aids Research andHuman Retroviruses 8：183中有说明；发夹基序在Hampel(1989)Biochemistry 28：4929和Hampel(1990)Nuc.Acids Res.18：299中有说明；肝炎δ病毒基序在Perrotta(1992)Biochemistry 31：16中有说明；RNaseP基序在Guetrier-Takada(1983)Cell35：849中有说明；I类内含子在Cech美国专利4,987,071中有说明。这些特定基序的引述并不是限制性的。本领域技术人员将认识到本发明的核酶，如，本发明的有酶活的RNA分子，可以有与一个或者多个靶基因的RNA区域互补的特异的底物结合位点。本发明的核酶可以在底物结合位点内或者其周围具有赋予了该分子RNA切割活性的核苷酸序列。

RNA干扰(RNAi)

在一个方面，本发明提供了被称为“RNAi”分子的RNA抑制性分子，其含有本发明的淀粉酶序列。RNAi分子构成双链RNA(dsRNA)分子。RNAi可抑制淀粉酶基因的表达。在一个方面，RNAi的长度大约为15、16、17、18、19、20、21、22、23、24、25或更多个核苷酸的双链。本发明不限于任何特殊的作用机制，RNAi可进入细胞中，引起相似或相同序列的单链RNA(ssRNA)的降解，包括内源性mRNA。当细胞与双链RNA(dsRNA)接触时，来自同源基因的mRNA被称为RNA干扰(RNAi)的过程选择性地降解。RNAi的一个可能的基本机制是将与特定的基因序列匹配的双链RNA(dsRNA)打断成为称为小分子干扰RNA的短的碎片，它可触发与其序列匹配的mRNA的降解。在一个方面，本发明的RNAi可用于基因沉默(gene-silencing)疗法中，见，例如Shuey(2002)Drug Discov.Today7：1040-1046。在一个方面，本发明提供了使用本发明的RNAi选择性降解RNA的方法。该过程可在体外、离体或体内实施。在一个方面，本发明的RNAi分子可用来在细胞、器官或动物中产生丧失功能的突变。制备和应用可选择性降解RNA的RNAi分子的方法在本领域中是为人所熟知的，见，例如美国专利6,506,559；6,511,824；6,515,109；6,489,127。

核酸的修饰

本发明提供了产生本发明的核酸的变体的方法，所述本发明的核酸例如那些编码淀粉酶的核酸。这些方法可以被重复或者以多种组合使用，以产生具有与模板核酸编码的淀粉酶有所改变的或不同的活性或有所改变的或不同的稳定性的淀粉酶。这些方法也可以被重复或以多种组合使用，从而例如在基因/信息表达、信息翻译或信息稳定性方面产生变化。另一方面，细胞的遗传组成可以被改变，例如通过同源基因的离体修饰，随后再将其插入到细胞中。

本发明的核酸可以通过任何方法来改变。例如，随意或随机方法、或者非随机、或者“定向进化”的方法，参见如，美国专利6,361,974。基因的随机突变方法在本领域是已知的，参见如，美国专利5,830,696。例如，可以应用突变剂来对基因进行随机突变。突变剂包括，如，紫外线或者γ辐射，或者化学诱变剂，如，丝裂霉素，亚硝酸，光活化的补骨脂内酯，它们单独使用或者组合使用来诱导DNA的断裂，其可以通过重组被修复。另外的化学诱变剂包括，如，亚硫酸氢钠、亚硝酸、羟胺、肼或者甲酸。其它的诱变剂是核苷酸前体的类似物，如，亚硝基胍、5-溴尿嘧啶、2-氨基嘌呤或者吖啶。这些试剂可以加入到PCR反应中替换核苷酸前体，从而突变该序列。也可以应用嵌入试剂如普罗黄素、吖啶黄、奎纳克林和类似物。

可以应用分子生物学上的任何技术，如随机PCR诱变，参见，如，Rice(1992)Proc.Natl.Acad.Sci.USA 89：5467-5471；或者组合式多重盒式诱变，参见如，Crameri(1995)Biotechinques 18：194-196。可选择地，核酸，如基因，可以在随机片段化后重新装配，参见，如，美国专利6,291,242；6,287,862；6,287,861；5,955,358；5,830,721；5,824,514，5,811,238；5,605,793.。在可选择的方面，修饰、增加或者删除可以通过易错PCR、重排、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基因再装配、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、重组、递归序列重组(recursive sequence recombination)、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶模板的诱变、缺口双重诱变(gapped duplex mutagenesis)、点错配修复诱变(point mismatch repair mutagenesis)、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变(restriction-selection mutagenesis)、限制纯化诱变(restriction-purification mutagenesis)、人工基因合成、整体诱变、嵌合核酸多聚体生成、和/或者这些方法和其它方法的组合产生。

以下的出版物描述了可以整入到本发明的方法中的各种递归重组程序和/或方法：Stemmer(1999)“Molecular breeding of viruses for targeting and other clinicalproperties”Tumor Targeting 4：1-4；Ness(1999)Nature Biotechnology 17：893-896；Chang(1999)“Evolution of a cytokine using DNA family shuffling”NatureBiotechnology 17：793-797；Minshull(1999)“Protein evolution by molecular breeding”Current Opinion in Chemical Biology 3：284-290；Christians(1999)“Directed evolutionof thymidine kinase for AZT phosphorylation using DNA family shuffling”NatureBiotechnology 17：259-264；Crameri(1998)“DNA shuffling of a family of genes fromdiverse species accelerates directed evolution”Nature 391：288-291；Crameri(1997)“Molecular evolution of an arsenate detoxification pathway by DNA shuffling”NatureBiotechnology 15：436-438；Zhang(1997)“Directed-evolution of an effectivefucosidase from a galactosidase by DNA shuffling and screening”Proc.Natl.Acad.Sci.USA 94：4504-4509；Patten等(1997)“Applications of DNA Shuffling toPharmaceuticals and Vaccines”Current Opinion in Biotechnology 8：724-733；Crameri等(1996)“Construction and evolution of antibody-phage libraries by DNA shuffling”Nature Medicine 2：100-103；Gates等(1996)“Affinity selective isolation of ligandsfrom peptide libraries through display on a lac repressor ′headpiece dimer′”Journal ofMolecular Biology 255：373-386；Stemmer(1996)“Sexual PCR and Assembly PCR”In：The Encyclopedia of Molecular Biology.VCH Publishers，New York.447-457页；Crameri和Stemmer(1995)“Combinatorial multiple cassette mutagenesis creates allthe permutations ofmutant and wildtype cassettes”BioTechniques 18：194-195；Stemmer等(1995)“Single-step assembly of a gene and entire plasmid form large numbers ofoligodeoxyribonucleotides”Gene，164：49-53；Stemmer(1995)“The Evolution ofMolecular Computation”Science 270：1510；Stemmer(1995)“Searching SequenceSpace”Bio/Technology 13：549-553；Stemmer(1994)“Rapid evolution of a proteinin vitro by DNA shuffling”Nature 370：389-391；和Stemmer(1994)“DNA shufflingby random fragmentation and reassembly：In vitro recombination for molecularevolution”Proc.Natl.Acad.Sci.USA 91：10747-10751。

产生多样性的突变方法包括，例如，定点诱变(Ling等.(1997)“Approachesto DNA mutagenesis：an overview”Anal Biochem.254(2)：157-178；Dale等(1996)“Oligonucleotide-directed random mutagenesis using the phosphorothioate method”Methods Mol.Biol.57：369-374；Smith(1985)“In vitro mutagenesis”Ann.Rev.Genet.19：423-462；Botstein&Shortle(1985)“Strategies and applications of in vitromutagenesis”Science 229：1193-1201；Carter(1986)“Site-directed mutagenesis”Biochem.J.237：1-7；和Kunkel(1987)“The efficiency of oligonucleotide directedmutagenesis”在Nucleic Acids&Molecular Biology(Eckstein，F.和Lilley，D.M.J.eds.，Springer Verlag，Berlin))；使用含有尿嘧啶的模板的诱变(Kunkel(1985)“Rapidand efficient site-specific mutagenesis without phenotypic selection”Proc.Natl.Acad.Sci.USA 82：488-492；Kunkel等(1987)“Rapid and efficient site-specific mutagenesiswithout phenotypic selection”Methods in Enzymol.154，367-382；和Bass等(1988)“Mutant Trp repressors with new DNA-binding specificities”Science 242：240-245)；寡核苷酸诱导的定点诱变(Methods in Enzymol.100：468-500(1983)；Methods inEnzymol.154：329-350(1987)；Zoller(1982)“Oligonucleotide-directed mutagenesisusing M13-derived vectors：an efficient and general procedure for the production ofpoint mutations in any DNA fragment”Nucleic Acids Res.10：6487-6500；Zoller&Smith(1983)“Oligonucleotide-directed mutagenesis of DNA fragments cloned intoM13 vectors”Methods in Enzymol.100：468-500和Zoller(1987)Oligonucleotide-directed mutagenesis：a simple method using two oligonucleotideprimers and a single-stranded DNA template”Methods in Enzymol.154：329-350)；硫代磷酸酯修饰的DNA诱变(Taylor(1985)“The use of phosphorothioate-modifiedDNA in restriction enzyme reactions to prepare nicked DNA”Nucl.Acids Res.13：8749-8764；Taylor(1985)“The rapid generation of oligonucleotide-directed mutationsat high frequency using phosphorothioate-modified DNA”Nucl.Acids Res.13：8765-8787(1985)；Nakamaye(1986)“Inhibition of restriction endonuclease NciI cleavage by phosphorothioate groups and its application to oligonucleotide-directedmutagenesis”Nucl.Acids Res.14：9679-9698；Sayers(1988)“Y-T Exonucleases inphosphorothioate-based oligonucleotide-directed mutagenesis”Nucl.Asids Res.16：791-802；和Sayers等(1988)“Strand specific cleavage ofphosphorothioate-containing DNA by reaction with restriction endonucleases in thepresence of ethidium bromide”Nucl.Acids Res.16：803-814)；使用缺口双链体DNA的诱变(Kramer等(1984)“The gapped duplex DNA approach tooligonucleotide-directed mutation construction”Nucl.Acids Res.12：9441-9456；Kramer&Fritz(1987)Methods in Enzymol.“Oligonucleotide-directed construction ofmutations via gapped duplex DNA”154：350-367；Kramer(1988)“Improved enzymaticin vitro reactions in the gapped duplex DNA approach to oligonucleotide-directedconstruction of mutations”Nucl.Acids Res.16：7207；和Fritz(1988)“Oligonucleotide-directed construction of mutations：a gapped duplex DNA procedurewithout enzymatic reactions in vitro”Nucl.Acids Res.16：6987-6999)。

可以用于实践本发明的另外的实验方案包括点错配修复(Kramer(1984)“PointMismatch Repair”Cell 38：879-887)，应用修复缺陷型宿主株的诱变(Carter等(1985)“Improved oligonucleotide site-directed mutagenesis using M13 vectors”Nucl.AcidsRes.13：4431-4443和Carter(1987)“Improved oligonucleotide-directed mutagenesisusing M13 vectors”Methods in Enzymol.154：382-403)，缺失诱变(Eghtedarzadeh(1986)“Use of oligonucleotides to generate large deletions”Nucl.Acids Res.14：5115)，限制-选择和限制-纯化(Wells等(1986)“Importance of hydrogen-bondformation in stabilizing the transition state of subtilisin”Phil.Trans.R.Soc.Lond.A317：415-423)，通过全基因合成的诱变(Nambiar等(1984)“Total synthesis andcloning of a gene coding for the ribonuclease S protein”Science 223：1299-1301；Sakamar和Khorana(1988)“Total synthesis and expression of a gene for the a-subunitof bovine rod outer segment guanine nucleotide-binding protein (transducin)”Nucl.Acids Res.14：6361-6372；Wells等(1985)“Cassette mutagenesis：an efficient methodfor generation of multiple mutations at defined sites”Gene 34：315-323和Grundstrom等(1985)“Oligonucleotide-directed mutagenesis by microscale‘shot-gun’genesynthesis”Nucl.Acids Res.13：3305-3316)，双链断裂修复(Mandecki(1986)，Arnold(1993)“Protein engineering for unusual environments”Current Opinion inBiotechnology 4：450-455.“Oligonucleotide-directed double-strand break repair inplasmids of Escherichia coli：a method for site-speciflc mutagenesis”Proc.Natl.Acad.Sci.USA，83：7177-7181)。很多以上的方法的另外的细节在Methods in Enzymology的154卷中有说明，其中也描述了用于解决各种诱变方法中所会遇到的问题的有用策略。

在例如下列的文件中描述了可以用于实践本发明的实验方案，如Stemmer的美国专利5,605,793(1997.2.25)，“Methods for In Vitro Recombination”；Stemmer等的美国专利5,811,238(1998.9.22)“Methods for Generating Polynucleotides havingDesired Characteristics by Iterative Selection and Recombination”；Stemmer等的美国专利5,830,721(1998.11.3)，“DNA Mutagenesis by Random Fragmentation andReassembly”；Stemmer等的美国专利5,834,252(1998.11.10)，“End-ComplementaryPolymerase Reaction”；Minshull等的美国专利5,837,458(1998.11.17)“Methods andCompositions for Cellular and Metabolic Engineering”；WO 95/22625，Stemmer和Crameri，“Mutagenesis by Random Fragmentation and Reassembly”；WO 96/33207，Stemmer和Lipschutz，“End Complementary Polymerase Chain Reaction”；WO97/20078，Stemmer和Crameri的“Methods for Generating Polynucleotides havingDesired Characteristics by Iterative Selection and Recombination”；WO 97/35966，Minshull和Stemmer，“Methods and Compositions for Cellular and MetabolicEngineerin”；WO 99/41402，Punnonen等，“Targeting of Genetic Vaccine Vectors”；WO 99/41383，Punnonen等，“Antigen Library Immunization”；WO 99/41369，Punnonen等，“Genetic Vaccine Vector Engineering”；WO 99/41368，Punnonen等，“Optimization of Immunomodulatory Properties of Genetic Vaccines”；EP 752008，Stemmer和Crameri，“DNA Mutagenesis by Random Fragmentation and Reassembly”；EP 0932670，Stemmer，“Evolving Cellular DNA Uptake by Recursive SequenceRecombination”；WO 99/23107，Stemmer等，“Modification of Virus Tropism andHost Range by Viral Genome Shuffling”；WO 99/21979，Apt等，“HumanPapillomavirus Vectors”；WO 98/31837，del Cardayre等，“Evolution of Whole Cellsand Organisms by Recursive Sequence Recombination”；WO 98/27230，Patten和Stemmer，“Methods and Compositions for Polypeptide Engineering”；WO 98/27230，Stemmer等，“Methods for Optimization of Gene Therapy by Recursive SequenceShuffling and Selection”；WO 00/00632，“Methods for Generating Highly DiverseLibraries”；WO 00/09679，“Methods for Obtaining in Vitro Recombined PolynucleotideSequence Banks and Resulting Sequences”；WO 98/42832，Arnold等，“Polynucleotide Sequences Using Random or Defined Primers”；WO 99/29902，Arnold等，“Method for Creating Polynucleotide and Polypeptide Sequences”；WO98/41653，Vind，“An in Vitro Method for Construction of a DNA Library”；WO98/41622，Borchert等，“Method for Constructing a Library Using DNA Shuffling”；以及WO 98/42727，Pati和Zarling，“Sequence Alterations using HomologousRecombination”。

在例如下列的文件中描述了可以用于实践本发明的方案(提供了关于产生不同多样性的方法的细节)，如美国专利申请系列号(USSN)09/407,800，Patten等的“SHUFFLING OF CODON ALTERED GENES”，于1999年9月28日归档；delCardayre等的“EVOLUTION OF WHOLE CELLS AND ORGANISMS BYRECURSIVE SEQUENCE RECOMBINATION”，美国专利6,379,964；Crameri等的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”，美国专利6,319,714；6,368,861；6,376,246；6,423,542；6,426,224和PCT/US00/01203；Welch等的“USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FORSYNTHETIC SHUFFLING”，美国专利6,436,675；Selifonov等的“METHODS FORMAKING CHARACTER STRINGS，POLYNUCLEOTIDES&POLYPEPTIDESHAVING DESIRED CHARACTERISTICS”，2000年1月18日归档，(PCT/US00/01202)和，如Selifonov等的“METHODS FOR MAKINGCHARACTER STRINGS.POLYNUCLEOTIDES&POLYPEPTIDES HAVINGDESIRED CHARACTERISTICS”，2000年7月18日归档，(美国系列号09/618,579)；Selifonov和Stemmer的“METHODS OF POPULATING DATASTRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS”，2000年1月18日归档(PCT/US00/01138)，和Affholter的“SINGLE-STRANDED NUCLEIC ACIDTEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENTISOLATION”，2000年9月6日归档(美国系列号09/656,549)，和美国专利6,177,263；6,153,410。

非随机或“定向进化”方法包括，例如基因饱和诱变(GSSM^TM)、合成连接重装配(SLR)或其组合，它们被用于修饰本发明的核酸，以产生具有新的或改变的特性的淀粉酶(例如在高度酸性或碱性条件下的活性，在高温或低温的活性，等等)。由修饰的核酸编码的多肽可以在测试蛋白水解或其它活性之前被筛选活性。可以使用任何分析形式或实验方案，例如使用毛细管阵列平台。例如参见美国专利6,361,974；6,280,926；5,939,250。

饱和诱变或GSSM^TM

一方面，含有简并N，N，G/T序列的密码子引物被用于将点突变引入多核苷酸中，例如淀粉酶或本发明的抗体，以便产生一组子代多肽，其中在每一氨基酸位置上可表现出完全范围的单氨基酸取代，取代发生的位置例如酶活性位点中的氨基酸残基，或将要被修饰的配体结合位点。这些寡核苷酸可以包括相邻的第一同源序列，简并N，N，G/T序列，和任选地第二同源序列。由使用这些寡核苷酸而得到的下游子代翻译产物包含沿着多肽的每一氨基酸位点上的所有可能的氨基酸变化，这是由于N，N，G/T序列的简并性包括了所有20个氨基酸的密码子。一方面，一个这样的简并寡核苷酸(例如包括一个简并N，N，G/T序列盒)被用于使亲本多核苷酸模板中的每一原始密码子进行完全范围的密码子取代。另一方面，使用至少两个简并序列盒，或者在相同的寡核苷酸中或不同的寡核苷酸中，用于使亲本多核苷酸模板中的至少两个原始密码子进行完全范围的密码子取代。例如，一个寡核苷酸中可以包含多个N，N，G/T序列，以便在多于一个的位点上引入氨基酸突变。这些多个N，N，G/T序列可以直接相邻，或由一个或多个额外的核苷酸序列分隔开。另一方面，用于引入插入和删除的寡核苷酸可以单独使用，或者与含有N，N，G/T序列的密码子组合使用，以便引入氨基酸插入、删除和/或取代的任何排列组合。

一方面，两个或更多个连续氨基酸位置的同时诱变是使用含有相邻N，N，G/T三联体的寡核苷酸进行的，即简并(N，N，G/T)_n序列。另一方面，使用与N，N，G/T序列相比具有较低简并性的简并序列盒。例如，在一些情况下可能期望使用仅包括一个N的简并三联体序列，其中所述的N可以在三联体的第一、第二或第三位置上。在三联体的剩余两个位置上，可以使用包括任意排列组合的任何其它碱基。可以选择地，在一些情况下可能期望使用简并N，N，N三联体序列。

一方面，使用简并三联体(例如N，N，G/T三联体)允许在多肽中的每一和每个氨基酸位置上系统且容易地产生完全范围的可能的自然氨基酸(总共20种氨基酸)(在可以选择的方面，这些方法也包括在每一氨基酸残基或密码子、位置产生低于所有可能种类的取代)。例如，对于100个氨基酸的多肽，可以产生2000个不同种类(即每个位置上的20种可能氨基酸×100个氨基酸位置)。通过使用含有简并N，N，G/T三联体的寡核苷酸或一组寡核苷酸，32种不同序列可编码所有20种可能的天然氨基酸。因此，在其中使用至少一种这样的寡核苷酸对亲本多核苷酸序列进行饱和诱变的反应容器中，产生了编码20种不同多肽的32种不同的子代多核苷酸。相反，在定点诱变中使用非简并寡核苷酸在每个反应容器中仅仅导致一种子代多肽。非简并寡核苷酸可以任选地与所公开的简并引物组合使用；例如，非简并寡核苷酸可以被用于在工作多核苷酸中产生特异性点突变。这提供了产生特异性沉默点突变、导致相应的氨基酸变化的点突变、以及导致产生终止密码子和多肽片段的相应表达的手段。

一方面，每一饱和诱变反应容器含有编码至少20种子代多肽(例如淀粉酶)分子的多核苷酸，这样所有的20种天然氨基酸都会出现在对应于亲本多聚核苷酸中被诱变的密码子位置的特定氨基酸位置(其它的例子使用了少于20个天然的组合)。从每一饱和诱变反应容器产生的32倍简并的子代多肽可以被克隆扩增(例如使用表达载体克隆到合适的宿主中，例如大肠杆菌宿主中)，并进行表达的筛选。当单个子代多肽通过筛选鉴定，显示出有利的特性变化时(当与亲本多肽相比时，如在碱性或酸性条件下增高的蛋白水解活性)，可以对其测序以鉴定其中所含的相应的有利氨基酸取代。

一方面，如本文所公开的，应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变，确定出的有利的氨基酸变化可以在超过一个的氨基酸位置。可以产生一个或多个新的子代分子，其含有所有或部分这些有利的氨基酸取代的组合。例如，如果在多肽的3个氨基酸位置的每一个氨基酸位置处鉴定出2个特异性有利的氨基酸变化，那么出现的排列就包括每一位置上的3种可能性(与原始氨基酸没有变化的可能性，以及两个有利变化中的每一个的可能性)和3个位置。因此，总共有3×3×3或27种可能性，其中包括了先前被检验的7种可能性，即6个单点突变(即三个位置的每一个位置有2个)和在任何位置上没有变化的点突变。

另一方面，位点饱和诱变可以与另一种随机或非随机方法一起使用，以改变序列，这些方法例如合成连接重装配(参见下面)、重排、嵌合、重组和其它诱变方法和诱变剂。本发明提供了以反复的方式使用任何诱变方法，包括饱和诱变。

合成连接重装配(SLR)

本发明提供了非随机的基因修饰系统，命名为“合成连接重装配”或简单地称作“SLR”，这是一种“定向进化方法”，可以产生具有新的或改变的特性的多肽，例如本发明的淀粉酶或抗体。SLR是将寡核苷酸片段非随机地连接在一起的一种方法。该方法与随机寡核苷酸重排不同的地方在于，核酸构件(building blocks)没有被随意地重排、连接或嵌合，而是被非随机地装配。例如参见美国专利(USSN)09/332,835，题目为“Synthetic Ligation Reassembly in Directed Evolution”，于1999年6月14日提交(“USSN 09/332,835”)。一方面，SLR包括下述步骤：(a)提供模板多核苷酸，其中模板多核苷酸包含编码同源基因的序列；(b)提供多个构件多核苷酸，其中这些构件多核苷酸被设计成可在预定的序列处与模板多核苷酸交换重装配(cross-over reassemble)，所述构件多核苷酸包含一个作为同源基因变体的序列和一个与变体序列两侧的模板多核苷酸同源的序列；(c)将构件多核苷酸与模板多核苷酸组合在一起，以便构件多核苷酸与模板多核苷酸交换重装配，以产生包含同源基因序列变异体的多核苷酸。

SLR不依赖于将被重新排列的多核苷酸之间存在高度同源性。因此，该方法可以被用于非随机地产生包括超过10¹⁰⁰个不同嵌合体的子代分子的文库(或集合)。SLR可以被用于产生包括超过10¹⁰⁰⁰个不同子代嵌合体的文库。因此，本发明的一些方面包括产生一组最终嵌合的核酸分子的非随机方法，所述最终嵌合的核酸分子具有按设计所选择的整个装配次序。该方法包括按设计产生多个特异性核酸构件的步骤，以及装配这些核酸构件的步骤，这样可获得依设计而定的整个装配次序，所述的多个特异性核酸构件具有可被应用的互相相容的可连接末端。

将被装配的核酸构件的互相相容的可连接末端被认为对于这种类型的有序装配是“有用的”，如果它们能使这些构件以预定次序结合。因此，核酸构件可以被偶联的整个装配次序是由可连接末端的设计来确定。如果使用多于一个的装配步骤，那么核酸构件可被偶联的总装配次序也由装配步骤的连续次序来确定。一方面，用酶例如连接酶(例如T4DNA连接酶)处理退火的结构片段，以实现结构片段的共价结合。

一方面，寡核苷酸构件的设计通过分析一组祖先核酸序列模板来获得，所述祖先核酸模板作为产生最终嵌合的多核苷酸的子代集合的基础。这些亲本寡核苷酸模板因此作为序列信息的来源，它们在将被诱变例如被嵌合或重排的核酸构件的设计中有用。在该方法的一个方面，多个亲本核酸模板的序列被联配，以便选择一个或多个分界点。这些分界点可以位于同源区域，由一个或多个核苷酸构成。这些分界点优选地由至少两个祖先模板共享。从而这些分界点可以被用于描绘将要产生的寡核苷酸构件的边界，以便重排列亲本多核苷酸。在祖先分子中鉴定和选择的分界点作为最终嵌合的子代分子的装配中的潜在嵌合点。分界点可以是由至少两个亲本多核苷酸序列分享的同源区域(包括至少一个同源性核苷酸碱基)。可以选择地，分界点可以是由至少一半的亲本多核苷酸序列分享的同源区域，或者可以是由至少三分之二的亲本多核苷酸序列分享的同源区域。甚至更优选地，有用的分界点是由至少四分之三的亲本多核苷酸序列分享的同源区域，或者可以是由几乎所有的亲本多核苷酸序列分享的同源区域。一方面，分界点是由所有亲本多核苷酸序列分享的同源区域。

一方面，连接再装配过程被彻底地进行，以便产生含有尽量可能多的子代嵌合多核苷酸的文库。换句话说，核酸构件的所有可能的有序组合都呈现在最终嵌合的核酸分子集合中。同时，另一方面，在每一组合中的装配次序(即各个最终嵌合核酸的5’到3序列中每一构件的装配次序)是如上所述地遵循预先的设计(或非随机地)。由于本发明的非随机特性，大大地降低了不需要的副产品的可能性。

另一方面，连接再装配方法被系统地进行。例如，实施该方法，以便产生子代分子的系统区分化的文库，该文库分成能被系统地筛选的数个部分，例如可以逐个地筛选。换句话说，通过选择性的和审慎的应用特定的核酸构件，再加上选择性的和审慎的应用连续的分步骤的装配反应，本发明使得这样一种设计可以实现，即可以在各个反应容器中制备出各自特定的一系列子代产物。这样的设计允许进行系统的检查和筛选。因此，这些方法允许很可能非常大量的子代分子以更小的组被系统地检查。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力，尤其是当祖先分子之间具有低水平的同源性时，这些方法可以产生包含大量子代分子的文库(或集合)。由于本发明的连接再装配的非随机特性，所产生的子代分子优选地包含有最终嵌合核酸分子的文库，这些核酸分子具有按设计而选择的总装配次序。饱和诱变和优化的定向进化方法也可以被用于产生不同的子代分子种类。应该意识到，本发明在分界点的选择、核酸构件的大小和数量以及偶联的大小和设计方面提供了选择的自由度和可控制性。进一步，应该意识到，就本发明的可操作性而言，对分子间同源性的要求大大地放宽了。事实上，甚至可以在有很少的分子间同源性或没有分子间同源性的区域内选择分界点。例如，由于密码子的摆动，即密码子的简并性，可以将核苷酸取代引入核酸构件，同时又不会改变在相应的祖先模板中最初编码的氨基酸。可以选择地，可以改变密码子，从而改变对原始氨基酸的编码。在本发明中，这样的取代可以被引入到核酸构件中，以便增加分子间同源分界点的发生率，从而使得在构件之间可获得的偶联的数量增加，而这又允许产生更多数量的子代嵌合分子。

另一方面，产生构件的步骤的合成属性允许设计和引入核苷酸(例如一个或多个核苷酸，例如可以是密码子或内含子或调控序列)，这些核苷酸随后可以在体外过程中(例如通过诱变)或者在体内过程中(例如通过利用宿主生物体的基因剪接能力)被任选地去除。应该意识到，在许多情况下，除了产生有用的分界点的好处之外，还有许多其它原因也使得可能期望引入这些核苷酸。

一方面，应用核酸构件引入内含子。这样，根据此处描述的方法将功能性内含子引入到所制造的人造基因中。人工引入的内含子可以在宿主细胞的基因剪接中发挥作用，其发挥作用的方式与天然发生的内含子在基因剪接中发挥作用的方式在很大程度上是相同的。

优化的定向进化系统

本发明提供了一种非随机的基因修改系统，命名为“优化的定向进化系统”，其可以用来生产具有新的或者改变的性质的多肽，如本发明的淀粉酶或者抗体。优化的定向进化涉及还原性重配(reductive reassortment)、重组和选择的重复循环应用，其使得可以通过重组实现核酸的定向分子进化。优化的定向进化允许产生大量的进化出的嵌合序列，其中产生的群体显著地富集了具有预定数目遗传交换事件(crossover events)的序列。

遗传交换事件是在嵌合序列中的一个点，在这里，从一个亲本变异体到另一个亲本变异体的序列转换发生。这样的点一般在来自两个亲本的寡聚核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡聚核苷酸序列的正确浓度，这样，序列的最终嵌合群体富集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。

此外，这一方法与其他系统相比，提供了一种用于探究大数量的可能蛋白变异体的方便手段。以前，例如，如果在反应中产生了10¹³个嵌合分子，测试这样大数目的嵌合突变体的特定活性将会非常困难。此外，子代群体的相当部分将具有很高数目的遗传交换事件，其中得到的蛋白不大可能具有增高水平的特定活性。通过应用这些方法，嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此，尽管在反应中可以仍然产生10¹³嵌合分子，但是所选择的用于进一步分析的每一个分子很可能具有，例如，仅仅三个遗传学交换事件。因为得到的子代群体可以(在统计学上)偏向于具有预定数目的遗传交换事件，所以嵌合分子之间的功能多样性的范围缩少了。当要计算在最初的亲本多聚核苷酸中的哪一个可能影响到特定的性质时，便提供了更加可控数目的变量。

产生嵌合子代多聚核苷酸序列的一个方法是产生对应于每一个亲本序列的片段或者部分的寡聚核苷酸。每一个寡聚核苷酸优选地包括重叠的独特区域，这样把所述寡聚核苷酸混合，得到具有以正确顺序装配的寡聚核苷酸片段的新的变异体。也可以发现另外的一些信息，如，在USSN 09/332,835；美国专利6,361,974中。

对应于每一个亲本变异体产生的寡聚核苷酸数目与在最终产生的嵌合分子中得到的遗传学交换的总的数目具有一定的关系。例如，为了发现具有如在高温下的更高活性的嵌合变异体，可以提供三个亲本核苷酸序列变异体来进行连接反应。作为一个例子，对应于每一个亲本变异体的每一部分可以产生总共50个寡聚核苷酸序列。相应地，在连接再装配过程中，在每一个嵌合序列中就有可能有多达50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变异体的寡聚核苷酸的可能性很低。如果每一个寡聚核苷酸片段以同样的摩尔量存在于连接反应中，有可能在一些位置上来自同一亲本多核苷酸的寡核苷酸将与相邻的彼此连接，而不导致遗传交换事件。如果在这一例子的任何连接步骤中，来自每一个亲本的每一种寡聚核苷酸的浓度都保持不变，那么将会有三分之一的机会(假定3个亲本)来自同一个亲本变异体的寡核苷酸连接于嵌合序列内而不产生遗传交换。

因此，可以确定概率密度函数(PDF)，预测在一个连接反应的每一步中可能发生的遗传交换事件的总数，其中给定了一套具有确定数目的亲本变异体、对应于每种变体的寡聚核苷酸、以及在连接反应的每个步骤中的每种变异体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。通过应用这些方法，可以计算这样的概率密度函数，而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外，可以预先确定遗传交换事件的目标数目，然后对该系统进行程序化，以计算在该连接反应的每一个步骤中，每种亲本寡聚核苷酸的起始量，从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重复循环应用，通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生大量的进化出的嵌合序列，其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个点，在这里，从一个亲本变异体到另一个亲本变异体的序列转换发生。这样的点一般是在两个亲本的寡聚核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡聚核苷酸序列的正确浓度，这样，序列的最终嵌合群体富集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。

此外，这些方法与其他系统相比，提供了一种用于探究大数量的可能蛋白变异体的方便手段。通过应用在这里描述的方法，嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此，尽管在反应中可以仍然产生1013个嵌合分子，但是所选择的用于进一步分析的每一个分子很可能具有，例如，仅仅三个遗传学交换事件。因为得到的子代群体可以倾向于具有预定数目的遗传交换事件，所以造成嵌合分子之间的功能多样性的界线减少。当计算出在最初的亲本多聚核苷酸中的哪一个可能影响到特定的性质时，便提供了更加可控制的变量。

一方面，该方法通过产生对应于每一个亲本序列的片段或者部分的寡聚核苷酸，产生嵌合子代多核苷酸序列。每一个寡核苷酸优选地包括重叠的独特区域，这样把所述寡聚核苷酸混合，得到具有以正确顺序装配的寡核苷酸片段的新的变异体。也可参见USSN 09/332,835。

确定交换事件

本发明包括系统和软件，它们以所需的遗传交换的概率密度函数(PDF)、待再装配的亲本基因的数目以及在再装配中的片段数目作为输入量。该程序输出“片段PDF”，它可以用于确定用于获得重新装配的基因和那些基因的估计的遗传交换PDF的具体方法。在此说明的过程优选地在MATLAB^TM中进行(The Mathworks，Natick.Massachusetts)，MATLAB^TM是一种用于技术计算的程序语言和开发环境。

迭代处理

在本发明的实践中，这些过程可以被迭代重复。例如，鉴定出具有改变的或者新的淀粉酶表型的核酸，再分离，再修饰，再测试活性。这一过程可以重复直到得到所需的表型。例如，完整的生物化学合成代谢或分解代谢途径可以被通过基因工程设计到细胞中，例如包括淀粉水解活性的细胞。

类似地，如果确定了某特定寡核苷酸对于所期望的特性(例如新的淀粉酶表型)不会造成任何影响，则可以合成包括这段序列在内的更大的亲本寡核苷酸，从而将这段序列从变量中除去。由于将这段序列合并到更大的序列中，可以避免任何遗传交换事件，所以在子代多聚核苷酸中，这一序列不再有任何变异。确定哪些寡核苷酸与所需的性质最有关系，以及哪些与所需的性质无关的重复实践可以更有效地探寻所有可能的具有特定性质或者活性的蛋白变异体。

体内重排

分子的体内重排在本发明的方法中使用，提供本发明的多肽的变体，例如抗体、淀粉酶以及类似物。体内重排可以利用细胞重组多聚体的天然特性进行。尽管体内重组是提供分子多样性的主要天然途径，但遗传重组仍然是一种相对复杂的过程，该过程涉及1)同源性识别；2)链切割，链侵入，和导致产生重组交叉(recombination chiasma)的代谢步骤；和最后3)交叉消除，得到分离的重组分子。交叉的形成需要同源序列的识别。

一方面，本发明提供了一种方法，用于由至少第一多核苷酸(例如本发明的淀粉酶)和第二多核苷酸(例如酶，如本发明的淀粉酶或任何其它淀粉酶、或标记物或抗原决定基)获得杂合多核苷酸。本发明也用于产生杂合多核苷酸，通过将共享至少一个部分地序列同源的区域的至少第一多核苷酸和第二多核苷酸引入到合适的宿主细胞中实现。部分序列同源的区域促进了导致产生杂合多核苷酸的序列再组织过程。正如此处所用，术语“杂合多核苷酸”是从本发明的方法产生的任何核苷酸序列，其含有来自至少两个原始多核苷酸序列的序列。这样的杂合多核苷酸可以来自可促进DNA分子间序列整合的分子间重组事件。此外，这样的杂合多核苷酸可以来自于分子内还原重配过程，该过程利用重复序列来改变DNA分子内的核苷酸序列。

产生序列变异体

本发明也提供了用于产生本发明核酸(例如淀粉酶)序列的序列变异体的其它方法。本发明也提供了使用本发明的核酸和多肽分离淀粉酶的其它方法。一方面，本发明提供了本发明的淀粉酶编码序列(例如基因、cDNA或信息)的变异体，这些变异体可以通过任何方法来产生，如上所描述，例如包括随意或随机方法、或非随机或“定向进化”方法。

被分离的变异体可以是天然发生的。变异体也可以在体外产生。变异体也可以应用基因工程技术来产生，如定点诱变、随机的化学诱变、核酸外切酶III缺失方法和标准的克隆技术。可选择地，可以应用化学合成或者修饰方法来产生这样的变异体、片段、类似物或者衍生物。本领域技术人员也熟悉制备变异体的其它方法。这些方法包括这样的程序，其中，从天然分离物中获得的核酸序列经过修饰而产生编码具有某些特征的多肽的核酸，所述的特征使这些多肽在工业或者实验室应用中具有更高的价值。在这样的程序中，大量的变异体序列被获得和表征，这些变异体序列与从天然分离物中得到的序列相比，有一个或者多个核苷酸的差异。这些核苷酸的差异可能引起相对于天然分离得到的核酸序列编码的多肽的氨基酸变化。

例如，变异体可以通过易错PCR产生。在易错PCR中，PCR在DNA聚合酶的复制保真性较低的情况下进行，这样便在全长的PCR产物中得到较高的点突变率。易错PCR在例如，Leung，D.W.，等，Technique，1：11～15，1989和Caldwell，R.C.和Joyce G.F.，PCR Methods Applic.，2：28-33，1992中描述。简要地说，在这样的程序中，待诱变的核酸与PCR引物、反应缓冲液、MgCl₂、MnCl₂、Taq聚合酶以及适当浓度的dNTP混合，在全长的PCR产物中得到高的点突变率。例如，反应可以使用20fmol待诱变的核酸进行，每种PCR引物30pmol，反应缓冲液包括50mMKCl、10mM Tris HCl(pH8.3)和0.01％明胶、7mM的MgCl₂、0.5mM MnCl₂、5units的Taq聚合酶、0.2mM dGTP、0.2mM dATP、1mM dCTP和1mM dTTP。PCR可以进行30个循环，每个循环为94℃1分钟；45℃1分钟；和72℃1分钟。然而，应该意识到，这些参数可以适当地变化。诱变的核酸克隆到一个适当的载体，并评价由诱变核酸编码的多肽的活性。

变异体也可以用寡核苷酸诱导的定向突变产生，在任何感兴趣的克隆DNA中产生位点特异性的突变。寡核苷酸诱变在，例如，Reidhaar-Olson(1988)Science241：53-57中描述。简要地说，在这样的程序中，合成多个具有将要被导入被克隆的DNA中的一个或多个突变的双链寡聚核苷酸，将这些寡聚核苷酸插入到待诱变的克隆DNA中。回收含有诱变DNA的克隆，并评估它们编码的多肽的活性。

另一种产生变异体的方法是装配PCR。装配PCR涉及由小DNA片段的混合物来装配PCR产物。大量不同的PCR反应在相同的容器中平行地发生，一个反应的产物引发另一个反应的产物。装配PCR已经被描述，例如在美国专利5,965,408中。

另一种产生变异体的方法是有性PCR诱变。在有性PCR诱变中，由于基于序列同源性的DNA分子随机片段化，在不同的但是高度相关的DNA序列的DNA分子之间，在体外强行发生同源重组，然后通过PCR反应的引物延伸，遗传交换得到固定。有性PCR诱变在，例如，Stemmer(1994)Proc.Natl.Asad.Sci.USA 91：10747-10751中描述。简要地说，在这样的程序中，多个待重组的核酸用DNase消化，产生具有50到200个核苷酸的平均大小的片段。纯化具有所需的平均大小的片段，重悬于PCR混合物中。在有利于核酸片段重组的条件下进行PCR反应。例如，PCR可以这样进行：将纯化的片段重悬于含有0.2mM的各种dNTP、2.2mMMgCl₂、50mM KCl、10mM的Tris-HCl，pH 9.0以及0.1％的Triton X-100的溶液中，其浓度为10-30ng/μl。以100∶1的比例在反应混合物中加入2.5Units的Taq聚合酶，用以下的条件进行PCR：94℃60秒，94℃30秒，50-55℃30秒，72℃30秒(30-45次)，然后72℃进行5分钟。然而，可以意识到，这些参数可以进行适当的变化。在一些方面，寡聚核苷酸可以被包括在该PCR反应中。在其它方面，DNA聚合酶I的Klenow片段可以用于第一轮PCR反应，而Taq聚合酶可以用于后续的PCR反应。重组序列被分离，并评估它们编码的多肽的活性。

变异体也可以通过体内诱变产生。在一些方面，感兴趣的序列中的随机突变通过在细菌菌株中增殖该感兴趣的序列而产生，所述细菌菌株例如在一个或者多个DNA修复途径中具有突变的大肠杆菌菌株。这样的“突变”菌株具有比野生型亲本更高的随机突变率。在一种这样的菌株中进行DNA的繁殖，最终可产生DNA中的随机突变。适于在体内诱变中应用的突变菌株在，例如，PCT公开号WO91/16427中有描述。

变异体也可以通过应用盒式诱变产生。在盒式诱变中，双链DNA分子的一个小的区域被不同于天然序列的合成的寡核苷酸“盒子”替代。所述寡核苷酸一般含有完全和/或部分随机的天然序列。

递归整体诱变也可以用于产生变异体。递归整体诱变是一种用于蛋白质工程(蛋白诱变)的算法，它的开发是为了产生表型相关的突变体组成的多样性群体，其成员在氨基酸序列上有所不同。该方法应用反馈机制来控制连续多轮的组合式盒式诱变。递归整体诱变在如Aikin(1992)Proc.Natl.Acad.Sci.USA 89：7811-7815中有描述。

在一些方面，用指数整体诱变产生变异体。指数整体诱变是一个用于产生具有较高百分比的独特且具功能性的突变体的组合文库的过程，其中部分的残基被随机化，同时在每一个被改变的位置确认导致功能性蛋白的氨基酸。指数整体诱变在如，Delegrave(1993)Biotechnology Res.11：1548-1552中有描述。随机和定点诱变在如，Amold(1993)Current Opinion in Biotechnology 4：450-455中有描述。

在一些方面，变异体利用重排方法产生，其中编码不同的多肽的多个核酸的部分被融合在一起，产生编码嵌合多肽的嵌合核酸序列，其描述见美国专利5,965,408；5,939,250(也参见上面的讨论)。

本发明也提供了本发明的多肽(例如淀粉酶)的变异体，其包括这样的序列，其中一个或多个氨基酸残基(例如本发明的示例性多肽的一个或多个氨基酸残基)被保守或非保守氨基酸残基(例如保守氨基酸残基)取代，这样取代的氨基酸残基可以是由遗传密码编码或不被其编码的氨基酸。保守取代是那些在多肽中一个给定的氨基酸被另一个具有类似特性的氨基酸取代的取代。因此，本发明的多肽包括那些具有本发明的序列的保守取代的多肽，所述本发明的序列例如本发明的示例性多肽，所述取代包括但不限于下述取代：脂肪族氨基酸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸用另一个脂肪族氨基酸取代；丝氨酸用苏氨酸取代，或苏氨酸用丝氨酸取代；酸性残基如天冬氨酸和谷氨酸用另一个酸性残基取代；具有酰胺基因的残基，如天冬酰胺和谷氨酰胺用另一个具有酰胺基因的残基取代；碱性残基如赖氨酸和精氨酸用另一个碱性残基来交换；芳香族残基如苯丙氨酸、酪氨酸用另一个芳香族残基取代。其它变异体是那些在本发明的多肽的一个或多个氨基酸残基中包含有取代基团的变异体。

本发明范围内的其它变异体是那些在其中多肽与别的化合物联接的变异体，所述化合物例如增加多肽的半衰期的化合物，例如聚乙二醇。

本发明范围内的其它变异体是那些在其中额外的氨基酸被融合到多肽上的变异体，额外的氨基酸例如前导序列、分泌序列、蛋白原序列(proprotein sequence)或有助于多肽的纯化、富集或稳定的序列。

在一些方面，本发明的多肽的变异体、片段、衍生物和类似物保持了与示例性多肽相同的生物功能或活性，例如此处描述的淀粉酶活性。在其它方面，变异体、片段、衍生物或类似物包括蛋白原，这样，变异体、片段、衍生物或类似物可以通过蛋白原部分的割裂来激活，以产生活性多肽。

优化密码子以便在宿主细胞中获得高水平的蛋白表达

本发明提供了修饰编码淀粉酶的核酸来改变密码子使用的方法。一方面，本发明提供了修饰编码淀粉酶的核酸中的密码子来增加或者降低其在宿主细胞中的表达的方法。本发明也提供了编码淀粉酶的核酸，该核酸经过修饰从而其在宿主细胞中的表达增加，还提供了经过这样的修饰的淀粉酶，和制备修饰的淀粉酶的方法。该方法包括鉴定编码淀粉酶的核酸中的“非优选的”或“较不优选的”密码子，并且用编码同样氨基酸的“优选密码子”作为替换密码子替换一个或者多个这样的非优选或者较不优选的密码子，并且在所述核酸中至少一个非优选或较不优选的密码子被编码相同氨基酸的优选密码子替换。优选密码子是在宿主细胞基因的编码序列中被优选使用的密码子，而不优选的或者较不优选的密码子是指在宿主细胞基因的编码序列中较少使用的密码子。

用于表达本发明的核酸、表达序列盒以及载体的宿主细胞包括细菌、酵母、真菌、植物细胞、昆虫细胞和哺乳动物细胞。因此，本发明提供了在所有这些细胞中优化密码子使用的方法、密码子被改变的核酸，以及由所述的密码子被改变的核酸编码的多肽。典型的宿主细胞包括革兰氏阴性细菌，如大肠杆菌(Escherichiacoli)；革兰氏阳性细菌，如仙人掌杆菌(Bacillus cereus)、链霉菌(Streptomyces)、加氏乳酸杆菌(Lactobacillus gasseri)、乳酸乳球菌(Lactococcus lactis)、乳脂乳球菌(Lactococcus cremoris)、枯草芽胞杆菌(Bacillus subtilis)。示范性的宿主细胞也包括真核生物体，如，各种酵母，如酵母菌属(Saccharomyces sp.)，包括酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、毕赤酵母(Pichia pastoris)和乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉森酵母(Hansenula polymorpha)、黑曲霉(Aspergillus niger)和哺乳动物细胞和细胞系以及昆虫细胞和细胞系。因此，本发明也包括在这些生物体和物种中表达被优化的核酸和多肽。

例如，从细菌细胞中分离出的编码淀粉酶的核酸的密码子被修饰，以便该核酸在不同于获得该淀粉酶的细菌的细胞，如酵母、真菌、植物细胞、昆虫细胞或者哺乳动物细胞中被最优化地表达。优化密码子的方法在本领域是已知的，参见如，美国专利5,795,737；Baca(2000)Int.J.Parasitol.30：113-118；Hale(1998)Protein Expr.Purif.12：185-188；Narum(2001)Inect.Immun.69：7250-7253。也参见Narum(2001)Infect.Immun.69：7250-7253，描述了在鼠系统中优化密码子；Outchkourov(2002)Protein Expr.Purif.24：18-24，描述了在酵母中优化密码子；Feng(2000)Biochemistry 39：15399-15409，描述了在大肠杆菌中优化密码子；Humphreys(2000)Protein Expr.Purif 20：252-264，描述了大肠杆菌中影响分泌的优化的密码子使用。

转基因非人动物

本发明提供了转基因非人动物，其包含本发明的核酸、多肽(例如淀粉酶)、表达序列盒或载体或转染细胞或转化细胞。本发明也提供了产生和应用这些转基因非人动物的方法。

转基因非人类动物可以是，例如包含本发明的核酸的山羊、兔、绵羊、猪、牛、小鼠和大鼠。这些动物可以用作例如体内模型来研究淀粉酶活性，或者作为模型来在体内筛选改变淀粉酶活性的试剂。要在转基因非人动物中表达的多肽的编码序列可以设计为组成型的，或者在组织特异性、发育特异性或者可诱导的转录调控因子的控制之下。转基因非人动物可以应用本领域任何已知的方法设计和产生；参见，如，美国专利6,211,428；6,187,992；6,156,952；6,118,044；6,111,166；6,107,541；5,959,171；5,922,854；5,892,070；5,880,327；5,891,698；5,639,940；5,573,933；5,387,742；5,087,571，它们描述了制造和应用转化的细胞和卵以及转基因大鼠、小鼠、兔、羊、猪和牛。也参见，如，Pollock(1999)J.Immunol.Methods231：147-157，描述了在转基因奶牛动物的乳汁中生产重组蛋白；Baguisi(1999)Nat.Biotechnol.17：456-461，描述了转基因山羊的产生。美国专利6,211,428，描述了制备和应用在其脑中表达含有DNA序列的核酸构建物的转基因非人哺乳动物。美国专利5,387,742，描述了把克隆的重组子或者合成的DNA序列注射至鼠受精卵中，移植注射的卵至假孕的雌鼠中，并生长成为转基因鼠，它的细胞表达与阿尔茨海默氏病的病理相关的蛋白。美国专利6,187,992，描述了制备和应用转基因鼠，它的基因组包含编码淀粉样蛋白原(APP)的基因的破坏。

“基因敲除动物”也可以被用于实践本发明的方法。例如，一方面，本发明的转基因或修饰动物包括“基因敲除动物”，例如“基因敲除小鼠”，其被进行了遗传工程以至于不表达内源基因，该基因被表达本发明淀粉酶或包含有本发明淀粉酶的融合蛋白的基因代替。

转基因植物和种子

本发明提供了转基因植物和种子，其包含本发明的核酸、多肽(例如淀粉酶，如α淀粉酶)、表达序列盒或载体或转染或转化的细胞。本发明也提供了包含本发明的核酸和/或多肽(例如淀粉酶，如α淀粉酶)的植物产物，例如油、种子、叶、提取物和类似物。转基因植物可以是双子叶(双子叶植物)或单子叶的(单子叶植物)。本发明也提供了制备和应用这些转基因植物和种子的方法。表达本发明的多肽的转基因植物或者植物细胞可以按照本领域任何已知的方法构建。参见例如，美国专利6,309,872。

本发明的核酸和表达构建物可以通过任何方式导入到植物细胞中。例如，核酸或者表达构建物可以导入到所希望的植物宿主的基因组中，或者，核酸或表达构建物可以是附加体。可以导入到所希望的植物的基因组中，这样宿主的α-淀粉酶的产生被内源性的转录或者翻译控制元件调控。本发明也提供了“基因敲除植物”，其中例如同源重组导致的基因序列插入破坏了内源性基因的表达。产生“基因敲除”植物的方法在本领域是已知的，参见，如，Strepp(1998)Proc Natl.Acad.Sci.USA 95：4368-4373；Miao(1995)Plant J 7：359-365。参见下面的转基因植物的讨论。

本发明的核酸可以用来将所需的性质赋予基本上任何植物，例如产淀粉的植物，如马铃薯、小麦、稻、大麦以及类似的植物。本发明的核酸可以用于操作植物的代谢途径，以优化或者改变宿主的α-淀粉酶的表达。这可以改变植物中的淀粉/糖转化比率。这有助于植物的工业加工。可以选择地，本发明的α-淀粉酶可以在转基因植物的生产中被应用，以产生该植物不能天然产生的化合物。这可以降低生产成本或者产生一种新的产物。

一方面，生产转基因植物的第一步涉及制备用于在植物细胞中表达的表达构建物。这些技术在本领域是熟知的。它们可以包括选择和克隆启动子、便于核糖体有效结合mRNA的编码序列，以及选择适当的基因终止子序列。一个典型的组成型启动子是来自花椰菜花叶病毒的CaMV35S，它一般在植物中导致高水平的表达。其它的启动子是更特异的，并且对植物内部或者外部环境中的暗示有反应。一个典型的光诱导的启动子是来自编码主要叶绿素a/b结合蛋白的cab基因的启动子。

一方面，修饰核酸来实现在植物细胞中更强的表达。例如，本发明的序列很可能具有比在植物中更高的A-T核苷酸对百分率，而一些植物优选G-C核苷酸对。因此，编码序列中的A-T核苷酸可以用G-C核苷酸取代，而不显著改变氨基酸序列，从而可以增加基因产物在植物细胞中的生产。

为了鉴定已经成功整合了转移基因的植物细胞或者组织，可以将选择性标记基因加入到基因构建物中。这可能是必要的，因为在植物细胞中完成基因的整合和表达是一个小概率事件，仅仅在较少百分率的靶组织和细胞中发生。选择性标记基因编码对试剂有抗性的蛋白，所述试剂一般对植物有毒性，如抗生素或者除草剂。当在含有适当的抗生素或者除草剂的培养基上生长时，只有已经整合了选择性标记基因的植物细胞可以成活。与其它的插入基因一样，为了有恰当的功能，标记基因也需要启动子和终止序列。

一方面，制备转基因植物或种子包括将本发明的序列以及可选择的标记基因整合到目标表达构建物(如，质粒)中，同时设置启动子和终止子序列。这可以包括通过合适的方法将修饰的基因转移至植物中。例如，构建物可以应用如电击转化和微注射植物细胞原生质体的技术直接引入到植物细胞的基因组DNA中，或者构建物可以应用弹道方法(ballistic methods)，如，DNA微粒轰击(DNA particlebombardment)的方法直接引入到植物组织中。例如，参见如，Christou(1997)Plant Mol.Biol.35：197-203；Pawlowski(1996)Mol.Biotechnol.6：17-30；Klein(1987)Nature 327：70-73；Talcumi(1997)Genes Genet.Syst.72：63-69，讨论了应用微粒轰击引入转基因到小麦中；Adam(1997)如上，应用微粒轰击引入YAC至植物细胞中。例如，Rinehart(1997)如上，用微粒轰击来产生转基因棉花植物。用于加速微粒的设备在美国专利5,015,580中有说明；而且，可以买到BioRad(Biolistics)PDS-2000微粒加速设备；也参见，John，美国专利5,608,148；和Ellis，美国专利5,681,730，描述了微粒介导的裸子植物的转化。

一方面，原生质体可以被固定，并用核酸例如表达构建物注射。尽管源自原生质体的植物再生对于谷类并不容易，但是应用体细胞胚胎发生由原生质体来源的愈伤组织进行植物再生在豆类中是有可能的。机化组织可以使用基因枪技术用裸DNA转化，其中的DNA被包裹于钨微射弹(tungsten microprojectiles)上，射出物的大小为细胞大小的1/100，它携带DNA深入到细胞和细胞器中。转化的组织然后被诱导再生，一般通过体细胞胚胎发生技术。这一技术已经在包括玉米和水稻的几个谷类物种中成功应用。

核酸，例如表达构建物也可以应用重组病毒引入到植物细胞中。植物细胞可以用病毒载体转化，如，烟草花叶病毒衍生的载体(Rouwendal(1997)Plant Mol.Biol.33：989-999)，参见Porta(1996)“Use of viral replicons for the expression ofgenes in plants”，Mol.Biotechnol.5：209-221。

可选择地，核酸，如表达构建物，可以与合适的T-DNA旁侧区域组合，并导入到传统的根瘤农杆菌宿主载体中。根瘤农杆菌宿主的毒力功能将在植物细胞受该细菌感染时，引导构建物和邻近的标记插入至植物细胞DNA中。根瘤农杆菌介导的转化技术，包括disarming和二元载体的应用，在科学文献中有详细的说明。参见，如，Horsch(1984)Science 233：496-498；Fraley(1983)Proc.Natl.Acad.Sci.USA 80：4803(1983)；Gene Transfer to Plants，Potrykus，ed.(Springer-Verlag，Berlin1995)。根瘤农杆菌细胞的DNA被包含在细菌染色体中，也被包含在称为Ti(肿瘤诱导)质粒的另一种结构中。Ti质粒含有一段命名为T-DNA的DNA(～20kb长)和一系列毒力(virulence)基因，T-DNA在感染过程中被转移到植物细胞中，毒力基因则引导所述感染过程。根瘤农杆菌可以通过伤口感染植物：当一种植物的根或者茎受伤时，它释放某种化学信号，作为对这种信号的响应，根瘤农杆菌的毒力基因被激活，并引发一系列从Ti质粒转移T-DNA至植物染色体所必需的事件。T-DNA然后通过伤口进入到植物细胞。一个推测是T-DNA一直等到植物DNA复制或者转录，然后将自身插入到暴露的植物DNA中。为了应用根瘤农杆菌作为转基因载体，必须去除T-DNA的肿瘤诱导部分，而保留T-DNA的边界区域和毒力基因。转基因然后插入到T-DNA的边界区域之间，从这里转移到植物细胞并且整合到植物的染色体中。

本发明提供了应用本发明的核酸进行包括重要的谷类植物在内的单子叶植物的转化，参见Hiei(1997)Plant Mol.Biol.35：205-218。也参见如，Horsch，Science(1984)233：496；Fraley(1983)Proc.Natl Acad.Sci USA 80：4803；Thykjaer(1997)如上；Park(1996)Plant Mol.Biol.32：1135-1148，讨论了将T-DNA整合到基因组DNA中。也参见D′Halluin，美国专利5,712,135，描述了包含在谷类或者其它单子叶植物的细胞中的具有功能的基因的DNA的稳定整合过程。

一方面，第三步可能涉及完整植物的选择和再生，所述植物能够将整合的靶基因传递至下一代。这样的再生技术依赖于在组织培养生长培养基中对某些植物激素的操作，典型地，依赖于与所需的核苷酸序列一同引入的杀虫剂和/或除草剂标记。源自培养的原生质体的植物再生在以下文献中有说明，Evans等，Protoplastslsolation and Culture，Handbook of Plant Cell Culture，124-176页，MacMillilanPublishing Company，New York，1983；和Binding，Regeneration of Plants，PlantProtoplasts，21-73页，CRC Press，Boca Raton，1985。再生也可以从植物愈伤组织、外植体、器官或者其中的一部分得到。这样的再生技术在Klee(1987)Ann.Rev.ofplant Phys.38：467-486中有总体的说明。为了从转基因组织如未成熟的胚胎获得整个植物，它们可以在一系列含有营养物和激素的培养基中在可控制的环境条件下培养，即称为组织培养的过程。一旦整个植物再生并且产生种子，便开始评测其子代。

在表达序列盒稳定地整入到转基因植物之后，其可以通过有性杂交(sexualcrossing)引入到其它的植物中。可以应用任何的标准繁殖技术，这依赖于待杂交的物种。因为本发明核酸的转基因表达导致表型变化，包含本发明的重组核酸的植物可以和另一植物有性杂交而得到最终产物。因此，本发明的种子可以来自本发明的两个转基因植物的杂交，或者来自本发明的植物和其它植物的杂交。当两个亲本植物都表达本发明的多肽(例如淀粉酶，如α-淀粉酶)时，所需的效应(例如，表达本发明的多肽来产生一种开花行为被改变的植物)可以被增强。所需的效应通过标准的繁殖方法传到以后的植物世代中。

本发明的核酸和多肽被表达于或者插入到任何植物或者种子中。本发明的转基因植物可以是双子叶植物或者单子叶植物。本发明的单子叶转基因植物的例子是草，如牧草(蓝草，早熟禾属Poa)，饲料草如羊茅属，黑麦草属，温带草，如翦股颖属(Agrostis)，和谷类，如，小麦、燕麦、黑麦、大麦、水稻、蜀黍和玉米(corn)。本发明的双子叶转基因植物的例子是烟草，豆类，如羽扇豆，马铃薯，甜菜，豌豆，蚕豆和大豆，以及十字花科植物(Brassicaceae)，如花椰菜，油菜籽，和紧密相关的模式生物拟南芥(Arabidopsis thaliana)。这样，本发明的转基因植物和种子包括很宽范围的植物，包括，但不限于，以下属的物种：腰果属(Anacardium)、落花生属(Arachis)、天冬属(Asparagus)、茄属(Atropa)、燕麦属(Avena)、芸苔属(Brassica)、柑桔属(Citrus)、Citrullus、辣椒属(Capsicum)、Carthamus、椰子(Cocos)、咖啡(Coffea)、香瓜属(Cucumis)、南瓜属(Cucurbita)、Daucus、Elaeis、Fragaria、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、Heterocallis、大麦属(Hordeum)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄属(Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、Majorana、苜蓿属(Medicago)、烟草属(Nicotiana)、Olea、Oryza、Panieum、Pannisetum、鳄梨属(Persea)、菜豆属(Phaseolus)、Pistachia、Pisum、梨属(Pyrus)、李属(Prunus)、萝卡属(Raphanus)、蓖麻属(Ricinus)、黑麦属(Secale)、千里光属(Senecio)、Sinapis、茄属(Solanum)、高粱属(Sorghum)、Theobromus、Trigonella、小麦属(Triticum)、野豌豆属(Vicia)、Vitis、Vigna和玉蜀黍属(Zea)。

在可供选择的实施方式中，本发明的核酸在含有纤维细胞的植物中表达，包括，如，棉、丝棉树(木棉、吉贝木棉)、沙漠柳、石炭酸灌木、winterfat、balsa、苎麻、洋麻、大麻、洛神葵、黄麻、马尼拉剑麻和亚麻。在可供选择的实施方式中，本发明的转基因植物可以是棉属(Gossypium)的成员，包括任何棉种(Gossypium)的成员，如，亚洲棉(G.arboreum)、草棉(G.herbaceum)、海岛棉(G.barbadense)和陆地棉(G.hirsutum)。

本发明也提供了用于产生大量本发明多肽(例如淀粉酶，如α-淀粉酶)的转基因植物。例如，参见Palingren(1997)Trends Genet.13：348；Chong(1997)Transgenic Res.6：289-296(利用植物生长素诱导的双向甘露氨酸合成酶(mas1′，2′)启动子，应用根瘤农杆菌介导的叶片圆盘(leaf disc)转化方法在转基因马铃薯植物中生产人乳汁蛋白β-酪蛋白)。

应用已知的程序，技术人员可以通过检测在转基因植物中转基因mRNA或蛋白的增加或减少来筛选本发明的植物。检测和定量mRNA或蛋白的方法在本领域是熟知的。

多肽和肽

一方面，本发明提供了分离的或重组的多肽，其与本发明的示例性序列具有序列同一性(例如至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性)，本发明的示例性序列例如SEQID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：10，SEQ ID NO：12，SEQ IDNO：14，SEQ ID NO：16，SEQ ID NO：18，SEQ ID NO：20，SEQ ID NO：22，SEQ IDNO：24，SEQ ID NO：26，SEQ ID NO：28，SEQ ID NO：30，SEQ ID NO：32，SEQ IDNO：34，SEQ ID NO：36，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ IDNO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ IDNO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60，SEQ ID NO：62，SEQ IDNO：64，SEQ ID NO：66，SEQ ID NO：68，SEQ ID NO：70，SEQ ID NO：72，SEQ IDNO：74，SEQ ID NO：76，SEQ ID NO：78，SEQ ID NO：80，SEQ ID NO：82，SEQ IDNO：84，SEQ ID NO：86，SEQ ID NO：88，SEQ ID NO：90，SEQ ID NO：92，SEQ IDNO：94，SEQ ID NO：96，SEQ ID NO：98，SEQ ID NO：100，SEQ ID NO：102，SEQ IDNO：104，SEQ ID NO：106，SEQ ID NO：108，SEQ ID NO：110，SEQ ID NO：112，SEQID NO：114，SEQ ID NO：116，SEQ ID NO：118，SEQ ID NO：120，SEQ ID NO：122，SEQ ID NO：124，SEQ ID NO：126，SEQ ID NO：128，SEQ ID NO：130，SEQ IDNO：132，SEQ ID NO：134，SEQ ID NO：136，SEQ ID NO：138，SEQ ID NO：140，SEQ ID NO：142，SEQ ID NO：144，SEQ ID NO：146，SEQ ID NO：148，SEQ IDNO：150，SEQ ID NO：152，SEQ ID NO：154，SEQ ID NO：156，SEQ ID NO：158，SEQ ID NO：160，SEQ ID NO：162，SEQ ID NO：164，SEQ ID NO：166，SEQ IDNO：168，SEQ ID NO：190，SEQ ID NO：192，SEQ ID NO：194，SEQ ID NO：204，SEQ ID NO：206，SEQ ID NO：208，SEQ ID NO：210，SEQ ID NO：212，SEQ IDNO：323，SEQ ID NO：325，SEQ ID NO：327，SEQ ID NO：329，SEQ ID NO：331，SEQ ID NO：333，SEQ ID NO：335，SEQ ID NO：337，SEQ ID NO：339，SEQ IDNO：341，SEQ ID NO：343，SEQ ID NO：345，SEQ ID NO：347，SEQ ID NO：349，SEQ ID NO：351，SEQ ID NO：353，SEQ ID NO：355，SEQ ID NO：357，SEQ IDNO：359，SEQ ID NO：361，SEQ ID NO：363，SEQ ID NO：365，SEQ ID NO：367，SEQ ID NO：369，SEQ ID NO：371，SEQ ID NO：373，SEQ ID NO：375，SEQ IDNO：377，SEQ ID NO：379，SEQ ID NO：381，SEQ ID NO：383，SEQ ID NO：385，SEQ ID NO：387，SEQ ID NO：389，SEQ ID NO：391，SEQ ID NO：393，SEQ IDNO：395，SEQ ID NO：397，SEQ ID NO：399，SEQ ID NO：401，SEQ ID NO：403，SEQ ID NO：405，SEQ ID NO：407，SEQ ID NO：409，SEQ ID NO：411，SEQ IDNO：413，SEQ ID NO：415，SEQ ID NO：417，SEQ ID NO：419，SEQ ID NO：421，SEQ ID NO：423，SEQ ID NO：425，SEQ ID NO：427，SEQ ID NO：429，SEQ IDNO：431，SEQ ID NO：433，SEQ ID NO：435，SEQ ID NO：437，SEQ ID NO：439，SEQ ID NO：441，SEQ ID NO：443，SEQ ID NO：445，SEQ ID NO：447，SEQ IDNO：449，SEQ ID NO：451，SEQ ID NO：453，SEQ ID NO：455，SEQ ID NO：457，SEQ ID NO：459，SEQ ID NO：461，SEQ ID NO：461，SEQ ID NO：463，SEQ IDNO：464，SEQ ID NO：466，SEQ ID NO：468，SEQ ID NO：469，SEQ ID NO：470，SEQ ID NO：471，SEQ ID NO：472，SEQ ID NO：474，SEQ ID NO：476，SEQ IDNO：477，SEQ ID NO：479，SEQ ID NO：481，SEQ ID NO：482，SEQ ID NO：483，SEQ ID NO：485，SEQ ID NO：487，SEQ ID NO：488，SEQ ID NO：489，SEQ IDNO：490，SEQ ID NO：491，SEQ ID NO：493，SEQ ID NO：495，SEQ ID NO：496，SEQ ID NO：497，SEQ ID NO：499，SEQ ID NO：501，SEQ ID NO：502，SEQ IDNO：503，SEQ ID NO：504，SEQ ID NO：505，SEQ ID NO：506，SEQ ID NO：507，SEQ ID NO：508，SEQ ID NO：510，SEQ ID NO：512，SEQ ID NO：513，SEQ IDNO：514，SEQ ID NO：516，SEQ ID NO：518，SEQ ID NO：518，SEQ ID NO：520，SEQ ID NO：521，SEQ ID NO：523，SEQ ID NO：525，SEQ ID NO：526，SEQ IDNO：528，SEQ ID NO：530，SEQ ID NO：531，SEQ ID NO：533，SEQ ID NO：535，SEQ ID NO：536，SEQ ID NO：537，SEQ ID NO：538，SEQ ID NO：540，SEQ IDNO：542，SEQ ID NO：543，SEQ ID NO：545，SEQ ID NO：547，SEQ ID NO：548，SEQ ID NO：549，SEQ ID NO：550，SEQ ID NO：551，SEQ ID NO：553，SEQ IDNO：555，SEQ ID NO：556，SEQ ID NO：557，SEQ ID NO：559，SEQ ID NO：561，SEQ ID NO：562，SEQ ID NO：563，SEQ ID NO：564，SEQ ID NO：566，SEQ IDNO：568，SEQ ID NO：570，SEQ ID NO：572，SEQ ID NO：574，SEQ ID NO：576，SEQ ID NO：578，SEQ ID NO：580，SEQ ID NO：582，SEQ ID NO：584，SEQ IDNO：586，SEQ ID NO：588，SEQ ID NO：589，SEQ ID NO：590，SEQ ID NO：591，SEQ ID NO：592，SEQ ID NO：594，SEQ ID NO：604，SEQ ID NO：606，SEQ IDNO：608，SEQ ID NO：610，SEQ ID NO：612，SEQ ID NO：614，SEQ ID NO：616，SEQ ID NO：618，SEQ ID NO：620或SEQ ID NO：622，及其子序列和其变体。一方面，所述多肽具有淀粉酶活性，包括α-淀粉酶或葡糖淀粉酶活性。

同一性可以在多肽的全长的区域内，或同一性可以在至少大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700或更多残基的区域内。本发明的多肽也可以比所述的示例性多肽的全长短。在可以选择的方面，本发明提供了大小范围在大约5到多肽全长的多肽(肽、片段)，例如酶，如淀粉酶；示例性的大小为大约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700或更多残基，这些残基例如是本发明的示例性淀粉酶的相邻残基。本发明的肽可以用作，例如标记探针、抗原、耐受原、基序、淀粉酶活性位点。

例如，下表总结了本发明的示例性多肽的特征(例如活性、初始来源、信号序列位置和例证性信号序列)。例如，具有如SEQ ID NO：437中所示的序列的多肽，由SEQ ID NO：436编码，通过人工产生；具有如SEQ ID NO：439中所示的序列的多肽，由SEQ ID NO：438编码，在碱性条件下具有淀粉酶活性，并且最初来源于(分离自)未知来源；具有如SEQ ID NO：441中所示的序列的多肽，由SEQ ID NO：440编码，在碱性条件下具有淀粉酶活性，最初来源于(分离自)未知来源，并且具有一个由SEQ ID NO：441(“AA 1-32”)的氨基酸残基1到32组成的信号序列；也参见下面关于本发明的信号序列的讨论，等等：

本发明的多肽和肽可以分离自天然来源，可以是合成的，或者可以是重组产生的多肽。肽和蛋白可以在体外或体内重组表达。本发明的肽和多肽可以使用本技术领域已知的任何方法产生和分离。本发明的多肽和肽也可以使用本技术领域熟知的化学方法全部或部分合成。例如参见Caruthers(1980)Nucleic Acids Res.Symp.Ser.215-223；Horn(1980)Nucleic Acids Res.Symp.Ser.225-232；Banga，A.K.，Therapeutic Peptides and Proteins，Formulation，Processing and DeliverySystems(1995)Technomic Publishing Co.，Lancaster，PA。例如，肽合成可以使用各种固相技术进行(例如参见Roberge(1995)Science 269：202；Merrifield(1997)Methods Enzymol.289：3-13)，自动合成可以根据制造商提供的说明书来实施，例如使用ABI 431A肽合成仪(Perkin Elmer)。

本发明的肽和多肽也可以是糖基化的，所述糖基化可以在翻译后通过化学方法或者通过细胞的生物合成机制而加上，其中后者包括应用已知的糖基化作用基序，所述糖基化作用基序可以是天然序列，或者是作为肽段而被加入的，或者是在核酸编码序列中加入的。糖基化作用可以是O-连接的或者是N-连接的。糖基化可以被加入到本发明的任何多肽，以产生比“亲本”酶(糖基化被加入的酶)更耐热或热稳定性更好的酶。糖基化可以或者通过化学或者通过细胞生物合成机制来加入。

本发明提供了在大范围的温度下具有大范围比活性的淀粉酶，例如在大约37℃在每毫克蛋白质大约10到10,000或100到大约1000单位的范围内。本发明的淀粉酶也在高至120℃的温度下具有活性。在可以选择的方面，在这些方法中所用的淀粉酶在这些温度下是有活性的，例如在大约80℃到大约115℃，大约100℃到大约110℃，以及从大约105℃到大约108℃的范围内的温度下具有活性。然而，本发明的淀粉酶也在低温下具有活性，例如低至4℃到5℃。

本发明所述酶的Tm可以通过热激活来改变(例如，可以在大约10℃到90℃之间改变)。例如，SEQ ID NO：336/337的Tm可以通过热激活改变大约17℃到87℃：例如，预培养5分钟。

本发明的肽和多肽，如以上所定义的，包括所有的“模拟物(mimetic)”和“肽模拟物(peptidomimetic)”形式。术语“模拟物”和“肽模拟物”是指具有与本发明的多肽实质上相同的结构和/或功能特征的合成的化学化合物。该模拟物或者完全由合成的非天然的氨基酸类似物组成，或者是由部分天然的肽氨基酸和部分非天然的氨基酸类似物构成的嵌合分子。所述模拟物也可以包括任意数量的天然氨基酸保守取代，只要这样的取代本质上不改变该模拟物的结构和/或活性。对于作为保守性变异体的本发明的多肽，常规实验将可以确定一种模拟物是否在本发明的范围内，即，其结构和/或功能并没有实质上的改变。因此，一方面，如果一种模拟化合物具有淀粉酶活性，那么它在本发明的范围内。

本发明的多肽模拟物可以包含非天然结构成分的任何组合。在可供选择的方面，本发明的模拟物包括以下三种结构基团中的一种或所有：a)不是天然酰胺键(“肽键”)连接的残基连接基团；b)取代天然发生的氨基酸残基的非天然残基；或者c)诱导二级结构拟态(mimicry)的残基，即，可以诱导或者稳定二级结构，如β转角、γ转角、β折叠、α螺旋构象，以及类似的结构。例如，当一个多肽的所有残基或者一些残基通过非天然肽键的化学方式连接时，本发明的该多肽可以作为模拟物来表征。各个肽模拟物残基可以通过肽键、其它的化学键或者偶联方式连接，如，通过戊二醛、N-羟基琥珀酰亚胺酯、双功能马来酰亚胺、N，N′-二环己基碳二亚胺(DCC)或者N，N′-二异丙基碳二亚胺(DIC)连接。可以替代传统的酰胺键(“肽键”)连接的连接基团包括，如，酮基亚甲基(如，-C(＝O)-CH₂-代替-C(＝O)-NH-)、氨基亚甲基(CH₂-NH)、次乙基、烯烃(CH＝CH)、醚(CH₂-O)、硫醚(CH₂-S)、四唑(CN₄-)、噻唑、retroamide、硫代酰胺或者酯(参见如，Spatola(1983)在Chemistry and Biochemistry of Amino Acids，Peptides and Proteins，第7卷，267-357页，“Peptide Backbone Modifications”Marcell Dekker，NY)。

本发明的多肽作为模拟物时，其特征也可以是含有全部或者部分替代了天然发生的氨基酸残基的非天然氨基酸残基。在科学和专利文献中描述了非天然的残基；作为天然氨基酸残基的模拟物的一些典型的非天然化合物及指导在下面有描述。芳香族氨基酸的模拟物可以通过用以下的取代来产生，如，D-或L-萘基丙氨酸；D-或L-苯基甘氨基，D-或L-2thieneyl丙氨酸；D-或L-1，-2，3-或4-芘基丙氨酸；D-或L-3thieneyl丙氨酸；D-或L-(2-吡啶基)-丙氨酸；D-或L-(3-吡啶基)-丙氨酸；D-或L-(2-吡嗪基)-丙氨酸，D-或L-(4-异丙基)-苯基甘氨酸；D-(三氟甲基)-苯基甘氨酸；D-(三氟甲基)-苯基丙氨酸；D-p-氟-苯基丙氨酸；D-或L-p-二苯基苯基丙氨酸；D-者L-p-甲氧基-二苯基苯基丙氨酸；D-或L-2-吲哚(烷基)丙氨酸；和，D-或L-烷基丙氨酸，其中的烷基可以是取代的或非取代的甲基、乙基、丙基、己基、丁基，戊基、异丙基、异丁基、仲异基(sec-isotyl)、异戊基或者非酸性氨基酸。非天然氨基酸的芳香环包括，如噻唑基、苯硫基、吡唑基、苯并咪唑基、萘基、呋喃基、吡咯基和吡啶基芳香环。

酸性氨基酸的模拟物可以通过用以下的取代来产生，如，保持有负电荷的非羧酸氨基酸；(膦酰基)丙氨酸；硫酸化的苏氨酸。羧基侧链(如，天冬氨酰基或者谷氨酰基)也可以通过与碳二亚胺(R′-N-C-N-R′)反应进行选择性的修饰，所述碳二亚胺如1-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或者1-乙基-3(4-氮-4，4-二甲基戊基)碳二亚胺。天冬氨酰基或者谷氨酰基也可以通过与铵离子反应转化为天冬酰胺酰基和谷氨酰胺酰基。碱性氨基酸的模拟物可以通过用如，(除了赖氨酸和精氨酸外)鸟氨酸、瓜氨酸、或者(胍基)-乙酸，或者(胍基)烷基-乙酸的取代产生，其中烷基如以上定义。腈衍生物(如，含有取代COOH的CN-部分)可以取代天冬酰胺或者谷氨酰胺。天冬酰胺酰基和谷氨酰胺酰基可以脱氨基成为相应的天冬氨酰基或者谷氨酰基。精氨酸残基模拟物可以通过精氨酰基与例如一种或者多种常规试剂在优选为碱性的条件下反应而产生，所述的常规试剂包括如苯乙二醛、2，3-丁二酮、1，2-环己二酮或者茚三酮。酪氨酸残基模拟物可以通过酪氨酰基与例如芳香重氮化合物或者四硝基甲烷反应而产生。N-acetylimidizol和四硝基甲烷可以分别用于形成O-乙酰基酪氨酰物质和3-硝基衍生物。半胱氨酸残基模拟物可以通过半胱氨酰残基与例如α-卤素乙酸例如2-氯乙酸或者氯乙酰胺和相应的胺反应而产生；得到羧甲基或者羧酰胺甲基衍生物。半胱氨酸残基模拟物也可以通过半胱氨酰残基与例如溴代-三氟丙酮、α-溴-β-(5-imidozoyl)丙酸；氯乙酰磷酸、N-烷基马来酰亚胺、3-硝基-2-吡啶基二硫化物；甲基2-吡啶基二硫化物；p-氯汞苯甲酸盐；2-氯汞-4硝基苯酚，或者，氯-7-硝基苯并-氧杂-1，3-二唑反应而产生。可以通过赖氨酰基与例如琥珀酸或者其它的羧酸酸酐反应而产生赖氨酸模拟物(和改变氨基末端残基)。赖氨酸和其它的含有α-氨基的残基模拟物也可以通过与亚氨酸酯例如methyl picolinimidate、磷酸吡哆醛、吡哆醛、氯硼氢化物、三硝基-苯磺酸、O-甲基异脲、2，4，戊二酮的反应，和与乙醛酸的转酰胺基酶催化的反应而产生。甲硫氨酸的模拟物可以通过与例如甲硫氨酸亚砜反应而产生。脯氨酸的模拟物包括，例如，2-哌啶酸、四氢噻唑羧酸、3-或4-羟脯氨酸、脱氢脯氨酸、3-或4-甲基脯氨酸，或者3，3，-二甲基脯氨酸。组氨酸残基模拟物可以通过组氨酰基与例如二乙基原碳酸酯或对溴苯甲酰甲基溴化物反应而产生。其它的模拟物包括，例如，由脯氨酸和赖氨酸的羟基化作用产生的模拟物；由丝氨酰或者苏氨酰的羟基的磷酸化作用产生的模拟物；由赖氨酸、精氨酸和组氨酸的α氨基基团的甲基化作用产生的模拟物；由N-末端胺的乙酰化作用而产生的模拟物；由主链酰胺残基的甲基化或用N-甲基氨基酸取代而产生的模拟物；或者，由C-末端羧基的酰胺化而产生的模拟物。

本发明的多肽的残基例如氨基酸也可以用相反手性的氨基酸(或者肽模拟物残基)替代。因此，任何天然发生的L-构型(也可以被称为R或者S，取决于化学实体的结构)的氨基酸都可用相同化学结构类型但是具有相反手性的氨基酸或者肽模拟物替代，相反手性的氨基酸称为D-氨基酸，但也可以称R-或者S-型。

本发明也提供了通过天然过程，如，翻译后加工(如，磷酸化，酰化以及类似作用)或者通过化学修饰技术来修饰本发明的多肽的方法，以及得到的被修饰的多肽。修饰可以发生在所述多肽的任何地方，包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解，相同类型的修饰可以在已知的多肽中以相同的或者不同的水平在几个位点处发生。一个多肽也可以具有很多类型的修饰。修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组分、共价连接核苷酸或核苷酸衍生物、共价连接脂质或脂质衍生物、共价连接磷脂酰肌醇、交联的环化作用、形成二硫键、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、蛋白水解过程、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用，和转移RNA介导氨基酸添加到蛋白质中，如精氨酰化。参见，如，Creighton，T.E.，Proteins-Structure and Molecular Properties 2nd Ed.，W.H.Freeman和Company，New York(1993)；Posttranslational Covalent Modification of Proteins，B.C.Johnson，Ed.，Academic Press，New York，11-12页(1983)。

固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield，R.B.，J.Am.Chem.Soc.，85：2149-2154，1963)(也参见Stewart，J.M.和Young，J.D.，Solid PhasePeptide Synthesis，第二版，Pierce Chemical Co.，Rockford，III，11-12页)，并且这些方法已经可以通过商业上可获得的实验室肽设计和合成试剂盒(Cambridge ResearchBiochemicals)而被应用。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等，Proc.Natl.Acad.Sci.，USA，81：3998(1984)的方法，它们让肽合成在多个“杆(rods)”或者“钉(pins)”的顶端进行，而所有的“杆”或者“钉”都被连接到一块板上。当使用这样的系统时，一个板的杆或者钉被倒转并插入到另一个板的相应孔或者贮存器中，所述孔或者贮存器含有用于将一种适合的氨基酸附着或固定在杆或钉的顶端的溶液。通过重复这样的处理步骤，即是，反转和插入所述杆和钉的顶端至适当的溶液中，将氨基酸构建成所要的肽。此外，大量的FMOC肽合成系统是可利用的。例如，应用Applied Biosystems，Inc.的Model 431A^TM自动肽合成仪可以在固体支持物上装配多肽或者片段。这些设备使得本发明的肽容易获得，或者通过直接的合成或者通过用其它已知的技术将一系列片段偶联起来的合成。

本发明提供了新颖淀粉酶(例如α淀粉酶)，包括本发明的示例性酶，编码这些酶的核酸，与这些酶结合的抗体，以及制备和使用这些酶的方法。一方面，本发明的多肽具有淀粉酶活性，正如此处描述的，例如包括将淀粉水解为糖的能力。一方面，本发明的多肽具有α淀粉酶活性。在可以选择的方面，本发明的淀粉酶具有由本文所描述的示例性淀粉酶的活性的修饰而得到的活性。

本发明包括具有和没有信号序列(包括本发明的信号序列，例如参见下面的表3，或其它信号序列)的淀粉酶，以及信号序列本身(例如参见下面的表3)。本发明也包括含有本发明的信号序列的多肽(例如融合蛋白)，所述本发明的信号序列例如参见下面的表3。含有本发明的信号序列的多肽可以是本发明的淀粉酶，或别的淀粉酶，或其它酶或其它多肽。

本发明包括固定化的淀粉酶、抗淀粉酶抗体及其片段。本发明提供了抑制淀粉酶活性的方法，例如使用本发明的显性负突变体或抗淀粉酶抗体。本发明包括含有本发明淀粉酶的杂合物，例如融合蛋白、异源二聚体等等。

一方面，本发明的淀粉酶(例如α-淀粉酶)水解淀粉中的内部多糖键，例如α-1，4-和α-1，6-糖苷键，以产生更小分子量的麦芽糊精。一方面，该水解在很多程度上是随机地。因此，本发明提供了产生更小分子量的麦芽糊精的方法。

本发明的淀粉酶可以在实验室和工业环境中使用，用来水解淀粉或任何含有麦芽糊精的化合物以用于多种目的。这些淀粉酶可以被单独使用，来提供特定的水解，或可以与其它淀粉酶组合使用，以提供具有广谱活性的“混合物(cocktail)”。例证性用途包括从生物、食品、动物饲料、药物或工业样品中去除或者部分地或完整地水解淀粉或任何含有麦芽糊精的化合物。

例如，本发明的淀粉酶可以被配制在洗衣去污剂中，以帮助去除含有淀粉的污渍。一方面，本发明提供了含有本发明的淀粉酶——包括在碱性条件下具有活性的淀粉酶——的去污剂，以及生产和使用它们的方法。这些去污剂组合物包括洗衣和洗碗(例如自动洗碗)溶液和应用。本发明的淀粉酶可以在任何去污剂基料中作为清洗剂(参见下面的工业应用)。本发明的淀粉酶可以在淀粉加工的初始阶段(液化)中被使用，在玉米湿磨法中被使用，在酒精生产中被使用，在纺织行业中被用于淀粉脱浆，在焙烤食品应用中被应用，在饮料行业中被应用，在油田中的钻探过程中被应用，在循环纸的加墨中被应用，以及在动物饲料中被应用。

本发明的多肽可以在多种不同的条件下具有淀粉酶活性，例如极端pH和/或温度、氧化剂以及类似的条件。本发明提供了产生可供选择的淀粉酶制剂的方法，所述制剂具有不同的催化效率和稳定性，例如针对温度、氧化剂和改变洗涤条件。一方面，淀粉酶变异体可以使用定点诱变和/或随机诱变的技术来产生。一方面，定向进化可以被用来产生大量不同的具有可供选择的特异性和稳定性的淀粉酶变异体。

本发明的蛋白也可用作研究试剂，以鉴定淀粉酶调节物，例如淀粉酶活性的激活剂或抑制剂。简单的说，将测试样品(化合物、肉汤、提取物和类似物)加入到淀粉酶分析中，以确定它们抑制底物裂解的能力。用该方式鉴定的抑制剂可用于工业和研究中，以减少或阻止不期望的蛋白水解。当使用淀粉酶时，抑制剂可以被组合以增加活性谱。

本发明也提供了应用本发明的核酸、多肽和抗体来发现新的淀粉酶的方法。一方面，筛选λ噬菌体文库，基于表达来发现淀粉酶。一方面，本发明在筛选中使用λ噬菌体，以便可以检测到毒性克隆；更方便地接通到底物；减少工程改造宿主的需要，避开由文库中大的切除带来任何偏差的可能性；而且可以在低克隆密度下获得更快的生长。λ噬菌体文库的筛选可以是在液相中或者固相中进行。一方面，本发明提供了在液相中的筛选。与固相筛选相比，这提供了分析条件上的更大灵活性；额外底物的可行性；对于弱的克隆的更高灵敏性；和更容易实现的自动化。

本发明提供了使用本发明的蛋白和核酸以及机器人自动化来进行筛选的方法，机器人自动化使得可以在例如一天的短时间内进行数千个生物催化反应和筛选分析，并且保证了高水平的精确度和可重复性(参见下面关于阵列的讨论)。结果，衍生化合物的文库可以在数周内产生。对于包括小分子在内的分子的修饰的进一步教导，参见PCT/US94/09174。

本发明包括淀粉酶，这些淀粉酶是非天然发生的羰基水解酶变异体(例如淀粉酶变异体)，与获得变异体的氨基酸序列的前体羰基水解酶相比，它们具有不同的蛋白水解活性、稳定性、底物特异性、pH曲线和/或性能特征。特定地，这样的淀粉酶变异体具有在自然界没有发现的氨基酸序列，该氨基酸序列是通过用不同的氨基酸取代前体淀粉酶的多个氨基酸残基来衍生得到。前体淀粉酶可以是天然发生的淀粉酶或重组的淀粉酶。有用的淀粉酶变异体包括在指定的氨基酸残基位置处对天然发生的任何L-氨基酸所进行的取代。

淀粉酶信号序列

本发明提供了信号序列，该信号序列包括肽或由肽组成，所述肽的序列包括本发明的多肽的残基1到12、1到13、1到14、1到15、1到16、1到17、1到18、1到19、1到20、1到21、1到22、1到23、1到24、1到25、1到26、1到27、1到28、1到28、1到30、1到31、1到32、1到33、1到34、1到35、1到36、1到37、1到38或1到39或更长。例如，本发明提供了淀粉酶(例如α淀粉酶或葡糖淀粉酶)信号序列和编码这些信号序列的核酸，所述信号序列例如具有在表3、SEQ ID NO：7、SEQ ID NO：8、SEQ ID NO：213到257中所示的序列的本发明的示例性肽，本发明还提供了包含在表3、SEQ ID NO：7、SEQ ID NO：8、SEQID NO：213到257中所示的序列的多肽(或由这些所示序列组成的多肽)。本发明也提供了淀粉酶信号序列和编码这些信号序列的核酸，所述信号序列例如包括SEQ ID NO：323(由SEQ ID NO：322编码)的残基1到27或由其组成的肽、包括SEQ ID NO：333(由SEQ ID NO：332编码)的残基1到22或由其组成的肽、包括SEQ ID NO：335(由SEQ ID NO：334编码)的残基1到20或由其组成的肽、包括SEQ ID NO：337(由SEQ ID NO：336编码)的残基1到35或由其组成的肽，等等，除了这些信号序列，关于其它淀粉酶信号序列和编码这些信号序列的核酸参见表3。

本发明也提供了淀粉酶信号序列和编码这些信号序列的核酸，所述信号序列包括如下残基或由如下残基组成：SEQ ID NO：441的残基1到32或1到33，SEQID NO：443的残基1到27或1到28，SEQ ID NO：445的残基1到24或1到25，SEQ ID NO：449的残基1到23或1到24，SEQ ID NO：451的残基1到49或1到50，SEQ ID NO：453的残基1到34或1到35，SEQ ID NO：455的残基1到37或1到38，SEQ ID NO：457的残基1到26或1到27，SEQ ID NO：459的残基1到29或1到30，SEQ ID NO：466的残基1到22或1到23，SEQ ID NO：485的残基1到19或1到20，SEQ ID NO：493的残基1到54或1到55，SEQ ID NO：499的残基1到22或1到23，SEQ ID NO：516的残基1到21或1到22，SEQ ID NO：518的残基1到26或1到27，SEQ ID NO：540的残基1到20或1到21，SEQ ID NO：553的残基1到23或1到24，SEQ ID NO：559的残基1到19或1到20，SEQ ID NO：566的残基1到33或1到34。

例如，关于表3，本发明提供了包含SEQ ID NO：87的残基1到23(SEQ IDNO：213)的肽或由其组成的肽，等等。

表3

本发明的淀粉酶信号序列可以是分离的肽，或与别的淀粉酶或非淀粉酶多肽连接的序列，例如作为融合蛋白。一方面，本发明提供了包含本发明的淀粉酶信号序列的多肽。一方面，包含本发明的淀粉酶信号序列的多肽包含与本发明淀粉酶异源的序列(例如，包含本发明的淀粉酶信号序列以及来自别的淀粉酶或非淀粉酶蛋白的序列的融合蛋白)。一方面，本发明提供了带有异源信号序列的本发明的淀粉酶，例如带有酵母信号序列的序列。本发明的淀粉酶可以包含载体中的异源信号序列，所述载体例如pPIC系列载体(Invitrogen，Carlsbad，CA)。

一方面，本发明的信号序列在鉴定出新的淀粉酶多肽之后被鉴定。蛋白被分选和转运至其正确的细胞位置的通路通常被称为蛋白靶向通路(protein targetingpathways)。在所有这些靶向系统中最重要的元件之一是新合成的多肽的氨基末端上的短的氨基酸序列，称为信号序列。这种信号序列可指引蛋白至其在细胞中的适合位置，并在转运过程中或在蛋白到达其最终目的地时被去除。大多数的溶酶体蛋白、膜蛋白或分泌蛋白都具有氨基末端信号序列，这些信号序列标示着它们将转位至内质网腔内。在这一类中已经有超过100个蛋白信号序列被确定。信号序列的长度可以从13至36个氨基酸残基。识别信号序列的各种方法对于本领域技术人员是已知的。例如，在一个方面，新的淀粉酶信号肽可通过称为SignaIP的方法来鉴定。SignalP应用了既可识别信号肽，又可识别其裂解位点的组合神经网络。(Nielsen等人，“Indentification of prokaryotic and eukaryotic signal peptides andprediction of their cleavage sites”Protein Engineering，卷10，1，1-6页(1997))。

应该理解的是，在一些方面，本发明的淀粉酶可以没有信号序列。在一个方面，本发明提供了缺少所有或部分的信号序列的本发明的淀粉酶，所述信号序列例如本发明的信号序列(参见下面的表3)。在一个方面，本发明提供了编码来自一种淀粉酶的信号序列的核酸序列，所述淀粉酶可操作地连接到一种不同的淀粉酶的核酸序列上，或者，可选择地，来自非淀粉酶蛋白的信号序列是被需要的。表3说明了本发明的示例性信号序列。

淀粉酶原前体和信号序列以及催化结构域

除了信号序列(例如信号肽(SPs))，正如上面所讨论的，本发明提供了原前体(prepro)结构域和催化结构域(CDs)。本发明的SPs、原前体结构域和/或CDs可以是分离的或重组的肽或可以是融合蛋白的一部分，例如作为嵌合蛋白中的异源结构域。本发明提供了编码这些催化结构域(CDs)(例如“活性位点”)、原前体结构域和信号序列(SPs，例如具有一个包括本发明的多肽的氨基末端残基或由本发明的多肽的氨基末端残基组成的序列的肽)的核酸。

本发明的淀粉酶信号序列(SPs)、催化结构域(CDs)和/或原前体序列可以是分离的肽，或与另一个淀粉酶或非淀粉酶多肽结合的序列，例如作为融合(嵌合)蛋白的一部分。一方面，包含本发明的淀粉酶信号序列SPs和/或原前体的多肽包括与本发明的淀粉酶异源的序列(例如包括本发明的SP和/或原前体以及来自别的淀粉酶或非淀粉酶蛋白的序列的融合蛋白)。一方面，本发明提供了具有异源CDs、SPs和/或原前体序列的本发明的淀粉酶，例如具有酵母信号序列的序列。本发明的淀粉酶可以包括载体中的异源CD、SP和/或原前体，所述载体例如pPIC系列载体(Invitrogen，Carlsbad，CA)。

一方面，本发明的SPs、CDs和/或原前体序列在新的淀粉酶多肽被鉴定出之后被鉴定。蛋白被分选和转运至其正确的细胞位置的通路通常被称为蛋白靶向通路。在所有这些靶向系统中最重要的元件之一是新合成的多肽的氨基末端上的短的氨基酸序列，称为信号序列。这种信号序列可指引蛋白至其在细胞中的适合位置，并在转运过程中或在蛋白到达其最终目的地时被去除。大多数的溶酶体蛋白、膜蛋白或分泌蛋白都具有氨基末端信号序列，这些信号序列标示着它们将转位至内质网腔内。信号序列的长度可以从13至45或更多个氨基酸残基。识别信号序列的各种方法对于本领域技术人员是已知的。例如，在一个方面，新的水解酶信号肽可通过称为SignaIP的方法来鉴定。SignalP应用了既可识别信号肽，又可识别其裂解位点的组合神经网络。(Nielsen等人，“Indentification of prokaryotic andeukaryotic signal peptides and prediction of their cleavage sites”Protein Engineering，卷10，1，1-6页(1997))。

在一些方面，本发明的淀粉酶可以没有SPs和/或原前体序列、和/或催化结构域(CDs)。在一个方面，本发明提供了缺少所有或部分的SP、CD和/或原前体结构域的本发明的淀粉酶。在一个方面，本发明提供了编码来自一种淀粉酶的信号序列(SP)、CD和/或原前体的核酸序列，其可操作地连接到不同的淀粉酶的核酸序列上，或者，可选择地，来自非淀粉酶蛋白的信号序列(SPs)、CD和/或原前体结构域是被需要的。

本发明也提供了分离的或重组的多肽，其含有本发明的信号序列(SP)、原前体结构域和/或催化结构域(CD)以及异源序列。所述异源序列是与SP、原前体结构域和/或CD天然不相关的序列(例如，与淀粉酶是非天然相关的)。与SP、原前体结构域和/或CD天然不相关的序列可以在SP、原前体结构域和/或CD的氨基末端、羧基末端，和/或SP和/或CD的两个末端上。在一个方面，本发明提供了分离的或重组的多肽，其包括含有本发明的信号序列(SP)、原前体结构域和/或催化结构域(CD)的多肽或由所述多肽组成，条件是它没有和与其天然相关的任何序列(例如，淀粉酶序列)连接。同样，在一个方面，本发明提供了编码这些多肽的分离的或重组的核酸。因此，在一个方面，本发明的分离的或重组的核酸包含本发明的信号序列(SP)、原前体结构域和/或催化结构域(CD)的编码序列以及异源序列(即，与本发明的信号序列(SP)、原前体结构域和/或催化结构域(CD)天然不相关的序列)。异源序列可以在SP、原前体结构域和/或CD编码序列的3’末端、5’末端和/或两个末端上。

本发明的多肽包括活性或非活性形式的淀粉酶。例如，本发明的多肽包括在原前体序列的“成熟”或加工之前的原蛋白，所述的“成熟”或加工是例如通过原蛋白加工酶例如原蛋白转化酶来产生“活性”成熟蛋白而实现的。本发明的多肽包括由于其它原因而没有活性的淀粉酶，例如在通过翻译后加工事件进行“激活”之前的淀粉酶，所述的翻译后加工事件例如内切或外切肽酶或蛋白酶作用、磷酸化作用、酰胺化、糖基化或硫酸盐化作用、二聚事件以及类似的作用。鉴定“原前体”结构域序列、CDs和信号序列的方法在本技术领域是熟知的，例如Vande Ven(1993)Crit.Rev.Oncog.4(2)：115-136。例如，为了鉴定原前体序列，从胞外空间纯化出蛋白质，确定其N末端蛋白序列，并将其与未加工的形式进行比较。

本发明的多肽包括本发明的酶的所有活性形式，包括活性子序列，例如催化结构域(CDs)或活性位点。一方面，本发明提供了催化结构域或活性位点，正如下面所示。一方面，本发明提供了包含活性位点结构域或由活性位点结构域组成的肽或多肽，正如通过使用数据库如Pfam(该数据库是多序列比对和覆盖许多常见的蛋白家族的隐藏Markov模型的大集合，Pfam蛋白家族数据库，A.Bateman，E.Birney，L.Cerruti，R.Durbin，L.Etwiller，S.R.Eddy，S.Griffiths-Jones，K.L.Howe，M.Marshall，和E.L.L.Sonnhammer，Nucleic Acids Research，30(1)：276-280，2002)或等价数据库预测的。

杂交(嵌合)淀粉酶和肽文库

一方面，本发明提供了包含本发明的序列的杂合淀粉酶和融合蛋白，包括肽库。本发明的肽库可以用于分离目标的肽调节物(如，激活物或者抑制物)，如淀粉酶底物、受体、酶。本发明的肽库可以用于鉴定目标的结合配偶，如，配体，例如，细胞因子、激素以及类似物。

一方面，本发明的融合蛋白(如，肽部分)是构象稳定的(相对于线形肽)，对靶标具有更高的结合亲和性。本发明提供了本发明的淀粉酶与其它肽的融合，所述其它肽包括已知的肽和随机的肽。它们可以以这样一种方式融合，使得所述淀粉酶的结构没有明显地被扰乱，并且该肽在代谢上或者结构构象上是稳定的。这样便允许获得这样的肽库，其在细胞内的存在及其数量都是容易监测的。

本发明的氨基酸序列变异体可以通过该变异的预先确定的性质来表征，所述的预先确定的性质也就是将它们与天然发生的形式区分开的特征，所述的天然发生的形式例如淀粉酶序列的等位基因的或者种间的变异。一方面，本发明的变异体表现出与天然发生的类似物相同性质的生物活性。可选择地，可以选择具有改变的特征的变异体。一方面，尽管引入氨基酸序列变化的位点或区域是预先决定的，但突变本身并不需要预先决定。例如，为了优化在一个给定位点出现的突变所带来的性能，可以在目标密码子或者区域进行随机诱变，并筛选被表达的淀粉酶变异体，以寻找所需活性的优化组合。在具有已知序列的DNA的预先决定的位点产生取代突变的技术是已熟知的，正如在此说明的，例如，M13引物诱变和PCR诱变。突变体的筛选可以通过应用蛋白水解活性分析来进行。在可供选择的方面，氨基酸取代物可以是单个残基；插入可以是大约1到20个氨基酸的水平，尽管可以插入相当大的片段。缺失的范围可以是大约1到大约20、30、40、50、60、70个残基或者更多。为了得到具有优化性质的最终衍生物，替代、缺失、插入或者它们的任何组合都可以被应用。一般地，这些变化是在为数不多的氨基酸上进行，以使分子的改变最小化。然而，在某些情况下，可以容忍更大的改变。

本发明提供了淀粉酶，其中多肽骨架的结构、二级结构或三级结构，例如，α螺旋或β折叠结构，已被修饰。一方面，电荷或疏水性已被修饰。一方面，侧链基团已被修饰。通过选择较不保守的取代来产生功能或免疫性的实质变化。例如，可以进行这样的取代，它们将更加显著地影响：发生变化的区域的多肽骨架的结构，例如α螺旋或β折叠结构；分子的电荷或疏水位点，其可以是活性位点；或侧链。本发明提供在本发明的多肽中的取代，其中(a)亲水残基，例如丝氨酰或苏氨酰，被疏水残基例如亮氨酰、异亮氨酰、苯基丙氨酰、缬氨酰或丙氨酰取代；或者相反；(b)半胱氨酸或脯氨酸被任何别的残基取代；或者相反；(c)具有正电性侧链的残基，例如赖氨酰、精氨酰或组氨酰被带负电的残基例如谷氨酰或天冬氨酰取代；或者相反；或者(d)具有大体积侧链的基团，例如苯丙氨酸，被不具侧链的氨基酸例如甘氨酸取代；或者相反。所述变异体可以表现出相同性质的生物学活性(即，淀粉酶活性)，尽管变异体可经选择来按需改变淀粉酶的特征。

一方面，本发明的淀粉酶包括表位(epitopes)或者纯化标记、信号序列或其它的融合序列，等。在一方面，本发明的淀粉酶可以与随机的多肽融合，形成融合多肽。“融合”或者“可操作地连接”在此是指随机肽和淀粉酶连接在一起，以这样的方式来最小化对淀粉酶结构的稳定性的破坏，例如，其仍保持淀粉酶的活性。所述的融合多肽(或者编码该融合多肽的融合多核苷酸)还可以包含进一步的成分，包括在多环(multiple loops)处的多个肽段。

一方面，所述肽和编码它们的核酸被随机化，或者是被完全随机化的，或者是在它们的随机化中有偏向，例如，在核苷酸/残基的总的频率或者每个位置处的频率方面有偏向。“随机化”是指每一核酸和肽分别由实质上随机的核苷酸和氨基酸组成。一方面，产生所述肽的所述核酸可以化学合成，并且可以在任何位置整合进任何核苷酸。因此，当所述核酸被表达而形成肽时，任何氨基酸残基可以整合进任何位置。可以设计合成过程来产生随机化的核酸，从而允许在所述核酸的长度范围内形成所有的或大多数的可能组合，由此形成随机核酸文库。该文库可以提供足量的结构多样的随机化表达产物群体，可以获得概率上充分的细胞响应范围，从而可以提供一种或多种表现出所需响应的细胞。因此，本发明提供了一个足够大的相互作用文库，这样，其成员中的至少一个将具有使其对于一些分子、蛋白或者其他因子具有亲和性的结构。

筛选方法和“在线”监控设备

在实践本发明的方法时，多种仪器和方法可以与本发明的多肽和核酸一起使用，例如，用来筛选多肽的淀粉酶活性、用来筛选作为淀粉酶活性的潜在调节剂的化合物，例如激活剂或抑制剂，还可以用来筛选与本发明的多肽结合的抗体、与本发明的核酸杂交的核酸，用来筛选表达本发明的多肽的细胞，等等。

毛细管阵列

毛细管阵列，如GIGAMATRIX^TM，戴弗萨公司，San Diego，CA可以在本发明的方法中使用。本发明的核酸或多肽可被固定或应用于阵列上，包括毛细管阵列。阵列可用来筛选或监测化合物(例如，小分子、抗体、核酸等)的文库，以发现它们结合本发明的核酸或多肽或者调节本发明的核酸或多肽的活性的能力。毛细管阵列提供了容纳和筛选样品的可供选择的装置。例如，样品筛选仪器包括多个毛细管，它们形成相互邻近的毛细管构成的阵列，其中所述的每个毛细管含有至少一个壁，其限定了一个用以保留样品的内腔。该仪器可以进一步包括在阵列中相邻毛细管之间放置的间质材料(interstitial material)，从而在间质材料中形成一个或多个参考标记。筛选样品的毛细管可以包括第一个壁，其限定了一个用于保留样品的内腔，和由过滤材料形成的第二个壁，其用于过滤提供给内腔以激发样品的激发能，其中所述毛细管适于结合成毛细管阵列。

多肽或核酸，例如，配体可被导入进第一成分中，该成分被导入进毛细管阵列的至少一部分毛细管中。毛细管阵列的每一毛细管可以包括至少一个壁，其限定了一个用于保留第一组分的内腔。气泡被导入进第一成分后面的毛细管中。将第二成分导入进毛细管内，其中所述的第二成分与第一成分通过气泡相隔。感兴趣的样品可作为用可检测颗粒标记的第一液体导入进毛细管阵列的毛细管中，其中毛细管阵列的每一毛细管包括至少一个壁，其限定了一个用于保留第一液体和可检测颗粒的内腔，并且其中至少一个壁包被了一种结合材料，该结合材料将可检测颗粒结合在至少一个壁上。该方法可以进一步包括从毛细管去除第一液体，其中结合的可检测颗粒仍保留在毛细管内，并且包括将第二液体导入进毛细管内。

毛细管阵列可以包括多个单独的毛细管，所述单一毛细管包括至少一个限定内腔的外壁。毛细管的外壁可以是融合在一起的一个或多个壁。类似地，该壁可以限定一个内腔，这个内腔可以是圆柱形的、正方形的、六边形的或其它任何几何形状，只要所述壁能够形成内腔以保留住液体或样品。毛细管阵列的毛细管可相互靠近，联合在一起形成一个面状的构造。毛细管可通过融合(例如，当毛细管由玻璃制成时)、粘合、键合或面对面的夹合而结合在一起。毛细管阵列可由任何数量的毛细管形成，例如，100至4,000,000个毛细管。毛细管可以形成一个微量滴定平板，其具有大约100,000或更多个结合在一起的单一毛细管。

阵列，或“生物芯片”

本发明的核酸或者多肽可以固定于或者应用于阵列。可以应用阵列来筛选或者监测化合物(例如，小分子、抗体、核酸等等)的文库，所述筛选或者监测是针对它们结合本发明的核酸或多肽或者调控本发明的核酸或多肽的活性的能力。例如，在本发明的一方面，一个被监测的参数是淀粉酶基因的转录表达。细胞的一种或多种或所有的转录物可以通过阵列或“生物芯片”上的固定化核酸与包含细胞转录物、或代表细胞转录物的核酸、或与细胞转录物互补的核酸的样品的杂交来测定。通过在微型芯片上应用核酸“阵列”，细胞的一些或所有的转录物可以同时被定量。可选择地，包含基因组核酸的阵列也可以用于确定通过本发明的方法制造的新的工程菌株的基因型。“多肽阵列”也可以用于同时定量多种蛋白。本发明可以用任何已知的“阵列”进行实践，所述“阵列”也指“微阵列”或“核酸阵列”或“多肽阵列”或“抗体阵列”或“生物芯片”，或者它们的变体。阵列一般是多个“点”或者“靶元素”，每一个靶元素包括确定数量的一种或多种生物分子，例如，固定于基材表面的确定区域、用于特异结合样品分子如mRNA转录物的寡核苷酸。

在实践本发明的方法时，任何已知的阵列和/或制备和应用阵列的方法都可以被全部或者部分地整入，或者引入它们的变体，例如在下列文献中说明的：美国专利6,277,628；6,277,489；6,261,776；6,258,606；6,054,270；6,048,695；6,045,996；6,022,963；6,013,440；5,965,452；5,959,098；5,856,174；5,830,645；5,770,456；5,632,957；5,556,752；5,143,854；5,807,522；5,800,992；5,744,305；5,700,637；5,556,752；5,434,049；还例如，WO 99/51773；WO 99/09217；WO 97/46313；WO96/17958；还例如，Johnston(1998)Curr.Biol.8：R171-R174；Schummer(1997)Biotechinques 23：1087-1092；Kern(1997)Biotechniques 23：120-124；Solinas-Toldo(1997)Genes，Chromosomes&Cancer 20：399-407；Bowtell(1999)Nature GeneticsSupp.21：25-32。也参见公布的美国专利申请20010018642；20010019827；20010016322；20010014449；20010014448；20010012537；20010008765。

抗体和基于抗体的筛选方法

本发明提供了分离的或重组的抗体，所述抗体与本发明的淀粉酶特异性结合。这些抗体可用于分离、鉴定或定量本发明的淀粉酶或相关的多肽。这些抗体可用于分离本发明范围内的其它多肽，或其它相关的淀粉酶。这些抗体被设计成与淀粉酶的活性位点结合。因此，本发明提供了使用本发明的抗体抑制淀粉酶的方法。

抗体可以在免疫沉淀、染色、免疫亲合柱以及类似的程序中被应用。如果需要的话，编码特异抗原的核酸序列可以通过免疫方法获得，随后分离出多肽或核酸，进行扩增或克隆，将多肽固定在本发明的阵列上。可供选择的，本发明的方法可以用于修饰由细胞产生的待修饰的抗体的结构，如，抗体的亲和性可以增加或者降低。而且，制备或修饰抗体的能力可以是通过本发明的方法来为细胞设计的表型。

免疫接种、产生和分离抗体(多克隆的或单克隆的)的方法是本领域技术人员所了解的，并且在科学和专利文献中有描述，参见，如，Coligan，CURRENTPROTOCOLS IN IMMUNOLOGY，Wiley/Greene，NY(1991)；Stites(eds.)BASICAND CLINICAL IMMUNOLOGY(第7版)Lange Medical Publications，Los Altos，CA(“Stites”)；Goding，MONOCLONAL ANTIBODIES：PRINCIPLES ANDPRACTICE(第2版)Academic Press，New York，NY(1986)；Kohler(1975)Nature256：495；Harlow(1988)ANTIBODIES，A LABORATORY MANUAL，Cold SpringHarbor Publications，NewYork。除了使用动物的传统的体内方法外，抗体也可以在体外产生，例如，应用表达重组抗体结合位点的噬菌体展示文库。参见如，Hoogenboom(1997)Trends Biotechnol.15：62-70；Katz(1997)Annu.Rev.Biophys.Biomol.Struct.26：27-45。

多肽或肽可用于产生与本发明的多肽例如淀粉酶特异性结合的抗体。所得到的抗体可以在免疫亲和层析方法中使用，以分离或纯化多肽或确定生物样品中是否存在多肽。在这样的方法中，蛋白制剂，如提取物，或生物样品与抗体接触，所述抗体能与本发明的多肽之一特异结合。

在免疫亲和方法中，抗体被附着在固相支持物上，如珠子或其它柱基材。蛋白制剂与抗体接触放置，条件是在其中抗体与本发明的多肽之一特异结合。在洗涤去除非特异结合的蛋白后，洗脱出特异性结合的多肽。

生物样品中蛋白与抗体结合的能力可以使用本技术领域的普通技术人员熟悉的多种方法中的任意一种方法确定。例如，结合可以通过用可检测标记如荧光试剂、酶标记物或放射性同位素对抗体进行标记来确定。可以选择地，抗体与样品的结合可以使用其上具有这样的可检测标记物的二抗来检测。特定的测定法包括ELISA测定法、夹心测定法、放射免疫测定法和Weatern印迹。

针对本发明的多肽而产生的多克隆抗体可以通过将多肽直接注入到动物或通过将多肽施用到非人动物上来获得。如此获得的抗体然后将结合多肽本身。以这样的方式，甚至编码多肽的仅仅一个片段的序列可以用于产生可能与整个天然多肽结合的抗体。这样的抗体然后被用于从表达那个多肽的细胞中分离多肽。

为了制备单克隆抗体，可使用通过连续细胞系培养来产生抗体的任何技术。实例包括杂交瘤技术、trioma技术、人B细胞杂交瘤技术和EBV-杂交瘤技术(Cole等人，1985，in Monoclonal Antibodies and Cancer Therapy，Alan R.Liss，Inc.，pp.77-96)。

所描述的用于产生单链抗体的技术(例如参见美国专利4,946,778)可以适于产生针对本发明多肽的单链抗体。可以选择地，转基因小鼠可用于表达针对这些多肽或其片段的人源化抗体。

针对本发明多肽产生的抗体可以在从其它生物体和样品中筛选类似多肽(例如淀粉酶)的方法中使用。在这样的技术中，来自生物体的多肽与抗体接触，并检测那些特异性结合抗体的多肽。上面所描述的任何方法可以用于检测抗体结合。

试剂盒

本发明提供了试剂盒，其包括组合物，如本发明的核酸、表达序列盒、载体、细胞、转基因种子或植物或植物部分、多肽(例如淀粉酶)和/或抗体。正如此处所描述的，这些试剂盒也可以含有教导本发明的方法学和工业应用的指导材料。

测定代谢参数

本发明的方法提供了细胞的全细胞进化或全细胞工程，其通过修饰细胞的遗传组成来开发具有新表型的新的细胞株，例如具有新的或修饰的淀粉酶活性的细胞株。遗传组成可通过加入本发明的核酸到细胞中来改变。为了探测新的表型，以“实时”或“在线”的时间方式监测被修饰的细胞的至少一种代谢参数。一发面，多个细胞，如细胞培养物被“实时”或“在线”监测。一方面，“实时”或“在线”监测多个代谢参数。代谢参数可以应用本发明的淀粉酶来监测。

代谢流分析(MFA)是以已知的生物化学框架为基础。以质量守恒定律和细胞内代谢的假稳态假说(PSSH)为基础，构建线性独立代谢矩阵。在实践本发明的方法时，建立代谢网络，包括：

●所有途径底物、产物和中间代谢物的特性，

●使途径代谢物互变的所有化学反应的特性，途径反应的化学计量学，

●催化反应的所有酶的特性，酶反应动力学，

●途径组分之间的调控性相互作用；如变构效应相互作用，酶-酶相互作用等，

●酶或者酶的任何其它超大分子组织在细胞内的区室化，以及，

●任何浓度梯度的代谢物、酶或者效应分子的存在，或者它们运动的扩散障碍。

一旦针对给定的细胞株建立了代谢网络，如果在线代谢数据可用，那么可以通过矩阵概念引入数学表达来评估细胞内的代谢流。代谢表型依赖于细胞内整个代谢网络的变化。代谢表型依赖于途径利用对环境条件、遗传调控、发育状态和基因型等等作出的变化。在本发明方法的一个方面，当计算了在线MFA之后，通过研究所述的途径利用来分析细胞的动力学行为、它们的表型和其它性质。例如，在酵母发酵中，如果葡萄糖供应增加，氧气减少，呼吸途径的利用将会降低和/或者停止，而发酵途径的利用将占优势。在所述的途径分析之后，细胞培养物的生理状态的控制将成为可能。通过确定如何改变底物供给、温度、诱导物的使用等来控制细胞的生理状态朝着所需的方向进行，本发明的方法可以有助于确定如何操纵发酵。在实践本发明的方法时，MFA的结果也可以与转录物组(transcriptome)和蛋白质组(proteome)的数据比较，设计实验和方案用于代谢工程或者基因重排等等。

在实践本发明的方法时，可以产生和检测到任何修饰的或者新的表型，包括在细胞中新的或者改进的特征。可以监测代谢或生长的任何方面。

监控mRNA转录物的表达

在本发明的一个方面，工程改造得到的表型包括增加或降低mRNA转录物(例如淀粉酶信息)的表达，或在细胞中产生新的(例如淀粉酶)转录物。增加或降低的表达可以通过测试本发明的淀粉酶的存在或通过淀粉酶活性分析来跟踪。mRNA转录物或信息，也可以通过本技术领域已知的任何方法来检测和量化，包括Northern印迹、定量扩增反应、与阵列的杂交，以及类似的方法。定量扩增反应包括，例如定量PCR，例如包括定量逆转录聚合酶链式反应或RT-PCR；定量实时RT-PCR，或“实时动力学RT-PCR”(例如参见Kreuzer(2001)Br.J.Haematol.114：313-318；Xia(2001)Transplantation 72：907-914)。

在本发明的一方面，工程改造得到的表型是通过敲除同源基因的表达产生。可以敲除所述基因的编码序列或者一个或多个转录控制元件，如启动子或者增强子。这样，转录物的表达可以完全去除或者降低。

在本发明的一方面，工程改造得到的表型包括增加同源基因的表达。这可以通过敲除负调控元件或者诱变正调控元件而实现，负调控元件包括以顺式或反式起作用的转录调控元件。细胞的一种或多种或所有的转录物可以通过阵列上的固定化核酸与样品的杂交来测定，所述样品包含细胞转录物、或代表细胞转录物的核酸、或与细胞转录物互补的核酸。

监控多肽、肽和氨基酸的表达

在本发明的一方面，工程化改造得到的表型包括增加或降低多肽(如淀粉酶)的表达或者在细胞内产生新的多肽。这一增加或者减少的表达可以通过确定存在的淀粉酶的量或者通过淀粉酶活性分析来跟踪。也可以通过本领域任何已知的方法来检测并定量多肽、肽和氨基酸，所述方法包括，如，核磁共振(NMR)、分光光度测定法、射线照像术(蛋白放射性标记)、电泳、毛细管电泳、高效液相色谱(HPLC)、薄层色谱(TLC)、超扩散色谱，各种免疫学方法，如，免疫沉淀、免疫扩散、免疫电泳、放射性免疫分析(RIA)、酶联免疫吸附分析(ELISA)、免疫荧光分析，凝胶电泳(如，SDS-PAGE)、用抗体染色、荧光激活的细胞分选器(FACS)、热分解质谱、傅立叶转换红外光谱测定、拉曼光谱、GC-MS和LC-电喷以及cap-LC-串联-电喷质谱，已经类似的方法。应用这些方法或它们的变体也可以筛选新的生物活性，在美国专利6,057,103中有说明。而且，正如以下详细讨论的，可以应用蛋白阵列测定细胞的一个或多个或所有的多肽。

工业应用

去污剂组合物

本发明提供了包含本发明的一种或多种多肽的去污剂组合物，所述多肽例如本发明的淀粉酶，如α淀粉酶、葡糖淀粉酶等等，以及制造和应用这些组合物的方法。本发明包括了制造和使用去污剂组合物的所有方法，例如参见美国专利6,413,928；6,399,561；6,365,561；6,380,147。去污剂组合物可以是单组分和双组分的含水组合物、不含水的液体组合物、铸型固体、粒状形式、颗粒形式、压缩片剂、凝胶和/或糊状和浆状形式。本发明也提供了使用这些去污剂组合物快速去除油腻的食物类污垢、食物残渣的薄膜和其它小的食物组合物的方法。本发明的淀粉酶有助于通过淀粉多糖的催化水解去除淀粉污渍。本发明的淀粉酶可以在纺织品洗涤去污剂中、洗碗用洗涤剂中使用。

实际的活性酶含量依赖于去污剂组合物的制造方法，该含量不是关键性的，只要去污剂溶液具有期望的酶活性。一方面，最终溶液中存在的淀粉酶的量在每克去污剂组合物中从大约0.001mg到0.5mg之间变化。选择用于该方法和本发明的产品的具体酶依赖于最终的使用条件，包括产品的物理形式、使用时的pH、使用温度和将被降解或改变的污垢类型。可以对酶进行选择以针对给定的一组使用条件提供最佳的活性和稳定性。一方面，本发明的淀粉酶在pH从大约4到大约12的范围内具有活性，在大约20℃到大约95℃的温度范围内具有活性。本发明的去污剂可以包括阳离子、半极性非离子或两性离子表面活性剂；或其混合物。

本发明的淀粉酶可以被配制成粉末或液体去污剂，pH在4.0到12.0之间，重量百分比为大约0.01％到大约5％(优选0.1％到0.5％)的水平。这些去污剂组合物也包括其它酶，如已知的淀粉酶、纤维素酶、脂肪酶或内切糖苷酶，以及增洁剂和稳定剂。向传统的洗涤组合物中添加本发明的淀粉酶不会造成任何特殊的应用限制。换句话说，适合去污剂的任何温度和pH都适用于本发明的组合物，只要pH在上述范围内，并且温度低于所描述的酶的变性温度。另外，本发明的淀粉酶可用于不需要去污剂的洗涤剂中，单独应用或与增洁剂和稳定剂联合应用。

本发明提供了洗涤组合物，包括用于洗涤硬表面的去污剂组合物、用于洗涤织物的去污剂组合物、洗碗用组合物、口腔清洗组合物、假牙清洗组合物和隐型眼镜洗涤溶液。

一方面，本发明提供了用于洗涤物体的方法，包括使物体在足以洗涤的条件下接触本发明的多肽。一方面，在去污剂中使用本发明的多肽(例如碱性活性淀粉酶)，例如作为去污剂添加剂。本发明的去污剂组合物可以，例如被配制成包含本发明多肽的手洗或机洗用去污剂组合物。本发明的去污剂组合物包括洗衣和洗碗(例如自动洗碗)溶液和应用。适合于预处理带污渍的织物的洗衣添加剂可以含有本发明的多肽。织物柔顺剂组合物可以含有本发明的多肽。可以选择地，本发明的多肽可以被配制为去污剂组合物，以用于通常的家庭硬表面洗涤操作。在可选择的方面，本发明的去污剂添加剂和去污剂组合物可以包含一种或多种其它的酶，例如淀粉酶、脂肪酶、角质酶、别的淀粉酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶，例如乳糖酶和/或过氧化物酶。对本发明的(一种或多种)酶的性质进行选择，以使其与所选择的去污剂相容(即，与最适pH、与其它酶和非酶成分相容等等)，所述的酶以有效量存在。一方面，本发明的淀粉酶被用于从织物中去除恶臭物质。可以在本发明的实践中使用的各种去污剂组合物和制造它们的方法已经有描述，例如美国专利6,333,301；6,329,333；6,326,341；6,297,038；6,309,871；6,204,232；6,197,070；5,856,164。

处理织物

本发明提供了使用本发明的一种或多种多肽处理织物的方法。本发明的多肽可以在任何织物处理方法中使用，这些方法在本技术领域是已知的，例如参见美国专利6,077,316。一方面，织物的手感和外观通过包括用本发明的淀粉酶在溶液中接触织物的方法得到改进。一方面，用溶液在压力下处理织物。

一方面，本发明的酶在织物的编织过程中或之后应用，或在退浆阶段应用，或在一个或多个其它的织物处理步骤中应用。在织物的编织过程中，线被施加相当大的机械张力。在机械织布机上进行编织之前，经纱通常用上浆淀粉或淀粉衍生物涂覆，以便提高它们的拉伸强度并防止断裂。本发明的酶可用于去除这些上浆淀粉或淀粉衍生物。在纺织品已经编织好之后，织物继续进行到脱浆阶段。随后可以是一个或多个额外的织物加工步骤。脱浆是从纺织品中去除“浆料”的作用过程。在编织之后和进一步加工织物之前，必须去除浆料涂层，以便确保均匀且耐水的效果。本发明提供了一种脱浆方法，包括通过本发明酶的作用对“浆料”进行酶作用处理。

本发明的酶可作为去污剂添加剂对织物进行脱浆，所述织物包括含棉织物，所述酶可以例如在含水组合物中。本发明提供了在靛类染色的粗斜纹棉布织物和衣服上产生砂洗外观的方法。对于服装制造，织物可以被剪裁并缝纫为衣料或服装，这些在后来完成。尤其是，对于粗斜纹布牛仔裤的制造，已经开发了不同的酶加工方法。粗斜纹棉布服装的整理(finishing)通常从酶脱浆步骤开始，在该步骤中服装经受淀粉分解酶的作用，以便给织物提供柔软性，使得棉织物更易于进行后面的酶促整理步骤。本发明提供了使用本发明的淀粉酶加工粗斜纹棉布服装(例如“生物-磨光方法(bio-stoning process)”)、酶促脱浆并给织物提供柔软性的方法。本发明提供了在脱浆和/或整理过程中快速软化粗斜纹棉布服装的方法。

食物和食品加工：淀粉的液化

本发明的酶在食品加工行业具有多种应用。本发明的淀粉酶被用于淀粉到果糖的加工。淀粉到果糖的加工可以包括四个步骤：颗粒淀粉的液化、液化淀粉到右旋葡萄糖的糖化、纯化、异构化为果糖。

本发明提供了使用本发明所述酶的淀粉液化的方法。淀粉聚合物颗粒的浓缩悬液被转化为低粘度的可溶的较短链长的糊精的溶液。该步骤对于标准设备的便利处理以及到葡萄糖或10³其它糖的有效转化是有用的。一方面，颗粒淀粉的液化通过将颗粒淀粉的温度升高到超过72℃使颗粒凝胶化来实现。加工过程瞬间地破坏了不可溶的淀粉颗粒，从而产生了水溶性淀粉溶液。然后溶解的淀粉溶液通过本发明的淀粉酶来液化。因此，本发明提供了使用本发明所述淀粉酶的酶促淀粉液化过程。

图26、图27和图28示意性说明了本发明的可选择的示例性淀粉加工，包括淀粉液化加工(使用本发明的至少一种酶)。例如，图26示意性说明了本发明的示例性淀粉液化过程，包括用蒸汽处理淀粉浆状物(例如具有大约30％到35％的固体)以完成初步液化(例如在大约105℃处理大约5分钟)，注入到闪蒸罐(flashtank)中，随后进行二次液化(例如在大约90℃到95℃，大约90分钟)，这些步骤的每一步骤或一个步骤涉及使用本发明的酶。图27示意性说明了本发明的另一个示例性淀粉液化过程，包括在大约pH 4到pH 5之间，例如在pH 4.5处理淀粉浆状物，调节pH，加入钙，在大约pH 5到pH 6之间例如pH 5.4，在大约95℃使用本发明的α淀粉酶进行液化，随后再次调节pH和温度在大约pH 4到pH 5之间例如pH 4.5，在大约60℃到65℃之间的温度下使用本发明的葡糖淀粉酶进行糖化。图28示意性说明了本发明的另一个示例性淀粉加工过程，包括在大约pH 4到pH5之间例如在pH 4.5，处理淀粉浆状物(任选地调节pH，加入钙)，使用本发明的α淀粉酶和/或葡糖淀粉酶，在大约pH 4到pH 5之间例如在pH 4.5，在大于大约90℃或大于大约95℃的温度下，进行组合液化-糖化，随后在大约pH 4到pH 5之间例如在pH 4.5，在大约60℃到65℃之间的温度下，使用本发明的葡糖淀粉酶再次调节pH和温度。一方面，本发明的组合液化-糖化是一个“单罐(one-pot)”过程。一方面，整个过程是一个“单罐”过程。这些过程中的任何一个过程，和这些步骤中的任何一个步骤，也可以包括或可以进一步包括本发明的另一种酶(例如葡糖苷酶如α-1，6-葡糖苷酶、麦芽糖酶等等)，或另一种酶如支链淀粉酶或异构酶。

示例性的酶促液化过程涉及将颗粒淀粉浆状物的pH调节到6.0到6.5之间，加入氢氧化钙、氢氧化钠或碳酸钠。一方面，加入氢氧化钙。这提供了钙离子，从而稳定本发明的葡糖淀粉酶，避免其失活。一方面，一旦加入了淀粉酶，通过蒸气喷嘴泵出悬液，以便将温度瞬间地提高到80℃到115℃之间。一方面，淀粉被立即凝胶化，并且由于存在淀粉酶，通过淀粉酶对α-1，4-糖苷键的随机水解它被解聚为流体物质。该流体物质易于泵抽。

本发明提供了使用本发明的淀粉酶的多种酶促淀粉液化过程。在本发明的液化过程的一个方面，淀粉酶被加入到淀粉悬液中，并且将悬液的温度保持在80-100℃，以便部分地水解淀粉颗粒。一方面，部分水解的淀粉悬液被泵出通过喷嘴，温度超过大约105℃，以便使任何剩余的颗粒结构完全凝胶化。一方面，在凝胶化淀粉冷却后，再次加入淀粉酶，以进一步水解淀粉。

本发明提供了用于水解液体淀粉(液化的淀粉)和颗粒淀粉的酶和过程。这样的淀粉可以来源于任何来源，例如玉米、小麦、蜀黍、高梁、黑麦或bulgher。本发明适合于在液化中有用的任何谷物淀粉来源，例如已知产生适合于液化的淀粉的任何其它谷物或蔬菜来源。本发明的方法包括液化来自任何天然材料的淀粉，所述的天然材料例如稻、发芽水稻、玉米、大麦、蜀黍、小麦、高梁和甘薯。液化过程可以充分地水解淀粉以产生糖浆。液化的温度范围可以是已知在液化淀粉中有效的任何液化温度。例如，淀粉的温度可以在大约80℃到大约115℃之间，在大约100℃到大约110℃之间，以及大约105℃到大约108℃之间。在可以选择的方面，在这些方法中使用的淀粉酶在这些温度下具有活性，例如在大约80℃到大约115℃之间，在大约100℃到大约110℃之间，以及从大约105℃到大约108℃之间是有活性的。

本发明提供了液化糖化的方法，正如图17中示意性说明的。一方面，本发明的α-淀粉酶在所示意的液化步骤中使用(一些当前的工业方法使用地衣芽孢杆菌α-淀粉酶)。一方面，该过程在大约pH 6.0在大约95℃到105℃之间的任何温度下发生，时间长度在大约0.5到5小时之间的任何时间长度，例如60、90或120分钟。一方面，在玉米浸泡过程中，在液化之前，加入纤维素酶、蛋白酶和/或蛋白硫代还原酶。

在本发明的液化过程的一个方面，加入在大约pH 4.5(或在大约pH 5和pH 5之间的任何pH)具有活性的本发明淀粉酶，该酶可以依赖或不依赖Ca²⁺。在该过程的开始部分不加入盐，则免去了在该过程的后面部分去除这些盐的必要。在本发明的液化过程的一个方面，使用了更有活性的淀粉酶。这可以允许降低所需要的酶的量。一方面，在相同的罐中进行液化和糖化，作为一个“单罐过程”，例如在包括大约90℃到95℃(或大约80℃到105℃之间的任何温度)的条件下进行，该过程为一个大约3小时的过程(或持续大约1到5小时的过程)。在该方面，酶工作量可以再次减半。

在本发明的糖化过程的一个方面，使用了本发明的葡糖淀粉酶。一方面，本发明的葡糖淀粉酶在所示意的糖化步骤中使用(一些当前的工业方法使用黑曲霉葡糖淀粉酶)。一方面，该过程在大约pH 4.5，在大约60℃到62℃的温度范围内(或在大约50℃到72℃，或大约40℃到80℃之间的任何温度下)发生，该过程持续大约12到96小时或更多个小时。在本发明的糖化过程的一个方面，使用本发明的葡糖淀粉酶以便在糖浆中产生更高水平的葡萄糖。一方面，加入其它酶，例如支链淀粉酶以增加葡萄糖的量。

一方面，本发明的淀粉酶在所示意的异构化步骤中使用(一些当前的工业方法使用链霉菌某种(Streptomyces sp.)葡萄糖异构酶)。一方面，本发明的异构化反应在如下条件下发生：包括大约pH 5到pH 10之间的任何pH，或大约pH 6到pH 9之间的任何pH，大约pH 7.0到pH 8.5之间的任何pH。一方面，本发明的异构化反应在包括大约40℃到75℃之间，或大约50℃到65℃之间，或大约55℃到60℃之间的温度的条件下发生。

在本发明的异构化过程的一个方面，使用了木糖异构酶。一方面，在该反应中使用了钴(一些已知的热稳定葡萄糖异构酶要求使用钴)。一方面，使用了对钴缺乏依赖性或具有较低依赖性的本发明的酶。一方面，使用了在较低pH例如pH7.0、pH 6.5、pH6、pH 5.5、pH 4.5、pH 4、pH 3.5或更低pH下具有活性的本发明的酶，或者在例如大约pH 3.5到7.0之间具有活性的酶。一方面，这允许形成较少的颜色(否则，过量颜色可能必需被去除)。一方面，提高异构化过程中的温度，例如提高到大约80℃到110℃之间、大约85℃到105℃之间或大约90℃到100℃之间。这可以增加所产生的果糖的量，例如增加到大约51％。然而，一方面，对于苏打(例如软饮料以及类似物)，果糖水平可以在大约45％到65％之间，或50％到60％之间，例如大约55％。

一方面，在本发明的过程中使用的一种或一些或所有酶(包括本发明的酶)被固定化，例如固定在任何表面上，例如平的表面或酶柱上，例如固定在阵列、珠子、纤维、孔、毛细管和类似物上。一方面，通过被固定化，这些酶可以被再次使用。

一方面，本发明提供了使用本发明的至少一种酶的“酶混合物(enzymecocktails)”。一方面，在本发明的过程中使用“酶混合物”，例如包括在图17所示意性说明的液化糖化方法中使用“酶混合物”。例如，一方面，使用了细胞壁降解酶(CWDE)，例如，将其用于织物、纸浆和纸以及本发明的洗衣过程，所述酶包括例如纤维素酶、半纤维素酶、木聚糖酶、半乳甘露聚糖酶、葡甘露聚糖酶、阿拉伯呋喃糖苷酶以及其它酶的组合。一方面，在本发明的过程中使用的用于生物漂白(例如纸浆和纸、洗衣过程)的“酶混合物”包括漆酶、过氧化物酶、氧化酶以及类似酶的组合。一方面，将细胞壁降解酶与生物漂白酶和本发明的酶进行组合，以降解植物细胞壁从而释放有色物质。

产生高MW葡聚糖糖浆的过程

本发明提供了使用本发明的酶产生高MW葡聚糖糖浆的过程，包括用于产生MW集中在大约20,000MW处的寡糖的方法。一方面，使用古细菌来源的本发明的淀粉酶，其包括SEQ ID NO：80(由SEQ ID NO：79编码)、SEQ ID NO：82(由SEQ ID NO：81编码)、SEQ ID NO：116(由EQ ID NO：115编码)、SEQ ID NO：323(由SEQ ID NO：322编码)、SEQ ID NO：570(由SEQ ID NO：169编码)的古细菌来源的淀粉酶，以及与这些古细菌淀粉酶具有相同活性的本发明的酶，它们被用来液化含淀粉例如玉米淀粉的组合物，以产生集中在大约20,000MW处的寡糖类型(芽孢杆菌淀粉酶将产生含有具有更高MW的片段的糖浆，并且在糖化过程中高MW寡糖没有通过葡糖淀粉酶完全转化为葡萄糖，所述葡糖淀粉酶例如曲霉菌葡糖淀粉酶)。

使用古细菌来源的本发明的淀粉酶来催化含淀粉例如玉米淀粉的组合物的水解，产生了大约20,000MW的片段。这些大约20,000MW片段可以快速并且充分地转化为葡萄糖。因此，一方面，由芽孢杆菌淀粉酶液化产生的糖化糖浆所含的右旋糖，比使用本发明的淀粉酶的液化产生的糖化糖浆所含的右旋糖少。

产生同质麦芽糊精的过程

本发明提供了使用本发明所述酶产生同质麦芽糊精的过程。通过本发明的方法产生的同质麦芽糊精可以在多种食物、药物和包衣应用中使用。一方面，古细菌来源的本发明的淀粉酶，其包括SEQ ID NO：79、SEQ ID NO：80、SEQ ID NO：81、SEQ ID NO：82、SEQ ID NO：115、EQ ID NO：116、SEQ ID NO：322、SEQ ID NO：323的古细菌淀粉酶以及与这些古细菌淀粉酶具有相同活性的本发明的酶，可以产生高度均匀的麦芽糊精组合物(使用酸或酶来水解淀粉的传统制造过程导致产生广泛的、典型的双峰式MW分布的寡糖)。通过本发明的方法产生的同质麦芽糊精具有较纯的MW分布，它们可以在多种含麦芽糊精的产品中使用，导致更低的粘度、透明的(无模糊不清的)溶液、更好的包衣特性、更好的膜形成特性以及类似特性。

一方面，古细菌来源的本发明的淀粉酶(以及与这些古细菌淀粉酶具有相同活性的本发明的酶)被用于液化玉米淀粉，以产生均匀的含麦芽糊精的组合物。一方面，液化在大约pH 4.5到大约pH 6.5之间的pH，例如pH 5.0或5.5，在高达大约105℃的温度下进行。均匀的麦芽糊精组合物可以在大约5到高达大约20的DE范围内产生。通过本发明的这些古细菌来源的淀粉酶产生的糖浆可以被过滤、用木炭和/或喷雾干燥处理，以得到含有麦芽糊精的产物。

酶促干磨过程

本发明提供了使用本发明的酶的酶促干磨过程。在干磨法中，全谷物被磨碎，并且与水混合。胚芽通过漂浮分离或等价技术任选地去除。所得到的混合物使用淀粉酶液化，该混合物含有淀粉、纤维、蛋白质和谷物的其它组分。一方面，酶促液化在比本文讨论的淀粉液化过程低的温度下进行。一方面，在凝胶化后，在存在淀粉酶的情况下将淀粉溶液保持在高温下，直到DE达到10-20。一方面，该时间期间为大约1-3小时。葡萄糖当量(DE)是测量总还原糖的浓度的工业标准，以基于干重量算出的D-葡萄糖来计算。未水解的颗粒淀粉的DE实际上为零，而D-葡萄糖的DE被定义为100。

酶促湿磨过程

本发明提供了湿磨过程，例如玉米湿磨法，其中使用了本发明的酶，例如淀粉酶。玉米湿磨法是产生玉米油、面筋粉、麸质饲料和淀粉的过程。因此，本发明提供了使用本发明的酶生产玉米油、面筋粉、麸质饲料和淀粉的过程。一方面，在淀粉液化中使用本发明的碱性淀粉酶。一方面，在糖化中使用本发明的葡糖淀粉酶以产生葡萄糖。图25示意性说明了本发明的示例性玉米湿磨过程(使用本发明的至少一种酶)。图25示意性说明了本发明的示例性的产生玉米油的过程，包括浸泡、去除胚芽、去除纤维和麸皮分离，随后使用本发明的酶(例如α淀粉酶)进行液化，并使用本发明的酶(例如葡糖淀粉酶)进行糖化。

一方面，对玉米(谷粒，包括外种皮(纤维)、淀粉、淀粉和葡萄糖的组合以及内胚芽)进行四步骤加工，该加工过程导致产生了淀粉。一方面，将玉米浸泡、去除胚芽、去除纤维，并且分离麸皮。在浸泡过程中，去除可溶物。将去除可溶物后剩余的产物去除胚芽，从而导致产生了玉米油，并且产生了油渣，将油渣加入到浸泡步骤的可溶物中。将剩余产物去除纤维，将纤维固体加入到油渣/可溶物混合物中。纤维固体、油渣和可溶物的混合物形成了麸质饲料。在去除纤维后，对剩余产物进行麸质分离。该分离产生了面筋粉和淀粉。然后对淀粉使用本发明的多肽进行液化和糖化，以产生葡萄糖。

图25示意性说明了本发明的一个示例性的玉米湿磨过程(使用本发明的至少一种酶)。图26、图27和图28示意性说明了本发明的可供选择的示例性淀粉加工过程，其包括淀粉液化过程(使用本发明的至少一种酶)。

抗不新鲜化的方法

本发明提供了使用本发明淀粉酶来抗(例如焙烤产品如面包)不新鲜化的方法。本发明提供了使用本发明的淀粉酶来减慢(焙烤产品的)碎屑硬度增加和碎屑弹性降低的方法。焙烤产品(如面包)的不新鲜化随着面包产品的生产时刻和消费时刻之间时间的增加，变得越来越严重。术语不新鲜化被用来描述消费者对面包产品在离开烤箱之后的性能方面所不期望的改变，如碎屑硬度的增加、碎屑弹性的降低以及外皮变得硬且坚韧。在储存达到一定时间后，碎屑的硬度进一步增加，这被认为是无益的。本发明的淀粉酶被用来延迟面包的不新鲜化，正如在例如美国专利6,197,352；2,615,810和3,026,205；Silberstein(1964)Baker’s Digest38：66-72中所描述的。

一方面，本发明的酶被用于延迟焙烤产品的不新鲜化，而不会将淀粉水解为支链糊精。支链糊精通过断裂由α-淀粉酶水解所产生的糊精的支链来形成，其不能用α-淀粉酶进一步降解。这可以在所得到的面包中产生粘性面包屑。因此，本发明提供了延迟焙烤产品(例如发酵的焙烤产品)的不新鲜化的过程，该过程包括在用于产生焙烤产品的面粉或面团中加入具有外切淀粉酶活性的本发明的酶。本发明的外切淀粉酶可以具有葡糖淀粉酶、β-淀粉酶(该淀粉酶以β-构型释放麦芽糖)和/或产麦芽糖淀粉酶活性。

本发明也提供了用于制备面团的方法或用该面团制备的焙烤产品，所述方法包括在面团中以可以有效延迟面包变得不新鲜的量加入本发明的淀粉酶。本发明也提供了包含所述淀粉酶的面团，以及包括面粉和所述淀粉酶的预混合物的面团。最后，本发明提供了一种酶促焙烤添加剂，其含有所述淀粉酶。

本发明也提供了一种高产率方法，其用于产生高品质玉米纤维胶，该方法通过用本发明的酶处理玉米纤维，随后进行过氧化氢处理，从而得到碾磨的玉米纤维的提取物来实现。例如参见美国专利6,147,206。

动物饲料和添加剂

本发明提供了使用本发明的淀粉酶处理动物饲料和添加剂的方法。本发明提供了包含本发明的淀粉酶的动物饲料和添加剂。一方面，使用本发明的淀粉酶处理动物饲料和添加剂可以有助于在动物饲料或添加剂中的淀粉的可利用度。这可以导致易于消化和易于吸收的糖的释放。

使用本发明的淀粉酶可以增加动物和鸟的消化能力。使用本发明的淀粉酶可以确保充足营养物供给的可利用率，以便获得更好的生长和表现。一方面，本发明的酶可以作为动物的饲料添加剂被加入。另一方面，动物饲料可以在动物食用之前用淀粉酶处理。另一方面，淀粉酶可以通过在转基因饲料作物(例如转基因植物、种子以及类似物)例如玉米中直接表达酶来供给。如上所讨论的，本发明提供了包含编码本发明多肽的核酸序列的转基因植物、植物部分和植物细胞。一方面，该核酸被表达，这样淀粉酶以可回收的量被产生。淀粉酶可以从任何植物或植物部分回收。可以选择地，含有重组多肽的植物或植物部分可以被使用，这样，可以提高食物或饲料的质量，例如提高营养价值、口味和流变性质，或者破坏抗营养的因子。

纸或纸浆处理

本发明的淀粉酶可以在纸或纸浆处理或纸脱墨中使用。例如，一方面，本发明提供了使用本发明的淀粉酶的纸处理方法。一方面，本发明的酶可以被用来修饰纸中的淀粉，从而将其转化为液化形式。另一方面，在化学和酶促脱墨过程中处理再循环影印纸的纸成分。一方面，本发明的淀粉酶可以与纤维素酶一起使用。纸可以通过如下三种方法来处理：1)在存在本发明的淀粉酶的情况下进行离解；2)用脱墨化学制品和本发明的淀粉酶进行离解，和/或3)在用本发明的淀粉酶浸透后进行离解。与仅仅用纤维素酶处理的纸相比，用淀粉酶处理的循环纸可以具有更高的亮度，这是由于去除了调色剂颗粒。尽管本发明不受任何特定机理的限制，但本发明的淀粉酶的效果可能是由于其在纸浆悬浮物中作为表面活性剂的结果。

本发明提供了使用本发明的一种或多种淀粉酶处理纸和纸浆的方法。本发明的淀粉酶可以在任何纸处理或纸浆处理方法中使用，这些方法在本技术领域是熟知的，例如参见美国专利6,241,849；6,066,233；5,582,681。例如，一方面，本发明提供了对含有染料的印刷纸进行脱墨和脱色的方法，包括使印刷纸变成浆状物，以得到纸浆，并在存在本发明淀粉酶(也可以加入其它酶)的情况下从纸浆中移去油墨。另一方面，本发明提供了增加纸浆的打浆度的方法，所述纸浆例如由再生纤维制成的纸浆，这可以通过将含有本发明的酶的酶促混合物(也可以含有其它酶，例如果胶酶)加入到纸浆中，在可引起反应的条件下进行处理，以产生酶促处理的纸浆。酶促处理的纸浆的打浆度相对于再生纤维纸浆的初始打浆度有所增加，光度没有损失。

再次制浆：木素纤维素材料的处理

本发明也提供了用于处理木素纤维素纤维的方法，其中所述纤维用本发明的多肽处理，所述多肽以足以改进纤维特性的量被使用。本发明的淀粉酶也可以在由淀粉强化废纸和纸板生产木素纤维素材料如纸浆、纸和硬纸板的过程中被使用，尤其是在再次制浆发生在pH高于7的场合，以及淀粉酶可以通过降解强化淀粉来促进废品离解的场合。本发明的淀粉酶可以在由淀粉涂覆的印刷纸制备造纸纸浆的过程中有用。该过程可以按照例如WO 95/14807中的描述进行。

一个示例性的方法包括分解纸以产生纸浆，在所述分解之前、分解过程中或分解之后用淀粉降解酶进行处理，并在分解和酶处理之后从纸浆中分离出油墨颗粒。也参见美国专利6,309,871和本文引述的其它美国专利。因此，本发明包括用于再循环纸浆的酶促脱墨的方法，其中多肽以足以有效地对纤维表面进行脱墨的量使用。

废物处理

本发明的酶可以在多种其它的工业应用中使用，例如用于废物处理。例如，一方面，本发明提供了使用本发明的酶的固体废物降解方法。这些方法可以包括减少基本上未处理的固体废物的质量和体积。固体废品可以在控制温度下在存在酶溶液(包括本发明的酶)的情况下用酶促降解方法处理。这导致的是一种不存在着由于添加微生物而产生的显著细菌发酵的反应。固体废物被转化为液化的废物和一些剩余的固体废物。所得到的液化废物可以与所述任何剩余的固体废物分离。例如参见美国专利5,709,796。

口腔护理产品

本发明提供了包含本发明淀粉酶的口腔护理产品。示例性的口腔护理产品包括牙膏、牙科乳剂、凝胶或牙粉、牙用产品、漱口剂、刷洗前或刷洗后润洗制剂、口香糖、糖块或糖果。例如参见美国专利6,264,925。

酿造和发酵

本发明提供了包含本发明的淀粉酶的啤酒酿造(例如发酵)方法。在一个示例性的方法中，含淀粉的原料被离解，并被加工以形成麦芽。本发明的淀粉酶可以在发酵过程中的任意阶段使用。例如，本发明的淀粉酶可以在大麦麦芽的加工中使用。啤酒酿造的主要原料是大麦麦芽。这可以是一个三阶段过程。首先，大麦谷物被浸渍以增加水含量，例如增加到大约40％左右。第二，所述谷物可以在15℃到25℃的温度孵育3到6天以便发芽，此时酶合成在赤霉素的控制下被刺激。淀粉酶水平在此期间显著上升。一方面，本发明的淀粉酶在该过程的这个(或任意其它)阶段加入。淀粉酶的作用导致可发酵的还原糖有所增加。这可以被表示为糖化力(diastatic power)，DP，在12℃糖化力可以在5天内从大约80上升到190。

本发明的淀粉酶可以在任何啤酒或酒精饮料生产方法中使用，例如美国专利5,762,991；5,536,650；5,405,624；5,021,246；4,788,066中所描述的。

在钻井和采矿操作中的使用

本发明也包括在油井和钻探作业例如煤气、石油或其它钻探或采矿作业中使用本发明的酶的方法。一方面，本发明的酶被用于增加来自地下形成物(subterranean formation)例如油井或矿井的生产流体(production fluids)的流动。一方面，本发明的酶被用来去除破坏性的粘性的含淀粉的流体，例如在生产作业过程中形成的流体。这些含淀粉流体存在于地下形成物中，这些地下形成物包围着整个井孔。一方面，本发明淀粉酶在油井钻探流体中使用，以协助运走钻探泥浆。

一方面，该方法包括允许(包含本发明的酶的)生产液体从井孔或矿井流出。该方法包括将来自形成物的生产流体的流动降低到预期流速以下，并通过将含水流体和本发明的多肽混合在一起配制成酶处理物。该方法可以包括将酶处理物泵入到井孔内或其它钻探井筒(shaft)内的期望位置，并且允许酶处理物降解粘性、含蛋白的、破坏性液体。该方法可以包括将液体从地下形成物中移出井或井筒的表面。一方面，酶处理物可以有效地攻击含淀粉流体中的α糖苷键。一方面，本发明的淀粉酶在矿井钻探、钻井(例如煤气或油井钻探)以及类似应用中使用，以运走钻探泥浆，例如在钻孔(井孔或井筒)的同时进行该过程。

本发明的酶可以在任何井、井筒或矿井钻探作业中使用，这些作业中的许多在本技术领域是熟知的。例如，本发明提供了将本发明的酶引入到含有石油和/或煤气的岩石形成物中的方法，所述酶一方面也可以包括油田或气田生产化学品，该方法包括将含有酶(以及——在一个方面——化学品)的微乳液通入到生产井中，然后通入到形成物中。一方面，生产井被进行“关进(shut-in)”处理，从而含有本发明的酶的含水组合物在压力下被注入到生产井中，并被“挤入”到形成物中，并被保持在那里。例如参见美国专利6,581,687。

一方面，在煤气、石油或其它钻探或采矿作业中使用的本发明的淀粉酶在高pH或低pH和/或高或低温度下具有活性，例如在这些过程中使用的本发明的淀粉酶在包括大约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5或pH 4或更低pH的条件下或者在包括大约pH 7、pH 7.5、pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5或pH 11或更高pH的条件下具有活性。一方面，在这些过程中使用的本发明的淀粉酶在包括大约0℃到大约37℃之间的任何温度下、或大约37℃到大约95℃或更高、或大约80℃到大约120℃，例如85℃、90℃、95℃、98℃、100℃、105℃、110℃、115℃、120℃或更高温度下具有活性。

延迟释放组合物

本发明提供了延迟释放或“控释”组合物，该组合物含有用胶乳聚合物例如乳胶涂料或等价物涂覆的期望成分。本发明的延迟释放/控释组合物可以包括任何期望组合物，包括酶或任何活性成分，包括小分子、药物、多糖、脂质、核酸、维生素、抗生素、杀虫剂和类似物。一方面，涂层在相对低的温度下不会容易地溶解，但在相对较高的温度下将分解从而释放出期望组合物(例如酶)。

本发明提供了用于延迟释放/控制释放的组合物的方法，其中该组合物用胶乳聚合物例如胶乳涂料或等价物来涂覆。

本发明的延迟释放/控释组合物和方法可以用于各种医疗和工业应用中，例如，一方面，本发明的延迟释放/控释酶组合物包括在增强的油回收作业的瓜尔压裂流体中涉及的酶。本发明的油田瓜尔降解应用由于涂层而变得更容易，该涂层在低温下不易于溶解，但在较高温度下将分解而释放出酶。

另一方面，本发明的延迟释放/控释酶组合物包括动物饲料或营养补充剂，包括例如酶、维生素、抗生素和/或其它食物、药物或营养补充剂。本发明的延迟释放/控释组合物上的涂层，保护动物饲料或营养补充剂中的这些活性化合物，使其免受成粒条件或胃消化的影响。

一方面，释放是温度激活的释放，例如期望的成分(例如酶)在高温下释放，例如在大约37℃到大约95℃或更高的温度下被释放，例如在85℃、90℃、95℃、98℃、100℃或更高的温度被释放。释放的速率通过施用到期望的成分例如含有期望成分的颗粒或基料上的“阻挡层”或胶乳聚合物的厚度或量来控制。因此，本发明提供了具有一定范围的厚度的胶乳聚合物或等价物的颗粒状物或基料，以及它们的应用方法。

本发明提供了延迟释放/控制释放酶组合物，例如，一方面，含有本发明的酶的延迟释放/控释酶组合物。一方面，本发明提供了酶(例如本发明的酶)、含有酶(例如本发明的酶)的颗粒状组合物，该组合物涂覆有胶乳聚合物例如胶乳涂料或等价物。一方面，本发明提供了制备延迟释放酶组合物的方法，包括用胶乳聚合物例如胶乳涂料或等价物涂覆酶(例如本发明的酶)或含有酶(例如本发明的酶)的颗粒组合物。一方面，本发明提供了制备延迟释放/控释组合物的方法，包括用胶乳聚合物例如胶乳涂料或等价物涂覆期望的化合物。

在延迟释放/控释组合物(例如延迟释放/控释酶组合物)以及本发明的方法中使用的胶乳聚合物，包括但不限于多种类型，例如下述类型：丙烯酸树脂；醇酸树脂；纤维素；苯并呋喃茚；环氧树脂；酯；碳氢化合物；顺丁烯二酸；三聚氰胺树脂；天然树脂；含油树脂；酚醛塑料；聚酰胺；聚酯；松香；硅树脂；苯乙烯；萜烯；尿素；氨基甲酸乙酯；乙烯树脂；以及类似物。在本发明的延迟释放组合物和本发明的方法中使用的胶乳聚合物也包括，但不限于，含有一种或多种下述单体的一种或多种均聚物或共聚物：(meth)丙烯酸酯；乙酸乙烯；苯乙烯；乙烯；氯乙烯；丁二烯；亚乙烯基氯；乙烯基支链烷烃羧酸(vinyl versatate)；乙烯基丙酸酯；叔丁基丙烯酸酯；丙烯腈；氯丁橡胶；顺丁烯二酸酯；反丁烯二酸酯；以及类似物，包括其增塑衍生物或其它衍生物。

在本发明的胶乳组合物中使用的胶乳聚合物的量不是关键性的，但可以是按照使用胶乳聚合物的已经良好建立的方法的任何数量。在可以选择的方面，干胶乳聚合物的量是总胶乳聚合物的至少1％，或从大约2％到大约50％，或从大约3％到大约40wt％(重量百分比)。本发明的胶乳组合物可以任选地含有其它组分，例如通常在胶乳组合物中使用的那些组分。这些其它组分包括，但不限于，一种或多种下述组分：溶剂如脂肪族或芳族烃、醇、酯、酮、乙二醇、乙二醇醚、硝基烷或类似物；颜料；填料、干燥剂；消光剂；增塑剂；稳定剂；分散剂；表面活性剂；增粘剂(viscosifier)，包括聚合物相关增稠剂、基于多糖的增稠剂等等；悬浮剂；流动控制剂；消泡剂；抗起皮剂；防腐剂；补充剂；镀膜助剂；交联剂；表面改进剂；腐蚀抑制剂；以及在胶乳组合物中有用的其它成分。一方面，具有改进的流变能力和稳定性的本发明的胶乳组合物根据已建立的方法通过将胶乳聚合物和多糖与水混合来提供。例如参见美国专利6,372,901；5,610,225。

一方面，在制备含有活性成分的本发明的颗粒状或含基质的组合物中，所述活性成分例如酶(例如本发明的酶)，其被胶乳聚合物例如胶乳涂料或等价物包衣，活性组合物(例如酶)包埋在颗粒物的内部(一方面，大部分或所有的活性成分(例如酶)包埋在颗粒物中。因此，苛性化学品可以被用于涂覆颗粒物或基质的表面，所述苛性化学品例如胶乳包衣，其可以是期望的活性的成分的失活剂。包衣的组成成分可以通过诸如热、酸、碱、压力、酶、其它化学品以及类似的试剂来分解，以便可以通过暴露给包衣降解试剂而触发期望的酶促活性被可控制地释放。

一方面，活性成分，例如酶(例如本发明的酶或其它酶，例如甘露聚糖酶)，被分散在玉米胚芽粗粉和/或玉米淀粉基质中(例如以颗粒物的形式)。该混合物(例如颗粒物)在室温(例如大约22℃)水中在10分钟内离解，释放出所有(100％)的活性成分，例如释放所有的酶促活性。该更高的温度下，释放的速率会增加。这对于许多应用来说，不是一个可接受的离解速率。

然而，作为本发明的延迟释放/控释组合物，即，当该混合物用胶乳聚合物例如胶乳涂料或等价物涂覆时，该混合物(例如颗粒物、基质)的离解被延迟。释放速率和程度可通过应用于颗粒物或基质的涂层(阻挡层)的厚度来控制。例如，涂覆后的颗粒在22℃的水中6小时后将仅仅释放30％的活性。在60℃，在90分钟内仅50％的酶被释放。在80℃，在1小时之内80％的酶被释放。

本发明将参考下面的实施例做进一步的描述；然而，应该理解到，本发明不限于这些实施例。

实施例

实施例1：热稳定的α-淀粉酶的鉴定和表征

下述实施描述了一种用于确定多肽是否在本发明的范围内的示例性方法。该实施例描述了本发明的新的酸性淀粉酶的鉴定。筛选程序在中性和低pH条件下进行。用来探索的靶标为从低pH样品产生的DNA文库。这一努力使得发现了具有降解淀粉能力的数百个克隆。DNA序列和生物信息分析将这些基因中的许多分类为以前没有被鉴定的淀粉酶。

生物化学研究

淀粉酶基因组克隆的生物化学分析表明，许多淀粉酶基因组克隆具有低于pH6的最适pH。通过在70℃、80℃、90℃或100℃孵育10分钟并且测量在pH 4.5的残余活性，来测试这些基因组克隆的裂解物的耐热性。在80℃的热处理后，保持＞50％活性的那些克隆被选择，用于进一步的分析。将这些克隆在90℃在pH 6.0和4.5孵育10分钟，测试在pH 4.5的残余活性(图5)。在该处理后，大量克隆保留了＞40％的活性。为了比较的目的，本发明的酶(“进化的”淀粉酶)SEQ ID NO：437(由SEQ ID NO：436编码)的残余活性，与第二代酶中最好的酶等价；SEQ IDNO：437的比活性更大。

在90℃pH 4.5进行热处理后，在室温、70℃和90℃在pH 4.5测量具有残余活性的克隆的热活性。表1显示，SEQ ID NO：87(嗜热脂肪芽孢杆菌淀粉酶)和SEQ ID NO：113(地衣芽孢杆菌淀粉酶)的水解速率在更高温度下有所降低，而随着温度升高到70℃，SEQ ID NO：125的速率在继续增加，在90℃仅仅降低了大约50％。

具有在SEQ ID NO：437(由SEQ ID NO：436编码)中所示的序列的示例性多肽是热稳定的，在不加入钙的情况下，在pH 4.5，在100℃25分钟后剩余50％活性。在存在40mg/L钙的情况下，在pH 4.5，在100℃60分钟后该示例性多肽保留了90％的活性。多肽SEQ ID NO：437的活性曲线在大约4.8到5.0的范围内。所加入的钙对于活性不是必需的。

当用35％甘油配制时，多肽SEQ ID NO：437可以成为pH 10的比重为1.1的浅棕色至黄色液体。它的α淀粉酶活性在大约110到115IAU^*/克(^*IAU＝INNOVASE^TM活性单位)之间。所用的一种分析方法包括4-硝基苯基-α-D-六-葡糖吡喃糖苷的水解(该相同方法可以用于确定酶是否在本发明的范围内)。

备选评价

基于90℃热处理后在pH 4.5的残余活性，当与地衣芽孢杆菌淀粉酶比较时在90℃的比活性和淀粉水解速率，将SED ID NO：125与SEQ ID NO：437的酶(“进化的”淀粉酶)在淀粉液化分析中进行比较。

表1	室温	70℃	90℃
				SEQ ID NO：87¹	1.25	1.43	0.33
SEQ ID NO：113²	3.3	1.9	0.39
				SEQ ID NO：125	1.9	47	19

表1显示了在pH 4.5和3个不同温度下，三个基因组克隆的染料标记的淀粉水解的速率(相对荧光单位/s)。¹嗜热脂肪芽孢杆菌淀粉酶，²地衣芽孢杆菌淀粉酶。

下表总结了本发明的选择出的示例性酶的平均相对活性(ARA)、耐热性、热稳定性、比活性和表达(单位/L)(例如，SEQ ID NO：125，126，是指具有在SEQID NO：126中所示序列的多肽，由SEQ ID NO：125编码，等等)：

A.R.A.是平均相对活性。A.R.A.是以淀粉酶在pH 4和pH 7.5之间的平均相对活性来计算的。

#每升表达的单位近似计算如下：(在回收的冻干粉末中存在的淀粉酶的总单位)/(发酵器中培养物的体积)

淀粉酶SEQ ID NO：437的评价

在多种条件下评价淀粉酶SEQ ID NO：437(由SEQ ID NO：436编码)。在下述方案中，N°2黄色马齿种玉米被用作淀粉来源。

液化

含有35％干燥固体(“DS”)的淀粉浆状物在95℃到119℃之间的多个温度下(例如在大约110℃)在pH 4.0到pH 5.6之间，进行5分钟的初步液化，酶浓度在0.2到0.8克/公斤(g/kg)淀粉DS之间，所加入的钙在0到30百万分之一(ppm)之间。二次液化包括在95℃进行120分钟。

糖化

使用35％干燥固体(“DS”)(淀粉浆状物)和葡糖淀粉酶AMG 300L(Novozymes A/S，Denmark)，在0.225AGU/克DS(AGU＝淀粉葡糖苷酶或葡糖淀粉酶，单位)，pH 4.3，60℃44小时，对糖化进行初步测试。

淀粉酶SEQ ID NO：437被证明在上述pH条件下是有用的，是不依赖于钙的，具有高的热稳定性。一方面，本发明的淀粉酶SEQ ID NO：437或别的淀粉酶以0.5到0.7kg/MT DS淀粉的剂量被使用。

本发明提供了使用本发明的酶制备营养性甜味料的方法，例如包括上面描述的液化和糖化方案的过程，其中使用例如本发明的淀粉酶SEQ ID NO：437或另一种酶。一方面，本发明的酶在这些方法中的剂量范围在大约0.5到0.7克/kg淀粉DS之间，大约110℃的喷射温度(例如使用蒸气加压锅)，pH 4.5，不加入钙。

干磨乙醇生产

本发明提供了用于干磨乙醇生产的方法，其中使用了本发明的酶，所述酶例如本发明的淀粉酶SEQ ID NO：437，或本发明的另一种酶。

在对干磨乙醇生产——尤其是干磨玉米面粉的液化——中使用的本发明的酶进行评价时，台式反应器被用于商业干磨来源的玉米面粉。TERMAMYL^TMSC(Novozmes A/S，Denmark)淀粉酶被用作竞争基准。测试发现最适条件为85℃，pH 5.7。研究了五个独立变量：温度(范围在80℃到100℃之间)，酶剂量在0.2到1.0g/kg淀粉之间，pH在4.4到6.0之间，钙范围在0ppm到200ppm之间，循环涡流(recycled backset)在大约0％到40％之间。

与TERMAMYL^TM SC(Novozmes A/S，Denmark)淀粉酶在其最适条件——包括在85℃——下的作用相比，淀粉酶SEQ ID NO：437在95℃更快地降低干磨玉米面粉的粘度。淀粉酶SEQ ID NO：437降低粘度的速率主要受酶剂量和温度的影响。发现最适范围在0.4到0.6g/kg淀粉之间，最适温度为95℃。与TERMAMYL^TM SC(Novozmes A/S，Denmark)淀粉酶在pH 4.4到5.6之间相比，淀粉酶SEQ IDNO：437在更低pH和更高温度下有效。钙的加入对95℃时粘度降低的速率的影响很小。在存在30％循环涡流(例如兑稀釜馏物，底锅水＝回到液化过程的循环副产物)的情况下，淀粉酶SEQ ID NO：437是有效的。图29显示了总结这些发现的数据，其中将干磨乙醇加工中的淀粉酶SEQ ID NO：437与TERMAMYL^TM SC(Novozmes A/S，Denmark)淀粉酶进行比较。

在其它的方面，在干磨乙醇加工中使用淀粉酶SEQ ID NO：437可以提供操作上的便利优势，例如：快速降低浆状玉米面粉的粘度，增加溶解固体，增加在可能没有额外资金投入的情况下的生产能力；相对于最佳的竞争者仍具有更优的热稳定性，这避免了分次剂量使用(split dosing)(淀粉酶SEQ ID NO：437是热稳定的酶，其消除了在蒸气加压之前和之后对剂量的需求)，在更高的加工温度下获得更低的粘度，在浆体容器中提供了改善的微生物控制(加工在更高温度下进行，这样不需要的微生物被杀死)；更低的液化pH，这消除了调节pH的需求，降低了结垢(草酸钙沉淀物在零部件上形成，等等；如果液化在低pH下进行，那么就有较高的结垢可能性)，并且减少了副产物形成。

总的来说，淀粉酶SEQ ID NO：437是热稳定的酶，该酶可以满足关键的工业需求，例如，在某些条件下，快速地降低高干燥固体玉米面粉浆体的粘度，该酶可以是热稳定的(最适温度95℃)，可以是不依赖钙的，可以在低的最适pH下具有活性，可以容忍高达30％的循环涡流。一方面，推荐剂量在大约0.4到0.6kg/MT淀粉的范围内。

实施例2：在碱性pH下具有活性的热稳定淀粉酶

下述实施例描述了用于确定多肽是否在本发明的范围内的示例性方法，例如是否是热稳定淀粉酶。

该实施例的最初焦点是评价在商业自动洗碗(ADW)制剂中已有的一组淀粉酶。这一努力确定了两个备选者：在高pH具有活性的备选者(SEQ ID NO.：115)和另一个在ADW制剂中具有稳定性的备选者(SEQ ID NO.：207)。研究也包括鉴定高pH淀粉酶。该努力发现了具有降解淀粉能力的数百个克隆。DNA序列和生物信息分析将这些基因中的许多分类为以前没有被鉴定的淀粉酶。剩余的开发阅读框是neopullulanase、淀粉支链淀粉酶(amylopullulanases)和淀粉麦芽糖酶(amylomaltases)。深入的生物化学和应用研究显示了三个备选者：克隆B，SEQ IDNO.：147和SEQ ID NO.：139，它们在pH 10具有高的比活性，但遗憾地是在ADW制剂中缺乏稳定性。总的来说，已经鉴定出了一组新的淀粉酶，其中每一种具有适于ADW应用的期望表型。

生物化学研究

淀粉酶基因组克隆的生物化学分析表明，许多淀粉酶基因组克隆在pH 10和50℃水解淀粉。为了产生足量的酶以便进行进一步的生物化学和应用测试，将40个最具有活性的基因组克隆的淀粉酶开发阅读框亚克隆到表达载体中。该努力包括制备用于含有推定的信号序列的那些克隆的两个构建物，以及建立用于每一亚克隆(含有或不含有淀粉酶信号肽)的生长和诱导条件。

从34个亚克隆将可溶的活性蛋白质成功地纯化到同质，在pH 8和pH 10(40℃和50℃)使用2％淀粉在缓冲液中测定比活性(单位/mg，其中1单位＝μmol还原糖/分钟)。来自地衣芽孢杆菌(SEQ ID NO.：113)的淀粉酶被选择作为这些研究的基准。比活性是通过在30分钟的反应期间在多个时间点移出样品并分析还原糖来确定。初始速率通过将进度曲线拟合为线性方程来确定。最好的备选者的比较在表2中显示。

确定水解速率对pH的依赖性的研究表明，只有克隆B是具有大约8的最适pH的“碱性淀粉酶”；所有其它淀粉酶具有7或更低的最适pH。然而，清楚的是，命中的那一组中包括在pH 10和50℃具有可察觉的活性的几个先导淀粉酶。

表2淀粉酶的比活性(U/mg纯酶)

稳定性

通过生物化学分析鉴定的三个最佳备选者在存在ADW制剂的情况下的稳定性被测定。这些研究的基准是制剂基料中的商业酶。图13示意性说明了在50℃温育30分钟后的残余活性(测量在pH 8和50℃进行)，在所述的温育时存在ADW制剂的多种成分；pH 8、pH 10.8、ADW溶液(含有漂白剂)和ADW溶液(不含漂白剂)。温育后测量的活性以原始活性的百分比来表示。数据表明，克隆B对高温非常敏感，而其它淀粉酶受到的影响较小。当在高pH和高温下温育酶时，商业酶SEQ ID NO.：139变得较不稳定；然而，SEQ ID NO.：127保留了全部活性。在重复试验中，观察到SEQ ID NO.：127在pH 10温育和pH 8温育之后的明显异常行为。

当在ADW基料中在50℃下测量淀粉酶对染料标记淀粉的活性时，商业淀粉酶表现出在pH 8其活性的大约5％。在相同的分析测定中，克隆B、SEQ ID NO.：139和SEQ ID NO.：127表现出在pH 8测量的它们的原始活性的＜2％。

洗涤试验

使用淀粉涂覆载片进行洗涤试验，以测量每一种纯化酶的性能，并与商业淀粉酶相比较。根据实验方案制备意大利细面淀粉涂覆的载片。将两个预先称重的淀粉涂覆载片背靠背地放到50mL圆锥管中，在每一个管中加入25mL的ADW溶液，有/没有(+/-)酶。将这些管子在50℃孵育20分钟，同时放在垂直的旋转式传送带上轻轻地旋转。在孵育后，将载片立即在水中清洗，并且用烘箱干燥过夜。所有试验进行两次，商业酶作为阳性对照。这些实验的结果(图6)以被去除的淀粉的净百分比来表示，例如用含有酶的ADW去除的淀粉的百分比，减去用单独的ADW去除的淀粉的百分比。

实施例3：基因最优化

下述实施例描述了用于确定多肽是否在本发明的范围内的示例性方法，例如评价在存在ADW的情况下的酶性能。

酶的特性可以通过多种进化策略来改进，包括基因位点饱和诱变(GSSM^TM)和GeneReassembly^TM(Diversa Corporation，San Diego，CA)。这样的技术将被应用于本发明的淀粉酶核酸，以便产生可以对其进行筛选以发现改良特性的变体集合。一方面，用于进化的亲本分子包括本发明的任何核酸，例如是下述的一种或多种：SEQ ID NO.：113、SEQ ID NO.：139、SEQ ID NO.：115和SEQ ID NO.：127(SEQ IDNO.：127的截短形式)。

已经开发了高流通量筛选(HTS)，来评价在存在ADW性能的情况下的酶性能。HTS的开发在任何进化程序中都是极为重要的。HTS是自动化的，已经针对所述亲本淀粉酶显示出一致性的结果(图7)。亲本淀粉酶在ADW制剂中具有可测量到的活性，然而相对于pH 8活性已经被极大地降低。

实施例4：在碱性pH下具有活性的α-淀粉酶的表征

下述实施例描述了用于确定多肽是否在本发明的范围内的示例性方法，例如确定多肽在碱性pH下是否具有α-淀粉酶活性。

在碱性pH具有活性的本发明的淀粉酶被进一步表征。在pH 8和10，关于2％淀粉的动力学研究已经被进行。

表4：

1单位活性被定义为每分钟释放1μmol还原糖

实施例5：淀粉酶活性测定法：BCA还原末端测定法

下述实施例描述了用于确定多肽是否在本发明的范围内的示例性方法，例如通过BCA还原末端测定法来进行。感兴趣的克隆的淀粉酶活性使用下述方法来确定。

1.如下制备两份底物溶液：

a)2％可溶性淀粉(马铃薯)pH 8溶液，通过将2gm马铃薯淀粉溶解在100ml 100mM磷酸钠pH 8中制备。

b)2％可溶性淀粉(马铃薯)pH 10溶液，通过将2gm马铃薯淀粉溶解在100ml 100mM碳酸钠中制备。

在沸腾的水浴中加热两份溶液，同时混合，进行30-40分钟，直到淀粉溶解。

2.用64mg/ml一水合碳酸钠、24mg/ml碳酸氢钠和1.95mg/ml BCA(4，4’-二羧基-2，2’-二喹啉二钠盐(Sigma Chemical cat#D-8284)制备溶液A。上述溶液加入到dH2O中。

3.制备溶液B，通过将1.24mg/ml五水合硫酸铜和1.26mg/ml L-丝氨酸混合来完成。将该混合物加入到dH2O中。

4.制备溶液A和B的1∶1定量的工作试剂。

5.在dH2O中制备10mM麦芽糖的麦芽糖标准溶液，其中将10mM麦芽糖混合在期望pH的2％可溶性淀粉中，混合至终浓度为0、100、200、300、400、600μM。针对每一组时间点，制出标准曲线。由于该曲线是通过将10ul的标准物加入到工作试剂中来确定的，所以它可以扩展(work out)到0、1、2、3、4、6nmol麦芽糖。

6.将1ml的底物溶液等分(aliquot)到微量离心管中，在热块或加热的水浴中平衡到期望温度(5分钟)。将50ul的酶溶液加入到管盖内部。

7.当溶液平衡时，混合5ml的两种溶液A&B。将100ul等分到96孔PCR板中。置于冰上。

8.在5分钟的温度平衡后，将盖子盖在管子上，颠倒并振荡3次。当t＝0(零时刻)时，立即将10ul等分到平板中。使酶混合物保持在热块中，在每一期望的时间点(例如0、5、10、15、20、30分钟)等分10ul。

9.对于标准曲线，加入10ul标准物，确保12个孔是空的(仅仅是被等分的工作试剂)。

10.当所有的时间点被收集，加入标准物，盖上平板，加热到80℃35分钟。在冰上冷却平板10分钟。将100ul H2O加入到所有孔中。混合并将100ul等分到平底96孔板中，在560nm处读取吸光度。

11.用每一样品本身的t＝0，对每一样品的时间点进行校准(从其它的平均A560值中减去平均的t＝0A560值)。将A560_(实验值)转换为umol(用A560_(实验值)除以标准曲线的斜率(A560/umol))。得到时间点和umol的斜率(单位为umol/min)，乘以100(这是由于该umol值仅仅代表了该测定法中所用的10ul，而不是在1ml rxn中产生的量)。为了得到比活性，用斜率(单位为umol/min)除以蛋白质的mg数。所有点应当最少重复两次，三次是最佳的。示例性的标准曲线如图11所示。

表5：样品数据

活性＝0.008646umol/min

用蛋白质浓度(mg/ml)除以稀释度，得到测定法中所用的mg数。

用上述斜率除以测定法中所用的mg，得到比活性

比活性＝24.93umol/min/mg

参考例如，Dominic W.S.Wong，Sarah B.Batt，和George H.Robertson(2000)J.Agric.Food Chem.48：4540-4543；Jeffrey D.Fox和John F.Robyt，(1991)Anal.Biochem.195，93-96。

实施例6：α-淀粉酶活性的筛选

下述实施例描述了用于确定多肽是否在本发明范围内的示例性方法。克隆的淀粉酶活性可以通过本技术领域已知的多种方法来评价。下面是本发明中所用的一般方法。被筛选的噬菌斑的数量，每一平板中应该是大约10,000个噬菌斑形成单位(pfu’s)。对于每一DNA文库：每个分离的文库有至少50,000个噬菌斑，每个未分离的文库有至少200,000个噬菌斑，应该根据λZap Express扩增的裂解物的pfu滴定量来筛选。

λ文库的滴定测定

1)将数μL的λZap Express扩增文库原液加入到600μL大肠杆菌MRF’细胞(OD₆₀₀＝1.0)中。为了稀释MRF原液，使用10mM MgSO₄。

2)于37℃温育15分钟。

3)于50℃转移悬液至5-6mL的NZY上层琼脂中，轻轻地混合。

4)立即将琼脂溶液倒入大(150mm)NZY培养基平板中。

5)使上层琼脂完全凝固(大约30分钟)，然后倒置平板。

6)于39℃将平板温育8-12小时。

7)大约估计噬菌斑的数量。确定噬菌体滴定量以得到10,000pfu/平板。如果需要，用SM缓冲液稀释文库噬菌体的等份样品。

底物筛选

1)将来自扩增文库的λZap Express(50,000pfu)加入到600μL的大肠杆菌MRF’细胞中(OD600＝1.0)。对于非环境文库，准备4个管子(每一管子为50,000pfu)。

2)于37℃温育15分钟。

3)当温育噬菌体/细胞悬液时，于50℃将1.0mL红色淀粉底物(1.2％w/v)加入到6.0mL NZY上层琼脂中，并且彻底混合。保持该溶液于50℃直到被使用。

4)转移1/5(10,000pfu)的细胞悬液至底物/上层琼脂溶液中，轻轻地混合。

5)立即将溶液倒入大(150mm)NZY培养基平板中。

6)使上层琼脂完全凝固(大约30分钟)，然后倒置平板。

7)对于剩余细胞悬液，将步骤4-6重复4次(每次1/5悬液)。

8)在39℃温育平板8-12小时。

9)观察平板上噬菌斑周围的透明圈(晕圈)。

10)从琼脂的中心挖取有晕圈的噬菌斑，转移至无菌微量管中。大孔的200μL移液管尖头刚好能移出(挖取)含有期望噬菌斑的琼脂团。

11)噬菌体重悬于500μL SM缓冲液中。加入20μL氯仿以抑制任何进一步的细胞生长。

12)在下一个步骤之前，在室温下将纯的噬菌体悬液培养4小时或过夜。

纯克隆的分离

1)将10μL重悬的噬菌体悬液加入到500μL大肠杆菌MRF’细胞中(OD600＝1.0)。

2)于37℃温育15分钟。

3)当温育噬菌体/细胞悬液时，于50℃将1mL红色淀粉底物(1.2％w/v)加入到6.0mLNZY上层琼脂中，并且彻底混合。于50℃保持该溶液直到被使用。

4)转移细胞悬液至底物/上层琼脂溶液中，轻轻地混合。

5)立即将溶液倒入大(150mm)的NZY培养基平板中。

6)使上层琼脂完全凝固(大约30分钟)，然后倒置平板。

7)将平板在39℃温育8-12小时。

8)观察平板上单个噬菌斑(纯的克隆)周围的透明圈(晕圈)。如果单个噬菌斑不能被分离，那么调节滴定量，将噬菌体悬液重新铺平板。

9)从琼脂的中心挖取有晕圈的单个噬菌斑，转移到无菌微量管中。大孔200μL移液管尖头刚好能取出(挖取)含有期望噬菌斑的琼脂物。为了扩增该滴定量，将5个单一活性噬菌斑的中心挖取到微量管中。

10)噬菌体重悬于500μL SM缓冲液中。加入20μL氯仿以抑制任何进一步的细胞生长。

11)在下一个步骤之前，在室温下将纯的噬菌体悬液培养4小时或过夜。将DMSO加入到噬菌体悬液(7％v/v)中，将纯噬菌体悬液储存于-80℃。

纯克隆的切出(excision)

1)将100μL纯的噬菌体悬液加入到200μL大肠杆菌MRF’S细胞中(OD600＝1.0)。向其中加入1.0μL EXASSIST辅助噬菌体(＞1x10⁶pfu/mL；Stratagene)。使用2059Falcon管子用于切出。

2)悬液于37℃温育15分钟。

3)将3.0mL的2x YT培养基加入到细胞悬液中。

4)于30℃温育至少6小时或过夜，同时振荡。

5)转移管子到70℃20分钟。噬粒悬液可以于4℃储存1到2个月。

6)转移100μL噬粒悬液至含有200μL大肠杆菌Exp505细胞(OD 600＝1.0)的微型管子中。

7)悬液于37℃温育15分钟。

8)将300μL SOB加入到悬液中。

9)悬液于37℃温育30到45分钟。

10)转移100μL悬液至小(90mm)的LB培养基平板中，对于Zap ExpressDNA文库，该培养基平板含有卡那霉素(含有50μg/mL卡那霉素的LB培养基)，或对于Zap II DNA文库，该培养基平板含有氨苄青霉素(含有100μg/mL的LB培养基)。

11)转移剩余悬液至另一个小的LB培养基平板中。

12)使用无菌玻璃珠子将悬液均匀地分布在平板上。

13)将平板30℃温育12到24小时。

14)观察平板上的菌落。

15)将单个菌落接种到含有合适的抗生素的LB液体培养基中，并且于30℃培养12到24小时。

16)将80％甘油加入到液体培养物中(15％v/v)配制甘油原液，并且储存于-80℃。

活性确证

1)转移50μL的液体培养物至微型管子中。将500μL的8％pH 7支链淀粉天青(Amylopectin Azure)加入到同一管子中。对每一克隆准备2个管子。

2)在50℃测试活性，3小时和过夜。使用pH 7缓冲液作为对照。

3)受测样品在冰水浴中冷却5分钟。

4)加入750μL Ethaqnol并彻底混合。

5)13000rpm(16000g’s)离5分钟。

6)测量上清液在595nm处的OD值。

RELP分析

1)转移1.0mL液体培养物至无菌微型管子中。

2)13200rpm(16000g’s)离心1分钟。

3)弃上清。将另外的1.0mL液体培养物加入到同一无菌微型管子中。

4)13200rpm(16000g’s)离心1分钟。

5)弃上清。

6)按照QIAprep spin mini试剂盒实验方案进行质粒分离。

7)使用BioPhotometer检查DNA浓度。

8)对于第一次双重消化，使用Sac I和Kpn I。于37℃温育1小时。

9)对于第二次双重消化，使用Pst I和Xho I。于37℃温育1小时。

10)将加样染料加入到被消化的样品中。

11)在1.0％琼脂糖凝胶上将被消化的样品于120伏进行电泳1-1.5小时。

12)用凝胶成像仪观察凝胶。具有不同消化型式的所有克隆将被送去进行序列分析。

实施例7：对淀粉酶的分析测定

下述实施例描述了用于确定多肽是否在本发明范围内的示例性方法。

宿主培养物的制备

5.开始XL 1-Blue MRF’S宿主细胞的过夜培养。使用来自划线平板的单个菌落接种补充了20ug/mL四环素的10mL LB。过夜培养培养物，37℃，振荡，至少16小时。

6.使用无菌技术，用来自过夜LB_Tet培养物的XL1-Blue MRF’S宿主接种新鲜的100mL LB_Tet。

7.在37℃振荡器中培养，直到OD到达0.75-1.0。

8.以1000xg将宿主细胞离心10分钟而形成沉淀，轻轻地悬于10mM MgSO₄中，OD5。

9.将少量宿主细胞稀释到OD1，用于在滴定和pintooling中使用。

10.当在冰上于4℃储存时，宿主制备物可以被使用，直至1周。

-为了缩短白天培养的生长时间，使用1/2X在LB中通常的Tet浓度(1/2X＝10ug/mL)，或者完全略去抗生素。

-当用四环素进行选择时，不要使用NZY。NZY培养基中的高Mg⁺⁺浓度会使Tet失去活性。

滴定λ文库

11.放置三个无菌离心管于支架上。

12.将995uL制备的宿主细胞等分到一个管子中，将45uL制备的OD1宿主细胞等分到两个剩余管子的每一个管子中。

13.将5uLλ文库加入到含有995uL宿主细胞的管子中，振荡混合。这导致200的稀释因子。

14.通过将5uL前面的稀释物相继地加入到含有45uL制备的宿主细胞的两个剩余管子中，制备1/2,000和1/20,000稀释物。在制备了每一稀释物后，振荡混合。

15.通过37℃培养15分钟，使噬菌体吸附到宿主上。

16.同时，将100uL制备的OD1宿主细胞移取至三个Falcon 2059管子的每一个管子中。

17.将5uL的每一稀释物加入到含有宿主细胞的分离的2059管子中。

18.通过将3mL上层琼脂加入到每一个管子中来铺每一个平板，并且快速地倒在90mm NZY平板中。在上层琼脂凝固之前，确保其光滑、均匀的分布。

19.倒置平板，于37℃培养过夜。

20.对噬菌斑计数，并且计算λ原液(stock)的滴度(以噬菌斑形成单位(pfu)/uL为单位)。

淀粉酶的λ微量滴定筛选

准备

1.根据计划的筛选数量，制备足量的XL1-Blue MRF’宿主培养物，如上描述。100mL的培养物通常足以筛选2-3个文库。

2.用高压锅对与QFill2分液器相容的几个瓶子进行消毒。这些是宽口Corning瓶，250mL，在瓶口边缘有密封圈。

3.确保有适用于筛选的足量平板、上层琼脂、BODIPY淀粉、红色淀粉溶液，等等。

4.确定第二天自动操作的进度。

第一天

1.用文库筛选和平板数来标记1536孔平板(黑色)。Tough-Tags^TM粘胶管被横向分成两半，其对于标记1536孔平板是理想的。

2.计算筛选必需的文库、宿主细胞和NZY培养基的量。这可以使用Excel电子表格容易地进行。

3.将计算好量的λ文库和OD5宿主细胞混合在无菌250mL宽口Corning瓶子(带有密封圈)中。

4.在37℃保持15分钟，让吸附发生。

5.加入计算好量的NZY培养基，并且混匀。这被称作细胞-噬菌体-培养基悬液。

6.通过将50uL的细胞-噬菌体-培养基悬液与250uL的OD1宿主细胞在Falcon 2059管子中混合，然后用9mL上层琼脂铺于150mm NZY平板上，进行伴随(concomitant)滴定测定。于37℃温育伴随滴度平板过夜。

7.分液器加样剩余悬液，以每孔4uL来安排每一标记的1536孔平板。如果分液器在一些孔中留下气泡，这些气泡可以通过在200x g将平板离心1分钟被去除。

8.在至少两个测定平板的孔位置AD46中加入0.5uL的阳性对照噬菌体。对于该目的，使用强淀粉酶阳性λ克隆。SEQ ID NO.：113或SEQ ID NO.：199的λ版本是阳性对照的很好选择。

9.在加湿(≥95％)的培养箱中于37℃温育测定平板过夜。

第二天

1.计算伴随滴定平板的pfu，确定每孔的平均种子密度(以pfu/孔为单位)。

2.Pintool每一文库筛选的至少两个平板(优选地是含有阳性对照的两个平板)，如下：

a)制备两个宿主菌苔平板，用作进行pintool的表面：将250uL的OD1宿主细胞与2mL 2％红色淀粉混合，用9mL上层琼脂铺于150mm NZY平板上。当上层琼脂凝固时，尽可能水平地保持每一平板，以便在整个平板上产生色彩均匀的红色。

b)使用两次火焰灭菌的1536位pintool，在宿主菌苔平板上复制至少两个筛选平板。

c)将被pintool的接受平板放置在层流罩超净台中，同时将盖子拿掉大约15-30分钟(以便排出过量湿气)。

d)更换盖子，倒置，于37℃温育过夜。

3.如下制备2X BODIPY淀粉底物缓冲液：

a)以每孔4uL，计算所有筛选平板所需要的2X底物缓冲溶液的总体积(包括分液器所需要的任何额外的死区体积)，量取一定量的100mM CAPS pH10.4到适合于所用的分液器的容器中。

b)补充足量的0.5mg管的BODIPY淀粉，以产生所需体积的2X底物缓冲液[在上面的步骤a中计算的]，终浓度为20-30ug/mL。

c)室温下将每个0.5mg管溶解在50uL DMSO中，避光，频繁振荡。这需要超过15分钟的时间；一些生产批次的BODIPY淀粉的溶解比其它生产批次的要好。

d)每一管子中加入50uL 100mM CAPS缓冲液，pH 10.4，振荡混合。

e)汇集所有管子的内容物，通过在离心机中以最大速率离心1分钟去除任何未溶解的聚集物。

f)将上清加入到在上面步骤a)中量取的剩余100mM CAPS缓冲液中。

g)通过包装在箔中，使2X底物缓冲液避光。

4.将平板和底物缓冲液放置到自动化室，用如下参数对自动仪器进行编程：

a)将4uL底物缓冲液分配到每一孔中

b)第一次在底物后1小时读取，第二次在9小时读取，第三次在17小时读取；读数之间于37℃温育

c)激发过滤器：485nm；发射过滤器：535nm

d)将Spectrafluor增益设置在70，或为该批制备的2X底物缓冲液设置最适的增益。

e)确保所用的培养箱可保护测定平板，使其避光。

第三天

1.检查被pintool的平板，检查在与相关的测定平板上的孔相对应的所有位置处的细菌菌苔的透明情况。同样检查pin位置的任意位置处的红色淀粉中的透明情况。如果使用含有阳性对照的平板用于pintool，那么应该能在红色背景中观察到大的透明区域。小心在红色淀粉中也可形成透明区域的污染物(参见实施例7末尾部分的内容“在红色淀粉中形成透明区域的污染物”)。

2.鉴定由通过自动计算机产生的数据文件获得的推定命中(hits)。用工程学产生的KANAL程序简化了数据分析。作为判断规则，推定命中的特征在于是这样的孔，即，相比于背景，该孔的信号强度在至少1.5倍的增加。

3.对于每一推定，从孔中取出2uL，加入到含有500uL SM缓冲液和50uLCHCl3的管子中。振荡混合，于4℃储存。该溶液在下文将被称作4e-3原液。原始筛选平板应该于4℃储存，避光，至少储存到破解(breakouts)完成。

这是破解推定命中的一个推荐方法。该方法是一种液相测定法，依赖于对BODIPY淀粉的活性的证实。可以选择地，推定命中可以被直接铺于含有红色淀粉的固相平板上，这样对2,000-3,000pfu/命中进行检查，检查透明区域。然而，不能在红色淀粉上观察到透明区域，并不一定表明推定命中为假阳性。然后需要使用最初用来鉴定它的形式来分析它(即，使用BODIPY淀粉作为底物的液相分析)。此外，使用下面详细描述的方法，更容易鉴定出非常弱的阳性。

第一天

1.在一个无菌50mL圆锥管中，混合0.5mL OD5宿主细胞和45.5mL NZY。这将被称作宿主培养基悬液。

2.对于将被分析的每一推定命中，将1mL的宿主-培养基悬液等分到3个无菌离心管的每一个管子中。

3.设置12通道移液器(pipetman)为多次分配模式，等份大小为20uL，等份数量为2x。将一组清洁的无菌吸头装配在移液器上。

4.将1mL宿主-培养基悬液倒入一个新的无菌溶液槽中，并装载多通道移液器。

5.以每孔20uL分配到一个黑色384孔板的最后一行(第P行)(12通道x 2＝24孔)。该行在后面将被用作对照。

6.通过使吸头接触槽的表面并按下移液器上的RESET按钮，排出吸头中的剩余液体。放下移液器，并防止吸头的污染。此时不需要更换吸头。

7.将槽中的剩余液体倒入废弃物容器(像烧杯)中，注意避免溅回污染。

8.对于将被分析的第一个推定，取出111uL的4e-3原液(参见淀粉酶的λ微量滴定筛选中的第二天)，将其加入到含有1mL宿主-培养基悬液的(一组)三个管子的第一个管子中(步骤2)。振荡混合。这就是稀释物A。

9.取出111uL的稀释物A，加入到该组的下一个管子中。振荡混合。这就是稀释物B。

10.取出111uL的稀释物B，加入到该组的最后一个管子中。振荡混合。这就是稀释物C。现在应该有三种噬菌体稀释物，其中每一种稀释物的浓度有10倍的差别。

11.将稀释物C的内容物(三个样品中最淡的稀释物)倒入溶液槽中，装载多通道移液器。

12.以每孔20uL分配到384孔板的第一行(12通道x 2＝24孔)。

13.通过使吸头接触槽的表面并按下移液器上的RESET按钮，排出吸头中的剩余液体。放下移液器，并防止吸头的污染。不需要在此时更换吸头。

14.如上所述倒空溶液槽。

15.将稀释物B的内容物倒入同一槽中，加载多通道移液器。

16.以每孔20uL分配到384孔板的第二行。

17.同样地进行步骤13-16，将稀释物A分配到平板的第三行。

18.在所有三种稀释物已经被排列到平板的前三行后，将所有吸头和溶液槽弃入生物危险性废弃物容器中。

19.将一组清洁的无菌吸头装配到移液器上，打开一个新的无菌溶液槽。

20.针对剩下的每一推定命中，重复步骤8-19，其中利用平板上剩余的行直到第O行。可以在384孔平板上分析五个推定命中，保留最后一行(P行)作为对照。

21.将0.5uL的每一对照加入到分离的孔中。使用至少2-3个分离的对照，优选地覆盖一定范围的活性。

22.在加湿(≥95％)培养箱中于37℃温育测定平板过夜。

第二天

1.使用与“淀粉酶的λ微量滴定筛选”的“第二天”中所描述的方法相同的方法，将所有破解平板pintool到带有红色淀粉的宿主菌苔中，不同的是使用了384位pintool。

2.如下准备2X BODIPY淀粉底物缓冲液：

a)以每孔20uL计算所有破解平板(breakout plates)所需要的2X底物缓冲溶液的总体积(包括分液器所要求的任何额外的死区体积)，量取一定量的100mM CAPS pH 10.4分配到适合于所使用的分液器的容器中。

b)收回足够的0.5mg管子的BODIPY淀粉，以便产生所需体积的2X底物缓冲液[上述步骤a中所计算的]，终浓度为20-30ug/mL。

c)室温下将每一0.5mg管子溶解到50uL DMSO中，避光，同时频繁地振荡。这需要花费超过15分钟的时间；一些生产批次的BODIPY淀粉的溶解比其它的要好。

d)将50uL的100mM CAPS缓冲液pH 10.4加入到每一个管子中，振荡混合。

e)合并所有管子的内容物，通过在离心机上以最大速率离心1分钟去除任何未溶解的聚集物。

f)将上清加入到上述步骤a)中量取的剩余的100mM CAPS缓冲液中。

g)通过包裹在箔中使2X底物缓冲液避光。

3.以每孔20uL分配到所有破解平板中。

4.将所有平板包裹在铝箔中，室温下温育2-6小时。

5.用Spectrafluor读取每一平板，Spectrafluor具有如下设置：

a)荧光读数(激发过滤：485nm；发射过滤：535nm)

b)平板定义：384孔黑色

c)从顶部读数

d)最佳增益

e)闪光数：3

6.在所得到的Excel电子表格中，在独立的图表中绘制每一推定的3行，检查活性。确保阳性对照产生超过背景的信号。

7.对于在孔中似乎具有真实信号的每一推定，如下地从阳性孔中收获样品：

a)从代表着最高的初始稀释物的行中选择阳性孔。

b)从该孔将2uL转移到含有500uL SM和50uL CHCl₃的管子中。这被称作破解原液。

c)储存于4℃。

8.使用先前描述的方法，将大约10uL的每一破解原液铺于使用了红色淀粉的150mm NZY平板上。目标是获得数个(至少20个)独立孔的噬菌斑，从这些噬菌斑挖出分离物。

第三天

1.检查被pintool的平板，检查在与相关的测定平板上的孔相对应的细菌菌苔中可接受的透明发生。同样检查阳性对照组中和任何被测试的推定中的红色淀粉的透明变化。注意在红色淀粉中也会形成透明区域的污染物(参见下面)。

2.从含有破解原液的稀释物的固相平板，挖出几个分离的噬菌斑，将每一个噬菌斑放入具有50uL CHCl₃的500uL SM中。这被称作分离原液。

3.然后可以使用上面描述的方法在BODIPY淀粉上各自独立地测试分离原液。如果步骤2中被挖出的噬菌斑在红色淀粉背景中产生了透明圈，该步骤可以跳过。然后使用上面描述的方法在BODIPY淀粉上各自独立地测试分离原液。然而，如果步骤2中被挖出的噬菌斑在红色淀粉背景中产生了透明区域，那么该步骤可以跳过。

切出

第一天

1.在一个Falcon 2059管子中，混合200uL OD1 XL1-Blue MRF’宿主、100uLλ分离原液和1uL ExAssist噬菌体原液。

2.在37℃振动器中温育15分钟。

3.加入3mLNZY培养基。

4.在30℃振动器中温育过夜。

第二天

1.将切出用管子加热到70℃20分钟。

2.1000x g离心10分钟。

3.在一个Falcon 2059管子中，混合50uL上清液和200uL EXP505OD1宿主。

4.在37℃振动器中温育15分钟。

5.加入300uL SOB培养基。

6.在37℃振动器中温育30-45分钟。

7.使用无菌玻璃珠子将50uL平铺于大的LB_kan50平板上。如果平板是“干的”，可以加入额外的SOB培养基来帮助分散这些细胞。

8.在30℃将平板培养至少24小时。

9.培养分离物以进行测序和/或RFLP。

在30℃进行培养，降低了噬菌粒拷贝数，可以减轻一些淀粉酶克隆的表观毒性。

在红色淀粉中形成透明区域(透明圈)的污染物

当使用固体培养基上的红色淀粉来分析测定噬菌体的淀粉酶活性时，通常会看到在红色淀粉中形成透明区域的污染菌落形成单位(cfu)。对于被pintool的平板，重要的是，能够将淀粉酶阳性噬菌体克隆和这些污染物区分开来，无论是在何时将它们与特定的孔位置对齐。污染微生物的来源可能是2％红色淀粉储备溶液，该溶液不能在制备后用高压灭菌器或通过过滤来灭菌。可以想到，它们是机会微生物，通过代谢红色淀粉来存活。为了减少这些污染物，当制备2％红色淀粉溶液时使用无菌技术，将原液储存于4℃或冰上。

实施例8：生物信息学分析

下述实施例描述了确定多肽是否在本发明范围内的示例性方法，例如通过进行生物信息学分析。

初始的生物信息学分析使用已知的超嗜热α-淀粉酶序列来进行。图14a显示了序列的联配，其中一些序列已经保藏于NCBI数据库中。该分析显示了，设计简并引物来PCR省去其信号序列的整个基因的可能性(参见图14a)，从而从文库中产生潜在的新的全长α-淀粉酶。

通过基因组DNA的PCR筛选下述文库：

表6：

文库#	名称	PCR阳性	被亚克隆
				5	A.lithotropicus	否
13	隐蔽热网菌(Pyrodictium occultum)	否
				17	热网菌(Pyrodictium)TAG11	否	是
113	深海富集(Deep sea enrichment)	是	是
				170	深海富集(Deep sea enrichment)	是	是
198	Archaeglobus	否
				206	酸菌属(Acidianus sp)	否
453	Mixed iceland enrich	否
				455	Mixed iceland enrich	是	是

图14b显示了被鉴定的序列的联配，表7，在图18中示意性说明，列出了它们的相对百分比同一性。

氨基酸同一性范围为大约85-98％的同一性。因此，正如本文所述，这些序列在基因的重排中是有用的。

图14c显示了上面的相应多肽序列的核酸联配。这些淀粉酶在表达载体pSE420和宿主细胞系XL1-Blue中的表达表明，1703和1706具有淀粉酶活性。

实施例9：文库63GP-1α淀粉酶最适pH的表征和比活性测定

下述实施例描述了确定多肽是否在本发明范围内的示例性方法，例如通过α淀粉酶活性最适pH和比活性测定。

在最初的实验中，来自热球菌(Thermococcus)的SEQ ID NO：81显示，它在玉米湿磨法的淀粉液化以及织物脱浆中是有效的。该酶具有4.5到5.0的最适pH。在这一较低pH，可以使用少量或不使用钙，这降低了整个操作成本并降低了副产物的形成。此外，在这一低pH，具有减少的化学品使用和离子交换装载量。工业标准地衣芽孢杆菌淀粉酶在热稳定性和最适pH方面是次最优的。63GP-1淀粉酶与地衣芽孢杆菌淀粉酶相比具有更高的应用比活性，因此水解一吨的淀粉所需要的酶更少(可以使用少至达20倍差异的酶)。

用于水解淀粉的最适pH通过使50uL的GP-1，0.35U/ml与100ml的1％可溶性淀粉溶液(0.0175U/g的淀粉)在95摄氏度反应30分钟来确定。正如本文描述的，液化淀粉溶液中产生的还原端通过neocupronine测定法来测量。玉米淀粉的水解百分比通过用neocupronine测定法测量产生的糖还原端的数量来测定。称取70克的缓冲溶液(pH 4-7)，加入100ppm的钙。将30克的玉米淀粉混合到缓冲溶液中形成淀粉浆状物。加入酶，密封容器，以每分钟6摄氏度的初始加热速率于95摄氏度温育30分钟。从反应烧杯提取1ml样品，用neocupronine测定法分析。GP-1的最适pH在4.5到5之间，而商业地衣芽孢杆菌淀粉酶在大约pH 6.0发挥最佳性能。

实施例10：淀粉酶连接重装配

下述实施例描述了确定多肽是否在本发明范围内的示例性方法，例如通过下面描述的测定方法。

使用RBB-淀粉的测定方法

在新的96孔板(V型底)的每一个孔中加入75μl的RBB-淀粉底物(在50mMNaAc缓冲液中，1％RBB不可溶的玉米淀粉，pH＝4.5)。五个微量滴定的酶裂解产物被转移至有底物的每一个孔中，使用Biomek或Zymark。用铝密封带密封平板，在振动器上短暂地振动。90℃培养平板30分钟，随后室温冷却大约5到10分钟。每一孔中加入100微升的100％乙醇，密封平板，在振动器上短暂地振动。然后使用桌式(bench-top)离心机4000rpm离心平板20分钟。用Biomek转移100μl上清液至新的96孔板中(扁平底)，读取OD₅₉₅。对照组：SEQ ID NO：81，SEQ IDNO：77，SEQ ID NO：79。

使用FITC-淀粉的测定方法

在新的384孔板的每一孔中加入50μl底物(100mM NaAc缓冲液中，0.01％FITC-淀粉，pH＝4.5)。转移5μl酶裂解产物至有底物的每一孔中，室温温育平板过夜。读取每一孔的底物极化变化，激发485nm，发射535nm。对照组：SEQID NO：81，SEQ ID NO：77，SEQ ID NO：79。优选地，所有测定方法使用96孔平板。

新活性克隆的确认

培养筛选的每一阳性克隆，使用标准的实验方案进行诱导。检查每一克隆的生长(即，一段时间内的细胞密度)、每个细胞水平的活性(RBB-淀粉测定和液化分析)、蛋白的表达(蛋白凝胶)和溶解性(通过显微镜分析)。确认出的新的克隆(elevated clones)被转移用于发酵。

实施例11：用于液化淀粉和测量结果的示例性方法

下述实施例描述了使用本发明的选择的淀粉酶液化淀粉的示例性实施方案。

具有在SEQ ID NO：10和SEQ ID NO：4中所示序列的淀粉酶显示了在使用下面所示的反应条件中在pH 4.5或6.5时对液化淀粉的活性。

反应条件：100mM PO₄ pH 6.5，1％(w/w)液化淀粉DE 12，55℃。进行TLC和HPLC分析以检验活性。两种分析方法的数据显示，克隆是有活性的。

使用磷酸盐缓冲液，pH 3.0-6.5，55℃，绘制具有在SEQ ID NO：4和SEQ IDNO：10中所示序列的淀粉酶的pH曲线。从可以观察到的水解的量，可以直观地看到，所述克隆在某些pH值下比在上述表明的反应条件的其它值下更有活性：

SEQ ID NO：4-从pH 5.0到6.5有活性

SEQ ID NO：10-从pH 4.5到6.5有活性

液化淀粉在pH 6.5糖化的示例性方案：

●调节液化淀粉的pH至将要进行糖化时的pH。在带有100mM磷酸钠盐的100mM醋酸钠缓冲液，pH 4.5中液化淀粉，以便在糖化前pH可以被调节到6.5。

●称取5克液化淀粉的样品，装入到称过皮重的瓶子中。

●每100克液化淀粉，使用0.04％(w/w)Optidex L-400或大约400mL的1-10稀释的原液Optidex L-400。

●计算在400mL的1-10稀释的原液Optidex L-400中所包含的OptidexL-400的毫克数。接着，计算产生与Optidex L-400相同的酶浓度所需要的裂解产物的体积数。

●将酶加入至液化淀粉样品中，在期望温度(50℃)温育。18小时后，确定DE并且准备用于HPLC分析的样品。

示例性的DE确定方法：

示例性的新试铜灵(neocuproine)测定：

将100ml样品加入到2.0ml的新试铜灵溶液A(40g/L碳酸钠，16g/L甘氨酸，0.45g/L硫酸铜)中。向其中加入2.0ml的新试铜灵溶液B(1.2g/L盐酸新试铜灵-δN-1626)。混合管子并在沸水浴中加热12分钟；冷却，用DI水稀释到10ml体积，用分光光度计在450nm处读取OD。由同时进行的0.2mg/ml葡萄糖标准的响应推断出样品的葡萄糖当量。

示例性的HPLC分析：

利用折射率检测，通过HPLC(Bio-Rad Aminex HPX-87A柱，银形式，80℃)测量糖化碳水化合物曲线(谱图，profile)。流动相是过滤的Millipore水，以0.7ml/min的流动速率使用。用酸化的DI水(5滴6M HCl加入到200mL DI水中)将糖化样品稀释1-10，然后通过0.45mm注射过滤器过滤。注射体积是20uL。

示例性的TLC：

反应产物被w/d，以小时计为时间点，点在TLC板上并干燥。然后平板在10∶90水∶异丙醇中处理，并用香兰素染色或CAM染色来显示，然后加热以显示可还原糖。在观察到活性的情况下，液化淀粉被部分地水解为葡糖。

实施例12：使用本发明的淀粉酶的淀粉液化

该实施例描述了本发明的使用本发明的淀粉酶液化淀粉的示例性方法。

通过热处理、细胞洗涤、碱提取，使用微量过滤和超滤，由发酵肉汤(broths)制备出淀粉酶浓缩物(48％总产率)。用乙酸使UF浓缩物变为中性，并用pH 4.5的30％甘油进行配制。浆状制剂的活性水平是代表了商业产品(120U l/g-0.5kg/吨淀粉)。

标准的淀粉酶活性测定

将含有950μL的50mM MOPS pH 7.0——其含有5mM PNP-α-D-六-(1→4)-葡糖吡喃糖苷——的1mL小池，放置到预热到80℃的Beckman DU-7400分光光度计的Peltier温度控制器中。分光光度计在405nm处记录空白，小池中加入50μL的酶溶液，混匀，监控OD_405nm在1分钟的时间间隔内的增加。利用950μL 50mMMOPS中的50μl的1μmol/mL PNP在pH 7.0，80℃下的OD_405nm响应，将ΔOD_405nm/ _分钟速率转换为μmol/分钟的标准单位。热稳定α淀粉酶(DTAA)的一个标准Diversa单位相当于在该测定方法的限定条件下催化1μmol/mL/分钟的pNP释放的酶的量。

标准的葡糖淀粉酶活性测定

将含有950μL的50mM MOPS pH 7.0——其含有5mM pNP-α-D-葡糖吡喃糖苷——的1mL小池，放置到预热到60℃的Beckman DU-7400分光光度计的Peltier温度控制器中。分光光度计在405nm处记录空白，小池中加入50μL的酶溶液，混匀，监控OD_405nm在1分钟的时间间隔内的增加。利用950μL 50mM MOPS中的50μl的1μmol/mL PNP在pH 7.0，60℃下的OD_405nm响应，将ΔOD_405nm/分钟速率转换为μmol/分钟的标准单位。葡糖淀粉酶(DGA)的标准Diversa单位相当于在该测定方法的限定条件下催化1μmol/mL/分钟的pNP释放的酶的量。

葡萄糖当量的确定

新试铜灵方法被用于测量DE。利用本发明的程序和使用GPC分析物的GPCFehlings程序来测量所选择的样品。

新试铜灵测定

在2.0ml的新试铜灵溶液A(40g/L碳酸钠，16g/L甘氨酸，0.45g/L硫酸铜)中加入100μL样品。向其中加入2.0ml的新试铜灵溶液B(1.2g/L盐酸新试铜灵-δN-1626)。混合管子并在沸水浴中加热12分钟；冷却，用DI水稀释到10ml体积，在分光光度计上450nm处读取OD。从同时进行的0.2mg/ml葡萄糖标准的响应推断出样品的葡萄糖当量。

用DI水将淀粉样品稀释～1到16，记录准确的稀释度。在20ml的DI水加入10毫升稀释样品。稀释淀粉中加入10毫升Fehlings溶液A和B。样品沸腾3分钟，冰上冷却。加入10毫升的30％KI和10ml的6N H₂SO₄。用0.1N硫代硫酸钠滴定测量该溶液。滴定体积被记录，用于计算DE。

残余淀粉测定

使用Staley碘酒方法检查糖化后样品的残余淀粉。

称取20克样品，装入一个大称重盘中。称重盘中加入45μL的碘酒溶液，将淀粉溶液混匀。深蓝色表明存在淀粉，淡蓝绿色表明少量淀粉，淡绿色表明痕量淀粉，黄色-红色表明不存在淀粉。碘酒溶液通过将21.25克碘和40.0克碘化钾溶解在1升水中来制备。

寡糖特征(profiles)

液化和糖化碳水化合物特征通过应用了折射率检测的HPLC(Bio-Rad AminexHPX-87C柱，钙形式-80℃)来测定。

凝胶渗透色谱

在PL Aquagel-OH柱上进行色谱层析，通过借助于折射率的质量检测(WatersModel 2410)来确定分子量分布。Viscotek Model T60检测器被用于连续粘度和光散射的测量。

毛细管电泳

Beckman Coulter P/ACE MDQ Glycoprotein System-APTS衍生的寡糖在融合硅毛细管上的分离—通过激光诱导的荧光来检测。

初次液化

将直接来自GPC过程的线性淀粉泵入60升给料箱中，其中pH、DS(干重)和钙水平可以在液化之前被调节。浆状物中加入淀粉酶。通过正向置换泵以0.7升/分钟将32％DS浆状物泵到喷嘴——一个加压的混合容器，其中淀粉浆状物通过蒸气喷射被瞬间加热到大于100C。胶凝化的部分液化的淀粉被泵出通过管道网络(仍然在压力下)，以获得在一定温度下的期望驻留时间(5分钟)。将压力释放到闪蒸池中，获取样品。再次获取样品。

二次液化

液化的淀粉被收集到1升玻璃瓶子中，保持在95℃水浴中90分钟。

糖化

液化淀粉冷却到60C，pH调节到4.5，用葡糖淀粉酶处理样品。用HPLC在一段时间内监控糖化过程。

糖化

在90分钟二次液化后，立即用6N HCl将用每一种淀粉酶产生的液化糖浆调节到大约pH 2.5，以灭活任何残余的淀粉酶。然后将糖浆调节到pH 4.5，置于60℃水浴中，用三个水平的葡糖淀粉酶进行糖化。通过HPLC在18-88小时时间点监控糖化程度。

用标准剂量——0.04％的双重强度葡糖淀粉酶和两个更少的剂量(50％和25％)，糖化液化的糖浆，以监控在糖化过程中的任何差别。

糖化进展—葡糖生成百分比(％dextrose development)与时间—0.04％葡糖淀粉酶

糖化进展—葡糖生成百分比与时间—0.02％葡糖淀粉酶

糖化后的糖特征(profile)

在这些研究和所有先前的糖化研究中，在通过本发明的淀粉酶和地衣芽孢杆菌淀粉酶对液化糖浆进行糖化后获得的最终葡萄糖水平是基本上相同的。DP2(麦芽糖)水平也相似。这些大片段是葡糖淀粉酶的较差底物，它们往往被慢慢地转化，被慢慢地转化为较小片段，最终，被转化为葡萄糖。

分子量分布

通过本发明的示例性淀粉酶SEQ ID NO：6和SEQ ID NO：437以及商业的地衣芽孢杆菌和商业的嗜热脂肪芽孢杆菌的淀粉酶，液化到DE为12和18的糖浆的分子量分布，通过应用了折射率、光散射和粘度检测的凝胶渗透色谱来测量。地衣芽孢杆菌和嗜热脂肪芽孢杆菌淀粉酶两者都产生了双峰式分布——主要的峰中心在2000，第二个最高峰在32,000，具有延伸超过160,000范围的肩部。较低的分子量峰代表了样品总体的大约60％。本发明的示例性淀粉酶在2000处显示出一个单峰，在高于30,000时极小极少。

HPLC

通过本发明的示例性淀粉酶SEQ ID NO：6和SEQ ID NO：437以及商业的地衣芽孢杆菌和商业的嗜热脂肪芽孢杆菌淀粉酶产生的DE为12和18的糖浆通过HPLC来分析。两种技术产生了每一类淀粉酶的指纹特征；对于地衣芽孢杆菌淀粉酶和嗜热脂肪芽孢杆菌淀粉酶以及本发明的示例性淀粉酶，寡糖型有所不同。本发明的液化糖浆(例如，通过本发明的方法和/或通过本发明的酶产生的糖浆)的寡糖中表现出具有更大分枝的迹象。HPLC仅仅辨认了在＜DP15的范围内的寡糖——更大的片段在这些技术中是看不见的。已知芽孢杆菌淀粉酶以这样的方式液化淀粉，即，支链淀粉部分不如直链淀粉部分水解地彻底。这些＞DP39的支链淀粉片段被包含在中心为32,000的高的分子量部分中，从而，在芽孢杆菌液化糖浆的HPLC分析中看到极少的分枝迹象。来自本发明的淀粉酶的＜DP15寡糖含有来自直链淀粉和支链淀粉的片段。

实施例13：在酸性条件下使用本发明的淀粉酶的淀粉液化

本发明提供了使用本发明的淀粉酶液化淀粉的方法，所述淀粉酶包括在酸性条件下有活性的淀粉酶，例如在大约pH 4.0到5.0之间如pH 4.5具有活性。淀粉到葡萄糖的转化可以通过两种酶的顺序作用来催化：本发明的α-淀粉酶用以液化淀粉(例如高分子量葡糖聚合物通过本发明的淀粉酶水解为含有2到20个单糖单元的寡糖，典型的葡萄糖当量为10到12)，随后用葡糖淀粉酶进行糖化(该葡糖淀粉酶可以是本发明的葡糖淀粉酶)。一方面，加工是在玉米湿磨工厂中发生，产生具有一定pH例如约4.0到4.5的淀粉浆状物。一方面，pH在液化前被提高，例如提高到5.8到6.0，以便适应具有低pH活性和稳定性的α淀粉酶(其可以是本发明的α淀粉酶)。一方面，本发明的淀粉酶可以在pH 4.5将淀粉液化到葡萄糖当量在12到18的范围；一方面，以每吨淀粉大约3到6克的水平使用本发明的α淀粉酶。在这方面，使用本发明的α淀粉酶时可以让淀粉液化在pH 4.5进行。

一方面，使用本发明的淀粉酶，淀粉液化在pH 4.5进行，在105℃5分钟，至在95℃进行90分钟。调节酶的数量，以便可以调节液化后的目标DE为12到15。一方面，然后用葡糖淀粉酶例如曲霉菌葡糖淀粉酶糖化液化的淀粉，在大约pH 4.5和60℃糖化大约48小时。如果糖化的糖浆不含有至少95％葡萄糖，那么将目标液化DE提高，重复糖化过程，直到该液化过程最终产生了含有超过95％葡萄糖的糖化糖浆。产生用于糖化的合适的液化供给料所需要的淀粉酶蛋白通过PAGE来确定。

实施例14：使用本发明的淀粉酶的淀粉液化

该实施例描述了使用本发明的淀粉酶液化淀粉的示例性方法，表征了本发明的示例性酶SEQ ID NO：6和SEQ ID NO：437(由SEQ ID NO：436编码)与商业的地衣芽孢杆菌和嗜热脂肪芽孢杆菌淀粉酶的液化寡糖型(patterns)。这些结果将糖化过程和由本发明的酶和商业淀粉酶产生的糖浆的最终葡糖水平进行了比较。

三种商业酶，Genencor Spezyme AA和两种其它的酶都要求超过两倍的推荐剂量，才能获得目标葡萄糖当量(DE)。葡萄糖当量(DE)是用于量度总还原糖的浓度的工业标准，以基于干重量的D-葡萄糖来计算。未水解的颗粒淀粉的DE实际上为零，尽管D-葡萄糖的DE被定义为100。

这些结果证实了所有芽孢杆菌淀粉酶的“双倍剂量”效果，并且更加相信，SEQ ID NO：437在所述实验中的观察剂量也是在更正常的条件下所需要的值的两倍。规划的“正常”剂量，在pH 4.5时可以达到19DE的60-70单位/千克淀粉，是与实验室液化数据一致的。

本发明的淀粉酶产生的寡糖型与芽孢杆菌情况不同。芽孢杆菌淀粉酶(通过带有光散射和粘度检测的凝胶渗透层析)的分子量分布是双峰的，在非常高的分子量范围(＞30,000)甚至在18DE有明显的级分。SEQ ID NO：437在18DE表现出均匀的分布，没有超过20,000的部分。这与本发明的糖浆(例如用本发明的方法产生的糖浆，或者使用本发明的酶制备的糖浆)的更低的粘度是一致的。通过HPLC测定的DP(聚合度)特征也反映了在作用模式上的这一差别。

在该研究中以及在先前的研究中，在本发明的淀粉酶液化糖浆和芽孢杆菌糖浆的糖化之后，最终的葡萄糖水平在两种情况下是相同的。然而，糖化数据，例如来自GPC研究的数据，证实了针对本发明的淀粉酶的非葡糖残余物与芽孢杆菌淀粉酶糖浆是不同的。尽管葡萄糖和麦芽糖水平对于两者是基本相同的，但本发明的淀粉酶具有更高的DP3级分，但所述的“更高级分(highers)”相对于芽孢杆菌酶来说量是更低的。与液化后不存在高分子量级分这一结果相一致的是，本发明的糖化后糖浆的＞DP7级分的含量更低。

通过热处理、细胞洗涤、碱提取，使用微量过滤和超滤，用发酵肉汤制备得SEQ ID NO：437淀粉酶浓缩物(48％总产率)。用乙酸使UF浓缩物变为中性，用pH4.5的30％甘油进行配制。浆状制剂的活性水平代表了商业上的产品(120U l/g-0.5kg/吨淀粉)。

实施例15：用于洗衣和自动洗碗应用的碱性淀粉酶

一方面，本发明提供了包括本发明的淀粉酶的去污剂，包括在碱性条件下有活性的淀粉酶，以及它们的制备和应用方法。

针对在洗衣和自动洗碗(ADW)应用中重要的性质，将本发明的三种碱稳定淀粉酶与商业基准酶进行比较，这三种碱稳定淀粉酶的表现比商业基准酶更优越：

○在使用淀粉涂覆载片的ADW洗涤测试中，具有在SEQ ID NO：212(由SEQ ID NO：211编码)中所示的序列的淀粉酶的表现比纯化的商业基准酶更优越，而且对过氧化氢具有很好的抗性。

○在存在洗衣/ADW制剂的情况下，使用可溶性底物，具有在SEQ IDNO：210(由SEQ ID NO：209编码)和SEQ ID NO：212(由SEQ ID NO：211编码)中所示的序列的淀粉酶，在性能上比纯化的商业基准酶优越。

○在存在鳌合剂的情况下，具有在SEQ ID NO：439(由SEQ ID NO：438编码)中所示的序列的淀粉酶非常稳定，具有在SEQ ID NO：441(由SEQ ID NO：440编码)中所示的序列的淀粉酶中度稳定。

○具有SEQ ID NO：210(由SEQ ID NO：209编码)中所示的序列的淀粉酶和具有SEQ ID NO：212(由SEQ ID NO：211编码)中所示的序列的淀粉酶，以及具有SEQ ID NO：441(由SEQ ID NO：440编码)中所示的序列的淀粉酶具有强碱性最适pH，范围在10-11之间。具有SEQ ID NO：445(由SEQ ID NO：444编码)中所示的序列的淀粉酶和具有SEQ ID NO：439(由SEQ ID NO：438编码)中所示的序列的淀粉酶具有大约8的最适pH，而在pH 10保持了显著的活性。

○具有在SEQ ID NO：441(由SEQ ID NO：440编码)中所示的序列的淀粉酶和具有SEQ ID NO：439(由SEQ ID NO：438编码)中所示的序列的淀粉酶是嗜热的，在65℃到70℃发挥最佳性能。

生物化学表征

正如表1所描述的，表征了本发明的五种淀粉酶的最适pH和最适温度，其中的三种淀粉酶具有碱性最适pH。“SEQ ID NOS：209，210”是指具有由SEQ ID NO：209编码的SEQ ID NO：210中所示的序列的淀粉酶，等等。

表1

淀粉酶	最适pH	最适温度(℃)^*
			SEQ ID NO：209，210	11	55
SEQ ID NO：211，212	10	50
			SEQ ID NO：440，441	10	70
SEQ ID NO：444，445	8	40
			SEQ ID NO：438，439	8	65

最适温度，对于具有在由SEQ ID NO：209编码的SEQ ID NO：210(“SEQ IDNOS：209，210”)、SEQ ID NOS：211，212和SEQ ID NOS：440，441中所示的序列的淀粉酶，是在pH 10时被测定；对于具有在SEQ ID NOS：444，445和SEQ ID NOS：438，439中所示的序列的淀粉酶，是在pH 8时被确定。

在图1中显示了本发明的淀粉酶与当前在商业洗衣/ADW产品中使用的基准酶相比较的pH特征。本发明的所有酶显示在pH 8和10之间具有最适活性，而商业基准酶在低于pH 8最有活性，在pH 10仅仅具有残余活性。图19显示了本发明的受测淀粉酶和商业基准酶的pH特征。将纯化蛋白加入到含有可溶性底物的指示pH的缓冲液中，并测量活性。计算在10分钟内的初始速率，并转换为最大速率的百分比。

图20给出了本发明的酶的温度特征。三种酶在45℃和55℃之间最有活性，而具有SEQ ID NO：441(由SEQ ID NO：440编码)(“SEQ ID NO：440，441”)和SEQ ID NO：438，439中所示的序列的淀粉酶在60℃到70℃之间具有最适活性。图20显示了本发明的受测淀粉酶的温度活性曲线。纯化的蛋白的活性在指示的温度下在pH 10(SEQ ID NO：209，210、SEQ ID NO：211，212、SEQ ID NO：440，441)或pH 8(SEQ ID NO：444，445、SEQ ID NO：438，439)被测量。当使用BODIPY淀粉时，通过还原糖测定法或者通过监控520nm(485nm激发)处的荧光来测量活性。计算初始速率，并转换为最大速率的百分比。

应用测试

设计实验以评价本发明的受测碱性淀粉酶在洗衣/ADW制剂中的活性和稳定性，分别地考虑各组分。图21、22和23给出了使用可溶性淀粉底物的实验的结果。图24给出了使用固相底物——行业标准的淀粉包被载片的结果。

具有SEQ ID NO：439(由SEQ ID NO：438编码)(“SEQ ID NO：438，439”)中所示的序列的淀粉酶对鳌合剂EDTA具有非常强的抵抗力(图21)，SEQ ID NO：211，212对过氧化氢显示出显著抗性(图22)。相反，商业基准酶在该实验的条件下在存在任一种组分的情况下均不发挥作用。在存在完整的洗衣/ADW制剂的情况下，SEQ ID NO：209，210和SEQ ID NO：211，212与商业基准酶相比，对可溶性底物更有活性(图23)。

图21显示了存在EDTA的情况下的酶活性。在存在或不存在5mM EDTA的情况下，在50℃将纯化的蛋白温育指定的时间，然后使用可溶性底物测量残余淀粉酶活性。在存在EDTA情况下的活性以不存在鳌合剂情况下的活性的百分比来表示。图22显示了在存在过氧化氢的情况下的酶活性。在存在或不存在1M H₂O₂的情况下，在50℃将纯化的蛋白温育指定的时间，然后使用可溶性淀粉酶测量淀粉酶活性。在存在过氧化氢的情况下的活性以不存在H₂O₂情况下的活性的百分比来表示。图23显示了在带有可溶性底物(BODIPY-淀粉)的ADW溶液(蒸馏水、硬化溶液、漂白剂、鳌合剂、表面活性剂)中的酶活性。在存在洗衣/ADW制剂的情况下，纯化的蛋白与可溶性淀粉在40℃发生反应。计算5分钟内的初始速率，以每ng蛋白的荧光单位(FU)/s来表示。

在这些实验中出现的对可溶性底物具有好的表现的酶是具有SEQ ID NO：210(由SEQ ID NO：209编码)(“SEQ ID NO：209，210”)和SEQ ID NO：211，212中所示的序列的淀粉酶。这些淀粉酶，连同SEQ ID NOS：440，441，与商业基准酶在采用了淀粉包被载片的行业标准洗涤测试中进行比较。这些实验的结果表示在图24中。具有SEQ ID NO：212(由SEQ ID NO：211编码)中所示的序列的酶在该测试中始终比纯化的基准酶优越，尽管配制的基准酶显示出较好的性能。基准商业制剂的性质是未知的，但纯化的基准酶在存在牛血清白蛋白(BSA)的情况下显示出双倍的活性增加。图24显示了淀粉涂覆载片的洗涤测试的结果。在存在ADW溶液(蒸馏水、水硬化溶液、漂白剂、鳌合剂、表面活性剂)的情况下，在50℃将纯化的蛋白与载片温育30分钟。测量淀粉的去除情况，这是通过比较在酶处理之后与载片初始的重量而得到的重量损失来进行的。

示例性淀粉酶的特征的总结

编码具有在SEQ ID NO：212(由SEQ ID NO：211编码)(“SEQ ID NO：211，212”)中所示的序列的淀粉酶的基因是从环境文库分离出的，所述环境文库是从pH 11.0和温度为41℃的群落生境(biotope)收集的。由该基因编码的淀粉酶属于家族I，并且不含有任何已知的淀粉/碳水化合物结合结构域。蛋白已经被表达，其具有和不具有C末端组氨酸标记，并且被表达在非糖基化宿主和糖基化宿主中。以所有的这些宿主/His标记组合方式来表达的酶具有大约10的最适pH，大约50℃的最适温度(图19和20所代表的实验)。在糖基化宿主中表达的具有His标记物的酶被用于图21到24所代表的实验。His标记的存在似乎不影响比活性，然而，糖基化似乎导致比活性略微地低于没有糖基化时的比活性。

总结：

●在这些应用分析测定中表现最好的是具有在SEQ ID NO：212(由SEQ IDNO：211编码)(“SEQ ID NO：211，212”)中所示的序列的淀粉酶。

●SEQ ID NO：211，212的最适pH和最适温度满足洗衣/ADW应用的需要，适当地配制的SEQ ID NO：211，212将超过商业基准酶的性能。

实施例16：热稳定葡糖淀粉酶的鉴定和表征

下述实施例描述了具有葡糖淀粉酶活性的本发明的示例性热稳定淀粉酶的鉴定和表征。

核酸提取：丝状真菌棉状嗜热丝孢菌(Thermomyces lanuginosus)ATCC 200065在马铃薯葡萄糖培养基(Difco，BD，Franklin Lakes，NJ)中液体培养。收集生物材料，使用DNEASY^TM(DNeasy)Plant Maxi Kit(Qiagen，Valencia，CA)按照标准的实验方案分离高分子量基因组DNA。也按照标准的实验方案使用RNEASY^TM(Rneasy)Plant Maxi Kit(Qiagen，Valencia，CA)分离总RNA。

文库构建：用限制酶部分地消化嗜热真菌(Thermomyces)基因组DNA，介于1-10kb的片段被纯化以用于构建基因组文库。将片段连接到载体λZap Express^TM(Stratagene，San Diego，CA)中，按照制造商的说明书将其包装到感染性噬菌体中。

文库筛选：用上述λ文库感染上层琼脂中的XL1 Blue MRF’细胞(Stratagene)。将大约50,000pfu的噬菌体加入到600ul的细胞中，OD600＝1。于37℃在水浴中将该混合物温育15分钟，然后加入到6ml熔化的0.7％顶层琼脂中，铺于NZY琼脂平板。然后在39℃将平板温育过夜。将尼龙环(F.Hoffmann-La Roche Ltd.，BaselSwitzerland)放置于所得到的噬菌斑菌苔的顶部，随后提起，让一些噬菌体粘附到尼龙上。将尼龙浸没在1.5M NaCl、0.5M NaOH中2分钟，1.5M NaCl、0.5M TrispH 7.6中5分钟，以及2X SSC，0.2M Tris pH 7.6中30秒。然后在Stratagene交联器(corsslinker)中对尼龙滤膜(nylon filter)进行UV交联。

来自黑曲霉的葡糖淀粉酶基因的639bp PCR片段由曲霉基因组DNA产生，以用作探针。引物(5’-GCGACCTTGGATTCATGGTTGAGCAAC-3’(SEQ ID NO：595)和5’-CACAATAGAGACGAAGCCATCGGCGAA-3’)(SEQ ID NO：596)在PCR反应中使用，该反应使用了Expand High Fidelity PCR Kit^TM(Roche)，在热循环器中进行了30个循环：95℃20秒，55℃30秒，和72℃1分钟。该PCR片段由曲霉葡糖淀粉酶基因的外显子1-4构成。按照制造商的说明书，使用Prime It Kit^TM(Stratagene)将分离的PCR片段制备为放射性探针。

在杂交炉(Robbins)中，于42℃用预杂交溶液(DIG Easy Hyb^TM，Roche)将文库滤膜提起物洗涤2小时。将探针加至15ml新鲜DIG Easy Hyb^TM中，用来替换预杂交溶液。用探针将滤膜于45℃洗涤过夜。然后移去探针，用2X SSC、0.1％SDS将滤膜洗涤一次，洗涤15分钟，用0.1X SSC、0.1％SDS洗涤两次，每次洗涤15分钟。然后将尼龙滤膜于-80C暴露于X射线胶片过夜。在显影后，用X射线胶片上的杂交斑点来鉴定来自原始平板的克隆。从平板上排列有斑点的地方取出琼脂团，并悬浮在SM缓冲液中，以便将噬菌体释放到溶液中。与含有所有或部分的葡糖淀粉酶基因的嗜热真菌基因组片段相对应的数个分离的噬菌斑由此得到分离。

将100ul分离的噬菌体原液加至200ul XL-1 Blue MRF’细胞(Stratagene)和1ul ExAssist^TM辅助噬菌体(Stratagene)中。于37C温育混合物15分钟，加入3ml的2X YT培养基。然后将其于37℃振荡温育2.5小时。然后将该混合物于70℃加热20分钟，冰上冷却。取出100ul的混合物，加至200ul SOLR细胞(Stratagene)中，于37C培养15分钟。将50ul平铺于LB卡那霉素(50ug/ml)平板上，于37℃培养过夜。得到的菌落含有位于质粒pBK-CMV中的克隆基因组片段。

测序：用BigDye Terminator Cycle Sequencing Version 2.0Kit^TM(AppliedBiosystems，Foster City，CA)和3700DNA Analyzer^TM(Applied Biosystems)，使用制造商的实验方案对备选克隆进行DNA测序。鉴定出带有整个葡糖淀粉酶基因和侧翼序列的4.1kb插入物的基因组克隆，正如SEQ DI NO：587中所示。通过将该序列与曲霉中的内含子的共有序列进行比较，鉴定出潜在的内含子。棉状嗜热丝孢菌核苷酸序列具有编码617个氨基酸的蛋白的开放阅读框，被四个分别为64bp、61bp、80bp和57bp的内含子中断。

cDNA合成：使用制造商的实验方案，使用Thermoscript rtPCR Kit^TM(Invitrogen)进行cDNA合成反应，其中使用引物5’-ATGTTATTCCAACCGACTTTGTGCGC-3’(SEQ ID NO：597)和5’-TCATCGCCACCAAGAATTCACGGTG-3’(SEQ ID NO：598)。用于合成的模板是分离自在马铃薯葡萄糖培养基(Difco)中培养的棉状嗜热丝孢菌细胞的总RNA。来自该反应的1854bp片段被分离、克隆和测序，该核苷酸序列如SEQ ID NO：593中所示。

表达克隆：对引物进行设计，以在巴斯德毕赤酵母(Pichia pastoris)宿主中过量表达嗜热真菌葡糖淀粉酶。用引物5’-GTCTCGAGAAAAGAGCAACGGGCTCGCTCGAC-3’(SEQ ID NO：599)和5’-GTTCTAGATCATCGCCACCAAGAATTCACGGT-3’(SEQ ID NO：600)产生PCR片段，用cDNA克隆作为模板，使用了30个循环：95℃20秒，55℃30秒，72℃2分钟，使用Expand High Fidelity PCR Kit^TM(Roche)和制造商方案。用限制酶Xho I和Xba I消化PCR片段，并连接到质粒pPIC Zα(Invitrogen)的相应限制位点中。将构建物转化到巴斯德毕赤酵母菌株X-33(Invitrogen)中，在该菌株中构建物稳定地整合到毕赤染色体中。基于对zeocin的抗性进行选择。该构建物是经设计的，以便毕赤克隆可以用甲醇诱导，从而将成熟的嗜热真菌葡糖淀粉酶分泌到培养基中。

用在BMGY中的过夜起动培养物接种毕赤表达克隆的1升培养物，于30℃在摇瓶中培养过夜。次日通过离心收集细胞，重悬于1升BMMY中。于30℃在摇瓶中将细胞培养3天，每24小时加入一次甲醇，至最终0.5％。然后收集含有表达的葡糖淀粉酶的培养基，在葡糖淀粉酶活性分析中进行测试，使用标准的方案进行SDS PAGE电泳以确定蛋白大小。

也设计用于在大肠杆菌中过量表达嗜热真菌葡糖淀粉酶基因的引物。如同前述，使用引物(SEQ ID NO：601)5’-GTCCATGGCAACGGGCTCGCTCGAC-3’和(SEQ ID NO：602)5’-GTTCTAGATCATCGCCACCAAGAATTCACGGT-3’从cDNA模板产生PCR产物。用限制酶Nco I和Xba I消化PCR片段，并连接到质粒pSE420(Invitrogen)的相应限制位点。将构建物转化到大肠杆菌菌株XL-1BlueMR(Stratagene)中。质粒的选择是基于氨苄青霉素抗性。葡糖淀粉酶基因处于该质粒载体中的lac-z启动子的控制下，用IPTG(异丙基-硫代-吡喃型半乳糖苷)诱导。设计构建物，以便成熟的葡糖淀粉酶基因可以在大肠杆菌细胞中被表达，并且在N末端上将含有额外的甲硫氨酸残基。

标准的测定法：将等份酶样品加至水浴中的5mM缓冲液、3mM麦芽-寡糖(Sigma，M-3639)的溶液中。在某些时间点取出100ul等份物至200ul葡萄糖氧化酶试剂(Sigma，GAGO-20)中，并于37℃培养30分钟。加入12N磺酸终止反应，测定540nm处的吸光度。测试全长形式的酶(SEQ ID NO：594)的pH、温度和底物利用。正如下面所提到的，数据表明最适pH在大约pH 5.5。数据表明该酶(SEQ ID NO：8)在70℃是稳定的，活性在70℃到75℃之间具有快速的不可逆的损失。数据表明该酶(SEQ ID NO：594)将寡糖水解为麦芽糖，对于更长的糖，水解速率更高。切裂1，6键的速率大大低于1，4键，正如在底物潘糖中所观察到的，该底物在非还原末端具有1，6键。催化结构域的形式似乎稳定性较低。该酶(SEQID NO：594)在50℃具有很好的水解速率，但在70℃似乎不能生存。

活性测定：通过由寡糊精(oligo-dextrin)底物释放出的游离葡萄糖，来测量酶(SEQ ID NO：594)活性。被释放的自由葡萄糖在偶联反应中被氧化，导致产生有色产物。将酶(SEQ IDNO：594)等份物加入到水浴中的5mM缓冲液、3mM麦芽-寡糖(Sigma，M-3639)的溶液中。在某些时间点取出100ul等份物至200ul葡萄糖氧化酶试剂(Sigma，GAGO-20)中，于37℃温育30分钟。加入12N磺酸终止反应，测定540nm处的吸光度。然后就时间点进行绘图，以确定反应的相对速率。

pH特征：在活性测定中使用乙酸盐缓冲液(pH 4.0、4.5、5.0和5.4)以及磷酸盐缓冲液(pH 6.2、7.0、8.1)，以确定葡糖淀粉酶(SEQ ID NO：594)在每一pH的相对速率。然后就速率进行绘图，正如图5所示。该酶(SEQ ID NO：594)似乎在大约pH 5.5具有最大活性。

温度特征：确定该酶(SEQ ID NO：594)在乙酸盐缓冲液pH 5.3中，在各种温度下(50℃、60℃、70℃、80℃和85℃)的相对速率。对速率进行绘图，如图6所示。该酶(SEQ ID NO：594)似乎在70℃具有最大活性，高于该温度，活性便有很大的损失。

温度稳定性数据：在指定的温度下将酶(SEQ ID NO：594)加入到5mM乙酸盐缓冲液中。以4分钟的时间间隔将酶(SEQ ID NO：594)等份取出到冰上。然后于70℃测试所述等份对底物的活性，测试20分钟，数据如图7所示。

底物利用：在活性测定法中，用糊精麦芽糖(G2)、麦芽三糖(G3)、潘糖(Pan)、麦芽四糖(G4)和麦芽七糖(G7)代替麦芽寡糖，以测试葡糖淀粉酶(SEQ IDNO：594)的底物利用。在70℃测试各种底物在5mM乙酸盐缓冲液中的葡萄糖释放速率。被测试的底物：麦芽糖、麦芽三糖、潘糖、麦芽四糖和麦芽七糖都为3mM。然后对测定结果绘图，显示在图8中。酶(SEQ ID NO：594)能将直链(1，4键)糊精水解为麦芽糖，对于更长的糊精，速率则更高。正如在底物潘糖的情况中所显示的，该酶(SEQ ID NO：594)在1，6键上的活性较低。

实施例17：葡糖淀粉酶活性分析：BCA还原端测定

下述实施例描述了用于确定多肽是否在本发明的范围内的示例性方法，例如通过BCA还原末端测定法来进行。可以使用下述方法来确定葡糖淀粉酶活性。

1.如下制备两份底物溶液：

c)2％可溶性淀粉(马铃薯)pH 8溶液，通过将2gm马铃薯淀粉溶解在100ml 100mM磷酸钠pH 8中制备。

d)2％可溶性淀粉(马铃薯)pH 10溶液，通过将2gm马铃薯淀粉溶解在100ml 100mM碳酸钠中制备。

4.制备溶液A和B的1∶1定量的工作试剂。

11.用每一样品本身的t＝0，对每一样品的时间点进行校准(从其它的平均A560值中减去平均的t＝0A560值)。将A560_(实验值)转换为umol(用A560_(实验值)除以标准曲线的斜率(A560/umol))。得到时间点和umol的斜率(单位为umol/min)，乘以100(这是由于该umol值仅仅代表了该测定法中所用的10ul，而不是在1ml rxn中产生的量)。为了得到比活性，用斜率(单位为umol/min)除以蛋白质的mg数。所有点应当最少重复两次，三次是最佳的。用蛋白质浓度(mg/ml)除以稀释度，得到该测定法中所使用的mg。用上述斜率除以该测定法中所使用的mg，得到比活性。例如参见Wong(2000)J.Agric.Food Chem.48：4540-4543；Fox(1991)Anal.Biochem.195，93-96。

实施例18：葡糖淀粉酶活性的筛选

下述实施例描述了用于确定多肽是否在本发明范围内的示例性方法。克隆的葡糖淀粉酶活性可以通过本技术领域已知的多种方法来评价。下面是可以使用的一般方法。

被筛选的噬菌斑的数量，每一平板可以是大约10,000pfu’s。对于每一DNA文库：每个分离的文库为大约50,000个噬菌斑，每个未分离的文库为大约200,000个噬菌斑，它们可以根据λZap Express扩增的裂解物的pfu滴定来筛选。

λ文库的滴定测定

8)将数μL的λZap Express扩增文库原液加入到600μL大肠杆菌MRF’细胞(OD₆₀₀＝1.0)中。为了稀释MRF原液，使用10mM MgSO₄。

9)于37℃温育15分钟。

10)于50℃转移悬液至5-6mL的NZY上层琼脂中，轻轻地混合。

11)立即将琼脂溶液倒入大(150mm)NZY培养基平板中。

12)使顶层琼脂完全凝固(大约30分钟)，然后倒置平板。

13)于39℃将平板温育8-12小时。

14)大约估计噬菌斑的数量。确定噬菌体滴定量以得到10,000pfu/平板。如果需要，用SM缓冲液稀释文库噬菌体的等份样品。

底物筛选

13)将来自扩增文库的λZap Express(50,000pfu)加入到600μL的大肠杆菌MRF’细胞中(OD600＝1.0)。对于非环境文库，准备4个管子(每一管子为50,000pfu)。

14)于37℃温育15分钟。

15)当温育噬菌体/细胞悬液时，于50℃将1.0mL红色淀粉底物(1.2％w/v)加入到6.0mL NZY顶层琼脂中，并且彻底混合。保持该溶液于50℃直到被使用。

16)转移1/5(10,000pfu)的细胞悬液至底物/上层琼脂溶液中，轻轻地混合。

17)立即将溶液倒入大(150mm)NZY培养基平板中。

18)使上层琼脂完全凝固(大约30分钟)，然后倒置平板。

19)对于剩余细胞悬液，将步骤4-6重复4次(每次1/5悬液)。

20)在39℃温育平板8-12小时。

21)观察平板上噬菌斑周围的透明圈(晕圈)。

22)从琼脂的中心挖取有晕圈的噬菌斑，转移至无菌微量管中。大孔的200μL移液管尖头刚好能移出(挖取)含有期望噬菌斑的琼脂团。

23)噬菌体重悬于500μL SM缓冲液中。加入20μL氯仿以抑制任何进一步的细胞生长。

24)在下一个步骤之前，在室温下将纯的噬菌体悬液培养4小时或过夜。

纯克隆的分离

12)将10μL重悬的噬菌体悬液加入到500μL大肠杆菌MRF’细胞中(OD600＝1.0)。

13)于37℃温育15分钟。

14)当温育噬菌体/细胞悬液时，于50℃将1mL红色淀粉底物(1.2％w/v)加入到6.0mL NZY顶层琼脂中，并且彻底混合。于50℃保持该溶液直到被使用。

15)转移细胞悬液至底物/上层琼脂溶液中，轻轻地混合。

16)立即将溶液倒入大(150mm)的NZY培养基平板中。

17)使上层琼脂完全凝固(大约30分钟)，然后倒置平板。

18)将平板在39℃温育8-12小时。

19)观察平板上单个噬菌斑(纯的克隆)周围的透明圈(晕圈)。如果单个噬菌斑不能被分离，那么调节滴定量，将噬菌体悬液重新铺平板。

20)从琼脂的中心挖取有晕圈的单个噬菌斑，转移到无菌微量管中。大孔200μL移液管尖头刚好能取出(挖取)含有期望噬菌斑的琼脂物。为了扩增该滴定量，将5个单一活性噬菌斑的中心挖取到微量管中。

21)噬菌体重悬于500μL SM缓冲液中。加入20μL氯仿以抑制任何进一步的细胞生长。

22)在下一个步骤之前，在室温下将纯的噬菌体悬液培养4小时或过夜。将DMSO加入到噬菌体悬液(7％v/v)中，将纯噬菌体悬液储存于-80℃。

纯克隆的切出

17)将100μL纯的噬菌体悬液加入到200μL大肠杆菌MRF’S细胞中(OD600＝1.0)。向其中加入1.0μL EXASSIST辅助噬菌体(＞1x10⁶pfu/mL；Stratagene)。使用2059Falcon管子用于切出。

18)悬液于37℃温育15分钟。

19)将3.0mL的2x YT培养基加入到细胞悬液中。

20)于30℃温育至少6小时或过夜，同时振荡。

21)转移管子到70℃20分钟。噬粒悬液可以于4℃储存1到2个月。

22)转移100μL噬粒悬液至含有200μL大肠杆菌Exp505细胞(OD 600＝1.0)的微型管子中。

23)悬液于37℃温育15分钟。

24)将300μL SOB加入到悬液中。

25)悬液于37℃温育30到45分钟。

26)转移100μL悬液至小(90mm)的LB培养基平板中，对于Zap ExpressDNA文库，该培养基平板含有卡那霉素(含有50μg/mL卡那霉素的LB培养基)，或对于Zap II DNA文库，该培养基平板含有氨苄青霉素(含有100μg/mL的LB培养基)。

27)转移剩余悬液至另一个小的LB培养基平板中。

28)使用无菌玻璃珠子将悬液均匀地分布在平板上。

29)将平板30℃温育12到24小时。

30)观察平板上的菌落。

31)将单个菌落接种到含有合适的抗生素的LB液体培养基中，并且于30℃培养12到24小时。

32)将80％甘油加入到液体培养物中(15％v/v)配制甘油原液，并且储存于-80℃。

活性确证

7)转移50μL的液体培养物至微型管子中。将500μL的8％pH 7支链淀粉天青(Amylopectin Azure)加入到同一管子中。对每一克隆准备2个管子。

8)在50℃测试活性，3小时和过夜。使用pH 7缓冲液作为对照。

9)受测样品在冰水浴中冷却5分钟。

10)加入750μL Ethaqnol并彻底混合。

11)13000rpm(16000g’s)离心5分钟。

12)测量上清液在595nm处的OD值。

RELP分析

13)转移1.0mL液体培养物至无菌微型管子中。

14)13200rpm(16000g’s)离心1分钟。

15)弃上清。将另外的1.0mL液体培养物加入到同一无菌微型管子中。

16)13200rpm(16000g’s)离心1分钟。

17)弃上清。

18)按照QIAprep spin mini试剂盒实验方案进行质粒分离。

19)使用BioPhotometer检查DNA浓度。

20)对于第一次双重消化，使用Sac I和Kpn I。于37℃温育1小时。

21)对于第二次双重消化，使用Pst I和Xho I。于37℃温育1小时。

22)将加样染料加入到被消化的样品中。

23)在1.0％琼脂糖凝胶上将被消化的样品于120伏进行电泳1-1.5小时。

24)用凝胶成像仪观察凝胶。具有不同消化谱型的所有克隆将被送去进行序列分析。

实施例19：葡糖淀粉酶的分析

宿主培养物的制备

7.在37℃振荡器中培养，直到OD到达0.75-1.0。

9.将少量宿主细胞稀释到OD1，用于在滴定和pintooling中使用。

滴定λ文库

11.放置三个无菌离心管于支架上。

15.通过37℃培养15分钟，使噬菌体吸附到宿主上。

19.倒置平板，于37℃培养过夜。

葡糖淀粉酶的λ微量滴定筛选

准备

5.根据计划的筛选数量，制备足量的XL1-Blue MRF’宿主培养物，如上描述。100mL的培养物通常足以筛选2-3个文库。

6.用高压锅对与QFill2分液器相容的几个瓶子进行消毒。这些是宽口Corning瓶，250mL，在瓶口边缘有密封圈。

7.确保有适用于筛选的足量平板、上层琼脂、BODIPY淀粉、红色淀粉溶液，等等。

8.确定第二天自动操作的进度。

第一天

10.用文库筛选和平板数来标记1536孔平板(黑色)。Tough-Tags^TM粘胶管被横向分成两半，其对于标记1536孔平板是理想的。

11.计算筛选必需的文库、宿主细胞和NZY培养基的量。这可以使用Excel电子表格容易地进行。

12.将计算好量的λ文库和OD5宿主细胞混合在无菌250mL宽口Corning瓶子(带有密封圈)中。

13.在37℃保持15分钟，让吸附发生。

14.加入计算好量的NZY培养基，并且混匀。这被称作细胞-噬菌体-培养基悬液。

15.通过将50uL的细胞-噬菌体-培养基悬液与250uL的OD1宿主细胞在Falcon 2059管子中混合，然后用9mL上层琼脂铺于150mm NZY平板上，进行伴随(concomitant)滴定测定。于37℃温育伴随滴度平板过夜。

16.分液器加样剩余悬液，以每孔4uL来安排每一标记的1536孔平板。如果分液器在一些孔中留下气泡，这些气泡可以通过在200xg将平板离心1分钟被去除。

17.在至少两个测定平板的孔位置AD46中加入0.5uL的阳性对照噬菌体。对于该目的，使用强淀粉酶阳性λ克隆。SEQ ID NO.：113或SEQ ID NO.：199的λ版本是阳性对照的很好选择。

18.在加湿(≥95％)的培养箱中于37℃温育测定平板过夜。

第二天

21.计算伴随滴定平板的pfu，确定每孔的平均种子密度(以pfu/孔为单位)。

22.Pintool每一文库筛选的至少两个平板(优选地是含有阳性对照的两个平板)，如下：

d)更换盖子，倒置，于37℃温育过夜。

23.如下制备2X BODIPY淀粉底物缓冲液：

b)收回足量的0.5mg管的BODIPY淀粉，以产生所需体积的2X底物缓冲液[在上面的步骤a中计算的]，终浓度为20-30ug/mL。

d)每一管子中加入50uL 100mM CAPS缓冲液，pH 10.4，振荡混合。

g)通过包装在箔中，使2X底物缓冲液避光。

24.将平板和底物缓冲液放置到自动化室，用如下参数对自动仪器进行编程：

a)将4uL底物缓冲液分配到每一孔中

c)激发过滤器：485nm；发射过滤器：535nm

d)将Spectrafluor增益设置在70，或为制备的该批2X底物缓冲液设置最适的增益。

e)确保所用的培养箱可保护测定平板，使其避光。

第三天

4.检查被pintool的平板，检查在与相关的测定平板上的孔相对应的所有位置处的细菌菌苔的透明情况。同样检查pin位置的任意位置处的红色淀粉中的透明情况。如果使用含有阳性对照的平板用于pintool，那么应该能在红色背景中观察到大的透明区域。小心在红色淀粉中也可形成透明区域的污染物(参见内容“在红色淀粉中形成透明区域的污染物”)。

5.鉴定由通过自动计算机产生的数据文件获得的推定命中(hits)。用工程学产生的KANAL程序简化了数据分析。作为判断规则，推定命中的特征在于是这样的孔，即，相比于背景，该孔的信号强度在至少1.5倍的增加。

6.对于每一推定，从孔中取出2uL，加入到含有500uL SM缓冲液和50uLCHCl3的管子中。振荡混合，于4℃储存。该溶液在下文将被称作4e-3原液。原始筛选平板应该于4℃储存，避光，至少储存到破解(breakouts)完成。

第一天

25.在一个无菌50mL圆锥管中，混合0.5mL OD5宿主细胞和45.5mL NZY。这将被称作宿主培养基悬液。

26.对于将被分析的每一推定命中，将1mL的宿主-培养基悬液等分到3个无菌离心管的每一个管子中。

27.设置12通道移液器(pipetman)为多次分配模式，等份大小为20uL，等份数量为2x。将一组清洁的无菌吸头装配在移液器上。

28.将1mL宿主-培养基悬液倒入一个新的无菌溶液槽中，并装载多通道移液器。

29.以每孔20uL分配到一个黑色384孔板的最后一行(第P行)(12通道x 2＝24孔)。该行在后面将被用作对照。

30.通过使吸头接触槽的表面并按下移液器上的RESET按钮，排出吸头中的剩余液体。放下移液器，并防止吸头的污染。此时不需要更换吸头。

31.将槽中的剩余液体倒入废弃物容器(像烧杯)中，注意避免溅回污染。

32.对于将被分析的第一个推定，取出111uL的4e-3原液(参见淀粉酶的λ微量滴定筛选中的第二天)，将其加入到含有1mL宿主-培养基悬液的(一组)三个管子的第一个管子中(步骤2)。振荡混合。这就是稀释物A。

33.取出111uL的稀释物A，加入到该组的下一个管子中。振荡混合。这就是稀释物B。

34.取出111uL的稀释物B，加入到该组的最后一个管子中。振荡混合。这就是稀释物C。现在应该有三种噬菌体稀释物，其中每一种稀释物的浓度有10倍的差别。

35.将稀释物C的内容物(三个样品中最淡的稀释物)倒入溶液槽中，装载多通道移液器。

36.以每孔20uL分配到384孔板的第一行(12通道x 2＝24孔)。

37.通过使吸头接触槽的表面并按下移液器上的RESET按钮，排出吸头中的剩余液体。放下移液器，并防止吸头的污染。不需要在此时更换吸头。

38.如上所述倒空溶液槽。

39.将稀释物B的内容物倒入同一槽中，加载多通道移液器。

40.以每孔20uL分配到384孔板的第二行。

41.同样地进行步骤13-16，将稀释物A分配到平板的第三行。

42.在所有三种稀释物已经被排列到平板的前三行后，将所有吸头和溶液槽弃入生物危险性废弃物容器中。

43.将一组清洁的无菌吸头装配到移液器上，打开一个新的无菌溶液槽。

44.针对剩下的每一推定命中，重复步骤8-19，其中利用平板上剩余的行直到第O行。可以在384孔平板上分析五个推定命中，保留最后一行(P行)作为对照。

45.将0.5uL的每一对照加入到分离的孔中。使用至少2-3个分离的对照，优选地覆盖一定范围的活性。

46.在加湿(≥95％)培养箱中于37℃温育测定平板过夜。

第二天

47.使用与“淀粉酶的λ微量滴定筛选”的“第二天”中所描述的方法相同的方法，将所有破解平板pintool到带有红色淀粉的宿主菌苔中，不同的是使用了384位pintool。

48.如下准备2X BODIPY淀粉底物缓冲液：

g)通过包裹在箔中使2X底物缓冲液避光。

49.以每孔20uL分配到所有破解平板中。

50.将所有平板包裹在铝箔中，室温下温育2-6小时。

51.用Spectrafluor读取每一平板，Spectrafluor具有如下设置：

a)荧光读数(激发过滤：485nm；发射过滤：535nm)

b)平板定义：384孔黑色

c)从顶部读数

d)最佳增益

e)闪光数：3

52.在所得到的Excel电子表格中，在独立的图表中绘制每一推定的3行，检查活性。确保阳性对照产生超过背景的信号。

53.对于在孔中似乎具有真实信号的每一推定，如下地从阳性孔中收获样品：

a)代表着最高的初始稀释物的行中选择阳性孔。

b)从该孔将2uL转移到含有500uL SM和50uL CHCl₃的管子中。这被称作破解原液(breakout stock)。

c)储存于4℃。

54.使用先前描述的方法，将大约10uL的每一破解原液铺于使用了红色淀粉的150mm NZY平板上。目标是获得数个(至少20个)独立孔的噬菌斑，从这些噬菌斑挖出分离物。

第三天

55.检查被pintool的平板，检查在与相关的测定平板上的孔相对应的细菌菌苔中可接受的透明发生。同样检查阳性对照组中和任何被测试的推定中的红色淀粉的透明变化。注意在红色淀粉中也会形成透明区域的污染物(参见下面)。

56.从含有破解原液的稀释物的固相平板，挖出几个分离的噬菌斑，将每一个噬菌斑放入具有50uL CHCl₃的500uL SM中。这被称作分离原液。

57.然后可以使用上面描述的方法在BODIPY淀粉上各自独立地测试分离原液。如果步骤2中被挖出的噬菌斑在红色淀粉背景中产生了透明圈，该步骤可以跳过。然后使用上面描述的方法在BODIPY淀粉上各自独立地测试分离原液。然而，如果步骤2中被挖出的噬菌斑在红色淀粉背景中产生了透明区域，那么该步骤可以跳过。

切出

第一天

58.在一个Falcon 2059管子中，混合200uL OD1 XL1-Blue MRF’宿主、100uLλ分离原液和1uL ExAssist噬菌体原液。

59.在37℃振动器中温育15分钟。

60.加入3mLNZY培养基。

61.在30℃振动器中温育过夜。

第二天

10.将切出用管子加热到70℃20分钟。

11.1000x g离心10分钟。

12.在一个Falcon 2059管子中，混合50uL上清液和200uL EXP505 OD1宿主。

13.在37℃振动器中温育15分钟。

14.加入300uL SOB培养基。

15.在37℃振动器中温育30-45分钟。

16.使用无菌玻璃珠子将50uL平铺于大的LB_kan50平板上。如果平板是“干的”，可以加入额外的SOB培养基来帮助分散这些细胞。

17.在30℃将平板培养至少24小时。

18.培养分离物以进行测序和/或RFLP。

在红色淀粉中形成透明区域(透明圈)的污染物

使用RBB淀粉的分析测定

在新的96孔板(V型底)的每一个孔中加入75μl的RBB-淀粉底物(在50mMNaAc缓冲液中，1％RBB不可溶的玉米淀粉，pH＝4.5)。五个微量滴定的酶裂解产物被转移至有底物的每一个孔中，使用Biomek或Zymark。用铝密封带密封平板，在振动器上短暂地振动。90℃培养平板30分钟，随后室温冷却大约5到10分钟。每一孔中加入100微升的100％乙醇，密封平板，在振动器上短暂地振动。然后使用桌式(bench-top)离心机4000rpm离心平板20分钟。用Biomek转移100μl上清液至新的96孔板中(扁平底)，读取OD₅₉₅。

使用FITC-淀粉的分析测定

在新的384孔板的每一孔中加入50μl底物(100mM NaAc缓冲液中，0.01％FITC-淀粉，pH＝4.5)。转移5μl酶裂解产物至有底物的每一孔中，室温温育平板过夜。读取每一孔的底物极化变化，激发485nm，发射535nm。对于所有的分析测定，都可以使用96孔板。

实施例20：液化淀粉和测量结果的示例性方法

下述实施例描述了液化淀粉的示例性方法。反应条件：100mM PO4pH 6.5，1％(w/w)液化淀粉，DE12，55℃。可以进行TLC以及HPLC分析以确认活性。

液化淀粉在pH 6.5糖化的示例性方案：

●称取5克液化淀粉的样品，装入到称过皮重的瓶子中。

示例性的DE确定方法：

示例性的新试铜灵(neocuproine)测定：

示例性的HPLC分析：

示例性的TLC：

反应产物被w/d，以小时计为时间点，点在TLC板上并干燥。然后平板在10∶90水∶异丙醇中处理，并用香兰素染色或CAM染色来显示，然后加热以显示可还原糖。液化淀粉可以被部分地水解为葡糖，此时便观察到了活性。

实施例21：使用葡糖淀粉酶的淀粉液化

该实施例描述了使用本发明的葡糖淀粉酶液化淀粉的本发明的示例性方法。使用微量过滤和超滤，通过热处理、细胞洗涤、碱提取，由发酵肉汤制备得到葡糖淀粉酶浓缩物(48％总产率)。用乙酸使UF浓缩物变为中性，用pH 4.5的30％甘油进行配制。商业产品的活性水平可以是大约120U l/g-0.5kg/吨淀粉。

示例性的葡糖淀粉酶活性测定

将含有950μL的50mM MOPS pH 7.0——其含有5mM PNP-α-D-六-(1→4)-葡糖吡喃糖苷——的1mL小池，放置到预热到80℃的Beckman DU-7400分光光度计的Peltier温度控制器中。分光光度计在405nm处记录空白，小池中加入50μL的酶溶液，混匀，监控OD_405nm在1分钟的时间间隔内的增加。利用950μL 50mMMOPS中的50μl的1μmol/mL PNP在pH 7.0，80℃下的OD_405nm响应，将ΔOD_405nm/ _分钟速率转换为μmol/分钟的标准单位。热稳定α葡糖淀粉酶(DTAA)的一个标准Diversa单位相当于在该测定方法的限定条件下催化1μmol/mL/分钟的pNP释放的酶的量。

标准的葡糖淀粉酶活性测定

葡萄糖当量的确定

新试铜灵分析

残余淀粉测定

使用Staley碘酒方法检查糖化后样品的残余淀粉。

寡糖特征(profiles)

凝胶渗透色谱

毛细管电泳

初次液化

将直接来自GPC过程的线性淀粉泵入60升给料箱中，其中pH、DS(干重)和钙水平可以在液化之前被调节。浆状物中加入淀粉酶。通过正向置换泵以0.7升/分钟将32％DS浆状物泵到喷嘴——一个加压的混合容器，其中淀粉浆状物通过蒸气喷射被瞬间加热到大于100℃。胶凝化的部分液化的淀粉被泵出通过管道网络(仍然在压力下)，以获得在一定温度下的期望驻留时间(5分钟)。将压力释放到闪蒸池中，获取样品。再次获取样品。

二次液化

糖化

液化淀粉冷却到60℃，pH调节到4.5，用葡糖淀粉酶处理样品。用HPLC在一段时间内监控糖化过程。

糖化

糖化进展—葡糖生成百分比(％dextrose development)与时间—0.04％葡糖淀粉酶。

实施例22：在pH 4.5时使用葡糖淀粉酶进行的淀粉液化

淀粉到葡萄糖的转化可以通过两种酶的顺序作用来催化：淀粉酶(例如α-淀粉酶)——包括本发明的酶——将淀粉液化(例如，高分子量葡萄糖聚合物通过本发明的葡糖淀粉酶水解为含有2到20个单糖单位的寡糖，典型地葡萄糖当量(dextrose quivalent)为10到12)，随后用葡糖淀粉酶糖化(该葡糖淀粉酶可以是本发明的葡糖淀粉酶，例如SEQ ID NO：594)。一方面，在玉米湿磨中植物被加工，产生pH大约4.0到4.5的淀粉浆状物。一方面，在液化前将pH提高，例如提高到5.8到6.0，以便适应具有低pH活性和稳定性的葡糖淀粉酶。一方面，本发明的葡糖淀粉酶可以在pH 4.5将淀粉液化到葡萄糖当量在12到18之间；一方面，以每吨淀粉大约3到6克的水平使用本发明的葡糖淀粉酶。在这方面，本发明的葡糖淀粉酶的应用可以使淀粉液化能够在pH 4.5进行。

一方面，使用本发明的葡糖淀粉酶，在pH 4.5进行淀粉液化，在105℃进行5分钟，在95℃进行90分钟。调整酶的数量，从而将液化后的目标DE调节至12到15。一方面，然后用葡糖淀粉酶例如曲霉菌葡糖淀粉酶糖化被液化的淀粉，在大约pH 4.5和60℃糖化进行大约48小时。如果糖化的糖浆不含有至少95％葡萄糖，则将目标液化DE提高，重复糖化过程，直到该液化过程最终的确产生了含有超过95％葡萄糖的糖化糖浆。产生用于糖化作用的合适的液化供给料所需要的淀粉酶蛋白通过PAGE来确定。

已经描述了本发明的大量实施方案。然而，应该理解到可以进行多种变化，而它们并不背离本发明的精神和范围。因此，其它实施方案在权利要求的范围内。

Claims

1.分离的、合成的或重组的核酸，其：

(a)如SEQ ID NO：440所述，其中所述核酸编码为α-淀粉酶的多肽，

(b)编码SEQ ID NO：441所述的多肽，其中所述多肽是α-淀粉酶。

2.表达序列盒、载体或克隆载体，其包括权利要求1中所述的核酸序列。

3.转化细胞，其包括权利要求1中所述的序列。

4.分离的、合成的或重组的多肽，其为α-淀粉酶：

(a)如SEQ ID NO：441所述，

(b)由权利要求1所述的核酸编码。

5.蛋白制剂，所述蛋白制剂包含在权利要求4中所述的多肽，其中所述蛋白制剂包括液体、固体或凝胶。

6.固定化多肽，其如权利要求4中所述，其中所述多肽被固定在：细胞、金属、聚合物、陶瓷、玻璃或石墨颗粒上。

7.权利要求6所述的固定化多肽，其中所述聚合物为树脂。

8.固定化多肽，其如权利要求4中所述，其中所述多肽被固定在：微电极、珠子、凝胶、平板或毛细管上。

9.固定化多肽，其如权利要求4中所述，其中所述多肽被固定在阵列上。

10.用于人或动物的食物添加剂，其包括权利要求4中所述的多肽。

11.用于人或动物的食物，其包括权利要求4中所述的多肽。

12.水解淀粉的方法，包括如下步骤：

(a)提供在权利要求4中所述的多肽；

(b)提供包含淀粉的组合物；和

(c)用步骤(b)的组合物在其中多肽水解淀粉的条件下接触步骤(a)的多肽。

13.液化淀粉的方法，包括如下步骤：

(a)提供在权利要求4中所述的多肽；

(b)提供包含淀粉的组合物；和

(c)用步骤(b)的组合物在其中多肽液化淀粉的条件下接触步骤(a)的多肽。

14.去污剂组合物，所述去污剂组合物包含在权利要求4中所述的多肽。

15.去污剂组合物，所述去污剂组合物包含在权利要求4中所述的多肽，其中所述多肽配制为不含水的液体组合物。

16.去污剂组合物，所述去污剂组合物包含在权利要求4中所述的多肽，其中所述多肽配制为颗粒形式。

17.去污剂组合物，所述去污剂组合物包含在权利要求4中所述的多肽，其中所述多肽配制为凝胶形式。

18.去污剂组合物，所述去污剂组合物包含在权利要求4中所述的多肽，其中所述多肽配制为糊状形式。

19.饲料添加剂，其包含在权利要求4中所述的多肽。

20.饲料，其包含在权利要求4中所述的多肽。

21.组合物，其包含淀粉，以及在权利要求4中所述的多肽。

22.织物，其包含在权利要求4中所述的多肽。

23.用于织物处理的方法，该方法包括如下步骤：

(a)提供在权利要求4中所述的多肽；

(b)提供织物；和

(c)在所述多肽可处理所述织物的条件下用步骤(b)的织物接触步骤(a)的多肽。

24.用于织物脱浆的方法，该方法包括如下步骤：

(a)提供在权利要求4中所述的多肽；

(b)提供织物；和

(c)在所述多肽可脱浆织物的条件下用步骤(b)的织物接触步骤(a)的多肽。

25.纸产品，所述纸产品包含在权利要求4中所述的多肽。

26.纸浆，所述纸浆包含在权利要求4中所述的多肽。

27.用于处理纸产品的方法，所述方法包括如下步骤：

(a)提供在权利要求4中所述的多肽；

(b)提供含有纸产品的组合物；和

(c)在多肽可以处理纸产品的条件下用步骤(b)的组合物接触步骤(a)的多肽。

28.用于处理纸浆的方法，所述方法包括如下步骤：

(a)提供在权利要求4中所述的多肽；

(b)提供含有纸浆的组合物；和

(c)在多肽可以处理纸浆的条件下用步骤(b)的组合物接触步骤(a)的多肽。

29.用于处理纤维的方法，所述方法包括如下步骤：

(a)提供在权利要求4中所述的多肽；

(b)提供含有纤维的组合物；和

(c)在多肽可以处理纤维的条件下用步骤(b)的组合物接触步骤(a)的多肽。

30.用于处理木素纤维素材料的方法，所述方法包括如下步骤：

(a)提供在权利要求4中所述的多肽；

(b)提供木素纤维素材料；和

(c)在多肽可以处理所述材料的条件下用步骤(b)的材料接触步骤(a)的多肽，从而改进所述材料的性质。

31.高麦芽糖、或高葡萄糖液体，所述液体包含在权利要求4中所述的多肽。

32.高麦芽糖、或高葡萄糖糖浆，所述糖浆包含在权利要求4中所述的多肽。

33.用于产生高麦芽糖或高葡萄糖糖浆的方法，所述方法包括如下步骤：

(a)提供在权利要求4中所述的多肽；

(b)提供含有淀粉的组合物；和

(c)在步骤(a)的多肽可以水解步骤(b)的组合物的条件下接触步骤(a)的多肽，从而产生高麦芽糖或高葡萄糖糖浆，

其中所述淀粉来自稻、玉米、大麦、小麦、豆类、马铃薯或甘薯。

34.用于改善含淀粉的生产流体的流动的方法，所述方法包括如下步骤：

(a)提供在权利要求4中所述的多肽；

(b)提供含有淀粉的生产流体；和

(c)在所述多肽可以水解生产流体中的淀粉的条件下，将步骤(a)的多肽与步骤(b)的生产流体接触，从而通过降低其密度来改善其流动，

其中所述生产流体来自地下形成物。

35.在酒精生产中使用淀粉酶的方法，所述方法包括如下步骤：

(a)提供在权利要求4中所述的多肽；

(b)提供含有淀粉的组合物；

(c)在其中多肽可以水解在酒精生产中使用的组合物中的淀粉的条件下，将步骤(a)的多肽与步骤(b)的组合物结合。

36.在酿造中使用淀粉酶的方法，所述方法包括如下步骤：

(a)提供在权利要求4中所述的多肽；

(b)提供含有淀粉的组合物；

(c)在其中多肽可以水解在酿造中使用的组合物中的淀粉的条件下，将步骤(a)的多肽与步骤(b)的组合物结合。

37.酒精饮料，所述酒精饮料包含在权利要求4中所述的多肽。

38.啤酒，所述啤酒包含在权利要求4中所述的多肽。

39.药物组合物，所述药物组合物包含在权利要求4中所述的多肽。

40.口腔护理产品，所述口腔护理产品包含在权利要求4中所述的多肽。

41.油井钻探流体，所述油井钻探流体包括在权利要求4中所述的多肽。

42.用于改变组合物的粘度的方法，所述方法包括用在权利要求4中所述的多肽处理所述组合物。

43.用于帮助运走钻探泥浆的方法，所述方法包括用在权利要求4中所述的多肽处理钻探泥浆。

44.生物漂白溶液，所述生物漂白溶液包含在权利要求4中所述的多肽。

45.对组合物进行生物漂白的方法，所述方法包括用在权利要求4中所述的多肽处理所述组合物，其中所述组合物是纸产品。

46.对组合物进行生物漂白的方法，所述方法包括用在权利要求4中所述的多肽处理所述组合物，其中所述组合物是纸浆。

47.用于生产基于乙醇的燃料的方法，所述方法包括如下步骤：

(a)提供在权利要求4中所述的多肽；

(b)提供含有淀粉的组合物；和

(c)在所述多肽水解淀粉的条件下，用(b)的组合物接触(a)的多肽。