本申请是分案申请,原申请的申请日为2004年07月02日、申请号为200480025009.2(PCT/US2004/021492)、发明名称为“葡聚糖酶,编码它们的核酸以及制备和使用它们的方法”。
附图简述
下面的图是为了说明本发明的一些方面,不能被认为是限制权利要求书所包含的发明范围。
图1是计算机系统的方框图。
图2是流程图,说明了将新的核酸或蛋白序列与序列数据库进行比较,以确定新序列与数据库中的序列之间的同源性水平的方法的一个方面。
图3是流程图,说明了计算机中确定两条序列是否同源的方法的一个方面。
图4是流程图,说明了用于检测序列中特征的存在的识别器方法300的一个方面。
图5是概述本发明的若干示范性酶在各种条件下的相对活性的表。
图6以图标的形式示出了示范性的一组数据(“抽样数据”),该组数据作为“标准”数据示出,如实施例3中所论述。
图7和图8示出了葡聚糖酶活性测定的结果,证明在巴斯德毕赤酵母中本发明的示范性葡聚糖酶表达提高,该示范性葡聚糖酶具有SEQ ID NO:464中示出的序列,由密码子-优化版本的SEQ ID NO:5的编码(即优化的版本是SEQ ID NO:463),如下面实施例4中所论述。
图9示出了葡聚糖酶活性测定的结果,显示了本发明的示范性葡聚糖酶的温度曲线,该示范性葡聚糖酶由SEQ ID NO:6编码,如下面实施例5中所论述。
图10示出了葡聚糖酶活性测定的结果,显示了本发明的示范性葡聚糖酶的半衰期测定结果,该示范性葡聚糖酶由SEQ ID NO:6编码,如下面实施例5中所论述。
在不同的图表中同样的参考标记表示同样的元素。
发明祥述
本发明提供了多肽和编码它们的多核苷酸,和制备和使用它们的方法。本发明多肽的酶活性包括具有水解酶活性,例如葡聚糖酶活性的多肽,例如能够水解葡聚糖中存在的糖苷键的多肽,例如催化水解内部β-1,4-糖苷键的多肽。本发明多肽(包括抗体)的酶活性包括具有葡聚糖酶、木聚糖酶和/或甘露聚糖酶活性的多肽。本发明的酶可以被用于制备和/或加工食物、饲料(例如人、反刍动物、单胃动物、鸟类例如鸡的食物、饲料)、饮料、营养添加剂、织物、洗涤剂和类似物。本发明的酶可以用于药物组合物和膳食助剂。本发明的葡聚糖酶、甘露聚糖酶、木聚糖酶可以用于食品加工、焙烤、动物饲料或食品、饮料、洗涤剂、浆加工和纸工艺中。
定义
术语“抗体”包括来源于(derived from)、出自于(modeled after)或大体上编码于(substantially encoded by)一个免疫球蛋白基因或多个免疫球蛋白基因的肽或多肽或者其片断,它们能特异地结合于抗原或抗原决定部位,见例如,FundamentalImmunology,第三版,W.E.Paul,ed.,Raven Press,N.Y.(1993);Wilson(1994)J.Immunol.Methods175:267-273;Yarmush(1992)J.Biochem.Biophys.Methods25:85-97。术语抗体包括结合抗原的部分,即,具有与抗原结合的能力的“抗原结合位点”(例如,片断、序列、互补性决定区(CDRs)),包括(i)Fab片断,由VL、VH、CL和CH1结构域组成的单价片断;(ii)F(ab’)2片断,包括在铰链区由二硫键连接的两个Fab片断的二价片断;(iii)由VH和CH1结构域组成的Fd片断;(iv)由抗体单臂(a single arm)的VL和VH结构域组成的Fv片断;(v)由VH结构域组成的dAb片断(Ward等,(1989)Nature341:544-546),和(vi)分离出的互补性决定区(CDR)。单链抗体也被包括在术语“抗体”中。
在此使用的术语“阵列(array)”或“微阵列(microarray)”或“生物芯片(biochip)”或“芯片(chip)”是多个靶元素(element),每个靶元素包括固定在基底表面的确定区域上的确定量的一种或多种多肽(包括抗体)或核酸,以下进一步详细描述。
正如在此使用的,术语“计算机(computer)”、“计算机程序(computer program)”和“处理器(processor)”使用的是它们最广泛的一般内容,并可与所有设备结合,细节在以下详细描述。特定的多肽或蛋白的“编码序列”或“序列编码”是指当置于合适的调控序列的控制之下时,可转录和翻译成为多肽或蛋白的核酸序列。
在此使用的术语“核酸(nucleic acid)”或“核酸序列(nucleic acid sequence)”是指寡核苷酸、核苷酸、多聚核苷酸,或它们的片段,基因组DNA或RNA,或合成的起点,它们可以是单链或双链,可以代表正义链或反义链,它们可以是肽核酸(PNA)或任何DNA样或RNA样材料,可以是天然或合成的。短语“核酸”或“核酸序列”包括寡核苷酸、核苷酸、多聚核苷酸,或它们的片段,基因组DNA或RNA(例如,mRNA、rRNA、tRNA、iRNA),或合成的起点,它们可以是单链或双链,可以代表正义链或反义链,可以是肽核酸(PNA),或任何DNA样或RNA样材料,可以具有天然或合成的起始点,包括例如iRNA、核糖核蛋白(例如,双链iRNA,例如,iRNPs)。该术语包含了含有天然核苷酸的已知类似物的核酸,寡核苷酸。该术语也包含了具有合成的骨架的核酸样结构,见例如,Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry36:8692-8698;Samstag(1996)Antisense NucleicAcid Drug Dev6:153-156。“寡核苷酸”包括可以用化学合成的或者单链的多脱氧核苷酸或者双链的互补多脱氧核苷酸。这样合成的寡核苷酸没有5’磷酸,所以在没有激酶利用ATP增加磷酸基团的情况下,它不会与另外的寡核苷酸连接。合成的寡核苷酸可以与没有脱磷酸化的片断连接。
特定多肽或蛋白的“编码序列(coding sequence)”或编码特定多肽或蛋白的“核苷酸序列”,是当被置于合适调控序列的控制之下时被转录和翻译成多肽或蛋白的核酸序列。
术语“基因(gene)”是指涉及产生多肽链的DNA片段;它包括在编码区域前面和后面的区域(引导序列(leader)和尾部序列(trailer)),并且有时,个别的编码片段(外显子)之间有插入序列(内含子)。在此使用的“有效连接(operably linked)”是指两个或多个核酸(例如,DNA)片段之间的功能关系。典型的,它是指转录调控序列与被转录序列的功能关系。例如,启动子有效连接到编码序列,例如本发明的核酸,假如它刺激或调控该编码序列在合适的宿主细胞或别的表达系统中的转录的话。一般地,与被转录序列可操作性连接的启动子转录调控序列与该被转录序列是物理上邻接的,即,它们是顺式作用。然而,一些转录调控序列,例如增强子,并不需要物理邻接于或位置上靠近于转录被其增强的编码序列。
在此所用的术语“表达盒(expression cassette)”指的是可以影响结构基因(即,蛋白编码序列,例如本发明的木聚糖酶编码序列)在与这些序列相容的宿主中表达的核苷酸序列。表达序列盒至少包括与多肽编码序列可操作性连接的启动子;可选择地,也可以与例如转录终止信号的其它序列有效连接。必须的或有助于影响表达的其它要素也可以被使用,例如,增强子。所以,表达序列盒也包括质粒、表达载体、重组病毒、任何形式的重组“裸DNA”载体,以及类似物。“载体”包括能够感染细胞、转染细胞、短期或永久地转导细胞的核酸。可以认识到的是,载体可以是裸露的核酸或与蛋白或脂构成复合物的核酸。载体可选择地包括病毒的或细菌的核酸和/或蛋白质,和/或膜(例如,细胞膜、病毒脂质被膜等等)。载体包括,但不局限于复制子(例如,RNA复制子、噬菌体),DNA片段可以与复制子相连,而变得可以复制。载体包括,但不局限于RNA、自动地自我复制的环状或线状DNA或RNA(例如,质粒、病毒,以及类似物,见,例如美国专利5,217,879),并且包括表达质粒和非表达质粒。当重组微生物或细胞培养物被描述作为“表达载体”的宿主时,这包括染色体外的环状和线状DNA,以及已经整入到宿主染色体的DNA。当载体被宿主细胞保持时,载体或者可以在细胞有丝分裂期间作为自主结构稳定复制,或者整入到宿主基因组中。
如在此使用的,术语“启动子(promoter)”包括所有可以驱动在细胞例如植物细胞中编码序列的转录的序列。所以,本发明的构建物中使用的启动子包括顺式作用转录控制元件和调控序列,它们涉及调控或调节基因转录的时间和/或速率。例如,启动子可以是顺式作用转录控制元件,包括增强子、启动子、转录终止子、复制起点、染色体整合序列、5’和3’不翻译区,或涉及转录调控的内含子序列。这些顺式作用序列一般与蛋白质或别的生物分子相互作用(启动/关闭、调节、调控,等等)来进行转录。“组成型”的启动子是在多数环境条件和发育或细胞分化状态下持续驱动表达的启动子。“诱导型”或“调控型”启动子在环境条件或发育条件的影响下指导本发明的核酸的表达。可以影响诱导型启动子进行转录的环境条件的例子包括厌氧条件、提高的温度、干旱或有光。
“组织特异性(Tissue-specific)”启动子是只在特定细胞或组织或器官,例如植物或动物中,有活性的转录控制元件。组织特异性调控可以通过某些内在因子实现,内在因子可以确保编码某种组织特异性蛋白的基因的表达。已知这样的因子存在于哺乳动物和植物中,以允许特异性的组织发育。
术语“植物(plant)”包括整个植物、植物的部分(例如,叶、茎、花、根等等)、植物原生质体、种子和植物细胞和其后代。一般地,可以在本发明的方法中使用的植物种类宽泛至可适于转化技术的高等植物,包括被子植物(单子叶植物和双子叶植物),还有裸子植物。它包括多种倍体型的植物,包括多倍体、二倍体、单倍体和半合子。如在此使用的,术语“转基因植物”包括这样的植物或植物细胞,其中插入有异源核酸序列,例如本发明的核酸和各种重组构建物(例如,表达序列盒)。
“质粒(Plasmids)”可以从商业上获得、在不受限制地从公众获得、或者根据公开的程序由可获得的质粒构建。与在此描述的质粒等效的质粒在本领域是已知的,并且对本领域技术人员来说是很显然的。
在此所使用的“氨基酸(Amino acid)”或“氨基酸序列(amino acid sequence)”是指寡肽、肽、多肽或蛋白序列,或这些的片断、部分或亚基,天然发生的或合成的分子。
“氨基酸”或“氨基酸序列”包括寡肽、肽、多肽或蛋白序列,或这些的片断、部分或亚基,天然发生的或合成的分子。在此所使用的术语“多肽”是指通过肽键或修饰的肽键彼此连接的氨基酸,后者即肽等配物,并且可以包含不同于编码基因的20个氨基酸的修饰的氨基酸。可以通过天然过程,如翻译后加工,或通过本领域中为人所熟知的化学修饰技术来修饰多肽。修饰作用可发生在多肽中的任何位置,包括肽骨架、氨基酸侧链和氨基或羧基末端。要理解的是,相同类型的修饰作用可以相同或不同的程度发生在指定多肽的几个位置上。指定的多肽也可发生多种类型的修饰作用。修饰作用包括乙酰化、酰化、ADP-核糖基化、酰胺化、核黄素的共价附着、血红素基团的共价附着、核苷酸或核苷酸衍生物的共价附着、脂质或脂质衍生物的共价附着、磷脂酰肌醇的共价附着、交联的环化作用、二硫键形成、脱甲基化、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰化、γ-羧化、糖基化、形成GPI锚着(anchor)、羟基化、碘化、甲基化、肉豆蔻酰化、氧化、聚乙二醇化、葡聚糖水解酶加工、磷酸化、异戊二烯化、消旋化、硒化(selenoylation)、硫酸盐化和转运RNA介导的向蛋白中添加氨基酸如精氨酰化。(见Creighton,T.E.,Proteins-Structures and Molecular Properties,第二版,W.H.Freeman和Company,New York(1993);PosttranslationalCovalent Modification of Proteins,B.C.Johnson主编,Academic Press,New York,1-12页(1983))。本发明的肽和多肽也包括所有“模拟(mimetic)”和“肽模拟物(peptidomimetic)”形式,如在下面进一步所详述的。
如在此所使用的,术语“分离的(isolated)”是指从其原始环境(例如,如果它是天然发生的,那么就指自然环境)中取出的材料。例如,存在于活的动物中的天然发生的多核苷酸或多肽就不是分离的,但是从天然系统中的一些或全部共存材料分离到的同样的多核苷酸或多肽就是分离的。这些多核苷酸可以成为载体的一部分,和/或这些多核苷酸或多肽可以成为组合物的一部分,而它们仍然是分离的,因为这些载体或组合物不是天然环境的一部分。如在此所使用的,术语“纯化的”不要求绝对的纯净;相反,它是一个相对的定义。从文库中获得的单种核酸可以照惯例提纯到电泳同质。从这些克隆中获得的序列不能直接从文库中获得,或从人总DNA中获得。本发明的纯化核酸已经相对于生物体中基因组DNA的剩余部分纯化了至少104-106倍。但是,术语“纯化的”也包括已经从基因组DNA或文库中或别的环境中的别的序列中提纯的核酸,其纯度提高至少一个数量级,通常是二或三个数量级,更多的情况是四或五个数量级。
如在此所使用的,术语“重组(recombinant)”的含义是核酸与在其自然环境中并不邻接的“骨架(backbone)”核酸相邻。另外,为了成为“被富集的(enriched)”,核酸要在核酸骨架分子的群体中占到核酸插入物数量的5%或更多。根据本发明的骨架分子所包括的核酸如表达载体、自我复制的核酸、病毒、整合核酸和其它载体或用来保留或操作感兴趣的核酸插入物的核酸。一般,被富集的核酸在重组的骨架分子的群体中占到核酸插入物数量的15%或更多。更典型的,被富集的核酸在重组的骨架分子的群体中占到核酸插入物数量的50%或更多。在一个方面,被富集的核酸在重组的骨架分子的群体中占到核酸插入物数量的90%或更多。
“重组”多肽或蛋白是指通过重组DNA技术产生的多肽或蛋白;即从用编码所需多肽或蛋白的外源DNA构建物转化的细胞产生的多肽或蛋白。“合成的”多肽或蛋白是通过化学合成制备的多肽或蛋白。固相化学肽合成方法也可用来合成本发明的多肽或片段。自从二十世纪60年代早期在本领域中这种方法就是为人所熟知的(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也见Stewart,J.M.和Young,J.D.,Solid Phase Peptide Synthesis,第二版,Pierce Chemical Co.,Rockford,111.,11-12页))并已经在最近被用于商业上可获得的实验室肽设计和合成试剂盒(Cambridge ResearchBiochemicals)。这样的商业可获得的实验室试剂盒通常应用了H.M.Geysen等在Proc.Natl.Acad.Sci.,USA,81:3998(1984)中的教导,它们可在联系于单个板的多个“杆”或“钉”的尖端上合成多肽。当使用这样的系统时,一整板的杆或钉被倒转,并插入进第二个板的对应孔或容器中,其中含有可将一种合适的氨基酸附着或锚着到钉或杆的尖端上的溶液。通过重复这样的过程,即倒转和将杆和钉的尖端插入到合适的溶液中,氨基酸可被构建成为所需的肽。另外,许多现有的FMOC肽合成系统可以使用。例如,多肽或片段的组装可在固体支持物上使用Applied Biosystems公司的431A型自动肽合成仪来进行。这样的装置为本发明肽的合成提供了简便途径,它们通过直接合成或通过合成一系列可使用其它已知技术连接在一起的片段。
启动子序列可“可操作性地连接于(operably linked to)”编码序列,此时可在启动子处启动转录的RNA聚合酶将编码序列转录为mRNA。
“质粒(Plasmid)”标注为前面为小写的″p″,后面为大写字母和/或数字。起始的质粒可以是市售的,可以不受限制地从公共获得,或可根据已发表的方法从现有的质粒构建出来。另外,与在此所述的质粒相当的质粒在本领域中是已知的,对普通技术人员是很明显的。
DNA的“消化(Digestion)”是指使用仅可在DNA中某些序列上作用的限制性酶对DNA进行的催化切割。在此使用的各种限制型酶是商业渠道中可购得的,其使用的反应条件、辅助因子和其他必要条件是普通技术人员已知的。为了进行分析,一般1μg质粒或DNA片段在大约20μl缓冲溶液中使用大约2单位酶。为了分离DNA片段进行质粒构建,一般5至50μg的DNA用20至250单位酶在更大的体积中进行消化。特定的限制性酶的合适缓冲液和底物量由制造商说明。通常使用的孵育时间为在37℃大约1小时,但根据供应商的使用说明可以变化。在消化后,可以进行凝胶电泳以分离所需的片段。
短语“实质上相同的(substantially identical)”就两个核酸或多肽而言,是指两条或多条序列被比较和比对(aligned)以确定最大一致性(maxium correspondence)时,具有例如至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的核苷酸或氨基酸残基(序列)同一性,所述的最大一致性可以通过使用任何一种已知的序列比较算法进行测量,或者通过观察检验得出。一般,实质上的同一性存在于至少大约100个残基的区域中,最普遍的是,在至少大约150-200个残基的区域中序列是实质上相同的。在一些方面,序列在编码区的整个长度上是实质上相同的。
另外,“实质上相同的”氨基酸序列是通过一个或多个保守或非保守氨基酸的取代、删除或插入而与参考序列有差异的序列,特别是当这样的取代发生在分子的非活性位点(催化区域(CD))上时,只要该多肽基本上保留其功能特性。保守的氨基酸取代例如将一个氨基酸取代为相同类型的另一个氨基酸(例如,用一种疏水氨基酸如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸取代另一种疏水氨基酸,或用一种极性氨基酸替代另一种极性氨基酸,如用精氨酸取代赖氨酸,用谷氨酸取代天冬氨酸,或用谷氨酰胺取代天冬酰胺)。可以从例如葡聚糖酶多肽中删除一个或多个氨基酸,产生多肽结构的修饰,而又不明显地改变其生物学活性。例如,对葡聚糖酶生物学活性并不是必需的氨基或羧基末端氨基酸可被去掉。本发明的修饰的多肽序列可以通过任何方法来分析葡聚糖酶生物学活性,包括将修饰的多肽序列与葡聚糖酶底物接触,确定在该分析中修饰的多肽是否可降低特异底物的量或增加功能性葡聚糖酶多肽与底物的酶反应的生物产物的量。
如在此所使用的,“片段(Fragments)”是自然发生的蛋白的一部分,它可以以至少两种不同的构象存在。片段可以具有与自然发生的蛋白相同的或基本上相同的氨基酸序列。“基本上相同”的含义是很大程度上但不是完全的相同,但又保留了与其相关的序列的至少一种功能活性。通常,如果至少大约85%是相同的,两个氨基酸序列就是“基本上相同的”或“实质上同源的”。也包括具有与自然发生的蛋白不同的三维结构的片段。这样的一个实例是“前体形式(pro-form)”分子,如低活性的蛋白原(proprotein),它可通过切割而被修饰,从而产生具有明显更高活性的成熟酶。
“杂交(Hybridization)”是指核酸链与互补链通过碱基配对联结的过程。杂交反应可以是灵敏的和选择性的,感兴趣的特定序列甚至可以在以非常低的浓度存在于样品中时仍可被识别出来。合适的严紧条件可以通过例如预杂交和杂交溶液中盐或甲酰胺的浓度,或者通过杂交温度被限定,这是在本领域广为人知的。例如,严紧性(stringency)可以通过降低盐浓度、增加甲酰胺的浓度、或者提高杂交温度而增加。在可替代的方面,本发明的核酸可以根据它们在不同严紧条件(例如,高、中、低)下杂交的能力而进行定义,如在此阐明的。
例如,在高严紧性条件下的杂交可发生在大约50%甲酰胺、大约37℃至42℃。在降低的严紧性条件下的杂交可发生在大约35%至25%甲酰胺、大约30℃至35℃。特别地,在高严紧性条件下的杂交可发生在42℃、在50%甲酰胺、5XSSPE、0.3%SDS和200n/ml的剪切和变性的鲑鱼精DNA中。杂交可如上所述发生在降低的严紧性条件下,但在35%甲酰胺中、在降低的温度35℃。与特定水平的严紧性对应的温度范围可通过计算感兴趣的核酸中嘌呤和嘧啶的比例而进一步缩小,并相应地调整温度。对上述范围和条件的改变在本领域中是为人所熟知的。
术语“变体(variant)”是指在一个或多个碱基对、密码子、内含子、外显子或氨基酸残基处(分别)被修饰,但仍保留本发明的葡聚糖酶生物学活性的本发明的多聚核苷酸或多肽。可通过任何方法来产生变体,包括的方法如易错PCR、重排、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点专一性诱变、基因重装配、GSSMTM及其任何组合。
术语“饱和诱变(Saturation Mutagenesis)”、“基因位点饱和诱变TM(Gene SiteSaturation MutagenesisTM)”或“GSSMTM”包括使用简并寡核苷酸引物在多核苷酸中导入点突变的方法,以下详细描述。
术语“优化的定向进化系统(optimized directed evolution system)”或“优化的定向进化(optimized directed evolution)”包括用于重新装配相关核酸序列例如相关基因的片段的方法,以下详细描述。
术语“合成的连接重装配(synthetic ligation reassembly)”或者“SLR”包括以非随机方式连接寡核苷酸片段的方法,以下详细描述。
产生和操作核酸
本发明提供了分离、重组和合成的核酸(例如本发明的示范性核酸,包括SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ IDNO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ IDNO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ IDNO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ IDNO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ IDNO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ IDNO:97、SEQ ID NO:99、SEQ ID NO:101;SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ IDNO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ IDNO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ IDNO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ IDNO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ IDNO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ IDNO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ IDNO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ IDNO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ IDNO:295、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ IDNO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ IDNO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ IDNO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、SEQ IDNO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ IDNO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、SEQ IDNO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ IDNO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ IDNO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ IDNO:493、SEQ ID NO:495、SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ IDNO:515、SEQ ID NO:517,和与示范性核酸具有序列同一性的序列;编码本发明多肽的核酸,本发明多肽例如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ IDNO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO;92、SEQ IDNO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQID NO:128、SEQ ID NO:130、SEQ ID NO:132;SEQ ID NO:134;SEQ ID NO:136;SEQ ID NO:138;SEQ ID NO:140;SEQ ID NO:142;SEQ ID NO:144;NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、SEQID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQID NO:206、SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:248、SEQID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQID NO:404、SEQ ID NO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、SEQID NO:426、SEQ ID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:444、SEQ ID NO:446、SEQID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQID NO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:480、SEQ ID NO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQID NO:492、SEQ ID NO:494、SEQ ID NO:496、SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQID NO:514、SEQ ID NO:516、SEQ ID NO:518中的示范性氨基酸序列)。本发明也提供了表达盒,诸如表达载体,包括本发明的核酸,其包括编码本发明多肽的多核苷酸。本发明也包括使用本发明的核酸发现新的葡聚糖酶序列的方法。本发明也包括使用本发明的核酸抑制葡聚糖酶基因、转录物和多肽的表达的方法。也提供了修饰本发明的核酸的方法,例如,通过合成连接重装配、优化的定向进化系统和/或饱和诱变进行。
本发明的核酸可通过例如克隆和表达cDNA文库、通过PCR扩增信息或基因组DNA以及类似的方法来制备、分离和/或操作。
例如,本发明的下述示例性序列最初来自于下述的来源,如下表1所示:
表1
在一个方面,本发明提供了编码葡聚糖酶的核酸,和由它们编码的多肽,具有共同的新颖性,这是因为它们来自共同的来源,例如环境来源或古细菌来源。
在实施本发明的方法时,同源基因可以通过对模板核酸的操作而被修饰,如在此所述。本发明也可与本领域中已知的任何方法或方案或装置联合实施,它们在科学文献和专利文献中已被详细描述。
本发明的一个方面是分离出的核酸,其含有本发明序列之一、或包含本发明核酸的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段。分离出的核酸可以包括DNA,包括cDNA、基因组DNA和合成的DNA。DNA可以是双链或单链的,如果是单链,则可以是编码链或非编码(反义)链。可选择的是,分离出的核酸可以包括RNA。
本发明分离的核酸可以被用于制备其中一种本发明多肽,或片段,其包括本发明多肽的至少5、10、15、20、25、30、35、40、50、75、100或150个连续连续氨基酸。
因此,本发明的另一个方面是分离出的核酸,该核酸编码其中一种本发明多肽,或片段,其包括本发明多肽的至少5、10、15、20、25、30、35、40、50、75、100或150个连续连续氨基酸。这些核酸的编码序列可以与本发明的其中一种核酸的其中一种编码序列相同,或者,可以是不同的编码序列,其编码具有其中一种本发明多肽的至少5、10、15、20、25、30、35、40、50、75、100或150个连续的氨基酸的其中一种多肽,这是由于遗传代码的丰余或简并性的缘故。遗传代码对本领域的技术人员是已知的,可在例如B.Lewin,Genes VI,OxfordUniversity Press,1997的214页上获得。
编码其中一种本发明多肽的分离出的核酸,包括但不限于:仅本发明核酸的编码序列,和其它的编码序列,如引导序列(leader sequences)或蛋白原序列(proproteinsequences)和非编码序列,如内含子或编码序列的5′和/或3′端的非编码序列。因此,如在此所使用的,术语“编码多肽的多聚核苷酸”包括仅包含多肽的编码序列的多聚核苷酸以及包括其它额外的编码和/或非编码序列的多聚核苷酸。
可选择地,可采用常规的技术如位点定向诱变或本领域专业技术人员熟悉的其它的技术,诱变本发明核酸序列,以将一些沉默改变导入进本发明的多聚核苷酸中。如在此所使用的,“沉默改变(silent changes)”包括,例如不改变由多聚核苷酸编码的氨基酸序列的改变。这样的改变可能是有利的,以便通过导入在宿主生物体中频繁出现的密码子或密码子对,来增加含有编码多肽的载体的宿主细胞所产生的多肽的水平。
本发明也涉及具有核苷酸改变的多聚核苷酸,所述核苷酸改变可引起本发明的多肽发生氨基酸替代、添加、删除、融合和截断。这样的核苷酸改变可使用一些技术被导入,如位点定向诱变、随机化学诱变、核酸外切酶III删除和其它重组DNA技术。可选择地是,这样的核苷酸改变可以是天然的等位基因变异,它们可以通过在此处所提供的高、中或低严谨性条件下,鉴定可与探针特异杂交的核酸而被分离出来,所述探针包括本发明序列中的一种序列(或与其互补的序列)的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基。
一般技术
用来实施本发明的核酸,不管是RNA、iRNA、反义核酸、cDNA、基因组DNA、载体、病毒或其杂交体,都可从多种来源分离、利用遗传工程进行改造、扩增和/或利用重组技术表达/产生。从这些核酸产生的重组多肽(例如葡聚糖酶、甘露聚糖酶或木聚糖酶)可以被单独分离或克隆,并检测所需的活性。可使用任何的重组表达系统,包括细菌、哺乳动物、酵母、昆虫或植物细胞表达系统。
可选择地,这些核酸可以通过公知的化学合成技术体外合成,这些合成技术描述下述文献中:例如Adams(1983)J.Am.Chem.Soc.105:661;Belousov(1997)Nucleic AcidsRes.25:3440-3444;Frenkel(1995)Free Radic.Biol.Med.19:373-380;Blommers(1994)Biochemistry33:7886-7896;Narang(1979)Meth.Enzymol.68:90;Brown(1979)Meth.Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美国专利4,458,066。
核酸操作技术,例如亚克隆、标记探针(例如,使用Klenow聚合酶、切口平移、扩增来进行随机引物标记)、测序、杂交等等已经在科学和专利文献中详细描述过,见,例如Sambrook等,MOLECULAR CLONING:A LABORATORY MANUAL(第二版),1-3卷,Cold SpringHarbor Laboratory,(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Ausubel等.John Wiley&Sons Inc.,New York(1997);LABORATORY TECHNIQUES IN BIOCHEMISTRYAND MOLECULAR BIOLOGY:HYBRIDIZATION WITH NUCLEIC ACID PROBES,第I部分.Theoryand Nucleic Acid Preparation,Tijssen等.Elsevier,N.Y.(1993)。
另一种用于实践本发明的方法的有用的获得核酸和操作核酸的方法是从基因组样品中进行克隆,并且假如需要的话,筛选和再克隆从例如基因组克隆或cDNA克隆中分离或扩增出的插入物。在本发明的方法中使用的核酸来源包括基因组文库或cDNA文库,其被包含在例如哺乳动物的人工染色体(MACs)中,见,例如,美国专利5,721,118;6,025,155;人类人工染色体中,见,例如Rosenfeld(1997)Nat.Genet.15:333-335;酵母人工染色体(YAC)中;细菌人工染色体(BAC)中;P1人工染色体中,见,例如Woon(1998)Genomics50:306-316;P1-衍生的载体(PACs)中,见,例如,Kern(1997)Biotechniques23:120-124;粘粒、重组病毒、噬菌体或质粒中。
一方面,编码本发明的多肽的核酸在合适的阶段与引导序列组合,该引导序列能够引导翻译出的多肽或其片断进行分泌。
本发明提供融合蛋白和编码所述融合蛋白的核酸。本发明的多肽可以与异源的肽或多肽融合,例如与N端识别肽(N-terminal identification peptides)融合,该N端识别肽赋予所期望的特性,例如增加稳定性或使提纯简单化。为了例如产生更高免疫原性的肽、更容易地分离重组合成的肽、确定和分离抗体和表达抗体的B细胞,等等,本发明的肽和多肽也可以合成和表达为融合蛋白,其具有一个或多个与之连接的额外的结构域。有利于检测和提纯的结构域包括,例如,金属螯合肽,例如使得在固定化的金属上进行提纯成为可能的多组氨酸单元和组氨酸-色氨酸模式单元,使得在固定的免疫球蛋白上进行提纯成为可能的蛋白A结构域,和在FLAGS延展/亲和纯化系统中使用的结构域(Immunex Corp,SeattleWA)。为了有利于纯化,可以在纯化结构域和包含上述模体的肽或多肽之间引入可切割的连接序列,例如因子Xa或肠激酶(Inivitrogen,San Diego CA)。例如,表达载体可以包括与六个组氨酸残基连接的编码抗原决定部位的核酸序列,并连接有硫氧还蛋白和肠激酶切割位点(见,例如,Williams(1995)Biochemistry34:1787-1797;Dobeli(1998)ProteinExpr.Purif12:404-414)。组氨酸残基有利于检测和纯化,而肠激酶切割位点提供了将抗原决定部位从融合蛋白的剩余部分中纯化出来的方法。关于编码融合蛋白的载体的技术和融合蛋白的应用在科学和专利文献中有很好的描述,见,例如,Kroll(1993)DNA Cell.Biol.,12:441-53。
转录和翻译控制序列
本发明提供了与表达(例如,转录或翻译)控制序列可操作性连接的本发明的核酸(例如,DNA)序列,以指导或调控RNA合成/表达,这里的表达控制序列例如启动子或增强子。表达控制序列可以在表达载体中。典型的细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。典型的真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs、鼠金属硫蛋白I启动子。
合适于在细菌中表达多肽的启动子包括E.coli lac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动子、λPL启动子、编码糖酵解酶例如3-磷酸甘油酸激酶(PGK)的操纵子的启动子和酸性磷酸酶启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热休克启动子、早期和晚期SV40启动子、反转录病毒的LTRs、鼠金属硫蛋白-I启动子。已知的用来控制基因在原核和真核细胞或它们的病毒中的表达的别的启动子也可以使用。合适于在细菌中表达多肽或其片段的启动子包括E.colilac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动子、λPL启动子、编码糖酵解酶例如3-磷酸甘油酸激酶(PGK)的操纵子的启动子和酸性磷酸酶启动子。真菌启动子包括α因子启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热休克启动子、早期和晚期SV40启动子、反转录病毒的LTRs、鼠金属硫蛋白-I启动子。已知的用来控制基因在原核和真核细胞或它们的病毒中的表达的别的启动子也可以使用。
组织特异性植物启动子
本发明提供了可以以组织特异性方式表达的表达序列盒,例如,可以以组织特异性方式表达本发明的葡聚糖酶的表达序列盒。本发明也提供了以组织特异性方式表达本发明的葡聚糖酶的植物或种子。所述的组织特异性可以是种子特异性、茎特异性、叶特异性、根特异性、果实特异性以及类似的特异性。
一方面,组成型启动子例如CaMV35S启动子可以用于在植物或种子的特异部分或整个植物内的表达。例如,为了过量表达,植物启动子片段可以用于指导核酸在植物例如再生植物的一些或所有组织中表达。这样的启动子在此称为“组成型”启动子,它可以在大多数环境条件和发育状态或细胞分化情况下具有活性。组成型启动子的例子包括花椰菜花叶病毒(CaMV)35S转录起始区域、衍生于根癌农杆菌的T-DNA的1’-或2’-启动子,以及本领域技术人员已知的来自不同植物基因的别的转录起始区域。这些基因包括,例如,拟南芥(Arabidopsis)的ACT11(Huang(1996)Plant Mol.Biol.33:125-139);拟南芥的Cat3(GenBank号:U43147,Zhong(1996)Mol.Gen.Genet.251:196-203);甘蓝型油菜(Brassicanapus)的编码硬脂酰-酰基载体蛋白去饱和酶的基因(Genbank号:X74782,Solocombe(1994)Plant Physiol.104:1167-1176);玉米的GPc1(GenBank号:X15596;Martinez(1989)J.Mol.Biol208:551-565);玉米的Gpc2(GenBank号:U45855,Manjunath(1997)PlantMol.Biol.3397-112);美国专利4,962,028;5,633,440中描述的植物启动子。
本发明使用的组织特异性或组成型启动子可以衍生自病毒,包括,例如,烟草花叶病毒亚基因组启动子(Kumagai(1995)Proc.Natl.Acad.Sci.USA92:1679-1683);只能在受感染的水稻植物的韧皮部细胞中复制的水稻东格鲁杆状病毒(RTBV),其启动子驱动韧皮部特异的报告基因的表达;在导管、叶中轴细胞、根尖中具有最高活性的木薯脉带花叶病毒(cassava vein mosaic virus,CVMV)启动子(Verdaguer(1996)Plant Mol.Biol.31:1129-1139)。
可选择地,植物启动子可以指导表达葡聚糖酶的核酸表达于特定组织、器官或细胞类型中(即,组织特异启动子),或者可以在更加精确的环境或发育控制下或在可诱导启动子的控制下指导表达葡聚糖酶的核酸的表达。可以影响转录的环境条件的例子包括厌氧条件、提高温度、有光、或喷撒化学试剂/激素。例如,本发明包括玉米的干旱诱导型启动子(Busk(1997)如上),马铃薯的寒冷、干旱、高盐诱导型启动子(Kirch(1997)PlantMol.Biol.33:897909)。
组织特异性启动子只在该组织的发育阶段的某个时间段内促进转录。参见,例如描述拟南芥LEAFY基因启动子的Blazquez(1998)Plant Cell10:791-800。也见,描述转录因子SPL3的Cardon(1997)Plant J12:367-77,SPL3识别拟南芥(A.thaliana)的调节植物分生组织形成的基因(meristem identity gene)AP1的启动子区域的保守序列模体;和描述分生组织启动子eIF4的Mandel(1995)Plant Molecular Biology,29卷,995-1004页。可以使用在特定组织的整个生命周期都具有活性的组织特异性启动子。一方面,本发明的核酸与主要在棉花纤维细胞中有活性的启动子有效连接。一方面,本发明的核酸与主要在棉花纤维细胞伸长的阶段具有活性的启动子有效连接,例如,Rinehart(1996)如上所描述的。核酸可以与Fb12A基因启动子有效连接,这样它将偏好在棉花纤维细胞(Ibid)中表达。也见John(1997)Proc.Natl.Acad.Sci.USA89:5769-5773;John等,美国专利5,608,148和5,602,321,描述了用于构建转基因棉花植物的棉花纤维特异性启动子和方法。也可以使用根特异性启动子来表达本发明的核酸。根特异性启动子的例子包括乙醇脱氢酶基因中的启动子(DeLisle(1990)Int.Rey.Cytol.123:39-60)。也可以使用别的启动子来表达本发明的核酸,包括,例如,胚珠特异的、胚芽特异的、胚乳特异的、珠柄特异的、种皮特异的启动子或它们的组合;叶特异的启动子(见,例如,Busk(1997)Plant J.11:12851295,描述玉米的叶特异的启动子);Agrobacterium rhizogenes的ORF13启动子(ORF13启动子在根部表现出高活性,见,例如Hansen(1997)如上);玉米花粉特异性启动子(见,例如Guerrero(1990)Mol.Gen.Genet.224:161168);番茄启动子,其在果实成熟、变老、从叶上脱落的过程中有活性,在花中具有低一些的活性(见,例如,Blume(1997)Plant J.12:731746);马铃薯SK2基因的雌蕊特异性启动子(见,例如Ficker(1997)Plant Mol.Biol.35:425431);豌豆的Blec4基因,Blec4基因在蔬菜的表皮组织和转基因苜蓿的花梗顶中具有活性,这使它成为使外源基因靶向表达于活跃地生长的芽或纤维的表皮层的有用工具;胚珠特异的BEL1基因(见,例如,Reiser(1995)Cell83:735-742,GenBank号:U39944);和/或Klee,美国专利5,589,583中的启动子,描述了一种植物启动子区域,其可导致在分生组织和/或快速分裂细胞中的高水平转录。
可选择的是,经由对植物激素例如植物生长素的暴露便能被诱导的植物启动子用于表达本发明的核酸。例如,本发明可以使用大豆(Glycine max L.)中的植物生长素响应元件E1启动子片断(AuxREs)(Liu(1997)Plant Physiol.115:397-407);植物生长素响应的拟南芥GST6启动子(也对水杨酸和过氧化氢产生响应)(Chen(1996)Plant J.10:955-966);烟草的植物生长素诱导的parC启动子(Sakai(1996)37:906-913);植物生物素响应元件(Streit(1997)Mol.Plant Microbe Interact.10:933-937);和对应激激素脱落酸产生响应的启动子(Sheen(1996)Science274:1900-1902)。
本发明的核酸也可以与植物启动子有效连接,所述植物启动子暴露于施用于植物的化学试剂例如除草剂或抗生素,便能够被诱导。例如,可以使用由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子(De Veylder(1997)Plant Cell Physiol.38:568-577);不同的除草剂安全剂的应用诱导不同的基因表达模式,包括在根中、排水器中和芽尖分生组织中的表达。编码序列可以处于例如四环素诱导的启动子的控制下,例如,被描述的含有Avenasativa L.(oat)精氨酸脱羧酶基因的转基因烟草植物(Masgrau(1997)Plant J.11:465-473);或者处于水杨酸响应元件的控制之下(Stange(1997)Plant J.11:1315-1324)。使用化学(例如,激素或杀虫剂)诱导的启动子,即,对施用于田间的转基因植物的化学剂发生响应的启动子,本发明的多肽的表达可以在植物发育的特定阶段被诱导。所以,本发明也提供含有可诱导基因的转基因植物,所述可诱导基因编码本发明的多肽,其宿主范围局限于靶向植物种类,例如玉米、水稻、大麦、小麦、马铃薯或别的作物,并且所述可诱导基因在作物发育的任何阶段都可被诱导。
本领域技术人员会认识到,组织特异性的植物启动子可以驱动可操作性连接的序列在不是靶向组织的组织中表达。所以,组织特异性启动子是驱动在靶向组织或细胞类型中产生优势表达的启动子,但是也可以导致在别的组织中的一些表达。
本发明的核酸也可以与化学试剂诱导的植物启动子有效连接。这些试剂包括例如,除草剂、合成的植物生长激素或抗生素,它们可以通过例如喷雾而施用于转基因植物。本发明的产生葡聚糖酶的核酸的可诱导表达将允许对具有最佳的葡聚糖酶表达和/或活性的植物进行选择。植物局部的发育也可以因此被控制。这样,本发明提供了促进植物和植物的部分的收获的方法。例如,在许多实施方式中,玉米的由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子被使用(De Veylder(1997)Plant Cell Physiol.38:568-577)。应用不同的除草剂安全剂诱导出不同的基因表达模式,包括在根中、排水器中、芽尖分生组织中的表达。本发明的编码序列也可以处于四环素诱导的启动子的控制之下,例如,对含有燕麦(Avena sativa L.)(oat)精氨酸脱羧酶基因的转基因烟草植物的描述(Masgrau(1997)Plant J.11:465-473);或者,可以由水杨酸响应元件控制(Stange(1997)Plant J.11:1315-1324)。
在一些方面,适当的多肽表达可能要求该编码区域的3’端有多聚腺苷酸化区域。多聚腺苷酸化区域可以出自天然基因、各种别的植物(或动物或其它)基因、或者根癌农杆菌T-DNA中的基因。
表达载体和克隆载体
本发明提供包括本发明的核酸例如编码本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的序列的表达载体和克隆媒介物。本发明的表达载体和克隆媒介物可以包括病毒颗粒、杆状病毒、噬菌体、噬菌粒(phagemids)、粘粒、fos-质粒(fosmids)、细菌人工染色体、病毒DNA(例如疫苗、腺病毒、禽痘病毒、伪狂犬病病毒和SV40的衍生物)、基于P1的人工染色体、酵母质粒、酵母人工染色体和任何别的对感兴趣的特定宿主(例如,杆状菌、曲霉和酵母)有特异性的载体。本发明的载体可以包括染色体、非染色体和合成的DNA序列。大多数合适的载体对于本领域技术人员都是已知的,并且可以商业获得。典型的载体包括:细菌:pQE载体(Qiagen)、pBluescript质粒、PNH载体、λ-ZAP载体(Stratagene);ptrc99a、PKK223-3、pDR540、pRIT2T(Pharmacia);真核细胞的:PXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,也可以使用任何别的质粒或别的载体,只要它们可以在宿主中复制和维持下去。可以在本发明中使用低拷贝数或高拷贝数的载体。
表达载体可以包括启动子、翻译起始和转录终止的核糖体结合位点。载体也可以包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制起始点、任何必须的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、5’边的非转录序列。一方面,衍生于SV40剪接位点和聚腺苷酸化位点的DNA序列可以用于提供所需要的不被转录的基因元件。
在一个方面,表达载体含有一个或多个选择性标记基因,使得可以对含有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因和使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(E.coli)具有四环素或氨苄青霉素抗性的基因和酵母(S.cerevisiae)TRP1基因。启动子区域可以使用氯霉素转移酶(CAT)载体或具有选择标记的别的载体,从任何期望的基因中选择出来。
用于在真核细胞中表达多肽或其片段的载体也可以含有增强子,以增加表达水平。增强子是DNA的顺式作用元件,一般长度为大约10到大约300bp,其作用于启动子,增强其转录。例子包括在SV40复制起点下游侧100bp到270bp的增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子,和腺病毒增强子。
核酸序列可以通过各种程序插入载体中。一般的,把插入物和载体用合适的限制性内切酶消化后,序列可以连接到载体中的所希望的位置。可选择地,插入物和载体的平末端可以被连接。在本领域已知多种克隆技术,例如在Ausubel和Sambrook中描述的。这样的程序和别的程序被认为在本领域技术人员已知的范围内。
载体可以是质粒、病毒颗粒或噬菌体的形式。别的载体包括染色体的、非染色体的和合成的DNA序列、SV40的衍生物;细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和表达载体被例如Sambrook描述。
可以使用的特定的细菌载体包括商业上可获得的质粒,包括以下已知的克隆载体的遗传元件:pBR322(ATCC37017)、pKK223-3(Pharmacia Fine Chemicals,Uppsala,Sweden)、GEM1(Promega Biotec,Madison,WI,USA)、pQE70、pQE60、pQE-9(Qiagen)、pD10、psiX174pBluescript II KS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK233-3、DR540、pRIT5(Pharmacia)、pKK232-8和pCM7。特定的真核载体包括pSV2CAT、pOG44、pXT1、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用任何别的载体,只要它可以在宿主细胞中复制和维持。
本发明的核酸可以在表达序列盒、载体或病毒中表达,在植物细胞和种子中短暂的或稳定的表达。一个典型的短暂表达系统应用了附加体(episomal)表达系统,例如,在核中通过含有超螺旋DNA的附加小染色体的转录而产生的花椰菜花叶病毒(CaMV)RNA,见,例如,Covey(1990)Proc.Natl.Acad.Sci.USA87:1633-1637。作为选择,编码序列,即本发明的序列的全部或亚片断,可以插入到植物宿主细胞基因组中,而成为该宿主染色体DNA的整合的一部分。正义和反义转录产物可以以这种方式被表达。包含本发明的核酸的序列(例如,启动子或编码区域)的载体可以包括用于在植物细胞或种子中选择表型的标记基因。例如,所述标记可以编码生物杀灭剂抗性,特别是抗生素抗性,例如对卡那霉素、G418、博来霉素、潮霉素或除草剂的抗性,例如对氯磺隆或Basta的抗性。
可以在植物中表达核酸和蛋白的表达载体在本领域中是已知的,可以包括,例如,根癌农杆菌的载体、马铃薯病毒X(见,例如,Angell(1997)EMBO J.16:3675-3684)、烟草花叶病病毒(见,例如,Casper(1996)Gene173:69-73)、番茄丛矮病毒(见,例如,Hillman(1989)Virology169:42-50)、烟草蚀纹病毒(见,例如,Dolja(l997)Virology234:243-252)、菜豆金色花叶病毒(见,例如,Morinaga(1993)Microbiol inimunol.37:471-476)、花椰菜花叶病毒(见,例如,Cecchini(1997)Mol.Plant Microbe Interact.10:1094-110l)、玉米Ac/Ds转座元件(见,例如,Rubin(1997)Mol.Cell.Biol.17:6294-6302;Kunze(1996)Curr.Top.Microbiol.Inimunol.204:161-194),和玉米抑制基因-突变基因(Spm)转座元件(见,例如Schlappi(1996)Plant Mol.Biol.32:717-725);和它们的衍生物。
在一个方面,蛋白载体可以有两套复制系统,使其可以在两种生物中保持,例如在哺乳动物或昆虫细胞中表达,在原核宿主中克隆和扩增。进一步,对于整合表达载体,该表达载体可以包括至少一个与宿主细胞基因组同源的序列。它可以在表达构建物的两侧包含两个同源序列。通过选择包含入载体的合适的同源序列,可以将该整合载体定位到宿主细胞的特定位置。整合载体的构建在本领域已知。
本发明的表达载体也可以包括选择性的标记基因,以便对已经转化的细菌株进行选择,例如,使细胞对药物,例如氨苄青霉素、氯霉素、红霉素、卡那霉素、新霉素和四环素产生抗性的基因。选择性的标记也可以包括生物合成基因,例如在组氨酸、色氨酸和亮氨酸生物合成途径中的基因。
表达载体中的DNA序列可有效连接于合适的表达控制序列(启动子)以引导RNA的合成。具有特定命名的细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。真核细胞启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和鼠金属硫蛋白-I启动子。选择合适的载体和启动子是在本领域普通技术人员的水平之内。表达载体也含有翻译起始和转录终止的核糖体结合位点。载体也包括扩增表达的合适序列。可使用氯霉素转移酶(CAT)载体或其它具有选择性标记的载体从任何期望的基因中选择启动子区域。另外,为选择被转化的宿主细胞,表达载体在一个方面含有一个或多个选择性标记基因以提供一种表型特征,如使真核细胞培养物具有二氢叶酸还原酶或新霉素抗性,或使大肠杆菌具有四环素或氨苄青霉素抗性。
哺乳动物表达载体也可以包括复制起始点、任何必须的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、5’侧的非转录序列。在一些方面,衍生于SV40剪接位点和聚腺苷酸化位点的DNA序列可以用于提供所需要的不被转录的基因元件。
用于在真核细胞中表达多肽或其片段的载体也可以含有增强子,以增加表达水平。增强子是DNA的顺式作用元件,一般长度为大约10到大约300bp,作用于启动子,增强其转录。例子包括在SV40复制起点下游侧100bp到270bp的增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子和腺病毒增强子。
另外,表达载体通常含有一个或多个选择性标记基因,使得可以对含有该载体的宿主细胞进行选择。这些选择性标记包括编码二氢叶酸还原酶的基因和使得真核细胞培养物具有新霉素抗性的基因、使得E.coli具有四环素或氨苄青霉素抗性的基因和酵母(S.cerevisiae)TRP1基因。
在一些方面,编码本发明其中一个多肽或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的核酸在合适的阶段与能够引导翻译出的多肽或其片段分泌的引导序列组装。可选择的是,核酸可编码一种融合多肽,其中本发明其中一个多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段与异源肽或多肽融合,这些异源肽例如可提供所需特征如增加的稳定性或简化的纯化步骤的N-末端识别肽。
核酸序列可以通过各种程序插入载体中。一般的,把插入物和载体用合适的限制性内切酶消化后,序列可以在载体中的期望位置连接。可选择的是,插入物和载体的平末端可以被连接。多种克隆技术在Ausubel等,Current Protocols in Molecular Biology,John Wiley503Sons,Inc.1997和Sambrook等,Molecular Cloning:A Laboratory Manual2nd Ed.,Cold Spring Harbor Laboratory Press(1989)中被公开。这些程序和其它的程序被认为在本领域技术人员所知道的范围之内。
载体可以是例如质粒、病毒颗粒或噬菌体的形式。别的载体包括染色体的、非染色体的和合成的DNA序列、SV40的衍生物;细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和表达载体由Sambrook等,Molecular Cloning:A Laboratory Manual2nd Ed.,Cold Spring Harbor,N.Y.(1989)描述。
宿主细胞和转化细胞
本发明也提供了包含本发明的核酸序列例如编码本发明的葡聚糖酶的序列或者本发明的载体的转化细胞。宿主细胞可以是本领域技术人员熟悉的任何宿主细胞,包括原核细胞,真核细胞,例如,细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞或植物细胞。典型的细菌细胞包括大肠杆菌、乳酸乳球菌(Lactococcus lactis)、链霉菌、枯草芽孢杆菌、蜡状芽孢杆菌(Bacillus cereus)、鼠伤寒沙门氏菌(Salmonella typhimurium)和芽孢杆菌属、链霉菌属和葡萄球菌属中的任何种类。典型的昆虫细胞包括果蝇(Drosophila)S2和草地夜蛾(Spodoptera)Sf9。典型的酵母细胞包括巴斯德毕赤酵母、酿酒酵母或粟酒裂殖酵母(Schizosaccharomyces pombe)。典型的动物细胞包括CHO、COS或黑色素瘤细胞或任何鼠或人的细胞系。合适的宿主的选择在本领域技术人员的能力范围内。转化各种高等植物种类的技术是已知的,在技术和科学文献中有描述,见,例如,Weising(1988)Ann.Rey.Genet.22:421-477;美国专利5,750,870。
载体可以使用各种技术导入宿主细胞中,包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂转染法(lipofection)或电穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods in MolecularBiology,(1986))。
一方面,本发明的核酸或载体导入细胞是为了筛选,所以,所述核酸是以合适于该核酸的后续表达的方式进入细胞。导入的方法大体上由靶细胞类型决定。典型的方法包括CaPO4沉淀法、脂质体融合、脂转染法(例如,LIPOFECTINTM)、电穿孔法、病毒感染法,等等。候选的核酸可以稳定地整合到宿主细胞基因组中(例如,用反转录病毒导入)或者可以短暂的或稳定的存在于细胞质中(即,通过使用传统的质粒,利用标准的调控序列、选择标记,等等)。因为许多药学上重要的筛选要求人或模型哺乳动物靶细胞,所以可以使用能够转染这些靶细胞的反转录病毒载体。
适当的话,工程宿主细胞可以在传统的营养培养基中培养,所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后,用合适的方法(例如,温度变化或化学诱导)诱导被选择的启动子,细胞再培养一段时期,使得它们产生所需的多肽或其片段。
细胞可以通过离心收获,通过物理或化学方法破碎,保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎,包括冷冻-融解循环、超声波裂解法、机械破碎法或使用细胞溶解试剂。这些方法为本领域技术人员所熟悉。表达的多肽或其片断可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水作用色谱、亲和色谱、羟基磷灰石色谱和凝集素色谱在内的方法回收和纯化。假如必要的话,可以应用蛋白质重折叠来完成多肽的构象。假如需要的话,在最终的纯化步骤中可以采用高效液相色谱(HPLC)。
可以以常规方式应用宿主细胞中的构建物以产生由重组序列编码的基因产物。取决于在重组生产程序中采用的宿主细胞,由含有载体的该宿主细胞产生的多肽可以是糖基化的或者可以是非糖基化的。本发明的多肽可以包括或者不包括起始的甲硫氨酸残基。
也可以采用无细胞的翻译系统来产生本发明的多肽。无细胞翻译系统可以应用由DNA构建物转录得到的mRNA,所述DNA构建物包括与编码所述多肽或其片段的核酸可操作性连接的启动子。一些方面,该DNA构建物在进行体外转录反应之前可以是线性的。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育,产生所需的多肽或其片段。
表达载体可以含有一个或多个选择性标记基因,为选择转化宿主细胞提供表型性状,例如真核细胞培养物的二氢叶酸还原酶或新霉素抗性,或者大肠杆菌的例如四环素或氨苄青霉素的抗性。
含有感兴趣的多聚核苷酸例如本发明的核酸的宿主细胞可在常规营养培养基中培养,该培养基经改良以适于活化启动子、选择转化子或扩增基因。培养条件如温度、pH和类似的条件是以前那些被选择表达的宿主细胞所使用的条件,这对于普通技术人员是很明显的。被鉴定具有特异酶活性的克隆然后被测序,以鉴定编码具有增强活性的酶的多聚核苷酸序列。
本发明提供了在细胞中过量表达重组葡聚糖酶的方法,包括表达含有本发明的核酸的载体,本发明的核酸例如含有与本发明的示范性序列在至少大约100个残基的区域内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的核酸序列的核酸,其中所述的序列同一性是通过采用序列比较算法的分析或通过观察检验来确定的,或者,本发明的核酸例如在严紧条件下与本发明的核酸序列杂交的核酸。可通过任何手段实现过量的表达,例如使用高活性启动子、双顺反子载体或通过载体的基因扩增。
本发明的核酸可以用任何的体外或体内表达系统表达或过量表达。任何细胞培养系统都可用来表达或过量表达重组蛋白,包括细菌、昆虫、酵母、真菌或哺乳动物培养物。通过适当地选择启动子、增强子、载体(例如,使用复制子载体、双顺反子载体(见,例如Gurtu(1996)Biochem.Biophys.Res.Commun.229:295-8)、培养基、培养系统等可以实现过量表达。在一个方面,在细胞系统中,使用了选择标记如谷氨酰胺合成酶(见,例如Sanders(1987)Dev.Biol.Stand.66:55-63)的基因扩增可以被用来过量表达本发明的多肽。
关于这种方法的其它细节可在公共文献中找到,并且/或者它们对于专业技术人员是已知的。在一个特定的非限制性的示例中,这种可获得的公共文献包括EP0659215(WO9403612Al)(Nevalainen等);Lapidot,A.,Mechaly,A.,Shoham,Y.,″Overexpressionand single-step purification of a thermostable glucanase from Bacillusstearothermophilus T-6,″J.Biotechnol.Nov51:259-64(1996);Lüthi,E.,Jasmat,N.B.,Bergquist,P.L.,″Endoglucanases from the extremely thermophilic bacteriumCaldocellum saccharolyticum:overexpression of the gene in Escherichia coliand characterization of the gene product,″Appl.Environ.Microbiol.Sep56:2677-83(1990);以及Sung,W.L.,Luk,C.K.,Zahab,D.M.,Wakarch.uk,W.,″Overexpression ofthe Bacillus subtilis and circulans Endoglucanases in Escherichia coli,″Protein Expr.Purif.Jun4:200-6(1993),尽管这些参考文献并不能教导本申请中的发明酶。
宿主细胞可以是本领域技术人员熟悉的任何宿主细胞,包括原核细胞、真核细胞、哺乳动物细胞、昆虫细胞或植物细胞。作为合适的宿主的代表性例子,细菌细胞例如大肠杆菌、链霉菌、枯草芽孢杆菌、鼠伤寒沙门氏菌和链霉菌属和葡萄球菌属中的许多种类,真菌细胞例如酵母,昆虫细胞例如果蝇S2和草地夜蛾Sf9,动物细胞例如CHO、COS或黑色素瘤细胞,以及腺病毒。合适的宿主的选择在本领域技术人员的能力范围内。
载体可以使用各种技术导入宿主细胞中,包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂转染法或电穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods in Molecular Biology,(1986))。
适当的话,工程宿主细胞可以在传统的营养培养基中培养,所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后,用合适的方法(例如,温度变化或化学诱导)诱导被选择的启动子,细胞再培养一段时期,使得它们产生所需的多肽或其片段。
细胞通常可以通过离心收获,通过物理或化学方法破碎,保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎,包括冷冻-融解循环、超声波裂解法、机械破碎法或使用细胞溶解试剂。这些方法为本领域技术人员所熟悉。表达的多肽或其片段可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水作用色谱、亲和色谱、羟基磷灰石色谱和凝集素色谱在内的方法回收和纯化。假如必要的话,可以应用蛋白质重折叠来完成多肽的构象。假如需要的话,在最终的纯化步骤中可以采用高效液相色谱(HPLC)。
也可以应用各种哺乳动物细胞培养系统来表达重组蛋白。哺乳动物表达系统的例子包括猴肾纤维原细胞的COS-7细胞系(如Gluzman,Cell,23:175,1981所述)和别的能够由相容性载体表达蛋白质的细胞系,例如C127、3T3、CHO、HeLa和BHK细胞系。
可以以常规方式应用宿主细胞中的构建物来产生由重组序列编码的基因产物。取决于在重组生产程序中采用的宿主细胞,由含有载体的该宿主细胞产生的多肽可以是糖基化的或者可以是非糖基化的。本发明的多肽可以包括或者不包括起始的甲硫氨酸残基。
可选择地是,本发明的多肽,或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段可利用常规的肽合成仪来合成产生。在另一个方面,可以通过肽合成方法来应用多肽的片段或部分以产生相应的全长多肽;因此,片段可用作产生全长多肽的中间体。
也可以采用无细胞(cell-free)的翻译系统利用由DNA构建物转录得到的mRNA来产生本发明的其中一种多肽,或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段,所述DNA构建物包括与编码所述多肽或其片段的核酸可操作性连接的启动子。一些方面,该DNA构建物在进行体外转录反应之前可以是线性的。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育,产生所需的多肽或其片段。
扩增核酸
在实践本发明时,可以通过扩增来复制本发明的核酸和编码本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的核酸,或本发明的经修饰的核酸。扩增也可以用于克隆或修饰本发明的核酸。所以,本发明提供了用于扩增本发明的核酸的扩增引物序列对。本领域技术人员能够针对这些序列的任何部分或全长设计出扩增引物序列对。
在一个方面,本发明提供了利用本发明的引物对扩增出的核酸,所述的引物对例如由本发明核酸的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24、或25个残基和互补链的大约前(5′)15、16、17、18、19、20、21、22、23、24或25个残基所示的引物对。
本发明提供了用于扩增编码具有葡聚糖酶活性的多肽的核酸的扩增引物序列对,其中所述的引物对能够扩增含有本发明的序列或片段或其子序列的核酸。扩增引物序列对的一个或每个成员可以包括含有序列的至少大约10至50个连续碱基,或序列的大约12、13、14、15、16、17、18、19、20、21、22、23、24或25个连续碱基的寡核苷酸。本发明提供了扩增引物对,其中所述的引物对包含的第一个成员具有本发明核酸的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24或25个残基所示的序列,第二个成员具有第一个成员的互补链的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24或25个残基所示的序列。本发明提供了利用本发明的扩增引物对通过扩增例如聚合酶链式反应(PCR)产生的葡聚糖酶、甘露聚糖酶或木聚糖酶。本发明提供了利用本发明的扩增引物对通过扩增例如聚合酶链式反应(PCR)制备葡聚糖酶、甘露聚糖酶或木聚糖酶的方法。在一个方面,扩增引物对可从文库,例如基因文库,如环境文库中扩增出核酸。
扩增反应也可以用于定量样品中的核酸的量(例如,细胞样品中的信息(message)的量)、标记核酸(例如将其应用于阵列或印迹)、检测核酸或定量样品中的特定核酸的量。在本发明的一方面,从细胞或cDNA文库中分离出的信息被扩增。
熟练的技术人员能够选择和设计适合的寡核苷酸扩增引物。扩增方法在本领域是已知的,包括,例如聚合酶链式反应,PCR(见,例如PCR PROTOCOLS,A GUIDE TO METHODSAND APPLICATIONS,ed.Innis,Academic Press,N.Y.(1990)和PCR STRATEGLES(1995),ed.Innis,Academic Press,Inc.,N.Y.,连接酶链反应(LCR)(见,例如Wu(1989)Genomics4:560;Landegren(1988)Science241:1077;Barringer(l990)Gene89:117);转录扩增(见,例如Kwoh(1989)Proc.Natl.Acad.Sci.USA86:1173);和自主序列复制(见,例如Guatelli(1990)Proc.Natl.Acad.Sci.USA87:1874);Q Beta复制酶扩增(见,例如Smith(1997)J.Clin.Microbiol.35:1477-1491),自动Q-beta复制酶扩增分析(见,例如Burg(1996)Mol.Cell.Probes10:257-271)和别的RNA聚合酶介导的技术(例如,NASBA,Cangene,Mississauga,Ontario);也见Berger(1987)Metbods Enzymol.l52:307-316;Sambrook;Ausubel;美国专利4,683,195和4,683,202;Sooknanan(1995)Biotechnology13:563-564。
确定序列同一性(sequence identity)的程度
本发明提供了核酸,其包括与本发明的示例性核酸(例如SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ IDNO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ IDNO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ IDNO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ IDNO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ IDNO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ IDNO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ IDNO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ IDNO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ IDNO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ IDNO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ IDNO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ IDNO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ IDNO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ IDNO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ IDNO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ IDNO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ IDNO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ IDNO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ IDNO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ IDNO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、SEQ IDNO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ IDNO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ IDNO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ IDNO:495、SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515、SEQ IDNO:517)在至少大约10、20、30、40、50、60、70、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多残基的区域内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全(100%)的序列同一性的序列。本发明提供了多肽,其包括与本发明的示范性多肽具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全的(100%)序列同一性的序列。序列同一性(同源性)的程度可以使用任何计算机程序和相关的参数来测定,包括在此所述的那些程序和参数,如BLAST2.2.2.或FASTA版本3.0t78,其中使用默认参数(default parameters)。
本发明的核酸序列可以包括本发明的示例性序列和与其实质上相同的序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续核苷酸。本发明的核酸序列的同源序列和片段和片段,是指与这些序列具有至少99%、98%、97%、96%、95%、90%、85%、80%、75%、70%、65%、60%、55%或50%的同源性的序列。同源性可使用在此所述的任何计算机程序和参数来确定,包括FASTA版本3.0t78,并使用默认参数。同源序列也包括RNA序列,其中尿嘧啶替代了本发明核酸序列中的胸腺嘧啶。同源序列可以使用任何在此描述的程序或者可以由校正测序错误而获得。要理解的是,本发明的核酸序列可以用传统的单字符格式(single character format)来表示(见Stryer,Lubert.Biochemistry,3rd Ed.,W.HFreeman&Co.,New York的背面内页)或者用可记录序列内核苷酸同一性的任何其它格式来表示。
在本专利说明书的其它地方说明的各种序列比较程序都可被特别地考虑用于本发明的这个方面。蛋白和/或核酸序列的同源性可以应用本领域已知的各种序列比较算法和程序来评估。这样的算法和程序包括,但不限于,TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(Pearson和Lipman,Proc.Natl.Acad.Sci.USA85(8):2444-2448,1988;Altschul等,J.Mol.Biol.215(3):403-410,1990;Thompson等,Nucleic Acids Res.22(2):4673-4680,1994;Higgins等,Methods Enzymol.266:383-402,1996;Altschul等,J.Mol.Biol.215(3):403-410,1990;Altschul等,Nature Genetics3:266-272,1993)。
同源性或者同一性常常是应用序列分析软件来测定(如地址为1710UniversityAvenue,Madison,WI53705的威斯康星大学生物技术中心遗传学计算机组(GeneticsComputer Group)的序列分析软件包)。这样的软件通过对各种缺失、替代和其它的修饰赋予表示同源性的数值来匹配相似的序列。联系两个或者多个核酸或者多肽序列的术语“同源性”和“同一性”,是指当两个或更多个序列或子序列在某一比较窗口(comparisonwindow)或者指定区域内被比较和比对以确定最大一致性时,这些序列是相同的,或者具有特定比例的相同氨基酸残基或核苷酸,最大一致性可以应用各种序列比较算法或者通过人工比对和目测检查法来测定。
对于序列比较,通常是一段序列作为参考序列,受测序列与之进行比较。当使用序列比较算法时,将受测序列和参考序列输入到计算机中,指定子序列坐标,如果必要,指定序列算法程序参数。可以使用默认的程序参数,或者可以指定别的参数。以程序参数为基础,然后通过序列比较算法计算出受测序列相对于参照序列的百分序列一致性。
正如在此所使用的,“比较窗口(comparison window)”包括引用具有选自大约20到600、通常是大约50到大约200、更通常是大约100到大约150的任一数目的连续位置的片段,其中序列与具有同样数目的连续位置的参考序列在优化比对之后,两个序列可以进行比较。用于进行比较的序列比对方法在本领域已知。用于比较的序列的优化比对可以通过例如以下的手段实现:Smith和Waterman,Adv.Appl.Math.2:482,1981的局部同源性算法,Needleman和Wunsch,J.Mol.Biol.48:443,1970的同源性联配算法,person和Lipman,Proc.Nat′l.Acad.Sci.USA85:2444,1988的查找相似的方法,这些算法的计算机化实施(Wisconsin Genetics Software Package中的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputer Group,575Science Dr.,Madison,WI),手工比对和目测检查法。除了BLAST程序(生物信息国家中心的基本局域联配搜索工具(Basic Local Alignment Search Tool))外,用于确定同源性或者一致性的其它的算法包括,例如,ALIGN、AMAS(多重联配序列分析(Analysis of Multiply Aligned Sequences))、AMPS(蛋白多重序列联配(ProteinMultiple Sequence Alignment))、ASSET(联配片段统计评估工具(Aligned SegmentStatistical Evaluation Tool))、BANDS、BESTSCOR、BIOSCAN(生物学序列比较分析节点(Biological Sequence Comparative Analysis Node))、BLIMPS(BLocks IMProvedSearcher)、FASTA、Intervals&Points、BMB、CLUSTAL V、CLUSTAL W、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman算法、DARWIN、Las Vegas算法、FNAT(强迫核苷酸联配工具(Forced Nucleotide Alignment Tool))、Framealign、Framesearch、DYNAMIC、FILTER、FASP(Fristensky序列分析软件包)、GAP(全局联配程序(Global AlignmentProgram))、GENAL、GIBBS、GenQuest、ISSC(灵敏的序列比较(Sensitive SequenceComparison))、LALIGN(局部序列联配(Local Sequence Alignment))、LCP(局部内容程序(Local Content Program))、MACAW(多重联配构建和分析工作台(Multiple AlignmentConstruction&Analysis Workbench))、MAP(多重联配程序(Multiple AlignmentProgram))、MBLKP、MBLKN、PIMA(模式诱导的多重序列联配(Pattern-Induced Multi-sequence Alignment))、SAGA(通过遗传算法的序列联配(Sequence Alignment byGenetic Algorithm))和WHAT-IF。这样的联配程序也可以用于筛查基因组数据库,确定具有大体上相同的序列的多聚核苷酸序列。大量的基因组数据库是可利用的,例如,作为人类基因组测序工程的构成部分的人类基因组的实质部分可以被利用(J.Roach,http://weber.u.Washington.edu/~roach/human_genome_progress2.html)(Gibbs,1995)。几个基因组序列已经测定,如,生殖器支原体(M.genitalium)(Fraser等,1995)、甲烷球菌(M.jannaschii)(Bult等,1996)、流行性感冒杆菌(H.influenzae)(Fleischmann等,1995)、大肠杆菌(E.coli)(Blattner等,1997)、和酵母(S.cerevisiae)(Mewes等,1997),和黑腹果蝇(D.melanogaster)(Adams等,2000)。在模式生物的基因组序列的测序上已经取得了很大的进展,如鼠,线虫(C.elegans)和拟南芥(Arabadopsis sp.)。含有基因组信息并且注释有一些功能性信息的数据库由不同组织维护,可以通过互联网登录。
可用的算法的一个实例是BLAST和BLAST2.0算法,分别在Altschul等人,Nuc.Acids Res.25:3389-3402,1977和Altschul等人,J.Mol.Biol.215:403-410,1990中描述。用于实施BLAST分析的软件可以通过美国国家生物技术信息中心公开获得。这一算法包括首先通过鉴别待询序列(query sequence)中长度为W的短的字串来确定高分序列对(high scoring sequence pairs,HSPs),所述高分序列对在与数据库序列中同样长度的字串联配时,匹配或者满足某个正值的阈值T。T是指作为邻近字串(neighborhood word)的分数阈值(Altschul等,如上)。这些初始的邻近字串被用来启动搜索以发现包含有它们的更长的HSPs。所述字串沿着每一个序列向两个方向延伸,只要累积的联配分数在增加。对于核苷酸序列,使用参数M(一对匹配的残基的奖励分数;总是大于0)来计算累积分数;对于氨基酸序列,使用记分矩阵来计算累计分数。出现下面情况时,字串在各个方向上的延伸便停止:累积的联配分数由达到的最大值下降了数量X;由于一个或者多个记分为负的残基联配的累积,累积分数达到0或者0以下;或者延伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN程序(对于核苷酸序列)默认的是:字串长度(W)为11,期望值(E)为10,M=5,N=-4,对两条链进行比较。对于氨基酸序列,BLASTP程序默认:字串长度为3,期望值(E)为10,BLOSUM62记分矩阵(参见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA89:10915)联配(B)为50,期望值(E)为10,M=5,N=-4,对两条链进行比较。
BLAST算法也进行两个序列之间的相似性的统计学分析(参见,例如,Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA90:5873)。由BLAST算法提供的一种相似性量度是最小合计概率(smallest sum probability,P(N)),其表示两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如,在受测核酸和参考核酸的比较中,如果最小合计概率小于大约0.2,更在一个方面小于0.01,最优选地在一个方面小于大约0.001,就认为该核酸与参考序列相似。
一方面,应用基本局域联配搜索工具(“BLAST”)来评价蛋白和核酸序列同源性。例如,五个特定的BLAST程序可以用来进行以下的任务:
(1)BLASTP和BLAST3把氨基酸待询序列与蛋白质序列数据库进行比较;
(2)BLASTN把核苷酸待询序列与核苷酸序列数据库进行比较;
(3)BLASTX把待询核苷酸序列(两条链)的六个阅读框架的概念上的翻译产物与蛋白序列数据库进行比较;
(4)TBLASTN把待询蛋白序列与核苷酸序列数据库的所有六个阅读框架(两条链)的翻译结果进行比较;
(5)TBLASTN把核苷酸待询序列的六个框架的翻译结果与核苷酸序列数据库的六个框架的翻译结果进行比较。
BLAST程序通过确定相似片段来确定同源性序列,所述相似片段在此是指在待查询的氨基酸或核酸序列与受测序列之间的“高分片段对(high-scoring segment pairs)”,该受测序列在一个方面从蛋白或者核酸序列数据库得到。高分片段对在一个方面利用记分矩阵来鉴定(即,联配),很多的记分矩阵在本领域是已知的。在一个方面,应用的记分矩阵为BLOSUM62矩阵(Gonnet等,Science256:1443-1445,1992;Henikoff和Henikoff,Proteins17:49-61,1993)。较少地在一个方面,也可以应用PAM或者PAM250矩阵(参见如,Schwartz和Dayhoff,eds.,1978,Matrices for Detecting Distance Relationships:Atlas of protein Sequence and Structure,Washingion:National BiomedicalResearch Foundation)。BLAST程序可通过美国国立医学图书馆取得。
上述算法所使用的参数可根据被研究的序列长度和同源性程度来修改。在一些方面,在没有用户指令时所使用的参数可以是该算法所使用的默认参数。
计算机系统和计算机程序产品
为了确定和鉴定序列一致性、结构同源性、模体等等,本发明的核酸或多肽序列可以在能够由计算机阅读和访问的任何介质上存储、记录和操作。
因此,本发明提供记录或存储有本发明的核酸和多肽序列的计算机、计算机系统、计算机可读介质、计算机程序产品以及类似物。正如在此所用,词语“记录”和“存储”是指将信息存储到计算机介质中的过程。技术人员很容易地采用任何已知的方法将信息记录到计算机可读介质上,从而产生包括发明的一个或者多个核酸和/或多肽序列的产品。
本发明的多肽包括本发明的多肽序列,例如本发明的示范性序列和与其实质上相同的序列,和任何前述序列的片段。实质上相同的或同源的多肽序列是指与本发明的示范性序列,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全的(100%)序列同一性的多肽序列。
同源性可使用在此所述的任何计算机程序和参数来测定,包括FASTA3.0t78版,使用默认参数或任何修改的参数。同源序列可以使用任何在此描述的程序或者可以由测序错误的校正获得。多肽片段含有本发明多肽的至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500或更多的连续氨基酸。要理解的是,如在本发明的氨基酸序列中所示的多肽编码可以以传统的单字符格式或三字母格式表示(见Stryer,Lubert.Biochemistry.3rd Ed.,W.H Freeman&Co.,New York的背面内页)或以可以将多肽序列同一性关联起来的任何其它格式表示。
本发明的核酸或多肽序列可在能被计算机阅读和存取的任何介质上存储、记录和操作。如在此所使用的,词语“记录”和“存储”是指在计算机介质上储存信息的过程。技术人员可很容易地采用任何以前已知的方法来在计算机可读介质上记录信息以产生一些产品,其含有本发明的一个或更多个核酸序列,本发明的一个或更多个多肽序列。本发明的另一个方面是计算机可读介质,上面已经记录了本发明的核酸序列的至少2、5、10、15或20或更多个核酸序列。
本发明的另一个方面是计算机可读介质,其上已经记录了本发明的一个或更多个核酸序列。本发明的另一个方面是计算机可读介质,其上已经记录了本发明的一个或更多个多肽序列。本发明的另一个方面是计算机可读介质,其上已经记录了如上所示的至少2、5、10、15或20或更多个序列。
计算机可读介质包括磁性可读介质、光学可读介质、电子可读介质和磁性/光学介质。例如,计算机可读介质可以是硬盘、软盘、磁带、CD-ROM、数字化视频光盘(DVD)、随机存储器(RAM),或者只读存储器(ROM),同时还有本领域技术人员所知的其它类型的其它介质。
本发明的方面包括存储和操作在此描述的序列信息的系统(如,基于因特网的系统),特别是计算机系统。计算机系统100的一个例子在图1的框图中说明。正如在此所使用的,“计算机系统”是指其硬件部分、软件部分以及用于分析本发明核酸序列的核苷酸序列或本发明的多肽序列的数据存储部分。计算机系统100通常包括用于处理、访问和操作序列数据的处理器。该处理器105可以是任何已知类型的中央处理单元,例如Intel公司的奔腾III,或者来自Sun、Motorola、Compaq、AMD或者IBM的类似处理器。
通常地,计算机系统100是一种通用系统,包括处理器105和一个或者多个用于存储数据的内部数据存储部分110,以及一个或者多个用于检索存储在数据存储部分中的数据的数据检索装置。技术人员可以很容易地意识到目前可用的计算机系统的任何一个都是合适的。
在一个特定的方面,计算机系统100包括处理器105,处理器105连接于数据传送总线,该总线连接于一个主存储器115(在一个方面,按RAM来实施),计算机系统100还包括一个或者多个内部数据存储装置110,如硬盘驱动器和/或具有数据记录作用的其它的计算机可读介质。在一些方面,计算机系统100可以进一步包括一个或者多个用于读取内部数据存储装置110上储存的数据的数据检索装置118。
数据检索装置118可以是例如,软盘驱动器、光盘驱动器、磁带驱动器或者可以(如,通过因特网)连接至远端的数据存储系统的调制解调器等。在一些方面,内部数据存储装置110是可移动的计算机可读介质,例如含有控制逻辑和/或在其中记录有数据的软盘、光盘、磁带等。有利的是,计算机系统100可以包括或运行适当的软件程序,从插入到数据检索装置中的数据存储部分读取控制逻辑和/或数据。
计算机系统100包括用于给计算机使用者显示输出结果的显示器120。也应当注意到,计算机系统100可以在网络中或者宽域网中与其它的计算机系统125a-c相联,提供集中化的计算机系统100访问。
用于访问和处理本发明核酸序列的核苷酸序列,或本发明的多肽序列的软件(如搜索工具、比较工具和建模工具(modeling tools)等)可在执行过程中驻留在主存储器115中。
在一些方面,计算机系统100可以进一步包含用于比较存储在计算机可读介质上的本发明核酸序列,或本发明多肽序列与存储在计算机可读介质上的参考核苷酸或多肽序列的序列比较算法。“序列比较算法”是指一个或多个程序,其可在计算机系统100上(本地或远程)执行以比较核苷酸序列和数据储存装置中存储的其它的核苷酸序列和/或化合物。例如,序列比较算法可将储存在计算机可读介质上的本发明核酸序列的核苷酸序列,或本发明多肽序列与储存在计算机可读介质上的参考序列比较,以鉴定同源性或结构模体。
图2是说明了处理过程200的一个方面的流程图,这个处理过程是为了确定新序列和数据库中的序列间的同源性水平,把新的核苷酸或者蛋白序列与数据库中的序列加以比较。含有序列的数据库可以是存储于计算机系统100的私人数据库,或者公共的数据库,如通过因特网可以访问到的GENBANK。
过程200开始于起始状态201,然后移至状态202,其中待比较的新序列存储在计算机系统100的存储器上。如上讨论,存储器可以是任何形式的存储器,包括RAM或者内部存储设备。
过程200然后移至状态204,其中序列数据库被打开以用于分析和比较。然后,过程200移至状态206,其中存储在数据库的第一个序列读取到计算机的存储器中。然后在状态210中进行比较,确定第一序列是否与第二序列相同。重要的是,注意到这一步骤并不限于在所述新序列和数据库中的第一序列间进行准确的比较。本领域技术人员熟知比较两个核苷酸或者蛋白序列的方法,尽管它们并不完全相同。例如,为了提高两个待测序列间的同源性水平,可以在一个序列中引入空位。在比较过程中控制是否往序列中引入空位或者其它特征的参数一般由计算机系统的使用者输入。
一旦在状态210下进行两个序列的比较,在决定状态210下作出两个序列是否相同的决定。当然,术语“相同”并不限于绝对相同的序列。在过程200中,在使用者输入的同源性参数范围内的序列将标记为“相同”。
如果决定了两个序列相同,过程200移至状态214,其中给使用者显示了来自数据库的所述序列的名称。这一状态可以告诉使用者具有被显示的名称的序列满足输入的同源性限制。一旦被存储的序列的名称显示给使用者,过程200移至决定状态218,其中确定在数据库中是否存在更多的序列。如果在数据库中没有更多的序列存在,那么过程200终止于结束状态220。然而,如果在数据库中存在更多的序列,那么过程200移至状态224,其中指示器移至数据库的下一个序列以便可以与所述的新序列比较。以这种方式,所述的新序列与数据库中的每一个序列进行联配和比较。
应当注意到,如果已经在决定状态212确定了序列并不具有同源性,那么为了确定在数据库中是否有其它的可用于比较的序列,过程200将立即移至决定状态218。
因此,本发明的一个方面是计算机系统,其含有处理器、其上储存了本发明核酸序列或本发明多肽序列的数据存储设备、其上可检索地储存了参考核苷酸序列或多肽序列的数据存储设备,所述的参考核苷酸序列或多肽序列将与本发明的核酸序列或本发明的多肽序列进行比较,以及执行比较的序列比较器。序列比较器可指示被比较序列之间的同源性水平,或在上述的本发明核酸序列或本发明多肽序列中所示的多肽序列中鉴定结构模体,或可以在与这些核酸代码和多肽代码比较的序列中鉴定结构模体。在一些方面,数据存储设备上面可以存储有本发明核酸序列中的至少2、5、10、15、20、25、30或40或更多个序列,或本发明的多肽序列。
本发明的另一个方面是用于确定本发明核酸序列和本发明多肽序列与参考核苷酸序列之间的同源性水平的方法。该方法包括通过使用可测定同源性水平的计算机程序读取核酸代码或多肽代码以及参考核苷酸或多肽序列,并用计算机程序确定核酸代码或多肽代码与参考核苷酸或多肽序列之间的同源性。计算机程序可以是任意的能够测定同源性水平的计算机程序,包括在此特别列举的那些(例如,BLAST2N,使用默认参数,或任何修改的参数)。该方法可使用上述的计算机系统执行。本方法也可这样来执行:通过使用计算机程序读取上述本发明核酸序列或本发明多肽序列中的至少2、5、10、15、20、25、30或40或更多个序列,并测定核酸代码或多肽代码和参考核苷酸序列或多肽序列之间的同源性。
图3是说明在计算机中确定两个序列是否具有同源性的过程250的一个方面的流程图。过程250开始于起始状态252,然后移至状态254,其中待比较的第一序列被存储于存储器中。待比较的第二序列然后在状态256被存储于存储器中。过程250然后移至状态260,其中读取第一序列的第一个字符,然后到状态262,其中读取第二序列的第一个字符。应当理解,如果序列是核苷酸序列,那么所述字符一般将是A、T、C、G或者U。如果序列是蛋白质序列,那么在一个方面可以是单字母的氨基酸代码,以便第一序列和第二序列可以很容易地进行比较。
然后在决定状态264作出是否两个字符是否相同的决定。如果它们是相同的,那么过程250移至状态268,其中读取第一序列和第二序列的下一个字符。然后确定所述的下一字符是否相同。如果相同,那么过程250继续这一循环直到两个字符是不同的。如果确定了接下来的两个字符并不相同,过程250移至决定状态274,确定在两个序列中是否有任何更多的字符要读取。
如果没有任何更多的字符被读取,那么过程250移至状态276,其中第一序列和第二序列的同源性水平显示给使用者。通过计算序列间相同字符占第一序列中字符总数的比例来确定同源性水平。这样,如果第一个100核苷酸序列的每一个字符都与第二序列的每一个字符联配,那么同源性水平将是100%。
可选择的是,计算机程序可以是将本发明中所示核酸序列的核苷酸序列与一个或更多个参考核苷酸序列进行比较的计算机程序,以便确定本发明的核酸代码是否在一个或更多个位置上不同于参考核酸序列。可任意选择的是,关于参考多核苷酸序列或本发明核酸序列,这样的程序可记录插入、删除或替代的核苷酸的长度和同一性。在一个方面,计算机程序可以确定本发明核酸序列是否含有参考核苷酸序列的单核苷酸多态性(SNP)。
因此,本发明的另一个方面是确定本发明核酸序列是否与参考核苷酸序列有一个或更多个核苷酸的差异,包括步骤如下:通过使用可鉴定核酸序列间差异的计算机程序读取核酸代码和参考核苷酸序列,并使用计算机程序鉴定核酸代码和参考核苷酸序列之间的差异。在一些方面,计算机程序可鉴定单核苷酸多态性。该方法可通过上述的计算机系统来实施,方法在图3中图示。该方法的执行也可通过使用计算机程序读取本发明核酸序列的至少2、5、10、15、20、25、30或40或更多个核酸序列以及参考核苷酸序列,并使用计算机程序鉴定核酸代码和参考核苷酸序列之间的差异来进行。
在另一个方面,采用了计算机的系统可进一步包含识别器,可鉴别本发明的核酸序列或本发明的多肽序列内的特征。
“识别器(identifier)”是指一个或多个程序,其可识别本发明的核酸序列或本发明的多肽序列内的某些特征。在一个方面,识别器可以含有可鉴别本发明核酸序列中的开放阅读框架的程序。
图4是说明用于检测在序列中某个特征的存在的识别器处理过程300的一方面的流程图。过程300开始于起始状态302,随后移至状态304,其中待检测特征的第一序列被存储于计算机系统100的存储器115中。过程300然后移至状态306,其中序列特征的数据库被打开。这样的数据库将包括各个特征的属性及其名称的列表。例如,特征的名称可以是“起始密码子”,该特征属性将会是“ATG”。另一个例子是特征名称“TAATAA盒”,该特征的属性将是“TAATAA”。这样的数据库的例子由威斯康星大学遗传学计算机组制作。可选择地,所述特征可以是结构性多肽模体,如α螺旋、β折叠,或者功能性多肽模体,如酶的活性区域(CDs)或活性位点、螺旋-转角-螺旋模体,或者本领域技术人员所知的其它模体。
一旦特征的数据库在状态306下打开,过程300移至状态308,其中从数据库读取第一特征。然后在状态310进行第一特征的属性和第一序列的比较。然后在决定状态316中作出决定是否在第一序列中发现所述特征的属性。如果发现有该属性,那么过程300移至状态318,其中所发现的特征的名称被显示给使用者。
过程300然后移至决定状态320,其中决定是否在数据库中存在更多的特征。如果不存在更多的特征,那么过程300终止于结束状态324。然而,如果在数据库中存在更多的特征,那么过程300在状态326中读取下一个序列特征,并且回至状态310,在其中进行所述下一个特征的属性与第一序列比较。如果在决定状态316中所述特征的属性没有在所述第一序列中发现,那么为了决定在数据库中是否存在更多特征,过程300直接移至决定状态320。
因此,本发明的另一个方面是鉴别本发明核酸序列,或本发明多肽序列内的特征的方法,包括通过使用可识别其中特征的计算机程序读取核酸代码或多肽代码,并使用计算机程序鉴别核酸代码内的特征。在一个方面,计算机程序包括可鉴别开放阅读框的计算机程序。
本方法的实施可以通过使用计算机程序读取本发明核酸序列,或本发明多肽序列中的单个序列或至少2、5、10、15、20、25、30或40个序列,并使用计算机程序鉴别在核酸代码或多肽代码内的特征。
本发明的核酸序列,或本发明的多肽序列可在各种数据处理程序中以多种格式被储存和进行操作。例如,本发明的核酸序列,或本发明的多肽序列,可以以文本形式储存在字处理文件如Microsoft WORDTM或WORDPERFECTTM中,或以ASCII文件储存在各种本领域技术人员所熟悉的数据库程序如DB2TM、SYBASETM或ORACLETM中。另外,许多计算机程序和数据库都可用作序列比较算法、识别器、或参考核苷酸序列或多肽序列的来源,所述参考核苷酸序列或多肽序列要与本发明的核酸序列,或本发明的多肽序列进行比较。下列的列表的目的不是要限制本发明,而是提供可用于本发明的核酸序列,或本发明的多肽序列的程序和数据库的指南。
可以被应用于的程序和数据库包括,但不限于:MacPattern(EMBL)、DiscoveryBase(Molecular Applications Group)、GeneMine(Molecular ApplicationsGroup)、Look(Molecular Applications Group)、MacLook(Molecular ApplicationsGroup)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul等,J.Mol.Biol.215:403,1990)、FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB(Brutlag等,Comp.App.Biosci.6:237-245,1990)、Catalyst(Molecular SimulationsInc.)、Catalyst/SHAPE(Molecular Simulations Inc.)、Cerius2.DBAccess(MolecularSimulations Inc.)、HypoGen(Molecular Simulations Inc.)、Insight II(MolecularSimulations Inc.)、Discover(Molecular Simulations Inc.)、CHARMm(MolecularSimulations Inc.)、Felix(Molecular Simulations Inc.)、DelPhi(MolecularSimulations Inc.)、QuanteMM(Molecular Simulations Inc.),Homology(MolecularSimulations Inc.)、Modeler(Molecular Simulations Inc.)、ISIS(MolecularSimulations Inc.)、Quanta/Protein Design(Molecular Simulations Inc.)、WebLab(Molecular Simulations Inc.)、WebLab Diversity Explorer(Molecular SimulationsInc.)、Gene Explorer(Molecular Simulations Inc.)、SeqFold(Molecular SimulationsInc.)、MDL可用化学制品目录数据库(Available Chemicals Directory database)、MDL药品数据报告数据库(Drug Data Report data base)、综合医药化学数据库(ComprehensiveMedicinal Chemistry database)、德文特的世界药物索引数据库(World Drug Indexdatabase)、BioByteMasterFile数据库、Genbank数据库和Genseqn数据库。在本公开内容的技术领域内的技术人员是熟悉很多其它的程序和数据库的。
应用以上的程序可能检测到的模体包括编码亮氨酸拉链的序列、螺旋-转角-螺旋模体、糖基化作用位点、泛素化位点、α螺旋、β折叠、编码引导被编码蛋白的分泌的信号肽的信号序列、涉及转录调控的序列如同源框、酸性伸展(acidic stretches)、酶的活性位点(催化区域(CDs))、底物结合位点以及酶切割位点。
核酸的杂交
本发明提供了可在严紧条件下与本发明的示例性序列(例如SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ IDNO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ IDNO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ IDNO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ IDNO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ IDNO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ IDNO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ IDNO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ IDNO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ IDNO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ IDNO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ IDNO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ IDNO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ IDNO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ IDNO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ IDNO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ IDNO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ IDNO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ IDNO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO-369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ IDNO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ IDNO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、SEQ IDNO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ IDNO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ IDNO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ IDNO:495、SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515、SEQ IDNO:517)杂交的分离的、合成的、或重组的核酸。所述严紧条件可以是高的严紧条件、中等严紧条件和/或低的严紧条件,包括在此描述的高的和降低的严紧条件。在一方面,正是洗脱条件的严紧性提出了确定一段核酸是否在本发明范围内的条件,如下所述。
在可选择的方面,本发明的核酸根据它们在严紧条件下杂交的能力来定义,它们可以在大约5个残基到本发明的核酸全长之间;例如它们的长度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或者更多的残基。也包括比全长核酸短的核酸。这些核酸可以作为如,杂交探针、标记探针、PCR寡聚核苷酸探针、iRNA(单链或者双链)、编码抗体结合肽(抗原决定部位)的序列或反义序列、模体、活性位点(催化区域(CDs))以及类似物。
一方面,本发明的核酸由它们在高的严紧条件下杂交的能力来定义,高严紧条件包括在大约37℃到42℃大约50%的甲酰胺。一方面,本发明的核酸由它们在降低的严紧条件下杂交的能力来定义,低严紧条件包括在大约30℃到35℃大约35%到25%的甲酰胺。
作为选择,本发明的核酸由它们在高的严紧条件下杂交的能力定义,高严紧条件包括42℃,50%的甲酰胺、5×SSPE、0.3%SDS和重复序列封闭核酸,如cot-1或者鲑鱼精DNA(如,200n/毫升剪切的和变性的鲑鱼精DNA)。一方面,本发明的核酸由它们在降低的严紧条件下杂交的能力定义,该低严紧条件包括在降低的温度35℃,35%的甲酰胺。
在核酸杂交反应中,用来达到特定的严紧水平的条件可根据被杂交的核酸的特性来变化。例如,核酸的杂交区域的长度、互补性程度、核酸序列组成(例如,GC与AT含量)和核酸类型(例如,RNA或DNA)可在选择杂交条件时被加以考虑。其它的考虑是其中一种核酸是否被固定在例如滤纸上。
杂交可以在低严紧、中等严紧、高严紧条件下进行。作为核酸杂交的一个例子,含有固定的变性核酸的聚合物膜首先在45℃下在含有0.9M NaCl、50mM NaH2PO4,pH7.0、5.0mMNa2EDTA、0.5%SDS、10×Denhardt′s试剂和0.5毫克/毫升的聚核糖腺苷酸的溶液中预杂交30分钟。然后向该溶液中加入到大约2×107cpm(放射性比度为4-9×108cpm/ug)的32P末端标记的寡聚核苷酸探针。在温育12-16个小时以后,该膜在室温下在含有0.5%SDS的1×SET(l50mM NaCl、20mM Tris盐酸,pH7.8、1mM Na2EDTA)的溶液中洗涤30分钟,随后,用新鲜的1×SET在寡聚核苷酸探针的Tm-10℃洗涤30分钟。该膜随后暴露于放射自显影的胶片以检测杂交信号。
所有前面的杂交均可被考虑在高严紧条件下进行。
杂交后,可以洗涤滤膜以去除任何非特异结合的可检测探针。用于洗涤滤膜的严紧度也可以依据杂交的核酸的性质、杂交核酸的长度、互补的程度、核苷酸序列的组成(如GC和AT含量)以及核酸类型(如,RNA,DNA)而变化。越来越高的严紧条件洗涤的例子如下:2×SSC,0.1%SDS在室温下进行15分钟(低严紧度);0.1×SSC,0.5%SDS在室温下进行30分钟到1个小时(中等严紧度);0.1×SSC,0.5%SDS在杂交温度与68℃之间进行15到30分钟(高严紧度);以及0.15M的NaCl在72℃进行15分钟(很高的严紧度)。最后的低严紧度洗涤可以在0.1×SSC在室温进行。以上的例子仅仅是列出一系列可以用于洗膜的条件。本领域技术人员知道,对于不同严紧度的洗涤有各种配方。一些其它的实例如下所示。
已经与所述探针杂交的核酸可以通过放射自显影或者其它传统的技术鉴定。
以上的程序可以被修改,以鉴定与所述探针序列的同源性水平降低的核酸。例如,为了得到与可检测探针的同源性降低的核酸,可以应用较低严紧度的条件。例如,在含有大约1M的Na+浓度的杂交缓冲液中杂交温度可以以5℃的幅度从68℃降到42℃。杂交以后,滤膜可以用2×SSC、0.5%SDS在杂交温度下洗涤。认为这些条件中超过50℃是“中等”条件,而低于50℃的条件是“低的”条件。“中等”杂交条件的一个具体例子是当以上的杂交在55℃进行。“低严紧”杂交条件的一个具体例子是当以上的杂交在45℃进行。
作为选择,杂交可以在缓冲液中进行,如在含有甲酰胺的6×SSC中在42℃的温度进行。在这种情况下,在杂交缓冲液中的甲酰胺的浓度可以以5%的幅度从50%到0%,以鉴定与探针的同源性水平降低的克隆。杂交后,滤膜可以用6×SSC、0.5%SDS在50℃洗涤。认为这些条件中超过25%的甲酰胺是“中等”条件,而低于25%的甲酰胺的条件是“低的”条件。“中等”杂交条件的一个具体例子是当以上的杂交在甲酰胺为30%时进行。“低严紧”杂交条件的一个具体例子是当以上的杂交在甲酰胺为10%时进行。
然而,杂交形式的选择并不是关键的,而是洗脱条件的严紧度提出了确定一段核酸是否属于本发明范围的条件。用于鉴定核酸是否属于本发明范围的洗脱条件包括,例如在pH7的大约0.02摩尔的盐浓度,温度至少是大约50℃或者大约55℃到大约60℃;或者在72℃,大约0.15M NaCl的盐浓度,大约15分钟;或者大约0.2×SSC的盐浓度,温度至少为大约50℃或者大约55℃到大约60℃,进行大约15到20分钟;或者,杂交复合物在含有0.1%SDS的大约2×SSC的盐溶液中室温15分钟洗脱两次,然后用含有0.1%SDS的0.1×SSC在68℃、15分钟洗脱两次;或者等效条件,参见Sambrook、Tijssen和Ausubel所说明的SSC缓冲液和等效条件。
这些方法可用来分离本发明的核酸。例如,前述的方法可用来分离核酸,其具有与选自本发明序列中的一个序列,或含有其至少大约10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段和与其互补的序列中的核酸序列具有至少大约97%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%同源性的序列。可使用比对算法(alignment algorithm)来测定同源性。例如,同源的多核苷酸所具有的编码序列可以是在此所述的一种编码序列的天然发生的等位基因变异体。当与本发明核酸比较时,这样的等位基因变异体可以具有一个或多个核苷酸的取代、删除或添加。
另外,上述的程序可以被用来分离核酸,所述核酸编码的多肽与本发明多肽,或含有其5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段,具有至少大约99%、95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%的同源性,所述同源性可以使用序列比对算法(例如,如FASTA版本3.0t78算法,使用默认参数)来测定。
寡核苷酸探针和使用它们的方法
本发明也提供了核酸探针,其可以被用来例如鉴定编码具有葡聚糖酶活性的多肽或其片段的核酸或者用于鉴定葡聚糖酶基因。一方面,所述探针包括本发明的核酸的至少10个连续的碱基。作为选择,本发明的探针可以是本发明的核酸阐明的序列的至少大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、60、70、80、90、100、110、120、130、150或者大约10到50、大约20到60、大约30到70个连续的碱基。所述探针通过结合和/或杂交来鉴定核酸。所述探针可以用于本发明的阵列,参见以下的讨论,包括,例如毛细管阵列。本发明的探针也可以用于分离其它的核酸或者多肽。
分离得到的本发明核酸、与其互补的序列、或含有本发明序列中的一个序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段、或与其互补的序列,也可用作探针以确定一种生物学样品如土样中是否含有具有本发明核酸序列的生物体,或确定获得核酸的生物体。在这样的程序中,很有可能包藏有可以分离出所述核酸的生物体的生物样品被获得,并从所述样品中得到核酸。在允许探针特异地与所述样品中存在的任何互补序列杂交的条件下,让所述核酸与所述探针接触。
在必要的情况下,为了确定允许探针特异地与互补序列杂交的条件,可以让探针与来自已知含有互补序列的样品中的互补序列相接触,同时与不含有互补序列的对照序列相接触。杂交条件,如杂交缓冲液中的盐浓度、杂交缓冲液中甲酰胺的浓度或者杂交温度,可以进行被变化以确定允许所述探针特异地与互补的核酸杂交的条件。
如果样品含有可以从其中分离出所述核酸的生物体,那么探针的特异性杂交可以被检测到。杂交可以通过使用可检测试剂标记所述探针来检测,所述的可检测试剂例如放射性同位素、荧光染料或者能够催化形成可检测产物的酶。
使用标记探针来检测在样品中存在的互补核酸的很多方法对于本领域技术人员是熟悉的。这些方法包括Southern印迹、Northern印迹、菌落杂交方法以及点杂交。每种方法的实验方案都已经由Ausubel等人,Current Protocols in Molecular Biology,JohnWiley503Sons,Inc.(1997)和Sambrook等人,Molecular Cloning:A Laboratory Manual2nd Ed.,Cold Spring Harbor Laboratory Press(1989)提供。
作为选择,可以在一个扩增反应中使用多于一种探针(其中的至少之一可以特异地与存在于核酸样品的任何互补序列杂交)来检测样品中是否含有包括本发明的核酸序列的生物体(如,从中分离出所述核酸的生物体)。一方面,所述探针包括寡聚核苷酸。一方面,所述扩增反应可以包括PCR反应。PCR的实验方案见前面Ausubel和Sambrook的如上的所述。可选择地是,扩增包括连接酶链式反应、3SR或链置换反应(strand displacementreaction)。(参见,Barany,F.,″The Ligase Chain Reaction in a PCR World″,PCRMethods and Applications1:5-16,1991;E.Fahy等人,″Self-sustained SequenceReplication(3SR):An Isothermal Transcription-based Amplification SystemAlternative to PCR″,PCR Methods and Applications1:25-33,1991和Walker G.T.等人,″Strand Displacement Amplification-an Isothermal in vitro DNAAmplification Technique″,Nucleic Acid Research20:1691-1696,1992)。在这些程序中,所述样品中的核酸与所述探针相接触,进行所述扩增反应,检测得到的扩增产物。扩增产物可以通过对反应产物进行凝胶电泳,并用嵌入剂如溴化乙啶染胶来进行检测。可选择地,一种或者多种探针可以用放射性同位素标记,并且在凝胶电泳后通过放射性自显影来检测放射性的扩增产物的存在。
源自位于本发明序列的末端附近的序列的探针也可以在染色体移步(chromosomewalking)程序中被应用,以鉴定含有位于本发明序列附近的基因组序列的克隆。这样的方法允许从宿主生物体中分离出编码其他蛋白的基因。
分离得到的本发明核酸、与其互补的序列、或含有本发明序列中的一个序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段、或与其互补的序列,可用作探针以鉴定和分离相关的核酸。在一些方面,所述的相关的核酸可以是来自某些生物体的cDNA或者基因组DNA,但是这些生物体可以不是本发明的核酸起初被分离出来的那些生物体。例如,其它的生物体可以是相关的生物体。在这样的程序中,核酸样品与所述探针在允许探针特异地与相关序列杂交的条件下接触。所述探针与来自相关生物体的核酸的杂交采用以上描述的任何方法来检测。
通过变化被用来鉴定核酸例如与可检测探针杂交的cDNA或者基因组DNA的杂交条件的严紧度,可以鉴定和分离与探针具有不同水平的同源性的核酸。可以通过在低于探针的解链温度下改变温度进行杂交而使严紧度变化。解链温度,Tm,是指(在定义的离子强度和pH下)50%的靶序列与精确互补的探针杂交的温度。非常严紧的条件被选择为与特定的探针的Tm值相等或比其低大约5℃。探针的解链温度可以通过应用以下的经验公式计算:
对于在14到70个核苷酸长度的探针,应用此公式计算解链温度:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(600/N),其中的N是探针的长度。
如果杂交在含有甲酰胺的溶液中进行,解链温度可以通过应用以下的公式来计算:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(0.63%甲酰胺)-(600/N),其中的N是探针的长度。
预杂交可以在6×SSC、5×Denhardt′s试剂、0.5%SDS、100μg变性的鲑鱼精DNA片段或者6×SSC、5×Denhardt′s试剂、0.5%SDS、100μg变性的鲑鱼精DNA片段、50%甲酰胺中进行。SSC和Denhardt′s溶液的配方列于Sambrook等,supra中。
通过在以上所列的预杂交溶液中加入可以检测到的探针来进行杂交。当所述探针包括双链DNA时,它应在加入到杂交缓冲液前被变性。滤膜与杂交缓冲液接触足够长的时间使得探针与含有其互补序列或者其同源序列的cDNA或者基因组DNA杂交。对于超过200个核苷酸长度的探针,杂交的过程可以是在低于Tm温度15-25℃进行。对于较短的探针,如寡聚核苷酸探针,杂交的过程可以是在低于Tm温度5-10℃下进行。一般,在6×SSC溶液中的杂交过程在大约68℃进行。通常,在含有50%甲酰胺的溶液中的杂交的过程在大约42℃进行。
抑制酶(葡聚糖酶)的表达
本发明提供了与本发明的核酸——例如编码内切葡聚糖酶、甘露聚糖酶、或木聚糖酶的核酸——互补的核酸(例如,本发明的核酸的反义序列)。反义序列能够抑制葡聚糖酶,内切葡聚糖酶、甘露聚糖酶、或木聚糖酶编码基因的转运、剪接或转录。通过以基因组DNA或信使RNA作为靶标可实现抑制作用。靶核酸的转录或功能可通过例如杂交和/或剪切而被抑制。本发明提供的一组特别有用的抑制剂包括能够结合葡聚糖酶、甘露聚糖酶、或木聚糖酶基因或信息的寡核苷酸,在两种情况下都可阻止或抑制葡聚糖酶、甘露聚糖酶、或木聚糖酶的产生或功能。这种联合可以通过序列特异性杂交实现。另一类有用的抑制剂包括可引起葡聚糖酶、甘露聚糖酶、或木聚糖酶信息失活或剪切的寡核苷酸。该寡核苷酸可以具有导致这样的剪切的酶活性,如核酶(ribozyme)。寡核苷酸可被化学修饰或与能够切割互补核酸的酶或组合物偶联。可以对由很多不同的寡聚核苷酸组成的库进行筛选,以寻找到那些具有所需活性的寡聚核苷酸。因此,本发明提供了各种在核酸和/或蛋白水平抑制葡聚糖酶、甘露聚糖酶、或木聚糖酶表达的组合物,例如,反义、iRNA和含有本发明的葡聚糖酶、甘露聚糖酶、或木聚糖酶序列的核酶和本发明的抗木聚糖酶抗体。
抑制葡聚糖酶、甘露聚糖酶、或木聚糖酶的表达有大量的工业应用。例如,抑制葡聚糖酶、甘露聚糖酶、或木聚糖酶表达可延缓或防止酸败。当多糖例如结构性多糖被酶降解时可发生酸败。这可引起水果和蔬菜的变质或腐败。在一个方面,应用可抑制葡聚糖酶、甘露聚糖酶、或木聚糖酶的表达和/或活性的本发明的组合物,例如抗体、反义寡核苷酸、核酶和RNAi,可以延缓或防止酸败。因此,在一个方面,本发明提供了一些方法和组合物,包括在植物或植物产品(如谷物、谷粒、水果、种子、根、叶等)上使用本发明的抗体、反义寡核苷酸、核酶和RNAi来延缓或防止酸败。这些组合物也可被植物(例如,转基因植物)或其他生物体(如,用本发明的葡聚糖酶、甘露聚糖酶、或木聚糖酶基因转化的细菌或其他微生物)表达。
本发明的抑制葡聚糖酶、甘露聚糖酶或木聚糖酶表达的组合物(例如,反义、iRNA、核酶、抗体)可被用作药学组合物,例如抗病原体药剂或用于其它治疗中,例如抗微生物试剂,例如抗沙门氏菌试剂。
反义寡核苷酸
本发明提供了能够结合葡聚糖酶、甘露聚糖酶、或木聚糖酶信息或基因的反义寡核苷酸,其能够通过靶向mRNA来抑制目标基因或信息,例如抑制葡聚糖水解酶活性(例如,催化内β-1,4-木糖苷键的水解)。设计反义寡核苷酸的策略在科学和专利文献中已被详述,专业技术人员能够使用本发明的新型的试剂来设计这样的葡聚糖酶、甘露聚糖酶、或木聚糖酶寡核苷酸。例如,用于筛选有效的反义寡聚核苷酸的基因移步(gene walking)/RNA作图(RNA mapping)实验方案在本领域是已知的,参见,如,Ho(2000)Methods Enzymol.314:168-183,其说明了RNA作图分析,它是基于标准的分子技术,可以为有效的反义序列的选择提供容易的和可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11:191-198。
天然发生的核酸可以作为反义寡聚核苷酸。所述反义寡聚核苷酸可以是任何长度;例如,在可供选择的方面,所述反义寡聚核苷酸是在大约5到100之间、大约10到80之间、大约15到60之间、大约18到40之间。通过常规的筛选来确定最佳的长度。所述反义寡聚核苷酸可以以任何浓度存在。通过常规的筛选来确定最佳的浓度。已知有许多合成的、非天然发生的核苷酸和核酸类似物可以针对这样的潜在的问题。例如,可以应用含有非离子骨架如N-(2-氨乙基)甘氨酸单位的肽核酸(PNAs)。也可以应用具有硫代磷酸酯连接的反义寡聚核苷酸,如在WO97/03211;WO96/39l54;Mata(1997)Toxicol Appl Pharmacol144:189-197;Antisense Therapeutics,ed.Agrawal(Humana Press,Totowa,N.J.,1996)中所说明的。本发明提供的具有合成的DNA骨架类似物的反义寡聚核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、烷基磷酸三酯、氨基磺酸酯、3′-硫代乙缩醛、亚甲基(甲基亚氨)、3′-N-氨基甲酸酯和吗啉代氨基甲酸酯核酸,正如以上所说明的。
也可以应用组合化学方法来产生大量数目的寡聚核苷酸,可以对它们进行快速筛选,找出对某些靶标例如本发明的正义和反义葡聚糖酶、甘露聚糖酶或木聚糖酶序列具有合适的结合亲和性和特异性的特异的寡聚核苷酸(参见,如,Gold(1995)J.ofBiol.Chem.270:13581-13584)。
抑制性核酶
本发明提供可以结合葡聚糖酶、甘露聚糖酶、或木聚糖酶信息的核酶。这些核酶可以通过,例如靶向mRNA来抑制葡聚糖酶、甘露聚糖酶、或木聚糖酶活性。设计核酶和选择用于靶向的葡聚糖酶-、甘露聚糖酶-、或木聚糖酶-特异的反义序列的策略在科学和专利文献中有很好的说明,而且技术人员可以应用本发明的新型的试剂设计出这样的核酶。核酶通过核酶的靶RNA结合部分结合于靶RNA而起作用,核酶的RNA结合部分非常靠近切割靶RNA的RNA酶活部分。这样,通过互补的碱基配对,核酶识别和结合靶RNA,而且一旦结合于正确的位置,便以酶的活性作用来切割靶RNA和使其失活。如果切割发生在编码序列中,以这样的方式切割靶RNA将会破坏其引导合成编码的蛋白的能力。核酶结合和切割其RNA靶之后,它可以从结合的RNA上释放出来并且重复切割新的靶子。
在一些情况下,核酶的酶性质会优于其它的技术,如反义技术(其中核酸分子结合于核酸靶来阻止其转录、翻译或者与其它分子的联系),因为实现治疗效果所必要的核酶有效浓度可能低于反义寡聚核苷酸的浓度。这一潜在的优点反映出核酶可以以酶的方式进行作用的能力。因此,单个核酶分子可以切割靶RNA的多个分子。此外,核酶是一种典型的高度特异性的抑制物,其抑制作用的特异性不仅依赖于碱基配对的结合机制,也依赖于该分子抑制与其结合的RNA的表达的机制。即,所述抑制是由切割靶RNA引起的,因此特异性定义为靶RNA的切割率与非靶RNA的切割率的比值。除了涉及碱基配对的那些因素,这种切割机制还依赖于另外的因素。这样,核酶作用的特异性比结合于同样的RNA位点的反义寡聚核苷酸强。
本发明的核酶,例如,具有酶活的核酶RNA分子可以形成锤头状模体、发夹模体,如肝炎δ病毒模体、I类内含子模体和/或与RNA引导序列相联系的RNaseP类似的RNA。锤头状模体的例子在如Rossi(1992)Aids Research and Human Retroviruses8:183中有说明;发夹模体在Hampel(1989)Biochemistry28:4929和Hampel(1990)Nuc.Acids Res.18:299中有说明;肝炎δ病毒模体在Perrotta(1992)Biochemistry31:16中有说明;RnaseP模体在Guetrier-Takada(1983)Cell35:849中有说明;I类内含子在Cech美国专利4,987,071中有说明。这些特定模体的引述并不是限制性的。本领域技术人员将认识到本发明的核酶,如,本发明的有酶活的RNA分子,可以有与一个或者多个靶基因的RNA区域互补的特异的底物结合位点。本发明的核酶可以在底物结合位点内或者其周围具有赋予了该分子RNA切割活性的核苷酸序列。
RNA干扰(RNAi)
在一个方面,本发明提供了被称为“RNAi”分子的RNA抑制性分子,其含有本发明的葡聚糖酶、甘露聚糖酶、或木聚糖酶序列。RNAi分子构成双链RNA(dsRNA)分子。RNAi可抑制葡聚糖酶、甘露聚糖酶、或木聚糖酶基因的表达。在一个方面,RNAi的长度大约为15、16、17、18、19、20、21、22、23、24、25或更多个双链核苷酸。本发明不限于任何特殊的作用机制,RNAi可进入细胞中,引起相似或相同序列的单链RNA(ssRNA)的降解,包括内源性mRNA。当细胞与双链RNA(dsRNA)接触时,来自同源基因的mRNA被称为RNA干扰(RNAi)的过程选择性地降解。RNAi的一个可能的基本机制是将与特定的基因序列匹配的双链RNA(dsRNA)打断成为称为小分子干扰RNA的短的碎片,它可触发与其序列匹配的mRNA的降解。在一个方面,本发明的RNAi可用于基因沉默(gene-silencing)疗法中,见,例如Shuey(2002)DrugDiscov.Today7:1040-1046。在一个方面,本发明提供了使用本发明的RNAi选择性降解RNA的方法。该过程可在体外、离体或体内实施。在一个方面,本发明的RNAi分子可用来在细胞、器官或动物中产生丧失功能的突变。制备和应用可选择性降解RNA的RNAi分子的方法在本领域中是为人所熟知的,见,例如美国专利6,506,559;6,511,824;6,515,109;6,489,127。
核酸的修饰
本发明提供了产生本发明的核酸的变异体的方法,所述的本发明核酸例如那些编码葡聚糖酶、甘露聚糖酶、或木聚糖酶的核酸。这些方法可以被重复或者以各种组合方式来应用,以产生与模板核酸编码的葡聚糖酶、甘露聚糖酶、或木聚糖酶相比具有改变的或不同的活性,或者改变的或不同的稳定性的葡聚糖酶、甘露聚糖酶、或木聚糖酶。这些方法也可以被重复或者以各种组合方式来应用,以例如使基因/信息表达、信息翻译或者信息稳定性产生变化。另一方面,细胞的遗传学组成可以被改变,通过例如离体进行同源基因的修饰,然后将其重新插入到细胞。
本发明的核酸可以用任何方法进行变化。例如,无定向或随机方法、或者非随机、或者“定向进化”的方法,参见如,美国专利6,361,974。基因的随机突变方法在本领域是已知的,参见如,美国专利5,830,696。例如,可以应用突变剂来对基因进行随机突变。突变剂包括,如,紫外线或者γ辐射,或者化学诱变剂,如,丝裂霉素,亚硝酸,光活化的补骨脂内酯,它们单独使用或者组合使用来诱导DNA的断裂,其可以通过重组被修复。另外的化学诱变剂包括,如,亚硫酸氢钠、亚硝酸、羟胺、肼或者甲酸。其它的诱变剂是核苷酸前体的类似物,如,亚硝基胍、5-溴尿嘧啶、2-氨基嘌呤或者吖啶。这些试剂可以加入到PCR反应中替换核苷酸前体,从而突变该序列。也可以应用嵌入试剂如普罗黄素、吖啶黄、奎纳克林和类似物。
可以应用分子生物学上的任何技术,如随机PCR诱变,参见,如,Rice(1992)Proc.Natl.Acad.Sci.USA89:5467-5471;或者组合式多重盒式诱变,参见如,Crameri(1995)Biotechinques18:194-196。可选择地,核酸,如基因,可以在随机片段化后重新装配,参见,如,美国专利6,291,242;6,287,862;6,287,861;5,955,358;5,830,721;5,824,514,5,811,238;5,605,793.。在可选择的方面,修饰、增加或者删除可以通过易错PCR、重排、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基因重装配、基因位点饱和诱变TM(GSSMTM)、合成连接重装配(SLR)、重组、递归序列重组、硫代磷酸酯-修饰的DNA诱变、含有尿嘧啶模板的诱变、缺口二重诱变、点错配修复诱变、修复-缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制-选择诱变、限制-纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成、和/或者这些方法和其它方法的组合产生。
以下的出版物描述了各种递归重组程序和/或可以整入到本发明的方法中的方法:Stemmer(1999)“Molecular breeding of viruses for targeting and otherclinical properties”Tumor Targeting4:1-4;Ness(1999)Nature Biotechnology17:893-896;Chang(1999)“Evolution of a cytokine using DNA family shuffling”NatureBiotechnology17:793-797;Minshull(1999)“Protein evolution by molecularbreeding”Current Opinion in Chemical Biology3:284-290;Christians(1999)“Directed evolution of thymidine kinase for AZT phosphorylation using DNAfamily shuffling”Nature Biotechnology17:259-264;Crameri(1998)“DNA shufflingof a family of genes from diverse species accelerates directed evolution”Nature391:288-291;Crameri(1997)“Molecular evolution of an arsenatedetoxification pathway by DNA shuffling”Nature Biotechnology15:436-438;Zhang(1997)“Directed-evolution of an effective fucosidase from a galactosidase byDNA shuffling and screening”Proc.Natl.Acad.Sci.USA94:4504-4509;Patten等(1997)“Applications of DNA Shuffling to Pharmaceuticals and Vaccines”CurrentOpinion in Biotechnology8:724-733;Crameri等(1996)“Construction and evolutionof antibody-phage libraries by DNA shuffling”Nature Medicine2:100-103;Gates等(1996)“Affinity selective isolation of ligands from peptide libraries throughdisplay on a lac repressor′headpiece dimer′”Journal of Molecular Biology255:373-386;Stemmer(1996)“Sexual PCR and Assembly PCR”In:The Encyclopedia ofMolecular Biology.VCH Publishers,New York.447-457页;Crameri和Stemmer(1995)“Combinatorial multiple cassette mutagenesis creates all the permutations ofmutant and wildtype cassettes”BioTechniques18:194-195;Stemmer等(1995)“Single-step assembly of a gene and entire plasmid form large numbers ofoligodeoxyribonucleotides”Gene,164:49-53;Stemmer(1995)“The Evolution ofMolecular Computation”Science270:1510;Stemmer(1995)“Searching Sequence Space”Bio/Technology13:549-553;Stemmer(1994)“Rapid evolution of a protein in vitroby DNA shuffling”Nature370:389-391;和Stemmer(1994)“DNA shuffling by randomfragmentation and reassembly:In vitro recombination for molecular evolution”Proc.Natl.Acad.Sci.USA91:10747-10751。
产生多样性的突变方法包括,例如,定点诱变(Ling等.(1997)“Approaches toDNA mutagenesis:an overview”Anal Biochem.254(2):157-178;Dale等(1996)“Oligonucleotide-directed random mutagenesis using the phosphorothioatemethod”Methods Mol.Biol.57:369-374;Smith(1985)“In vitro mutagenesis”Ann.Rev.Genet.19:423-462;Botstein&Shortle(1985)“Strategies and applicationsof in vitro mutagenesis”Science229:1193-1201;Carter(1986)“Site-directedmutagenesis”Biochem.J.237:1-7;Kunkel(1987)“The efficiency of oligonucleotidedirected mutagenesis”在Nucleic Acids&Molecular Biology(Eckstein,F.和Lilley,D.M.J.eds.,Springer Verlag,Berlin));使用含有尿嘧啶的模板的诱变(Kunkel(1985)“Rapid and efficient site-specific mutagenesis without phenotypic selection”Proc.Natl.Acad.Sci.USA82:488-492;Kunkel等(1987)“Rapid and efficient site-specific mutagenesis without phenotypic selection”Methods in Enzymol.154,367-382;和Bass等(1988)“Mutant Trp repressors with new DNA-binding specificities”Science242:240-245);寡核苷酸诱导的定点诱变(Methods in Enzymol.100:468-500(1983);Methods in Enzymol.154:329-350(1987);Zoller&Smith(1982)“Oligonucleotide-directed mutagenesis using M13-derived vectors:an efficientand general procedure for the production of point mutations in any DNAfragment”Nucleic Acids Res.10:6487-6500;Zoller&Smith(1983)“Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13vectors”Methods inEnzymol.100:468-500和Zoller&Smith(1987)Oligonucleotide-directed mutagenesis:asimple method using two oligonucleotide primers and a single-stranded DNAtemplate”Methods in Enzymol.154:329-350);硫代磷酸酯修饰的DNA诱变(Taylor等(1985)“The use of phosphorothioate-modified DNA in restriction enzymereactions to prepare nicked DNA”Nucl.Acids Res.13:8749-8764;Taylor等(1985)“The rapid generation of oligonucleotide-directed mutations at high frequencyusing phosphorothioate-modified DNA”Nucl.Acids Res.13:8765-8787(1985);Nakamaye(1986)“Inhibition of restriction endonuclease Nci I cleavage byphosphorothioate groups and its application to oligonucleotide-directedmutagenesis”Nucl.Acids Res.14:9679-9698;Sayers等(1988)“Y-T Exonucleases inphosphorothioate-based oligonucleotide-directed mutagenesis”Nucl.AsidsRes.16:791-802;和Sayers等(1988)“Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence ofethidium bromide”Nucl.Acids Res.16:803-814);使用缺口双倍DNA的诱变(Kramer等(1984)“The gapped duplex DNA approach to oligonucleotide-directed mutationconstruction”Nucl.Acids Res.12:9441-9456;Kramer&Fritz(1987)Methods inEnzymol.“Oligonucleotide-directed construction of mutations via gapped duplexDNA”154:350-367;Kramer等(1988)“Improved enzymatic in vitro reactions in thegapped duplex DNA approach to oligonucleotide-directed construction ofmutations”Nucl.Acids Res.16:7207;和Fritz等(1988)“Oligonucleotide-directedconstruction of mutations:a gapped duplex DNA procedure without enzymaticreactions in vitro”Nucl.Acids Res.16:6987-6999)。
可以用于实践本发明的另外的实验方案包括点错配修复(Kramer(1984)“PointMismatch Repair”Cell38:879-887),应用修复缺陷型宿主株的诱变(Carter等(1985)“Improved oligonucleotide site-directed mutagenesis using M13vectors”Nucl.Acids Res.13:4431-4443和Carter(1987)“Improved oligonucleotide-directedmutagenesis using M13vectors”Methods in Enzymol.154:382-403),缺失诱变(Eghtedarzadeh(1986)“Use of oligonucleotides to generate large deletions”Nucl.Acids Res.14:5115),限制-选择和限制-纯化(Wells等(1986)“Importance ofhydrogen-bond formation in stabilizing the transition state of subtilisin”Phil.Trans.R.Soc.Lond.A317:415-423),通过全基因合成的诱变(Nambiar等(1984)“Total synthesis and cloning of a gene coding for the ribonuclease S protein”Science223:1299-1301;Sakamar和Khorana(1988)“Total synthesis and expression ofa gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein(transducin)”Nucl.Acids Res.14:6361-6372;Wells等(1985)“Cassette mutagenesis:an efficient method for generation of multiplemutations at defined sites”Gene34:315-323和Grundstrom等(1985)“Oligonucleotide-directed mutagenesis by microscale‘shot-gun’gene synthesis”Nucl.Acids Res.13:3305-3316),双链断裂修复(Mandecki(1986),Arnold(1993)“Proteinengineering for unusual environments”Current Opinion in Biotechnology4:450-455.“Oligonucleotide-directed double-strand break repair in plasmids ofEscherichia coli:a method for site-speciflc mutagenesis”Proc.Natl.Acad.Sci.USA,83:7177-7181)。很多以上的方法的另外的细节在Methods inEnzymology的154卷中有说明,其中也描述了用于解决各种诱变方法遇到的问题的有用的控制。
在例如下列的文件中描述了可以用于实践本发明的实验方案,如Stemmer的美国专利5,605,793(1997.2.25),“Methods for In Vitro Recombination”;Stemmer等的美国专利5,811,238(1998.9.22)“Methods for Generating Polynucleotides havingDesired Characteristics by Iterative Selection and Recombination”;Stemmer等的美国专利5,830,721(1998.11.3),“DNA Mutagenesis by Random Fragmentation andReassembly”;Stemmer等的美国专利5,834,252(1998.11.10),“End-ComplementaryPolymerase Reaction”;Minshull等的美国专利5,837,458(1998.11.17)“Methods andCompositions for Cellular and Metabolic Engineering”;WO95/22625,Stemmer和Crameri,“Mutagenesis by Random Fragmentation and Reassembly”;WO96/33207,Stemmer和Lipschutz,“End Complementary Polymerase Chain Reaction”;WO97/20078,Stemmer和Crameri的“Methods for Generating Polynucleotides having DesiredCharacteristics by Iterative Selection and Recombination”;WO97/35966,Minshull和Stemmer,“Methods and Compositions for Cellular and Metabolic Engineerin”;WO99/41402,Punnonen等,“Targeting of Genetic Vaccine Vectors”;WO99/41383,Punnonen等,“Antigen Library Immunization”;WO99/41369,Punnonen等,“GeneticVaccine Vector Engineering”;WO99/41368,Punnonen等,“Optimization ofImmunomodulatory Properties of Genetic Vaccines”;EP752008,Stemmer和Crameri,“DNA Mutagenesis by Random Fragmentation and Reassembly”;EP0932670,Stemmer,“Evolving Cellular DNA Uptake by Recursive Sequence Recombination”;WO99/23107,Stemmer等,“Modification of Virus Tropism and Host Range by Viral GenomeShuffling”;WO99/21979,Apt等,“Human Papillomavirus Vectors”;WO98/31837,delCardayre等,“Evolution of Whole Cells and Organisms by Recursive SequenceRecombination”;WO98/27230,Patten和Stemmer,“Methods and Compositions forPolypeptide Engineering”;WO98/27230,Stemmer等,“Methods for Optimization ofGene Therapy by Recursive Sequence Shuffling and Selection”;WO00/00632,“Methods for Generating Highly Diverse Libraries”;WO00/09679,“Methods forObtaining in Vitro Recombined Polynucleotide Sequence Banks and ResultingSequences”;WO98/42832,Arnold等,“Polynucleotide Sequences Using Random orDefined Primers”;WO99/29902,Arnold等,“Method for Creating Polynucleotide andPolypeptide Sequences”;WO98/41653,Vind,“An in Vitro Method for Constructionof a DNA Library”;WO98/41622,Borchert等,“Method for Constructing a LibraryUsing DNA Shuffling”;以及WO98/42727,Pati和Zarling,“Sequence Alterations usingHomologous Recombination”。
在例如下列的文件中描述了可以用于实践本发明的方案(提供了关于产生不同多样性的方法的细节),如美国专利申请系列号(USSN)09/407,800,Patten等的“SHUFFLINGOF CODON ALTERED GENES”,于1999年9月28日归档;del Cardayre等的“EVOLUTION OFWHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION”,美国专利6,379,964;Crameri等的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”,美国专利6,319,714;6,368,861;6,376,246;6,423,542;6,426,224和PCT/US00/01203;Welch等的“USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING”,美国专利6,436,675;Selifonov等的“METHODS FOR MAKING CHARACTER STRINGS,POLYNUCLEOTIDES&POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”,2000年1月18日归档,(PCT/US00/01202)和,如Selifonov等的“METHODS FOR MAKING CHARACTER STRINGS,POLYNUCLEOTIDES&POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”,2000年7月18日归档,(美国系列号09/618,579);Selifonov和Stemmer的“METHODS OF POPULATING DATASTRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS”,2000年1月18日归档(PCT/US00/01138),和Affholter的“SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATEDRECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION”,2000年9月6日归档(美国系列号09/656,549),和美国专利6,177,263;6,153,410。
非随机的或者“定向进化”的方法包括例如,Gene Site SaturationMutagenesisTM(GSSMTM)、合成的连接重装配(SLR),或者它们的组合,它们被用来修饰本发明的核酸,以产生具有新的或者改变的性质的葡聚糖酶、甘露聚糖酶或木聚糖酶(如,在强酸性或者强碱性条件、高温等条件下的活性)。由改变了的核酸编码的多肽可以在测定木聚糖水解或者其它活性之前对活性进行筛选。可以应用任何测试形式或者方案,如,用毛细管阵列平台。参见,如,美国专利6,361,974;6,280,926;5,939,250。
饱和诱变,或者GSSM TM
一方面,应用含有简并的N,N,G/T序列的密码子引物将点突变引入到多聚核苷酸,如,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶或者抗体,以便产生一套子代多肽,其中,在每个氨基酸位置都可以出现完整范围的单个氨基酸替换,例如,替换的位置可以在将要被改变的酶活性位点(催化区域(CDs))或者配基结合位点内的氨基酸残基。这些寡聚核苷酸可以包括邻近的第一同源序列、简并的N,N,G/T序列和可选择的第二同源序列。由这样的寡聚核苷酸的应用获得的下游的子代翻译产物包括在该多肽上每一个氨基酸位点的所有可能的氨基酸变化,这是由于N,N,G/T序列的简并包括了所有20个氨基酸的密码子。一方面,一个这样的简并寡聚核苷酸(例如,由一个简并的N,N,G/T盒构成)被应用,以使亲代多聚核苷酸模板中各个原先的密码子发生完整范围的密码子替换。另一方面,应用至少两个简并序列盒——或者是在同一个寡聚核苷酸中或者不是,以使亲代多聚核苷酸模板中的至少两个原先的密码子发生完整范围的密码子替代。例如,在一个寡聚核苷酸中可以含有多于一个的N,N,G/T序列,这样,在多于一个的位点导入氨基酸突变。这样的多个N,N,G/T序列可以是直接邻近的,或者被一个或者多个另外的核苷酸序列隔开。另一方面,可用于引入增加和缺失的寡聚核苷酸可以单独应用或者与含有N,N,G/T序列的密码子组合应用,以引入氨基酸增加、缺失和/或取代的任何组合或者排列。
一方面,应用含有邻接的N,N,G/T三联体,即简并的(N,N,G/T)n序列的寡聚核苷酸,可以在两个或者多个邻近的氨基酸位置同时进行诱变。另一方面,可以应用简并度比N,N,G/T序列小的简并盒。例如,在一些例子中,(如,在一个寡聚核苷酸中)应用包括仅仅一个N的简并三联体序列是理想的,其中所述的N可以是在三联体的第一、第二或者第三的位置。在剩下的两个位置可以使用包括任何组合和排列的任何其它的碱基。作为选择,在一些例子中,(如,在一个寡聚核苷酸中)使用简并的N,N,N三联体序列是理想的。
一方面,应用简并的三联体(如N,N,G/T三联体),可以系统地和容易地在多肽的所有氨基酸位置中的每一个位置获得完整范围的可能的天然氨基酸(对应于所有20个氨基酸)(在可供选择的方面,所述方法也包括在每一个氨基酸残基或者密码子位置产生比所有可能的种类要少的替换)。例如,对于100个氨基酸的多肽,可以产生2000个不同的种类(即,每个位置可能的20种氨基酸×100个氨基酸位置)。通过应用含有简并N,N,G/T三联体的一段寡聚核苷酸或者一套寡聚核苷酸,32个不同的序列可以编码所有20种可能的天然氨基酸。因此,在使用至少一种这样的寡聚核苷酸进行亲本多聚核苷酸序列饱和诱变的反应容器中,产生了32种不同的子代寡聚核苷酸,它们编码20种不同的多肽。相反地,在定点突变中,应用非简并的寡聚核苷酸导致在每个反应容器中仅仅有一种子代多肽产物。非简并的寡聚核苷酸可以选择性地与公开的简并引物组合使用;例如,在工作多肽中,可以应用非简并的寡聚核苷酸来产生特异的点突变。这就提供了一种手段来获得特定的沉默点突变、导致相应的氨基酸变化的点突变、以及引起终止密码子产生和多肽片段相应的表达终止的点突变。
一方面,每一个饱和诱变反应容器中含有编码至少20种子代多肽(如,葡聚糖酶、甘露聚糖酶或木聚糖酶)分子的多聚核苷酸,因此所有的20种天然氨基酸都会出现在对应于亲本多聚核苷酸中的被诱变的密码子位置上的特定的氨基酸位置(其它的例子使用了少于20个天然的组合)。产生于每个饱和诱变反应容器的32倍简并的子代多肽可以进行克隆扩增(例如,使用例如表达载体克隆至合适的宿主,如E.coli宿主),然后进行表达的筛选。当通过筛选确定显示出有利的性质变化(例如与亲本多肽比较,在碱性、酸性条件下葡聚糖水解活性增强)的单个子代多肽时,就可以用测序来确定其中所含有的相应的有利的氨基酸取代。
一方面,如在此所公开的,应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变,确定出的有利的氨基酸变化可以在超过一个的氨基酸位置。可以产生含有所有或者部分这些有利的氨基酸替代的组合的一种或者多种新的子代分子。例如,如果在多肽的三个氨基酸位置的每一个位置确定出2个特定的有利的氨基酸变化,这样出现的排列就包括在每一个位置的3种可能性(与原来的氨基酸没有变化,和两个有利变化中的每一个)和3个位置。这样,就有3×3×3或者27种总的可能性,包括先前检查出的7种——6种单点突变(即,在三个位置的每一个有2个)和在任何位置中都没有变化的1种。
另一方面,位点饱和诱变可以与重排、嵌合、重组和其它的诱变程序以及筛选一起应用。本发明提供了以反复的方式来应用任何的诱变程序,包括饱和诱变。在一个实例中,任何诱变程序的反复应用与筛选组合使用。
本发明也提供了所专有的密码子引物(含有简并N,N,N序列)的应用,其可将点突变导入进多核苷酸中,以产生一套子代多肽,其中,在每个氨基酸位置都可以出现完整范围的单个氨基酸替换(Gene Site Saturation MutagenesisTM(GSSMTM))。使用的寡聚物包括邻接的第一同源序列、简并N,N,N序列和在一个方面的但不是必需的第二同源序列。由这样的寡聚核苷酸的应用获得的下游的子代翻译产物包括在该多肽上每一个氨基酸位点的所有可能的氨基酸变化,这是由于N,N,G/T序列的简并包括了所有20个氨基酸的密码子。
一方面,一个这样的简并寡聚物(由一个简并的N,N,N盒构成)被应用,以使亲代多聚核苷酸模板中各个原先的密码子发生完整范围的密码子替换。另一方面,应用至少两个简并N,N,N序列盒——或者是在同一个寡聚物中或者不是,以使亲代多聚核苷酸模板中的至少两个原先的密码子发生完整范围的密码子替代。例如,在一个寡聚物中可以含有多于一个的N,N,N序列,这样,在多于一个的位点导入氨基酸突变。这样的多个N,N,N序列可以是直接邻近的,或者被一个或者多个另外的核苷酸序列隔开。另一方面,可用于引入增加和缺失的寡聚物可以单独应用或者与含有N,N,N序列的密码子组合应用,以引入氨基酸增加、缺失和/或取代的任何组合或者排列。
在一个特殊的实例中,可以应用含有邻接的N,N,N三联体,即简并的(N,N,N)n序列的寡聚物,在两个或者多个邻近的氨基酸位置同时进行诱变。
另一方面,本发明提供了简并度比N,N,N序列小的简并序列盒的应用。例如,在一些例子中,(如,在一个寡聚物中)应用包括仅仅一个N的简并三联体序列是理想的,其中所述的N可以是在三联体的第一、第二或者第三的位置。在剩下的两个位置可以使用包括任何组合和排列的任何其它的碱基。可选择的是,在一些实例中(例如,在一个寡聚物中)需要使用简并的N,N,N三联体序列、N,N,G/T,或N,N,G/C三联体序列。
但要理解的是,在本发明中所公开的简并三联体(如N,N,G/T或N,N,G/C三联体序列)的应用在数个方面都是有优势的。在一个方面,本发明提供了可以系统地和相当容易地在多肽的各个和所有氨基酸位置中产生完整范围的可能的氨基酸(总共20个氨基酸)替代的手段。因此,对于100个氨基酸的多肽,本发明提供了可系统地和相当容易地产生2000个不同的种类(即,每个位点20个可能的氨基酸乘100个氨基酸位点)的方法。要理解的是,通过使用含有简并N,N,G/T或N,N,G/C三联体序列的寡聚物,可以提供编码20个可能氨基酸的32条序列。因此,在使用一种这样的寡聚物进行亲本多聚核苷酸序列饱和诱变的反应容器中,产生了32种不同的子代寡聚核苷酸,它们编码20种不同的多肽。相反地,在定点突变中,应用非简并的寡聚物导致在每个反应容器中仅仅有一种子代多肽产物。
本发明也提供了非简并寡聚物的应用,其可选择性地与公开的简并引物联合使用。要理解的是,在一些情况下,使用非简并寡聚物在工作多核苷酸中产生特异点突变是有利的。这就提供了一种手段来产生特异的沉默点突变、导致相应的氨基酸改变的点突变和引起终止密码子产生和表达相应多肽片段的点突变。
因此,在本发明的一个方面,每个饱和诱变反应容器中含有编码至少20种子代多肽分子的多聚核苷酸,这样所有的20种氨基酸都会出现在对应于亲本多聚核苷酸中被诱变的密码子位置的特定的氨基酸位置。产生于每个饱和诱变反应容器的32倍简并的子代多肽可以进行克隆扩增(例如,使用例如表达载体克隆至合适的E.coli宿主),然后进行表达的筛选。当通过筛选确定显示出有利的性质变化(与亲本多肽比较)的单个子代多肽时,就可以用测序来确定其中所含有的相应的有利的氨基酸取代。
要理解的是,如在此所公开的,应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变,确定出的有利的氨基酸变化可以在超过一个的氨基酸位置。可以产生含有所有或者部分这些有利的氨基酸替代的组合的一种或者多种新的子代分子。例如,如果在多肽的三个氨基酸位置的每一个位置确定出2个特定的有利的氨基酸变化,这样出现的排列就包括在每一个位置的3种可能性(与原来的氨基酸没有变化,和两个有利变化中的每一个)和3个位置。这样,就有3×3×3或者27种总的可能性,包括先前检查出的7种——6种单点突变(即,在三个位置的每一个有2个)和在任何位置中都没有变化的1种。
因此,在一个非限制性的实例中,本发明提供了饱和诱变与其它诱变处理过程的组合应用,例如将两个或更多个相关的多核苷酸导入进合适的宿主细胞中,这样通过重组和还原性重配(reductive reassortment)产生杂交多核苷酸。
除了沿基因的整个序列进行诱变以外,本发明提出,可以使用诱变在多核苷酸序列中替换任意数目的碱基,其中所述的要被诱变的碱基数目在一个方面从15至100,000的每个整数。因此,不是对分子的每个位置进行诱变,可以将每一数目或不连续数目的碱基(在一个方面,子集总数选自从15至100,000)进行诱变。在一个方面,使用分离的核苷酸沿多核苷酸序列诱变每个位点或一组位点。要被诱变的一组3个位点可以是密码子。突变可以使用诱变引物导入,该引物含有异源序列盒,也称为诱变序列盒。示例性的序列盒具有1至500个碱基。这样的异源基因盒中的每个核苷酸位点可以是N、A、C、G、T、A/C、A/G、A/T、C/G、C/T、G/T、C/G/T、A/G/T、A/C/T、A/C/G或E,其中E可以是非A、C、G、或T的任何碱基(E可以被称为设计者寡聚物)。
通常意义上,饱和诱变包括在已确定要诱变的多核苷酸序列(其中所述的要被诱变的序列的长度在一个方面从大约15至100,000个碱基)中诱变一整套诱变序列盒(其中所述的每个序列盒的长度在一个方面为大约1-500个碱基)。因此,一组突变(范围从1至100个突变)被导入进要被诱变的每个序列盒中。在进行一轮饱和诱变时,被导入进一个序列盒的一组突变可以与要被导入进第二个序列盒的第二组突变不同或相同。这样的分组的例子是缺失、添加、特定密码子的分组和特定核苷酸序列盒的分组。
将要被诱变的确定序列包括整个基因、通路、cDNA、整个开放阅读框(ORF)和整个启动子、增强子、阻遏物/反式激活因子、复制起始点、内含子、操纵子或任何多核苷酸功能集团。通常,在此的“确定序列”可以是15个碱基的多核苷酸序列和长度在15个碱基和15,000个碱基之间的任何多核苷酸序列(本发明特别指定其间的任何整数)。在选择密码子组别时的考虑包括由简并诱变序列盒编码的氨基酸类型。
在一个实例中,可导入进诱变序列盒中一组突变集合,本发明特别地提供了在每个位点上编码2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20个氨基酸的简并密码子取代(使用简并的寡聚物)和由此编码的多肽文库。
合成连接重装配(SLR)
本发明提供了一种非随机的基因改变系统,命名为“合成连接重装配”或者简称为“SLR”,这是一种“定向进化方法”,可以产生具有新的或者改变的性质的多肽,例如,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶或抗体。
SLR是一种非随机地连接寡聚核苷酸片段的方法。这一方法与随机的寡聚核苷酸重排不同,因为核酸构建模块(building blocks)并不进行随机重排、连接或者嵌合,而是进行非随机的装配。参见,如,美国专利申请系列号(USSN)09/332,835,名称为“SyntheticLigation Ressembly in Directed Evolution”,在1999年6月14日归档(“USSN09/332,835”)。一方面,SLR包括以下的步骤:(a)提供模板多聚核苷酸,其中该模板多聚核苷酸包括编码同源基因的序列;(b)提供多个构建模块多聚核苷酸,其中所述的构建模块多聚核苷酸被设计为可与模板多聚核苷酸在预定的序列处横跨装配(cross-over reassemble),而且所述的构建模块多聚核苷酸包括所述同源基因的变异体序列以及在变异序列两侧与模板多聚核苷酸同源的序列;(c)将模板多聚核苷酸与构建模块多聚核苷酸结合,以便构建模块多聚核苷酸与模板多聚核苷酸横跨装配,产生包含同源基因序列变异体的多聚核苷酸。
SLR并不依赖于在待重新组装的多聚核苷酸之间存在高水平的同源性。这样,这一方法可以用于非随机地产生包括超过10100个不同嵌合体的子代分子文库。SLR可以用于产生包括超过101000个不同子代嵌合体的文库。这样,本发明包括用于产生一套最终的具有按设计选择的整个装配顺序的嵌合核酸分子的非随机方法。这一方法包括按设计产生大量特定的核酸构建模块的步骤,这些核酸构建模块具有可以应用的相互间相容的可以连接的末端,然后装配这些核酸构建模块,这样就完成了按设计的全部装配顺序。
将被装配的核酸构建模块的相互相容的可连接的末端对于这种类型的顺序装配被认为是“适用的”,如果它们使得构建模块以预先制定的顺序联接的话。因此,核酸构建模块被偶联的总体装配顺序是通过可连接末端的设计来特异化的。如果不止一个装配步骤将要被应用,那么核酸构建模块被偶联的总体装配顺序也通过装配步骤的先后次序来特异化。一方面,退火的构建模块用酶处理,如用连接酶(如,T4DNA连接酶)处理,以完成构建模块的共价键连接。
一方面,寡聚核苷酸构建模块的设计通过分析一套祖先核酸序列模板来得到,该模板作为产生子代一套最终的嵌合多聚核苷酸的基础。这些亲本寡聚核苷酸模板作为序列信息源,辅助待诱变例如待嵌合化或者重排的核酸构建模块的设计。在这一方法的一个方面,为了选择一个或者多个分界点(demarcation points),对多个亲本核酸模板的序列进行联配。所述分界点可以位于同源的区域,并且可以包括一个或者多个核苷酸。这些分界点在一个方面由至少两个祖先模板中共有。所述分界点可以因此用于描绘将要产生的寡聚核苷酸构建模块的边界,以便重新排列亲本寡聚核苷酸。在祖先分子中确定和选择的分界点用作装配最终的嵌合子代分子的潜在的嵌合位点。分界点可以是至少两个亲本多聚核苷酸序列共同的同源区域(包括至少一个同源核苷酸碱基)。可选择地,分界点可以是由至少半数的亲本多聚核苷酸序列共同拥有的同源区域,或者,是由至少三分之二的亲本多聚核苷酸序列共同拥有的同源区域。甚至在一个方面,可应用的分界点是至少四分之三的亲本多聚核苷酸序列共同拥有的同源区域,或者,是几乎所有的亲本多聚核苷酸序列共同拥有的同源区域。一方面,分界点是由所有的亲本多聚核苷酸序列共同拥有的同源区域。
一方面,为了产生一个彻底的子代嵌合多聚核苷酸文库,连接重装配过程被尽可能充分地实施。换句话说,核酸构建模块的所有可能顺序的组合存在于一套最终的嵌合核酸分子中。同时,另一方面,每个组合中的装配顺序(即,各个构建模块的装配顺序,按各个最终的嵌合核酸序列的5’到3’的方向)是按照以上所述设计的(或者是非随机的)。由于本发明的非随机性质,不需要的副产物的可能性大大降低。
另一方面,系统地实施连接重装配的方法。例如,实施本方法来产生系统区分化的子代分子文库,划分开的文库可以系统地进行筛选,例如逐个的筛选。换句话说,通过选择性的和审慎的应用特定的核酸构建模块,再加上选择性的和审慎的应用连续的分步骤的装配反应,本发明使得这样一种设计可以实现,即可以在各个反应容器中制备出各自特定的一系列子代产物。这就允许进行系统的检查和筛选步骤。因此,这些方法允许对很可能是很大数目的子代分子以较小的组进行系统性检测。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力,尤其是当祖先分子之间具有低水平的同源性时,所以这些方法可以产生包括很大数目的子代分子的文库(或者一套分子)。由于该连接重装配发明的非随机性,产生的子代分子在一个方面包括具有依设计而选择的全部装配序列的最终嵌合核酸分子的文库。饱和诱变和优化的定向进化方法也可以用于产生不同的子代分子种类。可以理解,本发明在分界点的选择、核酸构建模块的大小和数目以及偶联的大小和设计方面提供了选择和控制的自由度。更进一步理解的是,本发明的操作对分子间同源性的要求被大大降低了。实际上,甚至可以在有较少分子间同源性或者没有分子间同源性的区域选择区别点。例如,由于密码子的摆动性,即,密码子的简并,核苷酸的替代可以被引入到核酸构建模块中而并不改变在相应的祖先模板中起初编码的氨基酸。可选择地,一个密码子可以被改变以至于原先的氨基酸的编码被改变。本发明提供了这样的替换,它们能够被引入到核酸构建模块中,由此增加分子间同源的分界点的发生率,这样就允许在构建模块之间实现更多数目的偶联,这又使得更多数目的子代嵌合分子产生。
在一个方面,本发明提供了称为合成基因重装配的非随机方法,其显示稍微与随机重排相关,只是核酸构建模块并不进行随机重排、连接或者嵌合,而是进行非随机的装配。
合成基因重装配方法并不依赖于在待重排的多聚核苷酸之间存在高水平的同源性。本发明可以用于非随机地产生包括超过10100个不同嵌合体的子代分子文库(或一套子代分子)。令人信服的是,合成基因重装配甚至可以用于产生包括超过101000个不同子代嵌合体的文库。
因此,在一个方面,本发明提供了用于产生一套最终的具有按设计选择的整个装配顺序的嵌合核酸分子的非随机方法,这一方法包括按设计产生大量特定的核酸构建模块的步骤,这些核酸构建模块具有可以应用的相互间相容的可以连接的末端,然后装配这些核酸构建模块,这样就完成了按设计的全部装配顺序。
将被装配的核酸构建模块的相互相容的可连接的末端对于这种类型的顺序装配被认为是“适用的”,如果它们使得构建模块能够以预先制定的顺序联接的话。因此,在一个方面,核酸构建模块被偶联的总体装配顺序是通过可连接末端的设计来特异化的,如果不止一个装配步骤将要被应用,那么核酸构建模块被偶联的总体装配顺序也通过装配步骤的先后次序来特异化。在本发明的一方面,退火的构建模块用酶处理,如用连接酶(如,T4DNA连接酶)处理,以完成构建模块的共价连接。
在另一方面,核酸构建模块的设计是基于对一套祖先核酸模板的序列分析而得到的,该模板作为产生一套子代的最终的嵌合核酸分子的基础。因此,这些祖先核酸模板作为序列信息源,辅助待诱变的即待嵌合化的或者重排的核酸构建模块的设计。
在一个实例中,本发明提供了一个家族的相关基因的嵌合和它们编码的相关产物的家族。在一个特定的实例中,被编码的产物是酶。本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可根据在此所述的方法被诱变。
因此,根据本发明的一个方面,为了选择一个或者多个分界点,对多个祖先核酸模板(例如,本发明的多核苷酸)的序列进行联配,所述分界点可以位于同源的区域。所述分界点可以用于描绘将要产生的核酸构建模块的边界。因此,在祖先分子中确定和选择的分界点用作装配子代分子的潜在的嵌合位点。
通常,可应用的分界点是至少两个祖先模板共有的同源区域(包括至少一个同源核苷酸碱基)。分界点可以是由至少半数的祖先模板共同拥有的同源区域、是由至少三分之二的祖先模板共同拥有的同源区域、是至少四分之三的祖先模板共同拥有的同源区域,在一个方面是几乎所有的祖先模板共同拥有的同源区域。更有在一个方面,分界点是由所有的祖先模板共同拥有的同源区域。
在一个方面,基因重装配过程被极限地实施,以便产生一个极限文库。换句话说,核酸构建模块的所有可能的组合顺序都存在于一套最终的嵌合核酸分子中。同时,每个组合中的装配顺序(即,各个构建模块在各个最终嵌合核酸的5’至3’序列中的装配顺序)是遵循设计的(或者说是非随机的)。由于本方法的非随机性质,不需要的副产物的可能性大大降低。
在另一个方面,本方法提出,基因重装配过程可系统地被实施,例如,实施本方法来产生系统地区分化的文库,划分开的文库可以系统地进行筛选,例如逐个地筛选。换句话说,本发明提出,通过选择性的和审慎的应用特定的核酸构建模块,再加上选择性的和审慎的应用连续的分步骤的装配反应,本发明使得这样一种设计可以实现,即可以在各个反应容器中制备出各自特定的一系列子代产物。这就允许进行系统的检查和筛选步骤。因此,这些方法允许对很可能是很大数目的子代分子以较小的组进行系统性检测。
由于其具有以高度变通而又彻底和系统的方式进行嵌合作用的能力,尤其是当祖先分子之间具有低水平的同源性时,所以本发明提供了可以产生包括很大数目的子代分子的文库(或者一套分子)的方法。由于该基因重装配发明的非随机性,产生的子代分子在一个方面包括具有依设计而选择的全部装配序列的最终嵌合核酸分子的文库。在一个特定的方面,产生的这种文库含有超过103至超过101000个不同的子代分子种类。
在一个方面,一组如所述产生的最终嵌合的核酸分子构成编码多肽的多核苷酸。根据一个方面,这种多核苷酸是基因,可以是人造基因。根据另一个方面,这种多核苷酸是基因通路,可以是人造基因通路。本发明提出,可以将本发明产生的一个或多个人造基因整合到人造基因通路中,如可在真核生物(包括植物)中起作用的通路中。
在另一个实例中,产生构建模块的步骤的合成特性允许设计和导入的核苷酸(例如,可以是密码子或内含子或调控序列的一个或多个核苷酸)在以后在体外程序(例如,通过诱变)或在体内程序(例如,通过宿主生物的基因剪接能力)被选择性地去掉。可理解的是,在许多实例中,除了形成可应用的分界点的潜在益处之外,还有许多其它的原因导致需要导入这些核苷酸。
因此,根据另一个方面,本发明提出,可应用核酸构建模块来导入内含子。因此,本发明提出,功能性内含子可被导入进本发明的人造基因中。本发明也提出,功能性内含子可以导入进本发明的人造基因通路中。因此,本发明产生了一种嵌合的多核苷酸,它是含有一个(或多个)人工导入的内含子的人造基因。
因此,本发明也产生了嵌合的多核苷酸,它是含有一个(或多个)人工导入的内含子的人造基因通路。在一个方面,人工导入的内含子能够以天然发生的内含子在基因剪接中发挥功能的方式在一种或多种宿主细胞的基因剪接中发挥作用。本发明提供了产生含有人造内含子的多核苷酸的程序,所述多核苷酸可以被导入进宿主生物体中进行重组和/或剪接。
应用本发明产生的人造基因也可作为与别的核酸进行重组的底物。同样,应用本发明产生的人造基因通路也可作为与别的核酸进行重组的底物。在一个方面,重组可借助于或发生于人造的含内含子的基因和作为重组的另一方的核酸之间的同源区域。在一个方面,重组作用的另一方也可以是本发明产生的核酸,包括人造基因或人造基因通路。重组可借助于或发生于人造基因中一个(或多个)人工导入的内含子处的同源区域。
本发明的合成基因重装配方法利用了多个核酸构建模块,其中的每一个在一个方面具有两个可连接的末端。在每个核酸构建模块上的两个可连接末端可以是两个钝性末端(即,每个末端都无核苷酸悬出),或在一个方面一个钝性末端和一个粘性末端(overhang,悬出端),或更在一个方面是为两个粘性末端。
对于此目的,有用的粘性末端可以是3′突出的粘性末端或5′突出的粘性末端。因此,核酸构建模块可以具有一个3′粘末端、一个5′粘末端,或者两个3′粘末端或两个5′粘末端。核酸构建模块被装配成最终的嵌合核酸分子的整个顺序是通过有目的的实验设计来确定的,而非随机的。
在一个方面,核酸构建模块可以这样来产生,即化学合成两个单链核酸(也称为单链寡聚物),让它们退火形成双链的核酸构建模块。
双链核酸构建模块的大小是可变的。这些构建模块的大小可以很小或很大。构建模块的示范性大小的范围是从1个碱基对(不包括任何突出端)至100,000个碱基对(不包括任何突出端)。也可以是其它的大小范围,下限是从1bp至10,000bp(包括其间的任一整数值),上限是从2bp至100,000bp(包括其间的任一整数值)。
对于本发明,可应用许多种产生双链核酸构建模块的方法;这些方法在本领域中是已知的,很容易被专业技术人员实施。
根据一个方面,双链构建模块可通过首先产生两个单链核酸,再使它们退火形成双链核酸构建模块来产生。双链核酸构建模块的两条链的除了突出端之外的任何核苷酸可以是互补的;因此除任何突出端之外不含有任何错配。根据另一个方面,双链核酸构建模块的两条链在除了突出端之外的核苷酸处不是完全互补的。因此,根据这个方面,双链核酸构建模块可用来导入密码子简并。在一个方面,密码子简并通过应用在此所述的位点饱和诱变而被导入,其中使用了一个或多个N,N,G/T序列盒,或者,可以使用一个或多个N,N,N序列盒。
本发明的体内重组方法可在特定多核苷酸或序列的未知杂合体或等位基因构成的库上实施。但不一定需要知道所述特定多核苷酸的具体DNA或RNA序列。
在一组混合的基因内应用重组的方法可用来产生任何有用的蛋白,例如,白介素1、抗体、tPA和生长激素。这种方法可用来产生具有改变的特异性或活性的蛋白。该方法也可用来产生杂合的核酸序列,例如启动子区、内含子、外显子、增强子序列、基因的3’未翻译区或5’未翻译区。因此,这种方法可用来产生具有更高的表达率的基因。这种方法也可用于重复DNA序列(repetitive DNA sequences)的研究中。最后,这种方法可用来突变核酶或适体(aptamers)。
在一个方面,在此所述的本发明涉及使用重复循环的还原性重配、重组和选择,其使得高度复杂的线性序列,如DNA、RNA或蛋白质可以通过重组进行定向分子进化。
优化的定向进化系统
本发明提供了一种非随机的基因修改系统,命名为“优化的定向进化系统”,其可以用来生产具有新的或者改变的性质的多肽,如本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶或者抗体。优化的定向进化涉及还原性重配(reductive reassortment)、重组和选择的重复循环应用,其使得可以通过重组实现核酸的定向分子进化。优化的定向进化允许产生大量的进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目遗传交换事件(crossover events)的序列。
遗传交换事件是在嵌合序列中的一个点,在这里,从一个亲本变异体到另一个亲本变异体的序列转换发生。这样的点一般在来自两个亲本的寡聚核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡聚核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了所选择数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。
此外,这一方法与其他系统相比,提供了一种用于探究大数量的可能蛋白变异体的方便手段。以前,例如,如果在反应中产生了1013个嵌合分子,测试这样大数目的嵌合突变体的特定活性将会非常困难。此外,子代群体的相当部分将具有很高数目的遗传交换事件,其中得到的蛋白不大可能具有增高水平的特定活性。通过应用这些方法,嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此,尽管在反应中可以仍然产生1013嵌合分子,但是所选择的用于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以(在统计学上)偏向于具有预定数目的遗传交换事件,所以嵌合分子之间的功能多样性的界线减少。当计算出来自最初的亲本多聚核苷酸中的哪一个可能影响到特定的性质时,这时便提供了更加可控制的变量。
产生嵌合子代多聚核苷酸序列的一个方法是产生对应于每一个亲本序列的片段或者部分的寡聚核苷酸。每一个寡聚核苷酸在一个方面包括重叠的独特区域,这样把所述寡聚核苷酸混合,得到具有以正确顺序装配的寡聚核苷酸片段的新的变异体。也可以发现另外的一些信息,如,在USSN09/332,835;美国专利6,361,974中。
对应于每一个亲本变异体产生的寡聚核苷酸数目与在最终产生的嵌合分子中得到的遗传学交换的总的数目具有一定的关系。例如,为了发现具有如在高温下的更高活性的嵌合变异体,可以提供三个亲本核苷酸序列变异体来进行连接反应。作为一个例子,对应于每一个亲本变异体的每一部分可以产生一套50个寡聚核苷酸序列。相应的,在连接重装配过程中,在每一个嵌合序列中有可能有超过50个交换事件。产生的每一个嵌合多聚核苷酸都以交替的顺序含有来自各个亲本变异体的寡聚核苷酸的可能性很低。如果每一个寡聚核苷酸片段以同样的摩尔量存在于连接反应中,有可能在一些位置中来自同一亲本多聚核苷酸的寡聚核苷酸将相互一个个连接,而不导致遗传交换事件。如果在这一例子的任何连接步骤中,来自每一个亲本的每一个寡聚核苷酸的浓度保持不变,那么将会有1/3的机会(假定3个亲本)来自同一个亲本变异体的寡聚核苷酸连接于嵌合序列内而不产生遗传交换。
相应的,可以确定概率密度函数(PDF),预测在一个连接反应的每一步中可能发生的遗传交换事件的总数,其中给定了一套确定数目的亲本变异体、对应于每种变体的寡聚核苷酸、以及在连接反应中的每个步骤中的每种变异体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。通过应用这些方法,可以计算这样的概率密度函数,而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外,可以预先确定遗传交换事件的目标数目,然后对该系统进行程序化,以计算在该连接反应的每一个步骤中,每种亲本寡聚核苷酸的起始量,从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重复循环应用,通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生大量的进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个点,在这里,从一个亲本变异体到另一个亲本变异体的序列转换发生。这样的点一般在来自两个亲本的寡聚核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡聚核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了所选择数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。
此外,这些方法与其他系统相比,提供了一种用于探究大数量的可能蛋白变异体的方便手段。通过应用在这里描述的方法,嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此,尽管在反应中可以仍然产生1013个嵌合分子,但是所选择的用于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以(在统计学上)倾向于具有预定数目的遗传交换事件,所以嵌合分子之间的功能多样性的界线减少。当计算出来自最初的亲本多聚核苷酸中的哪一个可能影响到特定的性质时,这时便提供了更加可控制的变量。
一方面,该方法通过产生对应于每一个亲本序列的片段或者部分的寡聚核苷酸,产生嵌合子代多聚核苷酸序列。每一个寡聚核苷酸在一个方面包括重叠的独特区域,这样把所述寡聚核苷酸混合,得到具有以正确顺序装配的寡聚核苷酸片段的新的变异体。也可参见USSN09/332,835。
确定遗传交换事件
本发明包括系统和软件,它们以所需的遗传交换的概率密度函数(PDF)、待重新装配的亲本基因的数目以及重新装配的片段数目作为输入量。该程序输出“片段PDF”,它可以用于确定用于获得重新装配的基因和那些基因的估计的遗传交换PDF的具体方法。于此说明的过程在一个方面中在MATLABTM中进行(The Mathworks,Natick,Massachusetts),MATLABTM是一种用于技术计算的程序语言和开发环境。
迭代过程(iterative process)
在实践本发明时,这些过程可以迭代反复。例如,鉴定出改变的或者新的葡聚糖酶、甘露聚糖酶或木聚糖酶表型的核酸,再分离,再修饰,再测试活性。这一过程可以重复直到得到所需的表型。例如,完整的生物化学合成代谢的或者分解代谢的途径可以在细胞中设计,包括,例如葡聚糖酶、甘露聚糖酶或木聚糖酶活性。
类似地,如果确定了特定的寡聚核苷酸对于所有所需的性质(如,新的葡聚糖酶或甘露聚糖酶或木聚糖酶表型)没有影响,那么就可以合成包括这段序列在内的更大的亲本寡聚核苷酸,从而将作为变量的这段序列去除。由于将这段序列合并到更大的序列中,可以避免任何遗传交换事件,所以在子代多聚核苷酸中,这一序列不再有任何变异。确定哪些寡聚核苷酸与所需的性质最有关系,以及哪些与所需的性质无关的重复实践可以更有效地探寻所有可能的具有特定性质或者活性的蛋白变异体。
体内重排
分子的体内重排在本发明的提供本发明的多肽如抗体、葡聚糖酶、甘露聚糖酶或木聚糖酶等的变异体的方法中使用。体内重排利用细胞的天然特性进行多聚体重组。体内的重组提供了实现分子多样性的主要的天然途径,而遗传重组仍然是一种相对复杂的过程,其涉及1)同源性识别;2)链切割,链侵入,和导致产生重组交叉(recombinationchiasma)的代谢步骤;和最后3)交叉消除至分离的重组分子。交叉的形成需要同源序列的识别。
在另一个方面,本发明包括由至少第一多聚核苷酸和第二聚多核苷酸产生杂合的多聚核苷酸的方法。本发明通过将至少第一多聚核苷酸和第二聚多核苷酸导入进合适的宿主细胞中,可用来产生杂合的多聚核苷酸,所述的至少第一多聚核苷酸和第二聚多核苷酸共享具有部分序列同源性的至少一个区域(例如,SEQ ID NOS:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251,253、255、257及其组合)。具有部分序列同源性的区域可促进一些过程,这些过程可引起产生杂合多核苷酸的序列改组。正如在此所用,术语“杂合多聚核苷酸(hybrid polynucleotide)”是由本发明的方法产生的任何核苷酸序列,其含有来自至少两个原初的多聚核苷酸序列的序列。这样的杂合多聚核苷酸可以源于分子间重组事件,分子间重组事件促进了DNA分子间的序列整合。此外,这样的杂合多聚核苷酸可以源自分子内还原性重配过程,分子内还原性重配过程利用重复序列来改变DNA分子中的核苷酸序列。
体内重配主要集中在“分子间”的过程,它们可以统称为“重组”,在细菌中一般视作“依赖于RecA”的现象。本发明可以利用宿主细胞的重组过程来重新组合和重配序列,或者利用细胞介导还原性过程的能力,通过缺失来降低准重复序列的复杂性。“还原性重配(reductive reassortment)”的过程可以通过“分子内”的RecA依赖性的过程发生。
因此,在本发明的另一个方面,新型的多聚核苷酸可以通过还原性重配过程产生。本方法包括产生含有连续序列(最初的编码序列)的构建物,将它们插入到合适的载体中,随后将它们引入到合适的宿主细胞中。各个分子本体的重配通过具有同源性区域的构建物中的连续序列之间,或准重复单元之间的组合过程发生。重配过程重组和/或降低了重复序列的复杂性和范围,并且导致产生新的蛋白种类。可以应用不同的处理来提高重配率。这些可以包括用紫外线或者DNA损伤化学剂处理,和/或使用表现出高水平“遗传不稳定性(genetic instability)”的宿主细胞系。因此,重配过程可以包括同源重组或者准重复序列的天然性质来引导它们自身的进化。
重复或者“准重复(quasi-repeated)”序列在遗传不稳定性中起作用。在本发明中,“准重复”是并不限于它们起初的单元结构的重复。准重复单元可以在构建物中以序列的排列出现;以相似序列的连续单元出现。一旦连接,在连续序列之间的连接处变得本质上无形,并且得到的构建物的准重复性质在分子水平现在是连续的。细胞在准重复序列之间进行的缺失过程降低了得到的构建物的复杂性。准重复单位提供了一个实际上没有限制的模板内容,在模板上可以发生滑移事件。因此,含有准重复的构建物有效地提供了足够的分子弹性,缺失(和潜在的插入)事件实际上可以在准重复单元内的任何地方发生。
当准重复序列全部以相同方向连接,例如,头对尾或者反之亦然,细胞就不能区别各个单元。因此,还原过程可以在整个序列中发生。相反地,当例如,所述单元以头对头存在,而不是头对尾,相邻单元的头尾倒置,这样缺失的形成将有利于不连续单元的失去。因此,本发明的方法优选的是序列是处于相同的方向。准重复序列的随机定向将会导致重配效率的损失,而序列的一致定向将会提供最高的效率。然而,虽然具有较少的相同定向的连续序列会降低效率,但是仍然可以为新型分子的有效回收提供足够的弹性。用定向相同以允许更高效率的准重复序列制备构建物。
应用各种方法中的任何一种,可以将序列装配成头对尾的定向,包括以下:
a)可以使用包括poly-A头和poly-T尾的引物,当制成单链时,包括poly-A头和poly-T尾的引物将提供定向。这通过由RNA制备引物的头几个碱基来完成,而且随后用RNaseH可以很容易去除RNA。
b)可以应用包括独特的限制酶切割位点的引物。这需要多重位点、一组独特的序列、和重复的合成和连接步骤。
c)引物的内部几个碱基可以被硫醇化,并且用外切酶来产生合适的具有尾巴的分子。
重配序列的回收依赖于具有下降的重复指数(RI)的克隆载体的确定。被重配的编码序列可以随后通过扩增回收。产物被再克隆和表达。具有降低的RI的克隆载体的回收可以这样被完成,即:
l)应用仅仅当构建物的复杂性下降时才能稳定地维持的载体。
2)通过物理程序对缩短的载体进行物理回收。在这一情况下,克隆载体将应用标准的质粒分离程序进行回收,或者在具有低分子量截留的琼脂糖凝胶或者柱子上利用标准程序进行大小分离。
3)插入物的大小下降时,对含有可以选择的断裂基因的载体进行回收。
4)应用表达载体以及适当的选择,使用定向选择技术。
相关的生物体的编码序列(例如,基因)可以表现出高度的同源性,并且编码相当多样化的蛋白产物。这些类型的序列可以在本发明中用作准重复序列。以下的实施例说明了几乎相同的原始编码序列(准重复)的重配,然而,这一过程并不限于这种几乎相同的重复。
以下的例子表明了本发明的典型方法。描述了来源于三(3)种独特物种的编码核酸序列(准重复)。每一个序列编码的每一种蛋白都具有不同的一套性质。这些序列中的每一个在序列的独特位置处的单个或者几个碱基对上有差别。准重复序列分别或者一起被扩增,并且被连接到随机装配物中,这样所有可能的排列和组合都可以在连接分子的群体中获得。准重复单元的数目可以通过装配条件控制。准重复单元在构建物中的平均数目被定义为重复指数(RI)。
一旦构建物形成,可以按照已出版的实验方案通过琼脂糖凝胶根据大小进行分离,也可以不分离,将构建物插入到克隆载体中,并转染至适当的宿主细胞。然后细胞繁殖并且实现“还原性重配”。还原性重配过程的速率可以通过引入DNA损伤来进行刺激,如果需要的话。RI的降低是通过一种“分子内”的机制在重复序列间形成缺失来介导,还是通过“分子间”的机制由重组类似的事件来介导是不重要的。最终的结果是分子被重配,得到所有可能的组合。
可选择地,本方法包括一个额外的步骤,即对重排的文库成员进行筛选,以确定具有与一种预定的大分子如蛋白质受体、寡聚糖、病毒颗粒或者其它的预定的化合物或者结构结合或者不同方式地相互作用,或者催化一个特定的反应(如,酶的催化结构域)的能力的个别的重排文库成员。
从这样的文库确定出的多肽可以用于治疗、诊断、研究和相关目的(如,催化剂,用于增加水溶液的同渗容摩的溶质,等等),和/或可以用于进行一轮或者多轮附加的重排和/或选择循环。
另一方面,可以预见,在重组或重配之前,或者在重组或重配的过程中,通过本发明的方法产生的多聚核苷酸可以用试剂处理或进行加工,这些处理或加工促进突变引入到原始的多聚核苷酸中。引入这样的突变将会增加得到的杂合多聚核苷酸及其编码的多肽的多样性。促进诱变的试剂和过程可以包括,但不限于:(+)-CC-1065,或者合成的类似物如(+)-CC-1065-(N3-腺嘌呤)(参见Sun和Hurley,(1992);能够抑制DNA合成的N-乙酰化或者脱乙酰基的4’-氟-4-氨基联苯加合物(见,例如,van de Poll等(1992)),或者能够抑制DNA合成的N-乙酰化或者脱乙酰基的4-氨基联苯加合物(见,van de Poll等(1992),751-758页);三价铬、三价铬的盐、可以抑制DNA复制的多环芳香烃(PAH)DNA加合物,如7-溴甲基-苯[a]蒽(“BMA”)、三(2,3-二溴丙基)磷酸盐(“Tris-BP”)、1,2-二溴-3-氯丙烷(“DBCP”)、2-溴丙烯醛(2BA)、苯并[a]芘-7,8-二氢二醇-9-10-环氧化物(“BPDE”)、铂(II)卤素盐、N-羟基-2-氨基-3-甲基咪唑[4,5-f]-喹啉(“N-羟基-IQ”)、和N-羟基-2-氨基-1-甲基-6-苯基咪唑[4,5-f]-吡啶(“N-羟基-PhIP”)。用于减慢或者停止PCR扩增的示范性的方法包括紫外线(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)。特别包含的方法是DNA加合物或者来自多聚核苷酸或者多聚核苷酸库的含有DNA加合物的多聚核苷酸,在进一步的处理前,其可以通过包括加热含有所述多聚核苷酸的溶液的过程进行释放或者去除。
本发明的另一个方面涉及产生具有生物学活性的重组蛋白的方法,其通过根据本发明,在可产生杂合或重配的多核苷酸条件的条件下处理含有编码野生型蛋白的双链模板多核苷酸的样品。
产生序列变异体
本发明也提供了制备本发明的核酸(如,葡聚糖酶、甘露聚糖酶或木聚糖酶)序列的序列变异体的另外的方法。本发明也提供了应用本发明的核酸和多肽分离葡聚糖酶、甘露聚糖酶或木聚糖酶的另外的方法。一方面,本发明提供了本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶编码序列(如,基因、cDNA或者信息)的变异体,其可以通过任何方法被改变,包括,例如,随机的方法,或者非随机的方法,或者“定向进化”的方法,如上所述。
被分离的突变体可以是天然发生的。变异体也可以在体外产生。变异体也可以应用基因工程技术来产生,如定点诱变、随机的化学诱变、核酸外切酶III缺失方法和标准的克隆技术。可选择地,可以应用化学合成或者修饰方法来产生这样的变异体、片段、类似物或者衍生物。本领域技术人员也熟悉制备变异体的其它方法。这些方法包括这样的程序,其中,从天然分离物中获得的核酸序列经过修饰而产生编码具有某些特征的多肽的核酸,所述的特征使这些多肽在工业或者实验室应用中具有更高的价值。在这样的程序中,大量的变异体序列被获得和表征,这些变异体序列与从天然分离物中得到的序列相比,有一个或者多个核苷酸的差异。这些核苷酸的差异可能引起相对于天然分离得到的核酸序列编码的多肽的氨基酸变化。
例如,变异体可以通过易错PCR产生。在易错PCR中,PCR在DNA聚合酶的复制保真性较低的情况下进行,这样便在全长的PCR产物中得到较高的点突变率。易错PCR在例如,Leung,D.W.,等,Technique,l:11~15,1989和Caldwell,R.C.和Joyce G.F.,PCR MethodsApplic.,2:28-33,1992中描述。简要地说,在这一程序中,待突变的核酸与PCR引物、反应缓冲液、MgCl2、MnCl2、Taq聚合酶以及适合浓度的dNTPs混合,在全长的PCR产物中得到高的点突变率。例如,反应可以使用20fmol待诱变的核酸进行,每种PCR引物30pmol,反应缓冲液包括50mMKCl、10mM Tris HCl(pH8.3)和0.01%明胶、7mM的MgCl2、0.5mM MnCl2、5units的Taq聚合酶、0.2mM dGTP、0.2mM dATP、1mM dCTP和1mM dTTP。PCR可以进行30个循环,每个循环为94℃1分钟;45℃1分钟;和72℃1分钟。然而,这些参数可以适当地变化。诱变的核酸克隆到一个适当的载体,并评价由诱变核酸编码的多肽的活性。
变异体也可以用寡聚核苷酸诱导的定向突变产生,在任何感兴趣的克隆DNA中产生位点特异性的突变。寡聚核苷酸诱变在,例如,Reidhaar-Olson(1988)Science241:53-57中描述。简要地说,在这样的程序中,合成多个具有一个或者多个突变的双链寡聚核苷酸,这些寡聚核苷酸所含有的突变将要被导入被克隆的DNA中,将这些寡聚核苷酸插入到待诱变的克隆DNA中。回收含有诱变DNA的克隆,并评估它们编码的多肽的活性。
另一个产生变异体的方法是装配PCR。装配PCR涉及由小的DNA片段的混合物装配出PCR产物。在同一个容器中平行进行很多不同的PCR反应,其中,一个反应的产物用作另外一个反应的引物。装配PCR在例如美国专利5,965,408中有说明。
另一个产生变异体的方法是有性PCR诱变。在有性PCR诱变中,由于基于序列同源性的DNA分子的随机片段化,在不同的但是高度相关的DNA序列的DNA分子之间,在体外强行发生同源重组,然后通过PCR反应的引物延伸,遗传交换得到固定。有性PCR诱变在,例如,Stemmer(1994)Proc.Natl.Asad.Sci.USA91:10747-10751中描述。简要地说,在这样的程序中,多个待重组的核酸用DNase消化,产生具有50到200个核苷酸的平均大小的片段。纯化具有所需的平均大小的片段,重悬于PCR混合物中。在有利于核酸片段重组的条件下进行PCR反应。例如,PCR可以这样进行:将纯化的片段重悬于含有0.2mM的各种dNTP、2.2mMMgCl2、50mM KCl、10mM的Tris-HCl,pH9.0以及0.l%的Triton X-100的溶液中,其浓度为10-30ng/μ1,以100:1的比例在反应混合物中加入2.5Units的Taq聚合酶,用以下的条件进行PCR:94℃60秒,94℃30秒,50-55℃30秒,72℃30秒(30-45次),然后72℃进行5分钟。然而,这些参数可以进行适当的变化。在一些方面,寡聚核苷酸可以包括在该PCR反应中。在其它的一些方面,DNA聚合酶I的Klenow片段可以用于第一轮PCR反应,而Taq聚合酶可以用于后续的PCR反应。重组序列经过分离并评估它们编码的多肽的活性。
变异体也可以通过体内诱变产生。在一些方面,感兴趣的序列中的随机突变通过在细菌菌株中扩增该感兴趣的序列而产生,所述细菌菌株例如在一个或者多个DNA修复途径中具有突变的大肠杆菌菌株。这样的“突变”菌株具有比野生型亲本更高的随机突变率。在一种这样的菌株中进行DNA的繁殖将最终产生DNA中的随机突变。适于在体内诱变中应用的突变菌株在,例如,PCT公开号WO91/16427中有描述,公开日为1991年10月31日,标题为“Methods for Phenotype Creation from Multiple Gene Populations”。
变异体也可以通过应用盒式诱变产生。在盒式诱变中,双链DNA分子的一个小的区域被不同于天然序列的合成的寡聚核苷酸“盒子”替代。所述寡聚核苷酸一般含有完全和/或部分随机的天然序列。
递归整体诱变也可以用于产生变异体。递归整体诱变是一种用于蛋白质工程(蛋白突变)的算法,它的开发是为了产生表型相关的突变体组成的多样性群体,其成员在氨基酸序列上有所不同。该方法应用反馈机制来控制连续多轮的组合式盒式诱变。递归整体诱变在如Aikin(1992)Proc.Natl.Acad.Sci.USA89:7811-7815中有描述。
在一些方面,用指数整体诱变产生变异体。指数整体诱变是一个用于产生具有较高百分比的独特且具功能性的突变体的组合文库的过程,其中部分的残基被随机化,同时在每一个被改变的位置确认导致功能性蛋白的氨基酸。指数整体诱变在如,DelegraveBiotechnology Res.11:1548-1552,1993中有描述。随机和定点诱变在如,Amold CurrentOpinion in Biotechnology4:450-455,1993中有描述。
在一些方面,变异体利用重排方法产生,其中编码不同的多肽的多个核酸的部分被融合在一起,产生编码嵌合多肽的嵌合核酸序列,其描述见美国专利5,965,408,1996年7月9日归档,标题为“Method of DNA Reassembly by Interrupting Synthesis”和美国专利5,939,250,1996年5月22日归档,题目为“Production of Enzymes Having DesiredActivities by Mutagenesis”。
本发明多肽的变异体可以是本发明肽的一个或多个氨基酸残基被保守的或非保守的氨基酸残基(在一个方面是保守的氨基酸残基)取代所得到的变异体,这样的取代的氨基酸残基可以是或者不是由遗传密码编码的氨基酸残基。
本发明提供了本发明多肽(和编码它们的核酸序列)的替代实施方案,包括至少一个保守的氨基酸取代,如本文中所述,(例如保守氨基酸取代是用具有类似特征的另一氨基酸取代多肽中给定的氨基酸)。本发明提供了多肽(和编码它们的核酸序列),其中任何、一些或所有氨基酸残基被具有类似特征的另一氨基酸取代例如保守的氨基酸所取代。(PCT140页)
保守的取代是指在多肽中用另一个具有相似性质的氨基酸取代已知的氨基酸。以下的替代通常都被视作保守的取代:用其它的脂肪族氨基酸替换脂肪族的氨基酸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸;用苏氨酸替换丝氨酸,或者用丝氨基替换苏氨酸;用其它的酸性残基替换酸性残基如天冬氨酸和谷氨酸;用其它具有酰胺基的氨基酸替换具有酰胺基团的残基如天冬酰胺和谷氨酰胺;用其它的碱性氨基酸替换碱性氨基酸残基如赖氨酸和精氨酸;用其它的芳香氨基酸取代芳香氨基酸如苯丙氨酸,酪氨酸。在一个可选择的方面,这些保守取代氨基酸也可以是这些氨基酸的合成等同物。
在其它的变异体中,本发明的多肽的一个或多个氨基酸残基包含有取代基团。
仍然在其它的变异体中,多肽与别的化合物,如用于增加多肽半衰期的化合物,如,聚乙二醇联接。
在另外的变异体中,另外的氨基酸融合到多肽上,如前导序列、分泌序列、蛋白原序列或者有利于纯化、富集或者所述多肽稳定的序列。
在一些方面,片段、衍生物和类似物仍保留有与本发明的多肽相同的生物学功能或者活性。在其它方面,片段、衍生物或者类似物包括蛋白原,这样,所述片段、衍生物或者类似物可以通过蛋白原部分的切割而活化,产生有活性的多肽。
优化密码子,实现宿主细胞中高水平的蛋白表达
本发明提供了修饰编码葡聚糖酶、甘露聚糖酶或木聚糖酶的核酸来改变密码子使用(codon usage)的方法。一方面,本发明提供了修饰编码葡聚糖酶的核酸中的密码子来增强或者降低其在宿主细胞中的表达的方法。本发明也提供了编码经修饰而其表达在宿主细胞中增强的葡聚糖酶、甘露聚糖酶或木聚糖酶的核酸、经过这样的修饰的葡聚糖酶、甘露聚糖酶或木聚糖酶,和制备经修饰的葡聚糖酶、甘露聚糖酶或木聚糖酶的方法。该方法包括确定编码葡聚糖酶、甘露聚糖酶或木聚糖酶的核酸中“非-偏爱的”或者“较不偏爱的”密码子,并且用编码同样氨基酸的“偏爱的密码子”作为替换密码子替换一个或者多个这样的非-偏爱或者较不偏爱的密码子,并且在所述核酸中至少一个非-偏爱或者较不偏爱的密码子被编码相同氨基酸的偏爱密码子替换。偏爱密码子是在宿主细胞基因的编码序列中被优先使用的密码子,而不偏爱的或者较不偏爱的密码子是指在宿主细胞基因的编码序列中较少使用的密码子。
用于表达本发明的核酸、表达序列盒以及载体的宿主细胞包括细菌、酵母、真菌、植物细胞、昆虫细胞和哺乳动物细胞。因此,本发明提供了在所有这些细胞中优化密码子使用的方法、密码子被改变的核酸,以及由所述的密码子被改变的核酸编码的多肽。典型的宿主细胞包括革兰氏阴性细菌,如大肠杆菌;革兰氏阳性细菌,如链霉菌、加氏乳酸杆菌(Lactobacillus gasseri)、乳酸乳球菌(Lactococcus lactis)、乳脂乳球菌(Lactococcuscremoris)、芽胞杆菌属的种(Bacillus sp.)、枯草芽胞杆菌、蜡状芽孢杆菌。示范性的宿主细胞也包括真核生物体,如,各种酵母,如酵母属的种(Saccharomyces sp.),包括酿酒酵母、粟酒裂殖酵母、巴斯德毕赤酵母和乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉森酵母(Hansenula polymorpha)、黑曲霉(Aspergillus niger)和哺乳动物细胞和细胞系以及昆虫细胞和细胞系。因此,本发明也包括在这些生物体和生物物种中的表达被优化的核酸和多肽,例如本发明的核酸序列在例如毕赤酵母属的种例如(Pichia sp.)、酵母属的种、或芽胞杆菌属的种、链霉菌属的种(Streptomyces sp.)和类似菌中的宿主细胞中的表达密码子被优化。
例如,从细菌细胞中分离出的、编码本发明多肽,例如葡聚糖酶、甘露聚糖酶或木聚糖酶或类似酶的核酸的密码子被修饰,以便该核酸(编码酶)在不同于获得酶(例如葡聚糖酶、甘露聚糖酶或木聚糖酶)的细菌细胞,酵母、真菌、植物细胞、昆虫细胞或者哺乳动物细胞中优化表达。优化密码子的方法在本领域是已知的,参见如,美国专利5,795,737;Baca(2000)Int.J.Parasitol.30:113-l18;Hale(1998)Protein Expr.Purif.12:185-188;Narum(2001)Inect.Immun.69:7250-7253。也参见Narum(2001)Infect.Immun.69:7250-7253,描述了在鼠系统中优化密码子;Outchkourov(2002)Protein Expr.Purif.24:18-24,描述了在酵母中优化密码子;Feng(2000)Biochemistry39:15399-15409,描述了在大肠杆菌中优化密码子;Humphreys(2000)Protein Expr.Purif20:252-264,描述了大肠杆菌中影响分泌的优化的密码子使用。Gao(2004)Biotechnol Prog.20:443-448,描述了“UpGene”使用以网络为基础的DNA密码子优化算法(web-based DNA codon optimizationalgorithm)。
例如,如下面实施例4所述,将编码具有SEQ ID NO:6中示出的序列的多肽的核酸(例如SEQ ID NO:5)进行密码子优化,以在巴斯德毕赤酵母中获得最佳表达;巴斯德毕赤酵母密码子-优化的编码酶的核酸是SEQ ID NO:463。具有SEQ ID NO:464中示出的序列的示范性多肽在位置91是丙氨酸(SEQ ID NO:464),在可选择的方面,是缬氨酸(在SEQ ID NO:6中)。类似地,在可选择的实施方案中,编码SEQ ID NO:464(即SEQ ID NO:463)的示范性核酸在位置91可编码丙氨酸或缬氨酸(或另一保守的取代)。事实上,本发明提供了本发明多肽(和编码它们的核酸)的可选择实施方案,其包括至少一个保守氨基酸取代,如本文中论述(例如保守氨基酸取代是用具有类似的特性的另一氨基酸取代多肽中给定的氨基酸),如本文中论述。(PCT143)
转基因非-人类的动物
本发明提供了包含本发明的核酸、多肽(例如葡聚糖酶、甘露聚糖酶或木聚糖酶)、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转基因非人类的动物。本发明也提供了制造和应用这些转基因非人类动物的方法。
转基因非人类动物可以是,例如包括本发明的核酸的山羊、兔、绵羊、猪、牛、小鼠和大鼠。这些动物可以用作例如体内模型来研究葡聚糖酶、甘露聚糖酶或木聚糖酶活性,或者作为模型来在体内筛选改变葡聚糖酶、甘露聚糖酶或木聚糖酶活性的试剂。要在转基因非人类动物中表达的多肽的编码序列可以设计为组成型的,或者在组织特异性、发育特异性或者可诱导的转录调控因子的控制之下。转基因非人类动物可以应用本领域任何已知的方法设计和产生;参见,如,美国专利6,211,428;6,187,992;6,156,952;6,118,044;6,111,166;6,107,541;5,959,171;5,922,854;5,892,070;5,880,327;5,891,698;5,639,940;5,573,933;5,387,742;5,087,571,它们描述了制造和应用转化的细胞和卵以及转基因大鼠、小鼠、兔、羊、猪和牛。也参见,如,Pollock(1999)J.Immunol.Methods231:147-157,描述了在转基因奶牛动物的牛奶中生产重组蛋白;Baguisi(1999)Nat.Biotechnol.17:456-461,描述了转基因山羊的生产。美国专利6,211,428,描述了制备和应用在其脑中表达含有DNA序列的核酸构建物的转基因非人类哺乳动物。美国专利5,387,742,描述了把克隆的重组子或者合成的DNA序列注射至鼠受精卵中,移植注射的卵至假孕的雌鼠中,并且生长成为转基因鼠,它的细胞表达与阿尔茨海默氏病的病理相关的蛋白。美国专利6,187,992,描述了制备和应用转基因鼠,它的基因组具有编码淀粉样蛋白原(APP)的基因的断裂。
“基因敲除动物(Knockout animals)”也可以用于实践本发明的方法。例如,在一方面,本发明的转基因动物或者改进的动物包括“基因敲除动物”,如“基因敲除鼠”,它被工程改造,不会表达某种内源基因,取而代之的是,表达可以表达本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶或者包含本发明的聚糖酶、甘露聚糖酶或木聚糖酶的融合蛋白的基因。
转基因植物和种子
本发明提供了包含本发明的核酸、多肽(例如葡聚糖酶、甘露聚糖酶或木聚糖酶)、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转基因植物和种子。本发明也提供了包含本发明的核酸和/或多肽(例如葡聚糖酶、甘露聚糖酶或木聚糖酶)的植物产物,如油、种子、叶、提取物以及类似物。转基因植物可以是双子叶的(双子叶植物)或者单子叶的(单子叶植物)。本发明也提供了制备和应用这些转基因植物和种子的方法。表达本发明的多肽的转基因植物或者植物细胞可以按照本领域任何已知的方法构建。参见例如,美国专利6,309,872。
本发明的核酸和表达构建物可以通过任何方式导入到植物细胞中。例如,核酸或者表达构建物可以导入到所需的植物宿主的基因组中,或者,核酸或者表达构建物可以是附加体。可以导入到所需植物的基因组中,这样宿主的葡聚糖酶、甘露聚糖酶或木聚糖酶的产生被内源性的转录或者翻译控制元件调控。本发明也提供了“基因敲除植物”,其中例如同源重组导致的基因序列的插入破坏了内源性基因的表达。产生“基因敲除”植物的方法在本领域是已知的,参见,如,Strepp(1998)Proc Natl.Acad.Sci.USA95:4368-4373;Miao(1995)Plant J7:359-365。参见下面的转基因植物的讨论。
本发明的核酸可以将所需的性质赋予基本上任何植物,例如产淀粉的植物,如马铃薯、小麦、水稻、大麦等。本发明的核酸可以用于操作植物的代谢途径,以优化或者改变宿主的葡聚糖酶、甘露聚糖酶或木聚糖酶的表达。这可以改变葡聚糖酶、甘露聚糖酶或木聚糖酶活性。可选择地,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以在转基因植物的生产中被应用,以产生该植物不能天然产生的化合物。这可以降低生产成本或者产生一种新的产物。
一方面,生产转基因植物的第一步包括制备在植物细胞中表达的表达构建物。这些技术在本领域是被熟知的。它们可以包括选择和克隆启动子、便于核糖体有效结合mRNA的编码序列以及选择适当的基因终止序列。典型的组成型启动子是来自花椰菜花叶病毒的CaMV35S,它一般在植物中导致高水平的表达。其它的启动子是更特异的,并且对植物的内部或者外部环境中的暗示有反应。典型的光诱导的启动子是来自编码主要叶绿素a/b结合蛋白的cab基因的启动子。
一方面,修饰核酸来实现在植物细胞中更强的表达。例如,本发明的序列很可能具有比在植物中更高的A-T核苷酸对百分率,而一些植物优选G-C核苷酸对。因此,编码序列中的A-T核苷酸可以用G-C核苷酸取代,而不显著改变氨基酸序列,可以增强在植物细胞中基因产物的产生。
为了鉴定已经成功整合了转移基因的植物细胞或者组织,可以将选择性标记基因加入到基因构建物中。这可能是必要的,因为在植物细胞中完成基因的整合和表达是一个小概率事件,仅仅在较少百分率的靶组织和细胞中发生。选择性标记基因编码对试剂有抗性的蛋白,所述试剂一般对植物有毒性,如抗生素或者除草剂。当在含有适当的抗生素或者除草剂的培养基上生长时,只有已经整合了选择性标记基因的植物细胞可以成活。与其它的插入基因一样,为了有恰当的功能,标记基因也需要启动子和终止序列。
一方面,制备转基因植物或者种子包括将本发明的序列以及可选择的标记基因整合到目标表达构建物(如,质粒)中,同时设置启动子和终止序列。这可以包括通过合适的方法将修饰的基因转移至植物中。例如,构建物可以应用如电击转化和微注射植物细胞原生质体的技术直接引入到植物细胞的基因组DNA中,或者构建物可以应用弹道方法(ballistic methods),如,DNA微粒轰击(DNA particle bombardment)的方法直接引入到植物组织中。例如,参见如,Christou(1997)Plant Mol.Biol.35:197-203;Pawlowski(1996)Mol.Biotechnol.6:17-30;Klein(l987)Nature327:70-73;Talcumi(1997)GenesGenet.Syst.72:63-69,讨论了应用微粒轰击引入转基因到小麦中;Adam(1997)如上,应用微粒轰击引入YACs至植物细胞中。例如,Rinehart(1997)如上,用微粒轰击来产生转基因棉花植物。用于加速微粒的设备在美国专利5,015,580中有说明;而且,可以买到BioRad(Biolistics)PDS-2000微粒加速设备;也参见,John,美国专利5,608,148;和Ellis,美国专利5,681,730,描述了微粒介导的裸子植物的转化。
一方面,原生质体可以被固定,并用核酸例如表达构建物注射。尽管源自原生质体的植物再生对于谷类并不容易,但是应用体细胞胚胎发生由原生质体来源的愈伤组织进行植物再生在豆类中是有可能的。机化组织可以使用基因枪技术用裸DNA转化,其中的DNA被包裹于钨微射弹(tungsten microprojectiles)上,射出物的大小为细胞大小的l/100,它携带DNA深入到细胞和细胞器中。转化的组织然后被诱导再生,一般通过体细胞胚胎发生技术。这一技术已经在包括玉米和水稻的几个谷类物种中成功应用。
核酸,例如表达构建物也可以应用重组病毒引入到植物细胞中。植物细胞可以用病毒载体转化,如,烟草花叶病毒衍生的载体(Rouwendal(1997)Plant Mol.Biol.33:989-999),参见Porta(1996)“Use of viral replicons for the expression of genes inplants”,Mol.Biotechnol.5:209-221。
可选择地,核酸,如表达构建物,可以与合适的T-DNA旁侧区域组合,并导入到传统的根癌农杆菌宿主载体中。根癌农杆菌宿主的毒力功能将在植物细胞受该细菌感染时,引导构建物和邻近的标记插入至植物细胞DNA中。根癌农杆菌介导的转化技术,包括disarming和二元载体的应用,在科学文献中有详细的说明。参见,如,Horsch(1984)Science233:496-498;Fraley(1983)Proc.Natl.Acad.Sci.USA80:4803(1983);GeneTransfer to Plants,Potrykus,ed.(Springer-Verlag,Berlin1995)。根癌农杆菌细胞的DNA被包含在细菌染色体中,也被包含在称为Ti(肿瘤诱导)质粒的另一种结构中。Ti质粒含有一段命名为T-DNA的DNA(~20kb长)和一系列毒力(virulence)基因,T-DNA在感染过程中被转移到植物细胞中,毒力基因则引导所述感染过程。根癌农杆菌可以通过伤口感染植物:当一种植物的根或者茎受伤,它释放某种化学信号,作为对这种信号的响应,根癌农杆菌的毒力基因被激活,并引发一系列从Ti质粒转移T-DNA至植物染色体所必需的事件。T-DNA然后通过伤口进入到植物细胞。一个推测是T-DNA一直等到植物DNA复制或者转录,然后将自身插入到暴露的植物DNA中。为了应用根癌农杆菌作为转基因载体,必须去除T-DNA的肿瘤诱导部分,而保留T-DNA的边界区域和毒力基因。转基因然后插入到T-DNA的边界区域之间,从这里转移到植物细胞并且整合到植物的染色体中。
本发明提供了应用本发明的核酸进行包括重要的谷类植物在内的单子叶植物的转化,参见Hiei(1997)Plant Mol.Biol.35:205-218。也参见如,Horsch,Science(1984)233:496;Fraley(1983)Proc.Natl Acad.Sci USA80:4803;Thykjaer(1997)如上;Park(1996)Plant Mol.Biol.32:1135-1148,讨论了将T-DNA整合到基因组DNA中。也参见D′Halluin,美国专利5,712,135,描述了包含在谷类或者其它单子叶植物的细胞中的具有功能性的基因的DNA的稳定整合过程。
一方面,第三步可以包括能够将整合的靶基因传递至下一代的完整植物的选择和再生。这样的再生技术依赖于对组织培养生长培养基中的某些植物激素的操作,典型地,依赖于与所需的核苷酸序列一同引入的杀虫剂和/或除草剂标记。源自培养的原生质体的植物再生在以下文献中有说明,Evans等,Protoplasts lsolation and Culture,Handbookof Plant Cell Culture,124-176页,MacMillilan Publishing Company,New York,1983;和Binding,Regeneration of Plants,Plant Protoplasts,21-73页,CRC Press,BocaRaton,1985。再生也可以从植物愈伤组织、外植体、器官或者其中的一部分得到。这样的再生技术在Klee(1987)Ann.Rev.of plant Phys.38:467-486中有总体的说明。为了从转基因组织如未成熟的胚胎获得整个植物,它们可以在一系列含有营养物和激素的培养基中在可控制的环境条件下培养,即称为组织培养的过程。一旦整个植物再生并且产生种子,便开始评价子代。
在表达序列盒稳定地整入到转基因植物之后,其可以通过有性杂交(sexualcrossing)引入到其它的植物中。可以应用任何的标准繁殖技术,这依赖于待杂交的物种。因为本发明核酸的转基因表达导致表型变化,包含本发明的重组核酸的植物可以和另一植物有性杂交而得到最终产物。因此,本发明的种子可以来自本发明的两个转基因植物的杂交,或者来自本发明的植物和其它植物的杂交。当两个亲本植物都表达本发明的多肽(如,葡聚糖酶、甘露聚糖酶、或木聚糖酶)时,所需的效应(例如,表达本发明的多肽来产生一种开花行为被改变的植物)可以增强。所需的效应通过标准的繁殖方法传到以后的植物世代中。
本发明的核酸和多肽被表达于或者插入到任何植物或者种子中。本发明的转基因植物可以是双子叶植物或者单子叶植物。本发明的单子叶转基因植物的例子是草,如牧草(蓝草,早熟禾属Poa),饲料草如羊茅属,黑麦草属,温带草,如翦股颖属(Agrostis),和谷类,如,小麦、燕麦、黑麦、大麦、水稻、蜀黍和玉米(corn)。本发明的双子叶转基因植物的例子是烟草,豆类,如羽扇豆,马铃薯,甜菜,豌豆,蚕豆和大豆,以及十字花科植物(Brassicaceae),如花椰菜,油菜籽,和紧密相关的模式生物拟南芥(Arabidopsisthaliana)。这样,本发明的转基因植物和种子包括很宽范围的植物,包括,但不限于,以下属的物种:腰果属(Anacardium)、落花生属(Arachis)、天冬属(Asparagus)、茄属(Atropa)、燕麦属(Avena)、芸苔属(Brassica)、柑桔属(Citrus)、Citrullus、辣椒属(Capsicum)、Carthamus、椰子(Cocos)、咖啡(Coffea)、香瓜属(Cucumis)、南瓜属(Cucurbita)、Daucus、Elaeis、Fragaria、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、Heterocallis、大麦属(Hordeum)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄属(Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、Majorana、苜蓿属(Medicago)、烟草属(Nicotiana)、Olea、Oryza、Panieum、Pannisetum、鳄梨属(Persea)、菜豆属(Phaseolus)、Pistachia、Pisum、梨属(Pyrus)、李属(Prunus)、萝卡属(Raphanus)、蓖麻属(Ricinus)、黑麦属(Secale)、千里光属(Senecio)、Sinapis、茄属(Solanum)、高粱属(Sorghum)、Theobromus、Trigonella、小麦属(Triticum)、野豌豆属(Vicia)、Vitis、Vigna、和玉蜀黍属(Zea)。
在可供选择的实施方式中,本发明的核酸在含有纤维细胞的植物中表达,包括,如,棉、丝棉树(木棉、吉贝木棉)、沙漠柳、石炭酸灌木、winterfat、balsa、苎麻、洋麻、大麻、洛神葵、黄麻、马尼拉剑麻和亚麻。在可供选择的实施方式中,本发明的转基因植物可以是棉属(Gossypium)的成员,包括任何棉种(Gossypium)的成员,如,亚洲棉(G.arboreum)、草棉(G.herbaceum)、海岛棉(G.barbadense)和陆地棉(G.hirsutum)。
本发明也提供用于大量生产本发明的多肽(例如葡聚糖酶、甘露聚糖酶或木聚糖酶或抗体)的转基因植物。例如,参见Palingren(1997)Trends Genet.13:348;Chong(1997)Transgenic Res.6:289-296(利用植物生长素诱导的双向甘露氨酸合成酶(mas1′,2′)启动子,应用根癌农杆菌介导的叶片圆盘(leaf disc)转化方法在转基因马铃薯植物中生产人乳汁蛋白β-酪蛋白)。
应用已知的程序,技术人员可以通过检测在转基因植物中转基因mRNA或者蛋白的增加或者减少来筛选本发明的植物。检测和定量mRNA或者蛋白的方法在本领域是被熟知的。
多肽或肽
一方面,本发明提供了与本发明的示范性序列有着序列同一性(例如,至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全的(100%)的序列同一性)的分离的、合成的或重组的多肽,所述的本发明的示范性序列例如具有在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ IDNO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ IDNO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ IDNO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ IDNO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ IDNO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132;SEQ ID NO:134;SEQ ID NO:136;SEQ ID NO:138;SEQ ID NO:140;SEQ IDNO:142;SEQ ID NO:144;NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ IDNO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ IDNO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ IDNO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ IDNO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ IDNO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ IDNO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ IDNO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO-306、SEQ IDNO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ IDNO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ IDNO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ IDNO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ IDNO:396、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ IDNO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ IDNO:440、SEQ ID NO:442、SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、SEQ IDNO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:480、SEQ ID NO:482、SEQ IDNO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ IDNO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、SEQ ID NO:516或SEQ ID NO:518中所示的序列的蛋白。在一个方面,所述多肽具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性,例如可水解多糖内的糖苷键,例如葡聚糖内的糖苷键。在一个方面,多肽具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性,包括可催化1,4-β-D-糖苷键或β-1,3-糖苷键。在一个方面,内切葡聚糖酶活性包括内-l,4-β-内切葡聚糖酶活性。在一个方面,内切葡聚糖酶活性包括水解葡聚糖产生更小分子量的葡聚糖或葡聚糖-寡聚体。在一个方面,葡聚糖包括包括β-葡聚糖,诸如水溶性β-葡聚糖。
由本发明多核苷酸编码的酶包括但不限于水解酶,诸如葡聚糖酶,例如内切葡聚糖酶,甘露聚糖酶或木聚糖酶。图5是概述本发明的若干示范性酶在各种条件下,例如变化的pH和温度条件下的相对活性的表格。在图5中:ND=未测定;*pH或温度的最佳值未被测定,但是在指示pH和/或温度的酶活性进行了测定;1热稳定性,酶保留大部分活性(约>50%)的时间,或酶在指定的温度中失去它50%的活性(t1/2)的时间;2RA=各自相对于最佳pH和温度中的活性,在pH2.6、4.0、5.5、7.0、8.0、9.0或25℃、37℃、50℃、65℃、75℃、85℃的相对活性;3RA,最佳pH3.75、5、5.3、6.25、7,和最佳温度40、55、70、90℃时的相对活性;4BBG=大麦-β-葡聚糖,CMC=羧甲基纤维素。葡聚糖酶的家族分类描述于下。
在一个方面,本发明的酶也可以具有甘露聚糖酶活性,例如它能够降解(或水解)甘露聚糖。含有甘露聚糖的多糖是在硬木和软木以及许多豆科种子的胚乳和一些非-豆科植物的成熟种子中的半纤维素部分的主要成分。在一个方面,本发明的甘露聚糖酶水解甘露聚糖、葡甘露聚糖、半乳甘露聚糖和半乳葡甘露聚糖中的β-1,4键(甘露聚糖是具有由β-1,4键连接的甘露糖组成的主架的多糖,葡甘露聚糖是具有由或多或少规则交替的β-1,4键连接的甘露糖和葡萄糖组成的主架的多糖)。例如,在一个方面,多肽具有SEQ ID NO:454中示出的序列,由例如SEQ IDNO:453编码,具有木聚糖酶、葡聚糖酶和甘露聚糖酶活性。测定甘露聚糖酶活性的方法是本领域公知的,参见例如美国专利申请20030215812;20030119093;美国专利5,661,021;5,795,764;6,376,445;6,420,331。测定木聚糖酶活性的方法是本领域公知的,参见例如美国专利申请5,693,518;5,885,819;6,200,797;6,586,209;6,682,923。
本发明也提供了嵌合多肽(和编码它们的核酸),该嵌合多肽包括至少两个本发明的酶或它们的亚序列,例如活性位点,或催化位点(CDs)。本发明的嵌合蛋白质(例如融合蛋白质,或其他杂合二聚体,例如利用其他方式例如连接键或静电的方式结合在一起的两结构域)可以包括本发明的一个多肽(例如活性位点或催化位点)和本发明的另一种多肽(例如活性位点或催化区域肽(catalytic domain peptide))或其他多肽。例如,本发明的嵌合蛋白质可以具有甘露聚糖酶和木聚糖酶活性,甘露聚糖酶和葡聚糖酶活性等。在一个方面,本发明的嵌合蛋白质包括结构域的融合,例如单个结构域可以显示出葡聚糖酶/木聚糖酶/甘露聚糖酶活性或任何活性的组合。
本发明提供了具有同样的新颖性的葡聚糖酶,这是因为它们最初来自类似的“糖苷酶水解酶”家族。糖苷酶水解酶最初在1991年分类为一个家族,参见例如Henrissat(1991)Biochem,.J.280:309-316。从那以来,该分类不断升级,参见例如Henrissat(1993)Biochem.J.293:781-788;Henrissat(1996)Biochem.J.316:695-696;Henrissat(2000)Plant Physiology124:1515-1519。现有约87个鉴定的糖苷酶水解酶家族。在一个方面,本发明的葡聚糖酶被分入家族例如家族3、5、6、8、9、12和16,如下表2所示。
表2
本发明的多肽包括活性或非活性形式的葡聚糖酶、甘露聚糖酶或木聚糖酶。例如,本发明的多肽包括在“成熟”或前体序列(prepro sequences)加工之前的蛋白原(proproteins),所述的加工例如通过蛋白原加工酶,如可以产生“活性”成熟蛋白的蛋白原转变酶进行的加工。本发明的多肽包括为其它原因而失活的葡聚糖酶、甘露聚糖酶或木聚糖酶,例如未通过翻译后加工事件进行“活化”的木聚糖酶,所述的翻译后加工事件例如内肽酶或外肽酶或蛋白酶作用、磷酸化事件、酰胺化、糖基化或硫酸化、二聚化事件和类似作用。本发明的多肽包括所有的活性形式,包括活性子序列,例如葡聚糖酶、甘露聚糖酶或木聚糖酶的催化结构域或活性位点。
鉴定“前体(prepro)”结构域序列和信号序列的方法在本领域中是为人所熟知的,见,例如Van de Yen(1993)Crit.Rev.Oncog.4(2):115-136。例如,为了鉴定前体序列,蛋白从细胞外空间纯化出来,测定N-末端蛋白序列,并与未加工的形式进行比较。
本发明包括具有或没有信号序列和/或前体序列的多肽。本发明提供了具有异源的信号序列和/或前体序列的多肽。所述前体序列(包括用作异源前体结构域的本发明序列)可位于蛋白的氨基末端或羧基末端。本发明也包括构成本发明的序列的分离出的或重组的信号序列、前体序列和催化结构域(例如,“活性位点”)。
一定百分数的同一性可以是在所述多肽的全长范围,或者,所述同一性可以是在至少大约50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700或者更多残基的范围。本发明的多肽也可以比示范性多肽的全长短。在可供选择的方面,本发明提供大小范围在大约5至多肽例如一种酶,如葡聚糖酶、甘露聚糖酶或木聚糖酶的全长之间的多肽(肽,片段),典型的大小为大约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700或者更多的残基,如本发明的示范性的葡聚糖酶、甘露聚糖酶或木聚糖酶的连续残基。
本发明的肽(例如,本发明的示范性多肽的子序列)可以用作,例如标记探针,抗原、耐受原、模体、葡聚糖酶、甘露聚糖酶或木聚糖酶活性位点(例如,“催化结构域”)、信号序列和/或前体结构域。
本发明的多肽和肽可以是从天然的来源中分离出的,可以是合成的,或者是由重组产生的多肽。肽和蛋白可以在体外或者在体内重组表达。本发明的肽和多肽可以应用本领域任何已知的方法来制备和分离,本发明的多肽和肽也可以部分或者全部由本领域已知的化学方法合成。参见如,Caruthers(1980)Nucleic Acids Res.Symp.Ser.215-223;Horn(1980)Nucleic Acids Res.Symp.Ser.225-232;Banga,A.K.,Therapeutic Peptides andProteins,Formulation,Processing and Delivery Systems(1995)TechnomicPublishing Co.,Lancaster,PA。例如,肽的合成可以应用各种固相技术来进行(参见,如,Roberge(1995)Science269:202;Metrifield(1997)Methods Enzymol.289:3-13),还可以实现自动合成,如,按照制造商提供的说明书,应用ABI431A肽合成仪(Perkin Elmer)进行合成。
本发明的肽和多肽也可以是糖基化的,所述糖基化可以在翻译后通过化学方法或者通过细胞的生物合成机制而加上,其中后者包括应用已知的糖基化模体,所述糖基化模体可以是天然序列,或者是作为肽段而被加入的,或者是在核酸编码序列中加入的。糖基化作用可以是O-连接的或者是N-连接的。
本发明的肽和多肽,如以上所定义的,包括所有的“模拟物(mimetic)”和“肽模拟物(peptidomimetic)”形式。术语“模拟物”和“肽模拟物”是指具有与本发明的多肽实质上相同的结构和/或功能特征的合成的化学化合物。该模拟物或者完全由合成的非天然的氨基酸类似物组成,或者是由部分天然的肽氨基酸和部分非天然的氨基酸类似物构成的嵌合分子。所述模拟物也可以包括任意数量的天然氨基酸保守取代,只要这样的取代本质上不改变该模拟物的结构和/或活性。对于作为保守性变异体的本发明的多肽,常规实验将确定一种模拟物是否在本发明的范围内,即,其结构和/或功能并没有实质上的改变。因此,一方面,如果一种模拟化合物具有木聚糖酶活性,那么它在本发明的范围内。
本发明的多肽模拟化合物可以含有非天然结构组分的任何组合。在可供选择的方面,本发明的模拟化合物包括以下三种结构基团中的一种或所有:a)不是天然酰胺键(“肽键”)连接的残基连接基团;b)取代天然发生的氨基酸残基的非天然残基;或者c)诱导二级结构拟态(mimicry)的残基,即是,诱导或者稳定二级结构,如β转角、γ转角、β折叠、α螺旋构象,等等。例如,当一个多肽的所有残基或者一些残基通过非天然肽键的化学方式连接时,本发明的该多肽可以作为模拟物来表征。各个肽模拟物残基可以通过肽键、其它的化学键或者偶联方式连接,如,通过戊二醛、N-羟基琥珀酰亚胺酯、双功能马来酰亚胺、N,N′-二环己基碳二亚胺(DCC)或者N,N′-二异丙基碳二亚胺(DIC)连接。可以替代传统的酰胺键(“肽键”)连接的连接基团包括,如,酮基亚甲基(如,-C(=O)-CH2-代替-C(=O)-NH-)、氨基亚甲基(CH2-NH)、次乙基、烯烃(CH=CH)、醚(CH2-O)、硫醚(CH2-S)、四唑(CN4-)、噻唑、retroamide、硫代酰胺或者酯(参见如,Spatola(1983)在Chemistry and Biochemistry ofAmino Acids,Peptides and Proteins,第7卷,267-357页,“Peptide BackboneModifications”Marcell Dekker,NY)。
本发明的多肽作为模拟物时,其特征也可以是含有全部或者部分替代了天然发生的氨基酸残基的非天然氨基酸残基。在科学和专利文献中描述了非天然的残基;作为天然氨基酸残基的模拟物的一些典型的非天然化合物及指导在下面有描述。芳香族氨基酸的模拟物可以通过用以下的取代来产生,如,D-或者L-萘基丙氨酸;D-或者L-苯基甘氨基,D-或L-2thieneyl丙氨酸;D-或者L-l,-2,3-或者4-芘基丙氨酸;D-或者L-3thieneyl丙氨酸;D-或者L-(2-吡啶基)-丙氨酸;D-或者L-(3-吡啶基)-丙氨酸;D-或者L-(2-吡嗪基)-丙氨酸,D-或者L-(4-异丙基)-苯基甘氨酸;D-(三氟甲基)-苯基甘氨酸;D-(三氟甲基)-苯基丙氨酸;D-p-氟-苯基丙氨酸;D-或者L-p-二苯基苯基丙氨酸;D-或者L-p-甲氧基-二苯基苯基丙氨酸;D-或者L-2-吲哚(烷基)丙氨酸;和,D-或者L-烷基丙氨酸,其中的烷基可以是取代的或者非取代的甲基、乙基、丙基、己基、丁基,戊基、异丙基、异丁基、sec-isotyl、异戊基或者非酸性氨基酸。非天然氨基酸的芳香环包括,如噻唑基、苯硫基、吡唑基、苯并咪唑基、萘基、呋喃基、吡咯基和吡啶基芳香环。
酸性氨基酸的模拟物可以通过用以下的取代来产生,如,保持有负电荷的非羧酸氨基酸;(膦酰基)丙氨酸;硫酸化的苏氨酸。羧基侧链(如,天冬氨酰基或者谷氨酰基)也可以通过与碳二亚胺(R′-N-C-N-R′)反应进行选择性的修饰,所述碳二亚胺如1-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或者1-乙基-3(4-氮-4,4-二甲基戊基)碳二亚胺。天冬氨酰基或者谷氨酰基也可以通过与铵离子反应转化为天冬酰胺酰基和谷氨酰胺酰基。碱性氨基酸的模拟物可以通过用如,(除了赖氨酸和精氨酸外)鸟氨酸、瓜氨酸、或者(胍基)-乙酸,或者(胍基)烷基-乙酸的取代产生,其中烷基如以上定义。腈衍生物(如,含有取代COOH的CN-部分)可以取代天冬酰胺或者谷氨酰胺。天冬酰胺酰基和谷氨酰胺酰基可以脱氨基成为相应的天冬氨酰基或者谷氨酰基。精氨酸残基模拟物可以通过精氨酰基与例如一种或者多种常规试剂在优选为碱性的条件下反应而产生,所述的常规试剂包括如苯乙二醛、2,3-丁二酮、l,2-环己二酮或者茚三酮。酪氨酸残基模拟物可以通过酪氨酰基与例如芳香重氮化合物或者四硝基甲烷反应而产生。N-acetylimidizol和四硝基甲烷可以分别用于形成O-乙酰基酪氨酰物质和3-硝基衍生物。半胱氨酸残基模拟物可以通过半胱氨酰残基与例如α-卤素乙酸例如2-氯乙酸或者氯乙酰胺和相应的胺反应而产生;得到羧甲基或者羧酰胺甲基衍生物。半胱氨酸残基模拟物也可以通过半胱氨酰残基与例如溴代-三氟丙酮、α-溴-β-(5-imidozoyl)丙酸;氯乙酰磷酸、N-烷基马来酰亚胺、3-硝基-2-吡啶基二硫化物;甲基2-吡啶基二硫化物;p-氯汞苯甲酸盐;2-氯汞-4硝基苯酚,或者,氯-7-硝基苯并-氧杂-1,3-二唑反应而产生。可以通过赖氨酰基与例如琥珀酸或者其它的羧酸酸酐反应而产生赖氨酸模拟物(和改变氨基末端残基)。赖氨酸和其它的含有α-氨基的残基模拟物也可以通过与亚氨酸酯例如methyl picolinimidate、磷酸吡哆醛、吡哆醛、氯硼氢化物、三硝基-苯磺酸、O-甲基异脲、2,4,戊二酮的反应,和与乙醛酸的转酰胺基酶催化的反应而产生。甲硫氨酸的模拟物可以通过与例如甲硫氨酸亚砜反应而产生。脯氨酸的模拟物包括,例如,2-哌啶酸、四氢噻唑羧酸、3-或4-羟脯氨酸、脱氢脯氨酸、3-或4-甲基脯氨酸,或者3,3,-二甲基脯氨酸。组氨酸残基模拟物可以通过组氨酰基与例如二乙基原碳酸酯或者对溴苯甲酰甲基溴化物反应而产生。其它的模拟物包括,例如,由脯氨酸和赖氨酸的羟基化作用产生的模拟物;由丝氨酰或者苏氨酰的羟基的磷酸化作用产生的模拟物;由赖氨酸、精氨酸和组氨酸的α氨基基团的甲基化作用产生的模拟物;由N-末端胺的乙酰化作用而产生的模拟物;由主链酰胺残基的甲基化或用N-甲基氨基酸取代而产生的模拟物;或者,由C-末端羧基的酰胺化而产生的模拟物。
本发明的多肽的残基例如氨基酸也可以用相反手性的氨基酸(或者肽模拟物残基)替代。因此,任何天然发生的L-构型(也可以被称为R或者S,取决于化学实体的结构)的氨基酸都可用相同化学结构类型但是具有相反手性的氨基酸或者肽模拟物替代,相反手性的氨基酸称为D-氨基酸,但也可以称R-或者S-型。
本发明也提供了通过天然过程,如,翻译后加工(如,磷酸化,酰化以及类似作用)或者化学修饰技术修饰本发明的多肽的方法,以及得到的被修饰的多肽。修饰可以发生在所述多肽的任何地方,包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解,相同类型的修饰可以在已知的多肽中以相同的或者不同的水平在几个位点处发生。一个多肽也可以具有很多类型的修饰。修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组分、共价连接核苷酸或者核苷酸衍生物、共价连接脂质或者脂质衍生物、共价连接磷脂酰肌醇、交联的环化作用、形成二硫键、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、蛋白水解过程、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用,和转移RNA介导氨基酸添加到蛋白质中,如精氨酰化。参见,如,Creighton,T.E.,Proteins-Structure andMolecular Properties2nd Ed.,W.H.Freeman和Company,New York(1993);Posttranslational Covalent Modification of Proteins,B.C.Johnson,Ed.,AcademicPress,New York,11-12页(1983)。
固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也参见Stewart,J.M.和Young,J.D.,Solid Phase Peptide Synthesis,第二版,Pierce Chemical Co.,Rockford,III,11-12页),并且这些方法已经可以通过商业上可获得的实验室肽设计和合成试剂盒(Cambridge Research Biochemicals)而被应用。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的方法,它们让肽合成在多个“杆(rods)”或者“钉(pins)”的顶端进行,而所有的“杆”或者“钉”都被连接到一块板上。当使用这样的系统时,一个板的杆或者钉被倒转并插入到另一个板的相应孔或者贮存器中,所述孔或者贮存器含有用于将一种适合的氨基酸附着或固定在杆或钉的顶端的溶液。通过重复这样的处理步骤,即是,反转和插入所述杆和钉的顶端至适当的溶液中,将氨基酸构建成所要的肽。此外,大量的FMOC肽合成系统是可利用的。例如,应用Applied Biosystems,Inc.的Model431ATM自动肽合成仪可以在固体支持物上装配多肽或者片段。这些设备使得本发明的肽容易获得,或者通过直接的合成或者通过用其它已知的技术将一系列片段偶联起来的合成。
本发明包括具有或不具有信号的本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶。含有本发明的信号序列的多肽可以是本发明的葡聚糖酶或另一种葡聚糖酶或另一种酶或其它的多肽。
本发明包括固定化的葡聚糖酶、甘露聚糖酶或木聚糖酶、抗葡聚糖酶、甘露聚糖酶或木聚糖酶抗体及其片段。本发明提供了抑制葡聚糖酶、甘露聚糖酶或木聚糖酶活性的方法,例如使用显性负突变体或本发明的抗葡聚糖酶、甘露聚糖酶或木聚糖酶抗体。本发明包括杂合物,例如融合蛋白、异源二聚体等,其中含有本发明的葡聚糖酶。
本发明的多肽可以在各种条件下具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性,例如在极端pH和/或温度、氧化剂和类似的条件下。本发明提供了产生可选择的各种葡聚糖酶、甘露聚糖酶或木聚糖酶制备物的方法,它们例如对于温度、氧化剂和变化的清洗条件具有不同的催化效率和稳定性。在一个方面,葡聚糖酶、甘露聚糖酶或木聚糖酶变异体可使用定点诱变和/或随机诱变的技术来产生。在一个方面,定向进化可用来产生极大量的葡聚糖酶、甘露聚糖酶或木聚糖酶变异体,它们具有各种特异性和稳定性。
本发明的蛋白也可用作鉴定葡聚糖酶、甘露聚糖酶或木聚糖酶调节物——例如葡聚糖酶、甘露聚糖酶或木聚糖酶活性的激活物或抑制物——的研究试剂。简言之,将受测样品(化合物、肉汤、提取物等)加入至葡聚糖酶、甘露聚糖酶或木聚糖酶分析中以确定其抑制底物裂解的能力。以这种方式鉴定的抑制物可用于工业和研究中以降低或防止不需要的蛋白水解。对于葡聚糖酶、甘露聚糖酶或木聚糖酶,抑制物可被组合在一起以增加活性谱(spectrum of activity)。
本发明的酶也可用作消化蛋白质的研究试剂或用在蛋白测序中。例如,为了使用例如自动测序仪进行测序,可以使用葡聚糖酶、甘露聚糖酶或木聚糖酶将多肽破碎成更小的片段。
本发明也提供了应用本发明的核酸、多肽和抗体来发现新的葡聚糖酶、甘露聚糖酶或木聚糖酶的方法。一方面,筛选噬粒文库,基于表达来发现葡聚糖酶、甘露聚糖酶或木聚糖酶。另一方面,筛选λ噬菌体文库,基于表达来发现葡聚糖酶、甘露聚糖酶或木聚糖酶。通过筛选噬菌体或噬粒文库,可以检测到毒性克隆;更方便地利用底物;减少工程改造宿主的需要,绕过由文库中大的切除带来任何偏差的可能性;以及获得在低克隆密度下更快的生长速率。噬菌体或噬粒文库的筛选可以是在液相中或者固相中。一方面,本发明提供了在液相中的筛选。与固相筛选相比,这给予了分析条件上的更大灵活性;额外底物的可行性;对于弱的克隆的更高灵敏性;和固相筛选更容易进行的自动化。
本发明提供了使用本发明的蛋白和核酸以及机器人自动化来进行筛选的方法,机器人自动化使得在例如一天的短时间内能进行数千个生物催化反应和筛选分析,并且保证了高水平的精确度和可重复性(参见下面关于阵列的讨论)。结果,衍生化合物的文库可以在数周内产生。对于包括小分子在内的分子的修饰的进一步教导,参见PCT/US94/09174。
本发明的另一个方面是分离出的或纯化的多肽,其含有本发明的序列,或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段。如上所述,这样的多肽的获得可通过将编码多肽的核酸插入进载体中,这样,所述编码序列可操作性地连接于能够在合适的宿主细胞中驱动被编码的多肽表达的序列。例如,表达载体可含有启动子、启动翻译的核糖体结合位点和转录终止子。载体也包括用于扩增表达的合适序列。
本发明的另一个方面是多肽或其片段,其与本发明多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段具有至少大约50%、至少大约55%、至少大约60%、至少大约65%、至少大约70%、至少大约75%、至少大约80%、至少大约85%、至少大约90%、至少大约95%或超过大约95%的序列同一性(同源性)。序列同一性(同源性)可以使用上述的任何程序来确定,它们可比对被比较的多肽或片段,并确定它们之间的氨基酸同一性或相似性程度。要理解的是,氨基酸等同、或同一性或“同源性”包括保守的氨基酸取代,如上述的那些取代。
与本发明多肽的一种多肽或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段具有同源性的多肽或片段,可使用上述的技术通过分离编码它们的核酸而获得。
可选择的,通过生物化学富集或纯化步骤可获得同源的多肽或片段。通过木聚糖水解酶消化、凝胶电泳和/或微测序可以确定潜在同源的多肽或片段的序列。预期的同源多肽或片段的序列可使用上述的任何程序,与本发明多肽的一个多肽或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段相比较。
本发明的另一个方面是用于鉴定本发明的片段或变异体的分析方法,所述片段或变异体保留了本发明多肽的酶功能。例如所述多肽的片断或变异体可用来催化生物化学反应,这样的反应表明所述片段或变异体保留了本发明多肽的酶活性。
用于确定变异体的片段是否保留了本发明多肽的酶活性的分析方法包括步骤:将多肽片段或变异体与底物分子在允许该多肽片段或变异体发挥作用的条件下接触,并检测底物水平的降低或该多肽和底物之间反应的特异反应产物水平的增加。
本发明多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段可用于许多的应用领域中。例如,所述多肽或其片段可用来催化生物化学反应。根据本发明的一个方面,提供了一个过程,其中应用本发明多肽或编码这样的多肽的多核苷酸来水解糖苷键。在这样的过程中,含有糖苷键的底物(例如,淀粉)与本发明多肽,与其实质上相同的序列在可促进糖苷键水解的条件下接触。
本发明开发了酶的独特的催化性质。鉴于生物催化剂(即,纯化的或者粗制的酶,非存活的或者存活的细胞)在化学转化中的应用一般需要确定与特定的起始化合物反应的特定的生物催化剂,本发明应用的经选择的生物催化剂和反应条件是对于存在于很多起始化合物中的功能基团具有特异性的。每种生物催化剂对于一种功能基团或者几种相关的功能基团是特异的,并且可以和含有这一功能基团的许多起始化合物反应。
生物催化反应可以从单一的起始化合物生产出一个群体的衍生物。这些衍生物可以进行另一轮的生物催化反应来产生又一个群体的衍生化合物。通过生物催化的衍生作用的每一次迭代可以产生起始化合物的数千种变化。
酶可以在起始化合物的特定位点发生反应而不影响分子的其它部分,该过程通过传统的化学方法很难实现。这种高度的生物催化特异性提供了用于在文库中鉴定单个活性化合物的方法。该文库是通过用于产生该文库的一系列生物催化反应来表征,这也称为“生物合成历史”。对该文库的生物活性的筛选和对生物合成历史的追踪确定出产生活性化合物的特定反应顺序。重复该反应顺序,并确认合成出的化合物的结构。这种确认方式,不同于其它的合成和筛选方法,并不需要固定化技术,化合物可以利用实际上任何类型的筛选分析在溶液中自由合成和测试。一方面,酶反应在功能基团上的高度特异性允许“追踪”特定的酶促反应,由所述酶促反应制备出了生物催化产生的文库。
许多程序化的步骤可使用自动化机器人来实施,这使得每天可执行数千个生物催化反应和筛选分析,并保证高水平的准确性和可重复性。结果,在大概几周内便产生了衍生化合物的文库,而采用现今的化学方法则需要几年的时间。
在一个特定的方面,本发明提供了修饰小分子的方法,包括将在此所述的由多核苷酸编码的多肽或其酶活性片段与小分子接触,产生修饰的小分子。检测被修饰的小分子的文库以确定显示出所需活性的修饰小分子是否存在于文库内。产生具有所需活性的修饰小分子的特异性生物催化反应的鉴定可通过系统性地去除用来产生一部分文库的每个生物催化反应,然后检测在这一部分文库中产生的小分子是否存在具有所需活性的修饰小分子。产生具有所需活性的修饰小分子的特异生物催化反应可选择性地被重复。生物催化反应可用一组生物催化剂来进行,它们可与在小分子的结构中发现的各种不同结构部分反应,每个生物催化剂对一个结构部分或一组相关的结构部分是特异的;每个生物催化剂可与含有各种不同的结构部分的许多不同的小分子反应。
信号序列、前体和催化结构域
本发明提供了葡聚糖酶、甘露聚糖酶或木聚糖酶信号序列(例如,信号肽(SP))、前体结构域(prepro domains)和催化结构域(CD)(例如活性位点)。本发明的SP、前体结构域和/或CD可以是分离出的或重组的肽,或是融合蛋白的一部分,例如作为嵌合蛋白中的异源结构域。本发明提供了编码这些催化结构域(CD)、前体结构域和信号序列(SP,例如,具有由本发明多肽的氨基末端残基组成的序列/含有本发明多肽的氨基末端残基的序列的肽)的核酸。在一个方面,本发明提供了信号序列,其包括的肽含有本发明多肽的残基1至15、1至16、1至17、1至18、1至19、1至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至29、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至39、1至40、1至41、1至42、1至43、1至44中所示的序列或由其组成。
在一个方面,本发明也提供了嵌合多肽(和编码它们的核酸),该嵌合多肽包括至少两个本发明的酶或它们的亚序列,例如活性位点,或催化位点(CDs)。例如,本发明的嵌合蛋白质可以具有甘露聚糖酶和木聚糖酶活性,甘露聚糖酶和葡聚糖酶活性等。在一个方面,本发明的嵌合蛋白质包括结构域的融合,例如单个结构域可以显示出葡聚糖酶/木聚糖酶/甘露聚糖酶活性或任何活性的组合(例如重组嵌合蛋白质)。
本发明也提供了分离的、合成的或重组的信号序列,该信号序列或者包括本发明的信号序列,例如下表3中示出的示范性信号序列,或者由本发明的信号序列,例如下表3中示出的示范性信号序列组成,本发明也提供了包括这些信号序列的多肽。多肽可以是本发明另一葡聚糖酶、甘露聚糖酶或木聚糖酶,其他葡聚糖酶、甘露聚糖酶或木聚糖酶,另一糖苷酶或水解酶,或另一类型的酶或多肽。例如,阅读表3,本发明提供了SEQ ID NO:102的残基1至21示出的分离的、合成的或重组的信号序列,其在一个方面由例如SEQ ID NO:101的亚序列编码;或在本发明提供了SEQ ID NO:104的残基1至30示出的分离的、合成的或重组的信号序列,其在一个方面由例如SEQ ID NO:103的亚序列编码,等。
表3
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶信号序列(SP)和/或前体序列可以是分离出的肽,或与另一种葡聚糖酶、甘露聚糖酶或木聚糖酶或非葡聚糖酶、甘露聚糖酶或木聚糖酶多肽连接的序列,例如形成一个融合(嵌合)蛋白。在一个方面,本发明提供了含有本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶信号序列的多肽。在一个方面,含有本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶信号序列SP和/或前体序列的多肽包含与本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶异源的序列(例如,含有本发明的SP和/或前体序列和来自另一种葡聚糖酶或非葡聚糖酶蛋白的序列的融合蛋白)。在一个方面,本发明提供了具有异源的SP和/或前体序列的本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶,例如具有酵母信号序列的序列。本发明的木聚糖酶可以含有存在于载体例如pPIC系列载体(Invitrogen,Carlsbad,CA)中的异源SP和/或前体序列。
在一个方面,本发明的SP和/或前体序列在鉴定出新的葡聚糖酶、甘露聚糖酶或木聚糖酶多肽之后被鉴定出来。蛋白被分选和转运至其正确的细胞位置的通路通常被称为蛋白靶向通路(protein targeting pathways)。在所有这些靶向系统中最重要的元件之一是新合成的多肽的氨基末端上的短的氨基酸序列,称为信号序列。这种信号序列可指引蛋白至其在细胞中的适合位置,并在转运过程中或在蛋白到达其最终目的地时被去除。大多数的溶酶体蛋白、膜蛋白或分泌蛋白都具有氨基末端信号序列,这些信号序列标示着它们将转位至内质网腔内。在本组中有超过100个蛋白信号序列被确定。信号序列的长度可以从13至36个氨基酸残基。识别信号序列的各种方法对于本领域技术人员是已知的。例如,在一个方面,新的葡聚糖酶、甘露聚糖酶或木聚糖酶信号肽可通过称为SignalP的方法来鉴定。SignalP应用了既可识别信号肽,又可识别其裂解位点的组合神经网络。(Nielsen等人,“Indentification of prokaryotic and eukaryotic signal peptides and predictionof their cleavage sites”Protein Engineering,卷10,1,1-6页(1997))。
应该理解的是,在一些方面,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以没有SP和/或前体序列,或“结构域”。在一个方面,本发明提供了缺少所有或部分的SP和/或前体结构域的本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶。在一个方面,本发明提供了编码来自一种葡聚糖酶、甘露聚糖酶或木聚糖酶的信号序列(SP)和/或前体序列的核酸序列,其有效连接于一种不同的葡聚糖酶的核酸序列,或者,可选择地,来自非葡聚糖酶、甘露聚糖酶或木聚糖酶蛋白的信号序列(SP)和/或前体结构域是被需要的。
本发明也提供了分离出的或重组的多肽,其含有本发明的信号序列(SP)、前体结构域和/或催化结构域(CD)和异源序列。所述异源序列是与SP、前体结构域和/或CD(例如,与葡聚糖酶、甘露聚糖酶或木聚糖酶)天然不相关的序列。与SP、前体结构域和/或CD天然不相关的序列可以在SP、前体结构域和/或CD的氨基末端、羧基末端,和/或SP和/或CD的两个末端上。在一个方面,本发明提供了分离出的或重组的多肽,其包括(或构成于)含有本发明的信号序列(SP)、前体结构域和/或催化结构域(CD)的多肽,另外的条件是它同与其天然相关的任何序列(例如,葡聚糖酶、甘露聚糖酶或木聚糖酶序列)是不相关的。同样,在一个方面,本发明提供了编码这些多肽的分离出的或重组的核酸。因此,在一个方面,本发明的分离出的或重组的核酸包括本发明的信号序列(SP)、前体结构域和/或催化结构域(CD)的编码序列和异源序列(即,与信号序列(SP)、前体结构域和/或催化结构域(CD)天然不相关的序列)。异源序列可在SP、前体结构域和/或CD编码序列的3’末端、5’末端和/或两个末端上。
杂合(嵌合)葡聚糖酶、甘露聚糖酶或木聚糖酶和肽文库
一方面,本发明提供了包含本发明的序列的杂合葡聚糖酶、甘露聚糖酶或木聚糖酶和融合蛋白,包括肽库。本发明的肽库可以用于分离目标的肽调节物(如,激活物或者抑制物),如葡聚糖酶、甘露聚糖酶或木聚糖酶底物、受体、酶。本发明的肽库可以用于确定目标的形式上的结合配偶,如,配体,例如,细胞因子,激素以及类似物。一方面,本发明提供了嵌合蛋白,其含有本发明的信号序列(SP)、前体结构域和/或催化结构域(CD)或其组合以及异源序列(如上)。
一方面,本发明的融合蛋白(如,肽部分)是构象稳定的(相对于线形肽),对靶标具有更高的结合亲和性。本发明提供了本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶与其它肽的融合,所述其它肽包括已知的肽和随机的肽。它们可以以这样一种方式融合,使得所述葡聚糖酶、甘露聚糖酶或木聚糖酶的结构没有明显地被扰乱,并且该肽在代谢上或者结构构象上是稳定的。这样便允许获得肽库,该肽库在细胞内的存在及其数量都是容易监测的。
本发明的氨基酸序列变异体可以通过该变异的注定的性质来表征,也就是将它们与天然发生的形式区分开的特征,如,葡聚糖酶、甘露聚糖酶或木聚糖酶序列的等位基因的或者种间的变异。一方面,本发明的变异体表现出与天然发生的类似物相同性质的生物活性。可选择地,可以选择具有改变的特征的变异体。一方面,尽管引入氨基酸序列变化的区域或者位点是预先决定的,但突变本身并不需要预先决定。例如,为了优化在一个给定位点出现的突变,可以在目标密码子或者区域进行随机诱变,并筛选被表达的葡聚糖酶、甘露聚糖酶或木聚糖酶变异体,以寻找所需活性的优化组合。已知在具有已知序列的DNA的预先决定的位点产生取代突变的技术,正如在此说明的,例如,M13引物诱变和PCR诱变。突变体的筛选可以通过应用例如葡聚糖水解分析来进行。在可供选择的方面,氨基酸取代物可以是单个残基;插入可以是大约1到20个氨基酸的水平,尽管可以插入相当大的片段。缺失的范围可以是大约1到大约20、30、40、50、60、70个残基或者更多。为了得到具有优化性质的最终衍生物,替代、缺失、插入或者任何它们的组合可以被应用。一般地,这些变化是在几个氨基酸上进行,以最小化分子的改变。然而,在某些情况下,可以容忍更大的改变。
本发明提供了葡聚糖酶、甘露聚糖酶或木聚糖酶,其中多肽骨架的结构、二级结构或三级结构,例如,α螺旋或β折叠结构,已被修饰。一方面,电荷或疏水性已被修饰。一方面,侧链已被修饰。通过选择较不保守的取代来产生功能或免疫性的本质变化。例如,可以进行这样的取代,它们将更加显著地影响:发生变化的区域的多肽骨架的结构,例如α螺旋或β折叠结构;分子的电荷或疏水位点,其可以是活性位点;或者侧链。本发明提供在本发明的多肽中的取代,其中(a)亲水残基,例如丝氨酰或苏氨酰,被疏水残基例如亮氨酰、异亮氨酰、苯基丙氨酰、缬氨酰或丙氨酰取代;或者相反;(b)半胱氨酸或脯氨酸被任何别的残基取代;或者相反;(c)具有正电性侧链的残基,例如赖氨酰、精氨酰或组氨酰被带负电的残基例如谷氨酰或天冬氨酰取代;或者相反;或者(d)具有大体积侧链的基团,例如苯丙氨酸,被不具侧链的氨基酸例如甘氨酸取代;或者相反。所述变异体可以表现出相同性质的生物学活性(即是内切葡聚糖酶、甘露聚糖酶或木聚糖酶活性),尽管变异体可经选择来按需改变葡聚糖酶、甘露聚糖酶或木聚糖酶的特征。
一方面,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶包括抗原结合部位(epitopes)或者纯化标记、信号序列或者其它的融合序列,等。在一方面,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以与随机的多肽融合,形成融合多肽。“融合”或者“可操作性连接(operably linked)”在此是指随机肽和葡聚糖酶、甘露聚糖酶或木聚糖酶酶连接在一起,以这样的方式来最小化对葡聚糖酶结构稳定性的破坏,例如,其仍保持葡聚糖酶、甘露聚糖酶或木聚糖酶的活性。所述的融合多肽(或者编码该融合多肽的融合多聚核苷酸)还可以包含进一步的组分,包括在多环(multiple loops)处的多个肽段。
一方面,肽和编码它们的核酸或者是完全随机化的,或者是在随机化中有偏向,例如,在核苷酸/残基的普遍频率或者每个位置处的频率方面。“随机化”是指每一个核酸或者肽分别由本质上随机的核苷酸和氨基酸组成。一方面,产生所述肽的所述核酸可以通过化学合成,并且可以在任何位置整合进任何核苷酸。因此,当所述核酸被表达形成肽时,任何氨基酸残基可以整合进任何位置。可以设计合成过程来产生随机化的核酸,从而允许在所述核酸的长度范围内形成所有的或者大多数的可能组合,由此形成随机核酸文库。该文库可以提供足量的结构多样的随机化表达产物群体,可以获得概率上充分的细胞响应范围,从而可以提供一种或者多种表现出所需响应的细胞。因此,本发明提供了一个足够大的相互作用文库,以便其成员中的至少一个会具有使其对于一些分子、蛋白或者其他因子具有亲和性的结构。
内切葡聚糖酶木聚糖酶是多结构域的酶,可选择地,其由信号肽、糖类结合模块(module)、葡聚糖酶催化结构域、连接子(linker)和/或另一个催化结构域组成。
本发明提供了产生可以编码生物学活性杂合多肽(例如,杂合葡聚糖酶、甘露聚糖酶或木聚糖酶)的嵌合多聚核苷酸的方法。在一个方面,原始的多核苷酸编码生物学活性的多肽。本发明的方法通过利用细胞内过程产生了新的杂合多肽,所述的细胞内过程可整合原始的多核苷酸序列,这样得到的杂合多核苷酸编码证明具有源自原始生物学活性多肽的活性的多肽。例如,原始的多核苷酸可以编码来自不同微生物的特定酶。由来自一个生物体或变异体的第一多核苷酸编码的酶可以,例如,在特殊的环境条件下,例如,高盐,有效地发挥功能。来自不同生物体或变异体的第二多核苷酸编码的酶可在不同的环境条件下,如超高温,有效地发挥功能。含有来自第一和第二原始多核苷酸的序列的杂合多核苷酸编码的酶显示了原始多核苷酸编码的两种酶的特性。因此,杂合多核苷酸编码的酶可在第一和第二多核苷酸编码的酶所共有的环境条件下,例如高盐和极端温度下,有效地发挥功能。
由本发明的方法得到的杂合多肽可显示出在原始酶中不具有的特殊酶活性。例如,在编码水解酶活性的多核苷酸重组和/或进行还原性重配后,从得到的由杂合多核苷酸编码的杂合多肽中可筛选出由各个原始酶获得的特殊水解酶活性,即在水解酶作用的键类型和水解酶发挥作用的温度方面被特殊化。因此,例如,水解酶被筛选以确定那些可区分杂合水解酶和原始水解酶的化学功能性,如(a)酰胺(肽键),即内切葡聚糖酶;(b)酯键,即酯酶和脂酶;(c)乙缩醛;即糖苷酶,和例如杂合多肽发挥作用的温度、pH或盐浓度。
原始多聚核苷酸的来源可以是分离自个体生物体(“分离物”)、已经生长在成分确定的培养基中的生物体收集物(“富集培养物”),或者未经培养的生物体(“来自环境的样品”)。应用不依赖于培养物的方法从来自环境的样品获得编码新的生物活性的多聚核苷酸是最优选的,因为这样便可接触到具有生物多样性的原始来源。
“环境文库(Environmental libraries)”可以从环境样品中获得,其可以代表天然发生的生物体的基因组集合,这些“环境文库”可以用克隆载体完成,所述克隆载体可以在适合的原核宿主中扩增繁殖。因为被克隆的DNA起初是直接从环境样品中提取的,所以所述文库并不限于可以在纯培养物中生长的小部分原核生物。另外,存在于这些样品中的来自环境的DNA的标准化使其可以更加公正地代表存在于原始样品的物种的DNA。这可以大大增加从所述样品的次要组成中发现令人感兴趣的基因的效率,所述次要组成与优势种相比,其所占的量可能小几个数量级。
例如,从一个或者多个未经培养的微生物中获得的基因文库被筛选以发现感兴趣的活性。编码感兴趣的生物活性分子的潜在途径首先在原核细胞中以基因表达文库的形式捕获。编码令人感兴趣的活性的多聚核苷酸从这样的文库中分离出来并导入到宿主细胞中。该宿主细胞在促进重组和/或还原性重配的条件下生长,产生潜在的具有新的或者增强的活性的生物分子。
另外,可进行亚克隆以进一步分离感兴趣的序列。在亚克隆中,DNA的一部分被扩增、消化——通常是通过限制性酶——以剪切所需的序列,所需的序列被连接进接受载体中,并被扩增。在亚克隆的每个步骤中,该部分被检测感兴趣的活性,以保证编码结构蛋白的DNA不被排除。插入物可在亚克隆的任何步骤中被纯化,例如在连接入载体之前通过凝胶电泳,或在含有接受载体的细胞和不含有接受载体的细胞被置于选择性培养基中时,所述培养基含有例如一种抗生素,其可杀死不含有接受载体的细胞。将cDNA插入物亚克隆进载体中的具体方法在本领域中是为人所熟知的(Sambrook等人,Molecular Cloning:A Laboratory Mannual,第二版,ColdSpring Harbor Laboratory Press(1989))。在另一个方面,本发明的酶是亚克隆。这种亚克隆与亲代克隆的差别在于,例如,长度、突变、标志物(tag)或标记(label)。
在一个方面,本发明的信号序列在鉴定出新的葡聚糖酶、甘露聚糖酶或木聚糖酶多肽之后被鉴定出来。蛋白被分选和转运至其正确的细胞位置的通路通常被称为蛋白靶向通路。在所有这些靶向系统中最重要的元件之一是新合成的多肽的氨基末端上的短的氨基酸序列,称为信号序列。这种信号序列可指引蛋白至其在细胞中的适合位置,并在转运过程中或在蛋白到达其最终目的地时被去除。大多数的溶酶体蛋白、膜蛋白或分泌蛋白都具有氨基末端信号序列,这些信号序列标示着它们将转位至内质网腔内。在本组中有超过100个蛋白信号序列被确定。信号序列的长度可以从13至36个氨基酸残基。识别信号序列的各种方法对于本领域技术人员是已知的。在一个方面,肽可通过称为SignalP的方法来鉴定。SignalP应用了既可识别信号肽,又可识别其裂解位点的组合神经网络。参见例如Nielsen等人,“Indentification of prokaryotic and eukaryotic signal peptides andprediction of their cleavage sites”Protein Engineering,卷10,1,1-6页(1997)。应该理解的是,本发明的一些葡聚糖酶、甘露聚糖酶或木聚糖酶可以含有或不含有信号序列。可以期望的是,提供了编码来自一种葡聚糖酶、甘露聚糖酶或木聚糖酶的信号序列的核酸序列,其有效连接于一种不同的葡聚糖酶、甘露聚糖酶或木聚糖酶的核酸序列,或者,可选择地,来自非葡聚糖酶、甘露聚糖酶或木聚糖酶的蛋白的信号序列是被需要的。
可以制备所述多聚核苷酸的微生物包括原核微生物如真细菌和古细菌,低等真核微生物如真菌、一些藻和原生动物。多聚核苷酸可以是分离自环境样品,在这种情况下,核酸被回收而不需培养某一种生物体,或者是从一种或者多种培养的生物中回收。在一方面,这样的微生物可以是适于极端环境的,如,嗜高温的、嗜冷的、冷育的、嗜盐的、嗜压的和嗜酸的。编码从极端微生物中分离出来的酶的多聚核苷酸可以被应用。这样的酶可以在地表温泉和深海的热火山口超过100℃的温度有作用,在北极水域低于0℃的温度有作用,在死海的饱和的盐环境下有作用,在pH值在0附近的煤层沉积物和地热富硫矿泉中起作用,或者在pH值超过11的污水污泥中有作用。例如,来自极端条件下的生物体的几种被克隆和被表达的酯酶和脂酶在很宽的温度和pH范围内表现出高活性。
如上所述的选择和分离的多核苷酸被导入进合适的宿主细胞中。合适的宿主细胞是能够促进重组和/或还原性重配的任何细胞。被选择的多核苷酸在一个方面已经在包括有合适的控制序列的载体中。宿主细胞可以高等的真核细胞,如哺乳动物细胞,或低等真核细胞,如酵母细胞,或在一个方面,宿主细胞是原核细胞,如细菌细胞。将构建物导入宿主细胞可通过磷酸钙转染、DEAE-葡聚糖介导的转染,或电穿孔(Davis等人,1986)来实现。
对于典型的适当的宿主,可能被提及的是:细菌细胞,如大肠杆菌、链霉菌、鼠伤寒沙门氏菌;真菌细胞,如酵母;昆虫细胞如果蝇S2和草地夜蛾Sf9;动物细胞如CHO、COS或者黑色素瘤细胞;腺病毒,和植物细胞。选择适合的宿主被认为是在本领域技术人员已知的范围内。
特别提及可以用于表达重组蛋白的各种哺乳动物细胞培养系统,哺乳动物表达系统的例子包括猴肾纤维原细胞的COS-7细胞系,其在“SV40-transformed simian cellssupport the replication of early SV40mutants”(Gluzman,1981)中有说明,和其它的可以表达相容性载体的细胞系,例如,C127、3T3、CHO、HeLa和BHK细胞系。哺乳动物表达载体将包括复制起点、合适的启动子和增强子,以及任何必要的核糖体结合位点、多聚腺苷酸化的位点、剪接供体和受体位点、转录终止序列,以及5’旁侧的非转录序列。源于SV40剪接的DNA序列和多聚腺苷酸化的位点可以用于提供所需的非转录的遗传学元件。
另一方面,本发明的方法可以用于产生编码来自一个或者多个操纵子或者基因簇或者其中的部分的生物化学途径的新的多聚核苷酸。例如,细菌和很多真核生物具有用于调控基因的协作机制,所述基因的产物涉及相关的过程。基因成簇排列在单一染色体上,在结构上称“基因簇”,它们在单个调控序列的控制下一起转录,所述调控序列包括起始整个簇的转录的单个启动子。因此,基因簇是指一组或者相同或者相关的相邻基因,一般是指功能上相关的邻近的基因。通过基因簇编码的生物化学途径的一个例子是聚酮化合物(polyketides)。
基因簇DNA可以从不同的生物体中分离出来并且连接到载体中,尤其是含有表达调控序列的载体,所述表达控制序列可以控制和调控可检测蛋白或者来自连接在一起的基因簇的蛋白相关系列活性的产生。对于外源DNA具有非常大的容量的载体特别适合用于这样的基因簇的情况,在这里通过括大肠杆菌的f-因子(或者致育因子)的例子加以说明。大肠杆菌的f-因子是一种质粒,在接合过程中它能实现自身的高频率转移,f-因子对于获得和稳定扩增大DNA片段,如来自混合的微生物样品的基因簇是理想的。一个方面是使用被称作“fos-质粒”的克隆载体,或者细菌人工染色体(BAC)载体。它们是源于大肠杆菌f因子,可以稳定地整合大的基因组DNA片段。当整合来自混合的未经过培养的环境样品的DNA时,这就有可能得到以稳定的“环境DNA文库”形式存在的大的基因组片段。用于本发明的另一类型的载体是粘粒载体。粘粒载体最初是设计用来克隆和扩增基因组DNA的大片段。应用粘粒载体的克隆在Sambrook等,Molecular Cloning:A LaboratoryMannual,第二版,ColdSpring Harbor Laboratory Press(1989)中有详细说明。一旦连接到适当的载体,含有不同的聚酮化合物合成酶基因簇的两个或者多个载体可以引入到适合的宿主细胞中。这些基因簇所共有的具有部分序列同源性的区域将促进导致序列重新组织为杂合基因簇的过程。然后可以对新的杂合基因簇进行筛选,以寻找在起初的基因簇没有发现的活性。
因此,一方面,本发明涉及用于产生具有生物活性的杂合多肽以及筛选具有更高活性的多肽的方法,通过:
1)以有效连接的方式导入至少第一多聚核苷酸和导入至少第二多聚核苷酸到合适的宿主细胞,所述的至少第一多聚核苷酸和第二多聚核苷酸共有具有部分的序列同源性的至少一个区域。
2)在促进序列重新组织的条件下培养宿主细胞,得到有效连接的杂合多聚核苷酸。
3)表达由所述杂合多聚核苷酸编码的杂合多肽。
4)在有利于鉴定增强的生物活性的条件下筛选所述的杂合多肽;和
5)分离编码该杂合多肽的多聚核苷酸。
用于筛选各种酶活性的方法对于本领域技术人员是已知的,关于它的讨论贯穿于本说明书。当要分离本发明的多聚核苷酸和多肽时,可以应用这些方法。
筛选的方法学和“在线”监测设备
在实施本发明的方法时,可以应用与本发明的多肽和核酸结合的各种仪器和方法学,从而例如筛选具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的多肽(例如,分析例如酶谱中酪蛋白的水解、从明胶中荧光的释放,或从各种小分子肽底物中释放p-nitroanalide)、筛选可作为葡聚糖酶、甘露聚糖酶或木聚糖酶活性的潜在调节物的化合物,例如激活物或抑制物、筛选可与本发明的多肽结合的抗体、可与本发明的核酸杂交的核酸、筛选表达本发明多肽的细胞等。除了下面详细描述的用于筛选样品的阵列形式以外,也可使用别的形式来实施本发明的方法。这样的形式包括,例如质谱仪、色谱仪,例如,高通量HPLC和其它形式的液相色谱,和更小的形式,如1536-孔板、384-孔板等等。高通量筛选仪器可被改装并用来实施本发明的方法,见,例如美国专利申请20020001809。
毛细管阵列
本发明的核酸或多肽可被固定或应用于阵列上。阵列可用来筛选或监测组合物(例如,小分子、抗体、核酸等)的文库,以发现它们结合本发明的核酸或多肽或者调节本发明的核酸或多肽的活性的能力。毛细管阵列,如GIGAMATRIXTM,戴弗萨公司,San Diego,CA;和描述在例如美国专利申请20020080350Al;WO0231203A;WO0244336A中的阵列,提供了容纳和筛选样品的可供选择的装置。在一个方面,毛细管阵列包括多个毛细管,它们形成具有相互邻接的毛细管的阵列,其中所述的每个毛细管含有至少一个壁,其限定了一个用以保留样品的内腔。这个内腔可以是圆柱形的、正方形的、六边形的或其它任何几何形状,只要其壁能够形成内腔以保留液体或样品。毛细管阵列的毛细管可相互靠近联合在一起形成一个面状的构造。毛细管可通过融合(例如,当毛细管由玻璃制成时)、粘合、键合或面对面的夹合而结合在一起。可选择地,毛细管阵列可以包括在阵列中相邻毛细管之间放置的间质材料(interstitial material),从而形成含有多个穿通孔(through-holes)的固体平面装置。
毛细管阵列可由任何数量的毛细管形成,例如,100至4,000,000个毛细管。进一步,具有大约100,000或更多个毛细管的毛细管阵列可形成标准大小和形状的板,其适合于标准的实验室设备。通过毛细作用或使用细针的微注射,人工或自动地将腔充满。随后可以从毛细管中移出感兴趣的样品以进行进一步的分析或定性。例如,安置细针样的探头被安置,使其与选择的毛细管能够液体连通,从而可以向腔内加入材料或移走材料。
在单区筛选分析(single-pot screening assay)中,分析组分在插入到毛细管阵列中之前被混合在一起,产生目的溶液。当至少一部分阵列被浸入目标溶液中时,通过毛细作用充满内腔。在每个毛细管中的化学或生物学反应和/或活性被监测,以发现可检测事件。所述的可检测事件常常被称为“命中事件(hit)”,其常常可以通过光学检测与产生“非命中事件(non-hit)”的毛细管区分开来。因此,毛细管阵列可整体地并行检测“命中事件”。
在多区筛选分析(multi-pot screening assay)中,多肽或核酸,例如,配体可被导入进第一组分中,该组分被导入进毛细管阵列的至少一部分毛细管中。然后将气泡导入进第一组分后面的毛细管中。然后将第二组分导入进毛细管内,其中所述的第二组分与第一组分通过气泡相隔。通过在毛细管阵列的两侧施加静水压挤破气泡将第一和第二组分混合在一起。然后监测毛细管阵列中由两个组分的反应或非反应而发生的可检测事件。
在结合筛选分析(binding screening assay)中,目标样品可作为用可检测颗粒标记的第一液体导入进毛细管阵列的毛细管中,其中为了使可检测颗粒与内腔结合,毛细管的内腔包被了一种结合材料。然后第一种液体可从毛细管中移去,其中结合的可检测颗粒仍保留在毛细管内,可以将第二液体导入进毛细管内。然后监测毛细管中由颗粒与第二液体的反应或非反应而发生的可检测事件。
阵列,或“生物芯片”
本发明的核酸或者多肽可以固定于或者应用于阵列。可以应用阵列来筛选或者监测化合物(例如,小分子、抗体、核酸等等)的文库,所述筛选或者监测是针对它们结合或者调控本发明的核酸或者多肽的活性的能力。例如,在本发明的一方面,一个被监测的参数是葡聚糖酶、甘露聚糖酶或木聚糖酶基因的转录表达。细胞的一种或者多种或者所有的转录物可以通过阵列或者“生物芯片”上的固定化核酸与包含细胞转录物的样品,或者与代表细胞转录物或和细胞转录物互补的核酸的杂交来测定。通过应用在微型芯片上的核酸“阵列”,细胞的一些或者所有转录物可以同时被定量。可选择地,包含基因组核酸的阵列也可以用于确定通过本发明的方法制造的新型的工程菌株的基因型。“多肽阵列”也可以用于同时定量多种蛋白。本发明可以用任何已知的“阵列”进行实践,所述“阵列”也被指作“微阵列”或者“核酸阵列”或者“多肽阵列”或者“抗体阵列”或者“生物芯片”,或者它们的变体。阵列一般是多个“点”或者“靶元素”,每一个靶元素包括确定数量的一种或者多种生物分子,例如,固定于基底表面的确定区域、用于特异结合一种样品分子如mRNA转录物的寡核苷酸。
在实践本发明的方法时,任何已知的阵列和/或制备和应用阵列的方法都可以被全部或者部分地整入,或者也引入它们的变化,例如在下列文献中说明的:美国专利6,277,628;6,277,489;6,261,776;6,258,606;6,054,270;6,048,695;6,045,996;6,022,963;6,013,440;5,965,452;5,959,098;5,856,174;5,830,645;5,770,456;5,632,957;5,556,752;5,143,854;5,807,522;5,800,992;5,744,305;5,700,637;5,556,752;5,434,049;还例如,WO99/51773;WO99/09217;WO97/46313;WO96/17958;还例如,Johnston(1998)Curr.Biol.8:R171-R174;Schummer(1997)Biotechinques23:1087-1092;Kern(1997)Biotechniques23:120-124;Solinas-Toldo(1997)Genes,Chromosomes&Cancer20:399-407;Bowtell(1999)Nature Genetics Supp.21:25-32。也参见出版的美国专利申请20010018642;20010019827;20010016322;20010014449;20010014448;
抗体和基于抗体的筛选方法
本发明提供了可与本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶特异结合的分离出的或重组的抗体。这些抗体可用来分离、鉴定或定量本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶或相关的多肽。这些抗体可用来分离在本发明范围内的其它多肽或其它相关的葡聚糖酶、甘露聚糖酶或木聚糖酶。抗体经设计可以结合葡聚糖酶、甘露聚糖酶或木聚糖酶的活性位点。因此,本发明提供了使用本发明的抗体来抑制葡聚糖酶、甘露聚糖酶或木聚糖酶的方法(见上面关于本发明的抗葡聚糖酶、甘露聚糖酶或木聚糖酶组合物的应用的讨论)。
本发明提供了本发明的酶的片段,包括本发明的多肽的免疫原性片段。本发明提供了含有本发明的多肽或肽和佐剂或载体以及类似物的组合物。
所述抗体可以在免疫沉淀、染色、免疫亲合柱以及类似的程序中被应用。如果需要的话,编码特异抗原的核酸序列可以通过免疫方法获得,随后分离出多肽或者核酸,进行扩增或者克隆,将多肽固定在本发明的阵列上。可供选择的,本发明的方法可以用于修饰由细胞产生的待修饰的抗体的结构,如,抗体的亲和性可以增加或者降低。而且,制备或者修饰抗体的能力可以是通过本发明的方法设计细胞表型。
免疫、产生或者分离抗体(多克隆的或者单克隆的)的方法是本领域技术人员所了解的,并且在科学和专利文献中有描述,参见,如,Coligan,CURRENT PROTOCOLS INIMMUNOLOGY,Wiley/Greene,NY(199l);Stites(eds.)BASIC AND CLINICAL IMMUNOLOGY(第7版)Lange Medical Publications,Los Altos,CA(“Stites”);Goding,MONOCLONALANTIBODIES:PRINCIPLES AND PRACTICE(第2版)Academic Press,New York,NY(1986);Kohler(1975)Nature256:495;Harlow(1988)ANTIBODIES,A LABORATORY MANUAL,ColdSpring Harbor Publications,New York。除了使用动物的传统的体内方法外,抗体也可以在体外产生,例如,应用表达重组抗体结合位点的噬菌体展示文库。参见如,Hoogenboom(1997)Trends Biotechnol.15:62-70;Katz(1997)Annu.Rev.Biophys.Biomol.Struct.26:27-45。
本发明的多肽,或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段,也可用来产生与所述多肽或片段特异结合的抗体。得到的抗体可应用于免疫亲和层析程序,以分离或纯化多肽,或确定多肽是否存在于生物样品中。在这样的程序中,蛋白制备物,如提取物,或生物样品与能够同本发明的其中一种多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段特异结合的抗体接触。
在免疫亲和程序中,所述抗体附着于一种固体支持物上,如珠子或者其它的填充柱基质。在所述抗体可以特异地与本发明的其中一种多肽或其片段结合的条件下,将所述蛋白制备物与所述抗体接触。当通过清洗去除非特异结合的蛋白后,特异性结合的多肽被洗脱下来。
在生物样品中蛋白结合所述抗体的能力可以通过使用本领域技术人员所熟悉的各种方法来确定。例如,结合可以通过用例如荧光试剂、酶标记或者放射性同位素的可检测标记物来标记所述抗体来确定。可选择地,所述抗体与所述样品的结合可以通过应用具有这样的可检测标记的二抗来检测。特定的分析包括ELISA分析、夹心分析、放射免疫分析以及Western印迹。
产生的针对本发明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的多克隆抗体可通过直接将多肽注射进动物中或通过将多肽给予动物,例如非人动物而获得。这样获得的抗体然后可与多肽本身结合。以这种方式,甚至仅编码多肽的一个片段的序列也可用来产生可与整个天然多肽结合的抗体。这种抗体然后可用来从表达所述多肽的细胞中分离多肽。
为了制备单克隆抗体,可使用可通过连续细胞系培养来产生抗体的任何技术。实例包括杂交瘤技术(Kohler和Milstein,Nature,256:495-497,1975)、trioma技术、人B-细胞杂交瘤技术(Kozbor等人,Immunology Today4:72,1983)和EBV-杂交瘤技术(Cole等人,1985,in Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,Inc.,pp.77-96)。
用于产生单链抗体的技术(美国专利4,946,778)可被改动,以使之适于产生本发明的多肽,或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的单链抗体。可选择地是,转基因小鼠可用来表达这些多肽或其片段的人源化抗体。
产生的针对本发明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的抗体可用于筛选来自其它生物体和样品的类似多肽。在这些技术中,来自生物体的多肽与抗体接触,检测可与抗体特异结合的多肽。上述的任何程序可用来检测抗体的结合。一种这样的筛选分析描述在“Methodsfor Measuring CellulaseActivities”,Methods in Enzymology,Vol160,87-116页中。
试剂盒
本发明提供了试剂盒,其包括组合物,例如本发明的核酸、表达序列盒、载体、细胞、转基因种子或者植物或者植物的一部分、多肽(如内切葡聚糖酶、甘露聚糖酶或木聚糖酶)和/或者抗体。所述试剂盒也可以包括如在此所述的用于教导本发明的方法学以及工业应用的指导性材料。
全细胞工程和测定代谢参数
本发明的方法提供了细胞的全细胞进化或全细胞工程,其通过修饰细胞的遗传组成开发出具有新的表现型,例如,新的或修饰的葡聚糖酶、甘露聚糖酶或木聚糖酶活性的新细胞株。通过向细胞中加入本发明的核酸,例如本发明的酶的编码序列而修饰遗传组成。见,例如,WO0229032;WO0196551。
为了探测新的表型,在“实时”或者“在线”的时间期间监测被修饰的细胞的至少一种代谢参数。一发面,多个细胞,如培养细胞物被“实时”或者“在线”监测。一方面,“实时”或者“在线”监测多个代谢参数。代谢参数可以应用本发明的木聚糖酶进行监测。
代谢流分析(MFA)是以已知的生物化学框架为基础。以质量守恒定律和细胞内代谢的假稳态假说(PSSH)为基础,构建线性独立代谢矩阵。在实践本发明的方法时,建立代谢网络,包括:
●所有途径底物、产物和中间代谢物的特性,
●使途径代谢物互变的所有化学反应的特性,途径反应的化学计量学,
●催化反应的所有酶的特性,酶反应动力学,
●途径组分之间的调控性相互作用;如变构效应相互作用,酶-酶相互作用等,
●酶或者酶的任何其它超大分子组织在细胞内的区室化,以及,
●任何浓度梯度的代谢物、酶或者效应分子的存在,或者它们运动的扩散障碍。
一旦针对给定的细胞株建立了代谢网络,如果在线代谢数据可用,那么可以通过矩阵概念引入数学表达来评估细胞内的代谢流。代谢表型依赖于细胞内整个代谢网络的变化。代谢表型依赖于途径利用对环境条件、遗传调控、发育状态和基因型等等作出的变化。在本发明方法的一个方面,当计算了在线MFA之后,通过研究所述的途径利用来分析细胞的动力学行为、它们的表型和其它性质。例如,在酵母发酵中,如果葡萄糖供应增加,氧气减少,呼吸途径的利用将会降低和/或者停止,而发酵途径的利用将占优势。在所述的途径分析之后,细胞培养物的生理状态的控制将成为可能。通过确定如何改变底物供给、温度、诱导物的使用等来控制细胞的生理状态朝着所需的方向进行,本发明的方法可以有助于确定如何操纵发酵。在实践本发明的方法时,MFA的结果也可以与转录物组(transcriptome)和蛋白质组(proteome)的数据比较,设计实验和方案用于代谢工程或者基因重排等等。
在实践本发明的方法时,可以产生和检测到任何经修饰改变的或者新的表型,包括在细胞中新的或者改进的特征。可以监测代谢或者生长的任何方面。
监测mRNA转录物的表达
在本发明的一方面,工程化的表型包括增加或者降低mRNA转录物(如,葡聚糖酶、甘露聚糖酶或木聚糖酶信息)的表达或者在细胞中产生新的(如,葡聚糖酶、甘露聚糖酶或木聚糖酶)转录物。这一增加或者减少的表达可以通过测定本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的存在或者通过葡聚糖酶、甘露聚糖酶或木聚糖酶活性分析来跟踪。mRNA转录物或者信息也可以通过本领域已知的任何方法来检测或者定量,包括,例如,Northern印迹、定量扩增反应、阵列杂交以及类似的方法。定量扩增反应包括,如,定量PCR,包括,如,定量反转录聚合酶链式反应,或者RT-PCR;定量实时RT-PCR,或者“实时动力学RT-PCR”(参见,如,Kreuzer(2001)Br.J.Haematol.114:313-318;Xia(2001)Transplantation72:907-914)。
在本发明的一方面,工程化的表型是通过敲除同源基因的表达产生。可以敲除所述基因的编码序列或者一个或多个转录控制元件,如启动子或者增强子。这样,转录物的表达可以完全去除或者降低。
在本发明的一方面,所述工程化的表型包括增加同源基因的表达。这可以通过敲除负调控元件或者诱变正调控元件而实现,负调控元件包括以顺式或者反式起作用的转录调控元件。细胞的一种或者多种或者所有的转录物可以通过阵列上的固定化核酸与包含细胞转录物的样品,或者与代表细胞转录物或和细胞转录物互补的核酸的杂交来测定。
监测多肽、肽和氨基酸的表达
在本发明的一方面,工程化的表型包括增加或者降低多肽(如葡聚糖酶、甘露聚糖酶或木聚糖酶)的表达或者在细胞内产生新的多肽。这一增加或者减少的表达可以通过确定存在的葡聚糖酶、甘露聚糖酶或木聚糖酶的量或者通过葡聚糖酶、甘露聚糖酶或木聚糖酶活性分析来跟踪。也可以通过本领域任何已知的方法来检测并定量多肽、肽和氨基酸,所述方法包括,如,核磁共振(NMR)、分光光度测定法、射线照像术(蛋白放射性标记)、电泳、毛细管电泳、高效液相色谱(HPLC)、薄层色谱(TLC)、超扩散色谱,各种免疫学方法,如,免疫沉淀、免疫扩散、免疫电泳、放射性免疫分析(RIAs)、酶联免疫吸附分析(ELISAs)、免疫荧光分析,凝胶电泳(如,SDS-PAGE)、用抗体染色、荧光激活的细胞分选器(FACS)、热分解质谱、傅立叶转换红外光谱测定、拉曼光谱、GC-MS和LC-电喷以及cap-LC-串联-电喷质谱,已经类似的方法。应用这些方法或者它们的变体也可以筛选新的生物活性,在美国专利6,057,103中有说明。而且,正如以下详细讨论的,可以应用蛋白阵列测定细胞的一个或者多个或者所有的多肽。
工业应用
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶是高度选择性的催化剂。它们可催化具有强烈的立体选择性、区域选择性和化学选择性的反应,是常规合成化学无法比拟的。而且,酶是非常通用的。本发明的酶可适于在有机溶剂中发挥功能,可在极端pH(例如,高pH和低pH)和极端温度(例如,高温和低温)、极端的盐度水平(例如,高盐度和低盐度)下工作,并可催化同与其天然的生理底物结构不相关的化合物的反应。
去垢剂组合物
本发明提供了含有本发明的一种或多种多肽(例如,葡聚糖酶、甘露聚糖酶或木聚糖酶)的去垢剂组合物,以及制备和使用这些组合物的方法。本发明并入了制备和使用去垢剂组合物的所有方法,见,例如美国专利6,413,928;6,399,561;6,365,561;6,380,147。去垢剂组合物可以是一个部分和两个部分的含水组合物、不含水的液体组合物、铸型固体、颗粒形式、微粒形式、压缩片剂、凝胶和/或糊剂和浆液的形式。本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶也可用作固体或液体形式的去垢剂添加剂产品。这样的添加剂产品可以考虑用来补充或促进常规的去垢剂组合物的性能,它们可在洗涤过程的任何阶段被加入。
实际的活性酶含量依赖于制造去垢剂组合物的方法,这不是很严格的,只要去垢剂溶液具有所需的酶活性。在一个方面,存在于最终溶液中的葡聚糖酶、甘露聚糖酶或木聚糖酶的量的范围为每克去垢剂组合物大约0.001mg至0.5mg。选择用于本发明的过程和产品中的特定酶依赖于最终应用的条件,包括产品的物理形式、应用时的pH、应用时的温度和要被降解和改变的土壤类型。对于指定的任何一组应用条件,可以选择酶以提供最佳的活性和稳定性。在一个方面,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶在大约4至大约12的pH范围内,大约20℃至大约95℃的温度范围内是有活性的。本发明的去垢剂可以包括阳离子表面活性剂、半极性的非离子表面活性剂或两性离子表面活性剂或其混合物。
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可被制成粉末状和液体的去垢剂,具有的pH在4.0和12.0之间,重量为大约0.01%至大约5%(在一个方面为0.1%至0.5%)的水平。这些去垢剂组合物也包括其它的酶如其他葡聚糖酶、甘露聚糖酶或木聚糖酶、或纤维素酶、内切糖苷酶、内-β-l,4-葡聚糖酶、β-葡聚糖酶、内-β-l,3(4)-葡聚糖酶、过氧化氢酶、角质酶、过氧化物酶、漆酶、脂酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖葡聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、蛋白酶、果胶裂解酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。这些去垢剂组合物也包括洗涤增洁剂和稳定剂。
向传统的洗涤组合物中添加本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶不会造成任何特殊的应用限制。换句话说,适合去垢剂的任何温度和pH也适用于本发明的组合物,只要酶在打算使用的pH和/温度下有活性,或是可耐受的。另外,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可用于不需要去垢剂的洗涤剂中,单独应用或与增洁剂和稳定剂联合应用。
本发明提供了洗涤组合物,包括清洁硬表面的去垢剂组合物、清洁织物的去垢剂组合物、用于洗碗的组合物、口腔清洁组合物、假牙清洁组合物和隐形眼镜清洁溶液。
在一个方面,本发明提供了清洗物体的方法,包括将物体与本发明的多肽在可充分洗涤的条件下接触。本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶酶可以作为去垢剂添加剂而被加入。本发明的去垢剂组合物,例如可被配制为含有本发明多肽的手工或机器洗衣的去垢剂组合物。用于预处理染织物的洗衣添加剂可含有本发明的多肽。织物柔软剂组合物可含有本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶酶。可选择的是,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶酶可被制成去垢剂组合物,用于通常的家庭硬表面清洗工作中。在可选择的方面,本发明的去垢剂添加剂和去垢剂组合物包含一种或多种其它的酶,例如其他葡聚糖酶、甘露聚糖酶或木聚糖酶、或木聚糖酶、脂酶、角质酶、糖酶、纤维素酶、果胶酶、阿拉伯糖酶、半乳聚糖酶、氧化酶,例如,乳糖酶和/或过氧化物酶(也见上)。所选择的本发明的酶的特性可与所选择的去垢剂相容(即,最佳pH,与其它的酶或非酶成分相容,等),酶是以有效量存在。在一个方面,本发明的酶用来从织物中去掉有恶臭的材料。在实施本发明过程中可使用的各种去垢剂组合物和制备它们的方法描述在,例如美国专利6,387、690;6,333,301;6,329,333;6,326,341;6,297,038;6,309,871;6,204,232;6,197,070;5,856,164。
当制成适合用于洗衣机器洗涤方法的组合物时,本发明的木聚糖酶可包括表面活性剂和增白剂化合物。另外,它们可以包括一种或多种去垢剂组分,例如有机聚合的化合物、漂白剂、其它的酶、抑泡剂、分散剂、石灰肥皂分散剂、土壤悬液和防再污染剂和腐蚀抑制剂。本发明的洗衣组合物也可以含有柔软剂作为额外的去垢剂组分。这样的含有糖酶的组合物当制成洗衣去垢剂组合物时,可提供织物的洗涤、染剂的去除、洁白度的保持、软化、着色、染料转移的抑制和卫生处理。
本发明的洗衣去垢剂组合物的密度范围可以为大约200至1500克/升,或大约400至1200克/升,或大约500至950克/升,或600至800克/升组合物;这是在大约20℃时测定的。
本发明的洗衣去垢剂组合物的“紧密(compact)”形式最好由密度来反映,就组合物而言,可以通过无机填料盐类的量来反映。无机填料盐是粉末形式的去垢剂组合物的常规成分。在常规的去垢剂组合物中,填料盐类存在的基本量一般为总组合物重量的17%至35%。在所述紧密组合物的一个方面,填料盐类存在的量不超过总组合物重量的15%,或不超过10%,或不超过5%。无机填料盐类选自硫酸盐和氯化物的碱和碱土金属盐类,例如,硫酸钠。
本发明的液体去垢剂组合物也可以是“浓缩的形式”。在一个方面,与常规的液体去垢剂相比,所述的液体去垢剂组合物含有较低量的水分。在可选择的方面,浓缩液体去垢剂的水含量小于去垢剂组合物重量的40%,或小于30%,或小于20%。本发明的去垢剂化合物可以构成在WO97/01629中所述的剂型。
本发明的酶可用于配制多种洗涤组合物。多种已知的化合物是合适的表面活性剂包括非离子的,阴离子,阳离子,或可使用两性离子去垢剂,如在美国专利4,404,128;4,261,868;5,204,015中所公开的。另外,葡聚糖酶、甘露聚糖或木聚糖酶酶可用于,例如条皂或液体肥皂的应用、碗碟清洗剂型、隐形眼镜清洗溶液或产品、肽水解、废物处理、纺织品应用、在蛋白生产中作为融合-裂解酶,以及类似的应用。与别的去垢剂葡聚糖酶相比,葡聚糖酶、甘露聚糖酶或木聚糖酶在去垢剂组合物提供了增强的性能,即,酶基团可以提高对某些酶敏感的污物的清洗,如对草或血的清洗,这可以在进行标准的洗涤循环后用通常的评价方法来测定。本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶酶可被配制到已知的粉末状和液体去垢剂中,pH在6.5和12.0之间,重量水平在大约0.01至大约5%(例如,大约0.1%至0.5%)。这些去垢剂洗涤组合物也可以包括其它的酶,如已知的葡聚糖酶、甘露聚糖酶、木聚糖酶、淀粉酶、纤维素酶、脂酶或糖苷内切酶,以及增洁剂和稳定剂。
在一个方面,本发明提供了具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性(本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶)的去垢剂组合物,其可用于水果、蔬菜和/或泥浆和粘土化合物(见,例如,美国专利5,786,316)。
处理纤维和纺织品
本发明提供了使用本发明的一种或多种葡聚糖酶、甘露聚糖酶或木聚糖酶处理纤维和织物的方法。本发明的酶可用于本领域中熟知的任何纤维或织物处理方法中,见,例如,美国专利6,387,690;6,261,828;6,077,316;6,024,766;6,021,536;6,017,751;5,980,581;美国专利申请20020142438Al。例如,本发明的酶可用于纤维和/或织物的退浆工艺中。在一个方面,织物的质地和外观通过将织物与本发明的酶在溶液中接触的方法而被改善。在一个方面,织物用溶液在一定压力下处理。例如,本发明的酶可用于去除染料。
在一个方面,本发明的酶在编织织物期间或编织织物之后使用,或在退浆阶段使用,或在一个或多个额外的织品加工步骤期间应用。在编织织物期间,使线经受相当大的机械应力。在机械织布机上进行编织之前,弯曲的线常常涂敷浆料淀粉(sizing starch)或淀粉衍生物,以便增加它们的拉伸强度和防止断裂。纺织完织物之后,织品可以继续进行退浆阶段。这之后,可以进行一个或多个额外的织品加工步骤。退浆是的作用是将“浆料(size)”从织物去除。编织完之后,在进一步加工织物之前必须除去浆料涂层,以确保获得均一和耐洗(wash-proof)的结果。
本发明的酶可用来处理任何纤维素材料,包括纤维(例如,棉、大麻、亚麻或亚麻布纤维),缝制的和未缝制的织物,例如,由棉、混棉或天然纤维素或人造纤维素(例如,来自含葡聚糖的纤维素纤维,如来自木浆)或其混合物制成的编织物、针织物、粗斜纹布、纱线和毛巾料。混合物的实例是棉或人造丝/粘胶与一种或多种伴随材料如羊毛、合成纤维(例如,聚酰胺纤维、丙烯酸纤维、聚酯纤维、聚乙烯醇纤维、聚氯乙烯纤维、聚偏二氯乙烯纤维、聚氨酯纤维、聚脲纤维、芳香族聚酰胺纤维)和含纤维素的纤维(例如,人造丝/粘胶、苎麻、大麻、亚麻/亚麻布、黄麻、乙酸纤维素纤维、莱赛尔(lyocell))的混合物。
本发明的酶可用来处理织品或任何含有葡聚糖、甘露聚糖、木聚糖或纤维素的物质,包括含有棉的织品,如洗涤剂添加剂,例如在含水组合物中。对于制造衣服,织品可进行切割和缝制成衣服或服装。这些可以在处理之前或处理之后进行。特别地,对于制造牛仔裤,已经开发出不同的酶修整方法(enzymatic finishing method)。斜纹粗棉布服装的修整工作以酶退浆步骤为开始,在这个步骤期间服装受到淀粉分解酶的作用,以赋予织品柔性,并使得棉更容易接受随后的酶修整步骤。本发明提供了处理织物的方法,例如通过使用酶诸如本发明的甘露聚糖酶、木聚糖酶或葡聚糖酶(例如内切葡聚糖酶)的任何组合对斜纹粗棉布进行修整,酶法退浆,和赋予织品柔性。在一个方面,本发明的酶可以用于处理以防止织物颜色变灰。
在一个方面,本发明的碱性和/或热稳定性甘露聚糖酶、木聚糖酶和葡聚糖酶(例如内切葡聚糖酶)在单浴退浆(single bath desizing)和生物擦洗(bioscouring)中混合。将退浆和擦洗合并在一个步骤中的优点之中是节省成本,并降低对环境的影响,这是因为节省了能量和水的使用和降低废物产生量的缘故。退浆和擦洗的应用条件可以在约pH8.5至pH10.0之间,温度在约40℃和40℃以上。低酶剂量(例如每吨棉5g)和短的反应时间(例如约15分钟)可以用于获得高效的退浆和擦洗效率,无需加入钙。
本发明的酶可以用于处理含纤维素的织品以减少粗糙性,使色泽鲜明,或使此种织物的色泽局部发生变化。参见,例如美国专利6,423,524。例如,本发明的酶可以用于减少含棉织物的粗糙性,诸如用作粗糙性减少洗涤剂添加剂。本发明的酶可以用于处理织物,以给予彩色织物“石洗的(stonewashed)”外观,同时减少着色剂重新沉淀到织物上的数量。
本发明的纺织品处理过程(使用本发明的酶)可与其它纺织品处理相结合,例如,刷洗和漂白。刷洗是从棉纤维中去掉非纤维素的材料,例如角质层(主要由蜡组成)和原初的细胞壁(主要由胶质、蛋白质和木糖葡萄糖组成)。适当的蜡去除对获得高的可湿性是必须的。这是染色所必需的。通过本发明的过程去除主要的细胞壁可改善蜡的去除,保证更均匀的染色。用本发明的过程处理纺织品可改善漂白过程中的洁白度。用于刷洗中的主要化学物质是高浓度和高温下的钠、氢氧化物。漂白包括氧化纺织品。漂白一般涉及使用过氧化氢作为氧化剂,以便获得完全漂白(白的)织物或保证染料的洁净色调。
本发明也提供了碱性葡聚糖酶(在碱性条件下有活性的内切葡聚糖酶)、甘露聚糖酶、或木聚糖酶。这些酶在织物加工、植物纤维(例如植物韧皮纤维)的脱胶、废物处理,胶质废水的处理、造纸、咖啡和茶发酵中具有很广泛的应用。参见,例如Hoondal(2002)AppliedMicrobiology and Biotechnology59:409-418。
本发明的纺织品处理工艺也可包括使用其他酶的任何组合,这些其他酶(包括碳水化合物降解酶)诸如过氧化氢酶、其他葡聚糖酶、纤维素酶、脂酶、内切糖苷酶、内-β-1,4-葡聚糖酶、β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、漆酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、其他甘露聚糖酶、木糖葡聚糖酶、其他木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白酶、聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。本发明的酶可以与其他碳水化合物降解酶例如纤维素酶、阿拉伯聚糖酶、木糖葡聚糖酶、果胶酶、木聚糖酶和类似酶一起联合使用,来制备纤维或用于清洗纤维。蛋白酶也可以与本发明的酶联合使用。这可以与洗涤剂联合使用。
处理食物和食物加工
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶在食品加工工业中具有大量的应用。例如,在一个方面,本发明的酶可用来改善从富油植物原料中油的提取,例如,富含油的种子,例如来自大豆的大豆油、来自橄榄的橄榄油、来自油菜籽的油菜籽油和/或来自向日葵籽的向日葵油。
本发明的酶可用来分离植物细胞材料中的成分。例如,本发明的酶可用于将富含葡聚糖的物质(例如,植物细胞)分离成各种成分。在一个方面,本发明的酶可用来将富含葡聚糖或富含油的作物分离成有价值的蛋白和油和外壳组分。可通过使用本领域中已知的方法执行分离过程。
本发明的酶可用于水果或蔬菜汁、果汁、提取物以及类似物的制备过程以增加产量。本发明的酶可用于各种植物细胞壁衍生物质或废料的酶处理(例如,水解含有葡聚糖的植物物质),所述的被处理物质例如来自谷类、谷粒、葡萄酒或果汁的生产,或农业残余物如蔬菜外壳、豆荚、制糖甜菜浆、橄榄浆、马铃薯浆以及类似物。本发明的酶可用来改变被加工的水果或蔬菜的粘稠度和外观。本发明的酶可用来处理植物物质以促进包括食物在内的植物物质的加工,促进植物成分的纯化或提取。本发明的酶可用来改善饲料的价值、降低结合水含量、提高污水的降解性和/或改善植物物质向窖藏品的转变以及类似的应用。本发明的酶也可以用于水果和酿造工业进行设备清洗和维护。
在一个方面,本发明的酶,例如葡聚糖酶、甘露聚糖酶或木聚糖酶可用于烘烤应用中,例如,曲奇和饼干,以水解葡聚糖和减少粘性。本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶也可以用于产生机器不难加工的不粘的面团,并减小饼干的大小。使用本发明的酶水解葡聚糖可用于防止烘烤制品的迅速再水化引起的松脆性丢失和储藏寿命的减小。在一个方面,本发明的酶可用作面团加工过程中的添加剂。在一个方面,本发明的酶可用于面团改良,其中在一个方面,本发明酶在大约25-35℃的温度范围内和接近中性pH(7.0-7.5)下具有很高的活性。在一个方面,面团改良酶可在极端温度的烘烤下(>500°F)被灭活。
本发明的食品处理工艺也可包括使用其他酶的任何组合,这些其他酶诸如过氧化氢酶、葡聚糖酶、纤维素酶、内切糖苷酶、内-β-1,4-葡聚糖酶、淀粉糖苷酶(amyloglucosidases)、葡萄糖异构酶、葡萄糖苷转移酶、脂酶、磷脂酶、脂氧化酶、β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、漆酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖葡聚糖酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白酶、肽酶、蛋白酶、聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶
纸或纸浆处理
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可用于纸或纸浆处理或纸脱墨中。例如,在一个方面,本发明提供了使用本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的纸处理过程。在一个方面,本发明的酶可应用在高碱和高温环境中,减少对化学漂白剂如二氧化氯的需求。在一个方面,本发明的酶是耐热的碱性葡聚糖酶,可减少牛皮纸纸浆的二氧化氯需求量超过25%,使纸浆产量的损失小于0.5%。在一个方面,临界的参数为pH10,65-85℃,处理时间少于60分钟,酶的加样量小于0.001wt%。可以检测一个内切葡聚糖酶库中水解染料标记的葡聚糖的能力,例如在pH10和60℃。在这些条件下检测为阳性的酶然后可以在例如pH10和70℃被评价。可选择地是,酶可在pH8和pH10在70℃被测试。在发现纸浆和造纸工业中所需的内切葡聚糖酶的过程中,以来自高温或高碱环境的文库作为目标。特别地,这些文库被筛选,以发现可在碱性pH和大约45℃的温度发挥作用的酶。在另一个方面,本发明的葡聚糖酶可用于纸浆和造纸工业中降解木质素半纤维素连接,以释放木质素。
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可用于纸或纸浆工业,如例如美国专利5,661,021;6,387,690;6,083,733;6,140,095和6,346,407中所述。例如如美国专利6,140,095所述,本发明的酶可以是耐碱性的葡聚糖酶。本发明的酶可用于纸或纸浆工业,其中酶在65℃至75℃的温度范围和约10的pH中具有活性。此外,可用于纸或纸浆工业的本发明的酶将减少对漂白剂诸如二氧化氯的需要量。本发明的酶可以在微酸pH(5.5-6.0)、在40℃至70℃温度范围内具有活性,95℃失活。在一个方面,本发明的酶在40-75℃之间,和pH5.5-6.0时具有最佳活性;在70℃保持稳定至少50分钟,在96-100℃失活。
此外,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以用于生物漂白和处理化学浆,如美国专利5,202,249所述;用于生物漂白和处理木浆或纸浆,如美国专利5,179,021、5,116,746、5,407,827、5,405,769、5,395,765、5,369,024、5,457,045、5,434,071、5,498,534、5,591,304、5,645,686、5,725,732、5,759,840、5,834,301、5,871,730和6,057,438所述;用于减少木材中的木质素和修饰木材,如美国专利5,486,468和5,770,012中所述。
在一个方面,本发明的甘露聚糖酶或其他酶可以用于纸或浆工业,单独使用或与木聚糖酶(例如本发明的木聚糖酶)一起使用。在一个方面,本发明的酶可以用于漂白工艺,以增加漂白的浆(例如全部或部分来自软木材)的亮度。如果使用本发明的酶,可以减少在漂白阶段使用的氯的数量。在一个方面,本发明的甘露聚糖酶可以用于增加回收纸工艺中的浆的自由度。在一个方面,本发明的甘露聚糖酶单独使用或与木聚糖酶(例如本发明的木聚糖酶)一起用于处理木质素纤维浆(例如全部或部分来自软木材),以改善其漂白率。参见例如美国专5,795,764。
本发明的浆或纸处理也可包括使用与其他酶的任何组合,这些其他酶诸如过
过氧化氢酶、葡聚糖酶、纤维素酶、内切糖苷酶、内-β-1,4-葡聚糖酶、淀粉糖苷酶、葡萄糖异构酶、葡萄糖苷转移酶、脂酶、磷脂酶、脂氧化酶、β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、漆酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖葡聚糖酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白酶、肽酶、蛋白酶、聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。
动物饲料和食物或饲料添加剂
本发明提供了使用本发明的葡聚糖酶处理动物饲料和食物和食物或饲料添加剂的方法,动物包括哺乳动物(例如,人)、鸟类(例如鸡)、爬行动物、鱼和类似物。本发明提供了含有本发明葡聚糖酶、甘露聚糖酶或木聚糖酶的动物饲料、食物和添加剂。在一个方面,使用本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶处理动物饲料、食物和添加剂可有助于动物饲料或添加剂中的营养素例如淀粉、蛋白等的利用度。通过破坏很难消化的蛋白或间接或直接暴露淀粉(或其它营养物质),本发明的酶使营养物质更容易接近其它的内源或外源酶。本发明的酶也可引起很易消化和很易吸收的营养物质和糖类的释放。在另一方面,本发明的酶可以用于饲料中以减少食品或饲料,例如高-大麦或高-小麦饮食,诸如家禽饮食中的葡聚糖的粘性。在一个方面,这可以使湿滴(wet droppings)最小化。
当被加入进动物饲料中时,本发明的葡聚糖酶可改善植物细胞壁物质的体内分解,这部分是由于减小了肠内的粘度(见,例如Bedford等人,Proceedings of the1stSymposium on Enzymes in Animal Nutrition,1993,pp.73-77),因此可实现动物对植物营养物质的更好利用。因此,通过在饲料中使用本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶,动物的生长速率和/或饲料转化率(即,被消化饲料相对于增加的体重的重量)被改善。
本发明的动物饲料添加剂可以是颗粒状的酶产品,其很容易与饲料成分混合。可选择地是,本发明的饲料添加剂可形成一种预混合组分。本发明的颗粒状酶产品可被包被或不包被。酶颗粒的微粒大小可与饲料和预混合组分的大小相容。这为将酶整合进饲料中提供了一种安全和方便的手段。可选择地是,本发明的动物饲料添加剂可以是一种稳定的液体组合物。它可以是一种水基或油基的浆液。见,例如美国专利6,245,546。
在动物饲料或食物的改变中,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可在体外(通过改变饲料或食物的成分)或体内加工食物或饲料。本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可加入至含有很高含量的葡聚糖的动物饲料或食物组合物中,例如含有来自谷类、谷粒以及类似物的植物物质的饲料或食物。当被加入至饲料或食物中时,葡聚糖酶可显著地改善含葡聚糖物质例如植物细胞壁的体内分解,因此可实现动物(例如,人)对植物营养物质的更好利用。在一个方面,动物的生长速率和/或饲料转化率(即,被消化饲料的重量相对于增加的体重)被改善。例如,部分消化或不消化的含葡聚糖的蛋白被本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶完全或部分降解成为肽和半乳糖和/或半乳糖寡聚物,其中这些酶可以与其它酶联合,例如β-半乳糖苷酶。这些酶消化产物更容易被动物消化。因此,本发明的葡聚糖酶有助于饲料或食物的能量的有效利用。通过促使含葡聚糖蛋白的降解,本发明的葡聚糖酶也可改善糖类和非糖类饲料或食物成分如蛋白、脂肪和矿物质的消化性和摄取。
在另一个方面,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶通过直接在转基因饲料作物(如,例如转基因植物、转基因种子以及类似物)中表达酶而被供给,所述转基因作物如谷粒、谷类、玉米、大豆、油菜籽、羽扇豆以及类似物。如在上面所讨论的,本发明提供了转基因的植物、植物部分和植物细胞,其含有编码本发明多肽的核酸序列。在一个方面,核酸被表达,这样本发明的葡聚糖酶以可回收的量被产生。本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可从任何植物或植物部分中被回收。可选择的是,含有重组多肽的植物或植物部分可用来改善食物或饲料的性质,例如,改善营养价值、可口性和流变性,或破坏抗营养因子。
在一个方面,本发明提供了在饲料被动物个体消耗之前使用本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶从饲料中去除寡糖的方法。在这个过程中,形成了可代谢能值(metabolizable energy value)增加的饲料。除了本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶以外,可使用半乳糖苷酶、纤维素酶和其组合。在一个方面,酶以相当于饲料物质重量的大约0.1%至1%的量被加入。在一个方面,饲料是谷类、小麦、谷粒、大豆(例如,磨碎的大豆)物质。见,例如美国专利6,399,123。
在另一个方面,本发明提供了在动物饮食中应用本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶作为营养添加物的方法,这通过制备含有本发明的重组酶的营养添加物,将该营养添加物给予动物以增加对包含在被动物消化的食物中的葡聚糖的利用来进行。
仍在另一个方面,本发明提供了一种可食用的丸状的酶输送基质和将葡聚糖酶、甘露聚糖酶或木聚糖酶——例如作为一种营养添加物——输送给动物的应用方法。酶输送基质很容易释放葡聚糖酶,例如一种具有本发明的氨基酸序列或其至少30个连续氨基酸的酶,其处于含水介质中,例如,动物的消化性液体中。本发明的酶输送基质可用粒状的可食用载剂制备,载剂选自这样一些成分,如无油的谷粒胚芽、干草、苜蓿、梯牧草、大豆荚、向日葵籽粉、小麦粗粉以及类似物,它们很容易将包含在其中的重组酶分散进含水介质中。在应用中,可食用的丸状酶输送基质被给予动物,将葡聚糖酶输送给动物。合适的基于谷物的基质可包含或来自任何适合的可食用谷物,如小麦、玉米、大豆、高粱、苜蓿、大麦和类似物。基于谷物的基质的实例是基于玉米的基质。底物可来自谷物的任何合适的部分,但在一个方面被批准用于动物饲料的谷物胚芽,如可在潮湿的或干燥的磨粉过程中获得的玉米胚芽。谷物胚芽在一个方面含有废胚芽,它是油已经被榨出的谷物胚芽,如通过压榨或己烷或其它溶剂萃取。可选择地是,谷物胚芽被压榨机提取,即油已经通过压榨被去除。
本发明的酶输送基质是以分散的多个微粒、小丸或颗粒形式存在。“颗粒”的含义是被压扁或压紧的微粒,如通过制丸、挤压或类似的压制过程从基质中去除水分。微粒的这种压缩或压紧也可促进微粒的粒子内粘聚性。例如,通过在制丸机中将基于谷物的基质制丸来制备颗粒。由此制备的丸被研磨或粉碎成适合用作动物饲料辅料的颗粒大小。由于基质本身被批准用于动物饲料,所以在动物饲料中它可用作输送酶的稀释剂。
在一个方面,酶输送基质为颗粒的形式,颗粒大小范围为大约4至大约400目(USS);在还有一个方面大约8至大约80目;更有大约14至大约20目。如果谷物胚芽是经溶剂提取被消耗,在制粒机中可能需要使用润滑剂如玉米油,但如果胚芽是被压榨机提取则通常不需要这样的润滑剂。在本发明的另一个方面,通过其它的压制或压缩过程来制备基质,例如通过一个模具挤压基于谷物的基质,并将压出物研磨成合适的颗粒大小。
酶输送基质可进一步包括多糖成分作为粘合剂以增强基质颗粒的粘聚性。认为粘合剂可提供另外的羟基,可增强基质颗粒内谷类蛋白之间的键合作用。进一步认为,额外的羟基基团可通过增强蛋白与淀粉和其它蛋白的氢键结合而发挥作用。粘合剂可以任何适合的量存在以增强酶输送基质的颗粒的粘聚性。合适的粘合剂包括一种或多种糊精、麦芽糊精、淀粉,如玉米淀粉、面粉、纤维素、半纤维素和类似物。例如,基质中谷胚芽和粘合剂的比例(不包括酶)为78%的玉米胚芽粉和20%重量的玉米淀粉。
因为本发明的酶释放基质由生物可降解材料制成,基质可能发生酸败,如通过发霉。为了防止或抑制这种发霉,基质可包括发霉抑制剂,如丙酸盐,可以任何足以抑制酶释放基质发霉的量存在,因此提供了以稳定剂型存在的输送基质,其不需要冷冻。
包含在本发明的酶输送基质和方法中的葡聚糖酶在一个方面是热稳定的葡聚糖酶,如在此所述,这是为了在制造过程中抵抗葡聚糖酶的灭活,在制造过程中高温和/或蒸汽可被应用来制备成垛的酶输送基质。在消化含有本发明的酶输送基质的饲料过程中,水相消化液将引起活性酶的释放。其它类型的热稳定酶和热稳定的营养添加剂也可被掺入输送基质中,其可在任何类型的含水条件下释放。
出于许多不同的目的,可以对本发明的酶基质微粒应用包衣,如为了向动物饲料中添加调味剂或营养添加剂,为了在胃内条件下延缓动物饲料添加剂和酶的释放,以及类似的目的。或者,可应用包衣来实现功能性的目的,例如在需要延缓酶从基质微粒中的释放或控制酶将被释放的条件时。包衣材料的组合物可以是可选择性地被其敏感的试剂(如热、酸、酶或其它化学物质)分解的材料。可选择地是,对不同的这样的分解剂敏感的两种或更多种包衣可被连续地应用于基质微粒。
本发明也专注于制备酶释放基质的过程。根据本发明,该过程包括提供基于谷粒的基材的多个分散颗粒,其颗粒大小适合用作酶释放基质,其中所述的颗粒包括由本发明的氨基酸序列编码的葡聚糖酶。在一个方面,该过程包括将酶释放基质的颗粒压制或压缩成微粒,最优选在一个方面是通过制丸来完成。防霉剂和粘聚剂,当被应用时,可在任何适合的时间被加入,在一个方面与基于谷粒的基材以所需的比例在将基于谷粒的基材制丸之前混合。制丸机进料中的含水量在一个方面上面所示的与最终产物含水量对应的范围,在一个方面大约14-15%。在一个方面,水分以酶的水制剂形式加入至供给原料中,使该原料达到此含水量。在制丸机中的温度在一个方面用蒸汽达到大约82℃。制丸机可在任何条件下进行操作,对供给原料进行足够的操作以提供小丸。对于从含酶组合物中去除水分来说,制丸过程本身是一个很划算的过程。
在一个方面,制丸机用1/8英寸乘2英寸的模在100Ib./min.的压力下在82℃操作,形成小丸,然后在制丸机粉碎室内被粉碎形成分散的多个颗粒,颗粒大小能够通过8目的筛网但可被保留在20目的筛网上。
本发明的热稳定葡聚糖酶、甘露聚糖酶或木聚糖酶可用于本发明的小丸中。它们可以具有很高的最适温度和很高的耐热性,这样可以在至今无法进行反应的温度下执行酶反应。根据本发明,编码葡聚糖酶的基因(例如,在本发明序列的任何一条序列中所示的)可用于制备葡聚糖酶、甘露聚糖酶或木聚糖酶(例如,使用在此所述的GSSMTM),所述酶具有与本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶不同的特性(在最佳pH、最佳温度、耐热性、对溶剂的稳定性、比活、对底物的亲和力、分泌能力、翻译速率、转录调控以及类似的方面)。而且,本发明的多核苷酸可被用来筛选通过在此所述的方法制备的葡聚糖酶、甘露聚糖酶或木聚糖酶变异体,以确定那些具有所需活性的变异体,如具有改善或改变的热稳定性或耐热性的变异体。例如,美国专利5,830,732描述了测定葡聚糖酶的耐热性的筛选试验。
在一个方面,在动物饲料中的本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶在动物胃中具有活性。因此,在一个方面,例如在饲料中的本发明的酶在约37℃、在单胃动物的低pH(pH2-4)和反刍动物的中性pH(pH6.5-7)中具有活性。本发明的酶经得住动物内脏中的酶,例如蛋白酶的作用,在与饲料微粒化有关的较高温度中保持稳定。在一个方面,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶用于饲料添加剂,例如单胃动物饲料,并且具有较高的比活性,例如在35-40℃,和pH2-4具有活性,在SGF中半衰期大于30分钟,在在配制状态的85℃温度中半衰期>5分钟。对于反刍动物饲料,在饲料添加剂中的本发明葡聚糖酶、甘露聚糖酶或木聚糖酶具有较高的比活性,例如在5-40℃,和pH6.5-7.0具有活性,在SRF中半衰期大于30分钟,在浓缩的干粉中具有稳定性。
本发明的动物饲料和动物饲料生产工艺也可包括与其他酶的任何组合,这些其他酶诸如过氧化氢酶、其他葡聚糖酶、纤维素酶、内切糖苷酶、内-β-1,4-葡聚糖酶、淀粉糖苷酶、葡萄糖异构酶、葡萄糖苷转移酶、脂酶、磷脂酶、脂氧化酶、β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、漆酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、植酸酶、阿拉伯聚糖酶、半纤维素酶、其他甘露聚糖酶、木糖葡聚糖酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。
废物处理
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可用于其它的各种工业应用中,例如用在废物处理(除了例如将生物量转化为燃料)中。例如,在一个方面,本发明提供了使用本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的固体废物消化过程。该法可包括减少基本上未处理的固体废物的质量和体积。固体废物可在酶溶液(包括本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶)存在的情况下用一种酶消化过程在可控的温度下进行处理。这种反应不需要添加微生物形成明显的细菌发酵。固体废物被转变为液化的废物和残余的固体废物。得到的液化废物可与所述的任何残余的固化废物分离。见,例如美国专利5,709,796。
本发明的废物处理工艺也可包括使用与其他酶的任何组合,这些其他酶诸如
过氧化氢酶、其他葡聚糖酶、纤维素酶、内切糖苷酶、内-β-1,4-葡聚糖酶、淀粉糖苷酶、葡萄糖异构酶、葡萄糖苷转移酶、脂酶、磷脂酶、脂氧化酶、β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、漆酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、植酸酶、阿拉伯聚糖酶、半纤维素酶、其他甘露聚糖酶、木糖葡聚糖酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白酶、肽酶、蛋白酶、聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。
口腔护理产品
本发明提供了含有本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的口腔护理产品。示范性的口腔护理产品包括牙膏、牙乳剂、凝胶或牙粉、洗牙剂、漱口剂、刷牙前或后的漱口剂、口香糖、止咳糖或冰糖。见,例如美国专利6,264,925。
本发明的口腔护理产品可包括与其他酶的任何组合,这些其他酶诸蛋白酶、肽酶、蛋白酶、葡萄糖氧化酶、过氧化物酶、葡聚糖酶、纤维素酶、内切糖苷酶、内-β-1,4-葡聚糖酶、淀粉糖苷酶、内-β-1,3(4)-葡聚糖酶、淀粉糖苷酶和糖苷酶。
酿造和发酵
本发明提供了酿造(例如,发酵)含有本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的啤酒的方法。在一个示范性的过程中,含有淀粉的原材料被分解和加工形成麦芽。本发明的酶被用在发酵过程中的任何时候。例如,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶被用于酿造工业中,用来降解β-葡聚糖。在一个方面,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶被用于酿造工业中,用来澄清饮料。
在一个方面,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以被用于处理大麦麦芽。啤酒酿造的主要原材料是大麦麦芽。这是一个三阶段的过程。首先,大麦谷粒被浸泡以增加含水量,例如,大约40%左右。第二,当在赤霉素控制下刺激酶合成时,在15至25℃孵育3至6天可使谷粒发芽。在一个方面,本发明的酶在所述过程的这个阶段(或任何其它阶段)被加入。
在一个方面,本发明的酶用于糖化和转化过程。在酿造和发酵工业中,糖化和转化过程在一定的温度中进行,该一定的温度太低以至于不能促进水溶性葡聚糖和木聚糖进行足够的降解。这些聚合物形成胶粘性的底物,这会使得糖化的麦芽汁的粘性增加,从而在最终啤酒产品中产生较长的糖化醪过滤(run-off)时间、残留的浑浊和沉淀物,这是由于过滤效率不足和萃取量低的缘故。对于这些理由,在酿造过程中加入酶来降解β-1,4-和β-1,3-键连接的葡聚糖。
在一个方面,本发明的酶用于麦牙坊操作中,例如将葡聚糖酶加入到生产用水中,来缩短发芽时间和/或促进将质量差的大麦转化成可接受的麦芽。在一个方面,本发明的酶用于糖化,例如添加本发明的酶以增加可滤性和/或改善过滤。在一个方面,本发明的酶用于发酵罐和/或沉淀罐(settling tank),以例如帮助清除浑浊和/或提高过滤水平。在一个方面,本发明的酶用于添加料酿造中,例如加入本发明的葡聚糖酶以降解大麦、小麦和/或其他谷物中的葡聚糖,包括麦芽中聚糖。在一个方面,本发明的酶用于麦芽酿造,例如加入本发明的葡聚糖酶以改变葡聚糖含量高的劣等麦芽。
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可用于任何啤酒或酒精饮料的生产过程中,其描述例如,见美国专利5,762,991;5,536,650;5,405,624;5,021,246;4,788,066。
本发明的酿造工艺也可包括使用与其他酶的任何组合,这些其他酶诸如其他木聚糖酶、酯酶、纤维素酶、果胶酶、果胶裂解酶、淀粉酶、脱羧酶、漆酶、葡聚糖酶、蛋白酶、肽酶、蛋白酶、淀粉糖苷酶、葡萄糖异构酶、葡糖淀粉酶、β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、半纤维素酶、内切糖苷酶、内-β-1,4-葡聚糖酶、葡萄糖苷转移酶、磷脂酶、脂氧化酶、还原酶、氧化酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、其他甘露聚糖酶、木糖葡聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、转谷氨酰胺酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。
医学和研究应用
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶由于其溶菌的特性和抗真菌特性,可用作抗微生物试剂。本发明的葡聚糖酶可用来消灭沙门氏菌,或保护动物免受沙门氏菌感染,其描述见,例如PCT申请WO0049890和WO9903497。本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以用于糖酶和/或葡聚糖酶的组合物和使用方法,其用于制备用于治疗和/或预防球虫病的试剂。制备得到的试剂可以是以谷物为基础的动物饲料形式的(参见例如美国专利5,624,678)。
钻探应用
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以用于改变植物衍生的物质的粘性。在一个方面,本发明的酶可以用于石油工业,在石油工业中瓜尔豆胶和修饰的瓜尔豆被用于例如破碎液体和钻探泥浆。本发明的酶可以用于清洗油井,例如分解破碎之后破碎液体中的高粘度结构或凝胶结构。在一个方面,用于这些应用领域中的本发明的酶具有高热稳定性。在一个方面,用于这些应用领域中的本发明的酶能经受住地面中或钻探过程中产生的高温。本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以用于处理钻探泥浆(例如使用的泥浆)。
其它工业应用
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可用在各种食物、动物饲料和饮料应用中。通过筛选已存在的文库和从多种嗜温和中度嗜热场所以及从目标来源——包括消化性植物、动物废物中的微生物、土壤细菌和高度碱性栖息地——构建出的DNA文库来发现新的葡聚糖酶、甘露聚糖酶或木聚糖酶。使用含葡聚糖的底物和/或动物饲料物质中的不溶性多糖组分来进行生物俘获(biotrap)和初步的富集策略也是有用的。
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以用于将生物量转化为燃料,和用于生产乙醇,例如如PCT申请WO043496和WO100857中所述。本发明的葡聚糖酶可以用于生产可发酵的糖类和含葡聚糖的生物量,它们可以转化为燃料乙醇。
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以与参与纤维素消化的其他酶,例如纤维二糖水解酶和β-糖苷酶联合使用。
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以用于许多其他应用中。例如,本发明的葡聚糖酶可以用于改善泌乳母牛的乳蛋白生产的质量和数量(参见例如Kung,L.,etal,J.Dairy Science,2000Jan83:115-122),增加猪的胃和小肠中的可溶性糖的数量(参见例如van der Meulen,J.et al,Arch.Tierernahr,200154:101-115),提高母鸡后期产蛋效率和鸡蛋产量(参见例如Jaroni,D.,et al,Poult.Sci.,1999June78:841-847)。此外,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以用作面粉、面团和面包改良剂(参见例如美国专利5,108,765和5,306,633),作为饲料添加剂和/或补充物,如上所述(参见例如美国专利5,432,074、5,429,828、5,612,055、5,720,971、5,981,233、5,948,667、6,099,844、6,132,727和6,132,716),用于制造纤维素溶液(参见例如美国专利5,760,211)。包含本发明葡聚糖酶、甘露聚糖酶或木聚糖酶的洗涤剂组合物可以用于水果、蔬菜和/或泥和粘土化合物(参见例如美国专利5,786,316)。
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的其他用途包括用于产生水溶性的膳食纤维(参见例如美国专利5,622,738),用于改善可滤性,分离和产生淀粉(参见例如美国专利4,960,705和5,023,176),用于饮料工业,改善麦芽汁或啤酒的可滤性(参见例如美国专利4,746,517),用于促进家畜分泌奶和提高奶质量的酶组合物(参见例如美国专利4,144,354),用于减小植物物质的粘性(参见例如美国专利5,874,274),用于增加食物产品诸如果酱、橘子酱、果冻、糊剂、汤、沙拉等的粘性或凝胶强度(参见例如美国专利6,036,981)。葡聚糖酶、甘露聚糖酶或木聚糖酶也可以用于选择性地水解半纤维素,特别是在纤维素存在下。此外,纤维素酶丰富的截留物质适于水解纤维素(参见例如美国专利4,725,544)。
本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的各种用途包括产生乙醇的微生物的转化(参见例如PCT申请WO99/46362),用于生产酿酒产生的丹宁酸和酶组合物(参见例如PCT申请WO0164830),用于激发植物的自然抵御能力(参见例如PCT申请WO0130161),用于从半纤维素物质生产糖(参见例如PCT申请WO9203541),用于清洗含土的水果、蔬菜、泥或粘贴(参见例如PCT申请WO9613568),用于清洗啤酒过滤膜(参见例如PCT申请WO9623579),用于杀死或抑制微生物细胞(参见例如PCT申请WO9732480),用于通过使用两UV吸收测量的比例和比较光谱来测定来自木浆漂白的工业用水的特性(参见例如PCT申请WO9840721)。
本发明的任何产品和方法可以包括其他酶的任何组合,这些其他酶诸如:过氧化氢酶、葡聚糖酶、纤维素酶、内切糖苷酶、内-β-1,4-葡聚糖酶、淀粉糖苷酶(amyloglucosidases)、葡萄糖异构酶、葡萄糖苷转移酶、脂酶、酯酶、磷脂酶、脂氧化酶、β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、漆酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、植酸酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖葡聚糖酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。
两种筛选形式(基于活性和基于序列)可用于发现新的葡聚糖酶、甘露聚糖酶或木聚糖酶。基于活性的方法是直接在琼脂平板上采用底物如AZO-葡聚糖(Megazyme)来筛选葡聚糖酶活性。可选择的是,可使用基于序列的方法,这是根据生物信息学和分子生物学来为杂交和生物淘选(biopanning)设计探针。见,例如美国专利6,054,267、6,030,779、6,368,798、6,344,328。为了进行基本的生物化学定性,筛选得到的命中物可被纯化、测序、定性(例如,测定特异性、温度和最适pH)、使用生物信息学进行分析、亚克隆和表达。这些方法可用来筛选可用于大量应用中的葡聚糖酶、甘露聚糖酶或木聚糖酶,包括用于面团改进和作为动物饲料添加酶的木聚糖酶。
在对由筛选获得的酶进行定性的过程中,可以评价在面团加工和烘烤应用中的实效。定性可以包括,例如,测定底物的特异性(葡聚糖、阿拉伯糖基木聚糖、CMC、BBG)、温度和pH稳定性和比活。市售的酶可用作基准。在一个方面,本发明的酶在pH=7和25-35℃具有显著活性,对不溶的葡聚糖是无活性的,在50-67%蔗糖中是稳定和有活性的。
在另一个方面,可通过候选酶的表征来评价作为饲料添加剂的实效。表征可以包括,例如测量底物的特异性(葡聚糖、阿拉伯糖基木聚糖、CMC、BβG)、温度和pH稳定性、比活和胃内的稳定性。在一个方面,为单胃动物设计饲料,在另一方面,为反刍动物设计饲料。在一个方面,本发明的酶在pH2-4和35-40℃具有显著的活性,在胃液中的半衰期超过30分钟,在85℃时剂型(在缓冲液或细胞中)的半衰期超过5分钟,它们可用作单胃动物的饲料添加剂。在另一个方面,本发明的酶具有一种或多种以下的特性:在pH6.5-7.0和35-40℃具有显著的活性、在瘤胃流体中的半衰期超过30分钟、与干粉同样稳定的剂型稳定性、可用作反刍动物的饲料添加剂。
酶对于很大范围的天然底物和非天然底物酶都是具有反应性的,因此这使得实际上任何有机先导化合物(lead compound)的修饰都成为可能。而且,不同于传统的化学催化剂,酶是高度对映选择性和区域选择性的。酶所显示的高度的功能基团特异性使人们能够追踪可导致产生新的活性化合物的合成顺序中的每一个反应。酶也能够催化许多与其生理功能在自然状态下不相关的各种反应。例如,过氧化物酶可通过过氧化氢催化苯酚的氧化。过氧化物酶也可催化与该酶的天然功能不相关的羟基化反应。其它的实例是可催化多肽分解的葡聚糖酶。在有机溶液中,一些葡聚糖酶也可酰化糖类,该功能与这些酶的天然功能不相关。
本发明开发了酶的独特的催化性质。鉴于生物催化剂(即,纯化的或者粗制的酶,非存活的或者存活的细胞)在化学转化中的应用一般需要确定与特定的起始化合物反应的特定的生物催化剂,本发明应用的经选择的生物催化剂和反应条件是对于存在于很多起始化合物中的功能基团具有特异性的。每种生物催化剂对于一种功能基团或者几种相关的功能基团是特异的,并且可以和含有这一功能基团的许多起始化合物反应。生物催化反应可以从单一的起始化合物生产出一个群体的衍生物。这些衍生物可以进行另一轮的生物催化反应来产生又一个群体的衍生化合物。通过生物催化的衍生作用的每一次迭代可以产生起始化合物的数千种变化。
酶可以在起始化合物的特定位点发生反应而不影响分子的其它部分,该过程通过传统的化学方法很难实现。这种高度的生物催化特异性提供了用于在文库中鉴定单个活性化合物的方法。该文库是通过用于产生该文库的一系列生物催化反应来表征,这也称为“生物合成历史”。对该文库的生物活性的筛选和对生物合成历史的追踪确定出产生活性化合物的特定反应顺序。重复该反应顺序,并确认合成出的化合物的结构。这种确认方式,不同于其它的合成和筛选方法,并不需要固定化技术,化合物可以利用实际上任何类型的筛选分析在溶液中自由合成和测试。重要的是,要注意到,酶反应在功能基团上的高度特异性允许“追踪”制备出了生物催化产生的文库的特定酶促反应。
许多程序化的步骤可使用机器人自动化来实施,这使得每天可进行几千个生物催化反应和筛选测定,并保证高水平的准确性和可重复性。结果是,可在几周内产生衍生化合物的文库,使用现今的化学方法需要几年才能产生。(对于包括小分子在内的分子修饰的进一步教导,见PCT/US94/09174)。
本发明进一步通过下面的实施例进行说明;但要理解的是本发明不受这些实施例的限制。