CN100577809C - 具有α淀粉酶活性的酶及其使用方法 - Google Patents

具有α淀粉酶活性的酶及其使用方法 Download PDF

Info

Publication number
CN100577809C
CN100577809C CN02808640A CN02808640A CN100577809C CN 100577809 C CN100577809 C CN 100577809C CN 02808640 A CN02808640 A CN 02808640A CN 02808640 A CN02808640 A CN 02808640A CN 100577809 C CN100577809 C CN 100577809C
Authority
CN
China
Prior art keywords
sequence
polypeptide
nucleic acid
starch
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN02808640A
Other languages
English (en)
Other versions
CN1513059A (zh
Inventor
W·卡伦
T·理查森
G·弗雷
K·A·格雷
J·M·肖特
J·S·克若娃夫
E·J·马瑟
M·斯卢斯卡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Enzymes LLC
Original Assignee
Diversa Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Diversa Corp filed Critical Diversa Corp
Publication of CN1513059A publication Critical patent/CN1513059A/zh
Application granted granted Critical
Publication of CN100577809C publication Critical patent/CN100577809C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2414Alpha-amylase (3.2.1.1.)
    • C12N9/2417Alpha-amylase (3.2.1.1.) from microbiological source
    • AHUMAN NECESSITIES
    • A21BAKING; EDIBLE DOUGHS
    • A21DTREATMENT, e.g. PRESERVATION, OF FLOUR OR DOUGH, e.g. BY ADDITION OF MATERIALS; BAKING; BAKERY PRODUCTS; PRESERVATION THEREOF
    • A21D8/00Methods for preparing or baking dough
    • A21D8/02Methods for preparing dough; Treating dough prior to baking
    • A21D8/04Methods for preparing dough; Treating dough prior to baking treating dough with microorganisms or enzymes
    • A21D8/042Methods for preparing dough; Treating dough prior to baking treating dough with microorganisms or enzymes with enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2414Alpha-amylase (3.2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/04Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01001Alpha-amylase (3.2.1.1)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

本发明涉及α淀粉酶和编码α淀粉酶的多核苷酸。并且,也提供了设计新的α淀粉酶的方法和这些α淀粉酶的使用方法。这些α淀粉酶在酸性和碱性pH值和升高温度下具有增加的活性和稳定性。

Description

具有α淀粉酶活性的酶及其使用方法
相关申请资料
本申请要求如下申请的优先权:2001年2月21日提交的美国临时申请60/270,495,目前在审理中;2001年2月21日提交的美国临时申请60/270,496,目前在审理中;和2001年5月14日提交的美国临时申请60/291,122,目前在审理中,所有这些申请被完整引用于此作为参考。
发明领域
本发明总的来说涉及酶,编码这些酶的多核苷酸,这些多核苷酸和多肽的用途,更明确地说涉及具有α淀粉酶活性的酶。
背景技术
淀粉是存在于人类饮食中的复合糖。淀粉的结构是用α-1,4和α-1,6糖苷键连接的葡萄糖聚合物。淀粉酶是一种能催化淀粉水解为糖的酶。淀粉酶在淀粉中水解内α-1,4-糖苷键,在很大程度上是随机水解,从而得到较小分子量的麦芽糖糊精。在消化系统和商业上,淀粉的分解是很重要的。所以淀粉酶被认为很有商业价值,在很多场合得到使用:淀粉加工的初始阶段(液化);湿玉米碾磨;酒精生产;在去污剂基料中作为清洗剂;在纺织行业用于淀粉脱浆;烘培应用;饮料行业;在油田的钻探工艺中;给循环纸上墨;和动物饲料中。
淀粉酶是用多种微生物制备的,这些微生物包括芽孢杆菌属(Bacillus)和曲霉属(Aspergillus),其中许多商业淀粉酶是从细菌来源制备的,如地衣芽孢杆菌(Bacillus licheniformis),解淀粉芽孢杆菌(Bacillus amyloliquefaciens),枯草芽孢杆菌(Bacillus subtilis),或嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)。在最近几年,那些来自地衣芽孢杆菌的酶已经用于商业应用中,原因在于它们的热稳定性和性能,至少中性和弱碱性的pH值。
通常,淀粉到果糖的加工包括四个步骤:颗粒淀粉的液化,液化淀粉糖化为葡萄糖,纯化,和异构化为果糖。淀粉液化步骤的目的是将淀粉聚合物颗粒的浓缩悬浮液转化为低粘度的可溶性短链糊精溶液。该步骤对于用标准设备便利地处理和有效转化为葡萄糖或103其它糖是必要的。为了液化颗粒淀粉,必须通过将颗粒淀粉的温度升高到高于大约72℃以使颗粒胶凝化。加热过程可以瞬间破坏不溶性淀粉颗粒从而产生水溶性淀粉溶液。然后通过淀粉酶将溶解的淀粉溶液液化。淀粉颗粒包括:69-74%支链淀粉,26-31%淀粉酶,11-14%水,0.2-0.4%蛋白质,0.5-0.9%脂质,0.05-0.1%灰分,0.02-0.03%磷,0.1%戊聚糖。大约70%的颗粒是非晶态的,30%是晶态的。
普通的酶液化步骤涉及通过加入氢氧化钙,氢氧化钠或碳酸钠将颗粒淀粉浆料的pH值调节到6.0-6.5之间,是衍生于地衣芽孢杆菌的α-淀粉酶的最适pH值。加入氢氧化钙还有一个优点,就是可以提供钙离子,已知钙离子能够稳定α-淀粉酶以免其发生失活。一旦加入α-淀粉酶,就通过蒸汽喷嘴抽出悬浮液,这样可以将温度瞬间升高到80℃-115℃之间。淀粉被立刻胶凝化,随后由于存在α-淀粉酶,通过α-淀粉酶随机水解(1-4)糖苷键将其被解聚为流体物质,这样易于抽出。
在液化步骤的第二种变化形式中,α-淀粉酶被加入到淀粉悬浮液中,悬浮液被保持在80-100℃的温度以部分地水解淀粉颗粒,然后部分水解的淀粉颗粒通过喷嘴在超过大约105℃的温度被抽出,以彻底地胶凝化任何剩余的颗粒结构。在冷却胶凝淀粉后,第二次加入α-淀粉酶,以进一步水解淀粉。
该步骤的第三种变化形式被称作干磨方法。在干磨法中,将全粒研磨,并且与水混合。通过漂浮分离或等效技术任选地去除胚芽。用α-淀粉酶液化所得到的混合物,该混合物含有淀粉、纤维、蛋白质和谷物的其它成分。当使用干磨法时,本技术领域通常的实践是采取在较低温度下进行酶液化。通常,在将淀粉转化为可溶性糊精时,认为低温液化比高温液化的效率低一些。
典型地,淀粉溶液在胶凝化后,在存在α-淀粉酶的情况下,保持于高温下,直到DE达到10-20,通常保持1-3小时。葡萄糖当量值(DE)是用于测量总的还原糖浓度的行业标准,是以干重量计算的D-葡萄糖来表示。未水解的颗粒淀粉的DE实质上为零,尽管D-葡萄糖的DE被定义为100。
玉米湿磨是一种产生玉米油、谷蛋白粉、谷蛋白饲料和淀粉的方法。碱性淀粉酶被用于淀粉液化中,葡糖淀粉酶被用于糖化中,从而产生葡萄糖。玉米是一种包括外种皮(纤维)、淀粉、淀粉和葡萄糖的结合物和内胚芽的谷粒,进行一种四步骤方法,该四步骤方法导致产生淀粉。玉米被浸泡,去胚芽,去纤维,最后分离谷蛋白。在浸泡过程中,取出可溶性物质。去掉可溶性物质后剩余的产物被去胚芽,这样导致产生了玉米油且产生了油饼,油饼可以被加入到来自浸泡步骤的可溶性物质中。剩余产物被去纤维,然后纤维固体被加入到油饼/可溶性混合物中。纤维固体、油饼和可溶性物质的混合物形成了谷蛋白饲料。在去纤维后,剩余产物进行谷蛋白分离。该分离导致谷蛋白粉和淀粉。然后将淀粉进行液化和糖化,产生葡萄糖。
烘烤产品(如面包)的老化(staling)已经被认为是随着面包产品制备时刻和消费时刻之间的时间变长而变得越来越严重的一个问题。术语老化被用于描述面包产品在离开烤箱后的不受消费者欢迎的性质变化,如面包屑的坚硬性增加,面包屑弹性降低,面包皮发生变化,变得坚韧嚼不动。面包屑坚硬性在储存过程中进一步增加到一个被认为是被拒绝的水平。面包屑坚硬性的增加被认为是老化的最重要方面,是由消费者辨认的,是在面包产品在其它方面变得不适合消费之前的很长一段时间就发生的。
在该行业存在对于淀粉酶的鉴别和最优化的需求,淀粉酶可用于多种用途,包括商业玉米淀粉液化工艺中。例如,相对于来自地衣芽孢杆菌的行业标准酶而言,这些第二代酸性淀粉酶将提供改进的生产和/或工作特性。
也存在对于鉴别和最优化在自动洗碗机(ADW)产品和洗衣行业的去污剂中有用的淀粉酶的需求。在ADW产品中,淀粉酶将在存在钙螯合剂和氧化条件下,在pH 10-11和45-60℃发挥作用。对于洗衣行业,需要在适当的去污剂基料中,于pH 9-10和40℃下的活性。淀粉酶在织物脱浆、酿造工艺、造纸和纸浆行业中的淀粉改性以及本技术领域的其它工艺中有用。
此处讨论的公开文献只提供了它们在本发明提交日之前的公开内容。此处没有任何内容可以被解释为承认本发明没有依赖现有发明而以较前的时日记入这些公开内容。
发明概述
本发明提供了一种分离的核酸,其具有如下序列中所阐明的序列:SEQ ID NO.:1,3,5,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85,87,89,91,93,95,97,99,101,103,105,107,109,111,113,115,117,119,121,123,125,127,129,131,133,135,137,139,141,143,145,147,149,151,153,155,157,159,161,163,165,167,169,171,173,175,177,179,181,183,185,187,189,191,193,195,197,199,201,203,205,207,209,211,213,215,217,219,221,223,225,227,229,231,233,235,237,239,241,243,245,247,249,251,253,255,257,259,261,263,265,267,269,271,273,275,277,279,281,283,285,287,289,291,293,295,297,299及其与如下序列具有至少50%序列同一性的变体:SEQ IDNO.:1,3,5,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85,87,89,91,93,95,97,99,101,103,105,107,109,111,113,115,117,119,121,123,125,127,129,131,133,135,137,139,141,143,145,147,149,151,153,155,157,159,161,163,165,167,169,171,173,175,177,179,181,183,185,187,189,191,193,195,197,199,201,203,205,207,209,211,213,215,217,219,221,223,225,227,229,231,233,235,237,239,241,243,245,247,249,251,253,255,257,259,261,263,265,267,269,271,273,275,277,279,281,283,285,287,289,291,293,295,297,299,和编码具有α-淀粉酶活性的多肽。
本发明的一个方面是一种分离的核酸,其具有如下序列中所阐明的序列:SEQ ID NO.:1,3,5,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85,87,89,91,93,95,97,99,101,103,105,107,109,111,113,115,117,119,121,123,125,127,129,131,133,135,137,139,141,143,145,147,149,151,153,155,157,159,161,163,165,167,169,171,173,175,177,179,181,183,185,187,189,191,193,195,197,199,201,203,205,207,209,211,213,215,217,219,221,223,225,227,229,231,233,235,237,239,241,243,245,247,249,251,253,255,257,259,261,263,265,267,269,271,273,275,277,279,281,283,285,287,289,291,293,295,297,299(下文被称作“A组核酸序列”),与其基本上同一的序列,和与其互补的序列。
本发明的另一个方面是一种分离的核酸,其包括至少10个连续碱基,所述至少10个连续碱基是A组核酸序列,与其基本上同一的序列,和与其互补的序列中所阐明的序列的碱基。
仍然在另一个方面,本发明提供了一种分离的核酸,其编码具有如下述序列中所阐明的序列的多肽:SEQ ID NO.:2,4,6,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114,116,118,120,122,124,126,128,130,132,134,136,138,140,142,144,146,148,150,152,154,156,158,160,162,164,166,168,170,172,174,176,178,180,182,184,186,188,190,192,194,196,198,202,204,206,208,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,240,242,244,246,248,250,252,254,256,258,260,262,264,266,268,270,272,274,276,278,280,282,284,286,288,290,292,294,296,298及其编码具有α-淀粉酶活性和与这些序列具有至少50%序列同一性的多肽的变体。
本发明的另一个方面是一种分离的核酸,其编码具有如下述序列中所阐明的序列的多肽或其功能片段:SEQ ID NO.:2,4,6,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114,116,118,120,122,124,126,128,130,132,134,136,138,140,142,144,146,148,150,152,154,156,158,160,162,164,166,168,170,172,174,176,178,180,182,184,186,188,190,192,194,196,198,202,204,206,208,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,240,242,244,246,248,250,252,254,256,258,260,262,264,266,268,270,272,274,276,278,280,282,284,286,288,290,292,294,296,298(下文被称作“B组氨基酸序列”),和与其基本上同一的序列。
本发明的另一个方面是一种分离的核酸,其编码一种多肽,该多肽具有至少10个连续氨基酸,所述10个连续氨基酸是B组氨基酸序列和与其基本上同一的序列中所阐明的序列的氨基酸。
仍然在另一个方面,本发明提供了一种纯化的多肽,该多肽具有如B组氨基酸序列和与其基本上同一的序列中所阐明的序列。
本发明的另一个方面是一种分离的或纯化的抗体,该抗体与具有如B组氨基酸序列和与其基本上同一的序列中所阐明的序列的多肽特定地结合。
本发明的另一个方面是一种分离的或纯化的抗体或其结合片段,该抗体或其结合片段与具有至少10个连续氨基酸的多肽特定地结合,所述10个连续氨基酸是B组氨基酸序列和与其基本上同一的序列的多肽之一的10个连续氨基酸。
本发明的另一个方面是一种制备多肽的方法,该多肽具有B组氨基酸序列和与其基本上同一的序列中所阐明的序列。该方法包括将编码多肽的核酸导入宿主细胞,其中所述核酸与启动子可操作地连接,并且在允许核酸表达的条件下培养宿主细胞。
本发明的另一个方面是一种制备多肽的方法,该多肽具有至少10个氨基酸,是B组氨基酸序列和与其基本上同一的序列中所阐明的序列的10个氨基酸。该方法包括将编码多肽的核酸导入宿主细胞,其中所述核酸与启动子可操作地连接,并且在允许核酸表达的条件下培养宿主细胞,从而产生该多肽。
本发明的另一个方面是一种产生变体的方法,该方法包括获得具有如下序列中所阐明的一个序列的核酸:A组核酸序列,与其基本上同一的序列,与A组核酸序列基本上互补的序列中,包括前述序列的至少30个连续核苷酸的片段;将该序列中的一个或多个核苷酸改变为另一个核苷酸;删除该序列中的一个或多个核苷酸;或将一个或多个核苷酸添加到该序列中。
本发明的另一个方面是一种可用计算机读取的存储介质,其上已经存储了A组核酸序列和与其基本上同一的序列中所阐明的序列,或B组氨基酸序列和基本上与其同一的序列中所阐明的多肽序列。
本发明的另一个方面是一种计算机系统,该系统包括一个处理器和一个数据存储设备,其中数据存储设备上已经存储了A组核酸序列和与其基本上同一的序列中所阐明的序列,或具有B组氨基酸序列和基本上与其同一的序列中所阐明的序列的多肽。
本发明的另一个方面是一种将第一个序列与参考序列进行比较的方法,其中第一个序列是具有如A组核酸序列和与其基本上同一的序列中所阐明的序列的核酸,或B组氨基酸序列和基本上与其同一的序列的多肽编码。该方法包括通过使用进行序列比较的计算机程序读取第一个序列和参考序列;用该计算机程序确定第一个序列和参考序列之间的差异。
本发明的另一个方面是一种方法,用于鉴别A组核酸序列和与其基本上同一的序列中所阐明的序列的特征,或鉴别具有B组氨基酸序列和基本上与其同一的序列中所阐明的序列的多肽的特征,该方法包括通过使用能在序列中进行特征鉴别的计算机程序读取序列;用该计算机程序鉴别序列的特征。
本发明的另一个方面是一种分析方法,用于鉴别B组氨基酸序列和基本上与其同一的序列的片段或变体,其保留了B组氨基酸序列和与其基本上同一的序列的多肽的酶功能。该分析方法包括将B组氨基酸序列和基本上与其同一的序列的多肽,或多肽片段或变体,与底物分子在允许多肽片段或变体发挥作用的条件下接触;检测是底物水平有所降低,还是多肽与底物之间反应的特定反应产物水平有所增加,从而鉴别这些序列的片段或变体。
本发明也提供了一种方法,用于制备生面团或烘烤产品,该方法包括将本发明的淀粉酶以可以显著延迟面包老化的量加入到生面团中。本发明也提供了一种包括所述淀粉酶的生面团,和一种包括所述淀粉酶和面粉的预混合料。最后,本发明提供了一种酶烘烤添加剂,该添加剂含有所述淀粉酶。
根据本发明,使用淀粉酶提供了一种改进的抗老化效果,正如通过如下特性所测定的,例如较少的面包屑变硬,持久的面包屑弹性,改进的可切片性能(例如面包屑更少,无胶质面包屑),改进的可口性或味道。
附图简述
下述附图是本发明的实施方案的例证性说明,不意味着限定本发明的范围,本发明的范围如权利要求所描述。
图1是计算机系统的流程图。
图2是例证性说明一个实施方案的流程图,所述比较方法用于将新核苷酸或蛋白序列与序列数据库进行比较,以确定新序列和数据库中的序列之间的同源性水平。
图3是例证性地说明计算机中一种方法的一个实施方案的流程图,所述方法用于确定两个序列是否是同源的。
图4是例证性地说明一种识别符方法300的一个实施方案的流程图,所述方法用于检测序列特征的存在。
图5显示了实施例1中各种淀粉酶在加热到90℃维持10分钟后的残余活性。
图6显示了使用漂白剂和螯合剂的ADW洗涤测试中所去除的淀粉的净百分比与酶浓度的关系曲线。
图7显示了pH 8,40℃的亲代淀粉酶于55℃在ADW配方中的活性。
图8是关于实施例4中新颖酶的H2O2耐受性的数据图。
图9是选择所表征的淀粉酶的pH和温度数据图。图9a显示了pH8,40℃的数据,图9b显示了pH 10,50℃的数据。
图10阐明了在用酶进行的重装配试验中所使用的序列。
图11例证性说明了实施例5的样本标准曲线分析。
图12例证性说明了SEQ ID NO.:127的pH等级曲线图,其具有中性最适pH,和SEQ ID NO.:211的pH等级曲线图,其具有大约10的最适pH值。
图13显示了Diversa淀粉酶与商业酶相比的稳定性,如实施例2中所讨论的。
图14显示了嗜低温α-淀粉酶的序列对比,如实施例8中所阐明的。图14a显示了淀粉酶序列的对齐。SEQ ID NO.:81=环境克隆;pyro=热球菌属(Pyrococcus sp.(菌株:KOD1)),Tachibana,Y.,Mendez,L.,Takagi,M.和Imanaka,T.,J Ferment.Bioeng.82:224-232,1996;pyro2=激烈热球菌(Pyrococcus furiosus),Appl.Environ.Microbiol.63(9):3569-3576,1997;Thermo=热球菌(Thermococcus sp.);Thermo2=热水管热球菌(Thermococcus hydrothermalis),Leveque,E等人专利:法国98.05655,1998年5月5日,未公开。图14b显示了鉴别的序列的氨基酸序列对比:SEQ ID NO.:81;pyro;SEQ ID NO.:75;SEQ ID NO.:77;SEQ ID NO.:83;SEQ ID NO.:85;thermo2;SEQ ID NO.:79;thermo;pyro2;克隆A;thermo3。图14c显示了与图5和6的多肽序列相应的核酸序列对比。SEQ ID NO.:81;SEQ ID NO.:75;SEQ ID NO.:77;SEQID NO.:83;SEQ ID NO.:85;SEQ ID NO.:79;克隆A;和SEQ ID NO.:73。
图15是用邻位相连法(Neighor-jointing)所得的热球菌目(Thermococcales)进化树。
图16是本发明的序列。
发明详述
本发明涉及淀粉酶和编码这些酶的多核苷酸。正如此处所用,术语“淀粉酶”包括具有α-淀粉酶活性的酶,例如能在多糖中水解内α-1,4-葡聚糖键的淀粉酶,包括能在碱性pH或酸性pH将淀粉水解为糖的淀粉酶。本发明的淀粉酶特别地可用于玉米湿磨法,去污剂,烘烤工艺,饮料和油田(燃料乙醇)中。淀粉酶也可以用于织物脱浆,酿造工艺,纸和纸浆工业中淀粉改性和本技术领域描述的其它方法中。
已经鉴定出本发明的多核苷酸编码具有α淀粉酶或碱性淀粉酶活性的多肽。本发明的碱性淀粉酶可以包括,但不限于:SEQ ID NO.:115;SEQ ID NO.:207;SEQ ID NO.:139;SEQ ID NO.:127;SEQ ID NO.:137;SEQ ID NO.:113;SEQ ID NO.:205;SEQ ID NO.:179;SEQ ID NO.:151;SEQ ID NO.:187;SEQ ID NO.:97;SEQ ID NO.:153;SEQ ID NO.:69;SEQ ID NO.:135;SEQ ID NO.:189;SEQ ID NO.:119;SEQ ID NO.:209和SEQ ID NO.:211。
可以在本发明的变体中实现的特性改变是如下的特性改变,例如底物特异性、底物结合性、底物分裂型、热稳定性、pH/活性曲线、pH/稳定性曲线[如在低pH值(例如pH<6,尤其是pH<5)或高pH值(例如pH>9)下增加的稳定性]、抗氧化稳定性、Ca2+依赖性、比活性和其它相关特性。例如,与亲本淀粉酶相比,可以产生改变导致具有降低的Ca2+依赖性和/或改变的pH/活性曲线的变体。
本发明涉及α淀粉酶和编码这些酶的多核苷酸。正如此处所用,术语“α淀粉酶”包括具有α-淀粉酶活性的酶,例如能将淀粉水解为糖的酶。与许多已知的淀粉酶不同,本发明的淀粉酶可以是不依赖于钙的酶。
高度期望能降低α-淀粉酶的Ca2+依赖性。因此,本发明的一方面提供了一种淀粉酶,该淀粉酶与商品酶或亲本淀粉酶相比具有降低的Ca2+依赖性。降低的Ca2+依赖性通常将具有功能后果,即变体在存在比商品酶或亲本酶所需要的浓度低的钙离子浓度的情况下,在外部介质中表现出令人满意的淀粉分解活性。降低的Ca2+依赖性通常进一步具有如下结果,即变体对于钙离子贫乏的条件不太敏感,如那些在含有钙配位剂的介质中所获得的条件(例如某些去污剂助剂)。
“液化作用”或“液化”是指一种过程,通过该过程淀粉被转化为短链和低粘性糊精。通过,该过程包括在加入α淀粉酶的同时或加入α淀粉酶之后胶凝化淀粉。在商业过程中,优选地颗粒淀粉来自玉米、小麦、蜀黍、高粱、黑麦或bulgher(一种俄罗斯作物)。然而,本发明适用于可用于液化的任何谷物淀粉来源,例如已知可以产生适合于液化的淀粉的任何其它谷物或植物来源。
“颗粒淀粉”或“淀粉颗粒”指可食用谷物的水不溶性成分,该成分在去除外壳、纤维、蛋白质、脂肪、胚芽后保留下来的部分,并且在经过谷物湿磨方法所特有的浸泡、机械破裂、分离、筛选、逆流冲洗和离心步骤处理后可溶。颗粒淀粉包括含有,几乎是独占地含有压紧的淀粉分子(即支链淀粉和直链淀粉)的完整淀粉颗粒。在玉米中,颗粒淀粉成分含有大约99%淀粉;剩余1%包括蛋白质、脂肪、灰分、纤维素和与颗粒密切相关的微量成分。颗粒淀粉的填充物结构严重地阻碍了α-淀粉酶水解淀粉的能力。利用淀粉的胶凝化来破坏颗粒,以得到可溶性淀粉溶液且有助于酶水解。
“淀粉溶液”指水溶性胶凝淀粉,通过加热颗粒淀粉得到。一旦将颗粒加热到超过大约72℃,颗粒淀粉就溶解形成疏松淀粉分子的含水混合物。该混合物形成一种粘性水溶液,所述混合物,例如在黄色马齿种玉米中,包括大约75%支链淀粉和25%直链淀粉。“α淀粉酶”指裂解或水解α(1-4)糖苷键的酶活性,例如淀粉,支链淀粉或直链淀粉聚合物中的α(1-4)糖苷键。合适的α淀粉酶是天然存在的α淀粉酶,以及可用于淀粉液化中的重组或突变淀粉酶。例如,本发明也包括了在不同于野生型淀粉酶的pH或温度下,产生具有活性的变异淀粉酶的技术。
液化的温度范围通常是任何已知在液化淀粉中有效的液化温度。优选地,淀粉的温度介于大约80℃-大约115℃之间,更优选地介于大约100℃-大约110℃之间,最优选地介于大约105℃-大约108℃之间。
在一个实施方案中,本发明的信号序列是在鉴别新颖淀粉酶多肽后被鉴别的。蛋白质被分选,且转运到其适当细胞位置的途径是通过被称作蛋白质导向途径实现的。在所有这些导向系统中最重要的元件之一是称作信号序列的位于新合成的多肽的氨基末端上的短氨基酸序列。信号序列将蛋白质指向其在细胞中的适当位置,在转运过程中或者当蛋白质到达其最终目的地时被去除。大部分溶酶体、膜或分泌蛋白具有一个氨基末端信号序列,该信号标记它们转移到内质网的内腔中。该组中超过100种蛋白质的信号序列已经被确定。序列的长度在13-36个氨基酸残基之间。识别信号序列的各种方法对于本技术领域的普通技术人员而言是已知的。在一个实施方案中,通过一种被称作SignalP的方法来鉴别肽。SignalP使用综合神经网络来识别信号肽以及它们的裂解位点。(Nielsen,H.,Engelbrecht,J.,Brunalk,S.,von Heijne,G.,“Identification of prokaryotic and eukaryotic signal peptides andprediction of their cleavage sites.”Protein Engineering,第10卷,第1期,1-6页(1997),此处引用作为参考)。应该理解到,本发明的一些淀粉酶可以没有信号序列。可以期望包括编码信号序列的核酸序列,所述信号序列来自与一种不同淀粉酶的核酸序列可操作连接的淀粉酶,或任选地来自非淀粉酶蛋白的信号序列是期望的。表3显示了本发明的信号序列。
正如此处所用,短语“核酸”或“核酸序列”指寡核苷酸、核苷酸、多核苷酸,或指寡核苷酸、核苷酸、多核苷酸中任一种的片段,指基因组或合成来源的DNA或RNA,指肽核酸(PNA),或者指任何天然或合成来源的类似DNA或类似RNA的物质。
特定多肽或蛋白质的“编码序列”或“编码特定多肽或蛋白质的核苷酸序列”是当在置于适当调节序列控制下时被转录或翻译到多肽或蛋白质中的核酸序列。
术语“基因”指涉及产生多肽链的DNA片段;包括编码区之前和之后的区(前导区和非转录尾区),以及适当的时候,包括个体编码片段(外显子)之间的间插序列(内含子)。
正如此处所用,“氨基酸”或“氨基酸序列”指寡肽、肽、多肽或蛋白序列,或指寡肽、肽、多肽或蛋白序列中任意一种的片段、部分或亚单位,指天然分子或合成分子。
正如此处所用,术语“多肽”指通过肽键或修饰的肽键即肽等排物(peptide isostere)彼此连接在一起的氨基酸,并且可以含有除了20个由基因编码的氨基酸以外的修饰氨基酸。多肽可以通过任一种天然方法修饰,如翻译后加工,或通过本技术领域已知的化学修饰技术修饰。修饰可以发生在多肽中的任何地方,包括肽骨架、氨基酸侧链和氨基末端或羧基末端。应该意识到,在给定的多肽中,相同类型的修饰可以在数个位点以相同或变化的程度存在。而且,给定的多肽可以具有许多类型的修饰。这些修饰包括乙酰化作用、酰化作用、ADP-核糖基化作用、酰胺化作用、黄素的共价附着、亚铁血红素部分的共价附着、核苷酸或核苷酸衍生物的共价附着、脂质或脂质衍生物的共价附着、phosphytidylinositol的共价附着、交联环化、二硫键形成、脱甲基作用、共价交联的形成、半胱氨酸的形成、焦谷氨酸的形成、甲酰化作用、γ-羧化作用、糖基化作用、GPI锚形成、羟基化作用、碘化作用、甲基化作用、豆蔻酰化、氧化、pergylation、蛋白水解加工、磷酸化作用、异戊二烯化、外消旋作用、硒化作用(selenoylation)、硫酸化作用、t-RNA介导的将氨基酸加入到蛋白质的过程如精氨酰化。(参考Creighton,T.E.,Proteins-structure and Molecular Properties第二版,W.H.Freeman and Company,New York(1993);Posttranslational CovalentModification of Proteins,B.C.Johnson编著,Academic Press,New York,1-12页(1983))。
正如此处所用,术语“分离的”指物质离开其原始环境(例如,如果是天然存在的,则离开其天然环境)。例如,存在于活的动物体内的天然存在的多核苷酸或多肽不是分离的,但从天然系统中的一些或全部共存物质中分离出的相同多核苷酸或多肽是分离的。这样的多核苷酸可以是载体的一部分,和/或这样的多核苷酸或多肽可以是组合物的一部分,它们仍然是分离的,原因在于这些载体或组合物不是天然环境的一部分。
正如此处所用,术语“纯化的”不要求完全纯化;更确切地说,该术语是一个相对定义。来自文库的个体核苷酸已经被常规地纯化达到电泳同质性。来自这些克隆的序列不能直接从文库或者直接从总人DNA获得。本发明的纯化的核酸已经从微生物的基因组DNA的剩余物中纯化了至少104-106倍。然而,术语“纯化的”也包括已经从基因组DNA的剩余物或从文库或其它环境中的其它序列纯化了至少一个数量级的核酸,典型地是纯化了两个或三个数量级,更典型地是四个或五个数量级。
正如此处所用,术语“重组的”指核酸与“骨架”核酸相邻,而在其天然环境中与“骨架”核酸不是相邻的。另外,被“富集”的核酸表示核酸骨架分子群体中的核酸插入物达到5%或更多数量。根据本发明的骨架分子包括核酸,如表达载体、自我复制核酸、病毒、整合核酸和其它用于维持或操纵相关核酸插入物的载体或核酸。典型地,富集的核酸表示重组骨架分子群体中的核酸插入物达到15%或更多数量。更典型地,富集核酸表示重组骨架分子群体中的核酸插入物为50%或更多数量。在一个实施方案中,富集核酸表示重组骨架分子群体中的核酸插入物达到90%或更多数量。
“重组的”多肽或蛋白质指通过重组DNA技术产生的多肽或蛋白质;即,通过编码期望多肽或蛋白质的外源DNA构建物转化的细胞产生的多肽或蛋白质。“合成的”多肽或蛋白质是那些通过化学合成制备的多肽或蛋白质。也可以固相化学肽合成方法来合成本发明的多肽或片段。这些方法自从20世纪60年代早期在本技术领域就已经已知(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也可以参见Stewart,J.M.和Young,J.D.,Solid Phase Peptide Synthesis,第二版,Pierce Chemical Co.,Rockford,I11,11-12页)),并且最近已经被用于可通过商业途径获得的实验室肽设计和合成试剂盒(Cambridge ResearchBiochemicals)。这些可通过商业途径获得的实验室试剂盒通常使用了H.M.Geysen等人,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的教导,在大量“棒”或“针”的尖端上提供合成肽,所有棒或针与单个板子相连接。当使用这样的系统时,一个具有棒或针的板子被翻转,且插入到具有相应孔或容器的第二个板子中,所述孔或容器含有将适当氨基酸附着或固定到针或棒尖端的溶液。通过重复这一处理步骤,即将棒或针的尖端翻转且插入到适当溶液中,氨基酸就被构建到期望肽中。此外,可以得到数量众多的FMOC肽合成系统。例如,多肽或片段的装配可以使用Applied Biosystems,Inc.提供的Model 431A自动肽合成仪在固体载体上进行。该肽合成仪提供了现成获取本发明所述肽,或者通过直接合成或者通过合成一系列片段,这些片段可以使用其它已知技术偶联。
当起动启动子转录的RNA聚合酶将编码序列转录到mRNA中时,启动子序列与编码序列是“可操纵连接”的。
“质粒”由前面的小写字母“p”,和/或其后的大写字母和/或数字标明。此处的起始质粒或者通过商业途径获得,是不受限制地公开获得,或者可以用与公开方法一致的方法从可获得的质粒构建而来。另外,与此处所描述的质粒等效的质粒在本领域是已知的,对于普通技术人员而言是明了的。
DNA的“消化”指用仅在DNA中某些序列上发挥作用的限制酶催化裂解DNA。此处使用的各种限制酶是通过商业途径获得,其反应条件、辅因子和其它要求按照普通技术人员已知的那样使用。对于分析目的,通常在大约20μl缓冲液中,对于1μg质粒或DNA片段,大约使用2单位酶。对于分离DNA片段进行质粒构建的目的,通常在较大容器中用20-250单位酶消化5-50μg DNA。对于特定限制酶,由制造商详细说明所使用的适当缓冲液和底物的用量。一般使用37℃大约1小时的温育时间,但可以根据供应商提供的说明书有所变化。消化后,进行凝胶电泳来分离期望片段。
“寡核苷酸”或者指一个单链多脱氧核苷酸,或者指两个互补的多脱氧核苷酸链,它们可以化学合成。这样化学合成的寡核苷酸没有5’磷酸,因此在没有用ATP添加磷酸和存在激酶的情况下,不会与另一个寡核苷酸连接。合成寡核苷酸将与没有发生去磷酸化作用的片段连接。
在有关核酸或多肽的上下文中,词语“基本上同一的”指两个或更多序列,当进行最大对应的对比且对齐时,正如用已知的序列比较算法或通过视觉观察所测定的,所述序列具有至少50%,60%,70%,80%,在某些方面具有90-95%核苷酸或氨基酸残基同一性。典型地,基本上的同一性存在于至少大约100个残基的区域内,最普通地是序列在至少大约150-200个残基范围内是基本上同一的。在一些实施方案中,序列在整个编码区是基本上同一的。
另外,“基本上同一的”氨基酸序列是这样一个序列,即该序列通过一个或多个保守或非保守氨基酸取代、缺失或插入而与参考序列不同,尤其当这样的取代发生的位点不是分子的活性位点时,只要多肽实质上保留了其功能特性时。保守氨基酸取代,例如用一个氨基酸取代另一个同类氨基酸(例如用一个疏水氨基酸取代另一个疏水氨基酸,例如这些疏水氨基酸为异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸,或者用一个极性氨基酸取代另一个极性氨基酸,如用精氨酸取代赖氨酸,谷氨酸取代天冬氨酸,谷氨酰胺取代天冬酰胺)。一个或多个氨基酸可以被删除,例如从α淀粉酶多肽进行删除,导致多肽结构的修饰,而不会显著地改变其生物活性。例如,α淀粉酶生物活性不要求的氨基或羧基末端氨基酸可以被删除。本发明的修饰的多肽序列可以通过许多方法分析α淀粉酶生物活性,包括用α淀粉酶底物接触修饰的多肽序列,确定修饰的多肽是否在分析中降低了特定底物的量,或者是否增加了功能性α淀粉酶多肽与底物的酶反应的生物产物。
正如此处所用,“片段”是天然存在的蛋白质的一部分,其可以以至少两种不同的构象存在。片段可以具有与天然蛋白质相同或基本上相同的氨基酸序列。“基本上相同”指氨基酸序列大部分是相同的,但不是完全相同,但保持与其相关的序列的至少一种功能活性。通常如果两个氨基酸序列至少大约85%是同一的,那么这两个氨基酸序列是“基本上相同的”或“基本上同源的”。与天然蛋白质具有不同的三维结构的片段也包括在内。这样的一个例子是“前形式(pro-from)”分子,如可以通过裂解产生具有显著较高活性的成熟酶的具有较低活性的前蛋白。
“杂交”指一种过程,通过该过程核酸链通过碱基配对与互补链结合。杂交反应可以是敏感的,且是选择性的,这样相关的特定序列即使在其存在浓度非常低的样品中也能被识别出。合适的严格条件可以通过如下条件来确定,例如预杂交和杂交溶液中的盐或甲酰胺的浓度,或者通过杂交温度来确定,并且这些条件在本技术领域是已知的。尤其是,严格性的增加可以通过降低盐浓度、增加甲酰胺浓度或升高杂交温度实现。
例如,高度严格条件下的杂交可以于大约37℃-42℃和在大约50%甲酰胺中发生。杂交可以在降低的严格条件下发生,于大约30℃-35℃在大约35%-25%甲酰胺中发生。尤其是,杂交可以在高度严格条件下于发生,于大约42℃在50%甲酰胺、5X SSPE、0.3%SDS和200n/ml剪切且变性的鲑精DNA中发生。杂交可以在降低的严格条件下发生,正如上面所描述的,于降低的温度35℃在35%甲酰胺中发生。与特定严格性水平相应的温度范围可以通过计算相关核酸的嘌呤与嘧啶的比率并且相应地调节温度来进一步变窄。上述范围和条件的变化在本技术领域是已知的。
术语“变体(variant)”指在一个或多个碱基对、密码子、内含子、外显子或氨基酸残基(分别地)被修饰的本发明的多核苷酸或多肽,但仍然保留了本发明的α淀粉酶的生物活性。变体可以通过很多方法产生,这些方法包括,例如易错PCR、改组、寡核苷酸介导的诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归集团诱变(recursiveensemble mutagenesis)、指数集团诱变(exponential ensemblemutagenesis)、位点特异性诱变、基因再装配、GSSM及其任意组合。本发明也包括了产生,例如与野生型淀粉酶不同的pH或温度下具有活性的变体淀粉酶的技术。
酶是高度选择的催化剂。它们的特点是以微妙的立体、区域和化学选择性催化反应,这是传统合成化学难以匹敌的。而且,酶具有显著的多种用途。它们可以在有机溶剂中发挥作用,在极端pH(例如高pH和低pH)、极端温度(例如高温和低温)、极端盐度水平(例如高盐度和低盐度)下工作,且可以催化在结构上与其自然的生理学底物不相关的化合物的反应。
酶对于多种天然和非天然底物都有活性,从而能实质上修饰任何有机前导化合物。而且,与传统的化学催化剂不同,酶是高度对映选择和区域选择的。这些酶所表现出的高度官能基团特异性能使得人们追踪导致新活性化合物的合成序列中的每一反应。酶也能催化与它们的生理学功能本质上不相关的许多性质不同的反应。例如,过氧化物酶通过过氧化氢催化苯酚的氧化。过氧化物酶也能催化与该酶的天然功能不相关的羟基化反应。其它例子是催化多肽分解的蛋白酶。在有机溶液中,一些蛋白酶也可以催化糖的酰化,这是与这些酶的天然功能不相关的已知功能。
一方面,本发明包括液化含有组合物的淀粉的方法,所述方法包括将淀粉与本发明的多肽(例如,选自具有选自如下序列的氨基酸序列的纯化多肽:B组氨基酸序列;与至少一个B组氨基酸序列具有至少大约50%同源性的变体,在至少大约100个残基的区域内,正如通过用序列比较算法或通过视觉观察进行的分析所确定的那样;与任一个B组氨基酸序列互补的序列;和在至少大约100个残基的区域内与任一个B组氨基酸序列具有至少大约50%同源性的变体互补的序列,正如通过用序列比较算法或通过视觉观察进行的分析所确定的那样;和具有多肽的至少10个连续氨基酸的多肽,所述多肽具有选自B组氨基酸序列的序列)接触。在一个优选的实施方案中,多肽是B组氨基酸序列中所阐明的。淀粉可以来自选自如下的物质:稻米、发芽稻米、玉米、大麦、小麦、豆类和甘薯。此处也包括通过本发明的方法产生的葡萄糖糖浆。该糖浆可以是麦芽糖糖浆、葡萄糖糖浆或其组合。尤其是,与通过商业酶产生的糖浆相比,用本发明的淀粉酶产生的糖浆具有较高水平的DP2部分,较高水平的DP3(麦芽三糖和/或潘糖)和较少的大于DP7片段的片段。这与液化曲线相符合,这是由于在本发明的液化糖浆中有较少的大片段。
本发明也提供一种方法,用于从物质中去除含有淀粉的染料,该方法包括将该材料与本发明的多肽接触。一方面,本发明提供了一种洗涤目标物的方法,该方法包括将目标物与本发明的多肽在足以洗涤的条件下接触。例如,本发明的多肽可以作为去污剂添加剂被包括进相应产品中。本发明也包括一种用于织物脱浆的方法,该方法包括将织物与本发明的多肽在足以脱浆的条件下接触。
本发明也提供一种降低面包产品老化的方法,该方法包括将本发明的多肽在烘烤之前加入到面包产品中。
本发明也提供了一种处理木质纤维素的方法,其中用本发明的多肽以足以改进纤维特性的量处理纤维。本发明包括一种用于循环纸浆的酶法脱墨的方法,其中多肽以足以有效地使纤维表面脱墨的量使用。
此处描述的任何方法之一均包括添加第二种α-淀粉酶或者β-淀粉酶或者它们的组合物。适合与本发明的酶组合使用的商业淀粉酶或其它酶对于本技术领域的普通技术人员而言是已知的。
本发明也包括一种增加地层(subterranean formation)的采出液(production fluid)流动的方法,是通过去除生产操作过程中形成的和在地层中被发现的粘性、含淀粉的有损害性的液体(damaging fluid)而实现,这些液体包围完井井筒(completed well bore),包括允许采出液从井筒流出;降低从地层流出的采出液流动达到期望流速以下;通过将含水液体与本发明的多肽共混配制酶处理物;将酶处理物泵到井筒中的期望位置;允许酶处理物降解粘性、含淀粉的有损害性的液体,从而液体可以从地层移动到井表面;其中酶处理物可以有效地攻击含有淀粉的液体中的α糖苷键。
本发明利用了酶的一种独特的催化特性。尽管在化学转化中使用生物催化剂(即,纯化酶或者粗酶,非活细胞或者活细胞)通常需要鉴别与特定起始化合物反应的特定生物催化剂,本发明使用了选择的生物催化剂和反应条件,它们对于在许多起始化合物中存在的官能基团是特异的。
每种生物催化剂对于一种官能基团或者几种相关的官能基团是特异的,并且可以与含有该官能基团的许多起始化合物反应。
生物催化剂反应产生来自单一起始化合物的衍生物群体。这些衍生物可以被进行另一轮生物催化剂反应,以产生第二群衍生化合物。可以用生物催化剂衍生作用的每一次迭代产生成千上万种原始化合物的变化。
酶在起始化合物的特定位点反应,不影响该分子的其余部分,该过程用传统化学方法非常难以实现。这种高度的生物催化特异性提供了在文库中鉴别单一活性化合物的方法。文库的特征在于用于产生某种化合物的生物催化反应系列,所谓的“生物合成历史”。筛选文库的生物活性并且跟踪生物合成历史,就能够鉴别产生活性化合物的特定反应序列。重复反应序列,确定合成的化合物的结构。与其它合成和筛选方法不同,鉴别模式不需要固定化技术,可以使用实质上任何类型的筛选分析方法在溶液中以游离态合成且测试化合物。重要的是要注意到,酶在官能基团上的反应的高度特异性允许跟踪特定酶反应,这些反应形成生物催化产生的文库。
为基于表达而发现淀粉酶的目的,对λ噬菌体文库进行筛选有很多优点。这些优点包括改进对于毒性克隆的检测;改进对于底物的接近;降低对于对宿主进行遗传工程的需求;绕开对于任何由于文库的大规模删除所导致的偏见的潜能;以及在低克隆密度下的较快速生长。另外,在液相中筛选λ噬菌体文库相对于在固相中筛选而言有优势。这些优势包括:分析条件下更好的灵活性;额外的底物灵活性;对于弱克隆更高的灵敏度;以及易于自动化。
许多程序步骤是用机械自动化进行的,这样能完成大量生物催化反应,并且每天筛选被试验物,以及确保高水平的准确性和可再现性。这样的结果是,可以在几周内产生衍生化合物的文库,而该文库用当前的化学方法将需要数年才能产生。(关于分子修饰的进一步教导,包括小分子,参见PCT/US94/09174,将其完整引用于此作为参考)。
一方面,本发明提供了一种非随机方法,称作合成基因再装配(synthetic gene reassembly),这与随机改组有一些相关,只是核酸构件没有任意地被改组或被连接或被嵌合,而是被非随机性地装配。
合成基因再装配方法不依赖于将被改组的多核苷酸之间存在高度同源性。本发明可以被用于非随机地产生后代分子的文库(或集合),所述后代分子包括超过10100不同的后代嵌合体。令人信服地,合成基因再装配甚至能被用于产生包括超过101000不同的后代嵌合体的文库。因此,一方面,本发明提供了一种非随机方法,用于产生一组最终确定的嵌合核酸分子,这些分子具有由设计所选择的全装配顺序,该方法包括如下步骤:通过设计产生大量特定核酸构件,这些核酸构建具有可使用的相互兼容的可连接末端;装配这些核酸构件,从而可实现设计的总装配顺序。
如果将被装配的核酸构建的相互兼容的可连接末端能使构件以预定顺序被偶联,那么它们被认为对于这种类型的顺序装配是“可使用的”。因此,一方面,核酸构建可以被偶联的总装配顺序由可连接末端的设计确定,如果将使用多于一个装配步骤,那么核酸构建能被偶联的总装配顺序也将由装配步骤的顺序确定。在本发明的一个实施方案中,用酶处理退火的构件部分,例如连接酶(如,T4DNA连接酶)可以实现构件部分的共价键合。
在另一个实施方案中,核酸构件的设计是依据一组祖先核酸模板的序列分析获得的,模板用作产生最终确定的嵌合核酸分子的后代集合的基础。这些祖先核酸模板从而作为序列信息的来源,该序列信息核酸构件的设计,其将被诱变,例如被嵌合或改组。
在一个例证中,本发明提供了一个相关基因家族和它们的相关产物的编码家族的嵌合。在一个特定的例证中,被编码的产物是酶。本发明的淀粉酶,例如α-淀粉酶或碱性淀粉酶,可以根据此处描述的方法被诱变。
因此根据本发明的一个方面,大量祖先核酸模板的序列(例如A组核酸序列的多核苷酸)被对齐,以便选择一个或多个分界点,这些分界点可以被放置在一个同源区中。分界点可以被用来描述将要产生的核酸构件的边界。因此,在祖先分子中识别和选择的分界点在后代分子的装配中用作潜在的嵌合点。
典型地,可使用的分界点是由至少两个祖先模板共享的同源区(包括至少一个同源核苷酸碱基),但分界点可以是由至少一半的祖先模板,至少三分之二的祖先模板,至少四分之三的祖先模板,优选地最多所有祖先模板共享的同源区。甚至更优选地,可使用的分界点仍然是由所有祖先模板共享的同源区。
在一个实施方案中,基因再装配过程是彻底地进行的,以便产生详尽的文库。换句话说,核酸构件的所有可能的有序重组均存在于最终确定的核酸分子的集合中。同时,每一重组中的装配顺序(即每一最终确定的嵌合核酸的5’-3序列中的每一构件的装配顺序)是设计的(或者不是随机的)。由于该方法的非随机特性,大大降低了不必要的副产品的可能性。
在另一个实施方案中,该方法提供了,系统地进行基因再装配过程,例如以产生系统区室化的文库,该文库具有可以被系统性选择的区室,例如一个接一个顺序。换句话说,本发明提供了,通过有选择且明智地使用特定核酸构件,与有选择且明智使用的顺序阶段装配反应偶联,在几个反应容器中的每一个中获得后代产物的特定集合的场合,可以实现试验设计。这样可以允许进行系统地检验且筛选程序。因此,这允许潜在的大量后代分子以较小的组被系统地检验。
由于以高度灵活且详尽和系统的方式进行嵌合的能力,尤其是当祖先分子之间有低水平同源性时,本发明提供了产生一个包括大量后代分子的文库(或集合)。由于本发明的基因再装配发明的非随机特性,所产生的后代分子优选地包括一个最终确定的嵌合核酸分子的文库,这些核酸分子具有由设计所选择的总装配顺序。在一个特别的实施方案中,这样产生的文库包括超过103-超过101000个不同的后代分子种类。
一方面,正如所述所产生的最终确定的嵌合核酸分子的集合包括编码多肽的多核苷酸。根据一个实施方案,该多核苷酸是基因,可以是人工基因。根据另一个实施方案,该多核苷酸是基因途径,可以是人工基因途径。本发明提供了,由本发明所产生的一种或多种人工基因可以被整合到人工基因途径中,如在真核生物体(包括植物)中可操作的途径。
在另一个例证中,产生构件的步骤的合成特性允许设计且导入核苷酸(例如一个或多个核苷酸,它们可以是,例如密码子或内含子或调节序列),这些核苷酸随后可以以体外方法被任选地去除(例如通过诱变),或者以体内方法(例如通过利用宿主微生物的基因剪接能力)。应该意识到,在许多情况下,除了产生可使用的分界点的潜在益处之外,由于许多其它原因导入这些核苷酸也是期望的。
因此,根据另一个实施方案,本发明提供了,核酸构件可以被用来导入内含子。因此,本发明提供了,功能内含子可以被导入到本发明的人工基因中。本发明也提供了,功能内含子可以被导入到本发明的人工基因途径中。此外,本发明提供了嵌合多核苷酸的产生,该嵌合多核苷酸是含有一个(或多个)人工导入的内含子的人工基因。
另外,本发明也提供了嵌合多核苷酸的产生,该嵌合多核苷酸是含有一个(或多个)人工导入的内含子的人工基因途径。优选地,人工导入的内含子在一种或多种用于基因剪接的宿主细胞中起作用,主要以天然内含子在基因剪接中功能地发挥作用的方式进行。本发明提供了一种产生含内含子的人工多核苷酸的方法,这些多核苷酸将被导入到用于重组和/或剪接的宿主微生物中。
用本发明产生的人工基因也用作与另一种核酸重组的模板。同样地,用本发明产生的人工基因途径也用作与另一种核酸重组的模板。在一种优选的情况中,重组由含内含子的人工基因和用作重组配偶体的核酸之间的同源区促进,或者在该区发生。在一种特别优选的情况中,重组配偶体也是本发明产生的核酸,包括人工基团或人工基因途径。重组可以由存在于人工基因中的一个(或多个)人工导入的内含子的同源区促进,或者在该区发生。
本发明的核酸基因再装配方法使用了大量核酸构件,每一构件优选地具有两个可连接末端。每一核酸构件上的两个可连接末端可以是两个钝末端(即每一个没有核苷酸突出物),或者优选地一个钝末端和一个突出端,或者更优选地仍然是两个突出端。
对于该目的有用的突出端可以是3’突出端或5’突出端。因此,核酸构件可以具有3’突出端或可选择地5’突出端,或者可选择地具有两个3’突出端,或者可选择地具有两个5’突出端。核酸构件被装配以形成最终确定的嵌合核酸分子的总顺序由有目的的试验设计确定,不是随机的。
根据一个优选的实施方案,核酸构件是如下产生的:两个单链核酸(也称作单链寡核苷酸)的化学合成,并且将它们接触以允许它们退火形成一个双链核酸构件。
双链核酸构件的尺寸是可变化的。这些构件的尺寸可小可大。构件的优选尺寸的范围在1个碱基(不包括任何突出端)到100,000个碱基对(不包括任何突出端)之间。也提供了其它优选的尺寸范围,下限为1bp-10,000bp(包括1-10,000之间的每一个整数值),上限为2bp-100,000bp(包括2-100,000之间的每一个整数值)。
存在许多方法,通过这些方法可以产生对于本发明有用的双链核酸构件;并且这些方法在本技术领域是已知的,可以容易地由普通技术人员进行。
根据一个实施方案,双链核酸构件是如下产生的:首先产生两个单链核酸,然后允许它们退火形成双链核酸构件。双链核酸构件的两个链在除了任何形成突出端的核苷酸以外的每一核苷酸上可以是互补的;从而除了任何突出端以外不含有失配。根据另一个实施方案,双链核酸构件的两个链在除了任何形成突出端的核苷酸以外,即少于每一个核苷酸的部分是互补的。因此,根据该实施方案,双链核酸构件可以被用来导入密码子简并。优选地用此处描述的位点饱和诱变(Site-saturation mutagenesis)导入密码子简并,用一个或多个N,N,G/T盒子或也可以使用一个或多个N,N,N盒子进行。
本发明的体内重组方法可以根据特定多核苷酸或序列的未知杂交或等位基因库不受抑制地进行。然而,没必要知道特定多核苷酸的实际DNA或RNA序列。
在基因的混合群体内使用重组的方法可以用于产生任何有用的蛋白,例如白细胞介素I,抗体,组织型纤溶酶原激活物(tPA)和生长激素。该方法可用于产生具有改变的特异性或活性的蛋白质。该方法也可以用于产生杂交核酸序列,例如启动子区域、内含子、外显子、增强子序列、基因的3’未翻译区或5’未翻译区。因此该方法可以用于产生具有增强的表达率的基因。该方法也可以用于重复DNA序列的研究。最后,该方法可用于突变核酶或适体(aptamer)。
如此处所述,本发明的一个方面涉及使用还原重配、重组和选择的重复循环,这些循环允许通过重组完成高度复杂的线性序列的定向分子进化,如DNA、RNA或蛋白质。
分子的体内改组可用于提供变体,可以用细胞的天然特性进行,以重组多聚体。而体内重组已经提供了分子多样性的主要自然路线,基因重组保留了相对复杂的过程,该过程涉及1)同源性的识别;2)链裂解、链侵入和导致产生重组交叉的新陈代谢步骤;以及最后3)交叉分解为分离的重组分子。交叉的形成需要识别同源序列。
在另一个实施方案中,本发明包括一种方法,用于从至少第一个多核苷酸和第二个多核苷酸产生杂交多核苷酸。本发明也用于产生杂交多核苷酸,通过将共享至少一个部分序列同源区的第一个多核苷酸和第二个多核苷酸引导进入合适的宿主细胞来实现。部分序列同源区促进了导致产生杂交多核苷酸的序列再组织的过程。正如此处所用,术语“杂交多核苷酸”是用本发明的方法产生的任何核苷酸序列,其含有来自至少两个原始多核苷酸序列的序列。这样的杂交多核苷酸可以来自分子间重组事件,这些事件可以促进DNA分子之间的序列整合。另外,这样的杂交多核苷酸可以来自分子内还原重配过程,这些过程使用重复序列来改变DNA分子内的核苷酸序列。
本发明提供了一种产生杂交多核苷酸的方式,所述杂交多核苷酸可以编码生物活性的杂交多肽(例如杂交α淀粉酶)。一方面,原始多核苷酸编码生物活性多肽。本发明的方法通过使用细胞过程产生新的杂交多肽,这些过程整合原始多核苷酸的序列,以便产生杂交多核苷酸编码多肽,该多肽表现出来自原始生物活性多肽的活性。例如,原始多核苷酸可以编码来自不同微生物的特定酶。例如,来自生物体或变体的第一个多核苷酸编码的酶可以在特定环境条件如高盐度下有效地发挥作用。由来自不同生物体或变体的第二个多核苷酸编码的酶可以在不同的环境条件如极度高温下有效地发挥作用。含有来自第一个和第二个原始多核苷酸的序列的杂交多核苷酸可以编码酶,该酶表现出由原始多核苷酸编码的两种酶的特性。因此,由杂交多核苷酸编码的酶可以在由第一个和第二个多核苷酸编码的每一酶共有的环境条件下有效地发挥作用,例如高盐度和极端温度。
由本发明的多核苷酸编码的酶,包括但不限于,水解酶,如α淀粉酶和碱性淀粉酶。由本发明的方法产生的杂交多肽可以表现出原始酶没有显示的特定酶活性。例如,在编码水解酶活性的多核苷酸的重组和/或还原重配后,可以对所得到的由杂交多核苷酸编码的杂交多肽筛选来自每一原始酶的特定水解酶活性,即水解酶发挥作用的键类型和水解酶发挥作用的温度。因此,例如,可以对水解酶进行筛选以明确那些区分杂交水解酶与原始水解酶的化学功能性,例如(a)酰胺(肽键),即蛋白酶;(b)酯键,即淀粉酶和脂酶;(c)缩醛,即糖苷酶,以及例如,杂交多肽发挥作用的温度、pH或盐浓度。
原始多核苷酸来源可以分离自单个生物体(“分离物”),已经在合成培养基(“富集培养物”)中培养的生物体采集,或未培养的生物体(“环境样品”)。使用不依赖培养物的方法来获得来自环境样品的编码新颖生物活性的多核苷酸是最优选的,这是因为该方法允许得到未使用的生物多样性来源。
“环境文库”是从环境样品产生的,表示存储于克隆载体中的自然存在的生物体的集合基因组,所述克隆载体可以在合适的原核宿主中增殖。由于克隆DNA最初直接提取自环境样品,所以这些文库不限于可以在纯培养中生长的小的原核生物部分。此外,这些样品中存在的环境DNA的规格化可以允许从原始样品中存在的所有种类中更均等地呈现DNA。这可以显著地增加从样品的较少组成部分中找到相关基因的效率,与优势种相比,这些基因可以以数个数量级之低的数量存在。
例如,对从一种或多种未培养的微生物产生的基因文库进行筛选,以筛选相关活性。编码相关生物活性分子的潜在途径首先以基因表达文库的形式在原核细胞中被捕获。编码相关活性的多核苷酸分离自这样的文库,并且被导入到宿主细胞中。宿主细胞在这样的条件下生长,即可以促进产生具有新颖或增强活性的潜在活性生物分子的重组和或还原重配。
可以制备多核苷酸的微生物包括原核微生物,如真细菌(Eubacteria)和古细菌(Archaebacteria),和低级真核微生物如真菌,一些藻类和原生动物。多核苷酸可以分离自环境样品,在这种情况下不需要培养生物体就可以回收核酸,或者从一种或多种培养的生物体回收。一方面,这样的微生物可以是极端菌(extremophile),如高温菌(hyperthermophile)、嗜冷菌、嗜冷生物、嗜盐菌、嗜压微生物和嗜酸细菌。编码分离自极端菌的酶的多核苷酸是特别优选的。这样的酶可以如下条件下发挥作用:陆地温泉和深海热出口超过100℃的温度,北极水中低于0℃的温度,死海的饱和盐环境,煤沉积物和富含硫的地热温泉中pH大约为0,或者污水污泥中pH超过11。例如,用极端菌生物体克隆且表达的几种淀粉酶和脂酶在大范围的温度和pH下显示出高活性。
在本发明的许多新颖酶已经在40℃和50℃且pH为8的条件下,以及在40℃和50℃且pH为10的条件下被纯化且表征。而且发现于pH 8和40℃的条件下被纯化且表征得到的酶的比活性为地衣芽孢杆菌酶(B.lichenoformis)(228U/mg)的三倍(682U/mg)。此外发现另一种酶具有与地衣芽孢杆菌酶相当的比活性(250U/mg)。在pH 10和50℃的条件下,这些酶之一的比活性为31U/mg,另一种的比活性为27.5U/mg,而地衣芽孢杆菌酶的比活性为27U/mg。
正如上面所述选择且分离的多核苷酸被导入合适的宿主细胞中。合适的宿主细胞是能促进重组和/或还原重配的任何细胞。所选择的多核苷酸优选地已经在包括适当控制序列的载体中。宿主细胞可以是高级真核细胞,如哺乳动物细胞,或者是低级真核细胞,如酵母细胞,或者优选地,宿主细胞是原核细胞,如细菌细胞。将构建物导入宿主细胞可以由磷酸钙转染法、DEAE-葡聚糖介导转染法或者由电穿孔实现(Davis等人,1986)。
适当宿主的代表性实例可以有:细菌细胞,如大肠杆菌(E.coli)、链霉菌(Streptomyces)、鼠伤寒沙门氏杆菌(Salmonella typhimurium);真菌细胞,如酵母;昆虫细胞,如果蝇S2和草地夜蛾Sf9;动物细胞,如中国仓鼠卵巢细胞(CHO)、COS或Bowes黑素瘤;腺病毒;和植物细胞。根据此处的教导,适当宿主的选择被认为在本技术领域普通技术人员的范围内。
尤其参考各种可以被用来表达重组蛋白的哺乳动物细胞培养系统,哺乳动物表达系统的实例包括猴肾成纤维细胞的COS-7系,描述在“SV40-转染的猿细胞支持早期SV40突变体的复制”(Gluzman,1981),和能表达匹配载体的其它细胞系,例如C127,3T3,CHO,HeLa和BHK细胞系。哺乳动物表达载体将包括一个复制起点和合适的启动子和增强子,也包括任何必须的核糖体结合位点,聚腺苷酸化位点,剪接供体和受体位点,转录终止序列,和5’侧非转录序列。衍生自SV40剪接的DNA序列和聚腺苷酸化位点可以被用来提供所要求的非转录遗传元件。
含有相关多核苷酸的宿主细胞可以在传统的营养培养基中培养,该传统营养培养基被修饰以适合激活启动子、选择转化体或扩增基因。培养条件,如温度和pH等等,是先前选择用于表达的宿主细胞所用的那些条件,这些条件对于普通技术人员而言是显然的。然后可以对克隆进行测序,以识别编码具有增强活性的酶的多核苷酸序列,所述克隆被鉴别出具有特定的酶活性。
另一方面,应该预期到,本发明的方法可以被用来从一种或多种操纵子或基因簇或其部分产生编码生化途径的新颖多核苷酸。例如,细菌和许多真核生物具有一种可调节基因的谐调机制,所述基因的产物涉及相关过程。这些基因在单一染色体上是成簇的,这在结构上被称作”基因簇”,并且在单一调节序列的控制下被转录在一起,包括起动整个簇转录的单一启动子。因此,基因簇是一组邻接基因,它们通常由于其功能或者相同或者相关。由基因簇编码的生物化学途径的一个实例是聚酮化合物。聚酮化合物分子是生物活性的非常丰富的来源,包括抗生素(如四环素和红霉素),抗癌试剂(道诺霉素),免疫抑制剂(FK506和雷帕霉素),以及兽医产品(莫能菌素)。许多聚酮化合物(由聚酮化合物合酶制备)是有价值的治疗剂。聚酮化合物合酶是多功能的酶,其催化大量在官能度和环化作用的长度和方式上不同的碳链的生物合成。聚酮化合物合酶基因落入基因簇,至少一种类型(被指定为类型I)的聚酮化合物合酶具有大尺寸基因和酶,这使得遗传操纵和这些基因/蛋白的体外研究变得复杂化。
基因簇DNA可以从不同的生物体分离,且被连接到载体中,尤其是含有表达调节序列的载体,这些表达调节序列可以控制和调节从连接的基因簇制备可检测的蛋白质或蛋白质相关排列活性。使用对于外源DNA导入具有异常大容量的载体对于使用这样的基因簇是尤其适当的,此次通过实施例的方式对它们进行了描述,包括大肠杆菌的f因子(或者致育因子)。大肠杆菌的f因子是影响其在接合过程中高频转移的质粒,可以理想地获得且稳定地增殖大DNA片段,如来自混合微生物样品的基因簇。尤其优选的实施方案是使用克隆载体,被称作“fosmid”或细菌人工染色体(BAC)载体。它们来源于大肠杆菌f因子,能稳定地整合基因组DNA大片段。当用来自混合未培养的环境样品的DNA整合时,可以以稳定的“环境DNA文库”的形式获得大基因组片段。用于本发明中的另一种类型的载体是粘粒载体。粘粒载体最初被设计用来克隆且增殖基因组DNA的大片段。在Sambrook等人的Molecular Cloning:A Laboratory Manual,第二版,Cold SpringHarbor Laboratory Press(1989)中详细描述了克隆进粘粒载体的方法。一旦连接到适当载体中,两种或多种含有不同聚酮化合物合酶基因簇的载体可以被导入到合适的宿主细胞中。由基因簇共享的部分序列同源区将促进导致序列组构(reorganization)的过程,而序列组构导致杂交基因簇。然后对新颖杂交基因簇进行筛选,以筛选在原始基因簇中不存在的增强的活性。
因此,在一个实施方案中,本发明涉及一种方法,用于制备生物活性杂交多肽,对这样的多肽筛选增强的活性,是通过如下步骤:
1)引导可操作连接中的至少第一多核苷酸和可操作连接中的第二多核苷酸进入合适的宿主细胞,所述至少第一多核苷酸和第二多核苷酸共享至少一个部分序列同源区;
2)培养宿主细胞,培养条件是促进导致可操作连接中的杂交多核苷酸的序列组构;
3)表达由杂交多核苷酸编码的杂交多肽;
4)在促进鉴别增强生物活性的条件下筛选杂交多肽;和
5)分离编码杂交多肽的多核苷酸。
筛选各种酶活性的方法对于本技术领域的普通技术人员而言是已知的,并且在整个说明书中对这些方法进行了讨论。当分离本发明的多肽和多核苷酸时可以使用这些方法。
作为可以使用的表达载体的代表性实例有:病毒颗粒、杆状病毒、噬菌体、质粒、噬菌粒、粘粒、fosmid、细菌人工染色体、病毒DNA(例如牛痘、腺病毒、禽痘病毒、假狂犬病和SV40衍生物)、P1人工染色体、酵母质粒、酵母人工染色体以及任何其它对于相关特异宿主特异的载体(如芽孢杆菌属、曲霉属和酵母)。因此,例如DNA可以被包括在用于表达多肽的多种表达载体中的任一种中。这样的载体包括染色体、非染色体和合成DNA序列。大量合适的载体对于本技术领域普通技术人员是已知的,而且可以通过商业途径获得。通过实例的方式提供了下述载体;细菌的:pQE载体(Qiagen),pBluescript质粒,pNH载体,(λ-ZAP载体(Stratagene);ptrc99a,pKK223-3,pDR540,pRIT2T(Pharmacia);真核的:pXT1,pSG5(Stratagene),pSVK3,pBPV,pMSG,pSVLSV40(Pharmacia)。然而,可以使用任何其它质粒或其它载体,只要它们在宿主中是可复制的且能生存的。本发明可以使用低拷贝数量或高拷贝数量载体。
表达载体中的DNA序列与适当的表达控制序列(启动子)可操作地连接,以指导RNA合成。特定命名的细菌启动子包括lacI,lacZ,T3,T7,gpt,λPR,PL和trp。真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、来自反转录病毒的LTR启动子和小鼠金属硫蛋白-I启动子。适当载体和启动子的选择在本技术领域普通技术人员的水平范围内。表达载体也含有翻译起始和转录终止子的核糖体结合位点。载体也可以包括扩增表达的适当序列。可以用可选择的标记物从使用了氯霉素转移酶(CAT)载体或其它载体的任何期望的基因选择启动子区。另外,表达载体优选地含有一种或多种可选择的标记物基因,以便为转化的宿主细胞的选择提供表型特征,如真核细胞培养的二氢叶酸还原酶或新霉素抗性,或者如大肠杆菌中的四环素或氨苄青霉素抗性。
体内重配集中于“分子间”过程,这些过程被集体称作“重组”,在细菌中通常称作“RecA依赖”现象。本发明依赖于宿主细胞的重组过程来重组和重配序列,或者细胞的能力来介导还原过程以通过缺失在细胞中降低准重复序列的复杂性。“还原重配”的过程通过“分子内”,是不依赖RecA的过程。
因此,在本发明的另一方面,新颖多核苷酸可以通过还原重配方法产生。该方法涉及产生含有连续序列(原始编码序列)的构建物,将这些构建物插入到适当的宿主中,随后导入适当的宿主细胞中。单个分子同一性的重配通过具有同源区的构建物中的连续序列之间或者准重复单元之间的组合过程发生。重配过程重组和/或降低重复序列的复杂性和程度,导致产生新颖的分子种类。可以使用多种处理以提高重配率。这些处理包括用紫外灯、DNA损伤化合物和/或使用显示出增强水平的“遗传不稳定性”的宿主细胞系处理。因此,重配过程可以涉及同源重组或准重复序列的自然特性,以指导它们自身的进化。
重复或“准重复”序列在遗传不稳定性中发挥着作用。在本发明中,“准重复”是不限于其原始单元结构的重复。准重复单元可以表现为构建物中的序列排列;小序列的连续单元。一旦连接,连续序列之间的连接处就变得基本上看不见,所得到的构建物的准重复性质现在在分子水平是连续的。细胞进行缺失过程以降低所产生的构建物复杂性的缺失过程会在准重复序列之间进行操作。准重复单元提供实际上无限的模板清单,滑动事件可以在模板上发生。因此含有准重复的构建物可以有效地提供足够的分子弹性(molecular elasticity),缺失(和潜在的插入)事件实质上可以在准重复单元内的任何地方发生。
当准重复序列以相同方向被全部连接时,例如头尾相接或反之,细胞就不能区分单个单元。因此,还原过程可以在整个序列中发生。相反,当例如单元以头对头呈现而不是以头对尾呈现时,倒置描绘了相邻单元的末端,这样缺失形成将有助于不连续单元的损失。因此,用本发明方法优选的是序列以相同方向。准重复序列的随机方向将导致重配效率的损失,而序列的一致方向将提供最高效率。然而,尽管在相同方向具有较少的邻接序列降低了效率,但它仍然可以为有效回收新颖分子提供充分的弹性。可以在相同方向上用准重复序列获得构建物,以提供更高的效率。
序列可以用多种方法中的任一种以头对尾的方向装配,包括如下:
a)可以使用包括聚腺苷酸头(poly-A)和聚胸苷酸尾(poly-T)的引物,当获得单链时它们可以提供方向。这是通过具有从RNA获得的最初几个碱基实现的,因此易于RNAseH去除。
b)可以使用包括独特限制裂解位点的引物。将需要多个位点、一组独特序列和重复的合成和连接步骤。
c)引物的内部少许碱基可以被硫醇化,核酸外切酶用于产生适当的有尾分子。
重配序列的回收依赖于用还原重复指数(RI)鉴别克隆载体。然后通过扩增回收重配编码序列。产物被再克隆且被表达。具有还原RI的克隆载体的回收受如下因素影响:
1)使用只有当构建物的复杂性降低时才稳定地维持的载体。
2)用物理方法物理回收缩短的载体。在这种情况下,将用标准质粒分离方法回收克隆载体,在琼脂糖凝胶上,或者用标准方法在具有低分子量临界的柱上进行大小分级。
3)回收含有断裂基因的载体,当插入物大小降低时可以选择断裂基因。
4)用表达载体和适当的选择使用直接选择技术。
从相关生物体编码序列(例如基因)可以表明高度同源水平,并且编码变化相当多的蛋白产物。这些类型的序列尤其可以在本发明中用作准重复序列。然而,尽管下面举例说明的实施例表明几乎相同的原始编码序列(准重复序列)的重配,但该方法不限于这些几乎相同的重复序列。
下面的实例说明了本发明的方法。描述了衍生于三(3)个独特种类的编码核酸序列(准重复序列)。每一序列编码具有不同特性组的蛋白质。每一序列在序列中的独特位置上通过一个或几个碱基对而不同。准重复序列被单独或整体扩增,并且连接到随机装配中,这样可以在连接分子群体中获得所有可能的排列和组合。准重复单元的数量可以通过装配条件来控制。构建物中准重复单元的平均数量被定义为重复指数(RI)。
构建物一旦形成,就可以根据出版的协议在琼脂糖凝胶上进行大小分级,或者不进行大小分级,被插入克隆载体,转染到适当宿主细胞中。然后细胞被增殖,进行“还原重配”。如果需要,还原重配率可以通过导入DNA损伤来刺激。RI的降低是通过“分子内”机制由重复序列间的缺失形成来介导,还是通过“分子间”机制由类似于重组的事件来介导是不重要的。最终结果是分子被重配到所有可能的组合中。
任选地,该方法包括一个额外步骤,即筛选改组池的文库成员以鉴别单个改组文库成员,所要鉴别的单个改组成员具有结合或相互作用或催化具有预定大分子的特定反应(如酶的催化域),例如蛋白质受体、寡糖、病毒或其它预定化合物或结构。
从这些文库中鉴别出的多肽可以用于治疗、诊断、研究和相关用途(例如催化剂、增加水溶液的摩尔渗透压浓度的溶质,等等),和/或可以经受一次或多次额外的改组和/或选择循环。
另一方面,应该想象到,在重组或重配之前或期间,用本发明的方法产生的多核苷酸可以经受促进将突变导入原始多核苷酸的试剂或方法的处理。这些突变的导入将增加所得到的杂交多核苷酸和由此所编码的多肽的多样性。促进诱变的试剂或方法包括但不限于:(+)-CC-1065,或者一种合成类似物如(+)-CC-1065-(N3-腺嘌呤(参见Sun和Hurley,(1992);能抑制DNA合成的N-乙酰化或脱乙酰化4’-氟-4-氨基联苯加成物(例如参见van de Poll等人(1992));或能抑制DNA合成的N-乙酰化或脱乙酰化4’-氨基联苯加成物(例如参见van de Poll等人(1992),751-758页);三价铬、三价铬盐、能抑制DNA复制的多环芳族烃(PAH)DNA加成物,如7-溴甲基-苯[a]蒽(“BMA”),三(2,3-二溴丙基)磷酸盐(“Tris-BP”),1,2-二溴-3-氯丙烷(“DBCP”),2-溴丙烯醛(2BA),苯并[a]芘-7,8-二氢二醇-9-10-环氧化物(“BPDE”),铂(II)卤盐,N-羟基-2-氨基-3-甲基咪唑[4,5-f]-喹啉(“N-羟基-IQ”),和N-羟基-2-氨基-1-甲基-6-苯基咪唑[4,5-f]-吡啶(“N-羟基-PhIP”)。减慢或暂停PCR扩增的尤其优选的方法包括UV光(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)。尤其包括的方法是DNA加成物或来自多核苷酸或多核苷酸池的含有DNA加成物的多核苷酸,可以用一种方法来释放或去除,该方法包括在进一步处理之前加热含有多核苷酸溶液。
另一方面,本发明涉及一种制备具有生物活性的重组蛋白质的方法,通过处理含有编码野生型蛋白质的双链模板多核苷酸样品,条件是根据本发明能提供杂交或重配多核苷酸产生的条件。
本发明也提供使用专用密码子引物(含有简并N,N,N序列)引导点突变进入多核苷酸,以便产生一组后代多肽,其中全长的单一氨基酸取代体现在每一氨基酸位置上(基因位点饱和诱变(GSSM))。所用的寡核苷酸连续地包括第一同源序列、简并N,N,N序列和优选地但不是必须的第二同源序列。使用这样的寡核苷酸得到的下游后代翻译产物在每一氨基酸位点沿着多肽包括所有可能的氨基酸变化,这是因为N,N,N序列的简并包括所有20个氨基酸的密码子。
一方面,一个这样的简并寡核苷酸(包括一个简并N,N,N盒子)被用于使亲本寡核苷酸模板上的每一原始密码子经受全长密码子取代。另一方面,使用至少两个简并N,N,N盒子-或者在相同寡核苷酸上或者不是,用于使亲本寡核苷酸模板上的至少两个原始密码子经受全长密码子取代。因此,在一个寡核苷酸中可以含有多于一个N,N,N序列,以便在多于一个位点上引入氨基酸突变。大多数N,N,N序列可以直接邻接,或者被一个或多个额外的核苷酸序列分离。另一方面,可以单独使用可用于引入添加和缺失的寡核苷酸,或者与含有N,N,N序列的密码子组合使用,以便引导氨基酸添加、缺失和/取代的任何组合或排列。
在一个特别的例证中,用寡核苷酸同时诱变两个或多个连续氨基酸位置是可能的,所述寡核苷酸含有连续的N,N,N三联体,即简并(N,N,N)n序列。
另一方面,本发明提供使用比N,N,N序列具有较低简并性的简并盒子。例如,在某些情况下期望使用(例如在一个寡核苷酸中)仅包括一个N的简并三联体序列,其中所述N可以是三联体的,第一,第二或第三位置。包括其任何组合和排列的任何其它碱基可以被用在三联体的其余两个位置上。另外,在某些情况下期望使用(例如在一个寡核苷酸中)简并N,N,N三联体序列,N,N,G/T,或N,N,G/C三联体序列。
然而,应该理解到,由于好几个原因,使用本发明中所公开的简并三联体(如N,N,G/T,或N,N,G/C三联体序列)是有利的。一方面,本发明提供一种方法,该方法可以系统地且非常简单地产生可能氨基酸(对于总共20个氨基酸而言)到多肽中每一氨基酸位置的全长取代。因此,对于100个氨基酸多肽,本发明提供一种途径,来系统且非常简单地产生2000个不同种类(即每个位置20个可能的氨基酸乘以100个氨基酸位置)。应该理解到,通过使用含有简并N,N,G/T或N,N,G/C三联体序列的寡核苷酸,提供了32个编码20个可能氨基酸的单一序列。因此,在反应容器中,其中用这样的寡核苷酸使亲本多核苷酸序列经受饱和诱变,产生了32个编码20个不同多肽的不同后代多核苷酸。相反,在定点诱变中使用非简并寡核苷酸导致每一反应容器仅有一个后代多肽产物。
本发明也提供了使用非简并寡核苷酸,它们可以被任选地与所公开的简并引物组合使用。应该预期到,在某些情况下,在工作寡核苷酸中使用非简并寡核苷酸来产生特异性点突变是有利的。这提供了一种方式,用于产生特异性沉默点突变,导致相应氨基酸变化的点突变,引起终止密码子和多肽片段的相应表达的点突变。
因此,在本发明的一个优选实施方案中,每一饱和诱变反应容器包括编码至少20个后代多肽分子的多核苷酸,这样所有20个氨基酸被表示在与在亲本多核苷酸中诱变的密码子位置相应的特异性氨基酸位置上。从每一饱和诱变反应容器产生的32倍简并后代多肽可以经受克隆扩增(例如用表达载体克隆进合适的大肠杆菌中),并且经受表达筛选。当通过筛选鉴别出单个后代多肽在特性上显示出有利变化时(当与亲本多核苷酸相比较),可以对其进行测序以鉴别被包含在其中的相应的有利氨基酸取代。
应该理解到,一旦用此处所公开的饱和诱变在亲本多肽上诱变每一氨基酸位置,可以在多于一个氨基酸位置上鉴别出有利的氨基酸变化。可以产生一个或多个新颖后代分子,它们含有这些有利的氨基酸取代的全部或部分的组合。例如,如果在多肽中3个氨基酸位置中的每一位置上鉴别出2个特定的有利氨基酸变化,那么排列包括每一位置(与原始氨基酸没有变化,和两个有利变化中的每一个)和3个位置上的3种可能性。因此,有3x 3x 3或27种总可能性,包括先前检验的7种-6个单一点突变(即三个位置的每一位置上2个)并且任何位置上都没有变化。
仍然在另一方面,位点饱和诱变可以与改组、嵌合、重组和其它诱变过程连同筛选一起使用。本发明提供了以迭代方式使用任何诱变过程,包括饱和诱变。在一个例证中,任何诱变过程的迭代用途被用于与筛选组合使用。
因此,在一个非限定性例证中,本发明提供了饱和诱变与其它诱变过程的组合使用,如两个或多个相关多核苷酸被导入合适的宿主细胞的过程,以便通过重组和还原重配产生杂交多核苷酸。
除了沿着基因的整个序列进行诱变,本发明提供了,可以用诱变在多核苷酸序列中取代大量碱基中的每一个,其中将被诱变的碱基数量优选地是15-100,000之间的每一整数。因此,代替沿着分子诱变每一位置,可以使每一或离散数量的碱基(优选地总数在15-100,000之间的子集)经受诱变。优选地,分离的核苷酸被用于沿着多核苷酸序列诱变每一位置或一组位置。将被诱变的一组3个位置可以是密码子。优选地用含有异种盒子的诱变引物导入突变,也被称作诱变盒子。优选的盒子具有1-500个碱基。这样的异种盒子中的每一核苷酸位置是N,A,C,G,T,A/C,A/G,A/T,C/G,C/T,G/T,C/G/T,A/G/T,A/C/T,A/C/G,或E,其中E是不是A,C,G或T的任何碱基(E可以被称作设计者寡核苷酸)。
通常意义而言,饱和诱变包括在将被诱变的确定多核苷酸序列(其中将被诱变的序列的长度优选地在大约15-100,000个碱基之间)中诱变一组完整的诱变盒子(其中每一盒子的长度优选地为大约1-500个碱基)。因此,一组突变(1-100个突变)被导入将被诱变的每一盒子中。在应用一轮饱和诱变的过程中,将被导入盒子的突变的分组可以与将被导入第二个盒子的突变的分组不同或相同。这样的分组的例证为缺失、添加、特定密码子的分组和特定核苷酸盒子的分组。
将被诱变的已知序列包括全基因、途径、cDNA、整个开放阅读框(ORF)和整个启动子、增强子、阻遏物/反式激活蛋白、复制起点、内含子、操纵子、或任何多核苷酸官能基团。通常,用于该用途的”确定序列”可以是任何多核苷酸,15个碱基多核苷酸序列和长度在15个碱基到15,000个碱基之间的多核苷酸序列(本发明特别是指15-15,000之间的每一整数)。选择密码子分组要考虑的因素包括由简并诱变盒子编码的氨基酸类型。
在一个尤其优选的例证中,可以被导入诱变盒子的突变的分组,本发明特别地提供了在每一位置上编码2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19和20个氨基酸的简并密码子取代(使用简并寡核苷酸),和由它们编码的多肽文库。
本发明的另一个方面是已知分离的核酸,其包括A组核酸序列中、与其基本上同一的序列、与其互补的序列的一个序列,或者包括一个片段,其包括A组核酸序列(或与其互补的序列)的序列之一的至少10,15,20,25,30,35,40,50,75,100,150,200,300,400或500个连续碱基。分离的核酸可以包括DNA,这包括cDNA、基因组DNA和合成DNA。DNA可以是双链或单链的,如果单链可以是编码链或非编码(反义)链。另外,分离的核酸可以包括RNA。
正如下面所详细讨论的,A组核酸序列和与其基本上同一的序列的序列之一的分离的核酸可以被用于制备B组氨基酸序列和与其基本上同一的序列的多肽之一,或者含有B组氨基酸序列和与其基本上同一的序列的多肽之一的至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。
另外,本发明的另一方面是一种分离的核酸,其编码B组氨基酸序列和与其基本上同一的序列的多肽之一,或者含有B组氨基酸序列的多肽之一的至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。作为遗传密码子的冗余或简并的结果,这些核酸的编码序列可以与A组核酸序列的核酸之一的编码序列之一、或其片段相同,或者可以是不同的编码序列,其编码B组氨基酸序列和与其基本上同一的序列的多肽之一,或者含有B组氨基酸序列多肽之一的至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。遗传密码子对于本技术领域的普通技术人员而言是已知的,而且可以获得,例如在B.Lewin,Genes VI,Oxford UniversityPress,1997的第214页,将其公开内容引用于此作为参考。
编码B组氨基酸序列和与其基本上同一的序列的分离的核酸包括但不限于:仅包括A组核酸序列和与其基本上同一的序列的序列之一的编码序列,和其它编码序列,如前导序列或前蛋白序列和非编码序列,如内含子或编码序列的5’和/或3’非编码序列。因此,正如此处所用,术语“编码多肽的多核苷酸”包括,仅包括多肽的编码序列的多核苷酸,和包括其它编码和/或非编码序列的多核苷酸。
另外,A组核酸序列和与其基本上同一的序列的核酸序列可以用传统技术来诱变,如定点诱变,或者对于本技术领域普通技术人员熟悉的其它技术,以便引导沉默变化进入A组核酸序列和与其基本上同一的序列的多核苷酸中。正如此处所用,“沉默变化”包括,例如不改变由多核苷酸编码的氨基酸序列的变化。这样的变化可能是期望的,以便通过引导密码子或密码子对增加由含有编码多肽的载体的宿主细胞产生的多肽的水平,这在宿主生物体中频繁发生。
本发明也涉及具有核苷酸变化的多核苷酸,这些变化在B组氨基酸序列和与其基本上同一的序列的多肽中导致氨基酸取代、添加、缺失、融合和平截。这样的核苷酸变化可以使用诸如定点诱变、随机化学诱变、核酸外切酶III缺失和其它重组DNA技术来引入。另外,这样的核苷酸变化可以是自然发生的等位基因变体,它们通过鉴别核酸被分离,所述核酸与包括A组核酸序列和与其基本上同一的序列(或与其互补的序列)的序列之一的至少10,15,20,25,30,35,40,50,75,100,150,200,300,400或500个连续碱基的探针在此处提供的高度严格、中度严格或低度严格条件下特定地杂交。
A组核酸序列、和与其基本上同一的序列、与其互补的序列的分离的核酸,或含有A组核酸序列、和与其基本上同一的序列、与其互补的序列的序列之一的至少10,15,20,25,30,35,40,50,75,100,150,200,300,400或500个连续碱基的片段,也可以被用作探针来确定生物样品如土壤样品是否含有具有本发明的核酸序列的生物体或可以从其得到核酸的生物体。在这样的方法中,可以得到潜在的含有从其可以得到核酸的生物体的生物样品,并且可以从该样品得到核酸。将核酸与探针接触,条件是允许探针与样品中存在的任何互补序列特定地杂交。
在必要时,允许探针与任何互补序列特定地杂交的条件可以通过将探针与来自样品的互补序列接触来确定,所述样品已知含有互补序列和对照序列,对照序列不含有互补序列。杂交条件,如杂交缓冲液的盐浓度,杂交缓冲液的甲酰胺浓度,或者杂交温度可以发生变化,以鉴别允许探针与互补核酸特定地杂交的条件。
如果样品含有生物体,从这些生物体可以得到核酸,然后检测探针的特定杂交。可以通过用可检测试剂标记探针来检测杂交.这些可检测试剂如放射性同位素、荧光染料、或能催化可检测产物形成的酶。
许多使用已标记的探针来检测样品中互补核酸的存在的方法对于本技术领域的普通技术人员是熟悉的。这些方法包括Southern印迹、Northern印迹、克隆杂交方法和斑点印迹。每一种这些方法的程序由Ausubel等人,Current Protocols in Molecular Biology,John Wiley 503Sons,Inc.(1997)以及Sambrook等人,Molecular Cloning:A LaboratoryManual第二版,Cold Spring Harbor Laboratory Press(1989)提供,这些参考文献被完整引用于此作为参考。
另外,多于一个探针(至少能与核酸样品中存在的任何互补序列特定地杂交的探针)可以被用于扩增反应中以确定样品是否含有包括本发明的核酸序列的生物体(例如从中可以得到核酸的生物体)。典型地,探针包括寡核苷酸。在一个实施方案中,扩增反应可以包括PCR反应。PCR程序描述在Ausubel和Sambrook的文献中,见上文。另外,扩增可以包括连接酶链式反应、3SR、或链置换反应。(参见Barany,F.,“The Ligase Chain Reaction in a PCR World”,PCR方法和应用1:5-16,1991;E.Fahy等人,“Self-sustained Sequence Replication(3SR):AnIsothermal Transcription-Based Amplification System Alternative to PCR”,PCR方法和应用1:25-33,1991;和Walker G.T.等人,“StrandDisplacement Amplification-an Isothermal in vitro DNA AmplificationTechnique”,Nucleic Acid Research 20:1691-1696,1992,将这些参考文献引用于此作为参考)。在这样的方法中,将样品中的核酸与探针接触,进行扩增反应,并且检测任何所得到的扩增产物。扩增产物可以通过在反应产物上进行凝胶电泳并且用嵌入剂(interculator)如溴化乙锭染色凝胶来检测。另外,可以用放射性同位素来标记一个或多个探针,在凝胶电泳后通过射线自显影术检测是否存在放射性扩增产物。
来自接近A组核酸序列和与其基本上同一的序列的序列末端的序列的探针也可以用在染色体步移方法中,以鉴别含有基因组序列的克隆,所述基因组克隆位于与A组核酸序列和与其基本上同一的序列临近的位置。这样的方法允许来自宿主生物体的编码其它蛋白质的基因的分离。
A组核酸序列、和与其基本上同一的序列、与其互补的序列的分离的核酸,或者含有A组核酸序列、和与其基本上同一的序列、或与其互补的序列的序列之一的至少10,15,20,25,30,35,40,50,75,100,150,200,300,400或500个连续碱基的片段,可以被用作探针,以鉴别和分离相关核酸。在一些实施方案中,相关核酸可以是来自生物体的cDNA或基因组DNA,而不是可以从中分离核酸的生物体。在这样的方法中,将核酸样品与探针接触,条件是允许探针与相关序列特定地杂交。然后用上面所描述的任一种方法检测探针与来自相关生物体的核酸的杂交。
在核酸杂交反应中,用于获得特定严格水平的条件可以有所变化,这依赖于将被杂交的核酸的性质。例如,在选择杂交条件时可以考虑核酸杂交区的长度、互补程度、核苷酸序列组成(例如GC和AT含量)和核酸类型(例如RNA和DNA)。其它的考虑因素是核酸之一是否被固定化,例如固定化在滤器上。
杂交可以在低度严格、中度严格或高度严格条件下进行。作为核酸杂交的一个实例,含有被固定化的变性核酸的高分子膜被首先于45℃在溶液中预杂交30分钟,所述溶液含有0.9M NaCl、50mMNaH2PO4、pH 7.0、5.0mM Na2EDTA、0.5%SDS、10X Denhardt’s溶液和0.5mg/ml多核糖腺苷酸。然后将大约2X107cpm(比活性4-9X108cpm/μg)的P末端标记的寡核苷酸探针加入到上述溶液中。温育12-16小时后,用含有0.5%SDS的1X SET(150mM NaCl、20mM三氢氯化物、pH 7.8、1mM Na2EDTA)中于室温下将膜冲洗30分钟.随后用对于寡核苷酸探针而言为Tm-10℃的新鲜1X SET冲洗30分钟。然后将膜暴露于放射自 显影薄膜以检测杂交信号。
通过改变用于鉴别核酸杂交条件的严格性,所述核酸如cDNA或基因组DNA,其与可检测到的探针杂交,可以鉴别且分离与探针具有不同同源性水平的核酸。通过在低于探针的解链温度的变化温度下完成杂交来改变严格性。解链温度Tm是指,在该温度下(在已知的离子强度和pH下)50%的靶序列与优选的互补探针杂交。对于特定探针,选择非常严格的条件为等于5℃或比Tm低大约5℃。探针的解链温度可以用如下公式计算:
对于长度在14-70个核苷酸之间的探针,解链温度(Tm)的计算公式为:Tm=81.5+16.6(log[Na+])+0.41(分数G+C)-(600N),其中N是探针的长度。
如果杂交是在含有甲酰胺的溶液中完成的,解链温度的计算公式为:Tm=81.5+16.6(log[Na+])+0.41(分数G+C)-(0.63%甲酰胺)-(600/N),其中N是探针的长度。
预杂交可以在6X SSC、5X Denhardt’s试剂、0.5%SDS、100μg变性断裂鲑精DNA或6X SSC、5X Denhardt’s试剂、0.5%SDS、100μg变性断裂鲑精DNA、50%甲酰胺中进行。对于SSC和Denhardt’s溶液的阐述罗列在Sambrook等人的文献中,见上文。
通过将可检测探针加入到上面所罗列的预杂交溶液中完成杂交。其中探针包括双链DNA,它在加入到杂交溶液之前被变性。将滤器与杂交溶液接触足够长的时间,以允许探针与含有与其互补的序列或与其同源的序列的cDNA或基因组DNA杂交。多于长度超过200个核苷酸的探针,杂交可以在低于Tm的15-25℃进行。低于较短的探针,如寡核苷酸探针,杂交可以在低于Tm的5-10℃进行。典型地,对于在6X SSC中进行的杂交,杂交在大约68℃进行。通常,对于在含有50%甲酰胺的溶液中进行的杂交,杂交在大约42℃进行。
前述所有杂交将在高度严格条件下考虑。
杂交后,冲洗滤器以去除任何没有特定结合的可检测探针。用于冲洗滤器的严格性也可以变化,依赖于将被杂交的核酸的性质、将被杂交的核酸的长度、互补程度、核苷酸组成(例如GC和AT含量)和核酸类型(例如RNA和DNA)。逐渐增加的严格性条件的实例如下:2X SSC、0.1%SDS于室温下15分钟(低严格性);0.1X SSC、0.5%SDS于室温下30分钟到1小时(中度严格性);0.1X SSC、0.5%SDS在杂交温度和68℃之间15-30分钟(非常高的严格性)。最终的低严格性冲洗可以在0.1X SSC中于室温下进行。上述实例仅仅是对可用于冲洗滤器的一组条件的例证性说明。本技术领域的普通技术人员将知道对于不同的严格性冲洗有许多方法。下面给出了一些其它的实例。
通过放射自显影术或其它传统技术来鉴别已经与探针杂交的核酸。
可以对上述方法进行修正以鉴别与探针序列具有降低水平的同源性的核酸。例如,为了获得与可检测探针具有降低的同源性的核酸,可以使用较低的严格条件。例如,杂交温度可以在具有大约1M Na+浓度的杂交缓冲液中以5℃的增量从68℃降低到42℃。杂交后,在杂交温度下用2X SSC,0.5%SDS冲洗滤器。高于50℃的条件被认为是”中度”条件,低于50℃被认为是”低度”条件。”中度”杂交条件的一个特定实例是当上述杂交在55℃完成时。”低度严格性”杂交条件的一个特定实例是当上述杂交在45℃完成时。
另外,杂交可以于42℃在缓冲液中进行,如含有甲酰胺的6X SSC。在这种情况下,杂交缓冲液中的甲酰胺浓度可以以5%的增量从50%降低到0%,以鉴别与探针具有降低水平的同源性的克隆。杂交后,于50℃用6X SSC,0.5%SDS冲洗滤器。高于25%的甲酰胺被认为是”中度”条件,低于25%的甲酰胺被认为是“低度”条件。“中度”杂交条件的一个特定实例是当上述杂交在30%的甲酰胺中完成时。“低度严格性”杂交条件的一个特定实例是当上述杂交在10%的甲酰胺中完成时。
例如,可以用前述方法来分离核酸,所述核酸具有与选自如下序列的核酸序列具有至少大约97%,至少95%,至少90%,至少85%,至少80%,至少70%,至少65%,至少60%,至少55%或至少50%同源性的序列:A组核酸序列和与其基本上同一的序列,或包括其至少大约10,15,20,25,30,35,40,50,75,100,150,200,300,400或500个连续碱基的片段,和与其互补的序列。用对齐算法来测定同源性。例如,同源的多核苷酸可能具有一个编码序列,该编码序列是此处描述的编码序列之一的天然存在的等位基因变体。与A组核酸序列或与其互补的序列的核酸相比,这样的等位基因变体可能具有一个或多个核苷酸的取代、缺失或添加。
另外,上述方法可以用于分离编码多肽的核酸,所述多肽与具有如下序列之一的序列的多肽具有至少大约99%,95%,至少90%,至少85%,至少80%,至少75%,至少70%,至少65%,至少60%,至少55%或至少50%同源性的序列:B组氨基酸序列和与其基本上同一的序列,或包括其至少大约5,10,15,20,25,30,35,40,50,75,100或150个连续碱基的片段,正如用序列对齐算法所测定的(例如,如具有缺省参数的FASTA版本3.0t78算法)。
本发明的另一个发明是一种分离或纯化的多肽,其包括如下序列之一的序列:A组核酸序列和与其基本上同一的序列,或包括其至少大约5,10,15,20,25,30,35,40,50,75,100或150个连续碱基的片段。正如上面所讨论的,这样的多肽可以通过将编码多肽的核酸插入到载体中获得,这样编码序列与能够驱动被编码的多肽在合适的宿主细胞中表达的序列可操作地连接在一起。例如,表达载体可以包括启动子、翻译起始的核糖体结合位点和转录终止子。载体也可以包括用于扩增表达的适当的序列。
适合在细菌中表达多肽或其片段的启动子包括大肠杆菌lac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动子、来自编码如3-磷酸甘油酸激酶(PGK)的操纵子的启动子、和酸性磷酸酶启动子。真菌启动子包括V因子启动子。真核启动子包括CMV立即早期启动子、HSV胸腺嘧啶核苷激酶启动子、热休克启动子、早期和晚期SV40启动子、来自反转录病毒的长末端重复序列(LTR)和小鼠金属硫蛋白-I启动子。也可以使用已知在原核或真核细胞或其病毒中控制基因表达的其它启动子。
哺乳动物表达载体也可以包括复制起点、任何必须的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列和5’侧非转录序列。在一些实施方案中,衍生于SV40剪接和聚腺苷酸化位点的DNA序列可以用于提供所需要的非转录遗传元件。
用于在真核细胞中表达多肽或其片段的载体也可以含有增强子以增加表达水平。增强子是DNA的顺式作用元件,长度通常在大约10-大约300bp之间,其作用于启动子以增强其转录。实例包括复制起点bp 100-270后侧上的SV40增强子、巨细胞病毒早期启动子增强子、复制起点后侧上的多瘤病毒增强子、和反转录病毒增强子。
另外,表达载体通常含有一个或多个选择性标记物基因,以允许选择含有载体的宿主细胞。这样的选择性标记物包括编码二氢叶酸还原酶的基因、或为真核细胞培养物提供新霉素抗性的基因、在大肠杆菌中提供四环素或氨苄青霉素抗性的基因、和酿酒酵母(S.cerevisiae)TRP1基因。
在一些实施方案中,编码如下序列的多肽之一的核酸以适当相与能指导翻译多肽或其片段分泌的前导序列装配:B组氨基酸序列和与其基本上同一的序列,或者含有其至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。任选地,核酸可以编码融合多肽,其中B组氨基酸序列和与其基本上同一的序列,或者含有其至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段的多肽之一被融合到异种肽或多肽上,如赋予期望特性,诸如增强的稳定性或简易纯化特性的N-末端鉴别肽。
适当的DNA序列可以通过多种方法被插入到载体中。通常,在用适当的限制性核酸内切酶消化插入物和载体后,DNA序列被连接到载体中的期望位置。另外,插入物和载体的钝末端可以被连接。在如下文献中公开了多种克隆技术:Ausubel等人,Current Protocols inMolecular Biology,John Wiley 503 Sons,Inc.1997和Sambrook等人,Molecular Cloning:A Laboratory Manual第二版,Cold Spring HarborLaboratory Press(1989),将这些文献的全部公开内容引用于此作为参考。这些方法和其它方法被认为在本技术领域的普通技术人员的范围内。
载体的形式可以是,例如质粒、病毒颗粒或噬菌体。其它载体包括染色体、非染色体和合成DNA序列、SV40衍生物;细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA如牛痘、腺病毒、禽痘病毒以及假狂犬病。原核和真核宿主中使用的多种克隆和表达载体由Sambrook等人描述在Molecular Cloning:A Laboratory Manual第二版,Cold Spring HarborLaboratory Press(1989)中,将该文献的公开内容引用于此作为参考。
可以被使用的特定细菌载体包括可以通过商业途径获得的质粒,其含有如下已知的克隆载体的遗传成分:pBR322(ATCC 37017)、pKK2233(Pharmacia Fine Chemicals,Uppsala,Sweden),GEM1(Promega Biotec,Madison,WI,USA)pQE70,pQE60,pQE-9(Qiagen),pD10,psiX174 pBluescript II KS,pNH8A,pNH16a,pNH18A,pNH46A(Stratagene),ptrc99a,pKK223-3,pKK233-3,pDR540,pRIT5(Pharmacia),pKK232-8和pCM7。特定的真核载体包括pSV2CAT,pOG44,pXT1,pSG(Stratagene)pSVK3,pBPV,pMSG和pSVL(Pharmacia)。然而,可以使用任何其它载体,只要它在宿主细胞中可复制且可存活。
宿主细胞可以是本技术领域普通技术人员所熟悉的任何宿主细胞,包括原核细胞、真核细胞、哺乳动物细胞、昆虫细胞或植物细胞。作为适当宿主的代表性实例有:细菌细胞,如大肠杆菌、链霉菌属、枯草杆菌、鼠伤寒沙门氏杆菌和假单胞菌属、链霉菌属和葡萄球菌属中的多种种类;真菌细胞,如酵母;昆虫细胞,如果蝇S2和草地夜蛾Sf9;动物细胞,如CHO、COS或Bowes黑素瘤;以及腺病毒。适当宿主的选择在本技术领域普通技术人员的能力范围内。
可以用多种技术中的任一种将载体导入宿主细胞中,包括转化、转染、转导、病毒感染、基因枪或Ti-介导的基因转移。特定的方法包括磷酸钙转染法、DEAE-葡聚糖介导的转染法、脂质转染法或者电穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods in Molecular Biology,(1986))。
适当的时候,进行了遗传工程的宿主细胞可以在传统营养培养基中培养,所述培养基被修饰以适合激活启动子、选择转化体或扩增本发明的基因。在转化了合适的宿主株并且使宿主株生长到适当的细胞密度后,可以通过适当的方法诱导所选择的启动子(例如温度变化或化学诱导),并且可以将细胞再培养一段时间,以使得它们制备出期望的多肽或其片段。
细胞通常通过离心来收获,通过物理或化学方法来破坏,保留所得到的粗提取物,以进一步纯化。用于表达蛋白的微生物细胞可以通过任何便利的方法来破坏,包括冻-融循环、超声处理、机械破坏、或使用细胞裂解剂。这样的方法对于本技术领域的普通技术人员是已知的。被表达的多肽或其片段可以通过如下方法被回收或从重组细胞培养物中纯化:硫酸铵或乙醇沉淀、酸萃取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、亲和层析、羟基磷灰石层析和凝集素层析。需要时,在完成多肽的构型中,可以使用蛋白质再折叠步骤。如果期望,可以将高效液相色谱(HPLC)用于最终的纯化步骤。
也可以用多种哺乳动物细胞培养系统来表达重组蛋白质。哺乳动物表达系统的实例包括猴肾成纤维细胞的COS-7系(由Gluzman描述,Cell,23:175,1981),和能表达来自相容载体的蛋白质的其它细胞系,如C127,3T3,CHO,HeLa和BHK细胞系。
宿主细胞中的构建物可以以传统方式来使用,以产生由重组序列所编码的基因产物。依赖于重组产生方法中所用的宿主,由含有载体的宿主细胞产生的多肽可以被糖基化,或者不被糖基化。本发明的多肽也可以或者不可以包括起始甲硫氨酸氨基酸残基。
另外,B组氨基酸序列和与其基本上同一的序列的多肽,或者其含有至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段,可以通过传统肽合成仪通过合成方法制备。在其它实施方案中,多肽的片段或部分可以通过肽合成仪被用于制备相应的全长多肽;于此,这些片段可以被用作制备全长多肽的中间物。
也可以通过使用从DNA构建物转录的mRNA将不含细胞的翻译系统用于制备B组氨基酸序列和与其基本上同一的序列的多肽,或者其含有至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段的多肽之一,所述DNA构建物含有与编码多肽或其片段的核酸可操作连接的启动子。在一些实施方案中,DNA构建物可以在进行体外转录反应之前被线性化。然后用适当的不含细胞的翻译提取物温育转录的mRNA,如兔网织红细胞提取物,以制备期望的多肽或其片段。
本发明也涉及如下序列的多肽的变体:B组氨基酸序列,和与其基本上同一的序列,或者其含有至少5,10,15,20,25,30,35,40.50,75,100或150个连续氨基酸的片段。术语”变体”包括这些多肽的衍生物或类似物。尤其是,通过一个或多个取代、添加、缺失、融合和平截,它们可以以任意的组合出现,变体可以在氨基酸序列上与B组氨基酸序列和与其基本上同一的序列的多肽不同。
变体可以是自然存在或在体外产生。尤其是,这样的变体可以用遗传工程技术产生,如定向诱变、随机化学诱变、核酸外切酶III缺失方法和标准克隆技术。另外,这样的变体、片段、类似物或衍生物可以用化学合成或修饰方法产生。
产生变体的其它方法对于本技术领域的普通技术人员也是熟悉的。这些方法包括,其中从天然分离物得到的核酸序列被修饰以产生编码多肽的核酸,所述多肽具有增强它们在工业或实验室应用中的价值。在这样的方法中,由于从天然分离物得到的序列,得到了具有一个或多个核苷酸差异的大量变体序列,并且它们被表征。典型地,相对对于来自天然分离物的核酸编码的多肽,这些核苷酸差异导致氨基酸变化。
例如,可以用易错PCR产生变体。在易错PCR中,PCR是在DNA聚合酶的拷贝保真度较低的条件下进行的,这样沿着PCR产物的全长可以获得高比率点突变。易错PCR描述在Leung,D.W.,等人,Technique.1:11-15,1989)和Caldwell,R.C.&Joyce G.F.,PCR Methods Applic.,2:28-33,1992,将其公开内容完整引用于此作为参考。简单地说,在这些方法中,将要被诱变的核酸与PCR引物、反应缓冲液、MgCl2、MnCl2、Taq聚合酶和适当浓度的dNTPs混合,以沿着PCR产物的全长获得高比率点突变。例如,可以使用如下物质进行反应:20fmol将被诱变的核酸,30pmol每一PCR引物,含有50mM KCl、10mM Tris HCl(pH8.3)和0.01%凝胶的反应缓冲液,7mM MgCl2,0.5mM MnCl2,5单位Taq聚合酶,0.2mM dGTP,0.2mM dATP,1mM dCTP和1mM dTTP。PCR可以进行30个循环:94℃1分钟,45℃1分钟,72℃1分钟。然而,应该意识到这些参数在需要时可以有所变化。将被诱变的核酸克隆到适当的载体中,并且评价由诱变的核酸编码的多肽的活性。
也可以用寡核苷酸定向诱变产生变体,以便在任何相关的克隆DNA中产生位点特异性突变。寡核苷酸诱变描述在Reidhaar-Olson,J.F.&Sauer,R.T.,等人,Scicence,241:53-57,1988,将其公开内容完整引用于此作为参考。简单地说,在这些方法中合成了大量具有一次或多次将要被导入克隆DNA的突变的双链寡核苷酸,并且被插入到将被诱变的克隆DNA中。回收含有诱变DNA的克隆,评价由它们编码的多肽的活性。
产生变体的另一种方法是装配PCR(assembly PCR)。装配PCR涉及从小DNA片段的混合物装配PCR产物。大量不同的PCR反应在同一小管中平行发生,一次反应的产物作为另一次反应的产物的引物。装配PCR描述在:1996年7月9日提交的美国专利5,965,408,题为”Method of DNA Reassembly by Interrupting Synthesis”,将其公开内容完整引用于此作为参考。
仍然产生变体的另一种方法是有性PCR诱变。在有性PCR诱变中,强制同源重组在体外发生于具有不同但高度相关DNA序列的DNA分子之间,结果基于序列同源性的DNA分子之间发生随机断裂,随后在PCR反应中通过引物延伸固定交换。有性PCR诱变描述在:Stemmer,W.P.,PNAS,USA,91:10747-10751,1994,将其公开内容完整引用于此作为参考。简单地说,在这些方法中,用DNAse消化大量将被用于重组的核酸,以产生具有平均大小为50-200核苷酸的片段。纯化具有期望的平均大小的片段,且再次悬浮于PCR混合物中。PCR在有助于核酸片段之间重组的条件下进行。例如,PCR可以通过如下进行:将纯化的片段以10-30ng/∶l的浓度再次悬浮于下述溶液中,其中每一种dNTP为0.2mM、2.2mM MgCl2、50mM KCL、10mM Tris HCl、pH 9.0和0.1%Triton X-100的溶液中。每100∶1反应混合物加入2.5单位Taq聚合物,用如下方式进行PCR:94℃60秒,50-55℃30秒,72℃30秒(30-45次)和72℃5分钟。然而,应该意识到,这些参数当需要时可以有所变化。在一些实施方案中,寡核苷酸可以被包括在PCR反应中。在其它实施方案中,DNA聚合酶I的克列诺片段(Klenow fragment)可以被用于第一组PCR反应中,Taq聚合物可以被用于随后的PCR反应组中。分离重组序列,并且评价它们编码的多肽的活性。
也可以用体内诱变(in vivo mutagenesis)产生变体。在一些实施方案中,通过在细菌株如大肠杆菌株中增殖相关序列产生相关序列中的随机突变,所述细菌株在一种或多种DNA修复途径中发生了突变。这些”增变”株比野生型亲本具有更高的随机突变率。在这些菌株中增殖DNA将最终在该DNA中产生随机突变。适合用于体内诱变的增变株描述在:PCR Publication No.WO 91/16427,于1991年10月31日出版,题为“Methods for Phenotype Creation from Multiple GenePopulations”,将其公开内容完整引用于此作为参考。
也可以用盒式诱变(cassette mutagenesis)产生变体。在盒式诱变中,用与天然序列不同的合成寡核苷酸”盒子”取代双链DNA分子的小区域。寡核苷酸通常含有完全和/或部分随机化的天然序列。
递归集团诱变(recursive ensemble mutagenesis)也可以用来产生变体。递归集团诱变是一种蛋白质工程(蛋白质诱变)算法,该算法被用来开发产生不同群体的表型相关突变体,所述表型相关突变体的成员在氨基酸序列上不同。该方法使用反馈机制来控制连续轮回的组合盒式诱变。递归集团诱变描述在:Arkin,A.P.和Youvan,D.C.,PNAS,USA,89:7811-7815,1992,将其公开内容完整引用于此作为参考。
在一些实施方案中,用指数集团诱变(exponential ensemblemutagenesis)产生变体。指数集团诱变是一种用于产生高百分比的独特和功能性突变体的组合文库的方法,其中残基小组中被随机化,以便平行地在每一被改变的位置鉴别导致功能蛋白质的氨基酸。指数集团诱变描述在:Delegrave,S.和Youvan,D.C.,Biotechnology Research,11:1548-1552,1993,将其公开内容完整引用于此作为参考。随机和定点诱变描述在:Arnold,F.H.,Current Opinion in Biotechnology,4:450-455,1993,将其公开内容完整引用于此作为参考。
在一些实施方案中,用改组方法(shuffling procedure)产生变体,其中编码不同多肽的多个核酸部分被融合到一起,产生编码嵌合多肽的嵌合核酸序列,描述在:1996年7月9日提出申请的美国专利5,965,408中,题为“Method of DNA Reassembly by InteruptingSynthesis”,和美国专利5,939,250中,1996年5月2日提出申请,题为“Production of Enzymes Having Desired Activities by Mutagenesis”,将它们都引用于此作为参考。
B氨基酸序列的多肽的变体可以是这样的变体,即其中B组氨基酸序列的多肽的一个或多个氨基酸残基被保守或非保守氨基酸残基(优选地一个保守氨基酸残基)取代,这样取代的氨基酸残基可以是或者不是由遗传密码子编码的残基。
保守置换是那些用具有类似特性的另一个氨基酸取代多肽中的给定氨基酸。通常认为的保守置换是下述取代:用另一个脂族氨基酸取代脂族氨基酸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸;用苏氨酸取代丝氨酸,或反之亦然;用另一个酸性残基取代酸性残基,如天冬氨酸和谷氨酸;用另一个具有酰胺基团的残基取代具有酰胺基团的残基,如天冬酰胺和谷氨酰胺;用另一个碱性残基交换碱性残基,如赖氨酸和精氨酸;用另一个芳族残基取代芳族残基,如苯丙氨酸、酪氨酸。
其它变体是那些其中B组氨基酸序列的多肽的一个或多个氨基酸残基包括取代基的变体。
仍然地,其它的变体是那些其中多肽与另一种化合物结合的变体,例如增加多肽的半衰期的化合物(例如聚乙二醇)。
其它变体是那些其中其它的氨基酸被融合到多肽上的变体,例如前导序列、分泌序列、前蛋白序列或有助于多肽的纯化、富集或稳定的序列。
在一些实施方案中,片段、衍生物和类似物保持与B组氨基酸序列和与其基本上同一的序列的多肽系统的生物功能或活性。在其它实施方案中,片段、衍生物或类似物包括前蛋白,这样片段、衍生物或类似物可以通过前蛋白部分的裂解激活,以产生活性多肽。
本发明的另一个方面是多肽或其片段,其与如下序列的多肽之一具有至少大约50%,至少大约55%,至少大约60%,至少大约65%,至少大约70%,至少大约75%,至少大约80%,至少大约85%、至少大约90%、至少大约95%或高于大约95%同源性的序列:B组氨基酸序列和与其基本上同一的序列,或其包括至少大约5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。同源性可以用上面描述的任一种程序来确定,上面描述的程序对齐将比较的多肽或片段,并且确定它们之间的氨基酸同一性或类似性程度。应该意识到,氨基酸”同源性”包括保守氨基酸置换,如上面所描述的那些。
与如下序列的多肽之一具有同源性的多肽或片段可以使用上面描述的技术通过分离编码它们的核酸获得:B组氨基酸序列,和与其基本上同一的序列,或其包括至少大约5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。
另外,同源的多肽或片段可以通过生物化学富集或纯化方法获得。潜在的同源多肽或片段的序列可以通过蛋白水解消化、凝胶电泳和/或微量测序确定。预期同源的多肽或片段的序列可以使用上面所描述的任一种程序与如下序列的多肽之一比较:B组氨基酸序列,和与其基本上同一的序列,或其包括至少大约5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。
本发明的另一方面是一种分析方法,用于鉴定B组氨基酸序列和与其基本上同一的序列的片段或变体,它们保留了B组氨基酸序列和与其基本上同一的序列的多肽的酶功能。例如,所述多肽的片段或变体可以被用来催化生化反应,这表明片段或变体保留了B组氨基酸序列中的多肽的酶活性。
确定变体的片段是否保留了B组氨基酸序列和与其基本上同一的序列的多肽的酶活性的分析方法包括如下步骤:将多肽片段或变体与底物分子在允许多肽片段或变体发挥作用的条件下接触,检测底物水平是否有所降低,或者多肽和底物之间反应的特定反应产物的水平是否有所增加。
B组氨基酸序列,和与其基本上同一的序列,或其包括至少大约5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段的多肽可以用于多种应用中。例如,其多肽或片段可用于催化生化反应。根据本发明的一方面,提供了一种方法,所述方法使用B组氨基酸序列和与其基本上同一的序列的多肽,或编码这样的多肽的多核苷酸来水解糖苷键。在这样的方法中,将含有糖苷键的底物(例如淀粉)与B组氨基酸序列和与其基本上同一的序列的多肽之一接触,条件是有助于糖苷键的水解。
B组氨基酸序列,和与其基本上同一的序列,或其包括至少大约5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段的多肽,也可以被用于淀粉的液化和糖化中。使用本发明的多肽或其片段,液化可以在比先前的酶所用的pH更低的pH下进行。在一个实施方案中,液化在pH 4.5进行。另外,与这些方法中先前所用的酶相比,本发明的多肽或其片段对钙的依赖性更低。在液化中用淀粉酶来水解淀粉。在优选的实施方案中,本发明的多肽或其片段在90-95℃是热稳定的。
B组氨基酸序列,和与其基本上同一的序列,或其包括至少大约5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段的多肽,也可以用来产生与多肽或片段特定结合的抗体。所得到的抗体可以用在免疫亲和层析方法中,以分离或纯化多肽,或者确定生物样品中是否存在多肽。在这样的方法中,将蛋白质制剂如提取物,或者生物样品与能与如下序列的多肽之一特定结合的抗体接触:B组氨基酸序列,和与其基本上同一的序列,或其包括至少大约5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。
在免疫亲和方法中,抗体被附着在固体载体上,如珠子或其它柱基质上。蛋白质制剂被置于与抗体接触,条件是抗体与B组氨基酸序列,和与其基本上同一的序列,或其片段的多肽之一特定地结合。在洗涤以去除非特定地结合的蛋白质之后,洗脱出特定结合的多肽。
可以用本技术领域普通技术人员熟悉的多种技术中的任一种来确定蛋白质在生物样品中结合抗体的能力。例如,可以通过用可检测的标记物如荧光试剂、酶标记物或放射性同位素标记抗体来确定结合。另外,抗体与蛋白质的结合可以使用其上具有可检测标记物的第二抗体来检测。特定的方法方法包括酶联免疫吸附测定(ELISA分析)、夹心分析、放射免疫分析和Western印迹。
针对如下序列的多肽产生的多克隆抗体可以通过将多肽直接注射到动物体内和通过将多肽施用于动物例如非人动物获得:B组氨基酸序列,和与其基本上同一的序列,或其包括至少大约5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。然后,这样获得的抗体将与多肽自身结合。用这样方式,甚至仅编码多肽的一个片段的序列可以用于产生抗体,所述抗体可能与完整的天然多肽结合。这样的抗体然后被用于从表达该多肽的细胞分离多肽。
为了制备单克隆抗体,可以使用能提供连续细胞系培养产生抗体的任何技术。实例包括杂交瘤技术(Kohler和Milstein,Nature,256:495-497,1975,将其公开内容引用于此作为参考),三系杂交瘤技术(trioma技术),人B-细胞杂交瘤技术(Kozbor等人,Immunology Today4:72,1983,将其公开内容引用于此作为参考),以及EBV-杂交瘤技术(Cole等人,1985,Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,Inc.,77-96页,将其公开内容引用于此作为参考)。
描述单链抗体产生的技术(美国专利4,946,778,将其公开内容引用于此作为参考)可以适用于产生B组氨基酸序列,和与其基本上同一的序列,或其包括至少大约5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段的单链抗体。另外,转基因小鼠可以被用于表达这些多肽或其片段的人源化抗体。
针对B组氨基酸序列,和与其基本上同一的序列,或其包括至少大约5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段的多肽而产生的抗体可以被用于从其它生物体和样品中筛选类似多肽。在这样的技术中,将来自生物体的多肽与抗体接触,并且检测那些与抗体特定地结合的多肽。上面所描述的任何技术可以被用来检测抗体结合。一种这样的筛选分析方法描述在“Methods forMeasuring Cellulase Activities”,Methods in Enzymology,160卷,87-116页,将其完整引用于此作为参考。
正如此处所用,术语“如下序列中所阐明的核酸序列:SEQ ID NO.:1,3,5,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85,87,89,91,93,95,97,99,101,103,105,107,109,111,113,115,117,119,121,123,125,127,129,131,133,135,137,139,141,143,145,147,149,151,153,155,157,159,161,163,165,167,169,171,173,175,177,179,181,183,185,187,189,191,193,195,197,199,201,203,205,207,209,211,213,215,217,219,221,223,225,227,229,231,233,235,237,239,241,243,245,247,249,251,253,255,257,259,261,263,265,267,269,271,273,275,277,279,281,283,285,287,289,291,293,295,297,299”包括如下序列的核苷酸序列:A组核酸序列,和与其基本上同一的序列,以及与A组核酸序列及其片段同源的序列,和与所有前述序列互补的序列。片段包括如下序列的部分:SEQ ID NO.:1,3,5.9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85,87,89,91,93,95,97,99,101,103,105,107,109,111,113,115,117,119,121.123,125,127,129,131,133,135,137,139,141,143,145,147,149,151,153,155,157,159,161,163,165,167,169,171,173,175,177,179,181,183,185,187,189,191,193,195,197,199,201,203,205,207,209,211,213,215,217,219,221,223,225,227,229,231,233,235,237,239,241,243,245,247,249,251,253,255,257,259,261,263,265,267,269,271,273,275,277,279,281,283,285,287,289,291,293,295,297和299,包括A组核酸序列,和与其基本上同一的序列的至少10,15,20,25,30,35,40,50,75,100,150,200,300,400或500个连续核苷酸。A组核酸序列,和与其基本上同一的序列的同源序列和片段,是指与这些序列具有至少99%,98%,96%,95%,90%,85%,80%,75%,70%,65%,60%,55%或50%同源性的序列。同源性可以使用此处描述的任一种计算机程序和参数来确定,包括具有缺省参数的FASTA版本3.0t78。同源序列也包括RNA序列,其中尿嘧啶取代A组核酸序列中所阐明的核酸序列中的胸腺嘧啶。可以使用此处描述的任何方法获得同源序列,或者可以从校正测序误差获得同源序列。应该意识到,A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,可以以传统的单字母格式表示(参见Stryer,Lubert.Biochemistry,第三版,W.HFreeman&Co.,New York的封三)或者以在序列中记录核苷酸同一性的任何其它格式表示。
正如此处所用,术语“如下序列中所阐明的多肽序列:SEQ ID NO.:2,4,6,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114,116,118,120,122,124,126,128,130,132,134,136,138,140,142,144,146,148,150,152,154,156,158,160,162,164,166,168,170,172,174,176,178,180,182,184,186,188,190,192,194,196,198,202,204,206,208,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,240,242,244,246,248,250,252,254,256,258,260,262,264,266,268,270,272,274,276,278,280,282,284,286,288,290,292,294,296,298”包括如下序列的多肽序列:B组氨基酸序列,和与其基本上同一的序列,它们由如下序列中的序列编码:SEQ ID NO.:2,4,6,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114,116,118,120,122,124,126,128,130,132,134,136,138,140,142,144,146,148,150,152,154,156,158,160,162,164,166,168,170,172,174,176,178,180,182,184,186,188,190,192,194,196,198,202,204,206,208,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,240,242,244,246,248,250,252,254,256,258,260,262,264,266,268,270,272,274,276,278,280.282,284,286,288,290,292,294,296,298中所阐明的序列,与B组氨基酸序列同源的多肽序列,和与其基本上同一的序列,或任何前述序列的片段。同源的多肽序列指与B组氨基酸的多肽序列之一具有至少99%,98%,97%,96%,95%,90%,85%,80%,75%,70%,65%.60%,55%或50%同源性的序列。同源性可以使用此处描述的任一种计算机程序和参数来确定,包括具有缺省参数或任何被修改参数的FASTA版本3.0t78。可以使用此处描述的任何方法获得同源序列,或者可以从校正测序误差获得同源序列。多肽片段包括B组氨基酸序列.和与其基本上同一的序列的多肽的至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸。应该意识到,B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列,可以以传统的单字母格式或三字母格式表示(参见Stryer,Lubert.Biochemistry,第三版,W.HFreeman&Co.,New York的封三)或者以在序列中叙述多肽同一性的任何其它格式表示。
本技术领域普通技术人员应该可以意识到,SEQ ID NO.:1,3,5,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85,87,89,91,93,95,97,99,101,103,105,107,109,111,113,115,117,119,121,123,125,127,129,131,133,135,137,139,141,143,145,147,149,151,153,155,157,159,161,163,165,167,169,171,173,175,177,179,181,183,185,187,189,191,193,195,197,199,201,203,205,207,209,211,213,215,217,219,221,223,225,227,229,231,233,235,237,239,241,243,245,247,249,251,253,255,257,259,261,263,265,267,269,271,273,275,277,279,281,283,285,287,289,291,293,295,297,299中所阐明的核酸序列,和SEQ ID NO.:2,4,6,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114,116,118,120,122,124,126,128,130,132,134,136,138,140,142,144,146,148,150,152,154,156,158,160,162,164,166,168,170,172,174,176,178,180,182,184,186,188,190,192,194,196,198,202,204,206,208,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,240,242,244,246,248,250,252,254,256,258,260,262,264,266,268,270,272,274,276,278,280,282,284,286,288,290,292,294,296,298中所阐明的多肽序列可以在任何计算机可以阅读且访问的介质上被储存、记录和操作。正如此处所用,词语“被记录”和“被储存”指将信息储存在计算机介质上的过程。熟练技术人员将可以容易地采用任何当前已知的方法,将信息记录在计算机可读的介质上,以便产生包括如下序列的制品:A组核酸序列和与其基本上同一的序列中所阐明的一个或多个核酸序列,B组氨基酸序列和与其基本上同一的序列中所阐明的一个或多个多肽序列。本发明的另一个方面是其上储存了A组核酸序列和与其基本上同一的序列中所阐明的至少2,5,10,15或20个核酸序列的计算机可读介质。
本发明的另一方面是其上已经储存了A组核酸序列和与其基本上同一的序列中所阐明的一个或多个核酸序列的计算机可读介质。本发明的另一方面是其上储存了B组氨基酸序列和与其基本上同一的序列中所阐明的至少一个或多个多肽序列的计算机可读介质。本发明的另一个方面是其上储存了如上所阐明的至少2,5,10,15或20个序列的计算机可读介质。
计算机可读介质包括磁性可读介质、光学可读介质、电子可读介质和磁性/光学介质。例如,计算机可读介质可以是硬盘、软盘、磁带、CD-ROM、数字通用盘(DVD)、随机存取存储器(RAM)或只读存储器(ROM)以及本技术领域已知的其它类型的其它介质。
本发明的实施方案包括系统(例如基于因特网的系统),尤其是存储且操纵此处描述的序列信息的计算机系统。在图1中以方块图形式说明了计算机系统100的一个实例。正如此处所用,”计算机系统”指硬件部分、软件部分和数据存储部分,所述计算机系统用于分析如下序列:A组核酸序列和与其基本上同一的序列中所阐明的核酸序列的核苷酸序列,或B组氨基酸序列中所阐明的多肽序列。计算机系统100通常包括一个用于处理、访问和操纵序列数据的处理器。处理器105可以是任何已知类型的中央处理器单元,如Intel公司的奔腾III,或Sun、Motorola、Compag、AMD或国际商业机器公司(IBM公司)的类似处理器。
通常计算机系统100是一种具有通用目的的系统,其包括处理器105,和用于储存数据的一个或多个内部数据存储部分110,和一个或多个用于恢复数据存储部分上存储的数据的数据恢复设备。熟练技术人员可以容易地意识到,当前可获得的任一种计算机系统是适合的。
在一个特定实施方案中,计算机系统100包括与总线相连的处理器105,所述总线与主存储器115相连(优选地为RAM),和一个或多个内部数据存储设备110,如硬盘驱动器和/或其上已经存储了数据的其它计算机可读介质。在一些实施方案中,计算机系统100进一步包括一个或多个数据恢复设备118,用于读取存储在内部数据存储设备110上的数据。
数据恢复设备118表示,例如软盘驱动器、光盘驱动器、磁带驱动器或能连接远程数据存储系统(如通过因特网)等的调制解调器。在一些实施方案中,内部数据存储设备110是可移动的计算机可读介质,如包括控制逻辑和/或其上记录了数据的软盘、光盘、磁带等等。计算机系统100可以有利地包括或通过适当的软件被编程,以便数据存储部分一旦插入到数据恢复设备就从其上阅读控制逻辑和/或数据。
计算机系统100包括显示器120,其用于将输出显示给计算机用户。也应该注意到,计算机系统100可以被连接到因特网或广域网中的其它计算机系统125a-c上,以便集中访问计算机系统100。
访问和处理如下序列的核苷酸的软件(如搜索工具、比较工具和建模工具等)在执行过程中可以驻留在主存储器115中:A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列。
在一些实施方案中,计算机系统100可以进一步包括序列比较算法,用于将存储在计算机可读介质上的A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列,与存储在计算机可读介质上的参考核苷酸或多肽序列进行比较。“序列比较算法”指一个或单个程序,它们在计算机系统100上(本地或远程)运行,以便将核苷酸序列与数据存储设备中所存储的其它核苷酸序列和/或化合物进行比较。例如,序列比较算法可以将存储在计算机可读介质上的A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列,与存储在计算机可读介质上的参考序列进行比较,以鉴别同源性或结构基序。在本发明说明书中任何地方标明的多种序列比较程序尤其期望用于本发明的这一方面。蛋白质和/或核酸序列同源性可以用本技术领域已知的多种序列比较算法和程序来评价。这样的算法和程序包括但决不限于:TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85(8):2444-2448,1988;Altschul等人,J.Mol.Biol.215(3):403-410,1990;Thompson等人,Nucleic Acids Res.22(2):4673-4680,1994;Higgins等人,Methods Enzymol.266:383-402,1996;Altschul等人,J.Mol.Biol.215(3):403-410,1990;Altschul等人,Nature Genetics 3:266-272,1993)。
同源性或同一性通常用序列分析软件来测定(例如GeneticsComputer Group,University of Wisconsin Biotechnology Center,1710University Avenue,Madison,WI 53705的序列分析软件包)。该软件通过给各种缺失、取代和其它修饰分配同源性程度来匹配类似序列。在上下文中对于两种或多种核酸或多肽序列,术语”同源性”和”同一性”指相同或具有特定百分比的氨基酸残基或核苷酸的两个或多个序列或子序列,当在同一比较窗口或指定区域内尽可能一致地比较或对齐时,所述氨基酸残基或核苷酸是相同的,这正如用大量序列比较算法或通过人工对齐和视觉观察所测定那样。
对于序列比较,通常一个序列作为参考序列,测试序列与其进行比较。当使用序列比较算法时,将测试序列和参考序列输入计算机,如果需要,指定子序列坐标系,指定序列算法程序参数。然后用序列比较算法基于程序参数计算测试序列相对于参考序列的序列同一性百分比。
正如此处所用,“比较窗口(comparison window)”是指包括选自20~600,通常为大约50~大约200,更通常大约100~大约150的邻接位置的任一个数目的片断,在这些片断中,在两个序列被最优地对比后,一个序列可以与具有相同数目的邻接位置的参考序列进行比较。用于比较的序列对比方法在本领域是熟知的。可以进行最优的序列对比比较,如通过local homology algorithm,由Smith&Waterman,Adv.Appl.Math.2:482,1981提供;通过homology alignment algorithm,由Needleman&Wunsch,J.Mol.Biol 48:443,1970提供;通过search forsimilarity method,由person&Lipman,Proc.Nat’l.Acad.Sci.USA85:2444,1988提供,通过这些算法的计算机化实施(Wisconsin GeneticsSoftware Package,Genetics Computer Group,575 Science Dr.,Madison,WI中的GAP、BESTFIT、FASTA和TFASTA),或通过人工对比和视觉观察。例如,用于确定同源性或同一性的其它算法包括,除了BLAST程序(Basic Local Alignment Search Tool at the National Center forBiological Information)、ALIGN、AMAS(Analysis of Multiply AlignedSequences)、AMPS(Protein Multiple Sequence Alignment)、ASSET(Aligned Segment Statistical Evaluation Tool)、BANDS、BESTSCOR、BIOSCAN(Biological Sequence Comparative Analysis Node)、BLIMPS(Blocks IMProved Searcher)、FASTA、Intervals&Points、BMB、CLUSTAL V、CLUSTAL W、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman algorithm、DARWIN、Las Vegasalgorithm、FNAT(Forced Nucleotide Alignment Tool)、Framealign、Framesearch、DYNAMIC、FILTER、FSAP(Fristensky Sequence AnalysisPackage)、GAP(Global Alignment Program)、GENAL、GIBBS、GenQuest、ISSC(Sensitive Sequence Comparison)、LALIGN(LocalSequence Alignment)、LCP(Local Content Program)、MACAW(MultipleAlignment Construction&Analysis Workbench)、MAP(MultipleAlignment Program)、MBLKP、MBLKN、PIMA(Pattern-InducedMulti-sequence Alignment)、SAGA(Sequence Alignment by GeneticAlgorithm)和WHAT-IF。这些对比程序也可以用来筛选基因组数据库,以区分序列基本上一样的多核苷酸序列。许多基因组数据库是可利用的,例如,人类基因组的实质部分可以作为人类基因组测序项目的一部分来利用(J.Roach,http://weber.u.Washington.edu/~roach/human genome progress 2.html)(Gibbs,1995)。至少21个其它基因组已经被测序,例如包括M.genitalium(Fraser等人,1995)、M.jannaschii(Bult等人,1996)、H.influenzae(Fleischmann等人,1995)、大肠杆菌(Blattner等人,1997)和酵母(S.cerevisiae)(Mewes等人,1997)和果蝇(D.melanogaster)(Adams等人,2000)。在模型生物的基因组的测序上已经取得了显著的进步,如鼠、C.elegans和Arabadopsis sp。几个含有注解有某些功能信息的基因组信息由不同的组织所保存,可以通过因特网访问,例如http://www.tigr.org/tdb;http://www.genetics.wisc.edu; http://genome-www.stanford.edu/~ball;http://hiv-web.lanl.gov; http://www.ncbi.nlm.nih.gov;http://www.ebi.ac.uk; http://Pasteur.fr/other/biology;和http://www.genome.wi.mit.edu。
一个有用算法的实例是BLAST和BLAST 2.0算法,对它们的描述分别在Altschul等人,Nuc.Acids Res.25:3389-3402,1977和Altschul等人,J.Mol.Biol.215:403-410,1990中。完成BLAST分析的软件可以通过National Center for Biotechnology Information(http://www.ncbi.nlm.nih.gov/)公开获得。该算法首先涉及通过识别查询序列中的长度W的短单词来识别高计分序列对(HSP),当在数据库序列中用相同长度的单词对比时,该高记录序列对或者匹配或者满足一些正阈值T。T是指相邻单词分数阈值(Altschul等人,见上文)。这些起始的相邻单词击中作为寻找包括它们的更长HSP的初始搜索的种子。这些单词击中在两个方向沿着每一个序列一直延伸,直到累积对比值增加。对于核苷酸序列,用参数M(一对匹配残基的得分;通常>0)对累积值进行计算。对于氨基酸序列,用计分矩阵来计算累积值。当发生下列情况时暂停在每一方向的单词击中的延伸:累积对比值随着数量X从其最大获得值而下降;由于一个或多个负得分残基对比值的累积,累积值达到零或零以下;或者达到了任一序列的末端。BLAST算法参数W、T和X确定对比的选择性和速度。BLASTN程序(用于核苷酸序列)使用的缺省值为:单词长度(W)为11,期望值(E)为10,M=5,N=-4,以及比较两个链。对于氨基酸序列,BLASTP程序使用的缺省值为:单词长度为3,期望值(E)为10,BLOSUM62计分矩阵(参考Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA89:10915,1989)对比值(B)为50,期望值(E)为10,M=5,N=-4,以及比较两个链。
BLAST算法也进行两个序列之间相似性的统计分析(如参考Karlin&Altchul,Proc.Natl.Acad.Sci.USA 90:5873,1993)。由BLAST算法提供的相似性的一个测量值是最小总计几率(P(N)),该值提供了几率指标,通过它两个核苷酸或氨基酸序列之间的匹配将偶然地发生。例如,如果测试核酸与参考核酸的比较中最小总计几率小于大约0.2,更优选小于大约0.01,最优选小于大约0.001,那么核酸被认为与参考序列是相似的。
在一个实施方案中,用Basic Local Alignment Search Tool(”BLAST”)来评价蛋白质和核酸序列同源性。尤其是,使用五个特定BLAST程序来完成下述任务:
(1)BLASTP和BLAST3将氨基酸查询序列与蛋白质序列数据库进行比较;
(2)BLASTN将核苷酸查询序列与核苷酸序列数据库进行比较;
(3)BLASTX将查询核苷酸序列(两个链)的六读框概念翻译产物与蛋白质序列数据库进行比较;
(4)TBLASTN将查询蛋白质序列与以总共六个阅读框(两个链)翻译的核苷酸序列数据库进行比较;和
(5)TBLASTX将核苷酸查询序列的六读框翻译与核苷酸序列数据库的六读框翻译进行比较。
BLAST程序通过识别查询氨基酸或核酸序列与测试序列之间相似片断,在此处被称作”高计分片断对”,来识别同源序列,其中测试序列优选从蛋白质或核酸序列数据库获得。高计分片断对优选通过计分矩阵方法来识别(即对比),其中大部分方法在本领域是已知的。优选地,所用的计分矩阵是BLOSUM62矩阵(Gonnet等人,Science256:1443-1445,1992;Henikoff和Henikoff,Proteins 17:49-61,1993)。不太优选地,也可以使用PAM或PAM250矩阵(如参考Schwartz和Dayhoff编著,1978,Matrices for Detecting Distance Relationships:Atlasof Protein Sequence and Structure,Washington:National BiomedicalResearch Foundation)。BLAST程序可以通过美国National Library ofMedicine获得,例如www.ncbi.nlm.nih.gov。
可以根据序列长度和所研究的同源性程度对上述算法所用的参数进行修改。在一些实施方案中,在没有用户说明书的情况下,这些参数可以是这些算法所用的缺省参数。
图2是说明方法200的一个实施方案的流程图,该方法200用于将新核苷酸或蛋白质序列与序列数据库进行比较,以便确定新序列和数据库中序列之间的同源性水平。序列数据库可以是存储在计算机系统100中的专用数据库,或者可以是公开数据库,如通过因特网获得的GENBANK数据库。
方法200在起点状态201开始,然后进展至状态202,其中将被比较的新数据库被存储在计算机系统100的存储器中。正如上面所讨论的,存储器可以是任何类型的存储器,包括RAM或内部存储设备。
方法200然后进展至状态204,其中打开序列数据库以便用于分析和比较。方法200然后进展至状态206,其中存储在数据库中的第一序列被读入计算机上的存储器中。然后在状态210进行比较,以确定第一序列是否与第二序列相同。重要的是要注意到,这一步不限于在新序列和数据库中的第一序列之间进行精确的比较。用于比较两个核苷酸或蛋白质序列的著名方法对于本技术领域普通技术人员是已知的,即使它们不相同。例如,可以将间隙引入序列中,以便提高两个测试序列之间的同源性水平。比较过程中控制间隙或其它特征是否被引入序列中的参数通常通过计算机系统的用户输入。
一旦两个序列的比较已经在状态210进行,就要在状态210做出一个判断,即两个序列是否相同。当然,术语”相同”不限于完全相同的序列。在方法200中,处于由用户输入的同源参数内的序列将被记录为”相同”。
如果做出的判断是两个序列是相同的,方法200进展至状态214,其中来自数据库的序列的名称被显示给用户。该状态通知用户,具有所显示名称的序列满足输入的同源性约束。一旦所存储的序列的名称被显示给用户,方法200就进展至判断状态218,其中要做出判断,即数据库中是否存在更多的序列。如果数据库中不存在更多的序列,那么方法200就在终止状态220结束。然而,如果数据库中存在更多的序列,那么方法200就进展至状态224,其中指针被指向数据库中的下一个序列,这样该序列可以与新序列进行比较。用这种方式,新序列被对齐,并且与数据库中的每一序列进行比较。
应该注意到,如果在判断状态212已经做出这两个序列不同源的判断,那么方法200将立即进展至判断状态218,以便确定数据库中是否有任何其它序列可进行比较。
因此,本发明的一个方面是一个计算机系统,该系统包括一个处理器;一个其上已经存储了如下述序列中所阐明的序列的数据存储设备:A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列;一个其上已经可检索地存储了将要与如下序列中所阐明的序列进行比较的参考核苷酸序列或多肽序列:A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列;和一个进行比较的序列比较器。序列比较器可以表明所要比较的序列之间的同源性,或者可以鉴别上面所描述的A组核酸序列和与其基本上同一的序列的核酸密码子,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列中的结构基序,或者它可以鉴别相对于这些核酸密码子和多肽密码子的序列中的结构基序。在一些实施方案中,数据存储设备上可以存储如下序列中所阐明的至少2,5,10,15,20,25,30或40或更多个序列:A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列。
本发明的另一个方面是一种方法,用于确定如下序列中所阐明的序列和参考核苷酸序列之间的同源性水平:A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列。该方法包括通过使用一个确定同源性水平的计算机程序读取核酸密码子或多肽密码子,和参考核苷酸或多肽序列,用该计算机程序确定核酸密码子或多肽密码子和参考核苷酸或多肽序列之间的同源性。该计算机程序可以是用于确定同源性水平的大量计算机程序中的任一个,包括此处特别列举的那些(例如具有缺省参数或任何修改参数的BLAST2N)。该方法可以用上面所描述的计算机系统来执行。该方法也可以通过使用计算机程序读取至少2,5,10,15,20,25,30或40或更多个上面所描述的A组核酸序列中所阐明的核酸序列,或B组氨基酸序列中所阐明的多肽序列并且确定核酸密码子或多肽密码子与参考核苷酸序列或多肽序列之间的同源性来进行。
图3是说明计算机中方法250的一个实施方案的流程图,该方法用于确定两个序列是否同源。方法250在开始状态252开始,然后进展至状态254,其中将要被比较的第一序列被存储在存储器上。将要被比较的第二序列然后在状态256被存储在存储器上。方法250然后进展至状态260,其中读取第一序列中的第一个字母,然后进展至状态262,其中读取第二序列的第一个字母。应该理解到,如果该序列是核苷酸序列,那么该字母将通常是A,T,C,G或U。如果该序列是蛋白质序列,那么优选地它是单字母氨基酸密码子,这样可以容易地比较第一和第二序列。
然后在判断状态264做出这两个字母是否相同的判断。如果它们相同,那么方法250进展至状态268,其中读取第一和第二序列中的下一个字母。然后做出下一个字母是否相同的判断。如果它们相同,那么方法250继续这一循环,直到两个字母不相同。如果做出的判断是下两个字母不相同,那么方法250进展至判断状态274,以确定是否有更多的字母或者序列可以读取。
如果没有更多的字母可以读取,那么方法250进展至状态276,其中第一和第二序列之间的同源性水平被显示给用户。同源性水平通过计算第一序列中相同序列之间的字母在总序列中的百分比来确定。因此,如果第一个含有100个核苷酸的序列中的每一字母与第二序列中的每一字母进行对齐,同源性将是100%。
另外,计算机程序可以是这样的计算机程序,即将本发明中所阐明的核酸序列的核苷酸序列与一个或多个参考核苷酸序列进行比较,以便确定A组核酸序列和与其基本上同一的序列的核酸密码子是否与参考核酸序列在一个或多个位置上不同。任选地这样的程序记录了被插入、删除或取代的核苷酸的长度和相对于参考多核苷酸序列或A组核酸序列和与其基本上同一的序列中所阐明的核酸序列的序列的同一性。在一个实施方案中,计算机程序可以是这样的程序,即确定A组核酸序列和与其基本上同一的序列中所阐明的核酸序列相对子参考核苷酸序列是否含有单核苷酸多态现象(SNP)。
因此,本发明的另一个方面是一种方法,用于确定A组核酸序列和与其基本上同一的序列中所阐明的核酸序列是否与参考核苷酸序列在一个或多个核苷酸上不同,所述方法包括如下步骤:通过鉴别核酸序列间差异的计算机程序读取核酸密码子和参考核苷酸序列,用该计算机程序鉴别核酸密码子和参考核苷酸序列之间的差异。在一些实施方案中,计算机程序是鉴别单核苷酸多态现象的程序。该方法可以通过上面说明的计算机程序和图3中所说明的方法来完成。该方法也可以通过用计算机程序读取A组核酸序列和与其基本上同一的序列中所阐明的至少2,5,10,15,25,30或40或更多个核酸序列,以及参考核苷酸序列,并且用该计算机程序鉴别核酸密码子和参考核苷酸序列之间的差异来进行。
在其它实施方案中,基于计算机的系统可以进一步包括一个鉴别器,用于鉴别A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列中的特征。
“鉴别器”指一个或多个程序,所述程序鉴别A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列中的某些特征。在一个实施方案中,鉴别器可以包括一个程序,该程序鉴别用于在A组核酸序列和与其基本上同一的序列中所阐明的核酸序列中鉴别开放阅读框。
图4是说明鉴别器方法300的一个实施方案的流程图,该方法用于检测序列中某个特征的存在。方法300在起始状态302开始,然后进展至状态304,其中将被检查特征的第一序列被存储到计算机系统100中的存储器115中。方法300然后进展至状态306,其中开放序列特征的数据库。这样的数据库将包括每一特征属性连同特征名称的列表。例如,特征名称可以是“起始密码子”,属性将是“ATG”。另一个实例将是特征名称“TAATAA盒”,特征属性将是“TAATAA”。这样的一个数据库的实例是由University of Wisconsin Genetics ComputerGroup(www.gcg.com)产生的。另外,这些特征是结构多肽基序,如α-螺旋、β-片层或功能多肽基序,如酶活性位点、螺旋-转角-螺旋基序或本技术领域普通技术人员已知的其它基序。
一旦特征数据库在状态306开放,方法300进展至状态308,其中从数据库读取第一特征。然后在状态310进行第一特征的属性与第一序列的比较。在状态316进行判断,即在第一序列中是否存在该特征的属性。如果存在该属性,那么方法300进展至状态318,其中所存在的特征的名称被显示给用户。
方法300然后进展至判断状态320,其中做出数据库中是否存在更多特征的判断。如果不存在更多的特征,方法300在结束状态324结束。然而,通过数据库中存在更多的特征,那么方法300在状态326读取下一个序列特征,并且循环回到状态310,其中将下一特征的属性再次与第一序列进行比较。
应该注意到,如果在判断状态316中发现第一序列中不存在特征属性,那么方法300直接进展至判断状态320,以便确定数据库中是否存在更多的特征。
因此,本发明的另一方面是一种方法,用于鉴别A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列中的特征,该方法包括通过在其中鉴别特征的计算机程序读取核酸密码子或多肽密码子,并且用该程序在核酸密码子内鉴别特征。在一个实施方案中,计算机程序包括一个鉴别开放阅读框的计算机程序。该方法可以通过用计算机程序读取A组核酸序列和与其基本上同一的序列中所阐明的一个单一序列或者至少2,5,10,15,25,30或40或更多个核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列,并且用该计算机程序鉴别核酸密码子或多肽密码子内的特征来进行。
A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列可以以多种格式存储在多种数据存储程序且用多种数据存储程序来操纵。例如,A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列可以以文本存储在字处理文件中,如MicrosoftWORD或WORDPERFECT或以ASCII文件存储在本技术领域普通技术人员熟悉的多种数据库程序中,如DB2、SYBASE或ORACLE。而且,许多计算机程序和数据库可以被用作序列比较算法、鉴别器或参考核苷酸序列或多肽序列源,这些序列将要与A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列进行比较。下述列表目的不在于限定本发明,而是对有用的程序和数据库提供指导,这是对于A组核酸序列和与其基本上同一的序列中所阐明的核酸序列,或B组氨基酸序列和与其基本上同一的序列中所阐明的多肽序列有用的程序和数据库。
可以使用的程序和数据库包括但不限于:MacPattern(EMBL),DiscoveryBase(Molecular Application Group),GeneMine(MolecularApplications Group),Look(Molecular Applications Group),MacLook(Molecular Applications Group),BLAST和BLAST2(NCBI),BLASTN和BLASTX(Altschul等人,J.Mol.Biol.215:403,1990),FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci.USA,85:2444,1988),FASTDB(Brutlag等人,Comp.App.Biosci.6:237-245,1990),Catalyst(MolecularSimulations Inc.),Catalyst/SHAPE(Molecular Simulations Inc.),Cerius2.DBAccess(Molecular Simulations Inc.),HypoGen(MolecularSimulations Inc.),Insight II,(Molecular Simulations Inc.),Discover(Molecular Simulations Inc.),CHARMm(Molecular Simulations Inc.),Felix(Molecular Simulations Inc.),DelPhi,(Molecular Simulations Inc.),QuanteMM,(Molecular Simulations Inc.),Homology(MolecularSimulations Inc.),Modeler(Molecular Simulations Inc.),ISIS(MolecularSimulations Inc.),Quanta/Protein Design(Molecular Simulations Inc.),WebLab(Molecular Simulations Inc.),WebLeb Diversity Explorer(Molecular Simulations Inc.),Gene Explorer(Molecular Simulations Inc.),SeqFold(Molecular Simulations Inc.),the MDL Available ChemicalsDirenctory数据库,Derwent’s World Drug Index数据库,BioByteMasterFile数据库,Genbank数据库和Genseqn数据库。通过所给出的本发明的公开内容,许多其它程序和数据库对于本技术领域普通技术人员是显而易见的。
可以用上述程序检测的基序包括编码亮氨酸拉链的序列、螺旋-转角-螺旋基序、糖基化位点、遍在蛋白化位点、α-螺旋、β-片层、编码信号肽的信号序列,所述信号肽指导所编码的蛋白的分泌,在转录调节中相关的序列,如同源框、酸性序列、酶活性位点、底物结合位点和酶裂解位点。
本发明利用了酶的独特的催化特性。尽管在化学转化中使用生物催化剂(即纯化酶或粗酶,非活性或活性细胞)通常需要鉴别与特定起始化合物反应的特定生物催化剂,本发明使用对于许多起始化合物如小分子中存在的官能基团特异的选择的生物催化剂和反应条件。每一种生物催化剂对于一个官能基团或几个相关的官能基团特异,并且可以与许多含有该官能基团的起始化合物反应。
生物催化反应产生了来自单一起始化合物的衍生物群体。这些衍生物可以进行另一轮生物催化反应,以产生衍生化合物的第二群体。每一次生物催化衍生的重复就会产生成千上万的原始小分子或化合物的变异物。
酶在起始化合物的特定位点反应,不会影响分子的其余部分,该过程用传统化学方法很难实现。高度生物催化特异性提供了在文库中鉴别单一活性化合物的方法。该文库的特征在于用于产生该文库的生物催化反应系列,被称作“生物合成历史”。筛选该文库的生物活性并且跟踪生物合成历史可以鉴别产生活性化合物的特定反应序列。重复反应序列,并且确定所合成的化合物的结构。这种鉴别模式不同于其它合成和筛选方法,不需要固定化技术,并且可以使用实质上任何类型的筛选分析方法在溶液中合成且测试化合物。重要的是要注意到,官能基团上的酶反应的高度特异性允许“跟踪”特定酶反应,所述特定酶反应形成生物催化法产生的文库。
许多程序步骤是用机械人自动化进行的,这样能完成大量生物催化反应,并且每天筛选被试验物,以及确保高水平的准确性和可再现性。这样的结果是,可以在几周内产生衍生化合物的文库,该文库用当前的化学方法将需要数年才能产生。
在一个特定的实施方案中,本发明提供了一种用于修饰小分子的方法,该方法包括用小分子接触由此处描述的多核苷酸编码的多肽或其酶活性判断,以产生修饰的小分子。测试修饰的小分子文库,以确定文库中是否存在表现出期望活性的小分子。通过系统地去除用于产生文库部分的每一生物催化反应,然后测试文库部分中产生的小分子是否存在或不存在具有期望活性的修饰的小分子,从而鉴别产生具有期望活性的修饰小分子的特定生物催化反应。任选地重复产生期望活性的修饰小分子的特定生物催化反应。用一组生物催化剂来完成生物催化反应,所述生物催化剂与小分子结构中发现的不同结构部分反应,每一生物催化剂对于一个结构部分或一组相关结构部分特异;并且每一生物催化剂与含有不同结构部分的许多不同小分子反应。
在一个实施方案中,本发明的新颖碱性淀粉酶通过如下来鉴别:在高pH下筛选活性,并且鉴别在自动洗碗(ADW)配方中具有稳定性的淀粉酶。对于衍生自地衣芽孢杆菌的淀粉酶进行比较。水解对于pH的依赖性研究表明,本发明的大部分碱性淀粉酶的最适pH为7,或更低,除了克隆B的最适pH为大约8。本发明的碱性淀粉酶保留了在ADW配方中的活性,尽管克隆B对于高温敏感。优选地,当在ADW产品中使用时,本发明的碱性淀粉酶将在pH 10-11和45-60℃下发挥作用。
本发明参考下述实施例进行了进一步的描述;然而,应该理解到本发明不限于这些实施例。
实施例
实施例1
耐热α-淀粉酶的鉴别和表征
本实施例显示了新颖酸性淀粉酶的鉴别。筛选程序是在中性和低pH条件下进行的。目标是发现用低pH样品产生的DNA文库。这一努力发现了数百种有能力降解淀粉的克隆。DNA序列和生物信息分析将这些基因中的大多数分类为以前未曾鉴别的淀粉酶。
生化研究
淀粉酶基因组克隆的生化分析表明许多克隆的最适pH低于6。通过在70℃,80℃,90℃或100℃温育10分钟并且测量在pH为4.5时的残余活性来测试这些基因组克隆的裂解物的耐热性。选择在80℃热处理后保留>50%活性的克隆进行进一步分析。将这些克隆在90℃和pH 6.0和pH4.5温育10分钟,并且在pH 4.5测试残余活性(图1),在处理后大部分克隆保留的活性>40%。为了便于比较,所进化的淀粉酶,克隆c的残余活性等于第二代酶中最好的酶;克隆c的比活性比较高。
在pH为4.5室温、70℃和90℃测量在90℃和pH 4.5进行热处理后具有残余活性的克隆的热活性。表1表明SEQ ID NO.:87(嗜热脂肪芽孢杆菌淀粉酶)和SEQ ID NO.:113(地衣芽孢杆菌淀粉酶)的水解率在较高温度下有所降低,尽管SEQ ID NO.:125的水解率随着温度升高到70℃继续增加,并且在90℃仅仅降低了大约50%。
候选者评价
基于在90℃进行热处理后在pH为4.5时的残余活性,比活性和在90℃时的淀粉水解率,当与地衣芽孢杆菌淀粉酶比较时,在淀粉液化分析方法中将SEQ ID NO.:125与进化的淀粉酶克隆c进行比较。
  室温   70℃   90℃
  SEQ ID NO.:87<sup>1</sup>   1.25   1.43   0.33
  SEQ ID NO.:113<sup>2</sup>   3.3   1.9   0.39
  SEQ ID NO.:125   1.9   47   19
表1:三个基因组克隆在pH为4.5和3个不同温度时的染料标记淀粉水解率(相对荧光单位/秒)。1B.stearothermophilus淀粉酶,2B.licheniformis淀粉酶。
实施例2
碱性pH下耐热淀粉酶活性
该实施例的起始焦点是评价商业自动洗碗(ADW)配方中的现有淀粉酶系列。这一努力鉴别出了两个候选者:一个在高pH具有活性(SEQ ID NO.:115),另一个在ADW配方中具有稳定性(SEQ ID NO.:207)。研究也包括高pH淀粉酶的鉴别。这一努力发现了数百种具有降解淀粉能力的克隆。DNA序列和生物信息分析将这些基因中的大多数分类为先前没有鉴别的淀粉酶。剩余的开放阅读框是新支链淀粉酶(neopullulanase)、淀粉支链淀粉酶(amylopullulanase)和淀粉麦芽糖酶。广泛的生化和应用研究表明了3个候选者:克隆B,SEQ ID NO.:147,和SEQ ID NO.:139),在pH 10具有高比活性,但不幸的是在ADW配方中缺乏稳定性。总之,已经鉴别了新颖淀粉酶系列,其中每一淀粉酶对于ADW应用具有期望表型。
生化研究
淀粉酶基因组克隆地生化分析表明,这些克隆中大多数在pH 10和50℃水解淀粉。为了产生足够数量的酶以便进一步进行生化和应用测试,40个最具活性的基因组克隆的淀粉酶开放阅读框被亚克隆到表达载体中。这一努力包括:对于那些含有推定信号序列的克隆构建两个构建物,为每一亚克隆建立生长和诱导条件(加上或减去淀粉酶信号肽)。
可溶的活性蛋白质从34个亚克隆中被成功地纯化到同质性,用缓冲液中的2%淀粉于pH 8和pH 10(40℃和50℃)测量比活性(单位/mg,其中1单位=μmol还原糖/分钟)。选择来自地衣芽孢杆菌的淀粉酶(SEQ ID NO.:113)作为这些研究的基准。比活性通过在30分钟反应过程中在不同时间点去除样品并且分析还原糖来确定比活性。起始比率通过将进展曲线适合线性方程来确定。最好的候选者的比较如表2所示。
确定水解率对pH的依赖性的研究表明,只有克隆B是“碱性淀粉酶”,其最适pH为大约8;所有其它的最适pH为大约7或更低。不过,应该清楚击中系列包括在pH 10和50℃具有明显活性的几种榜样淀粉酶。
表2淀粉酶的比活性(U/mg纯酶)
  酶   比活性pH 8,40℃   比活性pH 10,50℃
  克隆B   682   20
  SEQ ID NO.:139   430   33
  SEQ ID NO.:127   250   47
  SEQ ID NO.:137   230   3
  SEQ ID NO.:113(地衣芽孢杆菌)   228   27
  SEQ ID NO.:205   163   4
  其余   <40
稳定性
测量通过生化分析鉴别的3个最佳候选者中每一个在存在ADW配方的情况下的稳定性。这些研究的基准是配方基质中的商业酶。图13说明了在存在ADW配方的多种组分的情况下在50℃温育30分钟后的残余活性(于pH 8和50℃测量);pH 8,pH 10.8,ADW溶液(有漂白剂)和ADW溶液(无漂白剂)。温育后,所测量的活性以原始活性的百分比表示。该数据表明,克隆B对于高温非常敏感,尽管其它淀粉酶受影响很小。当在高pH和高温温育这些酶时,商业酶SEQ IDNO.:139稳定性变差;然而,SEQ ID NO.:127保留了全部活性。在重复试验中在pH 10温育对pH 8温育后,观察到SEQ ID NO.:127的显而易见的反常行为。
当在ADW基质中于50℃测量了染料标记的淀粉的淀粉酶活性时,商业淀粉酶表现出活性在pH为8时的大约5%。在相同分析中,克隆B、SEQ ID NO.:139和SEQ ID NO.:127表现出其在pH为8时测量的原始活性的不到2%。
洗涤测试
用淀粉涂敷玻片进行洗涤测试,以测量每一纯化酶与商业淀粉酶相比的性能。根据试验程序,准备用空心面条淀粉涂敷的玻片。将两个预先称重的淀粉涂敷玻片背对背置于50mL圆锥管中,每个管加入25mL ADW溶液,+/-酶。将试管在垂直的圆盘传送带上轻轻旋转的同时于50℃温育20分钟。在温育期后,将玻片立即在水中洗涤,烘干过夜。所有试验进行两次,商业酶作为阳性对照组。这些试验的结果(图6)以所去除的淀粉的净百分比表示,例如,在有酶的ADW中去除的淀粉百分比,减去在单独ADW中去除的淀粉百分比。
实施例3
基因最优化
酶的特性可以通过多种进化策略来提高,包括基因位点饱和诱变(GSSMTM)和基因再装配TM(Diversa Corporation,San Diego,CA)。这样的技术将被用于所发现的淀粉酶基因,以便产生可以筛选改进的特性的变体库。
进化的亲本分子将是下述分子中的一种或多种:SEQ ID NO.:113,SEQ ID NO.:139,SEQ ID NO.:115和SEQ ID NO.:127(SEQ ID NO.:127的平截形式)。
已经开发出了高产量筛选(high throughput screen)来评价存在ADW特性情况下的酶特性。高产量筛选(HTS)的开发在任何进化程序中是最重要的。HTS已经实现自动化,且对于亲本淀粉酶,已经显示出一致结果(图7)。亲本淀粉酶在ADW配方中具有可测量的活性,然而相对于pH 8活性降低了很多。
通过GSSM或随机突变产生的SEQ ID N0.:81的突变体
GSSM
宿主:大肠杆菌,XL1-Blue MRF’
载体:pSE420
亲本:SEQ ID NO.:81
突变的残基包括#2-93,#118-159,#389和#433。
已经被测序的提高活性的淀粉酶克隆列表
  名称  变化   大肠杆菌中的数据
  SEQ ID NO.:81/4V  Y4V,TAT到GTG   活性增加2倍
  SEQ ID NO.:81/4V  Y4V,TAT到GCG   活性增加2倍
SEQ ID NO.:81/30V  T30,ACC到GTT 活性增加2.5倍
SEQ ID NO.:81/31V  I31Q,ATC到TAG 活性增加1.5倍
SEQ ID NO.:81-4V-30V  4V+30V 活性增加3倍
SEQ ID NO.:81-2C  C154A&C155A 活性增加1.2倍
SEQ ID NO.:81-4C  C154,C155A&C389A,C433A 活性增加2倍
备注:
·对于SEQ ID NO.:81/31Q,TAG密码子应该编码终止密码子,但由于宿主的supE突变它编码XL1-Blue MRF’中的Gln。
随机突变
通过易错PCR按照如下方法将随机突变导入SEO ID NO.:81中
◆在反应中使用不平衡的dATP,dCTP,dGTP或dTTP来导入突变
◆在反应中使用不同浓度的MnCl2来导入诱变
◆使用上述两种方法的组合
新活性克隆的确认:
◆在15ml Falcon管中从初级筛选中培养上调突变体,并且用1mM IPTG诱导
◆用RBB-淀粉作为底物再次进行分析
◆对克隆进行测量以确认突变
已经被测序的提高活性的淀粉酶克隆列表
Figure C0280864000791
实施例4
在碱性pH下对具有活性的α-淀粉酶的表征
进一步对本发明的在碱性pH下具有活性的淀粉酶进行表征。已经在pH 8和10(40℃和50℃)进行了对2%淀粉的动力学分析。
表4
Figure C0280864000801
(地衣芽孢杆菌)
Figure C0280864000802
1单位活性倍定义为每分钟释放1μmol还原糖
实施例5
淀粉酶活性分析:BCA还原端分析
相关克隆地淀粉酶的活性使用下面的方法学进行确定。
1.如下准备2种底物溶液:
a)2%可溶淀粉(马铃薯)溶液,pH为8,通过将2mg马铃薯淀粉溶解在pH为8的100ml 100mM磷酸钠中制备。
b)2%可溶淀粉(马铃薯)溶液,pH为10,通过将2mg马铃薯淀粉溶解在100ml 100mM碳酸钠中制备。
在沸腾的水浴中加热这两种溶液,同时混合,持续30-40分钟直到淀粉溶解。
2.制备溶液A,使用64mg/ml一水合碳酸钠,24mg/ml碳酸氢钠,和1.95mg/ml BCA(4,4’-二羧基-2,2’-二喹啉二钠盐(Sigma Chemical cat#D-8284)来制备。将上述加入到dH2O中。
3.制备溶液B,通过将1.24mg/ml五水合硫酸铜和1.26mg/ml L-丝氨酸混合而制备。将该混合物加入到dH2O中。
4.用溶液A和B制备一种工作试剂,其中溶液A和B的比率为1∶1。
5.制备dH2O中的10mM麦芽糖的麦芽糖标准溶液,其中10mM麦芽糖在期望pH下混合到2%可溶淀粉中,使最终浓度为0,100,200.300,400,600μM。标准曲线将通过每组时间-点产生。由于该曲线是通过将10μl标准物加入到工作溶剂中来确定,所以它能确定出0,1,2,3,4,6nmol麦芽糖。
6.将1ml底物溶液等分到微型离心管中,在加热块或被加热的水浴中使其平衡到期望温度(5分钟)。将50μl酶溶液加入到管盖子的内部。
7.该溶液用溶液A&B的混合溶液5ml进行平衡,将100μl等分到96孔PCR板中。将板放在冰上。
8.在5分钟温度平衡后,盖上管子的盖子,倒置且涡流3次。将10μl立刻等分到板子上,t=0(零时间点)。将酶混合物留在加热块中,在每一期望时间点等分10μl(例如0,5,10,15,20,30分钟)。
9.确保12个孔是空的(只有工作试剂被等分),以便加入10μl标准物作标准曲线。
10.当所有时间点被收集以及加入了标准物之后,盖住板,加热到80℃维持35分钟。在冰上将板冷却10分钟。所有孔中加入100μl H2O。混合均匀并将100μl样品加入到平底96孔板上,在560nm下读取吸光值。
11.对每一样品的时间点根据其自己的t=0调零(从其它A560值的平均值中减去平均的t=0A560值)。通过标准曲线的斜率将A560值(实验值)转化为微摩尔(将A560值(实验值)作被除数,除以标准曲线的斜率(A560/umole))。生成时间点和微摩尔(以微摩尔/分表示)的斜率,乘以100(作为微摩尔值,只是因为在检试中使用了10μl,而不是1ml rxn中所含的量)。斜率(以微摩尔/分表示)除以用以毫克为单位表示的蛋白质数值可以得到比活性。在三个测试样品中,所有的点应该至少是以双份方式重复。一个例示性的标准曲线图示在图11中。
表5:样品数据
  A560实验值/标准斜率
  克隆   稀释度   分钟   A-560-1   A-560-2   平均A560   调零A560   微摩尔
  ENZ   50   0   0.1711   0.1736   0.17235   0   0.000
  5   0.2104   0.2165   0.21345   0.0411   0.0005
  10   0.2492   0.2481   0.24865   0.0763   0.0009
  15   0.2984   0.2882   0.2933   0.12095   0.0014
  20   0.3355   0.3409   0.3382   0.16585   0.0020
  30   0.3942   0.3805   0.38735   0.215   0.0026
  40   0.4501   0.4412   0.44565   0.2733   0.0033
活性=0.008646微摩尔/分
蛋白质浓度(mg/ml)除以任意稀释度,就可以得到测试中所用毫克数值。
上述斜率除以测试中所用毫克数值,得到比活性
比活性=24.93微摩尔/分/毫克
(例如,参见,Dominic W.S.Wong,Sarah B.Batt,和George H.Robertson(2000).Microassay for rapid screening of alpha-amylase activity.J.Agric.Food Chem.48,4540-4543,以及Jeffrey D.Fox和John F.Robyt,(1991).Minituratization of three carbohydrate analyses using amicro sample plate reader.Anal.Biochem.195,93-96,在此引用加以参考)。
实施例6
筛选α-淀粉酶活性
克隆的淀粉酶活性可以通过本技术领域的多种方法进行评价。下面是有关本发明所用的一般方法学的叙述。每个板上用于筛选的噬菌斑的数目大约是10,000噬菌斑形成单位(pfu)。对于每个DNA文库:对于一个分离文库而言,至少筛选50,000个噬菌斑;对于一个非分离文库而言,至少筛选200,000个噬菌斑。这取决于相对λZap Express扩增裂解物而言的噬菌斑形成单位的滴度。
λ文库的滴度确定
1)将微升量的λZap Express扩增文库原种加到600μl大肠杆菌MRF细胞中(OD600=1.0)。为稀释MRF原种,使用了10mM MgSO4
2)在37℃温育15分钟。
3)将细胞悬液转移到50℃的5-6ml NZY培养基的顶层琼脂中,轻轻混合。
4)立即将琼脂溶液倾倒到大的(150mm)NZY培养基平板上。
5)然后让顶层琼脂完全凝固(大约30分钟),然后倒置平板。
6)在39℃将平板温育8-12小时。
7)估计噬菌斑的数目。确定出噬菌体滴度为10,000pfu/板。如果需要,用SM缓冲液稀释文库噬菌体等分试样。
底物筛选
1)将来自扩增文库的λZap Express(50,000pfu)加到600μl大肠杆菌MRF细胞中(OD600=1.0)。对于非环境文库,制备4管(50,000pfu/管)。
2)在37℃温育15分钟。
3)当噬菌体/细胞悬液正在温育时,将1.0mL红色淀粉底物(1.2%w/v)加入到50℃的6.0mL NZY培养基的顶层琼脂中,彻底混合。将溶液于50℃保存,直到使用。
4)将1/5(10,000pfu)细胞悬液转移到底物/培养基的顶层琼脂中,轻轻混合。
5)立即将琼脂溶液倾倒到大的(150mm)NZY培养基平板上。
6)然后让顶层琼脂完全凝固(大约30分钟),然后倒置平板。
7)将剩余细胞悬液重复步骤4-6四次(每次1/5悬液)。
8)在39℃将平板温育8-12小时。
9)观察平板上噬菌斑周围的清澈区(孔环区)。
10)将具有孔环的噬菌斑从琼脂中取出,并且转移到无菌微量管中。大孔200μL移液管管尖正好用于移出含有期望噬菌斑的(核心)琼脂塞。
11)将噬菌体再次悬浮于500μL SM缓冲液中。加入20μL氯仿,以抑制任何进一步的细胞生长。
12)在开始下一步之前,将纯噬菌体悬液在室温温育4小时,或者过夜。
分离纯克隆
1)将10mL再悬浮的噬菌体悬液加到500μl大肠杆菌MRF细胞中(OD600=1.0)。
2)在37℃温育15分钟。
3)当噬菌体/细胞悬液正在温育时,将1.0mL红色淀粉底物(1.2%w/v)加入到50℃的6.0mL NZY培养基的顶层琼脂中,彻底混合。将溶液于50℃保存,直到使用。
4)将细胞悬液转移到底物/培养基的顶层琼脂中,轻轻混合。
5)立即将琼脂溶液倾倒到大的(150mm)NZY培养基平板上。
6)然后让顶层琼脂完全凝固(大约30分钟),然后倒置平板。
7)在39℃将平板温育8-12小时。
8)观察平板上单个噬菌斑(纯克隆)周围的清澈区(孔环区)。如果单个噬菌斑不能分离,调节滴度和并且再次对噬菌体悬液铺板。
9)将具有孔环的单个噬菌斑从琼脂中取出,并且转移到无菌微量管中。大孔200μL移液管管尖正好用于移出含有期望噬菌斑的(核心)琼脂塞。为了扩增滴度,将5个单个活性噬菌斑装入到微量管中。
10)将噬菌斑再次悬浮于500μL SM缓冲液中。加入20μL氯仿,以抑制任何进一步的细胞生长。
11)在开始下一步之前,将纯噬菌斑悬液在室温温育4小时,或者过夜。通过将DMSO加入到噬菌体悬液(7%v/v)中,将纯噬菌体悬液储存于-80℃。
排除纯克隆
1)将100μL纯噬菌体悬液加到200μl大肠杆菌MRF细胞中(OD600=1.0)。向其中加入1.0μL ExAssist噬菌体(>1X106pfu/mL;Stratagene)。使用2059 Falcon管来排除。
2)将悬液在37℃温育15分钟。
3)将3.0mL 2x YT介质加入到细胞悬液中。
4)在摇动的同时将悬液在30℃温育至少6小时或过夜。
5)将管子变为70℃20分钟。噬菌粒悬液可以在4℃储存1-2月。
6)将100μL噬菌粒悬液转移到含有200μL大肠杆菌Exp 505细胞(OD600=1.0)的微量管中。
7)将悬液在37℃温育15分钟。
8)将300μL SOB加入到悬液中。
9)将悬液在37℃温育30-45分钟。
10)将100μL悬液转移到小的(90mm)LB培养基平板中,所述平板含有用于Zap Express DNA文库的卡那霉素(含有卡那霉素50μg/mL的LB培养基)或用于Zap II DNA文库的氨苄青霉素(含有卡那霉素100μg/mL的LB培养基)。
11)剩余悬液被转移到另一个小的LB培养基平板上。
12)使用无菌玻璃珠将悬液均匀地分配到平板上。
13)将平板在30℃温育12-24小时。
14)观察平板的集落。
15)将单个集落接种到含有适当的抗生素的LB液体培养基中,并且在30℃温育12-24小时。
16)甘油原种可以通过将80%甘油加入到液体培养物(15%v/v)中来制备,并且于-80℃储存。
活性检验
1)将50μL液体培养物转移到微量管中。将500μL 8%pH 7Amylopectin Azure加入到同一管子中。每一克隆准备2个管子。
2)在50℃测试活性3小时或过夜。使用pH 7缓冲液作为对照组。
3)在冰水浴中将试验样品冷却5分钟。
4)加入750μL Ethaqnol并且彻底混合。
5)在13000rpm(16000g)离心5分钟。
6)在595nm测量上清液的OD。
RFLP分析
1)将1.0mL液体培养物转移到无菌微量管中。
2)在13200rpm(16000g)离心1分钟。
3)丢弃上清液。将另一种1.0mL液体培养物加入到同一无菌微量管中。
4)在13200rpm(16000g)离心1分钟。
5)丢弃上清液。
6)按照QIAprep旋转微型试剂盒规程以进行质粒分离。
7)使用BioPhotometer检查DNA浓度。
8)使用Sac I和Kpn I进行第一次双重消化。在37℃温育1小时。
9)使用Pst I和Xho I进行第二次双重消化。在37℃温育1小时。
10)将加样染料加入到消化后的样品中。
11)以120伏特在1.0%琼脂糖凝胶上对消化后的样品电泳1-1.5小时。
12)用凝胶成象仪观察凝胶。所有具有不同消化模式的克隆将进行序列分析。
实施例7
淀粉酶分析
宿主培养物的制备
1.开始过夜培养XL 1-Blue MRF宿主细胞。使用来自划线平板的单菌落接种用20μg/mL四环素补充的10mL LB。过夜培养培养物,在37℃摇动至少16小时。
2.使用无菌技术,用具有来自过夜LBTet培养物的XL 1-Blue MRF宿主接种新鲜的100mL LBTet每日培养物。
3.在37℃振荡器中培养,直到OD值到达0.75-1.0。
4.使宿主细胞在1000xg离心10分钟得以沉淀,然后轻轻地再悬浮于10mM OD值为5的MgSO4中。
5.将少量宿主细胞稀释到OD1,用于滴度测定和pintooling。
6.当宿主制备物被储存于冰中或4℃时,可以使用长达1周时间。
注释
-为了缩短日培养的时间,在LB中使用1/2X通常的Tet浓度(1/2X=10μg/mL),或者完全略去抗生素。
-当用四环素选择时不使用NZY。NZY培养基中的高Mg-浓度使得Tet不起作用。
测定λ文库的滴度
7.将三个无菌微量离心管放置到支架上。
8.将995μL制备的宿主细胞等分到一个管子中,并且将45μL制备的OD1宿主细胞等分到两个剩余的管子的每一个中。
9.将5μLλ文库加入到含有995μL宿主细胞的管子中,涡流搅拌混合。这导致稀释因子为200。
10.通过将5μL先前的稀释液连续地加入到含有45μL制备的宿主细胞的其余两个管子中,制备1/2,000和1/20,000稀释液。
11.通过在37℃温育15分钟,使噬菌体吸附到宿主上。
12.同时,将100μL制备的OD1宿主细胞移入三个Falcon 2059管子的每一个中。
13.将5μL每一稀释液加入到含有宿主细胞的独立的2059管子中。
14.通过将3mL顶层琼脂加入到每一个管子中,并且快速地倾倒在90mm NZY板上,对每一稀释液铺平板。在顶层琼脂变硬之前确保平滑且均匀地分配。
15.倒置平板,在37℃过夜培养。
16.数出噬菌斑的数量,并且计算文库原种的滴度(单位为:噬菌斑形成单位(pfu)/μL)。
淀粉酶的λ微量滴度筛选
制备
1.如上所述制备足量的XL1-Blue MRF宿主培养物,用于计划的筛选量。100mL培养物通常足以筛选2-3个文库。
2.高压灭菌与QFill 2分配器相容的几个瓶子。这些瓶子是广口科尔希(Corning)瓶,250mL,在瓶口有密封环。
3.确保具有足量的适于筛选的平板,顶层琼脂,BODIPY淀粉,红色淀粉溶液等等。
4.规定用自动化代表形式设定运转Day 2自动仪器循环。
第一天
1.用文库筛选和平板数目标记1536-孔平板(黑色)。Tough-TagsTM管粘着剂,在宽度方向切割成两半,是标记1536-孔平板的理想标记物。
2.计算筛选所必须的文库、宿主细胞和NZY介质的体积。这用Excel电子表格很容易实现。
3.将所计算的λ文库和OD5宿主细胞的体积混合到一个无菌250mL广口科尔希瓶中(具有密封环)。
4.允许在37℃发生吸附作用15分钟。
5.加如所计算的体积的NZY介质并且很好地混合。这被称作细胞-噬菌体-介质悬浮液。
6.通过将50μL细胞-噬菌体-介质悬浮液与250μL OD1细胞在Falcon 2059管中混合进行伴随滴度测定,然后与9mL顶层琼脂一起铺平板于150mm NZY平板上。在37℃将伴随滴度平板培养过夜。
7.用剩余的悬浮液装载分配器,并且将每一标记的1536-孔平板以4μL/孔进行排列。如果分配器在一些孔中留下了气泡,可以通过在200xg离心1分钟去除这些气泡。
8.将0.5μL阳性对照组噬菌体加入到至少两个分析平板的AD46孔位置处。为了完成这一目的,使用具有强大的淀粉酶阳性的λ克隆。SEQ ID NO.:113或SEQ ID NO.:199的λ版本是阳性对照组的很好的选择。
9.在一个加湿温育器中(≥95%)将排列平板于37℃培养过夜。
第二天
1.计算伴随滴度测定平板上的pfu数量,确定每孔的平均接种密度(单位为pfu/孔)。
2.如下pintool每一文库筛选的至少两个平板(优选地2个含阳性对照组):
a)准备两个宿主菌苔平板作为其上进行pintool的表面:将250μLOD1宿主细胞与2mL 2%红色淀粉混合,并且用9mL顶层琼脂铺平板于150mm NZY平板上。尽可能地将每一平板与顶层琼脂凝固保持水平,以便在平板上产生均匀的红色色彩。
b)使用两次火焰消毒的1536位置pintool,在宿主菌苔平板上重复至少两个筛选平板。
c)将pintool的受体平板放置在层流罩超静台中,将其盖子打开大约15-30分钟(以排出过量的湿气)。
d)将盖子放回原处,在37℃倒置培养过夜。
3.如下制备2X BODIPY淀粉底物缓冲液:
a)计算以4μL/孔的所有筛选平板所需要的2X底物缓冲溶液的总体积(包括分配器所需要的任何额外的死区体积),并且将100mMCAPS pH 10.4的量计量为适合于所用分配器的容器。
b)收回足量0.5mg的BODIPY淀粉管子,以产生终浓度为20-30μg/mL的所需体积的2X底物缓冲液(在上面步骤a)中所计算的)。
c)于室温将50μL DMSO溶解在每一0.5mg管子中,避光,同时频繁涡流。这需要超过15分钟时间;一些生产批量的BODIPY淀粉比其它淀粉溶解的好一些。
d)在每一管子中加入50μL 100mM CAPS缓冲液,pH 10.4,并且涡流混合。
e)合并所有管子的内容物,并且通过在微型离心机中以最大速度离心速度离心1分钟去除任何未溶解的聚集物。
f)将上清液加入到上述步骤a)中测量的剩余的100mM CAPS缓冲液中。
g)通过用金属箔包裹使2X底物缓冲液避光。
4.将平板和底物缓冲液放入自动化室中,用下述参数设计自动仪器的程序:
a)每孔分配4μL底物缓冲液
b)第一次读数在加入底物后1小时,第二次读数在9小时,第三次读数在17小时;读数之间于37℃温育
c)激发过滤器:485nm;发射过滤器:535nm
d)将荧光增益设置为70,或者设置所准备的2X底物缓冲液批次的最适增益。
e)确保所用的培育箱可以使分析平板避光
第三天
1.检查pintool平板在与相关分析平板上的孔对应的所有位置上在细菌菌苔中已透明。而且检查在任何针刺(pin)位置上在红色淀粉中已透明。如果含有阳性对照组的平板被用于pintool,应该能在红色背景上看到一个大的透明区。注意要提防也会在红色淀粉中形成透明区的污染(参见实施例7最后的评论”在红色淀粉中形成透明区地污染物”)。
2.从自动仪器计算机产生的数据表中鉴别出推定的击中。通过遗传工程产生的KANAL程序简化了数据分析。作为单凭经验的方法,推定击中的特征在于具有在整个背景上信号密度清洗至少1.5倍的孔。
3.对于每一推定,从孔中取出2μL,加入到含有500μL SM缓冲液和50μL CHCl3的管子中。涡流混合,并且于4℃储存。该溶液在下文被称作4e-3原种。原始筛选平板应当于4℃避光储存,至少储存到对数据进行分类总结结束时。
这是推荐的用于突破推定击中的方法。这是一种依赖于确认BODIPY淀粉上活性的液相分析方法。另外,推定击中可以被直接铺平板于含有红色淀粉的固相平板上,这样对于2,000-3,000pfu/击中就可以检查透明区。然而,不能观察到红色淀粉上的透明区的一个指示不必是,推定击中是假阳性。然后必需用最初鉴别的格式进行分析(即用BODIPY淀粉作为底物的液相分析)。另外,非常弱的阳性用下面详细描述的方法将更加易于鉴别。
第一天
1.在无菌50mL圆锥管中,将0.5mL OD5宿主细胞与45.5mL NZY混合。这将被称作宿主-介质悬浮液。
2.对于将要分析的每一推定击中,将1mL宿主介质悬浮液等分到3个无菌微量离心管的每一管中。
3.将12道自动移液管设置为多次分配模式,等分试样为20μL,等分量为2x。将具有无菌尖端的清洁装置安放到自动移液管上。
4.将大约1mL宿主介质悬浮液倾倒到一个新无菌溶液盆中,并且加到多道自动移液管上。
5.将20μL/孔分配到黑色384-孔平板(12道x2=24孔)的最后一行(行P)。这一行在下文将被用作对照组。
6.通过用尖端接触盆表面并且按下自动移液管上的RESET按钮将剩余液体排出尖端。将自动移液管稍微朝下放置以阻止尖端受到污染。此时没有必要替换尖端。
7.将盆中的剩余液体倾倒到一个废物容器中(像烧杯),注意避免防溅挡板的污染。
8.对于将要分析的第一推定,取出111μL 4e-3原种(参见淀粉酶的λ微量滴度筛选的第二天),并且将其加入到一组含有1mL宿主介质悬浮液的三个管子中的第一个中(步骤2)。涡流混合。这是稀释物A。
9.取出111μL溶液A,并且将其加入到该组管子的下一个管子中。涡流混合。这是稀释物B。
10.取出111μL溶液B,并且将其加入到该组管子的最后一个管子中。涡流混合。这是稀释物C。现在应该有三种噬菌体稀释物,每一稀释物的浓度以因子10而不同。
11.将稀释物C的内容物(三个样品中最稀的)倾倒到溶液盆中,加到多道自动移液管上。
12.按照20μL/孔分配到384-孔平板(12道x2=24孔)的第一行。
13.通过用尖端接触盆表面并且按下自动移液管上的RESET按钮将剩余液体排出尖端。将自动移液管稍微朝下放置以阻止尖端受到污染。此时没有必要替换尖端。
14.如上所述倒空盆子。
15.将稀释物B的内容物倾倒到相同的盆子中,并且加到多道自动移液管上。
16.按照20μL/孔分配到384-孔平板的第二行。
17.类似地进行步骤13-16以便将稀释物A分配到平板的第三行中。
18.在所有三种稀释物已经被排列到平板的最初3行中后,将所有尖端和溶液盆抛到生物危险废物容器中。
19.用一组干净的无菌尖端放置到自动移液管上,并且打开一个新的无菌溶液盆。
20.对每一剩余的推定击中重复步骤8-19,使用平板上剩余的行,直到行O。在一个384-孔平板上可以分析五个推定击中,保留最后一行(行P)作为对照组。
21.将0.5μL每一对照组加入到一个独立的孔中。使用至少2-3个独立对照组,优选地能覆盖活性范围。
22.在加湿(≥95%)培养箱中于37℃过夜培养分析平板。
第二天
1.将所有幸免平板pintool到具有红色淀粉的宿主菌苔上,使用与淀粉酶的λ微量滴度筛选中的第二天所描述的相同方法,除了使用384-位置pintool之外。
2.如下制备2X BODIPY淀粉底物缓冲液:
a)计算以20μL/孔的所有幸免平板所需要的2X底物缓冲溶液的总体积(包括分配器所需要的任何额外的死区体积),并且将100mMCAPS pH 10.4的量计量为适合于所用分配器的容器。
b)收回足量0.5mg的BODIPY淀粉管子,以产生终浓度为20-30μg/mL的所需体积的2X底物缓冲液(在上面步骤a)中所计算的)。
c)于室温将每一0.5mg管子中的物质溶解在50μL DMSO中,避光,同时频繁涡流。这需要超过15分钟时间;一些生产批量的BODIPY淀粉比其它淀粉溶解的好一些。
d)在每一管子中加入50μL 100mM CAPS缓冲液,pH 10.4,并且涡流混合。
e)合并所有管子的内容物,并且通过在微型离心机中以最大速度离心1分钟去除任何未溶解的聚集物。
f)将上清液加入到上述步骤a)中测量的剩余的100mM CAPS缓冲液中。
g)通过用金属箔包裹使2X底物缓冲液避光。
3.按照20μL/孔分配到所有幸免平板中。
4.在铝箔包裹所有平板,并且于室温温育2-6小时。
5.用下述设置在Spectrafluor中读取每一平板:
a)荧光读数(激发过滤器:485nm;发射过滤器:535nm
b)平板定义:384孔黑色
c)从顶部读数
d)最适增益
e)闪光次数:3
6.在所得到的Excel电子表格中,以独立的图表绘制推定的3行中的每一行的图表,并且检查其活性。确保阳性对照组在整个背景上产生信号。
7.对于在孔中具有每一真实信号的每一推定,按照如下方法从阳性孔中收获样品:
a)从代表最高的原始稀释度的行中选择阳性孔。
b)将2μL从上述孔中转移到含有500μL SM和50μL CHCl3的管子中。这被称作机会原种。
c)于4℃储存。
8.使用先前所描述的方法,用红色淀粉将大约10μL每一机会原种铺平板于150mm NZY平板上。目的是获得几个(至少20个)孔独立的噬菌斑,从这些噬菌斑中来取出分离物。
第三天
1.检查pintool平板在与相关分析平板上的孔对应的所有位置上在细菌菌苔中的透明区可接受发生率。而且检查在任何阳性对照组和任何测试推定中红色淀粉中的透明区。注意要提防也会在红色淀粉中形成透明区的污染物(参见如下)。
2.从含有机会原种的稀释物的固相平板上,取出几个分离的噬菌斑,将每一噬菌斑移入含有50μL CHCl3的500μL SM中。这被称作分离原种。
3.然后可以用上述描述的方法在BODIPY淀粉上个别地测试分离原种。如果在步骤2中被取出的噬菌斑在红色淀粉背景中产生了透明区的话,这一步可以忽略。然后用上述描述的方法在BODIPY淀粉上个别地测试分离原种。然而,如果在步骤2中被取出的噬菌斑在红色淀粉背景中产生了透明区的话,这一步可以忽略。
排除
第一天
1.在Falcon 2059管子中混合200μL OD1 XL1-Blue MRF宿主,100μLλ分离原种和1μL ExAssist噬菌体原种。
2.在37℃振荡器中温育15分钟。
3.加入3mL NZY培养基。
4.在37℃振荡器中培养过夜。
第二天
1.在20分钟内将排除管加热到70℃。
2.在1000xg离心10分钟。
3.在Falcon 2059管子中,混合50μL上清液和200μL EXP505 OD1宿主。
4.在37℃振荡器中温育15分钟。
5.加入300μL SOB培养基。
6.在37℃振荡器中温育30-45分钟。
7.使用无菌玻璃珠将50μL铺平板于大的LBKan50平板上。如果这些平板是“干的”,可以加入另外的SOB培养基,以帮助分配细胞。
8.将平板在30℃至少培养24小时。
9.培养分离物以用于测序和/或RFLP。
在30℃培养降低了噬菌粒的拷贝数量,并且被用于减轻一些淀粉酶克隆的显而易见的毒性。
在红色淀粉中形成透明区的污染物
当在固体培养基上使用红色淀粉来分析噬菌体的淀粉酶活性时,通常可以看见在红色淀粉中形成透明区的污染集落生成单位(cfu)。对于pintool平板,重要的是,不管何时这些污染物与特定孔位置对齐时.需要区分淀粉酶阳性噬菌体克隆与这些污染物。污染微生物的来源大概是2%红色淀粉原种,该原种不能通过高压灭菌或通过在制备后过滤来灭菌。应该可以认为,它们是通过使红色淀粉产生代谢变化而存洉的机会微生物。为了降低这些污染物,当准备2%红色淀粉溶液时需要使用无菌技术,并且将原种于4℃或冰中储存。
实施例8
生物信息分析
用已知的嗜高温α-淀粉酶序列进行最初的生物信息分析。图14a显示了序列的对齐状况,一些序列已经储存在NCBI数据库中。该分析显示了用于PCR的简并引物的设计潜力,PCR完整基因减去其信号序列(参见图14a)的部分,从文库中潜在地得到了新颖的全长α淀粉酶。
通过PCR从基因组DNA筛选下述文库:
表6
  文库   名称   PCR阳性   亚克隆
  5   A.lithotropicus   否
  13   隐蔽热网菌(Pyrodictium occultum)   否
  17   热网菌TAG11(Pyrodictium TAG11)   否   是
  113   深海富集物(Deep sea enrichment)   是   是
  170   深海富集物(Deep sea enrichment)   是   是
  198   古生菌属(Archaeglobus)   否
  206   酸菌属(Acidianus sp)   否
  453   混合的冰岛富集物(Mixed iceland enrich)   否
  455   混合的冰岛富集物(Mixed iceland enrich)   是   是
图14b显示了所鉴别的序列的对齐,下面的表罗列了它们相对的同一性百分比。
实施例9
文库63GP-1α淀粉酶最适pH的表征和比活性的确定
在最初的试验中,来自Thermococcus的SEQ ID NO.:81显示了,它不仅对于用于谷物湿研磨的淀粉液化有效,而且对于用于织物脱浆有效。该酶的最适pH为4.5-5.0。在这样低的pH下,可能使用很少的钙或不使用钙,这会降低整个运作成本和减少副产物形成。另外,在这样低的pH下,减少了化学品的使用和离子交换载体的使用。工业标准的地衣芽孢杆菌淀粉酶的热稳定性和最适pH属于次最佳的。与地衣芽孢杆菌淀粉酶相比,63GP-1淀粉酶具有较高的应用比活性,因此水解一吨淀粉需要的酶会更少(使用的酶可以少至20倍)。
水解淀粉的最适pH通过将50μL GP-1,0.35U/ml与100ml 1%可溶淀粉溶液(淀粉0.0175U/g)在95℃反应30分钟来确定。正如此处所述,在液化淀粉溶液中产生的还原端通过neocupronine分析测量。玉米淀粉的水解百分比通过用neocupronine分析测量所产生的糖还原端来确定。称取70g缓冲溶液(pH 4-7),加入100ppm钙。将30g玉米淀粉混合到缓冲溶液中,形成淀粉浆料。加入酶,密封容器,用每分钟6℃的起始加热速率在95℃温育30分钟。从反应烧杯中提取1ml样品,并且用neocupronine分析法进行分析。GP-1的最适pH为4.5到5之间,而商业上的地衣芽孢杆菌淀粉酶在大约pH 6.0发挥最佳作
实施例10
淀粉酶连接再装配
从亲本克隆SEQ ID NO.:81,SEQ ID NO.:77,SEQ ID NO.:79中的每一个扩增9个片段(每一个片段大约150bp),覆盖了整个开放阅读框。引物提供在表8中。
Figure C0280864000971
Figure C0280864000981
PCR所用的条件是:3分钟94℃,(30秒94℃;30秒55℃,30秒68℃)x30个循环,随后10分钟68℃。将与来自三个亲本的同源区相对应的PCR产物集中(1∶1∶1),用适当的限制酶切割(参见表8),并且凝胶纯化。混合等量的片段库,并且将其连接(16℃;过夜)。将所得到的450bp连接产物凝胶纯化并且连接,得到全长淀粉酶基因。将所得到的全长产物凝胶纯化,并且用F1引物SEQ ID NO.:81,SEQ IDNO.:77,SEQ ID NO.:79和引物(SEQ ID NO.:312)的混合物进行PCR扩增。PCR所用的条件如下:3分钟94℃,(30秒94℃;30秒50℃,30秒68℃)x30个循环,随后10分钟68℃。纯化所得到的PCR产物(~1.4kbp),用SpeI和BbvI切割,凝胶纯化,连接到pMYC(来自Mycogen的载体,用SpeI/XhoI切割)中,并且转化到大肠杆菌Top 10中。分离来自~21000集落库中的质粒DNA,并且将其转化到假单孢菌属(Pseudomonas)中。
重配α-淀粉酶的筛选
将所转化的荧光假单胞菌(Pseudomonas fluorescens (MB214))通过FACS挑选到96孔或384孔平板中,并且用6M尿素进行处理,所述转化的荧光假单胞菌(MB214)含有衍生自亲本克隆SEQ ID NO.:81,SEQ ID NO.:77,SEQ ID NO.:79的pMYC。如下面所更详细描述的,用RBB-淀粉和/或异硫氰酸荧光素淀粉(FITC-淀粉)作为底物完成最初筛选。使用诱导的培养物并且通过液化分析,用RBB-淀粉作为底物筛选提高活性的克隆。基于液化数据,储存新的提高活性的克隆,并且对其进行测序。
收集所转化的重配淀粉酶文库(MB214(Pf)),并且在50μL LB+Tet中以1细胞/孔将其挑选到96孔平板(或384孔平板)中。复制与每孔相应的平板,用于储存。将45μL 12M尿素加入到每一孔中,将平板振荡10分钟。将平板于室温保持至少1小时,将溶菌产物于4℃储存。
用RBB-淀粉进行分析
75μL RBB-淀粉底物(在50mM NaAc缓冲液中的1%RBB-不可溶玉米淀粉,pH=4.5)加入到新96孔平板(V-底)中的每一孔中。用Biomek或Zymark将5μL酶溶菌产物转移到每一含有底物的孔中。用铝封条密封平板,在摇床上短暂地振荡。于90℃将平板温育30分钟,随后于室温冷却5-10分钟。将100μL 100%乙醇加入到每一孔中,密封平板,在摇床上短暂地振荡。然后用台式离心机以4000rpm将平板离心20分钟。用Biomek将100μL上清液转移到一个新的96孔平板(平底)中,并且读取OD595。对照组:SEQ ID NO.:81,SEQ ID NO.:77,SEQ ID NO.:79。
用FITC-淀粉进行分析
将50μL底物(在100mM NaAc缓冲液中的0.01%FITC淀粉,pH=4.5)加入到一个新的384孔平板的每一孔中。将5μL酶溶菌产物转移到含有底物的每一孔中,于室温将平板温育过夜。读取每一孔底物的极化变换,激发485nm,发射535nm。对照组:SEQ ID NO.:81,SEQID NO.:77,SEQ ID NO.:79。优选地,所有分析使用96孔平板。
新活性克隆的确认
培养筛选所得的每一阳性克隆,用标准方法进行诱导。检查每一克隆的生长(即,一段时间内的细胞密度),每细胞水平的活性(RBB-淀粉分析和液化分析),蛋白质的表达(蛋白凝胶)和可溶性(通过显微镜分析)。转移所确认的新的升高克隆,用于发酵。
尽管本发明已经参考其某些优选实施方案进行了详细描述,应该可以理解到修饰和变化也在所描述的和所请求保护的范围和精神内。

Claims (36)

1.一种分离的、合成的或重组的核酸,其包括
(a),编码具有α淀粉酶活性的多肽的序列,其中所述序列:(i)与SEQ ID NO.:1,3,5,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,47,51,53,55,57,59,61,63,65,67,71,77,79或81的核酸序列具有至少90%、95%、97%或100%的序列同一性;或(ii)与SEQ ID NO:45的核酸序列具有至少95%、97%或100%的序列同一性;
(b),编码具有α淀粉酶活性的多肽的序列,其中所述序列与SEQID NO.:1,13,15,17,19,21,23,27,29,31,33,37,39,43,45,55,59,61,63,65,67,71,77,79或81的核酸序列在高度严格条件下杂交,其中所述高度严格杂交条件包括用含有150mM NaCl、20mM Tris盐酸,pH7.8、1mM Na2EDTA、0.5%SDS的缓冲液于室温清洗30分钟,随后用新鲜缓冲液于比该序列的解链温度(Tm)低5℃的温度清洗30分钟;
并且所述序列与SEQ ID NO:45的核酸序列具有至少95%、97%或100%的序列同一性;或与SEQ ID NO.:1,3,5,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,47,51,53,55,57,59,61,63,65,67,71,77,79或81的核酸序列具有至少90%、95%、97%或100%的序列同一性;或
(c),编码具有α淀粉酶活性的多肽的序列,其中所述多肽包括与SEQ ID NO.:2,4,6,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,48,52,54,56,58,60,62,64,66,68,72,78,80或82的氨基酸序列具有至少95%、97%或100%序列同一性的氨基酸序列;或(ii)与SEQ ID NO:46的氨基酸序列具有至少97%或100%的序列同一性;
(d),(a)、(b)或(c)的序列的片段,所述片段编码酶活性片段,其中所述酶活性片段具有α淀粉酶活性;和
(e),与(a)、(b)、(c)或(d)所述的核酸序列完全互补的序列。
2.一种产生重组多肽的方法,所述多肽包括由权利要求1所述的核酸编码的多肽,该方法包括将编码所述多肽的核酸在允许多肽表达的条件下导入宿主细胞中,且回收多肽的步骤。
3.一种产生变体多核苷酸的方法,所述方法包括:
得到核酸,所述核酸包括权利要求1所述的多核苷酸;和
在所述多核苷酸中将一个或多个核苷酸修饰为别的核苷酸,在所述多核苷酸中删除一个或多个核苷酸,或将一个或多个核苷酸添加到所述多核苷酸中,其中,所述变体多核苷酸编码的多肽保留α淀粉酶活性。
4.如权利要求3所述的方法,其中修饰是通过选自如下的方法来引入的:易错PCR、改组、寡核苷定向诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归集团诱变、指数集团诱变、位点特异性诱变、基因再装配、基因位点饱和诱变及其任意组合。
5.一种水解淀粉键的方法,所述方法包括将含有淀粉的物质与多肽在促进所述淀粉键水解的条件下接触,所述多肽包括:
由具有权利要求1所述序列的多核苷酸编码的、能够水解淀粉键的多肽。
6.权利要求5所述的方法,其中所述淀粉分离自或来源于稻米、稻芽、玉米、大麦、小麦、豆类、甘薯、蜀黍、高粱、黑麦、bulger或其组合。
7.一种催化淀粉分解的方法,所述方法包括将含有淀粉的样品与多肽在促进所述淀粉分解的条件下接触,所述多肽包括:
由权利要求1所述的多核苷酸编码的、能够水解淀粉键的多肽。
8.权利要求7所述的方法,其中所述淀粉分离自或来源于稻米、稻芽、玉米、大麦、小麦、豆类、甘薯、蜀黍、高粱、黑麦、bulger或其组合。
9.一种分析方法,用于鉴别具有酶促活性的多肽,所述分析方法包括步骤:
将由权利要求1所述的多核苷酸编码的多肽与底物分子在允许所述多肽发挥作用的条件下接触;和
检测底物量的降低或者所述多肽与所述底物之间反应得到的反应产物的量的增加;其中底物量的降低或反应产物量的增加鉴定出酶促活性多肽。
10.一种核酸探针,所述核酸探针包括寡核苷酸,该寡核苷酸具有权利要求1所述的序列,并且其在中度到高度严格条件下杂交到核酸靶区域上,形成可检测的靶:探针双链体。
11.如权利要求10的探针,其中所述寡核苷酸是DNA或RNA。
12.如权利要求10的探针,其中所述探针进一步包括可检测的同位素标记物,或所述探针进一步包括可检测的非同位素标记物,所述非同位素标记物选自荧光分子、化学发光分子、酶、辅因子、酶底物和半抗原。
13.一种多核苷酸探针,用于分离或鉴别α淀粉酶基因,其具有与如下序列中的一个序列的至少一个片段相同或完全互补的序列:
具有权利要求1所述的序列的核酸。
14.一种用于修饰小分子的方法,所述方法包括将由具有在权利要求1中所述的序列的多核苷酸编码的至少一个多肽与至少一个小分子混合,从而通过至少一个生物催化反应产生至少一个修饰的小分子的步骤,其中所述至少一个多肽具有α淀粉酶活性。
15.如权利要求14的方法,其中所述至少一个多肽包括大量多肽,所述至少一个小分子包括大量小分子,从而通过大量生物催化反应产生大量修饰的小分子,从而形成修饰的小分子文库。
16.权利要求15所述的方法,其中,所述方法进一步包括测试该文库以确定该文库中是否存在表现出期望活性的特定的修饰小分子的步骤。
17.权利要求16所述的方法,其中,所述测试文库的步骤进一步包括步骤:系统地消除除了用于产生文库中的大量修饰小分子的一部分的一个生物催化反应以外的所有生物催化反应,通过测试所述的那一部分修饰小分子中存在或不存在具有期望活性的特定的修饰小分子,和鉴别产生具有期望活性的特定修饰小分子的特异性生物催化反应而进行,其中,任选地,所述的产生具有期望活性的修饰小分子的特异性生物催化反应被重复。
18.权利要求17所述的方法,其中,所述生物催化反应用一组生物催化剂完成,所述生物催化剂与在所述至少一个小分子内存在的不同结构部分反应;每一生物催化剂对于特定的结构部分或一组相关的结构部分是特异的;并且每一生物催化剂与含有对该特定生物催化剂特异的特定结构部分的大量小分子反应。
19.克隆载体或表达载体,其含有权利要求1所述的序列。
20.分离的宿主细胞,其含有权利要求1所述的序列。
21.权利要求20所述的分离的宿主细胞,其中,所述宿主是原核、真核、真菌、酵母、植物或新陈代谢旺盛的宿主细胞。
22.一种方法,用于液化含有淀粉的组合物,所述方法包括将所述组合物与由权利要求1所述的核酸编码的具有淀粉酶活性的多肽接触。
23.权利要求22所述的方法,其中所述淀粉分离自或来源于稻米、稻芽、玉米、大麦、小麦、豆类、甘薯、蜀黍、高粱、黑麦、bulger或其组合。
24.一种通过权利要求22至23的任一项所述的方法产生的液化糖浆。
25.权利要求24所述的液化糖浆,其中,所述液化糖浆具有在18DE时低于2.0、在12DE时低于4.0的Mn/Mw比率。
26.一种用于清洗物体的方法,所述方法包括将所述物体与由权利要求1所述的核酸编码的具有淀粉酶活性的多肽在足以完成所述清洗的条件下接触。
27.一种用于织物脱浆的方法,所述方法包括将所述织物与由权利要求1所述的核酸编码的具有淀粉酶活性的多肽在足以完成所述脱浆的条件下接触。
28.一种用于处理木质纤维的方法,其中用由权利要求1所述的核酸编码的具有淀粉酶活性的多肽处理所述纤维,所用多肽的量足以提高纤维特性。
29.一种用于给再循环纸浆酶促脱墨的方法,其中由权利要求1所述的核酸编码的具有淀粉酶活性的多肽以足以有效地给纤维表面脱墨的量施用。
30.一种用于液化含有淀粉的组合物的方法,所述方法包括将所述组合物与由权利要求1所述的核酸编码的具有淀粉酶活性的多肽在足以完成所述液化的条件下接触。
31.权利要求30所述的方法,其中所述淀粉分离自或来源于稻米、稻芽、玉米、大麦、小麦、豆类、甘薯、蜀黍、高粱、黑麦、bulger或其组合。
32.一种去污剂添加剂,其包含由权利要求1所述的核酸编码的具有淀粉酶活性的多肽。
33.一种用于产生高麦芽糖或高葡萄糖糖浆或混合糖浆的方法,所述方法包括:
用有效量的由权利要求1所述的核酸编码的具有淀粉酶活性的多肽液化含有淀粉的组合物,得到一种可溶的淀粉水解产物;和
使可溶的淀粉水解产物糖化,从而产生糖浆。
34.如权利要求22-23、30-31或33中任一项所述的方法,其中所述淀粉来源于或分离自选自稻米、稻芽、玉米、大麦、小麦、豆类和甘薯的物质。
35.如权利要求22-23、30-31或33中任一项所述的方法,所述方法进一步包括加入第二种α淀粉酶或β淀粉酶或其组合。
36.一种增加地层的采出液的流动的方法,通过去除生产操作过程中形成的且在地层内存在的粘性、含淀粉的、具有破坏性的流体来进行,所述地层包围完井井孔,所述方法包括:
允许采出液从所述井孔流出;
降低所述形成物的采出液的流动至期望流速以下;
通过将含水流体与由权利要求1所述的核酸编码的具有淀粉酶活性的多肽混合在一起配制酶处理物;
将酶处理物泵到井孔内的期望位置;
允许酶处理物降解粘性、含淀粉的、具有破坏性的流体,从而可以将所述流体从所述地层中移动到所述井表面;和
其中所述酶处理有效攻击含淀粉流体中的α糖苷键。
CN02808640A 2001-02-21 2002-02-21 具有α淀粉酶活性的酶及其使用方法 Expired - Lifetime CN100577809C (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US27049501P 2001-02-21 2001-02-21
US27049601P 2001-02-21 2001-02-21
US60/270,496 2001-02-21
US60/270,495 2001-02-21
US29112201P 2001-05-14 2001-05-14
US60/291,122 2001-05-14

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CN201410559804.5A Division CN104593394A (zh) 2001-02-21 2002-02-21 具有α淀粉酶活性的酶及其使用方法
CN200910224585.4A Division CN101724640B (zh) 2001-02-21 2002-02-21 具有α淀粉酶活性的酶及其使用方法

Publications (2)

Publication Number Publication Date
CN1513059A CN1513059A (zh) 2004-07-14
CN100577809C true CN100577809C (zh) 2010-01-06

Family

ID=27402294

Family Applications (3)

Application Number Title Priority Date Filing Date
CN02808640A Expired - Lifetime CN100577809C (zh) 2001-02-21 2002-02-21 具有α淀粉酶活性的酶及其使用方法
CN200910224585.4A Expired - Fee Related CN101724640B (zh) 2001-02-21 2002-02-21 具有α淀粉酶活性的酶及其使用方法
CN201410559804.5A Pending CN104593394A (zh) 2001-02-21 2002-02-21 具有α淀粉酶活性的酶及其使用方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN200910224585.4A Expired - Fee Related CN101724640B (zh) 2001-02-21 2002-02-21 具有α淀粉酶活性的酶及其使用方法
CN201410559804.5A Pending CN104593394A (zh) 2001-02-21 2002-02-21 具有α淀粉酶活性的酶及其使用方法

Country Status (16)

Country Link
US (10) US7273740B2 (zh)
EP (8) EP3305894A1 (zh)
JP (9) JP2004533220A (zh)
CN (3) CN100577809C (zh)
AT (1) ATE510023T1 (zh)
AU (3) AU2002240489C1 (zh)
BR (1) BRPI0207770A8 (zh)
CA (6) CA2438205C (zh)
CY (1) CY1111771T1 (zh)
DK (4) DK2333099T3 (zh)
ES (4) ES2637501T3 (zh)
HK (1) HK1060373A1 (zh)
MX (1) MXPA03007527A (zh)
PT (1) PT1370674E (zh)
WO (2) WO2002068597A2 (zh)
ZA (2) ZA200306486B (zh)

Families Citing this family (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040005673A1 (en) * 2001-06-29 2004-01-08 Kevin Jarrell System for manipulating nucleic acids
JP2002537762A (ja) * 1999-01-05 2002-11-12 トラスティーズ オブ ボストン ユニバーシティ 改良型核酸クローニング
US7435562B2 (en) 2000-07-21 2008-10-14 Modular Genetics, Inc. Modular vector systems
WO2002008408A2 (en) * 2000-07-21 2002-01-31 Trustees Of Boston University Modular vector systems
WO2002068597A2 (en) 2001-02-21 2002-09-06 Diversa Corporation Enzymes having alpha amylase activity and methods of use thereof
US7560126B2 (en) 2001-02-21 2009-07-14 Verenium Corporation Amylases, nucleic acids encoding them and methods for making and using them
US7659102B2 (en) 2001-02-21 2010-02-09 Verenium Corporation Amylases, nucleic acids encoding them and methods for making and using them
DE10138753B4 (de) * 2001-08-07 2017-07-20 Henkel Ag & Co. Kgaa Wasch- und Reinigungsmittel mit Hybrid-Alpha-Amylasen
JP2005503153A (ja) * 2001-08-27 2005-02-03 シンジェンタ パーティシペーションズ アクチェンゲゼルシャフト 自己加工植物及び植物部分
AU2003285906A1 (en) 2002-10-31 2004-06-07 Diversa Corporation Amylases, nucleic acids encoding them and methods for making and using them
US7189552B2 (en) 2002-12-17 2007-03-13 Novozymes A/S Thermostable alpha-amylases
EP3508578A1 (en) * 2003-03-06 2019-07-10 BASF Enzymes, LLC Amylases, nucleic acids encoding them and methods for making and using them
AU2015218541A1 (en) * 2003-03-06 2015-10-29 Basf Enzymes Llc Amylases, nucleic acids encoding them and methods for making and using them
CA2515340C (en) * 2003-03-06 2016-04-26 Diversa Corporation Amylases, nucleic acids encoding them and methods for making and using them
EP1601699B1 (en) * 2003-03-10 2016-04-27 Danisco US Inc. Grain compositions containing pre-biotic isomalto-oligosaccharides and methods of making and using same
DK1654355T3 (da) * 2003-06-13 2010-08-09 Danisco Pseudomonas polypeptidvarianter med ikke-maltogen exoamylaseaktivitet og deres anvendelse til fremstilling af fødevarer
US7306935B2 (en) * 2003-06-25 2007-12-11 Novozymes North America, Inc Polypeptides having alpha-amylase activity and polypeptides encoding same
US7618795B2 (en) * 2003-06-25 2009-11-17 Novozymes A/S Starch process
EP1675941B1 (en) * 2003-06-25 2013-05-22 Novozymes A/S Polypeptides having alpha-amylase activity and polynucleotides encoding same
CN102796717A (zh) 2003-07-07 2012-11-28 金克克国际有限公司 外切特异性的淀粉酶多肽、编码那些多肽的核酸及其应用
US8143048B2 (en) 2003-07-07 2012-03-27 Danisco A/S Exo-specific amylase polypeptides, nucleic acids encoding those polypeptides and uses thereof
US7169257B2 (en) * 2003-11-12 2007-01-30 Kemira Chemicals, Inc. Method of deinking waste paper using a reduced alkali system
RS20060506A (en) * 2004-03-08 2008-04-04 Syngenta Participations Ag., Self-processing plants and plant parts
US20050257932A1 (en) * 2004-05-19 2005-11-24 Davidson Eric A Filter cake degradation compositions and associated methods
AU2011203198B2 (en) * 2004-07-07 2013-01-10 Dupont Nutrition Biosciences Aps Polypeptide
DK2295557T3 (en) 2004-07-07 2017-12-11 Genencor Int EXOAMYLASE VARIANTS
US20060084150A1 (en) * 2004-09-29 2006-04-20 Qunyu Gao Method for manufacturing maltose-rich products
CA2590245A1 (en) * 2004-11-11 2006-05-18 Modular Genetics, Inc. Ladder assembly and system for generating diversity
US20060147581A1 (en) 2004-12-22 2006-07-06 Novozymes A/S Hybrid enzymes
ATE489404T1 (de) 2004-12-22 2010-12-15 Novozymes As Hybridenzyme, bestehend aus einer ersten endoamylaseaminosäuresequenz und einem kohlenhydratbindenden modul als zweiter aminosäuresequenz
EP1868426B1 (en) * 2005-03-16 2018-02-21 Syngenta Participations AG Corn event 3272 and methods of detection thereof
US20070184472A1 (en) * 2005-06-08 2007-08-09 Toagosei Co., Ltd Method of purifying environmental dna and method of efficiently screening for protein-encoding gene from environmental dna
US8030050B2 (en) 2005-07-07 2011-10-04 Danisco A/S Modified amylases from Pseudomonas species
ES2644745T3 (es) 2006-06-19 2017-11-30 Dupont Nutrition Biosciences Aps Polipéptido
WO2008008808A2 (en) * 2006-07-11 2008-01-17 Modular Genetics Inc. Methods of introducing targeted diversity into nucleic acid molecules
DK2069389T3 (en) 2006-08-04 2015-01-12 Bp Corp North America Inc Glucanases, nucleic acids encoding them, and processes for their preparation and use
US7808342B2 (en) * 2006-10-02 2010-10-05 Skyworks Solutions, Inc. Harmonic phase tuning filter for RF switches
ES2620288T3 (es) 2006-12-21 2017-06-28 Basf Enzymes Llc Amilasas y glucoamilasas, ácidos nucleicos que las codifican y métodos para formarlas y utilizarlas
US7914993B2 (en) * 2007-06-01 2011-03-29 Syngenta Participations Ag. Process for starch liquefaction and fermentation
US7727726B2 (en) * 2007-06-01 2010-06-01 Syngenta Participations Ag Process for starch liquefaction and fermentation
US7915020B2 (en) * 2007-06-01 2011-03-29 Syngenta Participations Ag Process for starch liquefaction and fermentation
EP2238244A1 (en) 2008-01-02 2010-10-13 Danisco A/S Pseudomonas saccharophila g4-amylase variants and uses thereof
US9816119B2 (en) 2008-02-29 2017-11-14 Syngenta Participations Ag Methods for starch hydrolysis
CA2726630A1 (en) 2008-06-06 2009-12-10 Danisco Us Inc. Production of glucose from starch using alpha-amylases from bacillus subtilis
US8323945B2 (en) 2008-06-06 2012-12-04 Danisco Us Inc. Variant alpha-amylases from Bacillus subtilis and methods of uses, thereof
DK2291526T3 (da) 2008-06-06 2014-10-06 Danisco Us Inc Saccharificering af enzymsammensætning med bacillus subtilis alpha-amylase
US7666457B1 (en) 2008-08-19 2010-02-23 Delavau Llc Dry mixes comprising glycerine
US20120172275A1 (en) * 2009-03-10 2012-07-05 Danisco Us Inc. Bacillus Megaterium Strain DSM90-Related Alpha-Amylases, and Methods of Use, Thereof
RU2011143721A (ru) * 2009-04-01 2013-05-10 ДАНИСКО ЮЭс ИНК. Система очистки, содержащая альфа-амилазу и протеазу
EP3591046B1 (en) * 2009-05-19 2021-04-21 DuPont Nutrition Biosciences ApS Amylase polypeptide
EP2461702B1 (en) * 2009-08-07 2018-11-21 Danisco US Inc. Alpha-amylase blend for starch processing and method of use thereof
WO2011049945A2 (en) * 2009-10-23 2011-04-28 Danisco Us Inc. Methods for reducing blue saccharide
US20130029382A1 (en) * 2010-01-25 2013-01-31 Syngenta Participations Ag Compositions and methods relating to dual activity enzymes having xylanase and cellulase activity
PL3543333T3 (pl) 2011-06-30 2022-06-13 Novozymes A/S Sposób badania przesiewowego alfa-amylaz
US20130159253A1 (en) * 2011-12-15 2013-06-20 Sybase, Inc. Directing a data replication environment through policy declaration
US9672126B2 (en) 2011-12-15 2017-06-06 Sybase, Inc. Hybrid data replication
GB2499463B (en) * 2012-01-31 2014-04-02 Verenium Corp Reduced sugar syrups and methods of making reduced sugar syrups
HUE057894T2 (hu) 2012-06-08 2022-06-28 Danisco Us Inc Alfa-amiláz változatok javított aktivitással keményítõpolimereken
BR112015023620B1 (pt) 2013-03-15 2021-06-22 Grain Processing Corporation Preparação de malto-oligossacarídeos
US20160186102A1 (en) * 2013-10-03 2016-06-30 Danisco Us Inc. Alpha-amylases from exiguobacterium, and methods of use, thereof
BR112017021639A2 (pt) 2015-04-10 2018-07-24 Syngenta Participations Ag composições de ração animal e métodos de uso
US11286621B2 (en) 2015-08-14 2022-03-29 Basf Se Aqueous surface treatment composition for paper and board
FR3045055B1 (fr) 2015-12-10 2020-02-21 Roquette Freres Hydrolysat d'amidon de basse viscosite presentant un comportement a la retrogradation ameliore
WO2017106633A1 (en) * 2015-12-18 2017-06-22 Basf Enzymes Llc A liquid formulation of alpha-amylase
DE102016208466A1 (de) 2016-05-18 2017-11-23 Henkel Ag & Co. Kgaa Verbesserte Waschleistung durch eine neue alpha-Amylase aus Rhizoctonia solani
DE102016209880A1 (de) 2016-06-06 2017-12-07 Henkel Ag & Co. Kgaa Neue Amylasen
WO2017220787A1 (en) * 2016-06-24 2017-12-28 Evaxion Biotech Aps Vaccines against aearomonas salmonicida infection
CN106011107B (zh) * 2016-06-30 2019-09-10 安徽工程大学 一种耐碱性α-淀粉酶及其基因工程菌的构建方法和应用
EP3512995A2 (en) 2016-09-16 2019-07-24 Basf Se Methods of modifying pulp comprising cellulase enzymes and products thereof
DE102016221851A1 (de) 2016-11-08 2018-05-09 Henkel Ag & Co. Kgaa Amylase für Wasch- und Reinigungsmittelanwendungen
CA3067218A1 (en) * 2017-06-16 2018-12-20 Basf Enzymes Llc Method for increasing oil yield during ethanol production
MX2020003483A (es) 2017-10-12 2020-07-20 Syngenta Participations Ag Composiciones de pienso para animales mejoradas y metodos de uso.
WO2019081976A2 (en) 2017-10-25 2019-05-02 Basf Se BETA-AMYLASE ENZYMES
DE102017220757A1 (de) 2017-11-21 2019-05-23 Henkel Ag & Co. Kgaa Amylase und eine solche enthaltendes Wasch- oder Reinigungsmittel
MX2020009437A (es) * 2018-03-13 2021-01-08 Lallemand Hungary Liquidity Man Llc Alfa-amilasas termoestables expresadas por levadura para hidrólisis de almidón.
WO2019206994A1 (en) 2018-04-26 2019-10-31 Basf Se Lipase enzymes
US20210115422A1 (en) 2018-05-03 2021-04-22 Basf Se Amylase enzymes
WO2019226845A1 (en) * 2018-05-25 2019-11-28 Basf Se Uses of surfactants in starch processing
DE102018208444A1 (de) 2018-05-29 2019-12-05 Henkel Ag & Co. Kgaa Verbesserte Waschleistung durch eine neue alpha-Amylase aus Trametes hirsuta (Thi)
DE102018208446A1 (de) 2018-05-29 2019-12-05 Henkel Ag & Co. Kgaa Verbesserte Waschleistung durch eine neue alpha-Amylase aus Fomes fomentarius (Ffo)
EP3802813A1 (en) * 2018-05-29 2021-04-14 Basf Se Amylase enzymes
DE102018208443A1 (de) 2018-05-29 2019-12-05 Henkel Ag & Co. Kgaa Verbesserte Waschleistung durch eine neue alpha-Amylase Irpex lacteus (IIa)
DE102018208445A1 (de) 2018-05-29 2019-12-05 Henkel Ag & Co. Kgaa Verbesserte Waschleistung durch eine neue alpha-Amylase aus Fomitopsis pinicola (Fpi)
US20220186177A1 (en) 2019-02-20 2022-06-16 Basf Se Industrial fermentation process for bacillus using defined medium and magnesium feed
MX2021010109A (es) 2019-02-20 2021-09-21 Basf Se Proceso de fermentacion industrial para bacillus mediante el uso de un medio definido y una alimentacion de oligoelementos.
EP3938504A1 (en) 2019-03-11 2022-01-19 Basf Se Amylases and methods for making and using them
WO2020193532A1 (en) 2019-03-25 2020-10-01 Basf Se Cleaning composition having amylase enzymes
WO2020193534A2 (en) 2019-03-25 2020-10-01 Basf Se Amylase enzymes
WO2020193535A2 (en) 2019-03-25 2020-10-01 Basf Se Amylase enzymes
EP3958890A4 (en) 2019-04-23 2023-05-03 Basf Se BETA-AMYLASE VARIANTS
AU2019445862A1 (en) 2019-05-13 2021-08-19 Halliburton Energy Services, Inc. Injectivity and production improvement in oil and gas fields
MX2021015364A (es) 2019-06-13 2022-01-24 Basf Se Metodo de recuperacion de una proteina de un caldo de fermentacion mediante el uso de un cation divalente.
ES2955800T3 (es) 2019-07-05 2023-12-07 Basf Se Procedimiento de fermentación industrial de células microbianas mediante precultivo alimentado por lotes
CN114364795A (zh) 2019-08-22 2022-04-15 巴斯夫欧洲公司 淀粉酶变体
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3847740A (en) 1972-10-02 1974-11-12 Cpc International Inc Process for the production of levulose-bearing syrups
JPS5823799A (ja) 1981-08-03 1983-02-12 株式会社林原生物化学研究所 高純度マルト−スの製造方法
JPS5872598A (ja) 1981-10-26 1983-04-30 Hayashibara Biochem Lab Inc 高純度イソマルト−スの製造方法
US4557927A (en) 1983-03-10 1985-12-10 Kabushiki Kaisha Hoyashibara Food products and process for producing same
EP0208491B1 (en) 1985-07-03 1993-08-25 Genencor International, Inc. Hybrid polypeptides and process for their preparation
JPS62104580A (ja) 1985-10-30 1987-05-15 Kunio Yamane 高耐熱性酵素発現dna
CA1272150C (en) * 1985-12-03 1990-07-31 PRODUCTION OF GLUCOSE AND PURIFIED STARCH SYRUPS FROM WHEAT STARCH AND OTHER CEREALS CONTAINING PENTOSANES
GB8609288D0 (en) * 1986-04-16 1986-05-21 Ici Plc Debranching enzyme
DK311186D0 (da) 1986-06-30 1986-06-30 Novo Industri As Enzymer
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
JP2696537B2 (ja) 1988-10-28 1998-01-14 東和化成工業株式会社 高純度マルトースの製造方法
EP0528881A4 (en) 1990-04-24 1993-05-26 Stratagene Methods for phenotype creation from multiple gene populations
US6582908B2 (en) 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
WO1993000426A1 (en) 1991-06-25 1993-01-07 Novo Nordisk A/S Mammalian pancreatic lipase and variant thereof
DE69325700T2 (de) 1992-12-28 1999-12-30 Hayashibara Biochem Lab Nichtreduzierendes saccharidbildendes Enzym, und dessen Herstellung und Verwendungen
CZ293163B6 (cs) 1993-02-11 2004-02-18 Genencor International, Inc. Mutanta alfa-amylázy, její použití, kódová DNA pro tuto mutantu, vektor pro expresi, hostitelské buňky, čisticí prostředek a prostředek pro zkapalnění škrobu
JP3559585B2 (ja) 1993-06-03 2004-09-02 株式会社林原生物化学研究所 トレハロース遊離酵素とその製造方法並びに用途
EP0648843A1 (en) * 1993-10-01 1995-04-19 Takara Shuzo Co. Ltd. DNA encoding a hyperthermostable alpha-amylase
JPH07143880A (ja) * 1993-10-01 1995-06-06 Takara Shuzo Co Ltd 超耐熱性α−アミラーゼ遺伝子
CN1189558C (zh) * 1993-10-08 2005-02-16 诺沃奇梅兹有限公司 淀粉酶变体
DE69626976T2 (de) 1995-06-02 2004-03-04 Novozymes A/S BEHANDLUNG EINER PROTEINLÖSUNG MIT A1/Fe UND ANSCHLIESENDE MEMBRANKONZENTRATION
US5736499A (en) 1995-06-06 1998-04-07 Genencor International, Inc. Mutant A-amylase
JPH09173077A (ja) * 1995-07-20 1997-07-08 Tadayuki Imanaka 超耐熱性酸性α−アミラーゼおよび該α−アミラーゼ産生遺伝子を含むDNA断片
US6479258B1 (en) 1995-12-07 2002-11-12 Diversa Corporation Non-stochastic generation of genetic vaccines
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
CN1222938A (zh) * 1996-05-14 1999-07-14 金克克国际有限公司 经修饰具有改变了的钙离子吉合性质的α-淀粉酶
US5789228A (en) * 1996-05-22 1998-08-04 Diversa Corporation Endoglucanases
CN1233286A (zh) * 1996-10-11 1999-10-27 诺沃挪第克公司 a-淀粉酶与纤维素结合结构域融合以用于淀粉降解
AU7107798A (en) * 1997-04-09 1998-10-30 Michigan State University Hyperthermostable alpha-amylase
EP1027428B1 (en) * 1997-10-30 2010-12-01 Novozymes A/S Alpha-amylase mutants
AUPP209298A0 (en) * 1998-03-02 1998-03-26 Uniphase Fibre Components Pty Limited Grating writing techniques
FR2778412B1 (fr) 1998-05-05 2002-08-09 Univ Reims Champagne Ardennes Procede pour preparer une enzyme alpha-amylase thermophile et enzyme ainsi obtenue
TR200003570T2 (tr) 1998-06-24 2001-04-20 Aventis Pharma Deutschland Gmbh Mumbaistatin, Üretim yöntemi ve farmasötik kullanımı
CA2331385A1 (en) 1998-06-25 1999-12-29 Applied Phytologics, Inc. Methods and reagents for producing transgenic monocot plants, comprisinga regulatable promoter controlling expression of a selectable marker gene in callus cells
AU784761B2 (en) 1999-03-25 2006-06-08 Serono Genetics Institute S.A. Biallelic markers related to genes involved in drug metabolism
AU3419300A (en) * 1999-03-30 2000-10-23 Novozymes A/S Alpha-amylase variants
JP4919198B2 (ja) 2000-05-22 2012-04-18 株式会社林原生物化学研究所 α−イソマルトシル転移酵素とその製造方法並びに用途
AU2001296653A1 (en) 2000-10-04 2002-04-15 Maxygen, Inc. Enantioselective production of amino carboxylic acids
US7560126B2 (en) 2001-02-21 2009-07-14 Verenium Corporation Amylases, nucleic acids encoding them and methods for making and using them
WO2002068597A2 (en) * 2001-02-21 2002-09-06 Diversa Corporation Enzymes having alpha amylase activity and methods of use thereof
US7659102B2 (en) * 2001-02-21 2010-02-09 Verenium Corporation Amylases, nucleic acids encoding them and methods for making and using them
DE10131441A1 (de) 2001-06-29 2003-01-30 Henkel Kgaa Eine neue Gruppe von alpha-Amylasen sowie ein Verfahren zur Identifizierung und Gewinnung neuer alpha-Amylasen
US20030082595A1 (en) 2001-08-03 2003-05-01 Bo Jiang Nucleic acids of aspergillus fumigatus encoding industrial enzymes and methods of use
JP2005503153A (ja) 2001-08-27 2005-02-03 シンジェンタ パーティシペーションズ アクチェンゲゼルシャフト 自己加工植物及び植物部分
US20040025917A1 (en) * 2002-08-06 2004-02-12 Jeremy Gin Mobility-aid apparatus and method using tabs on non-boundary region
CA2515340C (en) 2003-03-06 2016-04-26 Diversa Corporation Amylases, nucleic acids encoding them and methods for making and using them
EP2358873B2 (en) 2008-12-15 2018-02-21 Danisco US Inc. Hybrid alpha-amylases
US8857799B2 (en) 2011-05-12 2014-10-14 Sealy Technology, Llc Advanced conformance encased coil spring units
CN105452839B (zh) 2013-06-21 2019-01-15 伯乐生命医学产品有限公司 具有流体收集管的微流体系统

Also Published As

Publication number Publication date
EP1392815A2 (en) 2004-03-03
AU2002240489C1 (en) 2009-02-05
US20100047392A1 (en) 2010-02-25
EP2333098B1 (en) 2016-08-24
WO2002068589A2 (en) 2002-09-06
US20080047037A1 (en) 2008-02-21
CN104593394A (zh) 2015-05-06
US20160264951A1 (en) 2016-09-15
US20030125534A1 (en) 2003-07-03
US8334118B2 (en) 2012-12-18
EP2333099B1 (en) 2017-11-01
US7407677B2 (en) 2008-08-05
EP1370674A2 (en) 2003-12-17
US7781201B2 (en) 2010-08-24
US20080032378A1 (en) 2008-02-07
EP2333099A2 (en) 2011-06-15
JP5576718B2 (ja) 2014-08-20
AU2006207843C1 (en) 2010-07-29
US7273740B2 (en) 2007-09-25
AU2006207843B2 (en) 2010-03-04
WO2002068589A3 (en) 2003-10-23
JP2014230543A (ja) 2014-12-11
US20180334660A1 (en) 2018-11-22
ES2604329T3 (es) 2017-03-06
CA2833423C (en) 2019-03-19
JP5719621B2 (ja) 2015-05-20
CA2438205C (en) 2015-11-03
US7785855B2 (en) 2010-08-31
EP1392815B1 (en) 2013-06-26
PT1370674E (pt) 2011-08-31
CA2897239A1 (en) 2002-09-06
US20130224800A1 (en) 2013-08-29
EP3305894A1 (en) 2018-04-11
JP2010263897A (ja) 2010-11-25
EP1370674A4 (en) 2004-10-20
EP2292784A3 (en) 2011-06-22
JP4846760B2 (ja) 2011-12-28
CA2438884A1 (en) 2002-09-06
EP2333098A3 (en) 2011-09-07
DK2333097T3 (da) 2017-08-28
AU2002240489B2 (en) 2006-01-12
CA3032990A1 (en) 2002-09-06
ZA200306486B (en) 2011-01-26
EP2333099A3 (en) 2011-09-07
US20070161099A1 (en) 2007-07-12
JP2008142080A (ja) 2008-06-26
HK1060373A1 (en) 2004-08-06
WO2002068597A3 (en) 2003-10-02
CA3081363A1 (en) 2002-09-06
DK2169076T3 (en) 2017-02-06
AU2009222426B2 (en) 2012-07-12
JP6305866B2 (ja) 2018-04-04
DK2333099T3 (da) 2017-11-27
BRPI0207770A8 (pt) 2017-12-12
EP1370674B1 (en) 2011-05-18
ES2637501T3 (es) 2017-10-13
BR0207770A (pt) 2004-12-07
EP1392815A4 (en) 2005-09-21
CN101724640A (zh) 2010-06-09
CA2438205A1 (en) 2002-09-06
JP4690381B2 (ja) 2011-06-01
ES2650636T3 (es) 2018-01-19
CN1513059A (zh) 2004-07-14
JP2004533219A (ja) 2004-11-04
WO2002068597A2 (en) 2002-09-06
EP2333097B1 (en) 2017-05-17
ES2613277T3 (es) 2017-05-23
EP2292784A2 (en) 2011-03-09
JP2004533220A (ja) 2004-11-04
MXPA03007527A (es) 2004-07-30
EP2333097A3 (en) 2011-10-12
EP2333098A2 (en) 2011-06-15
CA3032990C (en) 2020-07-14
AU2006207843A1 (en) 2006-09-28
ZA201008280B (en) 2019-12-18
JP2008206525A (ja) 2008-09-11
DK1370674T3 (da) 2011-08-29
US7666633B2 (en) 2010-02-23
AU2009222426A1 (en) 2009-10-15
CA2438884C (en) 2014-01-28
CY1111771T1 (el) 2015-10-07
EP2169076B1 (en) 2016-11-02
JP2011172566A (ja) 2011-09-08
JP6402205B2 (ja) 2018-10-10
US20060234280A1 (en) 2006-10-19
EP2333097A2 (en) 2011-06-15
EP2169076A2 (en) 2010-03-31
ATE510023T1 (de) 2011-06-15
CN101724640B (zh) 2014-10-15
US20030170634A1 (en) 2003-09-11
CA2833423A1 (en) 2002-09-06
US10047350B2 (en) 2018-08-14
US7816108B2 (en) 2010-10-19
EP2169076A3 (en) 2010-06-30
JP2019010100A (ja) 2019-01-24
JP2017074070A (ja) 2017-04-20

Similar Documents

Publication Publication Date Title
CN100577809C (zh) 具有α淀粉酶活性的酶及其使用方法
AU2015221461B2 (en) Enzymes having alpha amylase activity and methods of use thereof
AU2012238328B2 (en) Enzymes having alpha amylase activity and methods of use thereof
ES2368555T3 (es) Enzimas que tienen actividad de alfa-amilasa y métodos de uso de las mismas.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: American California

Patentee after: BASF Enzymes LLC

Address before: American California

Patentee before: Diversa Corp.

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20100106