CN101410514A - 糖苷水解酶的变体 - Google Patents

糖苷水解酶的变体 Download PDF

Info

Publication number
CN101410514A
CN101410514A CNA2004800315167A CN200480031516A CN101410514A CN 101410514 A CN101410514 A CN 101410514A CN A2004800315167 A CNA2004800315167 A CN A2004800315167A CN 200480031516 A CN200480031516 A CN 200480031516A CN 101410514 A CN101410514 A CN 101410514A
Authority
CN
China
Prior art keywords
amino acid
seq
replacement
variant
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004800315167A
Other languages
English (en)
Other versions
CN101410514B (zh
Inventor
萨拉·泰特
乔尔·彻里
科尼·沃德
保罗·哈里斯
奥布里·琼斯
琼·伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes Inc
Original Assignee
Novozymes Biotech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes Biotech Inc filed Critical Novozymes Biotech Inc
Publication of CN101410514A publication Critical patent/CN101410514A/zh
Application granted granted Critical
Publication of CN101410514B publication Critical patent/CN101410514B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D3/00Other compounding ingredients of detergent compositions covered in group C11D1/00
    • C11D3/16Organic compounds
    • C11D3/38Products with no well-defined composition, e.g. natural products
    • C11D3/386Preparations containing enzymes, e.g. protease or amylase
    • C11D3/38645Preparations containing enzymes, e.g. protease or amylase containing cellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2445Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • C12P7/10Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01021Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01176Cellulose 1,4-beta-cellobiosidase (reducing end)(3.2.1.176)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及亲代糖苷水解酶的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置包含取代,并任选地进一步在对应于SEQID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代,在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代,其中所述的变体具有糖苷水解酶活性。本发明也涉及编码所述变体糖苷水解酶的核苷酸序列并涉及包含所述核苷酸序列的核酸构建体、载体和宿主细胞。

Description

糖苷水解酶的变体
关于在联邦资助的研究与开发下完成的发明的权利声明
本发明依据能源部(Department of Energy)提供的基本合同DE-AC36-98GO10337,转包合同No.ZCO-30017-02,在政府支持下做出。政府在本发明中拥有一定权利。
技术领域
本发明涉及糖苷水解酶的变体,其相对于它的亲代酶具有一种或多种改进的性质,编码所述变体的核酸,产生所述变体的方法和应用所述变体的方法。
背景技术
纤维素是单糖葡萄糖通过beta-1,4-键共价连接的聚合物。许多微生物产生水解beta-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶(endoglucanase)、纤维素二糖水解酶(cellobiohydrolase)和糖苷水解酶。内切葡聚糖酶在随机的位点消化纤维素聚合物,打开它以被纤维素二糖水解酶攻击。纤维素二糖水解酶随后从纤维素聚合物的末端依次释放纤维二糖的分子。纤维二糖是葡萄糖的水溶性beta-1,4-连接的二聚体。糖苷水解酶将纤维二糖水解为葡萄糖。
纤维素的原料到乙醇的转化具有大量原料的简便的可用性、避免燃烧或填埋原料的需要性和乙醇燃料的清洁度的优点。将木材、农业残余物(agricultural residue)、草本作物(herbaceous crop)和城市固体废物(municipalsolid waste)作为乙醇生产的原料。这些材料主要由纤维素、半纤维素(hemicellulose)和木质素(lignin)。一旦纤维素转化为葡萄糖,所得的葡萄糖容易地通过酵母发酵为乙醇。
Figure A20048003151600301
等,1996,J.Mol.Biol.264:337-349,描述了来自Trichodermareesei的催化缺陷突变体(catalytically deficient mutant)的活性研究和晶体结构。Boer和Koivula,2003,Eur.J.Biochem.270:841-848,公开了以野生型和突变体Trichoderma reesei纤维二糖水解酶Cel7A研究的热稳定性和最适pH之间的关系。
WO 2004/016760公开了Hypocrea jecorina纤维二糖水解酶的变体。
在本技术领域中,提供具有改进的性质的糖苷水解酶变体用于将纤维素物质转化为单糖、二糖和多糖是有利的。改进的性质包括改变的依赖于-温度的活性图谱、热稳定性、pH活性、pH稳定性、底物特异性、产物特异性和化学稳定性。
本发明的目的在于提供与它亲代酶相比具有改进的性质的糖苷水解酶的变体。
发明内容
本发明涉及亲代糖苷水解酶的分离的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代,其中所述的变体具有糖苷水解酶活性。
本发明也涉及具有糖苷水解酶活性的分离的多肽,其中所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置不同于SEQ ID NO:2的氨基酸1至513,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同。
本发明也涉及分离的核苷酸序列,其编码所述变体糖苷水解酶或具有糖苷水解酶活性的多肽,并涉及包含所述核苷酸序列的核酸构建体、载体和宿主细胞。
本发明也涉及在宿主细胞中产生亲代糖苷水解酶的变体或具有糖苷水解酶活性的多肽的方法。
本发明也涉及获得亲代糖苷水解酶的变体的方法,其包括:
(a)在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置导入取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置导入取代,其中所述的变体具有糖苷水解酶活性;和
(b)回收所述的变体。
本发明进一步涉及将所述的糖苷水解酶用于洗涤剂(detergent)和用于将纤维素转化为葡萄糖的方法。
附图说明
图1显示pAJ052的限制性图谱。
图2显示pJC106的限制性图谱。
图3显示pAlLo1的限制性图谱。
图4显示pBANe10的限制性图谱。
图5显示pAlLo2的限制性图谱。
图6显示pCW026的限制性图谱。
图7显示pNP776G205R的限制性图谱。
图8显示pMJ04的限制性图谱。
图9显示pMJ06的限制性图谱。
图10显示pMJ09的限制性图谱。
图11显示pCW045的限制性图谱。
图12显示pSTM01的限制性图谱。
图13显示pSMKO3的限制性图谱。
图14显示pEJG97的限制性图谱。
图15显示烟曲霉(Aspergillus fumigatus)beta-糖苷酶的基因组DNA序列和推导出的氨基酸序列(分别为SEQ ID NOS:56和57)。将预测的信号肽加下划线而且预测的内含子用斜体表示。
图16显示烟曲霉beta-糖苷酶在50°和65℃的热稳定性。
图17显示烟曲霉beta-糖苷酶在70℃的热稳定性。
图18显示纤维二糖通过烟曲霉beta-糖苷酶在65℃水解。
图19显示通过所述亲代Trichoderma reesei菌株RutC30和表达变体776-M57的菌株的PCS水解的时程(time course)曲线。
具体实施方式
本发明涉及亲代糖苷水解酶的分离的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代,其中所述的变体具有糖苷水解酶活性。
定义
术语“糖苷水解酶”在本文中定义为由Coutinho,P.M.和Henrissat,B.,1999,Carbohydrate-active enzymes:an integrated database approach,in″RecentAdvances in Carbohydrate Bioengineering″,H.J.Gilbert,G. Davies,B.Henrissat和B.Svensson eds.,The Royal Society of Chemistry,Cambridge,pp.3-12中描述的水解酶。糖苷水解酶的实例包括,但不限于,纤维二糖水解酶、内切葡聚糖酶(endoglucanase)和外切葡聚糖酶(exoglucanase)。在优选的实施方案中,所述的糖苷水解酶属于由Coutinho,P.M.和Henrissat,B.,1999,见上文,所定义的家族7。
术语“纤维二糖水解酶”在本文中定义为1,4-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化纤维素、纤维四糖(cellotetriose)或含有beta-1,4-连接的葡萄糖的任何聚合物中1,4-beta-D-糖苷键的水解,从所述链的非还原端(non-reducing end)释放纤维二糖。为了本发明的目的,根据由Lever等,1972,Anal.Biochem.47:273-279和由van Tilbeurgh等,1982,FEBS Letters,149:152-156;van Tilbeurgh和Claeyssens,1985,FEBS Letters,187:283-288描述的方法测定纤维二糖水解酶活性。在本发明中,应用所述Lever等方法来评价玉米秸秆(corn stover)中纤维素的水解,而应用van Tilbeurgh等的方法来根据发荧光的二糖衍生物测定所述的纤维二糖水解酶活性。
术语“内切葡聚糖酶”在本文中定义为内-1,4-(1,3;1,4)-beta-D-葡聚糖4-葡聚糖水解酶(glucanohydrolase)(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素(carboxy methyl cellulose)和羟乙基纤维素(hydroxy ethylcellulose)、地衣淀粉(lichenin)、混合的beta-1,3葡聚糖中beta-1,4键如谷类beta-D-葡聚糖或木糖葡聚糖(xyloglucan)和其他含有纤维素组分的植物物质中1,4-beta-D-糖苷键的内水解(endohydrolysis)。为了本发明的目的,根据Ghose,1987,Pure和Appl.Chem.59:257-268的方法应用羧甲基纤维素(CMC)水解测定内切葡聚糖酶活性。
术语“外切葡聚糖酶”在本文中定义为1,4-beta-D-葡聚糖葡糖水解酶(glucohydrolase)(E.C.3.2.1.74),其在1,4-beta-D-葡聚糖中催化1,4-键(O-糖基键)的水解以去除连续的葡萄糖或纤维二糖单元。为了本发明的目的,根据由Himmel等,1986,J.Biol.Chem.261:12948-12955描述的方法测定外切葡聚糖酶活性。
变体:术语“变体”在本文中定义为包含一个或多个改变的糖苷水解酶,所述的改变如在所述多肽的一个或多个具体位置取代、插入、缺失和/或截断一个或多个具体的氨基酸残基。
野生型酶:术语“野生型”糖苷水解酶表示通过天然存在的微生物,如天然存在的酵母或丝状真菌表达的糖苷水解酶。
亲代酶:本文中应用的术语“亲代”糖苷水解酶指对其进行修饰,例如,取代、插入、缺失和/或截断以产生本发明的酶变体的糖苷水解酶。此术语也指与变体进行比较和比对的多肽。所述的亲代可为天然存在的(野生型)多肽,或它还可为通过任何合适的方法制备的变体。例如,所述亲代蛋白可为天然存在的多肽的变体,其氨基酸序列已经被修饰或改变。亲代也可为等位基因变体,其是由占据相同染色体基因座的基因的两种或更多替换形式中的任一种所编码的多肽。
重排:术语“重排”指两个或更多个同源核苷酸序列之间的核苷酸序列的重组,其产生重组的核苷酸序列(即,已经过重排循环的核苷酸序列),其与起始的核苷酸序列相比具有许多交换的核苷酸。
随机化的文库:术语“随机化的文库”、“变体文库”或“文库”在本文中定义为变体多肽的文库。变体文库中的多样性可以通过编码所述变体的基因在DNA三联子水平的突变产生,这样就使单独的密码子,例如通过在PCR反应中应用部分随机化的序列的引物多样化。已经描述了几种方法,由这些方法可以通过使基因中的几个核苷酸位点多样化并将它们重组,来创建多种多样的组合的文库,例如,当这些位点离得太远以至于不能被单一的(掺加的(spiked)或掺杂的(doped))寡核苷酸引物覆盖。这些方法包括应用如在WO97/07205第3页,第8至29行所描述的单独多样化的基因节段的体内重组。这些方法也包括应用DNA重排方法创建全长基因的文库,其中一些基因节段被组合,而且其中每个节段可,例如,通过掺加突变(spiked mutagenesis)(Stemmer,1994,Nature370:389-391;美国专利5,811,238;美国专利5,605,793和美国专利5,830,721)进行多样化。可以采用编码蛋白“骨架”(野生型亲代多肽)的基因作为模板多核苷酸,并将其与一个或多个单链或双链的寡核苷酸组合,如在WO 98/41623和WO 98/41622中所描述的。所述的单链寡核苷酸可在合成的过程中进行部分的随机化。所述的双链寡核苷酸可为在特定区域掺入多样性的PCR产物。在两种情况中,可以用编码骨架蛋白的序列的对应节段削弱多样性,以限制导入变化的平均数。
重组:术语“重组”在此定义为一种方法,其中核酸在同源的区域互相连接,在那些序列之间产生链内DNA交换。为了实现本发明的目的,根据由Paques和Haber,1999,Microbiology and Molecular Biology Reviews 63:349-404总结的步骤,测定同源重组(homologous recombination)。“同源重组”在此定义为重组,其中在相对于输入核苷酸序列的同源区域内核苷酸序列不发生变化。为了完美的同源重组,所述的区域应含有足够数量的核酸,如15至1,500个碱基对,优选100至1,500个碱基对,更优选400至1,500个碱基对,并最优选800至1,500个碱基对,其与对应的核酸序列高度同源以增加同源重组的可能性。所述的重组也可通过非-同源重组(non-homologousrecombination)产生。“非-同源重组”在此定义为重组,其中任何模式的掺入链交换的DNA修复产生不同于任何重组序列的核苷酸序列。
改进的性质:术语“改进的性质”在此定义为与变体有关的特性,其与亲代糖苷水解酶相比是改进的。这些改进的性质包括,但不限于,改变的依赖于温度的活性图谱、热稳定性、pH活性、pH稳定性、底物特异性、产物特异性和化学稳定性。
改进的热活性:术语“改进的热活性″在此定义为糖苷水解酶变体的依赖于温度的活性图谱(profile),相对于亲代糖苷水解酶依赖于温度的活性图谱在具体的温度的改变。所述的热活性值提供了在温度范围内水解反应的催化进行当中,酶的效率的测定方法。糖苷水解酶具有特异的温度范围,在所述的范围中,所述的蛋白是稳定的并保持其酶活性,但随着温度升高蛋白变得较不稳定因而更不活泼。此外,由糖苷水解酶催化的反应的初始速率可以通过升高温度而加速,其通过测定变体的热活性进行测量。热活性更高的变体导致水解速率增加,水解需要的时间减少和/或水解所需的酶浓度减少。可替换地,具有降低的热活性的变体,可在低于亲代酶的最适温度的温度催化水解反应,所述亲代酶的最适温度由亲代依赖于温度的活性图谱定义。
改进的热稳定性:术语“改进的热稳定性”在此定义为在高温温育一段时间之后相对于亲代酶显示酶活性保留的变体酶。这样的变体可以或不可以显示相对于亲代改变的热活性图谱,例如,变体可具有相对于亲代的改进的能力以在高温温育之后进行重折叠。
在优选的实施方案中,当将在64℃或更高温度对于4-甲基繖酮-beta-D-乳糖苷(4-methylumbelliferyl beta-D-lactoside)的活性与在50℃、pH 5进行45分钟的活性相比时,所述变体糖苷水解酶的热活性比野生型变体高至少1.5-倍,优选至少2-倍,更优选至少5-倍,最优选至少7-倍和甚至最优选至少20-倍。
改进的产物特异性:术语“改进的产物特异性”在此定义为变体酶显示相对于亲代改变的产物分布(profile),其中所述改变的产物分布在给定的应用中,相对于亲代改进了变体的性能。术语“产物分布”在此定义为由酶法水解产生的反应产物的化学组合物。
改进的化学稳定性:术语“改进的化学稳定性”在此定义为在一种或多种化学品存在的条件下温育一段时间后变体酶显示酶活性保留,所述的化学品是天然存在的或合成的,其降低亲代酶的酶活性。改进的化学稳定性也可导致变体在上述化学品存在的条件下更强的催化反应的能力。
命名变体的惯例
在本发明中,应用了糖苷水解酶变体中氨基酸残基位置的特殊的编号方式。例如,通过比对已知的糖苷水解酶的氨基酸序列,能够给任何糖苷水解酶中的任何氨基酸残基指定氨基酸位置编号。
应用发源于糖苷水解酶的氨基酸序列的编号系统,所述的糖苷水解酶在SEQ ID NO:2中公开,与许多其他的糖苷水解酶的氨基酸序列比对,能够显示在糖苷水解酶的结构同源性的区域中氨基酸残基的位置。
可以进行蛋白序列的多重比对,例如,应用“ClustalW”(Thompson,J.D.,Higgins,D.G.和Gibson,T.J.,1994,CLUSTAL W:Improving the sensitivity ofprogressive multiple senquence alignment through senquence weighting,position-specific gap penalties and weight matrix choice,Nucleic Acids Research22:4673-4680)。用所述的蛋白比对作为模板,用来自所述DNA序列的对应的密码子替换所述的氨基酸,可进行DNA序列的多重比对。
通常采用的配对序列比较算法足够检测蛋白序列之间的相似性,所述的蛋白序列的差异不超过大约20-30%序列同一性的点(Doolittle,1992,ProteinSci.1:191-200;Brenner等,1998,Proc.Natl.Acad.Sci.USA.95,6073-6078)。然而,具有同样的折叠和相似的生物学功能的真正同源的蛋白常常相差到某点,在该点传统的基于序列的比较不能检测到它们的关系(Lindahl和Elofsson,2000,J.Mol Biol.295:613-615)。在基于序列的检索中,应用搜索程序可以获得更高的敏感性,所述的搜索程序应用蛋白家族(分布)的可能的代表物来搜索数据库。例如,PSI-BLAST程序通过迭代的(iterative)数据库搜索过程产生分布,并能够检测关系疏远的同源物(Atschul等,1997,Nucleic Acids Res 25:3389-3402)。如果所述目标蛋白的家族或超家族在蛋白结构数据库中具有一个或多个代表物,那么就可以得到更高的敏感性。程序如GenTHREADER(Jones1999,J Mol.Biol.287:797-815;McGuffin和Jones,2003,Bioinformatics 19:874-881)应用来自多种来源的信息(PSI-BLAST、二级结构预测、结构比对分布和溶剂化电势)输入到神经网络,预测查询序列的结构折叠。同样地,Gough等,2000,J,Mol,Biol,313:903-919的方法,可用于以SCOP数据库中存在的所述超家族的模型来比对未知结构的序列。这些比对可依次用于产生目的蛋白的同源模型,并可采用为此目的开发的各种各样的工具评价这样的模型。
对于已知结构的蛋白,几种工具和资源可用于检索和产生结构比对。例如SCOP超家族的蛋白已经进行了结构比对,而且那些比对是可以得到和可以下载的。这些比对可用于在结构上和功能上预测相同结构的超家族的蛋白中对应的氨基酸残基。此信息,连同源自同源建模和分布搜索的信息,当从一种蛋白中将目标突变移动到关系亲近或关系疏远的同源物时,可用于预测对哪个残基进行突变。
在描述本发明的多种糖苷水解酶变体时,应用下述的命名法以便参考。在所有的情况中,应用了公认的IUPAC单字母或三字母氨基酸缩写。
取代.对于氨基酸取代,采用了如下的命名法:[原始氨基酸,位置,取代的氨基酸]。因此,苏氨酸在位置226用丙氨酸取代记为“Thr226Ala”或“T226A”。多个突变通过加入标记(“+”)分开,例如,“Gly205Arg+Ser411Phe”或“G205R+S411F”,代表分别在位置205用精氨酸(R)取代甘氨酸(G)和在位置411用苯丙氨酸(F)取代丝氨酸(S)。
缺失.对于氨基酸缺失,采用了如下的命名法:[原始氨基酸,位置*]。因此,在位置195缺失甘氨酸记为“Gly195*”或“G195*”。多个缺失通过加入标记(“+”)分开,例如,“Gly195*+Ser411*″或″G195*+S411*”。
插入.对于氨基酸插入,采用了如下的命名法:[原始氨基酸,位置,原始的氨基酸,新插入的氨基酸]。因此,在位置195的甘氨酸之后插入赖氨酸记为“Gly195GIyLys”或“G195GK”。
多个修饰.包括多个修饰的变体加入标记(“+”)分开,例如,“Arg170Tyr+GlyS95Glu”或“R170Y+G195E”表示为位置170和195分别用酪氨酸和谷氨酸取代精氨酸和甘氨酸。
亲代糖苷水解酶
在本发明中,所述亲代糖苷水解酶是(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:2的氨基酸1至513具有至少70%的同一性;或(b)由核苷酸序列编码的多肽,所述核苷酸序列在低严紧性条件下与SEQ ID NO:1的核苷酸52至1539或其互补链杂交。
在第一个方面,所述亲代糖苷水解酶包含氨基酸序列,所述氨基酸序列与SEQ ID NO:2的氨基酸1至513具有至少70%,优选至少75%,更优选至少80%,更优选至少85%,还更优选至少90%,最优选至少95%,并甚至最优选至少97%的同一性程度,其具有糖苷水解酶活性(在下文中称为“同源多肽”)。为了本发明的目的,两个氨基酸序列之间的同一性程度通过Clustal方法(Higgins,1989,C4BI055:151-153),应用具有同一性表和下述多个比对参数的LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)进行确定:缺口(gap)罚10分和缺口长度罚10分。配对比对参数为Ktuple=1,缺口罚分=3,窗口(window)=5和对角线(diagonal)=5。
基本(substantially)同源的亲代糖苷水解酶可具有一个或多个氨基酸取代、缺失或添加。这些改变优选较少天然的(minor nature),其为如前所述的保守氨基酸取代和不显著影响所述的蛋白或多肽的三-维折叠或活性的其他取代;通常为1个至大约30个氨基酸的小缺失;和氨基-末端或羧基-末端的小延伸,诸如氨基-末端的甲硫氨酸残基、多达大约20-25个残基的小连接肽或便于纯化的小延伸(亲和标记),如聚-组氨酸区(poly-histidine tract),或蛋白A(Nilsson等,1985,EMBO J.4:1075;Nilsson等,1991,Methods Enzymol.198:3。也参见,通常,Ford等,1991,Protein Expression and Purification 2:95-107。保守修饰的实例是在碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳香氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)之内的。通常不改变所述比活性的氨基酸修饰在本技术领域中是公知的,并例如,由H.Neurath和R.L. Hill,1979,In,The Proteins,Academic Press,New York描述。最常发生的改变为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly以及反向(Taylor,1986,Journal of Theoretical Biology 119:205-218。
虽然上述的改变优选较少天然的,但是这样的改变也可为真正天然的,如多至300个或更多个氨基酸的较大多肽的融合体作为氨基-末端或羧基-末端的延伸。
除了20个标准的氨基酸,非标准的氨基酸(诸如4-羟脯氨酸(4-hydroxyproline)、6-N-甲基赖氨酸(6-N-methyl lysine)、2-氨基异丁酸(2-aminoisobutyric acid)、异缬氨酸(isovaline)和alpha-甲基丝氨酸(alpha-methylserine))可取代野生型糖苷水解酶的氨基酸残基。有限数目的非保守氨基酸、不由遗传密码编码的氨基酸和非天然的氨基酸可取代氨基酸残基。“非天然的氨基酸”已经在蛋白合成后经过修饰,和/或在它们的侧链具有不同于标准氨基酸的化学结构。非天然的氨基酸可以化学合成,并优选商业上可得到的,而且包括六氢吡啶羧酸(pipecolic acid)、噻唑烷羧酸(thiazolidine carboxylicacid)、脱氢脯氨酸(dehydroproline)、3-和4-甲基脯氨酸和3,3-二甲基脯氨酸。
优选地,所述亲代糖苷水解酶包含SEQ ID NO:2的氨基酸序列;或其等位基因变体;或其具有糖苷水解酶活性的片段。在优选的实施方案中,所述亲代多肽包含SEQ ID NO:2的氨基酸序列。在另一个优选的实施方案中,所述亲代多肽包含SEQ ID NO:2的氨基酸1至513;或其等位基因变体;或其具有糖苷水解酶活性的片段。在另一个优选的实施方案中,所述亲代多肽包含SEQ ID NO:2的氨基酸1至513。在另一个优选的实施方案中,所述亲代多肽由SEQ ID NO:2的氨基酸序列;或其等位基因变体;或其具有糖苷水解酶活性的片段组成。在另一个优选的实施方案中,所述亲代多肽由SEQ ID NO:2的氨基酸序列组成。在另一个优选的实施方案中,所述亲代多肽由SEQ IDNO:2的氨基酸1至513或其等位基因变体;或其具有糖苷水解酶活性的片段。在另一个优选的实施方案中,所述亲代多肽由质粒pAJO52中包含的核苷酸序列编码,所述质粒pAJO52包含于大肠杆菌NRRL B-30683,其中所述核酸序列编码具有糖苷水解酶活性的多肽。在另一个优选的实施方案中,所述亲代多肽由质粒pAJO52中包含的成熟多肽编码区(mature peptide codingregion)编码,所述质粒pAJO52包含于大肠杆菌NRRL B-30683。
SEQ ID NO:2的片段是具有一个或多个氨基酸的多肽,所述的氨基酸是从此氨基酸序列的氨基末端和/或羧基末端缺失的。优选地,片段含有至少450个氨基酸残基,更优选至少470个氨基酸残基,并最优选至少490个氨基酸残基。
在第二个方面,亲代糖苷水解酶由核苷酸序列编码,所述的核苷酸序列在低严紧性条件下,优选中严紧性条件,更优选中-高严紧性条件,还更优选高严紧性条件,并最优选非常高严紧性条件下,与核苷酸探针杂交,所述的核苷酸探针在相同的条件下与(i)SEQ ID NO:1的核苷酸52至1539,(ii)基因组核苷酸序列,其包括SEQ ID NO:1的核苷酸52至1539,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互补链杂交(J.Sambrook,E.F.Fritsch,和T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2d edition,ColdSpring Harbor,New York)。SEQ ID NO:1的子序列可为至少100个连续的核苷酸,或优选至少200个连续的核苷酸。而且,所述的子序列可编码具有糖苷水解酶活性的多肽片段。
SEQ ID NO:1的子序列,或其同源物,是已经从5’-和/或3’-末端缺失一个或多个核苷酸的核苷酸序列。优选地,子序列包含至少1350个核苷酸,更优选至少1410个核苷酸,并最优选至少1470个核苷酸。
所述亲代多肽也可为具有糖苷水解酶活性的多肽的等位的变体,等位的变体意为占据相同染色体基因座的基因的两种或更多替换形式中的任一种。等位的变异通过突变天然地发生,并可在种群内产生多态性(polymorphism)。基因突变可以是沉默的(不改变编码的多肽)或可编码具有改变的氨基酸序列的多肽。多肽的等位的变体由基因的等位基因变体编码。
SEQ ID NO:1的核苷酸序列或其子序列,以及SEQ ID NO:2的氨基酸序列或其片段,可用于设计核苷酸探针,以鉴定并从不同属或种的菌株中,根据本技术领域公知的方法,克隆编码具有糖苷水解酶活性的亲代多肽的DNA。尤其,这样的探针可用于与目标属或种的基因组DNA或cDNA杂交,然后是标准的Southern印迹步骤,以鉴定并分离在其中对应的基因。这样的探针可以显著地短于所述的全序列,但是应为至少15个,优选至少25个,并更优选至少35个核苷酸的长度。也可采用较长的探针。DNA探针和RNA探针都可以采用。通常(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin))标记所述的探针用于检测对应的基因。
从这样的其他生物体制备的基因组DNA或cDNA文库可筛选DNA,所述的DNA与上述的探针杂交,并编码具有糖苷水解酶活性的亲代多肽。基因组DNA或来自这样的其他生物体的其他DNA,可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或其他分离方法进行分离。可将来自所述文库的DNA或分离的DNA转移到并固定在硝化纤维素(nitrocellulose)或其他合适的载体材料上。为了鉴定与SEQ ID NO:1或其子序列同源的克隆或DNA,将所述的载体材料用于Southern印迹。为了本发明的目的,杂交表示所述的核苷酸序列,在低严紧性条件至非常高严紧性条件下,与标记的核苷酸探针杂交,所述的核苷酸探针对应于在SEQ ID NO:1中显示的核苷酸序列,其互补链,或其子序列。所述探针与之杂交的分子可以应用,例如,X射线胶片(X-ray film)或任何其他本技术领域公知的检测方法进行检测。
在优选的实施方案中,所述的核苷酸探针是核苷酸序列,其编码SEQ IDNO:2的多肽,或其子序列。在另一个优选的实施方案中,所述的核苷酸探针是SEQ ID NO:1。在另一个优选的实施方案中,所述的核苷酸探针是SEQID NO:1的核苷酸52至1539。在另一个优选的实施方案中,所述的核苷酸探针是质粒pAJO52中包含的核酸序列,所述质粒pAJO52包含于大肠杆菌NRRL B-30683,其中所述核酸序列编码具有糖苷水解酶活性的多肽。在另一个优选的实施方案中,所述核苷酸探针是质粒pAJO52中包含的成熟多肽编码区,所述质粒pAJO52包含于大肠杆菌NRRL B-30683。
对于长度至少100个核苷酸长探针,低严紧性条件至非常高严紧性条件定义为,在42℃,在5×SSPE、0.3%SDS、200μg/ml剪切的和变性的鲑精DNA,对于低严紧性25%甲酰胺,对于中和中-高严紧性35%甲酰胺,对于高和非常高严紧性50%甲酰胺中,进行预杂交和杂交,然后是标准的Southern印迹步骤,其最优进行12至24小时。
对于长度至少100个核苷酸的长探针,所述的载体材料最终用0.2×SSC,0.2%SDS,优选至少在50℃(低严紧性),更优选至少在55℃(中严紧性),更优选至少在60℃(中-高严紧性),最优选至少在65℃(高严紧性),并甚至最优选至少在70℃(非常高严紧性)洗涤三次,每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,严紧性条件定义为在比用Bolton和McCarthy(1962,Proceedings of the National Academy ofSciences USA 48:1390)计算得出的Tm低5℃至10℃,在0.9M NaCl,0.09MTris-HCl pH 7.6,6mM EDTA,0.5%NP-40,1×登哈特溶液(Denhardt′ssolution),1mM焦磷酸钠(sodium pyrophosphate),1mM磷酸二氢钠(sodiummonobasic phosphate),0.1mM ATP和0.2mg每ml的酵母RNA中,进行预杂交、杂交和杂交后洗涤(washing post-hybridization),然后是标准的Southern印迹步骤,其最优进行12至24小时。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,所述载体材料在6×SSC加0.1%SDS中洗涤一次15分钟,并用6×SSC在低于计算的Tm5℃至10℃洗涤两次,每次15分钟。
所述亲代糖苷水解酶可从任何属的微生物得到。为了本发明的目的,本文应用的术语“从...中得到”连同给出的来源,可指由核苷酸序列编码的亲代糖苷水解酶通过所述的来源或通过细胞产生,在所述的细胞中已经插入来自所述来源的核苷酸序列。在优选的实施方案中,所述亲代糖苷水解酶是分泌到细胞外的。
亲代糖苷水解酶可为真菌糖苷水解酶。在优选的实施方案中,所述的真菌糖苷水解酶是酵母糖苷水解酶,诸如念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、糖酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或Yarrowia糖苷水解酶。在又一个优选的实施方案中,所述的真菌糖苷水解酶是丝状真菌糖苷水解酶,诸如枝顶孢霉属(Acremonium)、蘑菇属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、葡萄座腔菌属(Botryospaeria)、Ceriporiopsis、Chaetomidium、麦角属(Claviceps)、旋孢腔菌属(Cochliobolus)、Coprinopsis、Coptotermes、Corynascus、Cryphonectria、色二孢属(Diplodia)、黑耳属(Exidia)、镰孢属(Fusarium)、赤霉属(Gibberella)、Holomastigotoides、腐质霉属(Humicola)、耙菌属(Irpex)、Lentinula、Leptospaeria、Magnaporthe、Melanocarpus、Meripilus、毁丝霉属(Myceliophthora)、脉孢菌属(Neurospora)、青霉属(Penicillium)、Phanerochaete、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、Thielavia、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、Volvariella(小包脚菇属)或炭角菌属(Xylaria)糖苷水解酶。
在更优选的实施方案中,所述亲代糖苷水解酶是卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomycesdiastaticus)、Saccharomyces douglasii、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形糖酵母(Saccharomyces oviformis)糖苷水解酶。
在另一个更优选的实施方案中,亲代糖苷水解酶是Acremoniumcellulolyticus、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillusfumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、杆孢状镰孢(Fusariumbactridioides)、Fusarium cerealis、Fusarium crookwellense、大刀镰孢(Fusariumculmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusariumnegundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、腐皮镰孢(Fusarium solani)、拟分枝孢镰孢(Fusariumsporotrichioides)、Fusarium sulphureum、Fusarium torulosum、Fusariumtrichothecioides、Fusarium venenatum、灰腐质霉(Humicola grisea)、Humicolainsolens、Humicola lanuginosa、乳白耙菌(Irpex lacteus)、米黑毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicillium funiculosum)、产紫青霉(Penicilliumpurpurogenum)、Phanerochaete chrysosporium、裂褶菌(Schizophyllumcommune)、齐整小核菌(Sclerotium rolfsii)、Sporotrichum cellulophilum、Talaromyces emersonii、土生梭孢霉(Thielavia terrestris)、Trichodermaharzianum、康宁木霉(Trichoderma koningii)、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉(Trichoderma viride)糖苷水解酶。
在还更优选的实施方案中,所述的亲代糖苷水解酶是Trichoderma reesei糖苷水解酶,并最优选SEQ ID NO:2的Trichoderma reesei纤维二糖水解酶I或其成熟多肽。在另一个最优选的实施方案中,所述的亲代糖苷水解酶由质粒pAJO52中包含的核苷酸序列编码,其中所述的质粒pAJO52包含于大肠杆菌NRRL B-30683,其中所述核苷酸序列编码具有糖苷水解酶活性的多肽。在另一个最优选的实施方案中,所述的亲代糖苷水解酶由质粒pAJO52中包含的成熟多肽编码区编码,其中所述的质粒pAJO52包含于大肠杆菌NRRLB-30683。
可以理解,对于上述的菌种而言,本发明包括其完全阶段和不完全阶段(perfect and imperfect states),和其他分类学的等同物,例如,无性型(anamorph),而不管它们已知的种名。本领域的技术人员将容易地辨别适当的等同物的同一性。
这些菌种的菌株容易地被公众在许多培养物保藏中心获得,诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung von Mikroorganismen undZellkulturen GmbH)(D SM)、真菌菌种保藏中心(Centraalbureau VoorSchimmelcultures)(CBS)和农业研究机构保藏中心(Agricultural ResearchService Patent Culture Collection),Northern Regional Research Center(NRRL)。
所述亲代糖苷水解酶也可从其他来源鉴定和获得,所述的来源包括从自然(例如,土壤、堆肥(compost)、水等)分离的微生物或直接从天然材料(例如,土壤、堆肥、水等)应用上述的探针得到的DNA样品。直接从天然的生活环境(habitat)分离微生物和DNA的方法是本技术领域公知的。编码糖苷水解酶的核苷酸序列于是可通过同样地筛选另一种微生物的cDNA文库或混合的DNA样品得到。一旦用本文所述的合适的探针探测到编码糖苷水解酶的核苷酸序列,该序列可通过应用本领域的普通技术人员所公知的方法进行分离或克隆(参见,例如,J.Sambrook,E.F.Fritsch,和T. Maniatus,1989,MolecularCloning,A Laboratory Manual,2d edition,Cold Spring Harbor,New York)。
如在此定义的,“分离的”糖苷水解酶是基本上无其他非-糖苷水解酶多肽的多肽,例如,至少大约20%纯度,优选至少大约40%纯度,更优选大约60%纯度,还更优选大约80%纯度,最优选大约90%纯度,和甚至最优选大约95%纯度,如通过SDS-PAGE所测定的。
所述亲代糖苷水解酶也可包括融合的多肽或可切割的融合多肽,其中另一种多肽融合于所述多肽或其片段的N-末端或C-末端。融合的多肽是通过将编码另一种多肽的核苷酸序列(或其一部分)融合于本发明的核苷酸序列(或其一部分)来产生。产生融合多肽的方法是本技术领域公知的,并包括将编码所述多肽的编码序列连接,以使它们位于框架中,并在同样的启动子和终止子的控制下表达所述融合的多肽。融合蛋白也可应用内蛋白(intein)方法构建,其中融合是在翻译后产生的(Cooper等,1993,EMBOJ 12:2575-2583;Dawson等,1994,Science 266:776-779)。
亲代糖苷水解酶的基本氨基酸可根据本技术领域公知的方法,诸如定位突变(site-directed mutagenesis)或丙氨酸-扫描突变(alanine-scanningmutagenesis)进行鉴定(Cunningham和Wells,1989,Science 244:1081-1085)。在后一种方法中,单一丙氨酸突变在分子中的每个残基引入,并测定得到的突变分子的生物活性(即,糖苷水解酶活性)以鉴定对于所述分子的活性关键的氨基酸残基。也参见,Hilton等,1996,J.Biol Chem.271:4699-4708。所述酶或其他生物相互作用的活性位点也可以通过结构的物理分析进行测定,如通过核磁共振(nuclear magnetic resonance)、结晶学(crystallography)、电子衍射(electron diffraction)或光亲和标记(photoaffinity labeling)这样的方法,连同突变推定的接触位点氨基酸进行测定。参见,例如,de Vos等,1992,Science 255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBSLett.309:59-64。基本氨基酸的同一性也可由与本发明的多肽相关的多肽的同一性分析进行推断。
可进行单个或多个氨基酸取代,并应用已知的突变、重组和/或重排方法,继之以相关的筛选步骤进行检测,所述的筛选步骤诸如那些由Reidhaar-Olson和Sauer,1988,Science 241:53-57;Bowie和Sauer,1989,Proc Natl Acad SciUSA 86:2152-2156;WO 95/17413或WO 95/22625所公开的。其他可以采用的方法包括易错PCR(error-prone PCR)、噬菌体展示(phage display)(例如,Lowman等,1991,Biochem.30:10832-10837;美国专利No.5,223,409;WO92/06204)和区域定点突变(region-directed mutagenesis)(Derbyshire等,1986,Gene 46:145,Ner等,1988,DNA 7:127)。
质粒
用于制备糖苷水解酶变体的一种或多种质粒可为经过重组DNA步骤的任意质粒或载体。包括编码糖苷水解酶的核苷酸序列的质粒可以通过将所述的核苷酸序列连接到合适的质粒中,或通过其他合适的方法进行制备。所述的质粒优选包含一个或多个在此描述的可选择的标记(selectable marker),其允许容易地筛选转化的细胞。质粒的选择常常依赖于它将导入的宿主细胞。
在本发明中,所述的质粒可为一种自主复制(autonomous replication)的质粒,即,作为染色体外的(extrachromosomal)实体而存在的质粒,它的复制与染色体的复制有所区别。
所述质粒复制子可为任何质粒复制子,其介导在细胞中发挥功能的自主复制。术语“质粒复制子”在本文中定义为能使质粒或载体在体内复制的序列。在酵母细胞中有用的质粒复制子的实例是复制的2微米起点(2micronorigin)、ARS1、ARS4、ARS1与CEN3的组合,及ARS4与CEN6的组合。在丝状真菌细胞中有用的质粒复制子的实例是AMA1和ANS 1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。根据在WO 00/24883中公开的方法,可以实现AMA1基因的分离和包含该基因的质粒或载体的构建。
所述质粒的线性化(linearizing)可以定向到所述质粒中的任何位点。所述质粒可以通过本技术领域所公知的任何合适的方法线性化,例如,以一种或多种限制酶消化。所述质粒的线性化的末端可以用核苷酸填充,如由Pompon等,1989,Gene 83:15-24所描述的。然而,当它可以产生移码(frameshift)时,优选不填充所述的线性化的末端。
为了简化筛选方法,所述质粒优选为表达载体,其中所述的核苷酸序列可操作地连接于DNA转录所需的附加区段。通常,所述表达载体源自质粒、粘粒(cosmid)或噬菌体(bacteriophage),或可以包含元件中的任一种或所有这些元件。为了本发明的目的,术语“质粒”和“载体”可以互换地采用。
DNA片段
与线性化的质粒的同源区通过体内重组随机组合(或“重排”)的DNA片段的文库,可以通过任何合适的方法进行制备。例如,所述的DNA片段可以通过包含所述核苷酸序列的质粒的PCR扩增(例如,易错PCR),应用特异性引物进行制备,例如,如在美国专利No.4,683,202或Saiki等,1988,Science 239:487-491中所描述的。所述的DNA片段也可从包含所需的核苷酸序列的质粒中通过用限制酶消化进行分离,然后再应用例如,电泳进行分离。
所述的DNA片段可替换地,可以通过已建立的标准方法合成制备,例如,由Beaucage和Caruthers,1981,Tetrahedron Letters 22:1859-1869描述的亚磷酰胺(phosphoamidite)方法,或由Matthes等,1984,EMBO Journal 3:801-805描述的方法。根据亚磷酰胺方法,在自动DNA合成仪上合成寡核苷酸,纯化、退火、连接,并克隆入合适的质粒。
所述的DNA片段也可为合成DNA与基因组DNA混合来源的、合成DNA与cDNA混合来源的,或基因组DNA与cDNA混合来源的,其通过将合成DNA、基因组DNA或cDNA来源的片段连接而制备,所述的片段依照标准方法对应于全部核苷酸序列的各个部分。
DNA片段的文库包括所述核苷酸序列的一个或多个突变,其中所述的片段包括至少两种区域,一个或多个与线性化的核苷酸序列和/或质粒序列的缺口的5’-区或3’-区同源的区域,和一个或多个与所述文库的DNA片段的5’-区或3’-区同源的第二区域。
所述DNA片段的区域可为与所述的核苷酸序列和/或质粒序列同源的任何序列。
在优选的实施方案中,所述DNA片段的区域为侧翼与编码糖苷水解酶的基因相连的5’-区和/或3’-区;或编码糖苷水解酶的基因的5’-区和/或3’-区。
在本发明的另一个优选的实施方案中,所述的一个或多个DNA片段在导致低、中或高随机突变频率的条件下制备。为了获得低突变频率,所述的核苷酸序列(包括所述的DNA片段)可以通过标准的PCR扩增方法制备(US4,683,202或Saiki等,1988,Science 239:487-491)。中或高突变频率可以通过在降低通过热稳定的聚合酶复制的保真度,和增加核苷酸的错误掺入的条件下实施PCR扩增获得,例如,由Deshler,1992,GATA9:103-106;Leung等,1989,BioTechniques 1:11-15所描述的。
所述的PCR扩增可应用合适的物理或化学诱变剂(mutagenizing agent)与突变步骤组合,所述的诱变剂例如诱导转化(transition)、颠换(transversion)、倒位(inversion)、混乱(scrambling)、缺失和/或插入的诱变剂。
在优选的实施方案中,将进行重排的DNA片段优选具有大约15bp至8kb的长度,更优选大约30bp至6kb,还更优选大约40bp至6kb,还更优选大约80bp至4kb,并最优选大约100bp至2kb,以能够与线性化的质粒最优地相互作用。
真菌细胞
将质粒/片段核苷酸序列的混合物导入其中的真菌细胞,可为本发明中有用的任何真菌细胞。“重组真菌细胞”在本文中定义为能够介导大量同源核苷酸序列重排的细胞。
在优选的实施方案中,所述的真菌重组细胞是酵母细胞。在更优选的实施方案中,所述的酵母重组细胞是念珠菌属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、糖酵母属、裂殖酵母属或西洋蓍霉(Yarrowia)细胞。
在最优选的实施方案中,所述的酵母重组细胞是乳酸克鲁维酵母(Kluyveromyces lactis)、卡尔酵母、酿酒酵母、糖化酵母、Saccharomycesdouglasii、克鲁弗酵母、诺地酵母、Saccharomyces oviformis或Yarrowialipolytica细胞。
在另一个优选的实施方案中,所述的真菌重组细胞是丝状真菌细胞。在更优选的实施方案中,所述的丝状真菌重组细胞是枝顶孢霉属、曲霉属、镰孢属、腐质霉属、毛霉属、毁丝霉属、脉孢菌属、青霉属、Thielavia、Tolypocladium或木霉属细胞。
在最优选的实施方案中,丝状真菌重组细胞是泡盛曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个最优选的实施方案中,所述的丝状真菌重组细胞是杆孢状镰孢、Fusarium cerealis、Fusariumcrookwellense、大刀镰孢、禾本科镰孢、Fusarium graminum、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides或Fusarium venenatum细胞。在另一个最优选的实施方案中,所述的丝状真菌重组细胞是Humicola insolens、Humicola lanuginosa、米黑毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌、产紫青霉、土生梭孢霉、Trichoderma harzianum、康宁木霉、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉细胞。
在另一个最优选的实施方案中,所述的曲霉细胞是米曲霉细胞。
在另一个最优选的实施方案中,所述的曲霉细胞是黑曲霉细胞。
在另一个最优选的实施方案中,所述的Fusarium venenatum细胞是Fusarium venenatum A3/5,其起初作为禾本科镰孢ATCC 20334保藏,并最近由Yoder和Christianson,1998,Fungal Genetics and Biology 23:62-80和O′Donnell等,1998,Fungal Genetics and Biology 23:57-67重分类为Fusariumvenenatum;以及Fusarium venenatum的分类学等同物,而不管它们普遍公知的种名。在另一个最优选的实施方案中,所述的Fusarium venenatum细胞是Fusarium venenatum A3/5或Fusarium venenatum ATCC 20334的形态突变体(morphological mutant),如在WO 97/26330中公开的。
真菌细胞可通过包括形成原生质体、转化原生质体和以本身已知的方式再生细胞壁的方法进行转化。转化曲霉属和木霉属宿主细胞的合适的步骤在EP 238023和Yelton等,1984,Proceedings of the National Academy of SciencesUSA 81:1470-1474中描述。转化镰孢属菌种的合适的方法由Malardier等,1989,Gene 78:147-156和WO 96/00787描述。酵母可以应用由Becker和Guarente,In Abelson,J.N.和Simon,M.I.,editors,Guide to Yast Genetics和Molecular Biology,Methods in Enzymology,Volume 194,pp 182-187,AcademicPress,Inc.,New York;Ito等,1983,Journal of Bacteriology 153:163和Hinnen等,1978,Proceedings of the National Academy of Sciences USA 75:1920中描述的步骤进行转化。
体内重组
可以将大量的变体或同源基因组合在一个转化中,以有效地从同源基因中产生基因嵌合体(gene chimera)。重排这些基因、编码改进的变体、野生型基因或其组合,产生能够表达的嵌合体,然后通过筛选应用有益突变的最优组合以鉴定那些嵌合体。此方法将所能得到的进一步改进的变体的数量,与只应用随机突变的方法相比增加了多-倍(为了回顾,参见Kuchner和Arnold,1997,TIBTech 15:523-530)。随机突变将突变导入目标核苷酸序列,产生的有害突变(deleterious mutation)比有益突变更多。这样的突变循环轮(iterativeround)中,有害突变比有益突变积累得更快,在筛选的过程中显著地屏蔽了有益突变的鉴定。两个或多个在它们的核苷酸序列中含有多个单核苷酸改变的同源核苷酸序列,它们之间的随机重组可能允许所有那些包含在一个变体中的核苷酸改变,所述的变体将从彼此分离并被替换与存在于其他变体的任何突变随机组合。这种突变的重排提供了一种方法,通过此方法来自不同亲代序列的突变可以相互随机组合,以增加在单核苷酸序列中组合核苷酸改变的可能性。
突变/重排方法可与高产量、自动化的筛选方法组合,以检测由宿主细胞表达的、克隆的、突变的多肽的活性。编码活性多肽的突变的DNA分子可以应用本技术领域的标准方法从宿主细胞中回收并快速地测序。这些方法允许快速检测目标多肽中重要的单个氨基酸残基,并可应用于未知结构的多肽。
应用体内重组方法有效重组多个重叠片段,是从变体或同源基因产生嵌合体的方法。小如15bp的重叠部分对于重组是足够的,并可以应用于甚至是关系疏远的基因的非常简单的区域重排。在区域重排中,非-同源DNA的较大区段通过在它们的末端延伸同源性的方法进行随机地分类。
优选至少一个重排循环是与初始应用的一个或多个DNA片段进行的回交循环(backcrossing cycle),所述的DNA片段可为野生型DNA片段。这就消除了不重要的(non-essential)突变。不重要的突变也可以通过应用野生型DNA片段作为初始应用的输入DNA材料进行消除。
两段以上的核苷酸序列可以同时重排,而且其优势在于可以快速地制备大量完全不同的变体,而不需增加循环步骤。当从同样的区域重组多个片段时,所述片段的多个重叠部分会自动地增加DNA互换的频率,但同样重要的是在重叠区具有相对大量的随机交换体(random crossover),以重新组合位置接近的变体/差异。
两个片段之间小如15bp的重叠部分足够得到有效的重组。因此,在15至5000bp范围内的重叠,优选30bp至500bp,尤其是30bp至100bp是适于本发明的。
在本发明中,优选两段或更多的重叠片段,更优选2至50个重叠片段,并最优选2至10个重叠片段,可有利地用作重排循环中的DNA片段。
除了允许产生嵌合体基因,应用重叠片段是区域重排的有用的方法,所述的区域重排是通过在来自不同区域的DNA片段之间产生小的重叠部分,并筛选其最优的组合来进行的。例如,在3个DNA片段的情况中,所述的重叠区域可为如下:第一个片段的第一个末端与所述线性化的质粒第一个末端重叠,第二个片段的第一个末端与第一个片段的第二个末端重叠,而且第二个片段的第二个末端与第三个片段的第一个末端重叠,第三个片段的第一个末端(如上所述)与第二个片段的第二个末端重叠,而第三个片段的第二个末端与所述线性化的质粒的第二个末端重叠。
可以理解,当应用两段或更多DNA片段作为起始材料(starting material)时,优选所述质粒和DNA片段的末端之间具有连续的重叠部分。
虽然优选以DNA片段和线性化的质粒的形式重排同源的核苷酸序列,但也可能重排两个或多个包含编码多肽的同源核苷酸序列的线性化的质粒。然而,在这样的情况中重要的是在不同的位点将所述的质粒线性化。
在本发明中,两个或多个线性化的质粒和一个或多个同源DNA片段可用作将重排的起始材料。线性化的质粒和同源DNA片段之间的比例优选处于20∶1至1∶50的范围内,并更优选2∶1至1∶10(mol质粒∶mol片段),及1pM至10M的DNA特异的浓度。
通过在质粒中缺失所述片段之间的重叠部分,线性化的质粒可具有缺口。而在所述质粒中修复所述缺口需要,除将所述的片段与有缺口的质粒的末端重新组合之外,将所述的片段相互重新组合,以重新构成环形的、自主复制的质粒。在优选的实施方案中,所述质粒或载体的线性化在所述核苷酸序列的编码序列中产生足够的缺口,以推动所述的DNA片段与所述核苷酸序列的对应区域的同源重组,重新产生环形的复制的质粒。
变体
在本发明中,所述亲代糖苷水解酶的分离的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代,其中所述具有糖苷水解酶活性的变体包含氨基酸序列,所述氨基酸序列与所述亲代糖苷水解酶的氨基酸序列具有至少70%,优选至少75%,更优选至少80%,更优选至少85%,还更优选至少90%,最优选至少95%,并甚至最优选至少97%的同一性程度。为了本发明的目的,两个氨基酸序列的同一性程度通过Clustal方法(Higgins,1989,CABIOS 5:151-153),应用具有同一性表和下述多个比对参数的LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)进行确定:缺口罚10分和缺口长度罚10分。配对比对参数为Ktuple=1,缺口罚分=3,窗口=5和对角线=5。
如本文所定义的,亲代糖苷水解酶的“分离的变体”是基本上无其他非-糖苷水解酶多肽的多肽,例如,如通过SDS-PAGE测定的至少20%纯度,优选至少40%纯度,更优选至少60%纯度,还更优选至少80%纯度,最优选至少90%纯度,并甚至最优选至少95%纯度。
在优选的实施方案中,在本发明的变体中氨基酸取代的数目包含优选33,更优选32,还更优选31,还更优选30,还更优选29,还更优选28,还更优选27,还更优选26,还更优选25,还更优选24,还更优选23,还更优选22,还更优选21,还更优选20,还更优选19,还更优选18,还更优选17,还更优选16,还更优选15,还更优选14,还更优选13,还更优选12,还更优选11,还更优选10,还更优选9,还更优选8,还更优选7,还更优选6,还更优选5,还更优选4,还更优选3,还更优选2,并最优选1。
在优选的实施方案中,亲代糖苷水解酶的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。在另一个优选的实施方案中,亲代糖苷水解酶的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的两个或更多位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。在另一个优选的实施方案中,亲代糖苷水解酶的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的三个或更多位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。在另一个优选的实施方案中,亲代糖苷水解酶的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的四个或更多位置包含取代,并任选地进一步在对应于SEQID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。在另一个优选的实施方案中,亲代糖苷水解酶的变体在对应于SEQID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的五个或更多位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。在另一个优选的实施方案中,亲代糖苷水解酶的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的六个或更多位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。在另一个优选的实施方案中,亲代糖苷水解酶的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的七个或更多位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。在另一个优选的实施方案中,亲代糖苷水解酶的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的八个或更多位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。在另一个优选的实施方案中,亲代糖苷水解酶的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的九个或更多位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。在另一个优选的实施方案中,亲代糖苷水解酶的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的十个或更多位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。在另一个优选的实施方案中,亲代糖苷水解酶的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的十一个或更多位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。在另一个优选的实施方案中,亲代糖苷水解酶的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的十二个或更多位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。在另一个优选的实施方案中,亲代糖苷水解酶的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的十三个或更多位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。在另一个优选的实施方案中,亲代糖苷水解酶的变体在至少对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Pro作为在对应于SEQ ID NO:2的氨基酸1至513的位置21的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S21P。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置94的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置94的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Ser作为在对应于SEQ ID NO:2的氨基酸1至513的位置94的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G94S。在另一个还更优选的实施方案中,所述变体包含Ala作为在对应于SEQ ID NO:2的氨基酸1至513的位置94的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G94A。在另一个还更优选的实施方案中,所述变体包含Arg作为在对应于SEQ ID NO:2的氨基酸1至513的位置94的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G94R。在另一个还更优选的实施方案中,所述变体包含Gln作为在对应于SEQID NO:2的氨基酸1至513的位置94的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G94Q。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Arg作为在对应于SEQ ID NO:2的氨基酸1至513的位置157的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代K157R。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Arg作为在对应于SEQ ID NO:2的氨基酸1至513的位置205的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G205R。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置206的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置206的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Tyr作为在对应于SEQ ID NO:2的氨基酸1至513的位置206的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代H206Y。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置247的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置247的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Cys作为在对应于SEQ ID NO:2的氨基酸1至513的位置247的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代Y247C。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置337的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置337的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Val作为在对应于SEQ ID NO:2的氨基酸1至513的位置337的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代E337V。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置350的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置350的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Ser作为在对应于SEQ ID NO:2的氨基酸1至513的位置350的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代T350S。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置373的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置373的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含His作为在对应于SEQ ID NO:2的氨基酸1至513的位置373的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代N373H。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置383的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置383的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Ala作为在对应于SEQ ID NO:2的氨基酸1至513的位置383的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代T383A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置438的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置438的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Leu作为在对应于SEQ ID NO:2的氨基酸1至513的位置438的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代P438L。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置455的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置455的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Ala作为在对应于SEQ ID NO:2的氨基酸1至513的位置455的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代T455A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置467的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置467的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Ser作为在对应于SEQ ID NO:2的氨基酸1至513的位置467的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G467S。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置486的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置486的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Trp作为在对应于SEQ ID NO:2的氨基酸1至513的位置486的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代C486W。
在优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8的位置包含取代。在更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体进一步包含Pro作为在对应于SEQ ID NO:2的氨基酸1至513的位置8的位置的取代。在最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代S8P。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置22的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置22的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Asp作为在对应于SEQ ID NO:2的氨基酸1至513的位置22的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代G22D。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Ile作为在对应于SEQ ID NO:2的氨基酸1至513的位置41的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代T41I。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Ser作为在对应于SEQ ID NO:2的氨基酸1至513的位置49的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代N49S。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Asn作为在对应于SEQ ID NO:2的氨基酸1至513的位置57的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代S57N。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Asn作为在对应于SEQ ID NO:2的氨基酸1至513的位置113的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代S 113N。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置193的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置193的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Lys作为在对应于SEQ ID NO:2的氨基酸1至513的位置193的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代E193K。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Pro作为在对应于SEQ ID NO:2的氨基酸1至513的位置196的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代S196P。在另一个还更优选的实施方案中,所述变体进一步包含Thr作为在对应于SEQ ID NO:2的氨基酸1至513的位置196的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代S196T。在另一个还更优选的实施方案中,所述变体进一步包含Phe作为在对应于SEQ ID NO:2的氨基酸1至513的位置196的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代S196F。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置226的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置226的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Ala作为在对应于SEQ ID NO:2的氨基酸1至513的位置226的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代T226A。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Ala作为在对应于SEQ ID NO:2的氨基酸1至513的位置227的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代P227A。在另一个还更优选的实施方案中,所述变体进一步包含Leu作为在对应于SEQ ID NO:2的氨基酸1至513的位置227的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代P227L。所述变体进一步包含Gly作为在对应于SEQ ID NO:2的氨基酸1至513的位置227的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代P227G。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置246的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置246的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Ile作为在对应于SEQ ID NO:2的氨基酸1至513的位置246的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代T246I。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置251的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置251的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Lys作为在对应于SEQ ID NO:2的氨基酸1至513的位置251的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代R251K。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置255的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置255的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Pro作为在对应于SEQ ID NO:2的氨基酸1至513的位置255的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代T255P。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置259的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置259的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Asn作为在对应于SEQ ID NO:2的氨基酸1至513的位置259的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代D259N。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置301的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置301的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Ser作为在对应于SEQ ID NO:2的氨基酸1至513的位置301的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代N301S。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置356的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置356的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Ile作为在对应于SEQ ID NO:2的氨基酸1至513的位置356的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代T356I。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置371的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置371的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Cys作为在对应于SEQ ID NO:2的氨基酸1至513的位置371的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代Y371C。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置411的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Phe作为在对应于SEQ ID NO:2的氨基酸1至513的位置411的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代S411F。
在另一个优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置462的位置包含取代。在另一个更优选的实施方案中,所述变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体进一步包含Ala作为在对应于SEQ ID NO:2的氨基酸1至513的位置462的位置的取代。在另一个最优选的实施方案中,所述变体进一步包含SEQ ID NO:2的氨基酸1至513的取代T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227和259的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227和259的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Gly(或Ala或Leu)和Asn分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置227和259的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代P227G(或P227A或P227L)+D259N。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227和486的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227和486的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Ala(或Leu或Gly)和Trp分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置227和486的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代P227A(或P227L或P227G)+C486W。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置301和337的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置301和337的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Ser和Val分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置301和337的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代N301S+E337V。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和350的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和350的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Pro (或Thr或Phe)和Ser分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置196和350的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S196P(或S196T或S196F)+T350S。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置22和467的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置22和467的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Asp和Ser分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置22和467的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G22D+G467S。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21和57的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21和57的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Pro和Asn分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置21和57的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S21P+S57N。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205和411的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Arg和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置205和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G205R+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205和227的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205和227的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Arg和Ala(或Leu或Gly)分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置205和227的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G205R+P227A(或P227L或P227G)。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205和206的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205和206的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Arg和Tyr分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置205和206的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G205R+H206Y。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置8和205的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置8和205的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Pro和Arg分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置8和205的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S8P+G205R。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置94和205的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置94和205的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Ser(或Ala或Arg或Gln)和Arg分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置94和205的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G94S(或G94A或G94R或G94Q)+G205R。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和205的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和205的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Pro(或Thr或Phe)和Arg分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置196和205的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S196P(或S196T或S196F)+G205R。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置383和455的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置383和455的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Ala和Ala分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置383和455的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代T383A+T455A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113和411的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Asn和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置113和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113和196的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113和196的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Asn和Thr(或Pro或Phe)分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置113和196的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+S196T(或S196P或S196F)。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113和462的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Asn和Ala分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置113和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和462的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Thr(或Pro或Phe)和Ala分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置196和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S 196T(或S196P或S196F)+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和462的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置41和196的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ile和Phe(或Pro或Thr)分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置41和196的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代T41I+S196F(或S196P或S196T)。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置94和226的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置94和226的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Ala(或Ser或Arg或Gln)和Ala分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置94和226的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G94A(或G94S或G94R或G94Q)+T226A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和462的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Asn、Thr(或Pro或Phe)和Ala分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+S 196T(或S196P或S196F)+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157和205的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157和205的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Arg和Arg分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置157和205的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代K157R+G205R。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157和255的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157和255的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Arg和Pro分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置157和255的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代K157R+T255P。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205和255的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205和255的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Arg和Pro分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置205和255的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G205R+T255P。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157、205和255的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157、205和255的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Arg、Arg和Pro分别作为在对应于SEQID NO:2的氨基酸1至513的位置157、205和255的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代K157R+G205R+T255P。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置41和193的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置41和193的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Ile和Lys分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置41和193的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代T41I+E193K。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置41和411的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置41和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Ile和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置41和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代T41I+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置193和411的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置193和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Lys和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置193和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代E193K+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置41、193和411的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置41、193和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Ile、Lys和Phe分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置41、193和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代T41I+E193K+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置247和371的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置247和371的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Cys和Cys分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置247和371的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代Y247C+Y371C。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置247和411的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置247和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Cys和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置247和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代Y247C+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置371和411的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置371和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Cys和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置371和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代Y371C+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置247、371和411的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置247、371和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Cys、Cys和Phe分别作为在对应于SEQID NO:2的氨基酸1至513的位置247、371和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代Y247C+Y371C+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113和227的位置包含取代。在另一个更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113和227的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在另一个还更优选的实施方案中,所述变体包含Asn和Ala(或Leu或Gly)分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置113和227的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S 113N+P227A(或P227L或P227G)。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和227的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和227的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Thr(或Pro或Phe)和Ala(或Leu或Gly)分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置196和227的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S196T(或S196P或S196F)+P227A(或P227L或P227G)。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227和462的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ala(或Leu或Gly)和Ala分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置227和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代P227A(或P227L或P227G)+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和227的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置142、196和227的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Thr(或Pro或Phe)和Ala分别作为在对应于SEQID NO:2的氨基酸1至513的位置142、196和227的位置的取代。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和462的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Ala(或Leu或Gly)和Ala分别作为在对应于SEQID NO:2的氨基酸1至513的位置113、227和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+P227A(或P227L或P227G)+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和462的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Thr(或Pro或Phe)、Ala(或Leu或Gly)和Ala分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S196T(或S196P或S196F)+P227A(或P227L或P227G)+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和462的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Thr(或Pro或Phe)、Ala(或Leu或Gly)和Ala分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+S 196T(或S196P或S196F)+P227A(或P227L或P227G)+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49和113的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49和113的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ser和Asn分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置49和113的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQID NO:2的氨基酸1至513的取代N49S+S 113N。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49和227的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49和227的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ser和Ala(或Leu或Gly)分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置49和227的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代N49S+P227A(或P227L或P227G)。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49和438的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49和438的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ser和Leu分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置49和438的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQID NO:2的氨基酸1至513的取代N49S+P438L。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113和438的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113和438的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn和Leu分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置113和438的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+P438L。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227和438的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227和438的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ala(或Leu或Gly)和Leu分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置227和438的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代P227A(或P227L或P227G)+P438L。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49、113和227的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49、113和227的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ser、Asn、和Ala(或Leu或Gly)分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置49、113和227的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代N49S+S113N+P227A(或P227L或P227G)。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49、227和438的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49、227和438的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ser、Ala(或Leu或Gly)和Leu分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置49、227和438的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代N49S+P227A(或P227L或P227G)+P438L。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和438的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和438的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Ala(或Leu或Gly)和Leu分别作为在对应于SEQID NO:2的氨基酸1至513的位置113、227和438的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+P227A(或P227L或P227G)+P438L。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49、113和438的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49、113和438的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ser、Asn和Leu分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置49、113和438的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代N49S+S113N+P438L。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49、113、227和438的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置49、113、227和438的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ser、Asn、Ala(或Leu或Gly)和Leu分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置49、113、227和438的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代N49S+S113N+P227A(或P227L或P227G)+P438L。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Arg和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置157和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代K157R+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Arg和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置205和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G205R+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置255和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置255和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Pro和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置255和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代T255P+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157、255和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157、255和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Arg、Pro和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置157、255和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代K157R+T255P+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205、255和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置205、255和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Arg、Pro和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置205、255和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代G205R+T255P+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157、205和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157、205和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Arg、Arg和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置157、205和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代K157R+G205R+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157、205、255和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置157、205、255和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Arg、Arg、Pro和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置157、205、255和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代K157R、G205R+T255P+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Thr(或Pro或Phe)和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置196和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S196T (或S196P或S196F)+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ala(或Leu或Gly)和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置227和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代P227A(或P227L或P227G)+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Ala(或Leu或Gly)和Phe分别作为在对应于SEQID NO:2的氨基酸1至513的位置113、227和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+P227A(或P227L或P227G)+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Thr(或Pro或Phe)、Ala(或Leu或Gly)和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S196T(或S196P或S 196F)+P227A(或P227L或P227G)+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Thr(或Pro或Phe)和Phe分别作为在对应于SEQID NO:2的氨基酸1至513的位置113、196和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+S196T(或S196P或S196F)+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Thr(或Pro或Phe)、Ala(或Leu或Gly)和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQID NO:2的氨基酸1至513的取代S113N+S196T(或S196P或S196F)+P227A(或P227L或P227G)+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113和356的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113和356的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn和Ile分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置113和356的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+T356I。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和356的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和356的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Thr(或Pro或Phe)和Ile分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置196和356的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S196T(或S196P或S196F)+T356I。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227和356的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227和356的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ala(或Leu或Gly)和Ile分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置227和356的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代P227A(或P227L或P227G)+T356I。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置356和462的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置356和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ile和Ala分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置356和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代T356I+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和356的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和356的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Ala(或Leu或Gly)和Ile分别作为在对应于SEQID NO:2的氨基酸1至513的位置113、227和356的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S 113N+P227A(或P227L或P227G)+T356I。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和356的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和356的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Thr(或Pro或Phe)、Ala(或Leu或Gly)和Ile分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和356的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S196T(或S196P或S196F)+P227A(或P227L或P227G)+T356I。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和462的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Thr(或Pro或Phe)、Ala(或Leu或Gly)和Ala分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S196T(或S196P或S196F)+P227A(或P227L或P227G)+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196、356和462的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196、356和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Thr(或Pro或Phe)、Ile和Ala分别作为在对应于SEQID NO:2的氨基酸1至513的位置196、356和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S196T(或S196P或S196F)+T356I+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和356的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和356的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Thr(或Pro或Phe)和Ile分别作为在对应于SEQID NO:2的氨基酸1至513的位置113、196和356的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+S196T(或S196P或S196F)+T356I。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227、356和462的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置227、356和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ala(或Leu或Gly)、Ile和Ala分别作为在对应于SEQID NO:2的氨基酸1至513的位置227、356和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代P227A(或P227L或P227G)+T356I+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和356的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和356的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Thr(或Pro或Phe)、Ala(或Leu或Gly)和Ile分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和356的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQID NO:2的氨基酸1至513的取代S113N+S196T(或S196P或S196F)+P227A(或P227L或P227G)+T356I。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、227、356和462的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、227、356和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Ala(或Leu或Gly)、Ile和Ala分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置113、227、356和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+P227A(或P227L或P227G)+T356I+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、356和462的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、356和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Thr(或Pro或Phe)、Ile和Ala分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、356和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+S196T(或S196P或S196F)+T356I+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196、227、356和462的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置196、227、356和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Thr(或Pro或Phe)、Ala(或Leu或Gly)、Ile和Ala分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置196、227、356和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQID NO:2的氨基酸1至513的取代S 196T(或S196P或S196F)+P227A(或P227L或P227G)+T356I+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227、356和462的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227、356和462的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Thr(或Pro或Phe)、Ala(或Leu或Gly)、Ile和Ala分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227、356和462的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S113N+S196T(或S196P或S196F)+P227A(或P227L或P227G)+T356I+T462A。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21和246的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21和246的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Pro和Ile分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置21和246的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQID NO:2的氨基酸1至513的取代S21P+T246I。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21和251的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21和251的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Pro和Lys分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置21和251的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQID NO:2的氨基酸1至513的取代S21P+R251K。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21和411的位置包含以Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Pro和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置21和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQID NO:2的氨基酸1至513的取代S21P+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57和246的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57和246的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn和Ile分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置57和246的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQID NO:2的氨基酸1至513的取代S57N+T246I。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57和251的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57和251的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn和Lys分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置57和251的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQID NO:2的氨基酸1至513的取代S57N+R251K。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57和251的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置57和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQID NO:2的氨基酸1至513的取代S57N+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置246和251的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置246和251的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ile和Lys分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置246和251的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代T246I+R251K。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置246和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置246和411的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ile和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置246和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代T246I+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置251和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置251和411的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Lys和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置251和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代R251K+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、57和246的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、57和246的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Pro、Asn和Ile分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置21、57和246的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S21P+S57N+T246I。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、246和251的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、246和251的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Pro、Ile和Lys分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置21、246和251的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S21P+T246I+R251K。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、246和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、246和411的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Pro、Ile和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置21、246和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S21P+T246I+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57、246和251的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57、246和251的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Ile和Lys分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置57、246和251的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S57N+T246I+R251K。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57、246和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57、246和411的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Ile和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置57、246和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S57N+T246I+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57、251和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57、251和411的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Lys和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置57、251和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S57N+R251K+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、57和251的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、57和251的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Pro、Asn和Lys分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置21、57和251的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S21P+S57N+R251K。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置246、251和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置246、251和411的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Ile、Lys和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置246、251和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代T246I+R251K+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246和251的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246和251的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Pro、Asn、Ile和Lys分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置21、57、246和251的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S21P+S57N+T246I+R251K。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、246、251和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、246、251和411的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Pro、Ile、Lys和Phe分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置21、246、251和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S21P+T246I+R251K+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、251和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、251和411的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Pro、Asn、Lys和Phe分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置21、57、251和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S21P+S57N+R251K+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57、246、251和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置57、246、251和411的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Asn、Ile、Lys和Phe分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置57、246、251和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S57N+T246I+R251K+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246和411的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Pro、Asn、Ile和Phe分别作为在对应于SEQ IDNO:2的氨基酸1至513的位置21、57、246和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S21P+S57N+T246I+S411F。
在另一个优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246、251和411的位置包含取代。在更优选的实施方案中,所述变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246、251和411的位置包含以Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val的取代。在还更优选的实施方案中,所述变体包含Pro、Asn、Ile、Lys和Phe分别作为在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246、251和411的位置的取代。在另一个最优选的实施方案中,所述变体包含SEQ ID NO:2的氨基酸1至513的取代S21P+S57N+T246I+R251K+S411F。
在另一个优选的实施方案中,所述变体包含至少一个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少两个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少三个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少四个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少五个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少六个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少七个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少八个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少九个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少十个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少十一个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少十二个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少十三个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少十四个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S 196P、S 196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少十五个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少十六个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少十七个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少十八个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少十九个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T411、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含至少二十个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
在另一个优选的实施方案中,所述变体包含由至少SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W组成的取代,并任选地进一步包含一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的取代。
本发明的变体可进一步包含所述氨基酸序列的一个或多个缺失和/或插入。
在优选的实施方案中,本发明的变体由341至350、351至360、361至370、371至380、381至390、391至400、401至410、411至420、421至430、431至440、441至450、451至460、461至470、471至480、481至490、491至500或501至513个氨基酸组成。
在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代T226A的变体由大肠杆菌NRRL B-30657中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代S113N+S196T+T462A的变体由大肠杆菌NRRL B-30658中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代G22D+G467S的变体由大肠杆菌NRRL B-30659中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代S21P+S57N的变体由大肠杆菌NRRL B-30661中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代K157R+G205R+T255P的变体由大肠杆菌NRRL B-30662中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代S196P+G205R的变体由大肠杆菌NRRL B-30663中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代S113N+S 196T+P227A+T462A的变体由大肠杆菌NRRL B-30664中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代T41I+E193K+S411F的变体由大肠杆菌NRRL
B-30665中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID
NO:2的氨基酸1至513的取代N49S+S113N+P227A+P438L的变体由大肠杆菌NRRL B-30666中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代N301S+E337V的变体由大肠杆菌NRRL B-30674中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代S 196P+T350S的变体由大肠杆菌NRRL B-30675中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代G205R+H206Y的变体由大肠杆菌NRRL B-30676中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代S8P+G205R的变体由大肠杆菌NRRL B-30677中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代G94S+G205R的变体由大肠杆菌NRRL B-30678中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代T383A+T455A的变体由大肠杆菌NRRL B-30679中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代N373H的变体由大肠杆菌NRRL B-30680中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代Y247C+Y371C+S411F的变体由大肠杆菌NRRL B-30681中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代S21P+S57N+T246I+R251K+S411F的变体由大肠杆菌NRRL B-30682中包含的核苷酸序列编码。在另一个优选的实施方案中,包含SEQ ID NO:2的氨基酸1至513的取代P227G+D259N的变体由大肠杆菌NRRL B-30762中包含的核苷酸序列编码。
本发明也涉及获得亲代糖苷水解酶的变体的方法,其包括:(a)在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置将取代导入所述亲代糖苷水解酶,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置导入取代,其中所述变体具有糖苷水解酶活性;和(b)回收所述的变体。
核苷酸序列
本发明也涉及分离的核苷酸序列,其编码亲代糖苷水解酶的变体,其中所述核苷酸序列已被修饰以编码本文中所述的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。
本文中应用的术语“分离的核苷酸序列”指基本上无其他核苷酸序列的核苷酸序列,例如,通过琼脂糖电泳测定的至少20%纯度,优选至少40%纯度,更优选至少60%纯度,还更优选至少80%纯度,和最优选至少90%纯度。
在优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代T226A的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30657。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代S113N+S196T+T462A的变体的分离的核苷酸序列包含于大肠杆菌NRRLB-30658。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代G22D+G467S的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30659。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代S21P+S57N的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30661。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代K157R+G205R+T255P的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30662。在另一个优选的实施方案中,编码包含SEQID NO:2的氨基酸1至513的取代S 196P+G205R的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30663。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代S113N+S196T+P227A+T462A的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30664。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代T41I+E193K+S411F的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30665。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代N49S+S113N+P227A+P438L的变体的分离的核苷酸序列包含于大肠杆菌NRRLB-30666。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代N301S+E337V的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30674。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代S 196P+T350S的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30675。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代G205R+H206Y的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30676。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代S8P+G205R的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30677。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代G94S+G205R的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30678。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代T383A+T455A的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30679。在另一个优选的实施方案中,编码包含SEQ IDNO:2的氨基酸1至513的取代N373H的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30680。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代Y247C+Y371C+S411F的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30681。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代S21P+S57N+T246I+R251K+S411F的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30682。在另一个优选的实施方案中,编码包含SEQ ID NO:2的氨基酸1至513的取代P227G+D259N的变体的分离的核苷酸序列包含于大肠杆菌NRRL B-30762。
核酸构建体
本发明也涉及核酸构建体,其包含编码本发明的糖苷水解酶变体的核苷酸序列,该序列可操作地连接于一个或多个控制序列,所述的控制序列在合适的宿主细胞中,在与所述的控制序列相适合的条件下指导编码序列表达。表达可理解为包括与产生所述变体有关的任何步骤,其包括但不限于,转录、转录后修饰(posttranscriptional modification)、翻译、翻译后修饰(post-translational modification)和分泌。
“核酸构建体”在本文中定义为单链或双链的核酸分子,其分离自天然产生的基因,或其已被修饰以含有核酸的区段,所述的区段以自然中不存在的方式组合和并置(juxtapose)。当所述的核酸构建体含有表达本发明的变体的编码序列所需的所有控制序列时,术语核酸构建体与术语表达盒(expressioncassette)是同义的。术语“编码序列”在此定义为核酸序列,其直接地指明其蛋白产物的氨基酸序列。基因组编码序列的边界通常由恰位于mRNA的5’-末端的开放阅读框上游的ATG起始密码子,或可替换的起始密码子如GTG和TTG,和恰位于mRNA的3’末端的开放阅读框下游的转录终止子序列进行确定。编码序列可以包括,但不限于DNA、cDNA和重组核酸序列。
编码本发明的糖苷水解酶变体的分离的核苷酸序列,可以以各种方式操作以提供所述变体的表达。将所述核苷酸序列插入载体之前的操作可为需要的或必须的,这取决于表达载体。应用重组DNA方法修饰核酸序列的方法,在本技术领域中是众所周知的。
术语“控制序列”在本文中定义为,包括所有对于表达本发明的糖苷水解酶变体来说必需的或有利的成分。每个控制序列对于编码所述变体的核酸序列可为天然的或外源的。上述控制序列包括,但不限于,前导序列(leader)、聚腺苷酸化序列(polyadenylation sequence)、前肽序列(propeptide sequence)、启动子(promoter)、信号肽序列(signal peptide sequence)和转录终止子(transcription terminator)。最低限度,所述的控制序列包括启动子和转录信号和转录终止信号。所述的控制序列可与接头一起提供,用于引入具体的限制酶切位点以便于将所述的控制序列与编码本发明的变体糖苷水解酶的核苷酸序列的编码区连接。术语“可操作地连接”在本文中定义为一种构造(configuration),其中控制序列适合地位于相对于核苷酸序列的编码序列的位置,以使所述的控制序列指导变体糖苷水解酶的表达。
所述的控制序列可为适当的启动子序列,其由表达所述核苷酸序列的宿主细胞所识别。所述启动子序列包含转录控制序列(transcriptional controlsequences),其介导所述变体糖苷水解酶的表达。所述启动子可为任意核酸序列,其在优先选择的宿主细胞中显示转录活性,其包括突变体启动子(mutant)、被截短的启动子(truncated)和杂合体启动子(hybrid promoter),所述启动子可从编码细胞外或细胞内与所述宿主细胞同源或异源的多肽的基因中获得。
指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适的启动子的实例,是从米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶(aspartic proteinase)、黑曲霉中性alpha-淀粉酶(neutral alpha-amylase)、黑曲霉酸稳定性alpha-淀粉酶(acid stable alpha-amylase)、黑曲霉或泡盛曲霉葡糖淀粉酶(glucoamylase)(glaA)、曼赫根毛霉脂肪酶(lipase)、米曲霉碱性蛋白酶(alkaline proteinase)、米曲霉磷酸丙糖异构酶(triose phosphate isomerase)、构巢曲霉乙酰胺酶(acetamidase)、Fusarium venenatum淀粉葡萄糖苷酶(amyloglucosidase)、尖镰孢胰蛋白酶-样蛋白酶(trypsin-like proteinase)(WO96/00787)、Trichoderma reesei beta-葡糖苷酶、Trichoderma reesei纤维素二糖水解酶I、Trichoderma reesei内切葡聚糖酶I、Trichoderma reesei内切葡聚糖酶II、Trichoderma reesei内切葡聚糖酶III、Trichoderma reesei内切葡聚糖酶IV、Trichoderma reesei内切葡聚糖酶V、Trichoderma reesei木聚糖酶I、Trichoderma reesei木聚糖酶II、Trichoderma reesei beta-木聚糖酶的基因得到的启动子以及NA2-tpi启动子(来自黑曲霉中性alpha-淀粉酶和米曲霉磷酸丙糖异构酶基因的启动子的杂合体);其等同物;及其突变体启动子、被截短的启动子和杂合体启动子。
在酵母宿主中,有用的启动子从酿酒酵母烯醇酶(enolase)(ENO-1)、酿酒酵母半乳糖激酶(galactokinase)(GAL1)、酿酒酵母醇脱氢酶(alcoholdehydrogenase)/3-磷酸甘油醛脱氢酶(glyceraldehyde-3-phosphatedehydrogenase)(ADH1,ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(metallothionine)(CUP1)和酿酒酵母3-磷酸甘油酸激酶(3-phosphoglycerate kinase)的基因中得到。酵母宿主细胞的其他有用的启动子由Romanos等,1992,Yeast 8:423-488描述。
所述控制序列也可为合适的转录终止序列,即由宿主细胞识别以终止转录的序列。所述终止序列与编码所述变体糖苷水解酶的核苷酸序列的3’末端可操作地连接。任何在优先选择的宿主细胞中有功能的终止子可用于本发明。
丝状真菌宿主细胞的优选的终止子从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸盐合成酶(anthranilate synthase)、黑曲霉alpha-葡萄糖苷酶(alpha-glucosidase)和尖镰孢胰蛋白酶-样蛋白酶的基因中得到。
优选的酵母宿主细胞的终止子从酿酒酵母烯醇酶、酿酒酵母细胞色素C(cytochrome C)(CYC1)和酿酒酵母3-磷酸甘油醛脱氢酶的基因中得到。酵母宿主细胞的其他有用的终止子通过Romanos等,1992,见前文描述。
所述控制序列也可为合适的前导序列(leader sequence),即mRNA的不翻译的区域,其对于由宿主细胞的翻译是重要的。所述的前导序列与编码所述变体糖苷水解酶的核酸序列的5’末端可操作地连接。任何在优先选择的宿主细胞中有功能的前导序列可用于本发明。
优选的丝状真菌宿主细胞的前导序列,从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因中得到。
合适的酵母宿主细胞的前导序列从酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母alpha-因子和酿酒酵母醇脱氢酶/3-磷酸甘油醛脱氢酶(ADH2/GAP)的基因中得到。
所述的控制序列以可为聚腺苷酸化序列,即与所述多肽-编码序列的3’末端可操作地连接的序列,而且当它被转录时,它被宿主细胞识别为信号以将聚腺苷酸残基添加在转录的mRNA上。任何在优先选择的宿主细胞中有功能的聚腺苷酸化序列可用于本发明。
优选的丝状真菌宿主细胞的聚腺苷酸化序列从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸盐合成酶、尖镰孢胰蛋白酶-样蛋白酶和黑曲霉alpha-葡萄糖苷酶的基因中得到。
酵母宿主细胞的有用的聚腺苷酸化序列由Guo和Sherman,1995,Molecular Cellular Biology 15:5983-5990描述。
所述的控制序列也可为信号肽编码区域,其编码与变体糖苷水解酶的氨基末端连接的氨基酸序列,并指导编码的多肽进入细胞的分泌途径(secretorypathway)。所述核苷酸序列的编码序列的5′末端可天然地包含信号肽编码区,所述信号肽编码区天然地在翻译阅读框中与编码区的部分连接,所述编码区编码分泌的变体糖苷水解酶。可替换地,编码序列的5′末端可包含信号肽编码区,其对于所述的编码序列是外源的。所述外源的信号肽编码区可为必需的,其中所述编码序列天然地不含信号肽编码区。可替换地,所述外源的信号肽编码区可简单地替换天然的信号肽编码区,以增强所述变体糖苷水解酶的分泌。然而,任何指导所表达的多肽进入优先选择的宿主细胞的分泌途径的信号肽编码区可用于本发明。
丝状真菌宿主细胞的有效的信号肽编码区,为从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、Humicola insolens Cel45A纤维素酶和Humicola lanuginosa脂肪酶的基因中得到的信号肽编码区。
酵母宿主细胞的有用的信号肽从酿酒酵母alpha-因子(alpha-factor)和酿酒酵母转化酶(invertase)的基因中得到。其他有用的信号肽编码区通过Romanos等,1992,见前文描述。
所述控制序列也可为前肽编码区,其编码位于变体糖苷水解酶的氨基末端的氨基酸序列。得到的多肽被称为前酶(proenzyme)或前多肽(propolypeptide)(或有些情况下称为酶原(zymogen))。前多肽通常是无活性的,并可通过将所述多肽从前多肽上催化的或自催化的(autocatalytic)切割转化为成熟的活性多肽。所述多肽编码区可从酿酒酵母alpha-因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(laccase)(WO 95/33836)的基因中得到。
信号肽区和前肽区出现在多肽的氨基末端,所述前肽区紧接着位于多肽的氨基末端,而所述信号肽区紧接着位于前肽区的氨基末端。
也需要添加调控序列,其允许相对于所述宿主细胞的生长调控所述变体糖苷水解酶的表达。调控系统的实例是那些响应化学的或物理的刺激物(stimulus),包括调控化合物的存在,使所述基因的表达开启或关闭的调控系统。在酵母中,可采用ADH2系统或GAL1系统。在丝状真菌中,TAKA alpha-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子可用作调控序列。调控序列的其他实例是那些允许基因扩增的调控序列。在真核系统中,这些调控系统包括二氢叶酸还原酶(dihydrofolate reductase)基因,其在甲氨喋呤(methotrexate)存在的条件下被扩增,和金属硫蛋白(metallothionein)基因,其以重金属扩增。在这些情况中,编码所述变体糖苷水解酶的核苷酸序列与所述调控序列可操作地连接。
表达载体
本发明也涉及重组表达载体,其包括编码本发明的变体糖苷水解酶的核苷酸序列、启动子、转录和翻译终止信号。可将上述的多种核苷酸和控制序列结合在一起以产生重组表达载体,所述重组表达载体可包括一个或多个方便的限制酶切位点,以允许在这些位点上插入或取代编码所述变体的核苷酸序列。可替换地,所述的核苷酸序列可以通过将所述核酸序列或包含所述序列的核酸构建体插入适于表达的载体中进行表达。在创建所述表达载体的过程中,所述编码序列位于所述载体中,这样一来,所述的编码序列与适于表达的控制序列可操作地连接。
所述的重组表达载体可为任意载体(例如,质粒或病毒),其可以方便地经过重组DNA步骤,并可使所述核苷酸序列表达。所述载体的选择通常依赖于所述载体与被导入所述载体的宿主细胞的相容性(compatibility)。所述载体可为线状的质粒或闭合环状的质粒。
本发明的载体优选包含一个或多个可选择的标记,其允许容易地选择转化的细胞。可选择的标记为基因,该基因的产物可提供杀生物剂(biocide)或病毒抗性(viral resistance)、抗重金属(resistance to heavy metals)、营养缺陷型的原营养(prototrophy to auxotrophs)等。酵母宿主细胞的合适的标记为ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。在丝状真菌宿主细胞中应用的可选择的标记包括,但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶(ornithine carbamoyltransferase))、bar(膦丝菌素乙酰基转移酶(phosphinothricin acetyltransferase))、hph(潮霉素磷酸转移酶(hygromycinphosphotransferase))、niaD(硝酸盐还原酶(nitrate reductase))、pyrG(乳清酸核苷-5’-磷酸脱羧酶(orotidine-5′-phosphate decarboxylase))、sC(硫酸腺苷酰基转移酶(sulfate adenyltransferase))、trpC(邻氨基苯甲酸盐合成酶),以及其等同物。优选用于曲霉属细胞的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
所述载体可为自发复制的(autonomously replicating)载体,即作为染色体外的实体存在的载体,它的复制不同于染色体的复制,例如,质粒、染色体外的元件(element)、极微染色体(minichromosome)或人造染色体。所述载体可包含确保自我复制(self-replication)的任何方法(means)。可替换地,当所述载被导入宿主细胞时它被整合入基因组,并与被整合入所述载体的染色体一起复制。此外,可以采用单一的载体或质粒或共同含有待导入宿主细胞的基因组的总DNA的两种或多种载体或质粒,或转座子(transposon)。
本发明的载体优选含有元件,所述元件允许将所述载体整合到宿主细胞的基因组,或所述载体在所述细胞中不依赖于基因组地自发复制。
为了整合入所述宿主细胞基因组,所述载体可依赖于编码所述变体的核苷酸序列,或通过同源的或非同源的重组将所述载体整合入基因组中的任何其他元件。可替换地,所述的载体可包含附加的核酸序列,用于指导通过同源重组整合入宿主细胞的基因组。所述附加的核酸序列使所述载体在染色体的准确位置整合入宿主细胞基因组。为了提高在准确位置进行整合的可能性,所述的整合元件应优选含有足够数目的核酸,如100至10,000个碱基对,优选400至10,000个碱基对,并最优选800至10,000个碱基对,所述的核酸与对应的靶序列高度同源,以增强同源重组的可能性。所述的整合元件可为与所述宿主细胞的基因组中的靶序列同源的任何序列。此外,所述的整合元件可为非-编码的或编码的核酸序列。另一方面,所述载体可通过非-同源重组整合入所述宿主细胞的基因组中。
为了自发复制,所述载体可进一步包含复制起点(origin of replication),它能够使所述载体在所述的宿主细胞中自发的复制。在酵母宿主细胞中应用的复制起点的实例为2微米(micro)复制起点,ARS1、ARS4、ARS1和CEN3的组合、及ARS4和CEN6的组合。所述的复制起点可为具有突变的复制起点,所述突变使其在所述宿主细胞中具有温度-敏感性的功能(参见,例如,Ehrlich,1978,Proceedings of the National Academy of Sciences USA 75:1433)。在丝状真菌细胞中应用的质粒复制子的实例为AMA1和ANS1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO00/24883)。分离AMA1基因和构建含有该基因的质粒或载体,可以根据在WO 00/24883中公开的方法实施。
可将超过一个拷贝的本发明的核苷酸序列插入所述宿主细胞,以增加糖苷水解酶变体的产生。通过将所述序列的至少一个附加的拷贝整合入宿主细胞基因组,或者通过将可扩增的可选择标记基因包含于所述的核酸序列中,其中细胞含有所述可选择标记基因的扩增的拷贝,所述核酸序列的拷贝数可以得到增加,并由此所述核酸序列的附加拷贝可以通过在适当的选择性试剂存在的条件下培养所述细胞来选择。
用于连接上述元件以构建本发明的重组表达载体的步骤,是本领域的技术人员所熟知的(参见,例如,Sambrook等,1989,见前文)以得到基本上纯的糖苷水解酶变体。
宿主细胞
本发明也涉及包含编码变体糖苷水解酶的核苷酸序列的重组宿主细胞,其方便地应用于重组产生所述变体。将包含本发明的核苷酸序列的载体导入宿主细胞,所以所述载体作为染色体的组成部分,或作为如较早所述的自我-复制的染色体外的载体保持,。术语“宿主细胞”包括任何亲代细胞的后代,其由于复制过程中发生的突变而与亲代细胞不相同。宿主细胞的选择在很大程度上依赖于编码所述变体的基因及其来源。
所述宿主细胞可为任何真核细胞,例如哺乳动物、昆虫、植物或真菌细胞。
所述的宿主细胞可为任何真菌细胞。如在本文中应用的“真菌”包括子囊菌门(phyla Ascomycota),担子菌门(Basidiomycota),壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等在Ainsworth and Bisby′sDictionary of The Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK中所定义的),以及卵菌门(Oomycota)(如在Hawksworth等,1995,见前文,171页所引用的)和所有有丝分裂孢子的真菌(Hawksworth等,1995,见前文)。
在优选的实施方案中,所述真菌宿主细胞是酵母细胞。如在本文中应用的“酵母”包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在将来可变化,为了本发明的目的,将酵母定义为如在Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.和Davenport,R.R.,eds,Soc.App.Bacteriol.Smposium Series No.9,1980)中所描述的。
在更优选的实施方案中,所述的酵母宿主细胞是念珠菌属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、糖酵母属、裂殖酵母属或西洋蓍霉细胞。
在最优选的实施方案中,所述酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、Saccharomyces douglasii、克鲁弗酵母、诺地酵母或Saccharomycesoviformis细胞。在另一个最优选的实施方案中,所述的酵母宿主细胞是乳酸克鲁维酵母细胞。在另一个最优选的实施方案中,所述的酵母宿主细胞是Yarrowia lipolytica细胞。
在另一个优选的实施方案中,所述的真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括所有丝状形式的真菌和卵菌亚门(如由Hawksworth等,1995,见前文,所定义的)。所述的丝状真菌通常以由甲壳质(chitin)、纤维素、葡聚糖(glucan)、脱乙酰壳多糖(chitosan)、甘露聚糖(mannan)和其他复合多糖类(complex polysaccharides)组成的菌丝体壁(mycelial wall)为特征。通过菌丝延长(hyphal elongation)进行营养生长(vegetative growth),而碳分解代谢(carboncatabolism)是专性需氧的(obligately aerobic)。与此相反,酵母,诸如酿酒酵母的营养生长则是通过单细胞菌体的出芽生殖(budding)进行的,而碳分解代谢是可为发酵的(fermentative)。
在更优选的实施方案中,所述的丝状真菌宿主细胞是,但不限于,枝顶孢霉属、曲霉属、镰孢属、腐质霉属、毛霉属、毁丝霉属、脉孢菌属、青霉属、Thielavia、Tolypocladium或木霉属细胞。
在一个最优选的实施方案中,所述的丝状真菌宿主细胞是泡盛曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个最优选的实施方案中,所述的丝状真菌宿主细胞是杆孢状镰孢、Fusarium cerealis、Fusariumcrookwellense、大刀镰孢、禾本科镰孢、Fusarium graminum、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、Fusarium sulohureum、Fusarium torulosum、Fusarium trichothecioides或Fusarium venenatum细胞。在一个甚至最优选的实施方案中,所述的丝状真菌宿主细胞是Fusarium venenatum(Nirenberg sp.nov.)细胞。在另一个最优选的实施方案中,所述的丝状真菌宿主细胞是Humicola insolens、Humicolalanuginosa、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、土生梭孢霉(Thielavia terrestris)、Trichoderma harzianum、康宁木霉、Trichodermalongibrachiatum、Trichoderma reesei或绿色木霉细胞。在另一个甚至最优选的实施方案中,所述的丝状真菌宿主细胞是Trichoderma reesei RutC30。
可根据在此描述的步骤转化真菌细胞。
产生方法
本发明也涉及产生糖苷水解酶变体的方法,其包括:
(a)在适于表达所述变体的条件下培养宿主细胞,其中所述宿主细胞包含核苷酸序列,其已被修饰以编码变体,该变体如本文所述在对应于SEQ IDNO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置包含取代,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代;和
(b)从所述培养基中回收所述的变体。
在本发明的产生方法中,所述宿主细胞在适于产生所述糖苷水解酶变体的营养培养基中,用本技术领域公知的方法进行培养。例如,所述细胞可通过摇瓶培养、小-规模或大-规模发酵(包括连续的、批式的、补料分批的或固态的发酵),在实验室或工业发酵罐中,在合适的培养基中和在允许所述多肽表达和/或分离的条件下进行培养。所述的培养采用本技术领域公知的方法,在合适的包含碳源、氮源和无机盐的营养培养基中发生。合适的培养基可从商业供应者得到,或根据发表的组合物(例如,在美国典型培养物保藏中心(American Type Culture Collection)的目录中)进行制备。如果所述多肽分泌到所述营养培养基中,所述多肽可直接从该培养基中回收,如果所述多肽不分泌,那么它可以从细胞裂解物(cell lysate)中回收。
在一个替换的实施方案中,不回收所述的糖苷水解酶变体,但更可将表达变体的本发明的宿主细胞用作所述变体的来源。
所述的变体糖苷水解酶可采用本技术领域公知的、对所述多肽具有特异性的方法进行检测。这些检测方法可包括应用特异性抗体、酶产物形成或酶底物消失。例如,酶分析可用于测定所述多肽的活性,如本文在实施例中所描述的。
得到的糖苷水解酶变体可以通过本技术领域公知的方法进行回收。例如,所述多肽可以通过常规的方法从营养培养基中回收,所述常规方法包括,但不限于,收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀。
本发明的糖苷水解酶变体可通过本技术领域公知的各种方法进行纯化,所述方法包括,但不限于色谱法(例如,离子交换、亲和、疏水、色谱焦聚和大小排阻)、电泳的方法(例如,制备等电聚焦(preparative isoelectric focusing))、溶解性差异(例如,硫酸铵沉淀)、SDS-PAGE或提取(extraction)(参见,例如,Protein Purification,J.-C.Janson和Lars Ryden,editors,VCH Publishers,NewYork,1989)以得到基本上纯的糖苷水解酶变体。
具有糖苷水解酶活性的其他多肽
本发明也涉及具有糖苷水解酶活性的分离的多肽,其中所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同。
在优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2的氨基酸1至513相差优选33个氨基酸,更优选32个氨基酸,还更优选31个氨基酸,还更优选30个氨基酸,还更优选29个氨基酸,还更优选28个氨基酸,还更优选27个氨基酸,还更优选26个氨基酸,还更优选25个氨基酸,还更优选24个氨基酸,还更优选23个氨基酸,还更优选22个氨基酸,还更优选21个氨基酸,还更优选20个氨基酸,还更优选19个氨基酸,还更优选18个氨基酸,还更优选17个氨基酸,还更优选16个氨基酸,还更优选15个氨基酸,还更优选14个氨基酸,还更优选13个氨基酸,还更优选12个氨基酸,还更优选11个氨基酸,还更优选10个氨基酸,还更优选9个氨基酸,还更优选8个氨基酸,还更优选7个氨基酸,还更优选6个氨基酸,还更优选5个氨基酸,还更优选4个氨基酸,还更优选3个氨基酸,还更优选2个氨基酸,并最优选1个氨基酸。
在优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ ID NO:2。在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的两个或更多位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ ID NO:2。在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的三个或更多位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ ID NO:2。在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的四个或更多位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ ID NO:2。在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的五个或更多位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ ID NO:2。在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的六个或更多位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ ID NO:2。在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的七个或更多位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ ID NO:2。在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的八个或更多位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ ID NO:2。在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的九个或更多位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ ID NO:2。在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的十个或更多位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ ID NO:2。在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的十一个或更多位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ ID NO:2。在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的十二个或更多位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ ID NO:2。在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的十三个或更多位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ ID NO:2。在另一个优选的实施方案中,所述多肽的氨基酸序列在至少对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的位置不同于SEQ ID NO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置不同于SEQ IDNO:2。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置21的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21的位置与SEQ ID NO:2相差Pro。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置94的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置94的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置94的位置与SEQ ID NO:2相差Ser。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G94S。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置94的位置与SEQ ID NO:2相差Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G94A。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置94的位置与SEQ ID NO:2相差Arg。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ IDNO:2的氨基酸1至513的G94R。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置94的位置与SEQ ID NO:2相差Gln。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G94Q。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置157的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置157的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置157的位置与SEQ ID NO:2相差Arg。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的K157R。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置205的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置205的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置205的位置与SEQ ID NO:2相差Arg。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G205R。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置206的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置206的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置206的位置与SEQ ID NO:2相差Tyr。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的H206Y。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置247的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置247的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置247的位置与SEQ ID NO:2相差Cys。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的Y247C。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置337的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置337的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置337的位置与SEQ ID NO:2相差Val。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的E337V。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置350的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置350的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置350的位置与SEQ ID NO:2相差Ser。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T350S。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置373的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置373的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置373的位置与SEQ ID NO:2相差His。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的N373H。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置383的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置383的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置383的位置与SEQ ID NO:2相差Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T383A。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置438的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置438的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置438的位置与SEQ ID NO:2相差Leu。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的P438L。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置455的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置455的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置455的位置与SEQ ID NO:2相差Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T455A。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置467的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置467的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置467的位置与SEQ ID NO:2相差Ser。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G467S。
在另一个优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置486的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置486的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Irp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置486的位置与SEQ ID NO:2相差Trp。在另一个最优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的C486W。
在优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置8的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8的位置与SEQ ID NO:2相差Pro。在最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S8P。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置22的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置22的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置22的位置与SEQID NO:2相差Asp。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G22D。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置41的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41的位置与SEQID NO:2相差Ile。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T41I。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置49的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49的位置与SEQID NO:2相差Ser。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的N49S。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置57的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Iys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57的位置与SEQID NO:2相差Asn。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S57N。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置113的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113的位置与SEQ ID NO:2相差Asn。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置193的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置193的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置193的位置与SEQ ID NO:2相差Lys。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的E193K。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置196的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196的位置与SEQ ID NO:2相差Pro。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S 196P。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196的位置与SEQ ID NO:2相差Thr。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S196T。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196的位置与SEQ ID NO:2相差Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S196F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置226的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置226的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置226的位置与SEQ ID NO:2相差Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T226A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置227的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227的位置与SEQ ID NO:2相差Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的P227A。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227的位置与SEQ ID NO:2相差Leu。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的P227L。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227的位置与SEQ ID NO:2相差Gly。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的P227G。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置246的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置246的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置246的位置与SEQ ID NO:2相差Ile。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T246I。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置251的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置251的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置251的位置与SEQ ID NO:2相差Lys。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的R251K。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置255的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置255的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置255的位置与SEQ ID NO:2相差Pro。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T255P。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置259的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置259的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置259的位置与SEQ ID NO:2相差Asn。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的D259N。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置301的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置301的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置301的位置与SEQ ID NO:2相差Ser。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的N301S。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置356的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置356的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置356的位置与SEQ ID NO:2相差Ile。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T356I。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置371的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置371的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置371的位置与SEQ ID NO:2相差Cys。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的Y371C。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置411的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置411的位置与SEQ ID NO:2相差Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置462的位置不同于SEQ ID NO:2。在另一个更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在另一个还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置462的位置与SEQ ID NO:2相差Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227和259的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置227和259的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227和259的位置与SEQ ID NO:2相差Gly(或Ala或Leu)和Asn。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的P227G (或P227A或P227L)+D259N。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227和486的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置227和486的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227和486的位置与SEQ ID NO:2相差Ala(或Leu或Gly)和Trp。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的P227A(或P227L或P227G)+C486W。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置301和337的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置301和337的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置301和337的位置与SEQ ID NO:2相差Ser和Val。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的N301S+E337V。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196和350的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置196和350的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196和350的位置与SEQ ID NO:2相差Pro(或Thr或Phe)和Ser。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S196P(或S196T或S196F)+T350S。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置22和467的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置22和467的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置22和467的位置与SEQID NO:2相差Asp和Ser。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G22D+G467S。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21和57的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21和57的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21和57的位置与SEQID NO:2相差Pro和Asn。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P+S57N。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置205和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置205和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置205和411的位置与SEQ ID NO:2相差Arg和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G205R+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置205和227的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置205和227的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置205和227的位置与SEQ ID NO:2相差Arg和Ala(或Leu或Gly)。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G205R+P227A(或P227L或P227G)。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置205和206的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置205和206的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置205和206的位置与SEQ ID NO:2相差Arg和Tyr。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G205R+H206Y。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8和205的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8和205的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8和205的位置与SEQID NO:2相差Pro和Arg。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S8P+G205R。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置94和205的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置94和205的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置94和205的位置与SEQID NO:2相差Ser(或Ala或Arg或Gln)和Arg。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G94S(或G94A或G94R或G94Q)+G205R。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196和205的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置196和205的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196和205的位置与SEQ ID NO:2相差Pro(或Thr或Phe)和Arg。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S196P(或S 196T或S 196F)+G205R。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置383和455的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置383和455的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置383和455的位置与SEQ ID NO:2相差Ala和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T383A+T455A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置113和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113和411的位置与SEQ ID NO:2相差Asn和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113和196的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置113和196的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113和196的位置与SEQ ID NO:2相差Asn和Thr(或Pro或Phe)。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+S196T(或S196P或S196F)。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113和462的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置113和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113和462的位置与SEQ ID NO:2相差Asn和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S 113N+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196和462的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置196和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196和462的位置与SEQ ID NO:2相差Thr(或Pro或Phe)和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S196T(或S196P或S196F)+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196和462的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置41和196的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41和196的位置与SEQ ID NO:2相差Ile和Phe(或Pro或Thr)。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T41I+S196F(或S196P或S196T)。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置94和226的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置94和226的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置94和226的位置与SEQID NO:2相差Ala(或Ser或Arg或Gln)和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G94A(或G94S或G94R或G94Q)+T226A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和462的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置113、196和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和462的位置与SEQ ID NO:2相差Asn、Thr(或Pro或Phe)和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+S196T(或S196P或S196F)+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157和205的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置157和205的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157和205的位置与SEQ ID NO:2相差Arg和Arg。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的K157R+G205R。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157和255的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置157和255的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157和255的位置与SEQ ID NO:2相差Arg和Pro。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的K157R+T255P。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置205和255的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置205和255的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置205和255的位置与SEQ ID NO:2相差Arg和Pro。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G205R+T255P。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157、205和255的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置157、205和255的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157、205和255的位置与SEQ ID NO:2相差Arg、Arg和Pro。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的K157R+G205R+T255P。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41和193的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41和193的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41和193的位置与SEQID NO:2相差Ile和Lys。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T41I+E193K。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41和411的位置与SEQID NO:2相差Ile和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T41I+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置193和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置193和411的位置与SEQ IDNO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置193和411的位置与SEQ ID NO:2相差Lys和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的E193K+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41、193和411的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置41、193和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41、193和411的位置与SEQ ID NO:2相差Ile、Lys和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T41I+E193K+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置247和371的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置247和371的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置247和371的位置与SEQ ID NO:2相差Cys和Cys。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的Y247C+Y371C。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置247和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置247和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置247和411的位置与SEQ ID NO:2相差Cys和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的Y247C+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置371和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置371和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置371和411的位置与SEQ ID NO:2相差Cys和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的Y371C+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置247、371和411的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置247、371和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置247、371和411的位置与SEQ ID NO:2相差Cys、Cys和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的Y247C+Y371C+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113和227的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置113和227的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113和227的位置与SEQ ID NO:2相差Asn和Ala(或Leu或Gly)。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+P227A(或P227L或P227G)。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196和227的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置196和227的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196和227的位置与SEQ ID NO:2相差Thr(或Pro或Phe)和Ala(或Leu或Gly)。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQID NO:2的氨基酸1至513的S196T(或S196P或S196F)+P227A(或P227L或P227G)。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227和462的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置227和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227和462的位置与SEQ ID NO:2相差Ala(或Leu或Gly)和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的P227A(或P227L或P227G)+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和227的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置113、196和227的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和227的位置与SEQ ID NO:2相差Asn、Thr(或Pro或Phe)和Ala(或Leu或Gly)。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+S196T(或S196P或S196F)+P227A(或P227L或P227G)。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和462的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置113、227和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和462的位置与SEQ ID NO:2相差Asn、Ala(或Leu或Gly)和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S 113N+P227A(或P227L或P227G)+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和462的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置196、227和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和462的位置与SEQ ID NO:2相差Thr(或Pro或Phe)、Ala(或Leu或Gly)和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S196T(或S196P或S196F)+P227A(或P227L或P227G)+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和462的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置113、196和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和462的位置与SEQ ID NO:2相差Asn、Thr(或Pro或Phe)和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+S196T(或S196P或S196F)+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和462的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和462的位置与SEQ ID NO:2相差Asn、Thr(或Pro或Phe)、Ala(或Leu或Gly)和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+S196T(或S196P或S196F)+P227A(或P227L或P227G)+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49和113的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49和113的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49和113的位置与SEQID NO:2相差Ser和Asn。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的N49S+S113N。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49和227的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49和227的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49和227的位置与SEQID NO:2相差Ser和Ala(或Leu或Gly)。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的N49S+P227A(或P227L或P227G)。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49和438的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49和438的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49和438的位置与SEQID NO:2相差Ser和Leu。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的N49S+P438L。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113和438的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置113和438的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113和438的位置与SEQ ID NO:2相差Asn和Leu。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+P438L。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227和438的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置227和438的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227和438的位置与SEQ ID NO:2相差Ala(或Leu或Gly)和Leu。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的P227A(或P227L或P227G)+P438L。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49、113和227的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置49、113和227的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49、113和227的位置与SEQ ID NO:2相差Ser、Asn和Ala(或Leu或Gly)。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的N49S+S113N+P227A(或P227L或P227G)。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49、227和438的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置49、227和438的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49、227和438的位置与SEQ ID NO:2相差Ser、Ala(或Leu或Gly)和Leu。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的N49S+P227A(或P227L或P227G)+P438L。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和438的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置113、227和438的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和438的位置与SEQ ID NO:2相差Asn、Ala(或Leu或Gly)和Leu。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+P227A(或P227L或P227G)+P438L。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49、113和438的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置49、113和438的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49、113和438的位置与SEQ ID NO:2相差Ser、Asn和Leu。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的N49S+S113N+P438L。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49、113、227和438的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49、113、227和438的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49、113、227和438的位置与SEQ ID NO:2相差Ser、Asn、Ala(或Leu或Gly)和Leu。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的N49S,S113N+P227A(或P227L或P227G)+P438L。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置157和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157和411的位置与SEQ ID NO:2相差Arg和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的K157R+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置205和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置205和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置205和411的位置与SEQ ID NO:2相差Arg和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G205R+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置255和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置255和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置255和411的位置与SEQ ID NO:2相差Pro和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T255P+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157、255和411的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置157、255和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157、255和411的位置与SEQ ID NO:2相差Arg、Pro和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的K157R+T255P+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置205、255和411的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置205、255和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置205、255和411的位置与SEQ ID NO:2相差Arg、Pro和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G205R+T255P+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157、205和411的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置157、205和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157、205和411的位置与SEQ ID NO:2相差Arg、Arg和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的G205R+G205R+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157、205、255和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157、205、255和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置157、205、255和411的位置与SEQ ID NO:2相差Arg、Arg、Pro和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQID NO:2相差SEQ ID NO:2的氨基酸1至513的K157R,G205R+T255P+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置196和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196和411的位置与SEQ ID NO:2相差Thr(或Pro或Phe)和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S196T(或S196P或S196F)+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置227和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227和411的位置与SEQ ID NO:2相差Ala(或Leu或Gly)和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的P227A(或P227L或P227G)+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和411的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置113、227和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和411的位置与SEQ ID NO:2相差Asn、Ala(或Leu或Gly)和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+P227A(或P227L或P227G)+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和411的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置196、227和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和411的位置与SEQ ID NO:2相差Thr(或Pro或Phe)、Ala(或Leu或Gly)和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S196T(或S196P或S196F)+P227A(或P227L或P227G)+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和411的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置113、196和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和411的位置与SEQ ID NO:2相差Asn、Thr(或Pro或Phe)和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+S196T(或S196P或S196F)+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和411的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和411的位置与SEQ ID NO:2相差Asn、Thr(或Pro或Phe)、Ala(或Leu或Gly)和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+S196T(或S196P或S196F)+P227A(或P227L或P227G)+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113和356的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置113和356的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113和356的位置与SEQ ID NO:2相差Asn和Ile。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+T356I。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196和356的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置196和356的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196和356的位置与SEQ ID NO:2相差Thr(或Pro或Phe)和Ile。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S196T(或S196P或S196F)+T356I。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227和356的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置227和356的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227和356的位置与SEQ ID NO:2相差Ala(或Leu或Gly)和Ile。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的P227A(或P227L或P227G)+T356I。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置356和462的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置356和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置356和462的位置与SEQ ID NO:2相差Ile和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T356I+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和356的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置113、227和356的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、227和356的位置与SEQ ID NO:2相差Asn、Ala(或Leu或Gly)和Ile。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S 113N+P227A(或P227L或P227G)+T356I。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和356的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置196、227和356的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和356的位置与SEQ ID NO:2相差Thr(或Pro或Phe)、Ala(或Leu或Gly)和Ile。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S196T(或S196P或S196F)+P227A(或P227L或P227G)+T356I。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和462的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置196、227和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196、227和462的位置与SEQ ID NO:2相差Thr(或Pro或Phe)、Ala(或Leu或Gly)和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S196T(或S196P或S196F)+P227A(或P227L或P227G)+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196、356和462的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置196、356和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196、356和462的位置与SEQ ID NO:2相差Thr(或Pro或Phe)、Ile和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S196T(或S196P或S196F)+T356I+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和356的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置113、196和356的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和356的位置与SEQ ID NO:2相差Asn、Thr (或Pro或Phe)和Ile。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+S196T(或S 196P或S196F)+T356I。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227、356和462的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置227、356和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227、356和462的位置与SEQ ID NO:2相差Ala(或Leu或Gly)、Ile和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的P227A(或P227L或P227G)+T356I+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和356的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和356的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和356的位置与SEQ ID NO:2相差Asn、Thr(或Pro或Phe)、Ala(或Leu或Gly)和Ile。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+S196T(或S196P或S196F)+P227A(或P227L或P227G)+T356I。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、227、356和462的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、227、356和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、227、356和462的位置与SEQ ID NO:2相差Asn、Ala(或Leu或Gly)、Ile和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+P227A(或P227L或P227G)+T356I+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、356和462的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、356和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、356和462的位置与SEQ ID NO:2相差Asn、Thr(或Pro或Phe)、Ile和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S113N+S196T(或S196P或S196F)+T356I+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196、227、356和462的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196、227、356和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196、227、356和462的位置与SEQ ID NO:2相差Thr(或Pro或Phe)、Ala(或Leu或Gly)、Ile和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S196T(或S196P或S196F)+P227A(或P227L或P227G)+T356I+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227、356和462的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227、356和462的位置与SEQ ID NO:2相差Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227、356和462的位置与SEQ ID NO:2相差Asn、Thr(或Pro或Phe)、Ala(或Leu或Gly)、Ile和Ala。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ IDNO:2的氨基酸1至513的S113N+S 196T(或S 196P或S196F)+P227A(或P227L或P227G)+T356I+T462A。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21和246的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21和246的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21和246的位置与SEQID NO:2相差Pro和Ile。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P+T246I。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21和251的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21和251的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21和251的位置与SEQID NO:2相差Pro和Lys。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P+R251K。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21和411的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21和411的位置与SEQID NO:2相差Pro和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57和246的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57和246的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57和246的位置与SEQID NO:2相差Asn和Ile。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S57N+T246I。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57和251的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57和251的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57和251的位置与SEQID NO:2相差Asn和Lys。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S57N+R251K。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57和411的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57和411的位置与SEQID NO:2相差Asn和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S57N+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置246和251的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置246和251的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置246和251的位置与SEQ ID NO:2相差Ile和Lys。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T246I+R251K。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置246和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置246和411的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置246和411的位置与SEQ ID NO:2相差Ile和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T246I+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置251和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置251和411的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置251和411的位置与SEQ ID NO:2相差Lys和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的R251K+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57和246的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置21、57和246的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57和246的位置与SEQ ID NO:2相差Pro、Asn和Ile。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P+S57N+T246I。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、246和251的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置21、246和251的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、246和251的位置与SEQ ID NO:2相差Pro、Ile和Lys。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P+T246I+R251K。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、246和411的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置21、246和411的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、246和411的位置与SEQ ID NO:2相差Pro、Ile和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P+T246I+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57、246和251的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置57、246和251的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57、246和251的位置与SEQ ID NO:2相差Asn、Ile和Lys。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S57N+T246I+R251K。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57、246和411的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置57、246和411的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57、246和411的位置与SEQ ID NO:2相差Asn、Ile和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S57N+T246I+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57、251和411的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置57、251和411的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57、251和411的位置与SEQ ID NO:2相差Asn、Lys和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S57N+R251K+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57和251的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ IDNO:2的氨基酸1至513的位置21、57和251的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57和251的位置与SEQ ID NO:2相差Pro、Asn和Lys。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P+S57N+R251K。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置246、251和411的位置不同于SEQ IDNO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQID NO:2的氨基酸1至513的位置246、251和411的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置246、251和411的位置与SEQ ID NO:2相差Ile、Lys和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的T246I+R251K+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246和251的位置不同于SEQID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246和251的位置与SEQ IDNO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246和251的位置与SEQ ID NO:2相差Pro、Asn、Ile和Lys。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P+S57N+T246I+R251K。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、246、251和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、246、251和411的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、246、251和411的位置与SEQ ID NO:2相差Pro、Ile、Lys和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P+T246I+R251K+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、251和411的位置不同于SEQID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、251和411的位置与SEQ IDNO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、251和411的位置与SEQ ID NO:2相差Pro、Asn、Lys和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P+S57N+R251K+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57、246、251和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57、246、251和411的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57、246、251和411的位置与SEQ ID NO:2相差Asn、Ile、Lys和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQID NO:2相差SEQ ID NO:2的氨基酸1至513的S57N+T246I+R251K+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246和411的位置不同于SEQID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246和411的位置与SEQ IDNO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246和411的位置与SEQ ID NO:2相差Pro、Asn、Ile和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P+S57N+T246I+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246、251和411的位置不同于SEQ ID NO:2。在更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246、251和411的位置与SEQ ID NO:2相差Ala、Arg、Pro、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val。在还更优选的实施方案中,所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246、251和411的位置与SEQ ID NO:2相差Pro、Asn、Ile、Lys和Phe。在另一个最优选的实施方案中,所述多肽的氨基酸序列进一步与SEQ ID NO:2相差SEQ ID NO:2的氨基酸1至513的S21P+S57N+T246I+R251K+S411F。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少一个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少两个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少三个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少四个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少五个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少六个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少七个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少八个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少九个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少十个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少十一个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少十二个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少十三个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少十四个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少十五个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少十六个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少十七个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少十八个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少十九个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少二十个选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在另一个优选的实施方案中,所述多肽的氨基酸序列与SEQ ID NO:2相差至少由SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W组成的差异,并任选地进一步相差一个或多个选自S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的差异。
在优选的实施方案中,所述多肽由341至350、351至360、361至370、371至380、381至390、391至400、401至410、411至420、421至430、431至440、441至450、451至460、461至470、471至480、481至490、491至500或501至513个氨基酸组成。
所述分离的多肽与多肽SEQ ID NO:2相比具有一种或多种改进的性质,其中所述改进的性质选自如本文所述的热活性、热稳定性、pH活性、pH稳定性、底物特异性、产物特异性和化学稳定性。
本发明也涉及编码上述多肽的分离的核苷酸序列、包含该核苷酸序列的核酸构建体、表达载体和宿主细胞,和产生具有糖苷水解酶活性的多肽的方法,根据本文对于糖苷水解酶变体的相同的公开。
纤维二糖水解酶I和其核苷酸序列
本发明也涉及具有纤维二糖水解酶I活性的分离的多肽并涉及编码所述多肽的分离的核苷酸序列。
在优选的实施方案中,所述具有纤维二糖水解酶I活性的分离的多肽包含SEQ ID NO:2的氨基酸序列或其等位基因变体;或其具有纤维二糖水解酶I活性的片段。在更优选的实施方案中,本发明的多肽包含SEQ ID NO:2的氨基酸序列。在另一个优选的实施方案中,本发明的多肽包含SEQ ID NO:2的氨基酸1至513,或其等位基因变体;或其具有纤维二糖水解酶I活性的片段。在另一个优选的实施方案中,本发明的多肽包含SEQ ID NO:2的氨基酸1至513。在另一个优选的实施方案中,本发明的多肽由SEQ ID NO:2的氨基酸序列或其等位基因变体;或其具有纤维二糖水解酶I活性的片段组成。在另一个优选的实施方案中,本发明的多肽由SEQ ID NO:2的氨基酸序列组成。在另一个优选的实施方案中,所述多肽由SEQ ID NO:2的氨基酸1至513或其等位基因变体;或具有纤维二糖水解酶I活性的片段组成。在另一个优选的实施方案中,所述多肽由SEQ ID NO:2的氨基酸1至513组成。
在另一个优选的实施方案中,所述核苷酸序列列于SEQ ID NO:1。在另一个更优选的实施方案中,所述核酸序列是质粒pAJO52中包含的序列,所述质粒pAJO52包含于大肠杆菌NRRL B-30683。在另一个优选的实施方案中,所述核苷酸序列是SEQ ID NO:1的成熟多肽编码区。在另一个更优选的实施方案中,所述核苷酸序列是质粒pAJO52中包含的成熟多肽编码区,所述质粒pAJO52包含于大肠杆菌NRRL B-30683。本发明也包括核苷酸序列,其编码具有SEQ ID NO:2的氨基酸序列的多肽,或其成熟多肽,其由于遗传密码的简并性不同于SEQ ID NO:1。本发明也涉及SEQ ID NO:1的子序列,其编码具有纤维二糖水解酶I活性的SEQ ID NO:2的片段。
SEQ ID NO:2的片段是多肽,其具有一个或多个由此氨基酸序列的氨基和/或羧基末端缺失的氨基酸。优选地,片段包含至少450个氨基酸残基,更优选至少470个氨基酸残基,和最优选至少490个氨基酸残基。
SEQ ID NO:1的子序列是由SEQ ID NO:1包括的核酸序列,除了已经从所述的5′和/或3′末端缺失一个或多个核苷酸。优选地,子序列包含至少1350个核苷酸,更优选至少1410个核苷酸,和最优选至少1470个核苷酸。
本发明也涉及突变体核酸序列,其在SEQ ID NO:1的成熟多肽编码序列中包括至少一个突变,其中所述的突变体核酸序列编码多肽,所述多肽由SEQID NO:2的氨基酸1至513组成。
本发明也涉及包含所述核苷酸序列的核酸构建体、表达载体和宿主细胞,所述核苷酸序列编码具有纤维二糖水解酶活性的多肽,所述多肽包含SEQ IDNO:2的氨基酸1至513。可如本文所述构建核酸构建体、表达载体和宿主细胞。
本发明进一步涉及产生具有纤维二糖水解酶活性的多肽的方法,其包括:(a)培养菌株以产生所述的多肽,该菌株以其野生型形式能产生所述多肽;和(b)根据本文所述的方法回收所述的多肽。优选地,所述菌株为木霉属的菌株,并更优选Trichoderma reesei。
本发明也涉及产生本发明的多肽的方法,其包括(a)在有助于产生所述多肽的条件下,培养包含编码所述多肽的核苷酸序列的宿主细胞;和(b)根据本文所述的方法回收所述的多肽。
将生物质降解为单糖、二糖和多糖
本发明的糖苷水解酶变体、具有糖苷水解酶活性的多肽和宿主细胞,可以用于由生物质(biomass)产生单糖、二糖和多糖作为化学原料或发酵原料以产生乙醇、塑料或其他产品或中间体。所述的糖苷变体和具有糖苷水解酶活性的多肽可为去除细胞或者不去除细胞的粗发酵液的形式,或为半-纯化或纯化的酶制剂的形式。可替换地,本发明宿主细胞在生物质的发酵过程中可用作所述变体或具有糖苷水解酶活性的多肽的来源。
生物质可以包括,但不限于,木材资源(wood resource)、城市固体废物、废纸和作物残余物(参见,例如,Wiselogel等,1995,在Handbook on Bioethanol(Charles E.Wyman,editor),pp.105-118,Taylor & Francis,Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd,1990,AppliedBiochemistry and Biotechnology 24/25:695-719;Mosier等,1999,RecentProgress in Bioconversion of Lignocellulosics,Advances in BiochemicalEngineering/Biotechnology,T.Scheper,managing editor,Volume 65,pp.23-40,Springer-Verlag,New York)。
生物质的初生细胞壁(primary cell wall)中最主要的多糖是纤维素,第二丰富的是半-纤维素(hemi-cellulose),第三是果胶(pectin)。细胞停止生长后产生的次生细胞壁(secondary cell wall)也含有多糖,并通过与半纤维素共价交联的聚合的木质素来增强。纤维素是脱水纤维二糖(anhydrocellobiose)的均聚物(homopolymer),因而成为线状的beta-(1-4)-D-葡聚糖,而半纤维素包括各种化合物,诸如具有一系列(spectrum)取代基的复合分支结构的木聚糖(xylan)、木葡聚糖(xyloglucan)、阿拉伯木聚糖(arabinoxylan)和甘露聚糖(mannan)。虽然纤维素通常是多态的(polymorphous),但发现纤维素在植物组织中主要作为平行葡聚糖链(parallel glucan chain)的不可溶的结晶母体(crystalline matrix)。半纤维素通常与纤维素以及其他半纤维素通过氢键连接,这有助于稳定细胞壁基质(cell wall matrix)。
三种主要类型的糖水解酶(glycohydrolase)用于分解纤维素的生物质:
(1)“内-1,4-beta-葡聚糖酶”或1,4-beta-D-葡聚糖-4-葡聚糖水解酶(EC3.2.1.4),其随机地作用于可溶的和不可溶的1,4-beta-葡聚糖底物。
(2)“外-1,4-beta-D-葡聚糖酶”,其包括1,4-beta-D-葡聚糖葡糖水解酶(EC3.2.1.74),其从1,4-beta-D-葡聚糖释放D-葡萄糖并缓慢地水解D-纤维二糖;和纤维二糖水解酶(1,4-beta-D-葡聚糖纤维素二糖水解酶,EC 3.2.1.91),其从1,4-beta-葡聚糖释放D-纤维二糖。
(3)“beta-D-葡糖苷酶”或beta-D-葡糖苷葡糖水解酶(EC 3.2.1.21),其作用为从纤维二糖和可溶的纤维糊精(cellodextrin)中释放D-葡萄糖单元,以及一系列的糖苷。
这三类酶一起协同作用,导致有效地解晶(decrystallization)和水解来自生物质的天然纤维素以产生还原糖类。
本发明的糖苷水解酶变体和具有糖苷水解酶活性的多肽可以与上述提及的酶一起应用,以进一步降解生物质底物的纤维素成分(参见,例如,Brigham等,1995,在Handbook on Bioethanol(Charles E.Wyman,editor),pp.119-141,Taylor & Francis,Washington D.C.;Lee,1997,Journal of Biotechnology56:1-24)。
乙醇可以通过酶法降解生物质及将释放的糖类转化为乙醇来制备。这类乙醇常常被称为生物乙醇(bioethanol)或生物燃料(biofuel)。它可以在少于1%直至100%(燃料替代物)的混合物中用作燃料添加剂或补充剂(extender)。
洗涤剂组合物
可加入本发明的变体和具有糖苷水解酶活性的多肽,其由此成为洗涤剂组合物的成分。
本发明的洗涤剂组合物可被,例如,配制为手洗或机洗的洗涤剂组合物,其包括适于预-处理弄脏的纤维织物的洗衣添加剂组合物,和漂洗加入的织物柔软剂组合物,或被配制为洗涤剂组合物,用于一般的家庭硬面的清洁操作,或被配制用于手洗或机洗碟子的操作。
在具体的方面,本发明提供了包含本发明的变体和具有糖苷水解酶活性的多肽的洗涤剂添加剂。所述的洗涤剂添加剂,以及所述的洗涤剂组合物可包括一种或多种其他的酶,如蛋白酶、脂肪酶、角质酶(cutinase)、淀粉酶、糖酶、纤维素酶、果胶酶(pectinase)、甘露聚糖酶、阿拉伯糖酶(arabinase)、半乳聚糖酶(galactanase)、木聚糖酶、氧化酶,例如,漆酶和/或过氧化物酶。
通常,所述酶成分的性质应该与所选择的洗涤剂相适应(即,最适pH、与其他的酶成份和非-酶成份的相容性等),而且所述酶成分应以有效量存在。
蛋白酶:合适的蛋白酶包括那些动物、植物或微生物来源的,优选微生物来源的。包括化学修饰的或蛋白工程的突变体。所述的蛋白酶可为丝氨酸蛋白酶或金属蛋白酶,优选碱性微生物蛋白酶或胰蛋白酶-样蛋白酶。碱性蛋白酶的实例是枯草杆菌蛋白酶(subtilisin),尤其是那些源自芽孢杆菌的,例如,枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(在WO 89/06279中描述)。胰蛋白酶-样蛋白酶的实例是胰蛋白酶(例如,来源于猪或牛)和在WO 89/06270和WO 94/25583中描述的镰孢蛋白酶。
有用的蛋白酶的实例是在WO 92/19729、WO 98/20115、WO 98/20116和WO 98/34946中描述的变体,尤其是在一个或多个下列位点具有取代的变体:27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274。
优选的商业上可得到的蛋白酶包括AlcalaseTM、SavinaseTM、PrimasTM、DuralaseTM、EsperaseTM和KannaseTM  (Novozymes  A/S),MaxataseTM、MaxacalTM、MaxapemTM、ProperaseTM、PurafectTM、Purafect OxPTM、FN2TM和FN3TM(Genencor International Inc.)。
脂肪酶:合适的脂肪酶包括那些细菌来源或真菌来源的。包括化学修饰的或蛋白工程的突变体。有用的脂肪酶的实例包括来自腐质霉属(异名嗜热霉属)的脂肪酶,例如来自H.lanuginosa(T.lanuginosus),如在EP 258 068和EP305216中所描述的,或来自H.insolens,如在WO 96/13580中所描述的;假单胞菌脂肪酶,例如来自产碱假单胞菌(P.alcaligenes)或类产碱假单胞菌(P.pseudoalcaligenes)(EP 218272)、洋葱假单胞菌(P.cepacia)(EP 331 376)、施氏假单胞菌(P.stutzeri)(GB 1,372,034)、荧光假单胞菌(P.fluorescens)、假单胞菌菌株SD 705(WO 95/06720和WO 96/27002)、P.wisconsinensis(WO96/12012);芽孢杆菌脂肪酶,例如来自枯草芽孢杆菌(Dartois等,1993,Biochemica et Biophysica Acta,1131,253-360)、嗜热脂肪芽孢杆菌(JP64/744992)或短小芽孢杆菌(B.pumilus)(WO 91/16422)。
其他实例为脂肪酶变体如那些在WO 92/05249、WO 94/01541、EP 407225、EP 260105、WO 95/35381、WO 96/00292、WO 95/30744、WO 94/25578、WO 95/14783、WO 95/22615、WO 97/04079和WO 97/07202中所描述的。
优选的商业可得到的脂肪酶包括LipolaseTM和Lipolase UltraTM(Novozymes A/S)。
淀粉酶:合适的淀粉酶(α-和/或β-)包括那些细菌来源或真菌来源的。包括化学修饰的或蛋白工程的突变体。淀粉酶包括,例如,从芽孢杆菌得到的α-淀粉酶,例如地衣芽孢杆菌的具体菌株,在GB 1,296,839中详述。
有用的淀粉酶的实例为在WO 94/02597、WO 94/18314、WO96/23873、WO 97/43424中描述的变体,尤其是在一个或多个如下位点具有取代的变体:15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。
商业上可得到的淀粉酶是DuramylTM、TermamylTM、FungamylTM和BANTM(Novozymes A/S),RapidaseTM和PurastarTM(来自genencor International Inc.)。
纤维素酶:合适的纤维素酶包括那些细菌来源或真菌来源的。包括化学修饰的或蛋白工程的突变体。合适的纤维素酶包括来自芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、Thielavia、枝顶孢霉属的纤维素酶,例如US4,435,307、US 5,648,263、US 5,691,178、US 5,776,757和WO 89/09259中公开的由Humicola insolens、嗜热毁丝霉和尖镰孢产生的真菌纤维素酶。
特别合适的纤维素酶是具有颜色养护(colour care)益处的碱性或中性的纤维素酶。这样的纤维素酶的实例为在EP 0 495 257、EP 0 531 372、WO96/11262、WO 96/29397、WO 98/08940中描述的纤维素酶。其他实例为纤维素酶变体,如那些在WO 94/07998,EP 0 531 315、US 5,457,046、US 5,686,593、US 5,763,254、WO 95/24471、WO 98/12307和PCT/DK98/00299中所描述的。
商业上可得到的纤维素酶包括CelluzymeTM和CarezymeTM(NovozymesA/S),ClazinaseTM和Puradax HATM(genencor International Inc.)和KAC-500(B)TM(Kao Corporation)。
过氧化物酶/氧化酶:合适的过氧化物酶/氧化酶包括那些植物、细菌或真菌来源的。包括化学修饰的或蛋白工程的突变体。有用的过氧化物酶的实例包括来自鬼伞属(Coprinus),例如来自灰盖鬼伞(C.cinereus)的过氧化物酶,及其变体,如那些在WO 93/24618、WO 95/10602和WO 98/15257中所描述的。
商业上可得到的过氧化物酶包括GuardzymeTM(Novozymes A/S)。
所述的酶成分可通过加入含有一种或多种酶的独立的添加剂,或通过加入包含所有这些酶的组合的添加剂,包含于洗涤剂组合物中。本发明的洗涤剂添加剂,即独立的添加剂或组合的添加剂,可以配制为,例如颗粒、液体、浆体(slurry)等。优选的洗涤剂添加剂配制为颗粒,尤其是非-粉化的(non-dusting)颗粒,液体,尤其是稳定的液体,或浆体。
非-粉化的颗粒可以,例如,如在US 4,106,991和4,661,452中所公开的进行制备,并可以任意地通过本技术领域公知的方法进行包覆(coat)。蜡质包覆材料(waxy coating material)的实例是具有1000至20000的平均分子量的聚(环氧乙烷)产品(聚乙二醇(polyethyleneglycol),PEG);具有16至50个环氧乙烷单元的乙氧基化的壬基酚(ethoxylated nonylphenols);乙氧基化的脂肪醇,其中所述的醇包含12至20个碳原子,而且其中有15至80个环氧乙烷单元;脂肪醇类;脂肪酸;和脂肪酸的甘油单酯和甘油二酯和甘油三酯。适于以流化床技术应用的成膜包覆材料(film-forming coating material)的实例在GB1483591中给出。液体酶制剂可,例如,根据已建立的方法,通过添加多元醇(polyol),如丙二醇(propylene glycol),糖或糖醇(sugar alcohol),乳酸或硼酸(boric acid)稳定化。保护的酶可根据在EP 238,216中公开的方法进行制备。
本发明的洗涤剂组合物可为任何方便的形式,例如,条、片、粉、颗粒、糊或液体。液体洗涤剂可为水性的,通常包含多至70%的水和0-30%的有机溶剂;或为非-水性的。
所述的洗涤剂组合物包含一种或多种表面活性剂(surfactant),其可为非-离子的,包括半-极性的(semi-polar)和/或阴离子的和/或阳离子的和/或两性离子的(zwitterionic)。所述的表面活性剂通常以0.1%至60%(按重量计算)的水平存在。
当所述洗涤剂在其中包含时,所述的洗涤剂通常包含大约1%至大约40%的阴离子表面活性剂,诸如线状的烷基苯磺酸盐(linear alkylbenzenesulfonate)、alpha-烯烃磺酸盐(alpha-olefinsulfonate),烷基硫酸酯(alkyl sulfate)(脂肪醇硫酸酯(fatty alcohol sulfate)),醇乙氧基硫酸酯(alcohol ethoxysulfate),仲烷基磺酸盐(secondary alkanesulfonate),alpha-磺基脂肪酸甲酯(alpha-sulfo fatty acidmethyl ester),烷基-或烯基丁二酸(alkenylsuccinic acid)或肥皂。
当所述洗涤剂在其中包含时,所述的洗涤剂通常包含大约0.2%至大约40%的非-离子表面活性剂,诸如醇乙氧基化合物,壬基酚乙氧基化合物(nonylphenol ethoxylate),烷基聚糖苷(alkyl polyglycoside),烷基二甲基氧化胺(alkyldimethyl amineoxide),乙氧化的脂肪酸单乙醇酰胺(ethoxylated fatty acidmonoethanolamide),脂肪酸单乙醇酰胺(fatty acid monoethanolamide),多羟基烃基脂肪酸酰胺(polyhydroxy alkyl fatty acid amide),或葡糖胺(glucosamine)(“葡糖酰胺(glucamides)”)的N-酰基N烃基(N-acyl N-alkyl)衍生物。
所述的洗涤剂可包含0-65%的洗涤增效助剂(detergent builder)或络合剂(complexing agent),诸如沸石(zeolite),二磷酸盐(diphosphate),三磷酸盐(triphosphate),磷酸盐(phosphonate),碳酸盐(carbonate),柠檬酸盐(citrate),氮川三乙酸(nitrilotriacetic acid),乙二胺四乙酸(ethylenediaminetetraaceticacid),二次乙基三胺五乙酸(diethylenetriaminepentaacetic acid),烷基-或烯基丁二酸,可溶性的硅酸盐(silicate)或层状硅酸盐(例如来自Hoechst的SKS-6)。
所述的洗涤剂可包括一种或多种聚合物。实例为羧甲基纤维素(carboxymethylcellulose),聚(乙烯砒咯烷酮)(poly(vinylpyrrolidone)),聚(乙二醇)(poly(ethylene glycol)),聚(乙烯醇)(poly(vinyl alcohol)),聚(乙烯吡啶-N-氧化物)(poly(vinylpyridine-N-oxide)),聚(乙烯咪唑)(poly(vinylimidazole)),聚羧酸酯(polycarboxylates),诸如聚丙烯酸酯(polyacrylate),马来酸/丙烯酸共聚物(maleic/acrylic acid copolymer)和十二烷基甲基丙烯酸酯/丙烯酸共聚物(lauryl methacrylate/acrylic acid copolymer)。
所述的洗涤剂可包含漂白装置,所述漂白装置可包括H2O2源,诸如过硼酸盐(perborate)或过碳酸盐(percarbonate),其可与形成过酸的漂白活化剂(peracid-forming bleach activator),如四乙酰乙二胺(tetraacetylethylenediamine)或壬酰氧基苯磺酸酯(nonanoyloxybenzene sulfonate)组合。可替换地,所述漂白装置可包括例如酰胺类、酰亚胺类或砜类的过氧酸。
本发明的洗涤剂组合物的酶成分可应用常规的稳定剂进行稳定化,所述的稳定剂例如,多元醇如丙二醇或甘油,糖或糖醇,乳酸,硼酸或硼酸衍生物,例如,芳香族的硼酸酯(aromatic borate ester)或苯基硼酸衍生物如4-甲酰苯基(formylphenyl)硼酸,而所述的组合物可例如在WO 92/19709和WO92/19708中所描述的进行配制。
所述的洗涤剂也可含有其他常规洗涤剂成分,例如纤维调节剂(fabricconditioners)包括粘土(clay),发泡剂(foam booster),抑泡剂(suds suppressor),防腐蚀剂(anti-corrosion agent),悬污剂(soil-suspending agent),抗污垢再沉积试剂(anti-soil redeposition agent),染料(dye),杀菌剂(bactericide),光学增白剂(optical brightener),助水溶物(hydrotrope),晦暗抑制剂(tarnish inhibitor)或香料(perfume)。
在所述的洗涤剂组合物中,任何酶成分,尤其是本发明的变体和具有糖苷水解酶活性的多肽,可以以相应于0.01-100mg的酶蛋白每升洗涤液(washliquor)的量加入,优选0.05-5mg的酶蛋白每升洗涤液,尤其是0.1-1mg的酶蛋白每升洗涤液。
本发明的变体和具有糖苷水解酶活性的多肽可附加地并入WO 97/07202中公开的洗涤剂配方,WO 97/07202在此并入作为参考。
植物
本发明也涉及转基因的植物、植物部分或植物细胞,其已经用编码本发明的变体或具有糖苷水解酶活性的多肽的核苷酸序列转化,以表达并产生可回收量的所述变体或多肽。所述变体或多肽可从植物或植物部分中回收。可替换地,可应用所述的包含所述变体或多肽的植物或植物部分以提高食物(food)或饲料(feed)的质量,例如,提高营养价值(nutritional value)、适口性(palatability)和流变学的(rheological)性质,或破坏反营养性的因子(antinutritivefactor)。
转基因的植物可为双子叶的(dicotyledonous)(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属(Poa));饲用牧草(forage grass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草(temperate grass),如Agrostis;和谷类,例如,小麦、燕麦、黑麦、大麦、稻米(rice)、高粱和玉蜀黍(maize)(玉米)。
双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugar beet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(family Brassicaceae)),如花椰菜(cauliflower),油菜籽(rape seed)和紧密相关的模型生物体拟南芥(Arabidopsis thaliana)。
植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leave)、根(root)、果实(fruits)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyma)、维管组织(vasculartissues)、分生组织(meristems)。而且具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分,例如胚胎(embryos)、胚乳(endosperms)、糊粉(aleurone)和种皮(seed coat)。
上述植物、植物部分和植物细胞的子代也包括在本发明的范围之内。
表达本发明的变体或多肽的转基因的植物或植物细胞,可以依照本技术领域公知的方法构建。简言之,所述植物或植物细胞通过将一个或多个编码本发明的变体或多肽的表达构建体整合入植物宿主基因组,并将所得的修饰的植物或植物细胞在转基因的植物或植物细胞中增殖来进行构建。
方便地,所述的表达构建体是核酸构建体,其包含编码本发明的变体或多肽的核酸序列,所述核酸序列可操作地与在优先选择的植物或植物部分中表达所述核酸序列所必需的适当的调控序列相连接。此外,所述的表达构建体可包含可选择的标记,其用于鉴别已经整合入所述表达构建体的宿主细胞,和将该构建体导入所述植物必需的DNA序列(后者依赖于所采用的DNA导入方法)。
调控序列,如启动子和终止子序列及任选的信号序列或转运(transit)序列的选择,例如,在需要所述变体或多肽何时、何地和怎样表达的基础上进行确定。例如,表达编码本发明的变体或多肽的基因可为组成型的(constitutive)或诱导型的(inducible),或可为发育特异性的、阶段特异性的或组织特异性的,而基因产物可靶向具体的组织或植物部分,如种子或叶。调控序列为,例如,由Tague等,1988,Plant Physiology 86:506所描述的。
对于组成型表达,可以应用35S-CaMV启动子、玉米泛素(maize ubiquitin)1启动子和稻肌动蛋白(rice actin)1启动子(Franck等,1980,Cell 21:285-294;Christensen等,1992,Plant Mo.Biol.18:675-689;Zhang等,1991,Plant Cell 3:1155-1165)。器官特异性的启动子可为,例如,来自贮藏库组织(storage sinktissue),如种子、马铃薯根茎和果实的启动子(Edwards & Coruzzi,1990,Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolic sink tissues),如分生组织(Ito等,1994,Plant Mol.Biol.24:863-878),种子特异性的启动子,诸如来自稻的谷蛋白(glutelin)启动子、醇溶蛋白(prolamin)启动子、球蛋白(globulin)启动子或白蛋白(albumin)启动子(Wu等,1998,Plant and Cell Physiology 39:885-889),来自豆球蛋白(legumin)B4和蚕豆(Vicia faba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,Journal of Plant Physiology 152:708-711)、来自种子油体蛋白(oil body protein)的启动子(Chen等,1998,Plant and CellPhysiology 39:935-941),来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子,或本技术领域公知的任何其他种子特异性的启动子,例如,在WO91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,Plant Physiology 102:991-1000),小球藻病毒(chlorella virus)腺嘌呤甲基转移酶(adenine methyltransferase)基因启动子(Mitra和Higgins,1994,Plant Molecular Biology 26:85-93),或来自稻的aldP基因启动子(Kagaya等,1995,Molecular and general genetics 248:668-674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,Plant Molecular Biology22:573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源应用的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(plant hormones)如乙烯、脱落酸(abscisic acid)、赤霉酸(gibberellic acid)和/或重金属。
启动子增强子元件也可用于在所述植物中实现本发明的多肽的更高表达。例如,所述启动子增强子元件可为内含子(intron),其被置于启动子和编码本发明的多肽的核苷酸序列之间。例如,Xu等,1993,见前文,公开了稻肌动蛋白1基因的第一个内含子增强表达的应用。
可选择的标记基因和所述表达构建体的任何其他部分,可选自本技术领域中可得到的那些。
所述的核酸构建体,根据本技术领域公知的常规技术,整合入植物基因组,包括土壤杆菌(Agrobacterium)-介导的转化、病毒-介导的转化、显微注射(microinjection)、粒子轰击(particle bombardment)、生物射弹转化(biolistictransformation)和电穿孔(Gasser等,1990,Science 244:1293;Potrykus,1990,Bio/Technology 8:535;Shimamoto等,1989,Nature 338:274)。
目前,根癌土壤杆菌(Agrobacterium tumefaciens)-介导的基因转移(genetransfer),是产生转基因双子叶植物的优先选择的方法(为了考察,参见Hooykas和Schilperoort,1992,Plant Molecular Biology 19:15-38),而且它也可以用于转化单子叶植物,虽然对于这些植物其他的转化方法通常是优选的。目前,产生转基因单子叶植物的优先选择的方法,是用粒子(涂有转化DNA的微观的金或钨粒子)轰击胚胎愈伤组织(embryonic calli)或发育中的胚芽(developing embryos)(Christou,1992,Plant Journal 2:275-281;Shimamoto,1994,Current Opinion Biotechnology 5:158-162;Vasil et al.,1992,Bio/Technology 10:667-674)。转化单子叶植物的可替换的方法,是基于原生质体转化,如由Omirulleh等,1993,Plant Molecular Biology 21:415-428中所描述的。
转化之后,选择具有整合的表达构建体的转化体,并将其根据本技术领域中熟知的方法在全植物中再生。转化步骤常常是为了在再生的过程中或在后面的世代中,通过应用,例如,以两个独立的T-DNA构建体共转化或用特异性的重组酶(recombinase)位点特异性地切除选择基因(selection gene),选择性去除选择基因而设计的。
本发明也涉及产生本发明的变体或多肽的方法,其包括(a)在有助于产生所述变体的条件下培养包含核酸序列的转基因的植物或植物细胞,所述核酸序列编码本发明的变体或具有糖苷水解酶活性的多肽;和(b)回收所述的变体或多肽。
其他应用
本发明的具有糖苷水解酶活性的糖苷水解酶变体或多肽,也可以作为生物抛光剂(biopolishing agent)用于处理纺织品,并用于减少起毛(fuzz)、起球(pilling)、质地改变(texture modification)和石洗(stonewashing)(N.K.Lange,in P.Suominen,T.Reinikainen(Eds.),Trichoderma reesei Cellulases and OtherHydrolases,Foundation for Biotechnical and Industrial Fermentation Research,Helsinki,1993,pp.263-272)。此外,所述具有糖苷水解酶活性的变体或多肽也可以用于木材加工中的生物制浆(biopulping)或去皮(debarking),造纸中的纤维改性(fiber modification)、漂白和降低精制能源成本,白水处理(whitewatertreatment),对于回收废水(wastewater recycling)、回收木质纤维素的(lignocellulosic)纤维(如脱墨(deinking)和次级纤维(secondary fiber)加工),和木材残余物应用来说是重要的(S.D,Mansfield和A.R.Esteghlalian在S.D,Mansfield和J.N.Saddler(Eds.),Applications of Enzymes to Lignocellulosics,ACS Symposium Series 855,Washington,D.C.,2003,pp.2-29)。
本发明通过如下实施例进一步描述,所述的实施例不应看作对本发明的范围的限制。
实施例
菌株
Trichoderma reesei RutC30(ATCC 56765;Montenecourt和Eveleigh,1979,Adv.Chem.Ser.181:289-301)来源自Trichoderma reesei Qm6A(ATCC 13631;Mandels和Reese,1957,J.Bacteriol.73:269-278)。
米曲霉Jal250菌株(WO 99/61651)用于表达所述热稳定的beta-葡糖苷酶。
酿酒酵母YNG 344(MATα,ura3-52,leu-2Δ2,pep4Δ1,his4-539,cir0)用于产生突变的糖苷水解酶(Cel7A)的文库。
用于产生质粒的细菌菌株为Epicurian coli XL-10Gold超感受态细胞(ultracompetent cell),(Stratagene,Inc.,La Jolla,CA)。
培养基和溶液
酵母选择培养基,由每升6.7g酵母氮碱基(nitrogen base)、0.8g完全补充混合物(complete supplement mixture)(CSM,Qbiogene,Inc.,Carlsbad,CA;缺少尿嘧啶(uracil)并含有40mg/ml的腺嘌呤(adenine))、5g酪蛋白氨基酸(casmino acid)和20g Noble琼脂组成。所述培养基也含有50mM琥珀酸盐(succinate)pH 5.0、2%葡萄糖和25μg氯霉素(chloramphenicol)。
酵母筛选培养基由每升6.7g酵母氮碱基、0.8g CSM-URA、5g酪蛋白氨基酸和20g Noble琼脂组成。所述培养基每ml也含有50mM琥珀酸盐pH5.0、2%半乳糖、0.1%葡萄糖和25μg氯霉素。
YPD培养基,由每升10g酵母提取物、20g细菌用胰蛋白胨(bacto tryptone)和40ml 50%葡萄糖组成。
纤维素酶-诱导培养基由每升20g的Arbocel B800-天然纤维素纤维(J.Rettenmaier USA LP,Schoolcraft,Michigan)、10g玉米浸泡固体(corn steep solid)(Sigma Chemical Co.,St.Louis,MO)、1.45g(NH4)2SO4、2.08g KH2PO4、0.28gCaCl2、0.42g MgSO4·7H2O、0.42ml Trichoderma reesei痕量金属溶液和2滴pluronic acid组成;用10N NaOH将pH调节至6.0。
Trichoderma reesei痕量金属溶液由每升216g FeCl3·6H2O、58gZnSO4·7H2O、27g MnSO4·H2O、10g CuSO4·5H2O、2.4g H3BO3和336g柠檬酸组成。
COVE选择平板由每升342.3g蔗糖、20ml COVE盐溶液、10mM乙酰胺、15mM CsCl2和25g Noble琼脂组成。
COVE2加尿苷平板由每升30g蔗糖、20ml COVE盐溶液、10mM乙酰胺、10mM尿苷和25g Noble琼脂组成。
COVE盐溶液由每升26g KCl、26g MgSO4·7H2O、76g KH2PO4和50ml的COVE痕量金属组成。
COVE痕量元素溶液(trace elements solution)由每升0.04g NaB4O7·10H2O、0.4g CuSO4·5H2O、1.2g FeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·2H2O和10g ZnSO4·7H2O组成。
PDA培养基由每升39克的马铃薯右旋糖琼脂组成。
1X SSC由每升8.765g氯化钠和4.41g柠檬酸钠组成。
PEG缓冲液由每升500g PEG 4000(BDH,Poole,England)、10mM CaCl2和10mM Tris-HCl pH7.5(过滤除菌)组成。
STC由每升1M山梨醇、10mM CaCl2和10mM Tris-HCl pH7.5组成,并过滤除菌。
Trichoderma reesei接种物培养基由每升20g葡萄糖、10g玉米浸泡固体(Sigma Chemical Co.,St.Louis,MO)、1.45g(NH4)2SO4、2.08g KH2PO4、0.28gCaCl2、0.42g MgSO4·7H2O、0.42ml Trichoderma reesei痕量金属溶液和2滴pluronic acid;最终pH 5.0组成。
Trichoderma reesei发酵培养基由每升4g葡萄糖、10g玉米浸泡固体、30g Arbocel B800-天然纤维素纤维(J.Rettenmaier USA LP,Schoolcraft,Michigan)、3.8g(NH4)2SO4、2.8g KH2PO4、2.08g CaCl2、1.63g MgSO4·7H2O、0.75ml Trichoderma reesei痕量金属溶液和1.8ml pluronic acid组成。
Trichoderma reesei补料培养基由每升600g葡萄糖、20g纤维素B800、35.5g H3PO4和5ml pluronic acid组成。
米曲霉接种物培养基由每升50g葡萄糖、2g MgSO4·7H2O、10g KH2PO4、2g K2SO4、2.08g CaCl2·2H2O、2g柠檬酸、10g酵母提取物、0.5g AMG痕量金属和2g尿素,最终pH6.0组成。
AMG痕量金属由每升14.3g ZnSO4·7H2O、2.5g CuSO4·5H2O、0.5gNiCl2·6H2O、13.8g FeSO4·7H2O、8.5g MnSO4·H2O和3g柠檬酸组成。
米曲霉发酵培养基由每升2g MgSO4·7H2O、2g KH2PO4、3g K2SO4、9g(NH4)2HPO4、1g柠檬酸·H2O、10g酵母提取物、0.5ml AMG痕量金属、25g蔗糖和0.55mL pluronic组成。
米曲霉补料培养基由每升1g柠檬酸·H2O、320g SatinSweet 65和5gpluronic组成。
MDU2BP培养基由每升45g麦芽糖、1g MgSO4·7H2O、1g NaCl、2gK2SO4、12g KH2PO4、7g酵母提取物、2g尿素和0.5ml AMG痕量金属溶液组成。
实施例1:发酵和菌丝体组织(mycelial tissue)
Trichoderma reesei RutC30在如本技术领域所述的纤维素酶诱导标准条件下生长(Mandels和Weber,1969,Adv.Chem.Ser.95:391-413)。通过经Whatman纸过滤收获菌丝体样品并在液氮中快速冷冻。将所述样品贮存在80℃直到将它们破碎用于RNA提取。
实施例2:已表达序列标签(Expressed sequence tag)(EST)cDNA文库构建
从实施例1中所述的菌丝体样品中根据Timberlake和Barnard的方法(1981,Cell 26:29-37)提取总细胞RNA,并在从1%甲醛-琼脂糖凝胶印迹后通过Northern杂交分析所述的RNA样品(Davis等,1986,Basic Methods inMolecular Biology,Elsevier Science Publishing Co.,Inc.,New York)。从总RNA中用mRNA Separator KitTM(Clontech Laboratories,Inc.,Palo Alto,CA)根据制造商的说明分离聚腺苷酸化的(Polyadenylated)mRNA片段。应用大约5μgpoly(A)+mRNA根据Gubler和Hoffman的方法(1983,Gene 25:263-269)合成双链cDNA,除了将Not I-(dT)18引物(Pharmacia Biotech,Inc.,Piscataway,NJ)用于初始化第一条链合成。所述cDNA用绿豆核酸酶(mung bean nuclease)(Boehringer Mannheim Corporation,Indianapolis,IN)处理并用T4DNA聚合酶(New England Biolabs,Beverly,MA)将所述末端钝化。
将BamH I/EcoR I接头(adaptor)连接于所述cDNA的钝端。用NotI消化后,通过应用TAE缓冲液(4.84g Tris碱、1.14ml冰乙酸和2ml 0.5M EDTA pH8.0每升)的0.7%琼脂糖凝胶电泳大小选择所述的cDNA(ca.0.7-4.5kb),并与pYES2(Invitrogen Corporation,Carlsbad,CA)连接,所述pYES2已经用Not I加BamH I切割并以小牛-肠碱性磷酸酶(calf-intestine alkaline phosphatase)(Boehringer Mannheim Corporation,Indianapolis,IN)脱去磷酸。所述连接混合物用于转化感受态大肠杆菌TOP10细胞(Invitrogen Corporation,Carlsbad,CA)。在以50μg每ml的终浓度添加氨苄青霉素的2YT琼脂平板上(Miller,1992,A Short Course in Bacterial Genetics.A Laboratory Manual and Handbookfor Escherichia coli and Related Bacteria,Cold Spring Harbor Press,Cold SpringHarbor,New York)选择转化体。
实施例3:模板制备和cDNA克隆的核苷酸测序
从实施例2中描述的cDNA文库中,将大约7000个转化体菌落从所述的转化平板直接挑入含有添加50μg每ml氨苄青霉素的100μl 2YT培养液的96-孔微量滴定皿。将所述平板在37℃、200rpm振荡的条件下过夜培育。培育之后,将100μl无菌的50%甘油加入每个孔。将所述转化体在次级深-盘96-孔微量培养平板(Advanced Genetic Technologies Corporation,Gaithersburg,MD)上进行复制,所述平板中含有在每孔中添加50μg每ml氨苄青霉素的1ml Magnificent BrothTM(MacConnell Research,San Diego,CA)。将初级微量滴定平板冷冻贮存在-80℃。将所述的次级深-盘平板在37℃及在旋转振荡器上剧烈搅动(300rpm)进行过夜培育。为了避免泄漏和交叉-污染,及允许足够的通气,将每个次级培养平板用聚丙烯衬垫(Advanced Genetic TechnologiesCorporation,Gaithersburg,MD)和塑料微量滴定皿盖来覆盖。
应用如Utterback等(1995,Genome Sci.Technol.1:1-8)修改的AdvancedGenetic Technologies Corporation的96-孔Miniprep Kit规程从每个孔中分离DNA。应用染料-终止子化学(Giesecke等,1992,Journal of Virology Methods 38:47-60)和T7测序引物:5’-TAATACGACTCACTATAGGG-3’(SEQ ID NO:3)以Perkin-Elmer Applied Biosystems Model 377XL自动化DNA测序仪(Perkin-Elmer/Applied Biosystems,Inc.,Foster City,CA)进行单-通过DNA测序(EST)。
实施例4:分析cDNA克隆的DNA序列数据
为了质量和载体序列仔细核对核苷酸序列数据并修剪所述DNA序列末端的不确定的碱基,在PHRED/PHRAP软件(University of Washington,Seattle,WA)的帮助下对所有序列进行相互比较。将所得的重叠群(contig)和单元素(singleton)以六种框架进行翻译并应用GeneMatcherTM软件(Paracel,Inc.,Pasadena,CA)及采用BLOSUM 62矩阵(matrix)的修改的Smith-Waterman算法搜索公众可用的蛋白质数据库。
实施例5:鉴定编码家族7纤维二糖水解酶I(Cel7A)的cDNA克隆
通过将装配的EST的推导的氨基酸序列与公众可用的数据库如Swissprot、Genpept和PIR中储存的蛋白质序列进行比较来鉴定推定的编码家族7纤维二糖水解酶(Cel7A)的cDNA克隆。选择一个克隆Trichoderma reeseiEST Tr0221用于核苷酸序列分析,该分析显示含有如SEQ ID NO:1所示的1452bp开放阅读-框的1821bp pYES2插入片段和如SEQ ID NO:2所示的推导的氨基酸序列。所述含有Trichoderma reesei Cel7A纤维二糖水解酶I的质粒命名为pTr0221。
实施例6:构建酿酒酵母载体用于产生初级的和重排的Trichodermareesei Cel7A纤维二糖水解酶I文库
在初级文库和重排文库的产生中应用两个载体pJC106(WO9510602)和pAJ052(图1)。质粒pJC106是pYES2(Invitrogen Inc.,Carlsbad,CA)的衍生体,但区别在于pJC106具有全-长2微米复制子,其代替了pYES2中的部分2微米,并包含所述灰盖鬼伞过氧化物酶(CIP)(Cherry等,1999,Nat.Biotechnol.4:379-384)编码序列,该序列被GAL1启动子调控。
对于pAJ052,由Trichoderma reesei Cel 7A编码序列的ATG起始密码子跨越至TAA终止密码子的1452bp DNA片段,从pTr0221(实施例5)中应用下面显示的引物aGal_776.1(有义)和aGal_776.1A(反义)进行PCR扩增:
引物aGal_776.1:
5’-TATACCTCTATACTTTAACGTCAAGGAGAAAAAACTATAGGATCCACCATGTATCGGAAGTTGGCCG-3’(SEQ ID NO:4)
引物aGal_776.1A:
5’-CATAACTAATTACATGATGCGGCCCTCTAGATGCACATGACTCGAGTTACAGGCACTGAGAGTAG-3’(SEQ ID NO:5)
将引物aGal_776.1和aGal_776.1A设计为含有pJC106的同源的GAL1启动子(Giniger和Ptashne,1988,Proc.Natl.Acad.Sci.,USA 85:382-386)和所述CYC1终止子序列(Osbourne和Guarente,1988,Genes Dev.2:766-772)(分别加下划线的)用于所述PCR产物和pJC106的体内同源重组。引物aGal_776.1和aGal_776.1A也设计为分别含有BamH I和Xho I限制性内切酶位点。引物aGal_776.1进一步设计为在所述Trichoderma reesei纤维二糖水解酶I(Cel7A)基因ATG的上游紧接着含有酵母Kozak序列(ACC,-3至-1bp;Kozak,1984,Nature 308:241-246)。所述扩增反应(50μl)由1X PCR缓冲液(AppliedBiosystems Inc.,Foster City,CA)、0.2mM dNTPs、3.2pM引物aGal_776.1、3.2pM引物aGal_776.1A、大约100ng pTr0221和2.5单位Taq DNA聚合酶(Roche Applied Science,Manheim,Germany)组成。所述反应在EppendorfMastercycler 5333(Eppendorf EG,Hamburg,Germany)中进行,其程序为在94℃、3分钟的1个循环,然后是94℃30秒、55℃30秒和72℃90秒的30个循环,然后是在72℃5分钟的1个循环。然后将所述PCR产物应用QIAquickPCR Kit(QIAGEN Inc.,Valencia,CA)根据制造商的说明进行纯化,然后通过体内重组导入酿酒酵母。为了实现所述的体内重组,在YEASTMAKER酵母转化规程(Clontech Laboratories Inc.,Palo Alto,CA)之后,将大约100ng用BamH I和Xho I消化的pJC016,和大约500ng纯化的PCR片段共-转化入酿酒酵母YNG 344。将所述的转化铺于酵母选择培养基上用于在30℃进行4天菌落生长。
根据Kaiser和Auer,1993,BioTechniques 14:552所述的规程选择单菌落并分离质粒DNA,其后续根据制造商的说明导入大肠杆菌菌株XL-10(Stratagene Inc.,La Jolla,CA)。将源自转化的大肠杆菌菌株的质粒进行测序以检验所述PCR和重组事件的保真度(fidelity)。
实施例7:在酿酒酵母中产生突变的Cel7A纤维二糖水解酶I的初级文库
在致力于鉴定所述Trichoderma reesei Cel7A纤维二糖水解酶I的对于蛋白质热稳定性和改进的高-温活性来说关键的区域时,全部野生型Trichodermareesei Cel7A纤维二糖水解酶I基因应用易-错PCR以与所述酵母表达载体pJC106(图2)同源的序列进行突变,其可经过不同片段的同源结构域之间的体内重组,由线性化的载体和PCR产物的组合产生环状、复制的质粒。
应用如下的模板/引物组合中的一个产生用于缺口修复的PCR产物:
1)如下显示的引物aGal_776.1和引物aGal_776.1a用于易-错PCR扩增来自pTR0221的Cel7A纤维二糖水解酶I基因以产生突变的序列。
2)如下显示的引物yes2term和引物CiPpcrdwn用于易-错PCR扩增来自pAJ052的Cel7A纤维二糖水解酶I基因以产生突变的序列。
3)如下显示的引物cJC106.1a和引物CiPpcrdwn也用于易-错PCR扩增来自pAJ052的Cel7A纤维二糖水解酶I基因以产生突变的序列。
将所述片段克隆入pJC106用于在酵母中表达所述Cel7A纤维二糖水解酶I变体。
引物aGal_776.1:
5’-TATACCTCTATACTTTAACGTCAAGGAGAAAAAACTATAGGATCCACCATGTATCGGAAGTTGGCCG-3′(SEQ ID NO:6)
引物aGal_776.1a:
5’-CATAACTAATTACATGATGCGGCCCTCTAGATGCACATGACTCGAGTTACAGGCACTGAGAGTAG-3′(SEQ ID NO:7)
引物yes2term:
5′-GGCGTGAATGTAAGCGTGAC-3’(SEQ ID NO:8)
引物CiPpcrdwn:
5’-CTGGGGTAATTAATCAGCGAAGCGATGA-3’(SEQ ID NO:9)
引物cJC106.1a:
5’-GCGTACACGCGTCTGTACA-3’(SEQ ID NO:10)
所述易-错PCR扩增(50μl)由含MgCl2的1X PCR缓冲液、0.2mM dATP、0.2mM dGTP、0.1mM dCTP和0.1mM dTTP、50pmol有义和反义引物、0.05mM至0.6mM MnCl2和10-50ng的质粒DNA(一些情况下为pTR0221,在其他情况下为pAJ052)组成。所述反应应用MJ Research thermocycler(MJResearch,Inc.Boston,MA)温育,其程序设定为在95℃、3分钟的1个循环,其后加入2.5单位的Amplitaq(Perkin Elmer,Foster City,CA),然后是95℃60秒、55℃C 60秒和72℃C 90秒的30个循环,然后将所述反应在72℃进行5分钟的延伸。将每种PCR产物的等分试样应用如前所述的TAE缓冲液在0.7%琼脂糖凝胶上跑胶,其产生预期的大约1680至2030bp的条带。PCR反应应用MiniElute PCR纯化试剂盒(QIAGEN,Valencia,CA)进行纯化,洗脱入50μl的EB缓冲液(QIAGEN,Valencia,CA)。
质粒pJC106通过用BamH I和Xho I消化来产生缺口,然后应用QiaquickMinielute柱(QIAGEN,Inc.,Valencia,CA)纯化凝胶。所述的消化通过将所述消化的等分试样在0.8%琼脂糖凝胶上应用TAE缓冲液进行分级并以溴化乙锭染色来证实,其中得到预期的10771bp(有缺口的)和1030bp(来自灰盖鬼伞过氧化物酶基因)的片段。
将所述PCR反应以大约3比1的比例与所述有缺口的pJC106载体混合用于共转化入酿酒酵母YNG344感受态细胞。所述共-转化的片段,应用引物aGal_776.1和aGal_776.1a进行扩增的含有至少5’同源DNA的67bp和3’同源DNA的66bp,应用yes2term和CiPpcrdwn扩增的含有至少5’同源DNA的293bp和3’同源DNA的41bp,而cJC106.1a和CiPpcrdwn扩增的在所述的末端含有至少5’同源DNA的293bp和3’同源DNA的190bp以促进所述表达质粒的缺口修复。在每个按照YEASTMAKER酵母转化规程进行转化前制备酿酒酵母YNG 344的感受态细胞,所述的规程具有如下修改:(1)用于接种过夜培育(16-20小时)的酵母培养物的体积为100-1,000μl;(2)转化后在YPD培养基中在30℃回收细胞45分钟;和(3)所述转化混合物等分,用于铺在酵母选择培养基平板上和在控速制冷器(Nalge Nunc International,Rochester,NY)中在-80℃冷冻。
实施例8:构建pAlLo1和pAlLo2米曲霉表达载体
作为克隆几个Cel7A纤维二糖水解酶变体的主要(backbone)载体,构建了两种米曲霉表达载体。载体pAlLo1通过修饰pBANe6(美国专利6,461,837)来构建,其包含所述米曲霉alpha-淀粉酶启动子(TAKA启动子)、黑曲霉淀粉葡萄糖苷酶终止子序列(AMG终止子)和构巢曲霉乙酰胺酶基因(amdS)。pBANe6的修饰通过从所述amdS选择标记通过定点突变首先消除位置2051、2722和3397bp的三个Nco I限制性酶切位点来进行。所有的改变设计为“沉默的”,保持所述amdS基因产物的实际蛋白序列不改变。这三个位点的去除用GeneEditor定点突变试剂盒(Promega,Madison,WI)根据制造商的说明同时进行,并采用如下引物(加下划线的核苷酸表示改变的碱基):
引物AMDS3NcoMut(2050):
5’-GTGCCCCATGATACGCCTCCGG-3’(SEQ ID NO:11)
引物AMDS2NcoMut(2721):
5’-GAGTCGTATTTCCAAGGCTCCTGACC-3’(SEQ ID NO:12)
引物AMDS1NcoMut(3396):
5’-GGAGGCCATGAAGTGGACCAACGG-3’(SEQ ID NO:13)
然后将包含全部三种预期的序列改变的质粒应用QuickChange突变试剂盒(Stratagene,La Jolla,CA)进行定点突变,以在所述AMG终止子的末端消除位置1643的Nco I限制性内切酶位点。如下的引物(加下划线的核苷酸代表改变的碱基)用于突变:
诱变所述黑曲霉AMG终止子序列的有义引物
5’-CACCGTGAAAGCCATGCTCTTTCCTTCGTGTAGAAGACCAGACAG-3’(SEQ ID NO:14)
诱变所述黑曲霉AMG终止子序列的反义引物
5’-CTGGTCTTCTACACGAAGGAAAGAGCATGGCTTTCACGGTGTCTG-3’(SEQ ID NO:15)
修饰pBANe6的最后一步是将新的Nco I限制性酶切位点应用QuickChange突变试剂盒和下列引物(加下划线的核苷酸表示改变的碱基)添加在所述聚合接头(polylinker)的起点以获得pAlLo1(图3)。
诱变所述米曲霉TAKA启动子的有义引物:
5’-CTATATACACAACTGGATTTACCATGGGCCCGCGGCCGCAGATC-3’(SEQ ID NO:16)
诱变所述米曲霉TAKA启动子的反义引物:
5’-GATCTGCGGCCGCGGGCCCATGGTAAATCCAGTTGTGTATATAG-3’(SEQ ID NO:17)
pAILo1的amdS基因同构巢曲霉pyrG基因交换。将质粒pBANe10(图14)用作pyrG基因的来源,所述的pyrG基因作为选择标记。pBANe10的序列的分析显示,pyrG标记包含于Nsi I限制性酶切片段中,并不包含Nco I或PacI限制性酶切位点。由于amdS两侧也有Nsi I限制性酶切位点,交换选择标记的策略为Nsi I限制性酶切片段的简单交换。
来自pAILo1和pBANe10的质粒DNA用限制酶Nsi I消化,所述的产物通过琼脂糖凝胶电泳应用TAE缓冲液进行纯化。将来自含有pyrG基因的pBANe10的Nsi I片段连接到pAILo1的骨架上以代替原始的含有amdS基因的Nsi I DNA片段。重组的克隆通过限制性内切酶消化进行分析以确定插入方向。筛选具有以逆时针方向转录的pyrG基因的克隆。所述的新质粒命名为pAILo2(图5)。
实施例9:改进的Cel7A纤维二糖水解酶I变体G205R的理性设计和在酿酒酵母中产生G205R初级文库
将所述Trichoderma reesei Cel7A纤维二糖水解酶I蛋白序列(SEQ ID NO:2)与同一酶家族的其他蛋白质相比较。序列包括来自嗜热毛壳菌(Chaetomiumthermophilum)(WO 03/000941)、Humicola insolens(WO 95/02675)和粗糙脉孢菌(SWISSPROT:P38676a嗜热毛壳菌的亲近的种系发生的亲缘)的Cel7A纤维二糖水解酶I。应用ClustalX软件版本1.81(National Center forBiotechnology Information,NIH Bethesda,MD)(Thompson等,1994,NucleicAcids Res 22:4673-4680;Thompson等,1997,Nucleic Acids Res 25:4876-4882),采用具有默认的缺口罚分参数的Gonnet矩阵进行来自嗜热毛壳菌、Humicola insolens、Trichoderma reesei和粗糙脉孢菌的Cel7A纤维二糖水解酶I蛋白序列的多重对比。将显示较差比对的区域进行迭代地重比对,有时应用替换的矩阵(Blosum)和/或可变的缺口参数。公众可得到的Cel7A纤维二糖水解酶I序列的同源性模型应用自动化的SwissModel serviceSwissModel service(Biozentrum,Basel,Switzerland)来产生。来自Humicolainsolens的Cel7A纤维二糖水解酶I的同源性模型通过应用the Insight II程序(Accelrys,San Diego CA)产生。程序DeepView(Guex和Peitsch,1997,Electrophoresis 18:2714-2723)用于导入实际的突变并用于所有其他结构操作和能量最小化。用于来自Trichoderma reesei的Cel7A纤维二糖水解酶I的参考结构是PDB:7CEL(Divne等,1994,Science 265:524-528;Stahlberg等,1996,264:337-349)。根据所述比较,优先考虑Trichoderma reesei纤维二糖水解酶I的潜在的突变,基于它们可产生新的稳定相互作用(离子对和/或H-键)的可能性,也基于它们在嗜热真菌嗜热毛壳菌和Humicola insolens的Cel7A纤维二糖水解酶I的序列和结构中发生的可能性,和它们在嗜温真菌粗糙脉孢菌中不存在的可能性。
显示的氨基酸取代中的一个是位置205的甘氨酸改变为精氨酸。将所述G205R变体进行理性设计以导入与E190和E239的离子-配对。为了产生所述的G205R取代,将所述Trichoderma reesei Cel7A纤维二糖水解酶I基因亚克隆入用Nco I和Pac I消化的米曲霉载体pAlLo02以形成与所述基因的ATG和米曲霉alpha-淀粉酶启动子和黑曲霉淀粉葡萄糖苷酶终止子序列的完好连接。将所述Cel7A纤维二糖水解酶I基因亚克隆入pAlLo2通过设计下面显示的两个引物来实现,所述的引物允许克隆入所述Nco I和Pac I位点。引物cTR0221.7:5′-GCAACATGTATCGGAAGTTGGC-3′(SEQ ID NO:18)将与pAlLo2中的Nco I位点相适应的BspLU II位点,掺入所述Cel7A纤维二糖水解酶I基因的5’-末端,而引物cTR0221.7a:5′-AATTAATTTTACAGGCACTGAG-3′(SEQ ID NO:19)在所述的3’末端掺入BspLU II位点。
所述Cel7A纤维二糖水解酶I基因的扩增应用1X Tgo聚合酶反应缓冲液(Boehringer Mannheim Co,Indianapolis,IN)、25ng pTR0221、dATP、dGTP、dCTP和dTTP每种0.2mM、50pmole每种引物(cTR0221.7和cTR0221.7a)和1单位的Tgo聚合酶(Boehringer Mannheim Co,Indianapolis,IN)来完成。所述反应应用MJ Research Thermocycler温育,其程序为在94℃、5分钟的1个循环,然后是94℃60秒、55℃45秒和72℃2分钟的35个循环。然后将所述反应在72℃延伸5分钟。将每种PCR产物的等分试样应用TAE缓冲液在0.7%琼脂糖凝胶上跑胶,其产生预期的大约1545bp的条带。将所述1545bp PCR产物应用TOPO Blunt PCR4Cloning Kit(Invitrogen,Carlsbad,CA)进行亚克隆。将得到的质粒用BspLU II和Pac I消化并在0.7%琼脂糖凝胶上应用TAE缓冲液分级以产生预期的1.5kb编码序列,将其切除并应用AmiconUltra-free DA柱(Millipore,Billerica,MA)进行凝胶纯化。后续将得到的片段连接入同样消化的pAlLo2,以产生含有所述Trichoderma reesei Cel7A纤维二糖水解酶I基因的表达载体,其命名为pCW026(图6)。
从起始质粒pCW026开始工作,应用Quick Change定点突变试剂盒(Stratagene,La Jolla,CA)及pCW026作为模板,通过在Cel7A纤维二糖水解酶I的编码序列的碱基664将鸟苷突变为胞苷而得到G205R变体。用于掺入此突变的引物为下面显示的引物G205R.1和引物G205R.1a:
G205R.1:
5′-GAACACGGGCATTGGACGACACGGAAGCTGCTG-3′(SEQ ID NO:20)
G205R.1a:
5′-CAGCAGCTTCCGTGTCGTCCAATGCCCGTGTTC-3′(SEQ ID NO:21)
将得到的表达载体命名为pNP776G205R(图7)。
实施例10:筛选Cel7A纤维二糖水解酶I文库
将初级Cel7A纤维二糖水解酶I文库铺于Genetix QTrays(22x 22cm培养皿,Genetics Ltd.,Hampshire,United Kingdom)中的琼脂酵母选择培养基上并在30℃温育5天。应用Genetix QPix(Genetix Ltd.,Hampshire,UnitedKingdom),将菌落挑入含有酵母选择培养基的96-孔板。将平板在30℃温育5-8天。应用ORCA机器人(Beckman Coulter,Fullerton,CA),将所述生长平板转入Biomek Fx(Beckman Coulter,Fullerton,CA)并从该生长平板移出培养液样品且等分为两个96-孔聚碳酸脂v-底平板。将所述纤维二糖水解酶I底物4-甲基繖酮-beta-D-乳糖苷(MUL,Marker Gene Tech.Inc.,Eugene,OR)以0.2、0.1或0.05mg每ml 4-甲基繖酮-beta-D-乳糖苷、0.1M琥珀酸盐、pH 5.0和0.01%Tween-20的终浓度加入每个V-底96-孔平板。将实验平板转移导控温的培养箱,其中一个平板在50℃温育45分钟,而另一个在预定的温度62℃-65℃温育45分钟。此温育之后,将所述平板在4℃冷却1分钟,然后转移到所述的Biomek Fx,其中实验通过加入Tris-Cl,pH 9.5至0.75M的终浓度而终止。终止的反应样品在水中稀释,并应用BMG FLUOStar Galaxy荧光计(Offenburg,Germany)测定通过4-甲基繖酮-beta-D-乳糖苷的Cel7A纤维二糖水解酶I水解而释放的4-甲基繖酮的荧光(360nm激发,460nm发射)。将来自在高温处理平板的荧光的比例(“高温活性”)与来自在50℃温育的相同样品的荧光(“低温活性”),应用Microsoft Excel(Microsoft Corporation,Redmond,WA)进行比较,以测定每个变体的相对热活性比例。基于所述的热活性比例,筛选实施例7和实施例9中构建的文库产生表1中列出的变体。表1显示如通过评价64℃的活性相对于50℃的活性的热活性比例来测定的新型Cel7A纤维二糖水解酶I变体的改进的程度。对于初级筛选中得到的变体,改进的变化范围从相对于所述野生型酶提高2.60-倍至10.20-倍改进。对于由重排得到的突变体,观察到的改进为热活性比所述野生型酶高12.40-倍至19.20-倍。
表1.具有改进的热稳定性和热活性的Cel7A变体。“增加倍数”表示在64℃/50℃测定的热活性比例的相对改进。
 Cel7A变体   氨基酸取代*   增加倍数
  野生型   无   1
  G205R   G205R   2.60
  776-M1   T226A   6.20
  776-M3   P227A、C486W   7.80
  776-M4   S113N、S196T、T462A   6.00
  776-M21   N301S、E337V   4.00
  776-M22   S196P、T350S   1.60
  776-M23   G22D、G467S   1.40
  776-M26   S21P、S57N   3.80
  776-M27   S411F   7.60
  776-M30   T41I   2.60
  776-M32   K157R、G205R、T255P   5.20
  776-M35   G205R、S411F   8.40
  776-M40   G205R、P227A   10.20
  776-M41   G205R、H206Y   3.40
  776-M42   S8P、G205R   4.60
  776-M52   G94S、G205R   4.00
  776-M53   S196P、G205R   4.80
  776-M57   S113N、S196T、P227A、T462A   14.60
  776-M65   S57N   5.00
  776-M71   T383A、T455A   2.60
  776-M73   N373H   4.80
  776-M101   S113N、S411F   12.40
  776-M108   T41I、E193K、S411F   15.60
  776-M109   N49S、S113N、P227A、P438L   15.00
  776-M124   Y247C、Y371C、S411F   17.40
  776-M125   S21P、S57N、T246I、R251K、S411F   18.00
  776-M192   K157R、G205R、T255P、S411F   15.00
  776-M216   S113N、S196T、P227A、S411F   17.80
  776-M252   S113N、S196T、P227A、T356I、T462A   19.20
*编号方式应用成熟Cel7A酶的第一个残基作为位置1。
实施例11:变体的DNA测序
为了测定源自实施例7和9的文库的Cel7A纤维二糖水解酶I变体的序列,分离了质粒DNA。将每个变体在琼脂酵母选择培养基上划线并在30℃温育3-5天。分离出8个菌落并接种入1ml的酵母筛选培养基,在30℃生长5-8天。将所述琼脂平板在30℃再生长3-5天。如实施例10中所述检测来自每个变体的单菌落的培养液产生的纤维二糖水解酶I变体的改进的热活性以测定相对于野生型(wt)Cel7A纤维二糖水解酶I哪些具有改进的热活性比例。如Kaiser和Auer,1993,BioTechniques 14:552所述,应用大肠杆菌菌株XL-10(Stratagene Inc.,La Jolla,CA)从产生具有改进的热活性的纤维二糖水解酶I变体的菌落中拯救(rescue)质粒。
应用ABI 3700测序仪(Applied Biosystems,Foster City,CA),应用染料终止子化学(Giesecke等,1992,Journal of Virol.Methods 38:47-60)进行DNA测序。用于测序的质粒DNA应用BioRobot 9604(QIAGEN,Valencia,CA)制备。每个Trichoderma reesei Cel7A纤维二糖水解酶I变体的全部编码序列应用0.5μl质粒DNA和3.2pmol的如下引物测序:
cTr0221.1:5′-CTTCTTGGCCACAGCTCGTG-3′(SEQ ID NO:22)
cTr0221.2:5′-GGCTTTGTCACCCAGTCTGC-3′(SEQ ID NO:23)
cTr0221.3:5′-CGTCATCCAACAACGCGAAC-3′(SEQ ID NO:24)
cTr0221.4:5′-TTCGAGACGTCGGGTGCCAT-3′(SEQ ID NO:25)
cTr0221.4:5′-CGCGGAAGCTGCTCCACCAG-3′(SEQ ID NO:26)
cTr0221.1A:5′-AATGGAGAGGCTGTTACCGC-3′(SEQ ID NO:27)
应用Vector NTI Contig Express(Informax,Inc.,Bethesda,MD)编辑并汇编序列跟踪文件。
实施例12:应用变体Cel7A纤维二糖水解酶I基因作为模板产生易错文库
将几个改进的变体进行随机突变。应用如实施例10中所述从酵母中已经复苏的质粒DNA并且如实施例7中所述进行易-错PCR。此外,所述G205R变体通过应用pNP776G205R作为易-错PCR中的模板来进行突变。如下的引物用于产生突变的序列:
引物aGal_776.1:
5’TATACCTCTATACTTTAACGTCAAGGAGAAAAAACTATAGGATCCACCATGTATCGGAAGTTGGCCG-3’(SEQ ID NO:28)
引物aGal_776.1a:
5’CATAACTAATTACATGATGCGGCCCTCTAGATGCACATGACTCGAGTTACAGGCACTGAGAGTAG-3’(SEQ ID NO:29)
所述易-错PCR扩增在0.7%琼脂糖凝胶上应用TAE缓冲液进行分析,并用带缺口的pJC106载体转化入酿酒酵母,如实施例7中所述。
从通过所述G205R模板的易-错扩增产生的筛选文库中得到变体76-M35、776-M40、776-M41、776-M42、776-M52和776-M53。变体776-252源自通过变体776-M57的突变扩增产生的文库。如实施例10中所述,复苏来自这些变体的DNA并进行测序。
实施例13:Cel7A纤维二糖水解酶I的重排文库
为了重排源自野生型Cel7A纤维二糖水解酶I和G205R模板的突变的所述Cel7A纤维二糖水解酶I变体,如实施例10所述,从所述变体中分离质粒DNA。应用如下引物,从所述变体中扩增所述Cel7A纤维二糖水解酶I基因:
引物CiPpcrdwn:
5’-CTGGGGTAATTAATCAGCGAAGCGATGA-3’(SEQ ID NO:30)
引物cJC106.1A:
5’-GCGTACACGCGTCTGTACA-3’(SEQ ID NO:31)
每个扩增反应(50μl)由1X PCR缓冲液、0.2mM dNTPs、3.2pM引物aGal_776.1、3.2pM引物aGal_776.1A、大约100ng pTr0221和2.5单位的TaqDNA聚合酶组成。将所述反应在Eppendorf Mastercycler 5333中温育,其程序为在94℃、3分钟的1个循环,然后是94℃30秒、55℃30秒和72℃90秒的30个循环(5分钟最终延伸)。然后应用QIAquick PCR试剂盒根据制造商的说明来纯化PCR产物。
为了重排所述的Cel7A纤维二糖水解酶I变体,将来自扩增的变体基因的PCR产物与大约50ng用BamH I和Xho I消化的pJC016组合,并将100-200ng混合的PCR片段根据YEASTMAKER酵母转化规程共-转化入酿酒酵母YNG 344以产生重排的文库,如在实施例7中所述。于是产生大量的重排的文库。包含在单文库中的变体的总数变化范围从2到10。这些文库中活性变体的百分比变化范围从87%至94%,基于实施例9中所述在4-甲基繖酮-beta-D-乳糖苷实验中测定的50℃活性。由于应用的Taq DNA聚合酶具有低校对活性,所以重排的过程可将新的突变导入所述Cel7A纤维二糖水解酶I编码序列。
从所述重排的文库中挑取菌落并如实施例9中所述进行筛选,应用4-甲基繖酮-beta-D-乳糖苷作为底物,应用64℃活性与50℃活性的比较来评估每个变体的热稳定性和热活性的改进程度。
所述重排文库的筛选导致改进的变体的分离,所述变体命名为776-M57、776-M101、776-M108、776-M109、776-M124、776-M125、776-M192和776-M216。如实施例10中所述复苏来自这些变体的DNA并进行测序。一些所述的取代通过通过变体776-M57、776-M101、776-M108、776-M109、776-M124、776-M125、776-M192和776-M216的DNA序列来鉴定,这些变体含有预先通过测序来自易-错文库的突变体而鉴定的取代。例如,776-M57含有S113N突变,所述突变也存在于所述重排文库的一个亲代(776-M4),由此亲代所述的取代。同样地,776-M101含有S411F,所述取代存在于所述重排文库的一个亲代(776-M27),由此亲代得到所述的取代。其他存在于源自重排文库的变体中的取代包括N49S、E193K、R251K、T246I、Y247C、Y371C和P438L,它们在包含对应的重排文库的亲代变体的已测序的变体中观察不到。这些突变可已经在构建所述重排文库时在扩增所述变体DNA的过程中通过PCR-介导的突变事件导入。
实施例14:位点特异性的饱和诱变
为了筛选在Cel7A纤维二糖水解酶I中的具体位置改进热活性的最佳取代,进行位点-特异性的随机化。氨基酸G94、S196和P227通过以NN(G/C)取代所述野生型密码子,应用megaprimer PCR(Landt,等,1990基因96:125-128)进行随机化。应用如下引物在下述三个位置进行随机化:
在位置94随机化:
引物aTrCBHI.2:
5’-GCGGTAACAGCCTCTCCATTNNSTTTGTCAC-3’(SEQ ID NO:32)
引物aTrCBHI.2a:
5’-CTGCGCAGACTGGGTGACAAASNNAATGGAGAG-3’(SEQ ID NO:33)
在位置196随机化:
引物aTrCBHI.3:
5’-CCATCTCCGAGGCTCTTACCNNSCACCCTTGC-3’(SEQ ID NO:34)
引物aTrCBHI.3a:
5’-GGCCGACAGTCGTGCAAGGGTGSNNGGTAAGAG-3’(SEQ ID NO:35)
在位置227随机化:
引物aTrCBHIR.1:
5’-GAGGGCTGGGAGCCGTCANNSAACAACGCG-3’(SEQ ID NO:36)
引物aTrCBHI.1bA:
5’-CCAATGCCCGTGTTCGCGTTGTTSNNTGACGGC-3’(SEQ ID NO:37)
每个扩增反应(50μl)由1X PCR缓冲液、0.2mM dNTPs、3.2pM的有义引物、3.2pM的反义引物、大约100ng pTr0221和2.5单位的Taq DNA聚合酶组成。所述反应在Eppendorf Mastercycler 5333中温育,其程序为在95℃、3分钟的1个循环,然后是95℃30秒、55℃60秒和72℃90秒的30个循环(5分钟最终延伸)。然后应用QIAquick PCR试剂盒根据制造商的说明来纯化PCR产物。每个为单位点突变产生的PCR片段作为重叠延伸扩增反应的megaprimer以产生完整的纤维二糖水解酶I基因片段用于产生文库,所述的基因片段具有指示的位点-特异性突变。所述扩增反应的前5轮由1X PCR缓冲液、0.2mM dNTPs、100ng的有义(5’)megaprimer、100ng的反义(3’)megaprimer和2.5单位的Taq DNA聚合酶组成。所述反应在EppendorfMastercycler 5333中温育,其程序为在95℃、3分钟的1个循环,然后是95℃30秒、55℃60秒和72℃90秒的5个循环。将50pmol的引物aGal776.1和aGal776.1A加入此反应以扩增新产生的位点随机化的片段,所述片段在前5个循环反应中产生。加入所述新引物后,将所述反应在Eppendorf Mastercycler5333中温育,其程序为在95℃30秒、55℃60秒和72℃90秒的30个循环(5分钟最终延伸)。然后应用QIAquick PCR试剂盒根据制造商的说明来纯化得到的PCR片段。然后将最终的PCR片段与BamH I和Xho I-切断(gap)的pJC106质粒(实施例6)一起直接转化入酵母。
由于应用的Taq DNA聚合酶具有低校对活性,饱和突变(saturationmutagenesis)的方法可将除在位置94、196和227设计的改变之外的新突变导入所述的编码序列。如实施例10中所述筛选含有位点-特异性的随机化的氨基酸的文库。如表2所示,除通过筛选随机-突变的文库鉴定的取代之外,发现了许多相对于野生型改进了在63℃/50℃的热活性比例的取代。例如,变体776-M3由筛选初级文库得到,其中在位置227的脯氨酸转变为丙氨酸。在此位置筛选所述位点-特异性的随机化的文库的过程中,我们鉴定了变为亮氨酸和变为甘氨酸以及丙氨酸的取代。
除了揭示在位置227、94和196的赋予改进的热稳定性和活性的氨基酸取代之外,鉴定了能增加热活性的第二个位点突变。具体的,在变体776-M273中鉴定了取代D259N,如表2所示。
表2.在位置227、94和196包含取代的具有改进的热稳定性的Cel7A变体。“增加倍数”表示热活性比例的相对改进,在63℃/50℃测定。
  Cel7A变体   氨基酸取代   增加倍数   文库类型
  野生型   无   1   无
  776-M3   P227A、C486W   2.67   初级
  776-M259   P227L   1.50   在227位点-特异性随机化
  776-M273   P227G、D259N   3.00   在227位点-特异性随机化
  776-M274   P227A   2.67   在227位点-特异性随机化
  776-M275   P227L   2.00   在227位点-特异性随机化
  776-M52   G94S、G205R   2.00   初级
  776-M268   G94A、T226A   2.67   在94位点-特异性随机化
  776-M264   G94R   2.07   在94位点-特异性随机化
  776-M266   G94Q   2.17   在94位点-特异性随机化
  776-M269   G94A   2.03   在94位点-特异性随机化
  776-M53   S196P、G205R   1.50   初级
776-M4   S113N、S196T、T462A n.a. 初级
  776-M261   S196P   1.33   在196位点-特异性随机化
  776-M263   T41I、S196F   1.67   在196位点-特异性随机化
*编号方式应用成熟Cel7A酶的第一个残基作为位置1。
实施例15:构建pMJ04、pMJ06和pMJ09表达载体
通过应用下面显示的引物993429(反义)和993428(有义)从Trichodermareesei RutC30基因组DNA中PCR扩增所述Trichoderma reesei纤维二糖水解酶1基因(cbh1)终止子来构建表达载体pMJ04。所述反义引物设计为在5’-末端具有Pac I位点并在有义引物的3’-末端具有Spe I位点。
引物993429(反义):5’-AACGTTAATTAAGGAATCGTTTTGTGTTT-3’(SEQ ID NO:38)
引物993428(有义):5’-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3’(SEQ ID NO:39)
应用DNeasy Plant Maxi试剂盒(QIAGEN,Valencia,CA)分离Trichodermareesei RutC30基因组DNA。所述扩增反应(50μl)由1X ThermoPol反应缓冲液(New England Biolabs,Beverly,MA)、0.3mM dNTPs、100ng Trichoderma reeseiRutC30基因组DNA、0.3μM引物993429、0.3μM引物993428和2单位的Vent聚合酶(New England Biolabs,Beverly,MA)组成。所述反应在EppendorfMastercycler 5333中温育,其程序为在94℃30秒、50℃30秒和72℃60秒的5个循环,然后是94℃30秒、65℃30秒和72℃120秒的25个循环(5分钟最终延伸)。所述反应产物在1.0%琼脂糖凝胶上应用TAE缓冲液分离,其中从所述凝胶上切除229bp产物条带并应用QIAquick凝胶提取试剂盒(QIAGEN,Valencia,CA)根据制造商的说明来纯化。
将得到的PCR片段用Pac I和Spe I消化并应用Rapid Ligation Kit(Roche,Indianapolis,IN)连接入用相同的限制性内切酶消化的pAlLo01(实施例8)以产生pMJ04(图8)。
通过应用下面显示的引物993696(反义)和993695(有义)从Trichodermareesei RutC30基因组DNA中PCR扩增所述Trichoderma reesei Cel7A纤维二糖水解酶1基因(cbh1)启动子来构建表达载体pMJ06。所述反义引物设计为在有义引物的5’-末端具有Sal I位点并在反义引物的5’-末端具有Nco I位点。
引物993695(有义):
5’-ACTAGTCGACCGAATGTAGGATTGTT-3’(SEQ ID NO:40)
引物993696(反义):
5’-TGACCATGGTGCGCAGTCC-3’(SEQ ID NO:41)
所述扩增反应(50μl)由1X ThermoPol反应缓冲液、0.3mM dNTPs、100ngTrichoderma reesei RutC30基因组DNA(其应用DNeasy Plant Maxi Kit制备、0.3μM引物993696、0.3μM引物993695和2单位的Vent聚合酶组成。所述反应在EppendorfMastercycler 5333中温育,其程序为在94℃30秒、55℃30秒和72℃60秒的30个循环(15分钟最终延伸)。所述反应产物在1.0%琼脂糖凝胶上应用TAE缓冲液分离,其中从所述凝胶上切除988bp产物条带并应用QIAquick凝胶提取试剂盒根据制造商的说明来纯化。
将得到的PCR片段用Nco I和Sal I消化并应用Rapid Ligation Kit连接入用相同的限制性内切酶消化的pMJ04以产生pMJ06(图9)。
通过应用下面显示的引物993843(反义)和99344(有义)从Trichodermareesei RutC30基因组DNA中PCR扩增所述Trichoderma reesei Cel7A纤维二糖水解酶1基因(cbh1)终止子来构建表达载体pMJ09。所述反义引物设计为在5’-末端具有Pac I和Spe I位点并在有义引物的5’-末端具有Pvu I位点。
引物993844(有义):
5’-CGATCGTCTCCCTATGGGTCATTACC-3’(SEQ ID NO:42)
引物993843(反义):
5’-ACTAGTTAATTAAGCTCCGTGGCGAAAG-3’(SEQ ID NO:43)
所述扩增反应(50μl)由1X ThermoPol反应缓冲液、0.3mM dNTPs、100ngTrichoderma reesei RutC30基因组DNA(其应用DNeasy Plant Maxi Kit提取)、0.3μM引物993844、0.3μM引物993843和2单位的Vent聚合酶组成。所述反应在Eppendorf Mastercycler 5333中温育,其程序为在94℃30秒、55℃30秒和72℃60秒的30个循环(15分钟最终延伸)。所述反应产物在1.0%琼脂糖凝胶上应用TAE缓冲液分离,其中从所述凝胶上切除473bp产物条带并应用QIAquick凝胶提取试剂盒根据制造商的说明来纯化。
将得到的PCR片段用Pvu I和Spe I消化并应用Rapid Ligation Kit连接入用Pac I和Spe I消化的pMJ06以产生pMJ09(图10)。
实施例16:构建pCW045用于在Trichoderma reesei中表达变体776-M57
将变体776-M57应用In-Fusion PCR克隆试剂盒(BD Biosciences,Clonetech,Palo Alto,CA)亚克隆入所述Trichoderma reesei表达载体pMJ09。所述变体的PCR扩增应用Platinum Pfx DNA聚合酶(Invitrogen,Carlsbad,CA)进行。扩增由1X Pfx扩增缓冲液、dCTP、dATP、dTTP和dGTP每种0.3mM;1mM MgSO4、1pmol引物IF-F1、1pmol引物IF-R1、50-100ng的DNA模板776-57和1单位的Pfx聚合酶。所述反应应用MJ Research Thermocycler温育,其程序为在95℃、3分钟的1个循环,然后是95℃15秒、55℃30秒和68℃2分钟的30个循环。然后将所述反应在72℃温育7分钟延伸。
引物IF-F1:
5’-CGCGGACTGCGCACCATGTATCGGAAGTTG-3’(SEQ ID NO:44)
引物IF-R1:
5’-CGCCACGGAGCTTAATTACAGGCACTGAGA-3’(SEQ ID NO:45)
每种PCR产物的等分试样应用TAE缓冲液,如前所述在0.7%琼脂糖凝胶上跑胶,以产生预期的大约1.575kb的条带。PCR反应应用MinElute PCR纯化试剂盒进行纯化并将所述的DNA洗脱至50μl的EB缓冲液。每种纯化的PCR产物的产量通过在应用TAE缓冲液的0.7%琼脂糖凝胶上的观察估计为125ng每微升。
用Pac I消化并在Nco I位点钝化的质粒pMJ09应用Qiaquick MinieluteColumn Kit(QIAGEN,Valencia,CA)来纯化。所述质粒具有100ng每微升的浓度。所述浓度通过在应用TAE缓冲液的0.7%琼脂糖凝胶上的观察来确认。克隆上述776-M57PCR产物和消化的pMJ09载体通过应用In-Fusion PCR克隆试剂盒(BD Biosciences,Clonetech,Palo Alto,CA)来完成。得到的含有变体776-M57的Trichoderma reesei表达载体命名为pCW045(图11)。
实施例17:在Trichoderma reesei中表达Cel7A纤维二糖水解酶I作为单独的纤维二糖水解酶I
为了在天然宿主中表达后评估所述的776-M57变体作为单独的纤维二糖水解酶(cellobhiohydrolase)I,构建Trichoderma reesei菌株,其中所述的纤维二糖水解酶I Cel7A基因cbh1已经被破坏。应用来自大肠杆菌的潮霉素抗性基因(hph)作为可选择的标记来构建破坏盒(disruption cassette)。所述hph标记两翼为同源的cbh1序列以靶向天然的cbh1基因。
扩增所述基因组的cbhI基因应用聚合酶链式反应方法及PWO聚合酶(Roche Applied Science,Manheim,Germany)来完成。所述反应在EppendorfMastercycler 5333中温育。扩增由1X PWO扩增缓冲液、dCTP、dATP、dTTP和dGTP每种0.3mM、1mM MgSO4、下述引物cbh1N-term和cbhIC-term每种1pmol和50-100ng DNA模板组成。扩增应用在95℃初始变性2分钟,然后是变性1分钟、在55℃退火2分钟和在68℃延伸2分钟的35个循环。
引物cbh1N-term:
5’-GCC TTC GGC CTT TGG GTG TA-3’(SEQ ID NO:46)
引物cbh1C-term:
5’-GAG CGG CGA TTC TAC GGG TT-3’(SEQ ID NO:47)
所述2.3kb PCR片段应用Zero Blunt TOPO PCR克隆试剂盒(InvitrogenCorporation,Carlsbad,CA)克隆并在大肠杆菌Top10细胞(InvitrogenCorporation,Carlsbad,CA)中增殖。得到的构建体为5.8kb质粒,其命名为pSTM01(图12)。
所述bph基因从所述的PHT1质粒(Cummings等,1999,Curr.Genet.36:371-382)应用聚合酶链式反应方法及PWO聚合酶来扩增。所述反应在Eppendorf Mastercycler 5333中温育。扩增由1X PWO扩增缓冲液、dCTP、dATP、dTTP和dGTP每种0.3mM、1mM MgSO4、下述引物hph N-term和hph C-term每种1pmol和50-100ng DNA模板组成。扩增应用在95℃初始变性2分钟,然后是变性1分钟、在55℃退火2分钟和在68℃延伸2分钟的35个循环。
引物hph N-term:
5’-GCC GCG GCA CGC GCC ACA CGG AAA AT-3’(SEQ ID NO:48)
引物hph C-term:
5’-GAC CGG TCG CAA AAT GAC AAA TAG AAG-3’(SEQ ID NO:49)
为了产生所述的cbh1破坏盒,将pSTM01用Mlu I和BstE II消化以在所述cbhI编码序列中产生1.1kb缺口。然后应用T4DNA聚合酶(New EnglandBiolabs,Beverly,MA)来填充并在消化的质粒中产生钝端。将所述T4反应在15℃温育20分钟,然后在65℃热失活15分钟。将全部的反应混合物在应用TAE缓冲液的1%琼脂糖凝胶上分级,切除主要的条带并应用Qiaquick凝胶提取试剂盒从该凝胶洗脱。然后将1.7kb hph基因应用Rapid DNA LigationKit插入有缺口的pSTM01载体并转化入One Shot大肠杆菌感受态细胞(Invitrogen Corporation,Carlsbad,CA)。所得的质粒命名为pSMKO3(图13)。
应用pSMKO3作为模板,应用hph基因侧接的PCR引物扩增cbhI DNA。从pSMKO3应用下列引物扩增2.7kb片段:
引物pSMK03-F1:
5’-GCTCCGGGCAAATGCAAA GTG TG-3’(SEQ ID NO:50)
引物pSMK03-R1:
5’-AGCAGGCCGCATCTCCAGTGAAAG-3’(SEQ ID NO:51)
所述扩增应用聚合酶链式反应方法及PWO聚合酶来进行。所述反应在Eppendorf Mastercycler 5333中温育。扩增由1X PWO扩增缓冲液、dCTP、dATP、dTTP和dGTP每种0.3mM、1mM MgSO4、下述引物KO N-term和KO C-term每种1pmol和50-100ng DNA模板组成。扩增应用在95℃初始变性2分钟,然后是变性1分钟、在55℃退火2分钟和在68℃延伸2分钟的35个循环。所得的DNA片段含有639kb的cbhI启动子/基因序列、1.7kb的hph编码区和659个碱基的cbhI基因/终止子序列。
制备Trichoderma reesei RutC30的原生质体用于通过下列的方法进行转化。用5X107个分生孢子接种含有25ml YPD培养基的摇瓶。在34℃(150rpm)培育过夜(大约18小时)之后,通过经无菌的MiraclothTM(Calbiochem,SanDiego,CA)过滤来收集菌丝体并转移至25ml的1M山梨醇中的20mg/mlGlucanex(Novozymes A/S,
Figure A20048003151601961
Denmark)和1.6mg/ml壳多糖酶(Sigma-Aldrich,St.Louis,MO)。消化通常在34℃轻微振荡(80-100rpm)的条件下进行25-40分钟。然后将所述原生质体通过滤网过滤并以冰冻的1M山梨醇洗涤,然后在400x g离心8分钟。将原生质体用25m 1M山梨醇洗涤两次并用25ml1M山梨醇、50mM Tris-HCl pH8.0、50mM CaCl2洗涤两次。然后将原生质体应用血球计数器(haemacytometer)计数并以1X 108个原生质体/ml的浓度重悬于由7份1M山梨醇、50mM Tris-HCl pH 8.0、50mM CaCl2和2份50%PEG-4000、50mM Tris-HCl pH 8.0、50mM CaCl2组成的溶液。原生质体或者立即应用或者在-80℃贮存在控速制冷器(Nalge NuncInternational,Rochester,NY)中直到转化。
应用混合并在冰上保温5分钟的5μg线性DNA和5μl肝素(5mg/ml)来进行所述原生质体的转化。然后加入100微升的原生质体并将所述混合物在冰上保温15分钟。然后加入500微升的50%PEG-4000、50mM Tris-HCl pH8.0、50mM CaCl2并在室温温育15分钟。将100毫升50%PEG-4000、50mMTris-HCl pH 8.0、50mM CaCl2加入所述混合物并在34℃温育20分钟。在34℃温育之后,加入2ml的1M山梨醇、50mM Tris-HCl pH 8.0、50mM CaCl2。将所述内容物在将350μl的原生质体混合物铺于PDA平板之前进行轻微地混合。在PDA培养基中以100μg/ml潮霉素B(Roche Applied Science,Manheim,Germany)覆盖之前将所述平板在29℃温育大约18小时。3天内的潮霉素覆盖出现转化体。然后将转化体次培养至含有100μg/ml潮霉素B的PDA平板。然后将在所述第二平板上生长的转化体用于接种到纤维素酶诱导培养基(CIM)。
筛选纤维二糖水解酶I通过如下方法破坏的菌株。将转化体在纤维素酶-诱导培养基中在24-孔组织培养平板内(Corning,Acton,MA)在34℃生长3天。将10微升的培养液加入加1%beta-巯基乙醇的10μl 2X样品缓冲液,并在8-16%Tris-甘氨酸丙烯酰胺凝胶(NUPAGE Novex Gels Invitrogen Corporation,Carlsbad,CA)上应用NuPAGE
Figure A20048003151601962
MES SDS电泳缓冲液(NUPAGE Novex GelsInvitrogen Corporation,Carlsbad,CA)跑胶。基于纤维二糖水解酶I Cel7A蛋白条带相比于亲代菌株的缺失来选择可能的敲除体。
为了证实所述cbh1基因在已经通过SDS-PAGE分析选择的候选菌株中的缺失,进行Southern分析以评价所述cbh1基因是否已被破坏。菌丝体在含有25ml YPD培养基的摇瓶中过夜生长。然后收获、过滤并应用研钵和杵及液氮磨碎所述菌丝体。应用DNeasy Plant Maxi试剂盒分离基因组DNA。将1微克DNA用Hind III或Nde I消化并在TAE缓冲液中的0.8%琼脂糖凝胶上跑胶。通过以0.25M HCl处理用将所述DNA在所述凝胶中碎裂,用0.5MNaOH、1.5M NaCl变性,并用1M Tris、pH8.0中和;1.5M NaCl用于后续在10X SSC中转移至Nytran Plus membrane(Schleicher & Schuell BioScience,GmbH,Dassel,Germany)。所述的DNA与所述的膜UV-交联并在60℃于20mlDIG Easy Hyb(Roche Applied Science,Manheim,Germany)预杂交1小时。
制备两个探针用于Southern分析。1.7kb潮霉素探针从pSMK03应用聚合酶链式反应和下列引物进行扩增:
引物cpht-p:
5’-GCACGCGCCACACGGAAAAT-3’(SEQ ID NO:52)
引物cpht-t:
5’-CGCAAAATGACAAATAGAAG-3’(SEQ ID NO:53)
此外,2.1kb纤维二糖水解酶I探针从pSTM01应用引物pSMK03-F1和pSMK03-R1通过PCR进行扩增。探针以PCR DIG Probe Synthesis Kit(RocheApplied Science,Manheim,Germany)制备。所述PCR DIG Probe Synthesis mix和含镁的PCR缓冲液以1X应用。将Expand High Fidelity聚合酶(RocheApplied Science,Manheim,Germany)以每个反应0.75μl加入。每个反应应用1pmol每种引物和50-100ng DNA模板。应用之前将所述探针通过煮沸5分钟变性然后加入所述的杂交缓冲液。
将变形的探针直接加入所述DIG Easy Hyb缓冲液并在65℃杂交过夜。杂交后洗涤(两次在2X SSC中,一次在0.4X SSC中,60℃,每次10分钟)之后,应用DIG检测系统和CPD-Star(Roche Applied Science,Manheim,Germany)进行化学发光检测。所述DIG-标记的DNA分子量标记III试剂盒(Roche Applied Science,Manheim,Germany)用作标准标记的来源。
Southern分析显示单hph整合入特异性的转化体的cbh1基因的存在。此纤维二糖水解酶I基因缺失菌株命名为Trichoderma reesei SaMe013。
将在所述cbh1启动子之后含有所述纤维二糖水解酶I变体776-M57的质粒pCW045,通过PEG-介导的转化(Penttila等,1987,基因61:155-164)导入Trichoderma reesei SaMe013。所述质粒包含所述构巢曲霉amdS基因以使转化体能在以乙酰胺作为单一氮源生长。将Trichoderma reesei RutC30在27℃和90rpm在25ml添加10mM尿苷的YPD培养基中培养17小时。应用Millipore’s Vacuum Driven Disposable Filtration System(Millipore,Bedford,MA)通过过滤收集菌丝体并用去离子水洗涤两次及用1.2M山梨醇洗涤两次。通过将洗涤的菌丝体悬于含有15mg Glucanex每ml和0.36单位壳多糖酶每ml的20ml1.2M山梨醇并在34℃及90rpm轻微振荡的条件下温育15-25分钟来产生原生质体。通过在400x g离心7分钟收集原生质体并用冰冻的1.2M山梨醇洗涤两次。应用血球计数器计数所述的原生质体并重悬于STC至1X108原生质体每ml的终浓度。多余的原生质体在-80℃贮存于Cryo 1℃冷冻容器(Nalgene,Rochester,NY)中。
将大约1μg Pme I消化的pCW045加入100μl原生质体溶液并轻微地混合,然后是260μl的PEG缓冲液,混合并在室温温育30分钟。然后加入STC(3ml),混合并将所述转化溶液应用构巢曲霉amdS选择铺于COVE平板上。将所述平板在28℃温育5-7天。将转化体在COVE2加尿苷平板上进行次培养并在28℃生长7天。
将所述Trichoderma reesei转化体在以所述转化体的孢子接种的含有25ml pH 6.0的纤维素酶-诱导培养基的125ml带挡板的摇瓶中培养并在28℃和200rpm温育7天。将Trichoderma reesei RutC30作为对照进行操作。在第7天取出培养液样品。应用Criterion Tris-HCl(8-16%聚丙烯酰胺)凝胶(BioRad,Hercules,CA)及Criterion SDS-PAGE System(B ioRad,Hercules,CA)进行SDS-PAGE。将5μl的7天上清悬浮于5μl的2X样品缓冲液(BioRad,Hercules,CA)并在1%beta-巯基乙醇存在下加热5分钟。将所述上清样品上样于聚丙烯酰胺凝胶并以1X Tris/甘氨酸/SDS作为电泳缓冲液(BioRad,Hercules,CA)进行电泳。将得到的凝胶用Bio-Safe Coomassie Stain(BioRad,Hercules,CA)染色。评价候选转化体以显然等于所述Trichoderma reesei亲代菌株中观察到的水平的水平表达所述变体Cel7A纤维二糖水解酶I 776-M57的能力。在此基础上选择单一转化体用于在发酵中进行较大规模生产。
应用表达纤维二糖水解酶I变体776-M57的菌株进行发酵,并将Trichoderma reesei RutC30(宿主菌株)作为对照进行操作。将Trichodermareesei RutC30的孢子接种入含有100ml木霉接种物培养基的500ml摇瓶。将所述摇瓶置于定轨振荡器(orbital shaker)在28℃振荡大约48小时,此时将50ml的培养物接种入2升发酵容器中的1.8升的木霉发酵培养基。所述发酵在pH 5.0、28℃、及在1.0VVM通气量和1100搅拌的25%的最小溶氧的条件下运行。在18小时将木霉补料培养基加入所述的发酵容器,以3.6g/小时的补料速率进行33小时,然后为7.2g/小时。所述发酵运行165小时,此时将最终的发酵液离心并将所述上清贮存在-20℃。
实施例18:在烟曲霉的基因组序列中鉴定糖基水解酶家族GH3A基因
应用来自棘孢曲霉的beta-糖苷酶蛋白序列(登记号No.P48825)作为查询物,进行所述烟曲霉部分基因组序列(The Institute for Genomic Research,Rockville,MD)的tblastn搜索(Altschul等,1997,Nucleic Acids Res.25:3389-3402)。基于在氨基酸水平与所述查询序列的高度相似性,将几个基因鉴定为推定的家族GH3A同源物。选择在氨基酸水平与所述查询序列具有大于70%同一性的大约3000bp的一个基因组区用于进一步研究。
实施例19:烟曲霉基因组DNA提取
将烟曲霉在250ml的马铃薯葡萄糖培养基中,在带挡板的摇瓶中,在37℃和240rpm生长。菌丝体通过过滤来收获,在TE缓冲液(10mM Tris-1mMEDTA)中洗涤两次和冷冻在液氮中。冷冻的菌丝体通过研钵和杵研磨成细粉,将所述细粉重悬于含有10mM Tris、100mM EDTA、1%Triton X-100、0.5M盐酸胍(guanidine-HCl)和200mM NaCl的pH 8.0缓冲液。将无Dnase的RNaseA以20mg/升的浓度加入并将所述的裂解物在37℃温育30分钟。细胞碎片通过离心去除,并通过应用Qiagen Maxi 500柱(QIAGEN Inc.,Valencia,CA)分离DNA。所述的柱子在10ml的QBT中平衡,以30ml的QC洗涤并以15ml的QF洗脱(所有的缓冲液来自QIAGEN Inc.,Valencia,CA)。DNA在异丙醇中沉淀,在70%乙醇中洗涤,并通过离心回收。所述的DNA重悬于TE缓冲液中。
实施例20:克隆家族GH3A beta-糖苷酶基因和构建米曲霉表达载体
设计下面显示的两个合成的寡核苷酸引物,以从实施例19中制备的基因组DNA中,PCR扩增编码推定的家族GH3A beta-葡糖苷酶的烟曲霉基因。应用InFusion Cloning Kit(BD Biosciences,Palo Alto,CA)将所述的片段直接克隆到表达载体pAILo2(实施例8;图5)。
正向引物:5’-ACTGGATTTACC
Figure A20048003151602001
-3’(SEQID NO:54)
反向引物:5’-AGTCACCTCTAGTTA
Figure A20048003151602002
-3’(SEQID NO:55)
粗体字母代表编码序列。所剩余的序列与pAILo2(图5)的插入位点同源。
将50皮摩尔的每种上述引物用于PCR反应,所述反应中含有100ng的烟曲霉基因组DNA、1×Pfx扩增缓冲液(Invitrogen,Carlsbad,CA)、1.5μl的10mM dATP、dTTP、dGTP和dCTP的混合物、2.5单位的Platinum Pfx DNA聚合酶(Invitrogen,Carlsbad,CA)、1μl的50mM MgSO4和2.5μl的10×pCRx增强剂溶液(Invitrogen,Carlsbad,CA),其终体积为50μl。所述的扩增条件为一个循环,在94℃进行2分钟;和30个循环,每个在94℃进行15秒、在55℃进行30秒和在68℃进行3分钟。然后加热块进行4℃保温(soak)循环。
所述的反应产物应用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠(TAE)缓冲液,在1.0%琼脂糖凝胶上分离,其中从所述凝胶上切除3kb产物条带,并应用QIAquick凝胶提取试剂盒(QIAGEN,Valencia,CA),根据制造商的说明进行纯化。
然后将所述的片段应用Infusion Cloning Kit克隆到pAILo2表达载体中。所述的载体用限制性内切酶Nco I和Pac I(应用制造商详述的条件)进行消化。所述的片段通过凝胶电泳和Qiaquick凝胶纯化进行纯化。所述的基因片段和切割载体在反应中连接在一起,得到表达质粒pEJG97(图14),其中家族GH3Abeta-葡糖苷酶基因的转录在NA2-tpi启动子的控制之下。所述反应(50μl)由1×InFusion缓冲液(BD Biosciences,Palo Alto,CA)、1×BSA(BD Biosciences,Palo Alto,CA)、1μl的Infusion酶(1∶10稀释)(BD Biosciences,Palo Alto,CA)、150ng用Nco I和Pac I消化的pAlLo2和50ng的烟曲霉beta-葡糖苷酶纯化的PCR产物组成。所述的反应在室温温育30分钟。1μl的所述反应用于转化大肠杆菌XL10 Solopac Gold细胞(Stratagene,La Jolla,CA)。含有所述的pEJG97质粒的大肠杆菌转化体通过限制消化所述质粒进行检测,并且应用BioRobot 9600(QIAGEN,Inc.,Valencia,CA)制备质粒DNA。
实施例21:表征编码家族GH3A beta-葡糖苷酶的烟曲霉基因组序列
来自pEJG97的烟曲霉beta-葡糖苷酶基因的DNA测序,应用染料-终止子化学(Giesecke等,1992,Journal of Virology Methods 38:47-60)和引物步移(primer walking)策略以Perkin-Elmer Applied Biosystems Model 377XL自动DNA测序仪(Perkin-Elmer/Applied Biosystems,Inc.,Foster City,CA)进行。仔细检查核苷酸序列数据的质量并借助于PHRED/PHRAP软件(University ofWashington,Seattle,WA)将所有序列进行相互比较。
基于与来自棘孢曲霉、黑曲霉和川地曲霉(Aspergillus kawachii)的同源基因的相似性,构建烟曲霉序列的基因模型。所述的核苷酸序列(SEQ ID NO:56)和推导的氨基酸序列(SEQ ID NO:57)在图15中显示。所述的基因组片段编码863个氨基酸的多肽,其被62、55、58、63、58、58、63和51bp的8个内含子中断。所述基因的%G+C含量为54.3%。应用SignalP软件程序(Nielsen等,1997,Protein Engineering 10:1-6),预测了19个残基的信号肽。预测的成熟蛋白包含844个氨基酸,具有91.7kDa的分子量。
应用Clustal W方法(Higgins,1989,C4BI055:151-153)测定beta-葡糖苷酶序列的比较比对(comparative alignment),应用具有同一性表和下述多个比对参数的LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)进行确定:缺口罚10分和缺口长度罚10分。配对比对参数为Ktuple=1,缺口罚分=3,窗口(window)=5和对角线(diagonal)=5。所述的比对显示,所述烟曲霉beta-葡糖苷酶基因的推导的氨基酸序列,与棘孢曲霉(登录号P48825)、黑曲霉(登录号O00089)和川地曲霉(登录号P87076)beta-葡糖苷酶的推导的氨基酸序列,分享78%、76%和76%的同一性。
实施例22:在米曲霉JAL250中表达烟曲霉家族GH3A beta-糖苷酶基因
米曲霉Jal250原生质体根据Christensen等,1988,Bio/Technology 6:1419-1422的方法制备。5μg的pEJG97(以及pAILo2作为载体对照)用于转化米曲霉JAL250。
用pEJG97转化米曲霉Jal250得到大约100个转化体。将10个转化体分离到单独的PDA平板。
10个转化体中的5个汇合的PDA平板,用5ml的0.01%Tween 20洗涤,并单独地接种到125ml玻璃摇瓶内的25ml MDU2BP培养基中,并在34℃、250rpm温育。温育5天后,来自每个培养物的0.5μl上清,应用8-16%Tris-甘氨酸SDS-PAGE凝胶(Invitrogen,Carlsbad,CA),根据制造商的说明进行分析。所述培养物的SDS-PAGE图样显示,转化子中一个(命名为转化体1)具有大约130kDa的主条带。
(在PDA上生长的)转化体1的汇合的平板用10ml的0.01%Tween 20洗涤并接种入含有400ml MDU2BP培养基的2升Fernbach以产生培养液用于表征所述的酶。所述摇瓶在第5天收获并应用0.22μm GP Express plusMembrane(Millipore,Bedford,MA)过滤。
pEJG97在米曲霉中的单转化体在发酵罐中生长。将米曲霉的孢子接种入500ml摇瓶,其中含有100ml的接种培养基。将所述摇瓶置于定轨振荡器在34℃振荡大约24小时,此时将50ml的培养物接种入2升发酵容器中的1.8升发酵培养基。所述发酵在pH 7.0、34℃、及在1.0VVM通气量和1100搅拌的25%的最小溶氧的条件下运行。在溶氧尖峰(spike)时将补料培养基以4g/小时的补料速率加入所述的发酵容器。所述发酵运行164小时,此时将最终的发酵液离心并将所述上清贮存在-20℃。
实施例23:表征烟曲霉beta-葡糖苷酶
如实施例22中所述得到的烟曲霉beta-葡糖苷酶的3ml等分试样,应用BioRad Econo-Pac 10DG脱盐柱(BioRad,Hercules,CA)脱盐,得到100mM柠檬酸钠pH 5.0中大约4ml脱盐的培养液。然后将所述脱盐的培养液应用Amicon Centricon Plus-20(Biomax-5,5kDa截流,PES膜)浓缩至大约180μl并以100mM柠檬酸钠pH 5.0稀释到大约500μl的终体积。所述脱盐的、浓缩的培养液的BCA分析(Smith等,1985,Anal.Biochem.150:76-85)显示1.00mg蛋白每ml的浓度。也将第二份等分试样脱盐以得到更多的材料,其产生相似的结果。
浓缩的脱盐的样品的SDS-PAGE(BioRad Criterion 7.5%Tris-HCl)显示大约130kD的主条带。从所述凝胶上切除该130kD的主条带并进行N-末端氨基酸测序。
评价来自脱盐的/浓缩的培养液的烟曲霉beta-糖苷酶在50°、65°和70℃的热稳定性。在50°和65℃的测试条件为:100mM柠檬酸钠pH 5.0、0.01%Tween-20、4mM对-硝基苯基-beta-D-吡喃葡萄糖苷、[蛋白质]AfumGH3A=6.9X10-6mg/ml,在50°和65℃温育。在0.5、1、2、3、3.75和24小时取出等分试样。向每一个等分试样加入1M碳酸钠pH 10.0并由405nm的吸光度测定对-硝基苯基阴离子浓度。在70℃,所述测试条件为:100mM柠檬酸钠(pH5.0)、0.01%Tween-20、4mM对-硝基苯基-beta-D-吡喃葡萄糖苷、[蛋白质]=5.6X 10-6mg/ml。在0.25、0.5、1、2、4和5小时取出等分试样。向每一个等分试样加入1M碳酸钠pH 10.0并由405nm的吸光度测定对-硝基苯基阴离子浓度。注意上述每种蛋白质浓度是指试验中的总蛋白质浓度,因为它们作为培养液全部进行分析而不是纯化的酶。
所述结果显示于图16和17中。热稳定性定义为给定时间间隔的线性反应动力学,具有合理的转化为对-硝基苯基阴离子的转化百分比(<15%)。所述烟曲霉beta-糖苷酶看起来在50℃至少24小时是稳定的,虽然在4小时和24小时之间没有时间点。在65℃它看起来至少3.75小时是稳定的,但之后稳定性逐渐降低,在24小时65%转化为对-硝基苯基阴离子。此转化率是很高的,所以一些观察到的速率下降除了可能的热失活之外,可能由于底物耗尽和/或产物抑制。在70℃它看起来1小时是稳定的,至2小时是比较稳定的。
如实施例22所述得到的含有来自烟曲霉的家族GH3A beta-糖苷酶的培养液,首先进行脱盐(BioRad Econo-Pac 10DG柱)并浓缩(Centricon Plus-20,Biomax-5,5kD截流)至0.92mg/ml的浓度(BCA分析)。然后,以0.037和0.0092μg/ml总蛋白用100mM柠檬酸钠pH 5.0中的10mM纤维二糖加0.01%Tween-20在65℃温育。在0.5、1、2、3、4、6和19小时取出等分试样。将等分试样煮沸6分钟以终止所述反应,并且应用Trinder分析(SigmaChemical Co.,St.Louis,MO)和外部葡萄糖标准物测定葡萄糖浓度。结果在图18中显示。在65℃、较小蛋白上样量(0.0092μg/ml)的条件下,所述beta-糖苷酶6小时时看起来保持其活性的90%,而至19小时保持其活性的65%。在65℃所述beta-糖苷酶直到6小时看起来是比较稳定的。
实施例24:Cel7A变体776-M57与木霉属纤维素酶结合的实验
预处理的玉米秸秆(PCS)从美国能源部国家可再生能源实验室(NationalRenewable Energy Laboratory)(NREL)获得。PCS中水-不溶性的固体包括:56.5%纤维素、4.6%半纤维素和28.4%木质素(lignin)。预处理条件为:玉米秸秆、1.4%(重量/体积)硫酸、165℃、107p.s.i.、进行8分钟。在分析前,用大量蒸馏的去离子水在玻璃过滤器上洗涤PCS。然后应用咖啡磨碎机(coffeegrinder)磨碎PCS以减小粒度,然后进一步用水在22μm Millipore过滤器(6PExpress Membrane,Stericup,Millipore,Billerica,MA)上洗涤。将洗涤的PCS在去离子水中重悬以形成20mg/ml悬浮液并贮存在4℃。
将Trichoderma reesei发酵液过滤(0.4μm膜,Stericup,Millipore,Billerica,MA),并通过BCA分析(Pierce Biotech.,Inc.,Rockford,IL)测定蛋白质含量。在所述PCS测定中应用来自烟曲霉的热稳定的beta-糖苷酶。所述烟曲霉beta-糖苷酶如实施例22中所述制备。将异源表达的烟曲霉beta-糖苷酶的发酵液进行过滤(0.4μm膜,Stericup,Millipore,Billerica,MA),并通过BCA分析(Pierce,Biotech.,Inc.,Rockford,IL)测定蛋白质含量。PCS测定在1.0ml的体积中进行。测定包括10mg PCS每ml、50mM乙酸钠缓冲液(pH5.0)、8.5mg总发酵液蛋白质每克纤维素和0.27mg烟曲霉beta-糖苷酶发酵液。实验在55℃和60℃密封试管中(Immuno Ware Microtubes,Pierece Biotech.,Inc.,Rockford,IL)保持5天,并间歇地倒转试管。
大约每24小时的时间点(time points),从所述PCS反应中取样。从所述试管中将10微升等分试样移入90μl的碱猝灭(quench)法混合物(0.102MNa2CO3加0.058M NaHCO3)。将所述的碱猝灭样品稀释至起始浓度的八分之一或十六分之一。样品中通过降解PCS产生的还原糖的浓度通过对-羟基苯甲酸酰肼(PHBAH)实验(Lever,1972,Anal Biochem 47:273-279),应用碱猝灭法混合物中的2份1.25%PHBAH加入3份猝灭实验溶液进行测定。然后将此溶液在95℃加热10分钟,然后将样品稀释入水中,应用UltraMark Plate Reader(Bio-Rad,Hercules,CA)在405nm测定吸光度。将405nm的吸光度应用葡萄糖标准曲线转化为葡萄糖等同物。最后,应用纤维素的初始浓度和纤维素转化为葡萄糖中的增重(weight gain)因子计算纤维素转化的程度。纤维素转化为还原糖的程度(RS收率,%)应用如下的公式进行计算:
RS收率(%)=RS(mg/ml)*100*162/(5.65(mg/ml)*180)
          =RS(mg/ml)*100/(5.65(mg/ml)*1.111)
图19显示通过所述亲代Trichoderma reesei菌株,和表达变体776-M57的菌株代替野生型Cel7A纤维二糖水解酶I的PCS水解的时间过程曲线。显然含有所述变体的菌株在这些条件下胜过(outerforms)所述的亲代。
生物材料保藏
依据布达佩斯条约的条款,下述的生物材料已经保藏于农业研究机构保藏中心,北方区研究中心(Agricultural Research Service Patent CultureCollection,Northern Regional Research Center),1815 University Street,Peoria,Illinois,61604,给出了下述的保藏号:
保藏物(Deposit)     保藏登记号      保藏日期
pAJO52              NRRL B-30683    2003年7月29日
776-M1              NRRL B-30657    2003年5月22日
776-M4              NRRL B-30658    2003年5月22日
776-M23             NRRL B-30659    2003年5月22日
776-M26             NRRL B-30661    2003年5月22日
776-M32             NRRL B-30662    2003年5月22日
776-M53             NRRL B-30663    2003年5月22日
776-M57             NRRL B-30664    2003年5月22日
776-M108            NRRL B-30665    2003年5月22日
776-M109            NRRL B-30666    2003年5月22日
776-M21             NRRL B-30674    2003年7月28日
776-M22             NRRL B-30675    2003年7月28日
776-M41             NRRL B-30676    2003年7月28日
776-M42             NRRL B-30677    2003年7月28日
776-M52             NRRL B-30678    2003年7月28日
776-M71             NRRL B-30679    2003年7月28日
776-M73             NRRL B-30680    2003年7月28日
776-M124            NRRL B-30681    2003年7月28日
776-M125            NRRL B-30682    2003年7月28日
776-M273            NRRL B-30762    2004年8月25日
该菌株于下述条件下保藏:确保在本专利申请未决期间,由专利与商标委员依据37C.F.R.§1.14和35U.S.C.§122授权的人能够获得该培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交了该主题申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得该保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。
在此描述并要求的本发明不局限于在此公开的具体实施方案的范围内,因为这些实施方案旨在作为本发明的某些方面的说明。任何等同的实施方案确定地包含在本发明的范围内。实际上,除去在这里显示和描述的那些之外,对本发明前述的说明书的各种更改,对于本领域的那些技术人员是显而易见的。这样的更改也确定地落在附加的权利要求的范围内。在有冲突的情况下,以包含定义的本公开为准。
在此引用各种参考文献,其公开整体地并入作为参考。
序列表
<110>诺维信股份有限公司(Novozymes Biotech,Inc.)
<120>糖苷水解酶的变体
<130>10479.204-WO
<150>60/497,809
<151>2003-08-25
<160>57
<170>PatentIn version 3.2
<210>1
<211>1545
<212>DNA
<213>Trichoderma reesei
<220>
<221>CDS
<222>(1)..(1539)
<220>
<221>sig_peptide
<222>(1)..(51)
<220>
<221>mat_peptide
<222>(52)..()
<400>1
atg tat cgg aag ttg gcc gtc atc tcg gcc ttc ttg gcc aca gct cgt     48
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
        -15                 -10                 -5
gct cag tcg gcc tgc act ctc caa tcg gag act cac ccg cct ctg aca     96
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
-1  1               5                   10                  15
tgg cag aaa tgc tcg tct ggt ggc acg tgc act caa cag aca ggc tcc    144
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
                20                  25                  30
gtg gtc atc gac gcc aac tgg cgc tgg act cac gct acg aac agc agc    192
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
            35                  40                  45
acg aac tgc tac gat ggc aac act tgg agc tcg acc cta tgt cct gac    240
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
        50                  55                  60
aac gag acc tgc gcg aag aac tgc tgt ctg gac ggt gcc gcc tac gcg    288
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
    65                  70                  75
tcc acg tac gga gtt acc acg agc ggt aac agc ctc tcc att ggc ttt    336
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
80                  85                  90                  95
gtc acc cag tct gcg cag aag aac gtt ggc gct cgc ctt tac ctt atg    384
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
                100                 105                 110
gcg agc gac acg acc tac cag gaa ttc acc ctg ctt ggc aac gag ttc    432
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
            115                 120                 125
tct ttc gat gtt gat gtt tcg cag ctg ccg tgc ggc ttg aac gga gct     480
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
        130                 135                 140
ctc tac ttc gtg tcc atg gac gcg gat ggt ggc gtg agc aag tat ccc     528
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
    145                 150                 155
acc aac acc gct ggc gcc aag tac ggc acg ggg tac tgt gac agc cag     576
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
160                 165                 170                 175
tgt ccc cgc gat ctg aag ttc atc aat ggc cag gcc aac gtt gag ggc     624
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
                180                 185                 190
tgg gag ccg tca tcc aac aac gcg aac acg ggc att gga gga cac gga     672
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
            195                 200                 205
agc tgc tgc tct gag atg gat atc tgg gag gcc aac tcc atc tcc gag     720
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
        210                 215                 220
gct ctt acc ccc cac cct tgc acg act gtc ggc cag gag atc tgc gag     768
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
    225                 230                 235
ggt gat ggg tgc ggc gga act tac tcc gat aac aga tat ggc ggc act     816
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
240                 245                 250                 255
tgc gat ccc gat ggc tgc gac tgg aac cca tac cgc ctg ggc aac acc     864
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
                260                 265                 270
agc ttc tac ggc cct ggc tca agc ttt acc ctc gat acc acc aag aaa     912
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
            275                 280                 285
ttg acc gtt gtc acc cag ttc gag acg tcg ggt gcc atc aac cga tac     960
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
        290                 295                 300
tat gtc cag aat ggc gtc act ttc cag cag ccc aac gcc gag ctt ggt    1008
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
    305                 310                 315
agt tac tct ggc aac gag ctc aac gat gat tac tgc aca gct gag gag    1056
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
320                 325                 330                 335
gca gaa ttc ggc gga tcc tct ttc tca gac aag ggc ggc ctg act cag    1104
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
                340                 345                 350
ttc aag aag gct acc tct ggc ggc atg gtt ctg gtc atg agt ctg tgg    1152
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
            355                 360                 365
gat gat tac tac gcc aac atg ctg tgg ctg gac tcc acc tac ccg aca    1200
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
        370                 375                 380
aac gag acc tcc tcc aca ccc ggt gcc gtg cgc gga agc tgc tcc acc    1248
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
    385                 390                 395
agc tcc ggt gtc cct gct cag gtc gaa tct cag tct ccc aac gcc aag    1296
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
400                 405                 410                 415
gtc acc ttc tcc aac atc aag ttc gga ccc att ggc agc acc ggc aac    1344
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
                420                 425                 430
cct agc ggc ggc aac cct ccc ggc gga aac ccg cct ggc acc acc acc    1392
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
            435                 440                 445
acc cgc cgc cca gcc act acc act gga agc tct ccc gga cct acc cag    1440
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
        450                 455                 460
tct cac tac ggc cag tgc ggc ggt att ggc tac agc ggc ccc acg gtc    1488
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
    465                 470                 475
tgc gcc agc ggc aca act tgc cag gtc ctg aac cct tac tac tct cag    1536
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
480                 485                 490                 495
tgc ctgtaa                                                         1545
Cys
<210>2
<211>513
<212>PRT
<213>Trichoderma reesei
<400>2
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
        -15                 -10                 -5
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
-1  1               5                   10                  15
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
                20                  25                  30
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
            35                  40                  45
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
        50                  55                  60
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
    65                  70                  75
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
80                  85                  90                  95
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
                100                 105                 110
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
            115                 120                 125
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
        130                 135                 140
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
    145                 150                 155
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
160                 165                 170                 175
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
                180                 185                 190
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
            195                 200                 205
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
        210                 215                 220
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
    225                 230                 235
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
240                 245                 250                 255
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
                260                 265                 270
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
            275                 280                 285
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
        290                 295                 300
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
    305                 310                 315
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
320                 325                 330                 335
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
                340                 345                 350
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
            355                 360                 365
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
        370                 375                 380
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
    385                 390                 395
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
400                 405                 410                 415
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
                420                 425                 430
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
            435                 440                 445
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
        450                 455                 460
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
    465                 470                 475
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
480                 485                 490                 495
Cys
<210>3
<211>20
<212>DNA
<213>大肠杆菌(E.coli)
<400>3
taatacgact cactataggg                                                20
<210>4
<211>67
<212>DNA
<213>Trichoderma reesei
<400>4
tatacctcta tactttaacg tcaaggagaa aaaactatag gatccaccat gtatcggaag    60
ttggccg                                                              67
<210>5
<211>65
<212>DNA
<213>Trichoderma reesei
<400>5
cataactaat tacatgatgc ggccctctag atgcacatga ctcgagttac aggcactgag    60
agtag                                                                65
<210>6
<211>67
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>6
tatacctcta tactttaacg tcaaggagaa aaaactatag gatccaccat gtatcggaag    60
ttggccg                                                              67
<210>7
<211>65
<212>DNA
<213>酿酒酵母
<400>7
cataactaat tacatgatgc ggccctctag atgcacatga ctcgagttac aggcactgag    60
agtag                                                                65
<210>8
<211>20
<212>DNA
<213>酿酒酵母
<400>8
ggcgtgaatg taagcgtgac                                                20
<210>9
<211>28
<212>DNA
<213>酿酒酵母
<400>9
ctggggtaat taatcagcga agcgatga                                28
<210>10
<211>19
<212>DNA
<213>酿酒酵母
<400>10
gcgtacacgc gtctgtaca                                          19
<210>11
<211>22
<212>DNA
<213>构巢曲霉(Aspergillus nidulans)
<400>11
gtgccccatg atacgcctcc gg                                      22
<210>12
<211>26
<212>DNA
<213>构巢曲霉
<400>12
gagtcgtatt tccaaggctc ctgacc                                  26
<210>13
<211>24
<212>DNA
<213>构巢曲霉
<400>13
ggaggccatg aagtggacca acgg                                    24
<210>14
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>14
caccgtgaaa gccatgctct ttccttcgtg tagaagacca gacag             45
<210>15
<211>45
<212>DNA
<213>黑曲霉
<400>15
ctggtcttct acacgaagga aagagcatgg ctttcacggt gtctg             45
<210>16
<211>44
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>16
ctatatacac aactggattt accatgggcc cgcggccgca gatc             44
<210>17
<211>44
<212>DNA
<213>米曲霉
<400>17
gatctgcggc cgcgggccca tggtaaatcc agttgtgtat atag             44
<210>18
<211>22
<212>DNA
<213>Trichoderma reesei
<400>18
gcaacatgta tcggaagttg gc                                     22
<210>19
<211>22
<212>DNA
<213>Trichoderma reesei
<400>19
aattaatttt acaggcactg ag                                     22
<210>20
<211>33
<212>DNA
<213>Trichoderma reesei
<400>20
gaacacgggc attggacgac acggaagctg ctg                         33
<210>21
<211>33
<212>DNA
<213>Trichoderma reesei
<400>21
cagcagcttc cgtgtcgtcc aatgcccgtg ttc                         33
<210>22
<211>20
<212>DNA
<213>Trichoderma reesei
<400>22
cttcttggcc acagctcgtg                                        20
<210>23
<211>20
<212>DNA
<213>Trichoderma reesei
<400>23
ggctttgtca cccagtctgc                                        20
<210>24
<211>20
<212>DNA
<213>Trichoderma reesei
<400>24
cgtcatccaa caacgcgaac                                                20
<210>25
<211>20
<212>DNA
<213>Trichoderma reesei
<400>25
ttcgagacgt cgggtgccat                                                20
<210>26
<211>20
<212>DNA
<213>Trichoderma reesei
<400>26
cgcggaagct gctccaccag                                                20
<210>27
<211>20
<212>DNA
<213>Trichoderma reesei
<400>27
aatggagagg ctgttaccgc                                                20
<210>28
<211>67
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>28
tatacctcta tactttaacg tcaaggagaa aaaactatag gatccaccat gtatcggaag    60
ttggccg                                                              67
<210>29
<211>65
<212>DNA
<213>酿酒酵母
<400>29
cataactaat tacatgatgc ggccctctag atgcacatga ctcgagttac aggcactgag    60
agtag                                                                65
<210>30
<211>28
<212>DNA
<213>酿酒酵母
<400>30
ctggggtaat taatcagcga agcgatga                                       28
<210>31
<211>19
<212>DNA
<213>酿酒酵母
<400>31
gcgtacacgc gtctgtaca                                         19
<210>32
<211>31
<212>DNA
<213>Trichoderma reesei
<220>
<221>misc_feature
<222>(21)..(21)
<223>N=A,C,G,或T
<220>
<221>misc_feature
<222>(22)..(22)
<223>N=A,C,G,或T
<400>32
gcggtaacag cctctccatt nnstttgtca c                           31
<210>33
<211>33
<212>DNA
<213>Trichoderma reesei
<220>
<221>misc_feature
<222>(23)..(24)
<223>N=A,C,G,或T
<400>33
ctgcgcagac tgggtgacaa asnnaatgga gag                         33
<210>34
<211>32
<212>DNA
<213>Trichoderma reesei
<220>
<221>misc_feature
<222>(21)..(22)
<223>N=A,C,G,或T
<400>34
ccatctccga ggctcttacc nnscaccctt gc                          32
<210>35
<211>33
<212>DNA
<213>Trichoderma reesei
<220>
<221>misc_feature
<222>(24)..(25)
<223>N=A,C,G,或T
<400>35
ggccgacagt cgtgcaaggg tg snnggtaa gag                        33
<210>36
<211>30
<212>DNA
<213>Trichoderma reesei
<220>
<221>misc_feature
<222>(19)..(20)
<223>N=A,C,G,或T
<400>36
gagggctggg agccgtcann saacaacgcg                             30
<210>37
<211>33
<212>DNA
<213>Trichoderma reesei
<220>
<221>misc_feature
<222>(25)..(26)
<223>N=A,C,G,或T
<400>37
ccaatgcccg tgttcgcgtt gttsnntgac ggc                         33
<210>38
<211>29
<212>DNA
<213>Trichoderma reesei
<400>38
aacgttaatt aaggaatcgt tttgtgttt                              29
<210>39
<211>29
<212>DNA
<213>Trichoderma reesei
<400>39
agtactagta gctccgtggc gaaagcctg                              29
<210>40
<211>26
<212>DNA
<213>Trichoderma reesei
<400>40
actagtcgac cgaatgtagg attgtt                                 26
<210>41
<211>19
<212>DNA
<213>Trichoderma reesei
<400>41
tgaccatggt gcgcagtcc                                    19
<210>42
<211>26
<212>DNA
<213>Trichoderma reesei
<400>42
cgatcgtctc cctatgggtc attacc                            26
<210>43
<211>28
<212>DNA
<213>Trichoderma reesei
<400>43
actagttaat taagctccgt ggcgaaag                          28
<210>44
<211>30
<212>DNA
<213>Trichoderma reesei
<400>44
cgcggactgc gcaccatgta tcggaagttg                        30
<210>45
<211>30
<212>DNA
<213>Trichoderma reesei
<400>45
cgccacggag cttaattaca ggcactgaga                        30
<210>46
<211>20
<212>DNA
<213>Trichoderma reesei
<400>46
gccttcggcc tttgggtgta                                   20
<210>47
<211>20
<212>DNA
<213>Trichoderma reesei
<400>47
gagcggcgat tctacgggtt                                   20
<210>48
<211>26
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>48
gccgcggcac gcgccacacg gaaaat                            26
<210>49
<211>27
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>49
gaccggtcgc aaaatgacaa atagaag                                         27
<210>50
<211>23
<212>DNA
<213>Trichoderma reesei
<400>50
gctccgggca aatgcaaagt gtg                                             23
<210>51
<211>24
<212>DNA
<213>Trichoderma reesei
<400>51
agcaggccgc atctccagtg aaag                                            24
<210>52
<211>20
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>52
gcacgcgcca cacggaaaat                                                 20
<210>53
<211>20
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>53
cgcaaaatga caaatagaag                                                 20
<210>54
<211>31
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>54
actggattta ccatgagatt cggttggctc g                                    31
<210>55
<211>31
<212>DNA
<213>烟曲霉
<400>55
agtcacctct agttactagt agacacgggg c                                    31
<210>56
<211>3060
<212>DNA
<213>烟曲霉
<400>56
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag     60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc    120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt    180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg    240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc    300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc    360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag    420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga    480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc    540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact    600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt    660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg    720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca    780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg    840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt    900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga    960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga    1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt    1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa    1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg    1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga    1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt    1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac    1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat    1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc    1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg    1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc    1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat    1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc    1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact    1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct    1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg    1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac    1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac    2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat    2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac    2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg  2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt  2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc  2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct  2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag  2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag  2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat  2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg  2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt  2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat  2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc  2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac  2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat  2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg  3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag  3060
<210>57
<211>863
<212>PRT
<213>烟曲霉
<400>57
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1               5                   10                  15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
            20                  25                  30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
        35                  40                  45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
    50                  55                  60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65                  70                  75                  80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
                85                  90                  95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
            100                 105                 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
        115                 120                 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
    130                 135                 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145                 150                 155                 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
                165                 170                 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
            180                 185                 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
        195                 200                 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
    210                 215                 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225                 230                 235                 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
                245                 250                 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
            260                 265                 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
        275                 280                 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
    290                 295                 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305                 310                 315                 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
                325                 330                 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
            340                 345                 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
        355                 360                 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
    370                 375                 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385                 390                 395                 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
                405                 410                 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
            420                 425                 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
        435                 440                 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
    450                 455                 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465                 470                 475                 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
                485                 490                 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
            500                 505                 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
        515                 520                 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
    530                 535                 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545                 550                 555                 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
                565                 570                 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
            580                 585                 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
        595                 600                 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
    610                 615                 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625                 630                 635                 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
                645                 650                 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
            660                 665                 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
        675                 680                 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
    690                 695                 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705                 710                 715                 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
                725                 730                 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
            740                 745                 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
        755                 760                 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
    770                 775                 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785                 790                 795                 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
                805                 810                 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
            820                 825                 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
        835                 840                 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
    850                 855                 860

Claims (441)

1.亲代糖苷水解酶的分离的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置包含取代,并任选地进一步在对应于SEQID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代,其中所述的变体具有糖苷水解酶活性。
2.权利要求1的变体,其中所述亲代糖苷水解酶是(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:2的氨基酸1至513具有至少70%的同一性;或(b)由核苷酸序列编码的多肽,所述核苷酸序列在低严紧性条件下与SEQ ID NO:1的核苷酸52至1539或其互补链杂交。
3.权利要求2的变体,其中所述亲代糖苷水解酶包含氨基酸序列,其与SEQ ID NO:2的氨基酸1至513具有至少70%的同一性。
4.权利要求2的变体,其中所述亲代糖苷水解酶包含氨基酸序列,其与SEQ ID NO:2的氨基酸1至513具有至少75%的同一性。
5.权利要求2的变体,其中所述亲代糖苷水解酶包含氨基酸序列,其与SEQ ID NO:2的氨基酸1至513具有至少80%的同一性。
6.权利要求2的变体,其中所述亲代糖苷水解酶包含氨基酸序列,其与SEQ ID NO:2的氨基酸1至513具有至少85%的同一性。
7.权利要求2的变体,其中所述亲代糖苷水解酶包含氨基酸序列,其与SEQ ID NO:2的氨基酸1至513具有至少90%的同一性。
8.权利要求2的变体,其中所述亲代糖苷水解酶包含氨基酸序列,其与SEQ ID NO:2的氨基酸1至513具有至少95%的同一性。
9.权利要求1的变体,其中所述亲代糖苷水解酶包含SEQ ID NO:2的氨基酸1至513。
10.权利要求1的变体,其中所述亲代糖苷水解酶由SEQ ID NO:2的氨基酸1至513,或其具有糖苷水解酶活性的片段组成。
11.权利要求2的变体,其中所述亲代糖苷水解酶由核苷酸序列编码,所述的核苷酸序列在低严紧性条件下与SEQ ID NO:1的核苷酸52至1539杂交。
12.权利要求2的变体,其中所述亲代糖苷水解酶由核苷酸序列编码,所述的核苷酸序列在中严紧性条件下与SEQ ID NO:1的核苷酸52至1539杂交。
13.权利要求2的变体,其中所述亲代糖苷水解酶由核苷酸序列编码,所述的核苷酸序列在中-高严紧性条件下与SEQ ID NO:1的核苷酸52至1539杂交。
14.权利要求2的变体,其中所述亲代糖苷水解酶由核苷酸序列编码,所述的核苷酸序列在高严紧性条件下与SEQ ID NO:1的核苷酸52至1539杂交。
15.权利要求1的变体,其中所述亲代糖苷水解酶是野生型糖苷水解酶。
16.权利要求1的变体,其中所述亲代糖苷水解酶是枝顶孢霉属、伞菌属、链格孢属、曲霉属、Botryospaeria、Chaetomidium、麦角属、旋孢腔菌属、Coprinopsis、Coptotermes、Cryphonectria、黑耳属、镰孢属、赤霉属、Holomastigotoides、腐质霉属、耙菌属、Lentinula、Leptospaeria、Melanocarpus、脉孢菌属、青霉属、Phanerochaete、Poitrasia、Pseudotrichonympha、柱顶孢属、踝节菌属、嗜热子囊菌属、Thielavia、木霉属、长毛盘菌属、轮枝孢属、Volvariella或Xylaria糖苷水解酶。
17.权利要求16的变体,其中所述的木霉属糖苷水解酶是Trichodermareesei糖苷水解酶。
18.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置21的位置包含取代。
19.权利要求18的变体,其中所述的取代是Pro。
20.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置94的位置包含取代。
21.权利要求20的变体,其中所述的取代是Ser、Ala、Arg或Gln。
22.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置157的位置包含取代。
23.权利要求22的变体,其中所述的取代是Arg。
24.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置205的位置包含取代。
25.权利要求24的变体,其中所述的取代是Arg。
26.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置206的位置包含取代。
27.权利要求26的变体,其中所述的取代是Tyr。
28.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置247的位置包含取代。
29.权利要求28的变体,其中所述的取代是Cys。
30.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置337的位置包含取代。
31.权利要求30的变体,其中所述的取代是Val。
32.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置350的位置包含取代。
33.权利要求32的变体,其中所述的取代是Ser。
34.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置373的位置包含取代。
35.权利要求34的变体,其中所述的取代是His。
36.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置383的位置包含取代。
37.权利要求36的变体,其中所述的取代是Ala。
38.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置438的位置包含取代。
39.权利要求38的变体,其中所述的取代是Leu。
40.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置455的位置包含取代。
41.权利要求40的变体,其中所述的取代是Ala。
42.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置467的位置包含取代。
43.权利要求42的变体,其中所述的取代是Ser。
44.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置486的位置包含取代。
45.权利要求44的变体,其中所述的取代是Trp。
46.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8的位置包含取代。
47.权利要求46的变体,其中所述的取代是Pro。
48.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置22的位置包含取代。
49.权利要求48的变体,其中所述的取代是Asp。
50.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41的位置包含取代。
51.权利要求50的变体,其中所述的取代是Ile。
52.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49的位置包含取代。
53.权利要求52的变体,其中所述的取代是Ser。
54.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57的位置包含取代。
55.权利要求54的变体,其中所述的取代是Asn。
56.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113的位置包含取代。
57.权利要求56的变体,其中所述的取代是Asn。
58.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置193的位置包含取代。
59.权利要求58的变体,其中所述的取代是Lys。
60.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196的位置包含取代。
61.权利要求60的变体,其中所述的取代是Pro、Thr或Phe。
62.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置226的位置包含取代。
63.权利要求62的变体,其中所述的取代是Ala。
64.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227的位置包含取代。
65.权利要求64的变体,其中所述的取代是Ala、Leu或Gly。
66.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置246的位置包含取代。
67.权利要求66的变体,其中所述的取代Ile。
68.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置251的位置包含取代。
69.权利要求68的变体,其中所述的取代是Lys。
70.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置255的位置包含取代。
71.权利要求70的变体,其中所述的取代是Pro。
72.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置259的位置包含取代。
73.权利要求72的变体,其中所述的取代是Asn。
74.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置301的位置包含取代。
75.权利要求74的变体,其中所述的取代是Ser。
76.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置356的位置包含取代。
77.权利要求76的变体,其中所述的取代是Ile。
78.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置371的位置包含取代。
79.权利要求78的变体,其中所述的取代是Cys。
80.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置411的位置包含取代。
81.权利要求80的变体,其中所述的取代是Phe。
82.权利要求1的变体,其进一步在对应于SEQ ID NO:2的氨基酸1至513的位置462的位置包含取代。
83.权利要求82的变体,其中所述的取代是Ala。
84.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置227和486的位置包含取代。
85.权利要求84的变体,其包含所述的取代P227A+C486W。
86.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置301和337的位置包含取代。
87.权利要求86的变体,其包含所述的取代Asn301Ser+Glu337Val。
88.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置196和350的位置包含取代。
89.权利要求88的变体,其包含所述的取代Ser196Pro(或Ser196Thr或Ser196Phe)+Thr350Ser。
90.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置22和467的位置包含取代。
91.权利要求90的变体,其包含所述的取代Gly22Asp+Gly467Ser。
92.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置21和57的位置包含取代。
93.权利要求92的变体,其包含所述的取代Ser21Pro+Ser57Asn。
94.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置205和411的位置包含取代。
95.权利要求94的变体,其包含所述的取代Gly205Arg+Ser411Phe。
96.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置205和227的位置包含取代。
97.权利要求96的变体,其包含所述的取代Gly205Arg+Pro227Ala(或Pro227Leu或Pro227Gly)。
98.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置205和206的位置包含取代。
99.权利要求98的变体,其包含所述的取代Gly205Arg+His206Tyr。
100.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置8和205的位置包含取代。
101.权利要求100的变体,其包含所述的取代Ser8Pro+Gly205Arg。
102.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置94和205的位置包含取代。
103.权利要求102的变体,其包含所述的取代Gly94Ser(或Gly94Ala或Gly94Arg或Gly94Gln)+Gly205Arg。
104.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置196和205的位置包含取代。
105.权利要求104的变体,其包含所述的取代Ser196Pro+Gly205Arg。
106.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置383和455的位置包含取代。
107.权利要求106的变体,其包含所述的取代Thr383Ala+Thr455Ala。
108.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置113和411的位置包含取代。
109.权利要求108的变体,其包含所述的取代Ser113Asn+Ser411Phe。
110.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置227和259的位置包含取代。
111.权利要求110的变体,其包含所述的取代Pro227Ala(或Pro227Leu或Pro227Gly)+Asp259Asn。
112.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置94和226的位置包含取代。
113.权利要求112的变体,其包含所述的取代Gly94Ser(或Gly94Ala或Gly94Arg或Gly94Gln)+Thr226Ala。
114.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置41和196的位置包含取代。
115.权利要求114的变体,其包含所述的取代Thr41Ile+Ser196Thr(或Ser196Pro或Ser196Phe)。
116.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和462的位置包含取代。
117.权利要求116的变体,其包含所述的取代Ser113Asn+Ser196Thr(或Ser196Pro或Ser196Phe)+Thr462Ala。
118.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置157、205和255的位置包含取代。
119.权利要求118的变体,其包含所述的取代Lys157Arg+Gly205Arg+Thr255Pro。
120.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置41、193和411的位置包含取代。
121.权利要求120的变体,其包含SEQ ID NO:2的氨基酸1至513的所述的取代Thr41Ile+Glu193Lys+Ser411Phe。
122.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置247、371和411的位置包含取代。
123.权利要求122的变体,其包含SEQ ID NO:2的氨基酸1至513的所述的取代Tyr247Cys+Tyr371Cys+Ser411Phe。
124.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和462的位置包含取代。
125.权利要求124的变体,其包含SEQ ID NO:2的氨基酸1至513的所述的取代Ser113Asn+Ser196Thr(或Ser196Pro或Ser196Phe)+Pro227Ala+Thr462Ala。
126.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置49、113、227和438的位置包含取代。
127.权利要求126的变体,其包含SEQ ID NO:2的氨基酸1至513的所述的取代Asn49Ser+Ser113Asn+Pro227Ala(或Pro227Leu或Pro227Gly)+Pro438Leu。
128.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置157、205、255和411的位置包含取代。
129.权利要求128的变体,其包含SEQ ID NO:2的氨基酸1至513的所述的取代Lys157Arg+Gly205Arg+Thr255Pro+Ser411Phe。
130.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和411的位置包含取代。
131.权利要求130的变体,其包含SEQ ID NO:2的氨基酸1至513的所述的取代Ser113Asn+Ser196Thr(或Ser196Pro或Ser196Phe)+Pro227Ala(或Pro227Leu或Pro227Gly)+Ser411Phe。
132.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246、251和411的位置包含取代。
133.权利要求132的变体,其包含SEQ ID NO:2的氨基酸1至513的所述的取代Ser21Pro+Ser57Asn+Thr246Ile+Arg251Lys+Ser411Phe。
134.权利要求1的变体,其在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227、356和462的位置包含取代。
135.权利要求134的变体,其包含SEQ ID NO:2的氨基酸1至513的所述的取代Ser113Asn+Ser196Thr(或Ser196Pro或Ser196Phe)+Pro227Ala(或Pro227Leu或Pro227Gly)+Thr356Ile+Thr462Ala。
136.权利要求1的变体,其包含选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W的一个或多个取代,并任选进一步包含选自SEQ ID NO:2的氨基酸1至513的S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A的一个或多个取代。
137.权利要求1的变体,其具有氨基酸序列,所述氨基酸序列与SEQ IDNO:2的亲代糖苷水解酶的氨基酸1至513具有至少70%的同一性。
138.权利要求1的变体,其具有氨基酸序列,所述氨基酸序列与SEQ IDNO:2的亲代糖苷水解酶的氨基酸1至513具有至少75%的同一性。
139.权利要求1的变体,其具有氨基酸序列,所述氨基酸序列与SEQ IDNO:2的亲代糖苷水解酶的氨基酸1至513具有至少80%的同一性。
140.权利要求1的变体,其具有氨基酸序列,所述氨基酸序列与SEQ IDNO:2的亲代糖苷水解酶的氨基酸1至513具有至少85%的同一性。
141.权利要求1的变体,其具有氨基酸序列,所述氨基酸序列与SEQ IDNO:2的亲代糖苷水解酶的氨基酸1至513具有至少90%的同一性。
142.权利要求1的变体,其具有氨基酸序列,所述氨基酸序列与SEQ IDNO:2的亲代糖苷水解酶的氨基酸1至513具有至少95%的同一性。
143.权利要求1-142中任一项的变体,其中取代的数目为33,更优选32,还更优选31,还更优选30,还更优选29,还更优选28,还更优选27,还更优选26,还更优选25,还更优选24,还更优选23,还更优选22,还更优选21,还更优选20,还更优选19,还更优选18,还更优选17,还更优选16,还更优选15,还更优选14,还更优选13,还更优选12,还更优选11,还更优选10,还更优选9,还更优选8,还更优选7,还更优选6,还更优选5,还更优选4,还更优选3,还更优选2和最优选1。
144.权利要求1-143中任一项的变体,其与所述亲代糖苷水解酶相比具有改进的性质,其中所述改进的性质选自依赖于-温度的活性图谱、热稳定性、pH活性、pH稳定性和底物特异性、产物特异性,和化学稳定性。
145.权利要求144的变体,其中所述变体糖苷水解酶的热活性比所述野生型变体高至少2.5-倍,优选至少2-倍,更优选至少5-倍,最优选至少7-倍,并且还最优选至少20-倍。
146.权利要求1的变体,其由NRRL B-30658、NRRL B-30659、NRRLB-30661、NRRL B-30662、NRRL B-30663、NRRL B-30664、NRRL B-30665、NRRL B-30666、NRRL B-30674、NRRL B-30675、NRRL B-30676、NRRLB-30677、NRRL B-30678、NRRL B-30679、NRRL B-30680、NRRL B-30681、NRRL B-30682或NRRL B-30762中包含的核苷酸序列编码。
147.分离的核苷酸序列,其编码权利要求1-146中任一项的变体。
148.核酸构建体,其包含权利要求147的核苷酸序列。
149.表达载体,其包含权利要求147的核苷酸序列。
150.宿主细胞,其包含权利要求147的核苷酸序列。
151.产生变体的方法,其包括(a)在适于产生所述变体的条件下培养权利要求150的宿主细胞;和(b)从所述培养基中回收所述变体。
152.具有糖苷水解酶活性的分离的多肽,其中所述多肽的氨基酸序列在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置不同于SEQ IDNO:2,并任选地进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置包含取代。
153.权利要求152的多肽,其是是枝顶孢霉属、伞菌属、链格孢属、曲霉属、Botryospaeria、Chaetomidium、麦角属、旋孢腔菌属、Coprinopsis、Coptotermes、Cryphonectria、黑耳属、镰孢属、赤霉属、Holomastigotoides、腐质霉属、耙菌属、Lentinula、Leptospaeria、Melanocarpus、脉孢菌属、青霉属、Phanerochaete、Poitrasia、Pseudotrichonympha、柱顶孢属、踝节菌属、嗜热子囊菌属、Thielavia、木霉属、长毛盘菌属、轮枝孢属、Volvariella或Xylaria糖苷水解酶。
154.权利要求153的多肽,其中所述木霉属糖苷水解酶是Trichodermareesei糖苷水解酶。
155.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置21的位置不同于SEQ ID NO:2。
156.权利要求155的多肽,其中所述的不同是Pro。
157.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置94的位置不同于SEQ ID NO:2。
158.权利要求157的多肽,其中所述的不同是Ser、Ala、Arg或Gln。
159.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置157的位置不同于SEQ ID NO:2。
160.权利要求159的多肽,其中所述的不同是Arg。
161.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置205的位置不同于SEQ ID NO:2。
162.权利要求161的多肽,其中所述的不同是Arg。
163.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置206的位置不同于SEQ ID NO:2。
164.权利要求163的多肽,其中所述的不同是Tyr。
165.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置247的位置不同于SEQ ID NO:2。
166.权利要求165的多肽,其中所述的不同是Cys。
167.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置337的位置不同于SEQ ID NO:2。
168.权利要求167的多肽,其中所述的不同是Val。
169.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置350的位置不同于SEQ ID NO:2。
170.权利要求169的多肽,其中所述的不同是Ser。
171.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置373的位置不同于SEQ ID NO:2。
172.权利要求171的多肽,其中所述的不同是His。
173.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置383的位置不同于SEQ ID NO:2。
174.权利要求173的多肽,其中所述的不同是Ala。
175.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置438的位置不同于SEQ ID NO:2。
176.权利要求175的多肽,其中所述的不同是Leu。
177.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置455的位置不同于SEQ ID NO:2。
178.权利要求177的多肽,其中所述的不同是Ala。
179.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置467的位置不同于SEQ ID NO:2。
180.权利要求179的多肽,其中所述的不同是Ser。
181.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置486的位置不同于SEQ ID NO:2。
182.权利要求181的多肽,其中所述的不同是Trp。
183.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8的位置不同于SEQ ID NO:2。
184.权利要求183的多肽,其中所述的不同是Pro。
185.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置22的位置不同于SEQ ID NO:2。
186.权利要求185的多肽,其中所述的不同是Asp。
187.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41的位置不同于SEQ ID NO:2。
188.权利要求187的多肽,其中所述的不同是Ile。
189.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49的位置不同于SEQ ID NO:2。
190.权利要求189的多肽,其中所述的不同是Ser。
191.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57的位置不同于SEQ ID NO:2。
192.权利要求191的多肽,其中所述的不同是Asn。
193.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113的位置不同于SEQ ID NO:2。
194.权利要求193的多肽,其中所述的不同是Asn。
195.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置193的位置不同于SEQ ID NO:2。
196.权利要求195的多肽,其中所述的不同是Lys。
197.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196的位置不同于SEQ ID NO:2。
198.权利要求197的多肽,其中所述的不同是Pro、Thr或Phe。
199.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置226的位置不同于SEQ ID NO:2。
200.权利要求199的多肽,其中所述的不同是Ala。
201.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227的位置不同于SEQ ID NO:2。
202.权利要求201的多肽,其中所述的不同是Ala、Leu或Gly。
203.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置246的位置不同于SEQ ID NO:2。
204.权利要求203的多肽,其中所述的不同Ile。
205.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置251的位置不同于SEQ ID NO:2。
206.权利要求205的多肽,其中所述的不同是Lys。
207.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置255的位置不同于SEQ ID NO:2。
208.权利要求207的多肽,其中所述的不同是Pro。
209.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置259的位置不同于SEQ ID NO:2。
210.权利要求209的多肽,其中所述的不同是Asn。
211.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置301的位置不同于SEQ ID NO:2。
212.权利要求211的多肽,其中所述的不同是Ser。
213.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置356的位置不同于SEQ ID NO:2。
214.权利要求213的多肽,其中所述的不同是Ile。
215.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置371的位置不同于SEQ ID NO:2。
216.权利要求215的多肽,其中所述的不同是Cys。
217.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置411的位置不同于SEQ ID NO:2。
218.权利要求217的多肽,其中所述的不同是Phe。
219.权利要求152的多肽,其中所述多肽的氨基酸序列进一步在对应于SEQ ID NO:2的氨基酸1至513的位置462的位置不同于SEQ ID NO:2。
220.权利要求219的多肽,其中所述的不同是Ala。
221.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置227和486的位置不同于SEQ ID NO:2。
222.权利要求221的多肽,其中所述的不同是P227A+C486W。
223.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置301和337的位置不同于SEQ ID NO:2。
224.权利要求223的多肽,其中所述的不同是Asn301Ser+Glu337Val。
225.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置196和350的位置不同于SEQ ID NO:2。
226.权利要求225的多肽,其中所述的不同是Ser196Pro(或Ser196Thr或Ser196Phe)+Thr350Ser。
227.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置22和467的位置不同于SEQ ID NO:2。
228.权利要求227的多肽,其中所述的不同是Gly22Asp+Gly467Ser。
229.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置21和57的位置不同于SEQ ID NO:2。
230.权利要求229的多肽,其中所述的不同是Ser21Pro+Ser57Asn。
231.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置205和411的位置不同于SEQ ID NO:2。
232.权利要求231的多肽,其中所述的不同是Gly205Arg+Ser411Phe。
233.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置205和227的位置不同于SEQ ID NO:2。
234.权利要求233的多肽,其中所述的不同是Gly205Arg+Pro227Ala(或Pro227Leu或Pro227Gly)。
235.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置205和206的位置不同于SEQ ID NO:2。
236.权利要求235的多肽,其中所述的不同是Gly205Arg+His206Tyr。
237.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置8和205的位置不同于SEQ ID NO:2。
238.权利要求237的多肽,其中所述的不同是Ser8Pro+Gly205Arg。
239.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置94和205的位置不同于SEQ ID NO:2。
240.权利要求239的多肽,其中所述的不同是Gly94Ser(或Gly94Ala或Gly94Arg或Gly94Gln)+Gly205Arg。
241.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置196和205的位置不同于SEQ ID NO:2。
242.权利要求的多肽241,其中所述的不同是Ser196Pro+Gly205Arg。
243.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置383和455的位置不同于SEQ ID NO:2。
244.权利要求243,其中所述的不同是Thr383Ala+Thr455Ala。
245.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置113和411的位置不同于SEQ ID NO:2。
246.权利要求245的多肽,其中所述的不同是Ser113Asn+Ser411Phe。
247.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置227和259的位置不同于SEQ ID NO:2。
248.权利要求247的多肽,其中所述的不同是Pro227Ala(或Pro227Leu或Pro227Gly)+Asp259Asn。
249.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置94和226的位置不同于SEQ ID NO:2。
250.权利要求249的多肽,其中所述的不同是Gly94Ser(或Gly94Ala或Gly94Arg或Gly94Gln)+Thr226Ala。
251.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置41和196的位置不同于SEQ ID NO:2。
252.权利要求251的多肽,其中所述的不同是Thr41Ile+Ser196Thr(或Ser196Pro或Ser196Phe)。
253.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置113、196和462的位置不同于SEQ ID NO:2。
254.权利要求253的多肽,其中所述的不同是Ser113Asn+Ser196Thr(或Ser196Pro或Ser196Phe)+Thr462Ala。
255.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置157、205和255的位置不同于SEQ ID NO:2。
256.权利要求255的多肽,其中所述的不同是Lys157Arg+Gly205Arg+Thr255Pro。
257.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置41、193和411的位置不同于SEQ ID NO:2。
258.权利要求257的多肽,其中所述的不同是SEQ ID NO:2的氨基酸1至513的Thr41Ile+Glu193Lys+Ser411Phe。
259.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置247、371和411的位置不同于SEQ ID NO:2。
260.权利要求259的多肽,其中所述的不同是SEQ ID NO:2的氨基酸1至513的Tyr247Cys+Tyr371Cys+Ser411Phe。
261.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置113、196、227和462的位置不同于SEQ ID NO:2。
262.权利要求261的多肽,其中所述的不同是SEQ ID NO:2的氨基酸1至513的Ser113Asn+Ser196Thr(或Ser196Pro或Ser196Phe)+Pro227Ala+Thr462Ala。
263.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置49、113、227和438的位置不同于SEQ ID NO:2。
264.权利要求263的多肽,其中所述的不同是SEQ ID NO:2的氨基酸1至513的Asn49Ser+Ser113Asn+Pro227Ala(或Pro227Leu或Pro227Gly)+Pro438Leu。
265.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置157、205、255和411的位置不同于SEQ ID NO:2。
266.权利要求265的多肽,其中所述的不同是SEQ ID NO:2的氨基酸1至513的Lys157Arg+Gly205Arg+Thr255Pro+Ser411Phe。
267.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置113、196、227和411的位置不同于SEQ ID NO:2。
268.权利要求267的多肽,其中所述的不同是SEQ ID NO:2的氨基酸1至513的Ser113Asn+Ser196Thr(或Ser196Pro或Ser196Phe)+Pro227Ala(或Pro227Leu或Pro227Gly)+Ser411Phe。
269.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置21、57、246、251和411的位置不同于SEQID NO:2。
270.权利要求269的多肽,其中所述的不同是SEQ ID NO:2的氨基酸1至513的Ser21Pro+Ser57Asn+Thr246Ile+Arg251Lys+Ser411Phe。
271.权利要求152的多肽,其中所述多肽的氨基酸序列在对应于SEQ IDNO:2的氨基酸1至513的位置113、196、227、356和462的位置不同于SEQID NO:2。
272.权利要求271的多肽,其中所述的不同是SEQ ID NO:2的氨基酸1至513的Ser113Asn+Ser196Thr(或Ser196Pro或Ser196Phe)+Pro227Ala(或Pro227Leu或Pro227Gly)+Thr356Ile+Thr462Ala。
273.权利要求152的多肽,其包含一个或多个不同,所述的不同选自SEQID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W,并任选地进一步相差一个或多个不同,所述的不同选自SEQID NO:2的氨基酸1至513的S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A。
274.权利要求152-273中任一项的多肽,其中不同的总数为33,更优选32,还更优选31,还更优选30,还更优选29,还更优选28,还更优选27,还更优选26,还更优选25,还更优选24,还更优选23,还更优选22,还更优选21,还更优选20,还更优选19,还更优选18,还更优选17,还更优选16,还更优选15,还更优选14,还更优选13,还更优选12,还更优选11,还更优选10,还更优选9,还更优选8,还更优选7,还更优选6,还更优选5,还更优选4,还更优选3,还更优选2并最优选1。
275.权利要求152-274中任一项的多肽,其与所述亲代糖苷水解酶相比具有改进的性质,其中所述改进的性质选自依赖于-温度的活性图谱、热稳定性、pH活性、pH稳定性和底物特异性、产物特异性,和化学稳定性。
276.权利要求275的多肽,其中所述多肽糖苷水解酶的热活性比所述野生型多肽高至少2.5-倍,优选至少2-倍,更优选至少5-倍,最优选至少7-倍,并且还最优选至少20-倍。
277.权利要求152的多肽,其由NRRL B-30658、NRRL B-30659、NRRLB-30661、NRRL B-30662、NRRL B-30663、NRRL B-30664、NRRL B-30665、NRRL B-30666、NRRL B-30674、NRRL B-30675、NRRL B-30676、NRRLB-30677、NRRL B-30678、NRRL B-30679、NRRL B-30680、NRRL B-30681、NRRL B-30682或NRRL B-30762中包含的核苷酸序列编码。
278.分离的核苷酸序列,其编码权利要求152-277中任一项的多肽。
279.核酸构建体,其包含权利要求278的核苷酸序列。
280.表达载体,其包含权利要求278的核苷酸序列。
281.宿主细胞,其包含权利要求278的核苷酸序列。
282.产生多肽的方法,其包括(a)在适于产生所述变体的条件下培养权利要求281的宿主细胞;和(b)从所述培养基中回收所述变体。
283.获得亲代糖苷水解酶的变体的方法,其包括:
(a)在对应于SEQ ID NO:2的氨基酸1至513的位置21、94、157、205、206、247、337、350、373、383、438、455、467和486的一个或多个位置将取代导入所述的亲代糖苷水解酶,并任选地进一步在对应于SEQ IDNO:2的氨基酸1至513的位置8、22、41、49、57、113、193、196、226、227、246、251、255、259、301、356、371、411和462的一个或多个位置导入取代,其中所述的变体具有糖苷水解酶活性;和
(b)回收所述的变体。
284.权利要求283的方法,其中所述亲代糖苷水解酶是(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:2的氨基酸1至513具有至少70%的同一性;或(b)由核苷酸序列编码的多肽,所述核苷酸序列在低严紧性条件下与SEQ ID NO:1的核苷酸52至1539或其互补链杂交。
285.权利要求284的方法,其中所述亲代糖苷水解酶包含氨基酸序列,其与SEQ ID NO:2的氨基酸1至513具有至少70%的同一性。
286.权利要求284的方法,其中所述亲代糖苷水解酶包含氨基酸序列,其与SEQ ID NO:2的氨基酸1至513具有至少75%的同一性。
287.权利要求284的方法,其中所述亲代糖苷水解酶包含氨基酸序列,其与SEQ ID NO:2的氨基酸1至513具有至少80%的同一性。
288.权利要求284的方法,其中所述亲代糖苷水解酶包含氨基酸序列,其与SEQ ID NO:2的氨基酸1至513具有至少85%的同一性。
289.权利要求284的方法,其中所述亲代糖苷水解酶包含氨基酸序列,其与SEQ ID NO:2的氨基酸1至513具有至少90%的同一性。
290.权利要求284的方法,其中所述亲代糖苷水解酶包含氨基酸序列,其与SEQ ID NO:2的氨基酸1至513具有至少95%的同一性。
291.权利要求283的方法,其中所述亲代糖苷水解酶包含SEQ ID NO:2的氨基酸1至513。
292.权利要求283的方法,其中所述亲代糖苷水解酶由SEQ ID NO:2的氨基酸1至513,或其具有糖苷水解酶活性的片段组成。
293.权利要求284的方法,其中所述亲代糖苷水解酶由核苷酸序列编码,所述的核苷酸序列在低严紧性条件下与SEQ ID NO:1的核苷酸52至1539杂交。
294.权利要求284的方法,其中所述亲代糖苷水解酶由核苷酸序列编码,所述的核苷酸序列在中严紧性条件下与SEQ ID NO:1的核苷酸52至1539杂交。
295.权利要求284的方法,其中所述亲代糖苷水解酶由核苷酸序列编码,所述的核苷酸序列在中-高严紧性条件下与SEQ ID NO:1的核苷酸52至1539杂交。
296.权利要求284的方法,其中所述亲代糖苷水解酶由核苷酸序列编码,所述的核苷酸序列在高严紧性条件下与SEQ ID NO:1的核苷酸52至1539杂交。
297.权利要求283的方法,其中所述亲代糖苷水解酶是野生型糖苷水解酶。
298.权利要求283的方法,其中所述亲代糖苷水解酶是枝顶孢霉属、伞菌属、链格孢属、曲霉属、Botryospaeria、Chaetomidium、麦角属、旋孢腔菌属、Coprinopsis、Coptotermes、Cryphonectria、黑耳属、镰孢属、赤霉属、Holomastigotoides、腐质霉属、耙菌属、Lentinula、Leptospaeria、Melanocarpus、脉孢菌属、青霉属、Phanerochaete、Poitrasia、Pseudotrichonympha、柱顶孢属、踝节菌属、嗜热子囊菌属、Thielavia、木霉属、长毛盘菌属、轮枝孢属、Volvariella或Xylaria糖苷水解酶。
299.权利要求298的方法,其中所述的木霉属糖苷水解酶是Trichodermareesei糖苷水解酶。
300.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21的位置包含取代。
301.权利要求300的方法,其中所述的取代是Pro。
302.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置94的位置包含取代。
303.权利要求302的方法,其中所述的取代是Ser、Ala、Arg或Gln。
304.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置157的位置包含取代。
305.权利要求304的方法,其中所述的取代是Arg。
306.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置205的位置包含取代。
307.权利要求306的方法,其中所述的取代是Arg。
308.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置206的位置包含取代。
309.权利要求308的方法,其中所述的取代是Tyr。
310.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置247的位置包含取代。
311.权利要求310的方法,其中所述的取代是Cys。
312.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置337的位置包含取代。
313.权利要求312的方法,其中所述的取代是Val。
314.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置350的位置包含取代。
315.权利要求314的方法,其中所述的取代是Ser。
316.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置373的位置包含取代。
317.权利要求316的方法,其中所述的取代是His。
318.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置383的位置包含取代。
319.权利要求318的方法,其中所述的取代是Ala。
320.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置438的位置包含取代。
321.权利要求320的方法,其中所述的取代是Leu。
322.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置455的位置包含取代。
323.权利要求322的方法,其中所述的取代是Ala。
324.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置467的位置包含取代。
325.权利要求324的方法,其中所述的取代是Ser。
326.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置486的位置包含取代。
327.权利要求326的方法,其中所述的取代是Trp。
328.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置8的位置包含取代。
329.权利要求328的方法,其中所述的取代是Pro。
330.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置22的位置包含取代。
331.权利要求330的方法,其中所述的取代是Asp。
332.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置41的位置包含取代。
333.权利要求332的方法,其中所述的取代是Ile。
334.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置49的位置包含取代。
335.权利要求334的方法,其中所述的取代是Ser。
336.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置57的位置包含取代。
337.权利要求336的方法,其中所述的取代是Asn。
338.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置113的位置包含取代。
339.权利要求338的方法,其中所述的取代是Asn。
340.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置193的位置包含取代。
341.权利要求340的方法,其中所述的取代是Lys。
342.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置196的位置包含取代。
343.权利要求342的方法,其中所述的取代是Pro、Thr或Phe。
344.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置226的位置包含取代。
345.权利要求344的方法,其中所述的取代是Ala。
346.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227的位置包含取代。
347.权利要求346的方法,其中所述的取代是Ala、Leu或Gly。
348.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置246的位置包含取代。
349.权利要求348的方法,其中所述的取代Ile。
350.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置251的位置包含取代。
351.权利要求350的方法,其中所述的取代是Lys。
352.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置255的位置包含取代。
353.权利要求352的方法,其中所述的取代是Pro。
354.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置259的位置包含取代。
355.权利要求354的方法,其中所述的取代是Asn。
356.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置301的位置包含取代。
357.权利要求356的方法,其中所述的取代是Ser。
358.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置356的位置包含取代。
359.权利要求358的方法,其中所述的取代是Ile。
360.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置371的位置包含取代。
361.权利要求360的方法,其中所述的取代是Cys。
362.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置411的位置包含取代。
363.权利要求362的方法,其中所述的取代是Phe。
364.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置462的位置包含取代。
365.权利要求364的方法,其中所述的取代是Ala。
366.权利要求283的方法,其中所述的变体进一步在对应于SEQ ID NO:2的氨基酸1至513的位置227和486的位置包含取代。
367.权利要求366的方法,其中所述的变体包含取代P227A+C486W。
368.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置301和337的位置包含取代。
369.权利要求368的方法,其中所述的变体包含取代Asn301Ser+Glu337Val。
370.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和350的位置包含取代。
371.权利要求370的方法,其中所述的变体包含取代Ser196Pro(或Ser196Thr或Ser196Phe)+Thr350Ser。
372.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置22和467的位置包含取代。
373.权利要求372的方法,其中所述的变体包含取代Gly22Asp+Gly467Ser。
374.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21和57的位置包含取代。
375.权利要求374的方法,其中所述的变体包含取代Ser21Pro+Ser57Asn。
376.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置205和411的位置包含取代。
377.权利要求376的方法,其中所述的变体包含取代Gly205Arg+Ser411Phe。
378.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置205和227的位置包含取代。
379.权利要求378的方法,其中所述的变体包含取代Gly205Arg+Pro227Ala(或Pro227Leu或Pro227Gly)。
380.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置205和206的位置包含取代。
381.权利要求380的方法,其中所述的变体包含取代Gly205Arg+His206Tyr。
382.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置8和205的位置包含取代。
383.权利要求382的方法,其中所述的变体包含取代Ser8Pro+Gly205Arg。
384.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置94和205的位置包含取代。
385.权利要求384的方法,其中所述的变体包含取代Gly94Ser(或Gly94Ala或Gly94Arg或Gly94Gln)+Gly205Arg。
386.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置196和205的位置包含取代。
387.权利要求386的方法,其中所述的变体包含取代Ser196Pro+Gly205Arg。
388.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置383和455的位置包含取代。
389.权利要求388的方法,其中所述的变体包含取代Thr383Ala+Thr455Ala。
390.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置113和411的位置包含取代。
391.权利要求390的方法,其中所述的变体包含取代Ser113Asn+Ser411Phe。
392.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置227和259的位置包含取代。
393.权利要求392的方法,其中所述的变体包含取代Pro227Ala(或Pro227Leu或Pro227Gly)+Asp259Asn。
394.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置94和226的位置包含取代。
395.权利要求394的方法,其中所述的变体包含取代Gly94Ser(或Gly94Ala或Gly94Arg或Gly94Gln)+Thr226Ala。
396.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置41和196的位置包含取代。
397.权利要求396的方法,其中所述的变体包含取代Thr41Ile+Ser196Thr(或Ser196Pro或Ser196Phe)。
398.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196和462的位置包含取代。
399.权利要求398的方法,其中所述的变体包含取代Ser113Asn+Ser196Thr(或Ser196Pro或Ser196Phe)+Thr462Ala。
400.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置157、205和255的位置包含取代。
401.权利要求400的方法,其中所述的变体包含取代Lys157Arg+Gly205Arg+Thr255Pro。
402.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置41、193和411的位置包含取代。
403.权利要求402的方法,其中所述的变体包含SEQ ID NO:2的氨基酸1至513的取代Thr41Ile+Glu193Lys+Ser411Phe。
404.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置247、371和411的位置包含取代。
405.权利要求404的方法,其中所述的变体包含SEQ ID NO:2的氨基酸1至513的取代Tyr247Cys+Tyr371Cys+Ser411Phe。
406.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和462的位置包含取代。
407.权利要求406的方法,其中所述的变体包含SEQ ID NO:2的氨基酸1至513的取代Ser113Asn+Ser196Thr(或Ser196Pro或Ser196Phe)+Pro227Ala+Thr462Ala。
408.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置49、113、227和438的位置包含取代。
409.权利要求408的方法,其中所述的变体包含SEQ ID NO:2的氨基酸1至513的取代Asn49Ser+Ser113Asn+Pro227Ala(或Pro227Leu或Pro227Gly)+Pro438Leu。
410.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置157、205、255和411的位置包含取代。
411.权利要求410的方法,其中所述的变体包含SEQ ID NO:2的氨基酸1至513的取代Lys157Arg+Gly205Arg+Thr255Pro+Ser411Phe。
412.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227和411的位置包含取代。
413.权利要求412的方法,其中所述的变体包含SEQ ID NO:2的氨基酸1至513的取代Ser113Asn+Ser196Thr(或Ser196Pro或Ser196Phe)+Pro227Ala(或Pro227Leu或Pro227Gly)+Ser411Phe。
414.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置21、57、246、251和411的位置包含取代。
415.权利要求414的方法,其中所述的变体包含SEQ ID NO:2的氨基酸1至513的取代Ser21Pro+Ser57Asn+Thr246Ile+Arg251Lys+Ser411Phe。
416.权利要求283的方法,其中所述的变体在对应于SEQ ID NO:2的氨基酸1至513的位置113、196、227、356和462的位置包含取代。
417.权利要求416的方法,其中所述的变体包含SEQ ID NO:2的氨基酸1至513的取代Ser113Asn+Ser196Thr(或Ser196Pro或Ser196Phe)+Pro227Ala(或Pro227Leu或Pro227Gly)+Thr356Ile+Thr462Ala。
418.权利要求283的方法,其中所述的变体包含一个或多个取代,所述取代选自SEQ ID NO:2的氨基酸1至513的S21P、G94S、G94A、G94R、G94Q、K157R、E193K、S196P、S196F、G205R、H206Y、P227L、P227G、T246I、Y247C、D259N、R251K、N301S、E337V、T350S、N373H、T383A、P438L、T455A、G467S和C486W,并任选地进一步包含一个或多个取代,所述取代选自SEQ ID NO:2的氨基酸1至513的S8P、G22D、T41I、N49S、S57N、S113N、S196T、T226A、P227A、T255P、T356I、Y371C、S411F和T462A。
419.权利要求283的方法,其中所述的变体具有氨基酸序列,所述氨基酸序列与SEQ ID NO:2的亲代糖苷水解酶的氨基酸1至513具有至少70%的同一性。
420.权利要求283的方法,其中所述的变体具有氨基酸序列,所述氨基酸序列与SEQ ID NO:2的亲代糖苷水解酶的氨基酸1至513具有至少75%的同一性。
421.权利要求283的方法,其中所述的变体具有氨基酸序列,所述氨基酸序列与SEQ ID NO:2的亲代糖苷水解酶的氨基酸1至513具有至少80%的同一性。
422.权利要求283的方法,其中所述的变体具有氨基酸序列,所述氨基酸序列与SEQ ID NO:2的亲代糖苷水解酶的氨基酸1至513具有至少85%的同一性。
423.权利要求283的方法,其中所述的变体具有氨基酸序列,所述氨基酸序列与SEQ ID NO:2的亲代糖苷水解酶的氨基酸1至513具有至少90%的同一性。
424.权利要求283的方法,其中所述的变体具有氨基酸序列,所述氨基酸序列与SEQ ID NO:2的亲代糖苷水解酶的氨基酸1至513具有至少95%的同一性。
425.权利要求283-424中任一项的方法,其中取代的总数为33,更优选32,还更优选31,还更优选30,还更优选29,还更优选28,还更优选27,还更优选26,还更优选25,还更优选24,还更优选23,还更优选22,还更优选21,还更优选20,还更优选19,还更优选18,还更优选17,还更优选16,还更优选15,还更优选14,还更优选13,还更优选12,还更优选11,还更优选10,还更优选9,还更优选8,还更优选7,还更优选6,还更优选5,还更优选4,还更优选3,还更优选2并最优选1。
426.权利要求283-424中任一项的方法,其与所述亲代糖苷水解酶相比具有改进的性质,其中所述改进的性质选自依赖于-温度的活性图谱、热稳定性、pH活性、pH稳定性和底物特异性、产物特异性,和化学稳定性。
427.权利要求426的方法,其中所述变体糖苷水解酶的热活性比所述野生型变体高至少2.5-倍,优选至少2-倍,更优选至少5-倍,最优选至少7-倍,并且还最优选至少20-倍。
428.权利要求283的方法,其由NRRL B-30658、NRRL B-30659、NRRLB-30661、NRRL B-30662、NRRL B-30663、NRRL B-30664、NRRL B-30665、NRRL B-30666、NRRL B-30674、NRRL B-30675、NRRL B-30676、NRRLB-30677、NRRL B-30678、NRRL B-30679、NRRL B-30680、NRRL B-30681、NRRL B-30682或NRRL B-30762中包含的核苷酸序列编码。
429.具有纤维二糖水解酶活性的分离的多肽,其包含SEQ ID NO:2的氨基酸1至513。
430.分离的核苷酸序列,其编码权利要求429的多肽。
431.权利要求430的核苷酸序列,其包含于pAJO52中,所述的pAJO52包含于大肠杆菌NRRL B-30683。
432.表达载体,其包含权利要求430的核苷酸序列。
433.宿主细胞,其包含权利要求430的核苷酸序列。
434.产生具有纤维二糖水解酶活性的多肽的方法,其包括:
(a)在适于表达所述多肽的条件下培养权利要求433的宿主细胞;和
(b)从所述培养基中回收所述多肽。
435.权利要求429的产生具有纤维二糖水解酶活性的多肽的方法,其包括:
(a)在适于表达所述多肽的条件下培养菌株,其中所述菌株以其野生型形式能够产生所述的多肽;和
(b)从所述培养基中回收所述多肽。
436.洗涤剂组合物,其包含权利要求1-146中任一项的变体和表面活性剂。
437.降解含-纤维素和半纤维素的生物质的方法,其包括用有效量的权利要求1-146中任一项的变体处理所述的生物质,和回收所降解的生物质。
438.权利要求437的方法,其进一步包括用有效量的内-1,4-beta-葡聚糖酶和外-1,4-beta-D-葡聚糖酶处理所述的生物质。
439.降解含-纤维素和半纤维素的生物质的方法,其包括用权利要求150或281的宿主细胞处理所述的生物质,和回收所降解的生物质。
440.权利要求439的方法,其进一步包括用有效量的内-1,4-beta-葡聚糖酶和外-1,4-beta-D-葡聚糖酶处理所述的生物质。
441.包含权利要求147或278的核苷酸序列的植物。
CN2004800315167A 2003-08-25 2004-08-25 糖苷水解酶的变体 Expired - Fee Related CN101410514B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US49780903P 2003-08-25 2003-08-25
US60/497,809 2003-08-25
PCT/US2004/027649 WO2005030926A2 (en) 2003-08-25 2004-08-25 Variants of glycoside hydrolases

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201310003302XA Division CN103088001A (zh) 2003-08-25 2004-08-25 糖苷水解酶的变体

Publications (2)

Publication Number Publication Date
CN101410514A true CN101410514A (zh) 2009-04-15
CN101410514B CN101410514B (zh) 2013-02-13

Family

ID=34392916

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2004800315167A Expired - Fee Related CN101410514B (zh) 2003-08-25 2004-08-25 糖苷水解酶的变体
CN201310003302XA Pending CN103088001A (zh) 2003-08-25 2004-08-25 糖苷水解酶的变体

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201310003302XA Pending CN103088001A (zh) 2003-08-25 2004-08-25 糖苷水解酶的变体

Country Status (6)

Country Link
US (6) US20050048619A1 (zh)
EP (5) EP1660637A4 (zh)
CN (2) CN101410514B (zh)
DK (3) DK2377931T3 (zh)
ES (3) ES2538824T3 (zh)
WO (1) WO2005030926A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104870638A (zh) * 2012-12-12 2015-08-26 丹尼斯科美国公司 纤维二糖水解酶的变体
CN104870643A (zh) * 2012-12-12 2015-08-26 丹尼斯科美国公司 纤维二糖水解酶的变体
CN104870642A (zh) * 2012-12-12 2015-08-26 丹尼斯科美国公司 纤维二糖水解酶的变体
CN104870644A (zh) * 2012-12-12 2015-08-26 丹尼斯科美国公司 纤维二糖水解酶的变体
CN107779443A (zh) * 2017-10-26 2018-03-09 南开大学 纤维二糖水解酶突变体及其应用

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2305801B1 (en) * 2002-08-16 2017-07-05 Danisco US Inc. Novel variant hyprocrea jecorina CBH1 cellulases
ES2437198T3 (es) 2003-10-28 2014-01-09 Novozymes Inc. Polipéptidos con actividad de beta-glucosidasa y polinucleótidos aislados que codifican los polipéptidos
MX2009012844A (es) * 2007-05-31 2009-12-15 Novozymes Inc Composiciones para degradar material celulosico.
AU2009276270A1 (en) * 2008-08-01 2010-02-04 Iogen Energy Corporation Family 6 cellulase with decreased inactivation by lignin
MX2011009009A (es) 2009-02-27 2011-09-15 Iogen Energy Corp Enzimas de celulosa resistentes a lignina.
WO2010129287A2 (en) 2009-04-27 2010-11-11 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
WO2011097713A1 (en) 2010-02-11 2011-08-18 Iogen Energy Corporation Carbohydrate binding modules with reduced binding to lignin
ES2549328T3 (es) 2010-02-11 2015-10-27 Süd-Chemie Ip Gmbh & Co. Kg Enzimas celulasas optimizadas
BR112013010129A2 (pt) 2010-11-18 2016-07-05 Novozymes Inc polipeptídeo gh61 quimérico isolado, polinucleotídeo isolado, célula hospedeira, métodos para produzir um polipeptídeo gh61 quimérico, para degradas ou converter um material celulóstico, para sintetizar um produto de fermentação, para fermentar um material celulósico e para limpar ou lavar uma superfície dura ou roupa para lavar, planta transgênica, parte da planta ou célula de planta, uso do polipeptídeo gh61 quimérico, composição detergente, e, formulação de caldo ou composição de cultura de células completas
RU2013146245A (ru) 2011-03-17 2015-04-27 ДАНИСКО ЮЭс ИНК. Способ уменьшения вязкости в процессе осахаривания
WO2012135719A1 (en) * 2011-03-31 2012-10-04 Novozymes, Inc. Cellulose binding domain variants and polynucleotides encoding same
US20140287471A1 (en) * 2011-10-06 2014-09-25 Bp Corporation North America Inc. Variant cbh i polypeptides with reduced product inhibition
AU2012328637B2 (en) 2011-10-27 2016-06-02 Buckman Laboratories International, Inc. Method and composition for enzymatic treatment of fiber for papermaking, and paper products made therewith
US20150291947A1 (en) * 2012-10-23 2015-10-15 Novozymes A/S Cellobiohydrolase variants and polynucleotides encoding same
US20150315560A1 (en) * 2012-12-12 2015-11-05 Danisco Us Inc. Variants of cellobiohydrolases
CN110628749A (zh) 2013-03-08 2019-12-31 诺维信公司 纤维二糖水解酶变体和编码它们的多核苷酸
FR3022557B1 (fr) * 2014-06-20 2019-01-25 Proteus Variants d'exoglucanases a activite amelioree et leurs utilisations
WO2016037096A1 (en) 2014-09-05 2016-03-10 Novozymes A/S Carbohydrate binding module variants and polynucleotides encoding same
DK3191587T3 (da) 2014-09-08 2019-10-14 Novozymes As Cellobiohydrolasevarianter og polynukleotider, som koder for dem
US10557127B2 (en) 2015-02-24 2020-02-11 Novozymes A/S Cellobiohydrolase variants and polynucleotides encoding same
EP3433358B1 (en) * 2016-03-24 2022-07-06 Novozymes A/S Cellobiohydrolase variants and polynucleotides encoding same
CN109136124A (zh) * 2018-08-17 2019-01-04 西南科技大学 一种超富集植物体快速减容减量处理复合菌剂及其制备方法
CN109456954B (zh) * 2018-11-21 2021-08-20 中山大学 热稳定性提高的β-葡萄糖苷酶突变体及其应用
CN109355275B (zh) * 2018-11-21 2021-08-20 中山大学 高热稳定性β-葡萄糖苷酶突变体及其应用
CN114250214B (zh) * 2020-09-21 2023-07-07 南京工业大学 持续性内切纤维素酶突变体及其应用
CN112266907B (zh) * 2020-10-28 2022-03-15 江南大学 齐整小核菌内源小核菌胶水解酶及应用

Family Cites Families (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1296839A (zh) 1969-05-29 1972-11-22
GB1372034A (en) 1970-12-31 1974-10-30 Unilever Ltd Detergent compositions
GB1483591A (en) 1973-07-23 1977-08-24 Novo Industri As Process for coating water soluble or water dispersible particles by means of the fluid bed technique
GB1590432A (en) 1976-07-07 1981-06-03 Novo Industri As Process for the production of an enzyme granulate and the enzyme granuate thus produced
DK187280A (da) 1980-04-30 1981-10-31 Novo Industri As Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode
CA1338400C (en) * 1983-08-31 1996-06-18 David H. Gelfand Recombinant fungal cellulases
DK263584D0 (da) 1984-05-29 1984-05-29 Novo Industri As Enzymholdige granulater anvendt som detergentadditiver
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
JPH0697997B2 (ja) 1985-08-09 1994-12-07 ギスト ブロカデス ナ−ムロ−ゼ フエンノ−トチヤツプ 新規の酵素的洗浄剤添加物
EG18543A (en) 1986-02-20 1993-07-30 Albright & Wilson Protected enzyme systems
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
ES2058119T3 (es) 1986-08-29 1994-11-01 Novo Nordisk As Aditivo detergente enzimatico.
NZ221627A (en) 1986-09-09 1993-04-28 Genencor Inc Preparation of enzymes, modifications, catalytic triads to alter ratios or transesterification/hydrolysis ratios
ATE125865T1 (de) 1987-08-28 1995-08-15 Novo Nordisk As Rekombinante humicola-lipase und verfahren zur herstellung von rekombinanten humicola-lipasen.
JPS6474992A (en) 1987-09-16 1989-03-20 Fuji Oil Co Ltd Dna sequence, plasmid and production of lipase
DE68924654T2 (de) 1988-01-07 1996-04-04 Novonordisk As Spezifische Protease.
DK6488D0 (da) 1988-01-07 1988-01-07 Novo Industri As Enzymer
JP3079276B2 (ja) 1988-02-28 2000-08-21 天野製薬株式会社 組換え体dna、それを含むシュードモナス属菌及びそれを用いたリパーゼの製造法
WO1989009259A1 (en) 1988-03-24 1989-10-05 Novo-Nordisk A/S A cellulase preparation
US5776757A (en) 1988-03-24 1998-07-07 Novo Nordisk A/S Fungal cellulase composition containing alkaline CMC-endoglucanase and essentially no cellobiohydrolase and method of making thereof
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
GB8915658D0 (en) 1989-07-07 1989-08-23 Unilever Plc Enzymes,their production and use
IL97645A (en) 1990-03-23 1997-03-18 Gist Brocades Nv Production of enzymes in seeds and their use
DE59101948D1 (de) 1990-04-14 1994-07-21 Kali Chemie Ag Alkalische bacillus-lipasen, hierfür codierende dna-sequenzen sowie bacilli, die diese lipasen produzieren.
EP0531372B2 (en) 1990-05-09 2004-04-14 Novozymes A/S A cellulase preparation comprising an endoglucanase enzyme
DK115890D0 (da) 1990-05-09 1990-05-09 Novo Nordisk As Enzym
WO1992005249A1 (en) 1990-09-13 1992-04-02 Novo Nordisk A/S Lipase variants
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
EP0495257B1 (en) 1991-01-16 2002-06-12 The Procter & Gamble Company Compact detergent compositions with high activity cellulase
EP0511456A1 (en) 1991-04-30 1992-11-04 The Procter & Gamble Company Liquid detergents with aromatic borate ester to inhibit proteolytic enzyme
ES2085024T3 (es) 1991-04-30 1996-05-16 Procter & Gamble Detergentes liquidos reforzados con complejo de acido borico-poliol para inhibir la enzima proteolitica.
DE69226182T2 (de) 1991-05-01 1999-01-21 Novo Nordisk A/S, Bagsvaerd Stabilisierte enzyme und waschmittelzusammensetzungen
DK72992D0 (da) 1992-06-01 1992-06-01 Novo Nordisk As Enzym
DK88892D0 (da) 1992-07-06 1992-07-06 Novo Nordisk As Forbindelse
JP3678309B2 (ja) 1992-07-23 2005-08-03 ノボザイムス アクティーゼルスカブ 突然変異α−アミラーゼ、洗剤、皿洗い剤及び液化剤
ATE262035T1 (de) 1992-10-06 2004-04-15 Novozymes As Zellulosevarianten
DK0867504T4 (da) 1993-02-11 2011-08-29 Genencor Int Oxidativ stabil alfa-amylase
KR950702240A (ko) 1993-04-27 1995-06-19 한스 발터 라벤 세제로의 이용을 위한 새로운 리파제 변형체
DK52393D0 (zh) 1993-05-05 1993-05-05 Novo Nordisk As
AU7069294A (en) 1993-07-12 1995-02-13 Novo Nordisk A/S A detergent composition comprising two cellulase components
JP2859520B2 (ja) 1993-08-30 1999-02-17 ノボ ノルディスク アクティーゼルスカブ リパーゼ及びそれを生産する微生物及びリパーゼ製造方法及びリパーゼ含有洗剤組成物
CA2173946A1 (en) 1993-10-13 1995-04-20 Anders Hjelholt Pedersen H2o2-stable peroxidase variants
JPH07143883A (ja) 1993-11-24 1995-06-06 Showa Denko Kk リパーゼ遺伝子及び変異体リパーゼ
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
ATE222604T1 (de) 1994-02-22 2002-09-15 Novozymes As Methode zur herstellung einer variante eines lipolytischen enzymes
DE69534513T2 (de) 1994-03-08 2006-07-27 Novozymes A/S Neuartige alkalische zellulasen
US5912157A (en) * 1994-03-08 1999-06-15 Novo Nordisk A/S Alkaline cellulases
AU2524695A (en) 1994-05-04 1995-11-29 Genencor International, Inc. Lipases with improved surfactant resistance
ATE206460T1 (de) 1994-06-03 2001-10-15 Novo Nordisk Biotech Inc Gereinigte myceliophthora laccasen und nukleinsäuren dafür kodierend
AU2884595A (en) 1994-06-20 1996-01-15 Unilever Plc Modified pseudomonas lipases and their use
WO1996000292A1 (en) 1994-06-23 1996-01-04 Unilever N.V. Modified pseudomonas lipases and their use
WO1996000787A1 (en) 1994-06-30 1996-01-11 Novo Nordisk Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
EP1995303A3 (en) 1994-10-06 2008-12-31 Novozymes A/S Enzyme preparation with endoglucanase activity
BE1008998A3 (fr) 1994-10-14 1996-10-01 Solvay Lipase, microorganisme la produisant, procede de preparation de cette lipase et utilisations de celle-ci.
KR970707275A (ko) 1994-10-26 1997-12-01 안네 제케르 지질분해 활성을 갖는 효소(an enzyme with lipolytic activity)
AR000862A1 (es) 1995-02-03 1997-08-06 Novozymes As Variantes de una ó-amilasa madre, un metodo para producir la misma, una estructura de adn y un vector de expresion, una celula transformada por dichaestructura de adn y vector, un aditivo para detergente, composicion detergente, una composicion para lavado de ropa y una composicion para la eliminacion del
JPH08228778A (ja) 1995-02-27 1996-09-10 Showa Denko Kk 新規なリパーゼ遺伝子及びそれを用いたリパーゼの製造方法
CN102080070B (zh) 1995-03-17 2016-01-20 诺沃奇梅兹有限公司 新的内切葡聚糖酶
DE69633825T2 (de) 1995-07-14 2005-11-10 Novozymes A/S Modifiziertes enzym mit lipolytischer aktivität
DK0843725T3 (da) 1995-08-11 2002-08-12 Novozymes As Fremgangmåde til fremstilling af polypeptidvarianter
JP4068142B2 (ja) 1995-08-11 2008-03-26 ノボザイムス アクティーゼルスカブ 新規の脂肪分解酵素
CN1231588C (zh) 1996-01-19 2005-12-14 诺沃奇梅兹生物技术有限公司 丝状真菌的形态突变体
US5763385A (en) 1996-05-14 1998-06-09 Genencor International, Inc. Modified α-amylases having altered calcium binding properties
AU3938997A (en) 1996-08-26 1998-03-19 Novo Nordisk A/S A novel endoglucanase
EP1726644A1 (en) 1996-09-17 2006-11-29 Novozymes A/S Cellulase variants
CA2265734A1 (en) 1996-10-08 1998-04-16 Novo Nordisk A/S Diaminobenzoic acid derivatives as dye precursors
DE69739020D1 (de) 1996-11-04 2008-11-13 Novozymes As Subtilase varianten und verbindungen
KR100561826B1 (ko) 1996-11-04 2006-03-16 노보자임스 에이/에스 섭틸라제 변종과 조성물
WO1998034946A1 (en) 1997-02-12 1998-08-13 Massachusetts Institute Of Technology Daxx, a novel fas-binding protein that activates jnk and apoptosis
WO1998041622A1 (en) 1997-03-18 1998-09-24 Novo Nordisk A/S Method for constructing a library using dna shuffling
CA2284097A1 (en) 1997-03-18 1998-09-24 Novo Nordisk A/S Shuffling of heterologous dna sequences
EP1080210A2 (en) 1998-05-27 2001-03-07 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide by modifying the copy number of a gene
AU6188599A (en) 1998-10-26 2000-05-15 Novozymes A/S Constructing and screening a dna library of interest in filamentous fungal cells
US7375197B2 (en) * 2002-01-14 2008-05-20 Midwest Research Institute Cellobiohydrolase I gene and improved variants
EP1200574A4 (en) * 1999-07-13 2004-03-17 Midwest Research Inst REDUCED GLYCOSYLATION VARIANTS OF CELLOBIOHYDROLASE: CBHIN45A, CBHIN270A AND CBHIN384A
WO2001040489A1 (en) 1999-11-30 2001-06-07 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide using a consensus translational initiator sequence
EP2298868B1 (en) 2001-06-26 2015-01-07 Novozymes A/S Polypeptides having cellobiohydrolase I activity and polynucleotides encoding same
EP2305801B1 (en) * 2002-08-16 2017-07-05 Danisco US Inc. Novel variant hyprocrea jecorina CBH1 cellulases
CA2770976C (en) * 2003-03-21 2015-05-19 Genencor International, Inc. Cbh1 homologs and variant cbh1 cellulases

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104870638A (zh) * 2012-12-12 2015-08-26 丹尼斯科美国公司 纤维二糖水解酶的变体
CN104870643A (zh) * 2012-12-12 2015-08-26 丹尼斯科美国公司 纤维二糖水解酶的变体
CN104870642A (zh) * 2012-12-12 2015-08-26 丹尼斯科美国公司 纤维二糖水解酶的变体
CN104870644A (zh) * 2012-12-12 2015-08-26 丹尼斯科美国公司 纤维二糖水解酶的变体
CN107779443A (zh) * 2017-10-26 2018-03-09 南开大学 纤维二糖水解酶突变体及其应用
CN107779443B (zh) * 2017-10-26 2020-10-13 南开大学 纤维二糖水解酶突变体及其应用

Also Published As

Publication number Publication date
WO2005030926A3 (en) 2009-04-02
US20130130353A1 (en) 2013-05-23
DK2617826T3 (en) 2015-10-12
EP2377931B1 (en) 2013-05-08
CN101410514B (zh) 2013-02-13
US20110136167A1 (en) 2011-06-09
EP2617825B1 (en) 2015-04-01
EP1660637A2 (en) 2006-05-31
US7932073B2 (en) 2011-04-26
US20170298333A1 (en) 2017-10-19
EP2617826B1 (en) 2015-08-12
US20050048619A1 (en) 2005-03-03
EP2987857A1 (en) 2016-02-24
ES2538824T3 (es) 2015-06-24
ES2424346T3 (es) 2013-10-01
US20080167214A1 (en) 2008-07-10
CN103088001A (zh) 2013-05-08
ES2549775T3 (es) 2015-11-02
EP2617826A1 (en) 2013-07-24
US20150056664A1 (en) 2015-02-26
EP2617825A1 (en) 2013-07-24
US9701951B2 (en) 2017-07-11
EP1660637A4 (en) 2009-10-21
DK2377931T3 (da) 2013-07-08
DK2617825T3 (en) 2015-06-01
WO2005030926A2 (en) 2005-04-07
US8383385B2 (en) 2013-02-26
EP2377931A1 (en) 2011-10-19

Similar Documents

Publication Publication Date Title
CN101410514B (zh) 糖苷水解酶的变体
CN1902310B (zh) 具有β-葡糖苷酶活性的多肽和编码所述多肽的多核苷酸
US9080165B2 (en) Variants of beta-glucosidase
CN101874109B (zh) 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN101310017B (zh) 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
CN101516906A (zh) 提高具有生物学活性之多肽的分泌的方法
CN101253263A (zh) 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
CN100516207C (zh) β-葡糖苷酶的变体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130213

Termination date: 20160825