CN101896602A - 耐热和耐酸的β-木糖苷酶、编码基因、相关生物和方法 - Google Patents

耐热和耐酸的β-木糖苷酶、编码基因、相关生物和方法 Download PDF

Info

Publication number
CN101896602A
CN101896602A CN2009801014047A CN200980101404A CN101896602A CN 101896602 A CN101896602 A CN 101896602A CN 2009801014047 A CN2009801014047 A CN 2009801014047A CN 200980101404 A CN200980101404 A CN 200980101404A CN 101896602 A CN101896602 A CN 101896602A
Authority
CN
China
Prior art keywords
ala
val
leu
gly
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009801014047A
Other languages
English (en)
Inventor
D·N·汤普森
V·S·汤普森
K·舒浩勒
W·A·阿佩尔
D·W·瑞德
J·A·莱西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Battelle Energy Alliance LLC
Original Assignee
Battelle Energy Alliance LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Battelle Energy Alliance LLC filed Critical Battelle Energy Alliance LLC
Publication of CN101896602A publication Critical patent/CN101896602A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • C12N9/2482Endo-1,4-beta-xylanase (3.2.1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01037Xylan 1,4-beta-xylosidase (3.2.1.37)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01055Alpha-N-arabinofuranosidase (3.2.1.55)
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21CPRODUCTION OF CELLULOSE BY REMOVING NON-CELLULOSE SUBSTANCES FROM CELLULOSE-CONTAINING MATERIALS; REGENERATION OF PULPING LIQUORS; APPARATUS THEREFOR
    • D21C5/00Other processes for obtaining cellulose, e.g. cooking cotton linters ; Processes characterised by the choice of cellulose-containing starting materials
    • D21C5/005Treatment of cellulose-containing material with microorganisms or enzymes
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21CPRODUCTION OF CELLULOSE BY REMOVING NON-CELLULOSE SUBSTANCES FROM CELLULOSE-CONTAINING MATERIALS; REGENERATION OF PULPING LIQUORS; APPARATUS THEREFOR
    • D21C11/00Regeneration of pulp liquors or effluent waste waters
    • D21C11/0007Recovery of by-products, i.e. compounds other than those necessary for pulping, for multiple uses or not otherwise provided for

Abstract

提供了来自酸热脂环酸杆菌的分离的和/或纯化的多肽和编码多肽的核酸序列及其变体。还提供了使用来自酸热脂环酸杆菌的分离的和/或纯化的多肽和编码多肽的核酸序列及其变体至少部分地降解木三糖和/或木二糖的方法。

Description

耐热和耐酸的β-木糖苷酶、编码基因、相关生物和方法
优先权要求
本申请要求于2008年1月25日提交的名为“耐热和耐酸的β-木糖苷酶、编码基因、相关生物和方法”的美国临时专利申请系列号61/023,639的提交日期的权益。
政府权利
依据美国能源部与巴特尔能源联盟(Battelle Energy Alliance,LLC)之间的合同编号DE-AC07-99ID13727和合同编号DE-AC07-05ID14517,美国政府拥有本发明中的某些权利。
技术领域
本发明总体上涉及生物技术。更具体地说,本发明涉及来自酸热脂环酸杆菌(Alicyclobacillus acidocaldarius)的分离的和/或纯化的多肽和编码多肽的核酸序列以及它们的使用方法。
背景
从木质纤维素材料中去除半纤维素的稀酸水解是最发达的木质纤维素预处理技术并且目前受到青睐(Hemelinck等人,2005),因为它产生了相当高产率的木糖(75-90%)。通常使用的条件是范围从0.5%到1.5%的硫酸和高于160℃的温度。所使用的高温产生了抑制随后的微生物发酵的显著水平的热解产物(Lavarack等人,2002)。由于在升高的温度下酸的腐蚀性更强,高温水解需要加压系统、蒸汽的产生以及在反应器构建中的抗腐蚀材料。
低温酸水解令人感兴趣因为它们具有克服上述若干缺点的潜力(Tsao等人,1987)。已证明在80-100℃的温度范围内、在几小时的酸处理中,90%的半纤维素能够作为寡聚体而溶解。还已证明低温酸水解所产生的糖类在那些相同的条件下是稳定的,达至少24小时,其中没有可检测的降解为糠醛的分解产物。最后,在预处理中通常使用的硫酸在较低温度下不具同样的腐蚀性。较低温度的酸预处理的利用需要长得多的反应时间以达到可接受的水解的水平。尽管已显示90%的半纤维素溶解(Tsao,1987),但大部分的糖处于寡聚体的形式而不处于单体形式。目前在随后的发酵步骤中偏爱的生物不能利用糖寡聚体(Garrote等人,2001),包含寡聚体的水解物需要进一步加工成单体,通常如较低激烈性酸水解的第二步骤(Garrote等人,2001)。
其他的酸性预处理方法包括自动水解和热水洗涤。在自动水解中,在高温下(约200℃)用蒸汽处理生物质,这裂解了与半纤维素有关的乙酰基侧链以产生在酸水解中作为酸催化剂发挥作用的乙酸。因为乙酸是比硫酸弱的多的酸,所以低于240℃半纤维素不被完全水解为糖单体并且具有高水平的寡聚体(Garrote等人,2001)。在热水洗涤中,在提高的温度160-230℃下使生物质与水接触(在压力下)。这个过程能够有效地水解大于90%的存在的半纤维素并且溶解的半纤维素通常超过95%是处于寡聚体的形式(Liu和Wyman,2003)。在这些预处理之后,常常有必要将寡聚的半纤维素进一步解聚为单体糖,这可以使用各种催化剂实现,这些催化剂包括液体、固体、汽态的酸和碱、以及酶。
发明公开内容
本发明的实施方案涉及纯化的和/或分离的酸热脂环酸杆菌基因组的核苷酸序列、或者其类似物或片段。在本发明的一个实施方案中,所述核苷酸序列是SEQ ID No.1或其类似物或片段。在本发明的另一个实施方案中,所述类似物对SEQ ID No.1具有至少80%的序列同一性。
本发明的实施方案可以进一步涉及一种分离的和/或纯化的核酸序列,所述核酸序列包括编码一种多肽的核酸序列,所述多肽对SEQ ID No.2的多肽具有至少90%的序列同一性。
本发明的实施方案还涉及分离的和/或纯化的由酸热脂环酸杆菌基因组的核苷酸序列所编码的多肽、或者其类似物或片段。在一个实施方案中,所述核苷酸序列对SEQ ID 1具有至少80%的序列同一性。在本发明的另一个实施方案中,所述核苷酸序列是SEQ ID No.1或其类似物或片段。在又一个实施方案中,所述多肽具有SEQ ID No.2的氨基酸序列。还在一实施方案中,所述多肽对SEQ ID No.2具有至少80%的序列同一性。在另一实施方案中,所述多肽具有SEQ ID No.2的氨基酸序列。
在本发明的实施方案中,所述多肽可以是嗜酸的和/或嗜热的。在其他的实施方案中,所述多肽可以是糖基化的、聚乙二醇化的、或其他方式的翻译后修饰的。
本发明的实施方案包括至少部分地降解或裂解木三糖和/或木二糖以释放木糖的方法。此类方法可包括将对SEQ ID No.2具有至少90%序列同一性的一种多肽放在接触木三糖和/或木二糖的液体中。
考虑到在此所包含的教导内容,本发明的这些方面及其他方面将对熟练的技术人员变得显而易见。
附图简述
图1A到1D描绘了在一种β-木糖苷酶SEQ ID NO:2(RAAC00307)与都是β-木糖苷酶的gi:76795911、gi:15642851、gi:148269983、gi:15899739以及gi:116621797(分别为SEQ ID NO:3-7)之间的序列比对。将所比对的三个或更多个序列所共有的氨基酸以粗体指示。
图2描绘了来自酸热脂环酸杆菌的粗制胞外提取物的银染色SDS-PAGE凝胶,所述酸热脂环酸杆菌在以0.5g/L的小麦阿拉伯木聚糖作为碳源的矿物盐培养基上生长至平稳期。
图3描绘了从用来浓缩蛋白并且在名义上纯化蛋白的离子交换层析柱上将蛋白洗脱的图示。所述蛋白是在60℃和pH 3.5在小麦阿拉伯木聚糖上生长的酸热脂环酸杆菌的细胞外液中产生的。总蛋白被描绘为菱形(右手边y轴);木聚糖内切酶活性由正方形描绘(左手边y轴);并且葡聚糖内切酶活性由菱形描绘(左手边y轴)。
图4描绘了以4.19g/L不溶解的燕麦斯卑尔脱木聚糖刺激并经HPLC监测的来自疏棉状嗜热丝孢菌(Thermomyces lanuginosus)的一种商业化木聚糖内切酶在50℃和pH 4.7时的木聚糖酶活性的图示。木己糖的水平被描绘为菱形;木五糖的水平被描绘为X;木四糖的水平被描绘为开圆;木三糖的水平被描绘为三角形;木二糖的水平被描绘为正方形;并且木糖的水平被描绘为封闭的圆。线代表所呈现的数据点的非线性回归。
图5描绘了以3.95g/L不溶解的燕麦斯卑尔脱木聚糖刺激并经HPLC监测的来自酸热脂环酸杆菌的木聚糖内切酶和β-木糖苷酶以粗制细胞外浓度在60℃和pH 2.0时联合活性的图示。木己糖的水平被描绘为封闭的圆;木五糖的水平被描绘为X;木四糖的水平被描绘为开圆;木三糖的水平被描绘为三角形;木二糖的水平被描绘为正方形;并且木糖的水平被描绘为菱形。线代表所呈现的数据点的非线性回归。
图6描绘了完全分布于级分20-50的β-木糖苷酶活性的图示,其中最高活性出现在级分25左右,之后从级分30到级分50逐渐降低。活性测定以一式两份进行,并且误差棒指示了标准差。
实施发明的最佳方式
期望利用在用于生产燃料的木质纤维素残基的纤维素和半纤维素中所包含的糖以及在生物炼制概念中的增值化学品。包括玉米秸秆的木质纤维素残基是由主要包含纤维素、半纤维素以及木质素的非均质3维基质组成。因为木质纤维素的非均质本质,纤维素和半纤维不是可直接获得的。许多燃料和化学品可以从这些木质纤维素材料制成。为了利用木质纤维素生物质通过发酵过程来生产燃料和化学品,有必要将植物多糖转化为糖单体,然后使用各种微生物将这些糖单体发酵成产品。在高温和高压下由无机酸将木质纤维素直接水解成单体是可能的,然而,由于糖的热分解,具有不可避免的产量损失。降低这些产量损失的一个策略是在适度的温度下使用纤维素酶以及潜在的其他酶来使多糖解聚。
已开发酸预处理法来水解和除去半纤维素,并由此提高了基质中的纤维素对分解纤维素攻击的易感性。然而,由于高温和高压,需要能够经受高温腐蚀环境的昂贵的合金,所以这些酸预处理法具有高的成本和操作费用,并且取决于预处理的严酷性,它们产生大量的糖的热分解产物。这些热分解产物代表了可被用于随后的发酵的潜在的糖的损失,并且对发酵生物也有毒性。因为这些问题,发酵性生物炼制发展的希望方向是整合预处理、酶水解以及发酵过程的各个要素。存在各种手段来整合酶促多糖水解和发酵过程。对于为此目的要使用的可商购获得的酶而言,预处理浆料必须通过灰碱处理过度或另一种方法进行中和并被冷却至40-50℃,由此向所述过程增加很大成本。相比之下,酸稳定的耐热半纤维素酶能够与严酷性降低的酸预处理一起使用或者在其后使用,降低了能源和资本的成本。这将允许半纤维素衍生的糖的最高产量并且使毒性副产物的形成降到最低。这个策略也必然导致半纤维素寡聚体在预处理液中的积累,在大多数微生物能够利用这些寡聚体之前需要将它们进一步水解成单体。在预处理的过程中向所述生物质浆料中加入酸稳定的耐热水解酶诸如纤维素酶、木聚糖酶和木糖苷酶,允许使用较低的温度和压力以及较廉价的构建材料,由此减少了资本和能源,并且或许大大减少或消除了对用于预处理的高压蒸汽的需求。
本发明的实施方案部分地涉及酸热脂环酸杆菌的基因序列和由酸热脂环酸杆菌的基因编码的蛋白质序列。所包括的基因是编码能够将木三糖和木二糖分解成木糖的蛋白(β-木糖苷酶)的基因。
本发明涉及分离的和/或纯化的酸热脂环酸杆菌基因组的核苷酸序列,其中所述核苷酸序列包括SEQ ID No.1或其片段之一。
本发明同样涉及分离的和/或纯化的核苷酸序列,其特征在于它们选自:a)序列SEQ ID No.1或其片段之一的特定片段的核苷酸序列;b)与如在a)中所定义的核苷酸序列同源的核苷酸序列;c)与如在a)或b)中所定义的核苷酸序列互补的核苷酸序列和它们对应的RNA的核苷酸序列;d)能够在严格条件下与如在a)、b)或c)中所定义的核苷酸序列杂交的核苷酸序列;e)包含如在a)、b)、c)或d)中所定义的核苷酸序列的核苷酸序列;以及f)由例如在a)、b)、c)、d)或e)中所定义的核苷酸序列修饰的核苷酸序列。
根据本发明,核苷酸、多核苷酸或核酸序列将被理解为既表示处于单体和二聚体(所谓的串联)形式的双链或单链DNA又表示所述DNA的转录产物。
本发明的实施方案涉及这样的序列:可能从分离方法起始或从基因工程的方法起始对其进行分离、纯化或部分地纯化,所述分离方法诸如例如离子交换层析、通过基于分子大小排除、或通过亲和性、或者可替代的基于不同溶剂溶解度的分级分离技术,所述基因工程的方法诸如扩增、克隆和亚克隆,对于本发明的序列来说,由载体携带是可能的。
根据本发明的分离的和/或纯化的核苷酸序列片段将被理解为指定的酸热脂环酸杆菌基因组的任何核苷酸片段,并且以非限制性实例的方式可以包括所起源的序列的长度为至少8、12、20、25、50、75、100、200、300、400、500、1000或更长的连续核苷酸。
根据本发明的分离的和/或纯化的核苷酸序列的特定片段将被理解为指定的酸热脂环酸杆菌基因组的任何核苷酸片段,所述片段在与酸热脂环酸杆菌基因组序列的对应片段进行比对或比较之后具有至少一个不同性质的核苷酸或碱基。
在本发明的意义上的同源的分离和/或纯化的核苷酸序列被理解为表示与根据本发明的核苷酸序列的碱基具有至少一定百分比同一性的分离的和/或纯化的核苷酸序列,所述百分比同一性为至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%或99.7%,这个百分比是纯统计的,并且在这两条核苷酸序列任意长度和全长之间分布差异是可能的。
在本发明的意义上的特定的同源核苷酸序列被理解为表示具有如以上所定义的特定片段的至少一条核苷酸序列的同源核苷酸序列。所述“特定的”同源序列可以包括例如与代表酸热脂环酸杆菌的基因组的变体的基因组序列或其片段的序列相对应的序列。因而这些特定的同源序列能够对应于与酸热脂环酸杆菌菌株内的突变有关的变异,并且特别对应于至少一个核苷酸的截短、替换、缺失和/或增添。所述同源序列能够同样地对应于与遗传密码的简并性有关的变异。
数据“序列同源性的程度或百分比”是指如在本申请中所定义的“在最优比对之后在两条序列之间序列同一性的程度或百分比”。
两条氨基酸或核苷酸序列当如以下文所述进行最大对应比对时,如果在这两条序列中的氨基酸或核苷酸残基的序列是相同的,则称它们是“相同的”。在两种(或多种)肽或多核苷酸之间的序列比较通常是通过比较在区段或“比较窗口”的两条最佳比对的序列的序列而进行,以识别和比较局部区域的序列相似性。通过Smith和Waterman,Ad.App.Math 2:482(1981)的局部同源性算法,通过Neddleman和Wunsch,J.Mol.Biol.48:443(1970)的同源性比对算法,通过Pearson和Lipman,Proc.Natl.Acad.Sci.(U.S.A.)85:2444(1988)的搜索相似性方法,通过这些算法的计算机化实施(在Wisconsin遗传学软件包,Genetics Computer Group(GCG),575 Science Dr.,Madison,Wis.中的GAP、BESTFIT、FASTA、和TFASTA),或者通过目测可进行用于比较的序列的最优比对。
通过比较在比较窗口的两条最佳比对的序列来确定“序列同一性的百分比”(或者程度或同一性),其中在所述比较窗口中的肽或多核苷酸序列的部分可以包括相比于参考序列(它不包括增添或缺失)的增添或缺失(即空位),以用于这两条序列的最优比对。百分比的计算是通过确定相同的氨基酸残基或核酸碱基在两个序列中都存在的位置的数目以得出匹配的位置的数目,用匹配的位置的数目除以比较窗口中的位置的总数目,并且将结果乘以100以得出序列同一性的百分比。
以上所给出的序列同一性的定义是将被本领域熟练技术人员使用的定义。所述定义本身不需要任何算法的帮助,所述算法仅对实现序列的最优比对而不是序列同一性的计算有帮助。
从以上所给出的定义,由此可知,对于两条比较序列之间的序列同一性存在定义明确的唯一值,所述值对应于最佳比对或最优比对所获得的值。
BLAST N或BLAST P“BLAST 2序列”为在网站worldwideweb.ncbi.nlm.nih.gov/gorf/bl2.html中可得到的软件,并且被发明人以及通常被熟练技术人员习惯性地用于比较和确定两条序列之间的同一性,在上述软件中,依赖于要比较的序列长度的空位值(gap cost)被所述软件直接选择(即对于长度大于85的替换矩阵BLOSUM-62,为11.2)。
本发明的序列的互补核苷酸序列被理解为表示如下的任何DNA:其核苷酸与本发明的序列的核苷酸是互补的,并且其方向是颠倒的(反向平行序列)。在本发明的实施方案中,本发明的核苷酸序列和/或本发明的序列的互补核苷酸序列可以被用来改变基因的表达。可以被用来改变基因表达的技术的实例包括但不限于:RNAi、siRNA和反义技术。
在严格条件下与根据本发明的核苷酸序列杂交被理解为表示以如下方式所选择的温度和离子强度的条件下的杂交:所述方式为使得温度和离子强度允许保持在互补DNA的两个片段之间的杂交。
通过举例说明的方式,目的是限定以上所述的核苷酸片段的杂交步骤的非常严格性的条件有利地如以下所述。
在65℃的优选温度,在SSC缓冲液,对应于0.15M NaCl和0.05M柠檬酸钠的1xSSC的存在下进行杂交。洗涤步骤例如可以如下进行:在室温下的2xSSC,接着是用在65℃下的2xSSC,0.5%SDS;2x0.5xSSC,0.5%SDS的两次洗涤;在65℃各持续10分钟。
使用例如42℃的温度在2xSSC缓冲液的存在下的中度严格性条件,或者例如37℃的温度在2xSSC缓冲液存在下的较低严格性的条件,分别要求在这两条序列之间杂交的总体上较少量的互补。
用于具有近似350个碱基大小的多核苷酸的以上所述的严格杂交条件将由本领域的熟练技术人员根据Sambrook等人,1989的教导进行修改以适合于更大或更小尺寸的寡核苷酸。
允许获得根据本发明的同源序列的方法中可被用作引物或探针的那些核苷酸序列是在根据本发明的分离的和/或纯化的核苷酸序列中,这些方法如聚合酶链式反应(PCR)、核酸克隆和测序是本领域熟练技术人员公知的。
在根据本发明的分离的和/或纯化的核苷酸序列中,在允许存在包含SEQ ID No.1、其片段之一或如以下所定义的要被鉴别的其变体之一的序列的方法中可被用作引物或探针的那些核苷酸序列被再次优选。
可以例如通过特异性扩增如PCR,或者在用适当的限制性内切酶消化根据本发明的核苷酸序列之后获得根据本发明的核苷酸序列片段,这些方法具体在Sambrook等人,1989年的著作中描述。同样能够根据本领域的普通技术人员所熟知的方法通过化学合成获得此类代表性片段。
修饰的核苷酸序列将被理解为表示根据本领域熟练技术人员公知的技术通过诱变获得的任何核苷酸序列,并且包含关于根据本发明的正常序列的修饰,例如在多肽表达的调节序列和/或启动子序列中的突变,特别地导致所述多肽的表达率的改变或导致复制周期的调节。
修饰的核苷酸序列同样将被理解为表示编码如下文所定义的修饰的多肽的任何核苷酸序列。
本发明涉及分离的和/或纯化的酸热脂环酸杆菌的核苷酸序列,其特征在于它们选自序列SEQ ID No.1或其片段之一。
本发明的实施方案同样涉及分离的和/或纯化的核苷酸序列,其特征在于它们包含选自以下的核苷酸序列:a)核苷酸序列SEQ ID No.1或其片段之一;b)如在a)中所定义的序列的特定片段的核苷酸序列;c)与在a)或b)中所定义的序列具有至少80%同一性的同源核苷酸序列;d)如在a)、b)或c)中所定义的序列的互补核苷酸序列或与如在a)、b)或c)中所定义的序列相对应的RNA的序列;以及e)由如在a)、b)、c)或d)中所定义的序列修饰的核苷酸序列。
SEQ ID No.8-12的核苷酸序列或其片段、以及与SEQ ID No.1的序列或其片段具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%或99.7%同一性的同源性的任何其他分离的和/或纯化的核苷酸序列在根据本发明的分离的和/或纯化的核苷酸序列之中。所述同源序列能够包括例如与酸热脂环酸杆菌的基因组序列对应的序列。以相同的方式,这些特定的同源序列能够对应于与酸热脂环酸杆菌菌株内的突变有关的变异并且特别地对应于至少核苷酸的截短、替换、缺失和/或增添。
本发明的实施方案包括由根据本发明的核苷酸序列或其片段所编码的分离的和/或纯化的多肽,所述片段的序列由片段表示。氨基酸序列与能够根据序列SEQ ID No.1的三个可能的读码框中之一编码的分离的和/或纯化的多肽相对应。
本发明的实施方案同样涉及分离的和/或纯化的多肽,其特征在于它们包括选自氨基酸序列SEQ ID No.2或其片段之一的多肽。
本发明另外的实施方案涉及分离的和/或纯化的多肽,其特征在于它们包括选自氨基酸序列SEQ ID No.2或其片段之一的多肽,其中所述多肽具有β-木糖苷酶活性。
包含氨基酸序列SEQ ID No.13-17或其片段的任一种或多种的分离的和/或纯化的多肽,或者是与序列SEQ ID No.2或其片段具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%或99.7%同一性的同源性的任何其他分离的和/或纯化的多肽在根据本发明的实施方案的分离的和/或纯化的多肽中。
本发明的实施方案还涉及多肽,其特征在于它们包括选自以下的多肽:a)根据本发明的氨基酸序列的多肽的至少5个氨基酸的特定片段;b)与如在a)所定义的多肽同源的多肽;c)如在a)或b)中所定义的多肽的特定的生物学活性片段;以及d)由在a)、b)或c)中所定义的多肽修饰的多肽。
在本说明书中,术语多肽、肽和蛋白质是可互换的。
在本发明的实施方案中,根据本发明的分离的和/或纯化的多肽可以是糖基化的、聚乙二醇化的或其他方式的翻译后修饰的。在另外的实施方案中,糖基化可以在体内或体外发生,并且可以通过酶法或使用化学糖基化技术来实施。在另外的实施方案中,任何糖基化、聚乙二醇化和/或其他方式的翻译后修饰可能是N-连接的或O-连接的。
在本发明的实施方案中,任何一种根据本发明的分离的和/或纯化的多肽在等于或高于25、30、35、40、45、50、55、60、65、70、75、80、85、90、和/或95摄氏度的温度可以具有酶活性,和/或在等于、低于或高于7、6、5.5、5、4、3、2、1、和/或0的pH条件下可以具有酶活性。在本发明的其他实施方案中,糖基化、聚乙二醇化或其他方式的翻译后修饰可能为根据本发明的分离的和/或纯化的多肽所需要,所述多肽在等于或低于7、6、5.5、5、4、3、2、1、和/或0的pH、或者在等于或高于约25、30、35、40、45、50、55、60、65、70、75、80、85、90、和/或95摄氏度的温度可溶和/或具有酶活性。在其他实施方案中,所述酶活性可以是β-木糖苷酶活性。
本发明的实施方案涉及如下多肽:其通过从自然来源中纯化而被分离或获得,否则通过遗传重组或可替代地通过化学合成获得,并且它们可因此包含正常情况下在生命系统中不存在的氨基酸,如将在下文所描述的。
根据本发明的实施方案的“多肽片段”被理解为指定的包含至少5个连续的氨基酸、优选10个连续的氨基酸或者15个连续的氨基酸的多肽。根据本发明的多肽片段的非限制性实例包括含有5、10、15、25、50、75、100、200、300、400、500、1000或更多个连续残基的多肽。在其他实施方案中,所述多肽片段可以包括β-木糖苷酶活性。
在本发明中,特定的多肽片段被理解为指定的由根据本发明的特定片段核苷酸序列所编码的连续的多肽片段。
“同源多肽”将被理解为指定的具有关于天然多肽的某些修饰的多肽,具体而言,所述修饰为例如至少一个氨基酸的缺失、增添或替换,截短,延长,嵌合体融合,和/或突变。在所述同源多肽之中,其氨基酸序列与根据本发明的多肽的氨基酸的序列具有至少90%同源性的多肽是优选的。在其他实施方案中,同源多肽可以包括β-木糖苷酶活性。
“特定的同源多肽”将被理解为指定的如以上所定义的并具有根据本发明的多肽的特定片段的同源多肽。
在替换的情况中,一个或多个连续或者非连续的氨基酸被“等同的”氨基酸代替。表述“等同的”氨基酸在此是针对指定的能够被碱基结构的氨基酸之一替换、然而没有实质上改变对应肽的生物活性的任何氨基酸,并且这样使得它们将被下文定义。在氨基酸序列SEQ ID No.2中的此类替换的实例可以包括氨基酸序列SEQ ID No.13-17的那些分离的和/或纯化的多肽。
这些等同的氨基酸可以通过依赖于它们与所替换的氨基酸的结构同源性或依赖于能够被执行的在不同多肽之间生物活性的比较测验的结果来确定。
通过非限制性实例的方式,将提及能够被执行而不导致对应的修饰的多肽的生物活性的广泛改变的替换的可能性,例如亮氨酸被缬氨酸或异亮氨酸代替,天冬氨酸被谷氨酸代替,谷氨酰胺被天冬酰胺代替,精氨酸被赖氨酸代替等等,在相同条件下反向替换自然地是可想象的。
在另外的实施方案中,替换被限制为在具有相似的识别的酶活性的其他蛋白中不保守的氨基酸中的替换。例如,图1在此提供了在本发明的确定的肽(SEQ ID No.2)与其他的被识别为具有相似酶活性的肽之间的序列比对,其中所比对的序列中的三种或更多种序列所共有的氨基酸以粗体指示。因此,根据本发明的实施方案,替换或突变可以在图中未指示为粗体的位置发生。此类多肽的实例可以包括但不限于在氨基酸序列SEQ IDNo.13-17中发现的多肽。在另外的实施方案中,核酸序列可以被突变或替换以使得它们编码的氨基酸是未改变的(简并性替换和/或突变),和/或被突变或替换以使得任何生成的氨基酸替换或突变发生在图中未指示为粗体的位置。此类核酸序列的实例包括但不限于在核酸序列SEQ ID No.8-12或其片段中发现的核酸序列。
特定的同源多肽同样对应于由如以上所定义的特定的同源核苷酸序列所编码的多肽,并且因此在本定义中包括突变的多肽或与可以在酸热脂环酸杆菌中存在的变体相对应的多肽,以及特别地与至少一个氨基酸残基的截短、替换、缺失和/或增添相对应的多肽。
根据本发明的实施方案的“多肽的特定的生物学活性片段”将被具体理解为指定的特定的多肽片段,如以上所定义那样,具有根据本发明的多肽的至少一个特征。在某些实施方案中,所述肽能够作为β-木糖苷酶起作用。
根据本发明的实施方案的多肽片段能够与酸热脂环酸杆菌中天然存在的分离或纯化的片段相对应,或者与能够通过蛋白水解酶如胰蛋白酶、糜蛋白酶或胶原酶或通过化学试剂如溴化氰(CNBr)对所述多肽的切割而获得的片段相对应。此类多肽片段同样能够通过化学合成和/或从根据本发明的表达载体转化的宿主中容易地制备,所述表达载体包含允许表达所述片段的核酸,所述片段被置于适当的调节元件和/或表达元件的控制之下。
根据本发明的实施方案的多肽的“修饰的多肽”被理解为指定的通过将在以下描述的遗传重组或化学合成而获得的具有关于正常序列的至少一个修饰的多肽。这些修饰或许能够或许不能够对特异性和/或活性的起源、或结构构象的起源、定位、和根据本发明的多肽的膜插入的能力的起源的氨基酸有影响。因此,产生具有等同的、提高的或降低的活性以及等同的、更窄的或更宽的特异性的的多肽是可能的。修饰的多肽的实例包括但不限于如下多肽:其中多达5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、250、300、350、400、450或500个氨基酸能够被修饰、在N-端或C-端的末端被截短、或者甚至被缺失或增添。
允许对待说明的真核细胞或原核细胞的所述调控的方法是本领域普通技术人员公知的。同样被很好地理解的是使用编码所述修饰的多肽的核苷酸序列用于所述调控例如通过根据本发明并且在以下描述的载体将是可能的。
前述的修饰的多肽可以通过使用组合化学获得,在所述组合化学中,在模型、细胞培养物或微生物上测验多肽之前系统地改变多肽的部分例如以选择最具活性或具有寻找的特性的化合物是可能的。
化学合成同样具有能够利用非天然氨基酸或非肽键的优点。
因此,为了提高根据本发明的多肽的寿命持续时间,利用非天然氨基酸例如D形式或其他的氨基酸类似物例如特别是含硫形式可能是令人感兴趣的。
最后,将根据本发明的多肽的结构、其特定的或修饰的同源形式整合到多肽类型或其他类型的化学结构中将是可能的。因此,提供在N端和C端的末端不被蛋白酶识别的化合物可能是令人感兴趣的。
编码根据本发明的多肽的核苷酸序列同样是本发明的部分。
本发明同样涉及可作为引物或探针使用的核苷酸序列,其特征在于所述序列选自根据本发明的核苷酸序列。
被很好地理解的是本发明在各种实施方案中同样涉及由核苷酸序列编码的酸热脂环酸杆菌的特定的多肽,所述多肽能够通过从天然多肽中纯化、通过遗传重组或通过化学合成通按本领域熟练技术人员公知以及如以下具体描述的方法而获得。以相同的方式,直接针对由所述核苷酸序列所编码的所述特定多肽的标记或未标记的单克隆抗体或多克隆抗体也被本发明包括。
本发明的实施方案另外涉及根据本发明的核苷酸序列作为引物或探针来检测和/或扩增核酸序列的用途。
因此,可使用根据本发明的实施方案的核苷酸序列来扩增核苷酸序列,特别是通过PCR技术(聚合酶链式反应)(Erlich,1989;Innis等人,1990;Rolfs等人,1991;以及White等人,1997)。
这些寡脱氧核糖核苷酸或寡核糖核苷酸引物有利地具有至少8个核苷酸、优选至少12个核苷酸、以及甚至更优选的至少20个核苷酸的长度。
可以有利地采用靶核酸的其他扩增技术作为PCR的替代。
本发明的核苷酸序列、特别是根据本发明的引物同样能够在扩增靶核酸的其他方法中采用,例如:TAS技术(基于转录的扩增系统),由Kwoh等人在1989年描述;3SR技术(自主序列复制),由Guatelli等人在1990年描述;NASBA技术(基于核酸序列的扩增),由Kievitis等人在1991年描述;SDA技术(链置换扩增)(Walker等人,1992);TMA技术(转录介导的扩增)。
本发明的多核苷酸还能够在用作探针的核酸的扩增或修饰技术中采用,例如:LCR技术(连接酶链式反应),由Landegren等人在1988年描述并且由Barany等人在1991年改进,所述技术采用热稳定连接酶;RCR技术(修复链式反应),由Segev在1992年描述;CPR技术(循环探针反应),由Duck等人在1990年描述;用Q-β复制酶的扩增技术,由Miele等人在1983年描述并且特别地由Chu等人在1986年、Lizardi等人在1988年改进,然后由Burg等人以及Stone等人在1996年改进。
在待检测的靶多核苷酸可能是RNA例如一种mRNA的情况中,借助根据本发明的至少一种引物采用扩增反应之前或者借助本发明的至少一种探针采用检测步骤之前,使用逆转录酶类型的酶以便从包含在所述生物样品中的RNA获得cDNA是可能的。获得的cDNA将因此用作在根据本发明的扩增或检测步骤中所采用的一种或多种引物或者一种或多种探针的靶。
将以这样的方式选择所述检测探针:使得它与靶序列或从靶序列中产生的扩增子杂交。通过序列的方式,这样一种探针将有利地具有至少12个核苷酸的序列、特别地至少20个核苷酸的序列以及优选地至少100核苷酸的序列。
本发明的实施方案还包括可作为根据本发明的探针或引物使用的核苷酸序列,其特征在于它们用一种放射性化合物或非放射性化合物标记。
所述未标记的核苷酸序列可以直接作为探针或引物使用,尽管所述序列普遍用一种放射性元素(32P、35S、3H、125I)或用一种非放射性分子(生物素、乙酰氨基芴、地高辛、5-溴脱氧尿苷、荧光黄素)标记以获得可用于许多应用的探针。
核苷酸序列的非放射性标记的实例描述于例如法国专利号78.10975中,或者被Ureda等人或Sanchez-Pescador等人在1988年描述。
在后一种情况中,使用在专利FR-2 422 956和FR-2 518 755中所述的标记方法中的也将是可能的。
杂交技术能够以各种方式进行(Matthews等人,1988)。最普遍的方法包括将细胞的核酸提取物固定在支持体(如硝酸纤维素、尼龙、聚苯乙烯)上,并且包括在定义明确的条件下固定的靶核酸与探针一起孵育。在杂交后,清除过量的探针并且通过适当方法(与所述探针相关的放射活性、荧光或酶活性的测量)检测形成的杂交分子。
本发明在各种实施方案中同样包括根据本发明的核苷酸序列,其特征在于它们被共价或非共价地固定在支持体上。
根据利用依据本发明的核苷酸序列的另一个有利方式,后者能够固定在支持体上使用并且可因此用来通过特异性杂交捕获从待测验的生物样品中获得的靶核酸。如果必要,将所述固相支持体从所述样品中分离,然后在第二探针即用一种可容易检测的元素标记的所谓的检测探针的帮助下检测在所述捕获探针与所述靶核酸之间所形成的杂交复合物。
本发明的另方面是用于序列的克隆和/或表达的载体,其特征在于它包含根据本发明的核苷酸序列。
根据本发明的载体特征在于它们包含允许所述核苷酸序列在确定的宿主细胞中表达和/或分泌的元件,它们同样是本发明的部分。
所述载体那么可以包含启动子、翻译起始和终止的信号以及适当的转录调节区域。载体能稳定地保持在所述宿主细胞中,并且能够任选地具有指定所述翻译的蛋白分泌的特殊的信号。可以根据所用的宿主细胞的功能来选择这些不同的元件。为此目的,可以将根据本发明的核苷酸序列插入到所选宿主内的自主复制载体或所选宿主的整合载体中。
将根据本领域熟练技术人员目前使用的方法来制备此类载体,并且将自其产生的克隆通过标准方法可能引入到适当的宿主中,所述标准方法诸如例如转染、脂质转染、电穿孔和热休克。
如在此使用的“转化的”和“转化”是指包含载体的细胞或者向细胞提供载体的过程。转化的细胞可以是或者可以不是永生化的。转化的细胞的永生化可以是或者可以不是因为在载体中存在特殊的核酸序列。在本发明的实施方案中,载体或载体的一部分可以被稳定地整合到细胞的基因组中。在实施方案中,根据本发明当载体或载体的一部分已经被“转化”时,它们的整合并不改变细胞的状况,
根据本发明的载体是例如质粒或病毒来源的载体。用于表达本发明的多肽的载体的一个实例是杆状病毒。
这些载体对于转化宿主细胞以便克隆或表达本发明的核苷酸序列而言是有用的。
本发明同样包括被根据本发明的一种载体转化的宿主细胞。
这些细胞可以通过将已插入到如以上所定义的载体中的核苷酸序列引入到宿主细胞中、然后在允许复制和/或表达所述转染的核苷酸序列的条件下培养所述细胞来获得。
所述宿主细胞可以选自原核或真核系统,诸如例如:细菌细胞(Olins和Lee,1993);同样还有酵母细胞(Buckholz,1993);植物细胞(例如但不限于拟南芥);以及动物细胞,特别是哺乳动物细胞(Edwards和Aruffo,1993)的培养物,例如中国仓鼠卵巢(CHO)细胞;同样还有其中利用应用杆状病毒的方法是可能的昆虫的细胞,例如sf9昆虫细胞(Luckow,1993)。
本发明的实施方案同样涉及包含所述根据本发明的所述转化的细胞之一的生物。
过量表达酸热脂环酸杆菌的一种或多种基因或基因的部分的根据本发明的转基因生物的获得,可以根据本领域熟练技术人员公知的方法如通过病毒或非病毒转染,在例如大鼠、小鼠或兔中进行。在具有普遍存在性或者对一种组织类型选择性的强启动子的控制下,通过转染多个拷贝的所述基因获得过量表达一种或多种所述基因的转基因生物是可能的。通过以下获得转基因生物同样将是可能的:在胚细胞株中的同源重组,将这些细胞株转移到胚,在生殖线水平选择这些受感染的嵌合体,并且使所述嵌合体生长。
根据本发明的转化细胞和转基因生物在用于制备重组多肽的方法中是可利用的。
现今,通过基因工程、使用由根据本发明的表达载体所转化的细胞或者使用根据本发明的转基因生物相对大量地生产重组多肽是可能的。
用于制备重组形式的本发明的多肽的方法的特征在于它们采用了根据本发明的载体,和/或由根据本发明的载体所转化的细胞,和/或包含根据本发明的所述转化的细胞之一的转基因生物,这些方法本身包含在本发明中。
在用于制备重组形式的本发明的多肽的所述方法之中,采用载体和/或由所述载体转化的细胞和/或包含所述转化的细胞之一的转基因生物的制备方法,包含根据本发明的核苷酸序列,所述核苷酸序列编码本发明的多肽。
根据本发明的变体可以包括产生与“载体”蛋白相融合的重组多肽(嵌合蛋白)。这个系统的优点是它可以允许重组产物的稳定和/或蛋白水解的减少,在体外复性过程中溶解度的增加,和/或当融合伙伴对特定配体具有亲和性时纯化的简化。
更具体地说,本发明涉及用于制备本发明的多肽的方法,包括以下步骤:a)在允许表达根据本发明的核苷酸序列的重组多肽的条件下培养转化的细胞;b)如果需要的话,回收所述重组多肽。
当用于制备本发明的多肽的方法采用根据本发明的转基因生物时,所述重组多肽就从所述生物中被提取出来。
本发明还涉及能够通过如之前所描述的本发明的方法获得的多肽。
本发明还包括用于制备合成多肽的方法,其特征在于它使用根据本发明的多肽的氨基酸序列。
本发明同样涉及通过根据本发明的方法获得的合成多肽。
根据本发明的多肽同样能够通过在肽合成领域中常规的技术制备。这种合成可以在均相溶液中或在固相中进行。
例如,可以借助于由Houben-Weyl在1974年所描述的在均相溶液中的合成技术。
这种合成方法包括按所需顺序对连续氨基酸进行两个两个地连续缩聚,或者包括按适当顺序对之前形成并且已包含几个氨基酸的氨基酸和片段、或可替代地之前以这种方式制备的几个片段进行缩聚,应当理解的是有必要事先保护由这些氨基酸或片段所携带的所有的反应性官能团,除了一端的胺官能团和另一端的羧基之外或者反之亦然,根据在肽合成中公知的方法,所述胺官能团和羧基在正常情况下必须参与肽键的形成,特别是在活化羧基官能团之后。
还可以借助于由Merrifield所描述的技术。
根据Merrifield方法,为了制备肽链,借助于非常多孔的聚合树脂,链的第一C端氨基酸被固定在所述树脂上。这种氨基酸通过它的羧基被固定在树脂上并且它的胺官能团受到保护。这样将要形成所述肽链的氨基酸被一个接一个地固定在已形成并连在树脂上的肽链部分的氨基上,所述氨基每次都事先被脱保护。当已经形成整个的所述希望肽链时,将形成肽链的不同氨基酸的保护基团清除,并在酸的帮助下将所述肽从所述树脂中分离。
本发明另外涉及杂合多肽,所述杂合多肽具有根据本发明的至少一种多肽和能够在人或动物中诱导免疫反应的多肽的序列。
有利地,所述抗原决定簇是这样的:它能够诱导体液反应和/或细胞反应。
对于这样的决定簇来说,包括糖基化形式的根据本发明的多肽将是可能的,使用所述糖基化多肽目的在于获得能够诱导直接针对多个表位的抗体的合成的免疫原性组合物。
这些杂合分子可以部分地被形成根据本发明的多肽载体分子或其片段,所述分子或其片段与可能的免疫原性部分特别是白喉毒素、破伤风毒素、乙型肝炎病毒的表面抗原(专利FR7921811)、脊髓灰质炎病毒的VP1抗原或者任何其他病毒或细菌的毒素或抗原的表位有关。
用于合成杂合分子的方法包括在基因工程中用于构建编码对所寻找的多肽序列的杂合核苷酸序列的方法。例如,有利地引用由Minton在1984年描述的用于获得编码融合蛋白的基因的技术是可能的。
编码杂合多肽和根据本发明的杂合多肽的所述杂合核苷酸序列特征在于它们是通过表达所述杂合核苷酸序列而获得的重组多肽,它们同样是本发明的一部分。
本发明同样包括载体,其特征在于它们包含所述杂合核苷酸序列之一。由所述载体转化的宿主细胞、包含所述转化的细胞之一的转基因生物以及使用所述载体、所述转化的细胞和/或所述转基因生物来制备重组多肽的方法同样是本发明的一部分。
根据本发明的多肽、以下所述的根据本发明的抗体以及根据本发明的核苷酸序列,可以有利地在用于检测和/或鉴定酸热脂环酸杆菌或者来自该菌能够包含在样品中的蛋白中的方法中采用。按照根据本发明的多肽、抗体以及核苷酸序列的特异性,将使用的这些方法具体能够检测和/或鉴定酸热脂环酸杆菌或者来自它的蛋白。
根据本发明的多肽可有利地被用于在能够包含酸热脂环酸杆菌的样品中检测和/或鉴定酸热脂环酸杆菌的方法,其特征在于它包括以下步骤:a)将这份样品与根据本发明的多肽或其片段之一相接触(在允许所述多肽与可能存在于所述生物样品中的抗体之间的免疫反应的条件下);b)显示可能形成的抗原抗体复合物。
任何常规方法可被用来对可能形成的抗原抗体复合物进行检测。
通过举例的方式,优选的方法带来作用为根据通过免疫荧光的ELISA技术的免疫酶促方法或放射免疫方法(RIA)或其等同方法。
因此,本发明同样涉及根据本发明的、借助充分的标记如酶促、荧光的或放射性的类型标记的多肽。
此类方法包括例如以下步骤:将根据本发明的确定量的多肽组合物放在微滴定板的孔中,向所述孔中加入递增稀释度的血清或不同于之前所定义的必须被分析的生物样品,孵育微板,向微滴定板的孔中加入直接针对猪免疫球蛋白标记了的抗体,这些抗体已借助酶进行了标记,所述酶选自能够水解底物改变底物至少在确定的波长例如在550nm发光的吸收的酶,通过与对照试验进行比较来检测水解的底物的量。
根据本发明的多肽允许制备单克隆抗体或多克隆抗体,这些抗体的特征在于它们特异性地识别根据本发明的多肽。有利的是,根据由Kohler和Milstein在1975年描述的技术从杂交瘤制备所述单克隆抗体是可能的。例如,通过用与所述免疫反应的佐剂相关联的、根据本发明的多肽或DNA免疫动物特别是小鼠,然后在已事先固定了用作抗原的多肽的亲和柱上纯化包含在免疫了的动物血清中特异性抗体来制备所述单克隆抗体是可能的。根据本发明的多克隆抗体也可以通过在已事先固定了用作抗原的多肽的亲和柱上纯化包含在动物血清中的抗体来制备,所述动物通过免疫的方式受到酸热脂环酸杆菌或者根据本发明的多肽或片段攻击。
本发明同样涉及单克隆或多克隆抗体或者它们的片段、或者嵌合抗体,其特征在于它们能够特异性识别根据本发明的多肽。
对于本发明的抗体来说,用与之前对本发明的核酸探针所述相同的方式如酶的、荧光的或放射性类型的标记来标记它们同样是可能的。
本发明另外涉及用于在样品中检测和/或鉴定酸热脂环酸杆菌或来自它的蛋白的方法,其特征在于它包括以下步骤:a)将所述样品与根据本发明的单克隆或多克隆抗体相接触(在允许所述抗体与可能存在于所述生物样品中的酸热脂环酸杆菌的多肽之间免疫反应的条件下);b)显示可能形成的抗原抗体复合物。
本发明同样涉及用于在样品中检测和/或鉴定酸热脂环酸杆菌的方法,其特征在于它采用根据本发明的核苷酸序列。
更具体而言,本发明涉及用于在样品中检测和/或鉴定酸热脂环酸杆菌或来自它的蛋白的方法,其特征在于它包括以下步骤:a)如果需要的话,从待分析的样品中分离DNA;b)借助根据本发明的至少一种引物或一对引物特异性扩增所述样品的DNA;c)显示扩增产物。
例如,这些可以利用根据本发明的核酸探针通过分子杂交技术来检测。这种探针将有利地用非放射性元素(冷探针)或放射性元素标记。
出于本发明的目的,“生物样品的DNA”或“包含在生物样品中的DNA”将被理解为表示在所考虑的生物样品中存在的DNA或可能在逆转录酶类型的酶对所述生物样品中存在的RNA作用后所获得的cDNA。
本发明的另外的实施方案包括一种方法,其特征在于它包括以下步骤:a)将根据本发明的核苷酸探针与生物样品相接触,如果需要,包含在所述生物样品中的DNA在允许所述探针与所述样品的DNA杂交的条件下之前已变得容易杂交;b)显示在所述核苷酸探针与所述生物样品的DNA之间所形成的杂交体。
本发明还涉及根据本发明的一种方法,其特征在于它包括以下步骤:a)将固定在根据本发明的支持体上的核苷酸探针与生物样品相接触,如果需要所述样品的DNA在允许所述探针与所述样品的DNA杂交的条件下之前已变得容易杂交;b)将在支持体上固定的所述核苷酸探针与包含在生物样品的DNA之间所形成的杂交体,如果需要在将没有与所述探针杂交的所述生物样品的DNA清除后,与根据本发明的标记了的核苷酸探针相接触;c)显示在步骤b)中所形成的新的杂交体。
根据之前所定义的检测和/或鉴定的方法的有利的实施方案,其特征在于,在步骤a)之前,首先借助根据本发明的至少一种引物扩增所述生物样品中的DNA。
本发明的另外的实施方案包括将木三糖至少部分地降解为木二糖和木糖和/或将木二糖裂解为两单位木糖的方法。降解这些结构具有领域公知的用处,如在以下文献中所述:Mielenz 2001;Jeffries 1996;Shallom和Shoham 2003;Lynd等人2002;Vieille和Zeikus 2001;Bertoldo等人2004;和/或Malherbe和Cloete 2002。
方法的实施方案包括将对SEQ ID No.2的多肽具有至少90%序列同一性的重组、纯化和/或分离的多肽放在与木三糖和/或木二糖的液体接触中或放在要生产木三糖和/或木二糖的环境中。
方法的另外的实施方案包括将产生或编码对SEQ ID No.2的多肽具有至少90%序列同一性的一种重组、纯化和/或分离的多肽的细胞放在与木三糖和/或木二糖的液体接触中或放在要生产木三糖和/或木二糖的环境中。
如在此使用的“部分地降解”涉及在靶结构中化学键的重排或裂解。在另外的实施方案中,“部分地降解”包括木三糖裂解为木二糖和木糖和/或木二糖裂解为两单位的木糖。
在另外的实施方案中,至少部分地降解木三糖和/或木二糖的方法可以在等于或高于大约25、30、35、40、45、50、55、60、65、70、75、80、85、90、和/或95摄氏度的温度和/或在等于、低于和/或高于7、6、5.5、5、4、3、2、1、和/或0的pH下发生。
本发明的另外的实施方案可以包括用于至少部分地降解木三糖和/或木二糖的试剂盒,所述试剂盒包括一种细胞,所述细胞产生或编码对SEQID No.2的多肽具有至少90%序列同一性的重组、纯化和/或分离的多肽和/或对SEQ ID No.2的多肽具有至少90%序列同一性的重组、纯化和/或分离的多肽。
在本发明的实施方案中,根据本发明的任何一种分离的和/或纯化的多肽在等于或高于约25、30、35、40、45、50、55、60、65、70、75、80、85、90、和/或95摄氏度的温度下可以具有酶活性,和/或在等于或低于和/或高于7、6、5.5、5、4、3、2、1、和/或0的pH下可以具有酶活性。在本发明的其他实施方案中,糖基化、聚乙二醇化或其他方式的翻译后修饰可能为根据本发明的分离的和/或纯化的多肽所需要,所述多肽在等于或低于7、6、5.5、5、4、3、2、1、和/或0的pH、或者在等于或高于约25、30、35、40、45、50、55、60、65、70、75、80、85、90、和/或95摄氏度的温度可溶和/或具有酶活性。
在以下用作说明的实施例中对本发明进行了另外详细的描述。尽管所述实施例可能仅代表本发明的选择的实施方案,但应该理解以下实施例是用作说明的而非限制。
实施例
实施例1:从酸热脂环酸杆菌中分离木聚糖酶和β-木糖苷酶
在pH 3.5和60℃,使三十升的酸热脂环酸杆菌生长在包含0.5g/L小麦阿拉伯木聚糖作为唯一碳源的最小量盐的培养基上。使培养物长至平稳期并通过离心来收集以除去细胞。将得到的上清液通过0.22μm滤器过滤以除去任何剩余的细胞,并且通过10kDa分子量的截留膜超滤浓缩。然后在室温下将这种粗制的胞外浓缩液装载到流速为7.75mL/min的阳离子交换柱(Poros HS,Applied Biosystems)上。然后用从0到1M的氯化钠盐梯度经5分钟将结合的蛋白洗脱下来并且将其作为单一级分收集。将这个级分脱盐、浓缩并再次装载到阳离子交换柱上。进行一次洗涤以除去未结合的材料。然后用另一个从0到1M的氯化钠盐梯度以10ml/min的流速经5分钟洗脱结合的蛋白,并且每6秒收集一次级分。在级分15-39中的蛋白(三角形)、木聚糖内切酶(正方形)和葡聚糖内切酶(菱形)的活性水平示于图3中。得到的峰其中之一看起来是两个重叠峰。每个级分覆盖木聚糖酶(正方形)和纤维素酶(菱形)活性显示这两种活性重叠,这证明存在两种或多种酶(图3)。将级分15-34汇合(此后被称为汇合的浓缩层析级分,PCCF)并经历SDS-PAGE电泳。PCCF的SDS-PAGE凝胶既包含5个主要的蛋白条带也包含几个次要的条带(图2)。图2中的PCCF的SDS-PAGE凝胶中的多个条带支持多种酶的存在。
实施例2:显示来自酸热脂环酸杆菌中的木聚糖酶内切酶和β-木糖苷酶的活性
在60℃和pH 2.0用3.95g/L不溶的燕麦斯卑尔脱木聚糖作底物测验了PCCF的木聚糖酶内切酶和β-木糖苷酶的活性。结果与来自疏棉状嗜热丝孢菌(可从Sigma-Aldrich Co.,St.Louis,MO获得,产品编号X2753)的β-1,4-木聚糖内切酶的木聚糖内切酶活性的平行测验结果进行比较,所述平行测验使用4.19g/L不溶的燕麦斯卑尔脱木聚糖作底物并且在50℃和pH4.7下操作。通过HPLC对水相中的碳水化合物寡糖和单体的出现进行72小时的监测。通过与来自在相同条件下操作的无酶对照的HPLC数据的比较鉴定了由酶活性引起的产物。
如预期的那样,疏棉状嗜热丝孢菌的酶展示出木聚糖内切酶活性,它通过在内部切割β-1,4-木聚糖骨架发挥作用,并且产生了β-1,4-木聚糖的寡聚体。这些寡聚体包括木己糖、木五糖、木四糖、木三糖和木二糖(图4)。通过界定β-1,4-木聚糖内切酶的终产物,主要终产物是木二糖和木三糖。其中,可以看到木糖的水平(封闭的圆)仍在零点,而木二糖(正方形)和木三糖(三角形)的水平显示在实验期间的最大提高。木己糖(菱形)、木五糖(X)和木四糖(开圆)的水平也是可检测的,其普遍性与木聚糖聚合体的长度呈反向相关。
就PCCF的活性而言,木聚糖内切酶和β-木糖苷酶的活性都明确地存在(图5)。其中,可以看出木二糖(正方形)和木三糖(三角形)的水平表现出在实验期间很大提高。这与图4所示的来自疏棉状嗜热丝孢菌的木聚糖酶所见的木糖酶活性相关。木己糖(封闭的圆)的水平仍在零点,而木五糖(X)和木四糖(开圆)也是可检测的。然而,除了见到疏棉状嗜热丝孢菌的酶的木聚糖内切酶活性清楚存在之外,PCCF实验展现了大量木聚糖的产生(菱形)。因为迄今为止已知的木聚糖内切酶不能够产生木糖,这表明存在另一种酶活性,即β-木糖苷酶活性,此活性能够将木三糖转变为木二糖和木糖以及将木二糖转变为两单位的木糖。
实施例3:在来自酸热脂环酸杆菌的浓缩层析级分中的β-木糖苷酶活性的显示
在pH 3.5和60℃,使三十升的酸热脂环酸杆菌生长在包含0.5g/L小麦阿拉伯木聚糖作为唯一碳源的最小量盐的培养基上。使培养物长至平稳期并通过离心来收集以除去细胞。将得到的上清液通过0.22μm滤器过滤以除去任何剩余的细胞,并且将上清液装载到室温下流速为7.75mL/min的阳离子交换柱(Poros HS,Applied Biosystems)上。储备一升的上清液(柱前)用于在纯化之前测验β-木糖苷酶活性。储备一升不与柱结合的流穿液(柱后)来测验β-木糖苷酶活性。然后用从0到1M的氯化钠盐梯度经5分钟将结合的蛋白洗脱下来并且将其作为单一级分收集。将这个级分脱盐、浓缩并再次装载到阳离子交换柱上。进行一次洗涤以出去未结合的材料。然后用另一个从0到1M的氯化钠盐梯度以10ml/min的流速经5分钟洗脱结合的蛋白,并且每6秒收集一次级分。将柱前和柱后的液体浓缩125倍并且测验β-木糖苷酶。单个的级分也测验活性。在pH 3.5和60℃,使用类似物底物对-甲基伞形基-β-D-吡喃木糖苷在范围从级分20-50的浓缩层析级分中测验β-木糖苷酶活性。这种化合物具有与木二糖和木三糖中所发现的木糖-木糖键相似的键,并且当被切割时产生一种荧光产物。无酶对照也被实施以说明底物的非生物水解。β-木糖苷酶活性在柱前和柱后级分中均被发现并且分布遍及洗脱的级分,尽管在级分25左右似乎不存在宽峰(图6)。这可能指示所述柱不具有用于所述活性的足够的结合能力或者它结合得不是非常强。
鉴于PCCF和多个单独的浓缩层析级分显示的β-木糖苷酶活性,使用本领域中的标准技术对酸热脂环酸杆菌的整个基因组进行测序。分析了编码β-木糖苷酶的开放读码框。识别了编码与其他β-木糖苷酶具有高同源性的蛋白的基因,即RAAC00307(SEQ ID NO:1)。
实施例4:RAAC00307:一种β-木糖苷酶
在SEQ ID NO:1中提供的是从酸热脂环酸杆菌中分离的并且编码SEQID NO:2的多肽的核苷酸序列。如在图1A到图1D中可以看到的那样,SEQID NO:2与其他被识别为β-木糖苷酶的蛋白很好地比对。特别重要的,应当注意的是在其他β-木糖苷酶中保守的氨基酸的位置,那些氨基酸在SEQID NO:2中一般是保守的。因此,在SEQ ID NO:2中所提供的多肽被正确地分类为一种β-木糖苷酶。
SEQ ID NO:13-17的多肽是SEQ ID NO:2的多肽中的保守性替换的代表实例并且分别由SEQ ID NO:8-12的核苷酸序列编码。
使用本领域的标准技术将SEQ ID NO:1和SEQ ID NO:8-12的核苷酸序列放入表达载体中。然后将这些载体提供给细胞,例如细菌细胞或真核细胞(如Sf9细胞或CHO细胞)。与当前细胞中常见手段结合,包含SEQID NO:1和SEQ ID NO:8-12的载体产生了SEQ ID NO:2和SEQ IDNO:13-17的多肽。然后分离和/或纯化SEQ ID NO:2和SEQ ID NO:13-17的多肽。然后分离的和/或纯化的SEQ ID NO:2和SEQ ID NO:13-17的多肽显示出具有作为β-木糖苷酶的活性。
用木三糖和/或木二糖来刺激分离的和/或纯化的SEQ ID NO:2和SEQID NO:13-17的多肽。分离的和/或纯化的SEQ ID NO:2和SEQ ID NO:13-17的多肽显示出在将木三糖至少部分地降解为木二糖和木糖和/或将木二糖切割为两单位的木糖中具有活性。通过在反应中监测木三糖、木二糖和木糖的水平可以明确地证明这种活性。
实施例5:RAAC00307:一种β-木糖苷酶的产生和纯化
从酸热脂环酸杆菌中克隆SEQ ID NO:1的核苷酸序列。SEQ ID NO:1编码SEQ ID NO:2的多肽。将SEQ ID NO:1克隆到用于大肠杆菌的pBAD/HIS A表达载体和用于毕赤酵母的pPIC6αA表达载体中并且分别通过电穿孔和热激进入感受态细胞中提供给大肠杆菌和毕赤酵母。从包含SEQ ID NO:1的转化的大肠杆菌和毕赤酵母中检测SEQ ID NO:2的表达,并且使用钴树脂从这些用于活性测验的来源中对RAAC00307进行亲和纯化。
实施例6:RAAC00307:一种β-木糖苷酶的β-木糖苷酶活性
使用荧光测定法测验从大肠杆菌和毕赤酵母中纯化的RAAC00307的β-木糖苷酶活性,总结如下:
通过在1mL的二甲基亚砜(DMSO)中稀释10mg(0.01g)的MUXyl(4-甲基伞形基-β-D-吡喃木糖苷)(Sigma M7008-1G CAS#6734-33-4)产生了MUXyl的溶液。然后将DMSO溶液的单个等分部分用pH 2.0、pH 3.5和pH 5.5的50mM乙酸钠缓冲液进行1∶100稀释。
将实例5中产生的纯化的RAAC00307的样品在pH 2.0、pH 3.5和pH5.5的50mM乙酸钠缓冲液中进行1∶10、1∶20和1∶50稀释。将来自黑曲霉的β-木糖苷酶(Sigma X3501-5UN-CAS#9025-530)在pH 2.0、pH 3.5和pH 5.5的50mM乙酸钠缓冲液中进行1∶100稀释作为阳性对照。将样品(RAAC00307样品和阳性对照)以50μL等分部分放在96孔板的孔中。空白缓冲液仅放在一些孔中。然后将板预热到60或80摄氏度5分钟。然后将10μL的MUXyl溶液加入到每个孔中并将板进一步在60或80摄氏度孵育另外10分钟。然后将100μL的0.5M碳酸钠加入到每个孔中并且在96孔读板仪(SpectraMAX Gemini)以激发355和发射460测量β-木糖苷酶活性。
在表1中显示了所确定的RAAC00307的特异活性。
表1
  测定   比活性毕赤酵母   比活性大肠杆菌
  pH 3.5,60℃   1.63nmol/min mg   988nmol/min mg
  pH 5.5,60℃   1.46nmol/min mg   2205nmol/min mg
  pH 3.5,80℃   0.983nmol/min mg   710nmol/min mg
  pH 2.0,60℃   0.566nmol/min mg   未检出的
  pH 2.0,80℃   未检出的   未检出的
当已经在某些实施方案中描述本发明时,在本公开的精神和范围内可以进一步修改本发明。因此,本申请旨在覆盖使用其一般原理的本发明的任何变化、使用或改编。此外,本申请旨在覆盖对本公开的背离当出现在本发明所属领域中已知的或习惯性的实践之内时,这些背离落在所附权利要求书及其法律等同物的限制之内。
参考文献目录
Barany,F.,1911,PNAS.USA,88:189-193.
Bertoldo et al.,2004,Eng.Life Sci.,4,No.6
Buckholz,R.G.,1993,Yeast systems for the expression of heterologous gene products.Curr.Op.Biotechnology 4:538-542.
Burg,J.L.et al.,1996,Mol.and Cell.Probes,10:257-271.
Chu,B.C.F.et al.,1986,NAR,14:5591-5603.
Duck,P.et al.,1990,Biotechniques,9:142-147.
Edwards,C.P.,and Aruffo,A.,1993,Current applications of COS cell based transientexpression systems.Curr.Op.Biotechnology 4:558-563.
Garrote,G,H Dominguez,and JC Parajo,2001,Manufacture of xylose-based fermentationmedia from corncobs by posthydrolysis of autohydrolysis liquors,Appl.Biochem.Biotechnol.,95:195-207.
Guateli,J.C.et al.,1990,PNAS.USA,87:1874-1878.
Hamelinck,CN,G van Hooijdonk,and APC Faaij,2005,Ethanol from lignocellulosicbiomass:techno-economic performance in short-,middle-,and long-term,BiomassBioenergy,28:384-410.
Houben-Weyl,1974,in Methode der Organischen Chemie,E.Wunsch Ed.,Volume 15-I and15-II,Thieme,Stuttgart.
Huygen,K.et al.,1996,Nature Medicine,2(8):893-898.
Innis,M.A.et al.,1990,in PCR Protocols.A guide to Methods and Applications,San Diego,Academic Press.
Jeffries,1996,Curr.Op.in Biotech.,7:337-342.
Kievitis,T.et al.,1991,J.Virol.Methods,35:273-286.
Kohler,G.et al.,1975,Nature,256(5517):495497.
Kwoh,D.Y.et al.,1989,PNAS.USA,86:1173-1177.
Liu C,and CE Wyman,2003,The effect of flow rate of compressed hot water on xylan,lignin,and total mass removal from corn stover,Ind.Eng.Chem.Res.,42:5409-5416.
Loontiens,F.G.and C.K.DeBruyne,1965,Naturwissensehaften,52,661.
Luckow,V.A.,1993,Baculovirus systems for the expression of human gene products.Curr.Op.Biotechnology 4:564-572.
Lynd et al.,2002,Micro.and Mol.Biol.Rev.,Vol.66,No.3,P.506-577.
Malherbe and Cloete,2002,Re/View in Environmental Science and Bio/Technology,1:105-114.
Matthews,J.A.et al.,1988,Anal.Biochem.,169:1-25.
Merrifield,R.D.,1966,J.Am.Chem.Soc.,88(21):5051-5052.
Miele,E.A.et al.,1983,J.Mol.Biol.,171:281-295.
Mielenz,2001,Curr.Op.in Micro.,4:324-329.
Olins,P.O.,and Lee,S.C.,1993,Recent advances in heterologous gene expression in E.coli.Curr.Op.Biotechnology 4:520-525.
Rolfs,A.et al.,1991,In PCR Topics.Usage of Polymerase Chain reaction in Genetic andInfectious Disease.Berlin:Springer-Verlag.
Sambrook,J.et al.,1989,In Molecular cloning:A Laboratory Manual.Cold Spring Harbor,N.Y.:Cold Spring Harbor Laboratory Press.
Sanchez-Pescador,R.,1988,J.Clin.Microbiol.,26(10):1934-1938.
Segev D.,1992,in“Non-radioactive Labeling and Detection of Biomolecules”“.Kessler C.Springer Verlag,Berlin,New-York:197-205.
Shallom and Shoham,2003,Curr.Op,in Micro.,6:219-228.
Tsao,GT,MR Ladisch,and HR Bungay,1987.Biomass  Refining,In AdvancedBiochemical Engineering,Wiley Interscience,N.Y.,79-101.
Urdea,M.S.,1988,Nucleic Acids Research,II:4937-4957.
Vieille and Zeikus,2001,Micro.and Mol.Biol.Rev.,Vol.65,No.1,P.1-43.
Walker,G.T.et al.,1992,NAR 20:1691-1696.
Walker,G.T.et al.,1992,PNAS.USA,89:392-396.
White,B.A.et al.,1997,Methods in Molecular Biology,67,Humana Press,Totowa,NJ.
序列表
<110>巴特勒能源同盟有限公司
 
<120>耐热和耐酸的β-木糖苷酶、编码基因、相关生物和方法
 
<130>102696 1PWCN
 
<160>17
 
<170>PatentIn version 3.3
 
<210>1
<211>2397
<212>DNA
<213>酸热脂环酸杆菌(Alicyclobacillus acidocaldarius)
 
<400>1
ttgaatgtga aggcggcgtc agcgcctgat gagcagagga ggcttcccgt gacacccgtg    60
tatctcgatc ccgcacagtc cattgaagcg cgcgtcgacg cgctcctggc cgatatgacg   120
cttgaagaaa aggtcgctca actcacgtcc atctgggcgt tcgaagtcct ggatgagctc   180
gagttctccg ccgagaaggc cgccgccgtg ctcgggcagg gcatcggaca ggtgacccga   240
attggcggcg ccaccaatct ggacccgccg gatgtggccc gcctcgccaa ccagattcag   300
cgctacctgc gcgatcacac gcgcctcggc attccggcgc tgatccacga ggagtcgtgc   360
agcggctaca tggccaaggg cgccacctgc tttccgcaaa ccattggcat cgcgagcacg   420
tgggatgtcg atctcgcccg ccgtattggc gccatcatcc gcgatcagat gcgggccgtc   480
ggggcgcgcc aggcgctcgc cccgctcctg gatgtggcac gagatccgcg ctggggccgg   540
gtggaggaga cgttcggcga agatccgtac ctcgtggcgc agatgggcat cgcgtacgtc   600
cgcgggctgc agggagacga cctgagccag ggcgtgatgg cgacgggcaa gcacttcgtg   660
ggctacgggg cgtccgaggg cggcatgaac tgggcgccgg cgcacatccc ggagcgcgag   720
ctgcgcgagg tgtacctgtt cccgttcgag gcggcggtgc gcgaggcggg gctcggcgcc   780
atcatgccgg ggtaccacga gctcgacggc gtgccctgcc acgacaatcc agggcttttg   840
cgcgagaccc tccgcgggcg ctggggcttt caggggctcg tggtgtcgga ctatttcgcc   900
gtgaatcagc tgttcgaata tcatcaggtg gcccgggaca aggcggaggc cgcggcgctc   960
gccgtgcgcg ccggggtgga cgtggagctg ccgacgcgcg acgtgtacgg caagccgctc  1020
atcgaggccg ttgcacgagg gctcgtcagc ccggccgaga tcgacgaact cgtgcgccgg  1080
gtgctcacgt ggaagttccg gctcggcctc ttcgatcacc cgtttgtcga cgagggcgcg  1140
gccatcgccg tcttcgacaa cgcggagcag cgtcaggtgg cgcgggaggc ggcggagaag  1200
tcgatggtcc tcctcaaaaa cgacgggctt ctgcccctcg cgccccgcgg caccatcgcc  1260
gtgatcggcc caaacgcgca cacgacgcgc aatttggtag gcgattacgc ctacccgtgc  1320
cacatcgagt cgctcctcga gcagtccgag gacaacgtgt ttcagacccc gcttccgagc  1380
ggcgtgaaac acgtggacga gttcatcctc atgcggacca tcctcgaggc catccgccat  1440
cgcgtcgggt cggaggcgca ggtcgtctac gcgaaggggt gcgacatcct cggcggtgag  1500
gatgcggagc tcgaggaggc ggtggcgctt gccgcgaagg cggacgtggc ggttgtggtg  1560
gtgggcgatc gcgccgggct cacggacgcg tgcacgacag gggaatcgcg agacagagcc  1620
acgctctcgc tcatcgggcg gcaggaggaa ctcgtgcggc gcgtaatcgc cacgggcacg  1680
aagacggtcg tggtgctcgt gagcgggcgg ccgctcgcca tcccggacat cgcggagcgg  1740
gcgaacgccg ttctcgaggc gtggctgccg ggcgaggaag gcgcggaggc ggtggccgcg  1800
gtcctgtttg gcgacgtgaa tccgtccggg aagctgccca tcacgattcc gcgcagcgtg  1860
ggccaggtgc caatttacta cgggcacaag ccgtcgggcg gccgctcgca ctggaagggc  1920
gcgtatgtgg acgagagcaa tctgccgctc tatccgtttg ggcacgggct gtcctacacg  1980
gcgttcgcgt accgggatct ggcgctgtct ccgagcgtcc tgggcgtgca cggcgaggtc  2040
gaggtgtcgt gcgtgatcga aaacgtcggg gctcgcgcgg gcgaagaggt ggtgcaactg  2100
tacgcacgcg acgtggcggc ggacgtgacg cggccggtga aggcgctctg cggctttgcg  2160
cgggtggcgc tcgcgccggg agagaaggcg cgagtgcggt tccgggtttc agcgcaccag  2220
ttcggcttct acaaccggga gatgcggtat gtcgtggagc cgggcgagat cgagttcatg  2280
gtgggggcgt cgtccgagga catccgcctg cgcggggcgg tgcggatgga cggcgcggtg  2340
acggagatcg agcacgagaa ggtataccag agcgcggtgg acgtcgagcg gatgtga     2397
 
<210>2
<211>798
<212>PRT
 
<213>酸热脂环酸杆菌(Alicyclobacillus acidocaldarius)
 
<400>2
 
Met Asn Val Lys Ala Ala Ser Ala Pro Asp Glu Gln Arg Arg Leu Pro
1               5                   10                  15
Val Thr Pro Val Tyr Leu Asp Pro Ala Gln Ser Ile Glu Ala Arg Val
            20                  25                  30
Asp Ala Leu Leu Ala Asp Met Thr Leu Glu Glu Lys Val Ala Gln Leu
        35                  40                  45
Thr Ser Ile Trp Ala Phe Glu Val Leu Asp Glu Leu Glu Phe Ser Ala
    50                  55                  60
Glu Lys Ala Ala Ala Val Leu Gly Gln Gly Ile Gly Gln Val Thr Arg
65                  70                  75                  80
Ile Gly Gly Ala Thr Asn Leu Asp Pro Pro Asp Val Ala Arg Leu Ala
                85                  90                  95
Asn Gln Ile Gln Arg Tyr Leu Arg Asp His Thr Arg Leu Gly Ile Pro
            100                 105                 110
Ala Leu Ile His Glu Glu Ser Cys Ser Gly Tyr Met Ala Lys Gly Ala
        115                 120                 125
Thr Cys Phe Pro Gln Thr Ile Gly Ile Ala Ser Thr Trp Asp Val Asp
    130                 135                 140
Leu Ala Arg Arg Ile Gly Ala Ile Ile Arg Asp Gln Met Arg Ala Val
145                 150                 155                 160
Gly Ala Arg Gln Ala Leu Ala Pro Leu Leu Asp Val Ala Arg Asp Pro
                165                 170                 175
Arg Trp Gly Arg Val Glu Glu Thr Phe Gly Glu Asp Pro Tyr Leu Val
            180                 185                 190
Ala Gln Met Gly Ile Ala Tyr Val Arg Gly Leu Gln Gly Asp Asp Leu
        195                 200                 205
Ser Gln Gly Val Met Ala Thr Gly Lys His Phe Val Gly Tyr Gly Ala
    210                 215                 220
Ser Glu Gly Gly Met Asn Trp Ala Pro Ala His Ile Pro Glu Arg Glu
225                 230                 235                 240
Leu Arg Glu Val Tyr Leu Phe Pro Phe Glu Ala Ala Val Arg Glu Ala
                245                 250                 255
Gly Leu Gly Ala Ile Met Pro Gly Tyr His Glu Leu Asp Gly Val Pro
            260                 265                 270
Cys His Asp Asn Pro Gly Leu Leu Arg Glu Thr Leu Arg Gly Arg Trp
        275                 280                 285
Gly Phe Gln Gly Leu Val Val Ser Asp Tyr Phe Ala Val Asn Gln Leu
    290                 295                 300
Phe Glu Tyr His Gln Val Ala Arg Asp Lys Ala Glu Ala Ala Ala Leu
305                 310                 315                 320
Ala Val Arg Ala Gly Val Asp Val Glu Leu Pro Thr Arg Asp Val Tyr
                325                 330                 335
Gly Lys Pro Leu Ile Glu Ala Val Ala Arg Gly Leu Val Ser Pro Ala
            340                 345                 350
Glu Ile Asp Glu Leu Val Arg Arg Val Leu Thr Trp Lys Phe Arg Leu
        355                 360                 365
Gly Leu Phe Asp His Pro Phe Val Asp Glu Gly Ala Ala Ile Ala Val
    370                 375                 380
Phe Asp Asn Ala Glu Gln Arg Gln Val Ala Arg Glu Ala Ala Glu Lys
385                 390                 395                 400
Ser Met Val Leu Leu Lys Asn Asp Gly Leu Leu Pro Leu Ala Pro Arg
                405                 410                 415
Gly Thr Ile Ala Val Ile Gly Pro Asn Ala His Thr Thr Arg Asn Leu
            420                 425                 430
Val Gly Asp Tyr Ala Tyr Pro Cys His Ile Glu Ser Leu Leu Glu Gln
        435                 440                 445
Ser Glu Asp Asn Val Phe Gln Thr Pro Leu Pro Ser Gly Val Lys His
    450                 455                 460
Val Asp Glu Phe Ile Leu Met Arg Thr Ile Leu Glu Ala Ile Arg His
465                 470                 475                 480
Arg Val Gly Ser Glu Ala Gln Val Val Tyr Ala Lys Gly Cys Asp Ile
                485                 490                 495
Leu Gly Gly Glu Asp Ala Glu Leu Glu Glu Ala Val Ala Leu Ala Ala
            500                 505                 510
Lys Ala Asp Val Ala Val Val Val Val Gly Asp Arg Ala Gly Leu Thr
        515                 520                 525
Asp Ala Cys Thr Thr Gly Glu Ser Arg Asp Arg Ala Thr Leu Ser Leu
    530                 535                 540
Ile Gly Arg Gln Glu Glu Leu Val Arg Arg Val Ile Ala Thr Gly Thr
545                 550                 555                 560
Lys Thr Val Val Val Leu Val Ser Gly Arg Pro Leu Ala Ile Pro Asp
                565                 570                 575
Ile Ala Glu Arg Ala Asn Ala Val Leu Glu Ala Trp Leu Pro Gly Glu
            580                 585                 590
Glu Gly Ala Glu Ala Val Ala Ala Val Leu Phe Gly Asp Val Asn Pro
        595                 600                 605
Ser Gly Lys Leu Pro Ile Thr Ile Pro Arg Ser Val Gly Gln Val Pro
    610                 615                 620
Ile Tyr Tyr Gly His Lys Pro Ser Gly Gly Arg Ser His Trp Lys Gly
625                 630                 635                 640
Ala Tyr Val Asp Glu Ser Asn Leu Pro Leu Tyr Pro Phe Gly His Gly
                645                 650                 655
Leu Ser Tyr Thr Ala Phe Ala Tyr Arg Asp Leu Ala Leu Ser Pro Ser
            660                 665                 670
Val Leu Gly Val His Gly Glu Val Glu Val Ser Cys Val Ile Glu Asn
        675                 680                 685
Val Gly Ala Arg Ala Gly Glu Glu Val Val Gln Leu Tyr Ala Arg Asp
    690                 695                 700
Val Ala Ala Asp Val Thr Arg Pro Val Lys Ala Leu Cys Gly Phe Ala
705                 710                 715                 720
Arg Val Ala Leu Ala Pro Gly Glu Lys Ala Arg Val Arg Phe Arg Val
                725                 730                 735
Ser Ala His Gln Phe Gly Phe Tyr Asn Arg Glu Met Arg Tyr Val Val
            740                 745                 750
Glu Pro Gly Glu Ile Glu Phe Met Val Gly Ala Ser Ser Glu Asp Ile
        755                 760                 765
Arg Leu Arg Gly Ala Val Arg Met Asp Gly Ala Val Thr Glu Ile Glu
    770                 775                 780
His Glu Lys Val Tyr Gln Ser Ala Val Asp Val Glu Arg Met
785                 790                 795
 
<210>3
<211>784
<212>PRT
 
<213>嗜热厌氧乙醇杆菌(Thermoanaerobacter ethanolicus)ATCC 33223
 
<400>3
 
Met Thr Pro Leu Tyr Leu Asp Ser Thr Gln Ser Val Glu Lys Arg Val
1               5                   10                  15
Glu Asp Leu Leu Gln Gln Met Thr Ile Glu Glu Lys Val Ala Gln Leu
            20                  25                  30
Asn Ser Ile Trp Val Tyr Glu Ile Leu Asp Asp Met Lys Phe Ser Phe
        35                  40                  45
Asp Lys Ala Lys Arg Leu Met Ser Tyr Gly Ile Gly Gln Ile Thr Arg
    50                  55                  60
Leu Gly Gly Ala Ser Asn Leu Ser Pro Arg Glu Thr Val Arg Ile Ala
65                  70                  75                  80
Asn Gln Ile Gln Lys Phe Leu Ile Glu Asn Thr Arg Leu Gly Ile Pro
                85                  90                  95
Ala Leu Ile His Glu Glu Ser Cys Ser Gly Tyr Met Ala Lys Gly Ala
            100                 105                 110
Thr Ile Phe Pro Gln Thr Ile Gly Val Ala Ser Thr Trp Asn Asn Glu
        115                 120                 125
Ile Val Glu Lys Met Ala Ser Val Ile Arg Glu Gln Met Lys Ala Val
    130                 135                 140
Gly Ala Arg Gln Ala Leu Ala Pro Leu Leu Asp Ile Thr Arg Asp Pro
145                 150                 155                 160
Arg Trp Gly Arg Thr Glu Glu Thr Phe Gly Glu Asp Pro Tyr Leu Val
                165                 170                 175
Met Arg Met Gly Val Ser Tyr Ile Arg Gly Leu Gln Thr Glu Ser Leu
            180                 185                 190
Lys Glu Gly Ile Val Ala Thr Gly Lys His Phe Val Gly Tyr Gly Asn
        195                 200                 205
Ser Glu Gly Gly Met Asn Trp Ala Pro Ala His Ile Pro Glu Arg Glu
    210                 215                 220
Leu Arg Glu Val Phe Leu Tyr Pro Phe Glu Ala Ala Val Lys Glu Ala
225                 230                 235                 240
Lys Leu Ser Ser Ile Met Pro Gly Tyr His Glu Leu Asp Gly Val Pro
                245                 250                 255
Cys His Lys Ser Lys Lys Leu Leu Asn Asp Ile Leu Arg Lys Asp Trp
            260                 265                 270
Gly Phe Glu Gly Ile Val Val Ser Asp Tyr Phe Ala Ile Ser Gln Leu
        275                 280                 285
Tyr Glu Tyr His His Val Thr Ser Asp Lys Lys Gly Ala Ala Lys Leu
    290                 295                 300
Ala Leu Glu Ala Gly Val Asp Val Glu Leu Pro Ser Thr Asp Tyr Tyr
305                 310                 315                 320
Gly Leu Pro Leu Arg Glu Leu Ile Glu Ser Gly Glu Ile Asp Ile Asp
                325                 330                 335
Phe Val Asn Glu Ala Val Lys Arg Val Leu Lys Ile Lys Phe Glu Leu
            340                 345                 350
Gly Leu Phe Glu Asn Pro Tyr Ile Asn Glu Glu Lys Ala Val Glu Ile
        355                 360                 365
Phe Asp Thr Asn Glu Gln Arg Glu Leu Ala Tyr Lys Ile Ala Gln Glu
    370                 375                 380
Ser Ile Val Leu Leu Lys Asn Glu Asn Asn Leu Leu Pro Leu Lys Lys
385                 390                 395                 400
Asp Leu Lys Ser Ile Ala Val Ile Gly Pro Asn Ala Asp Ser Ile Arg
                405                 410                 415
Asn Met Ile Gly Asp Tyr Ala Tyr Pro Cys His Ile Glu Ser Leu Leu
            420                 425                 430
Glu Met Arg Glu Thr Asp Asn Val Phe Asn Thr Pro Leu Pro Glu Ser
        435                 440                 445
Leu Glu Ala Lys Asp Ile Tyr Val Pro Ile Val Thr Val Leu Gln Gly
    450                 455                 460
Ile Lys Ala Lys Val Ser Ser Asn Thr Glu Val Leu Tyr Ala Lys Gly
465                 470                 475                 480
Cys Asp Val Leu Asn Asn Ser Lys Asp Gly Phe Lys Glu Ala Val Glu
                485                 490                 495
Ile Ala Lys Gln Ala Asp Val Ala Val Val Val Val Gly Asp Lys Ser
            500                 505                 510
Gly Leu Thr Asp Gly Cys Thr Ser Gly Glu Ser Arg Asp Arg Ala Asp
        515                 520                 525
Leu Asn Leu Pro Gly Val Gln Glu Glu Leu Ile Lys Ala Ile Tyr Glu
    530                 535                 540
Thr Gly Thr Pro Val Ile Val Val Leu Ile Asn Gly Arg Pro Met Ser
545                 550                 555                 560
Ile Ser Trp Ile Ala Glu Lys Ile Pro Ala Ile Ile Glu Ala Trp Leu
                565                 570                 575
Pro Gly Glu Glu Gly Gly Arg Ala Val Ala Asp Val Ile Phe Gly Asp
            580                 585                 590
Tyr Asn Pro Gly Gly Lys Leu Pro Ile Ser Ile Pro Gln Ser Val Gly
        595                 600                 605
Gln Leu Pro Val Tyr Tyr Tyr His Lys Pro Ser Gly Gly Arg Ser His
    610                 615                 620
Trp Lys Gly Asp Tyr Val Glu Leu Ser Thr Lys Pro Leu Tyr Pro Phe
625                 630                 635                 640
Gly Tyr Gly Leu Ser Tyr Thr Glu Phe Ser Tyr Thr Asn Leu Asn Ile
                645                 650                 655
Ser Asn Arg Lys Val Ser Leu Arg Asp Arg Met Val Glu Ile Ser Val
            660                 665                 670
Asp Ile Lys Asn Thr Gly Thr Leu Lys Gly Asp Glu Val Val Gln Leu
        675                 680                 685
Tyr Ile His Gln Glu Ala Leu Ser Val Thr Arg Pro Val Lys Glu Leu
    690                 695                 700
Lys Gly Phe Lys Arg Ile Thr Leu Asp Ala Gly Glu Glu Lys Thr Val
705                 710                 715                 720
Ile Phe Lys Leu Ser Ile Glu Gln Leu Gly Phe Tyr Asp Glu Asn Met
                725                 730                 735
Glu Tyr Val Val Glu Pro Gly Arg Val Asp Val Met Ile Gly Ser Ser
            740                 745                 750
Ser Glu Asp Ile Arg Leu Arg Asp Tyr Phe Glu Ile Val Gly Glu Lys
        755                 760                 765
Glu Lys Val Ala Lys Lys Phe Ile Thr Glu Val Arg Val Glu Asn Lys
    770                 775                 780
 
<210>4
<211>778
<212>PRT
 
<213>海栖热袍菌(Thermotoga maritima)MSB8
 
<400>4
 
Met Glu Leu Tyr Arg Asp Pro Ser Gln Pro Ile Glu Val Arg Val Arg
1               5                   10                  15
Asp Leu Leu Ser Arg Met Thr Leu Glu Glu Lys Val Ala Gln Leu Gly
            20                  25                  30
Ser Val Trp Gly Tyr Glu Leu Ile Asp Glu Arg Gly Lys Phe Ser Arg
        35                  40                  45
Glu Lys Ala Lys Glu Leu Leu Lys Asn Gly Ile Gly Gln Ile Thr Arg
    50                  55                  60
Pro Gly Gly Ser Thr Asn Leu Glu Pro Gln Glu Ala Ala Glu Leu Val
65                  70                  75                  80
Ash Glu Ile Gln Arg Phe Leu Val Glu Glu Thr Arg Leu Gly Ile Pro
                85                  90                  95
Ala Met Ile His Glu Glu Cys Leu Thr Gly Tyr Met Gly Leu Gly Gly
            100                 105                 110
Thr Asn Phe Pro Gln Ala Ile Ala Met Ala Ser Thr Trp Asp Pro Asp
        115                 120                 125
Leu Ile Glu Lys Met Thr Thr Ala Val Arg Glu Asp Met Arg Lys Ile
    130                 135                 140
Gly Ala His Gln Gly Leu Ala Pro Val Leu Asp Val Ala Arg Asp Pro
145                 150                 155                 160
Arg Trp Gly Arg Thr Glu Glu Thr Phe Gly Glu Ser Pro Tyr Leu Val
                165                 170                 175
Ala Arg Met Gly Val Ser Tyr Val Lys Gly Leu Gln Gly Glu Asp Ile
            180                 185                 190
Lys Lys Gly Val Val Ala Thr Val Lys His Phe Ala Gly Tyr Ser Ala
        195                 200                 205
Ser Glu Gly Gly Lys Asn Trp Ala Pro Thr Asn Ile Pro Glu Arg Glu
    210                 215                 220
Phe Lys Glu Val Phe Leu Phe Pro Phe Glu Ala Ala Val Lys Glu Ala
225                 230                 235                 240
Asn Val Leu Ser Val Met Asn Ser Tyr Ser Glu Ile Asp Gly Val Pro
                245                 250                 255
Cys Ala Ala Asn Arg Lys Leu Leu Thr Asp Ile Leu Arg Lys Asp Trp
            260                 265                 270
Gly Phe Glu Gly Ile Val Val Ser Asp Tyr Phe Ala Val Lys Val Leu
        275                 280                 285
Glu Asp Tyr His Arg Ile Ala Arg Asp Lys Ser Glu Ala Ala Arg Leu
    290                 295                 300
Ala Leu Glu Ala Gly Ile Asp Val Glu Leu Pro Lys Thr Glu Cys Tyr
305                 310                 315                 320
Gln Tyr Leu Lys Asp Leu Val Glu Lys Gly Ile Ile Ser Glu Ala Leu
                325                 330                 335
Ile Asp Glu Ala Val Thr Arg Val Leu Arg Leu Lys Phe Met Leu Gly
            340                 345                 350
Leu Phe Glu Asn Pro Tyr Val Glu Val Glu Lys Ala Lys Ile Glu Ser
        355                 360                 365
His Arg Asp Ile Ala Leu Glu Ile Ala Arg Lys Ser Ile Ile Leu Leu
    370                 375                 380
Lys Asn Asp Gly Ile Leu Pro Leu Gln Lys Asn Lys Lys Val Ala Leu
385                 390                 395                 400
Ile Gly Pro Asn Ala Gly Glu Val Arg Asn Leu Leu Gly Asp Tyr Met
                405                 410                 415
Tyr Leu Ala His Ile Arg Ala Leu Leu Asp Asn Ile Asp Asp Val Phe
            420                 425                 430
Gly Asn Pro Gln Ile Pro Arg Glu Asn Tyr Glu Arg Leu Lys Lys Ser
        435                 440                 445
Ile Glu Glu His Met Lys Ser Ile Pro Ser Val Leu Asp Ala Phe Lys
    450                 455                 460
Glu Glu Gly Ile Glu Phe Glu Tyr Ala Lys Gly Cys Glu Val Thr Gly
465                 470                 475                 480
Glu Asp Arg Ser Gly Phe Glu Glu Ala Ile Glu Ile Ala Lys Lys Ser
                485                 490                 495
Asp Val Ala Ile Val Val Val Gly Asp Lys Ser Gly Leu Thr Leu Asp
            500                 505                 510
Cys Thr Thr Gly Glu Ser Arg Asp Met Ala Asn Leu Lys Leu Pro Gly
        515                 520                 525
Val Gln Glu Glu Leu Val Leu Glu Val Ala Lys Thr Gly Lys Pro Val
    530                 535                 540
Val Leu Val Leu Ile Thr Gly Arg Pro Tyr Ser Leu Lys Asn Val Val
545                 550                 555                 560
Asp Lys Val Asn Ala Ile Leu Gln Val Trp Leu Pro Gly Glu Ala Gly
                565                 570                 575
Gly Arg Ala Ile Val Asp Ile Ile Tyr Gly Lys Val Asn Pro Ser Gly
            580                 585                 590
Lys Leu Pro Ile Ser Phe Pro Arg Ser Ala Gly Gln Ile Pro Val Phe
        595                 600                 605
His Tyr Val Lys Pro Ser Gly Gly Arg Ser His Trp His Gly Asp Tyr
    610                 615                 620
Val Asp Glu Ser Thr Lys Pro Leu Phe Pro Phe Gly His Gly Leu Ser
625                 630                 635                 640
Tyr Thr Lys Phe Glu Tyr Ser Asn Leu Arg Ile Glu Pro Lys Glu Val
                645                 650                 655
Pro Pro Ala Gly Glu Val Val Ile Lys Val Asp Val Glu Asn Ile Gly
            660                 665                 670
Asp Arg Asp Gly Asp Glu Val Val Gln Leu Tyr Ile Gly Arg Glu Phe
        675                 680                 685
Ala Ser Val Thr Arg Pro Val Lys Glu Leu Lys Gly Phe Lys Arg Val
    690                 695                 700
Ser Leu Lys Ala Lys Glu Lys Lys Thr Val Val Phe Arg Leu His Met
705                 710                 715                 720
Asp Val Leu Ala Tyr Tyr Asn Arg Asp Met Lys Leu Val Val Glu Pro
                725                 730                 735
Gly Glu Phe Lys Val Met Val Gly Ser Ser Ser Glu Asp Ile Arg Leu
            740                 745                 750
Thr Gly Ser Phe Ser Val Val Gly Glu Lys Arg Glu Val Val Gly Met
        755                 760                 765
Arg Lys Phe Phe Thr Glu Ala Cys Glu Glu
    770                 775
 
<210>5
<211>778
<212>PRT
<213>嗜石油热袍菌(Thermotoga petrophila)RKU-1
 
<400>5
 
Met Glu Leu Tyr Arg Asp Pro Ser Gln Pro Ile Glu Val Arg Val Arg
1               5                   10                  15
Asp Leu Leu Ser Arg Met Thr Leu Glu Glu Lys Ala Ala Gln Leu Gly
            20                  25                  30
Ser Val Trp Gly Tyr Glu Leu Ile Asp Glu Arg Gly Lys Phe Ser Arg
        35                  40                  45
Glu Lys Ala Lys Glu Leu Leu Lys Asn Gly Ile Gly Gln Val Thr Arg
    50                  55                  60
Pro Gly Gly Ser Thr Asn Leu Glu Pro Gln Glu Ala Ala Glu Leu Val
65                  70                  75                  80
Asn Glu Ile Gln Arg Phe Leu Val Glu Glu Thr Arg Leu Gly Ile Pro
                85                  90                  95
Ala Met Ile His Glu Glu Cys Leu Thr Gly Tyr Met Gly Leu Gly Gly
            100                 105                 110
Thr Asn Phe Pro Gln Ala Ile Ala Met Ala Ser Thr Trp Asp Pro Asp
        115                 120                 125
Leu Ile Glu Lys Met Thr Thr Ala Ile Arg Glu Asp Met Arg Lys Ile
    130                 135                 140
Gly Ala His Gln Gly Leu Ala Pro Val Leu Asp Val Ala Arg Asp Pro
145                 150                 155                 160
Arg Trp Gly Arg Thr Glu Glu Thr Phe Gly Glu Ser Pro Tyr Leu Val
                165                 170                 175
Ala Arg Met Gly Val Ser Tyr Val Lys Gly Leu Gln Gly Glu Asp Ile
            180                 185                 190
Lys Lys Gly Val Val Ala Thr Val Lys His Phe Ala Gly Tyr Ser Ala
        195                 200                 205
Ser Glu Gly Gly Lys Asn Trp Ala Pro Thr Asn Ile Pro Glu Arg Glu
    210                 215                 220
Phe Lys Glu Val Phe Leu Phe Pro Phe Glu Ala Ala Val Lys Glu Ala
225                 230                 235                 240
Asn Val Leu Ser Val Met Asn Ser Tyr Ser Glu Ile Asp Gly Val Pro
                245                 250                 255
Cys Ala Ala Asn Arg Lys Leu Leu Thr Asp Ile Leu Arg Lys Asp Trp
            260                 265                 270
Gly Phe Lys Gly Ile Val Val Ser Asp Tyr Phe Ala Val Lys Val Leu
        275                 280                 285
Glu Asp Tyr His Arg Ile Ala Arg Asp Lys Ser Glu Ala Ala Arg Leu
    290                 295                 300
Ala Leu Glu Ala Gly Ile Asp Val Glu Leu Pro Lys Thr Glu Cys Tyr
305                 310                 315                 320
Gln Tyr Leu Lys Asp Leu Val Glu Lys Gly Ile Ile Ser Glu Ala Leu
                325                 330                 335
Ile Asp Glu Ala Val Ala Arg Val Leu Arg Leu Lys Phe Met Leu Gly
            340                 345                 350
Leu Phe Glu Asn Pro Tyr Val Glu Val Glu Lys Ala Lys Ile Glu Ser
        355                 360                 365
His Lys Asp Ile Ala Leu Asp Ile Ala Arg Lys Ser Ile Ile Leu Leu
    370                 375                 380
Lys Asn Asp Gly Ile Leu Pro Leu Gln Lys Asn Lys Lys Val Ala Leu
385                 390                 395                 400
Ile Gly Pro Asn Ala Gly Glu Val Arg Asn Leu Leu Gly Asp Tyr Met
                405                 410                 415
Tyr Leu Ala His Ile Arg Ala Leu Leu Asp Asn Ile Asp Asp Val Phe
            420                 425                 430
Gly Asn Pro Gln Ile Pro Arg Glu Asn Tyr Glu Arg Leu Lys Lys Ser
        435                 440                 445
Ile Glu Glu His Met Lys Ser Ile Pro Ser Val Leu Asp Ala Phe Lys
    450                 455                 460
Glu Glu Gly Ile Glu Phe Glu Tyr Ala Lys Gly Cys Glu Val Thr Gly
465                 470                 475                 480
Glu Asp Arg Ser Gly Phe Glu Glu Ala Ile Glu Ile Ala Lys Lys Ser
                485                 490                 495
Asp Val Ala Ile Val Val Val Gly Asp Lys Ser Gly Leu Thr Leu Asp
            500                 505                 510
Cys Thr Thr Gly Glu Ser Arg Asp Met Ala Asn Leu Lys Leu Pro Gly
        515                 520                 525
Val Gln Glu Glu Leu Val Leu Glu Val Ala Lys Thr Gly Lys Pro Val
    530                 535                 540
Val Leu Val Leu Ile Thr Gly Arg Pro Tyr Ser Leu Lys Asn Val Val
545                 550                 555                 560
Asp Lys Val Asn Ala Ile Leu Gln Val Trp Leu Pro Gly Glu Ala Gly
                565                 570                 575
Gly Arg Ala Ile Val Asp Ile Ile Tyr Gly Lys Val Asn Pro Ser Gly
            580                 585                 590
Lys Leu Pro Ile Ser Phe Pro Arg Ser Ala Gly Gln Ile Pro Val Phe
        595                 600                 605
His Tyr Val Lys Pro Ser Gly Gly Arg Ser His Trp His Gly Asp Tyr
    610                 615                 620
Val Asp Glu Ser Thr Lys Pro Leu Phe Pro Phe Gly His Gly Leu Ser
625                 630                 635                 640
Tyr Thr Lys Phe Glu Tyr Ser Asn Leu Arg Ile Glu Pro Lys Glu Val
                645                 650                 655
Pro Pro Ala Gly Glu Val Val Ile Lys Val Asp Val Glu Asn Thr Gly
            660                 665                 670
Asp Arg Asp Gly Asp Glu Val Val Gln Leu Tyr Ile Gly Arg Glu Phe
        675                 680                 685
Ala Ser Val Thr Arg Pro Val Lys Glu Leu Lys Gly Phe Lys Arg Val
    690                 695                 700
Ser Leu Lys Ala Lys Glu Lys Lys Thr Val Val Phe Arg Leu His Met
705                 710                 715                 720
Asp Val Leu Ala Tyr Tyr Asp Arg Asp Met Lys Leu Val Val Glu Pro
                725                 730                 735
Gly Glu Phe Lys Val Met Val Gly Ser Ser Ser Glu Asp Ile Arg Leu
            740                 745                 750
Thr Gly Ser Phe Thr Val Val Gly Glu Lys Arg Glu Val Val Gly Met
        755                 760                 765
Arg Lys Phe Phe Thr Glu Ala Cys Glu Glu
    770                 775
 
<210>6
<211>754
<212>PRT
 
<213>硫磺矿硫化叶菌(Sulfolobus solfataricus)P2
 
<400>6
 
Met Thr Ala Ile Lys Ser Leu Leu Asn Gln Met Ser Ile Glu Glu Lys
1               5                   10                  15
Ile Ala Gln Leu Gln Ala Ile Pro Ile Asp Ala Leu Met Glu Gly Lys
            20                  25                  30
Glu Phe Ser Glu Glu Lys Ala Arg Lys Tyr Leu Lys Leu Gly Ile Gly
        35                  40                  45
Gln Ile Thr Arg Val Ala Gly Ser Arg Leu Gly Leu Lys Pro Lys Glu
    50                  55                  60
Val Val Lys Leu Val Asn Lys Val Gln Lys Phe Leu Val Glu Asn Thr
65                  70                  75                  80
Arg Leu Lys Ile Pro Ala Ile Ile His Glu Glu Cys Leu Ser Gly Leu
                85                  90                  95
Met Gly Tyr Ser Ser Thr Ala Phe Pro Gln Ala Ile Gly Leu Ala Ser
            100                 105                 110
Thr Trp Asn Pro Glu Leu Leu Thr Asn Val Ala Ser Thr Ile Arg Ser
        115                 120                 125
Gln Gly Arg Leu Ile Gly Val Asn Gln Cys Leu Ser Pro Val Leu Asp
    130                 135                 140
Val Cys Arg Asp Pro Arg Trp Gly Arg Cys Glu Glu Thr Tyr Gly Glu
145                 150                 155                 160
Asp Pro Tyr Leu Val Ala Ser Met Gly Leu Ala Tyr Ile Thr Gly Leu
                165                 170                 175
Gln Gly Glu Thr Gln Leu Val Ala Thr Ala Lys His Phe Ala Ala His
            180                 185                 190
Gly Phe Pro Glu Gly Gly Arg Asn Ile Ala Gln Val His Val Gly Asn
        195                 200                 205
Arg Glu Leu Arg Glu Thr Phe Leu Phe Pro Phe Glu Val Ala Val Lys
    210                 215                 220
Ile Gly Lys Val Met Ser Ile Met Pro Ala Tyr His Glu Ile Asp Gly
225                 230                 235                 240
Val Pro Cys His Gly Asn Pro Gln Leu Leu Thr Asn Ile Leu Arg Gln
                245                 250                 255
Glu Trp Gly Phe Asp Gly Ile Val Val Ser Asp Tyr Asp Gly Ile Arg
            260                 265                 270
Gln Leu Glu Ala Ile His Lys Val Ala Ser Asn Lys Met Glu Ala Ala
        275                 280                 285
Ile Leu Ala Leu Glu Ser Gly Val Asp Ile Glu Phe Pro Thr Ile Asp
    290                 295                 300
Cys Tyr Gly Glu Pro Leu Val Thr Ala Ile Lys Glu Gly Leu Val Ser
305                 310                 315                 320
Glu Ala Ile Ile Asp Arg Ala Val Glu Arg Val Leu Arg Ile Lys Glu
                325                 330                 335
Arg Leu Gly Leu Leu Asp Asn Pro Phe Val Asp Glu Ser Ala Val Pro
            340                 345                 350
Glu Arg Leu Asp Asp Arg Lys Ser Arg Glu Leu Ala Leu Lys Ala Ala
        355                 360                 365
Arg Glu Ser Ile Val Leu Leu Lys Asn Glu Asn Asn Met Leu Pro Leu
    370                 375                 380
Ser Lys Asn Ile Asn Lys Ile Ala Val Ile Gly Pro Asn Ala Asn Asp
385                 390                 395                 400
Pro Arg Asn Met Leu Gly Asp Tyr Thr Tyr Thr Gly His Leu Asn Ile
                405                 410                 415
Asp Ser Gly Ile Glu Ile Val Thr Val Leu Gln Gly Ile Ala Lys Lys
            420                 425                 430
Val Gly Glu Gly Lys Val Leu Tyr Ala Lys Gly Cys Asp Ile Ala Gly
        435                 440                 445
Glu Ser Lys Glu Gly Phe Ser Glu Ala Ile Glu Ile Ala Lys Gln Ala
    450                 455                 460
Asp Val Ile Ile Ala Val Met Gly Glu Lys Ser Gly Leu Pro Leu Ser
465                 470                 475                 480
Trp Thr Asp Ile Pro Ser Glu Glu Glu Phe Lys Lys Tyr Gln Ala Val
                485                 490                 495
Thr Gly Glu Gly Asn Asp Arg Ala Ser Leu Arg Leu Leu Gly Val Gln
            500                 505                 510
Glu Glu Leu Leu Lys Glu Leu Tyr Lys Thr Gly Lys Pro Ile Ile Leu
        515                 520                 525
Val Leu Ile Asn Gly Arg Pro Leu Val Leu Ser Pro Ile Ile Asn Tyr
    530                 535                 540
Val Lys Ala Ile Ile Glu Ala Trp Phe Pro Gly Glu Glu Gly Gly Asn
545                 550                 555                 560
Ala Ile Ala Asp Ile Ile Phe Gly Asp Tyr Asn Pro Ser Gly Arg Leu
                565                 570                 575
Pro Ile Thr Phe Pro Met Asp Thr Gly Gln Ile Pro Leu Tyr Tyr Ser
            580                 585                 590
Arg Lys Pro Ser Ser Phe Arg Pro Tyr Val Met Leu His Ser Ser Pro
        595                 600                 605
Leu Phe Thr Phe Gly Tyr Gly Leu Ser Tyr Thr Gln Phe Glu Tyr Ser
    610                 615                 620
Asn Leu Glu Val Thr Pro Lys Glu Val Gly Pro Leu Ser Tyr Ile Thr
625                 630                 635                 640
Ile Leu Leu Asp Val Lys Asn Val Gly Asn Met Glu Gly Asp Glu Val
                645                 650                 655
Val Gln Leu Tyr Ile Ser Lys Ser Phe Ser Ser Val Ala Arg Pro Val
            660                 665                 670
Lys Glu Leu Lys Gly Phe Ala Lys Val His Leu Lys Pro Gly Glu Lys
        675                 680                 685
Arg Arg Val Lys Phe Ala Leu Pro Met Glu Ala Leu Ala Phe Tyr Asp
    690                 695                 700
Asn Phe Met Arg Leu Val Val Glu Lys Gly Glu Tyr Gln Ile Leu Ile
705                 710                 715                 720
Gly Asn Ser Ser Glu Asn Ile Ile Leu Lys Asp Thr Phe Arg Ile Lys
                725                 730                 735
Glu Thr Lys Pro Ile Met Glu Arg Arg Ile Phe Leu Ser Asn Val Gln
            740                 745                 750
Ile Glu
 
<210>7
<211>765
<212>PRT
<213>Solibacter usitatus Ellin6076
 
<400>7
 
Met Pro Arg Pro Ala Lys Ile Glu Pro Tyr Arg Asn Pro Ala Leu Pro
1               5                   10                  15
Pro Ala Lys Arg Ala Lys Asp Leu Leu Ser His Met Thr Leu Glu Glu
            20                  25                  30
Lys Ala Ala Gln Met Met Cys Val Trp Gln Gln Lys Ala Asp Thr Leu
        35                  40                  45
Val Asp Ala Asp Gly Arg Phe Asp Pro Glu Lys Ala Arg Lys Ala Phe
    50                  55                  60
Lys Asp Arg Arg Gly Leu Gly Gln Val Gly Arg Pro Ser Asp Ala Gly
65                  70                  75                  80
Lys Gly Gln Asp Ala Arg Gly Met Ala Glu Leu Thr Asn Ala Ile Gln
                85                  90                  95
Lys Phe Phe Ile Glu Asn Ser Arg Leu Gly Ile Pro Val Ile Phe His
            100                 105                 110
Glu Glu Cys Leu His Gly His Ala Ala Ile Gly Gly Thr Ser Phe Pro
        115                 120                 125
Gln Pro Ile Gly Leu Gly Ala Thr Phe Asp Pro Glu Leu Val Glu Ser
    130                 135                 140
Leu Phe Ala Met Thr Ala Ala Glu Ala Arg Ala Arg Gly Thr His Gln
145                 150                 155                 160
Ala Leu Thr Pro Val Val Asp Val Ala Arg Glu Pro Arg Trp Gly Arg
                165                 170                 175
Val Glu Glu Thr Tyr Gly Glu Asp Pro Phe Leu Val Ser Arg Met Gly
            180                 185                 190
Ile Ala Ala Val Arg Gly Phe Gln Gly Asp Ala Thr Phe Arg Asp Lys
        195                 200                 205
Thr Arg Val Ile Ala Thr Leu Lys His Phe Ala Ala His Gly Gln Pro
    210                 215                 220
Glu Ser Gly Thr Asn Cys Ala Pro Val Asn Val Ser Met Arg Val Leu
225                 230                 235                 240
Arg Glu Thr Phe Leu Phe Pro Phe Lys Glu Ala Leu Asp Lys Gly Cys
                245                 250                 255
Ala Ile Ser Val Met Ala Ser Tyr Asn Glu Ile Asp Gly Val Pro Ser
            260                 265                 270
His Ala Ser Arg Trp Leu Leu Arg Asp Val Leu Arg Lys Glu Trp Gly
        275                 280                 285
Phe Lys Gly Phe Val Val Ser Asp Tyr Tyr Ala Ile Tyr Glu Leu Ser
    290                 295                 300
Tyr Arg Pro Glu Ser His Gly His Phe Val Ala Lys Asp Lys Arg Glu
305                 310                 315                 320
Ala Cys Ala Leu Ala Val Gln Ala Gly Val Asn Ile Glu Leu Pro Glu
                325                 330                 335
Pro Asp Cys Tyr Leu His Leu Val Asp Leu Val His Lys Gly Val Leu
            340                 345                 350
Gln Glu Ser Gln Leu Asp Glu Leu Val Glu Pro Met Leu Arg Trp Lys
        355                 360                 365
Phe Gln Met Gly Leu Phe Asp Asp Pro Tyr Val Asp Pro Ala Glu Ala
    370                 375                 380
Glu Arg Ile Ala Gly Cys Asp Ala His Arg Glu Leu Ala Met Gln Ala
385                 390                 395                 400
Ala Arg Glu Thr Ile Thr Leu Leu Lys Asn Asp Gly Pro Val Val Pro
                405                 410                 415
Leu Asp Leu Ser Ala Ile Lys Thr Ile Ala Val Ile Gly Pro Asn Ala
            420                 425                 430
Asn Arg Ser Leu Leu Gly Gly Tyr Ser Gly Val Pro Lys His Asp Val
        435                 440                 445
Thr Val Leu Asp Gly Ile Arg Glu Arg Val Gly Ser Arg Ala Lys Val
    450                 455                 460
Val Tyr Ala Glu Gly Cys Lys Ile Thr Ile Gly Gly Ser Trp Val Gln
465                 470                 475                 480
Asp Glu Val Thr Pro Ser Asp Pro Ala Glu Asp Arg Arg Gln Ile Ala
                485                 490                 495
Glu Ala Val Lys Val Ala Lys Arg Ala Asp Val Ile Val Leu Ala Ile
            500                 505                 510
Gly Gly Asn Glu Gln Thr Ser Arg Glu Ala Trp Ser Pro Lys His Leu
        515                 520                 525
Gly Asp Arg Pro Ser Leu Asp Leu Val Gly Arg Gln Glu Glu Leu Val
    530                 535                 540
Arg Ala Met Val Ala Thr Gly Lys Pro Val Ile Ala Phe Leu Phe Asn
545                 550                 555                 560
Gly Arg Pro Ile Ser Ile Asn Tyr Leu Ala Gln Ser Val Pro Ala Ile
                565                 570                 575
Phe Glu Cys Trp Tyr Leu Gly Gln Glu Thr Gly Arg Ala Val Ala Glu
            580                 585                 590
Val Leu Phe Gly Asp Thr Asn Pro Gly Gly Lys Leu Pro Ile Thr Ile
        595                 600                 605
Pro Arg Ser Ala Gly His Leu Pro Ala Phe Tyr Asn His Lys Pro Ser
    610                 615                 620
Ala Arg Arg Gly Tyr Leu Phe Asp Glu Val Gly Pro Leu Tyr Ala Phe
625                 630                 635                 640
Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Ala Phe Gln Asn Leu Arg Leu
                645                 650                 655
Ala Lys Lys Lys Met His Arg Glu Ser Thr Ala Arg Val Leu Val Asp
            660                 665                 670
Val Thr Asn Thr Gly Ala Arg Glu Gly Arg Glu Val Val Gln Leu Tyr
        675                 680                 685
Ile Arg Asp Leu Val Ser Ser Val Thr Arg Pro Ile Lys Glu Leu Lys
    690                 695                 700
Gly Phe Arg Lys Ile Thr Leu Gln Pro Gly Gln Thr Gln Thr Val Glu
705                 710                 715                 720
Phe Glu Ile Thr Pro Asp Leu Leu Ala Phe Tyr Asn Val Asp Met Lys
                725                 730                 735
Phe Val Val Glu Pro Gly Asp Phe Glu Ile Met Val Gly Ser Ser Ser
            740                 745                 750
Arg Asp Ala Asp Leu Gln Lys Val Ile Leu Arg Val Glu
        755                 760                 765
 
<210>8
<211>2397
<212>DNA
<213>人工序列
 
<220>
<223>在SEQ ID NO 1中的替换
 
<400>8
ttgaatataa aggcggcgtc agcgcctgat gagcagagga ggcttcccgt gacacccgtg      60
tatctcgatc ccgcacagtc cattgaagcg cgcgtcgacg cgctcctggc cgatatgacg     120
cttgaagaaa aggtcgctca actcacgtcc atctgggcgt tcgaagtcct ggatgagctc     180
gagttctccg ccgagaaggc cgccgccgtg ctcgggcagg gcatcggaca ggtgacccga     240
attggcggcg ccaccaatct ggacccgccg gatgtggccc gcctcgccaa ccagattcag     300
cgctacctgc gcgatcacac gcgcctcggc attccggcgc tgatccacga ggagtcgtgc     360
agcggctaca tggccaaggg cgccacctgc tttccgcaaa ccattggcat cgcgagcacg     420
tgggatgtcg atctcgcccg ccgtattggc gccatcatcc gcgatcagat gcgggccgtc     480
ggggcgcgcc aggcgctcgc cccgctcctg gatgtggcac gagatccgcg ctggggccgg     540
gtggaggaga cgttcggcga agatccgtac ctcgtggcgc agatgggcat cgcgtacgtc     600
cgcgggctgc agggagacga cctgagccag ggcgtgatgg cgacgggcaa gcacttcgtg     660
ggctacgggg cgtccgaggg cggcatgaac tgggcgccgg cgcacatccc ggagcgcgag     720
ctgcgcgagg tgtacctgtt cccgttcgag gcggcggtgc gcgaggcggg gctcggcgcc     780
atcatgccgg ggtaccacga gctcgacggc gtgccctgcc acgacaatcc agggcttttg     840
cgcgagaccc tccgcgggcg ctggggcttt caggggctcg tggtgtcgga ctatttcgcc     900
gtgaatcagc tgttcgaata tcatcaggtg gcccgggaca aggcggaggc cgcggcgctc     960
gccgtgcgcg ccggggtgga cgtggagctg ccgacgcgcg acgtgtacgg caagccgctc    1020
atcgaggccg ttgcacgagg gctcgtcagc ccggccgaga tcgacgaact cgtgcgccgg    1080
gtgctcacgt ggaagttccg gctcggcctc ttcgatcacc cgtttgtcga cgagggcgcg    1140
gccatcgccg tcttcgacaa cgcggagcag cgtcaggtgg cgcgggaggc ggcggagaag    1200
tcgatggtcc tcctcaaaaa cgacgggctt ctgcccctcg cgccccgcgg caccatcgcc    1260
gtgatcggcc caaacgcgca cacgacgcgc aatttggtag gcgattacgc ctacccgtgc    1320
cacatcgagt cgctcctcga gcagtccgag gacaacgtgt ttcagacccc gcttccgagc    1380
ggcgtgaaac acgtggacga gttcatcctc atgcggacca tcctcgaggc catccgccat    1440
cgcgtcgggt cggaggcgca ggtcgtctac gcgaaggggt gcgacatcct cggcggtgag    1500
gatgcggagc tcgaggaggc ggtggcgctt gccgcgaagg cggacgtggc ggttgtggtg    1560
gtgggcgatc gcgccgggct cacggacgcg tgcacgacag gggaatcgcg agacagagcc    1620
acgctctcgc tcatcgggcg gcaggaggaa ctcgtgcggc gcgtaatcgc cacgggcacg    1680
aagacggtcg tggtgctcgt gagcgggcgg ccgctcgcca tcccggacat cgcggagcgg    1740
gcgaacgccg ttctcgaggc gtggctgccg ggcgaggaag gcgcggaggc ggtggccgcg    1800
gtcctgtttg gcgacgtgaa tccgtccggg aagctgccca tcacgattcc gcgcagcgtg    1860
ggccaggtgc caatttacta cgggcacaag ccgtcgggcg gccgctcgca ctggaagggc    1920
gcgtatgtgg acgagagcaa tctgccgctc tatccgtttg ggcacgggct gtcctacacg    1980
gcgttcgcgt accgggatct ggcgctgtct ccgagcgtcc tgggcgtgca cggcgaggtc    2040
gaggtgtcgt gcgtgatcga aaacgtcggg gctcgcgcgg gcgaagaggt ggtgcaactg    2100
tacgcacgcg acgtggcggc ggacgtgacg cggccggtga aggcgctctg cggctttgcg    2160
cgggtggcgc tcgcgccggg agagaaggcg cgagtgcggt tccgggtttc agcgcaccag    2220
ttcggcttct acaaccggga gatgcggtat gtcgtggagc cgggcgagat cgagttcatg    2280
gtgggggcgt cgtccgagga catccgcctg cgcggggcgg tgcggatgga cggcgcggtg    2340
acggagatcg agcacgagaa ggtataccag agcgcggtgg acgtcgagcg gatgtga       2397
 
<210>9
<211>2397
<212>DNA
<213>人工序列
 
<220>
<223>在SEQ ID NO 1中的替换
 
<400>9
ttgaatctga aggcggcgtc agcgcctgat gagcagagga ggcttcccgt gacacccgtg      60
tatctcgatc ccgcacagtc cattgaagcg cgcgtcgacg cgctcctggc cgatatgacg     120
cttgaagaaa aggtcgctca actcacgtcc atctgggcgt tcgaagtcct ggatgagctc     180
gagttctccg ccgagaaggc cgccgccgtg ctcgggcagg gcatcggaca ggtgacccga     240
attggcggcg ccaccaatct ggacccgccg gatgtggccc gcctcgccaa ccagattcag     300
cgctacctgc gcgatcacac gcgcctcggc attccggcgc tgatccacga ggagtcgtgc     360
agcggctaca tggccaaggg cgccacctgc tttccgcaaa ccattggcat cgcgagcacg     420
tgggatgtcg atctcgcccg ccgtattggc gccatcatcc gcgatcagat gcgggccgtc     480
ggggcgcgcc aggcgctcgc cccgctcctg gatgtggcac gagatccgcg ctggggccgg     540
gtggaggaga cgttcggcga agatccgtac ctcgtggcgc agatgggcat cgcgtacgtc     600
cgcgggctgc agggagacga cctgagccag ggcgtgatgg cgacgggcaa gcacttcgtg     660
ggctacgggg cgtccgaggg cggcatgaac tgggcgccgg cgcacatccc ggagcgcgag     720
ctgcgcgagg tgtacctgtt cccgttcgag gcggcggtgc gcgaggcggg gctcggcgcc     780
atcatgccgg ggtaccacga gctcgacggc gtgccctgcc acgacaatcc agggcttttg     840
cgcgagaccc tccgcgggcg ctggggcttt caggggctcg tggtgtcgga ctatttcgcc     900
gtgaatcagc tgttcgaata tcatcaggtg gcccgggaca aggcggaggc cgcggcgctc     960
gccgtgcgcg ccggggtgga cgtggagctg ccgacgcgcg acgtgtacgg caagccgctc    1020
atcgaggccg ttgcacgagg gctcgtcagc ccggccgaga tcgacgaact cgtgcgccgg    1080
gtgctcacgt ggaagttccg gctcggcctc ttcgatcacc cgtttgtcga cgagggcgcg  1140
gccatcgccg tcttcgacaa cgcggagcag cgtcaggtgg cgcgggaggc ggcggagaag  1200
tcgatggtcc tcctcaaaaa cgacgggctt ctgcccctcg cgccccgcgg caccatcgcc  1260
gtgatcggcc caaacgcgca cacgacgcgc aatttggtag gcgattacgc ctacccgtgc  1320
cacatcgagt cgctcctcga gcagtccgag gacaacgtgt ttcagacccc gcttccgagc  1380
ggcgtgaaac acgtggacga gttcatcctc atgcggacca tcctcgaggc catccgccat  1440
cgcgtcgggt cggaggcgca ggtcgtctac gcgaaggggt gcgacatcct cggcggtgag  1500
gatgcggagc tcgaggaggc ggtggcgctt gccgcgaagg cggacgtggc ggttgtggtg  1560
gtgggcgatc gcgccgggct cacggacgcg tgcacgacag gggaatcgcg agacagagcc  1620
acgctctcgc tcatcgggcg gcaggaggaa ctcgtgcggc gcgtaatcgc cacgggcacg  1680
aagacggtcg tggtgctcgt gagcgggcgg ccgctcgcca tcccggacat cgcggagcgg  1740
gcgaacgccg ttctcgaggc gtggctgccg ggcgaggaag gcgcggaggc ggtggccgcg  1800
gtcctgtttg gcgacgtgaa tccgtccggg aagctgccca tcacgattcc gcgcagcgtg  1860
ggccaggtgc caatttacta cgggcacaag ccgtcgggcg gccgctcgca ctggaagggc  1920
gcgtatgtgg acgagagcaa tctgccgctc tatccgtttg ggcacgggct gtcctacacg  1980
gcgttcgcgt accgggatct ggcgctgtct ccgagcgtcc tgggcgtgca cggcgaggtc  2040
gaggtgtcgt gcgtgatcga aaacgtcggg gctcgcgcgg gcgaagaggt ggtgcaactg  2100
tacgcacgcg acgtggcggc ggacgtgacg cggccggtga aggcgctctg cggctttgcg  2160
cgggtggcgc tcgcgccggg agagaaggcg cgagtgcggt tccgggtttc agcgcaccag  2220
ttcggcttct acaaccggga gatgcggtat gtcgtggagc cgggcgagat cgagttcatg  2280
gtgggggcgt cgtccgagga catccgcctg cgcggggcgg tgcggatgga cggcgcggtg  2340
acggagatcg agcacgagaa ggtataccag agcgcggtgg acgtcgagcg gatgtga     2397
 
<210>10
<211>2397
<212>DNA
<213>人工序列
 
<220>
<223>在SEQ ID NO 1中的替换
 
<400>10
ttgaatgtga gggcggcgtc agcgcctgat gagcagagga ggcttcccgt gacacccgtg    60
tatctcgatc ccgcacagtc cattgaagcg cgcgtcgacg cgctcctggc cgatatgacg   120
cttgaagaaa aggtcgctca actcacgtcc atctgggcgt tcgaagtcct ggatgagctc   180
gagttctccg ccgagaaggc cgccgccgtg ctcgggcagg gcatcggaca ggtgacccga   240
attggcggcg ccaccaatct ggacccgccg gatgtggccc gcctcgccaa ccagattcag   300
cgctacctgc gcgatcacac gcgcctcggc attccggcgc tgatccacga ggagtcgtgc     360
agcggctaca tggccaaggg cgccacctgc tttccgcaaa ccattggcat cgcgagcacg     420
tgggatgtcg atctcgcccg ccgtattggc gccatcatcc gcgatcagat gcgggccgtc     480
ggggcgcgcc aggcgctcgc cccgctcctg gatgtggcac gagatccgcg ctggggccgg     540
gtggaggaga cgttcggcga agatccgtac ctcgtggcgc agatgggcat cgcgtacgtc     600
cgcgggctgc agggagacga cctgagccag ggcgtgatgg cgacgggcaa gcacttcgtg     660
ggctacgggg cgtccgaggg cggcatgaac tgggcgccgg cgcacatccc ggagcgcgag     720
ctgcgcgagg tgtacctgtt cccgttcgag gcggcggtgc gcgaggcggg gctcggcgcc     780
atcatgccgg ggtaccacga gctcgacggc gtgccctgcc acgacaatcc agggcttttg     840
cgcgagaccc tccgcgggcg ctggggcttt caggggctcg tggtgtcgga ctatttcgcc     900
gtgaatcagc tgttcgaata tcatcaggtg gcccgggaca aggcggaggc cgcggcgctc     960
gccgtgcgcg ccggggtgga cgtggagctg ccgacgcgcg acgtgtacgg caagccgctc    1020
atcgaggccg ttgcacgagg gctcgtcagc ccggccgaga tcgacgaact cgtgcgccgg    1080
gtgctcacgt ggaagttccg gctcggcctc ttcgatcacc cgtttgtcga cgagggcgcg    1140
gccatcgccg tcttcgacaa cgcggagcag cgtcaggtgg cgcgggaggc ggcggagaag    1200
tcgatggtcc tcctcaaaaa cgacgggctt ctgcccctcg cgccccgcgg caccatcgcc    1260
gtgatcggcc caaacgcgca cacgacgcgc aatttggtag gcgattacgc ctacccgtgc    1320
cacatcgagt cgctcctcga gcagtccgag gacaacgtgt ttcagacccc gcttccgagc    1380
ggcgtgaaac acgtggacga gttcatcctc atgcggacca tcctcgaggc catccgccat    1440
cgcgtcgggt cggaggcgca ggtcgtctac gcgaaggggt gcgacatcct cggcggtgag    1500
gatgcggagc tcgaggaggc ggtggcgctt gccgcgaagg cggacgtggc ggttgtggtg    1560
gtgggcgatc gcgccgggct cacggacgcg tgcacgacag gggaatcgcg agacagagcc    1620
acgctctcgc tcatcgggcg gcaggaggaa ctcgtgcggc gcgtaatcgc cacgggcacg    1680
aagacggtcg tggtgctcgt gagcgggcgg ccgctcgcca tcccggacat cgcggagcgg    1740
gcgaacgccg ttctcgaggc gtggctgccg ggcgaggaag gcgcggaggc ggtggccgcg    1800
gtcctgtttg gcgacgtgaa tccgtccggg aagctgccca tcacgattcc gcgcagcgtg    1860
ggccaggtgc caatttacta cgggcacaag ccgtcgggcg gccgctcgca ctggaagggc    1920
gcgtatgtgg acgagagcaa tctgccgctc tatccgtttg ggcacgggct gtcctacacg    1980
gcgttcgcgt accgggatct ggcgctgtct ccgagcgtcc tgggcgtgca cggcgaggtc    2040
gaggtgtcgt gcgtgatcga aaacgtcggg gctcgcgcgg gcgaagaggt ggtgcaactg    2100
tacgcacgcg acgtggcggc ggacgtgacg cggccggtga aggcgctctg cggctttgcg    2160
cgggtggcgc tcgcgccggg agagaaggcg cgagtgcggt tccgggtttc agcgcaccag    2220
ttcggcttct acaaccggga gatgcggtat gtcgtggagc cgggcgagat cgagttcatg    2280
gtgggggcgt cgtccgagga catccgcctg cgcggggcgg tgcggatgga cggcgcggtg    2340
acggagatcg agcacgagaa ggtataccag agcgcggtgg acgtcgagcg gatgtga       2397
 
<210>11
<211>2397
<212>DNA
<213>人工序列
 
<220>
<223>在SEQ ID NO 1中的替换
 
<400>11
ttgaatgtga aggcggcgtc agcgcctgag gagcagagga ggcttcccgt gacacccgtg      60
tatctcgatc ccgcacagtc cattgaagcg cgcgtcgacg cgctcctggc cgatatgacg     120
cttgaagaaa aggtcgctca actcacgtcc atctgggcgt tcgaagtcct ggatgagctc     180
gagttctccg ccgagaaggc cgccgccgtg ctcgggcagg gcatcggaca ggtgacccga     240
attggcggcg ccaccaatct ggacccgccg gatgtggccc gcctcgccaa ccagattcag     300
cgctacctgc gcgatcacac gcgcctcggc attccggcgc tgatccacga ggagtcgtgc     360
agcggctaca tggccaaggg cgccacctgc tttccgcaaa ccattggcat cgcgagcacg     420
tgggatgtcg atctcgcccg ccgtattggc gccatcatcc gcgatcagat gcgggccgtc     480
ggggcgcgcc aggcgctcgc cccgctcctg gatgtggcac gagatccgcg ctggggccgg     540
gtggaggaga cgttcggcga agatccgtac ctcgtggcgc agatgggcat cgcgtacgtc     600
cgcgggctgc agggagacga cctgagccag ggcgtgatgg cgacgggcaa gcacttcgtg     660
ggctacgggg cgtccgaggg cggcatgaac tgggcgccgg cgcacatccc ggagcgcgag     720
ctgcgcgagg tgtacctgtt cccgttcgag gcggcggtgc gcgaggcggg gctcggcgcc     780
atcatgccgg ggtaccacga gctcgacggc gtgccctgcc acgacaatcc agggcttttg     840
cgcgagaccc tccgcgggcg ctggggcttt caggggctcg tggtgtcgga ctatttcgcc     900
gtgaatcagc tgttcgaata tcatcaggtg gcccgggaca aggcggaggc cgcggcgctc     960
gccgtgcgcg ccggggtgga cgtggagctg ccgacgcgcg acgtgtacgg caagccgctc    1020
atcgaggccg ttgcacgagg gctcgtcagc ccggccgaga tcgacgaact cgtgcgccgg    1080
gtgctcacgt ggaagttccg gctcggcctc ttcgatcacc cgtttgtcga cgagggcgcg    1140
gccatcgccg tcttcgacaa cgcggagcag cgtcaggtgg cgcgggaggc ggcggagaag    1200
tcgatggtcc tcctcaaaaa cgacgggctt ctgcccctcg cgccccgcgg caccatcgcc    1260
gtgatcggcc caaacgcgca cacgacgcgc aatttggtag gcgattacgc ctacccgtgc    1320
cacatcgagt cgctcctcga gcagtccgag gacaacgtgt ttcagacccc gcttccgagc    1380
ggcgtgaaac acgtggacga gttcatcctc atgcggacca tcctcgaggc catccgccat  1440
cgcgtcgggt cggaggcgca ggtcgtctac gcgaaggggt gcgacatcct cggcggtgag  1500
gatgcggagc tcgaggaggc ggtggcgctt gccgcgaagg cggacgtggc ggttgtggtg  1560
gtgggcgatc gcgccgggct cacggacgcg tgcacgacag gggaatcgcg agacagagcc  1620
acgctctcgc tcatcgggcg gcaggaggaa ctcgtgcggc gcgtaatcgc cacgggcacg  1680
aagacggtcg tggtgctcgt gagcgggcgg ccgctcgcca tcccggacat cgcggagcgg  1740
gcgaacgccg ttctcgaggc gtggctgccg ggcgaggaag gcgcggaggc ggtggccgcg  1800
gtcctgtttg gcgacgtgaa tccgtccggg aagctgccca tcacgattcc gcgcagcgtg  1860
ggccaggtgc caatttacta cgggcacaag ccgtcgggcg gccgctcgca ctggaagggc  1920
gcgtatgtgg acgagagcaa tctgccgctc tatccgtttg ggcacgggct gtcctacacg  1980
gcgttcgcgt accgggatct ggcgctgtct ccgagcgtcc tgggcgtgca cggcgaggtc  2040
gaggtgtcgt gcgtgatcga aaacgtcggg gctcgcgcgg gcgaagaggt ggtgcaactg  2100
tacgcacgcg acgtggcggc ggacgtgacg cggccggtga aggcgctctg cggctttgcg  2160
cgggtggcgc tcgcgccggg agagaaggcg cgagtgcggt tccgggtttc agcgcaccag  2220
ttcggcttct acaaccggga gatgcggtat gtcgtggagc cgggcgagat cgagttcatg  2280
gtgggggcgt cgtccgagga catccgcctg cgcggggcgg tgcggatgga cggcgcggtg  2340
acggagatcg agcacgagaa ggtataccag agcgcggtgg acgtcgagcg gatgtga     2397
 
<210>12
<211>2397
<212>DNA
<213>人工序列
 
<220>
<223>在SEQ ID NO 1中的替换
 
<400>12
ttgaatgtga aggcggcgtc agcgcctgat gatcagagga ggcttcccgt gacacccgtg    60
tatctcgatc ccgcacagtc cattgaagcg cgcgtcgacg cgctcctggc cgatatgacg   120
cttgaagaaa aggtcgctca actcacgtcc atctgggcgt tcgaagtcct ggatgagctc   180
gagttctccg ccgagaaggc cgccgccgtg ctcgggcagg gcatcggaca ggtgacccga   240
attggcggcg ccaccaatct ggacccgccg gatgtggccc gcctcgccaa ccagattcag   300
cgctacctgc gcgatcacac gcgcctcggc attccggcgc tgatccacga ggagtcgtgc   360
agcggctaca tggccaaggg cgccacctgc tttccgcaaa ccattggcat cgcgagcacg   420
tgggatgtcg atctcgcccg ccgtattggc gccatcatcc gcgatcagat gcgggccgtc   480
ggggcgcgcc aggcgctcgc cccgctcctg gatgtggcac gagatccgcg ctggggccgg   540
gtggaggaga cgttcggcga agatccgtac ctcgtggcgc agatgggcat cgcgtacgtc     600
cgcgggctgc agggagacga cctgagccag ggcgtgatgg cgacgggcaa gcacttcgtg     660
ggctacgggg cgtccgaggg cggcatgaac tgggcgccgg cgcacatccc ggagcgcgag     720
ctgcgcgagg tgtacctgtt cccgttcgag gcggcggtgc gcgaggcggg gctcggcgcc     780
atcatgccgg ggtaccacga gctcgacggc gtgccctgcc acgacaatcc agggcttttg     840
cgcgagaccc tccgcgggcg ctggggcttt caggggctcg tggtgtcgga ctatttcgcc     900
gtgaatcagc tgttcgaata tcatcaggtg gcccgggaca aggcggaggc cgcggcgctc     960
gccgtgcgcg ccggggtgga cgtggagctg ccgacgcgcg acgtgtacgg caagccgctc    1020
atcgaggccg ttgcacgagg gctcgtcagc ccggccgaga tcgacgaact cgtgcgccgg    1080
gtgctcacgt ggaagttccg gctcggcctc ttcgatcacc cgtttgtcga cgagggcgcg    1140
gccatcgccg tcttcgacaa cgcggagcag cgtcaggtgg cgcgggaggc ggcggagaag    1200
tcgatggtcc tcctcaaaaa cgacgggctt ctgcccctcg cgccccgcgg caccatcgcc    1260
gtgatcggcc caaacgcgca cacgacgcgc aatttggtag gcgattacgc ctacccgtgc    1320
cacatcgagt cgctcctcga gcagtccgag gacaacgtgt ttcagacccc gcttccgagc    1380
ggcgtgaaac acgtggacga gttcatcctc atgcggacca tcctcgaggc catccgccat    1440
cgcgtcgggt cggaggcgca ggtcgtctac gcgaaggggt gcgacatcct cggcggtgag    1500
gatgcggagc tcgaggaggc ggtggcgctt gccgcgaagg cggacgtggc ggttgtggtg    1560
gtgggcgatc gcgccgggct cacggacgcg tgcacgacag gggaatcgcg agacagagcc    1620
acgctctcgc tcatcgggcg gcaggaggaa ctcgtgcggc gcgtaatcgc cacgggcacg    1680
aagacggtcg tggtgctcgt gagcgggcgg ccgctcgcca tcccggacat cgcggagcgg    1740
gcgaacgccg ttctcgaggc gtggctgccg ggcgaggaag gcgcggaggc ggtggccgcg    1800
gtcctgtttg gcgacgtgaa tccgtccggg aagctgccca tcacgattcc gcgcagcgtg    1860
ggccaggtgc caatttacta cgggcacaag ccgtcgggcg gccgctcgca ctggaagggc    1920
gcgtatgtgg acgagagcaa tctgccgctc tatccgtttg ggcacgggct gtcctacacg    1980
gcgttcgcgt accgggatct ggcgctgtct ccgagcgtcc tgggcgtgca cggcgaggtc    2040
gaggtgtcgt gcgtgatcga aaacgtcggg gctcgcgcgg gcgaagaggt ggtgcaactg    2100
tacgcacgcg acgtggcggc ggacgtgacg cggccggtga aggcgctctg cggctttgcg    2160
cgggtggcgc tcgcgccggg agagaaggcg cgagtgcggt tccgggtttc agcgcaccag    2220
ttcggcttct acaaccggga gatgcggtat gtcgtggagc cgggcgagat cgagttcatg    2280
gtgggggcgt cgtccgagga catccgcctg cgcggggcgg tgcggatgga cggcgcggtg    2340
acggagatcg agcacgagaa ggtataccag agcgcggtgg acgtcgagcg gatgtga       2397
<210>13
<211>798
<212>PRT
<213>人工序列
 
<220>
<223>在SEQ ID NO:2中的替换并且由SEQ ID NO:8编码
 
<400>13
 
Met Asn Ile Lys Ala Ala Ser Ala Pro Asp Glu Gln Arg Arg Leu Pro
1               5                   10                  15
Val Thr Pro Val Tyr Leu Asp Pro Ala Gln Ser Ile Glu Ala Arg Val
            20                  25                  30
Asp Ala Leu Leu Ala Asp Met Thr Leu Glu Glu Lys Val Ala Gln Leu
        35                  40                  45
Thr Ser Ile Trp Ala Phe Glu Val Leu Asp Glu Leu Glu Phe Ser Ala
    50                  55                  60
Glu Lys Ala Ala Ala Val Leu Gly Gln Gly Ile Gly Gln Val Thr Arg
65                  70                  75                  80
Ile Gly Gly Ala Thr Asn Leu Asp Pro Pro Asp Val Ala Arg Leu Ala
                85                  90                  95
Asn Gln Ile Gln Arg Tyr Leu Arg Asp His Thr Arg Leu Gly Ile Pro
            100                 105                 110
Ala Leu Ile His Glu Glu Ser Cys Ser Gly Tyr Met Ala Lys Gly Ala
        115                 120                 125
Thr Cys Phe Pro Gln Thr Ile Gly Ile Ala Ser Thr Trp Asp Val Asp
    130                 135                 140
Leu Ala Arg Arg Ile Gly Ala Ile Ile Arg Asp Gln Met Arg Ala Val
145                 150                 155                 160
Gly Ala Arg Gln Ala Leu Ala Pro Leu Leu Asp Val Ala Arg Asp Pro
                165                 170                 175
Arg Trp Gly Arg Val Glu Glu Thr Phe Gly Glu Asp Pro Tyr Leu Val
            180                 185                 190
Ala Gln Met Gly Ile Ala Tyr Val Arg Gly Leu Gln Gly Asp Asp Leu
        195                 200                 205
Ser Gln Gly Val Met Ala Thr Gly Lys His Phe Val Gly Tyr Gly Ala
    2l0                 215                 220
Ser Glu Gly Gly Met Asn Trp Ala Pro Ala His Ile Pro Glu Arg Glu
225                 230                 235                 240
Leu Arg Glu Val Tyr Leu Phe Pro Phe Glu Ala Ala Val Arg Glu Ala
                245                 250                 255
Gly Leu Gly Ala Ile Met Pro Gly Tyr His Glu Leu Asp Gly Val Pro
            260                 265                 270
Cys His Asp Asn Pro Gly Leu Leu Arg Glu Thr Leu Arg Gly Arg Trp
        275                 280                 285
Gly Phe Gln Gly Leu Val Val Ser Asp Tyr Phe Ala Val Asn Gln Leu
    290                 295                 300
Phe Glu Tyr His Gln Val Ala Arg Asp Lys Ala Glu Ala Ala Ala Leu
305                 310                 315                 320
Ala Val Arg Ala Gly Val Asp Val Glu Leu Pro Thr Arg Asp Val Tyr
                325                 330                 335
Gly Lys Pro Leu Ile Glu Ala Val Ala Arg Gly Leu Val Ser Pro Ala
            340                 345                 350
Glu Ile Asp Glu Leu Val Arg Arg Val Leu Thr Trp Lys Phe Arg Leu
        355                 360                 365
Gly Leu Phe Asp His Pro Phe Val Asp Glu Gly Ala Ala Ile Ala Val
    370                 375                 380
Phe Asp Asn Ala Glu Gln Arg Gln Val Ala Arg Glu Ala Ala Glu Lys
385                 390                 395                 400
Ser Met Val Leu Leu Lys Asn Asp Gly Leu Leu Pro Leu Ala Pro Arg
                405                 410                 415
Gly Thr Ile Ala Val Ile Gly Pro Asn Ala His Thr Thr Arg Asn Leu
            420                 425                 430
Val Gly Asp Tyr Ala Tyr Pro Cys His Ile Glu Ser Leu Leu Glu Gln
        435                 440                 445
Ser Glu Asp Asn Val Phe Gln Thr Pro Leu Pro Ser Gly Val Lys His
    450                 455                 460
Val Asp Glu Phe Ile Leu Met Arg Thr Ile Leu Glu Ala Ile Arg His
465                 470                 475                 480
Arg Val Gly Ser Glu Ala Gln Val Val Tyr Ala Lys Gly Cys Asp Ile
                485                 490                 495
Leu Gly Gly Glu Asp Ala Glu Leu Glu Glu Ala Val Ala Leu Ala Ala
            500                 505                 510
Lys Ala Asp Val Ala Val Val Val Val Gly Asp Arg Ala Gly Leu Thr
        515                 520                 525
Asp Ala Cys Thr Thr Gly Glu Ser Arg Asp Arg Ala Thr Leu Ser Leu
    530                 535                 540
Ile Gly Arg Gln Glu Glu Leu Val Arg Arg Val Ile Ala Thr Gly Thr
545                 550                 555                 560
Lys Thr Val Val Val Leu Val Ser Gly Arg Pro Leu Ala Ile Pro Asp
                565                 570                 575
Ile Ala Glu Arg Ala Asn Ala Val Leu Glu Ala Trp Leu Pro Gly Glu
            580                 585                 590
Glu Gly Ala Glu Ala Val Ala Ala Val Leu Phe Gly Asp Val Asn Pro
        595                 600                 605
Ser Gly Lys Leu Pro Ile Thr Ile Pro Arg Ser Val Gly Gln Val Pro
    610                 615                 620
Ile Tyr Tyr Gly His Lys Pro Ser Gly Gly Arg Ser His Trp Lys Gly
625                 630                 635                 640
Ala Tyr Val Asp Glu Ser Asn Leu Pro Leu Tyr Pro Phe Gly His Gly
                645                 650                 655
Leu Ser Tyr Thr Ala Phe Ala Tyr Arg Asp Leu Ala Leu Ser Pro Ser
            660                 665                 670
Val Leu Gly Val His Gly Glu Val Glu Val Ser Cys Val Ile Glu Asn
        675                 680                 685
Val Gly Ala Arg Ala Gly Glu Glu Val Val Gln Leu Tyr Ala Arg Asp
    690                 695                 700
Val Ala Ala Asp Val Thr Arg Pro Val Lys Ala Leu Cys Gly Phe Ala
705                 710                 715                 720
Arg Val Ala Leu Ala Pro Gly Glu Lys Ala Arg Val Arg Phe Arg Val
                725                 730                 735
Ser Ala His Gln Phe Gly Phe Tyr Asn Arg Glu Met Arg Tyr Val Val
            740                 745                 750
Glu Pro Gly Glu Ile Glu Phe Met Val Gly Ala Ser Ser Glu Asp Ile
        755                 760                 765
Arg Leu Arg Gly Ala Val Arg Met Asp Gly Ala Val Thr Glu Ile Glu
    770                 775                 780
His Glu Lys Val Tyr Gln Ser Ala Val Asp Val Glu Arg Met
785                 790                 795
 
<210>14
<211>798
<212>PRT
<213>人工序列
 
<220>
<223>在SEQ ID NO:2中的替换并且由SEQ ID NO:9编码
 
<400>14
 
Met Asn Leu Lys Ala Ala Ser Ala Pro Asp Glu Gln Arg Arg Leu Pro
1               5                   10                  15
Val Thr Pro Val Tyr Leu Asp Pro Ala Gln Ser Ile Glu Ala Arg Val
            20                  25                  30
Asp Ala Leu Leu Ala Asp Met Thr Leu Glu Glu Lys Val Ala Gln Leu
        35                  40                  45
Thr Ser Ile Trp Ala Phe Glu Val Leu Asp Glu Leu Glu Phe Ser Ala
    50                  55                  60
Glu Lys Ala Ala Ala Val Leu Gly Gln Gly Ile Gly Gln Val Thr Arg
65                  70                  75                  80
Ile Gly Gly Ala Thr Asn Leu Asp Pro Pro Asp Val Ala Arg Leu Ala
                85                  90                  95
Asn Gln Ile Gln Arg Tyr Leu Arg Asp His Thr Arg Leu Gly Ile Pro
            100                 105                 110
Ala Leu Ile His Glu Glu Ser Cys Ser Gly Tyr Met Ala Lys Gly Ala
        115                 120                 125
Thr Cys Phe Pro Gln Thr Ile Gly Ile Ala Ser Thr Trp Asp Val Asp
    130                 135                 140
Leu Ala Arg Arg Ile Gly Ala Ile Ile Arg Asp Gln Met Arg Ala Val
145                 150                 155                 160
Gly Ala Arg Gln Ala Leu Ala Pro Leu Leu Asp Val Ala Arg Asp Pro
                165                 170                 175
Arg Trp Gly Arg Val Glu Glu Thr Phe Gly Glu Asp Pro Tyr Leu Val
            180                 185                 190
Ala Gln Met Gly Ile Ala Tyr Val Arg Gly Leu Gln Gly Asp Asp Leu
        195                 200                 205
Ser Gln Gly Val Met Ala Thr Gly Lys His Phe Val Gly Tyr Gly Ala
    210                 215                 220
Ser Glu Gly Gly Met Asn Trp Ala Pro Ala His Ile Pro Glu Arg Glu
225                 230                 235                 240
Leu Arg Glu Val Tyr Leu Phe Pro Phe Glu Ala Ala Val Arg Glu Ala
                245                 250                 255
Gly Leu Gly Ala Ile Met Pro Gly Tyr His Glu Leu Asp Gly Val Pro
            260                 265                 270
Cys His Asp Asn Pro Gly Leu Leu Arg Glu Thr Leu Arg Gly Arg Trp
        275                 280                 285
Gly Phe Gln Gly Leu Val Val Ser Asp Tyr Phe Ala Val Asn Gln Leu
    290                 295                 300
Phe Glu Tyr His Gln Val Ala Arg Asp Lys Ala Glu Ala Ala Ala Leu
305                 310                 315                 320
Ala Val Arg Ala Gly Val Asp Val Glu Leu Pro Thr Arg Asp Val Tyr
                325                 330                 335
Gly Lys Pro Leu Ile Glu Ala Val Ala Arg Gly Leu Val Ser Pro Ala
            340                 345                 350
Glu Ile Asp Glu Leu Val Arg Arg Val Leu Thr Trp Lys Phe Arg Leu
        355                 360                 365
Gly Leu Phe Asp His Pro Phe Val Asp Glu Gly Ala Ala Ile Ala Val
    370                 375                 380
Phe Asp Asn Ala Glu Gln Arg Gln Val Ala Arg Glu Ala Ala Glu Lys
385                 390                 395                 400
Ser Met Val Leu Leu Lys Asn Asp Gly Leu Leu Pro Leu Ala Pro Arg
                405                 410                 415
Gly Thr Ile Ala Val Ile Gly Pro Asn Ala His Thr Thr Arg Asn Leu
            420                 425                 430
Val Gly Asp Tyr Ala Tyr Pro Cys His Ile Glu Ser Leu Leu Glu Gln
        435                 440                 445
Ser Glu Asp Asn Val Phe Gln Thr Pro Leu Pro Ser Gly Val Lys His
    450                 455                 460
Val Asp Glu Phe Ile Leu Met Arg Thr Ile Leu Glu Ala Ile Arg His
465                 470                 475                 480
Arg Val Gly Ser Glu Ala Gln Val Val Tyr Ala Lys Gly Cys Asp Ile
                485                 490                 495
Leu Gly Gly Glu Asp Ala Glu Leu Glu Glu Ala Val Ala Leu Ala Ala
            500                 505                 510
Lys Ala Asp Val Ala Val Val Val Val Gly Asp Arg Ala Gly Leu Thr
        515                 520                 525
Asp Ala Cys Thr Thr Gly Glu Ser Arg Asp Arg Ala Thr Leu Ser Leu
    530                 535                 540
Ile Gly Arg Gln Glu Glu Leu Val Arg Arg Val Ile Ala Thr Gly Thr
545                 550                 555                 560
Lys Thr Val Val Val Leu Val Ser Gly Arg Pro Leu Ala Ile Pro Asp
                565                 570                 575
Ile Ala Glu Arg Ala Asn Ala Val Leu Glu Ala Trp Leu Pro Gly Glu
            580                 585                 590
Glu Gly Ala Glu Ala Val Ala Ala Val Leu Phe Gly Asp Val Asn Pro
        595                 600                 605
Ser Gly Lys Leu Pro Ile Thr Ile Pro Arg Ser Val Gly Gln Val Pro
    610                 615                 620
Ile Tyr Tyr Gly His Lys Pro Ser Gly Gly Arg Ser His Trp Lys Gly
625                 630                 635                 640
Ala Tyr Val Asp Glu Ser Asn Leu Pro Leu Tyr Pro Phe Gly His Gly
                645                 650                 655
Leu Ser Tyr Thr Ala Phe Ala Tyr Arg Asp Leu Ala Leu Ser Pro Ser
            660                 665                 670
Val Leu Gly Val His Gly Glu Val Glu Val Ser Cys Val Ile Glu Asn
        675                 680                 685
Val Gly Ala Arg Ala Gly Glu Glu Val Val Gln Leu Tyr Ala Arg Asp
    690                 695                 700
Val Ala Ala Asp Val Thr Arg Pro Val Lys Ala Leu Cys Gly Phe Ala
705                 710                 715                 720
Arg Val Ala Leu Ala Pro Gly Glu Lys Ala Arg Val Arg Phe Arg Val
                725                 730                 735
Ser Ala His Gln Phe Gly Phe Tyr Asn Arg Glu Met Arg Tyr Val Val
            740                 745                 750
Glu Pro Gly Glu Ile Glu Phe Met Val Gly Ala Ser Ser Glu Asp Ile
        755                 760                 765
Arg Leu Arg Gly Ala Val Arg Met Asp Gly Ala Val Thr Glu Ile Glu
    770                 775                 780
His Glu Lys Val Tyr Gln Ser Ala Val Asp Val Glu Arg Met
785                 790                 795
 
<210>15
<211>798
<212>PRT
<213>人工序列
 
<220>
<223>在SEQ ID NO:2中的替换并且由SEQ ID NO:10编码
 
<400>15
 
Met Asn Val Arg Ala Ala Ser Ala Pro Asp Glu Gln Arg Arg Leu Pro
1               5                   10                  15
Val Thr Pro Val Tyr Leu Asp Pro Ala Gln Ser Ile Glu Ala Arg Val
            20                  25                  30
Asp Ala Leu Leu Ala Asp Met Thr Leu Glu Glu Lys Val Ala Gln Leu
        35                  40                  45
Thr Ser Ile Trp Ala Phe Glu Val Leu Asp Glu Leu Glu Phe Ser Ala
    50                  55                  60
Glu Lys Ala Ala Ala Val Leu Gly Gln Gly Ile Gly Gln Val Thr Arg
65                  70                  75                  80
Ile Gly Gly Ala Thr Asn Leu Asp Pro Pro Asp Val Ala Arg Leu Ala
                85                  90                  95
Asn Gln Ile Gln Arg Tyr Leu Arg Asp His Thr Arg Leu Gly Ile Pro
            100                 105                 110
Ala Leu Ile His Glu Glu Ser Cys Ser Gly Tyr Met Ala Lys Gly Ala
        115                 120                 125
Thr Cys Phe Pro Gln Thr Ile Gly Ile Ala Ser Thr Trp Asp Val Asp
    130                 135                 140
Leu Ala Arg Arg Ile Gly Ala Ile Ile Arg Asp Gln Met Arg Ala Val
145                 150                 155                 160
Gly Ala Arg Gln Ala Leu Ala Pro Leu Leu Asp Val Ala Arg Asp Pro
                165                 170                 175
Arg Trp Gly Arg Val Glu Glu Thr Phe Gly Glu Asp Pro Tyr Leu Val
            180                 185                 190
Ala Gln Met Gly Ile Ala Tyr Val Arg Gly Leu Gln Gly Asp Asp Leu
        195                 200                 205
Ser Gln Gly Val Met Ala Thr Gly Lys His Phe Val Gly Tyr Gly Ala
    210                 215                 220
Ser Glu Gly Gly Met Asn Trp Ala Pro Ala His Ile Pro Glu Arg Glu
225                 230                 235                 240
Leu Arg Glu Val Tyr Leu Phe Pro Phe Glu Ala Ala Val Arg Glu Ala
                245                 250                 255
Gly Leu Gly Ala Ile Met Pro Gly Tyr His Glu Leu Asp Gly Val Pro
            260                 265                 270
Cys His Asp Asn Pro Gly Leu Leu Arg Glu Thr Leu Arg Gly Arg Trp
        275                 280                 285
Gly Phe Gln Gly Leu Val Val Ser Asp Tyr Phe Ala Val Asn Gln Leu
    290                 295                 300
Phe Glu Tyr His Gln Val Ala Arg Asp Lys Ala Glu Ala Ala Ala Leu
305                 310                 315                 320
Ala Val Arg Ala Gly Val Asp Val Glu Leu Pro Thr Arg Asp Val Tyr
                325                 330                 335
Gly Lys Pro Leu Ile Glu Ala Val Ala Arg Gly Leu Val Ser Pro Ala
            340                 345                 350
Glu Ile Asp Glu Leu Val Arg Arg Val Leu Thr Trp Lys Phe Arg Leu
        355                 360                 365
Gly Leu Phe Asp His Pro Phe Val Asp Glu Gly Ala Ala Ile Ala Val
    370                 375                 380
Phe Asp Asn Ala Glu Gln Arg Gln Val Ala Arg Glu Ala Ala Glu Lys
385                 390                 395                 400
Ser Met Val Leu Leu Lys Asn Asp Gly Leu Leu Pro Leu Ala Pro Arg
                405                 410                 415
Gly Thr Ile Ala Val Ile Gly Pro Asn Ala His Thr Thr Arg Asn Leu
            420                 425                 430
Val Gly Asp Tyr Ala Tyr Pro Cys His Ile Glu Ser Leu Leu Glu Gln
        435                 440                 445
Ser Glu Asp Asn Val Phe Gln Thr Pro Leu Pro Ser Gly Val Lys His
    450                 455                 460
Val Asp Glu Phe Ile Leu Met Arg Thr Ile Leu Glu Ala Ile Arg His
465                 470                 475                 480
Arg Val Gly Ser Glu Ala Gln Val Val Tyr Ala Lys Gly Cys Asp Ile
                485                 490                 495
Leu Gly Gly Glu Asp Ala Glu Leu Glu Glu Ala Val Ala Leu Ala Ala
            500                 505                 510
Lys Ala Asp Val Ala Val Val Val Val Gly Asp Arg Ala Gly Leu Thr
        515                 520                 525
Asp Ala Cys Thr Thr Gly Glu Ser Arg Asp Arg Ala Thr Leu Ser Leu
    530                 535                 540
Ile Gly Arg Gln Glu Glu Leu Val Arg Arg Val Ile Ala Thr Gly Thr
545                 550                 555                 560
Lys Thr Val Val Val Leu Val Ser Gly Arg Pro Leu Ala Ile Pro Asp
                565                 570                 575
Ile Ala Glu Arg Ala Asn Ala Val Leu Glu Ala Trp Leu Pro Gly Glu
            580                 585                 590
Glu Gly Ala Glu Ala Val Ala Ala Val Leu Phe Gly Asp Val Asn Pro
        595                 600                 605
Ser Gly Lys Leu Pro Ile Thr Ile Pro Arg Ser Val Gly Gln Val Pro
    610                 615                 620
Ile Tyr Tyr Gly His Lys Pro Ser Gly Gly Arg Ser His Trp Lys Gly
625                 630                 635                 640
Ala Tyr Val Asp Glu Ser Asn Leu Pro Leu Tyr Pro Phe Gly His Gly
                645                 650                 655
Leu Ser Tyr Thr Ala Phe Ala Tyr Arg Asp Leu Ala Leu Ser Pro Ser
            660                 665                 670
Val Leu Gly Val His Gly Glu Val Glu Val Ser Cys Val Ile Glu Asn
        675                 680                 685
Val Gly Ala Arg Ala Gly Glu Glu Val Val Gln Leu Tyr Ala Arg Asp
    690                 695                 700
Val Ala Ala Asp Val Thr Arg Pro Val Lys Ala Leu Cys Gly Phe Ala
705                 710                 715                 720
Arg Val Ala Leu Ala Pro Gly Glu Lys Ala Arg Val Arg Phe Arg Val
                725                 730                 735
Ser Ala His Gln Phe Gly Phe Tyr Asn Arg Glu Met Arg Tyr Val Val
            740                 745                 750
Glu Pro Gly Glu Ile Glu Phe Met Val Gly Ala Ser Ser Glu Asp Ile
        755                 760                 765
Arg Leu Arg Gly Ala Val Arg Met Asp Gly Ala Val Thr Glu Ile Glu
    770                 775                 780
His Glu Lys Val Tyr Gln Ser Ala Val Asp Val Glu Arg Met
785                 790                 795
<210>16
<211>798
<212>PRT
<213>人工序列
 
<220>
<223>在SEQ ID NO:2中的替换并且由SEQ ID NO:11编码
 
<400>16
 
Met Asn Val Lys Ala Ala Ser Ala Pro Glu Glu Gln Arg Arg Leu Pro
1               5                   10                  15
Val Thr Pro Val Tyr Leu Asp Pro Ala Gln Ser Ile Glu Ala Arg Val
            20                  25                  30
Asp Ala Leu Leu Ala Asp Met Thr Leu Glu Glu Lys Val Ala Gln Leu
        35                  40                  45
Thr Ser Ile Trp Ala Phe Glu Val Leu Asp Glu Leu Glu Phe Ser Ala
    50                  55                  60
Glu Lys Ala Ala Ala Val Leu Gly Gln Gly Ile Gly Gln Val Thr Arg
65                  70                  75                  80
Ile Gly Gly Ala Thr Asn Leu Asp Pro Pro Asp Val Ala Arg Leu Ala
                85                  90                  95
Asn Gln Ile Gln Arg Tyr Leu Arg Asp His Thr Arg Leu Gly Ile Pro
            100                 105                 110
Ala Leu Ile His Glu Glu Ser Cys Ser Gly Tyr Met Ala Lys Gly Ala
        115                 120                 125
Thr Cys Phe Pro Gln Thr Ile Gly Ile Ala Ser Thr Trp Asp Val Asp
    130                 135                 140
Leu Ala Arg Arg Ile Gly Ala Ile Ile Arg Asp Gln Met Arg Ala Val
145                 150                 155                 160
Gly Ala Arg Gln Ala Leu Ala Pro Leu Leu Asp Val Ala Arg Asp Pro
                165                 170                 175
Arg Trp Gly Arg Val Glu Glu Thr Phe Gly Glu Asp Pro Tyr Leu Val
            180                 185                 190
Ala Gln Met Gly Ile Ala Tyr Val Arg Gly Leu Gln Gly Asp Asp Leu
        195                 200                 205
Ser Gln Gly Val Met Ala Thr Gly Lys His Phe Val Gly Tyr Gly Ala
    210                 215                 220
Ser Glu Gly Gly Met Asn Trp Ala Pro Ala His Ile Pro Glu Arg Glu
225                 230                 235                 240
Leu Arg Glu Val Tyr Leu Phe Pro Phe Glu Ala Ala Val Arg Glu Ala
                245                 250                 255
Gly Leu Gly Ala Ile Met Pro Gly Tyr His Glu Leu Asp Gly Val Pro
            260                 265                 270
Cys His Asp Asn Pro Gly Leu Leu Arg Glu Thr Leu Arg Gly Arg Trp
        275                 280                 285
Gly Phe Gln Gly Leu Val Val Ser Asp Tyr Phe Ala Val Asn Gln Leu
    290                 295                 300
Phe Glu Tyr His Gln Val Ala Arg Asp Lys Ala Glu Ala Ala Ala Leu
305                 310                 315                 320
Ala Val Arg Ala Gly Val Asp Val Glu Leu Pro Thr Arg Asp Val Tyr
                325                 330                 335
Gly Lys Pro Leu Ile Glu Ala Val Ala Arg Gly Leu Val Ser Pro Ala
            340                 345                 350
Glu Ile Asp Glu Leu Val Arg Arg Val Leu Thr Trp Lys Phe Arg Leu
        355                 360                 365
Gly Leu Phe Asp His Pro Phe Val Asp Glu Gly Ala Ala Ile Ala Val
    370                 375                 380
Phe Asp Asn Ala Glu Gln Arg Gln Val Ala Arg Glu Ala Ala Glu Lys
385                 390                 395                 400
Ser Met Val Leu Leu Lys Asn Asp Gly Leu Leu Pro Leu Ala Pro Arg
                405                 410                 415
Gly Thr Ile Ala Val Ile Gly Pro Asn Ala His Thr Thr Arg Asn Leu
            420                 425                 430
Val Gly Asp Tyr Ala Tyr Pro Cys His Ile Glu Ser Leu Leu Glu Gln
        435                 440                 445
Ser Glu Asp Asn Val Phe Gln Thr Pro Leu Pro Ser Gly Val Lys His
    450                 455                 460
Val Asp Glu Phe Ile Leu Met Arg Thr Ile Leu Glu Ala Ile Arg His
465                 470                 475                 480
Arg Val Gly Ser Glu Ala Gln Val Val Tyr Ala Lys Gly Cys Asp Ile
                485                 490                 495
Leu Gly Gly Glu Asp Ala Glu Leu Glu Glu Ala Val Ala Leu Ala Ala
            500                 505                 510
Lys Ala Asp Val Ala Val Val Val Val Gly Asp Arg Ala Gly Leu Thr
        515                 520                 525
Asp Ala Cys Thr Thr Gly Glu Ser Arg Asp Arg Ala Thr Leu Ser Leu
    530                 535                 540
Ile Gly Arg Gln Glu Glu Leu Val Arg Arg Val Ile Ala Thr Gly Thr
545                 550                 555                 560
Lys Thr Val Val Val Leu Val Ser Gly Arg Pro Leu Ala Ile Pro Asp
                565                 570                 575
Ile Ala Glu Arg Ala Asn Ala Val Leu Glu Ala Trp Leu Pro Gly Glu
            580                 585                 590
Glu Gly Ala Glu Ala Val Ala Ala Val Leu Phe Gly Asp Val Asn Pro
        595                 600                 605
Ser Gly Lys Leu Pro Ile Thr Ile Pro Arg Ser Val Gly Gln Val Pro
    610                 615                 620
Ile Tyr Tyr Gly His Lys Pro Ser Gly Gly Arg Ser His Trp Lys Gly
625                 630                 635                 640
Ala Tyr Val Asp Glu Ser Asn Leu Pro Leu Tyr Pro Phe Gly His Gly
                645                 650                 655
Leu Ser Tyr Thr Ala Phe Ala Tyr Arg Asp Leu Ala Leu Ser Pro Ser
            660                 665                 670
Val Leu Gly Val His Gly Glu Val Glu Val Ser Cys Val Ile Glu Asn
        675                 680                 685
Val Gly Ala Arg Ala Gly Glu Glu Val Val Gln Leu Tyr Ala Arg Asp
    690                 695                 700
Val Ala Ala Asp Val Thr Arg Pro Val Lys Ala Leu Cys Gly Phe Ala
705                 710                 715                 720
Arg Val Ala Leu Ala Pro Gly Glu Lys Ala Arg Val Arg Phe Arg Val
                725                 730                 735
Ser Ala His Gln Phe Gly Phe Tyr Asn Arg Glu Met Arg Tyr Val Val
            740                 745                 750
Glu Pro Gly Glu Ile Glu Phe Met Val Gly Ala Ser Ser Glu Asp Ile
       755                 760                 765
Arg Leu Arg Gly Ala Val Arg Met Asp Gly Ala Val Thr Glu Ile Glu
    770                 775                 780
His Glu Lys Val Tyr Gln Ser Ala Val Asp Val Glu Arg Met
785                 790                 795
 
<210>17
<211>798
<212>PRT
<213>人工序列
 
<220>
<223>在SEQ ID NO:2中的替换并且由SEQ ID NO:12编码
 
<400>17
 
Met Asn Val Lys Ala Ala Ser Ala Pro Asp Asp Gln Arg Arg Leu Pro
1               5                   10                  15
Val Thr Pro Val Tyr Leu Asp Pro Ala Gln Ser Ile Glu Ala Arg Val
            20                  25                  30
Asp Ala Leu Leu Ala Asp Met Thr Leu Glu Glu Lys Val Ala Gln Leu
        35                  40                  45
Thr Ser Ile Trp Ala Phe Glu Val Leu Asp Glu Leu Glu Phe Ser Ala
    50                  55                  60
Glu Lys Ala Ala Ala Val Leu Gly Gln Gly Ile Gly Gln Val Thr Arg
65                  70                  75                  80
Ile Gly Gly Ala Thr Asn Leu Asp Pro Pro Asp Val Ala Arg Leu Ala
                85                  90                  95
Asn Gln Ile Gln Arg Tyr Leu Arg Asp His Thr Arg Leu Gly Ile Pro
            100                 105                 110
Ala Leu Ile His Glu Glu Ser Cys Ser Gly Tyr Met Ala Lys Gly Ala
        115                 120                 125
Thr Cys Phe Pro Gln Thr Ile Gly Ile Ala Ser Thr Trp Asp Val Asp
    130                 135                 140
Leu Ala Arg Arg Ile Gly Ala Ile Ile Arg Asp Gln Met Arg Ala Val
145                 150                 155                 160
Gly Ala Arg Gln Ala Leu Ala Pro Leu Leu Asp Val Ala Arg Asp Pro
                165                 170                 175
Arg Trp Gly Arg Val Glu Glu Thr Phe Gly Glu Asp Pro Tyr Leu Val
            180                 185                 190
Ala Gln Met Gly Ile Ala Tyr Val Arg Gly Leu Gln Gly Asp Asp Leu
        195                 200                 205
Ser Gln Gly Val Met Ala Thr Gly Lys His Phe Val Gly Tyr Gly Ala
    210                 215                 220
Ser Glu Gly Gly Met Asn Trp Ala Pro Ala His Ile Pro Glu Arg Glu
225                 230                 235                 240
Leu Arg Glu Val Tyr Leu Phe Pro Phe Glu Ala Ala Val Arg Glu Ala
                245                 250                 255
Gly Leu Gly Ala Ile Met Pro Gly Tyr His Glu Leu Asp Gly Val Pro
            260                 265                 270
Cys His Asp Asn Pro Gly Leu Leu Arg Glu Thr Leu Arg Gly Arg Trp
        275                 280                 285
Gly Phe Gln Gly Leu Val Val Ser Asp Tyr Phe Ala Val Asn Gln Leu
    290                 295                 300
Phe Glu Tyr His Gln Val Ala Arg Asp Lys Ala Glu Ala Ala Ala Leu
305                 310                 315                 320
Ala Val Arg Ala Gly Val Asp Val Glu Leu Pro Thr Arg Asp Val Tyr
                325                 330                 335
Gly Lys Pro Leu Ile Glu Ala Val Ala Arg Gly Leu Val Ser Pro Ala
            340                 345                 350
Glu Ile Asp Glu Leu Val Arg Arg Val Leu Thr Trp Lys Phe Arg Leu
        355                 360                 365
Gly Leu Phe Asp His Pro Phe Val Asp Glu Gly Ala Ala Ile Ala Val
    370                 375                 380
Phe Asp Asn Ala Glu Gln Arg Gln Val Ala Arg Glu Ala Ala Glu Lys
385                 390                 395                 400
Ser Met Val Leu Leu Lys Asn Asp Gly Leu Leu Pro Leu Ala Pro Arg
                405                 410                 415
Gly Thr Ile Ala Val Ile Gly Pro Asn Ala His Thr Thr Arg Asn Leu
            420                 425                 430
Val Gly Asp Tyr Ala Tyr Pro Cys His Ile Glu Ser Leu Leu Glu Gln
        435                 440                 445
Ser Glu Asp Asn Val Phe Gln Thr Pro Leu Pro Ser Gly Val Lys His
    450                 455                 460
Val Asp Glu Phe Ile Leu Met Arg Thr Ile Leu Glu Ala Ile Arg His
465                 470                 475                 480
Arg Val Gly Ser Glu Ala Gln Val Val Tyr Ala Lys Gly Cys Asp Ile
                485                 490                 495
Leu Gly Gly Glu Asp Ala Glu Leu Glu Glu Ala Val Ala Leu Ala Ala
            500                 505                 510
Lys Ala Asp Val Ala Val Val Val Val Gly Asp Arg Ala Gly Leu Thr
        515                 520                 525
Asp Ala Cys Thr Thr Gly Glu Ser Arg Asp Arg Ala Thr Leu Ser Leu
    530                 535                 540
Ile Gly Arg Gln Glu Glu Leu Val Arg Arg Val Ile Ala Thr Gly Thr
545                 550                 555                 560
Lys Thr Val Val Val Leu Val Ser Gly Arg Pro Leu Ala Ile Pro Asp
                565                 570                 575
Ile Ala Glu Arg Ala Asn Ala Val Leu Glu Ala Trp Leu Pro Gly Glu
            580                 585                 590
Glu Gly Ala Glu Ala Val Ala Ala Val Leu Phe Gly Asp Val Asn Pro
        595                 600                 605
Ser Gly Lys Leu Pro Ile ThrIle Pro Arg Ser Val Gly Gln Val Pro
    610                 615                 620
Ile Tyr Tyr Gly His Lys Pro Ser Gly Gly Arg Ser His Trp Lys Gly
625                 630                 635                 640
Ala Tyr Val Asp Glu Ser Asn Leu Pro Leu Tyr Pro Phe Gly His Gly
                645                 650                 655
Leu Ser Tyr Thr Ala Phe Ala Tyr Arg Asp Leu Ala Leu Ser Pro Ser
            660                 665                 670
Val Leu Gly Val His Gly Glu Val Glu Val Ser Cys Val Ile Glu Asn
        675                 680                 685
Val Gly Ala Arg Ala Gly Glu Glu Val Val Gln Leu Tyr Ala Arg Asp
    690                 695                 700
Val Ala Ala Asp Val Thr Arg Pro Val Lys Ala Leu Cys Gly Phe Ala
705                 710                 715                 720
Arg Val Ala Leu Ala Pro Gly Glu Lys Ala Arg Val Arg Phe Arg Val
                725                 730                 735
Ser Ala His Gln Phe Gly Phe Tyr Asn Arg Glu Met Arg Tyr Val Val
            740                 745                 750
Glu Pro Gly Glu Ile Glu Phe Met Val Gly Ala Ser Ser Glu Asp Ile
        755                 760                 765
Arg Leu Arg Gly Ala Val Arg Met Asp Gly Ala Val Thr Glu Ile Glu
    770                 775                 780
His Glu Lys Val Tyr Gln Ser Ala Val Asp Val Glu Arg Met
785                 790                 795

Claims (14)

1.一种分离的或纯化的核酸序列,包括编码一种多肽的核酸序列,所述多肽对SEQ ID No.2的多肽具有至少90%的序列同一性。
2.如权利要求1所述的分离的或纯化的核酸序列,其中所述多肽在等于或低于大约pH 5.5时展示出酶活性。
3.如权利要求1所述的分离的或纯化的核酸序列,其中所述多肽在等于或高于大约50摄氏度的温度展示出酶活性。
4.如权利要求1所述的分离的或纯化的核酸序列,其中所述核酸序列存在于载体中。
5.一种分离的或纯化的多肽,包括对SEQ ID No.2的多肽具有至少90%的序列同一性的多肽。
6.如权利要求5所述的分离的或纯化的多肽,其中所述多肽在等于或低于大约pH 5.5时展示出酶活性。
7.如权利要求5所述的分离的或纯化的多肽,其中所述多肽在等于或高于大约50摄氏度的温度展示出酶活性。
8.如权利要求5所述的分离的或纯化的多肽,其中所述多肽是糖基化的、聚乙二醇化的、或其他方式的翻译后修饰的。
9.如权利要求5所述的分离的或纯化的多肽,其中所述多肽展示出β-木糖苷酶活性。
10.一种至少部分地降解木三糖或者木二糖的方法,所述方法包括:
将对选自由SEQ ID No.2所组成的组的多肽具有至少90%序列同一性的分离的或纯化的多肽放在与木三糖或木二糖的液体接触中。
11.根据权利要求10所述的方法,其中将对选自由SEQ ID No.2所组成的组的多肽具有至少90%序列同一性的分离的或纯化的多肽放在与木三糖或木二糖的液体接触中是在等于或低于大约pH 5.5时进行的。
12.根据权利要求10所述的方法,其中将对选自由SEQ ID No.2所组成的组的多肽具有至少90%序列同一性的分离的或纯化的多肽放在与木三糖或木二糖的液体接触中是在等于或高于50摄氏度的温度进行的。
13.根据权利要求10所述的方法,其中所述多肽是糖基化的、聚乙二醇化的、或其他方式的翻译后修饰的。
14.根据权利要求10所述的方法,其中所述多肽展示出β-木糖苷酶活性。
CN2009801014047A 2008-01-25 2009-01-23 耐热和耐酸的β-木糖苷酶、编码基因、相关生物和方法 Pending CN101896602A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US2363908P 2008-01-25 2008-01-25
US61/023,639 2008-01-25
PCT/US2009/000442 WO2009094187A1 (en) 2008-01-25 2009-01-23 Thermal and acid tolerant beta-xylosidases, genes encoding, related organisms, and methods

Publications (1)

Publication Number Publication Date
CN101896602A true CN101896602A (zh) 2010-11-24

Family

ID=40901387

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801014047A Pending CN101896602A (zh) 2008-01-25 2009-01-23 耐热和耐酸的β-木糖苷酶、编码基因、相关生物和方法

Country Status (10)

Country Link
US (2) US7923234B2 (zh)
EP (1) EP2242841A4 (zh)
JP (1) JP2011523346A (zh)
CN (1) CN101896602A (zh)
AU (1) AU2009206670A1 (zh)
BR (1) BRPI0906066A2 (zh)
CA (1) CA2708279A1 (zh)
MX (1) MX292528B (zh)
NZ (1) NZ585947A (zh)
WO (1) WO2009094187A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102321647A (zh) * 2011-09-08 2012-01-18 杭州师范大学 一种β-葡萄糖苷酶、编码基因、载体、工程菌及其应用
WO2013075644A1 (en) * 2011-11-22 2013-05-30 Novozymes, Inc. Polypeptides having beta-xylosidase activity and polynucleotides encoding same

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8969033B2 (en) 2005-11-02 2015-03-03 Battelle Energy Alliance, Llc Alteration and modulation of protein activity by varying post-translational modification
WO2009094187A1 (en) * 2008-01-25 2009-07-30 Battelle Energy Alliance, Llc Thermal and acid tolerant beta-xylosidases, genes encoding, related organisms, and methods
US7960534B2 (en) 2008-02-26 2011-06-14 Battelle Energy Alliance, Llc Thermophilic and thermoacidophilic sugar transporter genes and enzymes from alicyclobacillus acidocaldarius and related organisms, methods
US9732330B2 (en) 2008-01-25 2017-08-15 Battelle Energy Alliance, Llc Methods of combined bioprocessing and related microorganisms, thermophilic and/or acidophilic enzymes, and nucleic acids encoding said enzymes
US8492114B2 (en) 2008-01-25 2013-07-23 Battelle Energy Alliance, Llc Methods of combined bioprocessing and related microorganisms, thermophilic and/or acidophilic enzymes, and nucleic acids encoding said enzymes
JP2011510657A (ja) 2008-01-31 2011-04-07 バテル エナジー アライアンス,エルエルシー アリサイクロバチルス・アシドカルダリウスおよび関連生物体に由来する好熱性および好熱好酸性バイオポリマー分解遺伝子および酵素、方法
US8497110B2 (en) 2008-01-31 2013-07-30 Battelle Energy Alliance, Llc Thermophilic and thermoacidophilic biopolymer-degrading genes and enzymes from alicyclobacillus acidocaldarius and related organisms, methods
US8426185B2 (en) * 2008-01-31 2013-04-23 Battelle Energy Alliance, Llc Thermophilic and thermoacidophilic biopolymer-degrading genes and enzymes from Alicyclobacillus acidocaldarius and related organisms, methods
US8557557B2 (en) * 2008-01-31 2013-10-15 Battelle Energy Alliance, Llc Thermophilic and thermoacidophilic biopolymer-degrading genes and enzymes from Alicyclobacillus acidocaldarius and related organisms, methods
MX2010008575A (es) 2008-02-22 2010-12-07 Battelle Energy Alliance Llc Control transcripcional en alicyclobacillus acidocaldarius y genes, proteinas y metodos asociados.
WO2010051049A2 (en) 2008-02-27 2010-05-06 Battelle Energy Alliance, Llc Thermophilic and thermoacidophilic glycosylation genes and enzymes from alicyclobacillus acidocaldarius and related organisms, methods
JP2011512819A (ja) 2008-02-28 2011-04-28 バテル エナジー アライアンス,エルエルシー アリサイクロバチルス・アシドカルダリウスおよび関連生物体由来の好熱性および好熱好酸性バイオポリマー分解遺伝子および酵素、方法
US20110275135A1 (en) 2010-05-05 2011-11-10 Battelle Energy Alliance, Llc Genetic elements, proteins, and associated methods including application of additional genetic information to gram (+) thermoacidophiles
DE102010042910A1 (de) * 2010-10-26 2012-04-26 Süd-Chemie AG Temperaturstabile ß-Pyranosidase
US10066237B2 (en) 2011-11-22 2018-09-04 Novozymes Inc. Polypeptides having beta-xylosidase activity and polynucleotides encoding same
CN104145016B (zh) * 2011-11-22 2018-08-21 诺维信股份有限公司 具有β-木糖苷酶活性的多肽和编码该多肽的多核苷酸
JP6350987B2 (ja) * 2014-08-04 2018-07-04 本田技研工業株式会社 GHファミリー3に属する耐熱性β―キシロシダーゼ
JP6364662B2 (ja) * 2014-09-17 2018-08-01 本田技研工業株式会社 GHファミリー3に属する耐熱性β―キシロシダーゼ
JP6319907B2 (ja) * 2014-12-12 2018-05-09 本田技研工業株式会社 耐熱性β―キシロシダーゼ

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2422956A1 (fr) * 1978-04-13 1979-11-09 Pasteur Institut Procede de detection et de caracterisation d'un acide nucleique ou d'une sequence de celui-ci, et reactif enzymatique pour la mise en oeuvre de ce procede
FR2480779B2 (fr) 1979-08-30 1986-07-18 Anvar Vecteur contenant une sequence nucleotidique de l'antigene de surface du virus de l'hepatite b et procede de fabrication d'une molecule immunogene mettant en oeuvre ce vecteur
US4237226A (en) * 1979-02-23 1980-12-02 Trustees Of Dartmouth College Process for pretreating cellulosic substrates and for producing sugar therefrom
FR2518755B1 (fr) * 1981-12-23 1986-04-11 Pasteur Institut Sonde contenant un acide nucleique modifie et reconnaissable par des anticorps specifiques et utilisation de cette sonde pour detecter et caracteriser une sequence d'adn homologue
US4624922A (en) * 1983-12-09 1986-11-25 Rikagaku Kenkyusho Plasmid, method for construction of the same, microorganism carrying the plasmid and method for cultivation of the microorganism
GB2279955B (en) * 1993-07-15 1998-02-18 Solvay Xylanase derived from a Bacillus species, expression vectors for such xylanase and other proteins, host organisms therefor and use thereof
CN1143387A (zh) * 1994-06-14 1997-02-19 吉斯特·布罗卡迪斯股份有限公司 热稳定性木聚糖酶
JP3435946B2 (ja) * 1994-12-21 2003-08-11 王子製紙株式会社 耐熱性キシラナーゼ
US5948667A (en) * 1996-11-13 1999-09-07 Her Majesty The Queen In Right Of Canada, As Represented By The Department Of Agriculture And Agri-Food Xylanase obtained from an anaerobic fungus
DE19717893A1 (de) 1997-04-28 1999-01-14 Max Planck Gesellschaft Monofunktionelle Glycosyltransferasen
US6268197B1 (en) * 1997-07-07 2001-07-31 Novozymes A/S Xyloglucan-specific alkaline xyloglucanase from bacillus
US5882905A (en) * 1997-08-01 1999-03-16 The United States Of America As Represented By The Secretary Of Agriculture Thermostable α-L-arabinofuranosidase from Aureobasidium pullulans
WO2001079461A2 (en) * 2000-04-14 2001-10-25 Novozymes A/S Polypeptides having haloperoxidase activity
AU781277B2 (en) * 2000-08-23 2005-05-12 Dsm Ip Assets B.V. Microbial production of L-ascorbic acid and D-erythorbic acid
US7226764B1 (en) * 2000-11-08 2007-06-05 The Board Of Trustees Operating Michigan State University Compositions and methods for the synthesis and subsequent modification of uridine-5′-diphosphosulfoquinovose (UDP-SQ)
US6833259B2 (en) * 2001-03-19 2004-12-21 Council Of Scientific And Industrial Research ‘Pseudomonas stutzeri’ strain and process for preparation of xylanase
US7799976B2 (en) * 2001-04-25 2010-09-21 Seminis Vegetable Seeds, Inc. Tomato plants that exhibit resistance to botrytis cinerea
US20040029129A1 (en) * 2001-10-25 2004-02-12 Liangsu Wang Identification of essential genes in microorganisms
US20030134395A1 (en) * 2001-12-19 2003-07-17 Shetty Jayarama K. Process for hydrolyzing starch without pH adjustment
AU2002306484A1 (en) 2002-02-13 2003-09-04 Dow Global Technologies Inc. Over-expression of extremozyme genes in pseudomonads and closely related bacteria
US7314974B2 (en) * 2002-02-21 2008-01-01 Monsanto Technology, Llc Expression of microbial proteins in plants for production of plants with improved properties
JP2005533525A (ja) * 2002-07-23 2005-11-10 ニオズ テクノロジーズ インコーポレイテッド 細菌グリコシルトランスフェラーゼを用いたオリゴ糖、糖脂質、及び糖タンパク質の合成
US20050112742A1 (en) * 2003-11-05 2005-05-26 Vicki Thompson High temperature and alkaline stable catalase
WO2005066339A2 (en) 2004-01-06 2005-07-21 Novozymes A/S Polypeptides of alicyclobacillus sp.
US20050147983A1 (en) * 2004-01-06 2005-07-07 Novozymes A/S Polypeptides of Alicyclobacillus sp.
US8309324B2 (en) * 2004-11-10 2012-11-13 University Of Rochester Promoters and proteins from Clostridium thermocellum and uses thereof
WO2006078821A2 (en) * 2005-01-21 2006-07-27 Invitrogen Corporation Products and processes for in vitro synthesis of biomolecules
WO2006117247A1 (en) 2005-05-02 2006-11-09 Genoplante-Valor Glycosyl hydrolase having both an alpha-l-arabinofuranosidase and a beta-d-xylosidase activity.
EP1948813A2 (en) * 2005-10-31 2008-07-30 The Trustees of Dartmouth College Thermophilic organisms for conversion of lignocellulosic biomass to ethanol
US7727755B2 (en) * 2005-11-02 2010-06-01 Battelle Energy Alliance, Llc Enzyme and methodology for the treatment of a biomass
US8969033B2 (en) * 2005-11-02 2015-03-03 Battelle Energy Alliance, Llc Alteration and modulation of protein activity by varying post-translational modification
US8492114B2 (en) * 2008-01-25 2013-07-23 Battelle Energy Alliance, Llc Methods of combined bioprocessing and related microorganisms, thermophilic and/or acidophilic enzymes, and nucleic acids encoding said enzymes
WO2009094187A1 (en) 2008-01-25 2009-07-30 Battelle Energy Alliance, Llc Thermal and acid tolerant beta-xylosidases, genes encoding, related organisms, and methods
US7960534B2 (en) * 2008-02-26 2011-06-14 Battelle Energy Alliance, Llc Thermophilic and thermoacidophilic sugar transporter genes and enzymes from alicyclobacillus acidocaldarius and related organisms, methods
JP2011510657A (ja) * 2008-01-31 2011-04-07 バテル エナジー アライアンス,エルエルシー アリサイクロバチルス・アシドカルダリウスおよび関連生物体に由来する好熱性および好熱好酸性バイオポリマー分解遺伝子および酵素、方法
MX2010008575A (es) * 2008-02-22 2010-12-07 Battelle Energy Alliance Llc Control transcripcional en alicyclobacillus acidocaldarius y genes, proteinas y metodos asociados.
WO2010051049A2 (en) * 2008-02-27 2010-05-06 Battelle Energy Alliance, Llc Thermophilic and thermoacidophilic glycosylation genes and enzymes from alicyclobacillus acidocaldarius and related organisms, methods
JP2011512819A (ja) * 2008-02-28 2011-04-28 バテル エナジー アライアンス,エルエルシー アリサイクロバチルス・アシドカルダリウスおよび関連生物体由来の好熱性および好熱好酸性バイオポリマー分解遺伝子および酵素、方法
US20110275135A1 (en) * 2010-05-05 2011-11-10 Battelle Energy Alliance, Llc Genetic elements, proteins, and associated methods including application of additional genetic information to gram (+) thermoacidophiles

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102321647A (zh) * 2011-09-08 2012-01-18 杭州师范大学 一种β-葡萄糖苷酶、编码基因、载体、工程菌及其应用
CN102321647B (zh) * 2011-09-08 2012-11-21 杭州师范大学 一种β-葡萄糖苷酶、编码基因、载体、工程菌及其应用
WO2013075644A1 (en) * 2011-11-22 2013-05-30 Novozymes, Inc. Polypeptides having beta-xylosidase activity and polynucleotides encoding same

Also Published As

Publication number Publication date
CA2708279A1 (en) 2009-07-30
AU2009206670A1 (en) 2009-07-30
WO2009094187A1 (en) 2009-07-30
BRPI0906066A2 (pt) 2015-08-18
MX292528B (es) 2011-11-22
US20090226978A1 (en) 2009-09-10
US7923234B2 (en) 2011-04-12
NZ585947A (en) 2012-01-12
MX2010007123A (es) 2010-11-05
EP2242841A4 (en) 2011-05-18
US20100311110A1 (en) 2010-12-09
US8431379B2 (en) 2013-04-30
JP2011523346A (ja) 2011-08-11
EP2242841A1 (en) 2010-10-27

Similar Documents

Publication Publication Date Title
CN101896602A (zh) 耐热和耐酸的β-木糖苷酶、编码基因、相关生物和方法
US7858353B2 (en) Thermophilic and thermoacidophilic biopolymer-degrading genes and enzymes from alicyclobacillus acidocaldarius and related organisms, methods
US9388398B2 (en) Alteration and modulation of protein activity by varying post-translational modification
US10597690B2 (en) Thermophilic and thermoacidophilic biopolymer-degrading genes and enzymes from Alicyclobacillus acidocaldarius and related organisms, methods
JP6357702B2 (ja) 耐熱性セロビオハイドロラーゼ及びそのアミノ酸置換変異体
US8426185B2 (en) Thermophilic and thermoacidophilic biopolymer-degrading genes and enzymes from Alicyclobacillus acidocaldarius and related organisms, methods
WO2010099394A9 (en) Alteration and modulation of protein activity by varying post-translational modification
US9862981B2 (en) Thermophilic acetylxylan esterase genes and enzymes from alicyclobacillus acidocaldarius and related organisms and methods
US8557557B2 (en) Thermophilic and thermoacidophilic biopolymer-degrading genes and enzymes from Alicyclobacillus acidocaldarius and related organisms, methods

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20101124