CN1539017A - 皂草苷分解酶及其基因以及大豆皂草精醇b的大量生产系统 - Google Patents

皂草苷分解酶及其基因以及大豆皂草精醇b的大量生产系统 Download PDF

Info

Publication number
CN1539017A
CN1539017A CNA028153634A CN02815363A CN1539017A CN 1539017 A CN1539017 A CN 1539017A CN A028153634 A CNA028153634 A CN A028153634A CN 02815363 A CN02815363 A CN 02815363A CN 1539017 A CN1539017 A CN 1539017A
Authority
CN
China
Prior art keywords
gly
pro
ser
thr
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA028153634A
Other languages
English (en)
Other versions
CN100439504C (zh
Inventor
�ɱ�ѧ
渡边学
御堂直树
田村隆由
隅田奈绪美
־
矢口贵志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meiji Seika Kaisha Ltd
Original Assignee
Meiji Seika Kaisha Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meiji Seika Kaisha Ltd filed Critical Meiji Seika Kaisha Ltd
Publication of CN1539017A publication Critical patent/CN1539017A/zh
Application granted granted Critical
Publication of CN100439504C publication Critical patent/CN100439504C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nutrition Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Soy Sauces And Products Related Thereto (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供具皂草苷分解活性的蛋白质,具体地说是可分解以大豆皂草精醇B为糖苷配基的苷、生产大豆皂草精醇B的蛋白质;编码该蛋白质的多核苷酸;以及可使用它们大量生产大豆皂草精醇B的方法。本发明的蛋白质涉及下述(a)、(b)或(c):(a)含有选自SEQ ID NO.2、4和6所示氨基酸序列的氨基酸序列的蛋白质;(b)含有与包含上述(a)的氨基酸序列的蛋白质具有至少50%同源性的氨基酸序列,且具皂草苷分解活性的蛋白质;或(c)含有上述(a)的氨基酸序列中缺失、置换、插入或添加1个或多个氨基酸残基的氨基酸序列,且具皂草苷分解活性的蛋白质。

Description

皂草苷分解酶及其基因以及大豆皂草精醇B的大量生产系统
技术领域
本发明涉及新型的皂草苷分解酶及其基因以及使用它们生产大豆皂草精醇B的新方法。
背景技术
大豆皂草精醇B(12-齐墩果烷-3,22,24-三醇)是豆科植物中含有的皂草苷类的糖苷配基之一,一直以来报道了它的各种生理活性。例如,报道了血小板凝集抑制作用、抗补体活性、预防和治疗胃炎、风湿病、全身性红斑狼疮等免疫疾病、自身免疫疾病或血栓病的作用(Chem.Pharm.Bull.:24,121-129,1976、Chem.Pharm.Bull.:30,2294-2297,1982、化学和生物21:224-232,1983、特开昭61-37749号)。还报道了对来自人结肠癌和人卵巢癌细胞增殖的抑制作用(特开昭61-37749号、特开平10-234396号)。
作为生产大豆皂草精醇B的方法,例如有将大豆种子中以苷状态含有的皂草苷类(大豆皂草苷I-V)的糖链进行化学水解的方法。但是这种方法因酸解的条件而产生很多副产物,效率不高。另外,已知大豆种子还含有以大豆皂草精醇A(大豆皂草苷A1-A6)和大豆皂草精醇E作为糖苷配基的皂草苷类。因此从大豆中获得大豆皂草精醇B时,容易夹杂大豆皂草精醇A和大豆皂草精醇E,从其中只纯化大豆皂草精醇B是很困难的。另外,大豆种子中含有的皂草苷的比例通常约为0.2%(药学杂志104,162-168,1984),由于太少,因此需要更有效的生产方法。
作为使用微生物生产大豆皂草精醇B的方法,例如已知使用链霉菌属(Streptomyces)(Chem.Pharm.Bull.:32,1287-1293,1984)和青霉属(Penicillium)(特开平10-234396号)的方法。但是使用这些微生物时,大豆皂草精醇B的生产性低、并不具实际应用性。
有报道指出:在使用曲霉属(Aspergillus)微生物产生的酶(葡糖醛酸糖苷酶)或含有该酶的培养物水解葡糖苷酸皂草苷类,生产以葡糖醛酸作为还原末端的酸性寡糖的方法中,作为副产物,可获得大豆皂草精醇B(特公平7-32714号)。但是,该方法是酸性寡糖的生产方法,该报道中只是定性地确定了大豆皂草精醇B。该报道中虽然明确了具有目标活性的酶的分子量,但并未阐明其氨基酸序列。
另一方面,本发明人调查了可有选择地水解以大豆皂草精醇B为糖苷配基的苷,高效生产大豆皂草精醇B的微生物,结果发现了属于新赤壳属(Neocosmospora)或正青霉属(Eupenicium)的丝状菌。发现:将属于新赤壳属或正青霉属的丝状菌在含有皂草苷类(以大豆皂草精醇B为糖苷配基的苷)的培养基中培养,大豆皂草精醇B在培养物中被高浓度生产、蓄积(参照国际公开WO01/81612号)。
这样的丝状真菌例如有新赤壳属的侵菅新赤壳侵菅变种PF1225菌株(Neocosmospora vasinfecta var.vasinfecta PF1225)、正青霉属的Eupenicillium brefeldianum PF1226菌株(参照国际公开WO01/81612号)。
通过直接利用这些菌类,可以与培养基中添加的皂草苷类的量呈相关性地生产目标物质大豆皂草精醇B,但由于皂草苷类具表面活性作用,容易起泡,因此可添加到培养基中的皂草苷类的量受到限制。另外,可以预见添加了皂草苷类的培养物由于其表面活性作用而粘性增高。因此由该培养物生产目标物质时,为了提高回收率,需要多次重复提取操作。通常采用大豆提取物作为可有效地提供皂草苷类的天然资源,但该大豆提取物中除了皂草苷类以外,通常还含有例如油脂、蛋白质和多糖类等成分。因此,可添加到培养基中的皂草苷类的量最终与大豆提取物的纯度相关,高效的生产未必是件容易的事情。
作为不象传统的方法依赖大豆提取物中的皂草苷含量,却可有效地生成大豆皂草精醇B并保持高回收率的方法,需采取用皂草苷分解酶进行酶反应的大量生产大豆皂草精醇B的方法。
发明概要
本发明人成功地从具有皂草苷分解活性的微生物中分离纯化出具有皂草苷分解活性的蛋白质(以下称为“皂草苷分解酶”),并鉴别了编码该蛋白质的基因。本发明人还使用得到的基因,使其在不同的宿主中表达,获得了高活性的皂草苷分解酶。并进一步使用该获得的皂草苷分解酶进行酶反应,高效地生产了大豆皂草精醇B。本发明基于上述认识而完成。
本发明的目的在于:提供具有皂草苷分解活性的蛋白质,具体地说,是可分解以大豆皂草精醇B为糖苷配基的苷而生产大豆皂草精醇B的蛋白质;编码这样的蛋白质的多核苷酸;以及可使用它们大量生产大豆皂草精醇B的方法。
本发明的蛋白质选自下述各项:
(a)含有选自SEQ ID NO.2、4和6所示氨基酸序列的氨基酸序列的蛋白质;
(b)含有与包含上述(a)的氨基酸序列的蛋白质具有至少50%同源性的氨基酸序列,且具皂草苷分解活性的蛋白质;或
(c)含有上述(a)的氨基酸序列中缺失、置换、插入或添加1个或多个氨基酸残基的氨基酸序列,且具皂草苷分解活性的蛋白质。
本发明的多核苷酸选自下述各项:
(i)由选自SEQ ID NO.1、3和5所示碱基序列的碱基序列构成的多核苷酸;
(ii)由与上述(i)的碱基序列构成的多核苷酸具有至少70%同源性的碱基序列构成,且编码具皂草苷分解活性的蛋白质的多核苷酸;
(iii)由上述(i)的碱基序列中缺失、置换、插入或添加1个或多个碱基的碱基序列构成,且编码具皂草苷分解活性的蛋白质的多核苷酸;和
(iv)与上述(i)的碱基序列构成的多核苷酸在严格条件下杂交,且编码具皂草苷分解活性的蛋白质的多核苷酸。
本发明的重组载体中包含本发明的多核苷酸。
本发明的宿主是由上述重组载体转化的宿主。
本发明的目标蛋白质的生产方法包括:培养上述转化宿主,从得到的培养物中收集具皂草苷分解活性的蛋白质。
根据本发明,可获得高活性的皂草苷分解酶。另外,使用该酶可以大量且高效地从皂草苷获得大豆皂草精醇B。根据该方法,可以不依赖于例如大豆提取物中的皂草苷含量而获得大豆皂草精醇B。
附图简述
图1表示质粒pCB-SBe的结构和限制性酶切图。
图2表示实施例5的重组皂草苷分解酶的最适pH结果。图中,野生型SDN是指来自侵菅新赤壳侵菅变种PF1225菌株的皂草苷分解酶,重组型SDN是指重组皂草苷分解酶。
图3表示实施例5的重组皂草苷分解酶的最适温度的结果。图中,野生型SDN是指来自侵菅新赤壳侵菅变种PF1225菌株的皂草苷分解酶,重组型SDN是指重组皂草苷分解酶。
图4表示质粒pCB-SDAe的结构和限制性酶切图。
图5表示实施例8的重组皂草苷分解酶的最适pH的结果。图中,野生型SDA是指来自曲霉属种名待定PF1224菌株(Aspergillus sp.PF1224)的皂草苷分解酶,重组型SDA是指重组皂草苷分解酶。
图6表示实施例8的重组皂草苷分解酶的最适温度的结果。图中,野生型SDA是指来自曲霉属种名待定PF1224菌株的皂草苷分解酶,重组型SDA是指重组皂草苷分解酶。
图7表示质粒pCB-SDEs的结构和限制性酶切图。
图8表示实施例12的重组皂草苷分解酶的最适pH的结果。图中,野生型SDE是指来自Eupenicillium brefeldianum PF1226的皂草苷分解酶,重组型SDE是指重组皂草苷分解酶。
图9表示实施例12的重组皂草苷分解酶的最适温度的结果。图中,野生型SDE是指来自Eupenicillium brefeldianum PF1226的皂草苷分解酶,重组型SDE是指重组皂草苷分解酶。
图10表示比较SDN、SDA和SDE的同源性的结果。
发明详述
微生物保藏
侵菅新赤壳侵菅变种PF1225菌株于2000年3月13日(原保藏日)保藏在独立行政法人产业技术综合研究所特许生物寄托中心(305-5466日本国茨城县筑波市东1丁目1番地1中央第6)。保藏号为FERMBP-7475。
Eupenicillium brefeldianum PF1226于2000年3月13日(原保藏日)保藏在独立行政法人产业技术综合研究所特许生物寄托中心(305-5466日本国茨城县筑波市东1丁目1番地1中央第6)。保藏号为FERMBP-7476。
曲霉属种名待定PF1224菌株于2000年5月24日保藏在独立行政法人产业技术综合研究所特许生物寄托中心(305-5466日本国茨城县筑波市东1丁目1番地1中央第6)。保藏号为FERM BP-8004。
绿色木霉MC300-1菌株(Trichoderma viride MC300-1)于1996年9月9日(原保藏日)保藏在独立行政法人产业技术综合研究所特许生物寄托中心(305-5466日本国茨城县筑波市东1丁目1番地1中央第6)。保藏号为FERM BP-6047。
具皂草苷分解活性的蛋白质
从侵菅新赤壳侵菅变种PF1225菌株(FERM BP-7475)中分离、纯化的皂草苷分解酶与迄今已知的任何一种皂草苷分解酶都不具有同源性,与来自分解葡糖苷酸皂草苷类的曲霉属微生物产生的葡糖醛酸糖苷酶(由特公平7-32714号记载的分子量35,000和45,000的亚基构成的约158,000的糖蛋白)的亚基结构和分子量不同,因而可确认其为新型的酶系。
进一步对本发明的蛋白质和上述公报公开的葡糖醛酸糖苷酶的同一性和相似性进行了研究。由于难以获得该公报记载的曲霉属微生物,使用其他曲霉属微生物进行了研究。通过下述微生物学性状鉴定所使用的曲霉属种名待定PF1224菌株为半知菌纲曲霉属(DeuteromycetesAspergillus)的丝状菌。
(1)菌落特性
在Czapek酵母提取物琼脂培养基上生长良好,在25℃下培养7天,菌落直径达到80mm。呈黄色~黄绿色、羊毛状菌落,大量形成分生孢子、菌核。背面呈淡褐色。在麦芽汁琼脂培养基上生长良好,在25℃下培养7天,菌落直径达到80mm。呈黄色~黄绿色、羊毛状菌落,大量形成分生孢子、菌核。背面呈土黄色。在37℃下培养时,其生长在两种培养基上都稍受抑制。
(2)形态学特性
分生孢子头呈黄色~黄绿色、放射状~近圆柱形状。分生孢子梗表面粗糙、无色,泡囊为棒形~近球形,几乎全部形成曲霉。曲霉为单列、双列混杂,通常为双列。梗基8~12×4~5μm,瓶梗为8~12×3~4μm。分生孢子呈球形~近球形、表面光滑,为4~6μm。
使用曲霉属种名待定PF1224菌株鉴定被称为葡糖醛酸糖苷酶的酶时,本发明人发现从曲霉属种名待定PF1224菌株分离、纯化的皂草苷分解酶的分子量为90kDa、最适pH5-6、最适温度为45-50℃(参照参考例)。
还鉴定了从Eupenicillium brefeldianum PF1226分离、纯化的皂草苷分解酶的分子量为90kDa、最适pH5-6、最适温度为45-50℃。
上述公报中未公开葡糖醛酸糖苷酶的氨基酸序列等信息,无法比较氨基酸序列的同源性,因此,由蛋白质的分子量和亚基结构进行了比较判断。结果表明:本发明的蛋白质是与上述公报记载的葡糖醛酸糖苷酶不同的蛋白质。
如上所述,根据本发明,可提供选自下述的蛋白质。
(a)含有选自SEQ ID NO.2、4和6所示氨基酸序列的氨基酸序列的蛋白质;
(b)含有与包含上述(a)的氨基酸序列的蛋白质具有至少50%同源性的氨基酸序列,且具皂草苷分解活性的蛋白质;或
(c)含有上述(a)的氨基酸序列中缺失、置换、插入或添加1个或多个氨基酸残基的氨基酸序列,且具皂草苷分解活性的蛋白质。
即,本发明的蛋白质是含有与SEQ ID NO.2、4或6所示氨基酸序列同一或实质上同一的氨基酸序列而构成的蛋白质。
这里,与SEQ ID NO.2、4或6所示氨基酸序列实质上同一的氨基酸序列是指:与这些SEQ ID NO.所示的任一种氨基酸序列的同源性典型地为50%以上,优选70%以上,更优选80%以上,进一步优选90%以上,更进一步优选95%以上,最优选98%以上的氨基酸序列。
本说明书中所示的这些同源性的数值均是采用本领域技术人员公知的同源性搜索程序计算的数值,例如在FASTA、BLAST等中,通过使用缺省值(初始设定)的参数可以容易地计算。
例如同源性搜索程序Genetyx(Genetyx公司出品)中,使用缺省值的参数计算的同源性的数值分别为:
SDN和SDA之间的同源性为51%,
SDA和SDE之间的同源性为52%,
SDE和SDN之间的同源性为51%。
含有与SEQ ID NO.2、4或6所示氨基酸序列实质上同一的氨基酸序列而构成的蛋白质是指:包含在任何这些氨基酸序列中缺失、置换、插入或添加1个或多个氨基酸残基的氨基酸序列、且具有皂草苷分解活性的蛋白质。
这里,可缺失、置换、插入或添加的氨基酸残基的数量优选为1-50个、更优选1-30个、进一步优选1-10个、更进一步优选1-5个、最优选1-2个。
本发明的一个更优选的实施方案中,上述(b)的蛋白质是由在上述氨基酸序列(a)中的1个或多个氨基酸残基被保守性置换的氨基酸序列构成、且具有皂草苷分解活性的蛋白质。
这里的“保守性置换”是指:不实质性地改变蛋白质的活性,将1个或多个氨基酸残基用其它的化学性质相似的氨基酸残基置换。例如有某个疏水性残基被其它疏水性残基置换的情况、某个极性残基被具有相同电荷的其它极性残基置换的情况等。可以进行这种保守性置换的功能相似的各种氨基酸都是本领域公知的。例举具体的例子,非极性(疏水性)氨基酸有丙氨酸、缬氨酸、异亮氨酸、亮氨酸、脯氨酸、色氨酸、苯丙氨酸、甲硫氨酸等。极性(中性)氨基酸有甘氨酸、丝氨酸、苏氨酸、酪氨酸、谷氨酰胺、天冬酰胺、半胱氨酸等。带正电荷(碱性)的氨基酸有精氨酸、组氨酸、赖氨酸等。另外,带负电荷(酸性)的氨基酸有天冬氨酸、谷氨酸等。
本发明中,“具有皂草苷分解活性的蛋白质”是指可分解皂草苷的活性得到本领域人员证实的蛋白质,例如是指在与实施例5同样的条件下测定时,其皂草苷分解活性得到证实的蛋白质。该蛋白质可从后述的“具皂草苷分解活性的生物”中分离、纯化。
本发明的蛋白质例如可如下获得。
培养具有皂草苷分解活性的生物,以皂草苷分解活性为指标,从该培养液中分离、纯化具有皂草苷分解活性的蛋白质。对得到的纯化蛋白质的氨基酸序列进行分析,合成编码该氨基酸序列的寡核苷酸,以该生物的DNA为模板进行PCR(聚合酶链反应),合成长链探针。使用该探针,通过反向PCR或RACE(cDNA末端快速扩增)法分析皂草苷分解酶基因的翻译区的DNA序列。将这样得到的皂草苷分解酶的翻译区连接到在用于表达的宿主内发挥功能的调节序列上,获得表达载体。使用该表达载体转化该宿主,通过培养该转化体,可获得皂草苷分解酶。
这里,“具有皂草苷分解活性的生物”只要是具有皂草苷分解活性的生物即可,并无特别限定,包括微生物、植物等。这样的微生物例如包括新赤壳属、曲霉属或正青霉属的丝状菌。已知这些微生物在酱和酱油的酿造中使用,具有皂草苷分解活性。放线菌和杆菌等中也存在具皂草苷分解活性的微生物,因此可以认为所述微生物中也包括这样的生物。作为所述植物,例如预测豆科植物的皂草苷类的糖转移酶中存在催化可逆反应的物质,因此也包括这样的植物体、植物细胞、来源于这样的植物的愈伤组织或培养细胞。
根据本发明的另一个优选实施方案,本发明的蛋白质或多核苷酸来自微生物,更优选来自丝状菌微生物。这样的丝状菌微生物优选为属于新赤壳属、曲霉属或正青霉属的丝状菌。
这里,新赤壳属的丝状菌例如有侵菅新赤壳侵菅变种PF1225菌株(保藏号FERM BP-7475)或其突变菌株。曲霉属的丝状菌例如有曲霉属种名待定PF1224菌株(保藏号FERM BP-8004)或其突变菌株。正青霉属的丝状菌例如有Eupenicillium brefeldianum PF1226(保藏号FERMBP-7476)或其突变菌株。
多核苷酸
根据本发明,提供编码本发明蛋白质的多核苷酸。
本发明的典型的多核苷酸选自上述(i)~(iv)。
即,根据本发明的一个实施方案,多核苷酸由选自SEQ ID NO.1、3和5所示碱基序列的碱基序列构成。
根据本发明的另一实施方案,多核苷酸由与SEQ ID NO.1、3或5所示碱基序列构成的多核苷酸具有至少70%同源性的碱基序列构成、且编码具有皂草苷分解活性的蛋白质。与由SEQ ID NO.1、3或5所示碱基序列构成的多核苷酸的同源性优选80%以上,更优选90%以上,进一步优选95%以上,最优选98%以上。
本说明书中所示的同源性的数值均可采用本领域技术人员公知的同源性搜索程序计算的数值,例如在FASTA、BLAST等中,通过使用缺省值(初始设定)的参数可以容易地计算。
根据本发明的另一个实施方案,多核苷酸由SEQ ID NO.1、3或5所示碱基序列中缺失、置换、插入或添加1个或多个碱基的碱基序列构成,且编码具有皂草苷分解活性的蛋白质。
这里,可缺失、置换、插入或添加的碱基数量优选为1-50个、更优选1-30个、进一步优选1-10个、更进一步优选1-5个、最优选1-2个。
根据本发明又一个实施方案,多核苷酸与由SEQ ID NO.1、3或5所示碱基序列构成的多核苷酸在严格条件下杂交,且编码具有皂草苷分解活性的蛋白质。根据本发明,多核苷酸中也包括与上述编码具皂草苷分解活性的蛋白质的多核苷酸互补的多核苷酸。
这里,“严格条件”是指控制为下述条件:使包含编码部分或全部本发明蛋白质的氨基酸序列的碱基序列而构成的探针与编码同源体的基因杂交,另一方面,使所述探针不与具有特公平7-32714号记载的分子量的葡糖醛酸糖苷酶杂交。具体地说,例如有下述条件:使用编码标记的SEQ ID NO.1、3或5所示氨基酸序列的全长多核苷酸作为探针,按照ECL直接DNA/RNA标记检测系统(Amersham)的方法,首先进行1小时的预杂交(42℃),然后掺入上述探针,进行15小时的杂交(42℃),接着使用添加了0.4%SDS和6M尿素的0.5倍浓度SSC(SSC;15mM柠檬酸三钠、150mM氯化钠),在42℃下洗涤20分钟,重复2次,再用5倍浓度SSC在室温(约25℃)洗涤10分钟,洗涤2次。
重组载体
根据本发明,提供含有上述多核苷酸的重组载体。
本发明的重组载体的构建顺序和方法可以采用基因工程领域常用的手段。
本发明中可使用的表达载体有:整合到宿主染色体DNA的表达载体、使具有可自我复制的自主复制序列的载体以质粒状态在宿主细胞内存在的表达载体。例如pUC系列(pUC18或pUC118等)、pBluescript系列(pBluescriptII KS+等)和pBR322等质粒。存在于宿主细胞内的基因的拷贝数可以是1个或多个。
对于重组载体的调节序列,只要是在宿主中发挥功能的调节序列即可,没有特别限定,例如可以使用启动子和终止子等。这样的调节序列可以与编码具皂草苷分解活性的蛋白质的基因连接,并使基因表达。
与调节序列的连接例如可以按照常规方法,通过将编码目标蛋白质的基因(目标基因)的翻译区顺时方向插入启动子的下游来进行。此时,可以使目标基因与编码其它蛋白质的翻译区的外源基因连接,作为融合蛋白质表达。
表达的具皂草苷分解活性的蛋白质或具该活性的融合蛋白可以在用于表达的宿主细胞内产生,也可以使其分泌到培养基中。
例如,由DNA序列分析和N末端氨基酸序列分析可知:来自侵菅新赤壳侵菅变种PF1225菌株(FERM BP-7475)的皂草苷分解酶的N末端侧具有26个氨基酸残基的信号肽序列(参照实施例)。同样方法确定了来自曲霉属种名待定PF1224菌株的皂草苷分解酶和来自Eupenicillium brefeldianum PF1226的皂草苷分解酶的N末端侧分别具有28个氨基酸残基和17个氨基酸残基的信号肽序列。
因此,例如使用木霉属(Trichoderma)和曲霉属等的丝状菌作为宿主时,可以直接利用该序列中含有的信号序列,使其分泌到培养基中。
另外,由推定氨基酸组成得出的预测分子量68kDa以及在大肠杆菌(Escherichia coli)和绿色木霉(Trichoderma viride)菌株中表达的蛋白质的分子量约68kDa,可以推测分子量约77kDa的来自侵菅新赤壳侵菅变种PF1225菌株的皂草苷分解酶为糖蛋白。同样,由推定氨基酸组成得出的预测分子量68kDa,可以推测分子量约90kDa的来自曲霉属种名待定PF1224菌株的皂草苷分解酶和分子量约80kDa的在绿色木霉菌株中表达的蛋白质为糖蛋白。另外,由推定氨基酸组成得出的预测分子量65kDa,可以推测分子量约90kDa的来自Eupenicillium brefeldianumPF1226的皂草苷分解酶为糖蛋白。
预计这些糖链不会对活性表达产生大的影响,但有望在耐热性、最适pH的改变、保存稳定性等方面产生效果,也可以进行翻译后的修饰例如添加各种糖链等。
本发明的重组载体还可以连接抗药性基因和/或营养需求型互补基因等选择性标记基因来构建。
基因标志可以根据选择转化体的方法来适当选择。例如可使用编码抗药性的基因或与营养需求型互补的基因。抗药性基因例如有抗越霉素、苯菌灵、寡霉素、潮霉素、G418、满霉素、双丙氨膦(bia1aphos)、沙稻瘟菌素S、腐草霉素、膦丝菌素、氨苄青霉素、链霉素、卡那霉素等药物的基因。与营养需求型互补的基因例如有 amdSpyrGargBtrpCniaDTRP1LEU2URA3等基因。另外也可含有用于各种氨基酸合成系统、维生素合成系统、核酸合成系统等表达的宿主原有的营养需求型互补基因标志,或经各种突变处理使其具有营养需求型、与该营养需求型互补的基因标志。
转化体和目标蛋白质的生产
根据本发明,提供由上述重组载体转化的宿主。
可在本发明中使用的宿主只要是可正确地转录和翻译编码具皂草苷分解活性的蛋白质的基因的生物即可,并没有特别限定,例如有大肠杆菌和芽孢杆菌属(Bacillus spp.)等的细菌、放线菌、酵母、木霉属等的丝状菌或上述微生物的突变菌株。
用于基因表达的重组载体向宿主的导入可以按照常规方法进行。导入方法例如有电穿孔法、聚乙二醇法、农杆菌法、锂法或氯化钙法等,可选择对于宿主细胞来说效率较高的方法。
转化体(转化的宿主细胞)的培养可以按照常规方法,适当选择培养基、培养条件等来进行。
作为培养基的常用成分,例如碳源可以使用葡萄糖、蔗糖、纤维素、饴糖、糊精、淀粉、甘油、糖蜜、动植物油等。氮源可以使用大豆粉、麦胚、玉米浆、棉籽饼、肉浸汁、蛋白胨、酵母提取物、硫酸铵、硝酸钾、尿素等。其它可根据需要添加有效生成钠、钾、钙、镁、钴、氯、磷酸、硫酸和其它离子的无机盐类,例如氯化钾、硫酸镁、磷酸二氢钾、硫酸锌、硫酸锰、硫酸铜等。另外还可根据需要添加各种维生素、氨基酸、核苷酸等微量营养元素、抗生素等选择性药物。还可以适当添加帮助转化体生长、促进导入基因的表达的有机物和无机物。
培养可以在选择性地含有上述成分的培养基上进行。
作为培养方法,例如采用液体培养基时,有好气条件下的培养方法、振荡培养法、通气搅拌培养法或深层培养法。培养基的pH例如为pH 5-pH 8左右。通常条件下,培养温度例如为14℃-40℃,优选26℃-37℃。培养天数可在1天-25天左右的条件下进行。
本发明的目标蛋白质的生产方法中,可从转化细胞的培养物中获得目标基因表达产物—具皂草苷分解活性的蛋白质。可以按照常规方法从培养物中获得目标蛋白质,例如将从培养物中提取(研磨处理、加压破碎等)、回收(过滤、离心等)和/或纯化(盐析法、溶剂沉淀法等)等方法适当组合来进行。另外,在这些过程中,可以根据需要添加苯甲基磺酰氟(PMSF)、苯脒或亮抑蛋白酶肽等蛋白酶抑制剂。
根据本发明的一个实施例,可通过使编码具皂草苷分解活性的蛋白质的基因在生成皂草苷类的植物体例如大豆、四季豆、豇豆、豌豆、花生、蚕豆或苜蓿等中表达,形成含大豆皂草精醇B的植物体,由此直接获得大豆皂草精醇B。这种情况下,也可以使用肌动蛋白、遍在蛋白质、花椰菜花叶病毒35S启动子等或在种子等部位特异性表达的基因的调节序列。
将编码具皂草苷分解活性的蛋白质的基因正确地连接到上述调节序列上,再根据需要将双丙氨膦、卡那霉素或沙稻瘟菌素S等抗药性标志基因与其连接。可以通过基因枪法、PEG法、电穿孔法或微量注射法等直接导入方法或通过农杆菌的Ti质粒载体的间接导入法等将其导入植物细胞,制备转化植物细胞。向植物细胞或植物导入基因的方法例如可以按照Vaeck M.等人的方法(Nature:328,33-37,1987)实施。
可以通过本领域技术人员熟知的方法使上述转化的植物细胞进行再分化,获得具完整植物体的转化植物。还可以栽培该转化植物,收获该植物体和/或使编码具皂草苷分解活性的蛋白质的基因表达的器官例如种子等,采用适合其性状的方法例如溶剂提取法等,由其中获得大豆皂草精醇B。
大豆皂草精醇B的生产
根据本发明的一个实施方案,提供大豆皂草精醇B的生产方法,所述方法使用含有可由上述转化宿主得到的具皂草苷分解活性的蛋白质的培养物,分解以大豆皂草精醇B为糖苷配基的苷。
根据本发明的另一个实施方案,还提供大豆皂草精醇B的生产方法,所述方法使用选自上述蛋白质和可由上述转化宿主得到的蛋白质的至少一种蛋白质,分解以大豆皂草精醇B为糖苷配基的苷。
这里,“以大豆皂草精醇B为糖苷配基的苷”主要在豆科植物中含有,例如大豆皂草苷I、II、IV、V;小豆皂草苷II、V(azukisaponinII、V)、黄芪苷VIII、槐黄苷I(sophoaraflavoside I)等。
另外,作为含有以大豆皂草精醇B为糖苷配基的苷的物质,例如有用热水、醇或含水醇从大豆或脱脂大豆(豆饼)中提取的物质,更优选按照常规方法除去蛋白质、糖、脂糖等杂质的物质。
根据本发明,使含有具皂草苷分解活性的蛋白质的培养物、本发明的蛋白质或可由本发明的宿主获得的蛋白质与上述含有以大豆皂草精醇B为糖苷配基的苷的物质和/或所述苷作用,可获得大豆皂草精醇B。
作为具体例子,例如将皂草苷(小城制药)按照约1%-10%重量的比例溶解于水或缓冲液例如乙酸缓冲液或磷酸缓冲液等中,向其中添加皂草苷分解酶。使其在适当温度例如20℃-50℃下反应,将该反应液用乙酸乙酯等有机溶剂萃取,可获得大豆皂草精醇B。
实施例
以下通过实施例详述本发明,但本发明并不限定于此。
参考例1:曲霉属皂草苷分解酶的确认
将约1cm2曲霉属种名待定PF1224菌株(FERM BP-8004)的PDA斜面培养物接种于装有100ml TS培养基(2.0%可溶淀粉、1.0%葡萄糖、0.5%聚胨、0.6%麦胚、0.3%酵母提取液、0.2%豆饼和0.2%碳酸钙(灭菌前为pH 7.0))的500ml容量三角烧瓶中,在25℃振荡培养3天。将4ml所得培养物接种于加入了100ml MY培养基(4.0%麦芽汁、2.0%酵母提取物、0.2%磷酸二氢钾、0.2%硫酸铵、0.03%硫酸镁七水合物、0.03%氯化钙二水合物(pH7.0))和4.0%大豆皂草苷(小城制药)的500ml容量三角烧瓶中,振荡培养3天。
在以下的来自曲霉属的皂草苷分解酶的纯化中,以试验例1所示的皂草苷分解活性为指标。
取约800ml上述培养液,用玻璃滤器(G3)过滤后进行离心(8,000rpm、30分钟),除去菌体碎片。向约570ml该培养上清中加入294g硫酸铵,通过离心(8,000rpm、30分钟)回收产生的沉淀。将该沉淀溶解于约120ml缓冲液A(0.1M乙酸钠缓冲液、1M硫酸铵(pH 5.8)),进行ButylToyopearl 650S(26mm i.d.×330mm)(Tosoh Co.)的疏水层析。用从缓冲液B(0.1M磷酸钠缓冲液、1M硫酸铵(pH 5.8))到0.1M磷酸钠缓冲液(pH 5.8)的浓度梯度进行洗脱,回收未吸附流分和1M至0.5M浓度硫酸铵洗脱的流分。
用Pellicon XL(截留分子量10,000)(Millipore)浓缩回收的流分,然后向其中加入1M Tris-盐酸缓冲液和硫酸铵,使其浓度与缓冲液C(50mM Tris-盐酸缓冲液、1M硫酸铵(pH 7.5))浓度相同,进行6mlResource PHE(Am ersham Biosciences)的疏水层析。用从缓冲液C到50mM Tris-盐酸缓冲液(pH 7.5)的浓度梯度进行洗脱,回收未吸附流分。
用Ultrafree 15(截留分子量5,000)(Millipore)浓缩所得流分,进行Superdex 200 pg(16mm i.d.×600mm)(Amersham Biosciences)的凝胶过滤层析。用缓冲液D(25mM磷酸钠缓冲液、0.15M氯化钠(pH 5.8))进行洗脱,回收截留分子量约为90kDa的流分。
对该流分进行SDS-PAGE,结果观察到在分子量约为90kDa处的单一条带。
试验例1:皂草苷分解活性的测定
用PD-10柱(Amersham Biosciences)对含有目标酶的酶液进行脱盐,使其与等量的2%皂草苷溶液混合,在37℃下反应约16小时。将其用等量的乙酸乙酯萃取,将该萃取液通过TLC展开(所用溶剂系统为氯仿∶甲醇=95∶5)。利用香草醛-硫酸显色反应检测Rf值为0.35的大豆皂草精醇B,从而测定目标酶液的酶活性。
试验例2:皂草苷分解活性的定量分析
向50μl 2%皂草苷溶液中加入稀释的酶,定容为100μl,使其反应30分钟,接着用等量的乙酸乙酯萃取反应液,将其中的50μl用450μl流动相稀释。取其中的10μl进行下述条件的高效液相色谱,测定保留时间约为7.5分钟的峰的高度。将其与大豆皂草精醇B的可信样品的峰高比较,定量评价所述酶的皂草苷分解活性。
柱:Inertsil ODS-2、5μm(4.6i.d.×250mm)
柱温:40℃
流动相:乙腈∶甲醇∶水=50∶35∶15
流动相流速:0.8ml/min
实施例1:来自新赤壳属的皂草苷分解酶(SDN)的分离纯化
将约1cm2侵菅新赤壳侵菅变种PF1225菌株(FERM BP-7475)的PDA斜面培养物接种于装有100ml TS培养基的500ml容量三角烧瓶中,在25℃振荡培养3天。将4ml上述培养物接种于装有100ml MY培养基和4.0%大豆皂草苷(小城制药)的500ml容量三角烧瓶中,振荡培养3天。
在以下的来自新赤壳属的皂草苷分解酶的纯化中,以试验例1所示的皂草苷分解活性为指标。
将约800ml上述培养液用约2倍的水稀释,通过离心(8,000rpm、30分钟)除去菌体。向其中加入171g硫酸铵,离心(8,000rpm、30分钟)除去产生的沉淀。再向该上清中加入573g硫酸铵,离心(8,000rpm、30分钟)回收沉淀,将该沉淀溶解于70ml缓冲液C中。进行ButylToyopearl650S(26mm i.d.×110mm)(Tosoh Co.)的疏水层析。用从缓冲液C到50mM Tris-盐酸缓冲液(pH 7.5)的浓度梯度进行洗脱,回收未吸附流分。
向约500ml上述流分中加入约239g硫酸铵,离心回收得到的沉淀。接着将回收的沉淀溶解于4ml缓冲液B中,进行苯基琼脂糖FF(PhenylSepharose FF)(16mm i.d.×100mm)(Amersham Biosciences)的疏水层析。用从缓冲液B到0.1M磷酸钠缓冲液(pH 5.8)的浓度梯度进行洗脱,回收约0.4M浓度硫酸铵洗脱的流分。
接着将回收的流分进行Superdex 200pg(16mm i.d.×600mm)(Amersham Biosciences)的凝胶过滤层析。用缓冲液E(50mM Tris-盐酸缓冲液、0.15M氯化钠(pH 7.5))进行洗脱,回收截留分子量约为76,000的流分。
对该流分进行SDS-PAGE,结果观察到在分子量约为77kDa处的单一条带。
实施例2:皂草苷分解酶(SDN)的氨基酸序列分析
2a)N末端侧的氨基酸序列
将如实施例1制备的流分进行SDS-PAGE,转印至PVDF膜(Immobilon-PSQ)(Millipore),然后水洗风干。将其用蛋白质测序仪492型(Applied Biosystem)进行氨基酸序列分析。
分析得到的氨基酸序列如下所示。
N末端氨基酸序列:ASPPASVPNPSSEEITLQ(SEQ ID NO.7)
2b)内部氨基酸序列的分析(肽作图)
将实施例1中制备的流分进行SDS-PAGE,使用考马斯亮蓝R250进行蛋白质染色。将其中分子量约为77kDa染色的单一条带切下,用在50%乙腈中配制的0.2M碳酸氢铵缓冲液(pH 8.0)进行脱色,在室温下风干约2小时。
接着,将该凝胶条用含0.02%吐温20的0.2M碳酸氢铵缓冲液(pH8.0)浸泡,然后加入胰蛋白酶(Promega),在37℃下反应2天。回收反应后的上清,再用60%乙腈和0.1%三氟乙酸将凝胶条洗涤3次。将该洗涤液与反应上清合并,浓缩,通过Model172μ制备HPLC系统(AppliedBiosystems)(RP-300 Aquiapore C18、220×2.1mm、由0.1%三氟乙酸、35%乙腈到0.085%三氟乙酸、35%乙腈的浓度梯度),分离如下所示的5种肽。
Trp26.8 :LVFNPSPK             SEQ ID NO.8
Trp27.59:WNVAADGSGPSGEIR      SEQ ID NO.9
Trp32.07:VTILHNPEGVAPITAK     SEQ ID NO.10
Trp39.43:EHSDTIPWGVPYVPGSQ    SEQ ID NO.11
Trp41.3 :LTDYSFDWYSDIR        SEQ ID NO.12
实施例3:皂草苷分解酶(SDN)的克隆和序列分析
3a)PCR制备长链探针
由侵菅新赤壳侵菅变种PF1225菌株(FERM BP-7475)培养菌体中制备基因组DNA,用其作为PCR模板。
基因组DNA的分离按照Horiuchi等人的方法(J.Bacteriol.:170,272-278,1988)进行。首先,通过离心(7,500rpm、10分钟)回收在TS培养基上培养的菌体。将得到的菌体冷冻干燥,然后悬浮于TE(10mMTris-盐酸缓冲液、1mM EDTA(pH 8.0))中,在3%SDS溶液中、在60℃下处理30分钟。接着用TE饱和苯酚萃取,由此除去菌体碎片。
将萃取液用乙醇沉淀后,用核糖核酸酶A(Nippon Gene)和蛋白酶K(和光纯药)处理,再用12%的聚乙二醇6000使核酸沉淀。将沉淀用TE饱和苯酚萃取,用乙醇沉淀,将该沉淀物溶解于TE,以此作为基因组DNA。
根据实施例2中得到的肽序列,合成编码上述肽序列的如下所示的寡核苷酸,用其作为PCR引物。
引物N1:CCIGCITCNGTNCCNAA    SEQ ID NO.13
引物N2:CCIGCIAGYGTNCCNAA    SEQ ID NO.14
引物2A:CCRTCIGCNGCNACRTT    SEQ ID NO.15
引物3A:CCCCAIGGDATNGTRTC    SEQ ID NO.16
引物4A:ACICCYTCNGGRTTRTG    SEQ ID NO.17
使用TaKara Taq(宝酒造)进行PCR,在94℃下进行1分钟的热变性处理,然后将94℃30秒、45℃30秒和55℃3分钟的一系列步骤进行10个循环,接着将94℃30秒、47℃30秒和60℃3分钟的一系列步骤进行20个循环,扩增片段。结果,在引物N1和引物4A的组合中,特异性扩增了约0.8kb的片段。使用TOPO TA克隆试剂盒(Invitrogen)将其克隆进入pCR2.1-TOPO中(pCR2.1-2)。
使用dRhodamine Terminator cycle sequencing ready reaction(Applied Biosystems)和ABI PRISM 310基因分析仪(Applied Biosystems)进行DNA序列分析,解码克隆进入pCR2.1-2中的PCR产物,确定了SEQ ID NO.1所示序列中位置88至位置812的区得到扩增。
3b)DNA印迹分析和使用反向PCR进行的序列解码
DNA印迹分析中,对由EcoRI消化的基因组DNA进行琼脂糖凝胶电泳,转印到Hibond N+(Amersham Biosciences)。使用ECF随机引物标记和检测系统(Amersham Biosciences)进行杂交,使用分子成象仪FX(Biorad)检测条带。
使用实施例3的3a)中得到的PCR产物作为探针,检测出约2kb的条带。
接着,用EcoRI消化基因组DNA,回收约2kb的片段,使用DNA连接试剂盒ver.2(宝酒造)进行环化。以其作为模板,使用如下所示的反向PCR引物,通过LA Taq(宝酒造),在94℃进行1分钟热变性处理后,将94℃30秒、50℃30秒和72℃4分30秒的一系列步骤重复25个循环,扩增片段。使用TOPO TA克隆试剂盒(Invitrogen)克隆这里被扩增的约2kb的片段,并通过引物分析其序列。
反向PCR引物1:TGACGCTGATACCAACGGCG    SEQ ID NO.18
反向PCR引物2:CTAGTGGCAGTATTGGACAG    SEQ ID NO.19
3c)使用3’RACE法和5’RACE法确定翻译区
以cDNA为模板,使用3’RACE法和5’RACE法进行翻译区的确定。cDNA的制备如下进行。
与实施例1同样,将在TS培养基中培养的1ml侵菅新赤壳侵菅变种PF1225菌株(FERM BP-7475)的培养液接种于装有100ml含1%大豆皂草苷的MY培养基的500ml容量三角烧瓶中。将其在25℃下振荡培养32小时,然后用尼龙筛(50μm)过滤菌体,用液氮将过滤的菌体冷冻。使用研钵和研杵研磨冷冻菌体,由研磨的菌体中提取总RNA。使用ISOGEN(Nippon Gene),按照所附的方案进行总RNA的提取。使用Oligotex-dT30<Super>(Roche Diagnostics),按照所附的方案,由总RNA中纯化mRNA。
对于该mRNA,使用5’/3’RACE试剂盒(Roche Diagnostics),按照所附的方案进行5’RACE和3’RACE,扩增3’和5’区。此时,在3’RACE方法中,使用AmpriTaq Gold(Applied Biosystem)进行第一次PCR,使用PCR supermix high fidelity(Lifetech oriental Co.,Ltd)进行第二次PCR。在5’RACE方法中,均使用PCR supermix high fidelity (Lifetechoriental Co.,Ltd)进行第一次PCR和第二次PCR。
3’RACE和5’RACE的特异性引物序列如下所示。
用于第一次PCR的3’RACE特异性引物:CCCAGGCCTTTAAGGATGGC    SEQ ID NO.20
用于第二次PCR的3’RACE特异性引物:CTAGTGGCAGTATTGGACAG    SEQ ID NO.19
用于cDNA合成的5’RACE特异性引物: TGACGCTGATACCAACGGCG    SEQ ID NO.18
用于第一次PCR的5’RACE特异性引物:CTGCTTGAGGGTAATGGGCTC   SEQ ID NO.21
用于第二次PCR的5’RACE特异性引物:ACAGACGCCGGAGGAGAAGCG   SEQ ID NO.22
如上所述,确定了SEQ ID NO.1所示SDN基因的翻译区。这里,由实施例2a)的结果可知:从翻译起始位点的Met数起,SDN氨基酸序列的成熟蛋白质的N末端位于位置27。
通过比较基因组DNA和cDNA的碱基序列来确定翻译区中是否存在内含子。证实该翻译区中不存在内含子。
实施例4:皂草苷分解酶(SDN)在大肠杆菌中的表达
以实施例3中得到的cDNA为模板,使用如下所示的用于在大肠杆菌中表达的引物进行PCR。
使用PCR supermix high fidelity(Lifetech oriental Co.,Ltd),在94℃进行1分钟的热变性处理后,将94℃30秒、50℃30秒和72℃2分钟的一系列步骤进行25个循环,扩增SDN基因的翻译区。使用DNA连接试剂盒ver.2(宝酒造)使由限制酶 NdeI和 BamHI消化上述扩增产物的片段和用同样的限制酶消化的质粒pET15b(Novagen)连接。按照常规方法,用其转化大肠杆菌BL21(DE3)菌株,得到具有氨苄青霉素抗性的菌落。
用于在大肠杆菌中表达的N末端引物:GGGCATATGGCTTCTCCTCCTGCTTCTG      SEQ ID NO.23
用于在大肠杆菌中表达的C末端引物:GGGGGATCCTTAAGTGCCGCTCTGAGGACTACG SEQ ID NO.24
将得到的菌落用于以下的试验。
将由菌落中收集的菌体在装有50ml含有50μg/ml氨苄青霉素的LB培养基的250ml容量三角烧瓶中、在37℃下振荡培养过夜,再取其中的2ml接种于装有50ml含有50μg/ml氨苄青霉素的LB培养基的250ml容量三角烧瓶中,在37℃下振荡培养3小时。向其中加入异丙基-β-D-硫代半乳糖吡喃糖苷,使终浓度为0.4mM,再诱导培养3小时。
通过离心收集获得的培养菌体,使菌体在缓冲液F(50mM Tris-盐酸缓冲液、2mM EDTA(pH 8.0))中悬浮,然后再次通过离心回收菌体。将该菌体在-80℃冷冻,然后悬浮于5ml缓冲液F中,向其中添加溶菌酶和Triton X 100,使终浓度分别为100μg/ml和0.1%,将其在室温下静置20分钟。使用Sonifier 450(BRANSON),在冰冷却下,以50%的占空度(duty cycle)进行30秒的超声波处理,重复2次,使细胞破碎,通过离心除去菌体碎片。
将这样得到的菌体提取液作为粗酶液,按照试验例1进行皂草苷分解活性的测定。
结果,在TLC中,从皂草苷分解酶的翻译区被克隆的菌体提取液中只观察到分解产物大豆皂草精醇B的斑点。
实施例5:皂草苷分解酶(SDN)在绿色木霉中的表达
5a)用于转化的载体的构建
以实施例3得到的cDNA为模板,使用如下所示的用于在木霉属中表达的引物,与实施例4同样地进行PCR。
使用DNA连接试剂盒ver.2(宝酒造)使由限制酶 SmaI和 PstI消化所得PCR产物的片段和用 StuI和 PstI消化的质粒pCB1-M2(参照国际公开第WO98/11239号的实施例5)连接。将其用 XbaI消化、脱磷酸,然后使其与来自粗糙脉孢菌(Neurospora crassa)pyr4基因的 XbaI盒连接,构建质粒pCB-SBe(图1)。
用于在木霉属中表达的N末端引物:GGGCCCGGGGCGCATCATGCACTTCTTTGACAAAGCG
                               AC SEQ ID NO.25
用于在木霉属中表达的C末端引物:GGGCTGCAGTTAAGTGCCGCTCTGAGGACT
                               SEQ ID NO.26
Pyr4基因的 XbaI盒的构建方法如下所示。
首先,用 BglII消化pFB6(Biochem.Biophys.Res.Commun.:112,284-289,1983),然后用 HindIII进行部分消化,回收约1.9kb的片段。将其连接到用 BglII和 HindIII消化的pLITMUS28(New EnglandBiolabs)。接着,将其用 BglII消化,然后用DNA钝化试剂盒(宝酒造)产生平端,与磷酸化接头pXbaI(宝酒造)连接,构建了pyr4基因的 XbaI盒。
5b)来自绿色木霉的尿嘧啶需求型菌株的获得
将2支UV灯在30cm高度照射,一边将约1.0×109CFU/ml的绿色木霉MC300-1菌株孢子悬浮液缓慢混合,一边对该悬浮液照射UV。将其涂于选择性培养基上,在28℃培养7天,然后筛选生长菌株。
使用在基本培养基(0.2%磷酸二氢钾、0.4%硫酸铵、0.03%尿素、0.03%硫酸镁七水合物、0.03%氯化钙、0.5%葡萄糖、2.5%琼脂、0.01%痕量元素(5mg硫酸铁七水合物、1.56mg硫酸锰七水合物、1.4mg硫酸锌七水合物、2.0mg氯化钴溶解于1L水中形成))中添加了10μg/ml尿苷和1.0mg/ml 5-氟乳清酸的培养基作为选择性培养基。
5c)对绿色木霉的转化和对各重组体的皂草苷分解活性的检测
将实施例5的5b)中得到的尿嘧啶需求型绿色木霉菌株接种于装有50ml菌体形成培养基(1.0%酵母提取物、1.0%麦芽汁、2.0%聚胨、2.5%葡萄糖、0.1%磷酸氢二钾、0.05%硫酸镁七水合物(灭菌前pH 7.0))的200ml容量三角烧瓶中,在28℃下振荡培养2天。通过离心从得到的培养液中回收菌丝体。接着由该菌丝体制备原生质体,然后加入质粒pCB-SBe的DNA溶液,进行转化(参照国际公开第WO98/11239号的
实施例7)。
转化体再生时,使用在基本培养基中添加了0.5M蔗糖的培养基。再将生长的菌落移种于基本培养基上,将在此生长的菌落作为转化体。
将质粒pCB-SBe导入尿嘧啶需求型绿色木霉菌株,结果每1μgpCB-SBe获得了3个转化体。培养25株该转化体(参照国际公开第WO98/11239号的实施例1),将培养上清进行SDS-PAGE,只在转化体中观察到了显示分子量约为68kDa的条带。
使用该培养上清按照实施例1测定皂草苷的分解活性时,在TLC中观察到了分解产物大豆皂草精醇B的斑点。而在亲本菌株—尿嘧啶需求型绿色木霉菌株中未观察到该斑点。
5d)重组皂草苷分解酶(重组型SDN)的纯化、以及与来自侵菅新赤 壳侵菅变种PF1225菌株的皂草苷分解酶(野生型SDN)的活性比较
将实施例5的5c)中得到的约700ml培养液离心(8,000rpm、30分钟),除去菌体碎片。向约560ml该培养上清中加入64g硫酸铵,离心(8,000rpm、30分钟)除去沉淀。再向约600ml该上清中加入74g硫酸铵,离心回收沉淀。向得到的沉淀中加入100ml 0.05M Tris-盐酸缓冲液(pH 7.5)和16g硫酸铵,进行Butyl Toyopearl 650S(26mmi.d.×330mm)(Tosoh Co.)的疏水层析。用从缓冲液C到50mM Tris-盐酸缓冲液(pH 7.5)的浓度梯度进行洗脱,回收未吸附流分和由1M至0.6M浓度硫酸铵洗脱的流分。
用Millipore公司制造的Pellicon XL(截留分子量10,000)浓缩所得流分。然后向约8ml该浓缩液中加入1.3g硫酸铵和2ml 0.5M磷酸钠缓冲液(pH 5.8),进行6ml Resource PHE(Amersham Biosciences)的疏水层析。用从缓冲液B到0.1M磷酸钠缓冲液(pH 5.8)的浓度梯度进行洗脱,回收未吸附流分。
用Millipore公司制造的Ultrafree 15(截留分子量5,000)浓缩所得流分,将该浓缩液进行Superdex 200pg(16mm i.d.×600mm)(AmershamBiosciences)的凝胶过滤层析。用缓冲液G(50mM磷酸钠缓冲液、0.15M氯化钠(pH 7.0))进行洗脱,回收截留分子量约为68,000的流分。
对该流分进行SDS-PAGE,结果在分子量约68kDa处观察到单一条带。
如上所示,按照试验例2,对纯化的重组皂草苷分解酶(以下称为“重组型SDN”)和实施例1中纯化得到的皂草苷分解酶(以下称为“野生型SDN”)测定其最适pH和最适温度。
最适pH的测定中,首先向50μl 2%皂草苷溶液中加入20μl 0.5M各缓冲液(乙酸钠(pH4.5、pH5.0、pH5.8)、磷酸钠(pH5.0、pH5.8、pH7.0)、Tris-盐酸(pH7.0、pH8.0、pH9.0))和稀释的酶液,配制100μl的溶液。将其在37℃反应30分钟,然后定量生成的大豆皂草精醇B的量。
结果如图2所示。
最适温度的测定中,首先向50μl 2%皂草苷溶液中加入20μl 0.5M磷酸钠缓冲液(pH 5.8)和稀释的酶液,配制100μl的溶液。将其在规定的各温度下反应30分钟,然后定量纯化的大豆皂草精醇B的量。
结果如图3所示。
由这些结果可知:通过SDS-PAGE确认了分子量的差异,但在活性上未见有大的差异。
实施例6:来自曲霉属种名待定PF1224菌株的皂草苷分解酶(SDA)的 氨基酸序列分析
与实施例2的2b)同样,切下从曲霉属种名待定PF1224菌株(保藏号FERM BP-8004)中纯化的皂草苷分解酶(SDA)(参考例1)的约90kDa的条带,进行片段化。将其与实施例2的2b)同样地进行HPLC,分离如下所示的4种肽。
Trp23.67:LYNPDSPQPISAK            SEQ ID NO.27
Trp24.0 :LQFNPAPK                 SEQ ID NO.28
Trp38.05:VDWFSDLTSTGQVTGSK        SEQ ID NO.29
Trp24.5 :GEVSGSASVSIIHD           SEQ ID NO.30
实施例7:SDA基因的克隆和序列分析
7a)使用PCR制备长链探针
与实施例3同样,从如参考例1中培养的菌体中分离基因组DNA。
根据实施例6中得到的肽序列,合成编码该肽序列的如下所示的寡核苷酸,作为PCR引物。
引物23.67s1:TAYAAYCCIGAYTCNCC    SEQ ID NO.31
引物23.67s2:TAYAAYCCNGAYAGYCC    SEQ ID NO.32
引物24.0s:  CARTTYAAYCCIGCNCC    SEQ ID NO.33
引物24.0a:  GGIGCNGGRTTRAAYTG    SEQ ID NO.34
引物38.05a1:AARTCNGARAACCARTC    SEQ ID NO.35
引物38.05a2:AARTCRCTRAACCARTC    SEQ ID NO.36
与实施例3的3a)的方法同样地进行PCR。
结果,在上述引物中,引物24.0s和引物38.05a1的组合中,特异性地扩增了约1kb的片段,使用TOPO TA克隆试剂盒(Invitrogen)将其克隆进入pCR2.1-TOPO中(pSDAPCR1)。
序列分析的结果表明:克隆进入pSDAPCR1中的片段是SEQ IDNO.3所示序列中位置709到位置1748的区被扩增的片段。
7b)使用DNA印迹分析和大肠杆菌菌落文库进行筛选
DNA印迹分析中,将 BamHI、 EcoRI、 HindIII消化的基因组DNA在琼脂糖凝胶中进行电泳,将其转印到Hibond N+(AmershamBiosciences)。使用ECF随机引物标记和检测系统(Amersham Biosciences)进行杂交,使用分子成象仪FX(Biorad)检测条带。
使用上述7a)得到的PCR产物作为探针时,检测到约10kb的BamHI、约20kb的 EcoRI、约5kb的 HindIII片段的条带。
接着,用 HindIII消化基因组DNA,回收约4kb-6kb的片段。将其连接到 HindIII消化和脱磷酸处理的pUC18,使其转化大肠杆菌DH5α菌株。使该大肠杆菌在添加了氨苄青霉素的LB琼脂培养基中形成菌落,将得到的约1,000个菌落转印到Hibond N+(AmershamBiosciences)。这里,以上述7a)得到的PCR产物作为探针,用DIG Hi-prim DNA标记和检测试剂盒(Roche Diagnostics),获得了1种阳性克隆(pSDAHind5/18)。该克隆含有约5kb的 HindIII片段。
7c)使用3’RACE法和5’RACE法确定翻译区
与实施例3的3c)同样,从参考例1中制备的曲霉属种名待定PF1224菌株(保藏号FERM BP-8004)的培养菌体中提取总RNA,再使用mRNA快速预纯化试剂盒(QuickPrep mRNA Purification kit)(AmershamBiosciences),按照所附方案分离mRNA。
对于该mRNA,使用5’/3’RACE试剂盒(Roche Diagnostics),进行3’和5’区的扩增。另外,使用LA Taq(宝酒造)进行各个PCR。
3’RACE法和5’RACE特异性引物的序列如下所示。
用于第一次PCR的3’RACE特异性引物:CCTCGATACCCGAGGGACCG  SEQ ID NO.37
用于第二次PCR的3’RACE特异性引物:GATGGGTTGCATGTTATCGC  SEQ ID NO.38
用于cDNA合成的5’RACE特异性引物: GCGATAACATGCAACCCATC  SEQ ID NO.39
用于第一次PCR的5’RACE特异性引物:GACCACCTGGTTCAGTGGTG  SEQ ID NO.40
用于第二次PCR的5’RACE特异性引物:GGGTTATAGAGTCTGGTAACG SEQ ID NO.41
如上所述,确定了SEQ ID NO.3所示的SDA基因的翻译区。这里,与实施例2a)同样,对如参考例1纯化的SDA蛋白质分析其成熟N末端的氨基酸序列,结果表明:从翻译起始位点的Met数起,SDA氨基酸序列的成熟蛋白质的N末端位于位置29。
通过比较基因组DNA和cDNA的碱基序列来确定翻译区中是否存在内含子。证实该翻译区中不含有内含子。
实施例8:来自曲霉属种名待定PF1224菌株的皂草苷分解酶(SDA)在 绿色木霉中的表达
8a)用于转化的载体的构建
首先,以实施例7b中得到的pSDAHind5/18为模板,使用如下所示的在木霉属中表达的引物,与实施例4同样地进行PCR。
用DNA连接试剂盒ver.2(宝酒造)使由限制酶 StuI和 XhoI消化所得PCR产物的片段和预先用 StuI和 XhoI消化的质粒pCB1-M2(参照国际公开第WO98/11239号的实施例5)连接,构建pCB-SDAe(图4)。用于在木霉属中表达SDA的N末端引物:
GGGAGGCCTGCGCATCATGCATGTTGTCGCAAGTACCAC    SEQ ID NO.42
用于在木霉属中表达SDA的C末端引物:
GGGCTCGAGTACCTCAAGTCCCATTTGCCGGCTGC    SEQ ID NO.43
8b)绿色木霉的转化和各重组体的皂草苷分解活性的检测
以实施例5的5b)中得到的尿嘧啶需求型绿色木霉为宿主,与实施例5的5c)同样,用共转化的方法使pCB-SDAe和pyr4盒连接到pLITMUS28构建的载体pPYR4(参照实施例5的5a))转化。结果每1μgDNA获得了约12株的转化体。
培养上述获得的转化体(参照国际公开第WO98/11239号的实施例
1)后,将其培养上清进行SDS-PAGE,只在转化体中观察到显示分子量约80kDa的条带。
使用该培养上清,按照实施例1测定其皂草苷的分解活性时,在TLC中观察到分解产物大豆皂草精醇B的斑点。
8c)来自重组曲霉属种名待定PF1224菌株的皂草苷分解酶(重组型 SDA)的纯化、以及与来自野生型曲霉属种名待定PF1224菌株的皂草 苷分解酶(野生型SDA)的活性比较
将约600ml上述8b)所得培养液离心(8,000rpm、30分钟)除去其菌体碎片。向得到的约500ml上清中加入57g硫酸铵,离心除去不溶解的残渣。再向该上清中依次加入64g(40%饱和级分)和70g(60%饱和级分)硫酸铵,将得到的沉淀溶解于0.1M磷酸钠缓冲液(pH 5.8)中。向其中得到的60%饱和级分中加入硫酸铵,使浓度为1M,进行ButylToyopearl 650S(26mm i.d.×250mm)(Tosoh Co.)的疏水层析。用从缓冲液A到0.1M磷酸钠缓冲液(pH 5.8)的浓度梯度进行洗脱,回收从0.9M到0.2M浓度硫酸铵洗脱的流分。
用Millipore公司制造的Pellicon XL(截留分子量10,000)和Ultrafree15(截留分子量10,000)浓缩所得流分,用PD-10柱(AmershamBiosciences)脱盐,进行6ml Resource Q(Amersham Biosciences)的离子交换层析。用50mM Tris-盐酸缓冲液(pH7.5)到50mM Tris-盐酸缓冲液、0.5M氯化钠(pH7.5)的浓度梯度进行洗脱,回收未吸附流分和由0.08M盐浓度洗脱的流分。
用Ultrafree15(截留分子量10,000)(Millipore)浓缩所得流分,进行Superdex 200pg(16mm i.d.×600mm)(Amersham Biosciences)的凝胶过滤层析。用缓冲液G进行洗脱,回收截留分子量约50kDa的流分。
对该流分进行SDS-PAGE,结果在分子量约80kDa处观察到单一条带。另外,凝胶过滤的截留分子量与SDS-PAGE的分子量不同,这是由于该蛋白质与载体非特异性吸附的缘故。
按照试验例2的方法,对于如上纯化的重组型SDA和参考例1中纯化的皂草苷分解酶(野生型SDA)测定其最适pH和最适温度。
最适pH和最适温度的测定与实施例5的5d)同样进行。
结果分别如图5和图6所示。
结果表明:重组型SDA在pH 7的磷酸钠缓冲液中的比活性比野生型SDA低,但在Tris-盐酸缓冲液中的比活性有提高。
实施例9:来自Eupenicillium brefeldianum PF1226的皂草苷分解酶(SDE) 的分离纯化
将约1cm2 Eupenicillium brefeldianum PF1226(保藏号FERM BP-7476)的PDA斜面培养物接种于装有100ml TS培养基的500ml容量三角烧瓶中,在25℃振荡培养3天。将4ml上述培养物接种于装有100mlMY培养基和1.0%大豆皂草苷(小城制药)的500ml容量三角烧瓶中,振荡培养7天。
将约1,000ml该培养液用玻璃滤器(G3)过滤,除去菌体碎片。向约640ml该培养上清中加入73g硫酸铵,离心(8,000rpm、30分钟)除去生成的沉淀。再向约670ml该上清中加入256g硫酸铵,离心回收生成的沉淀。使该沉淀溶解于约50ml 0.1M乙酸钠缓冲液(pH 5.8),加入13.2g硫酸铵,加入水,使最终浓度为1M硫酸铵、0.1M磷酸钠缓冲液。
离心分离该溶液后,进行Butyl Toyopearl 650S(26mm i.d.×330mm)(Tosoh Co.)的疏水层析。用从缓冲液C到50mM Tris-盐酸缓冲液的浓度梯度进行洗脱,回收由0.7M至0.5M浓度硫酸铵洗脱的流分。
用Pellicon XL(截留分子量10,000)(Millipore)浓缩所得流分,然后加入磷酸钠缓冲液和硫酸铵,使其构成缓冲液A的组成,进行6mlResource PHE(Amersham Biosciences)的疏水层析。用从缓冲液A到0.1M磷酸钠缓冲液(pH 5.8)的浓度梯度进行洗脱,回收从1M到0.3M浓度硫酸铵洗脱的流分。
用Ultrafree15(截留分子量10,000)(Millipore)浓缩所得流分,用PD-10柱(Amersham Biosciences)脱盐后,进行6ml Resource Q(Amersham Biosciences)的离子交换层析。用20mM磷酸钠缓冲液(pH 7.0)到20mM磷酸钠缓冲液、1M氯化钠(pH 7.0)的浓度梯度进行洗脱,回收未吸附流分。
用Ultrafree 15(截留分子量10,000)(Millipore)浓缩该流分,进行Superdex 200pg(16mm i.d.×600mm)(Amersham Biosciences)的凝胶过滤层析。用缓冲液G进行洗脱,回收截留分子量约90kDa的流分。
对该流分进行SDS-PAGE,结果在分子量约90kDa处观察到单一条带。
实施例10:SDE的氨基酸序列分析
10a)N末端侧氨基酸序列
与实施例2的2a)同样,对实施例9中制备的流分进行N末端侧的氨基酸序列分析。结果得到所示的氨基酸序列。
N末端氨基酸序列:STTPAPPQPEPI(SEQ ID NO.44)
10b)肽作图
与实施例2的2b)同样,切下实施例9中纯化的SDE的约90kDa的条带,进行片段化。与实施例2的2b)同样地,将其进行HPLC,分离到如下所示的3种肽。
Trp20.73:ADPAFSPDGTR         SEQ ID NO.45
Trp34.21:LHPDDTHMGWSSF       SEQ ID NO.46
Trp36.26:GFSGAGDEILYIGSTR    SEQ ID NO.47
实施例11:SDE基因的克隆和序列分析
11a)使用PCR制备长链探针
与实施例3同样,从实施例9培养的菌体中分离基因组DNA。
根据实施例10中获得的肽的序列,合成编码这些肽序列的如下所示的寡核苷酸,作为PCR引物。
引物Ns:    CCICARCCNGARCCNAT     SEQ ID NO.48
引物20.37a:CTRAAIGCNGGRTCNGC     SEQ ID NO.49
引物34.21a:CCANCCCATRTGNGTRTC    SEQ ID NO.50
与实施例3的3a)同样地进行PCR。
结果,在上述引物中,引物Ns和引物20.73a的组合中,特异性地扩增了约1kb的片段,使用TOPO TA克隆试剂盒(Invitrogen)将其克隆到pCR2.1-TOPO中(pSDEPCR5)。
序列分析的结果表明:克隆到pSDEPCR5中的片段是SEQ ID NO.5所示序列中位置70到位置1247的区被扩增的片段。
11b)使用DNA印迹分析和噬菌体文库进行筛选
DNA印迹分析中,对 PstI、 SphI、 XhoI消化的基因组DNA在琼脂糖凝胶中进行电泳,转印到Hibond N+(Amersham Biosciences)。使用ECF随机引物标记和检测系统(Amersham Biosciences)进行杂交,使用分子成象仪FX(Biorad)检测条带。
使用上述11a)中得到的PCR产物作为探针,检测出约3kb  PstI、约4kb  SphI、约6kb  XhoI片段的条带。
接着,用 Sau3A1部分消化基因组DNA。使其与λEMBL3/ BamHI载体(Stratagene)连接,使用MaxPlax包装提取试剂盒(EPICENTRETECHNOLOGIES)进行包装。将约5×104 PFU的该噬菌体文库转印到Hibond N+(Amersham Biosciences),以克隆进入pSDEPCR5中的PCR片段作为探针,通过DIG Hi-prime DNA标记和检测试剂盒(RocheDiagnostics)获得了5种阳性克隆。从其中含有6kb XhoI片段的噬菌体DNA中回收该XhoI片段,克隆进入pBluescriptII KS+(pSDEXho/IIKS+1)。
以pSDEXho/IIKS+1为模板,通过转座子法确定SDE翻译区的DNA序列如SEQ ID NO.5所示。
这里,实施例10a)的结果表明:从翻译起始位点的Met数起,SDE氨基酸序列的成熟蛋白质的N末端位于位置18。
通过比较基因组和cDNA的DNA序列来确认翻译区中是否存在内含子。证实该翻译区中不存在内含子。
实施例12:来自Eupenicillium brefeldianum PF1226的皂草苷分解酶(SDE) 在绿色木霉中的表达
12a)用于转化的载体构建
以实施例11中获得的pSDEXho/IIKS+1为模板,使用如下所示的用于木霉属分泌的引物,与实施例4同样地进行PCR。
用DNA连接试剂盒ver.2(宝酒造)使由限制酶 SmaI和 XhoI消化所得PCR产物得到的片段和预先由 SmaI和 XhoI消化的质粒pCB1-M2(参照国际公开第WO98/11239号的实施例5)连接,构建pCB-SDEs(图7)。
用于在木霉属中分泌SDE的N末端引物:
GGGCCCGGGCTCAGACTACCCCGGCACCTCCTCAGCC    SEQ ID NO.51
用于在木霉属中分泌SDE的C末端引物:
GGGCTCGAGTACCTCATGCACCATTGAGCGGCTGGTGG    SEQ ID NO.52
12b)绿色木霉的转化和各重组体的皂草苷分解活性的检测
以实施例5的5b)中得到的尿嘧啶需求型绿色木霉为宿主,与实施例5的5c)同样,用共转化的方法使pCB-SDEs和pyr4盒连接到pLITMUS28构建的载体pPYR4(参照上述5a))进行转化。结果每1μg的DNA获得了约28株的转化体。
培养上述获得的转化体(参照国际公开第WO98/11239号的实施例1)后,将该培养上清进行SDS-PAGE,只在转化体中观察到显示分子量约67kDa的条带。
按照试验例1,使用该培养上清测定皂草苷的分解活性时,在TLC中观察到分解产物大豆皂草精醇B的斑点。
12c)来自重组Eupenicillium brefeldianum PF1226的皂草苷分解酶 (重组型SDE)的纯化、以及与来自野生型Eupenicillium brefeldianum PF1226的皂草苷分解酶(野生型SDE)的活性比较
将约900ml实施例12的12b)所得培养液离心(8,000rpm、30分钟)除去菌体碎片。向得到的约690ml上清中加入78.7g硫酸铵,离心除去不溶解的残渣。再向该上清中加入88.6g(40%饱和级分)硫酸铵,将得到的沉淀溶解于120ml 1M硫酸铵、0.1M磷酸钠缓冲液(pH 5.8)中。取其中的20ml进行Butyl Toyopearl 650S(26mm i.d.×330mm)(TosohCo.)的疏水层析。用从缓冲液A到0.1M磷酸钠缓冲液的浓度梯度进行洗脱,回收从0.2M到0M硫酸铵浓度洗脱的流分。
用Millipore公司制造的Pellicon XL(截留分子量10,000)和Ultrafree15(截留分子量5,000)浓缩该流分,用PD-10柱(Amersham Biosciences)脱盐,进行6ml Resource Q(Amersham Biosciences)的离子交换层析。用50mM Tris-盐酸缓冲液(pH 7.5)到50mM Tris-盐酸缓冲液、0.5M氯化钠(pH 7.5)的浓度梯度进行洗脱,回收由0M到0.1M盐浓度洗脱的流分。
用Ultrafree15(截留分子量5,000)(Millipore)浓缩该流分,进行Superdex 200pg(16mmi.d.×600mm)(Amersham Biosciences)的凝胶过滤层析。用缓冲液G进行洗脱,回收截留分子量约50kDa的流分。
对该流分进行SDS-PAGE,结果在分子量约67kDa处观察到单一条带。另外,凝胶过滤的截留分子量与SDS-PAGE的分子量不同,这是由于该蛋白质与载体非特异性吸附的缘故。
按照试验例2的方法,对于如上纯化的重组型SDE和实施例9中纯化的皂草苷分解酶(野生型SDE)测定其最适pH和最适温度。
最适pH和最适温度的测定与实施例5的5d)同样进行。
结果分别如图8和图9所示。
结果表明:重组型SDE在Tris-盐酸缓冲液中的活性比野生型SDE高,在高pH下的活性也得到提高。
                          序列表
<110>明治制果株式会社(MEIJI SEIKA KAISHA,LTD.)
<120>皂草苷分解酶及其基因以及大豆皂草精醇B的大量生产系统
<130>MO713-PCT,MO713-AR,TW(136515px)
<140>
<141>
<150>JP 2001/171604
<151>2001-6-6
<160>54
<170>PatentIn Ver.2.1
<210>1
<211>1917
<212>DNA
<213>侵菅新赤壳侵菅变种PF1225菌株(Neocosmospora vasinfecta variety vasinfecta
P1225)
<220>
<221>CDS
<222>(1)..(1914)
<220>
<221>mat_peptide
<222>(79)..(1914)
<300>
<400>1
atg cac ttc ttt gac aaa gcg act gtc tac gct ata ctc tgc ggt agc    48
Met His Phe Phe Asp Lys Ala Thr Val Tyr Ala Ile Leu Cys Gly Ser
    -25                 -20                 -15
gtg gcc cag act gtt cac gct gca ccc tcc gct tct cct cct gct tct    96
Val Ala Gln Thr Val His Ala Ala Pro Ser Ala Ser Pro Pro Ala Ser
-10                  -5              -1   1               5
gtt cca aac cct cct tct cct gag ccc att acc ctc aag cag cta cct    144
Val Pro Asn Pro Pro Ser Pro Glu Pro Ile Thr Leu Lys Gln Leu Pro
             10                  15                  20
ctt cct ccc atc tcc cct agc gac gac gtc ggt gct tgc acg aag cag    192
Leu Pro Pro Ile Ser Pro Ser Asp Asp Val Gly Ala Cys Thr Lys Gln
         25                  30                  35
atc aac tct cgt gga acg gga tgt ctc gcc aac ggc gtt ttt gaa acg    240
Ile Asn Ser Arg Gly Thr Gly Cys Leu Ala Asn Gly Val Phe Glu Thr
     40                  45                  50
ttt cag tct ggt gac ttt tta cct gat gga aag cat gtc atc gcc atg    288
Phe Gln Ser Gly Asp Phe Leu Pro Asp Gly Lys His Val Ile Ala Met
 55                  60                  65                  70
gtc aac ttt act ggt gcg cct gct gct ccg gct gcg gga agc atc tac    336
Val Asn Phe Thr Gly Ala Pro Ala Ala Pro Ala Ala Gly Ser Ile Tyr
                 75                  80                  85
tct ggc ccg cag gtc atc atc gtc aag acg gat ggc aag aca ttt cct    384
Ser Gly Pro Gln Val Ile Ile Val Lys Thr Asp Gly Lys Thr Phe Pro
             90                  95                 100
aac gga gac ccc tgg aag tgc atc acc tgt ggt gtc cct gag aag aac    432
Asn Gly Asp Pro Trp Lys Cys Ile Thr Cys Gly Val Pro Glu Lys Asn
        105                 110                 115
gcc gtt ggt atc agc gtc aag tat gac tac ccc cag gcc ttt aag gat    480
Ala Val Gly Ile Ser Val Lys Tyr Asp Tyr Pro Gln Ala Phe Lys Asp
    120                 125                 130
ggc aaa cgt ctt ctc atc gga cac aat att ctc gac tgc ggc acc aac    528
Gly Lys Arg Leu Leu Ile Gly His Asn Ile Leu Asp Cys Gly Thr Asn
135                 140                 145                 150
cag ttg acg agc gag agc tgc aag cca gat aac acc cac atc tac cct    576
Gln Leu Thr Ser Glu Ser Cys Lys Pro Asp Asn Thr His Ile Tyr Pro
                155                 160                 165
atc cgc tgg aat gtt gct gcc gac ggt tcc ggc ccg agc ggt gaa atc    624
Ile Arg Trp Asn Val Ala Ala Asp Gly Ser Gly Pro Ser Gly Glu Ile
            170                 175                 180
cgt gag ctg cgg tta cac ccg gac aat gtc cat ctc gag ttt agc tct    672
Arg Glu Leu Arg Leu His Pro Asp Asn Val His Leu Glu Phe Ser Ser
        185                 190                 195
ttc acc ttt gct agt ggc agt att gga cag tat gcc tac ttt tct cgg    720
Phe Thr Phe Ala Ser Gly Ser Ile Gly Gln Tyr Ala Tyr Phe Ser Arg
    200                 205                 210
ctc gtt ttc aat cct tcg ccc aag act gga act ccc ctt gcg ccg cgg    768
Leu Val Phe Asn Pro Ser Pro Lys Thr Gly Thr Pro Leu Ala Pro Arg
215                 220                 225                 230
tat gac ctg gaa aag gtt act att ctg cac aac ccc gag ggc gtt gcc    816
Tyr Asp Leu Glu Lys Val Thr Ile Leu His Asn Pro Glu Gly Val Ala
                235                 240                 245
cct atc acg gcc aag ggt aag gtt ctg tct ctg aac ccc cag gct att    864
Pro Ile Thr Ala Lys Gly Lys Val Leu Ser Leu Asn Pro Gln Ala Ile
            250                 255                 260
tcg gtt ggc gag gct cgt ggc ttc aac ggc gac gga act gag ctc act    912
Ser Val Gly Glu Ala Arg Gly Phe Asn Gly Asp Gly Thr Glu Leu Thr
        265                 270                 275
tat gtc gga agc aat att gag agc tgt aat aat gat gtc ttt gcc gtt    960
Tyr Val Gly Ser Asn Ile Glu Ser Cys Asn Asn Asp Val Phe Ala Val
    280                 285                 290
cat ctt Gaa act gga gtt gtt cga cgt ctt acc aac cat ccc gag tat    1008
His Leu Gln Thr Gly Val Val Arg Arg Leu Thr Asn His Pro Glu Tyr
295                 300                 305                 310
cct gac cct ctg gct ttc tcg cct gat aac aaa tgg atg gct gtc atg    1056
Pro Asp Pro Leu Ala Phe Ser Pro Asp Asn Lys Trp Met Ala Val Met
                315                 320                 325
gat acc cgc gga agt ggt cgc aac atg ttt att gcc ggc atg cga gga    1104
Asp Thr Arg Gly Ser Gly Arg Asn Met Phe Ile Ala Gly Met Arg Gly
            330                 335                 340
atc ccg ccc ctg gtt gat att gtt ggc ggt att ctg cca gcg tcg tct    1152
Ile Pro Pro Leu Val Asp Ile Val Gly Gly Ile Leu Pro Ala Ser Ser
        345                 350                 355
cgc aac aac ggt ctt cgt cgc ttc ttc cag ccg tac ctg ctt gat ttt    1200
Arg Asn Asn Gly Leu Arg Arg Phe Phe Gln Pro Tyr Leu Leu Asp Phe
    360                 365                 370
tat ggt gac cgc ggt gac tac tac ggc caa aag atc aac gga gat aac    1248
Tyr Gly Asp Arg Gly Asp Tyr Tyr Gly Gln Lys Ile Asn Gly Asp Asn
375                 380                 385                 390
aat ggc gtg cct ggg agt ggt gcc atc aac gat cct gag tgg aac ggt    1296
Asn Gly Val Pro Gly Ser Gly Ala Ile Asn Asp Pro Glu Trp Asn Gly
                395                 400                 405
atg gct gat ccg aga tgg tct cct gac agc agg cag ctc gtc ttt tgg    1344
Met Ala Asp Pro Arg Trp Ser Pro Asp Ser Arg Gln Leu Val Phe Trp
            410                 415                 420
cag act cat acc gtc tcc cct tct tgt ggc ggc gcc aac cct ctc cct    1392
Gln Thr His Thr Val Ser Pro Ser Cys Gly Gly Ala Asn Pro Leu Pro
        425                 430                 435
tgc tac cct tcg aaa gag caa ggt ggc cgt aac tat cgc atg tac atc    1440
Cys Tyr Pro Ser Lys Glu Gln Gly Gly Arg Asn Tyr Arg Met Tyr Ile
    440                 445                 450
gcg acc ttt act agc cgc agc cca agc cct cct gcc ccg gtg aag gag    1488
Ala Thr Phe Thr Ser Arg Ser Pro Ser Pro Pro Ala Pro Val Lys Glu
455                 460                 465                 470
cac tcc gat acc atc ccc tgg ggc gtc ccg tac gtt ccc gga tct cag    1536
His Ser Asp Thr Ile Pro Trp Gly Val Pro Tyr Val Pro Gly Ser Gln
                475                 480                 485
gtt act cca aag cct ggc ttg gcg ggc ggt atc tac acg ctc tac ggc    1584
Val Thr Pro Lys Pro Gly Leu Ala Gly Gly Ile Tyr Thr Leu Tyr Gly
            490                 495                 500
aag gct tcg ggc gag gcc aag gtc aac atc acc tgg ggt gag gca ccc    1632
Lys Ala Ser Gly Glu Ala Lys Val Asn Ile Thr Trp Gly Glu Ala Pro
        505                 510                 515
gag att gga acc gtc agc gtc gtg tac aag gac tat tcg ctc gac ggc    1680
Glu Ile Gly Thr Val Ser Val Val Tyr Lys Asp Tyr Ser Leu Asp Gly
    520                 525                 530
aag agc ttc ctc aac ggg aac gag agc gtc acg ggg tct gtc gag aga    1728
Lys Ser Phe Leu Asn Gly Asn Glu Ser Val Thr Gly Ser Val Glu Arg
535                 540                 545                 550
ctg act gac tat tct ttt gac tgg tat tcg gat att cgc cag acg gga    1776
Leu Thr Asp Tyr Ser Phe Asp Trp Tyr Ser Asp Ile Arg Gln Thr Gly
                555                 560                 565
gct gtc aag gga acc aag aag acg agc cct ggt gga ttc cat gct aat  1824
Ala Val Lys Gly Thr Lys Lys Thr Ser Pro Gly Gly Phe His Ala Asn
            570                 575                 580
att gat gtc atg atc aac gac ctg act tca act ggt act ctt acc acg  1872
Ile Asp Val Met Ile Asn Asp Leu Thr Ser Thr Gly Thr Leu Thr Thr
        585                 590                 595
act ctg gat ggt gtt gag tgg cgt agt cct cag agc ggc act taa      1917
Thr Leu Asp Gly Val Glu Trp Arg Ser Pro Gln Ser Gly Thr
    600                 605                 610
<210>2
<211>638
<212>PRT
<213>侵菅新赤壳侵菅变种PF1225菌株(Neocosmospora vasinfecta variety vasinfecta
P1225)
<400>2
Met His Phe Phe Asp Lys Ala Thr Val Tyr Ala Ile Leu Cys Gly Ser
    -25                 -20                 -15
Val Ala Gln Thr Val His Ala Ala Pro Ser Ala Ser Pro Pro Ala Ser
-10                  -5              -1   1               5
Val Pro Asn Pro Pro Ser Pro Glu Pro Ile Thr Leu Lys Gln Leu Pro
             10                  15                  20
Leu Pro Pro Ile Ser Pro Ser Asp Asp Val Gly Ala Cys Thr Lys Gln
         25                  30                  35
Ile Asn Ser Arg Gly Thr Gly Cys Leu Ala Asn Gly Val Phe Glu Thr
     40                  45                  50
Phe Gln Ser Gly Asp Phe Leu Pro Asp Gly Lys His Val Ile Ala Met
 55                  60                  65                  70
Val Asn Phe Thr Gly Ala Pro Ala Ala Pro Ala Ala Gly Ser Ile Tyr
                 75                  80                  85
Ser Gly Pro Gln Val Ile Ile Val Lys Thr Asp Gly Lys Thr Phe Pro
             90                  95                 100
Asn Gly Asp Pro Trp Lys Cys Ile Thr Cys Gly Val Pro Glu Lys Asn
        105                 110                 115
Ala Val Gly Ile Ser Val Lys Tyr Asp Tyr Pro Gln Ala Phe Lys Asp
    120                 125                 130
Gly Lys Arg Leu Leu Ile Gly His Asn Ile Leu Asp Cys Gly Thr Asn
135                 140                 145                 150
Gln Leu Thr Ser Glu Ser Cys Lys Pro Asp Asn Thr His Ile Tyr Pro
                155                 160                 165
Ile Arg Trp Asn Val Ala Ala Asp Gly Ser Gly Pro Ser Gly Glu Ile
            170                 175                 180
Arg Glu Leu Arg Leu His Pro Asp Asn Val His Leu Glu Phe Ser Ser
        185                 190                 195
Phe Thr Phe Ala Ser Gly Ser Ile Gly Gln Tyr Ala Tyr Phe Ser Arg
    200                 205                 210
Leu Val Phe Asn Pro Ser Pro Lys Thr Gly Thr Pro Leu Ala Pro Arg
215                 220                 225                 230
Tyr Asp Leu Glu Lys Val Thr Ile Leu His Asn Pro Glu Gly Val Ala
                235                 240                 245
Pro Ile Thr Ala Lys Gly Lys Val Leu Ser Leu Asn Pro Gln Ala Ile
            250                 255                 260
Ser Val Gly Glu Ala Arg Gly Phe Asn Gly Asp Gly Thr Glu Leu Thr
        265                 270                 275
Tyr Val Gly Ser Asn Ile Glu Ser Cys Asn Asn Asp Val Phe Ala Val
    280                 285                 290
His Leu Gln Thr Gly Val Val Arg Arg Leu Thr Asn His Pro Glu Tyr
295                 300                 305                 310
Pro Asp Pro Leu Ala Phe Ser Pro Asp Asn Lys Trp Met Ala Val Met
                315                 320                 325
Asp Thr Arg Gly Ser Gly Arg Asn Met Phe Ile Ala Gly Met Arg Gly
            330                 335                 340
Ile Pro Pro Leu Val Asp Ile Val Gly Gly Ile Leu Pro Ala Ser Ser
        345                 350                 355
Arg Asn Asn Gly Leu Arg Arg Phe Phe Gln Pro Tyr Leu Leu Asp Phe
    360                 365                 370
Tyr Gly Asp Arg Gly Asp Tyr Tyr Gly Gln Lys Ile Asn Gly Asp Asn
375                 380                 385                 390
Asn Gly Val Pro Gly Ser Gly Ala Ile Asn Asp Pro Glu Trp Asn Gly
                395                 400                 405
Met Ala Asp Pro Arg Trp Ser Pro Asp Ser Arg Gln Leu Val Phe Trp
            410                 415                 420
Gln Thr His Thr Val Ser Pro Ser Cys Gly Gly Ala Asn Pro Leu Pro
        425                 430                 435
Cys Tyr Pro Ser Lys Glu Gln Gly Gly Arg Asn Tyr Arg Met Tyr Ile
    440                 445                 450
Ala Thr Phe Thr Ser Arg Ser Pro Ser Pro Pro Ala Pro Val Lys Glu
455                 460                 465                 470
His Ser Asp Thr Ile Pro Trp Gly Val Pro Tyr Val Pro Gly Ser Gln
                475                 480                 485
Val Thr Pro Lys Pro Gly Leu Ala Gly Gly Ile Tyr Thr Leu Tyr Gly
            490                 495                 500
Lys Ala Ser Gly Glu Ala Lys Val Asn Ile Thr Trp Gly Glu Ala Pro
        505                 510                 515
Glu Ile Gly Thr Val Ser Val Val Tyr Lys Asp Tyr Ser Leu Asp Gly
    520                 525                 530
Lys Ser Phe Leu Asn Gly Asn Glu Ser Val Thr Gly Ser Val Glu Arg
535                 540                 545                 550
Leu Thr Asp Tyr Ser Phe Asp Trp Tyr Ser Asp Ile Arg Gln Thr Gly
                555                 560                 565
Ala Val Lys Gly Thr Lys Lys Thr Ser Pro Gly Gly Phe His Ala Asn
            570                 575                 580
Ile Asp Val Met Ile Asn Asp Leu Thr Ser Thr Gly Thr Leu Thr Thr
        585                 590                 595
Thr Leu Asp Gly Val Glu Trp Arg Ser Pro Gln Ser Gly Thr
    600                 605                 610
<210>3
<211>1902
<212>DNA
<213>曲霉属种名待定PF122菌株(Aspergillus sp.PF1224)
<220>
<221>CDS
<222>(1)..(1899)
<220>
<221>mat_peptide
<222>(85)..(1899)
<400>3
atg cat gtt gtc gca agt acc act gct ttt ctg ggc gtc gtt tct act    48
Met His Val Val Ala Ser Thr Thr Ala Phe Leu Gly Val Val Ser Thr
            -25                 -20                 -15
gtt gct ggg gta cac cat gtc aac aga gac acc agt caa cag atc cta    96
Val Ala Gly Val His His Val Asn Arg Asp Thr Ser Gln Gln Ile Leu
        -10                  -5              -1   1
aaa cca cct gta cca gag cct att gtc gtc acc gag ctt ccc ttg cct    144
Lys Pro Pro Val Pro Glu Pro Ile Val Val Thr Glu Leu Pro Leu Pro
  5                  10                  15                  20
cct gtc gcc gac agt aag gag ggc tct tgt act ccc gaa gtt agc cct    192
Pro Val Ala Asp Ser Lys Glu Gly Ser Cys Thr Pro Glu Val Ser Pro
                 25                  30                  35
cac agg acc ggt tgt cta ctc aaa tcc tcc cag att cag agt gga aat    240
His Arg Thr Gly Cys Leu Leu Lys Ser Ser Gln Ile Gln Ser Gly Asn
             40                  45                  50
ttc ctt cct gac aac aat cat gtc ctt gtc agc tta aac ttc tca ggg    288
Phe Leu Pro Asp Asn Asn His Val Leu Val Ser Leu Asn Phe Ser Gly
         55                  60                  65
gct cca gca gct cca gat ccg gct agc att tat aat ggt acc cat ttg    336
Ala Pro Ala Ala Pro Asp Pro Ala Ser Ile Tyr Asn Gly Thr His Leu
     70                  75                  80
act ctg ata aag gct gat ggg acc aac ttt cct agt ggt gac cca tgg    384
Thr Leu Ile Lys Ala Asp Gly Thr Asn Phe Pro Ser Gly Asp Pro Trp
 85                  90                  95                 100
aag tgt att acc tgc ggc gtg ccg gaa gaa aac aag gtc ggc agc aca    432
Lys Cys Ile Thr Cys Gly Val Pro Glu Glu Asn Lys Val Gly Ser Thr
                105                 110                 115
gaa ctt tcg cca tat cct cag gcg ttt ttg gat ggc aag agg gcc tta    480
Glu Leu Ser Pro Tyr Pro Gln Ala Phe Leu Asp Gly Lys Arg Ala Leu
            120                 125                 130
att ggg acc aac atc gtt gat tgt ggc tcg gcg ctg ctt tca agt tca    528
Ile Gly Thr Asn Ile Val Asp Cys Gly Ser Ala Leu Leu Ser Ser Ser
        135                 140                 145
gac tgt aca ccg gat aaa gtg cat atc tac cca atc cgc tgg aat gtc    576
Asp Cys Thr Pro Asp Lys Val His Ile Tyr Pro Ile Arg Trp Asn Val
    150                 155                 160
aag gca gat ggc tca ggt tcc gga ggg aat ata cga gaa ttg cgc cta    624
Lys Ala Asp Gly Ser Gly Ser Gly Gly Asn Ile Arg Glu Leu Arg Leu
165                 170                 175                 180
cat ccg gac aat gtg cac tta ggg ttc aac tcc ttc acg ttc tct aat    672
His Pro Asp Asn Val His Leu Gly Phe Asn Ser Phe Thr Phe Ser Asn
                185                 190                 195
ggt caa cta gga cag ttt ggc tac ttt agt cga ctg cag ttt aac cca    720
Gly Gln Leu Gly Gln Phe Gly Tyr Phe Ser Arg Leu Gln Phe Asn Pro
            200                 205                 210
gcc ccg aag act ggc gaa cct cgc tca gcc cga tat gat ctg gtt aac    768
Ala Pro Lys Thr Gly Glu Pro Arg Ser Ala Arg Tyr Asp Leu Val Asn
        215                 220                 225
gtt acc aga ctc tat aac ccg gac agc cca cag cct atc agc gca aaa    816
Val Thr Arg Leu Tyr Asn Pro Asp Ser Pro Gln Pro Ile Ser Ala Lys
    230                 235                 240
ggc aac gag tta ttg ttt aac cga tcg gct att gcc gtc ggt gag ctt    864
Gly Asn Glu Leu Leu Phe Asn Arg Ser Ala Ile Ala Val Gly Glu Leu
245                 250                 255                 260
cga gga ttt acc gga cgt ggc aaa gaa gtc aca tat atc ggc aac cct    912
Arg Gly Phe Thr Gly Arg Gly Lys Glu Val Thr Tyr Ile Gly Asn Pro
                265                 270                 275
gtc gag tca tgc aac atc gac gta ttc gct gcc gac ctg aca acc gga    960
Val Glu Ser Cys Asn Ile Asp Val Phe Ala Ala Asp Leu Thr Thr Gly
            280                 285                 290
aag gtc cgt cgg att aca gat cac ccc gag tat gtc gat ccg atg gat    1008
Lys Val Arg Arg Ile Thr Asp His Pro Glu Tyr Val Asp Pro Met Asp
        295                 300                 305
gtc tct ccc gac gac aag tgg caa gtt atc ctc gat acc cga ggg acc    1056
Val Ser Pro Asp Asp Lys Trp Gln Val Ile Leu Asp Thr Arg Gly Thr
    310                 315                 320
ggt cga cag atg ttc atg gcc ggc atg cgc ggt att cca ccg atc atc    1104
Gly Arg Gln Met Phe Met Ala Gly Met Arg Gly Ile Pro Pro Ile Ile
325                 330                 335                 340
gac ctg ata gct act acg gtc gca tcc tct act cgc aac aac ggc cct    1152
Asp Leu Ile Ala Thr Thr Val Ala Ser Ser Thr Arg Asn Asn Gly Pro
                345                 350                 355
cgg cga ttt ttc cga cct tgg ctc ctg gac cac gat ggg gac cgt gga    1200
Arg Arg Phe Phe Arg Pro Trp Leu Leu Asp His Asp Gly Asp Arg Gly
            360                 365                 370
gac tac tat ggc cag caa atc aac ggg gac ggt gac ggc agc ccg gga    1248
Asp Tyr Tyr Gly Gln Gln Ile Asn Gly Asp Gly Asp Gly Ser Pro Gly
        375                 380                 385
agc atc aac gac cct aac tgg aac gcc ggg gca gat cca aag tgg tcc    1296
Ser Ile Asn Asp Pro Asn Trp Asn Ala Gly Ala Asp Pro Lys Trp Ser
    390                 395                 400
cac gac ggc acg cgc ata gca tac ttc gag aac ctg gtt gtt tct cct    1344
His Asp Gly Thr Arg Ile Ala Tyr Phe Glu Asn Leu Val Val Ser Pro
405                 410                 415                 420
tct tgt ggc gga cag aac ccg ctg cct tgc cct aac tcc act gaa cca    1392
Ser Cys Gly Gly Gln Asn Pro Leu Pro Cys Pro Asn Ser Thr Glu Pro
                425                 430                 435
ggt ggt cgt gtc acc cgc ctg atg ctt gct cac ctg acc agc cgc gag    1440
Gly Gly Arg Val Thr Arg Leu Met Leu Ala His Leu Thr Ser Arg Glu
            440                 445                 450
ccg ctc gat ctt gaa ccc gtt gct cct gtc tct gat gaa gtt ccc tgg    1488
Pro Leu Asp Leu Glu Pro Val Ala Pro Val Ser Asp Glu Val Pro Trp
        455                 460                 465
ggt gtt cca tac gtg ccc gag agt gct cta cca gac cgt ccc ttt cca    1536
Gly Val Pro Tyr Val Pro Glu Ser Ala Leu Pro Asp Arg Pro Phe Pro
    470                 475                 480
gct gaa gga aat tac acc ttg aag gga gag gtg tca ggc tca gct tct    1584
Ala Glu Gly Asn Tyr Thr Leu Lys Gly Glu Val Ser Gly Ser Ala Ser
485                 490                 495                 500
gtg tca atc att cat gac aag acc att cca gca gcg atc aaa act atc    1632
Val Ser Ile Ile His Asp Lys Thr Ile Pro Ala Ala Ile Lys Thr Ile
                505                 510                 515
gca gtc acc tat cgc aac tat tcc gat gat ggg ttg cat gtt atc gca    1680
Ala Val Thr Tyr Arg Asn Tyr Ser Asp Asp Gly Leu His Val Ile Ala
            520                 525                 530
ggg tct gaa aga ttc acc aat act gtc gca tcc atg aca ata aac aag    1728
Gly Ser Glu Arg Phe Thr Asn Thr Val Ala Ser Net Thr Ile Asn Lys
        535                 540                 545
gtc gac tgg ttt tcc gac ctt acg tct acc gga caa gtg acc gga agc    1776
Val Asp Trp Phe Ser Asp Leu Thr Ser Thr Gly Gln Val Thr Gly Ser
    550                 555                 560
aag aag acc agt ccc ggt ggg ttc cat ctg gag att gat gct atg act    1824
Lys Lys Thr Ser Pro Gly Gly Phe His Leu Glu Ile Asp Ala Met Thr
565                 570                 575                 580
aac atc ttc atg gca aac gga acc ttg aca acc act atc gat gga aag    1872
Asn Ile Phe Met Ala Asn Gly Thr Leu Thr Thr Thr Ile Asp Gly Lys
                585                 590                 595
gtc tgg aag cag ccg gca aat ggg act tga                            1902
Val Trp Lys Gln Pro Ala Asn Gly Thr
            600                 605
<210>4
<211>633
<212>PRT
<213>曲霉属种名待定PF122菌株(Aspergillus sp.PF1224)
<400>4
Met His Val Val Ala Ser Thr Thr Ala Phe Leu Gly Val Val Ser Thr
            -25                 -20                 -15
Val Ala Gly Val His His Val Asn Arg Asp Thr Ser Gln Gln Ile Leu
        -10                  -5              -1   1
Lys Pro Pro Val Pro Glu Pro Ile Val Val Thr Glu Leu Pro Leu Pro
  5                  10                  15                  20
Pro Val Ala Asp Ser Lys Glu Gly Ser Cys Thr Pro Glu Val Ser Pro
                 25                  30                  35
His Arg Thr Gly Cys Leu Leu Lys Ser Ser Gln Ile Gln Ser Gly Asn
             40                  45                  50
Phe Leu Pro Asp Asn Asn His Val Leu Val Ser Leu Asn Phe Ser Gly
         55                  60                  65
Ala Pro Ala Ala Pro Asp Pro Ala Ser Ile Tyr Asn Gly Thr His Leu
     70                  75                  80
Thr Leu Ile Lys Ala Asp Gly Thr Asn Phe Pro Ser Gly Asp Pro Trp
 85                  90                  95                 100
Lys Cys Ile Thr Cys Gly Val Pro Glu Glu Asn Lys Val Gly Ser Thr
                105                 110                 115
Glu Leu Ser Pro Tyr Pro Gln Ala Phe Leu Asp Gly Lys Arg Ala Leu
            120                 125                 130
Ile Gly Thr Asn Ile Val Asp Cys Gly Ser Ala Leu Leu Ser Ser Ser
        135                 140                 145
Asp Cys Thr Pro Asp Lys Val His Ile Tyr Pro Ile Arg Trp Asn Val
    150                 155                 160
Lys Ala Asp Gly Ser Gly Ser Gly Gly Asn Ile Arg Glu Leu Arg Leu
165                 170                 175                 180
His Pro Asp Asn Val His Leu Gly Phe Asn Ser Phe Thr Phe Ser Asn
                185                 190                 195
Gly Gln Leu Gly Gln Phe Gly Tyr Phe Ser Arg Leu Gln Phe Asn Pro
            200                 205                 210
Ala Pro Lys Thr Gly Glu Pro Arg Ser Ala Arg Tyr Asp Leu Val Asn
        215                 220                 225
Val Thr Arg Leu Tyr Asn Pro Asp Ser Pro Gln Pro Ile Ser Ala Lys
    230                 235                 240
Gly Asn Glu Leu Leu Phe Asn Arg Ser Ala Ile Ala Val Gly Glu Leu
245                 250                 255                 260
Arg Gly Phe Thr Gly Arg Gly Lys Glu Val Thr Tyr Ile Gly Asn Pro
                265                 270                 275
Val Glu Ser Cys Asn Ile Asp Val Phe Ala Ala Asp Leu Thr Thr Gly
            280                 285                 290
Lys Val Arg Arg Ile Thr Asp His Pro Glu Tyr Val Asp Pro Met Asp
        295                 300                 305
Val Ser Pro Asp Asp Lys Trp Gln Val Ile Leu Asp Thr Arg Gly Thr
    310                 315                 320
Gly Arg Gln Met Phe Met Ala Gly Met Arg Gly Ile Pro Pro Ile Ile
325                 330                 335                 340
Asp Leu Ile Ala Thr Thr Val Ala Ser Ser Thr Arg Asn Asn Gly Pro
                345                 350                 355
Arg Arg Phe Phe Arg Pro Trp Leu Leu Asp His Asp Gly Asp Arg Gly
            360                 365                 370
Asp Tyr Tyr Gly Gln Gln Ile Asn Gly Asp Gly Asp Gly Ser Pro Gly
        375                 380                 385
Ser Ile Asn Asp Pro Asn Trp Asn Ala Gly Ala Asp Pro Lys Trp Ser
    390                 395                 400
His Asp Gly Thr Arg Ile Ala Tyr Phe Glu Asn Leu Val Val Ser Pro
405                 410                 415                 420
Ser Cys Gly Gly Gln Asn Pro Leu Pro Cys Pro Asn Ser Thr Glu Pro
                425                 430                 435
Gly Gly Arg Val Thr Arg Leu Met Leu Ala His Leu Thr Ser Arg Glu
            440                 445                 450
Pro Leu Asp Leu Glu Pro Val Ala Pro Val Ser Asp Glu Val Pro Trp
        455                 460                 465
Gly Val Pro Tyr Val Pro Glu Ser Ala Leu Pro Asp Arg Pro Phe Pro
    470                 475                 480
Ala Glu Gly Asn Tyr Thr Leu Lys Gly Glu Val Ser Gly Ser Ala Ser
485                 490                 495                 500
Val Ser Ile Ile His Asp Lys Thr Ile Pro Ala Ala Ile Lys Thr Ile
                505                 510                 515
Ala Val Thr Tyr Arg Asn Tyr Ser Asp Asp Gly Leu His Val Ile Ala
            520                 525                 530
Gly Ser Glu Arg Phe Thr Asn Thr Val Ala Ser Met Thr Ile Asn Lys
        535                 540                 545
Val Asp Trp Phe Ser Asp Leu Thr Ser Thr Gly Gln Val Thr Gly Ser
    550                 555                 560
Lys Lys Thr Ser Pro Gly Gly Phe His Leu Glu Ile Asp Ala Met Thr
565                 570                 575                 580
Asn Ile Phe Met Ala Asn Gly Thr Leu Thr Thr Thr Ile Asp Gly Lys
                585                 590                 595
Val Trp Lys Gln Pro Ala Asn Gly Thr
            600                 605
<210>5
<211>1857
<212>DNA
<213>Eupenicillium brefeldianum PF1226
<220>
<221>CDS
<222>(1)..(1854)
<220>
<221>mat_peptide
<222>(52)..(1854)
<400>5
atg cgt tgg agt ttc tct gtt gtc cta agc acg gct gcc ctt ggt ata    48
Met Arg Trp Ser Phe Ser Val Val Leu Ser Thr Ala Ala Leu Gly Ile
        -15                 -10                  -5
tcc tcg act acc ccg gca cct cct cag cca gag ccc att gaa gta gtt    96
Ser Ser Thr Thr Pro Ala Pro Pro Gln Pro Glu Pro Ile Glu Val Val
 -1   1               5                  10                  15
gaa ctt ccc cta cct ccg gtt gca cca agc aac agt acg ggc gca tgc    144
Glu Leu Pro Leu Pro Pro Val Ala Pro Ser Asn Ser Thr Gly Ala Cys
                 20                  25                  30
acg gca tcc atc aac ccc cac cgg aca ggc tgc att gcg cag gta tca    192
Thr Ala Ser Ile Asn Pro His Arg Thr Gly Cys Ile Ala Gln Val Ser
             35                  40                  45
gac tct ttc cag gct ggc gac ttt aca cct gat gga aac cat gtg gtc    240
Asp Ser Phe Gln Ala Gly Asp Phe Thr Pro Asp Gly Asn His Val Val
         50                  55                  60
atc acc gtg gag ttt gtt ggt gct ccg gcg gca Gca gac cca gcc agc    288
Ile Thr Val Glu Phe Val Gly Ala Pro Ala Ala Pro Asp Pro Ala Ser
     65                  70                  75
ata tac tct ggg gaa cat atc atc ctc gtc aaa gca gac ggt aca acg    336
Ile Tyr Ser Gly Glu His Ile Ile Leu Val Lys Ala Asp Gly Thr Thr
 80                  85                  90                  95
ttc acc aat ggc gat gca tgg aaa tgc tta agc tgc ggt gtt cct tcc    384
Phe Thr Asn Gly Asp Ala Trp Lys Cys Leu Ser Cys Gly Val Pro Ser
                100                 105                 110
aaa aat gcc ctt agc ctc gac ccg cag aga gac tat cca cat gtg gct    432
Lys Asn Ala Leu Ser Leu Asp Pro Gln Arg Asp Tyr Pro His Val Ala
            115                 120                 125
aga aat tct cga caa gcc ctt tgg gga cac aat atc ctg gat tgc agt    480
Arg Asn Ser Arg Gln Ala Leu Trp Gly His Asn Ile Leu Asp Cys Ser
        130                 135                 140
ggc att cct ctg gtc agc gat gag tgc acg cca aac aag acg cat atc    528
Gly Ile Pro Leu Val Ser Asp Glu Cys Thr Pro Asn Lys Thr His Ile
    145                 150                 155
tat cca atc tac tgg ccc acc ggc acg aac agc tcg ggc agc act cgg    576
Tyr Pro Ile Tyr Trp Pro Thr Gly Thr Asn Ser Ser Gly Ser Thr Arg
160                 165                 170                 175
gaa atg cgt ctg cat cct gac gat acg cac atg ggc tgg agc tca ttc    624
Glu Met Arg Leu His Pro Asp Asp Thr His Met Gly Trp Ser Ser Phe
                180                 185                 190
acc agt ggt ggt caa ttc gca tac ttt ggt cga ctg cag ttc cgt caa    672
Thr Ser Gly Gly Gln Phe Ala Tyr Phe Gly Arg Leu Gln Phe Arg Gln
            195                 200                 205
aat cca acc gac ggg aca ctt cgt gtt cca aga tat gat ctc gtc gat    720
Asn Pro Thr Asp Gly Thr Leu Arg Val Pro Arg Tyr Asp Leu Val Asp
        210                 215                 220
gtc aat ctg ctc gtc cag ccc aat ggt act gcg cct atc atg gcc cag    768
Val Asn Leu Leu Val Gln Pro Asn Gly Thr Ala Pro Ile Met Ala Gln
    225                 230                 235
ggc tct gaa ctg aag atc cat aat gaa gct att aca gtt ggt gag ctt    816
Gly Ser Glu Leu Lys Ile His Asn Glu Ala Ile Thr Val Gly Glu Leu
240                 245                 250                 255
cgc gga ttc agc ggc gcc gga gac gag atc ctg tac att ggg tcg aca    864
Arg Gly Phe Ser Gly Ala Gly Asp Glu Ile Leu Tyr Ile Gly Ser Thr
                260                 265                 270
cgt gag gca aac aac att gat ctc ttt gcg gtc cat atc act act ggc    912
Arg Glu Ala Asn Asn Ile Asp Leu Phe Ala Val His Ile Thr Thr Gly
            275                 280                 285
gct gtt cgc cgt ctc acc agt cac cct gag tac gct gat ccc att gcc    960
Ala Val Arg Arg Leu Thr Ser His Pro Glu Tyr Ala Asp Pro Ile Ala
        290                 295                 300
ttt tca cat gac aac caa tgg ttc gtc acc atg gac act cgt ggc tca    1008
Phe Ser His Asp Asn Gln Trp Phe Val Thr Met Asp Thr Arg Gly Ser
    305                 310                 315
aat cga cag atg tgg atg gct ggg gag cgg tat att cct cct ctg att    1056
Asn Arg Gln Met Trp Met Ala Gly Glu Arg Tyr Ile Pro Pro Leu Ile
320                 325                 330                 335
gac ctg gtc act gtc aca gct gct tca tca act cgc aat aac ggc gcg    1104
Asp Leu Val Thr Val Thr Ala Ala Ser Ser Thr Arg Asn Asn Gly Ala
                340                 345                 350
cgc cgc ttc ttt cag cca atc ctg atc gat cgt tac ggt gat cgg gga    1152
Arg Arg Phe Phe Gln Pro Ile Leu Ile Asp Arg Tyr Gly Asp Arg Gly
            355                 360                 365
gac tac ttt ggt caa cga gtc aac tat caa ggc gac gga agc aat ggc    1200
Asp Tyr Phe Gly Gln Arg Val Asn Tyr Gln Gly Asp Gly Ser Asn Gly
        370                 375                 380
agt gtc aac gac ccg aat tgg aat ggc aga gca gac cca gcc ttc tct    1248
Ser Val Asn Asp Pro Asn Trp Asn Gly Arg Ala Asp Pro Ala Phe Ser
    385                 390                 395
ccc gat gga act cgt atc gtc tat tgg cag gcc ttg gtg att cca cct    1296
Pro Asp Gly Thr Arg Ile Val Tyr Trp Gln Ala Leu Val Ile Pro Pro
400                 405                 410                 415
gcc tgc ggt ggt gca aat cca ctc ccc tgc cca gtg tca act gcc caa    1344
Ala Cys Gly Gly Ala Asn Pro Leu Pro Cys Pro Val Ser Thr Ala Gln
                420                 425                 430
gga ggt cga aca tac cga gtg atg ctg gca cgt ctt tca gat cgc aaa    1392
Gly Gly Arg Thr Tyr Arg Val Met Leu Ala Arg Leu Ser Asp Arg Lys
            435                 440                 445
cac acg gac cca gcc cct gtt ttt gct gcg cca gat tat att tct tgg    1440
His Thr Asp Pro Ala Pro Val Phe Ala Ala Pro Asp Tyr Ile Ser Trp
        450                 455                 460
gcg act ccg ttc cca cca ggt gca ggt ctt cct acg tct tat acc ctg    1488
Ala Thr Pro Phe Pro Pro Gly Ala Gly Leu Pro Thr Ser Tyr Thr Leu
    465                 470                 475
cct gcg ggt aac tac act ctc tac ggc aag gct act ggg ctt gca aat    1536
Pro Ala Gly Asn Tyr Thr Leu Tyr Gly Lys Ala Thr Gly Leu Ala Asn
480                 485                 490                 495
gcc acc ctg acc agg gac cca ctt ttc ggc agc ttt aag act gta tcc    1584
Ala Thr Leu Thr Arg Asp Pro Leu Phe Gly Ser Phe Lys Thr Val Ser
                500                 505                 510
gtc aac tac acg aat ttc tca gat gat ggc cag cac ttt atc aat ggc    1632
Val Asn Tyr Thr Asn Phe Ser Asp Asp Gly Gln His Phe Ile Asn Gly
            515                 520                 525
tat gaa tct gtt act ctg acg ttg tct gcc tcg aac cct tgg ctt agc    1680
Tyr Glu Ser Val Thr Leu Thr Leu Ser Ala Ser Asn Pro Trp Leu Ser
        530                 535                 540
cat ttg gac tgg gtc tcc gat att gtg cag act ggt gct gtg aac gct    1728
His Leu Asp Trp Val Ser Asp Ile Val Gln Thr Gly Ala Val Asn Ala
    545                 550                 555
gtt aag gag act ggg tct ggt gga ttt cat ttg aca atc gat gca cag    1776
Val Lys Glu Thr Gly Ser Gly Gly Phe His Leu Thr Ile Asp Ala Gln
560                 565                 570                 575
gag aac att ttt gag gct aat ggg aca ctg act acg act gtt gat ggc    1824
Glu Asn Ile Phe Glu Ala Asn Gly Thr Leu Thr Thr Thr Val Asp Gly
                580                 585                 590
gtg acc tac cac cag ccg ctc aat ggt gca tga                        1857
Val Thr Tyr His Gln Pro Leu Asn Gly Ala
            595                 600
<210>6
<211>618
<212>PRT
<213>Eupenicillium brefeldianum PF1226
<400>6
Met Arg Trp Ser Phe Ser Val Val Leu Ser Thr Ala Ala Leu Gly Ile
        -15                 -10                  -5
Ser Ser Thr Thr Pro Ala Pro Pro Gln Pro Glu Pro Ile Glu Val Val
 -1   1               5                  10                  15
Glu Leu Pro Leu Pro Pro Val Ala Pro Ser Asn Ser Thr Gly Ala Cys
                 20                  25                  30
Thr Ala Ser Ile Asn Pro His Arg Thr Gly Cys Ile Ala Gln Val Ser
             35                  40                  45
Asp Ser Phe Gln Ala Gly Asp Phe Thr Pro Asp Gly Asn His Val Val
         50                  55                  60
Ile Thr Val Glu Phe Val Gly Ala Pro Ala Ala Pro Asp Pro Ala Ser
     65                  70                  75
Ile Tyr Ser Gly Glu His Ile Ile Leu Val Lys Ala Asp Gly Thr Thr
 80                  85                  90                  95
Phe Thr Asn Gly Asp Ala Trp Lys Cys Leu Ser Cys Gly Val Pro Ser
               100                  105                 110
Lys Asn Ala Leu Ser Leu Asp Pro Gln Arg Asp Tyr Pro His Val Ala
            115                 120                 125
Arg Asn Ser Arg Gln Ala Leu Trp Gly His Asn Ile Leu Asp Cys Ser
        130                 135                 140
Gly Ile Pro Leu Val Ser Asp Glu Cys Thr Pro Asn Lys Thr His Ile
    145                 150                 155
Tyr Pro Ile Tyr Trp Pro Thr Gly Thr Asn Ser Ser Gly Ser Thr Arg
160                 165                 170                 175
Glu Met Arg Leu His Pro Asp Asp Thr His Met Gly Trp Ser Ser Phe
                180                 185                 190
Thr Ser Gly Gly Gln Phe Ala Tyr Phe Gly Arg Leu Gln Phe Arg Gln
            195                 200                 205
Asn Pro Thr Asp Gly Thr Leu Arg Val Pro Arg Tyr Asp Leu Val Asp
        210                 215                 220
Val Asn Leu Leu Val Gln Pro Asn Gly Thr Ala Pro Ile Met Ala Gln
    225                 230                 235
Gly Ser Glu Leu Lys Ile His Asn Glu Ala Ile Thr Val Gly Glu Leu
240                 245                 250                 255
Arg Gly Phe Ser Gly Ala Gly Asp Glu Ile Leu Tyr Ile Gly Ser Thr
                260                 265                 270
Arg Glu Ala Asn Asn Ile Asp Leu Phe Ala Val His Ile Thr Thr Gly
            275                 280                 285
Ala Val Arg Arg Leu Thr Ser His Pro Glu Tyr Ala Asp Pro Ile Ala
        290                 295                 300
Phe Ser His Asp Asn Gln Trp Phe Val Thr Met Asp Thr Arg Gly Ser
    305                 310                 315
Asn Arg Gln Met Trp Met Ala Gly Glu Arg Tyr Ile Pro Pro Leu Ile
320                 325                 330                 335
Asp Leu Val Thr Val Thr Ala Ala Ser Ser Thr Arg Asn Asn Gly Ala
                340                 345                 350
Arg Arg Phe Phe Gln Pro Ile Leu Ile Asp Arg Tyr Gly Asp Arg Gly
            355                 360                 365
Asp Tyr Phe Gly Gln Arg Val Asn Tyr Gln Gly Asp Gly Ser Asn Gly
        370                 375                 380
Ser Val Asn Asp Pro Asn Trp Asn Gly Arg Ala Asp Pro Ala Phe Ser
    385                 390                 395
Pro Asp Gly Thr Arg Ile Val Tyr Trp Gln Ala Leu Val Ile Pro Pro
400                 405                 410                 415
Ala Cys Gly Gly Ala Asn Pro Leu Pro Cys Pro Val Ser Tbr Ala Gln
                420                 425                 430
Gly Gly Arg Thr Tyr Arg Val Met Leu Ala Arg Leu Ser Asp Arg Lys
            435                 440                 445
His Thr Asp Pro Ala Pro Val Phe Ala Ala Pro Asp Tyr Ile Ser Trp
        450                 455                 460
Ala Thr Pro Phe Pro Pro Gly Ala Gly Leu Pro Thr Ser Tyr Thr Leu
    465                 470                 475
Pro Ala Gly Asn Tyr Thr Leu Tyr Gly Lys Ala Thr Gly Leu Ala Asn
480                 485                 490                 495
Ala Thr Leu Thr Arg Asp Pro Leu Phe Gly Ser Phe Lys Thr Val Ser
                500                 505                 510
Val Asn Tyr Thr Asn Phe Ser Asp Asp Gly Gln His Phe Ile Asn Gly
            515                 520                 525
Tyr Glu Ser Val Thr Leu Thr Leu Ser Ala Ser Asn Pro Trp Leu Ser
        530                 535                 540
His Leu Asp Trp Val Ser Asp Ile Val Gln Thr Gly Ala Val Asn Ala
    545                 550                 555
Val Lys Glu Thr Gly Ser Gly Gly Phe His Leu Thr Ile Asp Ala Gln
560                 565                 570                 575
Glu Asn Ile Phe Glu Ala Asn Gly Thr Leu Thr Thr Thr Val Asp Gly
                580                 585                 590
Val Thr Tyr His Gln Pro Leu Asn Gly Ala
            595                 600
<210>7
<211>19
<212>PRT
<213>侵菅新赤壳侵菅变种PF1225菌株(Neocosmospora vasinfecta variety vasinfecta
P1225)
<400>7
Ala Ser Pro Pro Ala Ser Val Pro Asn Asn Pro Ser Ser Glu Glu Ile
  1               5                  10                  15
Thr Leu Gln
<210>8
<211>8
<212>PRT
<213>侵菅新赤壳侵菅变种PF1225菌株(Neocosmospora vasinfecta variety vasinfecta
P1225)
<400>8
Leu Val Phe Asn Pro Ser Pro Lys
  1               5
<210>9
<211>15
<212>PRT
<213>侵菅新赤壳侵菅变种PF1225菌株(Neocosmospora vasinfecta variety vasinfecta
P1225)
<400>9
Trp Asn Val Ala Ala Asp Gly Ser Gly Pro Ser Gly Glu Ile Arg
  1               5                  10              15
<210>10
<211>16
<212>PRT
<213>侵菅新赤壳侵菅变种PF1225菌株(Neocosmospora vasinfecta variety vasinfecta
P1225)
<400>10
Val Thr Ile Leu His Asn Pro Glu Gly Val Ala Pro Ile Thr Ala Lys
  1               5                  10                  15
<210>11
<211>17
<212>PRT
<213>侵菅新赤壳侵菅变种PF1225菌株(Neocosmospora vasinfecta variety vasinfecta
P1225)
<400>11
Glu His Ser Asp Thr Ile Pro Trp Gly Val Pro Tyr Val Pro Gly Ser
  1               5                  10                  15
Gln
<210>12
<211>13
<212>PRT
<213>侵菅新赤壳侵菅变种PF1225菌株(Neocosmospora vasinfecta variety vasinfecta
P1225)
<400>12
Leu Thr Asp Tyr Ser Phe Asp Trp Tyr Ser Asp Ile Arg
  1               5                  10
<210>13
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<220>
<221>modified_base
<222>(3)
<223>i
<220>
<221>modified_base
<222>(6)
<223>i
<400>13
ccngcntcng tnccnaa                                                 17
<210>14
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<220>
<221>modified_base
<222>(3)
<223>i
<220>
<221>modified_base
<222>(6)
<223>i
<400>14
ccngcnagyg tnccnaa                                                17
<210>15
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<220>
<221>modified_base
<222>(6)
<223>i
<400>15
ccrtcngcng cnacrtt                                                17
<210>16
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<220>
<221>modified_base
<222>(6)
<223>i
<400>16
ccccanggda tngtrtc                                                17
<210>17
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<220>
<221>modified_base
<222>(3)
<223>i
<400>17
acnccytcng grttrtg                                                17
<210>18
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>18
tgacgctgat accaacggcg                                             20
<210>19
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>19
ctagtggcag tattggacag                                              20
<210>20
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>20
cccaggcctt taaggatggc                                              20
<210>21
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>21
ctgcttgagg gtaatgggct c                                            21
<210>22
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>22
acagacgccg gaggagaagc g                                           21
<210>23
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>23
gggcatatgg cttctcctcc tgcttctg                                    28
<210>24
<211>33
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>24
gggggatcct taagtgccgc tctgaggact acg                              33
<210>25
<211>39
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>25
gggcccgggg cgcatcatgc acttctttga caaagcgac                        39
<210>26
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>26
gggctgcagt taagtgccgc tctgaggact                                  30
<210>27
<211>13
<212>PRT
<213>曲霉属种名待定PF122菌株(Aspergillus sp.PF1224)
<400>27
Leu Tyr Asn Pro Asp Ser Pro Gln Pro Ile Ser Ala Lys
  1               5                  10
<210>28
<211>8
<212>PRT
<213>曲霉属种名待定PF122菌株(Aspergillus sp.PF1224)
<400>28
Leu Gln Phe Asn Pro Ala Pro Lys
  1               5
<210>29
<211>17
<212>PRT
<213>曲霉属种名待定PF122菌株(Aspergillus sp.PF1224)
<400>29
Val Asp Trp Phe Ser Asp Leu Thr Ser Thr Gly Gln Val Thr Gly Ser
  1               5                  10                  15
Lys
<210>30
<211>14
<212>PRT
<213>曲霉属种名待定PF122菌株(Aspergillus sp.PF1224)
<400>30
Gly Glu Val Ser Gly Ser Ala Ser Val Ser Ile Ile His Asp
  1               5                  10
<210>31
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<220>
<221>modified_base
<222>(9)
<223>i
<400>31
tayaayccng aytcncc                                                17
<210>32
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>32
tayaayccng ayagycc                                                17
<210>33
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<220>
<221>modified_base
<222>(12)
<223>i
<400>33
carttyaayc cngcncc                                                17
<210>34
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<220>
<221>modified_base
<222>(3)
<223>i
<400>34
ggngcnggrt traaytg                                                17
<210>35
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>35
aartcngara accartc                                                17
<210>36
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>36
aartcrctra accartc                                                17
<210>37
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>37
cctcgatacc cgagggaccg                                             20
<210>38
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>38
gatgggttgc atgttatcgc                                             20
<210>39
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>39
gcgataacat gcaacccatc                                             20
<210>40
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>40
gaccacctgg ttcagtggtg                                             20
<210>41
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>41
gggttataga gtctggtaac g                                           21
<210>42
<211>39
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>42
gggaggcctg cgcatcatgc atgttgtcgc aagtaccac                        39
<210>43
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>43
gggctcgagt acctcaagtc ccatttgccg gctgc                            35
<210>44
<211>12
<212>PRT
<213>Eupenicillium brefeldianum PF1226
<400>44
Ser Thr Thr Pro Ala Pro Pro Gln Pro Glu Pro Ile
  1               5                  10
<210>45
<211>11
<212>PRT
<213>Eupenicillium brefeldianum PF1226
<400>45
Ala Asp Pro Ala Phe Ser Pro Asp Gly Thr Arg
  1               5                  10
<210>46
<211>13
<212>PRT
<213>Eupenicillium brefeldianum PF1226
<400>46
Leu His Pro Asp Asp Thr His Met Gly Trp Ser Ser Phe
  1               5                  10
<210>47
<211>16
<212>PRT
<213>Eupenicillium brefeldianum PF1226
<400>47
Gly Phe Ser Gly Ala Gly Asp Glu Ile Leu Tyr Ile Gly Ser Thr Arg
  1               5                  10                  15
<210>48
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<220>
<221>modified_base
<222>(3)
<223>i
<400>48
ccncarccng arccnat                                                17
<210>49
<211>17
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<220>
<221>modified_base
<222>(6)
<223>i
<400>49
ctraangcng grtcngc                                                17
<210>50
<211>18
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>50
ccancccatr tgngtrtc                                               18
<210>51
<211>37
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>51
gggcccgggc tcagactacc ccggcacctc ctcagcc                          37
<210>52
<211>38
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>52
gggctcgagt acctcatgca ccattgagcg gctggtgg                         38
<210>53
<211>1917
<212>DNA
<213>侵菅新赤壳侵菅变种PF1225菌株(Neocosmospora vasinfecta variety vasinfecta
P1225)
<220>
<221>CDS
<222>(1)..(1914)
<220>
<221>mat_peptide
<222>(79)..(1914)
<400>53
atg cac ttc ttt gac aaa gcg act gtc tac gct ata ctc tgc ggt agc    48
Met His Phe Phe Asp Lys Ala Thr Val Tyr Ala Ile Leu Cys Gly Ser
    -25                 -20                 -15
gtg gcc cag act gtt cac act gca ccc tcc gct tct cct cct gct tct    96
Val Ala Gln Thr Val His Thr Ala Pro Ser Ala Ser Pro Pro Ala Ser
-10                  -5              -1   1               5
gtt cca aac cct cct tct cct gag ccc att acc ctc aag cag cta cct    144
Val Pro Asn Pro Pro Ser Pro Glu Pro Ile Thr Leu Lys Gln Leu Pro
             10                  15                  20
ctt cct ccc atc tcc cct agc gac gac gtc ggt gct tgc acg aag cag    192
Leu Pro Pro Ile Ser Pro Ser Asp Asp Val Gly Ala Cys Thr Lys Gln
         25                  30                  35
atc aac tct cgt gga acg gga tgt ctc gcc aac ggc gtt ttt gsa acg    240
Ile Asn Ser Arg Gly Thr Gly Cys Leu Ala Asn Gly Val Phe Glu Thr
     40                  45                  50
ttt cag tct ggt gac ttt tta cct gat gga aag cat gtc atc gcc atg    288
Phe Gln Ser Gly Asp Phe Leu Pro Asp Gly Lys His Val Ile Ala Met
 55                  60                  65                  70
gtc aac ttt act ggt gcg cct gct gct ccg gct gcg gga agc atc tac    336
Val Asn Phe Thr Gly Ala Pro Ala Ala Pro Ala Ala Gly Ser Ile Tyr
                 75                  80                  85
tct ggc ccg cag gtc atc atc gtc aag acg gat ggc aag aca ttt cct    384
Ser Gly Pro Gln Val Ile Ile Val Lys Thr Asp Gly Lys Thr Phe Pro
             90                  95                 100
aac gga gac ccc tgg aag tgc atc acc tgt ggt gtc cct gag aag aac    432
Asn Gly Asp Pro Trp Lys Cys Ile Thr Cys Gly Val Pro Glu Lys Asn
        105                 110                 115
gcc gtt ggt atc agc gtc aag tat gac tac ccc cag gcc ttt aag gat    480
Ala Val Gly Ile Ser Val Lys Tyr Asp Tyr Pro Gln Ala Phe Lys Asp
    120                 125                 130
ggc aaa cgt ctt ctc atc gga cac aat att ctc gac tgc ggc acc aac    528
Gly Lys Arg Leu Leu Ile Gly His Asn Ile Leu Asp Cys Gly Thr Ash
135                 140                 145                 150
cag ttg acg agc gag agc tgc aag cca gat aac acc cac atc tac cct    576
Gln Leu Thr Ser Glu Ser Cys Lys Pro Asp Asn Thr His Ile Tyr Pro
                155                 160                 165
atc cgc tgg aat gtt gct gcc gac ggt tcc ggc ccg agc ggt gaa atc    624
Ile Arg Trp Asn Val Ala Ala Asp Gly Ser Gly Pro Ser Gly Glu Ile
            170                 175                 180
cgt gag ctg cgg tta cac ccg gac aat gtc cat ctc gag ttt agc tct    672
Arg Glu Leu Arg Leu His Pro Asp Asn Val His Leu Glu Phe Ser Ser
        185                 190                 195
ttc acc ttt gct agt ggc agt att gga cag tat gcc tac ttt tct cgg    720
Phe Thr Phe Ala Ser Gly Ser Ile Gly Gln Tyr Ala Tyr Phe Ser Arg
    200                 205                 210
ctc gtt ttc aat cct tcg ccc aag act gga act ccc ctt gcg ccg cgg    768
Leu Val Phe Asn Pro Ser Pro Lys Thr Gly Thr Pro Leu Ala Pro Arg
215                 220                 225                 230
tat gac ctg gaa aag gtt act att ctg cac aac ccc gag ggc gtt gcc    816
Tyr Asp Leu Glu Lys Val Thr Ile Leu His Asn Pro Glu Gly Val Ala
                235                 240                 245
cct atc acg gcc aag ggt aag gtt ctg tct ctg aac ccc cag gct att    864
Pro Ile Thr Ala Lys Gly Lys Val Leu Ser Leu Asn Pro Gln Ala Ile
            250                 255                 260
tcg gtt ggc gag gct cgt ggc ttc aac ggc gac gga act gag ctc act    912
Ser Val Gly Glu Ala Arg Gly Phe Asn Gly Asp Gly Thr Glu Leu Thr
        265                 270                 275
tat gtc gga agc aat att gag agc tgt aat aat gat gtc ttt gcc gtt    960
Tyr Val Gly Ser Asn Ile Glu Ser Cys Asn Asn Asp Val Phe Ala Val
    280                 285                 290
cat ctt caa act gga gtt gtt cga cgt ctt acc aac cat ccc gag tat    1008
His Leu Gln Thr Gly Val Val Arg Arg Leu Thr Asn His Pro Glu Tyr
295                 300                 305                 310
cct gac cct ctg gct ttc tcg cct gat aac aaa tgg atg gct gtc atg    1056
Pro Asp Pro Leu Ala Phe Ser Pro Asp Asn Lys Trp Met Ala Val Met
                315                 320                 325
gat acc cgc gga agt ggt cgc aac atg ttt att gcc ggc atg cga gga    1104
Asp Thr Arg Gly Ser Gly Arg Asn Met Phe Ile Ala Gly Met Arg Gly
            330                 335                 340
atc ccg ccc ctg gtt gat att gtt ggc ggt att ctg cca gcg tcg tct    1152
Ile Pro Pro Leu Val Asp Ile Val Gly Gly Ile Leu Pro Ala Ser Ser
        345                 350                 355
cgc sac aac ggt ctt cgt cgc ttc ttc cag ccg tac ctg ctt gat ttt    1200
Arg Asn Asn Gly Leu Arg Arg Phe Phe Gln Pro Tyr Leu Leu Asp Phe
    360                 365                 370
tat ggt gac cgc ggt gac tac tac ggc caa aag ttc aac gga gat aac    1248
Tyr Gly Asp Arg Gly Asp Tyr Tyr Gly Gln Lys Phe Asn Gly Asp Asn
375                 380                 385                 390
aat ggc gtg cct ggg agt ggt gcc atc aac gat cct gag tgg aac ggt    1296
Asn Gly Val Pro Gly Ser Gly Ala Ile Asn Asp Pro Glu Trp Asn Gly
                395                 400                 405
atg gct gat ccg aga tgg tct cct gac cgc agg cag ctc gtc ttt tgg    1344
Met Ala Asp Pro Arg Trp Ser Pro Asp Arg Arg Gln Leu Val Phe Trp
            410                 415                 420
cag act cat acc gtc tcc cct tct tgt ggc ggc gcc aac cct ctc cct    1392
Gln Thr His Thr Val Ser Pro Ser Cys Gly Gly Ala Asn Pro Leu Pro
        425                 430                 435
tgc tac cct tcg aaa gag caa ggt ggc cgt aac tat cgc atg tac atc    1440
Cys Tyr Pro Ser Lys Glu Gln Gly Gly Arg Asn Tyr Arg Met Tyr Ile
    440                 445                 450
gcg acc ttt act agc cgc agc cca agc cct cct gcc ccg gtg aag gag    1488
Ala Thr Phe Thr Ser Arg Ser Pro Ser Pro Pro Ala Pro Val Lys Glu
455                 460                 465                 470
cac tcc gat acc atc ccc tgg ggc gtc ccg tac gtt ccc gga tct cag    1536
His Ser Asp Thr Ile Pro Trp Gly Val Pro Tyr Val Pro Gly Ser Gln
                475                 480                 485
gtt act cca aag cct ggc ttg gcg ggc ggt atc tac acg ctc tac ggc    1584
Val Thr Pro Lys Pro Gly Leu Ala Gly Gly Ile Tyr Thr Leu Tyr Gly
            490                 495                 500
aag gct tcg ggc gag gcc aag gtc aac atc acc tgg ggt gag gca ccc    1632
Lys Ala Ser Gly Glu Ala Lys Val Asn Ile Thr Trp Gly Glu Ala Pro
        505                 510                 515
gag att gga acc gtc agc gtc gtg tac aag gac tat tcg ctc gac ggc    1680
Glu Ile Gly Thr Val Ser Val Val Tyr Lys Asp Tyr Ser Leu Asp Gly
    520                 525                 530
aag agc ttc ctc aac ggg aac gag agc gtc acg ggg tct gtc gag aga    1728
Lys Ser Phe Leu Asn Gly Asn Glu Ser Val Thr Gly Ser Val Glu Arg
535                 540                 545                 550
ctg act gac tat tct ttt gac tgg tat tcg gat att cgc cag acg gga    1776
Leu Thr Asp Tyr Ser Phe Asp Trp Tyr Ser Asp Ile Arg Gln Thr Gly
                555                 560                 565
gct gtc aag gga acc aag aag acg agc cct ggt gga ttc cat gct aat    1824
Ala Val Lys Gly Thr Lys Lys Thr Ser Pro Gly Gly Phe His Ala Asn
            570                 575                 580
att gat gtc atg atc aac gac ctg act tca act ggt act ctt acc acg    1872
Ile Asp Val Met Ile Asn Asp Leu Thr Ser Thr Gly Thr Leu Thr Thr
        585                 590                 595
act ctg gat ggt gtt gag tgg cgt agt cct cag agc ggc act taa        1917
Thr Leu Asp Gly Val Glu Trp Arg Ser Pro Gln Ser Gly Thr
    600                 605                 610
<210>54
<211>638
<212>PRT
<213>侵菅新赤壳侵菅变种PF1225菌株(Neocosmospora vasinfecta variety vasinfecta
P1225)
<400>54
Met His Phe Phe Asp Lys Ala Thr Val Tyr Ala Ile Leu Cys Gly Ser
    -25                 -20                 -15
Val Ala Gln Thr Val His Thr Ala Pro Ser Ala Ser Pro Pro Ala Ser
-10                  -5              -1   1               5
Val Pro Asn Pro Pro Ser Pro Glu Pro Ile Thr Leu Lys Gln Leu Pro
             10                  15                  20
Leu Pro Pro Ile Ser Pro Ser Asp Asp Val Gly Ala Cys Thr Lys Gln
         25                  30                  35
Ile Asn Ser Arg Gly Thr Gly Cys Leu Ala Asn Gly Val Phe Glu Thr
     40                  45                  50
Phe Gln Ser Gly Asp Phe Leu Pro Asp Gly Lys His Val Ile Ala Met
 55                  60                  65                  70
Val Asn Phe Thr Gly Ala Pro Ala Ala Pro Ala Ala Gly Ser Ile Tyr
                 75                  80                  85
Ser Gly Pro Gln Val Ile Ile Val Lys Thr Asp Gly Lys Thr Phe Pro
             90                  95                 100
Asn Gly Asp Pro Trp Lys Cys Ile Thr Cys Gly Val Pro Glu Lys Asn
        105                 110                 115
Ala Val Gly Ile Ser Val Lys Tyr Asp Tyr Pro Gln Ala Phe Lys Asp
    120                 125                 130
Gly Lys Arg Leu Leu Ile Gly His Asn Ile Leu Asp Cys Gly Thr Asn
135                 140                 145                 150
Gln Leu Thr Ser Glu Ser Cys Lys Pro Asp Asn Thr His Ile Tyr Pro
                155                 160                 165
Ile Arg Trp Asn Val Ala Ala Asp Gly Ser Gly Pro Ser Gly Glu Ile
            170                 175                 180
Arg Glu Leu Arg Leu His Pro Asp Asn Val His Leu Glu Phe Ser Ser
        185                 190                 195
Phe Thr Phe Ala Ser Gly Ser Ile Gly Gln Tyr Ala Tyr Phe Ser Arg
    200                 205                 210
Leu Val Phe Asn Pro Ser Pro Lys Thr Gly Thr Pro Leu Ala Pro Arg
215                 220                 225                 230
Tyr Asp Leu Glu Lys Val Thr Ile Leu His Asn Pro Glu Gly Val Ala
                235                 240                 245
Pro Ile Thr Ala Lys Gly Lys Val Leu Ser Leu Asn Pro Gln Ala Ile
           250                 255                 260
Ser Val Gly Glu Ala Arg Gly Phe Asn Gly Asp Gly Thr Glu Leu Thr
        265                 270                 275
Tyr Val Gly Ser Asn Ile Glu Ser Cys Asn Asn Asp Val Phe Ala Val
    280                 285                 290
His Leu Gln Thr Gly Val Val Arg Arg Leu Thr Asn His Pro Glu Tyr
295                 300                 305                 310
Pro Asp Pro Leu Ala Phe Ser Pro Asp Asn Lys Trp Met Ala Val Met
                315                 320                 325
Asp Thr Arg Gly Ser Gly Arg Asn Met Phe Ile Ala Gly Met Arg Gly
            330                 335                 340
Ile Pro Pro Leu Val Asp Ile Val Gly Gly Ile Leu Pro Ala Ser Ser
        345                 350                 355
Arg Asn Asn Gly Leu Arg Arg Phe Phe Gln Pro Tyr Leu Leu Asp Phe
    360                 365                 370
Tyr Gly Asp Arg Gly Asp Tyr Tyr Gly Gln Lys Phe Asn Gly Asp Asn
375                 380                 385                 390
Asn Gly Val Pro Gly Ser Gly Ala Ile Asn Asp Pro Glu Trp Asn Gly
                395                 400                 405
Met Ala Asp Pro Arg Trp Ser Pro Asp Arg Arg Gln Leu Val Phe Trp
            410                 415                 420
Gln Thr His Thr Val Ser Pro Ser Cys Gly Gly Ala Asn Pro Leu Pro
        425                 430                 435
Cys Tyr Pro Ser Lys Glu Gln Gly Gly Arg Asn Tyr Arg Met Tyr Ile
    440                 445                 450
Ala Thr Phe Thr Ser Arg Ser Pro Ser Pro Pro Ala Pro Val Lys Glu
455                 460                 465                 470
His Ser Asp Thr Ile Pro Trp Gly Val Pro Tyr Val Pro Gly Ser Gln
                475                 480                 485
Val Thr Pro Lys Pro Gly Leu Ala Gly Gly Ile Tyr Thr Leu Tyr Gly
            490                 495                 500
Lys Ala Ser Gly Glu Ala Lys Val Asn Ile Thr Trp Gly Glu Ala Pro
        505                 510                 515
Glu Ile Gly Thr Val Ser Val Val Tyr Lys Asp Tyr Ser Leu Asp Gly
    520                 525                 530
Lys Ser Phe Leu Asn Gly Asn Glu Ser Val Thr Gly Ser Val Glu Arg
535                 540                 545                 550
Leu Thr Asp Tyr Ser Phe Asp Trp Tyr Ser Asp Ile Arg Gln Thr Gly
                555                 560                 565
Ala Val Lys Gly Thr Lys Lys Thr Ser Pro Gly Gly Phe His Ala Asn
            570                 575                 580
Ile Asp Val Met Ile Asn Asp Leu Thr Ser Thr Gly Thr Leu Thr Thr
        585                 590                 595
Thr Leu Asp Gly Val Glu Trp Arg Ser Pro Gln Ser Gly Thr
    600                 605                 610

Claims (20)

1.蛋白质,该蛋白质选自下述各项:
(a)含有选自SEQ ID NO.2、4和6所示氨基酸序列的氨基酸序列的蛋白质;
(b)含有与包含上述(a)的氨基酸序列的蛋白质具有至少50%同源性的氨基酸序列,且具皂草苷分解活性的蛋白质;和
(c)含有上述(a)的氨基酸序列中缺失、置换、插入或添加1个或多个氨基酸残基的氨基酸序列,且具皂草苷分解活性的蛋白质。
2.多核苷酸,该多核苷酸编码权利要求1所述的蛋白质。
3.多核苷酸,该多核苷酸选自下述各项:
(i)由选自SEQ ID NO.1、3和5所示碱基序列的碱基序列构成的多核苷酸;
(ii)由与上述(i)的碱基序列构成的多核苷酸具有至少70%同源性的碱基序列构成,且编码具皂草苷分解活性的蛋白质的多核苷酸;
(iii)由上述(i)的碱基序列中缺失、置换、插入或添加1个或多个碱基的碱基序列构成,且编码具皂草苷分解活性的蛋白质的多核苷酸;和
(iv)与上述(i)的碱基序列构成的多核苷酸在严格条件下杂交,且编码具皂草苷分解活性的蛋白质的多核苷酸。
4.权利要求3所述的多核苷酸,其中所述(ii)由与(i)的碱基序列构成的多核苷酸具有至少80%同源性的碱基序列构成。
5.权利要求3所述的多核苷酸,其中所述(ii)由与(i)的碱基序列构成的多核苷酸具有至少90%同源性的碱基序列构成。
6.权利要求2-5中任一项所述的多核苷酸,所述多核苷酸来自丝状菌。
7.权利要求6所述的多核苷酸,其中所述丝状菌属于新赤壳属(Neocosmospora)、正青霉属(Eupenicillium)或曲霉属(Aspergillus)。
8.权利要求7所述的多核苷酸,其中属于新赤壳属的丝状菌为侵菅新赤壳侵菅变种PF1225菌株(Neocosmospora vasinfecta var.vasinfecta PF1225)(保藏号FERM BP-7475)或其突变菌株。
9.权利要求7所述的多核苷酸,其中属于正青霉属的丝状菌为Eupenicillium brefeldianum PF1226(保藏号FERM BP-7476)或其突变菌株。
10.权利要求7所述的多核苷酸,其中属于曲霉属的丝状菌为曲霉属种名待定PF1224菌株(Aspergillus sp.PF1224)(保藏号FERM BP-8004)或其突变菌株。
11.重组载体,该重组载体含有权利要求2-10中任一项记载的多核苷酸。
12.宿主,该宿主是由权利要求11记载的重组载体转化的。
13.权利要求12所述的宿主,该宿主是微生物。
14.权利要求13所述的宿主,该宿主是丝状菌。
15.权利要求14所述的宿主,其中丝状菌属于木霉属(Trichoderma)。
16.权利要求15所述的宿主,该宿主是绿色木霉MC300-1菌株(Trichoderma viride MC300-1)(保藏号FERM BP-6047)或其突变菌株。
17.权利要求12-16中任一项所述的宿主,该宿主表达皂草苷分解酶。
18.目标蛋白质的生产方法,该方法包括培养权利要求12-17中任一项所述的宿主,从获得的培养物中收集具皂草苷分解活性的蛋白质。
19.大豆皂草精醇B的生产方法,该方法包括使用含有可由权利要求12-17中任一项所述的宿主获得的具皂草苷分解活性的蛋白质的培养物,分解以大豆皂草精醇B为糖苷配基的苷。
20.大豆皂草精醇B的生产方法,该方法包括使用至少一种选自权利要求1所述的蛋白质和可由权利要求12-17中任一项所述的宿主获得的蛋白质,分解以大豆皂草精醇B为糖苷配基的苷。
CNB028153634A 2001-06-06 2002-06-06 皂草苷分解酶及其基因以及大豆皂草精醇b的大量生产系统 Expired - Fee Related CN100439504C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP171604/2001 2001-06-06
JP2001171604 2001-06-06

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CNA2006101256646A Division CN101037680A (zh) 2001-06-06 2002-06-06 皂草苷分解酶及其基因以及大豆皂草精醇b的大量生产系统
CNA2006101256608A Division CN1982444A (zh) 2001-06-06 2002-06-06 皂草苷分解酶及其基因以及大豆皂草精醇b的大量生产系统

Publications (2)

Publication Number Publication Date
CN1539017A true CN1539017A (zh) 2004-10-20
CN100439504C CN100439504C (zh) 2008-12-03

Family

ID=19013351

Family Applications (3)

Application Number Title Priority Date Filing Date
CNA2006101256646A Pending CN101037680A (zh) 2001-06-06 2002-06-06 皂草苷分解酶及其基因以及大豆皂草精醇b的大量生产系统
CNB028153634A Expired - Fee Related CN100439504C (zh) 2001-06-06 2002-06-06 皂草苷分解酶及其基因以及大豆皂草精醇b的大量生产系统
CNA2006101256608A Pending CN1982444A (zh) 2001-06-06 2002-06-06 皂草苷分解酶及其基因以及大豆皂草精醇b的大量生产系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNA2006101256646A Pending CN101037680A (zh) 2001-06-06 2002-06-06 皂草苷分解酶及其基因以及大豆皂草精醇b的大量生产系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNA2006101256608A Pending CN1982444A (zh) 2001-06-06 2002-06-06 皂草苷分解酶及其基因以及大豆皂草精醇b的大量生产系统

Country Status (15)

Country Link
US (6) US7022508B2 (zh)
EP (1) EP1403373B1 (zh)
JP (1) JP4216183B2 (zh)
KR (3) KR100652275B1 (zh)
CN (3) CN101037680A (zh)
AR (1) AR034386A1 (zh)
AT (1) ATE526413T1 (zh)
AU (1) AU2002306218C1 (zh)
BG (1) BG108422A (zh)
BR (1) BR0210144A (zh)
CA (1) CA2449651C (zh)
HU (1) HUP0400150A2 (zh)
MX (1) MXPA03010816A (zh)
TW (3) TWI331630B (zh)
WO (1) WO2002101053A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HUP0400150A2 (en) 2001-06-06 2004-07-28 Meiji Seika Kaisha Saponin-digesting enzymes, genes thereof and soyasapogenol b mass production system
TW200951214A (en) * 2008-06-11 2009-12-16 heng-rui Xu Method for extracting surfactant sapindoside, organic acid, vitamins of saccharide enzyme organic substance from sapindus fruit and the product thereof
WO2013001890A1 (ja) 2011-06-28 2013-01-03 株式会社J-オイルミルズ ソーヤサポゲノール組成物
CN104487061B (zh) 2012-07-24 2017-11-07 J-制油株式会社 组合物

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04267876A (ja) 1991-02-21 1992-09-24 Abo Sadakichi グルクロニダーゼ
GB9408573D0 (en) * 1994-04-29 1994-06-22 Gatsby Charitable Foundation Identification, production and use of saponin gylcosyl hydrolases
CN1055928C (zh) * 1995-07-19 2000-08-30 北京市营养源研究所 豆粕皂苷的制造方法
CN1198939C (zh) 1996-09-13 2005-04-27 明治制果株式会社 来自绿色木霉的纤维素酶cbh1基因的调控序列以及利用该序列的蛋白质或多肽的大量生产体系
JPH10234396A (ja) 1997-02-25 1998-09-08 Nippon Kayaku Co Ltd 新規抗腫瘍剤およびソヤサポゲノールbの製造法
AR029912A1 (es) * 2000-04-25 2003-07-23 Meiji Seika Kaisha Metodo para producir soyasapogenol b, y las nuevas cepas de aplicacion en dicho metodo
HUP0400150A2 (en) 2001-06-06 2004-07-28 Meiji Seika Kaisha Saponin-digesting enzymes, genes thereof and soyasapogenol b mass production system
JP4267876B2 (ja) 2002-07-29 2009-05-27 豊田合成株式会社 頭部保護エアバッグ装置

Also Published As

Publication number Publication date
KR100664775B1 (ko) 2007-01-04
US7144718B2 (en) 2006-12-05
HUP0400150A2 (en) 2004-07-28
CA2449651C (en) 2010-09-21
US20100167362A1 (en) 2010-07-01
AR034386A1 (es) 2004-02-18
TWI313300B (en) 2009-08-11
US7790425B2 (en) 2010-09-07
US20040175711A1 (en) 2004-09-09
US7022508B2 (en) 2006-04-04
TW200700555A (en) 2007-01-01
US7335498B2 (en) 2008-02-26
TWI331630B (en) 2010-10-11
BG108422A (en) 2005-04-30
EP1403373A4 (en) 2006-02-01
TW200700554A (en) 2007-01-01
AU2002306218B2 (en) 2005-12-22
CN1982444A (zh) 2007-06-20
CN101037680A (zh) 2007-09-19
KR100652275B1 (ko) 2006-11-29
US20080187972A1 (en) 2008-08-07
KR20060096127A (ko) 2006-09-06
ATE526413T1 (de) 2011-10-15
MXPA03010816A (es) 2004-02-17
KR20040004682A (ko) 2004-01-13
KR20060035815A (ko) 2006-04-26
US20060115886A1 (en) 2006-06-01
US7670803B2 (en) 2010-03-02
BR0210144A (pt) 2004-06-08
JP4216183B2 (ja) 2009-01-28
WO2002101053A1 (en) 2002-12-19
CA2449651A1 (en) 2002-12-19
EP1403373B1 (en) 2011-09-28
KR100664776B1 (ko) 2007-01-04
US20060275862A1 (en) 2006-12-07
JPWO2002101053A1 (ja) 2005-04-07
AU2002306218C1 (en) 2006-11-09
EP1403373A1 (en) 2004-03-31
CN100439504C (zh) 2008-12-03
US7553640B2 (en) 2009-06-30
US20090226967A1 (en) 2009-09-10

Similar Documents

Publication Publication Date Title
CN1253574C (zh) 来自米曲霉的areA基因和其中areA基因已被修饰的真菌
CN1261567C (zh) 热稳定的葡糖淀粉酶
CN1262639C (zh) 新的宿主细胞和生产蛋白质的方法
CN1890367A (zh) 耐表面活性剂的纤维素酶及其修饰方法
CN1798848A (zh) 在缺乏酶的黑曲霉突变体中生产生物物质的方法
CN1842598A (zh) 适合含油酵母内的基因表达的甘油醛-3-磷酸脱氢酶和磷酸甘油酸变位酶启动子
CN1852983A (zh) 蛋白质从酵母的分泌
CN1535279A (zh) 二肽生产方法,所用的l-氨基酸酰胺水解酶,以及l-氨基酸酰胺水解酶生产方法
CN1622998A (zh) 丝状真菌来源的赖氨酰氧化酶
CN1882691A (zh) 对l-抗坏血酸进行微生物生产的方法
CN1993377A (zh) 丙氨酸2,3氨基变位酶
CN1531595A (zh) 琼脂糖酶及其基因
CN1160465C (zh) 其中areA、pepC和/或pepE基因已被灭活的真菌
CN1836044A (zh) 头孢菌素c酰基转移酶突变体及用其制备7-aca的方法
CN1253575C (zh) 用共有翻译起始区序列制备多肽的方法
CN1269838C (zh) 用于由大肠杆菌向培养基中分泌来制备Leu-水蛭素的信号序列
CN1594571A (zh) 百草枯抗性基因及维管束和毛状体特异性启动子
CN1301307A (zh) 在丝状真菌突变细胞中生产多肽的方法
CN1842592A (zh) 赋予植物再分化能力的基因及其应用
CN1930289A (zh) 变异芽孢杆菌属细菌
CN1661015A (zh) 来自产朊假丝酵母的谷胱甘肽合成酶编码基因
CN1763187A (zh) 重组丝氨酸蛋白酶及含有其的杀虫真菌剂
CN1183248C (zh) 环状缩肽合成酶及其基因、以及环状缩肽的大规模生产系统
CN1292068C (zh) 酒曲霉菌中蛋白水解酶的增强表达
CN1894404A (zh) 有机酸存在下的启动子及其用途

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081203

Termination date: 20110606