CN1514880A - 生产依马菌素的方法和组合物 - Google Patents

生产依马菌素的方法和组合物 Download PDF

Info

Publication number
CN1514880A
CN1514880A CNA02810000XA CN02810000A CN1514880A CN 1514880 A CN1514880 A CN 1514880A CN A02810000X A CNA02810000X A CN A02810000XA CN 02810000 A CN02810000 A CN 02810000A CN 1514880 A CN1514880 A CN 1514880A
Authority
CN
China
Prior art keywords
seq
leu
ala
arg
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA02810000XA
Other languages
English (en)
Inventor
I��Ħ����
I·摩尔纳
J·M·利宫
ƶ��׿�
R·E·泽科尔
��Ĭ����
P·E·汉默
ϣ
D·S·希尔
J·P·帕克拉特科
T·G·巴克尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Participations AG
Original Assignee
Syngenta Participations AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations AG filed Critical Syngenta Participations AG
Publication of CN1514880A publication Critical patent/CN1514880A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0077Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with a reduced iron-sulfur protein as one donor (1.14.15)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/181Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了P450单加氧酶家族,该家族的每个成员能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素。在从除虫菌素生产依马菌素的方法和制剂中可使用P450单加氧酶。本发明还公开了纯化本发明的P450单加氧酶的方法,与本发明的P450单加氧酶特异性结合的结合剂,和表达本发明的P450单加氧酶的基因工程细胞。本发明还公开了与本发明的P450单加氧酶具有活性的铁氧还蛋白和铁氧还蛋白还原酶。

Description

生产依马菌素的方法和组合物
技术领域
本发明涉及农用化学品领域,特别是杀虫剂领域。更特别地,本发明涉及除虫菌素的衍生化,尤其是依马菌素(emamectin)的合成。
背景技术
依马菌素是一种潜在的杀虫剂,控制多种害虫例如蓟马、潜叶虫和蠕虫,所述蠕虫包括美洲苜蓿粉蝶、甜菜夜蛾、白菜金翅夜蛾、棉铃虫、切根虫、菜蛾、烟夜蛾、谷实夜蛾、番茎麦蛾。在美国专利号4,874,749和Cvetovich,R.J.等,J.Organic Chem.59:7704-7708,1994中描述了依马菌素(4”-脱氧-4”-表-N-甲基氨基除虫菌素Bla/Blb)(称为MK-244)。
美国专利号5,288,710描述了农用化学中特别有用的依马菌素的盐。这些依马菌素的盐是有用的杀虫剂,特别用于对抗昆虫及螨目(Acarina)的典型代表。在欧洲专利申请EP-A 736,252中列出了依马菌素有效对抗的一些害虫。
使用依马菌素的一个缺点是从除虫菌素合成依马菌素困难。这是由于所述过程的第一步引起的,该步是制备依马菌素的最昂贵和耗时的步骤,其中除虫菌素的4”-甲醇基团必须被氧化成酮。4”-甲醇基团的氧化难以解决是由于分子中存在其它两个羟基,而这两个羟基必须在氧化前进行化学保护并且氧化后去保护。这样,所述的第一步显著地提高从除虫菌素制备依马菌素的整体成本和时间。
由于依马菌素作为杀虫剂的效力和能力,有必要发展一种节省成本和时间的方法和/或试剂用于区域选择性地氧化除虫菌素的4”-甲醇基团以制备4”-酮-除虫菌素,而后者为从除虫菌素制备依马菌素的必需中间体。
发明内容
本发明提供P450单加氧酶新家族,该家族中的每一个成员能够区域选择性地氧化未保护的除虫菌素的4”-甲醇基团,由此提供一种廉价、有效制备4”-酮-除虫菌素(即制备依马菌素中的必需中间体)的方法。本发明允许除去昂贵、耗时的步骤:(1)在氧化4”-甲醇基团之前,化学保护除虫菌素分子上的其它两个在氧化前必须化学保护的羟基;和(2)在氧化后化学去保护所述其它两个羟基。因此,本发明提供了显著降低从除虫菌素制备依马菌素的整体成本的试剂和方法。
●因此,一方面,本发明提供一种纯化的核酸分子,该核酸分子编码一种显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
●在一个具体实施方式中,本发明涉及一种纯化的核酸分子,该核酸分子包含编码显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽的核苷酸序列,其中所述多肽基本上与SEQ ID NO:2所示多肽相似,并优选与SEQ ID NO:2多肽具有至少50%至99%之间的氨基酸序列同一性,并且所述50%和99%之间范围内的每一个单独的数字也是本发明的一部分。
●在进一步的具体实施方式中,本发明涉及一种纯化的核酸分子,该核酸分子包含编码显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽的核苷酸序列,其中所述多肽与抗SEQ ID NO:2所示多肽的抗体有免疫学反应性。
●本发明进一步提供一种纯化的核酸分子,该核酸分子包含一种核苷酸序列,该核苷酸序列
a)如SEQ ID NO:1所示;
b)与(a)基本上相似;
c)能够与(a)或其互补序列杂交;
d)能够与一种核酸分子杂交,该核酸分子包含如SEQ ID NO:1所示的核苷酸序列或其互补序列的50至200或更多连续核苷酸;
e)与(a)、(b)或(c)互补;
f)为(a)、(b)或(c)的反向互补序列,或
g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并将除虫菌素区域选择性氧化为4”-酮-除虫菌素的多肽。
●在一个具体的实施方式中,本发明涉及一种纯化的核酸分子,该核酸分子包含一种编码显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽的核苷酸序列,其中所述多肽基本上与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34或SEQ ID NO:95所示多肽相似,并优选与其具有至少60%至99%之间氨基酸序列同一性,并且所述60%和99%之间范围内的每一个单个的数字也是本发明的一部分。
●在进一步的具体实施方式中,本发明涉及一种纯化的核酸分子,该核酸分子包含一种编码显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽的核苷酸序列,其中所述多肽与抗如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34或SEQ ID NO:95所示多肽的抗体有免疫学反应性。
●本发明进一步提供一种纯化的核酸分子,该核酸分子包含一种核苷酸序列,该核苷酸序列
a)如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33或SEQ ID NO:94所示;
b)与(a)基本上相似;
c)能够与(a)或其互补序列杂交;
d)能够与一种核酸分子杂交,该核酸分子包含如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ IDNO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33或SEQ IDNO:94所示的核苷酸序列或其互补序列的50至200或更多连续核苷酸;
e)与(a)、(b)或(c)互补;
f)为(a)、(b)或(c)的反向互补序列;或
g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
在某些实施方式中,所述核酸分子包含与SEQ ID NO:1具有至少66%至99%之间同一性的核酸序列或实质上由这种核酸序列构成,并且所述66%和99%之间范围内的每一个单个的数字也是本发明的一部分。
●在某些实施方式中,所述核酸分子包含以下核酸序列或实质上由以下核酸序列构成:与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ IDNO:31、SEQ ID NO:33或SEQ ID NO:94具有至少70%至99%之间同一性的核酸序列,并且所述70%和99%之间范围内的每一个单独的数字也是本发明的一部分。
●在一些实施方式中,所述核酸分子包含以下核酸序列或实质上由以下核酸序列构成:与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ IDNO:31、SEQ ID NO:33或SEQ ID NO:94具有至少80%同一性的核酸序列。
●在某些实施方式中,所述核酸分子包含以下核酸序列或实质上由以下核酸序列构成:与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ IDNO:31、SEQ ID NO:33或SEQ ID NO:94具有至少90%同一性的核酸序列。
●在某些实施方式中,所述核酸分子包含以下核酸序列或实质上由以下核酸序列构成:与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ IDNO:31、SEQ ID NO:33或SEQ ID NO:94具有至少95%同一性的核酸序列。
●在某些实施方式中,所述核酸分子包含以下核酸序列或实质上由以下核酸序列构成,所述核酸序列选自:SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33和SEQ ID NO:94。
●在特定实施方式中,所述核酸分子分离自链霉菌属(Streptomyces)的株系。在某些实施方式中,链霉菌的株系选自杀结核链霉菌(Streptomyces tubercidicus)、利迪链霉菌(Streptomyceslydicus)、普拉特链霉菌(Streptomyces platensis)、恰塔努加链霉菌(Streptomyces chattanoogensis)、春日链霉菌(Streptomyceskasugaensis)和龟裂链霉菌(Streptomyces rimosus)和生白链霉菌(Streptomyces albofaciens)。
●在这方面的某些实施方式中,核酸分子进一步包含编码通过共价键连接于P450单加氧酶的标签的核酸序列。在某些实施方式中,所述的标签选自组氨酸标签、GST标签、HA标签、HSV标签、Myc-标签和VSV-G-标签。
●在另一方面,本发明提供一种纯化的多肽,该多肽显示P450单加氧酶的酶活性并能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素。
●在一些实施方式中,所述多肽包含以下核酸分子编码的氨基酸序列或本质上由这种氨基酸序列构成,所述核酸分子
a)如SEQ ID NO:1或其互补序列所示;
b)与(a)基本上相似;
c)能与(a)或其互补序列杂交;
d)能够与一种核酸分子杂交,该核酸分子包含如SEQ ID NO:1所示的核苷酸序列或其互补序列的50至200个或更多连续核苷酸;
e)与(a)、(b)或(c)互补;
f)为(a)、(b)或(c)的反向互补序列;或
g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
在一些实施方式中,所述多肽包含以下氨基酸序列或本质上由以下氨基酸序列构成:与SEQ ID NO:2具有至少50%至99%同一性的氨基酸序列,并且所述50%和99%之间范围内的每一个单独的数字也是本发明的一部分。
●在一些实施方式中,所述多肽包含以下核酸分子编码的氨基酸序列或本质上由这种氨基酸序列构成,所述核酸分子
a)如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33或ID NO:94或其互补序列所示;
b)与(a)基本上相似;
c)能与(a)或其互补序列杂交;
d)能够与一种核酸分子杂交,该核酸分子包含如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ IDNO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33或ID NO:94所示的核苷酸序列或其互补序列的50至200或更多个连续核苷酸,或其互补序列;
e)与(a)、(b)或(c)互补;
f)为(a)、(b)或(c)的反向互补序列;或
g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
●在一些实施方式中,P450单加氧酶包含以下氨基酸序列或本质上由以下氨基酸序列构成:与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:95具有至少60%至99%之间同一性的氨基酸序列,并且所述60%和99%之间范围内的每一个单独的数字也是本发明的一部分。
●在某些实施方式中,P450单加氧酶包含以下氨基酸序列或本质上由以下氨基酸序列构成:与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:95具有至少70%同一性的氨基酸序列。
●在一些实施方式中,P450单加氧酶包含以下氨基酸序列或本质上由以下氨基酸序列构成:与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:95具有至少80%同一性的氨基酸序列。
●在一些实施方式中,P450单加氧酶包含以下氨基酸序列或本质上由以下氨基酸序列构成:与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:95具有至少90%同一性的氨基酸序列。
●在某些实施方式中,P450单加氧酶包含以下氨基酸序列或本质上由以下氨基酸序列构成:与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:95具有至少95%同一性的氨基酸序列。
●在本发明该方面的一些实施方式中,P450单加氧酶包含以下氨基酸序列或本质上由以下氨基酸序列构成,所述氨基酸序列选自:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34和SEQ ID NO:95。
●在某些实施方式中,根据本发明显示P450单加氧酶的酶活性的多肽还包含标签。在一些实施方式中,所述的标签选自组氨酸标签、GST标签、HA标签、HSV标签、Myc-标签和VSV-G-标签。
●在另一方面,本发明提供一种结合剂,该结合剂与根据本发明的多肽特异性结合,根据本发明的多肽显示将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶的酶活性。在一些实施方式中,结合剂为抗体。在某些实施方式中,抗体为多克隆抗体或单克隆抗体。
●在另一方面,本发明提供一个P450单加氧酶多肽家族,其中,该家族中的每个成员都能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素。
●在某些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下氨基酸序列构成:与如SEQ ID NO:2所示氨基酸序列具有至少50%至99%同一性的氨基酸序列,并且在50%至99%范围内的每一个单独的数字也是本发明的一部分。
●在某些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下氨基酸序列构成:与如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:95所示氨基酸序列具有至少60%至99%同一性的氨基酸序列,并且在60%至99%范围内的每一个单独的数字也是本发明的一部分。
●在某些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下氨基酸序列构成:与如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:95所示氨基酸序列具有至少70%同一性的氨基酸序列。
●在某些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下氨基酸序列构成:与如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:95所示氨基酸序列具有至少80%同一性的氨基酸序列。在一些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下氨基酸序列构成:与如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:95所示氨基酸序列具有至少90%同一性的氨基酸序列。
●在某些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下氨基酸序列构成:与如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:95所示氨基酸序列具有至少95%同一性的氨基酸序列。
●在本发明这方面的一些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下的氨基酸序列构成,所述氨基酸序列选自:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34和SEQ ID NO:95。
●在另一方面中,本发明提供一种细胞,该细胞经基因工程化包含一种编码显示将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的核酸分子。
●在一些实施方式中,将所述核酸分子定位以在细胞中表达。在某些实施方式中,细胞还包含一种核酸分子,该核酸分子包含编码根据本发明显示铁氧还蛋白酶活性的多肽的核苷酸序列。
●在一些实施方式中,该细胞还包含一种核酸分子,该核酸分子包含编码根据本发明显示铁氧还蛋白还原酶蛋白的酶活性的多肽的核苷酸序列。
●在某些实施方式中,细胞为基因工程化的链霉菌属的株系。在某些实施方式中,细胞为基因工程化的浅青紫链霉菌(Streptomyceslividans)株系。在特定实施方式中,所述的基因工程化的浅青紫链霉菌株系具有NRRL指定号B-30478。在一些实施方式中,细胞为基因工程化的假单胞菌属(Pseudomonas)的株系。在一些实施方式中,细胞为基因工程化的恶臭假单胞菌(Pseudomonas putida)株系。在某些实施方式中,基因工程化的恶臭假单胞菌株系具有NRRL指定号B-30479。在一些实施方式中,细胞为基因工程化的大肠杆菌(Escherichia coli)株系。
●在另一方面,本发明提供一种纯化的核酸分子,该核酸分子包含编码根据本发明显示铁氧还蛋白的酶活性的多肽的核苷酸序列,其中,所述的核酸分子分离自含有能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶的链霉菌属株系。
●在特定实施方式中,本发明涉及一种纯化的核酸分子,该核酸分子包含编码显示铁氧还蛋白的酶活性的多肽的核苷酸序列,其中所述多肽与如SEQ ID NO:36或SEQ ID NO:38所示的多肽基本上相似,优选与其具有至少80%至90%氨基酸序列同一性,并且,所述的80%至90%之间范围内的每一个单独的数字也是本发明的一部分。
●在进一步的特定实施方式中,本发明涉及一种纯化的核酸分子,该核酸分子包含编码显示铁氧还蛋白酶活性的多肽的核苷酸序列,其中所述多肽与抗SEQ ID NO:36或SEQ ID NO:38所示多肽的抗体有免疫学反应性。
●本发明还提供一种纯化的核酸分子,该核酸分子包含一种核苷酸序列,该核苷酸序列
a)如SEQ ID NO:35或SEQ ID NO:37所示;
b)与(a)基本上相似;
c)能够与(a)或其互补序列杂交;
d)能够与包含SEQ ID NO:35或SEQ ID NO:37所示核苷酸序列的50至200或更多个连续核苷酸的核酸分子或其互补序列杂交;
e)与(a)、(b)或(c)互补;
f)为(a)、(b)或(c)的反向互补序列;或
g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,其编码仍显示铁氧还蛋白的酶活性并且能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
●在某些实施方式中,编码本发明的铁氧还蛋白的核酸分子包含以下核酸序列或本质上由以下核酸序列构成:与SEQ ID NO:35或SEQ ID NO:37具有至少81%同一性的核酸序列。在一些实施方式中,该核酸分子包含以下核酸序列或本质上由以下核酸序列构成:与SEQID NO:35或SEQ ID NO:37具有至少85%或至少90%,或至少95%,或至少99%同一性的核酸序列。在某些实施方式中,编码本发明的铁氧还蛋白的核酸分子包含或本质上由SEQ ID NO:35或SEQ IDNO:37的核酸序列构成。
●在另一方面,本发明提供一种纯化的铁氧还蛋白,其中所述的铁氧还蛋白分离自含有将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶的链霉菌属株系。在某些实施方式中,本发明的铁氧还蛋白包含或本质上由与SEQ ID NO:36或SEQ ID NO:38具有至少80%同一性的氨基酸序列构成。在一些实施方式中,所述的核酸分子包含以下氨基酸序列或本质上由以下氨基酸序列构成:与SEQ IDNO:36或SEQ ID NO:38具有至少85%,或至少90%,或至少95%,或至少99%同一性的氨基酸序列。
●在特定实施方式中,本发明的铁氧还蛋白包含SEQ ID NO:36或SEQ ID NO:38所示的氨基酸序列或本质上由该氨基酸序列构成。
●在另一方面,本发明提供一种纯化的核酸分子,该核酸分子包含编码根据本发明显示铁氧还蛋白还原酶酶活性的多肽的核苷酸序列,其中所述核酸分子分离自含有能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶的链霉菌属株系。
●在某些实施方式中,包含编码根据本发明显示铁氧还蛋白还原酶酶活性的多肽的核苷酸序列的核酸分子包含SEQ ID NO:98、SEQID NO:100、SEQ ID NO:102或SEQ ID NO:104所示的核酸序列或本质上由该核酸序列构成。
●在另一方面,本发明提供一种纯化的多肽,该多肽显示铁氧还蛋白还原酶蛋白的酶活性,其中所述多肽分离自含有能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶的链霉菌属株系。在某些实施方式中,本发明的该多肽包含或本质上由SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103或SEQ ID NO:105所示的氨基酸序列构成。
●在另一方面,本发明提供一种制备式(I)化合物的方法:
Figure A0281000000341
其中
R1-R9相互独立地代表氢或取代基;
m为0、1或2;
n为0、1、2或3;且
标有A、B、C、D、E和F的键相互独立地表示:两个相邻碳原子通过以下形式相连:双键、单键、单键和下式的环氧桥
或单键和下式的亚甲基桥
包括,当可适用时,E/Z异构体,E/Z异构体的混合物,和/或其互变异构体,每种情况中为游离形式或盐形式,
其中该方法包括:
1)将式(II)化合物
Figure A0281000000351
其中
R1-R7、m、n、A、B、C、D、E和F与上述式(I)中给出的含义相同,
与根据本发明的多肽接触,所述多肽能够区域选择性地氧化在4”位的醇,以形成式(III)化合物
Figure A0281000000352
其中,R1、R2、R3、R4、R5、R6、R7、m、n、A、B、C、D、E和F与式(I)中给出的含义相同;和
2)使式(III)化合物与式HN(R8)R9的胺在还原剂存在的情况下反应,其中R8和R9与式(I)中给定的含义相同,并且其是已知的;
并且,在每种情况下,如果需要,将按照本方法或其它方法可获得的式(I)化合物、或其E/Z异构体或互变异构体,每种情况中为游离形式或盐形式,转变为不同的式(I)化合物或其E/Z异构体或互变异构体,每种情况中为游离形式或盐形式;将可按照本方法获得的E/Z异构体混合物分离,并分离出所需的异构体;和/或将可按照本方法和其它方法获得的游离式(I)化合物、或其E/Z异构体或互变异构体转变为盐,或将可按照本方法和其它方法获得的式(I)化合物、或其E/Z异构体或互变异构体的盐转变为游离的式(I)化合物或其E/Z异构体或互变异构体或转变为不同的盐。
●在一些实施方式中,使式(II)化合物进一步与根据本发明显示铁氧还蛋白酶活性的多肽接触。在某些实施方式中,使式(II)化合物进一步与根据本发明显示铁氧还原白还原酶酶活性的多肽接触。在一些实施方式中,使式(II)化合物进一步与还原剂(例如,NADH或NADPH)接触。
●在进一步的实施方式中,本发明提供一种制备式(III)化合物的方法
其中R1、R2、R3、R4、R5、R6、R7、m、n、A、B、C、D、E和F与权利要求1的式(I)中给定的含义相同,
其中所述方法包括:
1)使式(II)化合物
其中
R1-R7、m、n、A、B、C、D、E和F与上述式(I)中给定的含义相同,
与根据本发明能够区域选择性地氧化在4”位的醇的多肽接触,将所述接触保持足够发生氧化反应的时间并且分离和纯化式(II)化合物。
●在另一实施方式中,本发明提供一种根据本发明制备式(I)化合物的方法,其中
n为1;
m为1;
A为双键;
B为单键或双键,
C为双键,
D为单键,
E为双键,
F为双键;或单键和环氧桥;或单键和亚甲基桥;
R1、R2和R3为H;
R4为甲基;
R5为C1-C10-烷基,C3-C8-环烷基或C2-C10-链烯基;
R6为H;
R7为OH;
R8和R9相互独立地为H;C1-C10-烷基或C1-C10-酰基;或一起形成-(CH2)q-;且
q为4、5或6。
●在另一实施方式中,本发明提供一种根据本发明制备式(I)化合物的方法,其中
n为1;
m为1;
A、B、C、E和F为双键;
D为单键;
R1、R2和R3为H;
R4为甲基;
R5为s-丁基或异丙基;
R6为H;
R7为OH;
R8为甲基;
R9为H。
●在另一实施方式中,本发明提供一种根据本发明制备4”-脱氧-4”-N-甲基氨基除虫菌素B1a/B1b苯甲酸盐的方法。
●在另一方面,本发明提供一种生产依马菌素的方法。该方法包括:将根据本发明显示将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶的酶活性的多肽加入包含除虫菌素的反应混合物中;和将反应混合物在使多肽将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的条件下温育。在一些实施方式中,反应混合物进一步包含根据本发明显示铁氧还蛋白的酶活性的多肽。在某些实施方式中,反应混合物进一步包含根据本发明显示铁氧还蛋白还原酶的酶活性的多肽。在一些实施方式中,反应混合物进一步包含还原剂(例如NADH或NADPH)。
●在另一方面,本发明提供一种生产式(I)化合物的制剂,该制剂包含:根据本发明显示能够区域选择性地氧化在4”位的醇以形成式(II)化合物的P450单加氧酶活性的多肽。在一些实施方式中,该制剂进一步包含根据本发明显示铁氧还蛋白的酶活性的多肽(例如,来自分离或获得P450单加氧酶的细胞或株系的铁氧还蛋白)。
●在另一方面,本发明提供一种生产依马菌素的制剂,该制剂包含将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶。在一些实施方式中,该制剂进一步包含铁氧还蛋白(例如,来自分离或获得P450单加氧酶的细胞或株系的铁氧还蛋白)。
●在某些实施方式中,该制剂进一步包含根据本发明显示铁氧还蛋白还原酶的酶活性的多肽(例如,来自分离或获得P450单加氧酶的细胞或株系的铁氧还蛋白)。在一些实施方式中,该制剂进一步包含还原剂(例如,NADH或NADPH)。
附图说明
图1为显示质粒pTBBKA图谱的概图。图中显示了指定的限制性内切酶的识别位点,和该位点在质粒的核苷酸序列中的定位。图中还显示了质粒中含有的基因(例如,卡那霉素抗性“KanR”)和其它功能方面(例如,Tip启动子)。
图2为显示质粒pTUA1A图谱的概图。图中显示了指定的限制性内切酶的识别位点,和该位点在质粒的核苷酸序列中的定位。图中还显示了质粒中含有的基因(例如,氨苄青霉素抗性“AmpR”)和其它功能方面(例如,Tip启动子)。
图3为显示质粒pRK-ema1/fd233图谱的概图。该质粒通过将含有组织在单一转录单元上的ema1和fd233基因的BglI片段连接入广宿主范围质粒pRK290中而获得。ema1/fd233基因由tac启动子(Ptac)表达并且ema1/fd233基因后为tac终止子(Ttac)。显示的限制性内切酶识别位点为BglII“B”;EcoRI“E”;PacI“Pc”;PmeI“Pm”和SalI“S”。
本发明提供一种多肽家族,所述多肽家族显示P450单加氧酶的酶活性并能够区域选择性地氧化式(II)化合物例如除虫菌素4”位的醇,以产生式(III)化合物,尤其是4”-酮-除虫菌素。
更具体地,根据本发明的多肽家族可以用于制备式(I)化合物的方法中,
Figure A0281000000411
其中,
R1-R9相互独立地代表氢或取代基;
M为0、1或2;
n为0、1、2或3;且
标有A、B、C、D、E和F的键相互独立地表示:两个相邻碳原子通过以下形式相连:双键、单键、单键和下式的环氧桥(epoxidebridge)
Figure A0281000000412
或单键和下式的亚甲桥
包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,每种情况中为游离形式或盐形式,
其中,该方法包括:
1)将式(II)化合物
其中
R1-R7、m、n、A、B、C、D、E和F与上述式(I)中给定的含义相同,
与根据本发明的多肽接触,所述多肽显示P450单加氧酶的酶活性并能够区域选择性地氧化式(II)在4”位的醇,以产生式(III)化合物
其中,R1、R2、R3、R4、R5、R6、R7、m、n、A、B、C、D、E和F与式(I)中给定的含义相同;和
2)在还原剂存在的情况下使式(III)化合物与已知的式HN(Rg)R9的胺反应,其中R8和R9与式(I)中给定的含义相同,并且;
并且,在每种情况下,如果需要,将可按照本方法和其它方法获得的式(I)化合物、或其E/Z异构体或互变异构体,每种情况中为游离形式或盐形式,转变为不同的式(I)化合物或其E/Z异构体或互变异构体,每种情况中为游离形式或盐形式;将可按照本方法获得的E/Z异构体混合物分离,并分离出所需的异构体;和/或将可按照本方法或其它方法获得的游离的式(I)化合物、或其E/Z异构体或互变异构体转变为盐,或将可按照本方法和其它方法获得的式(I)化合物、或其E/Z异构体或互变异构体的盐转变为游离的式(I)化合物或其E/Z异构体或互变异构体或转变为不同的盐。
文献中描述了式(I)化合物的合成方法。然而,发现主要由于产量低和使用程序繁琐,文献中已知的方法在制备过程中产生很多问题。因此,在这方面已知方法并不令人满意,从而需要获得这些化合物的改进的制备方法。
化合物(I)、(II)和(III)可以为互变异构体的形式。因此,在前后文中,如果适当的话,化合物(I)、(II)和(III)应被理解为包括相应的互变异构体,即使相应的互变异构体在每种情况下并没有特别提及。
化合物(I)、(II)和(III)能够形成酸加成盐。例如,与强无机酸(inorganic acid),与强有机羧酸或与有机磺酸形成那些盐。强无机酸(inorganic acid)例如无机酸(mineral acid)如高氯酸、硫酸、硝酸、亚硝酸、磷酸或氢卤酸。强有机羧酸例如,未取代或取代的,如卤素取代的,C1-C4烷羧酸,如乙酸,饱和或不饱和二羧酸,如草酸、丙二酸、琥珀酸、马来酸、延胡索酸或苯二甲酸,羟基羧酸如抗坏血酸、乳酸、苹果酸、酒石酸或柠檬酸,或苯甲酸。有机磺酸例如未取代或取代的,如卤代的,C1-C4烷基-或芳基-磺酸,如甲磺酸或对甲苯磺酸。而且,具有至少一个酸性基团的式(I)、(II)和(III)化合物能够与碱形成盐。与碱的合适的盐为,例如金属盐如碱金属或碱土金属盐,如钠、钾或镁盐,与氨或有机胺形成的盐,所述有机胺例如吗啉、哌啶、吡咯烷,单-、二-或三-低级烷基胺,例如乙基-、二乙基-、三乙基-或二甲基-丙基胺,或单-、二-或三-羟基-低级烷基胺,例如单-、二-或三-乙醇胺。另外,还可以形成相应的内盐。在本发明范围内优选农用化学有用的盐。鉴于游离形式和其盐形式的式(I)、(II)和(III)化合物间的紧密关系,如果适当和有利的话,前后文提及的式(I)、(II)和(III)的游离化合物或其各自的盐应理解为也包含式(I)、(II)和(III)的相应的盐或游离化合物。对于式(I)、(II)和(III)化合物的互变异构体和其盐的情况,这也同样适用。在每种情况下,通常优选游离形式。
本发明范围内优选制备式(I)化合物的方法,其中
n为1;
m为1;
A为双键;
B为单键或双键,
C为双键,
D为单键,
E为双键,
F为双键;或单键和环氧桥(epoxy bridge);或单键和亚甲桥;
R1、R2和R3为H;
R4为甲基;
R5为C1-C10-烷基,C3-C8-环烷基或C2-C10-链烯基;
R6为H;
R7为OH;
R8和R9相互独立地为H;C1-C10-烷基或C1-C10-酰基;或一起形成-(CH2)q-;和
q为4、5或6。
本发明范围内特别优选制备式(I)化合物的方法,其中
n为1;
m为1;
A、B、C、E和F为双键;
D为单键;
R1、R2和R3为H;
R4为甲基;
R5为s-丁基或异丙基;
R6为H;
R7为OH;
R8为甲基;
R9为H。
非常特别优选制备依马菌素,更特别是依马菌素的苯甲酸盐的方法。依马菌素为4”-脱氧-4”-N-甲基氨基除虫菌素B1a/B1b的混合物并且描述于US-P-4,4874,749中和作为MK-244描述于有机化学杂志(Journal of Organic Chemistry),Vol.59(1994),7704-7708中。US-P-5,288,710中描述了农业化学中特别有用的依马菌素的盐。上文描述的显示P450单加氧酶酶活性的该肽家族中的每个成员都能够在4”位区域选择性地氧化未保护的除虫菌素,因此开辟了制备依马菌素的新的更经济途径。
每个家族成员都能催化下列反应:
       除虫菌素             4”-酮-除虫菌素           依马菌素
B1a(R=CH3)和B1b(R=H)     B1a(R=CH3)和B1b(R=H)   R=CH3,H
因此,本发明提供一种纯化的核酸分子,该核酸分子编码显示P450单加氧酶的酶活性并能够区域选择性地氧化式(II)化合物(例如除虫菌素)在4”的醇,以产生式(III)化合物(尤其是4”-酮-除虫菌素)。
特别地,本发明提供一种纯化的核酸分子,该核酸分子编码将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶。“核酸分子”是指单链或双链多核苷酸,例如脱氧核糖核酸(DNA)、核糖核酸(RNA)或DNA或RNA的类似物。
本发明还提供一种纯化的多肽,该多肽显示P450单加氧酶的酶活性并能够区域选择性地氧化式(II)化合物例如除虫菌素在4”位的醇,以产生式(III)化合物,尤其是4”-酮-除虫菌素。
特别地,本发明还提供一种纯化的P450单加氧酶,该单加氧酶将除虫菌素区域选择性氧化为4”-酮-除虫菌素。
如本文所示,“纯化的”意指已将核酸分子或多肽(例如酶或抗体)从天然伴随它的成份中分离出来。从来源中“纯化”的感兴趣的这样的核苷酸序列或片段的例子,可以为通过化学方法,例如通过使用限制性内切酶,从所述来源切离或取出的核苷酸序列或片段,从而可进一步通过基因工程的方法对其进行操作,例如扩增,用于本发明。这样的核苷酸序列或片段通常称为“重组体”。在一个具体方面,纯化的核酸分子可从核苷酸序列(该序列就象在染色体中天然存在的一样与所述核酸分子侧翼相连),例如启动子或增强子分离。
对于蛋白质或多肽的情况,纯化的蛋白质和多肽分别与细胞中伴随它的成份,例如细胞膜的其它蛋白质或片段相分离。当然,分子生物学的普通技术人员会理解,水、缓冲液和其它小分子可以额外存在于纯化的核酸分子或纯化的蛋白制备物中。本发明纯化的核酸分子或纯化的多肽(例如酶)至少95%重量、或至少98%重量、或至少99%重量、或100%重量地没有天然伴随所述的核酸分子或多肽的成份。
根据本发明,纯化的核酸分子可以通过例如从染色体上将所述核酸分子切离产生。然后,可将其连接入表达质粒。可获得产生编码本发明P450单加氧酶的纯化的核酸分子的其它方法,并且包括,但不限于,在核酸合成仪上人工合成核酸分子。
相似地,本发明纯化的P450单加氧酶可以通过,例如在细胞中重组表达编码P450单加氧酶的核酸分子产生,其中所述细胞中天然不存在P450单加氧酶。当然,其它获得本发明纯化的P450单加氧酶的方法,包括,但不限于,在多肽合成仪上人工合成P450单加氧酶,和利用例如与P450单加氧酶特异性结合的抗体,从天然存在P450单加氧酶的细胞中分离P450单加氧酶。
已知链霉菌属的细菌通过脱氢酶或氧化酶将仲醇生物转化为酮。然而,在本发明发现杀结核链霉菌株系R-922的细胞色素P450单加氧酶负责将除虫菌素区域选择性氧化为4”-酮-除虫菌素之前,没有报道链霉菌的其它细胞色素P450单加氧酶将仲醇氧化为酮的实验数据。
根据本发明的一些实施方式,核酸分子和/或由核酸分子编码的多肽分离自链霉菌属株系。因此,核酸分子(或由其编码的多肽)可以分离自,但不限于,杀结核链霉菌、利迪链霉素、普拉特链霉菌、恰塔努加链霉菌、春日链霉菌、龟裂链霉菌和生白链霉菌。
如上所述和如下详细描述的,本文提供显示能够将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的整个家族。所有的这些家族成员相关,在氨基酸水平具有至少60%同一性。含有编码本发明显示P450单加氧酶酶活性的多肽的核苷酸序列的有用核酸分子包含以下核酸序列或本质上由以下核酸序列构成:与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33或SEQ ID NO:94具有至少70%同一性的核酸序列。在某些实施方式中,包含编码本发明显示P450单加氧酶酶活性的多肽的核苷酸序列的核酸分子包含以下核酸序列或本质上由以下核酸序列构成:与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33或SEQ ID NO:94具有至少80%同一性;或至少85%同一性;或至少90%同一性;或至少95%同一性;或至少98%同一性的核酸序列。
相似地,本发明提供一种显示将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的纯化多肽,其中,在一些实施方式中,所述多肽包含以下氨基酸序列或本质上由以下氨基酸序列构成:与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:95具有至少60%同一性的氨基酸序列。在某些实施方式中,本发明的显示P450单加氧酶的酶活性的纯化的多肽包含以下氨基酸序列或本质上由以下氨基酸序列构成:与SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:95具有至少70%同一性;或至少80%同一性;或至少90%同一性;或至少95%同一性的氨基酸序列。
在一些实施方式中,含有编码本发明显示P450单加氧酶酶活性的多肽的核苷酸序列的核酸分子包含以下核酸序列或本质上由以下核酸序列构成:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33或SEQ ID NO:94。相似地,在一些实施方式中,本发明的显示P450单加氧酶的酶活性的纯化的多肽包含或本质上由以下氨基酸序列构成:SEQ 1D NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:95。
为了描述两条或多条核酸或多核苷酸间的序列相关性,使用以下术语:(a)“参考序列”,(b)“比较窗口”,(c)“序列同一性”,(d)“序列同一性百分比”和(e)“基本上相同”。
(a)本文所使用的“参考序列”为作为序列比较基础的指定序列。参考序列可以为具体序列的子集或全部;例如作为全长cDNA或基因序列的片段,或全部cDNA或基因序列。
(b)本文使用的“比较窗口”涉及多核苷酸序列的连续且指定的片段,其中,为了两条序列的最佳比对(alignment),比较窗口中的多核苷酸片段与参考序列(其不包含添加或缺失)相比,可以包含添加或缺失(即缺口)。通常,比较窗口至少20个连续的核苷酸长,可选地可为30、40、50、100或更长。本领域技术人员理解,为了避免由于多核苷酸序列中包含缺口而产生与参考序列的高相似性,通常引入缺口罚值(gap penalty),并将其从匹配的数目中减去。
本领域熟知为比较而进行序列比对的方法。因此,使用数学算法可完成任何两条序列间同一性百分比的确定。这些数学算法的优选的非限制性例子为Myers和Miller的算法,1988;Smith等的局部同源性算法;Needleman和Wunsch的同源性比对算法,1970;Pearson和Lipman的查找相似性的方法,1988;Karlin和Altschul的算法,1990,如Karlin和Altschul修改的,1993。
可以采用这些数学算法的计算机执行工具,用于比较序列以确定序列的同一性。这样的执行工具包括,但不限于:PC/Gene程序中的CLUSTAL(获自Intelligeneties,Mountain View,加利福尼亚);ALIGN程序(Version 2.0)和成斯康星遗传学软件包(Wisconsin GeneticsSoftware Package)中的GAP、BESTFIT、BLAST、FASTA和TFASTA,Version 8(获自遗传学计算机小组(Genetics Computer Group,GCG)),575 Science Drive,麦迪逊,威斯康星,美国)。可以使用默认参数利用这些程序进行比对。Higgins等1988;Higgins等1989;Corpet等1988;Huang等1992和Pearson等1994很好地描述了CLUSTAL程序。ALIGN程序基于Myers和Miller的算法,见上文。Altschul等(1990)的BLAST程序基于Karlin和Altschul的算法,见上文。
可通过国家生物技术信息中心(http://www.ncbi.nlm.nih.gov/)公开获得进行BLAST分析的软件。该算法包括通过鉴定查询序列的长度W的短字符,首先鉴定高分序列对(high scoring sequence pairs,HSPs),其中长度W的短字符与数据库序列中相同长度的字符比对时,其与一些阳性值阀值得分T匹配或符合。T指临近字符得分阀值(Altschul等,1990)。这些起始临近字符命中(hits)作为起始寻找含有它们的更长HSPs的开端。然后,这些字符命中沿着每个序列在两端延伸至积累比对得分可以增长。对于核苷酸序列,使用参数M(一对匹配残基的奖赏得分;总是>0)和N(不匹配残基的处罚得分;总是<0)来计算积累得分。对于氨基酸序列,使用得分矩阵计算积累得分。当积累比对得分从其最大取得值减少数值X,或由于积累一个或多个负分残基比对而使积累得分达到0或低于0,或达到任何一个序列的终点时,在每个方向中字符命中的延伸停止。
除了计算百分序列同一性,BLAST算法还进行两条序列间相似性的统计分析(参见,例如,Karlin & Altschul(1993))。一种由BLAST算法提供的相似性的测定为最小总数概率(P(N)),该测定提供了两条核苷酸或氨基酸序列间匹配会偶然发生的概率。例如,如果待测核酸序列与参考核酸序列比较的最小总数概率小于约0.1,更优选小于约0.01,最优选小于约0.001,则认为待测核酸序列与参考序列相似。
为了获得缺口比对以进行比较,可以使用如Aitschul等1997描述的缺口BLAST(在BLAST 2.0中)。可替代地,可使用PSI-BLAST(BLAST 2.0中)进行检测分子间远缘相关性的反复检索。参见Altschul等,见上文。当使用BLAST、缺口BLAST、PSI-BLAST时,可以使用各个程序的默认参数(例如核苷酸序列采用BLASTN,蛋白质采用BLASTX)。BLASNTN程序(用于核苷酸序列)使用的默认值是:字符长度(wordlength(W))为11,期望值(expectation(E))为10,截断值(cutoff)为100,M=5,N=4,和两条链的比较。对于氨基酸序列,BLASTP程序使用的默认值是:字符长度(W)为3,期望值(E)为10,和BLOSUM62得分矩阵(参见Henikoff & Henikoff,1989)。参见 http://www.ncbi.nlm.nih.gov.。还可以通过手工检查进行比对。为了本发明目的,用于测定与本文公开的核苷酸序列的百分序列同一性的核苷酸序列比较,优选使用BlastN程序(version 1.4.7或更晚),并使用其默认参数或任何等价程序来进行。“等价程序”意指任何序列比对程序,该程序对于任何考虑的两条序列,当与该优选程序产生的相应比对进行比较时,产生具有相同核苷酸或氨基酸残基匹配和相同百分序列同一性的比对。
(C)如本文所示,在两条核酸或多肽序列的上下文中“序列同一性”或“同一性”是指在特定的比较窗口比较最大对应性时,两条序列中相同的残基。当使用序列同一性百分比涉及蛋白质时,应该认识到,不相同的残基位置通常是因保守氨基酸替换而不同,保守氨基酸替换是氨基酸残基替换为另外具有相似化学特性(例如,电荷或疏水性)的氨基酸残基并且因此不改变分子的功能特性。当序列的不同在于保守性替换时,百分序列同一性可以上调,以校正替换的保守特性。不同在于这样的保守性替换的序列称为具有“序列相似性”或“相似性”。本领域技术人员熟知进行这种调整的方法。通常这种方法包括将保守性替换记为部分而不是完全不匹配,由此提高了序列同一性百分比。因此,例如,当给定相同的氨基酸的得分为1并且非保守性替换的得分为0时,给定保守性替换的得分为0至1之间。例如,如在PC/GENE程序中(Intelligenetics,Mountain View,加利福尼亚)执行的一样计算保守性替换的得分。
(d)如本文所示,“序列同一性百分比”意指通过比较比较窗口中两条最佳比对序列而测定的值,其中为了获得两条序列的最佳比对,与参考序列(其不包含添加或缺失)相比,比较窗口中多核苷酸序列部分可以包含添加或缺失(即缺口)。通过下述方法计算百分比:测定两条序列中存在相同核酸碱基或氨基酸残基的位置的数量而产生的匹配位置的数量,将匹配位置的数量除以比较窗口中位置的总数,和将结果乘以100以产生序列同一性的百分比。
(e)(i)术语多核苷酸序列“基本上相同”是指多核苷酸序列包含以下这样的序列:使用标准参数,采用描述的一种比对程序,与参考序列相比,该序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%或79%、优选至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%、更优选至少90%、91%、92%、93%或94%、最优选至少95%、96%、97%、98%或99%序列同一性。本领域技术人员知晓,通过考虑密码子简并性、氨基酸相似性、阅读框架定位等可以适当地调整这些数值以确定由两条核苷酸序列编码的蛋白质的相应同一性。用于这些目的的氨基酸序列的基本上同一性通常是指至少70%,更优选至少80%、90%和最优选至少95%的序列同一性。
如果两条分子在严谨条件下(见下)相互杂交,也指示核苷酸序列基本上相同。通常,严谨条件选择为比在指定离子强度和pH下特定序列的热解链温度(Tm)约低5℃。然而,严谨条件包括约1℃至约20℃范围内的温度,依赖于本文另外限定的期望的严谨程度。在严谨情况下相互不杂交的核酸,如果他们编码的多肽基本上相同,也仍是基本上相同的。这种情况可以发生于,例如,使用遗传密码允许的最大的密码子简并性产生的核酸拷贝时。两条核酸序列基本上相同的一个指示为由第一核酸序列编码的多肽与第二核酸编码的多肽有免疫学交叉反应性。
(e)(ii)在多肽的上下文中术语“基本上相同”是指所述多肽包含以下序列:在一个特定的比较窗口中,与参考序列具有至少50%、60%、70%、71%、72%、73%、74%、75%、76%、77%、78%或79%、优选80%、81%、82%、83%、84%、85%、86%、87%、88%或89%、更优选至少90%、91%、92%、93%或94%、或甚至更优选95%、96%、97%、98%或99%序列同一性。优选地,使用Needleman和Wunsch(1970)的同源性比对算法进行最佳比对。两条多肽序列基本上相同的一个指示为一条多肽与抗第二多肽的抗体免疫学反应。因此,例如,当两条多肽不同仅仅在保守性替换时,一条多肽与第二多肽基本上相同。
为了序列比较,通常一条序列作为参考序列,而待测序列与之比较。当使用序列比较算法时,将待测序列和参考序列输入计算机,如果需要,指定亚序列坐标,和指定序列算法程序参数。然后序列比较算法程序基于指定的程序参数,计算待测序列相对于参考序列的百分序列同一性。
如上所述,两条核酸序列基本上相同的另一种指示为在严谨条件下,两条分子相互杂交。短语“特异性杂交”指当特定的核苷酸序列存在于复杂混合物(例如,整个细胞)DNA或RNA中时,一种核酸分子在严谨条件下只与该特定的核苷酸序列结合、形成双螺旋或杂交。“基本上结合”指探针核酸与靶核酸互补杂交,并且包含较少的不匹配,而该不匹配可以通过降低杂交介质的严谨性来调节以获得期望的靶核酸序列的检测。
在上下文核酸杂交实验,例如Southern和Northern杂交中的“严谨的杂交条件”和“严谨杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。Tm为(在指定的离子强度和pH下)50%靶序列与完全匹配的探针杂交时的温度。特异性通常为杂交后洗涤的函数,关键因素为最终洗涤溶液的离子强度和温度。DNA-DNA杂交体的Tm可以通过Meinkoth和Wahl等式大致计算,1984;Tm81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L;其中M为单价阳离子的摩尔浓度,%GC为DNA中鸟苷和胞嘧啶的百分比,%form为杂交溶液中甲酰胺的百分比,L杂交体的长度,以碱基对表示。对于每1%错配,Tm降低约1℃。因此,可以将Tm、杂交和/或洗涤条件调整为与期望同一性的序列杂交。例如,如果欲得到>90%同一性的序列,可将Tm降低10℃。通常,选择严谨条件为约比指定离子强度和pH下特定的序列和其互补序列的热解链温度I低约5℃。然而,严格严谨条件可以使用比热解链温度I低1、2、3或4℃的杂交和/或洗涤;中度严谨条件可以使用比热解链温度I低6、7、8、9或10℃的杂交和/或洗涤;低严谨条件可以使用比热解链温度I低11、12、13、14、15或20℃的杂交和/或洗涤。使用所述等式,杂交和洗涤组合物,和合适的T,普通技术人员理解,内在描述了杂交和/或洗涤溶液严谨性的变化。如果错配的期望程度导致T小于45℃(水溶液)或32℃(甲酰胺溶液),优选提高SSC的浓度以致于可以使用较高的温度。在Tijssen,1993中可以找到核酸杂交的大量的指导。通常,选择高严谨杂交和洗涤条件为约比指定离子强度和pH下特定序列的热解链温度Tm低约5℃。
高严谨洗涤条件的例子为:0.15M NaCl于72℃约15分钟。严谨洗涤条件的例子为:于65℃,0.2X SSC洗涤15分钟(参见,Sambrook,见上,对SSC缓冲液的描述)。通常,高严谨洗涤之前为低严谨洗涤以除去背景探针信号。对例如多于100个核苷酸的双链,中度严谨洗涤的例子为1X SSC,45℃,15分钟。对例如多于100个核苷酸的双链,低严谨洗涤的例子为4-6X SSC,40℃,15分钟。对于短探针(例如约10至50个核苷酸),严谨条件通常包括盐浓度低于约1.5M,更优选约0.01至1.0M,Na离子浓度(或其它盐),pH7.0至8.3,和温度通常至少约30℃并且对于长探针(例如,>50个核苷酸)至少60℃。严谨条件还可以通过加入去稳定剂例如甲酰胺来获得。通常,在特定杂交分析中比观察到的不相关探针的信噪比高2X(或更高)的信噪比指示检测到特异杂交。如果核酸编码的蛋白质基本上相同,在严谨条件下相互不杂交的核酸也仍是基本上相同。这种情况可以发生于,例如,使用遗传密码允许的最大的密码子简并性产生的核酸拷贝时。
选择非常严谨条件为与特定探针的Tm相等。在Southern或Northern印迹中的滤膜上具有多于100个互补残基的互补核酸杂交的严谨条件例子为50%甲酰胺,例如,在50%甲酰胺,1M NaCl,1%SDS中于37℃杂交并于60至65℃于0.1X SSC中洗涤。示例性的低严谨条件包括用30至35%甲酰胺,1M NaCl,1%SDS (十二烷基硫酸钠)的缓冲溶液于37℃杂交,并且于1X至2X SSC(20X SSC=3.0M NaCl/0.3M柠檬酸三钠)中于50至55℃洗涤。示例性的中度严谨条件包括于40至45%甲酰胺,1.0M NaCl,1%SDS中于37℃杂交,并且于0.5X至1X SSC中于55至60℃洗涤。
以下为可以用于克隆与本发明的参考核苷酸序列基本上相同的直向同源核苷酸序列的杂交/洗涤条件组合的例子:参考核苷酸序列优选与所述的参考核苷酸序列于7%十二烷基硫酸钠(SDS),0.5MNaPO4,1mM EDTA于50℃杂交并且于2X SSC,0.1%SDS于50℃洗涤,更希望于7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mMEDTA于50℃杂交并且于1X SSC,0.1%SDS中于50℃洗涤,更希望于7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中于50℃杂交并且于0.5X SSC,0.1%SDS中于50℃洗涤,优选于7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中于50℃杂交并且于0.1X SSC,0.1%SDS中于50℃洗涤,更优选于7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA于50℃杂交并且于0.1X SSC,0.1%SDS中于65℃洗涤。
显示将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的本发明纯化多肽的一个非限制性的来源为以下实施例中描述的无细胞提取物。纯化根据本发明显示P450单加氧酶活性的多肽的另一种方法为给蛋白质加标签,由此方便其纯化。因此,本发明提供一种显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的纯化的多肽,其中,所述多肽与标签共价结合。本发明进一步提供一种编码这样带有标签的多肽的核酸分子。
如本文所示,“标签”意指共价与本发明多肽结合的多肽或其它分子,由此,结合剂(例如多肽或分子)特异性结合标签。根据本发明,“特异性结合”意指结合剂(例如抗体或Ni2+树脂)识别并结合特定的多肽或化学物质但基本上不识别或结合样品中的其它分子。在一些实施方式中,特异性结合配体的结合剂与那个配体形成缔合,该缔合在水中,生理条件下,或在就离子强度而言近似的生理条件下,例如140mM NaCl,5mM MgCl2,亲和力至少106M-1,或至少107M-1,或至少108M-1,或至少109M-1。例如,组氨酸标签被镍(例如载Ni2+-柱,以His·Bind树脂商购于Novagen Inc,Madison,WI)特异性结合。同样地,Myc标签被特异性结合Myc的抗体特异性结合。
如下所示,通过产生编码带有组氨酸标签的多肽的核酸分子,并在大肠杆菌中表达所述多肽,组氨酸标签附加到本发明显示P450单加氧酶的酶活性的纯化的多肽上。这些多肽,一旦被大肠杆菌表达,通过常规技术容易纯化(例如使用可商购于Novagen的一个His·Bind试剂盒或使用商购于Clontech Laboratories,Inc.,Palo Alto,CA的TALONTM树脂(和生产商说明))。
另外的标签可以附加于本发明任何或所有的多肽上以便于纯化。这些标签包括,但不限于,HA-标签(氨基酸序列:YPYDVPDYA(SEQ ID NO:39)),Myc-标签(氨基酸序列:EQKLISEEDL(SEQ IDNO:40)),HSV标签(氨基酸序列:QPELAPEDPED(SEQ ID NO:41)),和VSV-G-标签(氨基酸序列:YTDIEMNRLGK(SEQ ID NO:42))。将这些标签共价附加(例如,通过多肽键)于本发明的多肽上,允许分别使用抗-HA抗体、抗-Myc抗体、抗-HSV抗体或抗VSV-G抗体纯化带有标签的多肽,而所有的这些抗体都可以商购获得(例如从以下公司获得:MBL International Corp.,Watertown,MA;NovagenInc.;Research Diagnostics Inc.,Flanders,NJ)。
本发明显示P450单加氧酶活性的带有标签的多肽还可以通过共价键用化学物质,例如生物素标记,生物素被链霉抗生物素蛋白特异性结合,因此,可以在链霉抗生物素蛋白柱上纯化。相似地,本发明带有标签的P450单加氧酶可以共价连接于(例如,通过多肽键)抗体的恒定区。这样的带有标签的P450单加氧酶可以例如,在蛋白A琼脂糖上纯化。
本发明带有标签的P450单加氧酶还可以被GST(谷胱甘肽-S-转移酶)或免疫球蛋白的恒定区标记。例如,本发明的核酸分子(例如,含有SEQ ID NO:1)可以克隆入商购自Amersham Pharmacia Biotech,Inc.(Piscataway NJ)的pGEX质粒中,并且使质粒在大肠杆菌中表达。由该核酸分子编码的所得P450单加氧酶共价结合于GST(谷胱甘肽-S-转移酶)。这些GST融合蛋白可以在谷胱甘肽琼脂糖柱上纯化(商购自例如,Amersham Pharmacia Biotech),由此获得纯化。许多pGEX质粒能使GST部分从融合蛋白中轻松移去。例如,pGEX-2T质粒在插入的感兴趣的核酸分子和GST编码核酸序列之间含有凝血酶识别位点。相似地,pGES-3T质粒含有因子Xa位点。通过用合适的酶处理融合蛋白,然后使用谷胱甘肽琼脂糖(GST特异性与之结合)从本发明的P450单加氧酶中分离GST部分,可以纯化本发明的P450单加氧酶。
另一种获得本发明显示P450单加氧酶活性的纯化的多肽的方法为使用与这样的多肽特异性结合的结合剂。因此,本发明提供一种与本发明P450单加氧酶特异性结合的结合剂。本发明的这种结合剂可以为化学化合物(例如蛋白质),金属离子或小分子。
在特定的实施方式中,结合剂为抗体。术语“抗体”包括,但不限于,多克隆抗体、单克隆抗体、抗体片段(例如Fab、Fv或Fab’片段),单链抗体、嵌合抗体、双特异性抗体、任何同种型抗体(例如,IgG、IgA和IgE)和来自任何种(例如,兔子、鼠和人)的抗体。
在一个非限制性的实例中,本发明的结合剂为多克隆抗体。在另一个非限制性的实例中,本发明的结合剂为单克隆抗体。制备单克隆和多克隆抗体的方法是熟知的(参见,例如,免疫学中的当前方法( Current Protocols in Immunology),编辑John E.Coligan,JohnWiley & Sons,Inc.1993;分子生物学中的当前方法( Current Protocols in Molecular Biology),编辑Ausubel等,John Wiley & Sons,Inc.2000)。
本文描述的显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽属于新的P450单加氧酶的家族。因此,本发明还提供P450单加氧酶多肽家族,其中该家族的每个成员均能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素。在一些实施方式中,该家族的每个成员包含以下氨基酸序列或由以下氨基酸序列构成:该氨基酸序列与SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQID NO:32、SEQ ID NO:34或SEQ ID NO:95具有至少50%同一性。在特定实施方式中,该家族的每个成员由包含以下核酸序列或由以下核酸序列组成的核酸分子编码:与SEQ ID NO:1、SEQ ID NO:3、SEQID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ IDNO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ IDNO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ IDNO:29、SEQ ID NO:31、SEQ ID NO:33或SEQ ID NO:94具有至少66%同一性的核酸序列。
本发明,其提供P450单加氧酶的整个家族,该家族的每个成员都能够将除虫菌素区域选择性氧化为4”-酮-除虫菌素,允许产生天然不存在的改进的P450单加氧酶,而其有效地将除虫菌素区域选择性氧化为4”-酮-除虫菌素并且使不期望的副产物降低。例如,本发明的P450单加氧酶家族的一个成员P450Ema1酶催化不希望的进一步氧化,因为在含有ema1基因的杀结核链霉菌株系R-922和浅青紫链霉菌进行的反应中检测到3”-O-脱甲基-4”-酮-除虫菌素的形成。3”-O-脱甲基-4”-酮-除虫菌素的形成由3”-O-甲基基团的氧化引起,藉此,形成易水解的3”-O-羟甲基基团,其水解形成甲醛和3”-羟基。
通过提供显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽家族(参见,例如以下表3),可以将该家族的单个成员进行家族基因“改组(shuffling)”,以产生编码本发明的优化P450单加氧酶的新的杂合基因。在一个非限制性的例子中,编码P450Ema1蛋白的O2结合位点的ema1基因的一部分可以与编码P450Ema2蛋白的O2结合位点的ema2基因的一部分交换。这样嵌合的ema1/2蛋白在本发明的P450单加氧酶定义中。
还可以使用定点诱变或定向进化技术产生编码具有改进特性的酶的ema1基因衍生物,改进的特性包括更高的整体活性和/或形成的副产物减少。获得这样的突变体的一个方法为按照与如下描述的UV突变杀链霉菌株系R-922相似的方法,将链霉菌株系本身突变。
额外的衍生物可以通过对P450单加氧酶的氨基酸序列进行保守性或非保守性变化制备。保守性和非保守性氨基酸替换是熟知的(参见,例如Stryer,生物化学( Biochemistry),3rd Ed.,W.H.Freeman和Co.,NY 1988)。相似地,可以通过在蛋白的N-端(例如,参见如下描述的ema1A基因)、在C-端截短蛋白或从蛋白的中部截短(例如除去氨基酸残基)产生截短的本发明P450单加氧酶。
只要突变、衍生物或截短的P450单加氧酶能够将除虫菌素区域选择性地氧化为4”-酮-除虫菌素,这样的突变、衍生物或截短的P450单加氧酶也为本发明的P450单加氧酶。
在另一方面,本发明提供一种细胞,该细胞经基因工程化含有编码显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的核酸分子。“基因工程化”意指核酸分子对于引入它的细胞而言为外源的。可以通过任何方式将外源核酸分子引入基因工程化的细胞,包括,但不限于,转染、转导和转化。
在某些实施方式中,将核酸分子定位以用于在基因工程化的细胞中表达。“定位以用于表达”意指编码多肽的外源核酸分子以这种方式与调控序列连接,以允许在引入细胞时核酸分子表达。“调控序列”意指核酸序列,例如,起始信号、多腺苷酸化(polyA)信号、启动子和增强子,其控制与其可操作地连接的蛋白质编码序列的表达。编码蛋白质或多肽片段的核酸分子的“表达”意指该核酸分子表达为蛋白质和/或mRNA。
本发明的基因工程化细胞可以为原核细胞(例如大肠杆菌)或真核细胞(例如酿酒酵母(Saccharomyces cerevisiae)或哺乳动物细胞(例如,HeLa))。根据本发明的一些实施方式,基因工程化细胞为其野生型(即,未基因工程化的)细胞天然不含有插入的核酸分子并且不天然表达由插入的核酸分子编码的蛋白质的细胞。因此,细胞可以为基因工程化链霉菌株系,例如浅青紫链霉菌或除虫链霉菌(Streptomyces avermitilis)。可替换地,细胞可以为基因工程化的假单胞菌属的株系,例如恶臭假单胞菌或荧光假单胞菌(Pseudomonasfluorescens)株系。在另一替换方式中,细胞可以为基因工程化的大肠杆菌株系。
应注意,在一些经基因工程化而包含编码显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的核酸分子的细胞类型中,真正的基因工程化细胞本身可以不能将除虫菌素转变为4”-酮-除虫菌素。而是,由这样的基因工程化细胞异源表达的P450单加氧酶可以从该细胞中纯化,其中本发明纯化的P450单加氧酶可以用于将除虫菌素区域选择性氧化为4”-酮-除虫菌素。这样,本发明的基因工程细胞不需要本身能够将除虫菌素转变为4”-酮-除虫菌素;而是,本发明的基因工程细胞只需要含有编码显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的核酸分子,不管在该细胞中多肽是否有活性。
另外,基因工程化的含有编码显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的核酸分子的细胞(例如,大肠杆菌),可以不能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素,尽管从该基因工程细胞中纯化的P450单加氧酶能够将除虫菌素区域选择性氧化为4”-酮-除虫菌素。然而,如果将相同细胞基因工程化以含有本发明显示P450单加氧酶酶活性的多肽、本发明的铁氧还蛋白和/或本发明的铁氧还蛋白还原酶,那么都从该细胞中纯化的P450单加氧酶与铁氧还蛋白和铁氧还蛋白还原酶一起,在还原剂(例如,NADH或NADPH)存在下,将能够将除虫菌素区域选择性地氧化为4”-酮-除虫菌素。而且,含有本发明的P450单加氧酶、本发明的铁氧还蛋白和本发明的铁氧还蛋白还原酶的基因工程细胞本身可能能够进行这种氧化。
而且,在一个非限制性例子中,对细胞(例如,大肠杆菌)基因工程化以表达本发明的P450单加氧酶、铁氧还蛋白和铁氧还蛋白还原酶蛋白,当从基因工程大肠杆菌中纯化所有的这三种蛋白时,这些蛋白一起在还原剂(例如,NADH或NADPH)存在下,将具有活性并且能够将除虫菌素区域选择性氧化为4”-酮-除虫菌素,因此,可用于生产依马菌素的方法中。
根据本发明,已将下列材料按照国际承认用于专利程序目的保藏微生物的布达佩斯条约的规定,保藏于农业研究机构保藏中心(Agricultural Research Service,Patent Culture Collection(NRRL),1815 North University Street,Peoria,Illinois 61604):(1)浅青紫链霉菌ZX7(ema1/fd233-TUA1A)NRRL指定号B-30478;和(2)含有质粒pRK290-ema1/fd233的恶臭假单胞菌NRRL B-4067,NRRL指定号B-30479。
在鉴定显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的新家族中,在发现P450单加氧酶的相同的细菌株系中,还鉴定了新的铁氧还蛋白和新的铁氧还蛋白还原酶。因此,在另一方面,本发明提供一种包含编码显示铁氧还蛋白酶活生的多肽的核苷酸序列的纯化核酸分子,其中所述的核酸分子分离自含有将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽的链霉菌属株系。相似地,本发明提供一种包含编码显示铁氧还蛋白还原酶酶活性的多肽的核苷酸序列的纯化核酸分子,其中所述的核酸分子分离自含有将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽的链霉菌属株系。本发明还提供一种显示铁氧还蛋白的酶活性的纯化的多肽和显示铁氧还蛋白还原酶的酶活性的纯化的多肽,其中铁氧还蛋白和铁氧还蛋白还原酶蛋白分离自含有将除虫菌素区域选择性氧化为4”-酮-除虫菌素的多肽的链霉菌属株系。
含有编码显示铁氧还蛋白酶活性的多肽的核苷酸序列的有用核酸分子包含或本质上由以下核酸序列构成:该核酸序列与SEQ ID NO:35或SEQ ID NO:37具有至少81%同一性。可替换地,该核酸分子包含或本质上由以下核酸序列构成:该核酸序列与SEQ ID NO:35或SEQID NO:37具有至少85%,或至少90%,或至少95%或至少99%同一性。包含编码显示铁氧还蛋白酶活性的多肽的核苷酸序列的核酸分子可以包含或本质上由SEQ ID NO:35或SEQ ID NO:37的核酸序列构成。
显示铁氧还蛋白活性的本发明的蛋白质可以包含或本质上由以下氨基酸序列构成:该氨基酸序列与SEQ ID NO:36或SEQ ID NO:38具有至少80%同一性。在一些实施方式中,所述核酸分子包含或本质上由以下氨基酸序列构成:该氨基酸序列与SEQ ID NO:36或SEQID NO:38具有至少85%,或至少90%,或至少95%,或至少99%同一性。本发明的铁氧还蛋白可以包含或本质上由SEQ ID NO:36或SEQ IDNO:38的氨基酸序列构成。
含有编码本发明显示铁氧还蛋白还原酶酶活性的蛋白质的核苷酸序列的有用核酸分子包含或本质上由以下核酸序列构成:所述核酸序列与SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102或SEQ IDNO:104具有至少85%,或至少90%,或至少95%,或至少99%同一性。在本发明特定实施方式中,编码本发明的铁氧还蛋白还原酶的核酸分子可以包含或本质上由以下氨基酸序列构成:SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102或SEQ ID NO:104。
本发明的铁氧还蛋白还原酶可以包含或本质上由以下氨基酸序列构成:所述氨基酸序列与SEQ ID NO:99、SEQ ID NO:101、SEQ IDNO:103或SEQ ID NO:105具有至少85%,或至少90%,或至少95%,或至少99%同一性。在本发明的特定实施方式中,本发明的铁氧还蛋白还原酶可以包含或本质上由以下氨基酸序列构成:SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103或SEQ ID NO:105。
本领域已知纯化铁氧还蛋白和铁氧还蛋白还原酶蛋白及编码这样的铁氧还蛋白和铁氧还蛋白还原酶的核酸分子的方法,并且这些方法与上述纯化本发明的P450单加氧酶和编码本发明的P450单加氧酶的核酸分子描述的方法相同。
在获得本发明纯化的P450单加氧酶和纯化的铁氧还蛋白的一个非限制性的例子中,可以对浅青紫链霉菌株系(或恶臭假单胞菌或其它任何不天然产生本发明的P450单加氧酶的细胞)基因工程化以包含编码本发明P450单加氧酶的第一核酸分子和编码铁氧还蛋白的第二核酸分子,其中对第一和第二核酸分子定位以在该基因工程细胞中表达。第一和第二核酸分子可以在分开的质粒中,或可以在同一质粒中。这样,同一基因工程细胞或株系将产生本发明的P450单加氧酶和本发明的铁氧还蛋白。
在获得本发明纯化的P450单加氧酶和纯化的铁氧还蛋白及本发明的纯化的铁氧还蛋白还原酶的另一个非限制性的例子中,可以对浅青紫链霉菌株系(或恶臭假单胞菌株系,或其它任何不天然产生本发明的P450单加氧酶的细胞)基因工程化以包含编码本发明P450单加氧酶的第一核酸分子和编码本发明的铁氧还蛋白的第二核酸分子及编码本发明铁氧还蛋白还原酶蛋白的第三核酸分子,其中对第一和第二及第三核酸分子定位以在基因工程细胞中表达。第一和第二及第三核酸分子可以在分开的质粒中提供,或可以在同一质粒中提供。这样,同一基因工程细胞或株系将产生本发明的P450单加氧酶和本发明的铁氧还蛋白及铁氧还蛋白还原酶蛋白。
如同上文对本发明的P450单加氧酶描述的一样,铁氧还蛋白和/或铁氧还蛋白还原酶蛋白可以进一步包含标签。另外,本发明还包括与铁氧还蛋白特异性结合的结合剂(例如,抗体)和与本发明铁氧还蛋白还原酶蛋白特异性结合的结合剂。产生带有标签的铁氧还蛋白、带有标签的铁氧还蛋白还原酶蛋白,和与铁氧还蛋白或铁氧还蛋白还原酶特异性结合的结合剂(例如抗体)的方法与如上描述的产生本发明带有标签的P450单加氧酶和产生与本发明P450单加氧酶特异性结合的结合剂的方法相同。
本发明还提供一种生产依马菌素的方法。在该方法中,把能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶加入含有除虫菌素的反应混合物中。然后,将反应混合物在允许P450单加氧酶将除虫菌素区域选择性氧化为4”-酮-除虫菌素的条件下温育。反应混合物还可以包含铁氧还蛋白,例如本发明的铁氧还蛋白。在特定实施方式中,反应混合物还包含铁氧还蛋白还原酶,例如本发明的铁氧还蛋白。反应混合物还可以包含还原剂,例如NADH或NADPH。
另外,本发明提供一种生产4”-酮-除虫菌素的方法。该方法包括把能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶加入含有除虫菌素的反应混合物中,并且在允许P450单加氧酶将除虫菌素区域选择性氧化为4”-酮-除虫菌素的条件下温育。在一些实施方式中,反应混合物进一步包含铁氧还蛋白,例如本发明的铁氧还蛋白。反应混合物还可以包含铁氧还蛋白还原酶,例如本发明的铁氧还蛋白。在特定实施方式中,反应混合物还可以包含还原剂,例如NADH或NADPH。
本发明还提供一种生产依马菌素的制剂,该制剂包含能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶。在一些实施方式中,所述制剂还包含铁氧还蛋白,例如本发明的铁氧还蛋白。在特定实施方式中,铁氧还蛋白从分离或获得P450单加氧酶的相同种细胞或株系分离。在一些实施方式中,所述制剂还可以包含铁氧还蛋白还原酶,例如本发明的铁氧还蛋白还原酶。在特定实施方式中,所述的铁氧还蛋白还原酶从分离或获得P450单加氧酶的相同种细胞或株系分离。在一些实施方式中,所述制剂还可以包含还原剂,例如NADH或NADPH。
另外,本发明还提供一种生产4”-酮-除虫菌素的制剂,该制剂包含能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶。在一些实施方式中,所述制剂还包含铁氧还蛋白,例如本发明的铁氧还蛋白。在特定实施方式中,铁氧还蛋白从分离或获得P450单加氧酶的相同种细胞或株系分离。在一些实施方式中,所述制剂还可以包含铁氧还蛋白还原酶,例如本发明的铁氧还蛋白还原酶。在特定实施方式中,所述的铁氧还蛋白还原酶从分离或获得P450单加氧酶的相同种细胞或株系分离。所述制剂还可以包含还原剂,例如NADH或NADPH。
以下实施例意欲进一步阐述本发明的某些优选实施方式,并不在本质上进行限制。
实施例I
杀结核链霉菌株系R-922的优化生长条件
在一个非限定性的实施例中,将提供杀结核链霉菌株系R-922细胞稳定供应所需的发酵条件最优化,该株系R-922能够有效地将除虫菌素区域选择性氧化为4”-酮-除虫菌素。
首先,制备下列溶液。对ISP-2琼脂,将4g酵母提取物(商购自Oxoid Ltd,Basingstoke,英国)、4g D(+)-葡萄糖、10g bacto麦芽提取物(Difco No.0186-17-7(Difco产品商购自例如Voigt GlobalDistribution,Kansas City,MO))和20g琼脂(Difco No.0140-01)溶解于1升软化水中,并将pH调为7.0。将溶液于121℃灭菌20分钟,冷却,并保持于55℃至需要直接制备琼脂平板的时间。
对于PHG培养基,将10g蛋白胨(Sigma 0521;商购自SigmaChemical Co.,St.Louis,MO),10g酵母提取物(商购自Difco),10g D-(+)-葡萄糖,2g NaCl,0.15g MgSO4×7 H2O,1.3g NaH2PO4×H2O,和4.4g K2HPO4溶解于1升软化水中,并将pH调为7.0。
杀结核链霉菌株系R-922在28℃生长于ISP-2琼脂的培养皿中。这样培养物用于接种具有挡板的4个500ml摇瓶,每个含有100mlPHG培养基。将这些预培养物于28℃,120rpm的定轨摇床中培养72小时,然后,用于接种装备有机械搅拌器的10升发酵罐中,罐中含有8升PHG培养基。此主要培养物生长于28℃并且以500rpm搅拌,通气量为1.75vvm(14升/分钟)和压力为0.7bar。在对数生长末期,在约20小时后,通过离心收获细胞。湿细胞的产量为70-80g/l培养物。
实施例II
全细胞生物催化分析
如根据本发明测定的,应用下列全细胞生物催化分析确定链霉菌属细胞能够将除虫菌素区域选择性氧化为4”-酮-除虫菌素的活性是由P450单加氧酶催化的。
杀结核链霉菌株系R-922生长于PHG培养基中,杀结核链霉菌株系I-1529生长于M-17或PHG培养基中。PFG培养基含有:10g/l蛋白胨(Sigma,0.521),10g/l酵母提取物(Difco,0127-17-9),10g/l D-葡萄糖,2g/l NaCl,0.15g/l MgSO4×7 H2O,1.3g/l NaH2PO4×1 H2O,和4.4g/l K2HPO4,pH 7.0。M-17培养基含有:10g/l甘油,20g/l白糊精(Dextrin white),10g/l Soytone(Difco 0437-17),3g/l酵母提取物(Difco 0127-17-9),2g/l(NH4)2SO4和2g/l CaCO3,pH7.0。
为了培养细胞,接种ISP2琼脂平板(不长于1-2周)并培养3-7天直至获得好的生长。接着,将过度生长的琼脂块转移到(采用接种环)250ml含有50ml PHG培养基并具有一个挡板的三角瓶中。将这种预培养物于28℃,120rpm培养2-3天。接着,将5ml预培养物转移到500ml含有100ml PHG培养基并具有1个挡板的三角瓶中。将此主要培养物于28℃,120rpm培养2天。接着,将培养物在BeckmanRotor JA-14上于8000rpm离心10分钟。接着将细胞用50mM磷酸钾缓冲液,pH 7.0洗涤一次。
为了进行全细胞生物催化分析,将500mg湿细胞放入25ml三角瓶中,其中加入了10ml的50mM磷酸钾缓冲液,pH7.0。用磁力搅动棒搅动细胞以分散细胞。接着,加入异丙醇中的除虫菌素B1a溶液(30mg/ml)15μl并在定轨摇床中以160rpm,于28℃摇动混合物。株系R-922反应2小时,株系I-1529反应30小时。
为了逐步建立全细胞生物催化分析中的培养物,向含有静息细胞的三角瓶中加入10ml甲基-叔丁基-醚并将整个细胞混合物转移至30ml离心管中,剧烈振荡,然后于16000rpm离心10分钟。将醚相吸入50ml梨形瓶中并通过旋转蒸发器于真空中蒸发(≤0.1mbar)。将残渣再次溶解于1.2ml乙腈中并转移至HPLC样品瓶中。通过HPLC分析使用HPLC程序I可以从生物催化反应观察到除虫菌素B1a至4”-羟基-除虫菌素B1a和4”-酮-除虫菌素B1a(也称为4”-氧代-除虫菌素B1a)的转变,及副产物的形成。
为了进行HPLC程序I,使用如下参数:
硬件
泵:                      L-6250 Merck-Hitachi
自动取样器:              AS-2000A Merck-Hitachi
接口模块:                D-6000 Merck-Hitachi
道1-检测器:              L-7450A UV-Diode Array
                          Merck-Hitachi
柱加热炉(Column Oven):   无
柱:                      70mm×4mm
吸附剂:                  Kromasil 100-3.5μ-C18
梯度模型:低
压力范围:                5-300bar
柱温                      室温(≈20℃)
溶剂A:                   乙腈
溶剂B:                   水
流速:                    1.5ml/min
检测:                    243nm
泵表:              0.0min      75%A        25%B
线性梯度            7.0min      100%A       0%B
                    9.0min      100%A       0%B
跳跃(jump)          9.1min      75%A        25%B
                    12.0min      75%A        25%B
停止时间:          12min
取样间隔:          每200msec
保留时间表: 时间          参考
             2.12min       4”-羟基-除虫菌素B1a
             3.27min       除虫菌素B1a
             3.77min       3”-O-脱甲基-4”-酮-除虫菌素B1a
             4.83min       4”-酮-除虫菌素B1a
实施例III
利用链霉菌株系R-922的无细胞提取物的生物转化
为了制备能够将除虫菌素区域选择性氧化为4”-酮-除虫菌素的来自杀结核链霉菌株系R-922的活性无细胞提取物,制备下列溶液,保存于4℃并在使用时保持在冰上。
溶液 组成
PP-缓冲液 50mM K2HPO4/KH2PO4(pH 7.0)
破碎缓冲液 50mM K2HPO4/KH2PO4(pH 7.0),5mM苯甲脒,2mM二硫苏糖醇,和0.5mM Pefabloc(获自Roche Diagnostics)
底物 10mg除虫菌素溶解于1ml异丙醇中
将链霉菌株系R-922的湿细胞6克在PP-缓冲液中洗涤,然后悬浮于35ml破碎缓冲液中并4℃在弗氏压碎器中破碎。得到的悬浮液于35000×g离心1小时。收集无细胞提取液的上清液。将1μl底物加入499μl澄清的无细胞提取液中,30℃孵育1小时。然后,将1ml甲基-叔丁基醚加入反应混合物中并彻底混合。然后将混合物于14000rpm离心2分钟,将甲基-叔丁基醚相转移入10ml烧瓶中并通过旋转蒸发器于真空中蒸发。将残渣溶解于200μl乙腈中并转移至HPLC样品瓶中。
对于HPLC,使用HPLC程序I。
当将1μl底物加入499μl澄清的无细胞提取液中并于30℃孵育时,使用HPLC程序I通过HPLC分析没有观察到除虫菌素至4”-酮-除虫菌素的转化。
然而,探讨了向无细胞提取液加入菠菜铁氧还蛋白和菠菜铁氧还蛋白还原酶及NADPH以恢复生物催化活性的可能性(参见,通常,D.E.Cane和E.I.Graziani,J.Amer.Chem.Soc.120:2682,1998)。相应地,制备以下溶液:
溶液 组成
底物 10mg除虫菌素溶解于1ml异丙醇中
铁氧还蛋白 5mg铁氧还蛋白(来自菠菜),Tris/HCl-缓冲液中的溶液1-3mg/ml(来自Fluka)或5mg铁氧还蛋白(来自巴氏梭菌(Clostridiumpasteurianum)),Tris/HCl-缓冲液中的溶液1-3mg/ml(来自Fluka)或5mg铁氧还蛋白(来自紫菜(Porphyraumbilicalis)),Tris/HCl-缓冲液中的溶液1-3mg/ml(来自Fluka)
铁氧还蛋白还原酶 1mg冷冻干燥的铁氧还蛋白还原酶(来自菠菜),1ml H2O中的3.9U/mg溶液(来自Sigma)
NADPH H2O中的100mM NADPH(来自Roche Diagnostics)
将底物溶液保存于4℃,其它溶液保存在-20℃,并且在使用时保持于冰上。
将下列溶液加入475μl澄清的无细胞提取液中:10μl铁氧还蛋白,10μl铁氧还蛋白还原酶和1μl底物。在将底物加入细胞中后,将混合物立即且彻底混合和通气。然后,加入5μl的NADPH并且将混合物于30℃温育30分钟。然后,向混合物中加入1ml甲基-叔丁基醚并且彻底混合。接着,将混合物以14000rpm离心2分钟,并且将甲基-叔丁基醚相转移入10ml烧瓶中并且通过旋转蒸发器于真空中蒸发。将残渣溶解于200μl乙腈中并转移至HPLC样品瓶中。使用HPLC程序I进行HPLC分析。
通过HPLC分析可观察到4”-酮-除虫菌素的形成。因此,向无细胞提取液中加入菠菜铁氧还蛋白和菠菜铁氧还蛋白还原酶及NADPH恢复了生物催化活性。
一旦注射30μl样品,在4.83分钟出现一个峰,显示存在4”-酮-除虫菌素B1a。HPLC-质谱分析将870 D的质量分配给该峰,该质量与4”-酮-除虫菌素B1a的分子量相当。
注意,当通过HPLC和HPLC-质谱分析对产物形成进行分析时,除了4”-酮-除虫菌素,还发现在2.12分钟给出相应的酮水合物(ketohydrate)4”-羟基-除虫菌素的峰。该发现显示:P450通过羟基化作用将除虫菌素转变为4”-羟基-除虫菌素,并从其通过脱水作用形成4”-酮-除虫菌素。有趣的是,当来自菠菜的铁氧还蛋白被来自细菌巴氏梭菌或来自红藻Porphyra umbilicalis的铁氧还蛋白替代后,仍发生从除虫菌素至4”-酮-除虫菌素的生物催化转变,显示该酶并不依赖特定的铁氧还蛋白来获取还原当量。
实施例IV
分离具有提高活性的突变链霉菌属株系R-922
为了获得具有提高的将除虫菌素区域选择性氧化为4”-酮-除虫菌素的能力的链霉菌属株系R-922的株系,产生UV突变体。为此,收集链霉菌属株系R-922的孢子,并于-20℃贮存于15%甘油中。所述贮存液含有2×109孢子。
接着将孢子贮存液稀释并转移到含有10ml无菌水的培养平板上,并将悬浮液暴露于Stratalinker UV crosslinker 2400(商购自Stratagene,La Jolla,CA)的UV光下。Stratalinker UV crosslinker使用254-nm光源并且用于照射样品的能量量可以在“能量方式(energy mode)”中设定。
通过试验,确定了需要接受8000微焦耳UV照射(254nm)以杀死99.9%的孢子。在诱变中使用这种水平的UV曝光。
将存活的UV诱变孢子铺板,培养并转移到基本培养基中。约0.3-0.4%的存活孢子测定为营养缺陷型的,显示在群体中诱变的水平好。
在如实施例II描述的全细胞生物催化分析中筛选诱变克隆的活性。如HPLC色谱中显示的,与野生型株系R922相比,一个突变体(“R-922UV突变体”)显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的能力提高2至3倍。尽管编码负责区域选择性氧化活性的P450单加氧酶的基因,即ema1,在R-922UV突变体中并没有突变,但是该突变体提供了含有ema1蛋白质的无细胞提取液的优良来源。
实施例V
从链霉菌属株系R-922分离P450单加氧酶
为了浓缩P450酶,将35ml活性无细胞提取液滤过45μm滤膜,并通过阴离子交换层析分馏。阴离子交换层析的条件如下:
FPLC设备:          kta prime(购自Pharmacia Biotech)
FPLC-柱:           HiTrapTMQ(5ml)堆积到Resource Q
                    (6ml)(购自Pharmacia Biotech)上
洗脱液     缓冲液A:25mM Tris/HCl(pH 7.5)
           缓冲液B:25mM Tris/HCl(pH 7.5),含有1M KCl
温度       洗脱瓶和馏分置于冰浴中
流速       3ml/min
检测       UV 280nm
泵表:       0.0min       100%A    0%B
线性梯度   至2.0min       90%A     10%B
             5.0min       90%A     10%B
线性梯度   至30.0min      50%A     50%B
线性梯度   至40.0min      0%A      100%B
             50.0min      0%A      100%B
采用35%-40%缓冲液B洗脱酶活性。将活性馏分合并,并通过排阻限为5kD的BiomaxTM过滤器(商购自Millipore Corp.,Bedford,MA)于5000rpm离心过滤浓缩,然后在含有20%甘油的破碎缓冲液中再稀释至体积5ml,其含有3-10mg/ml蛋白质。这种浓缩的酶溶液含有至少25%的起始酶活性。
将酶进一步通过大小排阻层析纯化。大小排阻层析的条件如下:
FPLC设备:        kta prime(购自Pharmacia Biotech)
FPLC-柱:         HiLoad 26/60 Superdex 200 prep grade(购
                  自Pharmacia Biotech)
样品:            3-5ml获自阴离子层析步骤的浓缩的酶溶液
样品制备:        通过45μm滤膜过滤
洗脱缓冲液:      PP-缓冲液(pH 7.0)+0.1M KCl
温度:            4℃
流速:            2ml/min
检测:            UV 280nm
酶活性在205-235ml洗脱缓冲液之间洗脱。将活性馏分合并,并通过排阻限为5kD的BiomaxTM过滤器(购自Millipore)于5000rpm离心过滤浓缩,然后在含有20%甘油的破碎缓冲液中再稀释以形成含有2-5mg/ml蛋白质的溶液0.5-1ml。这种浓缩的酶溶液含有至少10%的起始酶活性。这种酶制剂,当通过SDS page检查纯度(参见,通常,Laemmli,U.K.,自然(Nature)227:680-685,1970和分子生物学当前方案,见上)和用考马斯蓝染色时,根据已知分子量的参考蛋白,显示一条分子量为45-50KD的主蛋白带。
实施例VI
试图从链霉菌属株系R-922和I-1529分离P450单加氧酶基因
基于上述显示来自株系R-922负责将除虫菌素区域选择性氧化为4”-酮-除虫菌素的酶为P450单加氧酶的结果,开始进行从这个株系克隆P450单加氧酶的直接基于PCR的方法(参见,通常,Hyun等,J.Microbiol.Biotechnol.8(3):295-299,1998)。该方法基于的实事为:所有的P450单加氧酶包含高度保守的氧结合和血红素结合域,所述结合域在核苷酸水平也是保守的。针对这些保守结构域设计PCR引物并且使用R-922或I-1529基因组DNA作为模板扩增P450基因的DNA片段。使用的PCR引物如表1所示。
表1
  O2结合域引物(5’-3’)*     简并性 SEQ ID NOs
   I   A   G   H   E   T   TATC GCS GGS CAC GAG ACS AC 8     4344
   V   A   G   H   E   T   TGTS GCS GGS CAC GAG ACS AC 16     4546
   L   A   G   H   E   T   TCTS GCS GGS CAC GAG ACS AC 16     4748
L   L   L   I   A   G   H   E   TTS CTS CTS ATC GCS GGS CAC GAG AC& 32     4950
  血红素结合域(3’-5’)*
   H   Q   C   L   G   Q   N   L   AGTG GTC ACG GAS CCS TGC TTG GAS CG& 8     5152
   F   G   H   G   V   H   Q   CAAG CCS GTG CCS CAS GTG GTC ACG 8     5354
   F   G   F   G   V   H   Q   CAAG GCS AAG CCS CAS GTG GTC ACG 8     5556
   F   G   H   G   I   H   Q   CAAG CCS GTG CCS TAG GTG GTC ACG 4     5758
   F   G   H   G   V   H   F   CAAG CCS GTG CCS CAS GTG AAG ACG 8     5960
*顶行显示氨基酸序列;下面第二行显示相应的核苷酸序列;S=G或C。
& Hyun等,见上,描述了该引物。
使用任何特异于编码O2结合域的核苷酸序列的引物与任何特异于编码血红素结合域的核苷酸序列的引物和来自链霉菌属株系R-922或I-1529的基因组DNA的PCR扩增产生约350bp DNA片段。由于P450基因中编码O2结合位点和血红素结合位点的基因片段分离约350bp,这恰好为PCR扩增期望的大小。
将350bp PCR片段克隆入pCR2.1-TOPO TA克隆质粒(商购自Invitrogen,Carlsbad,CA)并转化入大肠杆菌株系TOP10(Invitrogen,Carlsbad,CA)。将来自株系R-922和I-1529的约150个单独的克隆测序以确定代表了多少独特的P450基因片段。序列分析显示它们包括来自株系R-922的8个独特的P450基因片段和来自I-1529的7个独特的片段。
通过威斯康星大学程序包(University of Wisconsin Package)version 10.1的程序Pretty(Altschul等,Nucl.Acids Res.25:3389-3402)将分别来自杀结核链霉菌株系R-922和链霉菌株系I-1529的P450基因特异性PCR片段的推测氨基酸序列和参与合成碳霉素(Stol-ORFA)的耐热链霉菌(S.thermotolerans)P450单加氧酶(GenBank Accession No.D30759)进行比对的Blast分析,显示来自R-922和I-1529株系的所有独特的P450基因片段都衍生于P450基因并且编码O2结合域和血红素结合域间的区域。
接着,为了克隆从中获得PCR片段的全长基因,通过使用PCR克隆的DNA片段作为对含有来自株系R-922和I-1529的基因组DNA的基因文库的杂交探针。为此,采用Sau3A I部分消化来自R-922和I-1529的基因组DNA,用小牛肠碱性磷酸酶(CIP)去磷酸并连接入粘粒pPEH215,一种修饰的SuperCos 1(商购自Stratagene,LaJolla,CA)。使用Gigapack III XL包装提取物将连接产物包装并转染入大肠杆菌XL1 Blue MR宿主细胞。从R-922文库中鉴定出与PCR产生的P450基因片段强烈杂交的20个粘粒,对其中的3个独特的P-450基因亚克隆和测序。根据Church和Gilbert(Church和Gilbert,Proc.Natl.Acad.Sci.美国81:1991-1995,1984)的方案在高严谨条件下进行杂交。简要地讲,这些高严谨条件包括含有500mM磷酸钠(Na-phosphate),1mM EDTA,7%SDS,1%BSA的杂交缓冲液;含有40mM磷酸钠,1mM EDTA,5%SDS,0.5%BSA的洗涤缓冲液1;和含有40mM磷酸钠,1mM EDTA,1%SDS的洗涤缓冲液2(注意,在分子生物学当前方案(见上)中描述了其它高严谨杂交条件)。从I-1529文库中鉴定出19个强杂交粘粒,对其中4个独特的P-450基因亚克隆和测序。
在另一个从株系R-922和I-1529中分离各种P450单加氧酶基因的方法中,使用来自另外细菌的已知P450基因作为杂交探针以鉴定含有来自株系R-922和I-1529的同源P450单加氧酶基因的粘粒克隆。在本次尝试中探针使用来自纤维堆囊菌(Sorangium cellulosum)株系So ce90的epoF P450基因,其参与环氧聚微管素(epothilones)的合成(Molnar等,Chem Biol.7(2):97-109,2000)。使用epoF P450基因探针,从株系R-922中鉴定出一个粘粒(克隆LC),并且从株系I-1529中鉴定出三个(克隆LA,LB和EA)。在每种情况中,将同源基因片段亚克隆和测序,并且发现其编码P450单加氧酶。
然而,与实施例VII(以下)鉴定的17个多肽序列比较,未匹配任何这些克隆基因。两条多肽序列(即,LVKDDPALLPR和AVHELMR)定位于O2和血红素结合域之间的区域,所以,这些应该能鉴定通过PCR方法获得的任何部分基因片段。因此,基于Hyun等(见上)的已知PCR技术和使用已知P450基因作为杂交探针的标准方法未鉴定出编码负责区域选择性氧化除虫菌素的特定P450单加氧酶的基因。因此,确定需要额外的试验以分离本发明编码P450单加氧酶的基因。
实施例VII
来自链霉菌属株系R-922的P450单加氧酶的部分测序
由Friedrich Miescher Institute(Basel,瑞士)进行来自链霉菌属株系R-922的P450单加氧酶的部分氨基酸测序。SDS page上主要带的蛋白质用胰蛋白酶消化并将形成的肽通过质谱和Edman降解分离并测序(一般参见,Zerbe-Burkhardt等,J.Biol.Chem.273:6508,1998)。发现如下17条肽的序列:
序列                      序列I.D.No.
HPGEPNVMDPALITDPFTGYGALR  (SEQ ID NO:61)
FVNNPASPSLNYAPEDNPLTR     (SEQ ID NO:62)
LLTHYPDISLGIAPEHLER       (SEQ ID NO:63)
VYLLGSILNYDAPDHTR         (SEQ ID NO:64)
TWGADLISMDPDR             (SEQ ID NO:65)
EALTDDLLSELIR             (SEQ ID NO:66)
FMDDSPVWLVTR              (SEQ ID NO:67)
LMEMLGLPEHLR              (SEQ ID NO:68)
VEQIADALLAR               (SEQ ID NO:69)
LVKDDPALLPR               (SEQ ID NO:70)
DDPALLPR                  (SEQ ID NO:71)
TPLPGNWR                  (SEQ ID NO:72)
LNSLPVR                   (SEQ ID NO:73)
ITDLRPR                   (SEQ ID NO:74)
EQGPVVR                   (SEQ ID NO:75)
AVHELMR                   (SEQ ID NO:76)
AFTAR                     (SEQ ID NO:77)
FEEVR                     (SEQ ID NO:78)
这些肽与选择的放线菌P450单加氧酶序列的比对显示,所有的这些肽为单一P450单加氧酶的片段。
实施例VIII
从株系R-922中克隆编码负责将除虫菌素氧化为4”-酮-除虫菌素的酶的P450单加氢酶基因
通过将获自株系R-922的P450酶的几个肽的氨基酸序列反向翻译设计PCR引物(参见实施例VII和以下表2)。在PCR反应中,5条正向引物(2aF,2bF,3F,1F,和7F)的每一个与一个反向引物(5R)配对,并以R-922基因组DNA作为模板。在每个反应中,产生了期望大小的DNA片段。
表2
 引物 引物序列和设计引物序列所针对的氨基酸序列 简并性 期望大小(bp)**     SEQIDNO:
 2aF       P   G   E   D   N   V   M5′-CCS GGS GAR CCS AAY GTS ATG-3′     64     600     7980
 2bF       A   L   I   T   D   P   F5′-GCS CTS ATY ACS GAC CCS TTC-3′     32     580     8182
 3F       F   M   D   D   S   P   V   W5′-TTC ATG GAC GAC WSS CCS GTS TGG-3′     32     549     8384
 1F       L   N   Y   D   A   P   D   H5′-CTS AAY TAY GAC GCS CCS GAC CAC-3′     32     350     8586
 7F       V   E   Q   I   A   D   A   L5′-GTS GAR CAG ATY GCS GAC GCS CTS-3′     32     300     8788
 5R       D   L   I   S   M   D   P   D3′-CTG GAS TAR WSS TAC CTG GGS CTG-5′     64     ---     8990
*多义密码:Y=C或T;R=A或G;S=C或G;W=A或T
**当引物与引物5R配对时,PCR产物的期望大小
将分别采用引物(2bF和5R)和(2aF和5R)产生的580和600bp PCR片段克隆入pCR-Blunt II-TOPO克隆质粒(商购自Invitrogen,Carlsbad,CA)并转化入大肠杆菌株系TOP10(Invitrogen,Carlsbad,CA)。然后将插入的DNA片段测序。序列检查显示600和580bp片段在它们共同的580 bp序列中相同。而且,从600bp和580bp片段的核苷酸序列推断的氨基酸序列(SEQ ID NO:2)与从分离基因此区域中对齐的纯化P450Ema1酶分离的肽的氨基酸序列间完全匹配。这个结果强烈提示这些克隆中分离的基因片段来源于编码负责将除虫菌素氧化为4”-酮-除虫菌素的P450Ema1酶的基因。
使用以引物2aF(SEQ ID No:80)和5R(SEQ ID No:90)产生的600bp PCR片段作为对分离自株系R-922的基因组DNA的粘粒文库(如实施例VI描述的粘粒文库)的杂交探针。鉴定出命名为pPEH249和pPEH250的与探针强烈杂交的2个粘粒。将每个粘粒编码P450酶的部分测序,发现两个粘粒间序列相同。鉴定了ema1基因的全部编码序列(SEQ ID NO:1)。获自P450Ema1的所有多肽片段的氨基酸序列与从ema1基因推断的氨基酸序列完全匹配。利用BLASTP(Altschul等,见上)比较由ema1基因编码的蛋白质的推断的氨基酸序列,确定数据库中最接近的匹配为与来自耐热链霉菌的P450单加氧酶的匹配,而其在碳霉菌的生物合成中起作用(Arisawa等,Biosci.Biotech.Biochem.59(4):582-588,1995)并且其与ema1只具有49%的同一性(同一性=202/409(49%),阳性(Positives)=271/409(65%),缺口=2/409(0%))。在Blast分析中,采用如下设置:
BLASTP  2.0.10
λ(Lambda)      K         H
0.322           0.140     0.428
带缺口的λ
(Gapped Lambda) K         H
0.270           0.0470    0.230
矩阵(Matrix):BLOSUM62
缺口罚值(Gap Penalties):存在(Existence):11,延伸(Extension):1
对DB的命中数(Number of Hits to DB):375001765
序列数(Number of Sequences):1271323
延伸数(Number of extensions):16451653
成功延伸数(Number of successful extensions):46738
优于10.0的序列数(Number of sequences better than 10.0):2211
没有缺口、优于10.0的HSP′s数(Number of better than 10.0without gapping):628
初步测试中成功缺口的HSP′s数(Number of HSP′s successfullygapped in prelim test):1583
初步测试中尝试缺口的HSP′s数(Number of HSP′s thatattempted gapping in prelim test):43251
缺口HSP′s数(非初步测试)(Number of HSP′s gapped(non-prelim)):2577
查询的长度(length of query):430
数据库长度(length of database):409,691,007
有效HSP长度(effective HSP length):55
查询的有效长度(effective length of query):375
数据库的有效长度(effective length of database):339,768,242
有效检索空间(effective search space):127413090750
使用的有效检索空间(effective search space used):127413090750
这两条基因的核苷酸序列的相似比较显示它们在核苷酸水平具有65%的同一性。这些结果证明P450Ema1为新的酶。
实施例IX
ema1基因在浅青紫链霉菌株系ZX7中异源表达
ema1基因的编码序列与硫链丝菌肽可诱导的启动子(tipA)(Murakami等,J.Bacteriol.171:1459-1466,1989)融合。TipA启动子来自质粒pSIT151(Herron和Evans,FEMS MicrobiologyLetters 171:215-221,1999)。
通过首先用下列引物扩增ema1编码序列以在5’端引入PacI克隆位点和在3’端引入PmeI匹配端,实现tipA启动子和ema1编码序列的融合。
正向引物:下面划线的序列为PacI识别序列;粗体序列为ema1编码序列的起始。
Figure A0281000000791
反向引物:下面划线的序列为PmeI识别序列的一半;粗体序列为ema1翻译终止子的反向互补序列,然后为ema1编码序列的3’端。
5’-AAACTCACCCCAACCGCACCGGCAGCGAGTTC-3”(SEQ ID NO:92)
将含有ema1编码序列的PacI消化的PCR片段克隆入质粒pTBBKA(参见图1),该质粒已用PacI和PmeI限制(即消化),并且连接的质粒转化入大肠杆菌。将四个克隆测序。四个中的三个含有全部和正确的ema1编码序列。第四个ema1基因克隆含有ema1基因的截短的版本。全长ema1基因编码以氨基酸序列MSELMNS(SEQ IDNO:93)起始的蛋白质。截短的基因编码缺少开始的4个氨基酸并以第二个蛋氨酸残基起始的蛋白质。这个基因命名为ema1A。ema1A的核苷酸和氨基酸序列分别以SEQ ID NO:33和SEQ ID NO:34提供。这些质粒pTBBKA-ema1和pTBBKA-ema1A中的ema和ema1A基因与tipA启动子正确邻接以引起基因从这个启动子表达。
质粒pTBBKA含有来自链霉菌插入元件IS117的基因,该基因编码催化将质粒位点特异性整合入链霉菌属物种的染色体中的整合酶(Henderson等,Mol.Microbiol.3:1307-1318,1989和Lydiate等,Mol.Gen.Genet.203:79-88,1986)。由于质粒pTBBKA仅具有大肠杆菌复制起点,并含有转移位点(mobilization site),其可以通过结合从大肠杆菌转移至链霉菌属株系,在那儿其不复制。然而,由于IS117整合酶,它能够整合入染色体。由于质粒带有卡那霉素抗性基因,所以可以通过对卡那霉素的抗性选择含有染色体整合的链霉菌属克隆。
还将ema1编码序列克隆入其它在引入链霉宿主后或者在链霉菌中复制或者象pTBBKA一样整合入染色体的质粒。例如,将ema1克隆入质粒pEAA,质粒pEAA与质粒pTBBKA相似但含有tipA启动子的KpnI/PacI片段被ermE基因启动子替换(Schmitt-John和Engels,Appl Microbiol Biotechnol.36(4):493-498,1992)。另外,pEAA不含有卡那霉素抗性基因。ema1基因以PacI/PmeI片段形式克隆入pEAA以产生质粒pEAA-ema1,在该质粒中ema1基因由组成型ermE启动子表达。
质粒pTUA1A为链霉菌-大肠杆菌穿梭质粒(参见图2),该质粒含有tipA启动子。也将ema1基因克隆入质粒pTUA1A的PacI/PmeI位点以产生质粒pTUA-ema1。
也将ema1A基因片段以与ema1基因片段相同的方式,作为PacI/PmeI片段连接入质粒pTUA1A和pEAA,分别产生质粒pTUA-ema1A和pEAA-ema1A。
将含有ema1或ema1A基因的基于pTBBKA、pTUA1A和pEAA的质粒引入浅青紫链霉菌ZX7,并且在每种情况下,获得并验证转化体(分别为浅青紫链霉菌株系ZX7∷pTBBKA-ema1或ema1A,ZX7(pTUA-ema1或-ema1A),和ZX7∷pEAA-ema1或-ema1A)。
测试野生型浅青紫链霉菌株系ZX7,发现其不能将除虫菌素氧化为4”-酮-除虫菌素。使用静息细胞(resting cells),检测每种转化的浅青紫链霉菌株系ZX7∷pTBBKA-ema1,ZX7∷pTBBKA-ema1A,ZX7(pTUA-ema1),ZX7(pTUA-ema1A),ZX7∷pEAA-ema1,和ZX7∷pEAA-ema1A将除虫菌素氧化为4”-酮-除虫菌素的能力。为此,进行如上描述的全细胞生物催化活性分析(包括分析方法)。注意,对于全细胞生物催化分析,转化的浅青紫链霉菌,象株系R-922一样生长于PHG培养基上,并仍然象株系R-922一样,具有16小时的反应时间(即,在此期间,将于50mM磷酸钾缓冲液10ml,pH7.0中的转化浅青紫链霉菌湿细胞500mg于28℃,在15μl异丙醇中的除虫菌素(30mg/ml)溶液存在下以160rpm振荡)。
发现在诱导剂硫链丝菌肽(5ug/ml)存在下,含有ema1或ema1A的株系ZX7∷pTBBKA-ema1,ZX7∷pTBBKA-ema1A,ZX7(pTUA-ema1),ZX7(pTUA-ema1A)将除虫菌素氧化为4”-酮-除虫菌素,证据为出现了氧化的4”-酮-除虫菌素化合物(参见表3)。
表3
Beispiel 1:株系                除虫菌素的转化%
    2小时     16小时
 浅青紫链霉菌ZX7+质粒1
 无     0     0
 pTBBKA-ema1A     0.5±0.059     1.17±0.112
 pTBBKA-ema1     0.21±0.0.356     0.65±0.079
 pTUA-ema1     20.96±1.044     42.0±2.5
 pEAA-ema1     3.0±0.232     24.1±0.358
 pTBBKA-ema2     4.79±0.096     9.57±0.423
 pTUA-ema2     0.77±0.138     2.05±0.537
 pEAA-ema2     0.0     1.73±3.00
 pTBBKA-ema1/fd233     8.89±0.720     30.99±0.880
 pTUA-ema1/fd233     23.29±0.854     61.2±3.548
 pEAA-ema1/fd233     8.26±0.845     10.66±0.858
 pTUA-ema2/fd233     1.85±0.861     6.40±1.918
 恶臭假单胞菌S12+质粒
 无     0
 pRK-ema1     ND2     18
 pRK-ema1/fd233     ND     32
1pTBBKA=IS117整合酶,tipA启动子;pTUA=复制型质粒,tipA启动子;pEAA=IS117整合酶,ermE启动子
2未测定
这些结果结论性证明由ema1基因编码的P450Ema1酶在杀结核链霉菌株系R-922中负责将除虫菌素氧化为4”-酮-除虫菌素。而且,该数据证明比自然ema1基因在N端短4个氨基酸的ema1A基因也编码活性的P450Ema1酶。正如用HPLC分析可证明的,在用0、0.5、或5.0μg/ml硫链丝菌肽诱导ema1表达后,由浅青紫链霉菌株系ZX7∷pTBBKA-ema1将除虫菌素氧化为4”-酮-除虫菌素依赖于用于诱导ema1表达的硫链丝菌肽的量而变化。注意,在不存在硫链丝菌肽的情况下浅青紫链霉菌株系ZX7∷pEAA-ema1和ZX7∷pEAA-ema1A(参见表3)显示这种氧化活性,原因是在这些株系中,由不需要诱导的ermE启动子表达ema1或ema1A基因。
实施例X
从杀结核链霉菌株系I-1529分离ema1同源基因
还发现杀结核链霉菌I-1529在除虫菌素的生物催化形成4”-酮-除虫菌素衍生物中具有活性。采用以如前所述的引物2aF(SEQ IDNo:80)和5R(SEQ ID No:90)产生的600bp ema1 PCR片段在Church和Gilbert的高严谨条件下(Church和Gilbert,Proc.Natl.Acad.Sci.USA 81:1991-1995,1984)对实施例VI所述的来自株系I-1529的粘粒文库进行探针探测,以鉴定含有来自株系I-1529的ema1同系物的克隆。鉴定出3个强杂交的粘粒。将两个粘粒,pPEH252和pPEH253,中的P450基因区域测序,发现是同样的。DNA序列分析揭示存在一个与株系R-922的ema1基因高度同源的基因。将Ema2(即,P450Ema2),Ema1(即,P450Ema1)推断的氨基酸序列,和来自参与碳霉素(Carb-450)生物合成的耐热链霉菌的P450单加氧酶(GenBank登记号D30759)比较,显示来自R-922和I-1529的所有的独特的P450基因片段都衍生于P450基因并且编码O2结合域和血红素结合域间的区域。
来自杀结核链霉菌株系I-1529的基因,命名为ema2,编码与P450Ema1酶在氨基酸水平具有90%同一性且在核苷酸水平具有90.6%同一性的酶。ema2基因的核苷酸序列和P450Ema2推断的氨基酸序列分别在SEQ ID NO:3和SEQ ID NO:4提供。
用与ema1和ema1A基因同样的方式将ema2编码序列克隆入质粒pTBBKA,pTUA1A,和pEAA,使得编码序列在这些质粒中与tipA或ermE*启动子功能性融合。将得到的质粒,pTBBKA-ema2,pTUA-ema2,和pEAA-ema2通过接合从大肠杆菌转移至浅青紫链霉菌ZX7以产生含有ema2基因的株系ZX7∷TBBKA-ema2和ZX7(pTUA-ema2)和ZX7∷pEAA-ema2,ema2基因整合入染色体中或保持在质粒上。
然后,检测株系ZX7∷TBBKA-ema2,ZX7(pTUA-ema2)和ZX7∷pEAA-ema2将除虫菌素氧化为4”-酮-除虫菌素的能力。ema2基因尽管与ema1基因相比水平低,但也显示提供生物催化活性(参见表3)。
这些结果证明来自杀结核链霉菌株系I-1529的ema2基因也编码能够将除虫菌素氧化为4”-酮-除虫菌素的P450单加氧酶(P450Ema2)。
实施例XI
来自其它生物催化株系的ema1同系物的表征
鉴定出17个链霉菌属株系,包括株系R-922和I-1529,能够催化将除虫菌素的4”-甲醇区域特异性氧化为酮。接着,完成编码所有这些株系的生物催化酶的基因的分离和表征。
为此,从这些株系分离出基因组DNA,通过用几个限制性内切酶酶切和与ema1基因Southern杂交进行评价。每个DNA鉴定出一个特定的限制性内切酶,该内切酶将产生一个与ema1基因杂交的确定大小的单一DNA片段。对于每个株系,只有一个强杂交DNA片段,因此,暗示在这些实验中使用高严谨杂交条件下,没有检测出其它P450基因。将每个DNA用合适限制性内切酶消化,并进行琼脂糖凝胶电泳。从凝胶中将包含ema1-杂交片段大小的狭窄大小范围的DNA切除。将大小选择的DNA连接入合适的克隆质粒并且将连接的质粒用于转化大肠杆菌。通过与ema1基因片段的菌落杂交筛选每个实验中的大肠杆菌克隆以鉴定包含ema1同源DNA片段的克隆。
确定每个ema1-同源克隆中克隆的DNA的核苷酸序列,并检查与ema1具有同源性的编码P450酶的基因的存在。采用这种方式,从15个其它活性株系的14株系中分离出ema1同源基因。这些基因的核苷酸和推断的氨基酸序列参见表4的SEQ ID NOS:5-32和94-95。这些酶的关系可以通过系统树形式显示。这样的系统树可以使用商购的GCG Wisconsin software program version 1.0(Madison,WI)产生。
表4
    株系号     分类 SEQ ID NO(分别为核苷酸和氨基酸)
    R-0922   ema1     杀结核链霉菌     2. 1和2
    I-1529   ema2     杀结核链霉菌     3和4
    1053   ema3     龟裂链霉菌     5和6
    R-0401   ema4     利迪链霉菌     7和8
    I-1525   ema5     链霉菌属.     9和10
    DSM-40241   ema6     恰塔努加链霉菌*     3. 11和12
    IHS-0435   ema7     链霉菌属     13和14
    C-00083   ema8     生白链霉菌     15和16
    MAAG-7479   ema9     普拉特链霉菌     17和18
    A/96-1208710   ema10     春日链霉菌     4. 19和20
    R-2374   ema11     龟裂链霉菌     21和22
    MAAG-7027   ema12     杀结核链霉菌     5. 23和24
    Tue-3077   ema13     普拉特链霉菌     25和26
    I-1548   ema14     普拉特链霉菌     27和28
    NRRL-2433   ema15     利迪链霉菌     6. 29和30
    MAAG-0114   ema16     利迪链霉菌     31和32
    DSM-40261   ema17     杀结核链霉菌     94和95
*该株系采用16s rDNA分析显示在恰塔努加种(Chattanoogensis)中;然而,采用德国培养物保藏中心(German culturecollection(DSMZ))使用的经典分类方法显示其为saraceticus。
实施例XII
构建带有组氨酸标签的ema1和ema1同系物以便于酶纯化
为了纯化P450Ema1酶和由其它生物催化株系的ema1同系物编码的P450酶,将每个P450基因克隆入大肠杆菌表达质粒pET-28b(+)(商购自Novagen,Madison,WI)。设计pET-28质粒是用来便于在N-,或C-端与组氨酸标签的融合并提供在大肠杆菌中从T7噬菌体启动子的基因强表达。在许多情况下,ema基因的编码序列以序列ATGT起始。通过PCR将这些基因扩增,这样,在5’端的引物在5’端引入PciI识别位点(5’ATATGT 3’)。PciI位点的后4个碱基与ema基因编码序列起始端的ATGT对应。
设计基因3’端的PCR引物以除去ema基因编码序列末端的翻译终止密码子并且在3’端加入XhoI识别位点。得到的PCR片段用PciI和XhoI限制性酶切以在5’端产生PciI端点和在3’端产生XhoI端点,由此,便于所述片段克隆入先前用NcoI和XhoI限制性酶切的pET-28b(+)中。由于PciI和NcoI的末端是相容的,所述片段以与T7启动子和核糖体结合位点合适的方向克隆入pET-28b(+)以提供基因的表达。
在每个ema基因的3’端,编码序列与组氨酸标签序列在读框中于XhoI位点融合,组氨酸标签序列后为翻译终止密码子。这导致产生C端加有6个组氨酸残基的Ema酶以方便在镍柱上的纯化。
在ema基因的ATG翻译起始密码子后没有T核苷酸的情况下,通过对5’端采用不同的策略利用PCR扩增ema基因。设计5’端的引物以在ATG翻译起始密码子的前面紧接着引入C,并且3’端的引物与如上所描述的相同。扩增的PCR片段用XhoI限制性酶切以在3’端产生XhoI末端,并且保留5’端为平端。将这些片段克隆入pET-28b(+),该pET-28b(+)已用NcoI限制性酶切(但是NcoI端通过用绿豆核酸外切酶处理成平端)并用XhoI限制性酶切。
用这种方式,将ema基因克隆入pET-28b(+)以与以前描述的T7启动子和C末端的组氨酸标签形成功能性融合。将所有带有组氨酸的ema基因测序,以确保没有由PCR引入错误。
通过标准方案分离和纯化大量的P450Ema1和P450Ema2酶。培养含有在诱导型tac启动子控制下的T7 RNA聚合酶基因和合适的pET-28/ema质粒的大肠杆菌株系BL21 DE3(商购自Invitrogen;Carlsbad,CA),收集并裂解细胞。将裂解物施用于Ni-NTA柱(商购自Qiagen Inc.,Valencia,CA),并根据生产商推荐的程序纯化蛋白质。
由于显示将除虫菌素高效率转化为4”-酮-除虫菌素,证明纯化的带有组氨酸标签的P450Ema1和P450Ema2在体外活性分析中具有高度活性。
实施例XIII
ema1在假单胞菌中的表达
接着将ema1基因构建体引入恶臭假单胞菌(野生型恶臭假单胞菌商购自美国典型培养物保藏中心(American Type CultureCollection),马纳萨斯,弗吉尼亚州,ATCC Nos.700801和17453)。ema1和ema1/fd233基因片段以PacI/PmeI片段克隆入质粒pUK21(Viera和Messing,基因(Gene)100:189-194,1991)。将片段以正确的方向克隆入pUK21上tac启动子(Ptac)和终止子(Ttac)之间的位置以用于从tac启动子表达。以BglII片段从pUK21切除Ptac-ema1-Ttac和Ptac-ema1/fd233-Ttac基因片段并将这些片段克隆入广宿主范围的可传递质粒pRK290(Ditta等,Proc.Natl.Acad.Sci.美国77:7347-7351,1980)以产生质粒pRK-ema1和pRK-ema1/fd233(图3)。将这些质粒采用标准方法(Ditta等,Proc.Natl.Acad.Sci.美国77:7347-7351,1980)通过接合转移从大肠杆菌宿主引入恶臭假单胞菌株系ATCC 700801和ATCC 17453。
检测含有质粒pRK-ema1或pRK-ema1/fd233的恶臭假单胞菌ATCC 700801和ATCC 17453催化除虫菌素氧化的能力。如表3所示的结果显示这些株系能够催化这些反应。
实施例XIV
编码与P450Ema1单加氧酶一起有活性的铁氧还蛋白的基因的鉴定P450单加氧酶对其催化的每个羟基化反应需要2个电子(Mueller等,“P45cam研究的二十五年:对加氧酶催化作用的机制见解(Twenty-five years of P450cam research:Mechanistic Insights intoOxygenase Catalysis)”细胞色素P450(Cytochrome P450),第二版,P.R.Ortiz de Montellano(编辑),pp.83-124;Plenum Press,NY1995)。这些电子由铁氧还蛋白一次一个传递给P450单加氧酶。电子归根结底来自NAD(P)H,并由铁氧还蛋白还原酶传递给铁氧还蛋白。当与特定铁氧还蛋白相互作用时,特定P450单加氧酶具有更高的活性。在许多情况下,编码与给定的P450单加氧酶特异性相互作用的铁氧还蛋白的基因与编码P450酶的基因位置临近。
如上所述,除了ema1基因,还分离和测序株系R-922的4个P450基因和株系I-1529的7个P450基因(参见实施例VI)。对于其中的一些,对P-450基因的侧翼DNA有足够的序列信息以寻找相关联的铁氧还蛋白基因的存在。通过该方法,从两个株系的每个都鉴定出2个独特的铁氧还蛋白基因。从株系R-922鉴定出铁氧还蛋白基因fd229和fd230,从株系I-1529鉴定出fd233和fdEA。另外,发现一个铁氧还蛋白还原酶基因位置与来自株系I-1529的fdEA基因邻近。
为了检测与P450Ema1联合的每个这些铁氧还蛋白的生物活性,通过PCR扩增每个单个铁氧还蛋白基因以产生一个基因片段,该基因片段包括5’平端,天然的核糖体结合位点和铁氧还蛋白基因编码序列,和在3’段的PmeI限制性酶切位点。将每个这样的铁氧还蛋白基因片段克隆入质粒pTUA-ema1中位于ema1基因3’端的PmeI位点。采用这种方法,产生了由操作性连接于功能性启动子的ema1基因和一个铁氧还蛋白基因构成的人工操纵子。
在fdEA铁氧还蛋白基因的情况下,其中发现铁氧还蛋白还原酶基因freEA位置与fdEA基因邻近,采用相似的PCR策略,产生同时含有fdEA和freEA基因的DNA片段。按照与其它铁氧还蛋白描述的一样,也将该基因片段克隆入质粒pTUA-ema1的PmeI位点。
通过将各个ema1-铁氧还蛋白基因质粒引入浅青紫链霉菌株系ZX7,检测每个ema1-铁氧还蛋白基因联合的生物活性。测定了浅青紫链霉菌中每个质粒的生物催化活性。在4个不同的构建体中,当与在同样的质粒和宿主背景下ema1单独表达相比时,只有来自株系I-1529的铁氧还蛋白基因fd233提供增强的活性(参见表3)。浅青紫链霉菌中的pTUA-ema1/fd233质粒与pTUA-ema1质粒相比,提供约高1.5至3倍的活性。含有其它铁氧还蛋白基因的其它三个质粒与只有ema1基因的质粒相比,给出基本上相同的结果。同样地,pTUA-ema1/fdEA/freEA质粒没有产生与pTUA-ema1不同的结果。fd233基因的核苷酸序列和推断的氨基酸序列分别显示于SEQ IDNOs:35和36。
fd233的核苷酸和氨基酸序列的BLAST分析揭示最接近的匹配是与天蓝色链霉菌(S.coelicolor)(GenBank登录号AL445945)和浅青紫链霉菌(GenBank登录号AF072709)的铁氧还蛋白。在核苷酸水平,fd233分别与天蓝色链霉菌和浅青紫链霉菌的铁氧还蛋白具有80和79.8%的同一性。在肽水平,fd233分别与天蓝色链霉菌和浅青紫链霉菌的铁氧还蛋白具有79.4和77.8%的同一性。
由于fd233来自株系I-1529,ema1来自株系R-922,所以由这两个基因编码的蛋白质天然不能相互作用。在设计鉴定来自株系R-922的与fd233基因同源并有可能编码与P450Ema1最佳相互作用的铁氧还蛋白的铁氧还蛋白基因的方法中,使用fd233基因作为对株系R-922 DNA的基因文库的杂交探针。鉴定出强杂交质粒pPEH232并且将杂交DNA克隆和测序。比较来自fd233和粘粒pPEH232上的铁氧还蛋白基因fd232的推断的氨基酸序列,揭示它们只有单个氨基酸不同。
以相似的方式,构建质粒pTUA-ema1-fd232并在浅青紫链霉菌ZX7中测试。这个质粒给出与从质粒pTUA-ema1-fd233获得的结果相似结果(参见表3)。fd232的核苷酸序列和推断的氨基酸序列分别显示于SEQ ID NOs:37和38。
也将ema1-fd233操纵子作为PacI-PmeI片段亚克隆入已用相同限制酶消化的pTBBKA和pEAA。在除虫菌素转变分析中,检测浅青紫链霉菌ZX7∷pTBBKA-ema1-fd233和浅青紫链霉菌ZX7∷pEAA-ema1-fd233并且发现,比在可比较质粒中含有单独ema1基因的株系具有更高的活性(参见表3)。
实施例XV
P450Ema1和P450Ema2在其它细胞中的异源表达
表达构建体pRK-ema1(实施例XIII)和pRK-ema2(用与实施例XIII描述的pRK-ema1相似的方法产生)通过接合移动至3个荧光土壤假单胞菌株系。按照标准方法进行接合(Ditta等,Proc.Natl.Acad.Sci.美国,77:7347-7351,1980)。这些株系为:荧光假单胞菌MOCG134、荧光假单胞菌Pf-5和荧光假单胞菌CHAO。对每个转接合子进行将除虫菌素转变为4”-酮-除虫菌素的标准静息细胞分析。对株系Pf-5和CHAO,转变水平低于检测极限。株系MOCG134对ema1产生3%转变,对ema2产生5%转化。
另外,通过原生质体介导的转化,将如表5所列出的构建体引入除虫链霉菌MOS-0001(Kieser,T.;Bibb,M.J.;Buttner,M.J.;Chater,K.F.;Hopwood,D.A.(编辑):实用链霉菌遗传学(PracticalStreptomyces Genetics)The John Innes Foundation,诺里奇(英格兰),2000),(Stutzman-Engwall,K.等(1999)指导B2∶B1除虫菌素比率的除虫链霉菌基因(Streptomyces avermitilis gene directing the ratio ofB2∶B1 avermectins),WO 99/41389))。
表5
    构建体     除虫菌素的转变%,16小时
    无     0
    pTBBKA-ema1     10.90+/-3.48
    pTUA-ema1     5.326+/-2.19
    pEAA-ema1     6.74+/-0.08
    pTBBKA-ema1A/fd233     28.50+/-0.20
    pTUA-ema1A/fd233     23.97+/-5.95
检测野生型除虫链霉菌MOS-0001并且发现其不能将除虫菌素氧化为4”-酮除虫菌素。
使用静息细胞,检测每个转化的除虫链霉菌株系MOS-0001∷pTBBKA-ema1,MOS-0001(pTUA-ema1),MOS-0001∷pEAA-ema1,MOS-0001∷pTBBKA-ema1A/fd233,和MOS-0001(pTUA-ema1A/fd233)将除虫菌素氧化为4”-酮-除虫菌素的能力。为此,进行如上所述的(包括分析方法)全细胞生物催化分析。注意对于全细胞生物催化分析,转化的除虫链霉菌,象株系R-922一样,生长于PHG培养基,并且,再一次如株系R-922一样,反应时间为16小时(即,在此期间,将于10ml的50mM磷酸钾缓冲液(pH 7.0)中的500mg转化的除虫链霉菌湿细胞于异丙醇中15μl除虫菌素溶液(30mg/ml)存在下,于在28℃以160rpm振荡。
如表5所示,在诱导剂硫链丝菌肽(5μg/ml)存在下,发现含有ema1-或ema1A/fd233的株系MOS-0001∷pTBBKA-ema1,MOS-0001∷pTBBKA-ema1A/fd233,MOS-0001(pTUA-ema1)和MOS-0001(pTUA-ema1A/fd233)将除虫菌素氧化为4”-酮-除虫菌素,证据为出现氧化的4”-酮-除虫菌素化合物。注意,除虫链霉菌株系MOS-0001∷pEAA-ama1在不存在硫链丝菌肽下显示这样氧化活性,因为在该株系中,ema1基因由不需要诱导的ermE启动子表达。
这样,在各种链霉菌属和假单病菌属的株系中,ema1 P450单加氧酶基因的表达提供在静息细胞分析中能够将除虫菌素转变为4”-酮除虫菌素的重组细胞。
接着,在大肠杆菌中检测P450Ema1单加氧酶的表达和活性。为此,如前所述将ema1基因克隆入大肠杆菌表达质粒pET-28b(+)中(商购自Novagen,Madison,WI)。将含有在诱导型tac启动子控制下的T7聚合酶基因和pET-28/ema1质粒的大肠杆菌株系BL21 DE3(商购自Invitrogen;Carlsbad,CA)培养于具有一个挡板的250ml烧瓶中含有5mg/l卡那霉素的50ml LB培养基中,于37℃培养16小时,以130rpm振荡。使用0.5ml这种培养物接种具有一个挡板的2升烧瓶中含有5mg/l卡那霉素的500ml LB培养基中,并将培养物于37℃培养4小时,然后30℃培养4小时,并伴以130rpm振荡。通过离心收集细胞,并于50mM磷酸钾缓冲液中洗涤,并再次离心。
对于静息细胞分析,称取90mg湿细胞于深孔平板中,三次重复,并悬浮于0.5ml 50mM磷酸钾缓冲液中。对于无细胞提取物,将8ml破碎缓冲液中的4克湿细胞在弗氏压碎器中破碎。
对于静息细胞分析,将5μl底物(2.5mg/ml于2-丙醇中)加入细胞悬浮液。用可透过空气的箔将平板封住,并于28℃在定轨摇床中以1000rpm温育22小时进行反应。没有检测到除虫菌素转变为4”-酮除虫菌素。
对于无细胞分析,如实施例III所述,加入100μl无细胞提取物,2-丙醇中的1μl底物溶液(20mg/ml),5μl 100mM NADPH,10μl铁氧还蛋白,10μl铁氧还蛋白还原酶,和374μl磷酸钾缓冲液pH 7.0。在30℃以600rpm振荡培养20小时分析。9.2%+/-0.3%的除虫菌素转变为4”-酮除虫菌素。
这样,ema1基因在大肠杆菌中的表达导致有活性的Ema1 P450单加氧酶的产生,当所述单加氧酶从细胞中纯化时,能够将除虫菌素转变为4”-酮除虫菌素。
实施例XVI
鉴定和克隆编码支持提高的P450Ema1单加氧酶适性的铁氧还蛋白还原酶的基因
支持P450单加氧酶活性的电子传递途径还包括铁氧还蛋白还原酶。这些蛋白向铁氧还蛋白供给电子并且,如铁氧还蛋白和P450单加氧酶一样,已知特定的铁氧还蛋白还原酶对某些铁氧还蛋白比其它铁氧还蛋白是更好的电子供体。
因此,克隆链霉菌属株系的许多铁氧还蛋白还原酶基因并评价它们对生物催化反应的影响。为此,从NCBI获取大量细菌铁氧还蛋白还原酶(Fre)蛋白序列,并使用GCG包的程序Pretty比对。使用两个保守区域(相距约266个氨基酸残基)以产生PCR的简并寡核苷酸。使用正向引物(CGSCCSCCSCTSWSSAAS(SEQ ID NO:96;其中“S”为C或G;并且“W”为A或G))并且反向引物(SASSGCSTTSBCCCARTGYTC(SEQ ID NO:97;其中“S”为C或G;“B”为C,G,或T;“R”为A或G;并且“Y”为C或T))从有生物催化活性的链霉菌株系R-922和I-1529扩增800bp产物。将这些产物集合体克隆入TOPO TA克隆载体(商购自Invitrogen Inc.,Carlsbad,CA)并按照标准方法(参见,例如,分子生物学当前方案,Ausubel等编辑,John Wiley & Sons,Inc.2000)对来自R922和I-1529的各20个克隆测序。测序显示从这些株系分离出4个独特的fre基因片段:3个来自R922(fre3,fre12,fre14)和1个来自I-1529(fre16)。使用fre3、fre12、fre14和fre16基因片段作为探针从链霉菌属株系R922和I-1529的基因组克隆库鉴定全长铁氧还蛋白还原酶。通过这种方法,将这4个不同fre基因每一个的全部编码序列克隆和测序。核酸和氨基酸序列提供如下:fre3(SEQ ID NOs:98和99);fre12(SEQ ID NOs:100和101);fre14(SEQ ID NOs:102和103);和fre16(SEQ ID NOs:104和105)。
为了分析每个fre基因与Ema1活性相关的生物活性,将每个基因插入如上所描述的ema1/fd233操纵子,fd233基因的3’端。这形成由相同启动子表达的ema1,fd233和各fre基因构成的人工操纵子。将ema1/fd233/fre操纵子克隆入假单胞菌质粒pRK290,并引入3个不同的恶臭假单胞菌株系。然后使用全细胞分析分析这些株系的Ema1生物催化活性,并且发现,其中的一个基因,即来自株系I-1529的fre基因fre16,提高了P450Ema1单加氧酶的活性约2倍。由于仅在恶臭假单胞菌的一个株系ATCC保藏号No.17453中看到,而在其它两个株系中未看到,故此这种效果是株系特异性的。在恶臭假单胞菌株系ATCC 17453中,fre基因fre16的存在导致与没有该基因的23%相比,除虫菌素至4”-酮-除虫菌素的转变率44%。其它fre基因对任何检测的恶臭假单胞菌株系中的生物催化活性没有影响。
在相似的方法中,将每个ema1/fd233/fre操纵子克隆至链霉菌属的质粒pTUA,pTBBKA和pEAA中,并引入浅青紫链霉菌株系ZX7。在每种情况下,在浅青紫链霉菌中,任何fre基因对生物催化活性没有影响。
等同物
仅仅使用常规试验方法,本领域技术人员将知晓,或能够确定,本文描述的多种特定物质和方法的等同物。这样的等同物被认为在本发明的范围之内。
本文涉及的专利和科学文献确立本领域技术人员能够获得的知识。本文引用的这些公布的专利、申请和参考文献,包括GenBank数据库序列,在此引入作为参考,其程度就象具体和单个地指明将每篇文献引入作为参考一样。任何本文引用的参考文献和本说明书的具体教导间的矛盾,在解决时应利于后者。同样,任何本领域理解的单词或短语的定义与本说明书具体教导的该单词或短语的定义间的矛盾,在解决时应利于后者。
                         序列表
<110>Syngenta Participations AG
<120>生产依马菌素的方法和组合物
<130>PB/5-60016A
<140>
<141>
<150>US 60/291,149
<151>2001-05-16
<160>105
<170>FastSEQ for Windows Version 4.0
<210>1
<211>1293
<212>DNA
<213>杀结核链霉菌(Streptomyces tubercidicus)
<400>1
atgtcggaat taatgaactc tccgttcgcc gcgcacgtcg ggaaacaccc gggcgagccg     60
aatgtgatgg accccgccct gatcaccgac ccgttcaccg gctacggcgc gctgcgtgag    120
cagggcccgg tcgtacgggg ccggttcatg gacgactcgc ccgtctggct ggtgacgcgg    180
ttcgaggagg tccgccaggt cctgcgcgac cagcggttcg tgaacaatcc ggcctcgccg    240
tccctgaact acgcgcccga ggacaacccg ctgacccggc tgatggagat gctgggcctc    300
cccgagcacc tccgcgtcta cctgctcgga tcgatcctca actacgacgc ccccgaccac    360
acccggctgc gccgtctggt gtcgcgggcg ttcacggccc gcaagatcac cgacctgcgg    420
ccccgggtcg agcagatcgc cgacgcgctg ctggcccggc tgcccgagca cgccgaggac    480
ggcgtcgtcg acctcatcca gcacttcgcc taccccctgc cgatcaccgt catctgcgaa    540
ctggtcggca tacccgaagc ggaccgcccg cagtggcgaa cgtggggcgc cgacctcatc    600
tcgatggatc cggaccggct cggcgcctcg ttcccggcga tgatcgagca catccatcag    660
atggtccggg aacggcgcga ggcgctcacc gacgacctgc tcagcgaact gatccgcacc    720
catgacgacg acggcgggcg gctcagcgac gtcgagatgg tcaccatgat cctcacgctc    780
gtcctcgccg gccacgagac caccgcccac ctcatcagca acggcacggc ggcgctgctc    840
acccaccccg accagctgcg tctggtcaag gacgatccgg ccctcctccc ccgtgccgtc    900
cacgagctga tgcgctggtg cgggccggtg cacatgaccc agctgcgcta cgccaccgcc    960
gacgtcgacc tcgccggcac accgatccgc cagggcgatg ccgttcaact catcctggta   1020
tcggccaact tcgacccccg tcactacacc gaccccgacc gcctcgatct cacccggcac   1080
cccgcgggcc acgccgagaa ccatgtgggt ttcggccatg gagcgcacta ctgcctgggc   1140
gccacactcg ccaaacagga aggtgaagtc gccttcggca aactgctcac gcactacccg   1200
gacatatcgc tgggcatcgc cccggaacac ctggagcgga caccgctgcc gggcaactgg   1260
cggctgaact cgctgccggt gcggttgggg tga                                1293
<210>2
<211>430
<212>PRT
<213>杀结核链霉菌
<400>2
Met Ser Glu Leu Met Asn Ser Pro Phe Ala Ala His Val Gly Lys His
1               5                  10                   15
Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Thr Asp Pro Phe
            20                  25                  30
Thr Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg
        35                  40                  45
Phe Met Asp Asp Ser Pro Val Trp Leu Val Thr Arg Phe Glu Glu Val
    50                  55                  60
Arg Gln Val Leu Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Ser Pro
65                  70                  75                  80
Ser Leu Asn Tyr Ala Pro Glu Asp Asn Pro Leu Thr Arg Leu Met Glu
                85                  90                  95
Met Leu Gly Leu Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile
            100                 105                 110
Leu Asn Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
        115                 120                 125
Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu
    130                 135                 140
Gln Ile Ala Asp Ala Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp
145                 150                 155                 160
Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr
                165                 170                 175
Val Ile Cys Glu Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp
            180                 185                 190
Arg Thr Trp Gly Ala Asp Leu Ile Ser Met Asp Pro Asp Arg Leu Gly
        195                 200                 205
Ala Ser Phe Pro Ala Met Ile Glu His Ile His Gln Met Val Arg Glu
    210                 215                 220
Arg Arg Glu Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr
225                 230                 235                 240
His Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Met
                245                 250                 255
Ile Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile
            260                 265                 270
Ser Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
        275                 280                 285
Val Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met
    290                 295                 300
Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Tyr Ala Thr Ala
305                 310                 315                 320
Asp Val Asp Leu Ala Gly Thr Pro Ile Arg Gln Gly Asp Ala Val Gln
                325                 330                 335
Leu Ile Leu Val Ser Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro
            340                 345                 350
Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His
        355                 360                 365
Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala
    370                 375                 380
Lys Gln Glu Gly Glu Val Ala Phe Gly Lys Leu Leu Thr His Tyr Pro
385                 390                 395                 400
Asp Ile Ser Leu Gly Ile Ala Pro Glu His Leu Glu Arg Thr Pro Leu
                405                 410                 415
Pro Gly Asn Trp Arg Leu Asn Ser Leu Pro Val Arg Leu Gly
            420                 425                430
<210>3
<211>1293
<212>DNA
<213>杀结核链霉菌
<400>3
atgtcggcat tatccagctc tccgttcgct gcgcatgtcg ggaaacaccc gggtgagccg     60
aatgtgatgg agccggcgct gctcaccgac ccgttcgcgg gctacggcgc gctgcgtgag    120
caggccccgg tcgtacgggg ccggttcgtg gacgactcac cggtctggtt cgtgacgcgc    180
ttcgaggagg tccgccaagt cctgcgcgac cagcggttcg tgaacaatcc ggccgcgccg    240
cccctggccc catcggccga ggagaacccg ctgaccaggc tgatggacat gctgggcctc    300
cccgagcacc tccgcgtcta catgctcggg tcgattctca actacgacgc ccccgaccac    360
acccggctgc gccgtctggt gtcgcgcgcg ttcacggcgc ggaagatcac cgatctgcga    420
ccgcgtgtcg agcagatcgc cgacgagctg ctggcccgcc tccccgagta cgccgaggac    480
ggcgtcgtcg acctcatcca gcatttcgcc tacccgctgc cgatcaccgt catctgcgag    540
ctggtcggca tacccgaagc ggaccgcccg cagtggcgga agtggggcgc cgacctcatc    600
tcgatggacc cggaccggct cggcgcaacg ttcccggcga tgatcgagca catccatgag    660
atggtccggg agcggcgcgc ggcgctcacc gatgatctgc tcagcgagct gatccgtacc    720
catgacgacg atggcggccg gctcagcgac gtcgagatgg tcaccatgat cctcacgctc    780
gtcctcgccg gtcacgagac caccgcccac ctcatcagca acggcacggc ggcgctgctc    840
acccaccccg accagctgcg cctgctcaag gacgacccgg ccctgctccc ccgggccgtc    900
catgaactga tgcgctggtg cgggccggtg cagatgacgc agctgcgcta cgcggccgcc    960
gacgtcgacc tcgccggtac gcggatccac aagggcgacg ccgtacaact cctcctggtt   1020
gcggcgaact tcgacccccg ccactacacc gaccccgacc gtctcgatct gacgcgtcac   1080
cccgccggcc acgccgagaa ccatgtgggt ttcggccacg gtgcgcatta ctgcctgggt   1140
gccaccctcg ccaagcagga gggcgaagtc gcgttcggca agctgctcgc gcactacccg   1200
gagatgtccc tgggcatcga accggaacgt ctggagcgat tgccgctgcc tggcaactgg   1260
cggctgaatt ccctgccgtt gcggctgggg tga                                1293
<210>4
<211>430
<212>PRT
<213>杀结核链霉菌
<400>4
Met Ser Ala Leu Ser Ser Ser Pro Phe Ala Ala His Val Gly Lys His
1               5                   10                  15
Pro Gly Glu Pro Asn Val Met Glu Pro Ala Leu Leu Thr Asp Pro Phe
            20                  25                  30
Ala Gly Tyr Gly Ala Leu Arg Glu Gln Ala Pro Val Val Arg Gly Arg
        35                  40                  45
Phe Val Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val
    50                  55                  60
Arg Gln Val Leu Arg Asp Gln Arg Phe Val Ash Asn Pro Ala Ala Pro
65                  70                  75                  80
Pro Leu Ala Pro Ser Ala Glu Glu Asn Pro Leu Thr Arg Leu Met Asp
                85                  90                  95
Met Leu Gly Leu Pro Glu His Leu Arg Val Tyr Met Leu Gly Ser Ile
            100                 105                 110
Leu Asn Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
        115                 120                 125
Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu
    130                 135                 140
Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu Tyr Ala Glu Asp
145                 150                 155                 160
Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr
                165                 170                 175
Val Ile Cys Glu Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp
            180                 185                 190
Arg Lys Trp Gly Ala Asp Leu Ile Ser Met Asp Pro Asp Arg Leu Gly
        195                 200                 205
Ala Thr Phe Pro Ala Met Ile Glu His Ile His Glu Met Val Arg Glu
    210                 215                 220
Arg Arg Ala Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr
225                 230                 235                 240
His Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Met
                245                 250                 255
Ile Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile
            260                 265                 270
Ser Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
        275                 280                 285
Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met
    290                 295                 300
Arg Trp Cys Gly Pro Val Gln Met Thr Gln Leu Arg Tyr Ala Ala Ala
305                 310                 315                 320
Asp Val Asp Leu Ala Gly Thr Arg Ile His Lys Gly Asp Ala Val Gln
                325                 330                 335
Leu Leu Leu Val Ala Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro
            340                 345                 350
Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His
        355                 360                 365
Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala
    370                 375                 380
Lys Gln Glu Gly Glu Val Ala Phe Gly Lys Leu Leu Ala His Tyr Pro
385                 390                 395                 400
Glu Met Ser Leu Gly Ile Glu Pro Glu Arg Leu Glu Arg Leu Pro Leu
                405                 410                 415
Pro Gly Asn Trp Arg Leu Asn Ser Leu Pro Leu Arg Leu Gly
            420                 425                 430
<210>5
<211>1413
<212>DNA
<213>龟裂链霉菌(Streptomyces rimosus)
<400>5
atgaccacat cgcccaccga gtcccgggcg gccaccccgc ccgactccac cgcctccccc     60
tcgaccgctt ccgccccggc caccacccct tcggccgccg cctctccgga caccaccgac    120
cgcaccacgc tcccctccta cgtcggcctc cacccgggcg agccgaacct gatggaaccg    180
gagctgctgg agaacccgta caccggctac ggcacgctgc gcgagcaggc cccgctcgtc    240
cgcgcccggt tcatcgacga ctcgcccatc tggctggtga cccgcttcga cgtggtgcgc    300
gaggtgatgc gtgaccagcg gttcgtcaac aacccgaccc tggtgcccgg catcggcgcg    360
gacaaggacc cgcgtgcccg gctgatcgag ctgttcggca tccccgagga cctggccccg    420
tacctcaccg acaacatcct caccagcgac ccgccggacc acacccggct gcgccgcctg    480
gtctcccgcg ccttcaccgc acgccgtatc caggacctgc ggccgcgcgt cgagcggatc    540
accgacgagc tgctggaacg gctgccggac catgccgagg acggcgtcgt cgacctcgtc    600
gagcacttcg cctacccgct gcccatcacg gtcatctgcg agctggtcgg catcgacgag    660
gaggatcggg cgctgtggcg gcggttcggc gccgacctcg cctcgctgaa ccccaagcgc    720
atcggcgcca ccatgccgga gatgatctcg cacatccacg agctgatcga cgaacggcgc    780
gcggccctgc gggacgacct gctcagcggg ctcatccggg cgcaggacga cgacggcggc    840
cggctgagcg acgtcgagat ggtcaccctg gtcctgaccc tggtactggc cggtcacgag    900
accaccgccc acctcatcag caacggcacc ctcgccctgc tcacccaccc cgaccagcgg    960
cggctgatcg acgaggaccc ggcgctgctg ccgcgcgcgg tccacgagct gatgcgctgg   1020
tgcgggccga tccaggccac ccagcttcgg tacgccctgg aggacaccga ggtggccgga   1080
gtccaggtcc gccagggcga ggccctgatg ttcagcctcg tcgcggccaa ccacgacccg   1140
cgccactaca ccgggccgga gcggctcgac ctgacgcggc agccggccgg ccgcgccgag   1200
gaccacgtcg gcttcggcca cggcatgcac tactgcctgg gtgcctcact cgcccggcag   1260
gaggccgagg tggcctacgg gaagctgctc acccgctacc cggacctggc gctcgccctc   1320
accccggaac agttggagga ccaggaacgc ctgcggcagc ccggcacctg gcgcctgcga   1380
cggctgccgc tgaggctgca cgcgcagagc tga                                1413
<210>6
<211>470
<212>PRT
<213>龟裂链霉菌
<400>6
Met Thr Thr Ser Pro Thr Glu Ser Arg Ala Ala Thr Pro Pro Asp Ser
1               5                   10                  15
Thr Ala Ser Pro Ser Thr Ala Ser Ala Pro Ala Thr Thr Pro Ser Ala
            20                  25                  30
Ala Ala Ser Pro Asp Thr Thr Asp Arg Thr Thr Leu Pro Ser Tyr Val
        35                  40                  45
Gly Leu His Pro Gly Glu Pro Asn Leu Met Glu Pro Glu Leu Leu Glu
    50                  55                  60
Asn Pro Tyr Thr Gly Tyr Gly Thr Leu Arg Glu Gln Ala Pro Leu Val
65                  70                  75                  80
Arg Ala Arg Phe Ile Asp Asp Ser Pro Ile Trp Leu Val Thr Arg Phe
                85                  90                  95
Asp Val Val Arg Glu Val Met Arg Asp Gln Arg Phe Val Asn Asn Pro
            100                 105                 110
Thr Leu Val Pro Gly Ile Gly Ala Asp Lys Asp Pro Arg Ala Arg Leu
        115                 120                 125
Ile Glu Leu Phe Gly Ile Pro Glu Asp Leu Ala Pro Tyr Leu Thr Asp
    130                 135                 140
Asn Ile Leu Thr Ser Asp Pro Pro Asp His Thr Arg Leu Arg Arg Leu
145                 150                 155                 160
Val Ser Arg Ala Phe Thr Ala Arg Arg Ile Gln Asp Leu Arg Pro Arg
                165                 170                 175
Val Glu Arg Ile Thr Asp Glu Leu Leu Glu Arg Leu Pro Asp His Ala
            180                 185                 190
Glu Asp Gly Val Val Asp Leu Val Glu His Phe Ala Tyr Pro Leu Pro
        195                 200                 205
Ile Thr Val Ile Cys Glu Leu Val Gly Ile Asp Glu Glu Asp Arg Ala
    210                 215                 220
Leu Trp Arg Arg Phe Gly Ala Asp Leu Ala Ser Leu Asn Pro Lys Arg
225                 230                 235                 240
Ile Gly Ala Thr Met Pro Glu Met Ile Ser His Ile His Glu Leu Ile
                245                 250                 255
Asp Glu Arg Arg Ala Ala Leu Arg Asp Asp Leu Leu Ser Gly Leu Ile
            260                 265                 270
Arg Ala Gln Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val
        275                 280                 285
Thr Leu Val Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His
    290                 295                 300
Leu Ile Ser Asn Gly Thr Leu Ala Leu Leu Thr His Pro Asp Gln Arg
305                 310                 315                 320
Arg Leu Ile Asp Glu Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu
                325                 330                 335
Leu Met Arg Trp Cys Gly Pro Ile Gln Ala Thr Gln Leu Arg Tyr Ala
            340                 345                 350
Leu Glu Asp Thr Glu Val Ala Gly Val Gln Val Arg Gln Gly Glu Ala
        355                 360                 365
Leu Met Phe Ser Leu Val Ala Ala Asn His Asp Pro Arg His Tyr Thr
    370                 375                 380
Gly Pro Glu Arg Leu Asp Leu Thr Arg Gln Pro Ala Gly Arg Ala Glu
385                 390                 395                 400
Asp His Val Gly Phe Gly His Gly Met His Tyr Cys Leu Gly Ala Ser
                405                 410                 415
Leu Ala Arg Gln Glu Ala Glu Val Ala Tyr Gly Lys Leu Leu Thr Arg
            420                 425                 430
Tyr Pro Asp Leu Ala Leu Ala Leu Thr Pro Glu Gln Leu Glu Asp Gln
        435                 440                 445
Glu Arg Leu Arg Gln Pro Gly Thr Trp Arg Leu Arg Arg Leu Pro Leu
    450                 455                 460
Arg Leu His Ala Gln Ser
465                 470
<210>7
<211>1293
<212>DNA
<213>利迪链霉菌(Streptomyces lydicus)
<400>7
atgtcggcat cacccagcaa cacgttcacc gagcacgtcg gcaagcaccc gggcgagccg     60
aacgtgatgg atccggcgct gatcggggat ccgttcgccg gttacggcgc gctgcgcgag    120
cagggcccgg tcgtgcgggg gcggttcatg gacgactccc ccgtgtggtt cgtgacccgc    180
ttcgaggagg tccgcgaggt cctgcgtgac ccgcggttcc ggaacaatcc ggtctccgcg    240
gcgccgggcg cggcccccga ggacaccccg ctgtcccggc tgatggacat gatgggtttc    300
cccgagcacc tgcgcgtcta tctgctcggc tcgatcctca acaacgacgc ccccgaccac    360
acccggctgc gccgcctggt ctcccgggcc ttcaccgcgc ggaagatcac cgatctgcgg    420
ccgcgcgtca cacagatagc cgacgagctg ctggcccggc tgccggagca cgccgaggac    480
ggcgtcgtcg acctgatcca gcacttcgcc tatcccctgc cgatcaccgt catctgcgaa    540
ctggtcggca tccccgagga ggaccgcccg cagtggcgca cctggggcgc cgacctggtc    600
tcgctgcagc cggaccggat gagccggtcc ttcccggcga tgatcgacca catccacgag    660
ctgatcgcgg cgcggcgccg ggcgctcacc gacgatctgc tcagcgagct gatccggacc    720
catgacgacg acggcagccg gctcagcgac gtcgagatgg tcaccatggt cctcaccgtc    780
gtcctggccg gccacgagac caccgcgcac ctcatcggca acggcacggc ggccctgctc    840
acccaccccg accagctgcg gctgctcaag gacgacccgg cgctgctgcc gcgcgcggtg    900
cacgagttga tgcgctggtg cggcccggtg cacatgaccc agctgcgcta cgccgccgag    960
gacgtcgagc tggcgggcgt ccggatccgc acgggggacg ccgtccagct catcctggtg   1020
tcggcgaacc gcgacccgcg ccactacacc gaccccgacc ggctggacct gacccggcac   1080
cctgccggcc acgcggagaa ccatgtgggg ttcggccacg gggcgcacta ctgtctgggc   1140
gccacgctcg ccaagcagga gggcgaggtc gccctcggcg ccctgctcag gcacttcccc   1200
gagctgtcgc tggccgtcgc gccggaggcc ctggagcgca caccggtacc gggcagctgg   1260
cggctgaacg cgctgccgct gcgtctgcgc tga                                1293
<210>8
<211>430
<212>PRT
<213>利迪链霉菌
<400>8
Met Ser Ala Ser Pro Ser Asn Thr Phe Thr Glu His Val Gly Lys His
1               5                   10                  15
Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Gly Asp Pro Phe
            20                  25                  30
Ala Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg
        35                  40                  45
Phe Met Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val
    50                  55                  60
Arg Glu Val Leu Arg Asp Pro Arg Phe Arg Asn Asn Pro Val Ser Ala
65                  70                  75                  80
Ala Pro Gly Ala Ala Pro Glu Asp Thr Pro Leu Ser Arg Leu Met Asp
                85                  90                  95
Met Met Gly Phe Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile
            100                 105                 110
Leu Asn Asn Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
        115                 120                 125
Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Thr
    130                 135                 140
Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp
145                 150                 155                 160
Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr
                165                 170                 175
Val Ile Cys Glu Leu Val Gly Ile Pro Glu Glu Asp Arg Pro Gln Trp
            180                 185                 190
Arg Thr Trp Gly Ala Asp Leu Val Ser Leu Gln Pro Asp Arg Met Ser
        195                 200                 205
Arg Ser Phe Pro Ala Met Ile Asp His Ile His Glu Leu Ile Ala Ala
    210                 215                 220
Arg Arg Arg Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr
225                 230                 235                 240
His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Met
                245                 250                 255
Val Leu Thr Val Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile
            260                 265                 270
Gly Ash Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
        275                 280                 285
Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met
    290                 295                 300
Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Tyr Ala Ala Glu
305                 310                 315                 320
Asp Val Glu Leu Ala Gly Val Arg Ile Arg Thr Gly Asp Ala Val Gln
                325                 330                 335
Leu Ile Leu Val Ser Ala Asn Arg Asp Pro Arg His Tyr Thr Asp Pro
            340                 345                 350
Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His
        355                 360                 365
Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala
    370                 375                 380
Lys Gln Glu Gly Glu Val Ala Leu Gly Ala Leu Leu Arg His Phe Pro
385                 390                 395                 400
Glu Leu Ser Leu Ala Val Ala Pro Glu Ala Leu Glu Arg Thr Pro Val
                405                 410                 415
Pro Gly Ser Trp Arg Leu Asn Ala Leu Pro Leu Arg Leu Arg
            420                 425                 430
<210>9
<211>1299
<212>DNA
<213>链霉菌属物种(Streptomyces sp.)
<400>9
atgtcagcct tatccagctc tccgttcgcc gagcacatag ggaaacaccc gggcgagccg     60
aacgtgatgg aaccggctct gatcaacgat ccgttcggcg gctacggcgc gctgcgcgag    120
caggggccgg ttgtgcgtgg ccggttcatg gacgactcgc ccgtgtggtt cgtgacccgc    180
ttcgaggagg tccgccaagt cctgcgcgac cagcggttcg tgaacaatcc ggcgtcgccg    240
ctcctgggca gtcaggtcga ggagatgccg atggtcaagc tgctggagca gatgggcctc    300
cccgagcacc ttcgggtcta tctgctcgga tcgatcctca acagtgacgc ccccgatcac    360
acccggcttc gccgcctcgt ctcgcgggcc ttcaccgcac gtaagatcac cggtctgcgg    420
ccgcgcgtcg agcagatcgc cgacgagctg ctggcccggc tccccgagca cgccgaggac    480
ggcgtcgtcg acctcatcca gcacttcgcc tacccgctgc cgatcacggt catctgcgaa    540
ctggtcggca tacccgaagc cgatcgcccg caatggcgcg catggggcgc cgacctcgtg    600
tcactggagc cggacaagct cagcacgtcg ttcccggcga tgatcgacca cacccatgaa    660
ctgatccgcc aacggcgcgg cgcgctcacc gacgatctgc tcagcgagct gatccgtgcc    720
catgacgacg acggcagccg gctcagcgac gtcgagatgg tcaccatggt gttcgctctc    780
gtcttcgccg gtcacgagac caccgcccac ctcataggca acggcacggc ggcgctgctc    840
acccaccccg accagctgcg cctgctcaag gacgacccgg ccctgctccc gcgtgccgtc    900
catgagctga tgcgctggtg cgggccggtg cacatgaccc agttgcgtta cgcctccgag    960
gacatcgacc tcgccggtac gccgatccgg aagggcgacg ccgtccaact catcctggta   1020
tcggcgaact tcgacccccg ccactacagc gaccccgatc gcctcgacct gacccgtcac   1080
cccgcaggcc acgccgagaa ccacgtgggc ttcggccacg ggatgcacta ctgcttgggc   1140
gccgcgctcg ccaggcagga aggcgaagtg gcgttcggca aactgctcgc gcactacccg   1200
gacgtagcgc tgggcgtcga accggaagcc ctggagcggg tgccgatgcc cggcagttgg   1260
cggctgaatt ccttgccgct gcggttggcg aagcgctaa                          1299
<210>10
<211>432
<212>PRT
<213>链霉菌属物种
<400>10
Met Ser Ala Leu Ser Ser Ser Pro Phe Ala Glu His Ile Gly Lys His
1               5                   10                  15
Pro Gly Glu Pro Asn Val Met Glu Pro Ala Leu Ile Asn Asp Pro Phe
            20                  25                  30
Gly Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg
        35                  40                  45
Phe Met Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val
    50                  55                  60
Arg Gln Val Leu Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Ser Pro
65                  70                  75                  80
Leu Leu Gly Ser Gln Val Glu Glu Met Pro Met Val Lys Leu Leu Glu
                85                  90                  95
Gln Met Gly Leu Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile
            100                 105                 110
Leu Asn Ser Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
        115                 120                 125
Arg Ala Phe Thr Ala Arg Lys Ile Thr Gly Leu Arg Pro Arg Val Glu
    130                 135                 140
Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp
145                 150                 155                 160
Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr
                165                 170                 175
Val Ile Cys Glu Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp
            180                 185                 190
Arg Ala Trp Gly Ala Asp Leu Val Ser Leu Glu Pro Asp Lys Leu Ser
        195                 200                 205
Thr Ser Phe Pro Ala Met Ile Asp His Thr His Glu Leu Ile Arg Gln
    210                 215                 220
Arg Arg Gly Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Ala
225                 230                 235                 240
His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Met
                245                 250                 255
Val Phe Ala Leu Val Phe Ala Gly His Glu Thr Thr Ala His Leu Ile
            260                 265                 270
Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
        275                 280                 285
Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met
    290                 295                 300
Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Tyr Ala Ser Glu
305                 310                 315                 320
Asp Ile Asp Leu Ala Gly Thr Pro Ile Arg Lys Gly Asp Ala Val Gln
                325                 330                 335
Leu Ile Leu Val Ser Ala Asn Phe Asp Pro Arg His Tyr Ser Asp Pro
            340                 345                 350
Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His
        355                 360                 365
Val G1y Phe Gly His Gly Met His Tyr Cys Leu Gly Ala Ala Leu Ala
    370                 375                 380
Arg Gln Glu Gly Glu Val Ala Phe Gly Lys Leu Leu Ala His Tyr Pro
385                 390                 395                 400
Asp Val Ala Leu Gly Val Glu Pro Glu Ala Leu Glu Arg Val Pro Met
                405                 410                 415
Pro Gly Ser Trp Arg Leu Asn Ser Leu Pro Leu Arg Leu Ala Lys Arg
            420                 425                 430
<210>11
<211>1293
<212>DNA
<213>恰塔努加链霉菌(Streptomyces chattanoogenesis)
<400>11
atgtcggcat cacccagcaa cacgttcacc gagcacgtcg gcaagcaccc gggcgagccg     60
aacgtgatgg atccggcgct gatcggtgat ccgttcgccg gttacggcgc gctgcgcgag    120
cagggcccgg tcgtgcgggg gcggttcatg gacgactccc ccgtgtggtt cgtgacccgc    180
ttcgaggagg tccgcgaggt cctgcgtgac ccgcggttcc ggaacaatcc ggtctccgcg    240
gcgccgggcg cggcccccga ggacaccccg ctgtcccggc tgatggacat gatgggtttc    300
cccgagcacc tgcgcgtcta tctgctcggc tcgatcctca acaacgacgc ccccgaccac    360
acccggctgc gccgcctggt ctcccgggcc ttcaccgcgc ggaagatcac cgatctgcgg    420
ccgcgcgtca cacagatagc cgacgagctg ctggcccggc tgccggagca cgccgaggac    480
ggcgtcgtcg acctgatcca gcacttcgcc tatcccctgc cgatcaccgt catctgcgaa    540
ctggtcggca tccccgagga ggaccgcccg cagtggcgca cctggggcgc cgacctggtc    600
tcgctgcagc cggaccggat gagccggtcc ttcccggcga tgatcgacca catccacgag    660
ctgatcgcgg cgcggcgccg ggcgctcacc gacgacctgc tcagcgagct gatccggacc    720
catgacgacg acggcagcag gctcagcgac gtcgagatgg tcaccatggt cctcaccgtc    780
gtcctggccg gccacgagac caccgcgcac ctcatcggca acggcacggc ggccctgctc    840
acccaccccg accagctgcg gctgctcaag gacgacccgg cactgctgcc gcgcgcggtg    900
cacgagttga tgcgctggtg cggcccggtg cacatgaccc agctgcgcta cgccgccgag    960
gacgtcgagc tggcgggcgt ccggatccgc acgggggacg ccgtccagct catcctggtg   1020
tcggcgaacc gcgacccgcg ccactacacc gaccccgacc gtctggacct gacccggcac   1080
cccgccggtc acgcggagaa ccatgtgggg ttcggccacg gggcgcacta ctgtctgggc   1140
gccacgctcg ccaagcagga gggcgaggtc gccctcggcg ccctgctcag gcacttcccc   1200
gagctgtcgc tggccgtcgc gccggacgcc ctggagcgca caccggtacc gggcagctgg   1260
cggctgaacg cgctgccgct gcgtctgggc tga                                1293
<210>12
<211>430
<212>PRT
<213>恰塔努加链霉菌
<400>12
Met Ser Ala Set Pro Ser Asn Thr Phe Thr Glu His Val Gly Lys His
1               5                   10                  15
Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Gly Asp Pro Phe
            20                  25                 30
Ala Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg
        35                  40                  45
Phe Met Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val
50                  55                  60
Arg Glu Val Leu Arg Asp Pro Arg Phe Arg Asn Asn Pro Val Ser Ala
65                  70                  75                  80
Ala Pro Gly Ala Ala Pro Glu Asp Thr Pro Leu Ser Arg Leu Met Asp
                85                  90                  95
Met Met Gly Phe Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile
            100                 105                 110
Leu Asn Asn Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
        115                 120                 125
Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Thr
    130                 135                 140
Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp
145                 150                 155                 160
Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr
                165                 170                 175
Val Ile Cys Glu Leu Val Gly Ile Pro Glu Glu Asp Arg Pro Gln Trp
            180                 185                 190
Arg Thr Trp Gly Ala Asp Leu Val Ser Leu Gln Pro Asp Arg Met Ser
        195                 200                 205
Arg Ser Phe Pro Ala Met Ile Asp His Ile His Glu Leu Ile Ala Ala
    210                 215                 220
Arg Arg Arg Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr
225                 230                 235                 240
His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Met
                245                 250                 255
Val Leu Thr Val Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile
            260                 265                 270
Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
        275                 280                 285
Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met
    290                 295                 300
Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Tyr Ala Ala Glu
305                 310                 315                 320
Asp Val Glu Leu Ala Gly Val Arg Ile Arg Thr Gly Asp Ala Val Gln
                325                 330                 335
Leu Ile Leu Val Ser Ala Asn Arg Asp Pro Arg His Tyr Thr Asp Pro
            340                 345                 350
Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His
        355                 360                 365
Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala
    370                 375                 380
Lys Gln Glu Gly Glu Val Ala Leu Gly Ala Leu Leu Arg His Phe Pro
385                 390                 395                 400
Glu Leu Ser Leu Ala Val Ala Pro Asp Ala Leu Glu Arg Thr Pro Val
                405                 410                 415
Pro Gly Ser Trp Arg Leu Asn Ala Leu Pro Leu Arg Leu Gly
            420                 425                 430
<210>13
<211>1290
<212>DNA
<213>链霉菌属物种
<400>13
atgaccgaat tagcggactc ccccttcagc gagcacgtcg gcaaacaccc cggcgagccg     60
aacgtgatgg aaccggccct gctcaccgat ccgttcaccg gctacggcga actgcgcgaa    120
cagggcccgg tggtccgcgg ccggttcgcg gacgacaccc ccgtgtggtt catcacccgc    180
ttcgaggagg cccgcgaggt gctgcgcgac caccggttcg ccaatgcccc cgccttcgcg    240
gcgggaggtg gaagcggtga cacaccctcc aaccggctga tggaaatcat ggcctgccc     300
gagcactacc gggtgtacct cgccaacacc atcctcacca tggacgcccc cgaccacacc    360
cggatccggc gattggtctc ccgggcattc accgcccgta agatcaccga tctgcgaccc    420
cgggtggagg acatcgcgga cgatctgctg aggcggctgc ccgagcacgc cgaggacggc    480
gtcgtcgacc tcatcaagca ctacgcctat ccgctgccca taacggtcat ctgcgaactg    540
gtgggaattc cggaggaaga ccgactgcag tggcgggatt gggggtccgc gttcgtctcc    600
ctgcaaccgg atcggctcag caaagcgttc ccggcgatga tcgaacacat tcacgcgctg    660
atccgcgaac ggcgcgcggc gctcaccgac gatctgctca gcgaactgat ccgggtccat    720
gacgacgacg gcggccgact cagcgacgtc gaaatggtca cgatggtcct gaccctcgtt    780
ctcgccggtc atgagaccac cgcccatctc atcggcaacg gcactgccgc gcttctcacc    840
caccccgacc agctgcacct gctgaaatcc gatccggagc tgctcccacg cgccgtgcac    900
gagctgatgc gctggtgcgg accggtgcag atgacgcagt tgcggtacgc caccgaggac    960
gtcgaggtgg ccggggtgca ggtcaagcag ggcgaagcgg tgctggccat gctggtcgcg   1020
gcgaaccacg acccccgcca cttcgccgac cccgcccggc tcgacctcac ccgccagccg   1080
gcgggccggg ccgagaacca cgtcggtttc ggccacggca tgcactactg cctgggcgcc   1140
agcctggccc gccaggaggg cgaggtcgcc ttcgggaacc tgctcgcgca ctacccggac   1200
gtgtcgctgg cggtggaacc ggacgccctc cagcgggtcc cgctgccggg caactggcgg   1260
ctggccgcac tgccggtccg gctgcgctga                                    1290
<210>14
<211>429
<212>PRT
<213>链霉菌属物种
<400>14
Met Thr Glu Leu Ala Asp Ser Pro Phe Ser Glu His Val Gly Lys His
1               5                   10                  15
Pro Gly Glu Pro Asn Val Met Glu Pro Ala Leu Leu Thr Asp Pro Phe
            20                  25                  30
Thr Gly Tyr Gly Glu Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg
        35                  40                  45
Phe Ala Asp Asp Thr Pro Val Trp Phe Ile Thr Arg Phe Glu Glu Ala
    50                  55                  60
Arg Glu Val Leu Arg Asp His Arg Phe Ala Asn Ala Pro Ala Phe Ala
65                  70                  75                  80
Ala Gly Gly Gly Ser Gly Asp Thr Pro Ser Asn Arg Leu Met Glu Ile
                85                  90                  95
Met Gly Leu Pro Glu His Tyr Arg Val Tyr Leu Ala Asn Thr Ile Leu
            100                 105                 110
Thr Met Asp Ala Pro Asp His Thr Arg Ile Arg Arg Leu Val Ser Arg
        115                 120                 125
Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu Asp
    130                 135                 140
Ile Ala Asp Asp Leu Leu Arg Arg Leu Pro Glu His Ala Glu Asp Gly
145                 150                 155                 160
Val Val Asp Leu Ile Lys His Tyr Ala Tyr Pro Leu Pro Ile Thr Val
                165                 170                 175
Ile Cys Glu Leu Val Gly Ile Pro Glu Glu Asp Arg Leu Gln Trp Arg
            180                 185                 190
Asp Trp Gly Ser Ala Phe Val Ser Leu Gln Pro Asp Arg Leu Ser Lys
        195                 200                 205
Ala Phe Pro Ala Met Ile Glu His Ile His Ala Leu Ile Arg Glu Arg
    210                 215                 220
Arg Ala Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Val His
225                 230                 235                 240
Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Met Val
                245                 250                 255
Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile Gly
            260                 265                 270
Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu His Leu Leu
        275                 280                 285
Lys Ser Asp Pro Glu Leu Leu Pro Arg Ala Val His Glu Leu Met Arg
    290                 295                 300
Trp Cys Gly Pro Val Gln Met Thr Gln Leu Arg Tyr Ala Thr Glu Asp
305                 310                 315                 320
Val Glu Val Ala Gly Val Gln Val Lys Gln Gly Glu Ala Val Leu Ala
                325                 330                 335
Met Leu Val Ala Ala Asn His Asp Pro Arg His Phe Ala Asp Pro Ala
            340                 345                 350
Arg Leu Asp Leu Thr Arg Gln Pro Ala Gly Arg Ala Glu Asn His Val
        355                 360                 365
Gly Phe Gly His Gly Met His Tyr Cys Leu Gly Ala Ser Leu Ala Arg
    370                 375                 380
Gln Glu Gly Glu Val Ala Phe Gly Asn Leu Leu Ala His Tyr Pro Asp
385                 390                 395                 400
Val Ser Leu Ala Val Glu Pro Asp Ala Leu Gln Arg Val Pro Leu Pro
                405                 410                 415
Gly Asn Trp Arg Leu Ala Ala Leu Pro Val Arg Leu Arg
            420                 425
<210>15
<211>1428
<212>DNA
<213>生白链霉菌(Streptomyces albofaciens)
<400>15
atgaccacat cgcccaccga gtcccgggcg gccaccccgc ccgactccac cgcctccccc     60
tcgaccgctg ccgccccggc caccacccct tcggccgccg cctctccgga caccacctct    120
cccgccacca ccgaccgcac cacgctcccc tcctacgtcg gcctccaccc gggcgagccg    180
aacctgatgg aaccggagct gctggacaac ccgtacaccg gctacggcac gctgcgcgag    240
caggcgccgc tcgtccgcgc ccggttcatc gacgactcgc ccatctggct ggtgacccgc    300
ttcgacgtgg tgcgcgaggt gatgcgcgac cagcggttcg tcaacaaccc gaccctggtg    360
cccggcatcg gtgcggacca ggacccgcgc gcccggctga tcgagctgtt cggcatcccc    420
gaggacctgg ccccgtacct caccgacacc atcctcacca gcgacccgcc ggaccacacc    480
cggctgcgcc gcctggtctc ccgtgccttc accgcacgcc gtatccagga cctgcggccg    540
cgcgtcgagc ggatcaccga cgagctgctg gcgcggctgc cggaccatgc cgaggacggc    600
gtcgtcgacc tcgtcgagca cttcgcctac ccgctgccca tcacggtcat ctgcgaactg    660
gtcggcatcg acgaggagga ccgggcgctg tggcggcggt tcggcgccga cctcgcctcg    720
ctgaacccca agcgcatcgg cgccaccatg ccggagatga tcgcgcacat ccacgaggtg    780
atcgacgagc ggcgtgcgga cctgcgggac gacctgctca gcgggctcat ccgggcgcag    840
gacgacgacg gcggccggct gagcgacgtc gagatggtca cgctggtgct gaccctggtg    900
ctggccggtc acgagaccac cgcccacctc atcagcaacg gcaccctcgc cctgctcacc    960
caccccgacc agcggcggct gatcgacgag gacccggcgc tgctgccgcg cgcggtccac   1020
gagctgatgc gctggtgcgg gccgatccag gccacccagc tgcggtacgc catggaggac   1080
accgaggtgg ccggtgtcca ggtccgccag ggcgaggccc tgatgttcag cctcgtcgcg   1140
gccaaccacg acccgcgcca ctacaccggc ccggagcggc tcgacctgac gcggcagccg   1200
gccggccgcg ccgaggacca cgtcggcttc gggcacggga tgcactactg cctgggtgcc   1260
tcactggccc ggcaggaggc cgaggtggcg tacggcaagc tgctcacccg ctacccggac   1320
ctggcgctcg cgctcacccc ggaacagctg gaggaccagg aacgcctgcg gcagcccggc   1380
acctggcgcc tgcgacggct gccgctgagg ttgcacgcgg agagctga                1428
<210>16
<211>475
<212>PRT
<213>生白链霉菌
<400>16
Met Thr Thr Ser Pro Thr Glu Ser Arg Ala Ala Thr Pro Pro Asp Ser
1               5                   10                  15
Thr Ala Ser Pro Ser Thr Ala Ala Ala Pro Ala Thr Thr Pro Ser Ala
            20                  25                  30
Ala Ala Ser Pro Asp Thr Thr Ser Pro Ala Thr Thr Asp Arg Thr Thr
        35                  40                  45
Leu Pro Ser Tyr Val Gly Leu His Pro Gly Glu Pro Asn Leu Met Glu
    50                  55                  60
Pro Glu Leu Leu Asp Asn Pro Tyr Thr Gly Tyr Gly Thr Leu Arg Glu
65                  70                  75                  80
Gln Ala Pro Leu Val Arg Ala Arg Phe Ile Asp Asp Ser Pro Ile Trp
                85                  90                  95
Leu Val Thr Arg Phe Asp Val Val Arg Glu Val Met Arg Asp Gln Arg
            100                 105                 110
Phe Val Asn Asn Pro Thr Leu Val Pro Gly Ile Gly Ala Asp Gln Asp
        115                 120                 125
Pro Arg Ala Arg Leu Ile Glu Leu Phe Gly Ile Pro Glu Asp Leu Ala
    130                 135                 140
Pro Tyr Leu Thr Asp Thr Ile Leu Thr Ser Asp Pro Pro Asp His Thr
145                 150                 155                 160
Arg Leu Arg Arg Leu Val Ser Arg Ala Phe Thr Ala Arg Arg Ile Gln
                165                 170                 175
Asp Leu Arg Pro Arg Val Glu Arg Ile Thr Asp Glu Leu Leu Ala Arg
            180                 185                 190
Leu Pro Asp His Ala Glu Asp Gly Val Val Asp Leu Val Glu His Phe
        195                 200                 205
Ala Tyr Pro Leu Pro Ile Thr Val Ile Cys Glu Leu Val Gly Ile Asp
    210                 215                 220
Glu Glu Asp Arg Ala Leu Trp Arg Arg Phe Gly Ala Asp Leu Ala Ser
225                 230                 235                 240
Leu Asn Pro Lys Arg Ile Gly Ala Thr Met Pro Glu Met Ile Ala His
                245                 250                 255
Ile His Glu Val Ile Asp Glu Arg Arg Ala Asp Leu Arg Asp Asp Leu
            260                 265                 270
Leu Ser Gly Leu Ile Arg Ala Gln Asp Asp Asp Gly Gly Arg Leu Ser
        275                 280                 285
Asp Val Glu Met Val Thr Leu Val Leu Thr Leu Val Leu Ala Gly His
    290                 295                 300
Glu Thr Thr Ala His Leu Ile Ser Asn Gly Thr Leu Ala Leu Leu Thr
305                 310                 315                 320
His Pro Asp Gln Arg Arg Leu Ile Asp Glu Asp Pro Ala Leu Leu Pro
                325                 330                 335
Arg Ala Val His Glu Leu Met Arg Trp Cys Gly Pro Ile Gln Ala Thr
            340                 345                 350
Gln Leu Arg Tyr Ala Met Glu Asp Thr Glu Val Ala Gly Val Gln Val
        355                 360                 365
Arg Gln Gly Glu Ala Leu Met Phe Ser Leu Val Ala Ala Asn His Asp
    370                 375                 380
Pro Arg His Tyr Thr Gly Pro Glu Arg Leu Asp Leu Thr Arg Gln Pro
385                 390                 395                 400
Ala Gly Arg Ala Glu Asp His Val Gly Phe Gly His Gly Met His Tyr
                405                 410                 415
Cys Leu Gly Ala Ser Leu Ala Arg Gln Glu Ala Glu Val Ala Tyr Gly
            420                 425                 430
Lys Leu Leu Thr Arg Tyr Pro Asp Leu Ala Leu Ala Leu Thr Pro Glu
        435                 440                 445
Gln Leu Glu Asp Gln Glu Arg Leu Arg Gln Pro Gly Thr Trp Arg Leu
    450                 455                 460
Arg Arg Leu Pro Leu Arg Leu His Ala Glu Ser
465                 470                 475
<210>17
<211>1293
<212>DNA
<213>普拉特链霉菌(Streptomyces platensis)
<400>17
atgtcggcat tacccacctc accgttcgct gcacacgtcg ggaaacaccc gggcgagccg      60
aatgtgatgg acccggcact gatcaccgac ccgttcaccg gctacggcgc gctgcgcgag     120
cagggcccgg tcgtccgcgg ccgcttcgtg gacgactcac ccgtctggct ggtgacgcga     180
ttcgaggagg tccgccaagt cctgcgcgac cagcggttcg tgaacaaccc ggcggcgccc     240
tccctgggcc acgcggccga ggacaacccg ctcaccaggc tgatggacat gctgggcctc     300
cccgagcacc tccgccccta cctcctcgga tcgattctca attacgacgc ccccgaccac     360
acccggctgc gccgcctggt gtcgcgggcc ttcaccgccc gcaagatcac cgacctgcgg     420
ccgcgggtcg agcagatcgc cgacgccctg ctggcccggc tgcccgagca cgccgaggac     480
ggcgtcgtcg atctcatccg gcacttcgcc tacccgctgc cgatcaccgt catctgcgaa     540
ctggtcggca tacccgaagc ggaccgcccg cagtggcgga cgtggggcgc cgacctcgtc     600
tcgatggagc cggaccggct caccgcctcg ttcccgccga tgatcgagca catccaccgg     660
atggtccggg agcggcgcgg cgcgctcacc ggcgatctgc tcagcgagct gatccgtgcc     720
catgacgacg acggcggccg gctcagcgac gtcgagatgg tcaccttgat cctcacgctc     780
gtcctcgccg gtcacgagac caccgctcac ctcatcagca acggcacggc ggcgctgctc     840
acccaccccg accaactgcg cctgctccag gacgacccgg ccctgctccc ccgtgccgtc     900
cacgagctga tgcgctggtg cgggccggtg cagatgaccc agctgcgtta cgccgccgcc     960
gacgtcgacc tggccggcac cacgatccac cggggcgacg ccgtccaact catcctggtg    1020
tcggcgaact tcgacccccg ccactacacc gaccccgacc gcctcgatct gacccgccac    1080
cccgcgggac atgcggagaa ccatgtgggt ttcggccatg gggcgcacta ctgcctgggc    1140
gccacactcg ccaagcagga gggcgaagtc gccttcggca aactgctcgc gcactacccg    1200
gagatggcgt tgggcgtcgc accggagcgc ctggagcgga cgcccctgcc gggcaactgg    1260
cggctgaacg cgctgccggt gcggttgggg tga                                 1293
<210>18
<211>430
<212>PRT
<213>普拉特链霉菌
<400>18
Met Ser Ala Leu Pro Thr Ser Pro Phe Ala Ala His Val Gly Lys His
1               5                   10                  15
Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Thr Asp Pro Phe
            20                  25                  30
Thr Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg
        35                  40                  45
Phe Val Asp Asp Ser Pro Val Trp Leu Val Thr Arg Phe Glu Glu Val
    50                  55                  60
Arg Gln Val Leu Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Ala Pro
65                  70                  75                  80
Ser Leu Gly His Ala Ala Glu Asp Asn Pro Leu Thr Arg Leu Met Asp
                85                  90                  95
Met Leu Gly Leu Pro Glu His Leu Arg Pro Tyr Leu Leu Gly Ser Ile
            100                 105                 110
Leu Asn Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
        115                 120                 125
Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu
    130                 135                 140
Gln Ile Ala Asp Ala Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp
145                 150                 155                 160
Gly Val Val Asp Leu Ile Arg His Phe Ala Tyr Pro Leu Pro Ile Thr
                165                 170                 175
Val Ile Cys Glu Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp
            180                 185                 190
Arg Thr Trp Gly Ala Asp Leu Val Ser Met Glu Pro Asp Arg Leu Thr
        195                 200                 205
Ala Ser Phe Pro Pro Met Ile Glu His Ile His Arg Met Val Arg Glu
    210                 215                 220
Arg Arg Gly Ala Leu Thr Gly Asp Leu Leu Ser Glu Leu Ile Arg Ala
225                 230                 235                 240
His Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Leu
                245                 250                 255
Ile Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile
            260                 265                 270
Ser Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
    275                 280                 285
Leu Gln Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met
290                 295                 300
Arg Trp Cys Gly Pro Val Gln Met Thr Gln Leu Arg Tyr Ala Ala Ala
305                 310                 315                 320
Asp Val Asp Leu Ala Gly Thr Thr Ile His Arg Gly Asp Ala Val Gln
                325                 330                 335
Leu Ile Leu Val Ser Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro
            340                 345                 350
Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His
        355                 360                 365
Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala
    370                 375                 380
Lys Gln Glu Gly Glu Val Ala Phe Gly Lys Leu Leu Ala His Tyr Pro
385                 390                 395                 400
Glu Met Ala Leu Gly Val Ala Pro Glu Arg Leu Glu Arg Thr Pro Leu
                405                 410                415
Pro Gly Asn Trp Arg Leu Asn Ala Leu Pro Val Arg Leu Gly
            420                 425                 430
<210>19
<211>1293
<212>DNA
<213>春日链霉菌(Streptomyces kasugaensis)
<400>19
atgtcggcat cacccagcaa cacgttcacc gagcacgtcg gcaagcaccc gggcgagccg    60
aacgtgatgg atccggcgct gatcggggat ccgttcgccg gttacggcgc gctgcgcgag   120
cagggcccgg tcgtgcgggg gcggttcatg gacgactccc ccgtgtggtt cgtgacccgc   180
ttcgaggagg tccgcgaggt cctgcgtgac ccgcggttcc ggaacaatcc ggtctccgcg   240
gcgccgggcg cggcccccga ggacaccccg ctgtcccggc tgatggacat gatgggtttc   300
cccgagcacc tgcgcgtcta tctgctcggc tcgatcctca acaacgacgc ccccgaccac   360
acccggctgc gccgcctggt ctcccgggcc ttcaccgcgc ggaagatcac cgatctgcgg   420
ccgcgcgtca cacagatagc cgacgagctg ctggcccggc tgccggagca cgccgaggac   480
ggcgtcgtcg acctgatcca gcacttcgcc tatcccctgc cgatcaccgt catctgcgaa   540
ctggtcggca tccccgagga ggaccgcccg cagtggcgca cctggggcgc cgacctggtc   600
tcgctgcagc cggaccggat gagccggtcc ttcccggcga tgatcgacca catccacgag   660
ctgatcgcgg cgcggcgccg ggcgctcacc gacgatctgc tcagcgagct gatccggacc   720
catgacgacg acggcagccg gctcagcgac gtcgagatgg tcaccatggt cctcaccgtc   780
gtcctggccg gccacgagac caccgcgcac ctcatcggca acggcacggc ggccctgctc   840
acccaccccg accagctgcg gctgctcaag gacgacccgg cgctgctgcc gcgcgcggtg   900
cacgagttga tgcgctggtg cggcccggtg cacatgaccc agctgcgcta cgccgccgag   960
gacgtcgagc tggcgggcgt ccggatccgc acgggggacg ccgtccagct catcctggtg  1020
tcggcgaacc gcgacccgcg ccactacacc gaccccgacc ggctggacct gacccggcac  1080
cctgccggcc acgcggagaa ccatgtgggg ttcggccacg gggcgcacta ctgtctgggc  1140
gccacgctcg ccaagcagga gggcgaggtc gccctcggcg ccctgctcag gcacttcccc  1200
gagctgtcgc tggccgtcgc gccggaggcc ctggagcgca caccggtacc gggcagctgg  1260
cggctgaacg cgctgccgct gcgtctgcgc tga                               1293
<210>20
<211>430
<212>PRT
<213>春日链霉菌
<400>20
Met Ser Ala Ser Pro Ser Asn Thr Phe Thr Glu His Val Gly Lys His
1               5                   10                  15
Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Gly Asp Pro Phe
            20                  25                  30
Ala Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg
        35                  40                  45
Phe Met Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val
    50                  55                  60
Arg Glu Val Leu Arg Asp Pro Arg Phe Arg Asn Asn Pro Val Ser Ala
65                  70                  75                  80
Ala Pro Gly Ala Ala Pro Glu Asp Thr Pro Leu Ser Arg Leu Met Asp
                85                  90                  95
Met Met Gly Phe Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile
            100                 105                 110
Leu Asn Asn Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
        115                 120                 125
Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Thr
    130                 135                 140
Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp
145                 150                 155                 160
Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr
                165                 170                 175
Val Ile Cys Glu Leu Val Gly Ile Pro Glu Glu Asp Arg Pro Gln Trp
            180                 185                 190
Arg Thr Trp Gly Ala Asp Leu Val Ser Leu Gln Pro Asp Arg Met Ser
        195                 200                 205
Arg Ser Phe Pro Ala Met Ile Asp His Ile His Glu Leu Ile Ala Ala
    210                 215                 220
Arg Arg Arg Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr
225                 230                 235                 240
His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Met
                 245                250                 255
Val Leu Thr Val Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile
            260                 265                 270
Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
        275                 280                 285
Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met
    290                 295                 300
Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Tyr Ala Ala Glu
305                 310                 315                 320
Asp Val Glu Leu Ala Gly Val Arg Ile Arg Thr Gly Asp Ala Val Gln
                325                 330                 335
Leu Ile Leu Val Ser Ala Asn Arg Asp Pro Arg His Tyr Thr Asp Pro
            340                 345                 350
Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His
        355                 360                 365
Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala
    370                 375                 380
Lys Gln Glu Gly Glu Val Ala Leu Gly Ala Leu Leu Arg His Phe Pro
385                 390                 395                 400
Glu Leu Ser Leu Ala Val Ala Pro Glu Ala Leu Glu Arg Thr Pro Val
                405                 410                 415
Pro Gly Ser Trp Arg Leu Asn Ala Leu Pro Leu Arg Leu Arg
            420                 425                 430
<210>21
<211>1428
<212>DNA
<213>龟裂链霉菌
<400>21
atgaccacat cgcccaccga gtcccgggcg gccaccccga ccggctccac cgcctccccc     60
tcgaccgctt ccgccccggc caccacccct tcggccgcca cctcttcgga caccacctat    120
cccgccacca ccgaccgcac cacgctcccc tcctacgtcg gcctccaccc gggcgagccg    180
aacctgatgg aaccggagct gctggacaac ccgtacaccg gctacggcac gctgcgcgag    240
caggccccgc tcgtccgtgc ccggttcatc gacgactcgc ccatctggct ggtgacccgc    300
ttcgacgtgg tgcgcgaggt gatgcgcgac cagcggttcg tcaacaaccc gaccctggtg    360
cccggcatcg gtgcggacaa ggacccgcgc gcccggctga tcgagctgtt cggcatcccc    420
gaggacctga ccccgtacct cgccgacacc atcctcacca gcgacccgcc ggaccacacc    480
cggctgcgcc gcctggtctc ccgtgccttc accgcgcgcc gcatccagga cctgcggccg    540
cgcgtcgagc agatcaccga cgcgctgctg gagcgactgc cggaccatgc cgaggacggc    600
gtcgtcgacc tcgtcgagca cttcgcctac ccgctgccca tcacggtcat ctgcgagctg    660
gtcggcatcg acgaggagga ccggacgctg tggcggcggt tcggcgccga cctcgcctca    720
ctgaacccca agcgcatcgg cgccaccatg ccggagatga tcgcgcacat ccacgaggtg    780
atcgacgagc ggcgcgcggc cctgcgggac gacctgctca gcgggctcat ccgggcgcag    840
gacgacgacg gcggccggct gagcgacgtc gagatggtca ccctggtcct gaccctggtg    900
ctggccggtc acgagaccac cgcccacctc atcagcaacg gcaccctcgc cctgctcacc    960
caccccgacc agcggcggct gatcgacgag gacccggcac tgctgccgcg cgcggtccac   1020
gagctgatgc gctggtgcgg gccgatccag gccacccagc tgcggtacgc catggaggac   1080
accgaggtcg ccggtgtcca ggtccgccag ggcgaggccc tgatgttcag cctcgtcgcg   1140
gccaaccacg acccgcgcca ctacaccggg ccggagcggc tcgacctgac gcggcagccg   1200
gccggccgcg ccgaggacca cgtcggcttc gggcacggga tgcactactg cctgggtgcc   1260
tcactcgccc ggcaggaggc cgaggtggcc tacgggaagc tgctcacccg ctacccggac   1320
ctggagctcg ctctcacacc ggaacagctg gaggaccagg aacgcctgcg gcagcccggc   1380
acctggcgcc tgcggcggct gccgctgaag ctgcacgcgc ggagctga                1428
<210>22
<211>475
<212>PRT
<213>龟裂链霉菌
<400>22
Met Thr Thr Ser Pro Thr Glu Ser Arg Ala Ala Thr Pro Thr Gly Ser
1               5                   10                  15
Thr Ala Ser Pro Ser Thr Ala Ser Ala Pro Ala Thr Thr Pro Ser Ala
            20                  25                  30
Ala Thr Ser Ser Asp Thr Thr Tyr Pro Ala Thr Thr Asp Arg Thr Thr
        35                  40                  45
Leu Pro Ser Tyr Val Gly Leu His Pro Gly Glu Pro Asn Leu Met Glu
    50                  55                  60
Pro Glu Leu Leu Asp Asn Pro Tyr Thr Gly Tyr Gly Thr Leu Arg Glu
65                  70                  75                  80
Gln Ala Pro Leu Val Arg Ala Arg Phe Ile Asp Asp Ser Pro Ile Trp
                85                  90                  95
Leu Val Thr Arg Phe Asp Val Val Arg Glu Val Met Arg Asp Gln Arg
            100                 105                 110
Phe Val Asn Asn Pro Thr Leu Val Pro Gly Ile Gly Ala Asp Lys Asp
        115                 120                 125
Pro Arg Ala Arg Leu Ile Glu Leu Phe Gly Ile Pro Glu Asp Leu Thr
    130                 135                 140
Pro Tyr Leu Ala Asp Thr Ile Leu Thr Ser Asp Pro Pro Asp His Thr
145                 150                 155                 160
Arg Leu Arg Arg Leu Val Ser Arg Ala Phe Thr Ala Arg Arg Ile Gln
                165                 170                 175
Asp Leu Arg Pro Arg Val Glu Gln Ile Thr Asp Ala Leu Leu Glu Arg
            180                 185                 190
Leu Pro Asp His Ala Glu Asp Gly Val Val Asp Leu Val Glu His Phe
        195                 200                 205
Ala Tyr Pro Leu Pro Ile Thr Val Ile Cys Glu Leu Val Gly Ile Asp
    210                 215                 220
Glu Glu Asp Arg Thr Leu Trp Arg Arg Phe Gly Ala Asp Leu Ala Ser
225                 230                 235                 240
Leu Asn Pro Lys Arg Ile Gly Ala Thr Met Pro Glu Met Ile Ala His
                245                 250                 255
Ile His Glu Val Ile Asp Glu Arg Arg Ala Ala Leu Arg Asp Asp Leu
            260                 265                 270
Leu Ser Gly Leu Ile Arg Ala Gln Asp Asp Asp Gly Gly Arg Leu Ser
        275                 280                 285
Asp Val Glu Met Val Thr Leu Val Leu Thr Leu Val Leu Ala Gly His
    290                 295                 300
Glu Thr Thr Ala His Leu Ile Ser Asn Gly Thr Leu Ala Leu Leu Thr
305                 310                 315                 320
His Pro Asp Gln Arg Arg Leu Ile Asp Glu Asp Pro Ala Leu Leu Pro
                325                 330                 335
Arg Ala Val His Glu Leu Met Arg Trp Cys Gly Pro Ile Gln Ala Thr
            340                 345                 350
Gln Leu Arg Tyr Ala Met Glu Asp Thr Glu Val Ala Gly Val Gln Val
        355                 360                 365
Arg Gln Gly Glu Ala Leu Met Phe Ser Leu Val Ala Ala Asn His Asp
    370                 375                 380
Pro Arg His Tyr Thr Gly Pro Glu Arg Leu Asp Leu Thr Arg Gln Pro
385                 390                 395                 400
Ala Gly Arg Ala Glu Asp His Val Gly Phe Gly His Gly Met His Tyr
                405                 410                 415
Cys Leu Gly Ala Ser Leu Ala Arg Gln Glu Ala Glu Val Ala Tyr Gly
            420                 425                 430
Lys Leu Leu Thr Arg Tyr Pro Asp Leu Glu Leu Ala Leu Thr Pro Glu
        435                 440                 445
Gln Leu Glu Asp Gln Glu Arg Leu Arg Gln Pro Gly Thr Trp Arg Leu
    450                 455                 460
Arg Arg Leu Pro Leu Lys Leu His Ala Arg Ser
465                 470                 475
<210>23
<211>1293
<212>DNA
<213>杀结核链霉菌
<400>23
atgtcggcat tatccaactc cccgctcgcc gcacatgtcg ggaaacaccc tggcgagccg     60
aatgtgatgg acccggcgct gatcaccgac ccgttcggcg gctacggcgc actgcgcgag    120
caaggcccgg tcgtacgggg ccggttcatg gacgactcgc ccgtctggct ggtgacgcgc    180
ttcgaagagg tccgccaagt cctgcgcgat cagcggttcg tgaacaaccc ggccgcaccg    240
tccctgggac gctcgatcga cgaaagcccc gcggtcagac ttttggaaat gttggggttg    300
cccgaccatt tccggccgta tctgctcggg tcgatcctca actacgacgc acccgaccac    360
acccggctcc gccgactggt ctcgcgcgcc ttcacggcac gcaagatcac cgacctgcgg    420
ccgcgggtcg agcagatcac cgacgacctg ctgacccggc ttcccgagca cgccgaggac    480
ggtgtggtcg acctcatcca gcacttcgcc taccccctgc cgatcaccgt gatctgcgaa    540
ctggtcggca tcgccgaagc ggaccgcccg caatggcgga agtggggagc cgatctcgtc    600
tcgctggagc cggggcggct gagcaccgcg ttcccggcga tggtcgagca catccatgag    660
ctgatccgcg agcggcgcgg cgcgctcacc gacgatctgc tcagcgagct gatccgcacc    720
catgacgacg acggcggccg gctcagcgac atcgagatgg tcaccatgat cctcacgatc    780
gtcctggccg gccacgagac caccgcccac ctcataggca acggcacggc ggcgctgctc    840
acccaccccg accagctgcg cctactcaag gacgatccgg cgctgctgcc gcgcgccgtc    900
cacgagctga tgcgctggtg cgggccggtg cacatgaccc agctgcggtt cgcgtccgag    960
gacgtcgagg tcgccgggac accgatccac aagggcgacg ccgtacaact catcctggta   1020
tcggcgaact tcgacccccg ccactacacc gaccccgacc gtctcgacct gacccgccac   1080
cccgccggcc acgccgagaa ccatgtgggc ttcggccacg gaatgcacta ctgcctgggt   1140
gccaccctcg ccaaacagga aggcgaagtc gccttctccc gcctcttcac gcactacccg   1200
gaactgtccc tgggcgtcgc ggcggaccag ctggcgcgga cacaggtacc cggcagctgg   1260
cggctggaca ccctgccgct gcgactgggg tga                                1293
<210>24
<211>430
<212>PRT
<213>杀结核链霉菌
<400>24
Met Ser Ala Leu Ser Asn Ser Pro Leu Ala Ala His Val Gly Lys His
1               5                   10                  15
Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Thr Asp Pro Phe
            20                  25                  30
Gly Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg
        35                  40                  45
Phe Met Asp Asp Ser Pro Val Trp Leu Val Thr Arg Phe Glu Glu Val
    50                  55                  60
Arg Gln Val Leu Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Ala Pro
65                  70                  75                  80
Ser Leu Gly Arg Ser Ile Asp Glu Ser Pro Ala Val Arg Leu Leu Glu
                85                  90                  95
Met Leu Gly Leu Pro Asp His Phe Arg Pro Tyr Leu Leu Gly Ser Ile
            100                 105                 110
Leu Asn Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
        115                 120                 125
Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu
    130                 135                 140
Gln Ile Thr Asp Asp Leu Leu Thr Arg Leu Pro Glu His Ala Glu Asp
145                 150                 155                 160
Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr
                165                 170                 175
Val Ile Cys Glu Leu Val Gly Ile Ala Glu Ala Asp Arg Pro Gln Trp
            180                 185                 190
Arg Lys Trp Gly Ala Asp Leu Val Ser Leu Glu Pro Gly Arg Leu Ser
        195                 200                 205
Thr Ala Phe Pro Ala Met Val Glu His Ile His Glu Leu Ile Arg Glu
    210                 215                 220
Arg Arg Gly Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr
225                 230                 235                 240
His Asp Asp Asp Gly Gly Arg Leu Ser Asp Ile Glu Met Val Thr Met
                245                 250                 255
Ile Leu Thr Ile Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile
            260                 265                 270
Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
        275                 280                 285
Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met
    290                 295                 300
Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Phe Ala Ser Glu
305                 310                 315                 320
Asp Val Glu Val Ala Gly Thr Pro Ile His Lys Gly Asp Ala Val Gln
                325                 330                 335
Leu Ile Leu Val Ser Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro
            340                 345                 350
Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His
        355                 360                 365
Val Gly Phe Gly His Gly Met His Tyr Cys Leu Gly Ala Thr Leu Ala
    370                 375                 380
Lys Gln Glu Gly Glu Val Ala Phe Ser Arg Leu Phe Thr His Tyr Pro
385                 390                 395                 400
Glu Leu Ser Leu Gly Val Ala Ala Asp Gln Leu Ala Arg Thr Gln Val
                405                 410                 415
Pro Gly Ser Trp Arg Leu Asp Thr Leu Pro Leu Arg Leu Gly
            420                 425                 430
<210>25
<211>1293
<212>DNA
<213>普拉特链霉菌
<400>25
atgtcggcat tatccagctc accgttcgcc gcgcatgtcg ggaaacaccc gggcgagccg     60
aatgtgatgg acccggcgct gatcgccgat ccgttcggtg gttatggcgc actgcgtgag    120
caagggccgg tcgtacgggg ccggttcatg gacgactcac ccgtctggct cgtgacgcgc    180
ttcgaggaag tccgccaagt cctgcgcgac cagcggttcc tgaacgatcc gacggccccc    240
tccctggggc gctcattcga cgacagcccc acggccaggc tgctggagat gatgggactg    300
cccgagcatt tccggccgta tctgctcggt tcgattctga acaacgacgc ccccgaccac    360
acccggctgc gccgtctggt gtcgcgcgcc ttcacggcac gcaagatcac cgacctgcgg    420
ccgcgggtcg agcagatcgc cgacgagctg ctgacccggc ttcccgagta cgccgaggac    480
ggcgtggtcg acctcatcaa gcacttcgcc taccccctgc cgatcgccgt catctgcgaa    540
ctggtcggca tagccgaagc ggatcgtccg cagtggcgga agtggggtgc cgacctcgtc    600
tcgctgcagc cggaccggct cagcacctcg ttcccggcga tgatcgagca catccatgag    660
ctgatccgcg agcggcgcgg ggcgctcacg gacgatctgc tcagcgagct gatccgtgcc    720
catgacgacg acggcggccg gctcagcgac gtcgagatgg tcaccatgat cctcacggtg    780
gtgctcgccg gccacgagac caccgcgcac ctcataggca acggcacggc ggcgctgctc    840
acccaccccg accagctgcg gctgctcagg gacgacccgg ctctgtttcc ccgtgccgtc    900
cacgagctgt tgcgctggtg cgggccggtc cacatgaccc agatgcggtt tgcgtccgag    960
gatgtcgaca tcgccgggac gaagatccgt aagggcgacg ccgtacaact gatcctggta   1020
tcggccaact tcgacccccg ccactacacc gaccccgaac gtctcgacct gacccgtcac   1080
cccgccggcc acgccgagaa ccatgtgggc ttcggccacg ggatgcacta ctgcctgggc   1140
gccaccctcg ccaaacagga gggcgaagtc gcgttcgaga agctcttcgc gcactacccg   1200
gaggtgtcgc tgggcgtcgc accggaacaa ctggaaagga caccactgcc cggcagctgg   1260
cggctcgatt ccctgccgct gcggttgcgg taa                                1293
<210>26
<211>430
<212>PRT
<213>普拉特链霉菌
<400>26
Met Ser Ala Leu Ser Ser Ser Pro Phe Ala A1a His Val G1y Lys His
1               5                   10                  15
Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Ala Asp Pro Phe
            20                  25                  30
Gly Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg
        35                  40                  45
Phe Met Asp Asp Ser Pro Val Trp Leu Val Thr Arg Phe Glu Glu Val
    50                  55                  60
Arg Gln Val Leu Arg Asp Gln Arg Phe Leu Asn Asp Pro Thr Ala Pro
65                  70                  75                  80
Ser Leu Gly Arg Ser Phe Asp Asp Ser Pro Thr Ala Arg Leu Leu Glu
                85                  90                  95
Met Met Gly Leu Pro Glu His Phe Arg Pro Tyr Leu Leu Gly Ser Ile
            100                 105                 110
Leu Asn Asn Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
        115                 120                 125
Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu
    130                 135                 140
Gln Ile Ala Asp Glu Leu Leu Thr Arg Leu Pro Glu Tyr Ala Glu Asp
145                 150                 155                 160
Gly Val Val Asp Leu Ile Lys His Phe Ala Tyr Pro Leu Pro Ile Ala
                165                 170                 175
Val Ile Cys Glu Leu Val Gly Ile Ala Glu Ala Asp Arg Pro Gln Trp
            180                 185                 190
Arg Lys Trp Gly Ala Asp Leu Val Ser Leu Gln Pro Asp Arg Leu Ser
        195                 200                 205
Thr Ser Phe Pro Ala Met Ile Glu His Ile His Glu Leu Ile Arg Glu
    210                 215                 220
Arg Arg Gly Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Ala
225                 230                 235                 240
His Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Met
                245                 250                 255
Ile Leu Thr Val Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile
            260                 265                 270
Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
        275                 280                 285
Leu Arg Asp Asp Pro Ala Leu Phe Pro Arg Ala Val His Glu Leu Leu
    290                 295                 300
Arg Trp Cys Gly Pro Val His Met Thr Gln Met Arg Phe Ala Ser Glu
305                 310                 315                 320
Asp Val Asp Ile Ala Gly Thr Lys Ile Arg Lys Gly Asp Ala Val Gln
                325                 330                 335
Leu Ile Leu Val Ser Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro
            340                 345                 350
Glu Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His
        355                 360                 365
Val Gly Phe Gly His Gly Met His Tyr Cys Leu Gly Ala Thr Leu Ala
    370                 375                 380
Lys Gln Glu Gly Glu Val Ala Phe Glu Lys Leu Phe Ala His Tyr Pro
385                 390                 395                 400
Glu Val Ser Leu Gly Val Ala Pro Glu Gln Leu Glu Arg Thr Pro Leu
                405                 410                 415
Pro Gly Ser Trp Arg Leu Asp Ser Leu Pro Leu Arg Leu Arg
            420                 425                 430
<210>27
<211>1293
<212>DNA
<213>普拉特链霉菌
<400>27
atgtcggcat tatccagctc tccgttcgct gcgcatgtcg ggaaacaccc gggtgagccg     60
aatgtgatgg agccggcgct gctcaccgac ccgttcgcgg gctacggcgc gctgcgtgag    120
caggccccgg tcgtacgggg ccggttcgtg gacgactcac cggtctggtt cgtgacgcgc    180
ttcgaggagg tccgccaagt cctgcgcgac cagcggttcg tgaacaatcc ggccgcgccg    240
cccctggccc catcggccga ggagaacccg ctgaccaggc tgatggacat gctgggcctc    300
cccgagcacc tccgcgtcta catgctcggg tcgattctca actacgacgc ccccgaccac    360
acccggctgc gccgtctggt gtcgcgcgcg ttcacggcgc ggaagatcac cgatctgcga    420
ccgcgtgtcg agcagatcgc cgacgagctg ctggcccgcc tccccgagta cgccgaggac    480
ggcgtcgtcg acctcatcca gcatttcgcc tacccgctgc cgatcaccgt catctgcgag    540
ctggtcggca tacccgaagc ggaccgcccg cagtggcgga agtggggcgc cgacctcatc    600
tcgatggacc cggaccggct cggcgcaacg ttcccggcga tgatcgagca catccatgag    660
atggtccggg agcggcgcgc ggcgctcacc gatgatctgc tcagcgagct gatccgtacc    720
catgacgacg atggcggccg gctcagcgac gtcgagatgg tcaccatgat cctcacgctc    780
gtcctcgccg gtcacgagac caccgcccac ctcatcagca acggcacggc ggcgctgctc    840
acccaccccg accagctgcg cctgctcaag gacgacccgg ccctgctccc ccgggccgtc    900
catgagctga tgcgctggtg cgggccggtg cagatgacgc agctgcgcta cgcggccgcc    960
gacgtcgacc tcgccggtac gcggatccac aagggcgacg ccgtacaact cctcctggtt   1020
gcggcgaact tcgacccccg ccactacacc gaccccgacc gtctcgatct gacgcgtcac   1080
cccgccggcc acgccgagaa ccatgtgggt ttcggccacg gtgcgcatta ctgcctgggt   1140
gccaccctcg ccaagcagga gggcgaagtc gcgttcggca agctgctcgc gcactacccg   1200
gagatgtccc tgggcatcga accggaacgt ctggagcgat tgccgctgcc tggcaactgg   1260
cggctgaatt ccctgccgtt gcggctgggg tga                                1293
<210>28
<211>430
<212>PRT
<213>普拉特链霉菌
<400>28
Met Ser Ala Leu Ser Ser Ser Pro Phe Ala Ala His Val Gly Lys His
1               5                   10                  15
Pro Gly Glu Pro Asn Val Met Glu Pro Ala Leu Leu Thr Asp Pro Phe
            20                  25                  30
Ala Gly Tyr Gly Ala Leu Arg Glu Gln Ala Pro Val Val Arg Gly Arg
        35                  40                  45
Phe Val Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val
    50                  55                  60
Arg Gln Val Leu Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Ala Pro
65                  70                  75                  80
Pro Leu Ala Pro Ser Ala Glu Glu Asn Pro Leu Thr Arg Leu Met Asp
                85                  90                  95
Met Leu Gly Leu Pro Glu His Leu Arg Val Tyr Met Leu Gly Ser Ile
            100                 105                 110
Leu Asn Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
        115                 120                 125
Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu
    130                 135                 140
Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu Tyr Ala Glu Asp
145                 150                 155                 160
Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr
                165                 170                 175
Val Ile Cys Glu Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp
            180                 185                 190
Arg Lys Trp Gly Ala Asp Leu Ile Ser Met Asp Pro Asp Arg Leu Gly
        195                 200                 205
Ala Thr Phe Pro Ala Met Ile Glu His Ile His Glu Met Val Arg Glu
    210                 215                 220
Arg Arg Ala Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr
225                 230                 235                 240
His Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Met
                245                 250                 255
Ile Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile
            260                 265                 270
Ser Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
        275                 280                 285
Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met
    290                 295                 300
Arg Trp Cys Gly Pro Val Gln Met Thr Gln Leu Arg Tyr Ala Ala Ala
305                 310                 315                 320
Asp Val Asp Leu Ala Gly Thr Arg Ile His Lys Gly Asp Ala Val Gln
                325                 330                 335
Leu Leu Leu Val Ala Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro
            340                 345                 350
Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His
        355                 360                 365
Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala
    370                 375                 380
Lys Gln Glu Gly Glu Val Ala Phe Gly Lys Leu Leu Ala His Tyr Pro
385                 390                 395                 400
Glu Met Ser Leu Gly Ile Glu Pro Glu Arg Leu Glu Arg Leu Pro Leu
                405                 410                 415
Pro Gly Asn Trp Arg Leu Asn Ser Leu Pro Leu Arg Leu Gly
            420                 425                 430
<210>29
<211>1293
<212>DNA
<213>利迪链霉菌
<400>29
atgtcggcat tacccagcaa cacgttcacc gagcacgtcg gcaagcaccc gggcgaaccg     60
aacgtgatgg atccggcgct gatcggtgat ccgttcgccg gttacggcgc gctgcgcgag    120
cagggcccgg tcgtgcgggg gcggttcgtg gacgactccc ccgtgtggtt cgtgacccgc    180
ttcgaggagg tccgcgaggt cctgcgggac cagcggttcc ggaacaatcc ggtctcctcg    240
gcgccggacg cggaccccga ggacaccccg ctgtcccggc tgatggacat gatgggtttc    300
cccgagcacc tgcgcgtcta tctgctcggc tcgatcctca acaacgacgc ccccgaccac    360
acccggctgc gccgcctggt ctcccgggcc ttcaccgcgc ggaagatcac cgatctgcgg    420
ccgcgcgtcg cacagatagc cgacgagctg ctggcccggc tgccggagca cgccgaggac    480
ggcgtcgtcg acctgatcca gcacttcgcc tatcccctgc cgatcaccgt catctgcgaa    540
ctggtcggca tccccgagga ggaccgcccg cagtggcgca cctggggcgc cgacctggtc    600
tcgctgcagc cggaccggat gagccggtcc ttcccggcga tgatcgacca catccacgag    660
ctgatcgcgg cgcggcgccg ggcgctcacc gacgacctgc tcagcgagct gatccgaacc    720
catgacgacg acggcagccg gctcagcgac gtcgagatgg tcaccatggt cctcaccgtc    780
gtcctggccg gccacgagac caccgcgcac ctcatcggca acggcacggc ggccctgctc    840
acccaccccg accagctgcg gctgctcaag gacgacccgg cgctgctgcc gcgcgcggtg    900
cacgagttga tgcgctggtg cggcccggtg cacatgaccc agctgcgcta cgccgccgag    960
gacgtcgagc tggcgggcgt ccggatccgc aagggggacg ccgtccagct catcctggtg   1020
tcggcgaacc gcgatccgcg ccactacacc gaacccgacc gtctggacct gacccggcac   1080
cccgccggcc acgccgagaa ccatgtgggg ttcggccacg gggcgcacta ctgtctgggc   1140
gccacgctcg ccaagcagga gggcgaggtc gccctcggcg ccctgctcag gcacttcccc   1200
gagctgtcgc tggccgtcgc gccggacgcc ctggagcgca caccggtacc gggcagctgg   1260
cggctgaatg cgctgccgct gcgtctgcgc tga                                1293
<210>30
<211>430
<212>PRT
<213>利迪链霉菌
<400>30
Met Ser Ala Leu Pro Ser Asn Thr Phe Thr Glu His Val Gly Lys His
1               5                   10                  15
Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Gly Asp Pro Phe
            20                  25                  30
Ala Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg
        35                  40                  45
Phe Val Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val
    50                  55                  60
Arg Glu Val Leu Arg Asp Gln Arg Phe Arg Asn Asn Pro Val Ser Ser
65                  70                  75                  80
Ala Pro Asp Ala Asp Pro Glu Asp Thr Pro Leu Ser Arg Leu Met Asp
                85                  90                  95
Met Met Gly Phe Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile
            100                 105                 110
Leu Asn Asn Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
        115                 120                 125
Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Ala
    130                 135                 140
Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp
145                 150                 155                 160
Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr
                165                 170                 175
Val Ile Cys Glu Leu Val Gly Ile Pro Glu Glu Asp Arg Pro Gln Trp
            180                 185                 190
Arg Thr Trp Gly Ala Asp Leu Val Ser Leu Gln Pro Asp Arg Met Ser
        195                 200                 205
Arg Ser Phe Pro Ala Met Ile Asp His Ile His Glu Leu Ile Ala Ala
    210                 215                 220
Arg Arg Arg Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr
225                 230                 235                 240
His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Met
                245                 250                 255
Val Leu Thr Val Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile
            260                 265                 270
Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
        275                 280                  285
Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met
    290                 295                 300
Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Tyr Ala Ala Glu
305                 310                 315                 320
Asp Val Glu Leu Ala Gly Val Arg Ile Arg Lys Gly Asp Ala Val Gln
                325                 330                 335
Leu Ile Leu Val Ser Ala Asn Arg Asp Pro Arg His Tyr Thr Glu Pro
            340                 345                 350
Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His
        355                 360                 365
Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala
    370                 375                 380
Lys Gln Glu Gly Glu Val Ala Leu Gly Ala Leu Leu Arg His Phe Pro
385                 390                 395                 400
Glu Leu Ser Leu Ala Val Ala Pro Asp Ala Leu Glu Arg Thr Pro Val
                405                 410                 415
Pro Gly Ser Trp Arg Leu Asn Ala Leu Pro Leu Arg Leu Arg
            420                 425                 430
<210>31
<211>1293
<212>DNA
<213>利迪链霉菌
<400>31
atgtcggcat cgaccagctc tcccctcagc gcccacgtcg gcaagcaccc gggcgaaccc     60
catgtgatgg atccggcgct gatcagcgat ccgttcggcg gctacggtgc cctgcgcgag    120
cagggaccgg tcgtccgcgg acggttcttc gacgactcgc ccttgtggtt agtgacccgc    180
ttcgaggaag tccgccaggt cctgcgcgac cagcggttcg tgaacaaccc cgccgacccg    240
gcgctcggcg tcgcgccgga ggactccccg cagctgcgcg cgctggcgat gctgggcatc    300
cccgagcacc tgcacggcta tctgctcaac tcgatcctca actacgacgc ccccgaccac    360
acccggctgc gccgcctggt ctcccgcgcc ttcaccgccc gcaagatcac cgatcttcgg    420
ccgcgggtgg cgcagataac cgccgagctg ctggaccgac tcccggagca cgccgaggac    480
ggcgtggtcg acctgatcga gcacttcgcc tacccgctgc cgatcacggt gatctgcgaa    540
cttgtcggca tcgccgcgga ggaccggccc cagtggcgtt cctggggcgc cgacctggtc    600
tcggtggacc ccgaccggct cggccggacc ttcccggcga tgatcgacca catccacgcg    660
ctgatcggcc agcggcgggc cgcgctcacc gacgacctgc tcagcgagct gatccggacc    720
catgacgacg acggcagccg gctcagcgac gtcgagatgg tcaccctggt cctcaccctc    780
gtgctggccg gccacgagac caccgcacac ctcatcggca acggcaccgc ggccctgctc    840
acccaccccg accagctgcg gctgctcaag gacgacccgg cgctgctgcc gcgcgccgtc    900
cacgagctga tgcgctggtg cgggccggtg cacgtcaccc agctgcggta cgccgccgag    960
gacgtcgacc tcgccggcac ccggatccgc aggggcgacg ccgtgcaggc cgtcctggtc   1020
tcggcgaacc acgacccgcg ccactacacc gaccccgaac gcctggacct gacccggcag   1080
cccgcgggcc gcgccgagaa ccacgtgggc ttcgggcacg gggcgcacta ctgcctgggc   1140
gccagcctcg ccaggcagga gggtgaggtc gccctgggcg ccctgttcga ccgctacccc   1200
gacctggcgc tggcggtggc gcccgaggag ctggagcgca ccccggtgcc cggtacctgg   1260
cggctgacgt cgctgccggt gcgcctgggc tga                                1293
<210>32
<211>430
<212>PRT
<213>利迪链霉菌
<400>32
Met Ser Ala Ser Thr Ser Ser Pro Leu Ser Ala His Val Gly Lys His
1               5                   10                  15
Pro Gly Glu Pro His Val Met Asp Pro Ala Leu Ile Ser Asp Pro Phe
            20                  25                  30
Gly Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg
        35                  40                  45
Phe Phe Asp Asp Ser Pro Leu Trp Leu Val Thr Arg Phe Glu Glu Val
    50                  55                  60
Arg Gln Val Leu Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Asp Pro
65                  70                  75                  80
Ala Leu Gly Val Ala Pro Glu Asp Ser Pro Gln Leu Arg Ala Leu Ala
                85                  90                  95
Met Leu Gly Ile Pro Glu His Leu His Gly Tyr Leu Leu Asn Ser Ile
            100                 105                 110
Leu Asn Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
        115                 120                 125
Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Ala
    130                 135                 140
Gln Ile Thr Ala Glu Leu Leu Asp Arg Leu Pro Glu His Ala Glu Asp
145                 150                 155                 160
Gly Val Val Asp Leu Ile Glu His Phe Ala Tyr Pro Leu Pro Ile Thr
                165                 170                 175
Val Ile Cys Glu Leu Val Gly Ile Ala Ala Glu Asp Arg Pro Gln Trp
            180                 185                 190
Arg Ser Trp Gly Ala Asp Leu Val Ser Val Asp Pro Asp Arg Leu Gly
        195                 200                 205
Arg Thr Phe Pro Ala Met Ile Asp His Ile His Ala Leu Ile Gly Gln
    210                 215                 220
Arg Arg Ala Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr
225                 230                 235                 240
His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Leu
                245                 250                 255
Val Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile
            260                 265                 270
Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
        275                 280                 285
Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met
    290                 295                 300
Arg Trp Cys Gly Pro Val His Val Thr Gln Leu Arg Tyr Ala Ala Glu
305                 310                 315                 320
Asp Val Asp Leu Ala Gly Thr Arg Ile Arg Arg Gly Asp Ala Val Gln
                325                 330                 335
Ala Val Leu Val Ser Ala Asn His Asp Pro Arg His Tyr Thr Asp Pro
            340                 345                 350
Glu Arg Leu Asp Leu Thr Arg Gln Pro Ala Gly Arg Ala Glu Asn His
        355                 360                 365
Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Ser Leu Ala
    370                 375                 380
Arg Gln Glu Gly Glu Val Ala Leu Gly Ala Leu Phe Asp Arg Tyr Pro
385                 390                 395                 400
Asp Leu Ala Leu Ala Val Ala Pro Glu Glu Leu Glu Arg Thr Pro Val
                405                 410                 415
Pro Gly Thr Trp Arg Leu Thr Ser Leu Pro Val Arg Leu Gly
            420                 425                 430
<210>33
<211>1281
<212>DNA
<213>杀结核链霉菌
<400>33
atgaactctc cgttcgccgc gcacgtcggg aaacacccgg gcgagccgaa tgtgatggac     60
cccgccctga tcaccgaccc gttcaccggc tacggcgcgc tgcgtgagca gggcccggtc    120
gtacggggcc ggttcatgga cgactcgccc gtctggctgg tgacgcggtt cgaggaggtc    180
cgccaggtcc tgcgcgacca gcggttcgtg aacaatccgg cctcgccgtc cctgaactac    240
gcgcccgagg acaacccgct gacccggctg atggagatgc tgggcctccc cgagcacctc    300
cgcgtctacc tgctcggatc gatcctcaac tacgacgccc ccgaccacac ccggctgcgc    360
cgtctggtgt cgcgggcgtt cacggcccgc aagatcaccg acctgcggcc ccgggtcgag    420
cagatcgccg acgcgctgct ggcccggctg cccgagcacg ccgaggacgg cgtcgtcgac    480
ctcatccagc acttcgccta ccccctgccg atcaccgtca tctgcgaact ggtcggcata    540
cccgaagcgg accgcccgca gtggcgaacg tggggcgccg acctcatctc gatggatccg    600
gaccggctcg gcgcctcgtt cccggcgatg atcgagcaca tccatcagat ggtccgggaa    660
cggcgcgagg cgctcaccga cgacctgctc agcgaactga tccgcaccca tgacgacgac    720
ggcgggcggc tcagcgacgt cgagatggtc accatgatcc tcacgctcgt cctcgccggc    780
cacgagacca ccgcccacct catcagcaac ggcacggcgg cgctgctcac ccaccccgac    840
cagctgcgtc tggtcaagga cgatccggcc ctcctccccc gtgccgtcca cgagctgatg    900
cgctggtgcg ggccggtgca catgacccag ctgcgctacg ccaccgccga cgtcgacctc    960
gccggcacac cgatccgcca gggcgatgcc gttcaactca tcctggtatc ggccaacttc   1020
gacccccgtc actacaccga ccccgaccgc ctcgatctca cccggcaccc cgcgggccac   1080
gccgagaacc atgtgggttt cggccatgga gcgcactact gcctgggcgc cacactcgcc   1140
aaacaggaag gtgaagtcgc cttcggcaaa ctgctcacgc actacccgga catatcgctg   1200
ggcatcgccc cggaacacct ggagcggaca ccgctgccgg gcaactggcg gctgaactcg   1260
ctgccggtgc ggttggggtg a                                             1281
<210>34
<211>426
<212>PRT
<213>杀结核链霉菌
<400>34
Met Asn Ser Pro Phe Ala Ala His Val Gly Lys His Pro Gly Glu Pro
1               5                   10                  15
Asn Val Met Asp Pro Ala Leu Ile Thr Asp Pro Phe Thr Gly Tyr Gly
            20                  25                  30
Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg Phe Met Asp Asp
        35                  40                  45
Ser Pro Val Trp Leu Val Thr Arg Phe Glu Glu Val Arg Gln Val Leu
    50                  55                  60
Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Ser Pro Ser Leu Asn Tyr
65                  70                  75                  80
Ala Pro Glu Asp Asn Pro Leu Thr Arg Leu Met Glu Met Leu Gly Leu
                85                  90                  95
Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile Leu Asn Tyr Asp
            100                 105                 110
Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser Arg Ala Phe Thr
        115                 120                 125
Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu Gln Ile Ala Asp
    130                 135                 140
Ala Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp Gly Val Val Asp
145                 150                 155                 160
Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr Val Ile Cys Glu
                165                 170                 175
Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp Arg Thr Trp Gly
            180                 185                 190
Ala Asp Leu Ile Ser Met Asp Pro Asp Arg Leu Gly Ala Ser Phe Pro
        195                 200                 205
Ala Met Ile Glu His Ile His Gln Met Val Arg Glu Arg Arg Glu Ala
    210                 215                 220
Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr His Asp Asp Asp
225                 230                 235                 240
Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Met Ile Leu Thr Leu
                245                 250                  255
Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile Ser Asn Gly Thr
            260                 265                 270
Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu Val Lys Asp Asp
        275                 280                 285
Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met Arg Trp Cys Gly
    290                 295                 300
Pro Val His Met Thr Gln Leu Arg Tyr Ala Thr Ala Asp Val Asp Leu
305                 310                 315                 320
Ala Gly Thr Pro Ile Arg Gln Gly Asp Ala Val Gln Leu Ile Leu Val
                325                 330                 335
Ser Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro Asp Arg Leu Asp
            340                 345                 350
Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His Val Gly Phe Gly
        355                 360                 365
His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala Lys Gln Glu Gly
    370                 375                 380
Glu Val Ala Phe Gly Lys Leu Leu Thr His Tyr Pro Asp Ile Ser Leu
385                 390                 395                 400
Gly Ile Ala Pro Glu His Leu Glu Arg Thr Pro Leu Pro Gly Asn Trp
                405                 410                 415
Arg Leu Asn Ser Leu Pro Val Arg Leu Gly
            420                 425
<210>35
<211>195
<212>DNA
<213>杀结核链霉菌
<400>35
atgcggatca cgatcgacac cgacatctgt atcggcgccg gccagtgcgc cctgaccgcg      60
ccgggagtgt tcacccagga cgacgacggc ttcagcgccc tgctgcccgg ccgcgaggac     120
ggtgcgggcg acccgctggt gcgggaggcc gcccgcgcct gcccggtgca ggccatcacg     180
gtcacggacg actga                                                      195
<210>36
<211>64
<212>PRT
<213>杀结核链霉菌
<400>36
Met Arg Ile Thr Ile Asp Thr Asp Ile Cys Ile Gly Ala Gly Gln Cys
1               5                   10                  15
Ala Leu Thr Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly Phe Ser
            20                  25                  30
Ala Leu Leu Pro Gly Arg Glu Asp Gly Ala Gly Asp Pro Leu Val Arg
        35                  40                  45
Glu Ala Ala Arg Ala Cys Pro Val Gln Ala Ile Thr Val Thr Asp Asp
    50                  55                  60
<210>37
<211>195
<212>DNA
<213>杀结核链霉菌
<400>37
atgcggatca ccatcgacac cgacatctgc atcggcgccg gccagtgcgc cctgaccgcg    60
ccgggagtct tcacccagga cgacgacggt ttcagcgccc tgctgcccgg ccgcgaggac    120
ggcgcgggcg acccgctggt gcgcgaggcc gcccgcgcct gccccgtgca ggccatttcg    180
gtcacggacg actga                                                     195
<210>38
<211>64
<212>PRT
<213>杀结核链霉菌
<400>38
Met Arg Ile Thr Ile Asp Thr Asp Ile Cys Ile Gly Ala Gly Gln Cys
  1             5                   10                  15
Ala Leu Thr Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly Phe Ser
            20                  25                  30
Ala Leu Leu Pro Gly Arg Glu Asp Gly Ala Gly Asp Pro Leu Val Arg
        35                  40                  45
Glu Ala Ala Arg Ala Cys Pro Val Gln Ala Ile Ser Val Thr Asp Asp
    50                  55                  60
<210>39
<211>9
<212>PRT
<213>人工序列
<220>
<223>合成肽
<400>39
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1               5
<210>40
<211>10
<212>PRT
<213>人工序列
<220>
<223>合成肽
<400>40
Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1               5                   10
<210>41
<211>11
<212>PRT
<213>人工序列
<220>
<223>合成肽
<400>41
Gln Pro Glu Leu Ala Pro Glu Asp Pro Glu Asp
1               5                   10
<210>42
<211>11
<212>PRT
<213>人工序列
<220>
<223>合成肽
<400>42
Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys
1               5                   10
<210>43
<211>7
<212>PRT
<213>链霉菌属(Streptomyces)
<220>
<221>misc_feature
<222>
<223>链霉菌属共有序列
<400>43
Ile Ala Gly His Glu Thr Thr
1               5
<210>44
<211>20
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(6)..(18)
<223>第6、9和18位核苷酸是“s”,其中“s”=g或c
<400>44
atcgcsggsc acgagacsac                                                 20
<210>45
<211>7
<212>PRT
<213>链霉菌属
<220>
<221>misc_feature
<222>
<223>链霉菌属共有序列
<400>45
Val Ala Gly His Glu Thr Thr
1               5
<210>46
<211>20
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(3)..(18)
<223>第3、6、9和18位核苷酸是“s”,其中“s”=g或c
<400>46
gtsgcsggsc acgagacsac                                               20
<210>47
<211>7
<212>PRT
<213>链霉菌属
<220>
<221>misc_feature
<222>
<223>链霉菌属共有序列
<400>47
Leu Ala Gly His Glu Thr Thr
1               5
<210>48
<211>20
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(3)..(18)
<223>第3、6、9和18位核苷酸是“s”,其中“s”=g或c
<400>48
ctsgcsggsc acgagacsac                                                 20
<210>49
<211>9
<212>PRT
<213>链霉菌属
<220>
<221>misc_feature
<222>
<223>链霉菌属共有序列
<400>49
Leu Leu Leu Ile Ala Gly His Glu Thr
1               5
<210>50
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(2)..(17)
<223>第2、5、8、14和17位核苷酸是“s”,其中“s”=g或c
<400>50
tsctsctsat cgcsggscac gagac                                        25
<210>51
<211>9
<212>PRT
<213>链霉菌属
<220>
<221>misc_feature
<222>
<223>链霉菌属共有序列
<400>51
His Gln Cys Leu Gly Gln Asn Leu Ala
1               5
<210>52
<211>26
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(12)..(24)
<223>第12、15和24位核苷酸是“s”,其中“s”=g或c
<400>52
gtggtcacgg asccstgcttggascg                                           26
<210>53
<211>8
<212>PRT
<213>链霉菌属
<220>
<221>misc_feature
<222>
<223>链霉菌属共有序列
<400>53
Phe Gly His Gly Val His Gln Cys
1               5
<210>54
<211>24
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(6)..(15)
<223>第6、12和15位核苷酸是“s”,其中“s”=g或c
<400>54
aagccsgtgc cscasgtggt cacg                                           24
<210>55
<211>8
<212>PRT
<213>链霉菌属
<220>
<221>misc_feature
<222>
<223>链霉菌属共有序列
<400>55
Phe Gly phe Gly Val His Gln Cys
1               5
<210>56
<211>24
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(6)..(15)
<223>第6、12和15位核苷酸是“s”,其中“s”=g或c
<400>56
aaggcsaagc cscasgtggt cacg                                           24
<210>57
<211>8
<212>PRT
<213>链霉菌属
<220>
<221>misc_feature
<222>
<223>链霉菌属共有序列
<400>57
Phe Gly His Gly Ile His Gln Cys
1               5
<210>58
<211>24
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(6)..(12)
<223>第6和12位核苷酸是“s”,其中“s”=g或c
<400>58
aagccsgtgc cstaggtggt cacg                                           24
<210>59
<211>8
<212>PRT
<213>链霉菌属
<220>
<221>misc_feature
<222>
<223>链霉菌属共有序列
<400>59
Phe Gly His Gly Val His Phe Cys
1               5
<210>60
<211>24
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(6)..(15)
<223>第6、12和15位核苷酸是“s”,其中“s”=g或c
<400>60
aagccsgtgc cscasgtgaa gacg                                            24
<210>61
<211>24
<212>PRT
<213>杀结核链霉菌
<400>61
His Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Thr Asp Pro
1               5                   10                  15
Phe Thr Gly Tyr Gly Ala Leu Arg
            20
<210>62
<211>21
<212>PRT
<213>杀结核链霉菌
<400>62
Phe Val Asn Asn Pro Ala Ser Pro Ser Leu Asn Tyr Ala Pro Glu Asp
1               5                   10                  15
Asn Pro Leu Thr Arg
            20
<210>63
<211>19
<212>PRT
<213>杀结核链霉菌
<400>63
Leu Leu Thr His Tyr Pro Asp Ile Ser Leu Gly Ile Ala Pro Glu His
1               5                   10                  15
Leu Glu Arg
<210>64
<211>17
<212>PRT
<213>杀结核链霉菌
<400>64
Val Tyr Leu Leu Gly Ser Ile Leu Asn Tyr Asp Ala Pro Asp His Thr
1               5                   10                  15
Arg
<210>65
<211>13
<212>PRT
<213>杀结核链霉菌
<400>65
Thr Trp Gly Ala Asp Leu Ile Ser Met Asp Pro Asp Arg
1               5                   10
<210>66
<211>13
<212>PRT
<213>杀结核链霉菌
<400>66
Glu Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg
1               5                   10
<210>67
<211>12
<212>PRT
<213>杀结核链霉菌
<400>67
Phe Met Asp Asp Ser Pro Val Trp Leu Val Thr Arg
1               5                   10
<210>68
<211>12
<212>PRT
<213>杀结核链霉菌
<400>68
Leu Met Glu Met Leu Gly Leu Pro Glu His Leu Arg
1               5                   10
<210>69
<211>11
<212>PRT
<213>杀结核链霉菌
<400>69
Val Glu Gln Ile Ala Asp Ala Leu Leu Ala Arg
1               5                   10
<210>70
<211>11
<212>PRT
<213>杀结核链霉菌
<400>70
Leu Val Lys Asp Asp Pro Ala Leu Leu Pro Arg
1               5                   10
<210>71
<211>8
<212>PRT
<213>杀结核链霉菌
<400>71
Asp Asp Pro Ala Leu Leu Pro Arg
1               5
<210>72
<211>8
<212>PRT
<213>杀结核链霉菌
<400>72
Thr Pro Leu Pro Gly Asn Trp Arg
1               5
<210>73
<211>7
<212>PRT
<213>杀结核链霉菌
<400>73
Leu Asn Ser Leu Pro Val Arg
1               5
<210>74
<211>7
<212>PRT
<213>杀结核链霉菌
<400>74
Ile Thr Asp Leu Arg Pro Arg
1               5
<210>75
<211>7
<212>PRT
<213>杀结核链霉菌
<400>75
Glu Gln Gly Pro Val Val Arg
1               5
<210>76
<211>7
<212>PRT
<213>杀结核链霉菌
<400>76
Ala Val His Glu Leu Met Arg
1               5
<210>77
<211>5
<212>PRT
<213>杀结核链霉菌
<400>77
Ala Phe Thr Ala Arg
1               5
<210>78
<211>5
<212>PRT
<213>杀结核链霉菌
<400>78
Phe Glu Glu Val Arg
1               5
<210>79
<211>7
<212>PRT
<213>杀结核链霉菌
<400>79
Pro Gly Glu Asp Asn Val Met
1               5
<210>80
<211>21
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(3)..(18)
<223>第3、6、12和18位核苷酸是“s”,其中“s”=c或g
<220>
<221>misc_feature
<222>(9)..(9)
<223>第9位核苷酸是“r”,其中“r”=a或g
<220>
<221>misc_feature
<222>(15)..(15)
<223>第15位核苷酸是“y”,其中“y”=c或t
<400>80
ccsggsgarc csaaygtsat g                                               21
<210>81
<211>7
<212>PRT
<213>杀结核链霉菌
<400>81
Ala Leu Ile Thr Asp Pro Phe
1               5
<210>82
<211>21
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(3)..(18)
<223>第3、6、12和18位核苷酸是“s”,其中“s”=c或g
<400>82
gcsctsatya csgacccstt c                                              21
<210>83
<211>8
<212>PRT
<213>杀结核链霉菌
<400>83
Phe Met Asp Asp Ser Pro Val Trp
1               5
<210>84
<211>24
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(13)..(13)
<223>第13位核苷酸是“w”,其中“w”=a或t
<220>
<221>misc_feature
<222>(14)..(21)
<223>第14、15、18和21位核苷酸是“s”,其中“s”=c或g
<400>84
ttcatggacg acwssccsgt stgg                                            24
<210>85
<211>8
<212>PRT
<213>杀结核链霉菌
<400>85
Leu Asn Tyr Asp Ala Pro Asp His
1               5
<210>86
<211>24
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(3)..(18)
<223>第3、15和18位核苷酸是“s”,其中“s”=c或g
<220>
<221>misc_feature
<222>(6)..(9)
<223>第6和9位核苷酸是“y”,其中“y”=c或t
<400>86
ctsaaytayg acgcsccsga ccac                                           24
<210>87
<211>8
<212>PRT
<213>杀结核链霉菌
<400>87
Val Glu Gln Ile Ala Asp Ala Leu
1               5
<210>88
<211>24
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(3)..(24)
<223>第3、15、21和24位核苷酸是“s”,其中“s”=c或g
<220>
<221>misc_feature
<222>(12)..(12)
<223>第12位核苷酸是“y”,其中“y”=c或t
<220>
<221>misc-feature
<222>(6)..(6)
<223>第6位核苷酸是“r”,其中“r”=a或g
<400>88
gtsgarcaga tygcsgacgc scts                                           24
<210>89
<211>8
<212>PRT
<213>杀结核链霉菌
<400>89
Asp Leu Ile Ser Met Asp Pro Asp
1               5
<210>90
<211>24
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(6)..(21)
<223>第6、11、12和21位核苷酸是“s”,其中“s”=c或g
<220>
<221>misc_feature
<222>(9)..(9)
<223>第9位核苷酸是“r”,其中“r”=a或g
<220>
<221>misc_feature
<222>(10)..(10)
<223>第10位核苷酸是“w”,其中“w”=a或t
<400>90
ctggastarw sstacctggg sctg                                           24
<210>91
<211>36
<212>DNA
<213>杀结核链霉菌
<400>91
agattaatta atgtcggaat taatgaactg tccgtt                               36
<210>92
<211>32
<212>DNA
<213>杀结核链霉菌
<400>92
aaactcaccc caaccgcacc ggcagcgagt tc                                  32
<210>93
<211>7
<212>PRT
<213>杀结核链霉菌
<400>93
Met Ser Glu Leu Met Asn Ser
1               5
<210>94
<211>1293
<212>DNA
<213>杀结核链霉菌
<400>94
atgtcggcaa tatccagctc cccgttcgcc gcacacgtcg gaaagcatcc cggcgagccg 60
aatgtgatgg acccggcgct gatcaccgac ccgttcggcg gctacggcgc actgcgtgag 120
caaggccccg tcctaccggg ccggttcatg gacgactcac ccgtctggct cgtgacgcgc 180
ttcgaagagg tccgccaagt cctgcgcgat cagcggttcc tgaacaaccc ggccgcgtcg 240
tcaccggggc attcgatcga cgagagcccc acggccaggc tgctggacat gatggggatg 300
cccgaacatt tccggccgta tctgatgggg tcgatcctca acaacgacgc ccccgaccac 360
acccggctgc gccgtctggt gtcacgcgcg ttcacggcac gcaagatcac cgatctgcgg 420
ccgcgggtcg agcagctcgc cgacgagctg ctggcccggc ttcccgagca cgccgaggac 480
ggtgtggtcg acctgatcaa gcacttcgcc tatcccctgc cgatcaccgt gatctgcgaa 540
ctggtcggca tcccggaagc ggaccgcccg caatggcgga agtggggcgc cgacctcgtt 600
tcgctgcagc cggagcggct cagcacctcg ttcccggcga tgatcgagca catccatgaa 660
ctgatccgcg agcggcgcgg cgcgctcacc gacgatctgc tcagcgagct gatccgtacc 720
catgacgacg acggcagccg gctcagcgac gtcgagatgg tcaccatggt cctcaccgtc 780
gtcctggccg gccacgagac caccgcccac ctgataggca acggcacggc ggcgctgctc 840
acccaccccg accagctgcg cctggtcaag gacgacccgg agctgcttcc gcgtgccgtc 900
cacgagctgc tgcgctggtg cgggccggtc cagatgaccc agctgcggta cgcctccgag 960
gatgtcgaga tcgccgggac gccgatccgt aagggcgacg ccgtacaact catcctggta 1020
tcggcgaact tcgacccccg ccactacacc gcccccgaac gcctcgacct gacccgccac 1080
cccgccggcc acgccgagaa ccatgtgggc ttcggccacg gaatgcacta ctgcctgggc 1140
gccaccctcg ccaaacagga gggcgaagtc gcgttcggca agctcttcac gcactacccg 1200
gagctgtcgc tggccgtcgc accggacgag ttggagcgaa cgccggtgcc cggcagctgg 1260
cggttggatt cgctgccggt gcggttgggg tga                              1293
<210>95
<211>430
<212>PRT
<213>杀结核链霉菌
<400>95
Met Ser Ala Ile Ser Ser Ser Pro Phe Ala Ala His Val Gly Lys His
 1               5                  10                  15
Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Thr Asp Pro Phe
            20                  25                  30
Gly Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Leu Pro Gly Arg
        35                  40                  45
Phe Met Asp Asp Ser Pro Val Trp Leu Val Thr Arg Phe Glu Glu Val
    50                  55                  60
Arg Gln Val Leu Arg Asp Gln Arg Phe Leu Asn Asn Pro Ala Ala Ser
65                  70                  75                  80
Ser Pro Gly His Ser Ile Asp Glu Ser Pro Thr Ala Arg Leu Leu Asp
                85                  90                  95
Met Met Gly Met Pro Glu His Phe Arg Pro Tyr Leu Met Gly Ser Ile
            100                 105                 110
Leu Asn Asn Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
        115                 120                 125
Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu
    130                 135                 140
Gln Leu Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp
145                 150                 155                 160
Gly Val Val Asp Leu Ile Lys His Phe Ala Tyr Pro Leu Pro Ile Thr
                165                 170                 175
Val Ile Cys Glu Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp
            180                 185                 190
Arg Lys Trp Gly Ala Asp Leu Val Ser Leu Gln Pro Glu Arg Leu Ser
        195                 200                 205
Thr Ser Phe Pro Ala Met Ile Glu His Ile His Glu Leu Ile Arg Glu
    210                 215                 220
Arg Arg Gly Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr
225                 230                 235                 240
His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Met
                245                 250                 255
Val Leu Thr Val Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile
            260                 265                 270
Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
        275                 280                 285
Val Lys Asp Asp Pro Glu Leu Leu Pro Arg Ala Val His Glu Leu Leu
    290                 295                 300
Arg Trp Cys Gly Pro Val Gln Met Thr Gln Leu Arg Tyr Ala Ser Glu
305                 310                 315                 320
Asp Val Glu Ile Ala Gly Thr Pro Ile Arg Lys Gly Asp Ala Val Gln
                325                 330                 335
Leu Ile Leu Val Ser Ala Asn Phe Asp Pro Arg His Tyr Thr Ala Pro
            340                 345                 350
Glu Arg Leu Asp Leu Thr Arg His Pro A la Gly His Ala Glu Asn His
        355                 360                  365
Val Gly Phe Gly His Gly Met His Tyr Cys Leu Gly Ala Thr Leu Ala
    370                 375                 380
Lys Gln Glu Gly Glu Val Ala Phe Gly Lys Leu Phe Thr His Tyr Pro
385                 390                 395                 400
Glu Leu Ser Leu Ala Val Ala Pro Asp Glu Leu Glu Arg Thr Pro Val
                405                 410                 415
Pro Gly Ser Trp Arg Leu Asp Ser Leu Pro Val Arg Leu Gly
            420                 425                 430
<210>96
<211>18
<212>DNA
<213>人工序列
<400>96
cgsccsccsc tswssaas                                               18
<210>97
<211>21
<212>DNA
<213>人工序列
<400>97
sassgcstts bcccartgyt c                                           21
<210>98
<211>1266
<212>DNA
<213>杀结核链霉菌
<400>98
gtggtcgacg cacaccagac gttcgtcatc gtcgggggtg gcctggccgg cgcaaaggcc 60
gcggagactc tccgcgcgga ggggttcacc ggccgggtga tcctcatctg tgacgagcgc 120
gaccacccgt acgagcgccc cccgctctcc aaggggttcc tgctcggcaa ggaagagcgc 180
gacagcgtgt tcgtccatga gcccgcctgg tacgcccagg cacagatcga actgcacctg 240
ggccagcccg ccgtccgcct cgaccccgag ggcaggaccg tccgcctcgg cgacggcacc 300
ctgatcgcct acgacaagct gctgctggcc accggcgccg aaccgcggcg cctggacatc 360
cccggcaccg gcctggccgg cgtgcaccac ctgcgccgcc tcgcccacgc cgaacggctg 420
cgcggcgtcc tggcctccct cggccgcgac aacggccatc tggtgatcgc cggagccggc 480
tggatcggcc tggaggtcgc cgccgcggcc cgctcctacg gcgccgaggt gaccgtcgtc 540
gaggccgccc cgacgccgct gcacggcatc ctggggcccg aactcggcgg tctgttcacc 600
gatctgcacc gcgagcacgg cgtccgcttc cacttcggcg cccgcttcac cgagatcgtc 660
ggagagggcg gcatggtgct cgccgtgcgc accgacgacg gcgaggaaca ccccgcccac 720
gatgtgctcg ccgcgatcgg cgccgccccg cgcaccgcgc tcgccgaaca ggccgggctg 780
gatctcgccg acccggagac cggcggcggg gtggccgtcg acgcggcgct gcgcacctcc 840
gacccgtaca tctacgccgc cggtgacgtc gccgccgccg accacccgct gctggacacc 900
cggctgcggg tcgaacactg ggccaacgcc ctcaacggcg gcccggccgc cgcccgcgcc 960
atgctcggcc aggacatcag ctacgaccgc atcccgtact tcttctccga ccagtacgac 1020
gtcggcatgg agtactccgg ctacgccccg cccggctcgt acgcccaggt cgtctgccgc 1080
ggcgacgtcg ccaagcggga gttcatcgcc ttctggctgg cggcggacgg ccggctgctc 1140
gcgggcatga acgtcaacgt ctgggacgtc gccgagtcca tccagcaact catccgctcc 1200
ggggcgccgt tggagcccgg cgcactggcc gatccgcagg ttccgctggc ggcactgctc 1260
ccgtag                                                                       1266
<210>99
<211>421
<212>PRT
<213>杀结核链霉菌
<400>99
Val Val Asp Ala His Gln Thr Phe Val Ile Val Gly Gly Gly Leu Ala
 1               5                  10                  15
Gly Ala Lys Ala Ala Glu Thr Leu Arg Ala Glu Gly Phe Thr Gly Arg
            20                  25                  30
Val Ile Leu Ile Cys Asp Glu Arg Asp His Pro Tyr Glu Arg Pro Pro
        35                  40                  45
Leu Ser Lys Gly Phe Leu Leu Gly Lys Glu Glu Arg Asp Ser Val Phe
    50                  55                  60
Val His Glu Pro Ala Trp Tyr Ala Gln Ala Gln Ile Glu Leu His Leu
65                  70                  75                  80
Gly Gln Pro Ala Val Arg Leu Asp Pro Glu Gly Arg Thr Val Arg Leu
                85                  90                  95
Gly Asp Gly Thr Leu Ile Ala Tyr Asp Lys Leu Leu Leu Ala Thr Gly
            100                 105                 110
Ala Glu Pro Arg Arg Leu Asp Ile Pro Gly Thr Gly Leu Ala Gly Val
        115                 120                 125
His His Leu Arg Arg Leu Ala His Ala Glu Arg Leu Arg Gly Val Leu
    130                 135                 140
Ala Ser Leu Gly Arg Asp Asn Gly His Leu Val Ile Ala Gly Ala Gly
145                 150                 155                 160
Trp Ile Gly Leu Glu Val Ala Ala Ala Ala Arg Ser Tyr Gly Ala Glu
                165                 170                 175
Val Thr Val Val Glu Ala Ala Pro Thr Pro Leu His Gly Ile Leu Gly
            180                 185                 190
Pro Glu Leu Gly Gly Leu Phe Thr Asp Leu His Arg Glu His Gly Val
        195                 200                 205
Arg Phe His Phe Gly Ala Arg Phe Thr Glu Ile Val Gly Glu Gly Gly
    210                 215                 220
Met Val Leu Ala Val Arg Thr Asp Asp Gly Glu Glu His Pro Ala His
225                 230                 235                 240
Asp Val Leu Ala Ala Ile Gly Ala Ala Pro Arg Thr Ala Leu Ala Glu
                245                 250                 255
Gln Ala Gly Leu Asp Leu Ala Asp Pro Glu Thr Gly Gly Gly Val Ala
            260                 265                 270
Val Asp Ala Ala Leu Arg Thr Ser Asp Pro Tyr Ile Tyr Ala Ala Gly
        275                 280                 285
Asp Val Ala Ala Ala Asp His Pro Leu Leu Asp Thr Arg Leu Arg Val
    290                 295                 300
Glu His Trp Ala Asn Ala Leu Asn Gly Gly Pro Ala Ala Ala Arg Ala
305                 310                 315                 320
Met Leu Gly Gln Asp Ile Ser Tyr Asp Arg Ile Pro Tyr Phe Phe Ser
                325                 330                 335
Asp Gln Tyr Asp Val Gly Met Glu Tyr Ser Gly Tyr Ala Pro Pro Gly
            340                 345                 350
Ser Tyr Ala Gln Val Val Cys Arg Gly Asp Val Ala Lys Arg Glu Phe
        355                 360                 365
Ile Ala Phe Trp Leu Ala Ala Asp Gly Arg Leu Leu Ala Gly Met Asn
    370                 375                 380
Val Asn Val Trp Asp Val Ala Glu Ser Ile Gln Gln Leu Ile Arg Ser
385                 390                 395                 400
Gly Ala Pro Leu Glu Pro Gly Ala Leu Ala Asp Pro Gln Val Pro Leu
                405                 410                 415
Ala Ala Leu Leu Pro
            420
<210>100
<211>1314
<212>DNA
<213>杀结核链霉菌
<400>100
atgcccgctg cacgccgccg ccttcgacct ccgcaccgga gcggcgacct gcctgcccgc 60
ccgccgggcc gtgcgcaccc accccgtgac cgtccaggac ggcatgatct acgtccatca 120
cgccgcggag gagggcaccg ccgcatgaag tcggtcgctg tcatcggggc ctcgctggcg 180
ggcctgtacg ccgcgcggtc cctgcgttcc caggggttcg acggccgcct ggtgatcgtc 240
ggggacgagt gccacggccc ctacgaccgg cccccgctgt ccaaggactt cctcaccggc 300
gccaccgacc cgggccgact cgccctggcc gacgccgagg agatcgccga actcgacgcc 360
gaatggctgc tgggcacccg ggccaccggg ctcgacaccg gcggacgcac ggtgctgctc 420
gatggcggcc ggtccctgac caccgacggc gtggtcctcg ccaccggcgc cgccccgcgc 480
ctgctccccg gaccggtgcc cgccggggtc cacaccctgc gcaccctcga cgacgcccag 540
gcgctccgtg cggatctggc gccggcgccg gtccgggtcg tggtgatcgg cggcggcttc 600
atcggcgccg aggtcgcctc gtcctgcgcc gccctaggcc atgacgtcac cgtggtcgag 660
gccgcgccgc tccccctcgt cccccaactc ggccacgcca tggccgagat ctgcgccgcc 720
ctgcatgcgg accacggcgt cacgctgctc accggaaccg gtgtcgcccg gctgcgcagc 780
gagggcgacg gccggcgcgt caccggcgtc gagctgaccg acggccgcct gctccccgcc 840
gacgtggtcg tcgtcggcat cggggtacgc ccccgcaccg cctggctcac ggactccgga 900
ctgccgctcg acgacggtgt gctctgcgac gcgggctgtg tcaccccgct gcccgccgtc 960
gtggccgtcg gcgacgtcgc cagggtggac ggcgcccgtg ccgagcactg gaccagcgcc 1020
accgaacagg ccgccgtggc ggcgcggaac ctgctggccg gcagcaccgt cgcgacccac 1080
cggagcctgc cgtacttctg gtccgaccag tacggcgtcc gcatccagtt cgcgggccac 1140
cggctgccca ccgacacacc gcgcgtcctc gaaggctccc ccgacgaccg cagcttcctc 1200
gcctgttacg aacgggacgg acgcaccacc gcggtgctcg ccctcaaccg gccccgcccc 1260
ttcatgcggc tccgccgcga actcgcccgc accgccctgt cggccaccac ctga       1314
<210>101
<211>437
<212>PRT
<213>杀结核链霉菌
<400>101
Met Pro Ala Ala Arg Arg Arg Leu Arg Pro Pro His Arg Ser Gly Asp
 1               5                  10                  15
Leu Pro Ala Arg Pro Pro Gly Arg Ala His Pro Pro Arg Asp Arg Pro
            20                  25                  30
Gly Arg His Asp Leu Arg Pro Ser Arg Arg Gly Gly Gly His Arg Arg
        35                  40                  45
Met Lys Ser Val Ala Val Ile Gly Ala Ser Leu Ala Gly Leu Tyr Ala
    50                  55                  60
Ala Arg Ser Leu Arg Ser Gln Gly Phe Asp Gly Arg Leu Val Ile Val
65                  70                  75                  80
Gly Asp Glu Cys His Gly Pro Tyr Asp Arg Pro Pro Leu Ser Lys Asp
                85                  90                  95
Phe Leu Thr Gly Ala Thr Asp Pro Gly Arg Leu Ala Leu Ala Asp Ala
            100                 105                 110
Glu Glu Ile Ala Glu Leu Asp Ala Glu Trp Leu Leu Gly Thr Arg Ala
        115                 120                 125
Thr Gly Leu Asp Thr Gly Gly Arg Thr Val Leu Leu Asp Gly Gly Arg
    130                 135                 140
Ser Leu Thr Thr Asp Gly Val Val Leu Ala Thr Gly Ala Ala Pro Arg
145                 150                 155                 160
Leu Leu Pro Gly Pro Val Pro Ala Gly Val His Thr Leu Arg Thr Leu
                165                 170                 175
Asp Asp Ala Gln Ala Leu Arg Ala Asp Leu Ala Pro Ala Pro Val Arg
            180                 185                 190
Val Val Val Ile Gly Gly Gly Phe Ile Gly Ala Glu Val Ala Ser Ser
        195                 200                 205
Cys Ala Ala Leu Gly His Asp Val Thr Val Val Glu Ala Ala Pro Leu
    210                 215                 220
Pro Leu Val Pro Gln Leu Gly His Ala Met Ala Glu Ile Cys Ala Ala
225                 230                 235                 240
Leu His Ala Asp His Gly Val Thr Leu Leu Thr Gly Thr Gly Val Ala
                245                 250                 255
Arg Leu Arg Ser Glu Gly Asp Gly Arg Arg Val Thr Gly Val Glu Leu
            260                 265                 270
Thr Asp Gly Arg Leu Leu Pro Ala Asp Val Val Val Val Gly Ile Gly
        275                 280                 285
Val Arg Pro Arg Thr Ala Trp Leu Thr Asp Ser Gly Leu Pro Leu Asp
    290                 295                 300
Asp Gly Val Leu Cys Asp Ala Gly Cys Val Thr Pro Leu Pro Ala Val
305                 310                 315                 320
Val Ala Val Gly Asp Val Ala Arg Val Asp Gly Ala Arg Ala Glu His
                325                 330                 335
Trp Thr Ser Ala Thr Glu Gln Ala Ala Val Ala Ala Arg Asn Leu Leu
            340                 345                 350
Ala Gly Ser Thr Val Ala Thr His Arg Ser Leu Pro Tyr Phe Trp Ser
        355                 360                 365
Asp Gln Tyr Gly Val Arg Ile Gln Phe Ala Gly His Arg Leu Pro Thr
    370                 375                 380
Asp Thr Pro Arg Val Leu Glu Gly Ser Pro Asp Asp Arg Ser Phe Leu
385                 390                 395                 400
Ala Cys Tyr Glu Arg Asp Gly Arg Thr Thr Ala Val Leu Ala Leu Asn
                405                 410                 415
Arg Pro Arg Pro Phe Met Arg Leu Arg Arg Glu Leu A1a Arg Thr A1a
            420                 425                 430
Leu Ser A1a Thr Thr
        435
<210>102
<211>1233
<212>DNA
<213>杀结核链霉菌
<400>102
atggcccaga acacggcatt catcatcgcg ggagcggggc tggccggggc gaaggccgcg 60
gagacactgc gcgcggaggg cttcggcggc cccgtcctgc tgctgggcga cgagcgcgag 120
cgtccctacg agcggccgcc gctgtccaag ggctacctct tgggcacctc cgagcgggag 180
aaggcgtacg tccatccgcc ccagtggtac gccgagcacg acgtcgatct gcggctgggc 240
aacgccgtca ccgccctcga cccggccggc cacgaggtga ccctcgccga cggcagccgg 300
ctgggctacg ccaagctgct gctggccacc ggctccactc cgcgccggct gccggtgccc 360
ggcgccgacc tcgacggggt ccacacgctg cggtacctgg cggacagcga ccgcctcaag 420
gacctcttcc ggtccgcgtc ccggatcgtg gtgatcggcg gcggctggat cggcctggag 480
accacggccg ccgcgcgtgc ggcgggggtc gaggtgaccg tgctggagtc ggcgccgctg 540
cccctgctgg gggtgctggg ccgcgaggtc gcccaggtct tcgccgatct gcacaccgag 600
cacggtgtcg cgctgcgctg cgacacccag gtcacggaga tcaccggcac gaacggcgcg 660
gtcgacgggg tacggctggc cgacggcacc cggatcgcgg ccgacgcggt gatcgtcggc 720
gtcgggatca cccccaactc cgagacggcc gccgcggccg ggctcaaggt cgacaacggc 780
gtcgtcgtgg acgagcggct gtgctcctcc cacccggaca tctacgccgc cggcgacgtc 840
gccaacgcct accaccccct cctgggcaag cacctccgcg tcgagcactg ggccaacgcc 900
ctccaccagc cgaagaccgc ggcccgggcc atgctgggcg gggaggccgg ctacgaccgg 960
ctgccgtact tcttcaccga ccagtacgac ctgggcatgg agtacacggg gcatgtggag 1020
ccgggcgggt acgaccgcgt ggtgttccgc ggcgacaccg gtgcccgcga gttcatcgcc 1080
ttctggctct ccggcggccg ggtgctggcc gggatgaatg tgaacgtatg ggacgtcacc 1140
gacccgatcc gggccctggt ggcgagcggg cgggccgtgg accccgagcg gctcgccgac 1200
gcggacgtac cgctggcgga tctggtcccc tga                                     1233
<210>103
<211>410
<212>PRT
<213>杀结核链霉菌
<400>103
Met Ala Gln Asn Thr Ala Phe Ile Ile Ala Gly Ala Gly Leu Ala Gly
 1               5                  10                  15
Ala Lys Ala Ala Glu Thr Leu Arg Ala Glu Gly Phe Gly Gly Pro Val
            20                  25                  30
Leu Leu Leu Gly Asp Glu Arg Glu Arg Pro Tyr Glu Arg Pro Pro Leu
        35                  40                  45
Ser Lys Gly Tyr Leu Leu Gly Thr Ser Glu Arg Glu Lys Ala Tyr Val
    50                  55                  60
His Pro Pro Gln Trp Tyr Ala Glu His Asp Val Asp Leu Arg Leu Gly
65                  70                  75                  80
Asn Ala Val Thr Ala Leu Asp Pro Ala Gly His Glu Val Thr Leu Ala
                85                  90                  95
Asp Gly Ser Arg Leu Gly Tyr Ala Lys Leu Leu Leu Ala Thr Gly Ser
            100                 105                 110
Thr Pro Arg Arg Leu Pro Val Pro Gly Ala Asp Leu Asp Gly Val His
        115                 120                 125
Thr Leu Arg Tyr Leu Ala Asp Ser Asp Arg Leu Lys Asp Leu Phe Arg
    130                 135                 140
Ser Ala Ser Arg Ile Val Val Ile Gly Gly Gly Trp Ile Gly Leu Glu
145                 150                 155                 160
Thr Thr Ala Ala Ala Arg Ala Ala Gly Val Glu Val Thr Val Leu Glu
                165                 170                 175
Ser Ala Pro Leu Pro Leu Leu Gly Val Leu Gly Arg Glu Val Ala Gln
            180                 185                 190
Val Phe Ala Asp Leu His Thr Glu His Gly Val Ala Leu Arg Cys Asp
        195                 200                 205
Thr Gln Val Thr Glu Ile Thr Gly Thr Asn Gly Ala Val Asp Gly Val
    210                 215                 220
Arg Leu Ala Asp Gly Thr Arg Ile Ala Ala Asp Ala Val Ile Val Gly
225                 230                 235                 240
Val Gly Ile Thr Pro Asn Ser Glu Thr Ala Ala Ala Ala Gly Leu Lys
                245                 250                 255
Val Asp Asn Gly Val Val Val Asp Glu Arg Leu Cys Ser Ser His Pro
            260                 265                 270
Asp Ile Tyr Ala Ala Gly Asp Val Ala Asn Ala Tyr His Pro Leu Leu
        275                 280                 285
Gly Lys His Leu Arg Val Glu His Trp Ala Asn Ala Leu His Gln Pro
    290                 295                 300
Lys Thr Ala Ala Arg Ala Met Leu Gly Gly Glu Ala Gly Tyr Asp Arg
305                 310                 315                 320
Leu Pro Tyr Phe Phe Thr Asp Gln Tyr Asp Leu Gly Met Glu Tyr Thr
                325                 330                 335
Gly His Val Glu Pro Gly Gly Tyr Asp Arg Val Val Phe Arg Gly Asp
            340                 345                 350
Thr Gly Ala Arg Glu Phe Ile Ala Phe Trp Leu Ser Gly Gly Arg Val
        355                 360                 365
Leu Ala Gly Met Asn Val Asn Val Trp Asp Val Thr Asp Pro Ile Arg
    370                 375                 380
Ala Leu Val Ala Ser Gly Arg Ala Val Asp Pro Glu Arg Leu Ala Asp
385                 390                 395                 400
Ala Asp Val Pro Leu Ala Asp Leu Val Pro
                405                 410
<210>104
<211>1266
<212>DNA
<213>杀结核链霉菌
<400>104
gtggtcgacg cacaccagac gttcgtcatc gtcgggggtg gcctggccgg cgcaaaggcc 60
gcggagactc tccgcgcgga agggttcacc ggccgggtga tcctcatctg tgacgagcgc 120
gaccacccgt acgagcgccc cccgctctcc aaggggttcc tgctcggcaa ggaagagcgc 180
gacagcgttt tcgtccacga acccgcctgg tacgcccagg cacagatcga actgcacctg 240
ggccagcccg ccgtccgcct cgaccccgag gcgaagaccg tccgcctcgg cgacggcacc 300
ctgatcgcct acgacaagct gctgctggcc accggcgccg agccgcgccg cctggacatc 360
cccggcaccg gcctggccgg cgtgcaccac ctgcgccgcc tcgcccacgc cgaacggctg 420
cgcggcgtcc tggcctccct cgggcgggac aacgggcatc tggtgatcgc cggcgccggc 480
tggatcggcc tggaggtcgc cgccgcggcc cgctcctacg gcgccgaggt caccgtcgtc 540
gaggccgccc cgacaccgct gcacggcatc ctggggcccg aactcggcgg cctgttcacc 600
gaactgcacc gcgcacacgg cgtgcgcttc cacttcggcg cccgtttcac cgagatcgtc 660
ggacaggacg gcatggtgct cgccgtgcgc accgacgacg gcgaggagca ccccgcccac 720
gacgtgctcg ccgcgatcgg cgccgccccg cgcaccgcac tcgccgaaca ggccggactc 780
gacctcgccg acccggaggc cggcggcggc gtggccgtcg acgcgacgct gcgcacctcc 840
gacccgtaca tctacgccgc cggcgacgtg gccgccgccg accaccccct cctggacacc 900
cggctgcgcg tcgaacactg ggccaacgcc ctcaacggcg gcccggccgc cgcgcgcgcc 960
atgctcggcc aggacatcag ctacgaccgc gtcccgtact tcttctccga ccagtacgac 1020
gtcggcatgg agtactccgg ctacgccccg cccggctcct acgcacaggt cgtctgccgc 1080
ggcgacgtcg ccaaacggga gttcatcgcg ttctggctcg gcgaggacgg acggctgctc 1140
gcggggatga acgtcaacgt ctgggacgtc gccgaaacca tccagcaact catccgcggc 1200
ggggtgcggt tggagcccgg cgagctggct gatccggagg ttccgctgac ctcactgctc 1260
ccgtag                                                            1266
<210>105
<211>421
<212>PRT
<213>杀结核链霉菌
<400>105
Val Val Asp Ala His Gln Thr Phe Val Ile Val Gly Gly Gly Leu Ala
 1               5                  10                  15
Gly Ala Lys Ala Ala Glu Thr Leu Arg Ala Glu Gly Phe Thr Gly Arg
            20                  25                  30
Val Ile Leu Ile Cys Asp Glu Arg Asp His Pro Tyr Glu Arg Pro Pro
        35                  40                  45
Leu Ser Lys Gly Phe Leu Leu Gly Lys Glu Glu Arg Asp Ser Val Phe
    50                  55                  60
Val His Glu Pro Ala Trp Tyr Ala Gln Ala Gln Ile Glu Leu His Leu
65                  70                  75                  80
Gly Gln Pro Ala Val Arg Leu Asp Pro Glu Ala Lys Thr Val Arg Leu
                85                  90                  95
Gly Asp Gly Thr Leu Ile Ala Tyr Asp Lys Leu Leu Leu Ala Thr Gly
            100                 105                 110
Ala Glu Pro Arg Arg Leu Asp Ile Pro Gly Thr Gly Leu Ala Gly Val
        115                 120                 125
His His Leu Arg Arg Leu Ala His Ala Glu Arg Leu Arg Gly Val Leu
    130                 135                 140
Ala Ser Leu Gly Arg Asp Asn Gly His Leu Val Ile Ala Gly Ala Gly
145                 150                 155                 160
Trp Ile Gly Leu Glu Val Ala Ala Ala Ala Arg Ser Tyr Gly Ala Glu
                165                 170                 175
Val Thr Val Val Glu Ala Ala Pro Thr Pro Leu His Gly Ile Leu Gly
            180                 185                 190
Pro Glu Leu Gly Gly Leu Phe Thr Glu Leu His Arg Ala His Gly Val
        195                 200                 205
Arg Phe His Phe Gly Ala Arg Phe Thr Glu Ile Val Gly Gln Asp Gly
    210                 215                 220
Met Val Leu Ala Val Arg Thr Asp Asp Gly Glu Glu His Pro Ala His
225                 230                 235                 240
Asp Val Leu Ala Ala Ile Gly Ala Ala Pro Arg Thr Ala Leu Ala Glu
                245                 250                 255
Gln Ala Gly Leu Asp Leu Ala Asp Pro Glu Ala Gly Gly Gly Val Ala
            260                 265                 270
Val Asp Ala Thr Leu Arg Thr Ser Asp Pro Tyr Ile Tyr Ala Ala Gly
        275                 280                 285
Asp Val Ala Ala Ala Asp His Pro Leu Leu Asp Thr Arg Leu Arg Val
    290                 295                 300
Glu His Trp Ala Asn Ala Leu Asn Gly Gly Pro Ala Ala Ala Arg Ala
305                 310                 315                 320
Met Leu Gly Gln Asp Ile Ser Tyr Asp Arg Val Pro Tyr Phe Phe Ser
                325                 330                 335
Asp Gln Tyr Asp Val Gly Met Glu Tyr Ser Gly Tyr Ala Pro Pro Gly
        340                 345                 350
Ser Tyr Ala Gln Val Val Cys Arg Gly Asp Val Ala Lys Arg Glu Phe
    355                 360                 365
Ile Ala Phe Trp Leu Gly Glu Asp Gly Arg Leu Leu Ala Gly Met Asn
    370                 375                 380
Val Asn Val Trp Asp Val Ala Glu Thr Ile Gln Gln Leu Ile Arg Gly
385                 390                 395                 400
Gly Val Arg Leu Glu Pro Gly Glu Leu Ala Asp Pro Glu Val Pro Leu
                405                 410                 415
Thr Ser Leu Leu Pro
            420

Claims (44)

1.一种纯化的编码多肽的核酸分子,所述多肽显示P450单加氧酶的酶活性并能够区域选择性地氧化式(II)化合物在4”位的醇
Figure A0281000000021
其中
R1-R7相互独立地代表氢或取代基;
m为0、1或2;
n为0、1、2或3;且
标有A、B、C、D、E和F的键相互独立地表示:两个相邻碳原子通过以下形式相连:双键、单键、单键和下式的环氧桥
Figure A0281000000022
或单键和下式的亚甲基桥
Figure A0281000000023
包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,在每种情况中为游离形式或盐形式,
以制备式(III)化合物:
Figure A0281000000031
其中,R1-R7、m、n、A、B、C、D、E和F与上述式(II)中给定的含义相同。
2.如权利要求1所述的核酸分子,该核酸分子包含编码显示P450单加氧酶的酶活性并能将除虫菌素区域选择性氧化为4”酮-除虫菌素的多肽的核酸序列。
3.如权利要求1或2所述的核酸分子,该核酸分子包含编码显示P450单加氧酶酶活性的多肽的核酸序列,其中,所述多肽与SEQ IDNO:2所示的多肽基本上相似,并且与SEQ ID NO:2所示的多肽具有至少50%,至99%之间的氨基酸序列同一性。
4.如权利要求3所述的核酸分子,该核酸分子包含如下核苷酸序列,所述核苷酸序列
a)如SEQ ID NO:1所示;
b)与(a)基本上相似;
c)能够与(a)或其互补序列杂交;
d)能够与如下核酸分子杂交,该核酸分子包含SEQ ID NO:1所示的核苷酸序列或其互补序列的50至200或更多个连续核苷酸;
e)与(a)、(b)或(c)互补;
f)为(a)、(b)或(c)的反向互补序列;或
g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
5.如权利要求1或2所述的核酸分子,该核酸分子包含与SEQID NO:1具有至少66%同一性的核酸序列。
6.如权利要求1或2所述的核酸分子,该核酸分子包含编码显示P450单加氧酶酶活性的多肽的核酸序列,其中所述多肽基本上与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34或SEQ ID NO:95所示多肽相似,并与其具有至少60%至99%之间的氨基酸序列同一性。
7.如权利要求1或2所述的核酸分子,该核酸分子包含编码显示P450单加氧酶酶活性的多肽的核酸序列,其中所述多肽与抗SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34或SEQ ID NO:95所示多肽的抗体有免疫学反应性。
8.如权利要求1或2所示的核酸分子,该核酸分子包含如下核苷酸序列,该核苷酸序列
a)如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ IDNO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33或SEQ ID NO:94所示;
b)与(a)基本上相似;
c)能够与(a)或其互补序列杂交;
d)能够与以下核酸分子杂交,该核酸分子包含SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ IDNO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33或SEQ IDNO:94所示核苷酸序列或其互补序列的50至200或更多个连续核苷酸;
e)与(a)、(b)或(c)互补;和
f)为(a)、(b)或(c)的反向互补序列;
g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
9.如权利要求8所述的核酸分子,该核酸分子包含选自如下的核酸序列:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33和SEQ ID NO:94。
10.如权利要求1至9任一项的核酸分子,其中所述的核酸分子分离自链霉菌属的株系。
11.如权利要求1至10任一项的核酸分子,该核酸分子还包含编码通过共价键与P450单加氧酶连接的标签的核酸序列。
12.一种多肽,该多肽显示P450单加氧酶的酶活性并能够区域选择性地氧化式(II)化合物在4”位的醇,
其中
R1-R7相互独立地代表氢或取代基;
m为0、1或2;
n为0、1、2或3;且
标有A、B、C、D、E和F的键相互独立地表示:两个相邻碳原子通过以下形式相连:双键、单键、单键和下式的环氧桥
Figure A0281000000062
或单键和下式的亚甲基桥
包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,在每种情况中为游离形式或盐形式,
以制备式(III)化合物:
其中,R1-R7、m、n、A、B、C、D、E和F与上述式(II)中给定的含义相同。
13.一种显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”酮-除虫菌素的多肽。
14.如权利要求12或13所述的多肽,该多肽包含由以下核酸分子编码的氨基酸序列,所述核酸分子
a)如SEQ ID NO:1或其互补序列所示;
b)与(a)基本上相似;
c)能够与(a)或其互补序列杂交;
d)能够与以下核酸分子杂交,该核酸分子包含SEQ ID NO:1所示核苷酸序列或其互补序列的50至200或更多个连续核苷酸;
e)与(a)、(b)或(c)互补;
f)为(a)、(b)或(c)的反向互补序列;或
g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
15.权利要求12至14任一项所述的多肽,该多肽包含与SEQ IDNO:2具有至少50%同一性的氨基酸序列。
16.如权利要求12或13所述的多肽,该多肽包含由以下核酸分子编码的氨基酸序列,所述核酸分子
a)如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ IDNO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33或SEQ ID NO:94或其互补序列所示;
b)与(a)基本上相似;
c)能够与(a)或其互补序列杂交;
d)能够与以下核酸分子杂交,该核酸分子包含SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ IDNO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33或SEQ IDNO:94所示核苷酸序列或其互补序列的50至200或更多个连续核苷酸,或其互补序列;
e)与(a)、(b)或(c)互补;
f)为(a)、(b)或(c)的反向互补序列;或
g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
17.如权利要求16所述的多肽,该多肽包含选自以下的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34和SEQ ID NO:95。
18.如权利要求12至17任一项所述的多肽,该多肽还包含标签。
19.一种与权利要求12至18任一项所述的多肽特异性结合的结合剂。
20.如权利要求20所述的结合剂,其中所述的结合剂为抗体。
21.显示P450单加氧酶的酶活性的多肽家族,其中该家族的每个成员都能够区域选择性地氧化式(II)化合物在4”位的醇
其中
R1-R7相互独立地代表氢或取代基;
m为0、1或2;
n为0、1、2或3;且
标有A、B、C、D、E和F的键相互独立地表示:两个相邻碳原子通过以下形式相连:双键、单键、单键和下式的环氧桥
Figure A0281000000102
或单键和下式的亚甲基桥
Figure A0281000000103
包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,在每种情况中为游离形式或盐形式,
以制备式(III)化合物:
其中,R1-R7、m、n、A、B、C、D、E和F与上述式(II)中给定的含义相同。
22.显示P450单加氧酶的酶活性的多肽家族,其中该家族的每个成员都能将除虫菌素氧化为4”酮-除虫菌素。
23.如权利要求21或22所述的家族,其中该家族的每个成员包含与SEQ ID NO:2具有至少50%同一性的氨基酸序列。
24.一种纯化的核酸分子,该核酸分子包含编码分别显示铁氧还蛋白和铁氧还蛋白还原酶的酶活性的多肽的核苷酸序列,其中所述的核酸分子分离自含有P450单加氧酶的链霉菌属的株系,所述的P450单加氧酶能够区域选择性地氧化式(II)化合物在4”位的醇
Figure A0281000000121
其中
R1-R7相互独立地代表氢或取代基;
m为0、1或2;
n为0、1、2或3;且
标有A、B、C、D、E和F的键相互独立地表示:两个相邻碳原子通过以下形式相连:双键、单键、单键和下式的环氧桥
Figure A0281000000122
或单键和下式的亚甲基桥
包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,在每种情况中为游离形式或盐形式,
以产生式(III)化合物:
Figure A0281000000131
其中,R1-R7、m、n、A、B、C、D、E和F与上述式(II)中给定的含义相同。
25.如权利要求24所述的纯化的核酸分子,该核酸分子包含编码分别显示铁氧还蛋白和铁氧还蛋白还原酶的酶活性的多肽的核苷酸序列,其中所述的核酸分子分离自含有将除虫菌素区域选择性地氧化为4”-酮除虫菌素的P450单加氧酶的链霉菌属株系。
26.如权利要求25所述的核酸分子,该核酸分子包含选自SEQ IDNO:35和SEQ ID NO:37的核酸序列。
27.如权利要求25所述的核酸分子,该核酸分子包含选自SEQ IDNO:98、SEQ ID NO:100、SEQ ID NO:102和SEQ ID NO:104的核酸序列。
28.一种分别显示铁氧还蛋白和铁氧还蛋白还原酶的酶活性的多肽,其中所述的多肽分离自含有P450单加氧酶的链霉菌属株系,所述的P450单加氧酶能够区域选择性地氧化式(II)化合物在4”位的醇
Figure A0281000000141
其中
R1-R7相互独立地代表氢或取代基;
m为0、1或2;
n为0、1、2或3;和
标有A、B、C、D、E和F的键相互独立地表示:两个相邻碳原子通过以下形式相连:双键、单键、单键和下式的环氧桥
Figure A0281000000142
或单键和下式的亚甲基桥
包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,在每种情况中为游离形式或盐形式,
以制备式(III)化合物:
其中,R1-R7、m、n、A、B、C、D、E和F与上述式(II)中给定的含义相同。
29.一种分别显示铁氧还蛋白和铁氧还蛋白还原酶的酶活性的多肽,其中所述的铁氧还蛋白分离自含有将除虫菌素区域选择性地氧化为4”酮-除虫菌素的P450单加氧酶的链霉菌属株系。
30.如权利要去29所述的铁氧还蛋白,该铁氧还蛋白包含选自SEQ ID NO:36和SEQ ID NO:38的氨基酸序列。
31.如权利要求29所述的铁氧还蛋白还原酶蛋白,该铁氧还蛋白还原酶蛋白包含选自SEQ ID NO:99、SEQ ID NO:101、SEQ IDNO:103和SEQ ID NO:105的氨基酸序列。
32.一种细胞,其经基因工程化包含编码显示如权利要求1至11任一项所述P450单加氧酶的酶活性的多肽的核酸分子。
33.如权利要求32所述的细胞,该细胞还包含分别编码铁氧还蛋白和铁氧还蛋白还原酶蛋白或编码其联合的核酸分子。
34.如权利要求32或33所述的细胞,其中将所述的核酸分子定位以在细胞中表达。
35.如权利要求32至34任一项所述的细胞,其中所述的细胞为选自链霉菌属株系细胞、假单胞菌属株系细胞和大肠杆菌株系细胞的基因工程化细胞。
36.如权利要求35所述的细胞,其中所述的细胞分别具有NRRL指定号B-30478和NRRL指定号B-30479。
37.一种制备式(I)化合物的方法,
Figure A0281000000161
其中
R1-R9相互独立地代表氢或取代基;
m为0、1或2;
n为0、1、2或3;且
标有A、B、C、D、E和F的键相互独立地表示:两个相邻碳原子通过以下形式相连:双键、单键、单键和下式的环氧桥
Figure A0281000000171
或单键和下式的亚甲基桥
包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,在每种情况中为游离形式或盐形式,
其中所述方法包括:
1)将式(II)化合物
Figure A0281000000173
其中
R1-R7、m、n、A、B、C、D、E和F与上述式(I)中给定的含义相同,与根据本发明的多肽接触,所述多肽能够区域选择性地氧化在4”位的醇,以形成式(III)化合物
Figure A0281000000181
其中,R1、R2、R3、R4、R5、R6、R7、m、n、A、B、C、D、E和F与式(I)给定的含义相同;和
2)使式(III)化合物与式HN(R8)R9的胺在还原剂存在的情况下反应,其中R8和R9与式(I)中给定的含义相同,并且所述胺是已知的;
并且,在每种情况下,如果需要,将可按照本方法或其它方法获得的式(I)化合物、或其E/Z异构体或互变异构体,在每种情况中为游离形式或盐形式,转变为不同的式(I)化合物或其E/Z异构体或互变异构体,在每种情况中为游离形式或盐形式;将可按照本方法获得的E/Z异构体混合物分离,并分离出需要的异构体;和/或将可按照本方法或其它方法获得的游离的式(I)化合物、或其E/Z异构体或互变异构体转变为盐,或将可按照本方法或其它方法获得的式(I)化合物、或其E/Z异构体或互变异构体的盐转变为游离的式(I)化合物或其E/Z异构体或互变异构体或转变为不同的盐。
38.一种制备式(III)化合物的方法,
Figure A0281000000191
其中R1、R2、R3、R4、R5、R6、R7、m、n、A、B、C、D、E和F与权利要求37所述的式(III)中给定的含义相同,
其中所述方法包括:
1)使式(II)化合物
其中
R1-R7、m、n、A、B、C、D、E和F与上述式(I)给定的含义相同,
与根据本发明的能够区域选择性地氧化在4”位的醇的多肽接触,将所述接触保持足够发生所述氧化反应的时间并且分离和纯化式(II)化合物。
39.如权利要求37或38任一项所述的方法,用于制备依马菌素,该方法包括将显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”酮-除虫菌素的多肽加入含有除虫菌素的反应混合物中;将反应混合物在使该多肽将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的条件下温育。
40.如权利要求37至39任一项的方法,其中所述的反应混合物还包含铁氧还蛋白。
41.如权利要求37至40任一项的方法,其中所述的反应混合物还包含铁氧还蛋白还原酶蛋白。
42.一种用于生产依马菌素的制剂,该制剂包含显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
43.如权利要求42所述的制剂,该制剂还包含铁氧还蛋白。
44.如权利要求42或43所述的制剂,该制剂还包含铁氧还蛋白还原酶蛋白。
CNA02810000XA 2001-05-16 2002-05-15 生产依马菌素的方法和组合物 Pending CN1514880A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US29114901P 2001-05-16 2001-05-16
US60/291,149 2001-05-16

Publications (1)

Publication Number Publication Date
CN1514880A true CN1514880A (zh) 2004-07-21

Family

ID=23119055

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA02810000XA Pending CN1514880A (zh) 2001-05-16 2002-05-15 生产依马菌素的方法和组合物

Country Status (17)

Country Link
US (1) US20030068788A1 (zh)
EP (1) EP1389239A2 (zh)
JP (1) JP2004529651A (zh)
KR (1) KR20040005963A (zh)
CN (1) CN1514880A (zh)
AR (1) AR034703A1 (zh)
AU (1) AU2002342337B2 (zh)
BR (1) BR0209813A (zh)
CA (1) CA2446130A1 (zh)
CZ (1) CZ20033078A3 (zh)
HU (1) HUP0400008A2 (zh)
IL (1) IL158764A0 (zh)
MX (1) MXPA03010381A (zh)
PL (1) PL367195A1 (zh)
RU (1) RU2003135646A (zh)
WO (1) WO2002092801A2 (zh)
ZA (1) ZA200307737B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003236095A1 (en) * 2002-04-12 2003-10-27 Mercian Corporation Expression system of actinomycete-origin cytochrome p-450 in escherichia coli
CA2546614A1 (en) 2003-11-27 2005-06-09 Mercian Corporation Dna participating in hydroxylation of macrolide compound
EP1770165B1 (en) 2004-07-20 2011-12-21 Eisai R&D Management Co., Ltd. Dna coding for polypeptide participating in biosynthesis of pladienolide
AU2006100665B4 (en) * 2006-07-06 2006-09-07 Wyeth Biocatalytic oxidation process and use thereof
JPWO2008096695A1 (ja) * 2007-02-05 2010-05-20 メルシャン株式会社 ビタミンd類の水酸化に関連するdna
WO2015040197A1 (en) * 2013-09-19 2015-03-26 Laurent Daviet Method for producing fragrant alcohols
JP6522551B2 (ja) 2016-06-10 2019-05-29 長谷川香料株式会社 (−)−ロタンドンの製造方法
GB201807815D0 (en) 2018-05-14 2018-06-27 Hypha Discovery Ltd Hydroxylation techniques
GB201819209D0 (en) * 2018-11-26 2019-01-09 Hypha Discovery Ltd Biocatalytic techniques
CN110305818A (zh) * 2019-08-15 2019-10-08 齐鲁制药(内蒙古)有限公司 一种阿维菌素菌种选育方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4427663A (en) * 1982-03-16 1984-01-24 Merck & Co., Inc. 4"-Keto-and 4"-amino-4"-deoxy avermectin compounds and substituted amino derivatives thereof
US4874749A (en) * 1987-07-31 1989-10-17 Merck & Co., Inc. 4"-Deoxy-4-N-methylamino avermectin Bla/Blb
JPH07502650A (ja) * 1991-12-16 1995-03-23 イー・アイ・デユポン・ドウ・ヌムール・アンド・カンパニー ストレプトミセスにおけるP450soyおよびフェレドキシン−soyの構成性発現、および組み換え体生物による化学物質の生物変換
US5399717A (en) * 1993-09-29 1995-03-21 Merck & Co., Inc. Glycosidation route to 4"-epi-methylamino-4"-deoxyavermectin B1
US6117659A (en) * 1997-04-30 2000-09-12 Kosan Biosciences, Inc. Recombinant narbonolide polyketide synthase
US6265202B1 (en) * 1998-06-26 2001-07-24 Regents Of The University Of Minnesota DNA encoding methymycin and pikromycin
GB9926887D0 (en) * 1999-11-12 2000-01-12 Novartis Ag Organic compounds
JP2002058490A (ja) * 2000-08-22 2002-02-26 Kyowa Hakko Kogyo Co Ltd 新規チトクロームp450

Also Published As

Publication number Publication date
HUP0400008A2 (hu) 2004-04-28
CZ20033078A3 (cs) 2004-02-18
EP1389239A2 (en) 2004-02-18
WO2002092801A3 (en) 2003-11-27
JP2004529651A (ja) 2004-09-30
KR20040005963A (ko) 2004-01-16
PL367195A1 (en) 2005-02-21
IL158764A0 (en) 2004-05-12
AR034703A1 (es) 2004-03-17
AU2002342337B2 (en) 2006-01-05
ZA200307737B (en) 2004-04-21
RU2003135646A (ru) 2005-05-10
US20030068788A1 (en) 2003-04-10
MXPA03010381A (es) 2004-03-16
CA2446130A1 (en) 2002-11-21
BR0209813A (pt) 2004-06-01
WO2002092801A2 (en) 2002-11-21

Similar Documents

Publication Publication Date Title
CN1311075C (zh) 表达超热稳定蛋白的系统
CN100347291C (zh) 用于发酵制备l-半胱氨酸、l-胱氨酸、n-乙酰丝氨酸或四氢噻唑衍生物的微生物和方法
CN101044243A (zh) 类异戊二烯的生产方法
CN1196789C (zh) 经修饰的细胞色素p450单加氧酶
CN1162540C (zh) 新的醇醛脱氢酶
CN1961072A (zh) 改良型腈水合酶
CN1183252C (zh) 新型细胞色素p450单加氧酶及其在有机化合物的氧化方面的应用
CN1882691A (zh) 对l-抗坏血酸进行微生物生产的方法
CN1161461C (zh) 碱性磷酸酶在酵母中的表达
CN1993464A (zh) 新羰基还原酶、其基因及它们的使用方法
CN1993377A (zh) 丙氨酸2,3氨基变位酶
CN1514880A (zh) 生产依马菌素的方法和组合物
CN1263855C (zh) 来自淡青链霉菌的假寡糖生物合成基因的分离及其应用
CN1308457C (zh) 发酵生产s-腺苷甲硫氨酸的方法
CN1641019A (zh) 头孢菌素c酰基转移酶
CN1644696A (zh) 编码黄酮合酶的基因
CN1777681A (zh) Sqs基因
CN1886505A (zh) 参与大环内酯类化合物的羟化作用的dna
CN1668639A (zh) 涉及二酮哌嗪衍生物合成的多核苷酸和由所述多核苷酸编码的多肽
CN1250726C (zh) 耐热性核糖核酸酶h
CN1213402A (zh) 表层蛋白的重组表达
CN101063140A (zh) 万古霉素生物合成基因簇
CN1517436A (zh) 氧化还原酶
CN1056189C (zh) 编码阿凡曼链霉菌支链α-酮酸脱氢酶复合物的基因
CN1720329A (zh) 来自红球菌属的新表达系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned
C20 Patent right or utility model deemed to be abandoned or is abandoned